記事タイトル:疫学ことはじめ 


書き込み欄へ  ヘルプ
お名前: 鎌谷直之   
Case-control研究と縦断(cross-sectional研究)
Case-control研究(以下CCSと略)はコホート研究と明確に区別される。前に述べたよう
にコホート研究ではexposedとunexposedの集団のoutcomeを比較してその頻度の差を検討
する方法である。即ち、Expose→Develop or not, Unexposed→Develop or notという検討
をする。
CCSでは逆である。Outcomeの違いから時間的にさかのぼってexposedとunexposedの検討を
行う。例えば、RAとRAではない二つのグループにおいて発症前の妊娠のあるなしを検討す
る。このときは妊娠がexposeする要因である。RAがoutcomeとなる。アザルフィジンの副
作用の検討では、副作用がでたグループとでなかったグループにおける遺伝子の差を検討
するような研究である。ここでは副作用がoutcome、遺伝子がexposeする要因となる。こ
こで、アザルフィジンを投与されている患者をまず調べ、遺伝子を解析して副作用のある
なしと関係するか検討する方法だとコホートになる。なぜなら、副作用のある無し
(outcome)でサンプルを収集したのではないからである。
基本的にCCSで検討するのは以下の比率である。

                                  最初の選択
            case(disease)            control(disease-)
次に過去    暴露(+)  a                          b
の暴露     暴露(-)  c                           d
        合計     a+c                         b+d
暴露した割合      a/(a+c)           b/(b+d)

ここでa/(a+b)としたいところであるが、これはできない。これは暴露のありなしで別々
に収集されたサンプルなので、実際の集団における比率は不明だからである。

しばしばコホート研究とCCSの違いは前向きと後ろ向きの違いであると誤解されている
が、それは正しくない。以前、後ろ向きコホート研究については解説した。暴露と非暴露
によりグループを作り、それを前提にoutcomeの比率を検討するか、逆にoutcomeの違い
(多くは疾患のあるなし)からグループを作り、それを前提に暴露と非暴露の比率を検討
するかの違いである。
CCSの場合、caseとcontrolの背景が合っているかが非常に問題である。例えば、caseが一
つの病院のみから選択されたような場合は、controlとどのような差があったとしてもそ
れはその病院に固有のものかも知れず、病気とは関係ない可能性がある。
CCSの場合caseの選択にprevalent caseとincident caseがある。後者は新しく疾患となっ
た症例である。できればincident caseを選ぶほうが良い。なぜならprevalent caseを選
んだ場合、CCSで抽出された要因は疾患の発生ではなく、疾患による生存率に関係してい
る可能性があるからである。

理想的にはコントロールは疾患のあること以外のすべての点で疾患ぐんと同じでなければ
ならない。あるいは患者群が得られたと同じ集団の、疾患の無い人々のすべてを代表する
ものであるべきである。

実は、完全に理想的なコントロールをえるのはほとんど不可能である。

コントロールのソース
近隣者コントロール(neighborhood control)のような入院者以外のコントロール。しか
し、米国では現在インタビューをしようと思ってもドアを開けてくれない。ランダム番号
ダイアル法(random digit dialing)では7桁のダイアルを下四桁を固定し、上三桁を変
えることにより場所に偏ることなくダイアルする方法がしばしば取られる。
Best friend controlという患者の友人をコントロールとする方法、患者の配偶者や同胞
をコントロールとする方法などもしばしば取られる。

入院患者コントロール法

コントロール選択の問題点
膵臓癌で入院中の患者と、同時に入院していた患者のCCSにより、コーヒーの消費量と膵
臓癌に相関があることがわかった。対象となった患者は消化器専門の医師の患者であり、
コーヒーの消費を抑えるよう言われていた。
このようにCCSでは常にコントロール集団が患者集団と同じ集団から抽出されるコント
ロール集団と同じレベルの暴露をされているかを綿密に調べる必要がある。前の例では、
コントロールとなった消化器病の患者は明らかに膵臓癌患者集団と同じ集団の膵臓癌では
ない理想的コントロールよりコーヒー消費が少なかった事が問題である。

マッチング(条件そろえ)
患者集団とコントロール集団で現在問題となる要因以外の要因をそろえる必要がある。
集団マッチング
例えば、患者集団の25%が既婚者であれば、コントロール集団も25%既婚者とする、などの
方法である。

個別マッチング
これは患者が一人居ると、それにマッチしたコントロールをそろえる方法である。24歳の
男性の白人患者にはやはり24歳の男性白人コントロールをそろえるなどの方法である。
1.
実際に色々の項目でマッチングを行うとすると、そのようにマッチするコントロールは見
つけることが困難というような問題が起きる。
2.
また、一旦患者とコントロール集団をある要因でマッチさせると、もはやその要因につい
ては二集団の差を解析できないという問題が出る。
3.
計画外マッチング(unplanned matching)
例えば近隣者コントロールのような場合は計画しなくても社会経済的レベルでマッチする
ようなことが起きる。このような場合を過剰マッチング(overmatching)。

想起問題
思い出すことは完全ではなく、これにより問題が起きることがある。例えば風疹感染と異
常児出産の関係をCCSで行うとき、正常児を出産した母親をコントロールとしたとする。
異常児を出産した母親は正常児を出産した母親より妊娠時の感染を思い出しやすい。この
ような問題を想起バイアス(recall bias)という。即ち、caseとcontrolで想起のレベル
に違いがあり(differential recall)実際に妊娠時の感染と異常児出産の間に関係が無
くても、容易に差が出てくることになる。

多数コントロールの使用
同じタイプの複数コントロール
 一人の患者に複数のコントロールを設定することにより検出力を向上させることができ
る。患者数を増やすことは困難な場合にはこの方法が有効である。
異なるタイプの多数コントロール
 例えばコントロールを入院患者のみに取ったりすると、入院患者は喫煙率が高いなどの
問題がある。このとき、近隣者コントロールも同時に取ると良い。その二つをコントロー
ルとして解析して同じ結果が得られれば良い。もし、二つの解析の間に矛盾があればその
矛盾の原因を追求することが可能である。
例えば、小児の脳腫瘍のコントロールに健康小児とともに、脳腫瘍以外の小児の腫瘍のコ
ントロールを取ると良い。脳腫瘍小児と健康小児の間には放射線暴露などで明らかな差が
あるはずである。これらは他の腫瘍の小児を対象とすることで避けることができる差である。

Nested case-control study
この研究では、ある時点で単一集団のbaselineのデータを固定する。その後、しばらく時
間がたった後に疾患を発症した人のグループとコントロールのグループを用いてCCSを行
う。これにより想起バイアスなどを防ぐことができ、疾患の初期症状と真のリスクをより
よく区別することが可能であり、またコホート(疾患を発症しなかった人もすべて検査し
なければならない)のような大量のデータ採取も必要が無いので経済的である。

縦断研究(cross-sectional study)
単一時点でのデータを収集する。Prevalent studyとも言われる。
この研究の結果は次のようにまとめることができる。

            disease                  no disease
    暴露(+)          a                          b
    暴露(-)           c                           d

暴露(+)の場合の疾患のprevalence=a/(a+c)
暴露(-)の場合の疾患のprevalence= b/(b+d)

疾患の場合の暴露のprevalence=a/(a+c)
疾患なしの場合の暴露のprevalence=b(b+d)

しかし、cross-sectional studyでは差が出たとしても次のような問題がある。
Incident casesではないので、生存率の差による可能性がある。
同時にoutcomeと暴露が判定されたので、暴露に引き続きoutcomeが起きたか不明である。
[2002年3月29日 23時30分58秒]

お名前: 鎌谷直之   
赤真先生以下のような場合はどうでしょう。

1)私も田中栄一先生の指摘はあっていると思います。ただ、私の頭では、
以下のように考える方がすっきりします。

       ここで、直接年齢補正には次のような手段が用いられるように思います。

              仮想集団をYoung 5000, Old 3000とする。(集団Bにあわせる)。そうする
と。
                                       集団A        集団B
              Young(population)     5000        5000
              Event(仮想)            125           20

              Old (population)           3000        3000
              Event(仮想)              30           30
              合計                      155           50

              集団A、Bで年齢別の人数をそろえても確かにEvent数はA集団の方が多い。

(鎌谷コメント)
なるほど。それもいい方法だと思います。

しかし、次のような場合はどうでしょう。

                         集団A        集団B
Young(population)     1000          10000
Event数                  10            300

Old (population)         10000        1000
Event数                   300         10

これを集団Aの人数にそろえると
                        集団A        集団B
Young(population)     1000          1000
Event数                  10            30

Old (population)         10000        10000
Event数                   300         100
合計                       310         130
と、集団Aの方が多いですよね。

しかし、集団Bの人数にそろえると
                         集団A        集団B
Young(population)     10000          10000
Event数                  100            300

Old (population)         1000        1000
Event数                   30         10
合計                      130         310

今度は集団Bの方が多い。
このようにどちらにそろえるかによって結果が違うので、A,Bともどちらも対等
に比較するためには適当ではないと思います。
[2002年3月27日 14時33分49秒]

お名前: 鎌谷直之   
申し訳ありませんが、年齢補正のところでは計算ミスがかなりありましたので
以下修正します。

第一の方法は直接年齢補正である。
以下の資料があるとする。

                         集団A        集団B
Young(population)     4000        5000
Event数                  100          20

Old (population)           5000        3000
Event数                   500         30

ここでevent数ではなく、incidence rate/yearにするとこうなる

                         集団A        集団B
Young(population)     4000        5000
Incidence(/year)          25/1000      4/1000

Old (population)           5000        3000
Incidence(/year)         100/1000      10/1000

ここで、直接年齢補正には次のような手段が用いられるようである。

仮想集団をYoung 9000, Old 8000とする。(集団A,Bを加えたもの)そうすると。
                         集団A        集団B
Young(population)     9000        9000
Event(仮想)            225           36

Old (population)           8000        8000
Event(仮想)              800           80
合計                      1025          116

集団A、Bで年齢別の人数をそろえても確かにEvent数はA集団の方が多い。

次に、間接年齢補正(SMR: standardized mortality ratios)(この場合は死亡率なので
mortalityとなっている)の方法は

SMR=(no of observed events)/(no of expected events)
例えば、前の例で集団AがRA集団の骨折、集団Bが一般集団とする。
まず、以下のデータを基礎にする。
                         集団A        集団B
Young(population)     4000        5000
Event数                  100          20

Old (population)        5000        3000
Event数                  500          30

ここで、集団A(テストする集団)の年齢別人口を集団B(対照集団)とそろえ、期待され
るevent数を計算する。

                         集団B(観察)   集団A(期待値)   集団A(観察)
Young(population)         5000        4000                  4000
Event数                      20        16 (expected)           100
Incidence/year            4/1000        4/1000                25/1000

Old (population)            3000        5000                   5000
Event数                      30          50(expected)           500
Incidence/year             10/1000      10/1000               100/1000
合計                          50        66                       600

SMR=600/66

これが1より多いと集団Aでincidenceが増加していることが、1より小さいとincidenceが
減少していることが疑われる。
[2002年3月27日 14時32分22秒]

お名前: 鎌谷直之   
田中先生、桁が違ってない?
[2002年3月26日 8時29分12秒]

お名前: 赤真秀人   
1)私も田中栄一先生の指摘はあっていると思います。ただ、私の頭では、
以下のように考える方がすっきりします。

       ここで、直接年齢補正には次のような手段が用いられるように思います。

              仮想集団をYoung 5000, Old 3000とする。(集団Bにあわせる)。そうする
と。
                                       集団A        集団B
              Young(population)     5000        5000
              Event(仮想)            125           20

              Old (population)           3000        3000
              Event(仮想)              30           30
              合計                      155           50

              集団A、Bで年齢別の人数をそろえても確かにEvent数はA集団の方が多い。
[2002年3月26日 7時13分59秒]

お名前: 田中 栄一   
鎌谷先生へ

ご苦労様です。
愛用させていただいてます。

さて、[2002年3月21日 6時18分33秒]のところですが、


ここで、直接年齢補正には次のような手段が用いられるようである。

       仮想集団をYoung 9000, Old 8000とする。(集団A,Bを加えたもの)そうすると。
                                集団A        集団B
       Young(population)     9000        9000
       Event(仮想)            220           36

       Old (population)           8000        8000
       Event(仮想)              80           30
       合計                      300           66

       集団A、Bで年齢別の人数をそろえても確かにEvent数はA集団の方が多い。

ここは、

ここで、直接年齢補正には次のような手段が用いられるようである。

       仮想集団をYoung 9000, Old 8000とする。(集団A,Bを加えたもの)そうすると。
                                集団A        集団B
       Young(population)     9000        9000
       Event(仮想)            225           36

       Old (population)           8000        8000
       Event(仮想)              80           80
       合計                      305           116

       集団A、Bで年齢別の人数をそろえても確かにEvent数はA集団の方が多い。
ですよね。
[2002年3月25日 16時48分9秒]

お名前: 鎌谷直之   
今度はsensitivity=90%とし、specificity=yとすると、集団全体で

疾患 (+)              疾患 (-)
RAテスト(+)      90m                    100(1-y)n
RAテスト(-)       10m                100yn

となり、
ppv=90m/(90m+100(1-y)n)=9/(9+10(1-y)n/m)
n/m=99なので、ppv=9/(9+990(1-y))=1/(1+110(1-y))
specificity=0.9なら、ppv=8.3%となる。Specificity=0.99とするとppv=47.6%となり
specificityを上げればppvは限りなく1に近くなる。

即ち、ppvを上げるにはsensitivityを上げるよりspecificityを上げるほうが効果的であ
る。だから診断基準にせよ、テストにせよ、sensitivityを上げることだけにこだわらな
い方が良いという事ですよね。
しかし、一般に診断基準にせよテストにせよsensitivity, specificityは書いてあるけ
ど、ppvは書かれていないですよね。何故か?

次に、複数の観察者の判定結果の合致性について考えましょう。
例えば、RAのX線所見の判定にしても複数の判定者の判定がどれだけ一致するかは問題と
なる。医師と患者の現在のRAの活動性の評価についても同じようなことが言える。
+か-かで判定するような二値の判定の場合、次のように整理できる。

    観察者1により(+)  観察者1により(-)
観 (+)        a                   b
察 
者 (-)         c                   d
二

ここで、aとdは一致した個数になる。一致した個数の全体の個数に占める割合は

percent agreement=(a+d)/(a+b+c+d)

しかし、しばしば陽性は少なく陰性が圧倒的多数になる場合が多い。そのような場合は、
しばしば次の指標が有効である。

Percent agreement=100a/(a+b+c)

また、次のkappa統計量も用いられる。

Kappa=(percent observed agreement-percent greement expected by chance
alone)/(100-percent agreement expected by chance alone)

これは次のように計算する。
例えば、病理の癌の判定を二人の病理学者で行ったとする。

    観察者1により(+)  観察者1により(-)
観 (+)        41                   3
察 
者 (-)         4                   27
二

こうすると
percent agreement=(41+27)/(41+3+4+27)=90.7%
である。
ところで周辺度数を計算すると。

    観察者1により(+)  観察者1により(-)
観 (+)        41                   3      44 (58.6%)
察 
者 (-)         4                   27      31 (41.4%)
二
       45 (60%)            30 (40%)        75

ここで、周辺度数を固定して、観察者1,2の判定が独立であるとすると、期待されるそれ
ぞれのセルの度数は、例えば75 x 0.586 x 0.6 = 26.4などとして、

    観察者1により(+)  観察者1により(-)
観 (+)        26.4                   17.6
察 
者 (-)         18.6                   12.4
二

となる。そこで、
percent agreement expected by chance alone=(26.4+12.4)/75=51.7%

kappa=(90.7%-51.7%)/(100%-51.7%)=0.81
[2002年3月23日 15時17分51秒]

お名前: 鎌谷直之   
診断やスクリーニングテストの正当性と信頼性

いま、ある疾患とその診断のためのテストがあるとする。例えばRAテストである。慢性関
節リウマチの集団にRAテストをしたら陽性a人、陰性b人であった。慢性関節リウマチでは
ない人の集団では陽性c人、陰性d人であった。つまり以下のようである。

疾患 (+)              疾患 (-)
RAテスト(+)       a                    b
RAテスト(-)        c                    d

疾患の人々の中でRAテスト陽性の人の割合をsensitivityという。
Sensitivity = a/(a+c)

疾患でない人々の中でRAテスト陰性の人の割合をspecificityという。
Specificity=d/(b+d)
ここでRAテストが陽性か陰性かを判定するのは容易である。しかし、疾患のあるなしを確
実に判定することは困難である(実際にそれを確実に判定する手段が無いためにこのよう
なテストを作成することが多いのである)。しかしsensitivityやspecificityを計算する
ためにはどうしても疾患のあるなしを判定するgolden standardがなければならない。
もちろん、sensitivity、specificityともに高ければ(1に近ければ)高いほどよい。

False positive=b/(b+d)=1-specificity

False negative=c/(a+c)=1-sensitivity

RAテストの場合は離散的なテストであったが、例えば血糖値のような連続量のテストも可
能である。RAの場合は赤沈値などでRAを判定する場合などがこれに相当する。
連続量の場合は閾値を変更することによりいくらでもsensitivity、specificityを変更す
ることができる。しかし、sensitivity、specificityは互いに依存しており、両方を同時
に最大にすることはできない。

ここで複数のテストを組み合わせることを考える。
Sequential testingでは、通常、最初は比較的非浸襲的なテスト(例えば便潜血)でスク
リーニングし、次に便潜血陽性の人について大腸内視鏡検査を行う。このようにすると
net sensitivityは一般に減少する。しかし、net specificityは増加する。
Simultaneous testingでは複数のテストをすべての人に行う。入院中に色々の検査を一人
に行うことなどはこれに相当する。そのうち一つでも陽性なら陽性とすると、net
sensitivityは上昇し、net specificityは減少する。

テストのpredictive value
テストを受ける個人にとって大切なものはsensitivityであろうか、specificityであろう
か。実は、本人は病気かどうかわからないのであるから、病気であったらテスト陽性にな
る確率であるsensitivity、病気でなかったらテスト陰性になる確率であるspecificityよ
りも、テスト陽性であれば病気である確率、テスト陰性であれば病気でない確率のほうが
テストを受け、その結果を知った本人には大切なのである。
テスト陽性であったとき病気である確率(あるいはテスト陽性であったとき病気を将来発
症する確率のような場合もありうる)をpositive predictive valueという。RAとRAテス
トの関係の次の表を思い出してみよう。

(表1)
疾患 (+)              疾患 (-)
RAテスト(+)       a                    b
RAテスト(-)        c                    d

Positive predictive value=a/(a+b)

となるであろうか?そうはならないのである。なぜなら、上の表の疾患と疾患無しは集団
全部を調べたわけではないからである。即ち、positive predictive valueは疾患集団の
中のテスト陽性の割合、疾患なし集団の中のテスト陽性の割合のデータだけでは計算でき
ないのである。もし、集団全部を調べたとして次の表を得たとする。

(表2)
疾患 (+)              疾患 (-)
RAテスト(+)       A                    B
RAテスト(-)       C                    D

Positive predictive value=A/(A+B)

これは正しい。
ちなみに、テストが陰性の時に疾患の無い確率をnegative predictive valueという。

Negative predictive value=D/(C+D)
表1と表2の関係を調べるためには疾患のprevalenceを考える必要がある。

Prevalence=(A+C)/(A+B+C+D)

今、100人の疾患の集団、100人の非疾患の集団を調べ次の結果を得たとする。

疾患 (+)              疾患 (-)
RAテスト(+)      90                    10
RAテスト(-)       10                    90

定義によって、sensitivity10%、specificity10%ですよね。
もし疾患のprevalenceが1%だとpositive predictive valueはどうなるでしょう。
上の表の疾患サンプルが集団全体の患者の1/mをサンプルしており、疾患なしサンプルが
疾患の無い人全体の1/nをサンプルしているとします。そうすると集団全体としては人数は

疾患 (+)              疾患 (-)
RAテスト(+)      90m                    10n
RAテスト(-)       10m                    90n

となります。従って、

Positive predictive value=90m/(90m+10n)=90 /(90+10 n/m)

となります。そして
prevalence=(90m+10m)/(90m+10n+10m+90n)=100m/(100m+100n)=m/(m+n)=1/(1+n/m)

となります。従って、

n/m=1/prevalence-1

となります。

ここで、prevalenceが1%なので、n/m=99となり、positive predictive value=90/1180=7.6%

もし、prevalenceが0.1%という稀な病気なら。Positive predictive value=0.9%となりま
す。つまり、RAテスト陽性となっても0.9%の確率でしか疾患の可能性は無いわけです。
ところが、prevalence=10%だとpositive predictive value=50%になります。つまり、
positive predictive valueはprevalenceが低いと非常に低く、高いと高くなるという性
質があります。SLEのほとんどがANF+だからといって、一般人にANF+をみつけてSLEと考え
るのはおかしいということですよね。もし、SLEではないひとのANF+の割合がかなり低い
としてもね。

それでは、今度はprevalenceは1%として、sensitivity, specificityの影響を調べてみま
しょう。

Prevalence=1%だからn/m=99

ここでspecificity=90%とし、sensitivity=xとすると疾患100人、疾患なし100人のなかで
おおよそ

疾患 (+)              疾患 (-)
RAテスト(+)      100x                    10
RAテスト(-)       100(1-x)                90

のようになり、集団全体では、

疾患 (+)              疾患 (-)
RAテスト(+)      100mx                    10n
RAテスト(-)       100m(1-x)                90n

となるでしょう。
Positive predictive value=100mx/(100mx+10n)=100x/(100x+10n/m)
n/m=99を代入すると、
positive predictive value=10 (10+99/x)
従って、もしsensitivityが0.9だと、positive predictive value=8.3%で、sensitivity
が1だとしても9%にしかならない。即ち、sensitivityを上げることはpositive
predictive valueをそれほど上げない。
[2002年3月23日 11時39分10秒]

お名前: 鎌谷直之   
Cohort研究

臨床研究には色々の種類があるが、それぞれがどのような研究であるかを良く認識するこ
とが大切。
一般に医師が自分達の症例を報告する症例報告(case report)がある。しかし、症例報
告にはコントロールが無いので結果の有意性に疑問がある。症例とコントロールを比較す
る、case-control studyはその点ですぐれたものである。しかし、case-control studyは
caseとcontrolの選択が別に行われているための問題もある。
Cohort study、Randomized clinical trialについては以下に紹介する。

Cohort study
J-ARAMISもcohort studyである。コホート研究は基本的にある因子にexposeされた人と
exposeされない人の間にoutcomeに差があるかどうかを検討する研究である。Exposeされ
たかどうか、outcomeでDiseaseを生じたかどうかについて、それぞれの人数を整理すると
次の2 x 2分表になる。

                  Disease (+)          Disease (-)
Exposed (+)          a                   b
Exposed (-)           c                   d

ここで、exposeされた人の中でdiseaseを生じるincidence a/(a+b)をexposeされなかった
人の中でdiseaseを生じるincidence c/(c+d)と比較する。a/(a+b)がc/(c+d)より高ければ
exposeされたことによりdiseaseを生じる確率が高くなったと考える。

Cohort studyとrandomized trialとの違いは乱数化の有無である。
Cohort studyにおいて集団を選ぶ方法として、一つはexposedとunexposedを基準にして選
ぶ方法がある。あるいは、まだexposeされていない集団を選ぶこともできる。後者では研
究開始後にexposedとunexposedのグループができることになる。

またcohort studyはconcurrent cohort studyとretrospective cohort studyに分けるこ
とができる。Concurrent cohort study(concurrent prospectiveともlongitudinal
studyともいう)では研究者は研究の最初から対象集団を確定する。これに比べ、
retrospective cohort study(historical cohortまたはnonconcurrent prospective
study)では研究の開始より前のcohortを対象とし、exposedの情報とdiseaseの情報を集
める。

Concurrent cohort studyもretrospective cohort studyも本質的にexposedとunexposed
の集団におけるoutcomeを比較するという点において変わりは無い。

最も有名なcohort studyの例はFramingham studyである。3万人弱の住人のうち30-62歳の
人々が加わる。ここで、研究への参加が住民という、exposureとは関係の無いバイアスに
より選択されたことが大切である。

Cohort studyにより生じる可能性のあるバイアスには以下のものがある。これらは避ける
か、あるいは考慮すべきである。
1.
Outcomeを評価するためのバイアス。
これをさけるためには評価をする人を盲目化(マスク)するとよい。あるいはその人が参加
者uxposureに関する情報を知っていたかどうかをチェックする。
2.
情報バイアス。
情報の質や量がexposeされた人とexposeされなかったひとの間で異なるとバイアスとなる。
3.
回答なし、追跡なしなどのバイアス。
ドロップアウトのバイアス。
4.
分析バイアス。

いつでもcohort studyがいいわけではない。Cohort studyでは結論がでるまでに非常に長
い時間がかかることが多い。しかも、疾患の頻度が非常に低いときなどはcohort studyは
それほど有効ではない。
[2002年3月23日 11時38分8秒]

お名前: 赤真秀人    
鎌谷先生の購入されたEpidemiologyを所長室で覗いたら、incidenceのところに、incidence 
rate, or incidence density も載っていました。わたしは、慢性疾患を扱っている J−
ARAMISの解析には、incidence density も結構,使えるのではと思っています。たとえば、第
1回目に登録された患者の方は、第4回目での新登録患者より長期間,追跡調査されます。分母
を「特定時間内でリスクのある人数」でなく、「リスクのある全ての人・時間(person・
time)」とする方がうまく解析できることもあるのではないか、と考えるからです。ただ、い
くつかクリアすべき問題は出てくるのかも。
[2002年3月22日 13時56分25秒]

お名前: 赤真秀人    
これからもrate, frequency, incidence, prevalence, ratio, proportion, fraction,
percent, percentageということばがどんどんでてきます。英国人は特にこのような概念
を細かく区別することを好むのかもしれません。日本ではあまり区別されませんよね。

・・・・・日本で用語に関してうるさいことを言うと、またterminologyやさんがうるさいこと
を言っている、として無視されるか適当にいなされるか,になってしまうような気がします。
ところで、incidenceは発生率,発症率、罹患率どれが良いのでしょうか?

また、ちょっと外れますが、症例報告を聞いていて、私が質問し、分類基準と診断基準の違いを
指摘しても、結局はみんなその基準で診断するんでしょ、だから黙っていてくださいな、と今ま
で何回、冷たい目で見られた?かわかりません。
[2002年3月22日 13時46分17秒]

お名前: 鎌谷直之   
昨日考えていたらprevalenceとincidenceの面白い例を思いつきました。
「死亡はincidenceであるが、生存はprevalenceである。」

異なった集団での死亡率の比較
異なった集団で死亡率をどのように比較できるであろうか。

死亡でなくても、例えばJ-ARAMISでの骨折のevent等でも同じような考察が可能である。
J-ARAMISでRA集団に1年に4000人に100人の骨折の新規eventが見られたとする
(incidence)。これは一般集団より多いであろうか。例えば一般集団では5000人に20人の
新規の骨折eventが見られたという。100人は20人より確かに多い。しかし、分母が4000人
と5000人で違いがある。しかし、ここで分母を補正して20/5000と100/4000人で比較して
差があればよいであろうか。しかし、RAの多くは女性である。対象群が女性優位かを確か
める必要がある。もし、コントロールも女性有意であったとすると、この数値を比較して
よいであろうか。
RAは比較的高齢が多いが、対象集団はそうでもないかもしれない。このように、異なった
集団の頻度を比較する場合は年齢構成をそろえなければならない。Caseとcontrolで年齢
構成がそろっていない場合はどうしたらよいであろうか。
第一の方法は直接年齢補正である。
以下の資料があるとする。

                         集団A        集団B
Young(population)     4000        5000
Event数                  100          20

Old (population)           5000        3000
Event数                   500         30

ここでevent数ではなく、incidence rate/yearにするとこうなる

                         集団A        集団B
Young(population)     4000        5000
Incidence(/year)          25/1000      4/1000

Old (population)           5000        3000
Incidence(/year)         10/1000      10/1000

ここで、直接年齢補正には次のような手段が用いられるようである。

仮想集団をYoung 9000, Old 8000とする。(集団A,Bを加えたもの)そうすると。
                         集団A        集団B
Young(population)     9000        9000
Event(仮想)            220           36

Old (population)           8000        8000
Event(仮想)              80           30
合計                      300           66

集団A、Bで年齢別の人数をそろえても確かにEvent数はA集団の方が多い。

次に、間接年齢補正(SMR: standardized mortality ratios)(この場合は死亡率なので
mortalityとなっている)の方法は

SMR=(no of observed events)/(no of expected events)
例えば、前の例で集団AがRA集団の骨折、集団Bが一般集団とする。
まず、以下のデータを基礎にする。
                         集団A        集団B
Young(population)     4000        5000
Incidence(/year)          25/1000      4/1000

Old (population)           5000        3000
Incidence(/year)         10/1000      10/1000

ここで、集団Bの年齢別人口を集団Aとそろえ、期待されるevent数を計算する。

                         集団A        集団B
Young(population)     4000        4000
Event数                  100        16 (expected)
Old (population)           5000        5000
Event数                    50        50(expected)
合計                      150        66

SMR=150/66

これが1より多いと集団Aでincidenceが増加していることが、1より小さいとincidenceが
減少していることが疑われる。

SMRは職業別のincidenceの比較などによく用いられるらしい。

J-ARAMISでのincidenceが比較集団より多いか少ないかの判定には良いと思う。

また、cohort effectという概念もある。
例えば、同じ集団を1940, 1950,1960,1970年に調査したとする。ここで、1940年だけの年
齢別の値を比べて、incidenceの年齢差を考察できる。このような見方をcross sectional
viewという。これに比べて、1940年の30代、1950年の40代、1960年50代を比較すれば同じ
人々におけるincidenceの変化を知ることができる。これをcohort effectという。

集団調査をsurveillanceという。
対象者の自発的告白にまかせるものをpassive surveillance、質問表などで調べるものを
active surveillanceという。J-ARAMISのようなものはactive surveillanceになる。
一般にpassive surveillanceの方が安くすむが信頼性に乏しい。

(続く)
[2002年3月21日 6時18分33秒]

お名前: 鎌谷直之   
最後の所
「真の糖尿病の死亡率が増加したわけではない。」は「減少したわけではない」の間違い
でした。おわびして訂正します。
[2002年3月18日 17時46分3秒]

お名前: 鎌谷直之   
Commuter Library 1 (通電図書館1)

米国で統計学と疫学の教科書をしこたま買い込んできました。まず、疫学の知識が必要な
ので、通勤電車の時間にそれを読むことにしました。
以下の本です。
Epidemiology by Leon Gordis, W.B. Saunders Co. 2000
内容のうち、必要最低限のことをごくごく簡単に書きます。

300ページ位あるのでしばらくかかります。

疫学ことはじめ

疫学はすべての臨床医に必須である。臨床における診断や予後の判定、適当な治療の選択
も疫学的データに依存している。例えば、極端な例で考えると、日本人に乳癌がほとんど
無いとする。そうすると、乳房のしこりを見ても乳癌という診断の可能性は低いだろう。
逆に、ある地方の出身者の女性に乳癌の発生が多いという疫学データがあるとする。そう
すると、診察に訪れた、その地方出身者の女性が乳房のしこりを示したときに、乳癌の可
能性は高くなるであろう。また、乳癌と診断したときに、その予後は疫学データにより推
定するほかはないであろう。さらには疫学データにより、治療の選択も異なってくるであ
ろう。患者さんからのデータだけではそれはわからない。

Morbidityの測度(measure)
 疫学を学ぶためには概念をよく理解することが大切のようです。そうして、なぜその概
念を定義する必要があるのか、似たような二つのことばがあるとき、その二つのことばの
概念はどのように違うのか、なぜその二つを区別する必要があるのかを考えることは大切
なことです。
 ところでmeasureということばは尺度と訳されることが多いように思いますが、尺度は
scaleではないでしょうか。Measureは、数値として表される実態であり、scaleはそのも
のさしではないでしょうか。例えば身長はmeasureであり、cm刻みのものさしがscaleで
しょうか。Measureは物理なんかでは測度と約されているように思います。日本語ではほ
とんど区別されない概念だと思います。
 これからもrate, frequency, incidence, prevalence, ratio, proportion, fraction,
percent, percentageということばがどんどんでてきます。英国人は特にこのような概念
を細かく区別することを好むのかもしれません。日本ではあまり区別されませんよね。

Incidenceとprevalenceの違い
 ある特定時間に新しく病気になる人の、その病気になるリスクを持った人に占める割合
がincidence。つまり、
Incidence=(その集団に、特定時間内に新しくその病気を発生する人の数)/(その集団
で特定時間内にその病気を発生するリスクのある人の数)
このとき、分子の「新しく」というのが非常に重要です。特定時間の開始前に既に病気を
持っていた人は含まれません。また、分母の「リスクのある」というのが非常に大事です。
これに比べて、
prevalence=(ある特定時刻に集団に存在するその疾患を持った人の数)/(その特定時刻
に集団に存在する人の数)
これをなぜ区別する必要があるかを考えて見ます。ある集団の裕福階級と貧困階級で結核
の頻度について考えてみます。裕福階級では治療が十分なため結核にかかっても平均1年
で治癒するとします。貧困階級では治癒するまで平均2年かかるとします。そうすると、
incidenceが全く同じでもprevalenceは貧困階級で2倍になるでしょう。
つまり、
prevalence=incidence x duration of disease
となります。
発生頻度はincidenceが参考になりますが、例えば社会コストなどはprevalenceのほうが
重要でしょう。
特定の時間の全期間についてリスクのある人々全部について計算されたincidenceを
cumulative incidenceという。これに比較して、人によって(drop outなどで)観察期間が
違う場合などはincidence rateしか計算できないことも多い。

Prevalenceは、ある時刻での瞬間的な計算で、疾患にかかっている時間などのファクター
を無視している。

一般にcross-sectional studyではprevalenceは計算できるがincidenceは計算できない。
Cohort studyではincidenceが観察できるのが特徴である。

Incidenceの分母に「リスクのある」という注意書きが入っていることの重要性を考える。
子宮癌のincidenceを考えるとき、分母に男性が入っているとおかしなことになる。正し
いincidenceの測定のためには、分子で問題になる疾患に本当にリスクのある人だけを分
母に入れなければならない。
ここで、proportionとrateを区別することが重要である。例えば、子宮癌患者の集団(男
性も含めた)に占める割合の場合はproportionでよい。しかし、rateの場合、分母はリス
クのある女性だけでなければならない。つまり、リスクのある人の中で発生する割合を
rate、それに関係なく発生する割合をproportionというようである。

Mortalityの測度
Number of deaths 
死亡数は大切であるが、集団の人口がわからなければ意味が無い。例えば、集団の人口が
次第に増えていくような集団では、死亡率は同じでも死亡数は増えていく。
Mortality rate
人口あたりの単位時間あたり(例えば年間)の死亡数をMortality rateと呼ぶ。一般に分
母には一年の真中の時点における人口をあてるようである。
年間mortality rate=(一年間の死亡数)/(年の中間における人口)
例えば、RA患者の年間mortality rateは
(RA患者の年間死亡数)/(年の中間におけるRA患者数)

Case-fatality rate
しかし、疫学者には確かにmortality rateが興味があるであろうが、我々が関心があるの
は目の前の患者さんの死亡率である。そこで、case-fatality rateを定義する。
Case-fatality rate=(疾患発生、または診断以降一定時間内でのRA患者の死亡数)/(そ
の疾患の患者数)
Proportionate mortality
これは全死亡数に占める特定の(例えばRA)死亡数の割合である。
Years of potential life lost (YPLL)
これは、自動車事故で死亡した人に支払われるお金の計算に用いられる「得べかりし利
益」のような物である。これで計算すると癌などを抜いて事故などがトップを占めるよう
になる。癌にかかる人の平均年齢は高く、事故などでは平均年齢が低いからである。

国際合意により死亡はunderlying causeによりコードされる。例えば心停止などではな
く、心筋梗塞などである。International Classification of Disease (ICD, 10th
revision)が用いられる。

また疫学データについては常にそれが本当の事かどうかを吟味することが重要である。例
えば、米国の調査では1949年に糖尿病によるmortality rateが激減した。これは、死亡原
因がこの年に直接原因から間接原因(underlying deathに変更されたからである)。その
ため、分母の糖尿病の人口が激増した。真の糖尿病の死亡率が増加したわけではない。


(続く)
[2002年3月18日 17時35分41秒]

このテーマについての発言をどうぞ。
氏名
E-mail URL
※ 書き込みはご自分がいれた改行+カラム端でも自動改行されます。

半角カナは使用しないようにしてください。文字化けします。
記事一覧に戻る