6-2. 二項分布-3
続いて、例3について説明します。
あなたは、人口10万人のA市の保健担当者です。Bという病気(B症)の発症率は人口の5%とされています(話を簡単にするために、年齢性別など関係なく同じ率とします)。A市でもB症の発症率を調べて、一般的な発症率よりも明らかに多ければ、原因を突き止め、予防策などを講じる必要があります。ただ、全住民を調べるには費用と時間がかかります。
そこで、A市の人口構成と同じような住民100名に協力を得て調査した結果、100名中B症を発症している住民は8名(8%)でした。一般的な発症率に比べて3%多いので、A市のB症発症率は高いので、何らかの対策が必要と結論づけていいでしょうか。
この例は、前2つと違う感じがしますが、発症した-発症していないの二項に分けられますので、二項分布が使えます。異なるのは、期待値(発症率)が0.05(5%)であることです。また、試行数は、100名を調査したので100となります。この例の場合、100回調べて、発症者が8名ということです。
これについて、二項分布を描いてみます(下図)。前2例に比べ、かなり分布が原点側に寄っていることが分かります。実際は、横軸は100までありますが、15辺りからずっとほぼ0ですので、20以上は省略しています。
緑線は、今回の結果である発症者8名のラインです。これを見ると、確率は0.06程度ですので、100名中で発症率8%はレアなケースのように思えます。ただ、一般的な統計的に有意とすることが多い0.05以下ではないので、その点から見ると多いとは言えないので、対策を講講じる必要はないと結論づけることもできます。
では、このような場合どう考えたらいいでしょうか。
現実には、他の事柄も判断材料として考慮すべきと考えます。
例えば、B症はあることをすることで予防が容易であることが明らかであれば、対策を講じる大きな理由となります。あるいは、予防可能であるが、発症した場合の一人当たりの医療費や介護費用が大きい場合も予防策を講じる大きな動機付けとなります。
一方、予防に費用がかかったり予防が困難であるが、発症した場合でも治療が容易であったり、生命に大きな影響を与えずに治癒するようなものであれば、広報誌などで注意や発症した場合の早期受診を呼びかける程度にとどめるという決断もあり得ます。
学術研究においては統計的有意差として0.05以下や0.01以下をもってこの例であれば一般的な発症率に比べて明らかに多いと結論づけるかと思います。つまり、この調査結果からは、有意に多いとは言えないと結論づけられます。
しかし、この結果をもって行政がどのような対策を講じるのかあるいは積極的には講じないのかは、上記のように統計解析とは別の軸で議論される必要があります。統計解析はあくまでも意思決定のためのツールの一つ(判断材料の一つ)であるべきだからです。
0コメント