292.
第77回 ポアソン分布とは?ポアソン分布(Poisson distribution)は、まれな事象が起こる回数の確率分布を表す確率分布です。たとえば、1ヵ月間当たりの交通事故の発生件数や国道1km当たりのレストラン数などがポアソン分布に従うことがあります。では、身のまわりでよくある確率の問題で考えてみましょう。(1)ある交差点で1ヵ月間に起きる交通事故の死者数が平均1.2人であるとき、1ヵ月間の死者の数が0人である確率は?(2)国道200km当たりのレストラン数は10軒であるとき、国道1km当たりのレストラン数が1軒以上ある確率は?これらのテーマは、時間(たとえば1日当たり)、距離(たとえば1km当たり)などある一定区間の中で、偶然起こる事象の確率を考える問題です。ポアソン分布は、このように一定の長さの期間や距離において、ごくまれに起こる事象の数の分布です。前回第76回「二項分布とは?」で解説した二項分布と違って、nは必要ありません。たとえば交差点での交通事故の件数は極めてまれですが、その対象となる運転者や通行人のnはとても大きく、日々変化するなどで決められないのが通常です。このように、ポアソン分布は起こる確率の低い事象に対する分布であり、別名「少数の法則」とも呼ばれています。■ポアソン分布における確率分布と確率の求め方(1)の事例でポアソン分布を作成し、ポアソン分布を用いて確率分布を求めてみましょう。二項分布では、ある事象の起こる確率をP、この事象の試行回数をn回としてX回起こる確率を求めました。しかし、この(1)の事例ではPやnはわかりません。わかっているのは平均の1.2人のみです。この例では二項分布は適用できません。この問題を解決してくれるのがポアソン分布です。ある事象における平均値をmとします。この事象がX回起こる確率をP(X)で表すと、ポアソン分布におけるP(X)は次の公式によって求められます。ただ、この式の計算は煩雑なので、Excel関数によって計算してみましょう。算出された確率分布(表1)とそのグラフ(図1)を示します。表1 ポアソンの確率分布(左)図1 ポアソンの確率分布グラフ(右)画像を拡大するポアソン分布を用いて(1)の事例の確率を求めます。ある交差点で1ヵ月間に起きる交通事故の死者数が平均1.2人であるとき、1ヵ月間の死者の数が0人である確率は、上記の確率分布表より、0.3012(約30%)となります。それでは次にある交差点で1ヵ月間に起こる事故の件数が2、3、4、5件として、ポアソン分布のグラフを作成してみましょう(件数のことを“μ”と呼びます。この場合μ=2、3、4、5件となります)表2 ポアソンの確率分布の比較表(左)図2 ポアソンの確率分布の比較グラフ(右)画像を拡大する事故の件数(μ)が大きくなるほどグラフは右側へスライドし、右に裾を引いているグラフがだんだん左右対称に近付いていることがわかります。ポアソン分布はμが大きくなるにつれて、正規分布に近付いていきます。■二項分布とポアソン分布の比較前回第76回で適用したコイントスの事例をポアソン分布で計算してみましょう。「オモテの出る確率が0.5のコインを3回投げたとき、オモテが2回以上出る確率は?」でした。ポアソン分布は平均値を用いますので、この事例における平均値をまず算出します。平均値はn×Pで求められますので、平均値=n×P=3×0.5=1.5となります。Excel関数より下記のようになります。X=2の場合 =POISSON(X,m,0)→POISSON(2,1,5,0)→0.2510X=3の場合 =POISSON(X,m,0)→POISSON(3,1,5,0)→0.1255以上からオモテが2回以上の確率は、0.2510+0.1255=0.3765となり、二項分布における確率は0.5で、ポアソン分布の0.3765と異なる値となりました。ポアソン分布は別名「少数の法則」というように確率が低い事象についての確率分布ですので、50%の確率がある事象については、ポアソン分布を当てはめることに無理があったということになります。医療の領域でポアソン分布は、疫学調査における疾患発生率の推定にも用いられます。たとえば、ある地域におけるある疾患の発生数が、1年間平均で10例だった場合、その疾患の発生数はポアソン分布に従うことがあります。このとき、ポアソン分布の式を使って、ある年にその疾患にかかる人数が5例以下である確率を求めることができます。■二項分布とポアソン分布を使い分けるときの注意点二項分布とポアソン分布は、いずれも離散確率分布ですが、使い分けには以下のような注意点があります。まず、二項分布は、試行回数が固定された独立な試行で成功確率が一定の場合に適用されます。一方、ポアソン分布は、時間や面積などの連続的な空間において、単位時間当たりや単位面積当たりに発生する現象のような、成功回数がまれである(平均値が小さい)場合に適用されます。つまり、二項分布は、離散的な試行で確率を求める場合に適しており、ポアソン分布は、連続的な現象で発生回数がまれな場合に適しています。また、ポアソン分布は、平均値が大きくなると正規分布に近付くため、平均値が大きい場合には正規分布を用いることが一般的です。たとえば、ある病院において、手術中に合併症が生じる確率が0.1%(成功率が99.9%)であるとして、その手術を10回実施する場合、二項分布を用いて、2回以上合併症が生じる確率を求めることができます。一方、ある病院における1日当たりの入院患者数が、平均で5人である場合、ポアソン分布を用いて、ある日に入院患者が3人来る確率を求めることができます。以上のように、二項分布とポアソン分布は、適用する現象が異なるため、使い分けには注意が必要です。次回は「4種類あるエラーバー」について解説します。■さらに学習を進めたい人にお薦めのコンテンツ統計のそこが知りたい!第56回 正規分布とは?第57回 正規分布の面積(確率)の求め方は?第58回 標準正規分布とは?