ポアソン分布

ある一定の時間、大量の観測回数を重ねて稀に発生する事象の回数を記録したものが、ポアソン分布となる。例えば、次のようなものが、ポアソン分布に従う確率変数として考えられる。

・一年の間にある交差点で起こる事故の回数

・ある年で一年間に肺がんで死亡する人数

・一時間あたりにある店にかかってくる電話の回数

二項分布 では、確率\(p\)で成功するベルヌーイ試行を\(n\)回行うとき、成功する回数を確率変数\(X\)とみた。したがって、\(n\)が十分大きく、かつ\(p\)が十分小さいとき、二項分布はポアソン分布に近似できることが分かる。

ポアソン分布の確率密度関数を以下に示す。

\[ f(x) = \frac{\lambda{}^x{}e^\lambda}{x!} \]

ポアソン分布導出の背景

ポアソン分布は、二項分布において\(n\rightarrow\infty\)\(p\rightarrow0\)\(np\rightarrow\lambda\)と置き換えることで導出できる。ここで、\(\lambda\)は強度といい、確率密度関数の形を特徴づける重要な、唯一のパラメータである。

二項分布の確率密度関数は

\[ f(x)=\dbinom{n}{x}p^x(1-p)^{n-x} \]

コンビネーションを分解して近似式を適応していき、最終的にポアソン分布の確率密度関数に持っていく。

\[\begin{eqnarray} f(x) &=& \dbinom{n}{x}p^x(1-p)^{n-x}\\ &=& \frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}\\ &=& \frac{n(n-1)...(n-x+1)}{x!}p^x(1-p)^{n-x}\\ &=& (\frac{n}{n}\frac{n-1}{n}...\frac{n-x+1}{n})(np)^{x}\frac{1}{x!}\frac{(1-p)^n}{(1-p)^x} \end{eqnarray}\]

ここで、より近似による極限の操作を分かりやすくするため、\(\dfrac{n}{n}\dfrac{n-1}{n}...\dfrac{n-x+1}{n}\)の各項に対して\(\dfrac{n-1}{n}=1-\dfrac{1}{n}\)のように変形を施していく。すると、

\[\begin{eqnarray} f(x) &=& \{1(1-\frac{1}{n})...(1-\frac{x+1}{n})\}(np)^{x}\frac{1}{x!}\frac{(1-p)^n}{(1-p)^x} \end{eqnarray}\]

ここで、\(n\)\(x\)より十分大きいため、\(\dfrac{1}{n},\dots,\dfrac{x+1}{n}\)は全て0となり、\(\{1(1-\frac{1}{n})...(1-\frac{x+1}{n})\}\)の項は1に収束する。また、\(np\rightarrow\lambda\)も代入する。

さらに、\({(1-p)^x}=0\)は自明であるが、\((1-p)^n\neq0\)であることに注意されたい。なぜなら、\(n\rightarrow\infty\)であるため、この段階では不定形である。ネイピア数の定義を用いて極限値を求めることができるが、後述する。

\[\begin{eqnarray} f(x) &=& \lambda^x\frac{1}{x!}(1-p)^n \end{eqnarray}\]

ここで、\((1-p)^n=\{(1-p)^{-1/p}\}^{-np}\)という恣意的な変形を行う。以下に示すネイピア数の定義と\(np\rightarrow\lambda\)に注意してさらに変形していく。

\[ e=\lim_{t\rightarrow0}(1+t)^{\frac{1}{t}} \]

先ほどの変形の続きで\(-p=t\)、と置き換えてネイピア数を用いた変形を行うと\((1-p)^n=\{(1-p)^{-1/p}\}^{-np}=e^{-\lambda}\)を得る。

ここでこれまでの結果を式に戻して、

\[\begin{eqnarray} f(x) &=& \lambda^x\frac{1}{x!}e^{-\lambda}\\ &=& \frac{\lambda^x{}e^{-\lambda}}{x!} \end{eqnarray}\]

となり、導出が完了した。

ポアソン分布の概形

ポアソン分布の概形を示しておく。

ここ でもっと広範に\(\lambda\)を変えてみよう。

確率分布であることの証明

確率分布であるには

\(x\)がどのような値でも、\(f(x)\)は0より大きい(\(\forall{}x\in{}X, f(x)\geq0\))。

・全ての\(f(x)\)を足すと、合計1になる(\(\sum_{x\in{}X} = 1\))。

1番目は確率密度関数から自明であるため、2番目を示す。

まず、指数関数\(e^x\)のマクローリン展開より、

\[ e^x = \sum_{n=0}^{\infty}\frac{x^n}{n!} \]

これを変形に用いて、確率の合計が1であることを示す。ポアソン分布の確率密度関数を\(f(x)\)とすると

\[\begin{eqnarray} \sum_{x=0}^{\infty}f(x) &=&\sum_{x=0}^{\infty}\frac{\lambda^x{}e^{-\lambda}}{x!}\\ &=& e^{-\lambda}\sum_{x=1}^{\infty}\frac{\lambda^x}{x!}\\ &=& e^{-\lambda}e^\lambda\\ &=& 1 \end{eqnarray}\]

依って、題意は示された。

ポアソン分布のモーメント母関数

モーメント母関数は

\[ M_X(t) = E[e^{tX}] \]

であった。したがって、二項分布のモーメント母関数は

\[\begin{eqnarray} M_X(t) &=& \sum_{x=0}^{\infty}e^{tx}\frac{\lambda^x{}e^{-\lambda}}{x!}\\ &=& e^{-\lambda}\sum_{x=0}^{\infty}\frac{(\lambda{}e^t)^x}{x!}\\ &=& e^{-\lambda}\sum_{x=0}^{\infty}\frac{(\lambda{}e^t)^xe^{-\lambda{}e^t}}{x!}\frac{1}{e^{-\lambda{}e^t}}\\ &=& e^{\lambda(e^t-1)}\sum_{x=0}^{\infty}\frac{(\lambda{}e^t)^xe^{-\lambda{}e^t}}{x!} \end{eqnarray}\]

ここで、\(\displaystyle{\sum_{x=0}^{\infty}\frac{(\lambda{}e^t)^xe^{-\lambda{}e^t}}{x!}}\)の項は強度\(\lambda{}e^t\)のポアソン分布の確率密度関数とみることができる(\(\lambda\rightarrow\lambda{}e^t\)と置き換えただけ)ので、確率関数の総和は1であることを利用し(さっきの証明)、

\[ M_X(t) = e^{\lambda(e^t-1)} \]

となる。

ポアソン分布の期待値と分散

ポアソン分布の期待値と分散は、以下のように表される。

\[ E[X] = \lambda\\ V[X] = \lambda \]

期待値と分散の証明

モーメント母関数を用いる。

モーメント母関数の0付近での1階微分が期待値\(E[X]\)となり、2階微分が\(E[X^2]\)となる。分散\(V[X]\)\(V[X] = E[X^2]-E[X]^2\)と表されることに注意して

\[\begin{eqnarray} M_X^{'}(t) &=& e^{\lambda(e^t-1)}\lambda{}e^t\\ M_X^{''}(t) &=& e^{\lambda(e^t-1)}\lambda^2{}e^2t + e^{\lambda(e^t-1)}\lambda{}e^t\\ &=& {\lambda(e^t-1)}\lambda{}e^t(\lambda{}e^t + 1)\\ M_X^{'}(0) &=& \lambda\\ M_X^{''}(0) &=& \lambda(\lambda + 1)\\ E[X] &=& \lambda\\ V[X] &=& \lambda \end{eqnarray}\]

より示される。

ポアソン分布の再生性

ある確率変数\(X\)\(\lambda\)を持つポアソン分布に従うとき、よく\(X\sim{}Pois(\lambda)\)と表記する。また、確率分布を特徴づける\(\lambda\)をパラメータという。 ポアソン分布には再生性がある。すなわち、確率変数\(X\)\(Y\)がそれぞれポアソン分布\(Pois(\lambda_1)\)\(Pois(\lambda_2)\)に従うとき、2つの確率変数の和\(X+Y\)が二項分布\(Pois(\lambda_1+\lambda_2)\)に従う。

\[ X\sim{}Pois(\lambda_1),Y\sim{}Pois(\lambda_2)\Leftrightarrow{}X+Y\sim{}Pois(\lambda_1+\lambda_2) \]

再生性の証明

モーメント母関数による。 \(X\)\(Y\)のモーメント母関数は以下のようになる。

\[\begin{eqnarray} M_{X}(t) &=& e^{\lambda_1(e^t-1)}\\ M_{Y}(t) &=& e^{\lambda_2(e^t-1)} \end{eqnarray}\]

従って、\(X+Y\)のモーメント母関数は

\[\begin{eqnarray} M_{X+Y}(t) &=& M_X(t)M_Y(t)\\ &=& e^{\lambda_1(e^t-1)}e^{\lambda_2(e^t-1)}\\ &=& e^{(\lambda_1+\lambda_2)(e^t-1)} \end{eqnarray}\]

これは\(Pois(\lambda_1+\lambda_2)\)なるポアソン分布に従う確率変数のモーメント母関数と同一である。 依って、\(X+Y\sim{}Pois(\lambda_1+\lambda_2)\)となる。

次回、 正規分布 に続く。