ひとつのコールセンターに1時間にかかってくる電話の回数は,観測する1時間によって回数が変わりますから確率変数と考えることができます.
同様に,ひとつの市の1日の事故件数は,観測する1日によって件数が変わりますから確率変数と考えることができます.
このような「事象が時間あたりに起こる回数」が従う確率分布をポアソン分布といいます.
ただし,どの時間帯でも事象の起こりやすさは変わらず,各試行は独立であるとしています.
この記事では
- ポアソン分布の定義・基本性質
- ポアソン分布の具体例
- 期待値・分散・確率母関数の導出
を順に説明します.
「重要な確率分布」の一連の記事
- 離散型確率分布の定義と期待値・分散・母関数
- 連続型確率分布の定義と期待値・分散・母関数
- 連続型一様分布(準備中)
- 正規分布(準備中)
- カイ二乗分布(準備中)
- t分布(準備中)
- F分布(準備中)
- ガンマ分布(準備中)
- ベータ分布(準備中)
ポアソン分布の定義・基本性質
まずはポアソン分布の定義と,期待値$E[X]$・分散$V[X]$・確率母関数$G_X(s)$の結果を紹介します.
定義($X\sim\mrm{Po}(\lambda)$)
そもそも離散型確率変数$X$の確率関数$p_X$は
\begin{align*}p_X(k)=P(X=k)\end{align*}
と定義されるのでした.つまり,$X=k$となる確率を$p_X(k)$と表すことを思い出しておきましょう.
$\lambda>0$とする.離散型確率変数$X$がパラメータ$\lambda$のポアソン分布(Poisson distribution)に従うとは,$X$の確率関数$p_X$が
\begin{align*}p_X(k)=e^{-\lambda}\frac{\lambda^{k}}{k!}\quad(k=0,1,2,3,\dots)\end{align*}
を満たすことをいう.また,このとき$X\sim\mrm{Po}(\lambda)$などと表す.
ポアソン(Siméon Denis Poisson)は18世紀〜19世紀のフランスの数学者の名前です.
直観的には,時間あたりの平均発生回数が$\lambda$の事象の発生回数はポアソン分布$\mrm{Po}(\lambda)$に従います.
実は二項分布$\mrm{Bin}(n,p_n)$で$np=\lambda$を満たしつつ極限$n\to\infty$を考えるとポアソン分布$\mrm{Po}(\lambda)$に近付いていきます.このことをポアソンの少数法則といいます.
二項分布が発生回数を表すことと併せると,ポアソン分布も(なんらかの)発生回数に関する分布であることは自然ですね.
ポアソンの少数法則をより詳しく述べると「$\lim\limits_{n\to\infty}np_n=\lambda$を満たす$\lambda$, $0<p_n<1$($n=1,2,\dots$)に対して,$X_n\sim\mrm{Bin}(n,p_n)$,$X\sim\mrm{Po}(\lambda)$とすると,確率変数列$\{X_n\}$は$X$に分布収束する」となります.
期待値$E[X]$・分散$V[X]$・確率母関数$G_X(s)$
のちに導出するように,ポアソン分布の期待値・分散・確率母関数は次のようになります.
$X\sim\mrm{Po}(\lambda)$の期待値$E[X]$,分散$V[X]$,確率母関数$G_X(s)$は
\begin{align*}&E[X]=\lambda,\quad
V[X]=\lambda,\quad
G_X(s)=e^{\lambda(s-1)}\end{align*}
である.
確率母関数は$G_X(s)=E[s^X]$と定義されるので,$s=e^{t}$と置き換えれば積率母関数
\begin{align*}M_X(t)=E[e^{tX}]=e^{\lambda(e^{t}-1)}\end{align*}
が得られ,$s=e^{it}$と置き換えれば特性関数
\begin{align*}\phi_X(t)=E[e^{itX}]=e^{\lambda(e^{it}-1)}\end{align*}
が得られますね.
ポアソン分布の具体例
ポアソン分布に従う確率変数として,電話の回数・事故の件数を考えます.
具体例1(電話の回数):$\mrm{Po}(4)$
あるコールセンターには1時間で平均4回の電話がかかってくるとする.2本の電話が同時にはかかってこないとし,どの電話も独立にかかってくるとすると,1時間でかかってくる電話の回数$X$はどのようなポアソン分布に従うか?また,$X=3$となる確率を求めよ.
1時間での電話の平均回数は4なので,$X$はパラメータ4のポアソン分布に従う($X\sim\mrm{Po}(4)$).
このとき,確率変数$X$の確率関数は
\begin{align*}p_X(k)=e^{-4}\frac{4^k}{k!}\end{align*}
なので,$X=3$となる確率は
\begin{align*}p_X(3)=e^{-4}\frac{4^3}{3!}=\frac{32}{3e^4}(=0.195\dots)\end{align*}
である.
具体例2(事故の件数):$\mrm{Po}(2)$
ある市では1日で平均2回の交通事故が発生するとする.2つの交通事故が同時には起こらないとし,どの交通事故も独立に起こるとすると,1日でかかってくる交通事故の回数$X$はどのようなポアソン分布に従うか?また,$X=4$となる確率を求めよ.
1日での交通事故の平均回数は2なので,$X$はパラメータ2のポアソン分布に従う($X\sim\mrm{Po}(2)$).
このとき,確率変数$X$の確率関数は
\begin{align*}p_X(k)=e^{-2}\frac{2^k}{k!}\end{align*}
なので,$X=4$となる確率は
\begin{align*}p_X(4)=e^{-2}\frac{2^4}{4!}=\frac{2}{3e^2}(=0.090\dots)\end{align*}
である.
期待値・分散・確率母関数の導出
ポアソン分布の平均・分散・確率母関数を定義に基づいて求めましょう.
平均$E[X]$の導出
$X\sim\mrm{Po}(\lambda)$の期待値は$E[X]=\lambda$である.
$k=0$のとき$k\cdot p_X(k)=0$であることに注意すると,$X$の期待値$E[X]$の定義より
\begin{align*}E[X]&=\sum_{k=0}^{\infty}k\cdot p_X(k)=\sum_{k=1}^{\infty}k\cdot p_X(k)=\sum_{k=1}^{\infty}k\cdot e^{-\lambda}\frac{\lambda^{k}}{k!}
\\&=\lambda\sum_{k=1}^{\infty}e^{-\lambda}\frac{\lambda^{k-1}}{(k-1)!}=\lambda\sum_{k=1}^{\infty}p_X(k-1)\end{align*}
となる.ここで,級数の部分は全ての場合の確率の和だから
\begin{align*}\sum_{k=1}^{\infty}p_X(k-1)=p_X(0)+p_X(1)+p_X(2)+\dots=1\end{align*}
なので,$E[X]=\lambda$である.
二項分布を定義から求めるときにも同様の求め方をしていました.級数の部分は
\begin{align*}\sum_{k=1}^{\infty}e^{-\lambda}\frac{\lambda^{k-1}}{(k-1)!}=e^{-\lambda}\bra{1+\lambda+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+\dots}\end{align*}
となっており,( )の中身は$e^\lambda$のマクローリン展開なので
\begin{align*}E[X]=\lambda e^{-\lambda}e^{\lambda}=\lambda\end{align*}
と示しても構いません.
分散$V[X]$の導出
$X\sim\mrm{Po}(\lambda)$の分散は$V[X]=\lambda$である.
一般に$X$の分散は
\begin{align*}V[X]&=E[X^2]-E[X]^2=E[(X^2-X)+X]-E[X]^2
\\&=E[X(X-1)]+E[X]-E[X]^2\end{align*}
で求まる.$E[X]=\lambda$は上で求めたから,あとは$E[X(X-1)]$を求めればよい.
$k=0,1$のとき$k(k-1)\cdot p_X(k)=0$であることに注意すると,$X(X-1)$の期待値$E[X(X-1)]$は定義より
\begin{align*}E[X(X-1)]&=\sum_{k=0}^{n}k(k-1)\cdot p_X(k)=\sum_{k=2}^{n}k(k-1)\cdot p_X(k)
\\&=\sum_{k=2}^{n}k(k-1)\cdot e^{-\lambda}\frac{\lambda^{k}}{k!}=\lambda^2\sum_{k=2}^{n}e^{-\lambda}\frac{\lambda^{k-2}}{(k-2)!}
\\&=\lambda^2\sum_{k=2}^{n}p_X(k-2)\end{align*}
となる.ここで,級数の部分は全ての場合の確率の和だから
\begin{align*}\sum_{k=2}^{\infty}p_X(k-2)=p_X(0)+p_X(1)+p_X(2)+\dots=1\end{align*}
なので,$E[X(X-1)]=\lambda^2$である.よって,
\begin{align*}V[X]=\lambda^2+\lambda-\lambda^2=\lambda\end{align*}
である.
期待値の証明と同じく,級数の部分は
\begin{align*}\sum_{k=2}^{\infty}e^{-\lambda}\frac{\lambda^{k-2}}{(k-2)!}=e^{-\lambda}\bra{1+\lambda+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+\dots}\end{align*}
となっており,( )の中身は$e^\lambda$のマクローリン展開なので
\begin{align*}E[X]=\lambda e^{-\lambda}e^{\lambda}=\lambda\end{align*}
と示しても構いません.
確率母関数$G_X(s)$の導出
$X\sim\mrm{P}(\lambda)$の確率母関数$G_X(s)$は
\begin{align*}G_X(s)=e^{\lambda(s-1)}\end{align*}
である.
確率母関数$G_X(s)$の定義より
\begin{align*}G_X(s)&=E[s^X]=\sum_{k=0}^{n}s^k\cdot p_X(k)
\\&=\sum_{k=0}^{n}s^k\cdot e^{-\lambda}\frac{\lambda^k}{k!}=e^{-\lambda}\sum_{k=0}^{n}\frac{(\lambda s)^k}{k!}\end{align*}
である.級数の部分は
\begin{align*}\sum_{k=0}^{n}\frac{(\lambda s)^k}{k!}=1+\lambda s+\frac{(\lambda s)^2}{2!}+\frac{(\lambda s)^3}{3!}+\dots\end{align*}
となっており,これは$e^{\lambda s}$のマクローリン展開なので
\begin{align*}G_X(s)=e^{-\lambda}e^{\lambda s}=e^{\lambda(s-1)}\end{align*}
である.
コメント