まずは具体例で考えましょう.一定の確率で表が出るコインを1回投げて
- 表が出れば1点
- 裏が出れば0点
とするゲームでの点数$X$はベルヌーイ分布に従います.また,このゲームを$n$回続けるときの合計点数$Y$は二項分布に従います.
このことを数学的に言い表すと「確率変数$X_1,X_2,\dots,X_n$が同じベルヌーイ分布に独立に従うとき,これらの和$Y=X_1+X_2+\dots+X_n$は二項分布に従う」となります.
また,同様の関係が幾何分布と負の二項分布に対しても成り立ちます.すなわち,確率変数$X_1,X_2,\dots,X_n$が幾何分布に独立に従うとき,これらの和$Y=X_1+X_2+\dots+X_n$は負の二項分布に従います.
この記事では
- ベルヌーイ分布と二項分布の関係の直観的な考え方
- ベルヌーイ分布と二項分布の確率関数
- ベルヌーイ分布に従う確率変数の和が二項分布に従うことの証明
- 幾何分布と負の二項分布の関係
を順に解説します.
ベルヌーイ分布と二項分布の関係の直観的な考え方
ここでは冒頭のコインの例をもとに,ベルヌーイ分布と二項分布がどのような確率分布だったかを確認し,これらの関係を直観的に解説します.
ベルヌーイ分布を具体例から捉える
表が確率1/3で出るコインを1回投げ,表が出れば1点,裏が出れば0点とするゲームでの点数を$X$とすると,
- $X=1$となる確率は1/3
- $X=0$となる確率は2/3
となりますね.このとき,$X$はベルヌーイ分布$\mrm{Ber}(\frac{1}{3})$に従うといいます.
一般に,1回の試行で確率$p$で起こる事象$A$を考え,事象$A$に対して値1を,余事象$A^c$に対して値0をとる変数$X$はベルヌーイ分布$\mrm{Ber}(p)$に従うといい,
と表します.
二項分布を具体例から捉える
ベルヌーイ分布と同じく,表が確率1/3で出るコインを考えます.
表が出れば1点,裏が出れば0点とするゲームを10回繰り返し,最終的な合計点数を$Y$とすると,$Y$の取りうる値は$Y=0,1,2,3,\dots,10$のいずれかですね.
このとき,$Y$は二項分布$\mrm{Bin}(10,\frac{1}{3})$に従うといいます.
合計点数$Y$は表が出た回数と言い換えることもできますね.
一般に,試行$T$を行い確率$p$で起こる事象$A$を考えるとき,試行$T$を繰り返して事象$A$が起こる回数$Y$は二項分布$\mrm{Bin}(n,p)$に従うといい,
と表します.$n=1$のときの二項分布$\mrm{Bin}(1,p)$はベルヌーイ分布$\mrm{Ber}(p)$と同じですね.
ベルヌーイ分布と二項分布の関係
確率変数$X_1,X_2,\dots,X_n$がベルヌーイ分布に独立に従うとき,
- 各$X_i$は事象$A$が起これば値1
- 事象$A$が起こらなければ(余事象$A^c$が起これば)値0
なので,和$Y=X_1+X_2+\dots+X_n$は試行を$n$回繰り返したときの事象$A$が起こる回数となりますね.
この$Y$はまさに二項分布に従う確率変数ですから,以上をまとめて次のようになることが分かります.
$p$を$0<p<1$を満たす実数,$n$を正の整数とする.確率変数$X_1,X_2,\dots,X_n$が互いに独立にベルヌーイ分布$\mrm{Ber}(p)$に従うとき,
は二項分布$\mrm{Bin}(n,p)$に従う.
この定理はもっとシンプルに「$X_1,X_2,\dots,X_n\overset{\text{i.i.d.}}{\sim}\mrm{Ber}(p)$のとき,$X_1+X_2+\dots+X_n\sim\mrm{Bin}(n,p)$が成り立つ」と表現することもできます.
のちにこの定理を厳密に証明します.
ベルヌーイ分布と二項分布の確率関数
上記の定理を証明するために,ここでベルヌーイ分布と二項分布の定義を確認しておきましょう.
ベルヌーイ分布の定義
実数$p$は$0<p<1$を満たすとする.離散型確率変数$X$がパラメータ$p$のベルヌーイ分布に従うとは,$X$の確率関数$P(X=k)$が
を満たすことをいう.また,このとき$X\sim\mrm{Ber}(p)$などと表す.
慣習的に,ベルヌーイ分布で
- 値1となる事象を成功
- 値0となる事象を失敗
といいます.また,$p$を成功確率ということも多いです.たとえば,確率$p$で表が出るコインを投げて,
- 表が出れば1点(確率$p$)
- 裏が出れば0点(確率$1-p$)
とする場合は,表が出ることを成功,裏が出ることを失敗と考えているわけですね.
二項分布の定義
$p$を$0<p<1$を満たす実数とし,$n$を正の整数とする.離散型確率変数$X$がパラメータ$n$, $p$の二項分布に従うとは,$X$の確率関数$P(X=k)$が
を満たすことをいう.また,このとき$X\sim\mrm{Bin}(n,p)$などと表す.
$\binom{n}{k}$は二項係数で,高校数学でいう組み合わせの場合の数$\Co{n}{k}$と同じものです.
具体例で見たように,二項分布はベルヌーイ試行(成功または失敗のいずれかの事象が起こる試行)を繰り返すことを考えています.
そのため,ベルヌーイ分布と同様に,二項分布$\mrm{Bin}(n,p)$の$p$を慣習的に成功確率ということも多いです.
また,$n$はベルヌーイ試行を繰り返す回数$n$を試行回数ということも多いです.
ベルヌーイ分布に従う確率変数の和が二項分布に従うことの証明
(再掲)$p$を$0<p<1$を満たす実数,$n$を正の整数とする.確率変数$X_1,X_2,\dots,X_n$が互いに独立にベルヌーイ分布$\mrm{Ber}(p)$に従うとき,
は二項分布$\mrm{Bin}(n,p)$に従う.
各$X_1,X_2,\dots,X_n$のとる値は0または1だから,和$X_1+X_2+\dots+X_n$は$0,1,2,\dots,n$のいずれかの値をとることが分かる.
よって,あとは任意の$k=0,1,2,\dots,n$に対して,
が成り立つことを示せばよい.
$X_1+X_2+\dots+X_n=k$となるパターン
$X_1+X_2+\dots+X_n=k$となるのは,$X_1,X_2,\dots,X_n$のうちちょうど$k$個が1となる場合である.
すなわち,$X_1,X_2,\dots,X_n$から値1をとるものをちょうど$k$個選ぶ場合の数に等しく,組み合わせの場合の数$\Co{n}{k}=\binom{n}{k}$である.
(たとえば,$n=5$のとき,$X_1+X_2+X_3+X_4+X_5=3$となるのは
- $(X_1,X_2,X_3,X_4,X_5)=(1,1,1,0,0)$
- $(X_1,X_2,X_3,X_4,X_5)=(1,1,0,1,0)$
- ……
- $(X_1,X_2,X_3,X_4,X_5)=(0,0,1,1,1)$
の場合で,この場合の数は$\Co{5}{3}=\binom{5}{3}=10$である.)
確率$P(X_1+X_2+\dots+X_n=k)$の計算
上記の箇条書きのパターンはいずれも排反なので,それぞれの確率を求めて足し合わせれば,確率$P(X_1+X_2+\dots+X_n=k)$が得られる.
$X_1,X_2,\dots,X_n$は独立なので,いずれのパターンの確率も$p^k(1-p)^{n-k}$だから,
$P(X_1+X_2+\dots+X_n=k)=\underbrace{p^k(1-p)^{n-k}+\dots+p^k(1-p)^{n-k}}_{\text{$\binom{n}{k}$個}}$
である.同じ$p^k(1-p)^{n-k}$を$\binom{n}{k}$個足し合わせているので,
を得る.よって,$X_1+X_2+\dots+X_n$は二項分布$\mrm{Bin}(n,p)$に従う.
本質的に反復試行の確率の公式の導出と同じことをしています.
幾何分布と負の二項分布の関係
ベルヌーイ分布と二項分布の関係と同様の関係が,幾何分布と負の二項分布に対しても成り立ちます.
以下,ベルヌーイ分布と二項分布の関係と同様のストーリーで説明していきます.
直観的な考え方
確率$p$で表が出るコインを投げ続けるとき,
従います.一般に,試行$T$を1回行い確率$p$で起こる事象$A$を考えるとき,試行$T$を繰り返して
- 事象$A$が初めて起こるまでの余事象$A^c$が起こる回数$X$は幾何分布$\mrm{Geo}(p)$に従う
- 事象$A$が$r$回起こるまでの余事象$A^c$が起こる回数$Y$は負の二項分布$\mrm{NB}(r,p)$に従う
といい,それぞれ
と表します.
確率変数$X_1,X_2,\dots,X_r$が幾何分布に独立に従うとき,各$X_i$は事象$A$が起こるまでの余事象$A^c$が起こる回数なので,和$Y=X_1+X_2+\dots+X_r$は余事象$A^c$が$r$回繰り返したときの余事象$A^c$が起こる回数となりますね.
この$Y$はまさに負の二項分布に従う確率変数ですから,以上をまとめて次のようになることが分かります.
$p$を$0<p<1$を満たす実数,$r$を正の整数とする.確率変数$X_1,X_2,\dots,X_r$が互いに独立に幾何分布$\mrm{Geo}(p)$に従うとき,
は負の二項分布$\mrm{NB}(r,p)$に従う.
この定理はもっとシンプルに「$X_1,X_2,\dots,X_r\overset{\text{i.i.d.}}{\sim}\mrm{Geo}(p)$のとき,$X_1+X_2+\dots+X_r\sim\mrm{NB}(r,p)$が成り立つ」と表現することもできます.
幾何分布・負の二項分布の定義
実数$p$は$0<p<1$を満たすとする.離散型確率変数$X$がパラメータ$p$の幾何分布に従うとは,$X$の確率関数$p_X$が
を満たすことをいう.また,このとき$X\sim\mrm{Geo}(p)$などと表す.
$r$を正の整数,$p$は$0<p<1$を満たす実数とする.離散型確率変数$X$がパラメータ$r$, $p$の負の二項分布に従うとは,$X$の確率関数$p_X$が
を満たすことをいう.また,このとき$X\sim\mrm{NB}(r,p)$などと表す.
ベルヌーイ分布・二項分布と同様に,$p$を成功確率ということも多いです.
とくに,負の二項分布で$r=1$とした$\mrm{NB}(1,p)$は,$\binom{r+k-1}{k}=\binom{k}{k}=1$であることから$\mrm{Geo}(p)$に等しいですね.
幾何分布に従う確率変数の和が負の二項分布に従うことの証明
(再掲)$p$を$0<p<1$を満たす実数,$r$を正の整数とする.確率変数$X_1,X_2,\dots,X_r$が互いに独立に幾何分布$\mrm{Geo}(p)$に従うとき,
は負の二項分布$\mrm{NB}(r,p)$に従う.
各$X_1,X_2,\dots,X_r$のとる値は$0,1,2,3,\dots$だから,和$X_1+X_2+\dots+X_r$も値$0,1,2,3,\dots$をとる.
よって,あとは任意の$k=0,1,2,3,\dots$に対して,
が成り立つことを示せばよい.
$X_1+X_2+\dots+X_r=k$となるパターン
$X_1+X_2+\dots+X_r=k$となるのは,$r$種類のものから全部で$k$個選ぶ重複組み合わせの場合の数に等しい.
これは$k$個の◯と$r-1$本の|の並べ方の総数に等しく,組み合わせの場合の数$\Co{r+k-1}{k}=\binom{r+k-1}{k}$である.
(たとえば,$r=5$, $k=10$のとき
- ◯◯|◯◯◯◯|◯|◯|◯◯は$(X_1,X_2,X_3,X_4,X_5)=(2,4,1,1,2)$
- ◯◯◯|◯◯◯◯||◯◯|◯は$(X_1,X_2,X_3,X_4,X_5)=(3,4,0,2,1)$
- |◯◯||◯◯◯◯◯◯|◯◯は$(X_1,X_2,X_3,X_4,X_5)=(0,2,0,6,2)$
に対応する.すなわち,|によって分けられた◯が何個連続しているかと$(X_1,X_2,X_3,X_4,X_5)$を対応させることができる.)
確率$P(X_1+X_2+\dots+X_r=k)$の計算
異なる組$(X_1,X_2,\dots,X_r)$のパターンの確率を求めて足し合わせれば,確率$P(X_1+X_2+\dots+X_r=k)$が得られる.
$X_1,X_2,\dots,X_r$は独立なので,いずれのパターンの確率も$p^k(1-p)^{r}$だから,
$P(X_1+X_2+\dots+X_r=k)=\underbrace{p^k(1-p)^{r}+\dots+p^k(1-p)^{r}}_{\text{$\binom{r+k-1}{k}$個}}$
である.同じ$p^k(1-p)^{r}$を$\binom{r+k-1}{k}$個足し合わせているので,
を得る.よって,$X_1+X_2+\dots+X_r$は負の二項分布$\mrm{NB}(r,p)$に従う.
コメント