ベルヌーイ分布に従う確率変数の和は二項分布に従う|直観と証明

確率分布の性質
確率分布の性質

まずは具体例で考えましょう.一定の確率で表が出るコインを1回投げて

  • 表が出れば1点
  • 裏が出れば0点

とするゲームでの点数$X$はベルヌーイ分布に従います.また,このゲームを$n$回続けるときの合計点数$Y$は二項分布に従います.

このことを数学的に言い表すと「確率変数$X_1,X_2,\dots,X_n$が同じベルヌーイ分布に独立に従うとき,これらの和$Y=X_1+X_2+\dots+X_n$は二項分布に従う」となります.

また,同様の関係が幾何分布負の二項分布に対しても成り立ちます.すなわち,確率変数$X_1,X_2,\dots,X_n$が幾何分布に独立に従うとき,これらの和$Y=X_1+X_2+\dots+X_n$は負の二項分布に従います.

この記事では

  • ベルヌーイ分布と二項分布の関係の直観的な考え方
  • ベルヌーイ分布と二項分布の確率関数
  • ベルヌーイ分布に従う確率変数の和が二項分布に従うことの証明
  • 幾何分布と負の二項分布の関係

を順に解説します.

ベルヌーイ分布と二項分布の関係の直観的な考え方

ここでは冒頭のコインの例をもとに,ベルヌーイ分布二項分布がどのような確率分布だったかを確認し,これらの関係を直観的に解説します.

ベルヌーイ分布を具体例から捉える

表が確率1/3で出るコインを1回投げ,表が出れば1点,裏が出れば0点とするゲームでの点数を$X$とすると,

  • $X=1$となる確率は1/3
  • $X=0$となる確率は2/3

となりますね.このとき,$X$はベルヌーイ分布$\mrm{Ber}(\frac{1}{3})$に従うといいます.

一般に,1回の試行で確率$p$で起こる事象$A$を考え,事象$A$に対して値1を,余事象$A^c$に対して値0をとる変数$X$はベルヌーイ分布$\mrm{Ber}(p)$に従うといい,

    \begin{align*}X\sim\mrm{Ber}(p)\end{align*}

と表します.

二項分布を具体例から捉える

ベルヌーイ分布と同じく,表が確率1/3で出るコインを考えます.

表が出れば1点,裏が出れば0点とするゲームを10回繰り返し,最終的な合計点数を$Y$とすると,$Y$の取りうる値は$Y=0,1,2,3,\dots,10$のいずれかですね.

このとき,$Y$は二項分布$\mrm{Bin}(10,\frac{1}{3})$に従うといいます.

合計点数$Y$は表が出た回数と言い換えることもできますね.

一般に,試行$T$を行い確率$p$で起こる事象$A$を考えるとき,試行$T$を繰り返して事象$A$が起こる回数$Y$は二項分布$\mrm{Bin}(n,p)$に従うといい,

    \begin{align*}Y\sim\mrm{Bin}(n,p)\end{align*}

と表します.$n=1$のときの二項分布$\mrm{Bin}(1,p)$はベルヌーイ分布$\mrm{Ber}(p)$と同じですね.

ベルヌーイ分布と二項分布の関係

確率変数$X_1,X_2,\dots,X_n$がベルヌーイ分布に独立に従うとき,

  • 各$X_i$は事象$A$が起これば値1
  • 事象$A$が起こらなければ(余事象$A^c$が起これば)値0

なので,和$Y=X_1+X_2+\dots+X_n$は試行を$n$回繰り返したときの事象$A$が起こる回数となりますね.

この$Y$はまさに二項分布に従う確率変数ですから,以上をまとめて次のようになることが分かります.

$p$を$0<p<1$を満たす実数,$n$を正の整数とする.確率変数$X_1,X_2,\dots,X_n$が互いに独立にベルヌーイ分布$\mrm{Ber}(p)$に従うとき,

    \begin{align*}X_1+X_2+\dots+X_n\end{align*}

は二項分布$\mrm{Bin}(n,p)$に従う.

この定理はもっとシンプルに「$X_1,X_2,\dots,X_n\overset{\text{i.i.d.}}{\sim}\mrm{Ber}(p)$のとき,$X_1+X_2+\dots+X_n\sim\mrm{Bin}(n,p)$が成り立つ」と表現することもできます.

のちにこの定理を厳密に証明します.

ベルヌーイ分布と二項分布の確率関数

上記の定理を証明するために,ここでベルヌーイ分布二項分布の定義を確認しておきましょう.

ベルヌーイ分布の定義

実数$p$は$0<p<1$を満たすとする.離散型確率変数$X$がパラメータ$p$のベルヌーイ分布に従うとは,$X$の確率関数$P(X=k)$が

    \begin{align*}P(X=1)=p,\quad P(X=0)=1-p\end{align*}

を満たすことをいう.また,このとき$X\sim\mrm{Ber}(p)$などと表す.

慣習的に,ベルヌーイ分布で

  • 値1となる事象を成功
  • 値0となる事象を失敗

といいます.また,$p$を成功確率ということも多いです.たとえば,確率$p$で表が出るコインを投げて,

  • 表が出れば1点(確率$p$)
  • 裏が出れば0点(確率$1-p$)

とする場合は,表が出ることを成功,裏が出ることを失敗と考えているわけですね.

二項分布の定義

$p$を$0<p<1$を満たす実数とし,$n$を正の整数とする.離散型確率変数$X$がパラメータ$n$, $p$の二項分布に従うとは,$X$の確率関数$P(X=k)$が

    \begin{align*}P(X=k)=\binom{n}{k}p^{k}(1-p)^{n-k}\end{align*}

を満たすことをいう.また,このとき$X\sim\mrm{Bin}(n,p)$などと表す.

$\binom{n}{k}$は二項係数で,高校数学でいう組み合わせの場合の数$\Co{n}{k}$と同じものです.

具体例で見たように,二項分布はベルヌーイ試行(成功または失敗のいずれかの事象が起こる試行)を繰り返すことを考えています.

そのため,ベルヌーイ分布と同様に,二項分布$\mrm{Bin}(n,p)$の$p$を慣習的に成功確率ということも多いです.

また,$n$はベルヌーイ試行を繰り返す回数$n$を試行回数ということも多いです.

ベルヌーイ分布に従う確率変数の和が二項分布に従うことの証明

ベルヌーイ分布二項分布の関係を証明しましょう.

(再掲)$p$を$0<p<1$を満たす実数,$n$を正の整数とする.確率変数$X_1,X_2,\dots,X_n$が互いに独立にベルヌーイ分布$\mrm{Ber}(p)$に従うとき,

    \begin{align*}X_1+X_2+\dots+X_n\end{align*}

は二項分布$\mrm{Bin}(n,p)$に従う.

各$X_1,X_2,\dots,X_n$のとる値は0または1だから,和$X_1+X_2+\dots+X_n$は$0,1,2,\dots,n$のいずれかの値をとることが分かる.

よって,あとは任意の$k=0,1,2,\dots,n$に対して,

    \begin{align*}P(X_1+X_2+\dots+X_n=k)=\binom{n}{k}p^k(1-p)^{n-k}\end{align*}

が成り立つことを示せばよい.

$X_1+X_2+\dots+X_n=k$となるパターン

$X_1+X_2+\dots+X_n=k$となるのは,$X_1,X_2,\dots,X_n$のうちちょうど$k$個が1となる場合である.

すなわち,$X_1,X_2,\dots,X_n$から値1をとるものをちょうど$k$個選ぶ場合の数に等しく,組み合わせの場合の数$\Co{n}{k}=\binom{n}{k}$である.

(たとえば,$n=5$のとき,$X_1+X_2+X_3+X_4+X_5=3$となるのは

  • $(X_1,X_2,X_3,X_4,X_5)=(1,1,1,0,0)$
  • $(X_1,X_2,X_3,X_4,X_5)=(1,1,0,1,0)$
  • ……
  • $(X_1,X_2,X_3,X_4,X_5)=(0,0,1,1,1)$

の場合で,この場合の数は$\Co{5}{3}=\binom{5}{3}=10$である.)

確率$P(X_1+X_2+\dots+X_n=k)$の計算

上記の箇条書きのパターンはいずれも排反なので,それぞれの確率を求めて足し合わせれば,確率$P(X_1+X_2+\dots+X_n=k)$が得られる.

$X_1,X_2,\dots,X_n$は独立なので,いずれのパターンの確率も$p^k(1-p)^{n-k}$だから,

$P(X_1+X_2+\dots+X_n=k)=\underbrace{p^k(1-p)^{n-k}+\dots+p^k(1-p)^{n-k}}_{\text{$\binom{n}{k}$個}}$

である.同じ$p^k(1-p)^{n-k}$を$\binom{n}{k}$個足し合わせているので,

    \begin{align*}P(X_1+X_2+\dots+X_n=k)=\binom{n}{k}p^k(1-p)^{n-k}\end{align*}

を得る.よって,$X_1+X_2+\dots+X_n$は二項分布$\mrm{Bin}(n,p)$に従う.

本質的に反復試行の確率の公式の導出と同じことをしています.

幾何分布と負の二項分布の関係

ベルヌーイ分布二項分布の関係と同様の関係が,幾何分布負の二項分布に対しても成り立ちます.

以下,ベルヌーイ分布と二項分布の関係と同様のストーリーで説明していきます.

直観的な考え方

確率$p$で表が出るコインを投げ続けるとき,

  • 表が初めて出るまでの裏が出る回数$X$は幾何分布$\mrm{Geo}(p)$に
  • 表が$r$回出るまでの裏が出る回数$Y$は負の二項分布$\mrm{NB}(r,p)$に

従います.一般に,試行$T$を1回行い確率$p$で起こる事象$A$を考えるとき,試行$T$を繰り返して

  • 事象$A$が初めて起こるまでの余事象$A^c$が起こる回数$X$は幾何分布$\mrm{Geo}(p)$に従う
  • 事象$A$が$r$回起こるまでの余事象$A^c$が起こる回数$Y$は負の二項分布$\mrm{NB}(r,p)$に従う

といい,それぞれ

    \begin{align*}X\sim\mrm{Geo}(p),\quad Y\sim\mrm{NB}(r,p)\end{align*}

と表します.

確率変数$X_1,X_2,\dots,X_r$が幾何分布に独立に従うとき,各$X_i$は事象$A$が起こるまでの余事象$A^c$が起こる回数なので,和$Y=X_1+X_2+\dots+X_r$は余事象$A^c$が$r$回繰り返したときの余事象$A^c$が起こる回数となりますね.

この$Y$はまさに負の二項分布に従う確率変数ですから,以上をまとめて次のようになることが分かります.

$p$を$0<p<1$を満たす実数,$r$を正の整数とする.確率変数$X_1,X_2,\dots,X_r$が互いに独立に幾何分布$\mrm{Geo}(p)$に従うとき,

    \begin{align*}X_1+X_2+\dots+X_r\end{align*}

は負の二項分布$\mrm{NB}(r,p)$に従う.

この定理はもっとシンプルに「$X_1,X_2,\dots,X_r\overset{\text{i.i.d.}}{\sim}\mrm{Geo}(p)$のとき,$X_1+X_2+\dots+X_r\sim\mrm{NB}(r,p)$が成り立つ」と表現することもできます.

幾何分布・負の二項分布の定義

実数$p$は$0<p<1$を満たすとする.離散型確率変数$X$がパラメータ$p$の幾何分布に従うとは,$X$の確率関数$p_X$が

    \begin{align*}p_X(k)=(1-p)^{k}p\quad(k=0,1,2,3,\dots)\end{align*}

を満たすことをいう.また,このとき$X\sim\mrm{Geo}(p)$などと表す.

$r$を正の整数,$p$は$0<p<1$を満たす実数とする.離散型確率変数$X$がパラメータ$r$, $p$の負の二項分布に従うとは,$X$の確率関数$p_X$が

    \begin{align*}p_X(k)=\binom{r+k-1}{k}p^{r}(1-p)^{k}\quad(k=0,1,2,3,\dots)\end{align*}

を満たすことをいう.また,このとき$X\sim\mrm{NB}(r,p)$などと表す.

ベルヌーイ分布・二項分布と同様に,$p$を成功確率ということも多いです.

とくに,負の二項分布で$r=1$とした$\mrm{NB}(1,p)$は,$\binom{r+k-1}{k}=\binom{k}{k}=1$であることから$\mrm{Geo}(p)$に等しいですね.

幾何分布に従う確率変数の和が負の二項分布に従うことの証明

幾何分布負の二項分布の関係を証明しましょう.

(再掲)$p$を$0<p<1$を満たす実数,$r$を正の整数とする.確率変数$X_1,X_2,\dots,X_r$が互いに独立に幾何分布$\mrm{Geo}(p)$に従うとき,

    \begin{align*}X_1+X_2+\dots+X_r\end{align*}

は負の二項分布$\mrm{NB}(r,p)$に従う.

各$X_1,X_2,\dots,X_r$のとる値は$0,1,2,3,\dots$だから,和$X_1+X_2+\dots+X_r$も値$0,1,2,3,\dots$をとる.

よって,あとは任意の$k=0,1,2,3,\dots$に対して,

    \begin{align*}P(X_1+X_2+\dots+X_r=k)=\binom{r+k-1}{k}p^{r}(1-p)^{k}\end{align*}

が成り立つことを示せばよい.

$X_1+X_2+\dots+X_r=k$となるパターン

$X_1+X_2+\dots+X_r=k$となるのは,$r$種類のものから全部で$k$個選ぶ重複組み合わせの場合の数に等しい.

これは$k$個の◯と$r-1$本の|の並べ方の総数に等しく,組み合わせの場合の数$\Co{r+k-1}{k}=\binom{r+k-1}{k}$である.

(たとえば,$r=5$, $k=10$のとき

  • ◯◯|◯◯◯◯|◯|◯|◯◯は$(X_1,X_2,X_3,X_4,X_5)=(2,4,1,1,2)$
  • ◯◯◯|◯◯◯◯||◯◯|◯は$(X_1,X_2,X_3,X_4,X_5)=(3,4,0,2,1)$
  • |◯◯||◯◯◯◯◯◯|◯◯は$(X_1,X_2,X_3,X_4,X_5)=(0,2,0,6,2)$

に対応する.すなわち,|によって分けられた◯が何個連続しているかと$(X_1,X_2,X_3,X_4,X_5)$を対応させることができる.)

確率$P(X_1+X_2+\dots+X_r=k)$の計算

異なる組$(X_1,X_2,\dots,X_r)$のパターンの確率を求めて足し合わせれば,確率$P(X_1+X_2+\dots+X_r=k)$が得られる.

$X_1,X_2,\dots,X_r$は独立なので,いずれのパターンの確率も$p^k(1-p)^{r}$だから,

$P(X_1+X_2+\dots+X_r=k)=\underbrace{p^k(1-p)^{r}+\dots+p^k(1-p)^{r}}_{\text{$\binom{r+k-1}{k}$個}}$

である.同じ$p^k(1-p)^{r}$を$\binom{r+k-1}{k}$個足し合わせているので,

    \begin{align*}P(X_1+X_2+\dots+X_r=k)=\binom{r+k-1}{k}p^k(1-p)^{r}\end{align*}

を得る.よって,$X_1+X_2+\dots+X_r$は負の二項分布$\mrm{NB}(r,p)$に従う.

管理人

プロフィール

山本やまもと 拓人たくと

元予備校講師.講師として駆け出しの頃から予備校の生徒アンケートで抜群の成績を残し,通常の8倍の報酬アップを提示されるなど頭角を表す.

飛び級・首席合格で大学院に入学しそのまま首席修了するなど数学の深い知識をもち,本質をふまえた分かりやすい授業に定評がある.

現在はオンライン家庭教師,社会人向け数学教室での講師としての教育活動とともに,京都大学で数学の研究も行っている.専門は非線形偏微分方程式論.大学数学系YouTuberとしても活動中.

趣味は数学,ピアノ,甘いもの食べ歩き.公式LINEを友達登録で【限定プレゼント】配布中.

Twitter・大学数学YouTube・公式LINEを見てみる

コメント