幾何分布Geo(p)の期待値・分散・母関数｜初成功までの失敗回数

表が一定の確率で出るコインを繰り返し投げるとき，運が良ければすぐに表が出ますが，場合によってはなかなか表が出ないこともあります．

このように，一定の確率で成功する試行（ベルヌーイ試行）を初めて成功するまで繰り返すときの失敗回数が従う確率分布を幾何分布といいます．

この記事では

幾何分布の定義・基本性質
幾何分布の具体例
幾何分布の期待値・分散・確率母関数の導出

を順に説明します．

テキストによっては初めて成功したときの回数をとる確率変数$X$が従う確率分布を指すこともあります．

「重要な確率分布」の一連の記事

離散型確率分布の定義と期待値・分散・母関数

連続型確率分布の定義と期待値・分散・母関数
1. 連続型一様分布(準備中)
2. 正規分布(準備中)
3. カイ二乗分布(準備中)
4. t分布(準備中)
5. F分布(準備中)
6. ガンマ分布(準備中)
7. ベータ分布(準備中)

幾何分布の定義・基本性質
1. $X\sim\mrm{Geo}(p)$の定義
2. 期待値$E[X]$・分散$V[X]$・確率母関数$G_X(s)$
幾何分布の具体例
1. 具体例１（コイン）：$\mrm{Geo}(\frac{1}{3})$
2. 具体例２（サイコロ）：$\mrm{Geo}(\frac{5}{6})$
幾何分布の期待値・分散・確率母関数の導出
定義に基づいた期待値・分散の導出
参考文献
1. 現代数理統計学の基礎

幾何分布の定義・基本性質

まずは幾何分布の定義を説明し，そのあと幾何分布に従う確率変数の具体例を紹介します．

$X\sim\mrm{Geo}(p)$の定義

そもそも離散型確率変数$X$の確率関数$p_X$は

\begin{align*}p_X(k)=P(X=k)\end{align*}

と定義されるのでした．つまり，$X=k$となる確率を$p_X(k)$と表すことを思い出しておきましょう．

実数$p$は$0<p<1$を満たすとする．離散型確率変数$X$がパラメータ$p$の幾何分布（geometric distribution）に従うとは，$X$の確率関数$p_X$が

\begin{align*}p_X(k)=(1-p)^{k}p\quad(k=0,1,2,3,\dots)\end{align*}

を満たすことをいう．また，このとき$X\sim\mrm{Geo}(p)$などと表す．

１回１回の成功確率を$p$と考えると，１回１回の$1-p$は失敗確率ですから，$(1-p)^{k}p$は$k$回失敗して１回成功する確率ですね．

つまり，幾何分布$\mrm{Geo}(p)$に従う確率変数$X$とは，成功確率$p$のベルヌーイ試行を繰り返し，初めて成功するまでの失敗の回数をとる確率変数のことをいうわけですね．

期待値$E[X]$・分散$V[X]$・確率母関数$G_X(s)$

のちに導出するように，幾何分布の期待値・分散・確率母関数は次のようになります．

$X\sim\mrm{Geo}(p)$に対して，期待値$E[X]$，分散$V[X]$，確率母関数$G_X(s)$は

\begin{align*}E[X]=\frac{1-p}{p},\quad
V[X]=\frac{1-p}{p^2},\quad
G_X(s)=\frac{p}{1-s+sp}\end{align*}

である．ただし，確率母関数の定義域は$|s|<\frac{1}{1-p}$である．

確率母関数は$G_X(s)=E[s^X]$と定義されるので，$s=e^{t}$と置き換えれば積率母関数

\begin{align*}M_X(t)=E[e^{tX}]=\frac{p}{1-e^t+e^tp}\end{align*}

が得られ，$s=e^{it}$と置き換えれば特性関数

\begin{align*}\phi_X(t)=E[e^{itX}]=\frac{p}{1-e^{it}+e^{it}p}\end{align*}

が得られますね．

幾何分布の具体例

幾何分布に従う確率変数として，コイン投げ・サイコロ投げを具体的に考えます．

具体例１（コイン）：$\mrm{Geo}(\frac{1}{3})$

冒頭で紹介したように，歪んだコインを表が出るまで投げるときの試行回数は幾何分布に従います．

投げると表が確率$\dfrac{1}{3}$で出る歪んだコインを投げ続け，初めてコインが表が出たときの回数を確率変数$X$とすると，$X$が幾何分布に従うことを示せ．

$X$は０以上の整数のいずれかの値をとる．０以上の整数$k$に対して，$X=k$ということは

$k$回目まで表が出ない（確率$(1-\frac{1}{3})^{k}$）
$(k+1)$回目で表が出る（確率$\frac{1}{3}$）

ということなので，

\begin{align*}p_X(k)=P(X=k)=\bra{1-\frac{1}{3}}^{k-1}\cdot\frac{1}{3}\end{align*}

である．よって，$X$はパラメータ$\frac{1}{3}$の幾何分布に従う（$X\sim\mrm{Geo}(\frac{1}{3})$）．

運によってはすぐに表が出ることもあれば，いつまで経っても裏が出続けることもあります．確率は非常に低いですが，100回裏が出続ける確率は０ではありません．

そのため，$X$は全ての０以上の整数の値をとり得ることに注意してください．

具体例２（サイコロ）：$\mrm{Geo}(\frac{5}{6})$

各目が均等に出る６面サイコロを振り続け，初めて１〜５の目が出るまでの６の目が出た回数を確率変数$X$とすると，$X$が幾何分布に従うことを示せ．

この問題の１〜５の目が出たときに成功．６の目が出たときに失敗と考えるわけですね．

サイコロの出目（１〜６）自体は$X$ではないことに注意してください．$X$はあくまで６の目が出た回数なので$X=0,1,2,3,\dots$です．

$X$は０以上の整数のいずれかの値をとる．０以上の整数$k$に対して，$X=k$ということは

$k$回目まで１〜５の目が出ない（確率$(1-\frac{5}{6})^{k}$）
$(k+1)$回目で表が出る（確率$\frac{5}{6}$）

ということなので，

\begin{align*}p_X(k)=P(X=k)=\bra{1-\frac{5}{6}}^{k-1}\cdot\frac{5}{6}\end{align*}

である．よって，$X$はパラメータ$\frac{5}{6}$の幾何分布に従う（$X\sim\mrm{Geo}(\frac{5}{6})$）．

具体例１のコインと同様に，運によってはすぐに１〜５の目が出ることもあれば，いつまで経っても６が出続けることもあります．

そのため，$X$は全ての正の整数の値をとり得ることに注意してください．

幾何分布の期待値・分散・確率母関数の導出

幾何分布の期待値・分散・確率母関数を求めましょう．ここでは確率母関数を先に求めて，そこから期待値・分散を求めましょう．

期待値・分散は定義から直接求めることもできますが少々面倒です．しかし，念のためこの記事の最後に定義から直接計算する方法も紹介しています．

確率母関数$G_X(s)$の導出

$X\sim\mrm{Geo}(p)$の確率母関数は$G_X(s)=\dfrac{p}{1-s+sp}$である．ただし，定義域は$|s|<\dfrac{1}{1-p}$である．

確率母関数$G_X(s)$の定義より

\begin{align*}G_X(s)&=E[s^X]=\sum_{k=0}^{\infty}s^k\cdot p_X(k)
\\&=\sum_{k=0}^{\infty}s^k\cdot(1-p)^{k}p=p\sum_{k=0}^{\infty}(s-sp)^{k}\end{align*}

である．これは初項$p$，公比$s-sp$の等比級数である．

一般に初項$a\neq0$, 公比$r$の等比級数が収束するための必要十分条件は$|r|<1$であり，このとき$\frac{a}{1-r}$に収束することに注意すると，

\begin{align*}|s-sp|<1\iff |s|<\frac{1}{1-p}\end{align*}

を満たす$s$に対してのみ確率母関数$G_X(s)$が定義され，

\begin{align*}G_X(s)=\frac{p}{1-(s-sp)}=\frac{p}{1-s+sp}\end{align*}

である．

平均$E[X]$の導出

$X\sim\mrm{Geo}(p)$の期待値は$E[X]=\dfrac{1-p}{p}$である．

$0<p<1$より$|1|<\frac{1}{1-p}$なので，$|s|<\frac{1}{1-p}$は$s=1$を含む．よって，確率母関数

\begin{align*}G_X(s)=\frac{p}{1-s+sp}\quad\bra{|s|<\frac{1}{1-p}}\end{align*}

は$s=1$でも定義されている．

一般に$G’_X(1)=E[X]$であり，$G_X(s)$の$s=1$での微分係数は

\begin{align*}G’_X(1)&=\left.\frac{d}{ds}(p(1-s+sp)^{-1})\right|_{s=1}
\\&=\left.p(-1)(-1+p)(1-s+sp)^{-2}\right|_{s=1}
\\&=\left.\frac{p(1-p)}{(1-s+sp)^{2}}\right|_{s=1}=\frac{p(1-p)}{p^2}=\frac{1-p}{p}\end{align*}

なので，$E[X]=\frac{1-p}{p}$を得る．

分散$V[X]$の導出

$X\sim\mrm{Geo}(p)$の分散は$V[X]=\dfrac{1-p}{p^2}$である．

$X$の分散は

\begin{align*}V[X]&=E[X^2]-E[X]^2
\\&=E[X(X-1)]+E[X]-E[X]^2\end{align*}

で求まる．$E[X]=\frac{1-p}{p}$は上で求めたから，あとは$E[X(X-1)]$を求めればよい．

$E[X]=\frac{1-p}{p}$の証明で説明したように，確率母関数$G_X(s)$は$s=1$で定義されている．

一般に$G^{\prime\prime}_X(1)=E[X(X-1)]$であり，$G_X(s)$の$s=1$での２階微分係数は

\begin{align*}G^{\prime\prime}_X(1)&=\left.\frac{d}{ds}(p(1-p)(1-s+sp)^{-2})\right|_{s=1}
\\&=\left.p(1-p)(-2)(-1+p)(1-s+sp)^{-3}\right|_{s=1}
\\&=\left.2p(1-p)^2(1-s+sp)^{-3}\right|_{s=1}
\\&=\frac{2p(1-p)^2}{p^3}=\frac{2(1-p)^2}{p^2}\end{align*}

なので，$E[X(X-1)]=\frac{2(1-p)^2}{p^2}$を得る．以上より，

\begin{align*}V[X]&=\frac{2(1-p)^2}{p^2}+\frac{1-p}{p}-\bra{\frac{1-p}{p}}^2
\\&=\frac{2(1-p)^2+p(1-p)-(1-p)^2}{p^2}
\\&=\frac{\{(1-p)+p\}(1-p)}{p^2}=\frac{1-p}{p^2}\end{align*}

を得る．

定義に基づいた期待値・分散の導出

少々面倒ですが，期待値$E[X]$も分散$V[X]$も定義から直接求めることもできます．この場合は「等差×等比型の数列の和」に帰着させます．

等差×等比型の数列の和（高校数学の復習）

一般に等差数列$\{a_n\}$と等比数列$\{b_n\}$からできる和

\begin{align*}S_n=\sum_{k=1}^{n}a_nb_n\end{align*}

は数列$\{b_n\}$の公比$r$を用いて$S_n-rS_n$を考えることで，等比数列の和に帰着して求めることができます．

$n$を正の整数とする．和

\begin{align*}S_n=1\cdot2+3\cdot2^2+5\cdot2^3+\dots+(2n-1)\cdot2^n\end{align*}

を計算せよ．

この問題の和は

等差数列$1,3,5,\dots,2n-1$
等比数列$2,2^2,2^3,\dots,2^n$（公比２）

からできる「等差×等比型の数列の和」なので，等比数列の公比２を用いて$S_n-2S_n$を考えることで，等比数列の和に帰着します．

$S_n-2S_n$は

\begin{align*}\begin{matrix}
&S_n&=&1\cdot2&+&3\cdot2^2&+\dots+&(2n-1)2^n&\\
-)&2S_n&=&&&1\cdot2^2&+\dots+&(2n-3)2^{n}&+(2n-1)2^{n+1}\\ \hline
&-S_n&=&2&+&2\cdot2^2&+\dots+&2\cdot2^{n}&-(2n-1)2^{n+1}
\end{matrix}\end{align*}

である．右辺の第２項から第$n$項までの和は初項８，公比２の等比数列の和だから，

\begin{align*}S_n&=-2-(2\cdot2^2+2\cdot2^3+\dots+2\cdot2^{n})+(2n-1)2^{n+1}
\\&=-2-\frac{8(1-2^{n-1})}{1-2}+(2n-1)2^{n+1}
\\&=-2+8(1-2^{n-1})+(2n-1)2^{n+1}
\\&=6-2^{n+1}+(n-1)2^{n+2}\end{align*}

となる．

期待値$E[X]$の導出

（再掲）$X\sim\mrm{Geo}(p)$の期待値は$E[X]=\dfrac{1-p}{p}$である．

$k=0$のとき$k\times p_X(k)=0$であることに注意すると，確率変数$X$の期待値$E[X]$の定義より

\begin{align*}E[X]&=\sum_{k=0}^{\infty}k\times p_X(k)=\sum_{k=1}^{\infty}k\times p_X(k)
\\&=\sum_{k=1}^{\infty}k\times(1-p)^{k}p=\lim_{n\to\infty}p\sum_{k=1}^{n}k(1-p)^{k}\end{align*}

である．ここで，$q=1-p$とおき，

\begin{align*}S_n=\sum_{k=1}^{n}k(1-p)^{k}=\sum_{k=1}^{n}kq^{k}\end{align*}

とおくと，$S_n-qS_n$を計算すると

\begin{align*}\begin{matrix}
&S_n&=&1q&+&2q^2&+\dots+&nq^{n}&&\\
-)&qS_n&=&&&1q^2&+\dots+&(n-1)q^{n}&+nq^{n+1}\\ \hline
&(1-q)S_n&=&q&+&q^2&+\dots+&q^{n}&-nq^{n+1}
\end{matrix}\end{align*}

となる．$1-q=p$より左辺は$pS_n$であり，右辺は第$n$項まで等比数列の和なので

\begin{align*}pS_n&=q+q^2+\dots+q^{n}-nq^{n+1}
\\&=\frac{q(1-q^n)}{1-q}-nq^{n+1}=\frac{q(1-q^n)}{p}-nq^{n+1}\end{align*}

となる．よって，期待値は

\begin{align*}E[X]&=\lim_{n\to\infty}pS_n=\lim_{n\to\infty}\bra{\frac{q(1-q^n)}{p}-nq^{n+1}}
\\&=\lim_{n\to\infty}\bra{\frac{q(1-0)}{p}-0}=\frac{q}{p}=\frac{1-p}{p}\end{align*}

を得る．

いまの証明では部分和$S_n=\sum_{k=1}^{n}kq^{k}$が「等差×等比型の数列の和」になっているので，等比数列部分の公比$q$を用いて$S_n-qS_n$を考えているわけですね．

分散$V[X]$の導出

（再掲）$X\sim\mrm{Geo}(p)$の分散は$V[X]=\dfrac{1-p}{p^2}$である．

$X$の分散は$V[X]=E[X^2]-E[X]^2$で求まる．$E[X]=\frac{1-p}{p}$は上で求めたから，あとは$E[X^2]$を求めればよい．

$k=0$のとき$k^2\times p_X(k)=0$であることに注意すると，確率変数$X^2$の分散$E[X^2]$の定義より

\begin{align*}E[X^2]&=\sum_{k=0}^{\infty}k^2\times p_X(k)=\sum_{k=1}^{\infty}k^2\times p_X(k)
\\&=\sum_{k=1}^{\infty}k^2\times(1-p)^{k}p=\lim_{n\to\infty}p\sum_{k=1}^{n}k^2(1-p)^{k}\end{align*}

である．ここで，$q=1-p$とおき，

\begin{align*}S_n=\sum_{k=1}^{n}k^2(1-p)^{k}=\sum_{k=1}^{n}k^2q^{k}\end{align*}

とおくと，$S_n-qS_n$は

\begin{align*}\begin{matrix}
&S_n&=&1^2q&+&2^2q^2&+\dots+&n^2q^{n}&&\\
-)&qS_n&=&&&1^2q^2&+\dots+&(n-1)^2q^{n}&+n^2q^{n+1}\\ \hline
&(1-q)S_n&=&q&+&3q^2&+\dots+&(2n-1)q^{n}&-n^2q^{n+1}
\end{matrix}\end{align*}

である．$1-q=p$より左辺は$pS_n$であり，右辺の初項から第$n$項までの和を

\begin{align*}T_n=q+3q^2+\dots+(2n-1)q^{n}\end{align*}

とおくと，$pS_n=T_n-n^2q^{n+1}$が成り立つ．次に$T_n-qT_n$は

\begin{align*}\begin{matrix}
&T_n&=&q&+&3q^2&+\dots+&(2n-1)q^{n}&&\\
-)&qT_n&=&&&q^2&+\dots+&(2n-3)q^{n}&+(2n-1)q^{n+1}\\ \hline
&(1-q)T_n&=&q&+&2q^2&+\dots+&2q^{n}&-(2n-1)q^{n+1}
\end{matrix}\end{align*}

である．左辺は$pT_n$であり，右辺は第２項から第$n$項までが等比数列の和なので

\begin{align*}pT_n&=q+(2q^2+\dots+2q^n)-(2n-1)q^{n+1}
\\&=q+\frac{2q^2(1-q^{n-1})}{1-q}-(2n-1)q^{n+1}
\\&=q+\frac{2q^2(1-q^{n-1})}{p}-(2n-1)q^{n+1}\end{align*}

である．よって，

\begin{align*}E[X^2]&=\lim_{n\to\infty}pS_n=\lim_{n\to\infty}\bra{T_n-n^2q^{n+1}}
\\&=\lim_{n\to\infty}\brb{\frac{1}{p}\bra{q+\frac{2q^2(1-q^{n-1}}{p}-(2n-1)q^{n+1}}-n^2q^{n+1}}
\\&=\frac{1}{p}\bra{q+\frac{2q^2(1-0)}{p}-0}-0=\frac{pq+2q^2}{p^2}
\\&=\frac{p(1-p)+2(1-p)^2}{p^2}=\frac{2-3p+p^2}{p^2}\end{align*}

となる．

以上より，

\begin{align*}V[X]&=E[X^2]-E[X]^2=\frac{2-3p+p^2}{p^2}-\bra{\frac{1-p}{p}}^2
\\&=\frac{(2-3p+p^2)-(1-2p+p^2)}{p^2}=\frac{1-p}{p^2}\end{align*}

を得る．

$S_n=\sum_{k=1}^{n}k^2q^{k}$は「等差×等比型の数列の和」ではありませんが，$S_n-qS_n$を考えると「等差×等比型の数列の和」の$T_n$が現れます．

よって，$T_n$を求めて$S_n$が得られるわけですね．