表が一定の確率で出るコインを繰り返し投げるとき,運が良ければすぐに表が出ますが,場合によってはなかなか表が出ないこともあります.
このように,一定の確率で成功する試行(ベルヌーイ試行)を初めて成功するまで繰り返すときの失敗回数が従う確率分布を幾何分布といいます.
この記事では
- 幾何分布の定義・基本性質
- 幾何分布の具体例
- 幾何分布の期待値・分散・確率母関数の導出
を順に説明します.
テキストによっては初めて成功したときの回数をとる確率変数$X$が従う確率分布を指すこともあります.
「重要な確率分布」の一連の記事
- 離散型確率分布の定義と期待値・分散・母関数
- 連続型確率分布の定義と期待値・分散・母関数
- 連続型一様分布(準備中)
- 正規分布(準備中)
- カイ二乗分布(準備中)
- t分布(準備中)
- F分布(準備中)
- ガンマ分布(準備中)
- ベータ分布(準備中)
幾何分布の定義・基本性質
まずは幾何分布の定義を説明し,そのあと幾何分布に従う確率変数の具体例を紹介します.
$X\sim\mrm{Geo}(p)$の定義
そもそも離散型確率変数$X$の確率関数$p_X$は
\begin{align*}p_X(k)=P(X=k)\end{align*}
と定義されるのでした.つまり,$X=k$となる確率を$p_X(k)$と表すことを思い出しておきましょう.
実数$p$は$0<p<1$を満たすとする.離散型確率変数$X$がパラメータ$p$の幾何分布(geometric distribution)に従うとは,$X$の確率関数$p_X$が
\begin{align*}p_X(k)=(1-p)^{k}p\quad(k=0,1,2,3,\dots)\end{align*}
を満たすことをいう.また,このとき$X\sim\mrm{Geo}(p)$などと表す.
1回1回の成功確率を$p$と考えると,1回1回の$1-p$は失敗確率ですから,$(1-p)^{k}p$は$k$回失敗して1回成功する確率ですね.
つまり,幾何分布$\mrm{Geo}(p)$に従う確率変数$X$とは,成功確率$p$のベルヌーイ試行を繰り返し,初めて成功するまでの失敗の回数をとる確率変数のことをいうわけですね.
期待値$E[X]$・分散$V[X]$・確率母関数$G_X(s)$
のちに導出するように,幾何分布の期待値・分散・確率母関数は次のようになります.
$X\sim\mrm{Geo}(p)$に対して,期待値$E[X]$,分散$V[X]$,確率母関数$G_X(s)$は
\begin{align*}E[X]=\frac{1-p}{p},\quad
V[X]=\frac{1-p}{p^2},\quad
G_X(s)=\frac{p}{1-s+sp}\end{align*}
である.ただし,確率母関数の定義域は$|s|<\frac{1}{1-p}$である.
確率母関数は$G_X(s)=E[s^X]$と定義されるので,$s=e^{t}$と置き換えれば積率母関数
\begin{align*}M_X(t)=E[e^{tX}]=\frac{p}{1-e^t+e^tp}\end{align*}
が得られ,$s=e^{it}$と置き換えれば特性関数
\begin{align*}\phi_X(t)=E[e^{itX}]=\frac{p}{1-e^{it}+e^{it}p}\end{align*}
が得られますね.
幾何分布の具体例
幾何分布に従う確率変数として,コイン投げ・サイコロ投げを具体的に考えます.
具体例1(コイン):$\mrm{Geo}(\frac{1}{3})$
冒頭で紹介したように,歪んだコインを表が出るまで投げるときの試行回数は幾何分布に従います.
投げると表が確率$\dfrac{1}{3}$で出る歪んだコインを投げ続け,初めてコインが表が出たときの回数を確率変数$X$とすると,$X$が幾何分布に従うことを示せ.
$X$は0以上の整数のいずれかの値をとる.0以上の整数$k$に対して,$X=k$ということは
- $k$回目まで表が出ない(確率$(1-\frac{1}{3})^{k}$)
- $(k+1)$回目で表が出る(確率$\frac{1}{3}$)
ということなので,
\begin{align*}p_X(k)=P(X=k)=\bra{1-\frac{1}{3}}^{k-1}\cdot\frac{1}{3}\end{align*}
である.よって,$X$はパラメータ$\frac{1}{3}$の幾何分布に従う($X\sim\mrm{Geo}(\frac{1}{3})$).
運によってはすぐに表が出ることもあれば,いつまで経っても裏が出続けることもあります.確率は非常に低いですが,100回裏が出続ける確率は0ではありません.
そのため,$X$は全ての0以上の整数の値をとり得ることに注意してください.
具体例2(サイコロ):$\mrm{Geo}(\frac{5}{6})$
各目が均等に出る6面サイコロを振り続け,初めて1〜5の目が出るまでの6の目が出た回数を確率変数$X$とすると,$X$が幾何分布に従うことを示せ.
この問題の1〜5の目が出たときに成功.6の目が出たときに失敗と考えるわけですね.
サイコロの出目(1〜6)自体は$X$ではないことに注意してください.$X$はあくまで6の目が出た回数なので$X=0,1,2,3,\dots$です.
$X$は0以上の整数のいずれかの値をとる.0以上の整数$k$に対して,$X=k$ということは
- $k$回目まで1〜5の目が出ない(確率$(1-\frac{5}{6})^{k}$)
- $(k+1)$回目で表が出る(確率$\frac{5}{6}$)
ということなので,
\begin{align*}p_X(k)=P(X=k)=\bra{1-\frac{5}{6}}^{k-1}\cdot\frac{5}{6}\end{align*}
である.よって,$X$はパラメータ$\frac{5}{6}$の幾何分布に従う($X\sim\mrm{Geo}(\frac{5}{6})$).
具体例1のコインと同様に,運によってはすぐに1〜5の目が出ることもあれば,いつまで経っても6が出続けることもあります.
そのため,$X$は全ての正の整数の値をとり得ることに注意してください.
幾何分布の期待値・分散・確率母関数の導出
幾何分布の期待値・分散・確率母関数を求めましょう.ここでは確率母関数を先に求めて,そこから期待値・分散を求めましょう.
期待値・分散は定義から直接求めることもできますが少々面倒です.しかし,念のためこの記事の最後に定義から直接計算する方法も紹介しています.
確率母関数$G_X(s)$の導出
$X\sim\mrm{Geo}(p)$の確率母関数は$G_X(s)=\dfrac{p}{1-s+sp}$である.ただし,定義域は$|s|<\dfrac{1}{1-p}$である.
確率母関数$G_X(s)$の定義より
\begin{align*}G_X(s)&=E[s^X]=\sum_{k=0}^{\infty}s^k\cdot p_X(k)
\\&=\sum_{k=0}^{\infty}s^k\cdot(1-p)^{k}p=p\sum_{k=0}^{\infty}(s-sp)^{k}\end{align*}
である.これは初項$p$,公比$s-sp$の等比級数である.
一般に初項$a\neq0$, 公比$r$の等比級数が収束するための必要十分条件は$|r|<1$であり,このとき$\frac{a}{1-r}$に収束することに注意すると,
\begin{align*}|s-sp|<1\iff |s|<\frac{1}{1-p}\end{align*}
をみたす$s$に対してのみ確率母関数$G_X(s)$が定義され,
\begin{align*}G_X(s)=\frac{p}{1-(s-sp)}=\frac{p}{1-s+sp}\end{align*}
である.
平均$E[X]$の導出
$X\sim\mrm{Geo}(p)$の期待値は$E[X]=\dfrac{1-p}{p}$である.
$0<p<1$より$|1|<\frac{1}{1-p}$なので,$|s|<\frac{1}{1-p}$は$s=1$を含む.よって,確率母関数
\begin{align*}G_X(s)=\frac{p}{1-s+sp}\quad\bra{|s|<\frac{1}{1-p}}\end{align*}
は$s=1$でも定義されている.
一般に$G’_X(1)=E[X]$であり,$G_X(s)$の$s=1$での微分係数は
\begin{align*}G’_X(1)&=\left.\frac{d}{ds}(p(1-s+sp)^{-1})\right|_{s=1}
\\&=\left.p(-1)(-1+p)(1-s+sp)^{-2}\right|_{s=1}
\\&=\left.\frac{p(1-p)}{(1-s+sp)^{2}}\right|_{s=1}=\frac{p(1-p)}{p^2}=\frac{1-p}{p}\end{align*}
なので,$E[X]=\frac{1-p}{p}$を得る.
分散$V[X]$の導出
$X\sim\mrm{Geo}(p)$の分散は$V[X]=\dfrac{1-p}{p^2}$である.
$X$の分散は
\begin{align*}V[X]&=E[X^2]-E[X]^2
\\&=E[X(X-1)]+E[X]-E[X]^2\end{align*}
で求まる.$E[X]=\frac{1-p}{p}$は上で求めたから,あとは$E[X(X-1)]$を求めればよい.
$E[X]=\frac{1-p}{p}$の証明で説明したように,確率母関数$G_X(s)$は$s=1$で定義されている.
一般に$G^{\prime\prime}_X(1)=E[X(X-1)]$であり,$G_X(s)$の$s=1$での2階微分係数は
\begin{align*}G^{\prime\prime}_X(1)&=\left.\frac{d}{ds}(p(1-p)(1-s+sp)^{-2})\right|_{s=1}
\\&=\left.p(1-p)(-2)(-1+p)(1-s+sp)^{-3}\right|_{s=1}
\\&=\left.2p(1-p)^2(1-s+sp)^{-3}\right|_{s=1}
\\&=\frac{2p(1-p)^2}{p^3}=\frac{2(1-p)^2}{p^2}\end{align*}
なので,$E[X(X-1)]=\frac{2(1-p)^2}{p^2}$を得る.以上より,
\begin{align*}V[X]&=\frac{2(1-p)^2}{p^2}+\frac{1-p}{p}-\bra{\frac{1-p}{p}}^2
\\&=\frac{2(1-p)^2+p(1-p)-(1-p)^2}{p^2}
\\&=\frac{\{(1-p)+p\}(1-p)}{p^2}=\frac{1-p}{p^2}\end{align*}
を得る.
定義に基づいた期待値・分散の導出
少々面倒ですが,期待値$E[X]$も分散$V[X]$も定義から直接求めることもできます.この場合は「等差×等比型の数列の和」に帰着させます.
等差×等比型の数列の和(高校数学の復習)
一般に等差数列$\{a_n\}$と等比数列$\{b_n\}$からできる和
\begin{align*}S_n=\sum_{k=1}^{n}a_nb_n\end{align*}
は数列$\{b_n\}$の公比$r$を用いて$S_n-rS_n$を考えることで,等比数列の和に帰着して求めることができます.
$n$を正の整数とする.和
\begin{align*}S_n=1\cdot2+3\cdot2^2+5\cdot2^3+\dots+(2n-1)\cdot2^n\end{align*}
を計算せよ.
この問題の和は
- 等差数列$1,3,5,\dots,2n-1$
- 等比数列$2,2^2,2^3,\dots,2^n$(公比2)
からできる「等差×等比型の数列の和」なので,等比数列の公比2を用いて$S_n-2S_n$を考えることで,等比数列の和に帰着します.
$S_n-2S_n$は
\begin{align*}\begin{matrix}
&S_n&=&1\cdot2&+&3\cdot2^2&+\dots+&(2n-1)2^n&\\
-)&2S_n&=&&&1\cdot2^2&+\dots+&(2n-3)2^{n}&+(2n-1)2^{n+1}\\ \hline
&-S_n&=&2&+&2\cdot2^2&+\dots+&2\cdot2^{n}&-(2n-1)2^{n+1}
\end{matrix}\end{align*}
である.右辺の第2項から第$n$項までの和は初項8,公比2の等比数列の和だから,
\begin{align*}S_n&=-2-(2\cdot2^2+2\cdot2^3+\dots+2\cdot2^{n})+(2n-1)2^{n+1}
\\&=-2-\frac{8(1-2^{n-1})}{1-2}+(2n-1)2^{n+1}
\\&=-2+8(1-2^{n-1})+(2n-1)2^{n+1}
\\&=6-2^{n+1}+(n-1)2^{n+2}\end{align*}
となる.
期待値$E[X]$の導出
(再掲)$X\sim\mrm{Geo}(p)$の期待値は$E[X]=\dfrac{1-p}{p}$である.
$k=0$のとき$k\times p_X(k)=0$であることに注意すると,確率変数$X$の期待値$E[X]$の定義より
\begin{align*}E[X]&=\sum_{k=0}^{\infty}k\times p_X(k)=\sum_{k=1}^{\infty}k\times p_X(k)
\\&=\sum_{k=1}^{\infty}k\times(1-p)^{k}p=\lim_{n\to\infty}p\sum_{k=1}^{n}k(1-p)^{k}\end{align*}
である.ここで,$q=1-p$とおき,
\begin{align*}S_n=\sum_{k=1}^{n}k(1-p)^{k}=\sum_{k=1}^{n}kq^{k}\end{align*}
とおくと,$S_n-qS_n$を計算すると
\begin{align*}\begin{matrix}
&S_n&=&1q&+&2q^2&+\dots+&nq^{n}&&\\
-)&qS_n&=&&&1q^2&+\dots+&(n-1)q^{n}&+nq^{n+1}\\ \hline
&(1-q)S_n&=&q&+&q^2&+\dots+&q^{n}&-nq^{n+1}
\end{matrix}\end{align*}
となる.$1-q=p$より左辺は$pS_n$であり,右辺は第$n$項まで等比数列の和なので
\begin{align*}pS_n&=q+q^2+\dots+q^{n}-nq^{n+1}
\\&=\frac{q(1-q^n)}{1-q}-nq^{n+1}=\frac{q(1-q^n)}{p}-nq^{n+1}\end{align*}
となる.よって,期待値は
\begin{align*}E[X]&=\lim_{n\to\infty}pS_n=\lim_{n\to\infty}\bra{\frac{q(1-q^n)}{p}-nq^{n+1}}
\\&=\lim_{n\to\infty}\bra{\frac{q(1-0)}{p}-0}=\frac{q}{p}=\frac{1-p}{p}\end{align*}
を得る.
いまの証明では部分和$S_n=\sum_{k=1}^{n}kq^{k}$が「等差×等比型の数列の和」になっているので,等比数列部分の公比$q$を用いて$S_n-qS_n$を考えているわけですね.
分散$V[X]$の導出
(再掲)$X\sim\mrm{Geo}(p)$の分散は$V[X]=\dfrac{1-p}{p^2}$である.
$X$の分散は$V[X]=E[X^2]-E[X]^2$で求まる.$E[X]=\frac{1-p}{p}$は上で求めたから,あとは$E[X^2]$を求めればよい.
$k=0$のとき$k^2\times p_X(k)=0$であることに注意すると,確率変数$X^2$の分散$E[X^2]$の定義より
\begin{align*}E[X^2]&=\sum_{k=0}^{\infty}k^2\times p_X(k)=\sum_{k=1}^{\infty}k^2\times p_X(k)
\\&=\sum_{k=1}^{\infty}k^2\times(1-p)^{k}p=\lim_{n\to\infty}p\sum_{k=1}^{n}k^2(1-p)^{k}\end{align*}
である.ここで,$q=1-p$とおき,
\begin{align*}S_n=\sum_{k=1}^{n}k^2(1-p)^{k}=\sum_{k=1}^{n}k^2q^{k}\end{align*}
とおくと,$S_n-qS_n$は
\begin{align*}\begin{matrix}
&S_n&=&1^2q&+&2^2q^2&+\dots+&n^2q^{n}&&\\
-)&qS_n&=&&&1^2q^2&+\dots+&(n-1)^2q^{n}&+n^2q^{n+1}\\ \hline
&(1-q)S_n&=&q&+&3q^2&+\dots+&(2n-1)q^{n}&-n^2q^{n+1}
\end{matrix}\end{align*}
である.$1-q=p$より左辺は$pS_n$であり,右辺の初項から第$n$項までの和を
\begin{align*}T_n=q+3q^2+\dots+(2n-1)q^{n}\end{align*}
とおくと,$pS_n=T_n-n^2q^{n+1}$が成り立つ.次に$T_n-qT_n$は
\begin{align*}\begin{matrix}
&T_n&=&q&+&3q^2&+\dots+&(2n-1)q^{n}&&\\
-)&qT_n&=&&&q^2&+\dots+&(2n-3)q^{n}&+(2n-1)q^{n+1}\\ \hline
&(1-q)T_n&=&q&+&2q^2&+\dots+&2q^{n}&-(2n-1)q^{n+1}
\end{matrix}\end{align*}
である.左辺は$pT_n$であり,右辺は第2項から第$n$項までが等比数列の和なので
\begin{align*}pT_n&=q+(2q^2+\dots+2q^n)-(2n-1)q^{n+1}
\\&=q+\frac{2q^2(1-q^{n-1})}{1-q}-(2n-1)q^{n+1}
\\&=q+\frac{2q^2(1-q^{n-1})}{p}-(2n-1)q^{n+1}\end{align*}
である.よって,
\begin{align*}E[X^2]&=\lim_{n\to\infty}pS_n=\lim_{n\to\infty}\bra{T_n-n^2q^{n+1}}
\\&=\lim_{n\to\infty}\brb{\frac{1}{p}\bra{q+\frac{2q^2(1-q^{n-1}}{p}-(2n-1)q^{n+1}}-n^2q^{n+1}}
\\&=\frac{1}{p}\bra{q+\frac{2q^2(1-0)}{p}-0}-0=\frac{pq+2q^2}{p^2}
\\&=\frac{p(1-p)+2(1-p)^2}{p^2}=\frac{2-3p+p^2}{p^2}\end{align*}
となる.
以上より,
\begin{align*}V[X]&=E[X^2]-E[X]^2=\frac{2-3p+p^2}{p^2}-\bra{\frac{1-p}{p}}^2
\\&=\frac{(2-3p+p^2)-(1-2p+p^2)}{p^2}=\frac{1-p}{p^2}\end{align*}
を得る.
$S_n=\sum_{k=1}^{n}k^2q^{k}$は「等差×等比型の数列の和」ではありませんが,$S_n-qS_n$を考えると「等差×等比型の数列の和」の$T_n$が現れます.
よって,$T_n$を求めて$S_n$が得られるわけですね.
参考文献
以下は参考文献です.
現代数理統計学の基礎
[久保川達也 著/共立出版]
現代の統計学は社会学・心理学・機械学習など様々な分野に応用されている極めて実学的な分野です.
本書は本格的な統計学の基礎から,近年広く応用されている統計手法を学ぶことができるテキストで,
- 第1部:統計的推測を行う上で必要な確率・確率分布の基本的な事項
- 第2部:確率分布に関する推測方法
- 第3部:発展的な内容
の3部構成になっています(本書「はしがき」より).
著者が大学3,4年生に向けて行った講義に基づいて書かれており,全体的に簡潔に説明されているのが特徴です.
また,章末問題も豊富にあり,統計検定の準1級・1級の対策としても利用できます(たとえば,統計検定1級の「数理統計」は本書の第5章までをしっかり学べば十分対応できます).
さらに,著者による章末問題の略解がウェブにアップロードされているのも独学者にはありがたい点です.
コメント