ベルヌーイ分布の期待値・分散・確率母関数を定義から計算する

重要な確率分布
重要な確率分布

投げると表が確率1/3で出る歪んだコインを投げ,表が出たとき1点,裏が出たとき0点とすると,

  • 確率1/3で1点
  • 確率2/3で0点

となります.このコイン投げの点数のように,一定の確率で値0,1となる確率変数が従う確率分布をベルヌーイ分布といいます.

この記事では

  • ベルヌーイ分布の定義・基本性質・具体例
  • ベルヌーイ分布の期待値・分散・確率母関数

を順に説明します.

ベルヌーイ分布の定義・基本性質

まずはベルヌーイ分布の定義を説明し,そのあとベルヌーイ分布に従う確率変数の具体例を紹介します.

定義($X\sim\mrm{Ber}(p)$)

そもそも離散型確率変数$X$の確率関数$p_X$は

    \begin{align*}p_X(k)=P(X=k)\end{align*}

と定義されるのでした.つまり,$X=k$となる確率を$p_X(k)$と表すことを思い出しておきましょう.

実数$p$は$0<p<1$を満たすとする.離散型確率変数$X$がパラメータ$p$のベルヌーイ分布(Bernoulli distribution)に従うとは,$X$の確率関数$p_X$が

    \begin{align*}p_X(1)=p,\quad p_X(0)=1-p\end{align*}

を満たすことをいう.また,このとき$X\sim\mrm{Ber}(p)$などと表す.

値1が出ることを便宜上「成功」ということにして,パラメータ$p$を「成功確率」とよぶことがよくあります.

つまり,ベルヌーイ分布$\mrm{Ber}(p)$に従う確率変数$X$とは,一定の確率で値1(成功)か値0(失敗)をとるような確率変数のことをいうわけですね.

また,この値1(成功)か値0(失敗)かの試行をベルヌーイ試行ともいいます.

期待値$E[X]$・分散$V[X]$・確率母関数$G_X(s)$

のちに導出するように,ベルヌーイ分布の期待値・分散・確率母関数は次のようになります.

$X\sim\mrm{Ber}(p)$に対して,期待値$E[X]$,分散$V[X]$,確率母関数$G_X(s)$は

    \begin{align*}&E[X]=p, \\&V[X]=p(1-p), \\&G_X(s)=sp+1-p\end{align*}

である.

ベルヌーイ分布の具体例

ベルヌーイ分布に従う確率変数として,コイン・サイコロを具体的に考えます.

具体例1(コイン):$\mrm{Ber}(\frac{1}{3})$

冒頭で紹介したように,歪んだコイン投げはベルヌーイ分布に従います.

投げると表が確率$\frac{1}{3}$で出る歪んだコインを投げ,表が出たとき1点,裏が出たとき0点とする.コインを1回投げたときの点数を確率変数$X$とすると,$X$はどのようなベルヌーイ分布に従うか?

$X$は0,1のいずれかの値をとる.$X=1$となる(表が出る)確率は

$p_X(1)=P(X=1)=P(\text{コインが表})=\frac{1}{3}$

であり,$X=0$となる(裏が出る)確率は

$p_X(0)=P(X=0)=P(\text{コインが裏})=1-\frac{1}{3}$

である.よって,$X$はパラメータ$\frac{1}{3}$のベルヌーイ分布に従う($X\sim\mrm{Ber}(\frac{1}{3})$).

具体例2(コイン):$\mrm{Ber}(\frac{1}{2})$

表裏が均等に出るコインの場合も,同じように点数を考えるとベルヌーイ分布に従います.しかし,成功確率が変わるのでパラメータは変わります.

表裏が均等に出るコインを投げ,表が出たとき1点,裏が出たとき0点とする.コインを1回投げたときの点数を確率変数$X$とすると,$X$はどのようなベルヌーイ分布に従うか?

$X$は0,1のいずれかの値をとる.$X=1$となる(表が出る)確率は

$p_X(1)=P(X=1)=P(\text{コインが表})=\frac{1}{2}$

であり,$X=0$となる(裏が出る)確率は

$p_X(0)=P(X=0)=P(\text{コインが裏})=1-\frac{1}{2}$

である.よって,$X$はパラメータ$\frac{1}{2}$のベルヌーイ分布に従う($X\sim\mrm{Ber}(\frac{1}{2})$).

具体例3(サイコロ):$\mrm{Ber}(\frac{5}{6})$

各目が均等に出る6面サイコロを1回振り,

  • 1,2,3,4,5の目が出たとき1点
  • 6の目が出たとき0点

とする.この点数を確率変数$X$とすると,$X$はどのようなベルヌーイ分布に従うか?

この問題の$X$は1〜5の目が出たときに成功(値1).6の目が出たときに失敗(値0)と考える確率変数$X$ですね.

1〜6の出目自体は$X$ではないことに注意してください.$X$はあくまで点数なので$X=0$または$X=1$です.

$X$は0,1のいずれかの値をとる.$X=1$となる(1〜5の目が出る)確率は

$p_X(1)=P(X=1)=P(\text{出目が1〜5})=\frac{5}{6}=1-\frac{1}{6}$

であり,$X=0$となる(6の目が出る)確率は

$p_X(0)=P(X=0)=P(\text{出目が6})=\frac{1}{6}$

である.よって,$X$はパラメータ$\frac{5}{6}$のベルヌーイ分布に従う($X\sim\mrm{Ber}(\frac{5}{6})$).

ベルヌーイ分布の期待値・分散・確率母関数の導出

ベルヌーイ分布の期待値・分散・確率母関数を求めましょう.

期待値$E[X]$の導出

$X\sim\mrm{Ber}(p)$の期待値は$E[X]=p$である.

$X$の期待値$E[X]$の定義より

    \begin{align*}E[X]&=1\cdot p_X(1)+0\cdot p_X(0) \\&=1\cdot p+0\cdot(1-p)=p\end{align*}

である.

分散$V[X]$の導出

$X\sim\mrm{Ber}(p)$の分散は$V[X]=p(1-p)$である.

$X$の分散は$V[X]=E[X^2]-E[X]^2$で求まる.$E[X]=p$は上で求めたから,あとは$E[X^2]$を求めればよい.

$X^2$の期待値$E[X^2]$は,確率変数の期待値の定義より

    \begin{align*}E[X^2]&=1^2\cdot p_X(1)+0^2\cdot p_X(0) \\&=1\cdot p+0\cdot(1-p)=p\end{align*}

となる.よって,

    \begin{align*}V[X]=E[X^2]-E[X]^2=p-p^2=p(1-p)\end{align*}

である.

$1-p$は失敗確率なので,ベルヌーイ分布の分散は(成功確率)×(失敗確率)になっています.

確率母関数$G_X(s)$の導出

$X\sim\mrm{Ber}(p)$の確率母関数$G_X(s)$は

    \begin{align*}G_X(s)=sp+1-p\end{align*}

である.

確率母関数$G_X(s)$の定義より

    \begin{align*}G_X(s)&=E[s^X]=s^1\cdot p_X(1)+s^0\cdot p_X(0) \\&=s\cdot p+1\cdot(1-p)=sp+1-p\end{align*}

である.

$s=e^{t}$と置き換えれば積率母関数

    \begin{align*}M_X(t)=E[e^{tX}]=e^{t}p+1-p\end{align*}

が得られ,$s=e^{it}$と置き換えれば特性関数

    \begin{align*}\phi_X(t)=E[e^{itX}]=e^{it}p+1-p\end{align*}

が得られますね.

参考文献

以下は参考文献です.

統計学

[久保川達也 著/東京大学出版会]

現代の統計学は社会学・心理学・機械学習など様々な分野に応用されている極めて実学的な分野です.

本書は統計学の基礎を基礎から丁寧に解説した初学者向けのテキストで,大きく

  • 第1部:統計データの整理と記述のための基礎事項
  • 第2部:統計学で必要となる確率の知識
  • 第3部:統計的推測の基礎事項
  • 第4部:社会・経済・時系列データ

の4部構成になっています(本書「はしがき」より).

著者が大学2年生に向けて行った講義に基づいて書かれており,数理的な計算はしっかり追いつつも分かりやすさを重視した記述になっています.

難易度としては統計検定の2級を少し超えたくらいになっており,部分的には準1級レベルの箇所もあります.

章末問題も豊富にあり,統計検定の2級対策としても利用できます.

さらに,著者による章末問題の略解がウェブにアップロードされているのも独学者にはありがたい点です.

コメント