\usepackageamsmath\usepackageamsfonts\usepackageamssymb\usepackagefancybox\usepackagegraphics\usepackagemathrsfs\usepackage[all]xy\usepackagepgfplots\pgfplotssetcompat=newest\usetikzlibraryintersections,calc,arrows.meta

ベルヌーイ分布Ber(p)の期待値・分散・確率母関数を計算する

重要な確率分布
重要な確率分布

投げると表が確率1/3で出る歪んだコインを投げ,表が出たとき1点,裏が出たとき0点とすると,

  • 確率1/3で1点
  • 確率2/3で0点

となります.このコイン投げの点数のように,一定の確率で値0,1となる確率変数が従う確率分布をベルヌーイ分布といいます.

この記事では

  • ベルヌーイ分布の定義・基本性質・具体例
  • ベルヌーイ分布の期待値・分散・確率母関数

を順に説明します.

ベルヌーイ分布の定義・基本性質

まずはベルヌーイ分布の定義を説明し,そのあとベルヌーイ分布に従う確率変数の具体例を紹介します.

定義(XBer(p)

そもそも離散型確率変数Xの確率関数pX

pX(k)=P(X=k)

と定義されるのでした.つまり,X=kとなる確率をpX(k)と表すことを思い出しておきましょう.

実数p0<p<1を満たすとする.離散型確率変数Xがパラメータpベルヌーイ分布(Bernoulli distribution)に従うとは,Xの確率関数pX

pX(1)=p,pX(0)=1p

を満たすことをいう.また,このときXBer(p)などと表す.

値1が出ることを便宜上「成功」ということにして,パラメータpを「成功確率」とよぶことがよくあります.

つまり,ベルヌーイ分布Ber(p)に従う確率変数Xとは,一定の確率で値1(成功)か値0(失敗)をとるような確率変数のことをいうわけですね.

また,この値1(成功)か値0(失敗)かの試行をベルヌーイ試行ともいいます.

期待値E[X]・分散V[X]・確率母関数GX(s)

のちに導出するように,ベルヌーイ分布の期待値・分散・確率母関数は次のようになります.

XBer(p)に対して,期待値E[X],分散V[X],確率母関数GX(s)

E[X]=p,V[X]=p(1p),GX(s)=sp+1p

である.

確率母関数はGX(s)=E[sX]と定義されるので,s=etと置き換えれば積率母関数

MX(t)=E[etX]=etp+1p

が得られ,s=eitと置き換えれば特性関数

ϕX(t)=E[eitX]=eitp+1p

が得られますね.





ベルヌーイ分布の具体例

ベルヌーイ分布に従う確率変数として,コイン・サイコロを具体的に考えます.

具体例1(コイン):Ber(13)

冒頭で紹介したように,歪んだコイン投げはベルヌーイ分布に従います.

投げると表が確率13で出る歪んだコインを投げ,表が出たとき1点,裏が出たとき0点とする.コインを1回投げたときの点数を確率変数Xとすると,Xはどのようなベルヌーイ分布に従うか?

Xは0,1のいずれかの値をとる.X=1となる(表が出る)確率は

pX(1)=P(X=1)=P(コインが表)=13

であり,X=0となる(裏が出る)確率は

pX(0)=P(X=0)=P(コインが裏)=113

である.よって,Xはパラメータ13のベルヌーイ分布に従う(XBer(13)).

具体例2(コイン):Ber(12)

表裏が均等に出るコインの場合も,同じように点数を考えるとベルヌーイ分布に従います.しかし,成功確率が変わるのでパラメータは変わります.

表裏が均等に出るコインを投げ,表が出たとき1点,裏が出たとき0点とする.コインを1回投げたときの点数を確率変数Xとすると,Xはどのようなベルヌーイ分布に従うか?

Xは0,1のいずれかの値をとる.X=1となる(表が出る)確率は

pX(1)=P(X=1)=P(コインが表)=12

であり,X=0となる(裏が出る)確率は

pX(0)=P(X=0)=P(コインが裏)=112

である.よって,Xはパラメータ12のベルヌーイ分布に従う(XBer(12)).

具体例3(サイコロ):Ber(56)

各目が均等に出る6面サイコロを1回振り,

  • 1,2,3,4,5の目が出たとき1点
  • 6の目が出たとき0点

とする.この点数を確率変数Xとすると,Xはどのようなベルヌーイ分布に従うか?

この問題のXは1〜5の目が出たときに成功(値1).6の目が出たときに失敗(値0)と考える確率変数Xですね.

1〜6の出目自体はXではないことに注意してください.Xはあくまで点数なのでX=0またはX=1です.

Xは0,1のいずれかの値をとる.X=1となる(1〜5の目が出る)確率は

pX(1)=P(X=1)=P(出目が1〜5)=56=116

であり,X=0となる(6の目が出る)確率は

pX(0)=P(X=0)=P(出目が6)=16

である.よって,Xはパラメータ56のベルヌーイ分布に従う(XBer(56)).





ベルヌーイ分布の期待値・分散・確率母関数の導出

ベルヌーイ分布の期待値・分散・確率母関数を求めましょう.

期待値E[X]の導出

XBer(p)の期待値はE[X]=pである.

Xの期待値E[X]の定義より

E[X]=1pX(1)+0pX(0)=1p+0(1p)=p

である.

分散V[X]の導出

XBer(p)の分散はV[X]=p(1p)である.

Xの分散はV[X]=E[X2]E[X]2で求まる.E[X]=pは上で求めたから,あとはE[X2]を求めればよい.

X2の期待値E[X2]は,確率変数の期待値の定義より

E[X2]=12pX(1)+02pX(0)=1p+0(1p)=p

となる.よって,

V[X]=E[X2]E[X]2=pp2=p(1p)

である.

1pは失敗確率なので,ベルヌーイ分布の分散は(成功確率)×(失敗確率)になっています.

確率母関数GX(s)の導出

XBer(p)の確率母関数GX(s)

GX(s)=sp+1p

である.

確率母関数GX(s)の定義より

GX(s)=E[sX]=s1pX(1)+s0pX(0)=sp+1(1p)=sp+1p

である.





参考文献

以下は参考文献です.

統計学

[久保川達也 著/東京大学出版会]

現代の統計学は社会学・心理学・機械学習など様々な分野に応用されている極めて実学的な分野です.

本書は統計学の基礎を基礎から丁寧に解説した初学者向けのテキストで,大きく

  • 第1部:統計データの整理と記述のための基礎事項
  • 第2部:統計学で必要となる確率の知識
  • 第3部:統計的推測の基礎事項
  • 第4部:社会・経済・時系列データ

の4部構成になっています(本書「はしがき」より).

著者が大学2年生に向けて行った講義に基づいて書かれており,数理的な計算はしっかり追いつつも分かりやすさを重視した記述になっています.

難易度としては統計検定の2級を少し超えたくらいになっており,部分的には準1級レベルの箇所もあります.

章末問題も豊富にあり,統計検定の2級対策としても利用できます.

さらに,著者による章末問題の略解がウェブにアップロードされているのも独学者にはありがたい点です.

コメント