「負の二項分布」という名前から二項分布の一般化のように思えてしまいそうですが,実は負の二項分布は幾何分布の一般化になっています.
例えば「表が一定の確率で出るコインを繰り返し投げて,初めて表が出るまでの裏の回数」は幾何分布に従うのでした.
この幾何分布を一般化した確率分布が負の二項分布で,「コインを繰り返し投げて決めた回数表が出るまでの裏の回数」が従う確率分布を負の二項分布と言います.
二項分布と負の二項分布は別物です.「負の二項分布」の名前の由来はこの記事の最後で解説しています.
この記事では
- 負の二項分布の定義・基本性質
- 負の二項分布の具体例
- 期待値・分散・確率母関数の幾何分布を用いた導出
- 期待値・分散・確率母関数の定義からの導出
- 補足(なぜ「負の二項分布」という名前なのか?)
を順に説明します.
「重要な確率分布」の一連の記事
- 離散型確率分布の定義と期待値・分散・母関数
- 連続型確率分布の定義と期待値・分散・母関数
- 連続型一様分布(準備中)
- 正規分布(準備中)
- カイ二乗分布(準備中)
- t分布(準備中)
- F分布(準備中)
- ガンマ分布(準備中)
- ベータ分布(準備中)
負の二項分布の定義・基本性質
まずは負の二項分布の定義を説明し,そのあと負の二項分布に従う確率変数の具体例を紹介します.
定義( )
そもそも離散型確率変数
と定義されるのでした.つまり,
を満たすことをいう.また,このとき
確率関数
とみると意味が分かります.
反復試行の確率より
よって,負の二項分布
期待値 ・分散 ・確率母関数
のちに導出するように,負の二項分布の期待値・分散・確率母関数は次のようになります.
である.ただし,確率母関数の定義域は
確率母関数は
が得られ,
が得られますね.
負の二項分布の具体例
負の二項分布に従う確率変数として,コイン,サイコロを具体的に考えます.
具体例1(コイン):
冒頭で紹介したように,歪んだコインを表が2回出るまで投げ続けたときの「裏が出る回数」は負の二項分布に従います.
投げると表が確率
回目までに表が1回出る(確率 ) 回目で表が出る(確率 )
ということなので,
である.よって,
運によってはすぐに表が2回出ることもあれば,いつまで経っても裏が出続けることもあります.確率は非常に低いですが,100回裏が出続ける確率は0ではありません.
そのため,
具体例2(サイコロ):
各目が均等に出る6面サイコロを振り続け,1〜5の目が3回出るまでの6の目が出た回数を確率変数
回目の間で1〜5の目が2回出る(確率 ) 回目で表が出る(確率 )
ということなので,
である.よって,
具体例1のコインと同様に,運によってはすぐに1〜5の目が出ることもあれば,いつまで経っても6が出続けることもあります.
そのため,
期待値・分散・確率母関数の幾何分布を用いた導出
負の二項分布
- 期待値と分散は
倍 - 母関数は
乗
になっています.これは偶然ではなく,次の事実に基づいて証明することができます.
負の二項分布と幾何分布の関係
ベルヌーイ分布と二項分布の関係として「互いに独立な
実は,幾何分布と負の二項分布にも同様の関係が成り立ちます.
独立な
が成り立つ.
幾何分布は初めて成功するまでの失敗の回数が従う確率分布なのでした.
一方,負の二項分布の「

期待値 の導出
分散 の導出
確率母関数 の導出
である.
期待値・分散・確率母関数の定義からの導出
幾何分布との関係を使わなくても,確率母関数をマクローリン展開を用いて導出することもでき,確率母関数の導関数を用いて期待値・分散も求められます.
確率母関数 の導出
である.
確率母関数
である.以下,
が成り立つことを示す.
のマクローリン展開
なので,
である(
となる.
なので,
を得る.
収束半径と定義域
マクローリン展開
より,1であることが分かる.
よって,
で定義される.よって,確率母関数
平均 の導出
は
一般に
なので,
分散 の導出
で求まる.
一般に
なので,
を得る.
補足(なぜ「負の二項分布」という名前なのか?)
最後に「負の二項分布」という名前の由来を解説します.
負の二項分布の確率関数の変形
負の二項分布に従う確率変数
と変形できます.最後から2つ目の等号では,分子は
二項分布の確率関数との比較
通常の二項分布は次のように定義されるのでした.
を満たすことをいう.また,このとき
上の負の二項分布と,この定義の二項分布の確率密度関数で
二項分布の
参考文献
以下は参考文献です.
現代数理統計学の基礎
[久保川達也 著/共立出版]
現代の統計学は社会学・心理学・機械学習など様々な分野に応用されている極めて実学的な分野です.
本書は本格的な統計学の基礎から,近年広く応用されている統計手法を学ぶことができるテキストで,
- 第1部:統計的推測を行う上で必要な確率・確率分布の基本的な事項
- 第2部:確率分布に関する推測方法
- 第3部:発展的な内容
の3部構成になっています(本書「はしがき」より).
著者が大学3,4年生に向けて行った講義に基づいて書かれており,全体的に簡潔に説明されているのが特徴です.
また,章末問題も豊富にあり,統計検定の準1級・1級の対策としても利用できます(たとえば,統計検定1級の「数理統計」は本書の第5章までをしっかり学べば十分対応できます).
さらに,著者による章末問題の略解がウェブにアップロードされているのも独学者にはありがたい点です.
コメント