何らかの全国規模の調査を行いたいとき,対象者全員に調査することができれば最もよいですが,それは時間やコストなどの面から現実的ではありません.
そのため,実際には対象者の一部に調査を行い,そこで得られたデータから対象者全員の分布を推測することになります.
その推測の方法は色々ありますが,ひとつに最尤推定法というものがあり,名前の通り「最もそれっぽい(尤もらしい)分布を推定する方法」です.
「最尤推定法」という名前を聞くといかめしい印象を受けるかもしれませんが,考え方自体はシンプルでそれほど難しいものではありません.
この記事では
- 最尤推定法の考え方
- 最尤推定法の具体例
- 尤度関数と対数尤度関数
を順に説明します.
最尤推定法の考え方
最尤推定法を使う際には,最初に
- どのような分布に従うのか
- 実際に得られたデータ
の2つを用意します.例えば,「全国の成人男性の身長」を最尤推定法で考える際には
- 全国の成人男性の身長は「正規分布」に従う
- 1000人の成人男性の身長のデータ
などが既に分かっているものとします.この2つから「全国の成人男性の身長」がどのように分布しているかを推定するわけですね.
ここからしばらく次の問題を考えましょう.
ある正規分布から6個のデータ
最尤推定法で考える分布は一般には正規分布とは限りませんが,正規分布でなくても考え方は同じなので,この記事では正規分布で考えます.
分布を推定するとは?
「正規分布を推定する」とはどういうことでしょうか?
正規分布は(確率密度関数が)下図のような山のような形をしたグラフで表される分布でした.
ただし,「正規分布」と一言で言っても,グラフの
- 裾の広がり方(分散)
- 真ん中の位置(平均)
に特徴が表れます.例えば,なだらかな(分散が大きい)正規分布のグラフ
になることもありますし,山の頂上の
になることもあります.
よって,分布を推定するとは「このような色々な分布の中で,どれが最もそれっぽい正規分布なのかを推定しよう」ということなわけです.
正規分布の平均と分散のように,分布の特徴を示すものをパラメーターと言うことも多いですね.
最尤推定法の考え方
ここで,問題の6個のデータ
さらに,このデータが正規分布に従うことが分かっているとします.
このとき,「どんな正規分布だと思いますか?」と聞くと,多くの人は以下のようなグラフを描くのではないでしょうか?
一方,多くのデータが集まっているところからずれたグラフ
はなさそうですし,あまりに集中しすぎたグラフ
もなさそうです.つまり,「データがあるところの値が出来るだけ大きくなるような分布がそれっぽい」ということになります.
したがって,正規分布の確率密度関数を
が最大になるような確率密度関数
いまは暗にデータが独立に正規分布に従うことを仮定しているので積になっていますが,独立とは限らない場合は同時確率密度関数となります.
要するに「下図の青線の長さの積が最大になる
このような考え方に基づく分布の推定方法を最尤推定法といいます.
正規分布の最尤推定法
以上が最尤推定法の考え方で,次はいま考えたことを一般化することを考えましょう.
最尤推定法の要は尤度関数
ある分布に独立に従う
を尤度関数(likelihood function)といい,尤度関数が最大となる
上の尤度関数
です.なお,
先ほども書きましたが,最尤推定法を考えるときには,もともと
- データ
- 分布の確率密度関数
が用意されていることが大切です.
具体的に正規分布で考えましょう.平均
と表されるのでしたから,この関数
を尤度関数と言うわけですね.
先ほど説明したように正規分布の「位置」と「形」はそれぞれ平均
よって,正規分布の最尤推定法では尤度関数
微分しやすい対数尤度関数
さて,それでは実際にどうすれば尤度関数
関数の最大,最小を求める問題では微分を用いるのがよくある方法ですが,尤度関数
そこで,尤度関数
尤度関数
対数尤度関数 (log-likelihood function)という.
積に
の両辺で自然対数
となるわけですね.これを
よって,平均
積のまま微分すると式は煩雑になりますが,和の微分は各項で微分ができるので式はそれほど煩雑になりません.対数をとって和の形にしたのはこの理由からです.
平均
となりますね.
微分して極値を求める
上述したように,微分を用いることで対数尤度関数を
一般に微分可能な2変数関数
実際,正規分布の対数尤度関数の場合には
を満たすような
となるので,
のとき
対数尤度関数を用いなくても,頑張って尤度関数を微分しても全く同じ結論が得られます.
結論
さて,ただ「正規分布に従う
になっていますね!
確かに最尤推定法からそれっぽい結果が導かれました!
この記事では正規分布の最尤推定法を考えましたが,正規分布でない場合にも「分布の関数にデータの値を代入してそれらの積が最大になる分布が,最もそれっぽい分布だ」という最尤推定法のイメージがあれば,同じ考え方で最尤推定法を使うことができます.
コメント