ベイズ確率
出典: フリー百科事典『ウィキペディア(Wikipedia)』
ベイズ確率(-かくりつ)とは、ランダムな事象が生起する頻度としての確率(頻度主義的な狭義の確率、客観確率)に加えて、ある命題の尤もらしさ、あるいはその根拠となる信念・信頼の度合を表す数値としての確率(主観確率)をも含めた広義の確率のことである。確率論は客観確率を基礎として発展したが、ベイズ確率に関しても同じ理論を適用することが数学的には可能であることが証明されている。
確率論においてベイズ確率を採用する哲学的立場を、頻度主義に対比してベイズ主義(またベイズ主義的・ベイズ主義者という意味でベイジアン)という。
さらにベイズ確率に関しては、ベイズの定理からベイズ推定の方法が導かれ、これはベイズ統計学の基礎概念となっている。
例えばコイン投げをする場合、頻度主義でもベイズ主義でも表が出る確率は1/2とするが、「100万年前に火星に生命が存在した」という命題に対する主観的な信頼の度合を1/1000とするのはベイズ主義だけである。つまり頻度主義では不確かさはランダム性にのみ基づくのに対し、ベイズ主義では情報が不足していることにも基づく。
目次 |
[編集] ベイズ確率の歴史
ベイズ確率は、ベイズの定理の特別な場合を証明したトーマス・ベイズにちなんで命名されているが、実際に命名されたのは1950年代であり、ベイズ自身がこのような考えを持っていたかどうかは定かでない。
ベイズ確率の考えを積極的に用いたのはラプラス(ベイズの定理の一般的な場合を証明した)で、それを「土星の質量を確率的に見積もる」というような問題に応用した。しかし彼以後は長らくこの考え方は顧みられなかった(土星の質量は確率的に分布するわけではなく、観測誤差によって確率が介入するのだ)。特に19世紀末以降に発展した数理統計学は専ら頻度主義に基づいて厳密な理論を構築した。
確率論の主観的解釈(のちにベイズ主義と呼ばれる)は1931年に哲学者・数学者のフランク・ラムゼイによって提唱され、彼は同じく主観確率の支持者だったケインズと論争をしているが、彼自身はこれを頻度主義的解釈の単なる補助としか考えなかった。これをさらに厳密に取り上げたのは1937年、統計学者ブルーノ・デ・フィネッティである。さらに初めて詳細な分析を加えたのは1954年、L.J.サヴェッジであって、彼の考え方にはベイズ確率・ベイズ主義という呼び名が適用された。そのほか初期の研究者にはB.O.クープマン、エイブラハム・ウォールドらがいる。これらの研究は現在広く受け入れられるようになってきたが、頻度主義者とベイズ主義者の亀裂は現在でも尾をひいており、両主義の支持者の一部は互いに議論せず共通の学会に参加しないといった状況が続いている。
[編集] ベイズ確率のいろいろ
ベイジアンの中にも様々な考え方・学派がある。これらは重なる部分が多いが、特に客観性をどれほど必要と考えるかによって強調する部分が異なる。具体的には、個人が不確かな命題に対して抱く信念の度合としての「主観確率」を認める立場、これを許容しない立場、また不確かな命題であっても情報によって個人間のコンセンサスが得られるような方法がある(それを追求する)立場などがある。
[編集] ベイズ確率と頻度確率
ベイズ主義の考え方は、観測された頻度分布あるいは想定された母集団の割合から導かれるのが確率であるとする頻度確率の概念とは対照的である。
この違いは特に統計学的方法に大きく関係する。2つの仮説を比較するとき、頻度主義では、仮説に基づいて実際の観測値が得られる確率をもって仮説の採択か棄却かを行う。一方ベイズ主義では、ある仮説がもう1つの仮説よりも確からしい、あるいは一方の仮説を採択する際に期待される損失がもう一方を採択する際の損失より小さい、ということを示す。
ベイズの定理を用いて、新しい証拠に照らして命題の尤もらしさを改訂していく方法がベイズ推定である。例えばラプラスはこの方法で土星の質量を見積もった。しかし頻度主義による確率の定義では、確率論はこの問題に適用できない。土星の質量はランダム変数ではないからだ。「土星の質量とはどんな母集団から抽出されたものか?」という疑問に答えられなければ、これは頻度主義者の議論の対象にはならない。さらに極端な例を挙げると、「ランダムに振った2つのさいころの目の和が6のとき、さいころの目として2が出ていた確率」は、数学的には簡単に定義可能だが、頻度主義からは意味がない(「1回目のさいころの目が2のとき、2つの目の和が6になる確率」なら定義できる)。
[編集] ベイズ確率の応用
ベイズ確率は現在いろいろな方面で応用されている。一方で頻度主義に基づく統計学の理論体系に対しては、かえって実用性を犠牲にしているとのベイジアンからの批判がある。むしろベイズ主義のほうが人間の思考様式になじむというわけである。ベイズ推定は、まず複数の仮説について尤もらしさ(信念の度合)を考え、実験や観測により新しい情報(データ)を収集し、それらを組み合わせてベイズの定理によってその確率を改訂するという点で、科学的方法のモデルとしても提案されている。またベイズ因子(従来の統計学における尤度を用いる方法に似ている)を利用する方法はオッカムの剃刀に対応するものとされている。
ベイズ推定を用いた方法は近年、スパムを見つける方法(ベイジアンフィルタ)として利用され成果を上げている。すでにわかっているスパムの選別法をフィルターに示し、次いで単語の頻度を用いてスパムと必要なeメールとを識別するのである。