Bayes統計学を
を主に参照しつつ学んでいく。
●今回のまとめ
- Bayesの定理
- Bayes分析では①確率分布に関して意思決定主体が持つ主観的情報、②確率分布から生成されたデータがもたらす情報をBayesの定理を用いて融合した事後分布によって意思決定を行なう。
2 Bayesの定理
2.1 条件付き確率
事象に対して、事象
が起きたという条件の下での事象
の確率を
と書き、これを
にて定義する。これは、全事象および任意の事象
に対して
が成り立つことから
が成り立つこととのアナロジーで考えればわかりやすい。すなわち起きたことを前提視した事象の確率
を基準として事象
の確率
を測るものである。ただし
を基準とするために、事象
が起きているのに事象
は起きないことを検討しても仕様が無いため、分子には
を用いている。
定義より
2.2 余事象
事象に対して事象
が起こらないことを
と書き、これを余事象という。余事象に関しては
2.3 Bayesの定理
以上を踏まえることでBayesの定理を導入する。
条件付き確率の定義から
ここで確率の加法定理および乗法定理を活用して
が得られる。これを代入することで
これをBayesの定理という。
Bayesの定理は「ある条件下で起こりやすい(起きにくい)事象を観測したのであれば、その条件が満たされている可能性は高まった(低くなった)はずだ」という直観的な判断を数学的に表現・保障したものである。
Bayesの定理
を事前確率と呼び、その分布を事前分布という。これに対しを事後確率という。
このBayesの定理を繰り返し適用していくことで、もともとの事前確率が観測した事象=「情報」により修正されていく。
2.4 例題1:碁石*1
真っ暗な部屋に同じ形の3つの赤い壺、青い壺、緑の壺が置いてある。それぞれの壺の中には形・大きさ・手触り・重さのまったく等しい碁石がそれぞれ10個入っている。そのうち黒い碁石はそれぞれに3個、4個、5個入っている。手探りで(無作為に)1つの壺を選びそこから碁石を1つ取り出したところ、それが黒だったとして、選んだ壺が赤であった確率を求めよ。
解答:
Bayesの定理を適用することで
ここで無作為に壺を選んだため、とすれば
である。
2.5 例題2:血液鑑定問題*2
東京で殺人事件が発生した。現場に残された犯人の血液を鑑定した結果、この町に住むA氏の血液と特徴が一致した。その一致率が10万人に1人だとするとき、他に証拠が皆無であるとすれば、A氏が犯人である確率を求めよ。
解答:
Bayesの定理より
ここでであるとすれば
ここからが問題である。
- 他に証拠(情報)が無いため、
とすれば
すなわち有罪である。
- 犯罪統計上、日本では約10万人に1人が犯罪を犯すため、それを事前確率として用いれば
すなわちA氏が犯人か否かは五分五分である。
このように事前確率として何を用いるかで結果が大きく変わる。またたとえ大量のデータを用いて極端な事前情報が与える影響を薄めようとしても、事前確率の主観性・恣意性に対する警戒は怠ることは出来ない。
2.6 例題3:ウィルス感染確率の分析*3
世界全体の人口のうち
があるウィルスに感染しているとする。今ここから無作為に1人を抽出し、ある初期検査
を受診させた。この初期検査
は
で感染した人を特定し、
の確率で感染していない人を感染していると診断するものとする。また精密検査
は
で感染した人を特定でき、
で感染していない人を感染していると診断するものとする。このとき、
(1) 初期検査
が陽性と判断した人物が実際に感染者である確率を求めよ。
(2) 初期検査が陽性と判断した人物を精密検査
が陰性と判断した場合にその人物が実際には感染者である確率を求めよ。
を感染しているという事象、
を感染していない事象とする。このとき
であり、またをそれぞれ初期検査
が陽性、陰性であると診断する事象とすれば
である。
さらにをそれぞれ精密検査
が陽性、陰性であると診断する事象とすれば
である。
(1) 初期検査が陽性と判断した人物が実際に感染者である確率
は、Bayesの定理より
これは、初期検査で感染していると診断された
という情報により、その人が実際に感染している確率が
から
に押し上げたことになることを意味する。
(2) 初期検査が陽性と判断した人物を精密検査
が陰性と判断した場合にその人物が実際には感染者である確率を
とする。
まず初期検査で陽性と診断された人物が精密検査
で陽性である確率
は、Bayesの定理より
であり、である。
以上から
である。