Bayes統計学を今回は
を主に参照しつつ学んでいく。
4. Metropolis-Hastings法
復習としてMetropolis-Hastings法のアルゴリズムを記述する:
Metropolis-Hastings法のアルゴリズムを定式化すると「提案された候補点
を確率
で受容(
)するか、その場に留まる(
)ことを繰り返す」ことである:
- 提案分布
を利用して乱数
を生成する。
- 生成した
を用いて
ならば、、
と見なし、
を計算し、確率で
を受容し、
とする。確率
で
を破棄し、
とする。
ならば、確率で
を受容し
とする。
として1.に戻る。
以降、特殊なケースにおけるMetropolis-Hastings法(MH法)を取り扱う。
4.7 独立MH法
提案分布は一般的に条件付き分布の形式で表現する。これを敢えて1時点前の条件付きでない無条件分布を提案分布に用いることもできる。この場合、提案候補は互いに独立になる。このようなMH法を独立MH法という。
独立MH法では、提案分布が無条件分布であるから、
と表現できる。すなわち
図表1 独立Metropolis-Hastings法のアルゴリズム
- 提案分布
を利用して乱数
を生成する。
- 生成した
を用いて
ならば、、
と見なし、
を計算し、確率で
を受容し、
とする。確率
で
を破棄し、
とする。
ならば、確率で
を受容し
とする。
として1.に戻る。
独立MH法は提案分布の良し悪しに応じて、収束までの成績に大きな違いが生じる。実際のデータ分析では目標分布、更には目標分布の母数ですら不明であるため、不適切な提案分布を選ぶリスクがある。
4.7 ランダムウォークMH法
独立MH法における「不適切な提案分布を選ぶリスク」を解決するには、ランダムウォークを利用することが効果的である。具体的には候補提案を
と攪乱項を持たせる。分布としては、平均が
であるような正規分布や区間
の一様分布などの対称な分布を選ぶ。
提案分布は、対称な分布を選んだ方が便利である。対称な分布を選ぶと提案分布が
となる。このときランダムウォークMH法における補正係数は
と書ける。
- 提案分布
を利用して乱数
を生成する。
- 生成した
を用いて
ならば、、
と見なし、
を計算し、確率で
を受容し、
とする。確率
で
を破棄し、
とする。
ならば、確率で
を受容し
とする。
として1.に戻る。
4.8 生成量・仮説が正しい確率
一般に期待値は大数の法則により、が十分に大きければ
が成り立つことがMarkov連鎖Monte Carlo法の動機であった。ここではバーンイン期間として控除するサンプル数*1である。
事後分散はが十分に大きいので不偏性を持たせるための補正を無視すれば
である。
一般の関数に関する期待値
でも、母数とデータを入れ替えた
について大数の法則から
と近似できる。このときを生成量という。MCMC法では生成量を大量に与えるため、その標準誤差は事後標準偏差の推定値として利用できるため、それからパーセント値を利用すれば生成量の確信区間を数値的に求めることが出来る。
特にとして定義関数
(
は確率を求めたい仮説の事象)を用いることで
であり、で仮説
が正しい確率を評価することが出来る。
4.9 事後予測分布の評価方法
事後予測分布について
が成り立つから
*1:厳密にはサンプルの最初からの番号である。