Bayes統計学を今回は
を主に参照しつつ学んでいく。
4. Metropolis-Hastings法
4.1 事後分布からの乱数発生
Bayes統計学では、データからの知見を事後分布経由で得る。しかし事後分布の解析的評価は不可能な局面が殆どである。たとえばEAP推定量
は母数に関する積分が必要となるが、積分は評価できるものと出来ないものが存在する。特に多変量への積分になれば、計算負荷が大きくなり、数値的にも不可能という状態になり得る。そのため発想を変え、事後分布が母数の確率分布であることを踏まえて、事後分布から乱数を発生させることにする。すなわち観測変数が固定され、確率変数である母数が事後分布に従い、母数の実現値も観測されているという状況を考える。
ただし2点問題がある。
- 仮に確率分布が評価できても、必ずしも当該確率分布に従う乱数を発生させられるとは限らない。
- 事後分布に含まれっる正規化定数は評価できない場合が多い。
これらを考慮して、カーネルのみを用いて事後分布に従う乱数を発生させることを考える。
4.2 Monte Carlo積分*1
積分の計算方法には様々なものがあるが、1つにはMonte Carlo法を用いるものがある。
いまの確率密度関数を
として以下の積分を考える。
仮にから独立に
が得られたとすると、
は大数の強法則から、これはで
に収束する。これをMonte Carlo積分という。
Monte Carlo積分を用いてさまざまな統計量を(近似的に)計算する。
(1)事後平均
を近似すると、
が該当する。
(2)事後モード
を近似すると、
が該当する。
(3)特定の領域に入る確率
を近似すると、
が該当する。
(4)周辺事後分布
を近似すると、
が該当する。
(5)予測分布
が該当する。
4.3 Markov連鎖
カーネルのみを用いて事後分布に従う乱数を発生させるために、Markov連鎖の利用を考える。
一般の確率過程に対して、
すなわち条件付き確率が直前の時点における状況のみの影響を受けるような確率過程をMarkov連鎖という。Markov連鎖を規定する条件付き確率を遷移核(transition kernel)という。
4.4 定常分布への収束
Markov連鎖を用いて確率を遷移させていった結果として変化しなくなった確率分布をそのMarkov連鎖の定常分布(または不変分布)という。この挙動を定常分布への収束といい、収束までの期間をバーンイン期間
という。
Markov連鎖は遷移カーネルと初期状態が、
- 既約的:有限回の推移で状態空間の要素全てが互いに到達可能であること
- 正再帰的:状態空間の任意の要素は限りなく何度も遷移し得ること
- 非周期的:連鎖の状態が一定の周期性を持たないこと
を有するとき、定常分布に収束することが保証される。
定常分布には以下が知られている:
- Markov連鎖
で
を満たすような定常分布が存在する。
- Markov連鎖
で
4.5 Markov連鎖Monte Carlo法
サンプリングしたい分布を定常分布とするようなMarkov連鎖を構成する方法をMarkov連鎖Monte Carlo法と総称する。Markov連鎖Monte Carlo法ではサンプリングしたい分布を目標分布と呼ぶ。このときはすなわち、定常分布が既知である中で遷移核を知ることが問題になる。
Markov連鎖Monte Carlo法は以下の3点から爆発的に普及した:
4.6 詳細釣り合い条件
Markov連鎖が定常分布に収束するための十分条件として詳細釣り合い条件がある。
標本空間のすべての事象の組
に対し
が成り立つこと。
4.5.1 詳細釣り合い条件の意味
詳細釣り合い条件においてに関する総和を両辺について取ると
が成り立つ。これは分布が変化しないように制約を入れた全確率の公式である。
これを連続な確率変数に関して書けば
である。ここでが目標分布であり、
が遷移核である。目標分布が
であり遷移核が
であると言っても同じである。
この式はあらゆる点において成り立つから、これらを積分しても成り立つ:
これはから
に遷移する確率密度のあらゆる開始地点に関する平均確率密度(右辺)が
の確率密度そのものであると言っている。したがって詳細釣り合い条件が満たされているならば、初期状態を真の値からデタラメに遠くに取ったとしてもその周辺へと乱数列が急速に近づく。
4.6 Metropolis-Hastings法
既知である事後分布に対して詳細釣り合い条件
を満たすような遷移核を見つけるのは困難である。そこで代わりに適当な遷移核
を提案分布として用いる。
とはいえ適当に選択する以上、詳細釣り合い条件を満たすとは限らない。そこでそれを満たすような方向へ確率補正を掛けるのがMetropolis-Hastings法である。
確率補正の方法として適当な正の定数
を導入し
と補正する。
これを基にMetropolis-Hastings法のアルゴリズムを定式化すると「提案された候補点を確率
で受容(
)するか、その場に留まる(
)ことを繰り返す」:
- 提案分布
を利用して乱数
を生成する。
- 生成した
を用いて
ならば、、
と見なし、
を計算し、確率で
を受容し、
とする。確率
で
を破棄し、
とする。
ならば、確率で
を受容し
とする。
として1.に戻る。