統計学を真剣に学ぶ人のために、個人的にまとめているノートを公開する。
底本として
を用いる。
8. 統計的仮説検定
8.3 良い検定手法の定義:一様最強力検定・不偏検定・尤度比検定
「“良い”検定」とは何か。伝統的な検定手法に立脚すれば、前述のとおり第1種の過誤を犯す確率を有意水準に抑えたうえで対立仮説のもとでの検出力を最大にする(第2種の過誤を犯す確率を最小化する)ものである。こうしたものを与える条件を具体的に考えるために有用な概念が「(一様)最強力検定」「不偏検定」「尤度比検定」である。
「(一様)最強力検定」とは検出力の高い検定の方が“良い”検定であるという、言ってみれば当たり前の条件を明言化するための考えである。しかしそれはすべての検定において常に存在するというわけではない。そこでもし(一様)最強力検定が存在しないのであれば、(一様)最強力検定が存在するように検定族を制約する「条件」を加えることを考えればよく、そのための条件が検定における「不偏性」である。
8.3.1 最強力検定
ある仮説検定
を考える。前述した考えを前提とすれば、その検定において最も望ましいものは第1種の過誤を起こす確率を有意水準以下に抑えつつ、対立仮説のもとでの検出力を最大にするような検定である。このような検定を一様最強力検定という。すなわち有意水準を与えたときに想定し得るすべての検定の集合をとおくとき、が成り立つことに注意すれば、あるの検出力がほかのすべての検定よりも検出力が高いとき、を一様最強力検定(検定)という。
ここで“一様”とはすべての対立仮説について同時に検出力を最大にするからで、もし対立仮説が単純()ならばは単に最強力検定という。
問題は一様最強力検定の存在性だが、一般には常に一様最強力検定が存在するとは限らない。ただし任意に対立仮説を固定することで対立仮説を単純仮説と制限したときに、もし最強力検定が存在し更にそれがに依存しなければ、この最強力検定は固定する前の検定問題における“一様”最強力検定でもある。そこで一様最強力検定の存在性は、対立仮説が単純仮説である場合に最強力検定が存在するかを議論すればよい。
帰無仮説が複合仮説である場合については何とも言えないものの、帰無仮説もまた単純仮説である場合、以下の-の補題から、明示的に最強力検定を構成する方法が存在することが示される。
とおく。定義から明らかにであり、またである。
仮説検定
を考え、これの有意水準の検定関数をとおく。このとき定義から
が成り立つ。
の検出力および有意水準の任意の検定を考えると、
検定は任意に取っていたから、これはが最強力検定であることに他ならない。 )
連続確率変数ではある1点を取る確率密度関数の値はであり、は離散確率変数において有意水準を調整するためのものである。
実用上は本来を与えてから他の値を決めるのではなく、まずを与える。そしてが成り立つようにを選ぶ。
また-の補題で構成した最強力検定の一意性を考える。もしも有意水準の最強力検定だとすると、検出力の差分である。したがってと同一のについて
が成り立たなければならない。このため、の一意性のためにはは一意に定まらなければならない。
以上を踏まえて-の補題を再整理するとこうなる:
-の補題 ある確率分布の確率(密度)関数に対して仮説検定
を考える。このとき任意に与えられたに対して検定関数を
と定義すと、有意水準の検定においては最強力検定になる。また任意のほかの有意水準の最強力検定は同じについて上記形態を満たさなければならない。
ここで検定関数の場合分けにおいてを考えることもでき、これを尤度比という。これはすなわち-の補題は尤度比に基づく検定が最強力検定を構築することを意味する。
例:正規分布の平均の検定
としを固定する。このとき仮説検定を考える。この尤度比を計算すると
である。したがってある値を取り不等式を考えれば
が得られる。
-の補題より、棄却が最強力検定になる。
有意水準を与えたときのを具体的に求める。はに注意すれば、を標準正規分布の上側点として、
とすればよい。
以上をまとめると、仮説検定に対する有意水準の最強力検定は
で与えられる。
参考文献
- Lehmann, E.L., Casella, George(1998), "Theory of Point Estimation, Second Edition", (Springer)
- Lehmann, E.L., Romano, Joseph P.(2005), "Testing Statistical Hypotheses, Third Edition", (Springer)
- Sturges, Herbert A.,(1926), "The Choice of a Class Interval", (Journal of the American Statistical Association, Vol. 21, No. 153 (Mar., 1926)), pp. 65-66
- Wald, A.,(1950), "Statistical Decision Functions", John Wiley and Sons, New York; Chapman and Hall, London
- 上田拓治(2009)「44の例題で学ぶ統計的検定と推定の解き方」(オーム社)
- 大田春外(2000)「はじめよう位相空間」(日本評論社)
- 小西貞則(2010)「多変量解析入門――線形から非線形へ――」(岩波書店)
- 小西貞則,北川源四郎(2004)「シリーズ予測と発見の科学2 情報量基準」(朝倉書店)
- 小西貞則,越智義道,大森裕浩(2008)「シリーズ予測と発見の科学5 計算統計学の方法」(朝倉書店)
- 佐和隆光(1979)「統計ライブラリー 回帰分析」(朝倉書店)
- 清水泰隆(2019)「統計学への確率論,その先へ ―ゼロからの速度論的理解と漸近理論への架け橋」(内田老鶴圃)
- 鈴木 武, 山田 作太郎(1996)「数理統計学 基礎から学ぶデータ解析」(内田老鶴圃)
- 竹内啓・編代表(1989)「統計学辞典」(東洋経済新報社)
- 竹村彰通(1991)「現代数理統計学」(創文社)
- 竹村彰通(2020)「新装改訂版 現代数理統計学」(学術図書出版社)
- 東京大学教養学部統計学教室編(1991)「基礎統計学Ⅰ 基礎統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1994)「基礎統計学Ⅱ 人文・社会科学の統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1992)「基礎統計学Ⅲ 自然科学の統計学」(東京大学出版会)
- 豊田秀樹(2020)「瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―」(朝倉書店)
- 永田靖(2003)「サンプルサイズの決め方」(朝倉書店)
- 柳川堯(2018)「P値 その正しい理解と適用」(近代科学社)