統計学を真剣に学ぶ人のために、個人的にまとめているノートを公開する。
底本として
を用いる。
前回
2. 統計学のための確率論
2.10 確率変数及び確率分布の収束
統計学に基づいた議論を行う際に予め理論的に確認しておく必要があるのが、確率変数および確率分布の収束である。
統計的な推測を行う際、通常母集団に属するすべての元を知ることはできず、そのうちの一部を観測して得られた標本を用いて、すなわち母集団の限られた一部から全体の情報を知ることとなる。しかし理論的には、その一部の性質が母集団の性質を示すか否かは自明ではないし、どのような意味でそれが成り立つかも調べておく必要がある。
そこでそうした一部の情報が母集団の情報とどのように結びついているのかを理論的に議論すべく、確率変数および確率分布の収束を議論する。この関係性が分かれば、一定程度の観測数が担保されるという留保条件の下で、その一部の情報自体を解析することを母集団として想定できるものの性質を解析することに替えるのにある程度の正当性を与えるのである。
確率変数は可測空間上の可測関数であるから、その収束を考えるには関数列の収束を考える必要がある。関数列の収束には一様収束と各点収束の2種類がある。さらに確率変数独特の収束概念として、概収束、確率収束および分布収束がある。
これらには
- (1)一様収束するならば各点収束する。
- (2)各点収束すれば概収束する。
- (3)概収束すれば確率収束する。
- (4)確率収束すれば分布収束する。
という強弱関係がある。
2.10.1 各点収束と一様収束
関数列の収束として、まずは関数列が定義域の各点で収束するかどうかを考える。各点で関数列が収束すればよいと考えるのが各点収束である。各点で収束する上、収束速度が定義域全体で揃っていなければならないとするのが一様収束である。
実確率変数列と実確率変数について、任意の正数に対して充分に大きな自然数を取るとすべてので
となるとき、はに一様収束するという。
実確率変数列と実確率変数について、任意の正数に対して各点で充分大きな自然数を取ると
となるとき、はに各点収束するという。
一様収束するならば各点収束するが、逆は成り立たない。
2.10.2 概収束
各点収束の条件を緩めて、確率がとなる部分では収束しなくともよいとするのが概収束である。こういった議論をする際の用語として「命題が殆ど至るところで成り立つ」とは確率で成り立つことで、逆に起こる確率がであるところでは成立しなくとも構わないという意味である。
実確率変数列と実確率変数について、任意の正数に対してほとんど至るところの点で充分大きな自然数を取ると
となるとき、はに概収束するといい、
と書く。
2.10.3 確率収束
確率変数列が確率変数に確率収束(converge in probability)するとは、任意のに対して
が成り立つことをいい、と記す。
2.10.4 平均二乗収束
「確率収束」よりも強い収束概念として平均二乗収束がある。
確率変数列が確率変数に平均二乗収束するとは、
が成り立つことをいい、と記す。
確率変数列が確率変数に平均二乗収束すると仮定する。後述するChebyshevの不等式においてと置き換えることで
が得られる。すなわちを得ることができる。これは平均二乗収束するならば確率収束することを意味するのであって、がの母平均を表現する場合、平均二乗収束を議論する方がそれらの収束を議論するのが楽な場合がある。
2.10.5 分布収束
確率の理論における収束概念の一つとして次に「分布収束」を導入する。
確率変数列が確率変数に分布収束(converge in law)するとは、の分布関数をと書くときに、のすべての連続な点において
が成り立つことをいい、と記す。
同一の分布を持つ異なる確率変数が存在し得るため、法則収束しても確率収束するとは必ずしも言えるわけではない。
2.10.6 Markovの不等式
を確率変数でとする。このとき任意のに対して以下が成り立つ:
定理2.6 Markovの不等式
2.10.7 Chebyshevの不等式
Markovの不等式の特殊例としてChebyshevの不等式がある:
定理2.7 Chebyshevの不等式
実際、確率変数についてと仮定する。このとき、Markovの不等式においてとおくことで
すなわち
が成り立つ。
2.10.8 大数の弱法則
Chebyshevの不等式を用いることで標本平均の確率収束を証明することができる。
( とすると、
であることに注意すると、任意のに対してChebyshevの不等式を用いると
を得る。であるから、はさみうちの原理より
が成り立つ。 )
2.10.9 大数の強法則
この法則は、な確率変数列の和をその数で割った確率変数がある確率変数に概収束すること、さらにはがによらない定数になることを意味する。概収束するならば確率収束するため、弱法則よりもより強い法則である。
これを示すべく、いくつかの準備を行う。確率空間を考える。事象列に対して
とおき、の上極限という。このとき、Borel-Cantelliの補題、すなわち
- ならば
- 事象列がすべて互いに独立でが発散するならば
( 1. とおく。このとき任意のについてが成り立つから
である。ここでは任意であったからとすれば、仮定からが成り立ち、はさみうちの原理から
である。
2. 劣加法性から
でありとなるため、任意のに対して、
を示せば充分である。任意のに対して、事象列の独立性およびから
であるが、仮定からは発散するためのとき上式のとなり、
を得る。 )
次にKolmogorovの不等式を導入する。を独立な実確率変数列でかつとする。このとき任意の正数に対して
が成り立つ。
( 見やすくするために事象を
とおく。に対して
とおけば、互いに素なについて
と分解できる。したがって
が得られる。ここで
とする。
最後の不等式はならばが成り立つからである。
かつより
が成り立つ。したがって
が得られる。 )
以上を用いて大数の強法則を示す。まず、実確率変数列が独立で
を満たせば、に対して大数の強法則が成り立つことを示す。
( 任意のに対してと仮定してもよい。このとき任意のに対して
とおく。ならば任意のに対してであるためが存在してならばである。したがってとなる。
次に
とおく。このとき任意のに対して
が成り立つから、
を言うことができればが言える。そこでとして
が成り立つ。したがって
である。ここではを満たす整数とする。ここで
であるから、この定理の仮定から
となる。 )
さらにもう1つの定理を示しておく。実確率変数列が独立同一分布に従い
と仮定する。このとき
に対して大数の強法則が成り立つ。
( 任意のに対してと仮定してもよい。をと共通の分布をもつ確率変数とし、その分布関数をとする。とおくと、実確率変数列は直前に示した定理の仮定を満たす。実際は互いに独立であり、について
であるから、
が成り立つ。したがってであるから
が成り立つ。
次にLebesgueの収束定理から
が分かる。したがって
が成り立ち、以上からを置き換えることで
である。
最後に、
と評価できる。Borel-Cantelliの補題(1)を変形すると、
である、すなわち
と言えるので、今回についても
が成り立つ。すなわち
である。以上から
が成り立つ。これらから大数の強法則が示された。 )
参考文献
- Lehmann, E.L., Casella, George(1998), "Theory of Point Estimation, Second Edition", (Springer)
- Lehmann, E.L., Romano, Joseph P.(2005), "Testing Statistical Hypotheses, Third Edition", (Springer)
- Sturges, Herbert A.,(1926) "The Choice of a Class Interval", (Journal of the American Statistical Association, Vol. 21, No. 153 (Mar., 1926)), pp. 65-66
- 上田拓治(2009)「44の例題で学ぶ統計的検定と推定の解き方」(オーム社)
- 大田春外(2000)「はじめよう位相空間」(日本評論社)
- 小西貞則(2010)「多変量解析入門――線形から非線形へ――」(岩波書店)
- 小西貞則,北川源四郎(2004)「シリーズ予測と発見の科学2 情報量基準」(朝倉書店)
- 小西貞則,越智義道,大森裕浩(2008)「シリーズ予測と発見の科学5 計算統計学の方法」(朝倉書店)
- 佐和隆光(1979)「統計ライブラリー 回帰分析」(朝倉書店)
- 清水泰隆(2019)「統計学への確率論,その先へ ―ゼロからの速度論的理解と漸近理論への架け橋」(内田老鶴圃)
- 鈴木 武, 山田 作太郎(1996)「数理統計学 基礎から学ぶデータ解析」(内田老鶴圃)
- 竹内啓・編代表(1989)「統計学辞典」(東洋経済新報社)
- 竹村彰通(1991)「現代数理統計学」(創文社)
- 竹村彰通(2020)「新装改訂版 現代数理統計学」(学術図書出版社)
- 東京大学教養学部統計学教室編(1991)「基礎統計学Ⅰ 基礎統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1994)「基礎統計学Ⅱ 人文・社会科学の統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1992)「基礎統計学Ⅲ 自然科学の統計学」(東京大学出版会)
- 豊田秀樹(2020)「瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―」(朝倉書店)
- 永田靖(2003)「サンプルサイズの決め方」(朝倉書店)
- 柳川堯(2018)「P値 その正しい理解と適用」(近代科学社)
*1:は、確率変数が必ずしも特定はしないがある分布に「独立かつ同一の分布に従って」(i.i.d.)おり、それらの平均および分散はすべてそれぞれであるという意味である。