統計学を真剣に学ぶ人のために、個人的にまとめているノートを公開する。
底本として
を用いる。
前回
2. 統計学のための確率論
2.4 確率分布と期待値
確率実験における結果は数値によるものであるとは限らない 。しかし数値でないと数学的な取り扱いとしては不便な場合が多い。そもそも考えている根元事象と観測できるものが異なる場合というのは充分にあり得る。
そこで数値を取り扱うために、または根元事象と観測した数値とを対応付けるために、標本空間上の各事象に1つの実数値を対応させることで各事象を数値に対応づけ事象に基づいて定義された確率空間をその対応(した実数値)に基づいた新たな空間での議論に紐づけることを考えたい。このとき問題はそのように紐づけたとして、その紐づけたものに「確率」を与えることが可能なのか、またそこで与えた「確率」が元々の結果の「確率」と同一であると考えて良いのか、そしてより重要なのは、それを一意に定義できるのかということである。実はそれらはいずれも可能である。
定義2.8 確率変数の定義 標本空間上の各事象に1つの実数値を対応させるような対応を考えるとき、この対応を上の確率変数という 。より厳密には、確率空間を考えるとき、上の実数値関数が可測、すなわちすべてのについて
を満たすとき、を の上の確率変数と呼ぶ*1。
このように確率変数を導入したことで、事象を扱う代わりに実数値を取る確率変数を扱って確率実験を数値として扱うための概念を導入することができる。もっとも当初の疑問にはまだ答えていない。すなわち確率は事象を伴う上で集合に対して定義された関数であり、確率変数を取り扱うのであれば実数上での「確率」を別に考えなければならない。またその実数上の「確率」ともともと考えていた集合関数としての確率との対応関係を議論しなければならない。
確率空間を考える。またをの上の確率変数とするとき、集合関数を
と定めることでは上の確率となる。このときを像測度、またはの確率分布(probability distribution)と呼ぶ*2。
このように定義された確率分布が確率の性質を満たすことを確認しておく:
- (1)特にについて
であるから
が成り立つ。
- (2)は加法族であるから任意のについてが成立する。したがってを考えることができ、
- (3) に対して
以上から分布もまた当初導入した意味での確率の定義を満たすことを確認できた。
分布を更に扱いやすいようにすべく、分布関数を定義する。
このように定義したことで実数値に対応する「確率」にまで議論を持ってくることができた。なお複数の確率変数に対してそれぞれの分布関数を議論する場合には各分布関数とそれに対応する確率変数を強調するためにといった表記をすることが多い。
また関数の定義域をとするとき、以下の3つが成り立つことがが分布関数であることの必要十分条件であることが知られている:
(1)
(2)
(3)
確率変数が連続値でその分布関数がに関して微分可能なとき、
を確率密度関数という。
2.5 期待値と分散
2.5.1 期待値
確率に関して特殊な積分を定義することができる *4。確率空間を考え、その上の確率変数を考える。Lebesgue積分の意味での積分
を期待値(または平均)とよぶ。
Lebesgue積分の議論から積分は基本的に非負値に定義される。そこで
そこで
と定義したときに、
がまたはのときに期待値が存在するという*5。
具体的に期待値を計算するためには、確率を(確率)分布に変換してやれば実数に対する積分へと帰着することができる。すなわち実確率変数の族と可測関数に対してとおく。が可積分ならば
が得られる*6。
2.5.2 分散と共分散
確率変数を確率空間上で定義されたものとする。期待値が存在するとして
が存在するとき、を分散という。慣例として期待値は,分散はと書くことが多い*7。これらは分布(像測度)を通じ、前章で確率の議論を導入する前に定義した平均や分散と対応(一致)する。
さらに二乗可積分実確率変数に対して
をの共分散といい、
をの相関係数という。
2.5.3 期待値・(共)分散の性質
定理2.10 期待値の性質
関数の期待値が存在するとき、として以下が成り立つ:
- (1),特に
- (2)
- (3)
- (4)
( それぞれについて
(1) 期待値の定義および確率密度関数の定義から
である。
(2) 期待値の定義から
(3) 任意のに対してであると仮定すると、確率の定義を踏まえれば
(4) 任意のに対してであると仮定すると、
である。 )
( それぞれについて
(1)定義より、期待値(積分)が順序交換できることに注意して
(2)定義より
(3)定義より
等号が成立するときは
(4)定義より
であり、(2)においてに置き換えて、(1)を適用することで
(5)定義より
である。 )
期待値は本質的に(Lebesgue)積分であるから、積分に対して成立するさまざまな不等式が成立する。
とおくと、
(1)Hölderの不等式
のとき
(2) Minkovskyの不等式
に対して
(3) Markovの不等式
非減少可測関数がを満たすとき
が成り立つ。ここで確率変数および集合に対して
とする。とくに可積分確率変数に対してChebyshevの不等式が成り立つ:
(4)Jensenの不等式
開区間, 凸関数さらにを可積分とすると
詳しくは後で説明する。
2.6 その他の代表量:特性関数
それ以外の代表値についても数学的に定義、導入することができる。その具体的な計算のために有用な関数をまずは導入する。
一般にに対し、の平均をとして
をそれぞれ原点周りの次モーメント、平均周りの次モーメント(中心モーメント)と呼ぶ*8。
の計算には、が連続値の場合には、モーメント母関数
を利用する。ここではの分布関数、はの確率密度関数である。
モーメント母関数は、独立な2つの確率変数のモーメント母関数は個々のモーメント母関数の積で計算できるという性質がある。
またモーメント母関数の対数をとった
をキュムラント母関数という。対数は、2つの変数の積の対数を取るとそれが個々の対数の和に等しいという性質をもつから、独立な2つの確率変数のキュムラント母関数は個々のキュムラント母関数の積で計算できるという計算上の利点を持つ。
(非負の)離散確率変数の分布を調べる際には確率母関数を用いる。とするときを変数とする確率母関数を
で定義する。
確率母関数についてとし、
とおく。任意の整数に対して
である。したがって非負整数に対して
が成り立つ。
連続・離散に限らず、と置いたもの、すなわち確率変数に対して
を積率母関数という。とおけばであるから確率母関数と同等となる。
積率母関数は、積分と微分が交換できるという条件の下で
が成り立つ。のにおける(高次の)微係数がの原点まわりのモーメントを表す。平均まわりのモーメントを求めるには、
に注意すれば、の代わりにを積率母関数として用いればよい。ただし積率母関数はが存在するとは限らないため、必ずしも値が存在するわけではない。
積率母関数は、となるような区間においてその値が存在する場合、すべての次数のモーメントが存在し微分・積分の交換が保証される。このとき原点のまわりで
が成り立つ。
またとしたもの、すなわち
を特性関数という。
であるから、特性関数は任意の分布および任意の実数について存在する。
の次モーメントが存在すれば、微分と積分の交換が保証され、
となる。特性関数においても
が成り立つならば
となることが知られている。
一般の分布に対して逆転公式が存在するから、母関数(特性関数)からもとの確率分布を求める公式を母関数の逆転公式という。この公式があるために確率分布と母関数が一対一で対応することが分かる。
参考文献
- Lehmann, E.L., Casella, George(1998), "Theory of Point Estimation, Second Edition", (Springer)
- Lehmann, E.L., Romano, Joseph P.(2005), "Testing Statistical Hypotheses, Third Edition", (Springer)
- Sturges, Herbert A.,(1926) "The Choice of a Class Interval", (Journal of the American Statistical Association, Vol. 21, No. 153 (Mar., 1926)), pp. 65-66
- 上田拓治(2009)「44の例題で学ぶ統計的検定と推定の解き方」(オーム社)
- 大田春外(2000)「はじめよう位相空間」(日本評論社)
- 小西貞則(2010)「多変量解析入門――線形から非線形へ――」(岩波書店)
- 小西貞則,北川源四郎(2004)「シリーズ予測と発見の科学2 情報量基準」(朝倉書店)
- 小西貞則,越智義道,大森裕浩(2008)「シリーズ予測と発見の科学5 計算統計学の方法」(朝倉書店)
- 佐和隆光(1979)「統計ライブラリー 回帰分析」(朝倉書店)
- 清水泰隆(2019)「統計学への確率論,その先へ ―ゼロからの速度論的理解と漸近理論への架け橋」(内田老鶴圃)
- 鈴木 武, 山田 作太郎(1996)「数理統計学 基礎から学ぶデータ解析」(内田老鶴圃)
- 竹内啓・編代表(1989)「統計学辞典」(東洋経済新報社)
- 竹村彰通(1991)「現代数理統計学」(創文社)
- 竹村彰通(2020)「新装改訂版 現代数理統計学」(学術図書出版社)
- 東京大学教養学部統計学教室編(1991)「基礎統計学Ⅰ 基礎統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1994)「基礎統計学Ⅱ 人文・社会科学の統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1992)「基礎統計学Ⅲ 自然科学の統計学」(東京大学出版会)
- 豊田秀樹(2020)「瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―」(朝倉書店)
- 永田靖(2003)「サンプルサイズの決め方」(朝倉書店)
- 柳川堯(2018)「P値 その正しい理解と適用」(近代科学社)
*1:対応としてとした場合、を確率ベクトルという。
*2:像測度は主に測度論における呼称であり、確率論では後者、もしくは単に分布と呼ぶ。本ノートでも以降は(確率)分布と呼ぶことにする。
*3:確率ベクトルに対しても同様の定義をすることが出来、このときもを分布関数と呼ぶ。
*4:分布に関してではないことに注意せよ。ただし後の注記でも触れるように実用面では気にする必要はない。
*5:すなわち期待値は不定形は許容しない一方で、を取ることは許容している。
*6:ここで初めて確率に対して定義された期待値と分布とに対応が付いた。以降の議論では敢えて確率に対して各値を定義していくが、分布に対して定義しても良い。慣習上、確率に対して定義した場合はのように書く一方で、分布に対して定義、計算する際にはと書くことが多い。
*7:これらの概念が導入された当時は数学記号としてギリシア文字を使うのが一般的だったことに起因すると思われる。たとえば総和を表すの記号は英語のsumの頭文字のギリシア文字表記である。
*8:として期待値を1次モーメントということもままある。