統計学を真剣に学ぶ人のために、個人的にまとめているノートを公開する。
底本として
を用いる。
前回
5. 統計量・標本分布とサンプリング
5.2 正規分布から導出される統計量
統計量の分布は通常、解析的に導出・計算することは困難である。そこで標本数が無限に大きくなった場合に得られる分布を近似的に用いる。また確率変数が互いに独立かつ同一に正規分布に従うのであれば解析的に導出できる場合もある。本節ではとして、解析的に導出ができる事例を取り扱っていく。
5.2.2 標本分散
線形変換としてとおくことで一意に変換できることから
について考えることとする。まず
の従う分布を考えることとし、
とおくと
である。またヤコビアン
である。したがって
を得る。これは自由度のカイ二乗分布の確率密度関数に他ならない。
次に数学的帰納法によりが自由度
のカイ二乗分布、
が自由度
のカイ二乗分布に従うときに
が自由度
のカイ二乗分布に従うことを示す。まず
のときには
であるから、ヤコビ行列
は
したがってのときは示された。次に
のときに仮定が成立すると仮定する。このとき
である。畳み込みを用いることで
を得る。ここでとおくと
であり
のとき
であるから
である。以上からでも成り立つことが示された。
)
5.3 順序統計量と経験分布関数
標本の加工方法として、それを算術的に加工するのみならずそれらを並び替えたり頻度に加工したりすることでも標本がもつ母集団に関する情報を得ることができる。またノンパラメトリック・モデルであれば、順序の情報のみ利用することができる。そのための代表的な統計量として順序統計量および経験分布関数を導入する。
5.3.1 順序統計量
分布から得られた無作為標本を
とするとき、これらを昇順で並び替えたもの、すなわち
と新たに定義したを順序統計量という。
5.3.2 経験分布関数
分布から得られた無作為標本を
とするとき、特定の実数値
を与えたときの経験分布関数の値
を以下で定義する:
なお集合およびその部分集合
に対して
を
と定義し、これを指示関数(単位関数)と呼ぶ*1。これは標本から分布関数を推定するのに用いる。
参考文献
- Lehmann, E.L., Casella, George(1998), "Theory of Point Estimation, Second Edition", (Springer)
- Lehmann, E.L., Romano, Joseph P.(2005), "Testing Statistical Hypotheses, Third Edition", (Springer)
- Sturges, Herbert A.,(1926), "The Choice of a Class Interval", (Journal of the American Statistical Association, Vol. 21, No. 153 (Mar., 1926)), pp. 65-66
- 上田拓治(2009)「44の例題で学ぶ統計的検定と推定の解き方」(オーム社)
- 大田春外(2000)「はじめよう位相空間」(日本評論社)
- 小西貞則(2010)「多変量解析入門――線形から非線形へ――」(岩波書店)
- 小西貞則,北川源四郎(2004)「シリーズ予測と発見の科学2 情報量基準」(朝倉書店)
- 小西貞則,越智義道,大森裕浩(2008)「シリーズ予測と発見の科学5 計算統計学の方法」(朝倉書店)
- 佐和隆光(1979)「統計ライブラリー 回帰分析」(朝倉書店)
- 清水泰隆(2019)「統計学への確率論,その先へ ―ゼロからの速度論的理解と漸近理論への架け橋」(内田老鶴圃)
- 鈴木 武, 山田 作太郎(1996)「数理統計学 基礎から学ぶデータ解析」(内田老鶴圃)
- 竹内啓・編代表(1989)「統計学辞典」(東洋経済新報社)
- 竹村彰通(1991)「現代数理統計学」(創文社)
- 竹村彰通(2020)「新装改訂版 現代数理統計学」(学術図書出版社)
- 東京大学教養学部統計学教室編(1991)「基礎統計学Ⅰ 基礎統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1994)「基礎統計学Ⅱ 人文・社会科学の統計学」(東京大学出版会)
- 東京大学教養学部統計学教室編(1992)「基礎統計学Ⅲ 自然科学の統計学」(東京大学出版会)
- 豊田秀樹(2020)「瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―」(朝倉書店)
- 永田靖(2003)「サンプルサイズの決め方」(朝倉書店)
- 柳川堯(2018)「P値 その正しい理解と適用」(近代科学社)
*1:と書くこともある。