本気で学ぶ統計学(27/31) - 「大人の教養・知識・気付き」を伸ばすブログ

　統計学を真剣に学ぶ人のために、個人的にまとめているノートを公開する。
　底本として

新装改訂版現代数理統計学

作者:彰通, 竹村
学術図書出版社

Amazon

を用いる。

前回

power-of-awareness.com

前回
8.　統計的仮説検定
- 8.4　具体的な検定問題
参考文献

8.　統計的仮説検定

8.4　具体的な検定問題

　今までで仮説検定の理論的な背景について議論してきた。ここからは詳細な問題設定を与えた上で具体的な検定手法を導出していくことにする。
　その前にここまでの議論をシステマティックに考え方を整理しておこう。

	(1)帰無仮説 $H_0$ の設定	棄却されることを前提とした仮説を立てる。
	(2)対立仮説 $H_1$ の設定	採択されることを前提とした仮説を立てる。
	(3)標本の確認	得た標本から標本統計量および標本サイズを確認する。
	(4)検定統計量 $T$ の計算	条件に合った検定統計量 $T$ を計算する。
	(5)棄却域 $R$ の決定	有意水準、両側検定か片側検定か否か、自由度などから棄却域を決定する。
	(6)検定統計量 $T$ と棄却域 $R$ の比較	$T\geq R$ ならば帰無仮説 $H_0$ を棄却する。そうでなければ棄却しない。
	(7)結論を述べる	以上を受けて結論付ける。

　まず自分が示したい仮説を否定するような、すなわち棄却されることを前提とした仮説を立てて、それを帰無仮説 $H_0$ と設定する。次に本来自分が示したかった仮説を対立仮説 $H_1$ として設定する。
　次にいくつかの検討事項、すなわち

	(1)「パラメトリック検定」か「ノンパラメトリック検定」か否か
	(2)検定の目的
	(3)標本サイズ
	(4)分散(標準偏差)が既知か否か
	(5)「対応のあるデータ」か「対応の無いデータ」か否か*1

を考慮して適切な検定統計量 $T$ を決定する。
　検定統計量 $T$ の分布および有意水準に基づき、棄却域と採択域とに分布を区分けすることができる。あらためて整理しておくと、対立仮説を前提としたときに観測した標本から計算した標本統計量の推定値が得られるが、その標本統計量の分布からその推定値以下(以上)の値を取る確率が計算できる。その計算した確率が有意水準よりも小さいということは、対立仮説の下で標本統計量の推定値を得るような確率*2がまずあり得ない程に低いということだから、対立仮説が正しいという仮定に疑問を呈するべきだと考え、帰無仮説を棄却しない(=示したかった仮説があやまりだろうと考える。)。
　上記では有意水準と確率とを比較したが、これは標本統計量の①推定値自体とその標本統計量の分布の下において有意水準を与えるような値(棄却限界値という。)とを比較することとやっていることは等しい。そこで標本統計量の推定値と棄却限界値(棄却域)とを比較することで仮説の棄却について検討する。
　棄却限界値および棄却域を決めるためには、両側検定をするのか、片側検定をするのかが決まっていないといけない。両側検定を用いるべきときと片側検定を用いるべきときはそれぞれ以下のような場合である：

	両側検定を用いるべきとき：
	(1)分析者が両側の偏りに興味を持つとき
	(2)調査結果(標本)の方向性が想定できないとき
	(3)具体的に特定の値を取るか否かを検討するとき
	片側検定を用いるべきとき：
	(1)分析者が特定の方向に関心があるとき
	(2)具体的に特定の値よりも大きい(小さい)を検討するとき

特段指定が無いのであれば、両側検定をしておくことが望ましい。
　仮説の真偽を検討する際には、第1種の誤りおよび第2種の誤りの発生を検討することになる。

	検定で帰無仮説を採択するか	検定で帰無仮説を棄却するか
仮説の真偽	$H_0$ を採択	$H_0$ を棄却
$H_0$ は真	①正しい判定(確率 $1-\alpha$ )	③第1種の誤り(確率 $\alpha$ )
$H_0$ は偽	②第2種の誤り(確率 $\beta$ )	④正しい判定(確率 $1-\beta$ )

　最も問題になるのは、③帰無仮説 $H_0$ が偽であるのにその帰無仮説 $H_0$ を採択してしまうことで、この第2種の誤りは確率 $\beta$ で生じ、またこれはコントロールできない。

　標本サイズは明確な区分けがあるわけではないが、 $t$ 分布が標準正規分布にほぼ近似できるという観点から、1つの目安として標本サイズが $30$ 以上か否かで判断することがある。より堅確にするには $100$ 以上あるか否かを見るとよい。以下では左記の条件を満たす程大きい標本サイズを持つときを大標本、そうでない場合を小標本と呼ぶこととする。

8.4.1　仮説検定法の分類一覧

	パラメトリック検定	検定内容
	母平均	母平均の比較値との差の $z$ 検定
		母平均の比較値との差の $t$ 検定
		対応の無い2つの母平均の差の $z$ 検定
		対応の無い2つの母平均の差の $t$ 検定
		2つの母平均の差の $\mathrm{Welch}$ の $t$ 検定
		2つの母平均の差の $z$ 検定
		2つの母平均の差の $t$ 検定
	母分散	母分散の比較値との差の $\chi^2$ 検定
		母分散の比の $F$ 検定
		分散分析表の分散比の $F$ 検定
	相関係数・回帰係数	$\mathrm{Pearson}$ の積率相関係数の無相関の $t$ 検定
		母相関係数の比較値との差の $z$ 検定
		偏相関係数の無相関の $t$ 検定
		単回帰における回帰係数の $t$ 検定
	ノンパラメトリック検定	検定内容
	母比率	母比率の比較値との差の $z$ 検定
		母比率の比較値との差の $F$ 検定
		2つの母比率の差の $z$ 検定(対応のないデータ)
		2つの母比率の差の $z$ 検定(対応のある排反データ)
		2つの母比率の差の $z$ 検定(対応のある重複データ)
		比率の差の「 $\mathrm{McNemar}$ 検定」
		比率の差の「 $\mathrm{Cochran}$ の $Q$ 検定」
	適合度	適合度の $\chi^2$ 検定
		1標本 $\mathrm{Kolmogorov}$ - $\mathrm{Smirnov}$ 検定
	独立性	独立性の $\chi^2$ 検定( $m\times n$ 表)
		独立性の $\chi^2$ 検定( $2\times2$ 分割表)
	対応の無い2標本	代表値の差の $\mathrm{Mann}$ - $\mathrm{Whitney}$ の $U$ 検定
		代表値の差の2標本 $\mathrm{Kolmogorov}$ - $\mathrm{Smirnov}$ 検定
	対応のある2標本	代表値の差の $\mathrm{Wilcoxon}$ の符号付順位和検定
	対応の無い $k$ 標本	代表値の差の $\mathrm{Kraskal}$ - $\mathrm{Wallis}$ 検定
	対応のある $k$ 標本	代表値の差の $\mathrm{Friedman}$ 検定
	順位相関係数	$\mathrm{Spearman}$ の順位相関係数の検定
		$\mathrm{Kendall}$ の順位相関係数の検定

8.4.5　対応の無い2つの母平均の差のt検定

　条件

母分散(母標準偏差 $\sigma$ )が未知で小標本*3
各標本の母分散が等しいと見なせる

の双方が満たされる場合に、母平均の差が有意に存在するか( $0$ ではないと言えるか)を検定する。実務上は後者を検証するのに、まず $F$ 検定を行うことが多い。
　具体的に、標本サイズがそれぞれ $n_1,n_2(n_1+n_2\lt100)$ であるような2つの標本 $\boldsymbol{X}_1,\boldsymbol{X}_2$ について、それぞれの標本平均が $\bar{x}_1,\bar{x}_2$ で標本誤差がそれぞれ $s_1,s_2$ だとする。このとき、まず2つの標本の標準偏差 $\sigma_1,\sigma_2$ について、

帰無仮説 $H_0$ ： $\sigma_1^2=\sigma_2^2$
対立仮説 $H_1$ ： $\sigma_1^2\neq\sigma_2^2$

を考える。この検定手法の詳細は後述することとして、ここでは検定統計量 $T_1$

$\begin{aligned} T_1=\displaystyle{\frac{s_2^2}{s_1^2}} \end{aligned}$

が $T_1\sim F(n_1-1,n_2^1)$ に従うことに注意すれば、この検定は両側検定であるから、もし $T_1$ が $F(n_1-1,n_2^1)$ の下側 $100\times\displaystyle{\frac{\alpha}{2}}$ %点未満であれば、帰無仮説を棄却しない、すなわち母分散が異なるとは言い難く、等分散と見なすこととする。
　以降本題に戻って、すなわち等分散だったと仮定して母平均が等しいか否かの仮説検定

帰無仮説 $H_0$ ： $\mu_1=\mu_2$
対立仮説 $H_1$ ： $\mu_1\neq\mu_2$

を考える。このとき検定統計量 $T_2$

$\begin{aligned} T_2=\displaystyle{\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\displaystyle{\frac{1}{n_1}}+\displaystyle{\frac{1}{n_2}}}\sqrt{\displaystyle{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}}}} \end{aligned}$

が自由度 $n_1+n_2-2$ の $t$ 分布に従うことを利用して、自由度 $n_1+n_2-2$ の $t$ 分布の下側 $100\times\displaystyle{\frac{\alpha}{2}}$ %点と $T_2$ を比較し、もし $T_2$ の方が大きければ帰無仮説を棄却する、すなわち $\mu_1$ と $\mu_2$ は有意に差があると考える。

8.4.6　2つの母平均の差の $\mathrm{Welch}$ の $t$ 検定

　条件

母分散(母標準偏差 $\sigma$ )が未知で小標本*4
各標本の母分散が等しいと見なせる

について後者の成立が疑わしい場合、前項で用いた $t$ 検定は利用できない。代わりに $\mathrm{Welch}$ の $t$ 検定を用いる。
　基本的な考え方は同じなので、 $F$ 検定により帰無仮説が棄却できなかった、すなわち2標本の母分散が異なると仮定する。標本サイズがそれぞれ $n_1,n_2(n_1+n_2\lt100)$ であるような2つの標本 $\boldsymbol{X}_1,\boldsymbol{X}_2$ について、それぞれの標本平均が $\bar{x}_1,\bar{x}_2$ で標本誤差がそれぞれ $s_1,s_2$ だとする。このときに仮説検定

帰無仮説 $H_0$ ： $\mu_1=\mu_2$
対立仮説 $H_1$ ： $\mu_1\neq\mu_2$

を考える。検定統計量 $T$

$\begin{aligned} T=\displaystyle{\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\displaystyle{\frac{s_1^2}{n_1}}+\displaystyle{\frac{s_2^2}{n_2}}}}} \end{aligned}$

を考えると、

$\begin{aligned} T\sim t(f),\ f=\displaystyle{\frac{1}{\displaystyle{\frac{C^2}{n_1-1}}+\displaystyle{\frac{(1-C)^2}{n_2-1}}}},\ C=\displaystyle{\frac{\displaystyle{\frac{s_1^2}{n_1}}}{\displaystyle{\frac{s_1^2}{n_1}}+\displaystyle{\frac{s_2^2}{n_2}}}} \end{aligned}$

が成り立つ。
　このとき両側検定であることに注意すれば、 $T$ の従う分布の $100\times\displaystyle{\frac{\alpha}{2}}$ %点と $T$ の値とを比較し、 $T$ の方が大きければ帰無仮説 $H_0$ を棄却、すなわち母平均が異なると考える。

8.4.7　対応のある2つの母平均の差の $z$ 検定

　同一の母集団から得られた同一標本サイズ $n$ (大標本だとする。)を持つ2種類のデータの標本 $\boldsymbol{X},\boldsymbol{Y}$ を考える。これらの母平均の差 $\mu_d=\mu_X,\mu_Y$ に差があるかどうかを調べたい。すなわち

帰無仮説 $H_0$ ： $\mu_d=0$
対立仮説 $H_1$ ： $\mu_d\neq0$

を考える。このとき検定統計量

$\begin{aligned} T&=\displaystyle{\frac{\bar{d}}{\displaystyle{\frac{s_d}{\sqrt{n}}}}}=\displaystyle{\frac{\bar{X}-\bar{Y}}{\displaystyle{\frac{s_d}{\sqrt{n}}}}},\\ s_d&=\displaystyle{\frac{\displaystyle{\sum_{i=1}^{n}(d_i-\bar{d})^2}}{n-1}},\ d_i=X_i-Y_i \end{aligned}$

を考えると、 $T\sim N(0,1)$ であるから、 $z_{\frac{\alpha}{2}}$ を標準正規分布の下側 $100\times\displaystyle{\frac{\alpha}{2}}$ %点と $T$ を比較して $T\gt z_{\frac{\alpha}{2}}$ ならば帰無仮説 $H_0$ を棄却する。

8.4.8　対応のある2つの母平均の差の $t$ 検定

　同一の母集団から得られた同一標本サイズ $n$ (小標本だとする。)を持つ2種類のデータの標本 $\boldsymbol{X},\boldsymbol{Y}$ を考える。これらの母平均の差 $\mu_d=\mu_X,\mu_Y$ に差があるかどうかを調べたい。すなわち

帰無仮説 $H_0$ ： $\mu_d=0$
対立仮説 $H_1$ ： $\mu_d\neq0$

を考える。このとき検定統計量

が $T\sim t(n-1)$ に従うことを用いると、 $t_{\frac{\alpha}{2}}(n-1)$ を自由度 $n-1$ の $t$ 分布の下側 $100\times\displaystyle{\frac{\alpha}{2}}$ %点として、 $t_{\frac{\alpha}{2}}(n-1)$ と $T$ を比較して $T\gt t_{\frac{\alpha}{2}}(n-1)$ ならば帰無仮説 $H_0$ を棄却する。

参考文献

Lehmann, E.L., Casella, George(1998), "Theory of Point Estimation, Second Edition", (Springer)
Lehmann, E.L., Romano, Joseph P.(2005), "Testing Statistical Hypotheses, Third Edition", (Springer)
Sturges, Herbert A.,(1926), "The Choice of a Class Interval", (Journal of the American Statistical Association, Vol. 21, No. 153 (Mar., 1926)), pp. 65-66
Wald, A.,(1950), "Statistical Decision Functions", John Wiley and Sons, New York; Chapman and Hall, London
上田拓治（2009）「44の例題で学ぶ統計的検定と推定の解き方」(オーム社)
大田春外（2000）「はじめよう位相空間」(日本評論社)
小西貞則（2010）「多変量解析入門――線形から非線形へ――」(岩波書店)
小西貞則,北川源四郎（2004）「シリーズ予測と発見の科学2　情報量基準」(朝倉書店)
小西貞則,越智義道,大森裕浩（2008）「シリーズ予測と発見の科学5　計算統計学の方法」(朝倉書店)
佐和隆光（1979）「統計ライブラリー　回帰分析」(朝倉書店)
清水泰隆（2019）「統計学への確率論,その先へ　―ゼロからの速度論的理解と漸近理論への架け橋」(内田老鶴圃)
鈴木武, 山田作太郎（1996）「数理統計学　基礎から学ぶデータ解析」(内田老鶴圃)
竹内啓・編代表（1989）「統計学辞典」(東洋経済新報社)
竹村彰通（1991）「現代数理統計学」(創文社)
竹村彰通（2020）「新装改訂版　現代数理統計学」(学術図書出版社)
東京大学教養学部統計学教室編（1991）「基礎統計学Ⅰ　基礎統計学」(東京大学出版会)
東京大学教養学部統計学教室編（1994）「基礎統計学Ⅱ　人文・社会科学の統計学」(東京大学出版会)
東京大学教養学部統計学教室編（1992）「基礎統計学Ⅲ　自然科学の統計学」(東京大学出版会)
豊田秀樹（2020）「瀕死の統計学を救え！ ―有意性検定から「仮説が正しい確率」へ―」(朝倉書店)
永田靖（2003）「サンプルサイズの決め方」(朝倉書店)
柳川堯（2018）「Ｐ値　その正しい理解と適用」(近代科学社)

*1:同一の母集団から得た異なるデータセットを比較する場合を対応のあるデータと呼び、各データセットが独立した場合が対応の無いデータと呼ぶ。

*2:このような言い回しは、今は連続値を前提としていて、そのために理論的には誤りだが、分かりやすさのために敢えてこのような言い合わしをする。

*3:ここでは両方の標本の標本サイズ合計が $100$ 以下のことを指す。

*4:ここでは両方の標本の標本サイズ合計が $100$ 以下のことを指す。

前回

8. 統計的仮説検定

8.4 具体的な検定問題

8.4.1 仮説検定法の分類一覧

8.4.5 対応の無い2つの母平均の差のt検定

8.4.6 2つの母平均の差のの検定

8.4.7 対応のある2つの母平均の差の検定

8.4.8 対応のある2つの母平均の差の検定