計量経済学を学んでいく。
まずは
を中心に参照して基礎を学んでいく。
今日のまとめ
15. 特定化のテスト
今まで学んできたことを踏まえると、回帰モデルで分析する場合、説明変数と攪乱項の系列・クロスセクション相関など、モデル構造に関する仮定を検証する必要性があることが分かる。ここでは説明変数と攪乱項の相関を検定する手法を取り扱う。以降、帰無仮説としてを設定する。
15.1 特定化の検定
前節で述べたように、個人効果(攪乱項)と説明変数に相関があれば固定効果モデルを、そうでなければランダム効果モデルを取り扱う。これは相関があればランダム効果モデルの推定量(および一般化最小二乗推定量)にバイアスが発生するからであった。
これに着想して、帰無仮説が棄却されない場合には不偏であるもののそうでない場合にはバイアスが発生する推定量と特定化の帰無仮説の真偽に拘わらず不偏な推定量が存在する仮定するとき、もし帰無仮説が棄却されるならば、2つの推定量は異なる値へ確率収束するはずである。したがって両者に有意な差が無いならば帰無仮説は棄却できないと考えられる。
具体的には、特定化の検定では次元母数ベクトルをとし、帰無仮説の下での有効推定量としてをまず推定する。このときもう1つの不偏推定量との差の分散は推定量の分散の差がとなる。
15.2 有効推定量と不偏推定量の共分散
有効推定量ともう1つの不偏推定量の性質を調べる。まず両者とも不偏であるから、
である。または有効であるから、任意の不偏推定量の中で最も分散が小さい、すなわち
が成り立つ。ここで不等号は全成分についてその不等号が成り立つことを意味する。
したがって
が成り立つ。
またこの条件下でが漸近的に次元正規分布に従うとき、
は漸近的に自由度のカイ二乗分布に従う。
15.3 Hausman検定
帰無仮説が棄却できなければの差は小さく統計量も小さくなるはずである。したがって検定には片側検定を用いる。その一致推定量を用いても上述した漸近分布に関する定理は成り立つ。したがって特定化の検定は次の手続きで行うことができる。
(1) | ステップ1 | |
帰無仮説の下での有効推定量とその分散共分散行列の推定値を計算する。 | ||
(2) | ステップ2 | |
帰無仮説の真偽にかかわらず不偏性をもつ推定量とその分散共分散行列の推定値を計算する。 | ||
(3) | ステップ3 | |
検定量を計算する。その値が自由度のカイ二乗分布の限界値を超えるならば帰無仮説を棄却する。 |
15.4 モデル選択
説明変数の組み合わせや関数形などに複数の候補がある場合、どのモデルを構築すべきかが問題になる。これをモデル選択という。
モデル選択には2つのアプローチがある。1つはデータの当てはまりや予測能力などを測る指標からその値を最も大きくなるモデルを選ぶ手法である。このアプローチでは決定的な指標が存在しない点が課題である。またそのような最大の値をもたらすモデルが必ずしも満足するものになるとは限らない。
もう一つの方法は対立するモデルの推定結果について仮説検定をしながらモデルの妥当性を判断するものである。選択対象モデルが入れ子型ならば通常の検定や検定で選択できる。他方で非入れ子型ならば別の方法を検討する。
15.5 入れ子型仮説
2つのモデル
を考える。モデルの選択にはモデルを推定し、の係数という帰無仮説について検定を行う。もしくはモデルを推定し残差二乗和から検定を行う。帰無仮説が棄却されればモデル、棄却されなければモデルが選択される。またモデルでにが影響しないという仮説は
を推定しモデルの結果と比べることでテストできる。
仮説がより一般的なモデルの特殊ケースとなる場合、検定または検定でテストが行え、それに基づきモデル選択ができた。このようにモデル同士を比較できる仮説が書ける場合は入れ子型仮説と呼ばれる。
15.6 非入れ子型仮説
を説明数複数のモデル候補があるときにそれぞれの説明変数が共通とならない組み合わせがあり得る。すなわち
で、には両方に含まれる成分(説明変数)とそれぞれにしか含まれない成分(説明変数)があるものとする。このような仮説の関係は非入れ子型という。
15.6.1 非入れ子型F検定
モデルを選択する場合の1つの方法としては2つを混合したモデルを推定することが考えられる。モデルに含まれるがに含まれない説明変数を、逆にモデルにのみ含まれる説明変数を、両方に入る説明変数をとする。そしてこれらを混合したモデル
を考える。もしモデルでならばモデルモデルでならばモデルを採用する。このような検定を非入れ子型検定と呼ぶ。
非入れ子型検定には複数の問題点がある。
(1) | もしが多重共線の関係にあると誤判断を起こす蓋然性が高くなる。 | |
(2) | モデルのいずれを起点にするかで結果が変わり得る。 | |
(3) | モデルを比較している訳ではない。 | |
(4) | 実際上、モデルの説明変数の数が多くなり、多重共線が起こりやすい。 |
15.6.2 Davidson-MacKinnon検定
非入れ子型検定の問題点を解決する手法としてDavidson-MacKinnon検定がある。
モデルを検定対象とし、以下の手続きを取る:
ステップ1 | モデルを最小二乗法にて推定する。でモデルの予測値を計算する。 | |
ステップ2 | モデルを推定し、仮説を検定する。 |
仮説が棄却されなければモデルはモデルにより棄却されない。
検定のアイディアは次のとおりである。2つのモデルを結合したモデル
を考える。ここでがのいずれなのかを検定すればよい。直接的にを推定できないものの、をに置き換えて推定すればよいことが知られている。さらにが漸近的にに従うことが知られている。このような手続をJ検定と呼ぶ。
15.6.3 J検定と予測
J検定は予測精度の比較からモデルを選択していると解釈することもできる。
2つのモデルから2つの予測値が得られているとする。これらを結合すればより良い予測が得られるはずである。すなわち
とし予測誤差をとなる。これから
が得られる。モデルの予測を取り入れることにより予測誤差が有意に減少するならばモデルの推定値は有意になる。この手法をモデルの予測を用いてモデルを検定することもできる。
15.6.4 J検定の限界
J検定では両方のモデルを共に棄却する場合やともに受容する場合があり得る。前者は両モデルとも説明力が不充分であることを意味する。後者はどちらのモデルでも説明でき、両者の良し悪しを決定できないことを意味する。これらの場合「このデータからは結論が出せない」との結論を出すのが無難である。