「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。データ分析・語学に力点を置いています。 →現在、コンサルタントの雛になるべく、少しずつ勉強中です(※2024年1月21日改訂)。

MENU

計量経済学の基礎(21/22)

 計量経済学を学んでいく。
 まずは

を中心に参照して基礎を学んでいく。

今日のまとめ

  • 時系列方向に複数あり、さらに各1時点に複数のデータが存在する(クロスセクション)ようなデータセットパネルデータという。
  • パネルデータでは系列相関とクロスセクション方向での相関の2つを考える必要があり、それに応じて利用する回帰モデルを変える必要がある。
  • 個人効果が(クロスセクションでの相関)が無ければ古典的回帰モデルに帰着する。そうでなければ個人効果が説明変数と相関があれば固定効果モデル、無ければランダム効果モデルを用いればよい。

14. パネルデータ

 時系列方向に複数あり、さらに各1時点に複数のデータが存在する(クロスセクション)ようなデータセットパネルデータという。パネルデータを用いて推定する際の課題はクロスセクションでの際と時系列での構造変化とをどのようにモデルに反映させ、どのような有効推定量を導き、適切な仮説検定を導入するのかである。


パネルデータのイメージ

        時点         
       
1
2
\cdots
T
    個人
1
Y_{11} Y_{12} \cdots Y_{1T}
     
2
Y_{21} Y_{22} \cdots Y_{2T}
     
3
Y_{1} Y_{32} \cdots Y_{3T}
     
\vdots
\vdots \vdots \cdots \vdots
     
i
Y_{i1} Y_{i2} \cdots Y_{iT}
     
\vdots
\vdots \vdots \cdots \vdots
     
n
Y_{n1} Y_{n2} \cdots Y_{nT}

 重回帰モデルY=\beta_0+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilonにおいて

   (1) 係数ベクトル(\beta_0,\boldsymbol{\beta})が変化しない。
   (2) 定数項\beta_0は個人間(クロスセクション)で相違するものの、係数ベクトル\boldsymbol{\beta}は変化しない。
   (3) 定数項\beta_0は時系列および個人間(クロスセクション)で相違するものの、係数ベクトル\boldsymbol{\beta}は変化しない。
   (4) すべての時系列または個人間(クロスセクション)の一方で係数ベクトル(\beta_0,\boldsymbol{\beta})が変化する。
   (5) 時系列および個人間(クロスセクション)で係数ベクトル(\beta_0,\boldsymbol{\beta})が変化する。

となる場合が考えられ、ここでは(1)-(3)を扱う。

14.1 分散要素モデル

 (1)-(3)の場合をまとめたモデルは


\begin{aligned}
Y_{it}=\beta_0+{}^{t}\boldsymbol{X}_{it}\boldsymbol{\beta}+u_{it},\ i=1,2,\cdots,n,t=1,2,\cdots,T
\end{aligned}

と記述できる。
 攪乱項u_{it}を個人に固有な要因(個人効果\mu_i)、期間tに固有な要因(期間効果\lambda_t)およびその他の要因\varepsilon_{it}に分ける場合、すなわち


\begin{aligned}
u_{it}=\mu_i+\lambda_t+\varepsilon_{it}
\end{aligned}

を3要素モデルといい、一般に分散要素モデルという。
 以降では、期間効果のみ無いと仮定する、すなわち


\begin{aligned}
Y_{it}&=\beta_0+{}^{t}\boldsymbol{X}_{it}\boldsymbol{\beta}+u_{it},\ i=1,2,\cdots,n,t=1,2,\cdots,T,\\
u_{it}&=\mu_i+\varepsilon_{it}
\end{aligned}

と表す。また攪乱項に以下の仮定を置く:

   (1) その他の攪乱項\varepsilon_{it} 相互に独立かつ分散は均一だとする。
     E[\varepsilon_{it}]=0
     V[\varepsilon_{it}]=\sigma_{\varepsilon}^2
     \mathrm{Cov}[\varepsilon_{it},\varepsilon_{js}]=0,i\neq j,t\neq s
   (2) 個人効果\mu_{i} 期待値は0で、他の個人効果および\varepsilon_{it}が無相関だと

する。
     E[\mu_i]=0
     V[\mu_i]=\sigma_{\mu}^2
     \mathrm{Cov}[\mu_i,\mu_j]=0,i\neq j
     \mathrm{Cov}[\mu_i,\varepsilon_{it}]=0

 このとき


\begin{aligned}
V[u_{it}]&=V[\mu_i+\varepsilon_{it}]=\sigma_{\mu}^2+\sigma_{\varepsilon}^2\\
\mathrm{Cov}[u_{it},u_{js}]&=0,i\neq j,\\
\mathrm{Cov}[u_{it},u_{is}]&=\mathrm{Cov}[\mu_i+\varepsilon_{it},\mu_j+\varepsilon_{js}]=\sigma_{\mu}^2,t\neq s
\end{aligned}

が成り立つ。すなわち攪乱項の分散は均一で、異なった個人間における攪乱項の共分散は0、そして同一個人の異時点間の攪乱項の共分散は正かつ一定となる。
 モデルをベクトル表示すれば


\begin{aligned}
\boldsymbol{Y}&=\boldsymbol{X}\boldsymbol{\beta}+\boldsymbol{u},\\
\boldsymbol{Y}_i&=\begin{bmatrix}Y_{i1}\\Y_{i2}\\\vdots\\Y_{iT}\end{bmatrix}\in\mathbb{R}^{T},\\
\boldsymbol{Y}&=\begin{bmatrix}\boldsymbol{Y}_{1}\\\boldsymbol{Y}_{2}\\\vdots\\\boldsymbol{Y}_{n}\end{bmatrix}\in\mathbb{R}^{nT},\\
\boldsymbol{X}&=\begin{bmatrix}
X_{10}&X_{11}&\cdots&X_{1(k-1)}\\
X_{20}&X_{21}&\cdots&X_{2(k-1)}\\
\vdots&\vdots&&\vdots\\
X_{(i\cdot t)0}&X_{(i\cdot t)1}&\cdots&X_{(i\cdot t)(k-1)}\\
\vdots&\vdots&&\vdots\\
X_{(nT)0}&X_{(nT)1}&\cdots&X_{(nT)(k-1)}
\end{bmatrix}\in\mathbb{R}^{nT\times k},\\
\boldsymbol{\beta}&=\begin{bmatrix}
\beta_0\\\beta_1\\\vdots\\\beta_{k-1}
\end{bmatrix}\in\mathbb{R}^{k},\\
\boldsymbol{u}&=\begin{bmatrix}
u_{1}\\
u_{2}\\
\vdots\\
u_{i\cdot t}\\
\vdots\\
u_{nT}
\end{bmatrix}\in\mathbb{R}^{nT}
\end{aligned}

である。このとき


\begin{aligned}
\mathbb{V}[\boldsymbol{u}]&=\begin{bmatrix}
\Sigma^{*}&\boldsymbol{O}&\cdots&\boldsymbol{O}\\
\boldsymbol{O}&\Sigma^{*}&\boldsymbol{O}&\vdots\\
\vdots&\cdots&\ddots&\boldsymbol{O}\\
\boldsymbol{O}&\cdots&\boldsymbol{O}&\Sigma^{*}
\end{bmatrix},\\
\Sigma^{*}&=\begin{bmatrix}
\sigma_{\mu}^2&\sigma_{\mu}^2&\cdots&\sigma_{\mu}^2\\
\sigma_{\mu}^2&\sigma_{\mu}^2&\cdots&\vdots\\
\vdots&\cdots&\ddots&\sigma_{\mu}^2\\
\sigma_{\mu}^2&\cdots&\sigma_{\mu}^2&\sigma_{\mu}^2\\
\end{bmatrix}+\begin{bmatrix}
\sigma_{\varepsilon}^2&0&\cdots&0\\
0&\sigma_{\varepsilon}^2&\cdots&\vdots\\
0&\cdots&\ddots&\vdots\\
0&\cdots&0&\sigma_{\varepsilon}^2
\end{bmatrix}
\end{aligned}

で与えられる。
 もしくは個人効果をパラメータと見なして


\begin{aligned}
\boldsymbol{Y}&=\boldsymbol{X}\boldsymbol{\beta}+\boldsymbol{D}\boldsymbol{\mu}+\boldsymbol{\varepsilon},\\
\boldsymbol{D}&=\begin{bmatrix}
\boldsymbol{1}&0&\cdots&0\\
0&\boldsymbol{1}&\cdots&\vdots\\
0&\cdots&\ddots&\vdots\\
0&\cdots&0&\boldsymbol{1}
\end{bmatrix},\\
\boldsymbol{1}&=\begin{bmatrix}
1\\
1\\
\vdots\\
1
\end{bmatrix}\in\mathbb{R}^{T}
\end{aligned}

14.2 ダミー変数による推定

 ダミー変数を用いたモデル表現は古典的回帰モデルと解釈することもできる。その場合、\boldsymbol{Y}\boldsymbol{X},\boldsymbol{D}に回帰すればよい。この場合の推定量を固定効果推定量、またはダミー変数を用いた最小二乗法(LSDV推定量)と呼ぶ。
 LSDV推定量は簡便な方法で推定値を得ることができ、個人について一定の変数が観測できなくとも期間中変動する変数のパラメータが推定できる。一方で、説明変数に個人へ一定の効果を与えるものがある場合にダミー変数がその効果を吸収すること、不偏ではあるものの有効推定量ではないこと、個人のデータ数が多く、推定対象が多すぎて物理的に計算が困難なことがある。

 ダミー変数の使用を避ける実際的な方法は、\boldsymbol{Y},\boldsymbol{X}をまず\boldsymbol{D}に回帰し、その後に得られた\boldsymbol{Y}の残差を\boldsymbol{X}の残差に回帰する方法である。この推定量は個人の内部変動データから得られるため、内部変動からの回帰と呼ぶ。
 個人平均からの偏差を\tilde{}を用いて表すことにすれば、モデルは


\begin{aligned}
\tilde{\boldsymbol{Y}}=\tilde{\boldsymbol{X}}\boldsymbol{\beta}+\boldsymbol{u}
\end{aligned}

と書ける。
 個人平均からの偏差から構成されるモーメントを\boldsymbol{W}_{XX}={}^{t}\tilde{\boldsymbol{X}}\tilde{\boldsymbol{X}},\boldsymbol{W}_{XY}={}^{t}\tilde{\boldsymbol{X}}\tilde{\boldsymbol{Y}}で表すことにするとこの推定量


\begin{aligned}
\boldsymbol{\beta}_{W}={\boldsymbol{W}_{XX}}^{-1}\boldsymbol{W}_{XY}
\end{aligned}

で与えられる。
 内部変動からの回帰による推定量は個人の平均から測ったデータを用いるため、N人の個人平均の情報は推定に活かされていない。そのため以下のような推定を行う。まず個人について観測期間内の平均を取ることでN個のデータが得られる。個人平均についてのモデルは以下で書くことができる:


\begin{aligned}
\bar{Y}_i&=\beta_0+{}^{t}\bar{\boldsymbol{X}}_i\boldsymbol{\beta}+\bar{u}_i,i=1,\cdots,N,\\
\bar{Y}_i&=\displaystyle{\sum_{t=1}^{T}\frac{Y_{it}}{T}},\ \bar{\boldsymbol{X}}_i=\displaystyle{\sum_{t=1}^{T}\frac{\boldsymbol{X}_{it}}{T}},\\
\bar{u}_i&=\displaystyle{\sum_{t=1}^{T}\frac{u_{it}}{T}}=\mu_i+\displaystyle{\sum_{t=1}^{T}\frac{\varepsilon_{it}}{T}},
\end{aligned}
 ベクトル表示すれば

\begin{aligned}
\bar{\boldsymbol{Y}}&=\bar{\boldsymbol{X}}+\bar{\boldsymbol{u}},\\
\bar{\boldsymbol{Y}}&=\begin{bmatrix}\bar{Y}_1\\\bar{Y}_2\\\cdots\\\bar{Y}_N\end{bmatrix},\\
\bar{\boldsymbol{X}}&=\begin{bmatrix}\bar{X}_1\\\bar{X}_2\\\cdots\\\bar{X}_N\end{bmatrix},\\
\bar{\boldsymbol{u}}&=\begin{bmatrix}\bar{u}_1\\\bar{u}_2\\\cdots\\\bar{u}_N\end{bmatrix}
\end{aligned}

である。このとき攪乱項\bar{u}_iは個人間で独立で分散は均一であり、その値は


\begin{aligned}
V[\bar{u}_i]=\sigma_{\mu}^2+\displaystyle{\frac{\sigma_{\varepsilon}^2}{T}}
\end{aligned}

である。したがって攪乱項\bar{u}_iが説明変数と無相関ならばこのモデルは古典的回帰モデルの仮定を満たす。
 個人間のデータからのモーメントを\boldsymbol{B}_{XX}={}^{t}\tilde{\boldsymbol{X}}\tilde{\boldsymbol{X}},\boldsymbol{B}_{XY}={}^{t}\tilde{\boldsymbol{X}}\tilde{\boldsymbol{Y}}で表すことにするとこの推定量


\begin{aligned}
\boldsymbol{\beta}_{B}={\boldsymbol{B}_{XX}}^{-1}\boldsymbol{B}_{XY}
\end{aligned}

で与えられる。これはBetween推定量と呼ばれる。

14.3 一般化最小二乗法による推定(GLS)

 前節で与えた2つの推定量は有効推定量ではない。一方でもし個人効果が説明変数と無相関ならば、モデルは一般化古典的回帰モデルになり、一般化最小二乗推定量が有効推定量になる。
 一般にGLSEは


\begin{aligned}
\hat{\boldsymbol{\beta}}_{\mathrm{GLS}}=({}^t\boldsymbol{X}\Sigma^{-1}\boldsymbol{X})^{-1}{}^t\boldsymbol{X}\Sigma^{-1}\boldsymbol{Y}
\end{aligned}

で与えられる。またその分散は


\begin{aligned}
\mathbb{V}[\hat{\boldsymbol{\beta}}_{\mathrm{GLS}}]=({}^t\boldsymbol{X}\Sigma^{-1}\boldsymbol{X})^{-1}
\end{aligned}

である。ここで


\begin{aligned}
\Sigma=\begin{bmatrix}
\Sigma^{*}&O&\cdots&\cdots&O\\
O&\Sigma^{*}& & &\vdots\\
\vdots& &\ddots& &\vdots\\
\vdots& & &\Sigma^{*}&O\\
O&\cdots&\cdots&O&\Sigma^{*}
\end{bmatrix}
\end{aligned}

である。
 \Sigma^{*}=\sigma_{\varepsilon}^2 I+\sigma_{\mu}^2\boldsymbol{1}{}^{t}\boldsymbol{1}であり、その逆行列


\begin{aligned}
\Sigma^{*-1}=\displaystyle{\frac{1}{\sigma_{\varepsilon}^2}}\left(I-\displaystyle{\frac{\sigma_{\mu}^2}{\sigma_{\varepsilon}^2+T\sigma_{\mu}^2}}\boldsymbol{1}{}^{t}\boldsymbol{1}\right)
\end{aligned}

で与えられる。したがって\Sigma逆行列


\begin{aligned}
\Sigma^{-1}=\begin{bmatrix}
\Sigma^{*-1}&O&\cdots&\cdots&O\\
O&\Sigma^{*-1}& & &\vdots\\
\vdots& &\ddots& &\vdots\\
\vdots& & &\Sigma^{*-1}&O\\
O&\cdots&\cdots&O&\Sigma^{*-1}
\end{bmatrix}
\end{aligned}

である。
 GLSEは上記\Sigma^{-1}を推定量に代入すれば計算できる。他にも


\begin{aligned}
\hat{\boldsymbol{\beta}}_{\mathrm{GLS} }&=(\boldsymbol{W}_{XX}+\theta T\boldsymbol{B}_{XX})^{-1}(\boldsymbol{W}_{XY}+\theta T\boldsymbol{B}_{XY}),\\
\theta&=\displaystyle{\frac{\sigma_{\varepsilon}^2}{\sigma_{\varepsilon}^2+T\sigma_{\mu}^2}},0\leq\theta\leq1
\end{aligned}

であり、


\begin{aligned}
\hat{\boldsymbol{\beta}}=(\boldsymbol{W}_{XX}+\theta T\boldsymbol{B}_{XX})^{-1}(\boldsymbol{W}_{XX}\boldsymbol{\beta}_{W}+\theta T\boldsymbol{B}_{XX}\hat{\boldsymbol{\beta}}_{B})
\end{aligned}

が成り立つ。これは有効推定量が前述した2つの推定量で表すことができることを意味する。

14.4 分散要素の推定

 実行可能な一般化最小二乗推定値を求めるには\sigma_{\varepsilon}^2,\sigma_{\mu}^2を推定する必要がある。
 分散要素モデルは個人効果\muを興味のある母数と見なせば古典的回帰モデルと解釈できる。攪乱項の分散は\sigma_{\varepsilon}^2で、その不偏推定量は残差二乗和を自由度NT-N-k+1で割ることにより得られる。kは行列Xの定数項を含めた列数を表す。
 内部変動からの回帰モデルにより得た残差


\begin{aligned}
\boldsymbol{e}_{W}=\tilde{\boldsymbol{Y}}-(\tilde{\boldsymbol{X}}\hat{\boldsymbol{\beta}}_{W})
\end{aligned}

を用いて


\begin{aligned}
\hat{\sigma}_{\varepsilon}^2=\displaystyle{\frac{{}^{t}\boldsymbol{e}_{W}\boldsymbol{e}_{W}}{NT-N-k+1}}
\end{aligned}

で得られる。
 一方で個人平均のデータについてのモデルも個人効果と説明変数が無相関ならば古典的回帰モデルと解釈でき、攪乱項の不偏分散は残差二乗和を自由度N-kで割ればよい。
 個人平均からの回帰モデルで得た残差


\begin{aligned}
\boldsymbol{e}_B=\bar{\boldsymbol{Y}}-\bar{\boldsymbol{X}}\boldsymbol{\beta}_{B}
\end{aligned}

を用いて攪乱項の分散\sigma_{\mu}^2+\displaystyle{\frac{\sigma_{\varepsilon}^2}{T}}の推定量\hat{\sigma}^2


\begin{aligned}
\hat{\sigma}^2=\displaystyle{\frac{{}^{t}\boldsymbol{e}_B\boldsymbol{e}_B}{N-k}}
\end{aligned}

であるから、


\begin{aligned}
\hat{\sigma}_{\mu}^2=\displaystyle{\frac{{}^{t}\boldsymbol{e}_B\boldsymbol{e}_B}{N-k}}-\displaystyle{\frac{\hat{\sigma}_{\varepsilon}^2}{T}}
\end{aligned}

である。

14.5 固定効果とランダム効果

 分散要素モデルには合計3種類の推定量が出てくる。分散要素モデルは一般化古典的回帰モデルであるから一見最も望ましいものの、攪乱項と説明変数に相関があった場合、バイアスが生じる。
 内部変動からの回帰では個人効果を個人ダミーの係数として扱うため、攪乱項と説明変数の相関は0である。したがって同回帰では相関に拘わらずに不変である。一方で個人平均についてのモデルでは個人効果の影響を排除できない。一般化最小二乗推定量はこれらの結合で表されるから、個人平均についてのモデルによる推定量からバイアスを受けることとなる。まとめれば、個人効果が説明変数と無相関、これを個人効果がランダムという、ならば一般化最小二乗モデルを用いればよい。一方で個人効果が説明変数と相関するならば、これを個人効果を固定効果として扱い、内部変動からの回帰による推定量を用いればよい。
 攪乱項の個人効果と説明変数の相関は次章で扱う。

14.6 モデル選択・推定の手順

 モデル\boldsymbol{Y}=\boldsymbol{X}\boldsymbol{\beta}+\boldsymbol{D}\boldsymbol{\mu}+\boldsymbol{\varepsilon}をベースに以下を考える:

   (1) ステップ1 個人効果は存在するか?
   仮説検定H_0:\boldsymbol{\mu}=\boldsymbol{0}\ v.s.\ H_1:\boldsymbol{\mu}\neq\boldsymbol{0}

行えばよい。これはF検定に帰着できる。もし帰無仮説

棄却されればステップ2に移る。そうでなければ古典的

回帰モデルへ移ればよい。
   (2) ステップ2 個人効果は説明変数と無相関か?
   帰無仮説H_0:\mathrm{Cov}[\boldsymbol{\mu},\boldsymbol{X}]を特定化テストで検定すれば

よい。帰無仮説が棄却されれば固定効果モデルを採用

する。そうでなければ固定効果モデルを採用する。
プライバシーポリシー お問い合わせ