「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。目下、データ分析・語学に力点を置いています。

MENU

計量経済学の基礎(20/22)

 計量経済学を学んでいく。
 まずは

を中心に参照して基礎を学んでいく。

今日のまとめ

  • 従属変数が質的変数と量的変数の両方からなる場合、分布の形状が変わり、条件付き期待値は無条件の期待値よりも大きくなる。従属変数の取る値がある一定の領域に限られているとき、その従属変数は切断されているという。
  • 切断された従属変数を扱うためのモデルには、潜在変数をY^{*}とし、観測値YY^{*}に以下の関係がある
    \begin{aligned}Y_i^{*}&=\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i,i=1,2,\cdots,n\\\varepsilon_i&\sim N(0,\sigma^2),\\\\Y_i&=\begin{cases}Y_i^{*},&Y_i^{*}\gt0\\0,&Y_i^{*}\leq0\end{cases}\end{aligned}
    モデルがあり、これをTobitモデルと呼ぶ。
  • Tobitモデルの推定には最尤法を用いる。

13. 切断された従属変数

 本節では従属変数が質的変数と量的変数の両方からなる場合を考える。このとき線形回帰モデルは適用できない。
 従属変数がある一定の領域に取る値が限られているとき、その従属変数は切断されていると呼ぶ。たとえば非負の値を取るとき、ゼロで切断されているという。

13.1 切断された正規分布

 平均が\muであるような無作為標本Yについて以下のような条件


\begin{aligned}
Y&\gt a\Longrightarrow Yはそのままの値とする\\
&\leq a\Longrightarrow Yは値を不明とし、左記条件を満たすことのみが分かる
\end{aligned}

を与えるものとする。
 Yの分布関数および密度関数をそれぞれF_Y(y),f_Y(y)とすると、上記条件を満たす標本の密度関数\hat{f}_Y(y)は、切断されなかった領域について\displaystyle{\int_a^{\infty}f_Y(y)}dy=1-F_Y(a)が成り立つことに注意すれば


\begin{aligned}
\hat{f}_Y(y)=\displaystyle{\frac{f_Y(y)}{1-F_Y(a)}},y\gt a
\end{aligned}

である。
 切断された分布の条件付き期待値は


\begin{aligned}
E[Y|Y\gt a]=\displaystyle{\int_{a}^{\infty}\frac{y f_Y(y)}{1-F_Y(a)}}dy
\end{aligned}

で得られる。これについて


\begin{aligned}
E[Y]=\mu=E[Y|Y\gt a]P\{Y\gt a\}+E[Y|Y\leq a]P\{Y\leq a\}
\end{aligned}

およびE[Y|Y\leq a]\lt\muより、


\begin{aligned}
E[Y]=\mu&=E[Y|Y\gt a]P\{Y\gt a\}+E[Y|Y\leq a]P\{Y\leq a\}\\
&\lt E[Y|Y\gt a]P\{Y\gt a\}+\mu P\{Y\leq a\}\\
\therefore\ &\mu\lt E[Y|Y\gt a]P\{Y\gt a\}+\mu P\{Y\leq a\}\\
\Leftrightarrow& \mu\lt E[Y|Y\gt a]P\{Y\gt a\}+\mu P\{Y\leq a\}\\
\Leftrightarrow& (1-P\{Y\leq a\})\mu\lt E[Y|Y\gt a]P\{Y\gt a\}\\
\Leftrightarrow& P\{Y\gt a\}\mu\lt E[Y|Y\gt a]P\{Y\gt a\}\\
\Leftrightarrow& E[Y|Y\gt a]\gt\mu\\
\end{aligned}

すなわち条件付き期待値は無条件の期待値よりも大きくなる。

13.2 Tobitモデル

 潜在変数をY^{*}とし、観測値YY^{*}に以下の関係があるものとする:


\begin{aligned}
Y_i^{*}&=\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i,i=1,2,\cdots,n\\
\varepsilon_i&\sim N(0,\sigma^2),\\
\\
Y_i&=\begin{cases}
Y_i^{*},&Y_i^{*}\gt0\\
0,&Y_i^{*}\leq0
\end{cases}
\end{aligned}

とする。このモデルはTobitモデルと呼ばれる。
 ここでの興味は母数(\alpha,\boldsymbol{\beta})および分散\sigma^2である。
 観測値が0となる確率は


\begin{aligned}
P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}&=P\{Y_i^{*}\leq0|{}^{t}\boldsymbol{X}_i\}=P\{\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i\leq0|{}^{t}\boldsymbol{X}_i\}\\
&=P\{\varepsilon_i\leq-\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}|{}^{t}\boldsymbol{X}_i\}\\
&=F_Y(-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta})
\end{aligned}

である。したがって\Phi(\cdot)を標準正規分布として


\begin{aligned}
P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}=\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)
\end{aligned}

である。
 このとき


\begin{aligned}
E[Y_i|Y_i^{*}\gt0,\boldsymbol{X}]&=E[\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i|\varepsilon_i\gt-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}]\\
&=\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+E[\varepsilon_i|\varepsilon_i\gt-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}]
\end{aligned}

である。最右辺にある\varepsilon_iの条件付き期待値は正を取る。
 さらに\boldsymbol{\beta}が正ならば条件付き期待値と{}^{t}\boldsymbol{X}_iの相関は負になる。
 すべてのYの観測値に関する期待値は


\begin{aligned}
E[Y_i|{}^{t}\boldsymbol{X}_i]=&E[Y_i|Y_i=0,{}^{t}\boldsymbol{X}_i]P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}\\
&+E[Y_i|Y_i\gt0,{}^{t}\boldsymbol{X}_i]P\{Y_i\gt0|{}^{t}\boldsymbol{X}_i\}\\
=&E[Y_i|Y_i\gt0,{}^{t}\boldsymbol{X}_i]P\{Y_i\gt0|{}^{t}\boldsymbol{X}_i\}\\
=&(\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+E[\varepsilon_i|\varepsilon_i\gt-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}])\left(1-\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)\right)
\end{aligned}

であり、切断された標本の期待値よりも小さくなる。

13.3 推定方法

 Tobitモデルの推定に最小二乗法は利用できない。すべての観測値を用いた場合も、負値を取った場合の値を除外した場合も、推定量はバイアスを持つ。
 そこでTobitモデルの推定では最尤法を用いる。\varepsilon_i\sim N(0,\sigma^2)より


\begin{aligned}
f_Y(y)=\displaystyle{\frac{1}{\sigma}\varphi\left(\displaystyle{\frac{y-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)}
\end{aligned}

である。P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}=\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)だから尤度関数は


\begin{aligned}
L(\alpha,\boldsymbol{\beta},\sigma)=\displaystyle{\prod_{Y_i\gt0}\frac{1}{\sigma}\phi\left(\displaystyle{\frac{Y_i-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)}\displaystyle{\prod_{Y_i\gt0}\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)}
\end{aligned}

となる。これを最大化させるようなものとして\alpha,\boldsymbol{\beta},\sigma最尤推定量を得る。

13.4 Tobitモデルの限界

 Tobitモデルでは攪乱項についての想定として①正規性、②均一分散性が崩れれば推定が上手くいかなくなる。具体的には最尤推定量が一致性をもたなくなる。またすべての検閲された標本を含むモデルにTobitモデルを導入することはできない。また従属変数が一定の(作為的な)メカニズムで切断されることで起こされる回帰のバイアスは選択により偏りと呼ばれる。

プライバシーポリシー お問い合わせ