計量経済学の基礎（20/22） - 「大人の教養・知識・気付き」を伸ばすブログ

　計量経済学を学んでいく。
　まずは

計量経済学 (y21)

作者:皙, 浅野,二朗, 中村
有斐閣

Amazon

を中心に参照して基礎を学んでいく。

前回

power-of-awareness.com

今日のまとめ

従属変数が質的変数と量的変数の両方からなる場合、分布の形状が変わり、条件付き期待値は無条件の期待値よりも大きくなる。従属変数の取る値がある一定の領域に限られているとき、その従属変数は切断されているという。

切断された従属変数を扱うためのモデルには、潜在変数を $Y^{*}$ とし、観測値 $Y$ と $Y^{*}$ に以下の関係がある
$\begin{aligned}Y_i^{*}&=\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i,i=1,2,\cdots,n\\\varepsilon_i&\sim N(0,\sigma^2),\\\\Y_i&=\begin{cases}Y_i^{*},&Y_i^{*}\gt0\\0,&Y_i^{*}\leq0\end{cases}\end{aligned}$
モデルがあり、これをTobitモデルと呼ぶ。

Tobitモデルの推定には最尤法を用いる。

前回
今日のまとめ
13.　切断された従属変数
次回

13.　切断された従属変数

　本節では従属変数が質的変数と量的変数の両方からなる場合を考える。このとき線形回帰モデルは適用できない。
　従属変数がある一定の領域に取る値が限られているとき、その従属変数は切断されていると呼ぶ。たとえば非負の値を取るとき、ゼロで切断されているという。

13.1　切断された正規分布

　平均が $\mu$ であるような無作為標本 $Y$ について以下のような条件

$\begin{aligned} Y&\gt a\Longrightarrow Yはそのままの値とする\\ &\leq a\Longrightarrow Yは値を不明とし、左記条件を満たすことのみが分かる \end{aligned}$

を与えるものとする。
　 $Y$ の分布関数および密度関数をそれぞれ $F_Y(y),f_Y(y)$ とすると、上記条件を満たす標本の密度関数 $\hat{f}_Y(y)$ は、切断されなかった領域について $\displaystyle{\int_a^{\infty}f_Y(y)}dy=1-F_Y(a)$ が成り立つことに注意すれば

$\begin{aligned} \hat{f}_Y(y)=\displaystyle{\frac{f_Y(y)}{1-F_Y(a)}},y\gt a \end{aligned}$

である。
　切断された分布の条件付き期待値は

$\begin{aligned} E[Y|Y\gt a]=\displaystyle{\int_{a}^{\infty}\frac{y f_Y(y)}{1-F_Y(a)}}dy \end{aligned}$

で得られる。これについて

$\begin{aligned} E[Y]=\mu=E[Y|Y\gt a]P\{Y\gt a\}+E[Y|Y\leq a]P\{Y\leq a\} \end{aligned}$

および $E[Y|Y\leq a]\lt\mu$ より、

$\begin{aligned} E[Y]=\mu&=E[Y|Y\gt a]P\{Y\gt a\}+E[Y|Y\leq a]P\{Y\leq a\}\\ &\lt E[Y|Y\gt a]P\{Y\gt a\}+\mu P\{Y\leq a\}\\ \therefore\ &\mu\lt E[Y|Y\gt a]P\{Y\gt a\}+\mu P\{Y\leq a\}\\ \Leftrightarrow& \mu\lt E[Y|Y\gt a]P\{Y\gt a\}+\mu P\{Y\leq a\}\\ \Leftrightarrow& (1-P\{Y\leq a\})\mu\lt E[Y|Y\gt a]P\{Y\gt a\}\\ \Leftrightarrow& P\{Y\gt a\}\mu\lt E[Y|Y\gt a]P\{Y\gt a\}\\ \Leftrightarrow& E[Y|Y\gt a]\gt\mu\\ \end{aligned}$

すなわち条件付き期待値は無条件の期待値よりも大きくなる。

13.2　Tobitモデル

　潜在変数を $Y^{*}$ とし、観測値 $Y$ と $Y^{*}$ に以下の関係があるものとする：

$\begin{aligned} Y_i^{*}&=\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i,i=1,2,\cdots,n\\ \varepsilon_i&\sim N(0,\sigma^2),\\ \\ Y_i&=\begin{cases} Y_i^{*},&Y_i^{*}\gt0\\ 0,&Y_i^{*}\leq0 \end{cases} \end{aligned}$

とする。このモデルはTobitモデルと呼ばれる。
　ここでの興味は母数 $(\alpha,\boldsymbol{\beta})$ および分散 $\sigma^2$ である。
　観測値が $0$ となる確率は

$\begin{aligned} P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}&=P\{Y_i^{*}\leq0|{}^{t}\boldsymbol{X}_i\}=P\{\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i\leq0|{}^{t}\boldsymbol{X}_i\}\\ &=P\{\varepsilon_i\leq-\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}|{}^{t}\boldsymbol{X}_i\}\\ &=F_Y(-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}) \end{aligned}$

である。したがって $\Phi(\cdot)$ を標準正規分布として

$\begin{aligned} P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}=\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right) \end{aligned}$

である。
　このとき

$\begin{aligned} E[Y_i|Y_i^{*}\gt0,\boldsymbol{X}]&=E[\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+\varepsilon_i|\varepsilon_i\gt-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}]\\ &=\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+E[\varepsilon_i|\varepsilon_i\gt-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}] \end{aligned}$

である。最右辺にある $\varepsilon_i$ の条件付き期待値は正を取る。
　さらに $\boldsymbol{\beta}$ が正ならば条件付き期待値と ${}^{t}\boldsymbol{X}_i$ の相関は負になる。
　すべての $Y$ の観測値に関する期待値は

$\begin{aligned} E[Y_i|{}^{t}\boldsymbol{X}_i]=&E[Y_i|Y_i=0,{}^{t}\boldsymbol{X}_i]P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}\\ &+E[Y_i|Y_i\gt0,{}^{t}\boldsymbol{X}_i]P\{Y_i\gt0|{}^{t}\boldsymbol{X}_i\}\\ =&E[Y_i|Y_i\gt0,{}^{t}\boldsymbol{X}_i]P\{Y_i\gt0|{}^{t}\boldsymbol{X}_i\}\\ =&(\alpha+{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}+E[\varepsilon_i|\varepsilon_i\gt-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}])\left(1-\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)\right) \end{aligned}$

であり、切断された標本の期待値よりも小さくなる。

13.3　推定方法

　Tobitモデルの推定に最小二乗法は利用できない。すべての観測値を用いた場合も、負値を取った場合の値を除外した場合も、推定量はバイアスを持つ。
　そこでTobitモデルの推定では最尤法を用いる。 $\varepsilon_i\sim N(0,\sigma^2)$ より

$\begin{aligned} f_Y(y)=\displaystyle{\frac{1}{\sigma}\varphi\left(\displaystyle{\frac{y-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)} \end{aligned}$

である。 $P\{Y_i=0|{}^{t}\boldsymbol{X}_i\}=\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)$ だから尤度関数は

$\begin{aligned} L(\alpha,\boldsymbol{\beta},\sigma)=\displaystyle{\prod_{Y_i\gt0}\frac{1}{\sigma}\phi\left(\displaystyle{\frac{Y_i-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)}\displaystyle{\prod_{Y_i\gt0}\Phi\left(\displaystyle{\frac{-\alpha-{}^{t}\boldsymbol{X}_i\boldsymbol{\beta}}{\sigma}}\right)} \end{aligned}$

となる。これを最大化させるようなものとして $\alpha,\boldsymbol{\beta},\sigma$ の最尤推定量を得る。

13.4　Tobitモデルの限界

　Tobitモデルでは攪乱項についての想定として①正規性、②均一分散性が崩れれば推定が上手くいかなくなる。具体的には最尤推定量が一致性をもたなくなる。またすべての検閲された標本を含むモデルにTobitモデルを導入することはできない。また従属変数が一定の(作為的な)メカニズムで切断されることで起こされる回帰のバイアスは選択により偏りと呼ばれる。

次回

power-of-awareness.com

前回

今日のまとめ

13. 切断された従属変数

13.1 切断された正規分布

13.2 Tobitモデル

13.3 推定方法

13.4 Tobitモデルの限界

次回

13.　切断された従属変数

13.1　切断された正規分布

13.2　Tobitモデル

13.3　推定方法

13.4　Tobitモデルの限界