「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。目下、データ分析・語学に力点を置いています。今月(2022年10月)からは多忙につき、日々の投稿数を減らします。

MENU

時系列解析の基礎(17/XX)

 以下の書籍

を中心に時系列解析を勉強していきます。

8. GARCHモデル

8.2 GARCHモデル

8.2.3 GARCHモデルの統計的推測

 \mathrm{GARCH}モデルの推定はたいてい(条件付き)最尤法で行う。具体的には同時密度を条件付き密度に分解した


\begin{aligned}
\mathcal{l}(\boldsymbol{\theta})=\displaystyle{\sum_{t=1}^{T}\log f_{Y_y|\mathit{\Omega}_{t-1}}(y_t|\mathit{\Omega}_{t-1};\boldsymbol{\theta}) }
\end{aligned}

最尤推定の対象とする。問題なのがf_{Y_y|\mathit{\Omega}_{t-1}}(y_t|\mathit{\Omega}_{t-1};\boldsymbol{\theta})の計算である。たとえばv_tの分布として、正規分布t分布または一般化誤差分布を与えた場合の推定を考えることにする。一般に正規分布を仮定してもある程度のファットテイル性を確保できるものの、実証上は不充分であり、t分布や一般化誤差分布を用いることが普通である。
 まずv_t\sim i.i.d.N(0,1)の場合を考える。このときy_tの条件付き分布も正規分布であるから、y_t|\mathit{\Omega}_{t-1}\sim N(\mu_t,h_t)である。したがってv_t\sim i.i.d.N(0,1)のとき


\begin{aligned}
f_{Y_y|\mathit{\Omega}_{t-1}}(y_t|\mathit{\Omega}_{t-1};\boldsymbol{\theta})=\displaystyle{\frac{1}{\sqrt{2\pi h_t}}\exp\left\{\displaystyle{\frac{-(y_t-\mu_t)^2}{2h_t}}\right\}}
\end{aligned}

で与えられる。
 次に\displaystyle{\frac{\sqrt{\nu}v_t}{\sqrt{\nu-2}}}\sim i.i.d. t(\nu)の場合を考える*1。この場合、y_tの条件付き分散がh_tに等しくなる。このときf_{Y_y|\mathit{\Omega}_{t-1}}(y_t|\mathit{\Omega}_{t-1};\boldsymbol{\theta})


\begin{aligned}
f_{Y_y|\mathit{\Omega}_{t-1}}(y_t|\mathit{\Omega}_{t-1};\boldsymbol{\theta})=\displaystyle{\frac{\mathit{\Gamma}( (\nu+1)/2)}{\pi^{\frac{1}{2}}\mathit{\Gamma}(\nu/2)} (\nu-2)^{-\frac{1}{2}}h_t^{-\frac{1}{2}}\left\{1+\displaystyle{\frac{(y_t-\mu_t)^2}{h_t(\nu-2)}}\right\}^{-\frac{\nu+1}{2}} }
\end{aligned}

で与えられる。
 最後にv_t\sim \mathrm{GED}(\nu)の場合、f_{Y_y|\mathit{\Omega}_{t-1}}(y_t|\mathit{\Omega}_{t-1};\boldsymbol{\theta})


\begin{aligned}
f_{Y_t|\mathit{\Omega}_{t-1};\boldsymbol{\theta}}=&\log\displaystyle{\frac{\nu}{\lambda}}-\left(1+\displaystyle{\frac{1}{\nu}}\right)\log2-\log\mathit{\Gamma}\left(\displaystyle{\frac{1}{\nu}}\right)\\
&-\displaystyle{\frac{1}{2}\left|\displaystyle{\frac{y_t-\nu_t}{\lambda\sqrt{h_t}}}\right|^{\nu}}-\displaystyle{\frac{1}{2}\log h_t}
\end{aligned}

で与えられる。ここで


\begin{aligned}
\lambda=\left\{\displaystyle{\frac{2^{-\frac{2}{\nu}}\mathit{\Gamma}(1/\nu)}{\mathit{\Gamma}(3/\nu)}}\right\}^{\frac{1}{2}}
\end{aligned}

である。

8.2.4 GARCHモデルの選択と診断

 複数の\mathrm{GARCH}モデルから当てはまりの良いモデルを選択するには情報量基準を用いることが多い。ただし情報量基準が正当化されるのは、真のモデルを含むパラメトリックモデルのみである。そのため異なる分布族の比較、たとえば\mathrm{GARCH}モデルと\mathrm{EGARCH}モデルの比較はできない。
 真の\mathrm{GARCH}モデルではv_ti.i.d.系列になるから、v_t,v_t^2は自己相関を持たない。そのためもし選択した\mathrm{GARCH}モデルが正しいモデルであるならば、推定結果から得られる標準化した推定誤差


\begin{aligned}
\hat{v}_t=\displaystyle{\frac{\hat{u}_t}{\sqrt{\hat{h}_t}}}
\end{aligned}

および\hat{v}_t^2は自己相関を持たないはずである。そこで\hat{v}_t,\hat{v}_t^2の自己相関を検定することでモデルの診断をおこなうことができる。ただしこの診断は推定値\hat{v}_tを用いた検定であるから、モデルに応じて修正が必要になる。

8.3 多変量GARCHモデル

 多変量\mathrm{GARCH}モデルを紹介する。一般にn変量\mathrm{GARCH}モデルは


\begin{aligned}
\boldsymbol{y}=\boldsymbol{\mu}_t+\boldsymbol{u}_t+\mathit{\boldsymbol{H}}_t^{\frac{1}{2}}\boldsymbol{v}_t,\ \boldsymbol{v}_t\sim i.i.d.\mathcal{N}(\boldsymbol{0},\mathit{\boldsymbol{I}}_n)
\end{aligned}

と書ける。\boldsymbol{v}_tの分布には、分散共分散行列が\mathit{\boldsymbol{I}}_nとなるように基準化された自由度\nuの多変量t分布を用いることもある。上のモデルでは、\mathit{\boldsymbol{H}}_tを時点t-1における情報集合\mathit{\Omega}_{t-1}に含まれる変数でモデル化すると、


\begin{aligned}
\mathbb{E}\left[\left(\boldsymbol{y}_t-\boldsymbol{\mu}_t\right){}^{t}\left(\boldsymbol{y}_t-\boldsymbol{\mu}_t\right)|\mathit{\Omega}_{t-1}\right]=\mathbb{E}\left[\boldsymbol{u}_t{}^{t}\boldsymbol{u}_t|\mathit{\Omega}_{t-1}\right]=\mathit{\boldsymbol{H}}_t
\end{aligned}

となるから、\mathit{\boldsymbol{H}}_t\boldsymbol{y}_tの条件付き分散共分散行列になる。これは対称行列であるから、\displaystyle{\frac{n(n+1)}{2}}個の独立な成分を持つ。これらをモデル化するための代表的なモデルを以下では紹介する。

8.3.1 VECモデル

 行列A=(a_{i,j})_{1\leq i,j,\leq n}に対して\mathrm{vech}演算子


\begin{aligned}
\mathrm{vech}(A)={}^{t}\left(a_{11},a_{21},\cdots,a_{n1},a_{22},a_{32},\cdots,a_{n2},\cdots,a_{n-1,n-1},a_{n,n-1},a_{n,n}\right)
\end{aligned}

すなわち下三角成分を列方向を優先に並べた列ベクトルと定義するとき、\mathrm{VEC}(1,1)モデルは


\begin{aligned}
\mathrm{vech}(\boldsymbol{H}_t)=\boldsymbol{c}+\mathit{\boldsymbol{B}}\mathrm{vech}(\boldsymbol{H}_{t-1})+\mathit{\boldsymbol{A}}\mathrm{vech}(\boldsymbol{u}_{t-1}{}^{t}\boldsymbol{u}_{t-1})
\end{aligned}

で定義する。\mathrm{VEC}モデルは\mathrm{GARCH}モデルの自然な拡張であるが、nの増大に伴い変数の数が急速に大きくなるという問題がある。
 過剰パラメータ問題を解決するために改良した\mathrm{VEC}モデルが、\boldsymbol{A},\boldsymbol{B}を対角行列に限定した\mathrm{DVEC}モデルである。具体的には


\begin{aligned}
h_{i,j,t}=c_{i,j}+b_{i,j}h_{i,j,t-1}+a_{i,j}u_{i,t-1}u_{j,t-1}
\end{aligned}

とモデル化する。
 \mathrm{DVEC}モデルでは、条件付き分散がその他の変数の条件付き分散や攪乱項の影響を受けなくなっているため、条件付き分散間の相互依存関係は存在しない。したがって変数間の動学的依存関係をモデル化するには適当とは言い難い。

8.3.2 BEKKモデルとCCCモデル

 \mathrm{VEC}モデルにおける問題点を解消するためのモデルの1つに\mathrm{BEKK}モデルがある。\mathrm{BEKK}モデルは


\begin{aligned}
\mathit{\boldsymbol{H}}_t=\mathit{\boldsymbol{C}}+\mathit{\boldsymbol{B}}\mathit{\boldsymbol{H}}_{t-1}{}^{t}\mathit{\boldsymbol{B}}+\mathit{\boldsymbol{A}}\boldsymbol{u}_{t-1}{}^{t}\boldsymbol{u}_{t-1}{}^{t}\mathit{\boldsymbol{A}}
\end{aligned}

で与えられる。\mathit{\boldsymbol{A}},\mathit{\boldsymbol{B}}n次正方行列、\mathit{\boldsymbol{C}}n次対称行列である。このモデルの利点の1つは\mathit{\boldsymbol{C}}が正定値であれば\mathit{\boldsymbol{H}}_tも正定値になるという点である。
 このモデルは正定値性を保証できること、\mathrm{VEC}モデルよりも変数の数が少ないこと、変数数の少なさに対して条件付き分散間の相互依存関係を柔軟にモデル化できるため、非常に良く用いられる。
 他によく用いられるのが\mathrm{CCC}モデルである。\boldsymbol{u}_tの条件付き相関が時間を通じて一定であると仮定し、条件付き分散と共分散のみが動学的依存関係を持つ。具体的には、まず\mathit{\boldsymbol{H}}_tの対角成分のみを1変量\mathrm{GARCH}モデルでモデル化し、


\begin{aligned}
\mathit{\boldsymbol{D}}_t=\mathrm{diag}(h_{11,t},\cdots,h_{nn,t})^{\frac{1}{2}}
\end{aligned}

とおく。また\mathit{\boldsymbol{H}}_t(i,j)成分(i\neq j)は、事変的でない相関行列\mathit{\boldsymbol{R}}(i,j)成分を用いて


\begin{aligned}
h_{i,j,t}=\rho_{i,j}\sqrt{h_{ii,t}h_{jj,t}}
\end{aligned}

とする。\mathrm{CCC}モデルにおける\mathit{\boldsymbol{H}}_t


\begin{aligned}
\mathit{\boldsymbol{H}}_t=\mathit{\boldsymbol{D}}_t\mathit{\boldsymbol{R}}\mathit{\boldsymbol{D}}_t
\end{aligned}

と書くことができる。

8.4 相関変動モデル

 多変量モデルにおいては変数間の動学的関係の分析が主目的の1つであるが、そこで重要な役割を果たすのは相関係数である。そのため変数間の動学的関係を分析するには条件付き相関係数をモデル化する方が望ましく、これらは直接的にモデル化する。

8.4.1 DCCモデル

 \mathrm{DCC}モデルは\mathrm{CCC}モデルにおける条件付き相関を事変的に拡張したもの、すなわち


\begin{aligned}
\mathit{\boldsymbol{H}}_t=\mathit{\boldsymbol{D}}_t\mathit{\boldsymbol{R}}_t\mathit{\boldsymbol{D}}_t
\end{aligned}

という形に拡張したモデルと見なすことができる。
 \mathrm{DCC}モデルの1つに、\mathrm{Engle}(2002)による\mathrm{DCC}モデルがある。このモデルでは


\begin{aligned}
\mathit{\boldsymbol{R}}_t=\mathrm{diag}(q_{11,t},\cdots,q_{nn,t})^{\frac{1}{2}}\mathit{\boldsymbol{Q}}_t\mathrm{diag}(q_{11,t},\cdots,q_{nn,t})^{\frac{1}{2}}
\end{aligned}

と拡張する。ここで


\begin{aligned}
\mathit{\boldsymbol{Q}}_t=(1-a-b)\bar{\mathit{\boldsymbol{Q}}}+b\mathit{\boldsymbol{Q}}_{t-1}+a\boldsymbol{\varepsilon}_{t-1}{}^{t}\boldsymbol{\varepsilon}_{t-1}
\end{aligned}

とする。\boldsymbol{\varepsilon}_tは各変数の標準化残差からなるベクトルで、\boldsymbol{\varepsilon}_t=\boldsymbol{\boldsymbol{D}}_t^{-1}\boldsymbol{u}_tで与えられる。さらに\bar{\mathit{\boldsymbol{Q}}}\boldsymbol{\varepsilon}_tの条件なし相関行列である。a\geq0,b\geq0,a+b\lt1のとき\mathit{\boldsymbol{Q}}_tは必ず正定値行列になり、\mathit{\boldsymbol{R}}_tは相関行列になる。
 もう1つのモデルは


\begin{aligned}
\mathit{\boldsymbol{R}}_t=(1-a-b)\bar{\mathit{\boldsymbol{R}}}+b\mathit{\boldsymbol{R}}_{t-1}+a\mathit{\boldsymbol{\Psi}}_{t-1}
\end{aligned}

とモデル化するものである。ここで\mathit{\boldsymbol{\Psi}}_{t-1}=(\psi_{i,j,t-1})_{1\leq i,j\leq n}


\begin{aligned}
\psi_{i,j,t-1}=\displaystyle{\frac{\displaystyle{\sum_{m=1}^{M}\varepsilon_{i,t-m}\varepsilon_{j,t-m}}}{\sqrt{\left(\displaystyle{\sum_{m=1}^{M}\varepsilon_{i,t-m}^2}\right)\left(\displaystyle{\sum_{m=1}^{M}\varepsilon_{j,t-m}^2}\right)}}}
\end{aligned}

で与えられる。これが相関行列になるためにはM\geq nでなければならない。さらに\mathit{\boldsymbol{R}}_tが相関行列になることを保証すべく、a\geq0,b\geq0,a+b\lt1と仮定することが多い。

8.4.2 コピュラ

 \mathrm{DCC}モデルは変数間の依存構造がすべて相関を通じて変化する。しかし相関は依存性を表現するのには、たとえば非線形な依存関係や非対称な依存関係を表現できないなど、完璧とは言い難い。そのためコピュラを用いて依存関係を表現する。


定義 コピュラ すべての周辺分布が区間[\0,1]上の一様分布U(0,1)に等しいn変量同時確率分布関数を[te:n]変量コピュラという。

 コピュラが有用なのは、\mathrm{Sklar}の定理から、任意の同時分布関数F(x_1,\cdots,x_n)を、その第i変量周辺分布関数F_i(x_i)の関数として一意に書けること、すなわち


\begin{aligned}
F(x_1,\cdots,x_n)=C(F_1(x_1),\cdots,F_n(x_n))
\end{aligned}

を満たすようなコピュラCが一意に存在することが保証されていることが背景にある。すなわちコピュラは多変量分布を変数の依存関係を周辺分布と依存構造に分割することができる。なお逆も成り立つ。

8.4.3 DCDモデル

 \mathrm{DCC}モデルと同様にコピュラのパラメータを変動させたのが\mathrm{DCD}モデルである。依存構造のモデリングには非常に強力である。
 ただしいくつか問題がある。特に問題なのが、3変量以上に柔軟に拡張可能なコピュラが少ないことである。また\mathrm{DCD}モデルにはコピュラのパラメータ変動をどのように過去のショックと関連付けるかが難しい。他方でコピュラを用いると、分布の上側と下側の依存構造に対して異なる強さや動学を許容することができる。

*1:自由度\nut分布の分散が\displaystyle{\frac{\nu}{\nu-2}}であり、これを規格化するために係数を調整した。

プライバシーポリシー お問い合わせ