「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。データ分析・語学に力点を置いています。 →現在、コンサルタントの雛になるべく、少しずつ勉強中です(※2024年1月21日改訂)。

MENU

時系列解析の基礎(05/XX)

 以下の書籍

を中心に時系列解析を勉強していきます。

4. 予測

4.4 時系列解析における区間予測

 将来時点の値を1つの値として予測する方法を点予測と呼ぶのに対し、特定の確率を与えてその確率の範囲内で実現し得る値の区間として予測するものを区間予測という。現時点tまでの情報を基に将来時点t+hの値、すなわちh期先の値を100\alpha%の確率で含むような区間を推定することをh期先100\alpha%区間予想という。
 区間予想は

  • 確率的に評価できる
  • 不確実性が区間の長さで表されるために不確実の程度が理解しやすい
  • 平均的な値以外のシナリオ的な予測に用いやすい

という点で優れている*1

4.4.1 AR過程の区間予測

 h期先区間予測を構築するためには、\Omega_tを所与としたきのy_{t+h}の条件付き分布を得る必要がある。ここでは定常\mathrm{AR}過程



\begin{aligned}
y_t=c+\phi_1y_{t-1}+\phi_2y_{t-2}+\cdots+\phi_py_{t-p}+\varepsilon_t,\ \varepsilon_t\sim i.i.d.\ N(0,\sigma^2)
\end{aligned}


の条件付き分布と区間予測を考えよう。
 このとき


\begin{aligned}
y_{t+1}=c+\phi_1y_{t}+\phi_2y_{t-1}+\cdots+\phi_py_{t-p+1}+\varepsilon_{t+1},\ \varepsilon_{t+1}\sim i.i.d.\ N(0,\sigma^2)
\end{aligned}


であるから、\Omega_tを所与とすれば、\varepsilon_{t+1}のみが確率的な変数であり、これが正規分布に従うことを仮定していたから、y_{t+1}正規分布に従う。すなわち、



\begin{aligned}
y_{t+1|t}&\sim N(c+\phi_1y_{t}+\phi_2y_{t-1}+\cdots+\phi_py_{t-p+1},\sigma^2)\\
&\sim N(\hat{y}_{t+1|t},MSE(\hat{y}_{t+1|t}))
\end{aligned}


である。したがって標準正規分布の両側\alpha%点(0\lt\alpha\lt1)をz_{\alpha/2}とおけば



\begin{aligned}
P\left\{-z_{\alpha/2}\leq\displaystyle{\frac{y_{t+1|t}-\hat{y}_{t+1|t}}{\sqrt{MSE(\hat{y}_{t+1|t})}}}\leq z_{\alpha/2}\right\}=1-\alpha
\end{aligned}


であるから、


\begin{aligned}
P\left\{\hat{y}_{t+1|t}-\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\leq y_{t+1|t}\leq\hat{y}_{t+1|t}+\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\right\}=1-\alpha
\end{aligned}

が得られ、したがって1期先100(1-\alpha)%区間予測は



\begin{aligned}
\left[\hat{y}_{t+1|t}-\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2},\hat{y}_{t+1|t}+\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\right]
\end{aligned}


で与えられる。
 ただし\mathrm{MSE}(\cdot)を計算するのは困難である。対処するには、

  • \mathrm{Carman\ Filter}を用いて正確に推測する
  • シミュレーションにより区間予測する

という方法が考えられる。\mathrm{Carman\ Filter}を扱うには紙幅が少なすぎるため、これは省略し後者の概略を示す。

  • (1)逐次予測により点予測値\hat{y}_{t+1|t},\cdots,\hat{y}_{t+h|t}を算出する。
  • (2)k=1とする。
  • (3)\varepsilon_{t+1}^{(k)},\cdots,\varepsilon_{t+h}^{(k)}N(0,\sigma^2)から独立に発生させる。
  • (4)y_t,y_{t-1},\cdots,y_{t-p+1}を初期値として、(3)で発生させた\varepsilon_{t+1}^{(k)},\cdots,\varepsilon_{t+h}^{(k)}を用いて\hat{y}_{t+h}^{(k)}を計算し保存する。
  • (5)k\lt Nならばk=k+1として(3)に戻り、そうでなければ(6)に移る。
  • (6)y_{t+h|t}^{(k)},k=1,2,\cdots,Nの標本分散
    \begin{aligned}MSE(\hat{y}_{t+h|t}^{(k)})\displaystyle{\frac{1}{N}\sum_{k=1}^{N}(y_{t+h|t}^{(k)}-\hat{y}_{t+h|t})^2}\end{aligned}
    を用いて\mathrm{MSE}を推定する。
  • (7)点予測値\hat{y}_{t+h|t}およびMSE(\hat{y}_{t+h|t}^{(k)})
    \begin{aligned}\left[\hat{y}_{t+1|t}-\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2},\hat{y}_{t+1|t}+\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\right]\end{aligned}
    に代入してh期先100\alpha%区間予測を構成する。
4.4.2 MA過程の予測

 反転可能な\mathrm{MA}過程の予測を考える。

 有限個のyの値を用いた予測を考えるために、まずは無限個のyの観測値があると仮定した場合を考える。反転可能な\mathrm{MA}過程は



\begin{aligned}
y_t=\displaystyle{\sum_{k=1}^{\infty}\eta_ky_{t-k}}+\varepsilon_t
\end{aligned}


\mathrm{AR}(\infty)過程として書き直すことができる。したがって\Omega_t=\{y_t,y_{t-1},\cdots\}が既知ならば、



\begin{aligned}
\varepsilon_t=y_t-\displaystyle{\sum_{k=1}^{\infty}\eta_ky_{t-k}}
\end{aligned}


により、過去の\varepsilon_tがすべて計算できる。
 ここから、


\begin{aligned}
E\left[\varepsilon_{\tau}|\Omega_t\right]=\varepsilon_{\tau},\ \tau\leq t
\end{aligned}


が導かれる。\mathrm{MA}家庭の場合はy_{t+h}は将来ないし過去の\varepsilonしか含まないため、それらの条件付き期待値は



\begin{aligned}
E[\varepsilon_{t+k}|\Omega_t]&=0,\ k\gt0,\\
E\left[\varepsilon_{\tau}|\Omega_t\right]&=\varepsilon_{\tau},\ \tau\leq t
\end{aligned}


から完全に算出することができる。
 以下では\mathrm{MA}(2)過程



\begin{aligned}
y_t=\mu+\varepsilon_t+\theta_1\varepsilon_{t-1}+\theta_2\varepsilon_{t-2},\ \varepsilon_t\sim\ i.i.id\ N(0,\sigma^2)
\end{aligned}


を例に最適予測を行うことにする。
 まず1期先予測は、



\begin{aligned}
y_{t+1}=\mu+\varepsilon_{t+1}+\theta_1\varepsilon_{t}+\theta_2\varepsilon_{t-1}
\end{aligned}


であることに注意すれば、



\begin{aligned}
E[\varepsilon_{t+k}|\Omega_t]&=0,\ k\gt0,\\
E\left[\varepsilon_{\tau}|\Omega_t\right]&=\varepsilon_{\tau},\ \tau\leq t
\end{aligned}


を用いることで、



\begin{aligned}
\hat{y}_{t+1|t}&=E\left[\mu+\varepsilon_{t+1}+\theta_1\varepsilon_{t}+\theta_2\varepsilon_{t-1}\right]\\
&=\mu+E[\varepsilon_{t+1}]+\theta_1E[\varepsilon_{t}]+\theta_2E[\varepsilon_{t-1}]\\
&=\mu+\theta_1\varepsilon_{t}+\theta_2\varepsilon_{t-1}
\end{aligned}


が得られる。このとき



\begin{aligned}
MSE(\hat{y}_{t+1|t})=E[\hat{e}_{t+1|t}^2]=E[\varepsilon_{t+1}^2]=\sigma^2
\end{aligned}


である。

 区間予測は\mathrm{AR}過程と同様の議論をすればよい。



\mathrm{MA}(q)過程の最適予測が持つ性質 \mathrm{MA}(q)過程の最適予測は以下の性質を持つ:

  • (1)q期までの最適予測はすべての観測値y_t,y_{t-1},\cdotsに依存する。
  • (2)q+1期先以上の予測は過程の期待値に等しい。
  • (3)q期までの予測の\mathrm{MSE}は予測期間hが増大するにつれて単調増加していき、q+1期先以上の\mathrm{MSE}は過程の分散に等しい。


 次に有限個の観測値しかない場合、すなわち\Omega_t=\{y_t,y_{t-1},\cdots,y_1\}が既知な場合を考える。\mathrm{MA}(q)過程においてq+1期先では無限個のyの観測値が分かっている場合と同様である。そのため、過程の期待値\mug最適予測である。それに対してh\lt q期以内先の場合では\varepsilon_{t+h},\varepsilon_{t+h-1},\cdots,\varepsilon_{t}を計算する必要がある。



\begin{aligned}
\varepsilon_t=y_t-(\mu+\theta_1\varepsilon_{t-1}+\cdots+\theta_q\varepsilon_{t-q})
\end{aligned}


が成り立つことから、



\begin{aligned}
\hat{\varepsilon}_1&=y_1-\mu,\\
\hat{\varepsilon}_2&=y_1-\mu-\theta_1\hat{\varepsilon}_1,\\
\hat{\varepsilon}_3&=y_1-\mu-\theta_1\hat{\varepsilon}_1-\theta_2\hat{\varepsilon}_2,\\
\vdots&\ 
\end{aligned}


と逐次的に\varepsilonの近似値を求めればよい。

4.4.3 ARMA過程の予測

 \mathrm{ARMA}過程の予測は\mathrm{AR}過程と\mathrm{MA}過程の予測を組み合わせればよい。すなわちy_{t+h}を過去のyおよび\varepsilonで表現し、



\begin{aligned}
E[y_{\tau}|\Omega_t]&=y_{\tau},\tau\leq t,\\
E[\varepsilon_{t+k}|\Omega_t]&=0,\ k\gt0,\\
E\left[\varepsilon_{\tau}|\Omega_t\right]&=\varepsilon_{\tau},\ \tau\leq t
\end{aligned}


を用いて計算すればよい。ただし有限個のyの観測値しか利用できない場合、\mathrm{MA}家庭の予測で議論したように、\varepsilonの初期値を0として\varepsilonの近似値を逐次的に求めてそれらを用いればよい。

参考文献

  • 沖本竜義(2010)「経済・ファイナンスデータの 計量時系列分析」(朝倉書店)
  • 北川源四郎(2020)「Rによる時系列モデリング入門」(岩波書店
  • 柴田里程(2017)「時系列解析」(共立出版)
  • 白石博(2022)「時系列データ解析」(森北出版)
  • 萩原淳一郎,瓜生真也,牧山幸史[著],石田基広[監修](2018)「基礎からわかる時系列分析 Rで実践するカルマンフィルタ・MCMC・粒子フィルタ」(技術評論社)

*1:無論、ピンポイントで値が得られないことでデメリットにもなり得る。

プライバシーポリシー お問い合わせ