時系列解析の基礎(05/XX) - 「大人の教養・知識・気付き」を伸ばすブログ

　以下の書籍

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

作者:竜義, 沖本
朝倉書店

Amazon

を中心に時系列解析を勉強していきます。

前回

power-of-awareness.com

前回
4.　予測
- 4.4　時系列解析における区間予測
次回
参考文献

4.　予測

4.4　時系列解析における区間予測

　将来時点の値を1つの値として予測する方法を点予測と呼ぶのに対し、特定の確率を与えてその確率の範囲内で実現し得る値の区間として予測するものを区間予測という。現時点 $t$ までの情報を基に将来時点 $t+h$ の値、すなわち $h$ 期先の値を $100\alpha$ %の確率で含むような区間を推定することを $h$ 期先 $100\alpha$ %区間予想という。
　区間予想は

確率的に評価できる
不確実性が区間の長さで表されるために不確実の程度が理解しやすい
平均的な値以外のシナリオ的な予測に用いやすい

という点で優れている*1。

4.4.1　AR過程の区間予測

　 $h$ 期先区間予測を構築するためには、 $\Omega_t$ を所与としたきの $y_{t+h}$ の条件付き分布を得る必要がある。ここでは定常 $\mathrm{AR}$ 過程

$\begin{aligned} y_t=c+\phi_1y_{t-1}+\phi_2y_{t-2}+\cdots+\phi_py_{t-p}+\varepsilon_t,\ \varepsilon_t\sim i.i.d.\ N(0,\sigma^2) \end{aligned}$

の条件付き分布と区間予測を考えよう。
　このとき

$\begin{aligned} y_{t+1}=c+\phi_1y_{t}+\phi_2y_{t-1}+\cdots+\phi_py_{t-p+1}+\varepsilon_{t+1},\ \varepsilon_{t+1}\sim i.i.d.\ N(0,\sigma^2) \end{aligned}$

であるから、 $\Omega_t$ を所与とすれば、 $\varepsilon_{t+1}$ のみが確率的な変数であり、これが正規分布に従うことを仮定していたから、 $y_{t+1}$ も正規分布に従う。すなわち、

$\begin{aligned} y_{t+1|t}&\sim N(c+\phi_1y_{t}+\phi_2y_{t-1}+\cdots+\phi_py_{t-p+1},\sigma^2)\\ &\sim N(\hat{y}_{t+1|t},MSE(\hat{y}_{t+1|t})) \end{aligned}$

である。したがって標準正規分布の両側 $\alpha$ %点( $0\lt\alpha\lt1$ )を $z_{\alpha/2}$ とおけば

$\begin{aligned} P\left\{-z_{\alpha/2}\leq\displaystyle{\frac{y_{t+1|t}-\hat{y}_{t+1|t}}{\sqrt{MSE(\hat{y}_{t+1|t})}}}\leq z_{\alpha/2}\right\}=1-\alpha \end{aligned}$

であるから、

$\begin{aligned} P\left\{\hat{y}_{t+1|t}-\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\leq y_{t+1|t}\leq\hat{y}_{t+1|t}+\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\right\}=1-\alpha \end{aligned}$

が得られ、したがって1期先 $100(1-\alpha)$ %区間予測は

$\begin{aligned} \left[\hat{y}_{t+1|t}-\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2},\hat{y}_{t+1|t}+\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\right] \end{aligned}$

で与えられる。
　ただし $\mathrm{MSE}(\cdot)$ を計算するのは困難である。対処するには、

$\mathrm{Carman\ Filter}$ を用いて正確に推測する
シミュレーションにより区間予測する

という方法が考えられる。 $\mathrm{Carman\ Filter}$ を扱うには紙幅が少なすぎるため、これは省略し後者の概略を示す。

(1)逐次予測により点予測値 $\hat{y}_{t+1|t},\cdots,\hat{y}_{t+h|t}$ を算出する。

(2) $k=1$ とする。

(3) $\varepsilon_{t+1}^{(k)},\cdots,\varepsilon_{t+h}^{(k)}$ を $N(0,\sigma^2)$ から独立に発生させる。

(4) $y_t,y_{t-1},\cdots,y_{t-p+1}$ を初期値として、(3)で発生させた $\varepsilon_{t+1}^{(k)},\cdots,\varepsilon_{t+h}^{(k)}$ を用いて $\hat{y}_{t+h}^{(k)}$ を計算し保存する。

(5) $k\lt N$ ならば $k=k+1$ として(3)に戻り、そうでなければ(6)に移る。

(6) $y_{t+h|t}^{(k)},k=1,2,\cdots,N$ の標本分散
$\begin{aligned}MSE(\hat{y}_{t+h|t}^{(k)})\displaystyle{\frac{1}{N}\sum_{k=1}^{N}(y_{t+h|t}^{(k)}-\hat{y}_{t+h|t})^2}\end{aligned}$
を用いて $\mathrm{MSE}$ を推定する。

(7)点予測値 $\hat{y}_{t+h|t}$ および $MSE(\hat{y}_{t+h|t}^{(k)})$ を
$\begin{aligned}\left[\hat{y}_{t+1|t}-\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2},\hat{y}_{t+1|t}+\sqrt{MSE(\hat{y}_{t+1|t})}z_{\alpha/2}\right]\end{aligned}$
に代入して $h$ 期先 $100\alpha$ %区間予測を構成する。

4.4.2　MA過程の予測

　反転可能な $\mathrm{MA}$ 過程の予測を考える。

　有限個の $y$ の値を用いた予測を考えるために、まずは無限個の $y$ の観測値があると仮定した場合を考える。反転可能な $\mathrm{MA}$ 過程は

$\begin{aligned} y_t=\displaystyle{\sum_{k=1}^{\infty}\eta_ky_{t-k}}+\varepsilon_t \end{aligned}$

と $\mathrm{AR}(\infty)$ 過程として書き直すことができる。したがって $\Omega_t=\{y_t,y_{t-1},\cdots\}$ が既知ならば、

$\begin{aligned} \varepsilon_t=y_t-\displaystyle{\sum_{k=1}^{\infty}\eta_ky_{t-k}} \end{aligned}$

により、過去の $\varepsilon_t$ がすべて計算できる。
　ここから、

$\begin{aligned} E\left[\varepsilon_{\tau}|\Omega_t\right]=\varepsilon_{\tau},\ \tau\leq t \end{aligned}$

が導かれる。 $\mathrm{MA}$ 家庭の場合は $y_{t+h}$ は将来ないし過去の $\varepsilon$ しか含まないため、それらの条件付き期待値は

$\begin{aligned} E[\varepsilon_{t+k}|\Omega_t]&=0,\ k\gt0,\\ E\left[\varepsilon_{\tau}|\Omega_t\right]&=\varepsilon_{\tau},\ \tau\leq t \end{aligned}$

から完全に算出することができる。
　以下では $\mathrm{MA}(2)$ 過程

$\begin{aligned} y_t=\mu+\varepsilon_t+\theta_1\varepsilon_{t-1}+\theta_2\varepsilon_{t-2},\ \varepsilon_t\sim\ i.i.id\ N(0,\sigma^2) \end{aligned}$

を例に最適予測を行うことにする。
　まず1期先予測は、

$\begin{aligned} y_{t+1}=\mu+\varepsilon_{t+1}+\theta_1\varepsilon_{t}+\theta_2\varepsilon_{t-1} \end{aligned}$

であることに注意すれば、

$\begin{aligned} E[\varepsilon_{t+k}|\Omega_t]&=0,\ k\gt0,\\ E\left[\varepsilon_{\tau}|\Omega_t\right]&=\varepsilon_{\tau},\ \tau\leq t \end{aligned}$

を用いることで、

$\begin{aligned} \hat{y}_{t+1|t}&=E\left[\mu+\varepsilon_{t+1}+\theta_1\varepsilon_{t}+\theta_2\varepsilon_{t-1}\right]\\ &=\mu+E[\varepsilon_{t+1}]+\theta_1E[\varepsilon_{t}]+\theta_2E[\varepsilon_{t-1}]\\ &=\mu+\theta_1\varepsilon_{t}+\theta_2\varepsilon_{t-1} \end{aligned}$

が得られる。このとき

$\begin{aligned} MSE(\hat{y}_{t+1|t})=E[\hat{e}_{t+1|t}^2]=E[\varepsilon_{t+1}^2]=\sigma^2 \end{aligned}$

である。

　区間予測は $\mathrm{AR}$ 過程と同様の議論をすればよい。

$\mathrm{MA}(q)$ 過程の最適予測が持つ性質　 $\mathrm{MA}(q)$ 過程の最適予測は以下の性質を持つ：

(1) $q$ 期までの最適予測はすべての観測値 $y_t,y_{t-1},\cdots$ に依存する。
(2) $q+1$ 期先以上の予測は過程の期待値に等しい。
(3) $q$ 期までの予測の $\mathrm{MSE}$ は予測期間 $h$ が増大するにつれて単調増加していき、 $q+1$ 期先以上の $\mathrm{MSE}$ は過程の分散に等しい。

　次に有限個の観測値しかない場合、すなわち $\Omega_t=\{y_t,y_{t-1},\cdots,y_1\}$ が既知な場合を考える。 $\mathrm{MA}(q)$ 過程において $q+1$ 期先では無限個の $y$ の観測値が分かっている場合と同様である。そのため、過程の期待値 $\mu$ ｇ最適予測である。それに対して $h\lt q$ 期以内先の場合では $\varepsilon_{t+h},\varepsilon_{t+h-1},\cdots,\varepsilon_{t}$ を計算する必要がある。

$\begin{aligned} \varepsilon_t=y_t-(\mu+\theta_1\varepsilon_{t-1}+\cdots+\theta_q\varepsilon_{t-q}) \end{aligned}$

が成り立つことから、

$\begin{aligned} \hat{\varepsilon}_1&=y_1-\mu,\\ \hat{\varepsilon}_2&=y_1-\mu-\theta_1\hat{\varepsilon}_1,\\ \hat{\varepsilon}_3&=y_1-\mu-\theta_1\hat{\varepsilon}_1-\theta_2\hat{\varepsilon}_2,\\ \vdots&\ \end{aligned}$

と逐次的に $\varepsilon$ の近似値を求めればよい。

4.4.3　ARMA過程の予測

　 $\mathrm{ARMA}$ 過程の予測は $\mathrm{AR}$ 過程と $\mathrm{MA}$ 過程の予測を組み合わせればよい。すなわち $y_{t+h}$ を過去の $y$ および $\varepsilon$ で表現し、

$\begin{aligned} E[y_{\tau}|\Omega_t]&=y_{\tau},\tau\leq t,\\ E[\varepsilon_{t+k}|\Omega_t]&=0,\ k\gt0,\\ E\left[\varepsilon_{\tau}|\Omega_t\right]&=\varepsilon_{\tau},\ \tau\leq t \end{aligned}$

を用いて計算すればよい。ただし有限個の $y$ の観測値しか利用できない場合、 $\mathrm{MA}$ 家庭の予測で議論したように、 $\varepsilon$ の初期値を $0$ として $\varepsilon$ の近似値を逐次的に求めてそれらを用いればよい。

次回

power-of-awareness.com

参考文献

沖本竜義(2010)「経済・ファイナンスデータの計量時系列分析」(朝倉書店)
北川源四郎(2020)「Rによる時系列モデリング入門」（岩波書店）
柴田里程(2017)「時系列解析」(共立出版)
白石博(2022)「時系列データ解析」(森北出版)
萩原淳一郎，瓜生真也，牧山幸史[著]，石田基広[監修](2018)「基礎からわかる時系列分析　Rで実践するカルマンフィルタ・MCMC・粒子フィルタ」(技術評論社)

*1:無論、ピンポイントで値が得られないことでデメリットにもなり得る。

前回

4. 予測

4.4 時系列解析における区間予測

4.4.1 AR過程の区間予測

4.4.2 MA過程の予測

4.4.3 ARMA過程の予測

次回