「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。

MENU

【数理統計】時系列解析Vol.07:予測

 前回はARMA過程の詳細を述べた。今回はARMAモデルでの予測について述べる。


zeitgeist.hatenablog.com

引き続き、以下の書籍を基に学んだことを整理していく。

今日のポイント

  • 時系列解析においては「良い予測」には様々な考え方がある
  • 予測誤差\hat{e}_{t+1|t}=y_{t+1}-y_{t+1|t}を最小化する予測を「良い」とするものがある
  • 予測誤差自体も確率変数であるため、どのような意味で最小化すべきなのかも定めるべきである
  • 数学的に扱いやすい平均二乗誤差の意味で予測誤差を最小化すると、条件付き期待値が最適なものである

5.予測

(1) 予測の基本的な考え方

 これまでで時系列モデルを構築してきたが、それを用いて予測を立てることが今回の課題である。

 推定方法が様々あるように予測の考え方も様々なものがある。そのために如何なる予測が適切なものかを判断するのは難しく、その判断のための尺度が必要となる。
 一つには最小二乗法との考え方を敷衍し、予測誤差\hat{e}_{t+1|t}=y_{t+1}-y_{t+1|t}を最小化するような予測を良い予測であると見なす考え方がある。とはいえ予測誤差は確率変数の差であるからそれ自身も確率変数であり、どのような意味で最小化するものが適当なのかを定めなければ十分とは言えない。これにも様々な考え方があるが、もっとも頻用されるのは平均二乗誤差


\begin{aligned}
MSE =E[{\hat{e}_{t+1|t}}^2]=E[(y_{t+1}-y_{t+1|t})^2]
\end{aligned}

を最小化していくことである。このような平均二乗誤差を最小化することで得られる予測を最適予測(optimal forecast)と呼ぶ。

(2) より厳密な考え方

 時点tにおいて利用可能な観測値からなる情報集合\Omega_{t}=\{y_t,y_{t-1},\cdots,y_{1}\}を用いて、h>0期先の値y_{t+h}を予測したいとする。\Omega_{t}を用いて得られる予測量を\hat{y}_{t+h|t}とする。
 このとき前述の考えに従うとしよう。すると


\begin{aligned}
MSE(\hat{e}_{t+h|t})=E[\hat{e}_{t+h|t}^2|\Omega_{t}] =E[(y_{t+h}-\hat{y}_{t+h|t})^2|\Omega_{t}]
\end{aligned}
を考えることとなる。
 これを展開すると、

\begin{aligned}
MSE(\hat{e}_{t+h|t})&=E[\hat{e}_{t+h|t}^2|\Omega_{t}],\\
          &=E[(y_{t+h}-\hat{y}_{t+h|t})^2|\Omega_{t}].
\end{aligned}
 \mu_{t+h|t}=E[\hat{y}_{t+h}|\Omega_{t}]とおくと

\begin{aligned}
MSE(\hat{e}_{t+h|t})&=E[(y_{t+h}-\hat{y}_{t+h|t})^2|\Omega_{t}]\\
          &=E[(y_{t+h}-\mu_{t+h|t}+\mu_{t+h|t}+\hat{y}_{t+h|t})^2|\Omega_{t}]\\
          &=(E[y_{t+h}-\mu_{t+h|t}|\Omega_{t}])^2-\\
          &\ \ \ \ \ 2E[(y_{t+h}-\mu_{t+h|t})(\hat{y}_{t+h|t}-\mu_{t+h|t})|\Omega_{t}]+\\
          &\ \ \ \ \ (E[\hat{y}_{t+h|t}-\mu_{t+h|t}|\Omega_{t}])^2]\\
          &=(E[y_{t+h}-\mu_{t+h|t}|\Omega_{t}])^2+(E[\hat{y}_{t+h|t}-\mu_{t+h|t}|\Omega_{t}])^2
\end{aligned}
 右辺第2項は非負であるため、MSE(\hat{e}_{t+h|t})\hat{y}_{t+h|t}=\mu_{t+h|t}で最小化できる。以上の考察から、分布に特定の仮定を与えることで計算を可能(ないし容易)にした条件付き期待値を利用するのが妥当であると結論付けることができた。

まとめ

 以上、良い予測を行うための考え方を整理してきた:

  • 時系列解析においては「良い予測」には様々な考え方がある
  • 1つには予測誤差\hat{e}_{t+1|t}=y_{t+1}-y_{t+1|t}を最小化する予測を「良い」とするものがある
  • 予測誤差自体も確率変数であるため、どのような意味で最小化すべきなのかも定めるべきである
  • 数学的に扱いやすい平均二乗誤差の意味で予測誤差を最小化すると、条件付き期待値が最適なものである

次回はこれらの考え方をAR過程に当てはめて、具体的な予測を考えることとする。

プライバシーポリシー お問い合わせ