「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。現在、コンサルタントの雛になるべく、少しずつ勉強中です(※2024年12月10日改訂)。

MENU

コピュラ(1/X)

はじめに

  • コピュラに関する邦語参考書がついに出版されたので、読んでみようと思う。

1.確率の基礎とコピュラの概要

1.1 確率論の基礎

1.1.1 確率変数
  • ランダムに様々な値を取り得る変数を確率変数という(数学的には母集団から実数全体への関数X:\mathit{\Omega}\rightarrow\mathbb{R}とする。)。
  • 複数の確率変数の組(X_1,\cdots,X_n)n変量確率変数(確率ベクトル)という。
  • 確率変数の確率的な特徴はその分布により規定される。分布関数は、
    \begin{aligned}F(x)=P\left(X\leq x\right)\end{aligned}
    で定義される*1。たとえば、区間\left[0,1\right]上の一様分布(uniform distribution)は、0から1までの実数を乱数として一様に発生させる。たとえば、確率変数U区間\left[0,1\right]上の一様分布(U(0,1)と書くことにする。)に従うことをU\sim U(0,1)と書く。
  • 確率変数はその定義から、試行を行い実際にその値を観測するまで特定の値を得ることができない。この観測した値のことを実現値や観測値という。慣習的に確率変数を大文字で、観測値はその小文字(と試行を識別するために添え字)で表現する。たとえば、一様乱数U\sim U(0,1)を10,000回得るという試行では、u_1,\cdots,u_{10000}と書くことが多い*2
  • 確率変数の確率密度関数
    \begin{aligned}f(x)=\displaystyle{\frac{dF(x)}{dx}}\end{aligned}
    で表す。たとえば、U\sim U(0,1)に対し、
    \begin{aligned}f(u)=1,0\leq u\leq1\end{aligned}
    である。
  • このため、確率、分布関数および確率密度関数には、
    \begin{aligned}F(x)&=P\left(X\leq x\right)\\&=\displaystyle{\int_{-\infty}^{x}}f(t)dt\end{aligned}
    という関係がある*3
  • \bar{F}(x)=P(X\gt x)を生存関数という。定義から
    \begin{aligned}\bar{F}(x)&=P(X\gt x)\\&=P(\overline{\{X\leq x\}})\\&=1-P(X\leq x)\\&=1-F(x)\end{aligned}
    が成り立つ。
  • 任意の連続型確率変数は一様確率変数U\sim U(0,1)に変換することができる。実際、分布関数F(\cdot)*4を持つ確率変数Xに対して確率変数U=F(X)を定義すると、確率の定義からU\in [0,1]であり、
    \begin{aligned}F(x)&=P(X\leq x)=P\left(F^{-1}(U)\leq x\right)\\&=P\left(F\circ F^{-1}(U)\leq F(x)\right)=P\left(U\leq F(x)\right)\end{aligned}
    が成り立つ。F(x)=uとおけば、P(U\leq u)=uであり、これはUが一様分布であることに他ならない。したがって、一様乱数uを生成し、これをF^{-1}で変換したF^{-1}(u)は、分布Fに従う確率変数である。実際に計算機において任意の分布の乱数を生成するには、一般にこの方法を取る。こうした乱数の生成法を逆関数法という。
1.1.2 パラメトリック分布
  • U(0,1),U(-0.5,0.5)は共に一様分布だが、取り得る値が異なる*5。これは取る区間の差異で生まれており、このように分布を特徴づける定数*6を母数(パラメータ)という*7。一般に\thetaと書くことが多い*8。母数の取り得る範囲の集合を母数空間といい、母数と対応して慣習的に\Thetaと書くこともある。
  • このように、分布の特徴(分布の位置合いや形状)を特徴づける定数を持つ分布のことをパラメトリック分布という*9
  • 連続確率変数Xの特徴量を考えることがある。Xの分布をF(その密度関数をfとして存在する)としたとき、
    \begin{aligned}E\left[X\right]=\displaystyle{\int_{-\infty}^{\infty}x dF(x)}=\displaystyle{\int_{-\infty}^{\infty}x f(x) dx}\end{aligned}
    を平均という。また、
    \begin{aligned}V\left[X\right]=\displaystyle{\int_{-\infty}^{\infty}\left(X-E\left[X\right]\right)^2 f(x) dx}\end{aligned}
    Xの分散という。平均と分散は必ずしも存在するわけではない。たとえば、コーシー分布は平均も分散も存在しない。

1.2 なぜコピュラを用いるのか

  • コピュラは複数の確率変数間の相関構造をモデリングするために用いられる。コピュラも順位相関係数などの特徴量を持つ。
1.2.1 2変量正規分布とコピュラ
  • コピュラによる確率モデルの多くは、XYのそれぞれが正規分布に従うことを仮定していない。周辺分布によらずに相関構造の実を定めるために用いるのがコピュラである。
  • 確率変数XYをそれぞれ一様分布U(0,1)に従うように変換する。
1.2.2 コピュラによる相関構造
  • コピュラを用いると様々な相関構造を定めることができる。多くの場合、相関の強さを表すパラメータを持つ。
  • コピュラが定める確率変数間の相関構造は周辺分布に無関係である。周辺分布がどのような分布に従おうとも、2つの確率変数間の相関構造はコピュラで記述できる。それを明示的に示したのがSklarの定理である。コピュラを用いれば、周辺分布の方がどのようなものでも、それと無関係に相関構造をモデリングすることが可能となる。
  • あらゆる方の相関構造がコピュラを用いることによりモデル化できる。ただし、実際の解析では数学的性質の優れたコピュラに利用が限定されることが多い。そのため、コピュラを運用するには、代表的なコピュラの種類と、それらの数学的性質をある程度理解すると便利である。

1.3 さまざまなコピュラの種類

  • 実用上必要となる代表的なコピュラは、相関の強さを示すパラメータを付したパラメトリック・コピュラが殆どである。
  • 以下に代表的なコピュラを示す:
種類
C_{\theta}(u,v)の形式
パラメータ範囲
独立
クレイトン \left(\max\left(u^{-\theta}+v^{-\theta}-1,0\right)\right)^{-\frac{1}{\theta}} \theta\in[-1,0)\cup(0,\infty) \theta\rightarrow0
グンベル \exp\left(-\left\{\left(-\log u\right)^{\theta+1}+\left(-\log v\right)^{\theta+1} \right\}^{\frac{1}{\theta+1}}\right) \theta\in[0,\infty) \theta=0
フランク -\displaystyle{\frac{1}{\theta}}\log\left(1+\displaystyle{\frac{\left(e^{-\theta u}-1\right)\left(e^{-\theta v}-1\right)}{e^{-\theta}-1}}\right) \theta\in(-\infty,0)\cup(0,\infty) \theta\rightarrow0
ジョー 1-\left( (1-u)^{\theta}+(1-v)^{\theta}-(1-u)^{\theta}(1-v)^{\theta}\right)^{\frac{1}{\theta}} \theta\in[1,\infty) \theta=1
GB uv\exp\left(-\theta\log u\log v\right) \theta\in[0,1] \theta=0
CC uv\exp\left\{\theta(1-u)(1-v)\right\} \theta\in[-1,1] \theta=0
AMH \displaystyle{\frac{uv}{1-\theta(1-u)(1-v)}} \theta\in[-1,1] \theta=0
FGM uv+\theta u(1-u)v(1-v) \theta\in[-1,1] \theta=0
正規 \Phi_{\theta}\left(\Phi^{-1}(u),\Phi^{-1}(v)\right) \theta\in(-1,1) \theta=0
ブラケット \displaystyle{\frac{1+(\theta-1)(u+v)-\sqrt{D_{\theta}(u,v)}}{2(\theta-1)}} \theta\in(0,1)\cup(1,\infty) \theta\rightarrow1
マーディア \displaystyle{\frac{\theta^2(1+\theta)}{2}}M(u,v)+(1-\theta^2)uv+\displaystyle{\frac{\theta^2(1-\theta)}{2}}W(u,v) \theta\in[-1,1] \theta=0
BB1 \left[\left\{\left(u^{-\alpha}-1\right)^{\beta}+\left(v^{-\alpha}-1\right)^{\beta}\right\}^{\frac{1}{\beta}}+1\right]^{-\frac{1}{\alpha}} \alpha\gt0,\beta\geq1 \alpha\rightarrow0,\beta=1
フレシェ \alpha M(u,v)+(1-\alpha-\beta)\Pi(u,v)+\beta W(u,v) \alpha,\beta\in[0,1],\alpha+\beta\leq1 \alpha=\beta=0
MO u^{1-\alpha}v\ (u^{\alpha}\geq v^{\beta}), uv^{1-\beta}\ (u^{\alpha}\lt v^{\beta}) 0\leq\alpha,\beta\leq1 \alpha=\beta=0
t \Psi_{\alpha,\nu}\left(\Psi_{\nu}^{-1}(u),\Psi_{\nu}^{-1}(v)\right) \alpha\in(-1,1) \alpha=0,\nu\rightarrow\infty
一般化FGM uv\left\{1+\alpha(1-u)^{\beta}(1-v)^{\beta}\right\} -1\leq\alpha\leq\left(\displaystyle{\frac{\beta+1}{\beta-1}}\right)^{\beta-1} \alpha=0
一般化FGM uv\left\{1+\alpha(1-u^{\beta})(1-v^{\beta})\right\} -\displaystyle{\frac{1}{\beta^2}}\leq\alpha\leq\displaystyle{\frac{1}{\beta}} \alpha=0

章末問題

1.


1.  確率変数Xの分布関数をF(x)=P(X\leq x)とし、Fは連続で逆関数F^{-1}を持つとする。確率変数U=F(X)を定義する。
(1) 確率変数U区間[0,1]に値を取ることを示せ。
(2) P(U\leq u)=u,0\leq u\leq1を示せ。

 まず、


\begin{aligned}
U=F(X)=P(X\leq x)
\end{aligned}

である。確率の定義から0\leq P(X\leq x)\leq1だから、U\in[0,1]である。
 次に、U=F(X)に対し、F^{-1}が存在することから、X=F^{-1}(U)が成り立つ。したがって、


\begin{aligned}
F(x)=P(X\leq x)=P(F^{-1}(U)\leq x)=P(F\circ F^{-1}(U)\leq F(x) )=P(U\leq F(x))
\end{aligned}

で、u=F(x)とおけば、0\leq u\leq1であり、


\begin{aligned}
P(U\leq u)=u
\end{aligned}

である。

2.


2.  パラメータ\alpha,\beta\gt0のガンマ分布の密度関数は以下である:


\begin{aligned}
f(x)=\displaystyle{\frac{1}{\Gamma(\alpha)\beta^\alpha}x^{\alpha-1}\exp\left(-\frac{x}{\beta}\right)},x\gt0
\end{aligned}

ここに\Gamma(\cdot)はガンマ関数である。

(1) 平均E[X]=\alpha\beta、分散V[X]=\alpha\beta^2を示せ。
(2) 平均E[X]=1、分散V[X]=\thetaとなるガンマ分布の密度関数を書け。

  • (1)平均と分散を求める。


\begin{aligned}
E\left[X\right]=&\displaystyle{\int_{0}^{\infty}x f(x)}dx\\
=&\displaystyle{\int_{0}^{\infty}x\frac{1}{\Gamma(\alpha)\beta^{\alpha}}x^{\alpha-1}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)}dx\\
=&\displaystyle{\frac{\beta}{\Gamma(\alpha)}\int_{0}^{\infty}\left(\frac{x}{\beta}\right)^{\alpha}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)}dx\\
=&\displaystyle{\frac{\beta}{\Gamma(\alpha)}}\left\{\left[-\beta\left(\frac{x}{\beta}\right)^{\alpha}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)\right]_{0}^{\infty}+\alpha\displaystyle{\int_{0}^{\infty}\left(\frac{x}{\beta}\right)^{\alpha-1}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)}dx\right\}\\
=&\displaystyle{\frac{\beta}{\Gamma(\alpha)}}\alpha\Gamma(\alpha)\\
=&\alpha\beta\\
V\left[X\right]=&\displaystyle{\int_{0}^{\infty}(x-E[X])^2 f(x)}dx\\
=&\displaystyle{\int_{0}^{\infty}(x-\alpha\beta)^2\frac{1}{\Gamma(\alpha)\beta^{\alpha}}x^{\alpha-1}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)}dx\\
=&\displaystyle{\frac{\beta^2}{\Gamma(\alpha)}\int_{0}^{\infty}\left(\frac{x}{\beta}\right)^{\alpha+1}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)}dx\\
&-2\alpha\beta\displaystyle{\frac{1}{\Gamma(\alpha)}\int_{0}^{\infty}\left(\frac{x}{\beta}\right)^{\alpha}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)}dx\\
&+\displaystyle{\frac{(\alpha\beta)^2}{\Gamma(\alpha)}\int_{0}^{\infty}\left(\frac{x}{\beta}\right)^{\alpha-1}\exp\left(-\displaystyle{\frac{x}{\beta}}\right)}dx\\
=&\displaystyle{\frac{\beta}{\Gamma(\alpha)}(\alpha+1)\Gamma(\alpha+1)}-2(\alpha\beta)^2+\displaystyle{\frac{(\alpha\beta)^2}{\Gamma(\alpha)}\Gamma(\alpha)}\\
=&\alpha(\alpha+1)\beta^2-2(\alpha\beta)^2+(\alpha\beta)^2\\
=&\alpha\beta^2
\end{aligned}

  • (2) 平均E[X]=1,分散V[X]=\thetaの場合。

 (1)の結果から、


\begin{aligned}
E[X]&=\alpha\beta=1,V[X]&=\alpha\beta^2\theta
\end{aligned}

だから、\beta=\theta, \alpha=\displaystyle{\frac{1}{\theta}}である。これらを代入することで、


\begin{aligned}
f(x)=\displaystyle{\frac{1}{\Gamma\left(\displaystyle{\frac{1}{\theta}}\right)}x^{\frac{1}{\theta}-1}\exp\left(-\displaystyle{\frac{x}{\theta}}\right) }
\end{aligned}

である。

3.


3.  非負確率変数XX=Z^2,Z\sim N(0,1)で定義する。
(1) Xの分布関数がF(x)=P(X\leq x)=2\Phi(\sqrt{x}),x\geq0を示せ。
(2) X確率密度関数
\begin{aligned}f(x)=\displaystyle{\frac{1}{\sqrt{2\pi x}}\exp\left(-\displaystyle{\frac{x}{2}}\right)}\end{aligned}
になることを示せ。
(3) 上記の密度関数がガンマ分布で表せることを示せ。

  • (1) X=Z^2,Z\sim N(0,1)について、


\begin{aligned}
F(x)&=P(X\leq x)=P(Z^2\leq x)\\
&=P(-\sqrt{x}\leq Z\leq\sqrt{x})\\
&=\displaystyle{\int_{-\sqrt{x}}^{\sqrt{x}}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)}dz
\end{aligned}

である。被積分関数zに関する偶関数であるから、


\begin{aligned}
F(x)&=\displaystyle{\int_{-\sqrt{x}}^{\sqrt{x}}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)}dz\\
&=2\displaystyle{\int_{0}^{\sqrt{x}}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)}dz\\
&=2\left(\Phi(\sqrt{x})-\Phi(0)\right)\\
&=2\Phi(\sqrt{x})
\end{aligned}

を得る。

  • (2)


\begin{aligned}
f(x)&=\displaystyle{\frac{dF(x)}{dx}}\\
&=2\displaystyle{\frac{d}{dx}}\left(\displaystyle{\int_{0}^{\sqrt{x}}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)}dz\right)\\
&=2\displaystyle{\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x}{2}\right)\cdot\frac{1}{2\sqrt{x}}}\\
&=\displaystyle{\frac{1}{\sqrt{2\pi x}}\exp\left(-\frac{x}{2}\right)}
\end{aligned}

  • (3)\Gamma\left(\displaystyle{\frac{1}{2}}\right)=\sqrt{\pi}より、ガンマ分布において\alpha=\displaystyle{\frac{1}{2}},\beta=2とおけば、(2)で示した確率密度関数を得る。

4.


4.  X\sim N(\mu,\sigma^2),X\sim Logist(\mu,\sigma)の場合、平均とメディアンがいずれも\muであることを示せ。

X\sim N(\mu,\sigma^2)に対し、

\begin{aligned}
E\left[X\right]=\displaystyle{\int_{-\infty}^{\infty}x \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} }dx
\end{aligned}

である。Z=\displaystyle{\frac{1}{\sigma}}(X-\mu)とおくと、dX=\sigma dZであり、Z:-\infty\rightarrow\inftyである。したがって、

\begin{aligned}
E\left[X\right]=&\displaystyle{\int_{-\infty}^{\infty}\left(\sigma z+\mu\right)\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{\left(\displaystyle{\sigma z}\right)^2}{2\sigma^2}\right\}\sigma}dz\\
=&\displaystyle{\frac{\sigma}{\sqrt{2\pi}}\int_{-\infty}^{\infty}z\exp\left(-\frac{z^2}{2}\right)}dz+\mu\displaystyle{\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)}dz\\
=&\displaystyle{\frac{\sigma}{\sqrt{2\pi}}\int_{-\infty}^{\infty}z\exp\left(-\frac{z^2}{2}\right)}dz+\mu\\
=&\left[-\exp\left(\displaystyle{-\frac{z^2}{2}}\right)\right]_{-\infty}^{\infty}+\mu\\
=&\mu
\end{aligned}

を得る。次に、Xのメディアンをmとおく。Z=\displaystyle{\frac{1}{\sigma}}(X-\mu)とおけば、Zのメディアンをm_0として、m=\sigma m_0+\muである。標準正規分布の分布関数を\Phi(z)、密度関数を\varphi(z)とおけば、密度関数のzに対する対称性から、

\begin{aligned}
&\displaystyle{\int_{-\infty}^{\infty}\varphi(z)}dz=2\displaystyle{\int_{-\infty}^{0}\varphi(z)}dz=1\\
\therefore&\displaystyle{\int_{-\infty}^{0}\varphi(z)}dz=\Phi(0)=\displaystyle{\frac{1}{2}}
\end{aligned}

である。これはZのメディアンm_00であることに他ならない。したがって、m=\sigma\cdot0+\mu=\muを得る。

  • ロジスティック分布について

 x=z\sigma+\muとおけば、z=\displaystyle{\frac{x-\mu}{\sigma}}であり、dx=\sigma dzである。

\begin{aligned}
E\left[X\right]=&\displaystyle{\int_{-\infty}^{\infty}x\frac{\exp\left\{\displaystyle{\frac{-(x-\mu)}{\sigma}}\right\}}{\sigma\left[1+\exp\left\{\displaystyle{\frac{-(x-\mu)}{\sigma}}\right\}\right]^2}}dx\\
=&\displaystyle{\int_{-\infty}^{\infty}(z\sigma+\mu)\frac{e^{-z}}{\left(1+e^{-z}\right)^2}}dz\\
=&\sigma\displaystyle{\int_{-\infty}^{\infty}z\frac{e^{-z}}{\left(1+e^{-z}\right)^2}}dz+\mu\displaystyle{\int_{-\infty}^{\infty}\frac{e^{-z}}{\left(1+e^{-z}\right)^2}}dz\\
=&\sigma\displaystyle{\int_{-\infty}^{\infty}z\frac{e^{-z}}{\left(1+e^{-z}\right)^2}}dz+\mu\left[\displaystyle{\frac{1}{\left(1+e^{-z}\right)}}\right]_{-\infty}^{\infty}\\
=&\sigma\displaystyle{\int_{-\infty}^{\infty}z\frac{e^{-z}}{\left(1+e^{-z}\right)^2}}dz+\mu
\end{aligned}

第1項の被積分関数zに関する奇関数であるから第1項の積分0である。したがって、

\begin{aligned}
E\left[X\right]=&\mu
\end{aligned}

である。
 次に、ロジスティック分布の分布関数はF(x)=\displaystyle{\frac{1}{1+\exp\left(-\frac{x-\mu}{\sigma}\right)}}であるから、そのメディアンをmとおけば、

\begin{aligned}
&\displaystyle{\frac{1}{1+\exp\left(-\frac{m-\mu}{\sigma}\right)}}=\displaystyle{\frac{1}{2}}\\
\Leftrightarrow&2=1+\exp\left(-\frac{m-\mu}{\sigma}\right)\\
\Leftrightarrow&\displaystyle{\frac{m-\mu}{\sigma}}=0\\
\Leftrightarrow&m=\mu
\end{aligned}

を得る。

*1:確率は、試行(たとえば「コインを1枚投げて表が出ること」)と区間[0,1]を対応付けるものである。これに対し、表が出ることを1,裏が出ることを0で表すと確率変数Xを定義して、X区間[0,1]を対応付けるのが分布関数である。こうすることで実数と実数を対応付けることができ、数学的な取り扱いが便利になる。

*2:慣習なので必ずしもこうというわけではない。

*3:確率変数が離散値を取る場合はこの限りではないが、ここでは議論を省略する。

*4:逆関数F^{-1}が存在すると仮定する。なお、一般には逆関数が存在しない確率分布でも同様の議論をできるように擬逆関数を定義するが、ここでは議論しない。

*5:他の分布であれば値の出やすさも一般に相違する。

*6:ここでは、(0,1),(-0.5,0.5)が該当する。

*7:母数を定数と見るのは頻度論的解釈であり、ベイズ統計学の下では相違する。ここでは頻度論での議論をする。

*8:母数が複数ある場合はベクトル表記することもある。特定の分布では慣習的に決まったギリシア文字が当てられることが多い(たとえば正規分布であると平均は\mu、分散は\sigma^2)。

*9:必ずしも持つ分布を仮定するとは限らない。全くもってパラメータを持たない分布をノンパラメトリック分布と呼び、一部をパラメトリック分布のように明示的な関数形で考慮し、別の母数は明示的に取り込まないような分布をセミパラメトリック分布という。

プライバシーポリシー お問い合わせ