「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。目下、データ分析・語学に力点を置いています。

MENU

本気で学ぶ統計学(11/31)

 統計学を真剣に学ぶ人のために、個人的にまとめているノートを公開する。
 底本として

を用いる。

3. 代表的な一次元確率分布

 有名な1次元確率分布を紹介する。代表値の値や特徴的な性質についても同様に述べることとする。全体に共通して利用できる公式を導出しておく。すなわち


\begin{aligned}
V[X]=E[X^2]-\{E[X]\}^2
\end{aligned}


が成り立つ。

3.2 連続型確率分布

 連続な確率変数Xの従う分布について各種統計量を導出する

3.2.12 対数正規分布

 確率変数X確率密度関数



\begin{aligned}
f_X(x)=\displaystyle{\frac{1}{\sqrt{2\pi\sigma^2}x}\exp\left\{-\displaystyle{\frac{(\log x-\mu)^2}{2\sigma^2}}\right\}}\boldsymbol{1}_{[0,\infty)}(x)
\end{aligned}


と書けるとき確率変数Xは対数正規分布LN(\mu,\sigma^2)に従うという。また確率変数Y正規分布に従うときZ=e^{Y}は対数正規分布に従う。

  • 密度関数の性質を満たすことの確認


\begin{aligned}
\displaystyle{\int_{0}^{\infty}f_X(x)}dx=\displaystyle{\frac{1}{\sqrt{2\pi\sigma^2}}\int_{0}^{\infty}x^{-1}\exp\left\{-\displaystyle{\frac{(\log x-\mu)^2}{2\sigma^2}}\right\}dx}
\end{aligned}


を得る。ここで\sqrt{2\sigma^2}y+\mu=\log xとおくとx=e^{\sqrt{2\sigma^2}y+\mu},dx=\sqrt{2\sigma^2}e^{\sqrt{2\sigma^2}y+\mu}dyである。
x:0\rightarrow\inftyのときy:0\rightarrow\inftyであり



\begin{aligned}
\displaystyle{\int_{0}^{\infty}f_X(x)}dx&=\displaystyle{\frac{1}{\sqrt{2\pi\sigma^2}}\int_{0}^{\infty}e^{-(\sqrt{2\sigma^2}y+\mu)}e^{-y^2}\cdot\left(\sqrt{2\sigma^2}e^{\sqrt{2\sigma^2}y+\mu}\right)}dy\\
&=\displaystyle{\frac{1}{\sqrt{\pi}}\int_{0}^{\infty}e^{-y^2}}dy
\end{aligned}


が得られる。\displaystyle{\int_{0}^{\infty}e^{-y^2}}dy=Iとおくとe^{-y^2}\gt0だからI\gt0であり、



\begin{aligned}
I^2&=\left(\displaystyle{\int_{0}^{\infty}e^{-x^2}}dx\right)\left(\displaystyle{\int_{0}^{\infty}e^{-y^2}}dy\right)\\
&=\displaystyle{\int_{0}^{\infty}dx\int_{0}^{\infty}e^{-(x^2+y^2)}}dy
\end{aligned}


が成り立つ。ここでx=r\cos\theta,y=r\sin\theta,\ r\gt0,0\leq\theta\lt2\piとおくと、ヤコビ行列J



\begin{aligned}
J&=\displaystyle{\frac{\partial(x,y)}{\partial(r,\theta)}}\\
&=\begin{bmatrix}
\displaystyle{\frac{\partial x}{\partial r}}&\displaystyle{\frac{\partial x}{\partial\theta}}\\
\displaystyle{\frac{\partial y}{\partial r}}&\displaystyle{\frac{\partial y}{\partial\theta}}
\end{bmatrix}
&=\begin{bmatrix}
\cos\theta&-r\sin\theta\\
\sin\theta&r\cos\theta
\end{bmatrix}
\end{aligned}


である。したがって



\begin{aligned}
I^2&=\displaystyle{\int_{0}^{\infty}dr\int_{0}^{2\pi}d\theta e^{-r^2}\begin{vmatrix}\cos\theta&-r\sin\theta\\\sin\theta&r\cos\theta\end{vmatrix}}\\
&=\displaystyle{\int_{0}^{2\pi}d\theta\int_{0}^{\infty}re^{-r^2}}dr\\
&=2\pi\displaystyle{\int_{0}^{\infty}\left(-\displaystyle{\frac{1}{2}}\right)(-r^2)^{\prime}e^{-r^2}}dr\\
&=\pi\left[e^{-r^2}\right]_{\infty}^{0}=\pi\\
\therefore\ I&=\sqrt{\pi}
\end{aligned}


が成り立つ。以上から



\begin{aligned}
\displaystyle{\int_{0}^{\infty}f_X(x)}dx=\displaystyle{\frac{1}{\sqrt{\pi}}}\cdot\sqrt{\pi}=1
\end{aligned}


である。

  • 平均:\exp\left(\mu+\displaystyle{\frac{\sigma^2}{2}}\right)

 Y\sim N(\mu,\sigma^2)についてX=e^{Y}とおくと、



\begin{aligned}
E[X]&=\displaystyle{e^{y}f_Y(y)}dy\\
&=\displaystyle{\frac{1}{\sqrt{2\pi\sigma^2}}\int_{-\infty}^{\infty}\exp\left\{-\displaystyle{\frac{(y-\mu)^2}{2\sigma^2}}+y\right\}}\\
&=\displaystyle{\frac{1}{\sqrt{2\pi\sigma^2}}\int_{-\infty}^{\infty}\exp\left\{-\displaystyle{\frac{1}{2\sigma^2}}(y-\mu-\sigma^2)^2+\mu+\displaystyle{\frac{\sigma^2}{2}}\right\}}dy\\
\end{aligned}


である。y-\mu-\sigma^2=tとおくとdy=dtであり、y:-\infty\rightarrow\inftyのときにt:-\infty\rightarrow\inftyである。したがって



\begin{aligned}
E[X]&=\displaystyle{\exp\left(\mu+\displaystyle{\frac{\sigma^2}{2}}\right)\frac{1}{\sqrt{2\pi\sigma^2}}\int_{-\infty}^{\infty}e^{-\frac{t^2}{2\sigma^2}}}dt
\end{aligned}


である。右辺の積分部分はGauss積分に他ならず、正規分布の場合と同様の手順で\sqrt{2\pi\sigma^2}であるから、



\begin{aligned}
E[X]&=\displaystyle{\exp\left(\mu+\displaystyle{\frac{\sigma^2}{2}}\right)\frac{1}{\sqrt{2\pi\sigma^2}}\sqrt{2\pi\sigma^2}}\\
&=\exp\left(\mu+\displaystyle{\frac{\sigma^2}{2}}\right)
\end{aligned}


を得る。

  • 分散:(e^{\sigma^2}-1)e^{2\mu+\sigma^2}


\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=E[X^2]-exp\left(2\mu*\sigma^2\right)
\end{aligned}


である。E[X^2]=E[e^{2Y}]は平均の場合と同様に計算することで



\begin{aligned}
E[X^2]&=\displaystyle{\int_{-\infty}^{\infty}x^2\frac{1}{\sqrt{2\pi\sigma^2}x}\exp\left\{-\displaystyle{\frac{1}{2}\left(\frac{\log x-\mu}{\sigma}\right)^2}\right\}}\\
&=\displaystyle{\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\displaystyle{\frac{1}{2\sigma^2}}\{t^2-2(\mu+2\sigma^2)t+\mu^2\}\right\} }\\
&=e^{2\mu+2\sigma^2}\displaystyle{\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\displaystyle{\frac{1}{2}}\left(\frac{s-\mu}{\sigma}\right)^2\right\}}ds\\
&=e^{2\mu+2\sigma^2}
\end{aligned}


を得る。したがって



\begin{aligned}
V[X]=e^{2\mu+2\sigma^2}-e^{2\mu*\sigma^2}=e^{2\mu+\sigma^2}(e^{\sigma^2}-1)
\end{aligned}


である。

3.2.13 ワイブル分布

 確率変数X確率密度関数



\begin{aligned}
f_X(x)=\displaystyle{\frac{bx^{b-1}}{a^b}\exp\left\{-\left(\displaystyle{\frac{x}{a}}\right)^b\right\}}\boldsymbol{1}_{\left[0,\infty\right.)}(x)
\end{aligned}


に従うとき、Xはワイブル分布W(a,b)に従うという。

  • 密度関数の性質を満たすことの確認


\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx=\displaystyle{\int_{0}^{\infty}\frac{bx^{b-1}}{a^b}\exp\left\{-\left(\displaystyle{\frac{x}{a}}\right)^b\right\}}dx\\
\end{aligned}


である。ここで



\begin{aligned}
\left(\displaystyle{\frac{x}{a}}\right)^b=t
\end{aligned}


とおくとx=at^{\frac{1}{b}}であり、dx=\displaystyle{\frac{a}{b}}t^{\frac{1}{b}}dtであるから、



\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx&=\displaystyle{\int_{0}^{\infty}\frac{bx^{b-1}}{a^b}\exp\left\{-\left(\displaystyle{\frac{x}{a}}\right)^b\right\}}dx\\
&=\displaystyle{\frac{b}{a}\int_{0}^{\infty}t^{1-\frac{1}{b}} e^{-t}}\displaystyle{\frac{a}{b}}t^{\frac{1}{b}}dt\\
&=\displaystyle{\int_{0}^{\infty}t^{1} e^{-t}}dt
\end{aligned}


を得る。これはガンマ関数\Gamma(2)に他ならず、その値は1である。

  • 平均:a\Gamma\left(\displaystyle{\frac{b+1}{b}}\right)


\begin{aligned}
E[X]=\displaystyle{\int_{0}^{\infty}x\frac{bx^{b-1}}{a^b}\exp\left\{-\left(\displaystyle{\frac{x}{a}}\right)^b\right\}}dx\\
\end{aligned}


である。ここで



\begin{aligned}
\left(\displaystyle{\frac{x}{a}}\right)^b=t
\end{aligned}


とおくとx=at^{\frac{1}{b}}であり、dx=\displaystyle{\frac{a}{b}}t^{\frac{1}{b}}dtであるから、



\begin{aligned}
E[X]=\displaystyle{a\int_{0}^{\infty}t^{\frac{b+1}{b}-1}e^{-t}}dt
\end{aligned}


であるが、上式右辺の積分部分はガンマ関数に他ならない。したがって



\begin{aligned}
E[X]=a\Gamma\left(\displaystyle{\frac{b+1}{b}}\right)
\end{aligned}


を得る。

  • 分散:a^2\left(\Gamma\left(\displaystyle{\frac{b+2}{b}}\right)-\left[\Gamma\left(\displaystyle{\frac{b+1}{b}}\right)\right]^2\right)


\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=E[X^2]-\left[\Gamma\left(\displaystyle{\frac{b+1}{b}}\right)\right]^2
\end{aligned}


である。また



\begin{aligned}
E[X^2]&=\displaystyle{\int_{0}^{\infty}x^2\frac{bx^{b-1}}{a^b}\exp\left\{-\left(\displaystyle{\frac{x}{a}}\right)^b\right\}}dx\\
&=a^2\displaystyle{\int_{0}^{\infty}t^{\frac{2}{b}}e^{-t}}dt\\
&=a^2\displaystyle{\int_{0}^{\infty}t^{\frac{b+2}{b}-1}e^{-t}}dt\\
&=a^2\Gamma\left(\displaystyle{\frac{b+2}{b}}\right)
\end{aligned}


であるから



\begin{aligned}
a^2\left(\Gamma\left(\displaystyle{\frac{b+2}{b}}\right)-\left[\Gamma\left(\displaystyle{\frac{b+1}{b}}\right)\right]^2\right)
\end{aligned}


を得る。

3.2.14 二重指数分布

 確率変数X確率密度関数



\begin{aligned}
f_X(x)=\displaystyle{\frac{1}{2b}\exp\left(-\frac{|x-\mu|}{b}\right)}
\end{aligned}


であるとき、Xは二重指数分布(Laplace分布)\mathrm{Laplace(\mu,b)}に従うという。

  • 密度関数の性質を満たすことの確認


\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx&=\displaystyle{\frac{1}{2b}\int_{-\infty}^{\infty}\exp\left(-\frac{|x-\mu|}{b}\right)}dx\\
&=\displaystyle{\frac{1}{2b}\left\{\int_{-\infty}^{\mu}\exp\left(\frac{x-\mu}{b}\right)dx+\int_{\mu}^{\infty}\exp\left(-\frac{x-\mu}{b}\right)dx\right\}}
\end{aligned}


であり、



\begin{aligned}
\displaystyle{\int_{-\infty}^{\mu}\exp\left(\frac{x-\mu}{b}\right)dx}&=b\left[\exp\left(\frac{x-\mu}{b}\right)\right]_{-\infty}^{\mu}=b,\\
\displaystyle{\int_{\mu}^{\infty}\exp\left(-\frac{x-\mu}{b}\right)dx}&=-b\left[\exp\left(\frac{\mu-x}{b}\right)\right]_{\mu}^{\infty}=b
\end{aligned}


を代入することで



\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx=1
\end{aligned}


を得る。

  • 平均:\mu


\begin{aligned}
E[X]&=\displaystyle{\int_{-\infty}^{\infty}x\frac{1}{2b}\exp\left(-\displaystyle{\frac{|x-\mu|}{b}}\right)}dx\\
&=\displaystyle{\int_{\mu}^{\infty}x\frac{1}{2b}\exp\left(-\displaystyle{\frac{x-\mu}{b}}\right)}dx-
\displaystyle{\int_{-\infty}^{\mu}x\frac{1}{2b}\exp\left(-\displaystyle{\frac{x-\mu}{b}}\right)}dx\\
&=\displaystyle{\frac{1}{2}\left\{e^{-\frac{\mu}{b}}\int_{-\infty}^{\mu}\frac{x}{b}\exp\left(\displaystyle{\frac{x}{b}}\right)dx+e^{\frac{\mu}{b}}\int_{\mu}^{\infty}\frac{x}{b}\exp\left(-\displaystyle{\frac{x}{b}}\right)dx\right\}}
\end{aligned}


である。最右辺の各積分y=\displaystyle{\frac{x}{b}}とおけば、x=by, dx=bdyおよびx:-\infty\rightarrow\mu,x:\mu\rightarrow\inftyのときy:-\infty\rightarrow\displaystyle{\frac{\mu}{b}},\displaystyle{\frac{\mu}{b}}\rightarrow\inftyであるから、



\begin{aligned}
\displaystyle{\int_{-\infty}^{\mu}\frac{x}{b}\exp\left(\displaystyle{\frac{x}{b}}\right)}dx&=b\displaystyle{\int_{-\infty}^{\frac{\mu}{b}}y e^{y}}dy\\
&=b\left\{\left[te^y\right]_{-\infty}^{\frac{\mu}{b}}-\displaystyle{\int_{-\infty}^{\frac{\mu}{b}}e^{y}}dy\right\}\\
&=\displaystyle{\mu e^{\frac{\mu}{b}}}-b[e^y]_{-\infty}^{\frac{\mu}{b}}\\
&=(\mu-b)e^{\frac{\mu}{b}},\\
\displaystyle{\int_{\mu}^{\infty}\frac{x}{b}\exp\left(-\displaystyle{\frac{x}{b}}\right)}dx&=b\displaystyle{\int_{\frac{\mu}{b}}^{\infty}y e^{-y}}dy\\
&=b\left\{\left[-te^{-y}\right]_{\frac{\mu}{b}}^{\infty}+\displaystyle{\int_{\frac{\mu}{b}}^{\infty}e^{-y}}dy\right\}\\
&=\mu e^{-\frac{\mu}{b}}+b\left[-e^{-y}\right]_{\frac{\mu}{b}}^{\infty}\\
&=(\mu+b) e^{-\frac{\mu}{b}}
\end{aligned}


である。これらを代入することで



\begin{aligned}
E[X]&=\displaystyle{\frac{1}{2}\left\{e^{-\frac{\mu}{b}}\int_{-\infty}^{\mu}\frac{x}{b}\exp\left(\displaystyle{\frac{x}{b}}\right)dx+e^{\frac{\mu}{b}}\int_{\mu}^{\infty}\frac{x}{b}\exp\left(-\displaystyle{\frac{x}{b}}\right)dx\right\}}\\
&=\displaystyle{\frac{1}{2}}\left\{(\mu-b)+(\mu+b)\right\}\\
&=\mu
\end{aligned}


が成り立つ。

  • 分散:2b^2


\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=E[X^2]-\mu^2
\end{aligned}


であり、



\begin{aligned}
E[X^2]&=\displaystyle{\int_{-\infty}^{\infty}x^2\frac{1}{2b}\exp\left(-\displaystyle{\frac{|x-\mu|}{b}}\right)}dx\\
&=\displaystyle{\int_{\mu}^{\infty}x^2\frac{1}{2b}\exp\left(-\displaystyle{\frac{x-\mu}{b}}\right)}dx-
\displaystyle{\int_{-\infty}^{\mu}x^2\frac{1}{2b}\exp\left(-\displaystyle{\frac{x-\mu}{b}}\right)}dx\\
&=\displaystyle{\frac{b}{2}\left\{e^{-\frac{\mu}{b}}\int_{-\infty}^{\mu}\left(\frac{x}{b}\right)^2\exp\left(\displaystyle{\frac{x}{b}}\right)dx+e^{\frac{\mu}{b}}\int_{\mu}^{\infty}\left(\frac{x}{b}\right)^2\exp\left(-\displaystyle{\frac{x}{b}}\right)dx\right\}}
\end{aligned}


である。最右辺の各積分y=\displaystyle{\frac{x}{b}}とおけば、x=by, dx=bdyおよびx:-\infty\rightarrow\mu,x:\mu\rightarrow\inftyのときy:-\infty\rightarrow\displaystyle{\frac{\mu}{b}},\displaystyle{\frac{\mu}{b}}\rightarrow\inftyであるから、



\begin{aligned}
\displaystyle{\int_{-\infty}^{\mu}\left(\frac{x}{b}\right)^2\exp\left(\displaystyle{\frac{x}{b}}\right)}dx&=
b\displaystyle{\int_{-\infty}^{\frac{\mu}{b}}y^2e^{y}}dy\\
&=b\left[y^2e^{y}\right]_{-\infty}^{\frac{\mu}{b}}-2b\displaystyle{\int_{-\infty}^{\frac{\mu}{b}}ye^{y}}dy\\
&=\displaystyle{\frac{\mu^2}{b}e^{\frac{\mu}{b}}}-2b(\mu-b)e^{\frac{\mu}{b}}\\
\displaystyle{\int_{\mu}^{\infty}\left(\frac{x}{b}\right)^2\exp\left(-\displaystyle{\frac{x}{b}}\right)}dx&=
b\displaystyle{\int_{\frac{\mu}{b}}^{\infty}y^2e^{-y}}dy\\
&=b\left[-y^2e^{-y}\right]_{\frac{\mu}{b}}^{\infty}+2b\displaystyle{\int_{\frac{\mu}{b}}^{\infty}ye^{-y}}dy\\
&=\displaystyle{\frac{\mu^2}{b}e^{-\frac{\mu}{b}}}+2b(\mu+b)e^{-\frac{\mu}{b}}\\
\end{aligned}


を得る。これらを代入することで



\begin{aligned}
E[X^2]&=\displaystyle{\frac{b}{2}\left\{
e^{-\frac{\mu}{b}}\left(
\frac{\mu^2}{b}e^{\frac{\mu}{b}}-2b(\mu-b)e^{\frac{\mu}{b}}\right)+
e^{\frac{\mu}{b}}\left(
\frac{\mu^2}{b}e^{-\frac{\mu}{b}}+2b(\mu+b)e^{-\frac{\mu}{b}}\right)
\right\}
}\\
&=\displaystyle{\frac{1}{2}\left\{\mu^2-2b(\mu-b)+\mu^2+2b(\mu+b)\right\}}\\
&=\mu^2+2b^2
\end{aligned}


である。したがって



\begin{aligned}
V[X]&=E[X^2]-\mu^2\\
&=\mu^2+2b^2-\mu^2\\
&=2b^2
\end{aligned}


を得る。

3.2.15 パレート分布

 確率変数X確率密度関数



\begin{aligned}
f_X(x)=\displaystyle{\frac{\beta\alpha^{\beta}}{x^{\beta+1}}}\boldsymbol{1}_{[\alpha,\infty)}(x),\ \alpha\gt0,\beta\gt0
\end{aligned}


であるとき、Xはパレート分布\mathrm{Par}(\alpha,\beta)に従うという。

  • 密度関数の性質を満たすことの確認


\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx&=\displaystyle{\beta\alpha^{\beta}\int_{\alpha}^{\infty}x^{-\beta-1}}dx\\
&=\beta\alpha^{\beta}\left[-\displaystyle{\frac{x^{-\beta}}{\beta}}\right]_{\alpha}^{\infty}\\
&=\beta\alpha^{\beta}\displaystyle{\frac{\alpha^{-\beta}}{\beta}}\\
&=1
\end{aligned}


である。

  • 平均:\displaystyle{\frac{\beta\alpha}{\beta-1}}(\beta\gt1),\infty(\beta\leq1)


\begin{aligned}
E[X]&=\displaystyle{\int_{\alpha}^{\infty}x\frac{\beta\alpha^{\beta}}{x^{\beta+1}}}dx\\
&=\beta\alpha^{\beta}\displaystyle{\int_{\alpha}^{\infty}x^{-\beta}}dx\\
&=\beta\alpha^{\beta}\left[\displaystyle{\frac{x^{-(\beta-1)}}{\beta-1}}\right]_{\alpha}^{\infty}\\
&=\begin{cases}
\displaystyle{\frac{\beta\alpha}{\beta-1}},&\beta\gt1,\\
\infty,&\beta\leq1
\end{cases}
\end{aligned}

  • 分散:\displaystyle{\frac{\beta\alpha^2}{(\beta-1)^2(\beta-2)}}(\beta\gt2),\infty(\beta\leq2)


\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=\displaystyle{\int_{\alpha}^{\infty}x^2\frac{\beta\alpha^{\beta}}{x^{\beta+1}}}dx-\{E[X]\}^2\\
&=\beta\alpha^{\beta}\displaystyle{\int_{\alpha}^{\infty}x^{-\beta+1}}dx-\{E[X]\}^2\\
\end{aligned}


である。最右辺第1項の積分について\beta\neq2と仮定すれば



\begin{aligned}
\displaystyle{\int_{\alpha}^{\infty}x^{-\beta+1}}dx&=\left[-\displaystyle{\frac{x^{-\beta+2}}{\beta-2}}\right]_{\alpha}^{\infty}\\
&=\left[-\displaystyle{\frac{x^{-\beta+2}}{\beta-2}}\right]_{\alpha}^{\infty}\\
&=\begin{cases}
\displaystyle{\frac{\alpha^{-\beta+2}}{\beta-2}},&\beta\gt2,\\
\infty,&\beta\lt2
\end{cases}
\end{aligned}


を得る。仮定とまとめることで



\begin{aligned}
\displaystyle{\int_{\alpha}^{\infty}x^{-\beta+1}}dx&=\left[\displaystyle{\frac{x^{-\beta+2}}{\beta-2}}\right]_{\alpha}^{\infty}\\
&=\begin{cases}
\displaystyle{\frac{\alpha^{-\beta+2}}{\beta-2}},&\beta\gt2,\\
\infty,&\beta\leq2
\end{cases}
\end{aligned}


を得る。期待値の結果を踏まえれば



\begin{aligned}
\{E[X]\}^2&=\begin{cases}
\displaystyle{\frac{\beta^2\alpha^2}{(\beta-1)^2}},&\beta\gt1,\\
\infty,&\beta\leq1
\end{cases}
\end{aligned}


であることから、まとめると



\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=\beta\alpha^{\beta}\displaystyle{\int_{\alpha}^{\infty}x^{-\beta+1}}dx-\{E[X]\}^2\\
&=\begin{cases}
\displaystyle{\frac{\beta\alpha^2}{(\beta-2)(\beta-1)^2}},&\beta\gt2,\\
\infty,&1\lt\beta\leq2,\\
不定(定義できない),&\beta\leq1
\end{cases}
\end{aligned}


を得る。

3.2.15 グンベル分布

 確率変数X確率密度関数



\begin{aligned}
f_X(x)=\displaystyle{\frac{1}{\theta}e^{-\frac{x-\mu}{\theta}}}\exp\left\{-\exp\left(-\displaystyle{\frac{x-\mu}{\theta}}\right)\right\}
\end{aligned}


であるとき、Xはグンベル分布\mathrm{Gb}(\mu,\theta)に従うという*1

  • 密度関数の性質を満たすことの確認


\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx&=\displaystyle{\int_{-\infty}^{\infty}\frac{1}{\theta}e^{-\frac{x-\mu}{\theta}}e^{-e^{-\frac{x-\mu}{\theta}}}}dx\\
\end{aligned}


である。ここでz=e^{-\frac{x-\mu}{\theta}}とおけばx=\mu-\theta\log zでありdx=-\displaystyle{\frac{\theta}{z}}dzを得る。またx:-\infty\rightarrow\inftyのときz:\infty\rightarrow0であるから



\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx&=\displaystyle{\int_{-\infty}^{\infty}\frac{1}{\theta}e^{-\frac{x-\mu}{\theta}}e^{-e^{-\frac{x-\mu}{\theta}}}}dx\\
&=\frac{1}{\theta}\displaystyle{\int_{0}^{\infty}z e^{-z}}dx\\
&=\frac{1}{\theta}\left(\left[-z e^{-z}\right]_{\infty}^{0}+\displaystyle{\int_{\infty}^{0}e^{-z}}dx\right)\\
&=1
\end{aligned}

である。

  • 平均:E[X]=\mu+\gamma\theta(\gamma\mathrm{Euler}の定数)


\begin{aligned}
E[X]&=\displaystyle{\int_{-\infty}^{\infty}xf_X(x)}dx\\
&=\displaystyle{\int_{-\infty}^{\infty}x\frac{1}{\theta}e^{-\frac{x-\mu}{\theta}}e^{-e^{-\frac{x-\mu}{\theta}}}}dx\\
\end{aligned}


である。ここでz=e^{-\frac{x-\mu}{\theta}}とおけばx=\mu-\theta\log zでありdx=-\displaystyle{\frac{\theta}{z}}dzを得る。またx:-\infty\rightarrow\inftyのときz:\infty\rightarrow0であるから



\begin{aligned}
E[X]&=\displaystyle{\int_{-\infty}^{\infty}x\frac{1}{\theta}e^{-\frac{x-\mu}{\theta}}e^{-e^{-\frac{x-\mu}{\theta}}}}dx\\
&=\displaystyle{\int_{\infty}^{0}(\mu-\theta\log z)\frac{z}{\theta}e^{-z}\left(-\displaystyle{\frac{\theta}{z}}dz\right)}\\
&=\displaystyle{\int_{0}^{\infty}(\mu-\theta\log z)\frac{\theta}{z}\frac{z}{\theta}e^{-z}}dz\\
&=\displaystyle{\int_{0}^{\infty}(\mu-\theta\log z)e^{-z}}dz\\
&=\mu\displaystyle{\int_{0}^{\infty}e^{-z}}dz-\theta\displaystyle{\int_{0}^{\infty}(\log z)e^{-z}}dz\\
&=\mu-\theta\displaystyle{\int_{0}^{\infty}(\log z)e^{-z}}dz\\
\end{aligned}


を得る。ここで



\begin{aligned}
\displaystyle{\int_{0}^{\infty}(\log z)e^{-z}}dz=-\gamma\in\mathbb{R}
\end{aligned}


とある定数(\mathrm{Euler}の定数)になることが知られている。したがって



\begin{aligned}
E[X]=\mu+\gamma\theta
\end{aligned}


を得る。

  • 分散:\displaystyle{\frac{\theta^2\pi^2}{6}}


\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=\displaystyle{\int_{-\infty}^{\infty}x^2\frac{1}{\theta}e^{-\frac{x-\mu}{\theta}}e^{-e^{-\frac{x-\mu}{\theta}}}}dx-(\mu+\gamma\theta)^2
\end{aligned}


である。ここでz=e^{-\frac{x-\mu}{\theta}}とおけばx=\mu-\theta\log zでありdx=-\displaystyle{\frac{\theta}{z}}dzを得る。またx:-\infty\rightarrow\inftyのときz:\infty\rightarrow0であるから



\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=\displaystyle{\int_{-\infty}^{\infty}x^2\frac{1}{\theta}e^{-\frac{x-\mu}{\theta}}e^{-e^{-\frac{x-\mu}{\theta}}}}dx-(\mu+\gamma\theta)^2\\
&=\displaystyle{\int_{0}^{\infty}(\mu-\theta\log z)^2\frac{1}{\theta}ze^{-z}\frac{\theta}{z}}dz-(\mu+\gamma\theta)^2\\
&=\displaystyle{\int_{0}^{\infty}(\mu-\theta\log z)^2e^{-z}}dz-(\mu+\gamma\theta)^2\\
&=\mu^2\displaystyle{\int_{0}^{\infty}e^{-z}}dz-2\mu\theta\displaystyle{\int_{0}^{\infty}\log ze^{-z}}dz+\theta^2\displaystyle{\int_{0}^{\infty}(\log z)^2e^{-z}}dz-(\mu+\gamma\theta)^2\\
&=\mu^2+2\mu\theta\gamma+\theta^2\displaystyle{\int_{0}^{\infty}(\log z)^2e^{-z}}dz-(\mu+\gamma\theta)^2\\
&=\theta^2\left(\displaystyle{\int_{0}^{\infty}(\log z)^2e^{-z}}dz-\gamma^2\right)
\end{aligned}


を得る。\displaystyle{\int_{0}^{\infty}e^{-z}(\log z)^2}dz=\gamma^2+\displaystyle{\frac{\pi^2}{6}}を代入することで



\begin{aligned}
V[X]&=\theta^2\left(\gamma^2+\displaystyle{\frac{\pi^2}{6}}-\gamma^2\right)\\
&=\displaystyle{\frac{\theta^2\pi^2}{6}}
\end{aligned}


を得る。

3.2.17 ロジスティック分布

 確率変数X確率密度関数



\begin{aligned}
f_X(x)=\displaystyle{\frac{\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)}{s\left\{1+\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)\right\}^2}}
\end{aligned}


に従うとき、Xは位置母数\mu,尺度母数sのロジスティック分布に従うという。

  • 密度関数の性質を満たすことの確認


\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx&=\displaystyle{\frac{1}{s}\int_{-\infty}^{\infty}\frac{\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)}{\left\{1+\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)\right\}^2}}dx
\end{aligned}


である。ここで\displaystyle{\frac{1}{1+\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)}}=yとおくとx=\mu-s\log\left(\displaystyle{\frac{1-y}{y}}\right)であり、dx=s\displaystyle{\frac{1}{y(1-y)}}dyを満たす。またx:-\infty\rightarrow\inftyのときy:0\rightarrow1であるから



\begin{aligned}
\displaystyle{\int_{-\infty}^{\infty}f_X(x)}dx&=\displaystyle{\int_{0}^{1}y^2\frac{1}{y(1-y)}\left(\displaystyle{\frac{1}{y}}-1\right)}dy\\
&=\displaystyle{\int_{0}^{1}dy}\\
&=1
\end{aligned}


を得る。

  • 平均:\mu


\begin{aligned}
E[X]&=\displaystyle{\int_{-\infty}^{\infty}xf_X(x)}dx\\
&=\displaystyle{\frac{1}{s}\int_{-\infty}^{\infty}x\frac{\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)}{\left\{1+\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)\right\}^2}}dx
\end{aligned}


である。ここで\displaystyle{\frac{1}{1+\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)}}=yとおくとx=\mu-s\log\left(\displaystyle{\frac{1-y}{y}}\right)であり、dx=s\displaystyle{\frac{1}{y(1-y)}}dyを満たす。またx:-\infty\rightarrow\inftyのときy:0\rightarrow1であるから



\begin{aligned}
E[X]&=\displaystyle{\int_{0}^{1}\left\{\mu-s\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}y^2\frac{1}{y(1-y)}\left(\displaystyle{\frac{1}{y}}-1\right)}dy\\
&=\displaystyle{\int_{0}^{1}\left\{\mu-s\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}}dy\\
&=\mu-s\displaystyle{\int_{0}^{1}\log\left(\displaystyle{\frac{1-y}{y}}\right)}dy
\end{aligned}


である。最右辺第2項の積分について



\begin{aligned}
\displaystyle{\int_{0}^{1}\log\left(\displaystyle{\frac{1-y}{y}}\right)}&=\displaystyle{\int_{0}^{1}(\log(1-y)-\log y)dy}\\
&=\displaystyle{\int_{0}^{1}\log(1-y)dy}-\displaystyle{\int_{0}^{1}\log ydy}\\
&=\displaystyle{\int_{0}^{1}\log tdt}-\displaystyle{\int_{0}^{1}\log ydy}(t=1-y,dt=-dy)\\
&=0
\end{aligned}


であるから、したがって



\begin{aligned}
E[X]=\mu
\end{aligned}


を得る。

  • 分散:\displaystyle{\frac{s^2\pi^2}{3}}


\begin{aligned}
V[X]&=E[X^2]-\{E[X]\}^2\\
&=E[X^2]-\mu^2\\
\end{aligned}


である。右辺第1項について



\begin{aligned}
E[X^2]&=\displaystyle{\frac{1}{s}\int_{-\infty}^{\infty}x^2\frac{\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)}{\left\{1+\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)\right\}^2}}dx
\end{aligned}


である。ここで\displaystyle{\frac{1}{1+\exp\left(-\displaystyle{\frac{x-\mu}{s}}\right)}}=yとおくとx=\mu-s\log\left(\displaystyle{\frac{1-y}{y}}\right)であり、dx=s\displaystyle{\frac{1}{y(1-y)}}dyを満たす。またx:-\infty\rightarrow\inftyのときy:0\rightarrow1であるから



\begin{aligned}
E[X^2]&=\displaystyle{\int_{0}^{1}\left\{\mu-s\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}^2y^2\frac{1}{y(1-y)}\left(\displaystyle{\frac{1}{y}}-1\right)}dy\\
&=\displaystyle{\int_{0}^{1}\left\{\mu-s\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}^2}dy\\
&=\mu^2-2\mu s\displaystyle{\int_{0}^{1}\log\left(\displaystyle{\frac{1-y}{y}}\right)}dy+s^2\displaystyle{\int_{0}^{1}\left\{\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}^2}dy\\
&=\mu^2+s^2\displaystyle{\int_{0}^{1}\left\{\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}^2}dy\\
\end{aligned}


である。最右辺第2項の積分



\begin{aligned}
\displaystyle{\int_{0}^{1}\left\{\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}^2}dy&=\displaystyle{\int_{0}^{1}\left(\log(1-y)-\log y\right)^2}dy\\
&=\displaystyle{\int_{0}^{1}\left\{\left(\log(1-y)\right)^2-2\log(1-y)\log y+\left(\log y\right)^2\right\}}dy\\
&=\displaystyle{\int_{0}^{1}\left(\log(1-y)\right)^2}dy-2\displaystyle{\int_{0}^{1}\left\{\log(1-y)\log y\right\}}dy+\displaystyle{\int_{0}^{1}\left(\log y\right)^2}dy
\end{aligned}


であり、最右辺の各積分について



\begin{aligned}
\displaystyle{\int_{0}^{1}\left(\log(1-y)\right)^2}dy&=-\displaystyle{\int_{1}^{0}\left(\log t\right)^2}dt(t=1-y)\\
&=\displaystyle{\int_{0}^{1}\left(\log t\right)^2}dt\\
&=\left[x\left(\log t\right)^2\right]_{0}^{1}-2\displaystyle{\int_{0}^{1}\log t}dt\\
&=2\\
\displaystyle{\int_{0}^{1}\left(\log y\right)^2}dy&=2
\end{aligned}


を得る。第2項の積分は、\log(1-y)yに関するMacLaurin展開により



\begin{aligned}
\log(1-y)=-\displaystyle{\sum_{n=1}^{\infty}\frac{y^n}{n}}
\end{aligned}


が成り立つことに注意すれば、



\begin{aligned}
\displaystyle{\int_{0}^{1}\left(\log(1-y)\log y\right)}dy&=\displaystyle{\int_{0}^{1}\log y\left(\sum_{n=1}^{\infty}\frac{y^n}{n}\right)}dy\\
&=-\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n}\int_{0}^{1}y^n\log y}dy\\
&=-\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n}\left[\frac{y^{n+1}}{n+1}\left(\log y-\displaystyle{\frac{1}{n+1}}\right)\right]_{0}^{1}}dy\\
&=-\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n}\frac{1}{n+1}\left(0-\displaystyle{\frac{1}{n+1}}\right)}\\
&=\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n}\frac{1}{(n+1)^2}}\\
&=\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n}}-\displaystyle{\sum_{n=1}^{\infty}\frac{1}{(n+1)}}-\displaystyle{\sum_{n=1}^{\infty}\frac{1}{(n+1)^2}}\\
&=\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n(n+1)}}-\left(\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n^2}}-1\right)\\
&=1-\left(\displaystyle{\frac{\pi^2}{6}}-1\right)\\
&=2-\displaystyle{\frac{\pi^2}{6}}
\end{aligned}


である。ここで



\begin{aligned}
\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n(n+1)}}&=
\displaystyle{\lim_{n\rightarrow\infty}\sum_{k=1}^{n}\left(
\displaystyle{\frac{1}{k}}-\displaystyle{\frac{1}{k+1}}\right)}\\
&=\displaystyle{\lim_{n\rightarrow\infty}\sum_{k=1}^{n}\left(1-\displaystyle{\frac{1}{k}}\right)}\\
&=1
\end{aligned}


および\displaystyle{\sum_{n=1}^{\infty}\frac{1}{n^2}}ゼータ関数\zeta(2)=\displaystyle{\frac{\pi^2}{6}}に等しいことを用いた。
 これらの結果を代入することで



\begin{aligned}
\displaystyle{\int_{0}^{1}\left\{\log\left(\displaystyle{\frac{1-y}{y}}\right)\right\}^2}dy&=\displaystyle{\int_{0}^{1}\left\{\left(\log(1-y)\right)^2-2\log(1-y)\log y+\left(\log y\right)^2\right\}}dy\\
&=2-2\left(2-\displaystyle{\frac{\pi^2}{6}}\right)+2\\
&=\displaystyle{\frac{\pi^2}{3}}
\end{aligned}


であり、これはすなわち



\begin{aligned}
E[X^2]=\mu^2+\displaystyle{\frac{s^2\pi^2}{3}}
\end{aligned}


を意味する。したがって



\begin{aligned}
V[X]=\mu^2+\displaystyle{\frac{s^2\pi^2}{3}}-\mu^2=\displaystyle{\frac{s^2\pi^2}{3}}
\end{aligned}


を得る。

参考文献

  • Lehmann, E.L., Casella, George(1998), "Theory of Point Estimation, Second Edition", (Springer)
  • Lehmann, E.L., Romano, Joseph P.(2005), "Testing Statistical Hypotheses, Third Edition", (Springer)
  • Sturges, Herbert A.,(1926), "The Choice of a Class Interval", (Journal of the American Statistical Association, Vol. 21, No. 153 (Mar., 1926)), pp. 65-66
  • 上田拓治(2009)「44の例題で学ぶ統計的検定と推定の解き方」(オーム社)
  • 大田春外(2000)「はじめよう位相空間」(日本評論社)
  • 小西貞則(2010)「多変量解析入門――線形から非線形へ――」(岩波書店)
  • 小西貞則,北川源四郎(2004)「シリーズ予測と発見の科学2 情報量基準」(朝倉書店)
  • 小西貞則,越智義道,大森裕浩(2008)「シリーズ予測と発見の科学5 計算統計学の方法」(朝倉書店)
  • 佐和隆光(1979)「統計ライブラリー 回帰分析」(朝倉書店)
  • 清水泰隆(2019)「統計学への確率論,その先へ ―ゼロからの速度論的理解と漸近理論への架け橋」(内田老鶴圃)
  • 鈴木 武, 山田 作太郎(1996)「数理統計学 基礎から学ぶデータ解析」(内田老鶴圃)
  • 竹内啓・編代表(1989)「統計学辞典」(東洋経済新報社)
  • 竹村彰通(1991)「現代数理統計学」(創文社)
  • 竹村彰通(2020)「新装改訂版 現代数理統計学」(学術図書出版社)
  • 東京大学教養学部統計学教室編(1991)「基礎統計学Ⅰ 基礎統計学」(東京大学出版会)
  • 東京大学教養学部統計学教室編(1994)「基礎統計学Ⅱ 人文・社会科学の統計学」(東京大学出版会)
  • 東京大学教養学部統計学教室編(1992)「基礎統計学Ⅲ 自然科学の統計学」(東京大学出版会)
  • 豊田秀樹(2020)「瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―」(朝倉書店)
  • 永田靖(2003)「サンプルサイズの決め方」(朝倉書店)
  • 柳川堯(2018)「P値 その正しい理解と適用」(近代科学社)

*1:英語読みならばガンベルで、Gumbelの母語であるドイツ語で読めばグンベルが妥当だろう。

プライバシーポリシー お問い合わせ