Pythonによるデータ分析(その10/X) - 「大人の教養・知識・気付き」を伸ばすブログ

　仕事上、早々に $\mathrm{Python}$ を使えるようにしないといけないため、

Pythonによるデータ分析入門第2版 ―NumPy、pandasを使ったデータ処理

作者:Wes McKinney
オライリー・ジャパン

Amazon

を基に学んでいく。

前回

power-of-awareness.com

前回
3.　NumPyの基礎：配列とベクトル演算
- 3.6　行列計算
- 3.7　擬似乱数生成

3.　NumPyの基礎：配列とベクトル演算

　 $\mathrm{NumPy}$ は" $\mathrm{Numerical\ Python}$ "の意味で $\mathrm{Python}$ での数値計算におけるもっとも重要な基本パッケージの1つである。

3.6　行列計算

　 $\mathrm{NumPy}$ では**がアダマール積(対応する要素ごと)を意味するため、 $\mathrm{dot}()$ で内積を計算する。

関数	説明
$\mathrm{diag}$	正方行列の対角成分を返す。
$\mathrm{dot}$	2つの行列の内積を計算する。
$\mathrm{trace}$	対角成分の総和(トレース)を計算する。
$\mathrm{det}$	行列式を計算する。
$\mathrm{eig}$	正方行列に対して固有値および固有ベクトルを計算する。
$\mathrm{inv}$	正方行列に対して逆行列を計算する。
$\mathrm{pinv}$	$\mathrm{Moore}$ - $\mathrm{Penrose}$ 型疑似逆行列を求める。
$\mathrm{qr}$	$\mathrm{QR}$ 分解を行なう。
$\mathrm{svd}$	特異値分解を計算する。
$\mathrm{solve}$	正方行列 $A$ に対して線形方程式 $Ax=b$ を $x$ について解く。
$\mathrm{lstsq}$	$Ax=b$ に対して最小二乗法による近似を求める。

################
### 行列計算 ###
################

import numpy as np
from numpy.linalg import inv, qr

x = np.array([[1.,2.,3.],[4.,5.,6.]])
y = np.array([[6.,23.],[-1,7,],[8,9]])

print(x)
print(y)

# これらは等価
dot1 = x.dot(y)
dot2 = np.dot(x,y)
dot3 = x @ y

print(dot1)
print(dot2)
print(dot3)

# 標準的な計算
X = np.random.randn(5,5)

mat = X.T.dot(X) # 転置行列と元の行列との内積
print(mat)

inv_mat = inv(mat) # 逆行列
print(inv_mat)

print(mat.dot(inv(mat))) # 行列×逆行列

q, r = qr(mat) # QR分解
print(r)

3.7　擬似乱数生成

　 $\mathrm{NumPy}$ は組み込みの $\mathrm{random}$ を補完する形で $\mathrm{numpy.random}$ モジュールを提供している。

from numpy import random
samples = numpy.random.normal(size = (4, 4))

print(samples)

#
from random import normalvariate
N = 1000000

%timeit samples = [normalvariate(0, 1) for _ in range(N)]
%timeit np.random.normal(size = N)

　擬似乱数のシードは $\mathrm{random.seed}()$ で指定する。ただし $\mathrm{numpy.random}$ モジュールで提供される乱数データ生成関数は、いずれもグローバル乱数シードを参照するため、グローバル参照を避けるには、 $\mathrm{numpy.random.RandomState}()$ を用いる。

関数	説明
$\mathrm{seed}$	乱数生成器のシード。
$\mathrm{permutation}$	引数が配列の場合、その成分をランダムに並べ替えた新しい配列を返す。整数の場合、その引数で $\mathrm{np.arange}$ を呼び出し、結果をランダムに並べ替えた配列を返す。
$\mathrm{shuffle}$	その配列事態の成分をランダムに並べ替える。
$\mathrm{rand}$	連続一様乱数。
$\mathrm{randint}$	与えられた整数範囲内での整数乱数。
$\mathrm{randn}$	標準正規乱数。
$\mathrm{binomial}$	二項乱数。
$\mathrm{normal}$	正規乱数。
$\mathrm{beta}$	ベータ乱数。
$\mathrm{chisquare}$	カイ二乗乱数。
$\mathrm{gamma}$	ガンマ乱数。
$\mathrm{uniform}$	区間 $\left[0,1\right]$ の一様乱数。

########################
### ランダムウォーク ###
########################

import random
import numpy as np
import matplotlib.pyplot as plt

# 
position = 0
walk = [position]
steps = 10000

for i in range(steps):
    step = 1 if random.randint(0,1) else -1
    position += step
    walk.append(position)

plt.plot(walk)

# 
nsteps = 10000
draws = np.random.randint(0, 2, size = nsteps)
steps = np.where(draws > 0, 1, -1)
walk = steps.cumsum()

walk.min()
walk.max()

plt.plot(walk)

前回

3. NumPyの基礎：配列とベクトル演算

3.6 行列計算

3.7 擬似乱数生成

3.　NumPyの基礎：配列とベクトル演算

3.6　行列計算

3.7　擬似乱数生成