統計学に習熟するには線形代数の習得が不可欠である。が、初等的な線形代数ではカバーしきれないような分野も存在する。そこで以下の参考書
を基により高等な線形代数を学ぶ。
前回
4. 行列の因数分解と行列ノルム
4.3 QR分解
4.3.1 例:Mahalanobis距離とEuclid距離の関係
次元確率ベクトル
があり、その平均ベクトルを
分散共分散行列を
(正定値行列だとする。)とする。
の平方根行列を利用して、確率ベクトルを規格化することを考えよう。
を満たすような任意の行列を
とし、
のとき、
とおくと、
が得られる。の分散共分散行列は単位行列であるから、この分布に従う観測値間の距離に関して
距離は測度として意味がある。上述した規格化の線形変換を用いることで、
の観測値間の距離と
の観測値の距離を関連付けることが考えられる。
たとえば観測値とその期待値
との
距離は
が得られる。は
距離であり、この式は
距離は相関や相違する分散の影響を取り除いた上でそうした変換後の点間の
距離を計算していることを主張しているのに他ならない。