統計学に習熟するには線形代数の習得が不可欠である。が、初等的な線形代数ではカバーしきれないような分野も存在する。そこで以下の参考書
を基により高等な線形代数を学ぶ。
3. 固有値と固有ベクトル
3.3 固有値の極値特性
固有値の極値特性を考える意義を検討するのに以下の例を考える。
例 正準変量分析
個の異なった集団からの各個人
について
個の変数
が測定され、各集団間の平均
で見た差異を同定したいとする。このために全体平均
を用いて集団平均に対するその集団の平均の偏差
を用いることとする。また以下の平均和積和行列(sum of squares and cross products matrix)を構成する:
ある特定の単位ベクトル
に対して
は
の方向における
個の集団間の差異に関する指標を与える。この値が
である場合、集団がこの方向において同一の平均を有することを意味する。これに対して
が大きければその方向において集団間に大きな差異が存在することを意味する。
が
の順序付けられた固有値
に対応する規格化された固有ベクトルであるならば、これまでの定理から、全体平均からの偏差という観点における
個の集団間の最も大きな差は
で与えられる方向に生じる。そして
に直交するすべての方向のうち、
が
個の集団間における差を表す。もし一部の固有値が相対的に非常に小さければ、それ(ら)を無視することで次元を効率的に減らすことができる。
(例:主成分分析
今度は分散を用いて集団間の差異を把握する分析を考える。確率ベクトルは分散共分散行列
を持つものとする。また
の分散を可能な限り小さくする
を見つけ出したいとする。このとき
である。
あるに対して
となるような
を取り、
としていくことで分散を恣意的に大きくすることができるため、
の尺度の大きさから受ける影響を減らすべく、たとえば
となるような
に対して分散を最大化するように考えればよい。このとき
内におけるある軸(直線)の方向を探していることになる。この直線はそこに射影された
の観測値が最大化されるものである。この方向は
の最も大きな固有値に対応するような規格化された固有ベクトルによって与えられる。2つ目の方向は
の2番目に大きい固有値に対応するような規格化された固有ベクトルで与えられる。このような手順を繰り返すことで
個の方向を得られる。
ここまでの操作は元来の軸を新しい直交軸の集合とする回転を見出すことである。そして各軸はその軸に対する観測値の分散を最大化するように選択される。
変換後のの要素は
の主成分と呼ばれ、それらは無相関になる。それは、
としたときに
だからである。
のみを示すこととする。
行列を定義する。ここで各
は固有値
に対応する
の正規直交固有ベクトルだとする。
は
を満たす
行列であるから、前述の定理により
が成り立つ。いまを満たすような任意の行列
に対して、行列
は
行列であり、その列は線形従属でなければならない。そのため、
を満たすようなが存在する。したがって
が成立する。ここでである。このため
を得る。以上から
が成立する。 )