統計学に習熟するには線形代数の習得が不可欠である。が、初等的な線形代数ではカバーしきれないような分野も存在する。そこで以下の参考書
を基により高等な線形代数を学ぶ。
3. 固有値と固有ベクトル
3.3 固有値の極値特性
固有値の極値特性を考える意義を検討するのに以下の例を考える。
例 正準変量分析
個の異なった集団からの各個人について個の変数が測定され、各集団間の平均で見た差異を同定したいとする。このために全体平均を用いて集団平均に対するその集団の平均の偏差を用いることとする。また以下の平均和積和行列(sum of squares and cross products matrix)を構成する:
ある特定の単位ベクトルに対してはの方向における個の集団間の差異に関する指標を与える。この値がである場合、集団がこの方向において同一の平均を有することを意味する。これに対してが大きければその方向において集団間に大きな差異が存在することを意味する。
がの順序付けられた固有値に対応する規格化された固有ベクトルであるならば、これまでの定理から、全体平均からの偏差という観点における個の集団間の最も大きな差はで与えられる方向に生じる。そしてに直交するすべての方向のうち、が個の集団間における差を表す。もし一部の固有値が相対的に非常に小さければ、それ(ら)を無視することで次元を効率的に減らすことができる。
( 同様の手順で示すことができるため、最初の式例:主成分分析
今度は分散を用いて集団間の差異を把握する分析を考える。確率ベクトルは分散共分散行列を持つものとする。またの分散を可能な限り小さくするを見つけ出したいとする。このときである。
あるに対してとなるようなを取り、としていくことで分散を恣意的に大きくすることができるため、の尺度の大きさから受ける影響を減らすべく、たとえばとなるようなに対して分散を最大化するように考えればよい。このとき内におけるある軸(直線)の方向を探していることになる。この直線はそこに射影されたの観測値が最大化されるものである。この方向はの最も大きな固有値に対応するような規格化された固有ベクトルによって与えられる。2つ目の方向はの2番目に大きい固有値に対応するような規格化された固有ベクトルで与えられる。このような手順を繰り返すことで個の方向を得られる。
ここまでの操作は元来の軸を新しい直交軸の集合とする回転を見出すことである。そして各軸はその軸に対する観測値の分散を最大化するように選択される。
変換後のの要素はの主成分と呼ばれ、それらは無相関になる。それは、としたときにだからである。
のみを示すこととする。
行列を定義する。ここで各は固有値に対応するの正規直交固有ベクトルだとする。はを満たす行列であるから、前述の定理により
が成り立つ。いまを満たすような任意の行列に対して、行列は行列であり、その列は線形従属でなければならない。そのため、
を満たすようなが存在する。したがって
が成立する。ここでである。このため
を得る。以上から
が成立する。 )