統計学に習熟するには線形代数の習得が不可欠である。が、初等的な線形代数ではカバーしきれないような分野も存在する。そこで以下の参考書
を基により高等な線形代数を学ぶ。
3. 固有値と固有ベクトル
3.5 非負定値行列
の固有値と固有ベクトルを用いて群平均の相違を分析する正準変量分析を過去に論じた。このときスケールの影響を取り除くため、商を考えたのだった。このとき各群の分散共分散行列が単位行列でない(群に所属する各個体に相関がある)場合、不適切な結果が得られる場合がある。
たとえば各群が共通して分散共分散行列を持つと仮定する。分散共分散行列を持つ確率ベクトルがあるとき、で定義される方向におけるの分散は
で表される。
バラつきが大きい方向における群間の差はバラツキが小さい方向においてみられる差よりも重要性が低いと考えられる。そこでこのバラつきの差を
を用いることで修正する。
この比率を最大にするようなはバラツキの差異を補正した上で最も群間の差が大きくなるようなの1次元部分空間を特定することになる。次にとが無相関である範囲内で、上記の比率を最大化するようなベクトルを探す。これを続けることでを定めることが可能であり、これら各々が上記比率の個の極値を与える。これを特定するのが以下の定理である。
を用いてとおくと、であり、はと同様で対称で正則な行列ということになる、このときの固有値はの固有値に等しく、の対称性から、この行列は正規直交な固有ベクトルを持っているはずである。ここでを用いれば、と表すことができる。したがって
であり、また
である。以上からはの固有値に対応した固有ベクトルであり、であることが分かる。が正規直交であることから、ベクトルが線形独立であることは明らかである。そこであとは最小かおよび最大化を含む高騰式のみを示せばよい。手続きが同様なので最小化のみを示す。
まずを代入することで
を得る。ここでの行はの固有ベクトルの転置であるから、上式はに等しいことが分かり、これは既に示したようにと等しい。 )
あるいは、これと同等な