統計学に習熟するには線形代数の習得が不可欠である。が、初等的な線形代数ではカバーしきれないような分野も存在する。そこで以下の参考書
を基により高等な線形代数を学ぶ。
4. 行列の因数分解と行列ノルム
4.1 特異値分解
例:多重共線性と特異値分解
標準化された回帰モデル
を考える。これのパラメータに推定値を代入して得た予測値
は内の超平面上に点を与える。
いまは行列の特異値分解だとする。すなわちは次正方行列で、は次直交行列であり、はの固有値の平方根を対角要素に配し、それ以外の要素がであるような行列である。
モデルはと定義することで、
と書き換えることができる。
の対角要素のうち、ちょうど個、特に最後の個がで、をに適切に分割することでが得られると仮定する。ここでは次対角行列である。これはの行空間がの次元部分空間であり、その部分空間はの列によって張られていることを意味している。すなわち当てはめられた回帰超平面上の点は次元の標準化された説明変数空間上に射影されると、実質的に次元部分空間に留まる。
またモデルは
に簡約化される。ここでであり、
で与えられる。またでなければならないため、はの最小二乗推定量を得るのにも利用できる。
更にを用いてと分割すると
を得、両辺に左からを掛けることで
を得る。この恒等式を満たしている限り、任意に選択したに対しては最小二乗推定量になるから、の最小二乗推定量は一意でない。
今度は、で与えられた値を標準化された説明変数として持つような観測対象に対応している目的変数の推定が目的であると想定する。最小二乗推定量を用いることで推定値が得られる。この推定値は一意でない可能性がある。なぜならば、を用いてと分割すると、
が得られるからである。すなわち
が成立する場合にのみは一意になり、このとき唯一の推定値はで与えられる。を満たすすべてのベクトルの集合はの列空間である。したがってを計算するために得られる規格化された説明変数で成立するすべてのベクトルの集まりで張られた空間にが含まれている場合にのみ、は一意に推定される。
多重共線が生じている場合において、は最大階数となるため、行列は対角要素にを持たない代わりに、他の値に比べて値が非常に小さい個の成分を対角成分に持つ。この場合の行空間がのすべてであるが、の行に対応する点はすべての次元部分集合に近接している。これらの点に対応する目的変数の値へ与える小さな変動は、の外側に離れて位置するベクトルに対して当てはめられた回帰超平面の位置合いを実質的に変化させる。
目的変数の小さな変動は交点の直線の位置と平面の傾きの双方に小さな変動をもたらす。しかし回帰平面の傾きは、微小な変動でさえから離れたベクトルについてこの平面の表面に大きな変動をもたらす。
この傾きへの影響は主成分回帰により打ち消すことができる。