「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。データ分析・語学に力点を置いています。 →現在、コンサルタントの雛になるべく、少しずつ勉強中です(※2024年1月21日改訂)。

MENU

やりなおしの数学・線形代数篇(26/26)

 定番書

を基に線形代数を学び直していく。

今日のまとめ

  • 写像A(t)=(a_{ij}(t))_{m,n}に対し各a_{ij}(t)t=aにおいて連続であるとき、A(t)は点aで連続であるという。
  • 極限
    \begin{aligned}\displaystyle{\lim_{t\rightarrow a}\frac{A(t)-A(a)}{t-a}}:=\left(\displaystyle{\lim_{t\rightarrow a}\frac{a_{ij}(t)-a_{ij}(a)}{t-a}}\right)_{m,n}\end{aligned}
    が存在するとき、A(t)は点a微分可能であるという。この値をA(t)の点aにおける微分係数という。
  • 指数級数
    \begin{aligned}\displaystyle{\sum_{p=0}^{\infty}\frac{1}{p!}X^p}\end{aligned}
    は任意の行列Xに対して収束する。これを\exp{X}と書き、写像X\rightarrow\exp{X}を行列の指数関数という。すなわち
    \begin{aligned}\exp{X}=\displaystyle{\sum_{p=0}^{\infty}\frac{1}{p!}}X^p=I+X+\displaystyle{\frac{1}{2!}}X^2+\cdots\end{aligned}
    である。
  • A=(a_{ij})_{m,n}に対して
    \begin{aligned}\|A\|_2=\sqrt{\displaystyle{\sum_{i,j}|a_{ij}|^2}},\|A\|_1=\displaystyle{\sum_{i,j}|a_{ij}|} \end{aligned}
    で2-ノルムおよび1-ノルムを定義する。また
    \begin{aligned}\|A\|_{0}=\displaystyle{\sup_{\|\boldsymbol{x}\|_2=1,\boldsymbol{x}\in\mathbb{R}^n}\|A\boldsymbol{x}\|_2}=\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\frac{\|A\boldsymbol{x}\|_2}{\|x\|_2}}\end{aligned}
    作用素ノルムを定義する。

7. ベクトルおよび行列の解析的取扱い

7.1 ベクトルおよび行列関数の微積


行列写像の連続 写像A(t)=(a_{ij}(t))_{m,n}に対し各a_{ij}(t)t=aにおいて連続であるとき、A(t)は点aで連続であるという。



行列の微分 極限

\begin{aligned}
\displaystyle{\lim_{t\rightarrow a}\frac{A(t)-A(a)}{t-a}}:=\left(\displaystyle{\lim_{t\rightarrow a}\frac{a_{ij}(t)-a_{ij}(a)}{t-a}}\right)_{m,n}
\end{aligned}

が存在するとき、A(t)は点a微分可能であるという。この値をA(t)の点aにおける微分係数という。

 行列の微分は以下の性質を持つ:

  • 微分可能行列関数A(t)=(a_{ij}(t))_{m,n},B(t)=(b_{ij}(t))_{m,n}に対して


\begin{aligned}
( (A+B)(t))^{\prime}=A^{\prime}(t)+B^{\prime}(t)
\end{aligned}

  • 微分可能行列関数A(t)=(a_{ij}(t))_{m,n}および実数値微分可能関数c(t)に対して


\begin{aligned}
(c(t)A(t))^{\prime}=c^{\prime}(t)A(t)+c(t)A^{\prime}(t)
\end{aligned}

  • 微分可能行列関数A(t)=(a_{ij}(t))_{l,m},B(t)=(b_{ij}(t))_{m,n}に対して


\begin{aligned}
(A(t)B(t))^{\prime}=A^{\prime}(t)B(t)+A(t)B^{\prime}(t)
\end{aligned}


\begin{aligned}
(A^{-1}(t))^{\prime}=-A^{-1}(t)\cdot A^{\prime}(t)\cdot A^{-1}(t)
\end{aligned}

(\because A(t)(i,j)余因子を\tilde{a}_{ij}(t)とおくと、A^{-1}(t)(i,j)成分は


\begin{aligned}
\displaystyle{\frac{\tilde{a}_{ji}(t)}{|A(t)|}}
\end{aligned}
である。分母も分子も共にa_{ij}(t)多項式であり、定義より任意のa_{ij}(t)微分可能であるから、これもまた微分可能である。また正則であるから|A(t)|\neq 0が成り立つ。したがってA^{-1}(t)微分可能である。
 また、逆行列の定義および3番目の性質よりA(t) A^{-1}(t)=Iの両辺をtについて微分することで

\begin{aligned}
A^{\prime}(t)A^{-1}(t)+A(t)\left(A^{-1}(t)\right)^{\prime}=O
\end{aligned}

であり、左辺第1項を右辺に移項した上で、両辺に左からA^{-1}(t)を掛けることで


\begin{aligned}
\left(A^{-1}(t)\right)^{\prime}=-A^{\prime}(t)A^{-1}(t)A^{\prime}(t)
\end{aligned}

が得られる。\blacksquare)


行列のTaylor展開 A(t)=(a_{ij}(t))に対して行列のTaylor展開を以下で定義する:

\begin{aligned}
A(t)=\displaystyle{\sum_{p=0}^{\infty}\frac{1}{p!}A^{(p)}(a)(t-a)^{p}}
\end{aligned}

7.2 行列の冪級数

 n次正方行列Aに対して行列の級数


\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}a_p X^p}=a_0 I+a_1 X+a_2 X^2+\cdots
\end{aligned}

Xの冪級数という。


行列の冪級数の収束条件 通常の冪級数

\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}a_p x^p}
\end{aligned}

の収束半径を\rhoとする。このときXのすべての特性根の絶対値が\rhoよりも小さいならば、行列の冪級数は収束する。1つでも大きいものがあれば発散する。

(\because (i) Xが対角行列であるとき、X=(\delta_{ij}x_i)とおくと、Xの特性根はx_1,\cdots,x_nであり、X^p=(\delta_{ij}{x_i}^p)である。したがって行列の冪乗の収束性は

\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}a_p x^p}
\end{aligned}

の収束性に帰着し、主張は正しい。
(ii) XがJordan行列である場合、X=D+NDは対角行列、Nは冪零行列で、DN=ND)とおく。このときN^n=Oとすれば、p\geq nに対して


\begin{aligned}
X^p&=\displaystyle{\sum_{k=0}^{p}{}_{p}C_{k}D^{p-k}N^k}=\displaystyle{\sum_{k=0}^{n-1}{}_{p}C_{k}D^{p-k}N^{k}}\\
&=D^{p}+pD^{p-1}N+\cdots +{}_{p}C_{n-1}D^{p-n+1}N^{n-1}
\end{aligned}

が成り立つ。したがって行列の冪級数の収束性はn個の冪級数\displaystyle{\sum_{p=k}^{\infty}a_p{}_{p}C_{k} D^{p-k}}(k=0,1,\cdots,n-1)の収束性に一致する。これは\displaystyle{\sum_{p=0}^{\infty}a_p x^p}k回だけ項別微分したものの\displaystyle{\frac{1}{k!}}倍であるから、その収束半径は\rhoである。Dは対角行列であるから主張は正しい。
(iii)Xが一般の行列の場合、P正則行列ならば、2つの冪級数


\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}a_p X^p},\displaystyle{\sum_{p=0}^{\infty}a_p\left(P^{-1}AP\right)^p}
\end{aligned}

は同時に収束または発散する。P^{-1}APジョルダン行列になるようにPを選ぶことが可能であるから、(ii)より、主張は正しい。 \blacksquare)


行列の冪級数の収束条件(系) 行列の冪級数が収束するならば

\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}a_p\left(P^{-1}AP\right)^p}
\end{aligned}

も収束し、その和は


\begin{aligned}
P^{-1}\left(\displaystyle{\sum_{p=0}^{\infty}a_p X^p}\right)P
\end{aligned}

に等しい。

7.2.1 行列の指数級数

 指数級数


\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}\frac{1}{p!}X^p}
\end{aligned}

は任意の行列Xに対して収束する。これを\exp{X}と書き、写像X\rightarrow\exp{X}を行列の指数関数という。すなわち


\begin{aligned}
\exp{X}=\displaystyle{\sum_{p=0}^{\infty}\frac{1}{p!}}X^p=I+X+\displaystyle{\frac{1}{2!}}X^2+\cdots
\end{aligned}

である。
 上記から


\begin{aligned}
\exp{P^{-1}XP}=P^{-1}\exp{X}P
\end{aligned}

が成り立つ。X固有値\alpha_1,\cdots,\alpha_nとおけば、\exp{X}固有値\exp{\alpha_1},\cdots,\exp{\alpha_n}ですべて正である。したがって


\begin{aligned}
\mathrm{det} \exp{X}=e^{\mathrm{tr}(A)}
\end{aligned}

が成り立ち、\exp{X}は必ず正則となる。また{}^{t}\left(\exp{X}\right)=\exp\left({}^{t}X\right)が成り立つ。


\begin{aligned}
\displaystyle{\frac{d}{dt}}\exp{tX}=X\exp{tX}
\end{aligned}

である。
 さらに行列X,Yが交換可能ならば


\begin{aligned}
\exp{XY}=\exp{X}\cdot\exp{Y}
\end{aligned}

である。Xが交代行列ならば\exp{X}は直交行列である。逆にすべてのtに対して\exp{tX}が直交行列ならばXは交代行列である。またXが実対称行列ならば\exp{X}は正値対称行列である。逆にすべてのtに対して\exp{tX}が実対称行列ならばXは実対称行列である。実際、Xが交代行列ならば{}^{t}X=-Xが成り立つ。このとき


\begin{aligned}
{}^{t}(\exp{X})=\exp{⁡{}^{t}X}=\exp\left(-X\right)=(\exp{X})^{-1}
\end{aligned}

である。したがって\exp{X}は直交行列である。逆に\exp({}^{t}X)がすべて直交行列ならば


\begin{aligned}
{}^{t}(\exp{tX})(\exp{tX})=I
\end{aligned}

が成り立つが、この両辺をtについて微分t=0を代入することで


\begin{aligned}
{}^{t}X+X=O\Leftrightarrow{}^{t}X=-X
\end{aligned}

となる。
 またXが実対称行列であると仮定する。このとき{}^{t}X=Xが成り立ち、


\begin{aligned}
{}^{t}(\exp{X})=\exp(⁡{}^{t}X)=\exp{X} 
\end{aligned}

であり、Xの各成分が実数であるから\exp{X}\gt Oである。また


\begin{aligned}
{}^{t}(\exp{tX})(\exp{tX})=I
\end{aligned}

の両辺をtに関して微分t=0を代入することで


\begin{aligned}
\ -{}^{t}X+X=O\Leftrightarrow{}^{t}X=X
\end{aligned}
となる。

7.2.2 行列の対数

 Xについてその固有値について|\lambda_i|\lt1,{}^{\forall}i=1,\cdots,nのとき


\begin{aligned}
\log\left(⁡I+X\right):=\displaystyle{\sum_{p=1}^{\infty}\frac{(-1)^{p-1}}{p}X^p}
\end{aligned}

7.2.3  等比級数


\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}X^p}=I+X+X^2+\cdots 
\end{aligned}

は、X固有値の絶対値がすべて1未満であれば収束し、その値は(I-X)^{-1}となる。


\begin{aligned}
(I-X)^{-1}=I+X+X^2+\cdots 
\end{aligned}

実際


\begin{aligned}
S_n=\displaystyle{\sum_{p=0}^{n}X^p} 
\end{aligned}

とおく。X固有値の絶対値がすべて1未満であるから、X^n\rightarrow O(n\rightarrow\infty)であることに注意すると


\begin{aligned}
(I-X)S_n=(I-X)\displaystyle{\sum_{p=0}^{n}X^p}=\displaystyle{\sum_{p=0}^{n}X^p}-\displaystyle{\sum_{p=1}^{n+1}X^p}=I-X^{n+1}\rightarrow I(n\rightarrow\infty)
\end{aligned}

が成り立つ、すなわち


\begin{aligned}
(I-X)^{-1}=I+X+X^2+\cdots 
\end{aligned}

7.3 行列のノルム

 A=(a_{ij})_{m,n}に対して


\begin{aligned}
\|A\|_2=\sqrt{\displaystyle{\sum_{i,j}|a_{ij}|^2}},\|A\|_1=\displaystyle{\sum_{i,j}|a_{ij}|} 
\end{aligned}

で2-ノルムおよび1-ノルムを定義する。また


\begin{aligned}
\|A\|_{0}=\displaystyle{\sup_{\|\boldsymbol{x}\|_2=1,\boldsymbol{x}\in\mathbb{R}^n}\|A\boldsymbol{x}\|_2}=\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\frac{\|A\boldsymbol{x}\|_2}{\|x\|_2}}
\end{aligned}

作用素ノルムを定義する。
 これらについて
  (a) \|A\|\gt0。また\|A\|=0ならばA=O
  (b) A,Bの型が一致するならば、\|A+B\|\leq\|A\|+\|B\|
  (c) \|cA\|=|c|\|A\|
  (d) 積ABが定義できるならば\|AB\|\leq\|A\|\|B\|
が成り立つ。\|A\|_0について、実際、


\begin{aligned}
\|A\|_0=\displaystyle{\sup_{\|x\|_2=1,\boldsymbol{x}\in\mathbb{R}^n}\sqrt{\displaystyle{\sum_{i,j}|a_{ij}x_i|^2}}}
\end{aligned}

であり、任意のi,jに対し\displaystyle{\sqrt{\sum_{i,j}|a_{ij}x_i|^2}}\geq0であるから\|A\|_0\geq0である。また\|A\|_0=0を仮定する。


\begin{aligned}
\displaystyle{\sup_{\|x\|_2=1,\boldsymbol{x}\in\mathbb{R}^n}\sqrt{\sum_{i,j}|a_{ij}x_i|^2}}=0
\end{aligned}

であるが、任意のi,jに対し\supの定義から


\begin{aligned}
0\leq\displaystyle{\sqrt{\sum_{i,j}|a_{ij}x_i|^2}}\leq\displaystyle{\sup_{\|x\|_2=1,\boldsymbol{x}\in\mathbb{R}^n}\sqrt{\sum_{i,j}|a_{ij}x_i|^2}}=0
\end{aligned}

となる。したがって任意のi,jに対して


\begin{aligned}
\sqrt{\displaystyle{\sum_{i,j}|a_{ij}x_i|^2}}=0\Leftrightarrow a_{ij}x_i=0
\end{aligned}

となるからA=Oである。

 次に2-ノルムでの成立を前提とすれば


\begin{aligned}
\|A+B\|_0&=\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\frac{\|(A+B)\boldsymbol{x}\|}{\|\boldsymbol{x}\|_2}}\leq\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\frac{\|A\boldsymbol{x}\|+\|B\boldsymbol{x}\|}{\|\boldsymbol{x}\|_2}}\\
&=\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\frac{\|A\boldsymbol{x}\|}{\|\boldsymbol{x}\|_2}}+
\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\frac{\|B\boldsymbol{x}\|}{\|\boldsymbol{x}\|_2}}\\
&=\|A\|_0+\|B\|_0
\end{aligned}

 さらに


\begin{aligned}
\|cA\|_0&=\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\|cAx\|_2}=\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\sqrt{\displaystyle{\sum_{i,j}}|c a_{ij} x_i|^2}}\\
&=|c|\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\sqrt{\displaystyle{\sum_{i,j}}|a_{ij} x_i|^2}}\\
&=|c|\|A\|_0
\end{aligned}

 そして


\begin{aligned}
\|AB\|_0&=\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\|AB\boldsymbol{x}\|_2}\\
&\leq\left(\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\|A\boldsymbol{x}\|_2}\right)\left(\displaystyle{\sup_{\boldsymbol{x}\neq\boldsymbol{0},\boldsymbol{x}\in\mathbb{R}^n}\|B\boldsymbol{x}\|_2}\right)\\
&=\|A\|_0\|B\|_0
\end{aligned}

また


\begin{aligned}
\|A\|_1\geq\|A\|_2\geq\|A\|_0\geq\displaystyle{\frac{1}{n^2}}\|A\|_1
\end{aligned}

が成り立つため、無限列\{A_p\}A_0に収束するための条件


\begin{aligned}
\displaystyle{\lim_{p\rightarrow\infty}\|A_0-A_p\|}=0
\end{aligned}

はいずれのノルムに対しても成り立つ。

7.3.1 Cauchyの収束判定法

 (m,n)型行列の無限列\{A_p\}が収束するためには任意の正数\varepsilonに対し充分大きなp_0を選んで、q,r\geq p_0である限り\|A_r-A_q\|\lt\varepsilonが成り立つようにできることが必要十分である。

7.3.2 行列の絶対収束

 (m,n)型行列の級数\displaystyle{\sum_{p=0}^{\infty}A_p}に対して\displaystyle{\sum_{p=0}^{\infty}\|A_p\|}収束するならば、元の級数も収束する。このとき級数\displaystyle{\sum_{p=0}^{\infty}A_p}は絶対収束するという。
 また正方行列Aに対して冪級数


\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}|a_p|\|A\|^p}
\end{aligned}

が収束するならば、行列の冪級数


\begin{aligned}
\displaystyle{\sum_{p=0}^{\infty}a_p A^p}
\end{aligned}

は収束する。
 行列空間M_{(m,n)}(\mathbb{R})の部分集合SからM_{m^{\prime},n^{\prime}}(\mathbb{R})への写像\rhoA\in Sで連続であるとは、任意の正数\varepsilonに対し充分小さい\delta\gt0を取ると、\|X-A\|\lt\delta\gt0であるような任意のX\in Sに対して\|\rho(X)-\rho(A)\|\lt\varepsilonが成り立つことである。

プライバシーポリシー お問い合わせ