「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。目下、データ分析・語学に力点を置いています。

MENU

やりなおしの数学・微分積分篇(72/X)

 以下の書籍を参考に、改めて微分積分を復習していく。

今日のまとめ

  • 行列ノルムの性質を議論する。

11. 陰関数定理と逆写像定理

11.4. ベクトル値写像

 陰関数定理の一般形を扱うべく、ベクトル値写像を導入する。

11.4.2 行列のノルム

 (m,n)行列全体の集合をM(m,n)と書くこととする。M(m,n)\mathrm{R}^{m\times n}は行列A=\begin{bmatrix}a_{ij}\end{bmatrix}と点(a_{11},\cdots,a_{a_{mn}})\in\mathbb{R}^{m\times n}を対応付けることで同一視できる。これにより行列のノルムを以下のように導入できる。


行列のノルム A=\begin{bmatrix}a_{ij}\end{bmatrix}\in M(m,n)に対して、そのノルム\left|A\right|_{\mathbb{R}^{m\times n}}


\begin{aligned}
\left|A\right|_{\mathbb{R}^{m\times n}}=\sqrt{\sum_{i=1}^{m}\sum_{j=1}^{n}a_{ij}^2}
\end{aligned}

で定義する。

また\mathbb{R}^n内の点列の収束、\mathbb{R}^nの開集合等の定義と同様に、M(m,n)内の点列の収束や開集合などを定義できる。
 M(m,n)の部分集合O\subset M(m,n)が開集合であるとは、任意のA\in Oに対してある\varepsilon\gt0が存在し、B\in M(m,n)\left|B-A\right|_{\mathbb{R}^{m\times n}}\lt\varepsilonを満たすならばB\in Oが成立することをいう。
 またM(m,n)のノルムとして、


\begin{aligned}
\left|A\right|_{M(m,n)}=\displaystyle{\sup_{\left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1}\left|A\boldsymbol{h}\right|_{\mathbb{R}^m}}
\end{aligned}

という定義も利用される。この値は\left|\cdot\right|_{\mathbb{R}^{m\times n}}と同値になる。具体的な値の計算が難しい一方で、理論的に良い性質を持つ。



行列のsupノルムの性質 I\in M(n,n)単位行列A,B\in M(m,n),\boldsymbol{x}\in\mathbb{R}^n,\lambda\in\mathbb{R}とする。このとき以下が成立する。

  • \left|I\right|_{M(n,n)}=1
  • \left|A\boldsymbol{x}\right|_{\mathbb{R}^m}=\leq\left|A\right|_{M(m,n)}\left|\boldsymbol{x}\right|_{\mathbb{R}^n}
  • \left|A+B\right|_{M(m,n)}\leq\left|A\right|_{M(m,n)}+\left|B\right|_{M(m,n)}
  • \left|\lambda A\right|_{M(m,n)}=\left|\lambda\right|\left|A\right|_{M(m,n)}

(\because まずIに対して\boldsymbol{h}=\begin{bmatrix}h_1\\\vdots\\h_n\end{bmatrix}とおけば


\begin{aligned}
\left|I\right|_{M(n,n)}&=\left|\begin{bmatrix}1&0&\cdots&0&0\\0&1&\cdots&0&0\\\vdots&\vdots&\ddots&\vdots&\vdots\\0&0&\cdots&1&0\\0&0&\cdots&0&1\end{bmatrix}\right|_{M(n,n)}\\
&=\displaystyle{\sup_{\left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1}}\left|\begin{bmatrix}1&0&\cdots&0&0\\0&1&\cdots&0&0\\\vdots&\vdots&\ddots&\vdots&\vdots\\0&0&\cdots&1&0\\0&0&\cdots&0&1\end{bmatrix}\begin{bmatrix}h_1\\\vdots\\h_n\end{bmatrix}\right|\\
&=\displaystyle{\sup_{\left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1}}\left|\begin{bmatrix}h_1\\\vdots\\h_n\end{bmatrix}\right|\\
&=\displaystyle{\sup_{\left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1}}\left|\boldsymbol{h}\right|\\
&=1
\end{aligned}

である。
 次に2番目の不等式について、\boldsymbol{x}=\boldsymbol{0}のときは示すべき不等式の等号が成立する。 \boldsymbol{x}\neq\boldsymbol{0}のとき、


\begin{aligned}
\boldsymbol{h}_{0}=\displaystyle{\frac{\boldsymbol{x}}{\left|\boldsymbol{x}\right|_{\mathbb{R}^n}}}
\end{aligned}

とおけば、\left|\boldsymbol{h}_{0}\right|=1であるから、


\begin{aligned}
\left|A\boldsymbol{h}_{0}\right|_{\mathbb{R}^m}&\leq\displaystyle{\sup_{\left|\boldsymbol{h}\right|_{\mathbb{R}^n\leq1}}\left|A\boldsymbol{h}\right|_{\mathbb{R}^m}}\\
&=\left|A\right|_{M(m,n)}
\end{aligned}

が成り立つ。したがって


\begin{aligned}
\left|A\boldsymbol{x}\right|_{\mathbb{R}^m}&=\left|A\boldsymbol{h}_{0}\right|_{\mathbb{R}^m}\left|\boldsymbol{x}\right|_{\mathbb{R}^n}\\
&\leq\left|A\right|_{M(m,n)}\left|\boldsymbol{x}\right|_{\mathbb{R}^n}
\end{aligned}

を得る。
 更に3番目の不等式について、


\begin{aligned}
\left|(A+B)\boldsymbol{h}\right|_{\mathbb{R}^m}\leq\left|A\boldsymbol{h}\right|_{\mathbb{R}^m}+\left|B\boldsymbol{h}\right|_{\mathbb{R}^m}
\end{aligned}

であるから、\boldsymbol{h}\in\mathbb{R}^n\ \mathrm{s.t.}\ \left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1について、両辺の上限を取ればよい。
 最後の不等式も


\begin{aligned}
\left|\lambda A\boldsymbol{h}\right|_{\mathbb{R}^m}\leq\left|\lambda\right|\left|A\boldsymbol{h}\right|_{\mathbb{R}^m}
\end{aligned}

であるから、\boldsymbol{h}\in\mathbb{R}^n\ \mathrm{s.t.}\ \left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1について、両辺の上限を取ればよい。 \blacksquare)



行列の積に対する\supノルム A\in M(m,n),B\in M(n,k)とする。このときAB\in M(m,k)について


\begin{aligned}
\left|AB\right|_{M(m,k)}\leq\left|A\right|_{M(m,n)}\left|B\right|_{M(n,k)}
\end{aligned}

が成り立つ。

(\because 任意の\boldsymbol{h}\in\mathbb{R}^kに対してB\boldsymbol{h}\in\mathbb{R}^nであることに注意して前述の補題を用いることで


\begin{aligned}
\left|\left(AB\right)\boldsymbol{h}\right|_{\mathbb{R}^{m}}&=\left|A\left(B\right)\boldsymbol{h}\right|_{\mathbb{R}^{m}}\\
&\leq\left|A\right|_{M(m,n)}\left|B\boldsymbol{h}\right|_{\mathbb{R}^{n}}\\
&\leq\left|A\right|_{M(m,n)}\left|B\right|_{M(n,k)}\left|\boldsymbol{h}\right|_{\mathbb{R}^{k}}
\end{aligned}

を得る。\boldsymbol{h}\in\mathbb{R}^n\ \mathrm{s.t.}\ \left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1について、両辺の上限を取ればよい。 \blacksquare)


ベクトル値写像のノルム 開集合\mathit{\Omega}\subset\mathbb{R}^n,\mathit{\Omega}\neq\emptysetに対して、\boldsymbol{f}:\mathit{\Omega}\rightarrow\mathbb{R}^mC^1写像として定義する。\boldsymbol{a},\boldsymbol{a}+\boldsymbol{h}\in\mathbb{R}^nに対して、


\begin{aligned}
\left\{\boldsymbol{a}+t\boldsymbol{h}\left|\right.t\in\left[0,1\right]\right\}\subset\mathit{\Omega}
\end{aligned}

だとする。このとき


\begin{aligned}
\left|\boldsymbol{f}(\boldsymbol{a}+\boldsymbol{h})-\boldsymbol{f}(\boldsymbol{a})\right|_{\mathbb{R}^n}\leq\left|\boldsymbol{h}\right|_{\mathbb{R}^n}\displaystyle{\max_{t\in[0,1]}\left|D\boldsymbol{f}(\boldsymbol{a}+t\boldsymbol{h})\right|_{M(m,n)}}
\end{aligned}

が成り立つ。

(\because \boldsymbol{f}(\boldsymbol{a}+\boldsymbol{h})=\boldsymbol{f}(\boldsymbol{a})ならば明らかであるから、\boldsymbol{f}(\boldsymbol{a}+\boldsymbol{h})-\boldsymbol{f}(\boldsymbol{a})\neq\boldsymbol{0}とする。


\begin{aligned}
\boldsymbol{v}&=\displaystyle{\frac{\boldsymbol{f}(\boldsymbol{a}+\boldsymbol{h})-\boldsymbol{f}(\boldsymbol{a})}{\left|\boldsymbol{f}(\boldsymbol{a}+\boldsymbol{h})-\boldsymbol{f}(\boldsymbol{a})\right|_{\mathbb{R}^m}}},\\
g(t)&=\left(\boldsymbol{v},\boldsymbol{f}(\boldsymbol{a}+t\boldsymbol{h})\right):[0,1]\rightarrow\mathbb{R}
\end{aligned}

とおく。このとき


\begin{aligned}
\left|\boldsymbol{f}(\boldsymbol{a}+\boldsymbol{h})-\boldsymbol{f}(\boldsymbol{a})\right|_{\mathbb{R}^m}&=\left|g(1)-g(0)\right|\\
&\leq\displaystyle{\int_{0}^{1}\left|\frac{dg}{dt}(t)\right|dt}\\
&\leq\displaystyle{\int_{0}^{1}\left(\max_{t\in[0,1]}\left|\frac{dg}{dt}(t)\right|\right)dt}\\
&\leq\displaystyle{\max_{t\in[0,1]}\left|\frac{dg}{dt}(t)\right|\int_{0}^{1}dt}\\
&=\displaystyle{\max_{t\in[0,1]}\left|\frac{dg}{dt}(t)\right|}
\end{aligned}

が成り立つ。したがって


\begin{aligned}
\left|\displaystyle{\frac{dg}{dt}(t)}\right|&=\left|(\boldsymbol{v},D\boldsymbol{f}(\boldsymbol{a}+t\boldsymbol{h})\boldsymbol{h})\right|\\
&\leq\left|\boldsymbol{v}\right|_{\mathbb{R}^m}\left|D\boldsymbol{f}(\boldsymbol{a}+t\boldsymbol{h})\boldsymbol{h}\right|_{\mathbb{R}^m}\\
&\leq\left|\boldsymbol{v}\right|_{\mathbb{R}^m}\left|D\boldsymbol{f}(\boldsymbol{a}+t\boldsymbol{h})\right|_{\mathbb{R}^m}\left|\boldsymbol{h}\right|_{\mathbb{R}^m}\\
&=\left|D\boldsymbol{f}(\boldsymbol{a}+t\boldsymbol{h})\right|_{\mathbb{R}^m}\left|\boldsymbol{h}\right|_{\mathbb{R}^m}
\end{aligned}

が成立する。 \blacksquare)


行列ノルムの同値性 A\in M(m,n)に対して、


\begin{aligned}
\displaystyle{\frac{1}{\sqrt{n}}\left|A\right|_{\mathbb{R}^{m\times n}}}\leq\left|A\right|_{M(m,n)}\leq\left|A\right|_{\mathbb{R}^{m\times n}}
\end{aligned}

が成り立つ。

(\because A


\begin{aligned}
A=\begin{bmatrix}
a_{11}&a_{12}&\cdots&a_{1n}\\
a_{21}&a_{22}&\cdots&a_{2n}\\
\vdots&\vdots&\ddots&\vdots\\
a_{m1}&a_{m2}&\cdots&a_{mn}
\end{bmatrix}
\end{aligned}

とおけば、\boldsymbol{e}_1=\begin{bmatrix}1\\0\\\vdots\\0\end{bmatrix},\cdots,\boldsymbol{e}_n=\begin{bmatrix}0\\0\\\vdots\\1\end{bmatrix}とすれば


\begin{aligned}
A\boldsymbol{e}_j=\begin{bmatrix}a_{1j}\\a_{2j}\\\vdots\\a_{mj}\end{bmatrix}
\end{aligned}

である。このため


\begin{aligned}
\sqrt{\displaystyle{\sum_{i=1}^{m}a_{ij}^2}}=\left|A\boldsymbol{e}_j\right|_{\mathbb{R}^m}\leq\left|A\right|_{M(m,n)}
\end{aligned}

で、


\begin{aligned}
\left|A\right|_{\mathbb{R}^{m\times n}}^2=\displaystyle{\sum_{j=1}^{n}a_{ij}^2}\leq n\left|A\right|_{M(m,n)}
\end{aligned}

が成り立つ。
 次に任意のベクトル\boldsymbol{h}=\begin{bmatrix}h_1\\\vdots\\h_n\end{bmatrix}\in\mathbb{R}^nに対して


\begin{aligned}
A\boldsymbol{h}=\begin{bmatrix}\vdots\\
\displaystyle{\sum_{j=1}^{n}a_{ij}h_j}\\
\vdots
\end{bmatrix}
\end{aligned}

に対して\mathrm{Schwartz}の不等式を適用することで


\begin{aligned}
\left|A\boldsymbol{h}\right|_{\mathbb{R}^m}^2&=\displaystyle{\sum_{i=1}^{m}\left(\displaystyle{\sum_{j=1}^{n}a_{ij}h_j}\right)^2}\\
&\leq\displaystyle{\left(\left(\sum_{j=1}^{n}a_{ij}^2\right)\left(\sum_{j=1}^{n}h_j^2\right)\right)}\\
&=\left(\displaystyle{\sum_{i=1}^{m}\sum_{j=1}^{n}a_{ij}^2}\right)\left|\boldsymbol{h}\right|_{\mathbb{R}^n}^2\\
&=\left|A\right|_{\mathbb{R}^{m\times n}}^2\left|\boldsymbol{h}\right|_{\mathbb{R}^{n}}^2
\end{aligned}

を得る。\boldsymbol{h}\in\mathbb{R}^n\ \mathrm{s.t.}\ \left|\boldsymbol{h}\right|_{\mathbb{R}^n}\leq1について、両辺の上限を取ればよい。 \blacksquare)

プライバシーポリシー お問い合わせ