やりなおしの数学・微分積分篇（30/X） - 「大人の教養・知識・気付き」を伸ばすブログ

　以下の書籍を参考に、改めて微分積分を復習していく。

www.rokakuho.co.jp

前回

前回
今日のまとめ
7.　多変数関数の微分
- 7.7　極値問題、条件付き極値問題
- 7.8　一般の多変数関数における微分
次回

今日のまとめ

$\mathrm{Lagrange}$ の未定乗数法： $f(x_1,\cdots,x_n),\varphi_1(x_1,\cdots,x_n),\cdots,\varphi_m(x_1,\cdots,x_n),m\lt n$ は点 $\boldsymbol{x}_0$ の近傍で連続微分可能とし、点 $\boldsymbol{x}_0$ において $(m,n)$ 行列
$\begin{aligned}\begin{bmatrix}\displaystyle{\frac{\partial\varphi_{1}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{1}}{\partial x_{n}}}(\boldsymbol{x}_{0})\\\vdots&&\vdots\\\displaystyle{\frac{\partial\varphi_{m}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{m}}{\partial x_{n}}}(\boldsymbol{x}_{0})\end{bmatrix}\end{aligned}$
の階数を $m$ とする。
　条件
$\begin{aligned}\varphi_1(x_1,\cdots,x_n)=0,\cdots,\varphi_m(x_1,\cdots,x_n)=0\end{aligned}$
のもとで関数 $f(x_1,\cdots,x_n)$ が点 $\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)$ で極値を取るための必要条件は適当な $\lambda_1^0,\cdots,\lambda_m^0$ に対して $\boldsymbol{x}=\boldsymbol{x}_0,\boldsymbol{\lambda}=\boldsymbol{\lambda}_0$ において
$\begin{aligned}\displaystyle{\frac{\partial F}{\partial x_1}}=\displaystyle{\frac{\partial F}{\partial x_2}}=\cdots=\displaystyle{\frac{\partial F}{\partial x_n}}=\displaystyle{\frac{\partial F}{\partial\lambda_1}}=\cdots=\displaystyle{\frac{\partial F}{\partial\lambda_m}}=0\end{aligned}$
を満たさなければならない。

7.　多変数関数の微分

　2つ以上の変数を持つ関数（多変数関数）の微分およびその応用を取り扱う。まずは2変数関数を中心に扱い、その後に一般の $n(\geq2)$ 変数関数の場合を扱う。

7.7　極値問題、条件付き極値問題

　点 $(x,y)$ が与えられた制約条件 $\varphi(x,y)=0$ を満たすような集合上を動くときの関数 $f(x,y)$ が取る極値を考える。

条件付き極値の存在性　 $\varphi(x,y),f(x,y)$ は点 $P_0(x_0,y_0)$ の近傍で連続微分可能とし、 $|\varphi_x(P_0)|+|\varphi_y(P_0)|\neq0$ とする。条件 $\varphi(x,y)=0$ の下で関数 $f(x,y)$ が点 $P_0(x_0,y_0)$ で極値を取るものとすれば、このときある適当な $\lambda_0\in\mathbb{R}$ が存在し

$\begin{aligned} f_x(P_0)-\lambda_0\varphi_x(P_0)=0,\ f_y(P_0)-\lambda_0\varphi_y(P_0)=0 \end{aligned}$

を満たす。

( $\because$ 　 $\varphi_y(P_0)\neq0$ とする（ $\varphi_x(P_0)\neq0$ のときも同様に示すことができる。）。このとき陰関数定理*1により点 $P_0$ の近傍において $y$ を $y=g(x)$ と $x$ の関数として表すことができる。 $\varphi(x,g(x))=0$ の両辺を $x$ に関して微分することで、

$\begin{aligned} \varphi_x(P_0)+\varphi_y(P_0)g^{\prime}(x_0)=0 \end{aligned}$

が成り立つことが分かる。一方で $f(x,g(x))$ が $x=x_0$ で極値を取ることから

$\begin{aligned} f_x(P_0)+f_y(P_0)g^{\prime}(x_0)=0 \end{aligned}$

が成り立つ。したがって

$\begin{aligned} f_x(P_0)\varphi_y(P_0)=f_y(P_0)\varphi_x(P_0) \end{aligned}$

を得る。したがって $\lambda_0=\displaystyle{\frac{f_y(P_0)}{\varphi_y(P_0)}}$ とおけば

$\begin{aligned} f_x(P_0)-\lambda_0\varphi_x(P_0)=f_y(P_0)-\lambda_0\varphi_y(P_0)=0 \end{aligned}$

である。　 $\blacksquare$ )

　上で導入した $\lambda$ を $\mathrm{Lagrange}$ の未定乗数といい、上記の方法を $\mathrm{Lagrange}$ の未定乗数法という。

例1.
　条件 $xy=k,k\neq0$ のもとでの関数 $f(x,y)=x^2+y^2$ の極値を考える。 $\lambda$ を $\mathrm{Lagrange}$ の未定乗数として
$\begin{aligned} F(x,y,\lambda)=x^2+y^2-\lambda(xy-k) \end{aligned}$
を定義する。
　条件から $x\neq0\land y\neq0$ である。
　極値を取る点において $F_x=F_y=F_{\lambda}=0$ より
$\begin{aligned} 2x-\lambda y=0,\ 2y-\lambda x=0,\ xy=k \end{aligned}$
である。したがって
$\begin{aligned} &2x-\lambda y=2y-\lambda x\\ \Leftrightarrow&\lambda(x-y)=2(x-y) \end{aligned}$
である。
　 $k\gt0$ ならば $(x\gt0\land y\gt0)\lor (x\lt0\land y\lt0)$ であり、 $k\lt0$ ならば $(x\lt0\land y\gt0)\lor (x\gt0\land y\lt0)$ であるから、
である。したがって
$\begin{aligned} k\gt0&\Rightarrow \lambda=2,\\ k\lt0&\Rightarrow \lambda=-2 \end{aligned}$
である。以上から
$\begin{aligned} k\gt0&\Rightarrow \lambda=2,\ x=y=\pm\sqrt{k},\\ k\lt0&\Rightarrow \lambda=-2,\ x=-y=\pm\sqrt{-k} \end{aligned}$
が得られ、 $k\gt0$ のとき $(x,y)=(\pm\sqrt{k},\pm\sqrt{k})$ で最小値 $2k$ を取り、 $k\lt0$ のとき $(x,y)=(\pm\sqrt{-k},\mp\sqrt{-k})$ において最小値 $-2k$ を取る（以上、複合同順。）。

例2.
　条件 $x^2+y^2=1$ のもとでの関数 $Q(x,y)=ax^2+2bxy+cy^2$ の最大値または最小値を考える。 $\mathrm{Lagrange}$ の未定乗数 $\lambda$ を用いて関数
$\begin{aligned} F(x,y,\lambda)=ax^2+2bxy+cy^2-\lambda(x^2+y^2-1) \end{aligned}$
を考えると、 $\displaystyle{\frac{\partial F}{\partial x}}=\displaystyle{\frac{\partial F}{\partial y}}=\displaystyle{\frac{\partial F}{\partial \lambda}}=0$ であるから
$\begin{aligned} \displaystyle{\frac{\partial}{\partial x}}F&=2ax+2by-2x\lambda=0,\\ \displaystyle{\frac{\partial}{\partial y}}F&=2bx+2cy-2y\lambda=0,\\ \displaystyle{\frac{\partial}{\partial\lambda}}F&=x^2+y^2=1 \end{aligned}$
である。これを整理することで
$\begin{aligned} &ax+by=x\lambda,\ bx+cy=y\lambda,\\ \Leftrightarrow\ &\begin{bmatrix} a-\lambda&b\\ b&c-\lambda \end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix} \end{aligned}$
が成り立つ。これらから
$\begin{aligned} ax^2+2bxy+cy^2=(x^2+y^2)\lambda=\lambda \end{aligned}$
を得る。
　さて連立方程式
$\begin{aligned} \begin{bmatrix} a-\lambda&b\\ b&c-\lambda \end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix} \end{aligned}$
が自明でない解を持つためには、
$\begin{aligned} \begin{vmatrix} a-\lambda&b\\ b&c-\lambda \end{vmatrix}=0 \end{aligned}$
であればよい。これの特性方程式の解 $\lambda=\lambda_1,\lambda_2$ に対して
$\begin{aligned} \lambda_{\max}&=\max\{\lambda_1,\lambda_2\},\\ \lambda_{\min}&=\min\{\lambda_1,\lambda_2\} \end{aligned}$
が求めたい最大値・最小値であり、それらを取るような $(x,y)$ を求めればよい。

7.8　一般の多変数関数における微分

　ここまでの議論を拡張すれば一般の多変数関数における微分を定義できる。ここでは $\mathrm{Taylor}$ の定理のみ改めて述べることとする。

$\mathrm{Taylor}$ の定理（一般の多変数関数）　 $f(x_1,\cdots,x_n)$ は $\Omega\subset\mathbb{R}^n$ において $C^m$ 級の関数だとする。 $\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0),\boldsymbol{x}_1=(x_1^0+h_1,\cdots,x_n^0+h_n)\in\Omega$ とし、2点 $\boldsymbol{x}_0,\boldsymbol{x}_1$ を結ぶ線分は $\Omega$ に含まれるとする。このとき

$\begin{aligned} f(x_{1}^{0}+h_1,\cdots,x_{n}^{0}+h_n)=&f(x_{1}^{0},\cdots,x_{n}^{0})+\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)f(x_{1}^{0},\cdots,x_{n}^{0})\\ &+\displaystyle{\frac{1}{2!}}\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)^{2}f(x_{1}^{0},\cdots,x_{n}^{0})\\ &+\cdots\\ &+\displaystyle{\frac{1}{(m-1)!}}\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)^{m-1}f(x_{1}^{0},\cdots,x_{n}^{0})\\ &+\displaystyle{\frac{1}{(m)!}}\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)^{m}f(x_{1}^{0}+\theta h_1,\cdots,x_{n}^{0}+\theta h_n) \end{aligned}$

を満たすような $0\lt\theta\lt1$ が存在する。

　ここで

$\begin{aligned} H(\boldsymbol{x}_0)=\begin{bmatrix} \displaystyle{\frac{\partial^2 f}{\partial^2 x_1}}(\boldsymbol{x}_0) &\displaystyle{\frac{\partial^2 f}{\partial x_1\partial x_2}}(\boldsymbol{x}_0)&\cdots&\displaystyle{\frac{\partial^2 f}{\partial x_1\partial x_n}}(\boldsymbol{x}_0)\\ \displaystyle{\frac{\partial^2 f}{\partial x_2\partial x_1}}(\boldsymbol{x}_0)&\displaystyle{\frac{\partial^2 f}{\partial^2 x_2}}(\boldsymbol{x}_0) &\cdots&\displaystyle{\frac{\partial^2 f}{\partial x_2\partial x_n}}(\boldsymbol{x}_0)\\ \vdots & &\ddots&\vdots\\ \displaystyle{\frac{\partial^2 f}{\partial x_n\partial x_1}}(\boldsymbol{x}_0)&\displaystyle{\frac{\partial^2 f}{\partial x_n\partial x_2}}(\boldsymbol{x}_0)&\cdots&\displaystyle{\frac{\partial^2 f}{\partial^2 x_n}}(\boldsymbol{x}_0) \end{bmatrix} \end{aligned}$

を曲面 $u=f(x_1,\cdots,x_n)$ の点 $\boldsymbol{x}_0$ におけるヘッセ行列という。

極値の存在性（一般の多変数関数）　 $f(x_1,\cdots,x_n)$ は $\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)$ の近傍で定義された $C^2$ 級の関数だとする。 $u=f(x_1,\cdots,x_n)$ が点 $\boldsymbol{x}_0$ において極値を取るための必要条件は、

$\begin{aligned} \displaystyle{\frac{\partial f}{\partial x_i}}(\boldsymbol{x}_0)=0,i=1,2,\cdots,n \end{aligned}$

である。
　さらに停留点 $\boldsymbol{x}_0$ においてヘッセ行列 $H(\boldsymbol{x}_0)$ が正定値行列のときは点 $\boldsymbol{x}_0$ において $f(\boldsymbol{x})$ は狭義の極小を、負定値行列のときは狭義の極大を取る。 $|H(\boldsymbol{x}_0)|\neq0$ かつ $H(\boldsymbol{x}_0)$ が定値でない場合は $f(\boldsymbol{x})$ は $\boldsymbol{x}=\boldsymbol{x}_0$ で極値を取らない。

$\mathrm{Lagrange}$ の未定乗数法(一般の多変数関数)　 $f(x_1,\cdots,x_n),\varphi_1(x_1,\cdots,x_n),\cdots,\varphi_m(x_1,\cdots,x_n),m\lt n$ は点 $\boldsymbol{x}_0$ の近傍で連続微分可能とし、点 $\boldsymbol{x}_0$ において $(m,n)$ 行列

$\begin{aligned} \begin{bmatrix} \displaystyle{\frac{\partial\varphi_{1}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{1}}{\partial x_{n}}}(\boldsymbol{x}_{0})\\ \vdots&&\vdots\\ \displaystyle{\frac{\partial\varphi_{m}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{m}}{\partial x_{n}}}(\boldsymbol{x}_{0}) \end{bmatrix} \end{aligned}$

の階数を $m$ とする。
　条件

$\begin{aligned} \varphi_1(x_1,\cdots,x_n)=0,\cdots,\varphi_m(x_1,\cdots,x_n)=0 \end{aligned}$

のもとで関数 $f(x_1,\cdots,x_n)$ が点 $\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)$ で極値を取るための必要条件は適当な $\lambda_1^0,\cdots,\lambda_m^0$ に対して

$\begin{aligned} \displaystyle{\frac{\partial f}{\partial x_i}}(\boldsymbol{x}_0)-\displaystyle{\sum_{j=1}^{m}\lambda_j^{0}\frac{\partial \varphi_j}{\partial x_i}}=0,i=1,2,\cdots,n \end{aligned}$

を満たすことである。すなわち

$\begin{aligned} F(x_1,\cdots,x_n,\lambda_1,\cdots,\lambda_m)=f(x_1,\cdots,x_n)-\displaystyle{\sum_{j=1}^{m}\lambda_j\varphi_{j}(x_1,\cdots,x_n)} \end{aligned}$

を考えたとき、点 $\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)$ が制約のもとで $f(x_1,\cdots,x_n)$ の極値を与えるならば、適当に $\boldsymbol{\lambda}_0=(\lambda_1^0,\cdots,\lambda_m^0)$ を適当に選んだとき、 $\boldsymbol{x}=\boldsymbol{x}_0,\boldsymbol{\lambda}=\boldsymbol{\lambda}_0$ において

$\begin{aligned} \displaystyle{\frac{\partial F}{\partial x_1}}=\displaystyle{\frac{\partial F}{\partial x_2}}=\cdots=\displaystyle{\frac{\partial F}{\partial x_n}}=\displaystyle{\frac{\partial F}{\partial\lambda_1}}=\cdots=\displaystyle{\frac{\partial F}{\partial\lambda_m}}=0 \end{aligned}$

を満たさなければならない。

次回

power-of-awareness.com

*1:別項にて後に示す。

前回

今日のまとめ

7. 多変数関数の微分

7.7 極値問題、条件付き極値問題

7.8 一般の多変数関数における微分

次回

7.　多変数関数の微分

7.7　極値問題、条件付き極値問題

7.8　一般の多変数関数における微分