「大人の教養・知識・気付き」を伸ばすブログ

一流の大人(ビジネスマン、政治家、リーダー…)として知っておきたい、教養・社会動向を意外なところから取り上げ学ぶことで“気付く力”を伸ばすブログです。データ分析・語学に力点を置いています。 →現在、コンサルタントの雛になるべく、少しずつ勉強中です(※2024年1月21日改訂)。

MENU

やりなおしの数学・微分積分篇(30/X)

 以下の書籍を参考に、改めて微分積分を復習していく。

www.rokakuho.co.jp

今日のまとめ

  • \mathrm{Lagrange}の未定乗数法:f(x_1,\cdots,x_n),\varphi_1(x_1,\cdots,x_n),\cdots,\varphi_m(x_1,\cdots,x_n),m\lt nは点\boldsymbol{x}_0の近傍で連続微分可能とし、点\boldsymbol{x}_0において(m,n)行列
    \begin{aligned}\begin{bmatrix}\displaystyle{\frac{\partial\varphi_{1}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{1}}{\partial x_{n}}}(\boldsymbol{x}_{0})\\\vdots&&\vdots\\\displaystyle{\frac{\partial\varphi_{m}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{m}}{\partial x_{n}}}(\boldsymbol{x}_{0})\end{bmatrix}\end{aligned}
    の階数をmとする。

     条件
    \begin{aligned}\varphi_1(x_1,\cdots,x_n)=0,\cdots,\varphi_m(x_1,\cdots,x_n)=0\end{aligned}
    のもとで関数f(x_1,\cdots,x_n)が点\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)極値を取るための必要条件は適当な\lambda_1^0,\cdots,\lambda_m^0に対して\boldsymbol{x}=\boldsymbol{x}_0,\boldsymbol{\lambda}=\boldsymbol{\lambda}_0において
    \begin{aligned}\displaystyle{\frac{\partial F}{\partial x_1}}=\displaystyle{\frac{\partial F}{\partial x_2}}=\cdots=\displaystyle{\frac{\partial F}{\partial x_n}}=\displaystyle{\frac{\partial F}{\partial\lambda_1}}=\cdots=\displaystyle{\frac{\partial F}{\partial\lambda_m}}=0\end{aligned}
    を満たさなければならない。

7. 多変数関数の微分

 2つ以上の変数を持つ関数(多変数関数)の微分およびその応用を取り扱う。まずは2変数関数を中心に扱い、その後に一般のn(\geq2)変数関数の場合を扱う。

7.7 極値問題、条件付き極値問題

 点(x,y)が与えられた制約条件\varphi(x,y)=0を満たすような集合上を動くときの関数f(x,y)が取る極値を考える。


条件付き極値の存在性 \varphi(x,y),f(x,y)は点P_0(x_0,y_0)の近傍で連続微分可能とし、|\varphi_x(P_0)|+|\varphi_y(P_0)|\neq0とする。条件\varphi(x,y)=0の下で関数f(x,y)が点P_0(x_0,y_0)極値を取るものとすれば、このときある適当な\lambda_0\in\mathbb{R}が存在し

\begin{aligned}
f_x(P_0)-\lambda_0\varphi_x(P_0)=0,\ f_y(P_0)-\lambda_0\varphi_y(P_0)=0
\end{aligned}

を満たす。

(\because \varphi_y(P_0)\neq0とする(\varphi_x(P_0)\neq0のときも同様に示すことができる。)。このとき陰関数定理*1により点P_0の近傍においてyy=g(x)xの関数として表すことができる。\varphi(x,g(x))=0の両辺をxに関して微分することで、

\begin{aligned}
\varphi_x(P_0)+\varphi_y(P_0)g^{\prime}(x_0)=0
\end{aligned}

が成り立つことが分かる。一方でf(x,g(x))x=x_0極値を取ることから


\begin{aligned}
f_x(P_0)+f_y(P_0)g^{\prime}(x_0)=0
\end{aligned}

が成り立つ。したがって


\begin{aligned}
f_x(P_0)\varphi_y(P_0)=f_y(P_0)\varphi_x(P_0)
\end{aligned}

を得る。したがって\lambda_0=\displaystyle{\frac{f_y(P_0)}{\varphi_y(P_0)}}とおけば


\begin{aligned}
f_x(P_0)-\lambda_0\varphi_x(P_0)=f_y(P_0)-\lambda_0\varphi_y(P_0)=0
\end{aligned}

である。 \blacksquare)

 上で導入した\lambda\mathrm{Lagrange}の未定乗数といい、上記の方法を\mathrm{Lagrange}の未定乗数法という。

例1.
 条件xy=k,k\neq0のもとでの関数f(x,y)=x^2+y^2極値を考える。\lambda\mathrm{Lagrange}の未定乗数として


\begin{aligned}
F(x,y,\lambda)=x^2+y^2-\lambda(xy-k)
\end{aligned}

を定義する。
 条件からx\neq0\land y\neq0である。
 極値を取る点においてF_x=F_y=F_{\lambda}=0より


\begin{aligned}
2x-\lambda y=0,\ 2y-\lambda x=0,\ xy=k
\end{aligned}

である。したがって


\begin{aligned}
&2x-\lambda y=2y-\lambda x\\
\Leftrightarrow&\lambda(x-y)=2(x-y)
\end{aligned}

である。
 k\gt0ならば(x\gt0\land y\gt0)\lor (x\lt0\land y\lt0)であり、k\lt0ならば(x\lt0\land y\gt0)\lor (x\gt0\land y\lt0)であるから、
である。したがって


\begin{aligned}
k\gt0&\Rightarrow \lambda=2,\\
k\lt0&\Rightarrow \lambda=-2
\end{aligned}

である。以上から


\begin{aligned}
k\gt0&\Rightarrow \lambda=2,\ x=y=\pm\sqrt{k},\\
k\lt0&\Rightarrow \lambda=-2,\ x=-y=\pm\sqrt{-k}
\end{aligned}

が得られ、k\gt0のとき(x,y)=(\pm\sqrt{k},\pm\sqrt{k})で最小値2kを取り、k\lt0のとき(x,y)=(\pm\sqrt{-k},\mp\sqrt{-k})において最小値-2kを取る(以上、複合同順。)。

例2.
 条件x^2+y^2=1のもとでの関数Q(x,y)=ax^2+2bxy+cy^2の最大値または最小値を考える。\mathrm{Lagrange}の未定乗数\lambdaを用いて関数


\begin{aligned}
F(x,y,\lambda)=ax^2+2bxy+cy^2-\lambda(x^2+y^2-1)
\end{aligned}

を考えると、\displaystyle{\frac{\partial F}{\partial x}}=\displaystyle{\frac{\partial F}{\partial y}}=\displaystyle{\frac{\partial F}{\partial \lambda}}=0であるから


\begin{aligned}
\displaystyle{\frac{\partial}{\partial x}}F&=2ax+2by-2x\lambda=0,\\
\displaystyle{\frac{\partial}{\partial y}}F&=2bx+2cy-2y\lambda=0,\\
\displaystyle{\frac{\partial}{\partial\lambda}}F&=x^2+y^2=1
\end{aligned}

である。これを整理することで


\begin{aligned}
&ax+by=x\lambda,\ bx+cy=y\lambda,\\
\Leftrightarrow\ &\begin{bmatrix}
a-\lambda&b\\
b&c-\lambda
\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}
\end{aligned}

が成り立つ。これらから


\begin{aligned}
ax^2+2bxy+cy^2=(x^2+y^2)\lambda=\lambda
\end{aligned}

を得る。
 さて連立方程式


\begin{aligned}
\begin{bmatrix}
a-\lambda&b\\
b&c-\lambda
\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}
\end{aligned}

が自明でない解を持つためには、


\begin{aligned}
\begin{vmatrix}
a-\lambda&b\\
b&c-\lambda
\end{vmatrix}=0
\end{aligned}

であればよい。これの特性方程式の解\lambda=\lambda_1,\lambda_2に対して


\begin{aligned}
\lambda_{\max}&=\max\{\lambda_1,\lambda_2\},\\
\lambda_{\min}&=\min\{\lambda_1,\lambda_2\}
\end{aligned}

が求めたい最大値・最小値であり、それらを取るような(x,y)を求めればよい。

7.8 一般の多変数関数における微分

 ここまでの議論を拡張すれば一般の多変数関数における微分を定義できる。ここでは\mathrm{Taylor}の定理のみ改めて述べることとする。


\mathrm{Taylor}の定理(一般の多変数関数) f(x_1,\cdots,x_n)\Omega\subset\mathbb{R}^nにおいてC^m級の関数だとする。\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0),\boldsymbol{x}_1=(x_1^0+h_1,\cdots,x_n^0+h_n)\in\Omegaとし、2点\boldsymbol{x}_0,\boldsymbol{x}_1を結ぶ線分は\Omegaに含まれるとする。このとき

\begin{aligned}
f(x_{1}^{0}+h_1,\cdots,x_{n}^{0}+h_n)=&f(x_{1}^{0},\cdots,x_{n}^{0})+\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)f(x_{1}^{0},\cdots,x_{n}^{0})\\
&+\displaystyle{\frac{1}{2!}}\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)^{2}f(x_{1}^{0},\cdots,x_{n}^{0})\\
&+\cdots\\
&+\displaystyle{\frac{1}{(m-1)!}}\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)^{m-1}f(x_{1}^{0},\cdots,x_{n}^{0})\\
&+\displaystyle{\frac{1}{(m)!}}\left(\displaystyle{\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}}\right)^{m}f(x_{1}^{0}+\theta h_1,\cdots,x_{n}^{0}+\theta h_n)
\end{aligned}

を満たすような0\lt\theta\lt1が存在する。

 ここで


\begin{aligned}
H(\boldsymbol{x}_0)=\begin{bmatrix}
\displaystyle{\frac{\partial^2 f}{\partial^2 x_1}}(\boldsymbol{x}_0)             &\displaystyle{\frac{\partial^2 f}{\partial x_1\partial x_2}}(\boldsymbol{x}_0)&\cdots&\displaystyle{\frac{\partial^2 f}{\partial x_1\partial x_n}}(\boldsymbol{x}_0)\\
\displaystyle{\frac{\partial^2 f}{\partial x_2\partial x_1}}(\boldsymbol{x}_0)&\displaystyle{\frac{\partial^2 f}{\partial^2 x_2}}(\boldsymbol{x}_0)             &\cdots&\displaystyle{\frac{\partial^2 f}{\partial x_2\partial x_n}}(\boldsymbol{x}_0)\\
\vdots                                                                                                           &                                                                                                                     &\ddots&\vdots\\
\displaystyle{\frac{\partial^2 f}{\partial x_n\partial x_1}}(\boldsymbol{x}_0)&\displaystyle{\frac{\partial^2 f}{\partial x_n\partial x_2}}(\boldsymbol{x}_0)&\cdots&\displaystyle{\frac{\partial^2 f}{\partial^2 x_n}}(\boldsymbol{x}_0)
\end{bmatrix}
\end{aligned}

を曲面u=f(x_1,\cdots,x_n)の点\boldsymbol{x}_0におけるヘッセ行列という。


極値の存在性(一般の多変数関数) f(x_1,\cdots,x_n)\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)の近傍で定義されたC^2級の関数だとする。u=f(x_1,\cdots,x_n)が点\boldsymbol{x}_0において極値を取るための必要条件は、

\begin{aligned}
\displaystyle{\frac{\partial f}{\partial x_i}}(\boldsymbol{x}_0)=0,i=1,2,\cdots,n
\end{aligned}

である。
 さらに停留点\boldsymbol{x}_0においてヘッセ行列H(\boldsymbol{x}_0)が正定値行列のときは点\boldsymbol{x}_0においてf(\boldsymbol{x})は狭義の極小を、負定値行列のときは狭義の極大を取る。|H(\boldsymbol{x}_0)|\neq0かつH(\boldsymbol{x}_0)が定値でない場合はf(\boldsymbol{x})\boldsymbol{x}=\boldsymbol{x}_0極値を取らない。


\mathrm{Lagrange}の未定乗数法(一般の多変数関数) f(x_1,\cdots,x_n),\varphi_1(x_1,\cdots,x_n),\cdots,\varphi_m(x_1,\cdots,x_n),m\lt nは点\boldsymbol{x}_0の近傍で連続微分可能とし、点\boldsymbol{x}_0において(m,n)行列

\begin{aligned}
\begin{bmatrix}
\displaystyle{\frac{\partial\varphi_{1}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{1}}{\partial x_{n}}}(\boldsymbol{x}_{0})\\
\vdots&&\vdots\\
\displaystyle{\frac{\partial\varphi_{m}}{\partial x_{1}}}(\boldsymbol{x}_{0})&\cdots&\displaystyle{\frac{\partial\varphi_{m}}{\partial x_{n}}}(\boldsymbol{x}_{0})
\end{bmatrix}
\end{aligned}

の階数をmとする。
 条件


\begin{aligned}
\varphi_1(x_1,\cdots,x_n)=0,\cdots,\varphi_m(x_1,\cdots,x_n)=0
\end{aligned}

のもとで関数f(x_1,\cdots,x_n)が点\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)極値を取るための必要条件は適当な\lambda_1^0,\cdots,\lambda_m^0に対して


\begin{aligned}
\displaystyle{\frac{\partial f}{\partial x_i}}(\boldsymbol{x}_0)-\displaystyle{\sum_{j=1}^{m}\lambda_j^{0}\frac{\partial \varphi_j}{\partial x_i}}=0,i=1,2,\cdots,n
\end{aligned}

を満たすことである。すなわち


\begin{aligned}
F(x_1,\cdots,x_n,\lambda_1,\cdots,\lambda_m)=f(x_1,\cdots,x_n)-\displaystyle{\sum_{j=1}^{m}\lambda_j\varphi_{j}(x_1,\cdots,x_n)}
\end{aligned}

を考えたとき、点\boldsymbol{x}_0=(x_1^0,\cdots,x_n^0)が制約のもとでf(x_1,\cdots,x_n)極値を与えるならば、適当に\boldsymbol{\lambda}_0=(\lambda_1^0,\cdots,\lambda_m^0)を適当に選んだとき、\boldsymbol{x}=\boldsymbol{x}_0,\boldsymbol{\lambda}=\boldsymbol{\lambda}_0において


\begin{aligned}
\displaystyle{\frac{\partial F}{\partial x_1}}=\displaystyle{\frac{\partial F}{\partial x_2}}=\cdots=\displaystyle{\frac{\partial F}{\partial x_n}}=\displaystyle{\frac{\partial F}{\partial\lambda_1}}=\cdots=\displaystyle{\frac{\partial F}{\partial\lambda_m}}=0
\end{aligned}

を満たさなければならない。

*1:別項にて後に示す。

プライバシーポリシー お問い合わせ