固有値方程式とラグランジュの未定乗数法と楕円の関係

初めに

行列が対称行列の場合、固有値方程式はどうもラグランジュの未定乗数法になるようだ。
そう気づいたとき、ここまで話が広がるとは思っていなかった。

固有値方程式を展開する

3×3 の対称行列 \( A \) に対する固有値方程式は、

\[ \begin{pmatrix} a_1 & a_2 & a_3 \\ a_2 & a_4 & a_5 \\ a_3 & a_5 & a_6 \end{pmatrix} \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \lambda \begin{pmatrix} x \\ y \\ z \end{pmatrix} \]

各成分を展開すると、

\[ \begin{aligned} a_1 x + a_2 y + a_3 z &= \lambda x \\ a_2 x + a_4 y + a_5 z &= \lambda y \\ a_3 x + a_5 y + a_6 z &= \lambda z \end{aligned} \]

ラグランジュの未定乗数法を立てる

ここから別途、ラグランジュの未定乗数法を考える。
極値を求めたい関数 \( f \) を次のように定義する(これは2次形式だ)。

\[ f = \frac{a_1}{2} x^2 + a_2 xy + a_3 xz + \frac{a_4}{2} y^2 + a_5 yz + \frac{a_6}{2} z^2 \]

そして拘束条件 \( g \) を次のように定義する。これは球面の式だ。

\[ g = \frac{1}{2} x^2 + \frac{1}{2} y^2 + \frac{1}{2} z^2 = C \]

ラグランジュ方程式 \( \nabla f = \lambda \, \nabla g \) を各成分で展開する。

\[ \begin{aligned} \frac{\partial f}{\partial x} - \lambda \frac{\partial g}{\partial x} &= a_1 x + a_2 y + a_3 z - \lambda x = 0 \\ \frac{\partial f}{\partial y} - \lambda \frac{\partial g}{\partial y} &= a_2 x + a_4 y + a_5 z - \lambda y = 0 \\ \frac{\partial f}{\partial z} - \lambda \frac{\partial g}{\partial z} &= a_3 x + a_5 y + a_6 z - \lambda z = 0 \end{aligned} \]

完全に一致した!

固有値方程式と、ラグランジュ方程式が完全に一致した。

結論: 対称行列の固有値方程式とは、2次形式 \( f \) の極値を、 球面 \( g = C \) という拘束条件のもとで求める問題に等しい。

では、\( f \) が表す図形の正体はいったい何だろう?

f の正体は楕円体だった

淡いラベンダー背景に等高線楕円と制約円が交わる固有値・ラグランジュ乗数法の関係図

・・・

楕円体?

・・・

そうだ。2次形式 \( f \) が一定値をとる等高面、すなわち \( f(\mathbf{x}) = C \) の曲面は楕円体になる。
つまり対称行列の固有値方程式は、「楕円体上の点を、球面の拘束条件のもとで極値を求める」問題だったのだ。

幾何学的なイメージ

この解釈を幾何学的に言い換えると、次のようになる。

固有値の幾何学的な意味:

  • 最小固有値 \( \lambda_1 \): 楕円体に内接する球の半径。楕円体の最も短い軸方向で接する。
  • 中間固有値 \( \lambda_2 \)(3次元の場合): 半内接・半外接する球の半径。
  • 最大固有値 \( \lambda_3 \): 楕円体を外接して覆う球の半径。楕円体の最も長い軸方向で接する。

固有ベクトルは、楕円体と球が接する点の方向ベクトルに対応する。

あとがき

それなりに説明できてしまった。
これを書き始めたときは、固有値とラグランジュの未定乗数法の関係しか考えていなかったのに、
いつの間にか楕円体の話にまで広がっていた。

固有値って、意外と楽しいな。