05 線形代数
線形代数を学ぶ意義
こういう話は今度
固有値,固有ベクトル
ここでは,線形代数を学ぶ中でも特に重要な概念である,固有値と固有ベクトルの考え方,求め方について解説します.主成分分析など,多くの重要な数学的手法を学ぶときに必要になるので,ここではつまらないですが頑張って理解しておきましょう.
固有ベクトル
はじめに,固有ベクトルについてです.行列A \bm{A} A の固有ベクトルv \bm{v} v とは,
「行列 A \bm{A} A を掛けても,λ \lambda λ 倍されるだけで方向が変わらないベクトル」
のことを意味します.また,この時の対応する λ \lambda λ の値を固有値と言います.意味が分からないと思うので,とりあえず例を考えます.
たとえば,行列 A = ( 2 0 0 3 ) \bm{A} = \begin{pmatrix}
\displaystyle 2 & 0\\
\displaystyle 0 & 3
\end{pmatrix} A = ( 2 0 0 3 ) を考えます.このベクトルを色んなベクトルに掛けてみます.
まずは,( 1 0 ) \begin{pmatrix}
\displaystyle 1\\
\displaystyle 0
\end{pmatrix} ( 1 0 ) ,および( 0 1 ) \begin{pmatrix}
\displaystyle 0\\
\displaystyle 1
\end{pmatrix} ( 0 1 ) を考えてみます.
( 2 0 0 3 ) ( 1 0 ) = ( 2 0 ) ( 2 0 0 3 ) ( 0 1 ) = ( 0 3 ) \begin{pmatrix}
\displaystyle 2 & 0\\
\displaystyle 0 & 3
\end{pmatrix}
\begin{pmatrix}
\displaystyle 1\\
\displaystyle 0
\end{pmatrix} =
\begin{pmatrix}
\displaystyle 2\\
\displaystyle 0
\end{pmatrix}
\\[1em]
\begin{pmatrix}
\displaystyle 2 & 0\\
\displaystyle 0 & 3
\end{pmatrix}
\begin{pmatrix}
\displaystyle 0\\
\displaystyle 1
\end{pmatrix} =
\begin{pmatrix}
\displaystyle 0\\
\displaystyle 3
\end{pmatrix} ( 2 0 0 3 ) ( 1 0 ) = ( 2 0 ) ( 2 0 0 3 ) ( 0 1 ) = ( 0 3 )
これらは,行列 A \bm{A} A をかけても,それぞれ 2 , 3 2,3 2 , 3 倍されるだけです.つまり,行列 A \bm{A} A の固有ベクトルは ( 1 , 0 ) , ( 0 , 1 ) (1,0), (0,1) ( 1 , 0 ) , ( 0 , 1 ) で,対応する固有値は 2 , 3 2,3 2 , 3 であることが分かります.
では次に,行列 B = ( 2 1 1 3 ) \bm{B} = \begin{pmatrix}
\displaystyle 2 & 1\\
\displaystyle 1 & 3
\end{pmatrix} B = ( 2 1 1 3 )
を考えます.
( 2 1 1 3 ) ( 1 0 ) = ( 2 1 ) ( 2 1 1 3 ) ( 0 1 ) = ( 1 3 ) \begin{pmatrix}
\displaystyle 2 & 1\\
\displaystyle 1 & 3
\end{pmatrix}
\begin{pmatrix}
\displaystyle 1\\
\displaystyle 0
\end{pmatrix} =
\begin{pmatrix}
\displaystyle 2\\
\displaystyle 1
\end{pmatrix}
\\[1em]
\begin{pmatrix}
\displaystyle 2 & 1\\
\displaystyle 1 & 3
\end{pmatrix}
\begin{pmatrix}
\displaystyle 0\\
\displaystyle 1
\end{pmatrix} =
\begin{pmatrix}
\displaystyle 1\\
\displaystyle 3
\end{pmatrix} ( 2 1 1 3 ) ( 1 0 ) = ( 2 1 ) ( 2 1 1 3 ) ( 0 1 ) = ( 1 3 )
今度は,どちらも λ \lambda λ 倍では表すことができなくなっています.つまり, ( 1 , 0 ) , ( 0 , 1 ) (1,0),(0,1) ( 1 , 0 ) , ( 0 , 1 ) は行列 B \bm{B} B の固有ベクトルではありません.
今の計算結果を図にしてみます.
行列 A \bm{A} A の方はこのように,( 1 , 0 ) , ( 0 , 1 ) (1,0), (0,1) ( 1 , 0 ) , ( 0 , 1 ) ともに長さが伸びるだけです.一方で行列 B \bm{B} B は
このように,行列を作用させたことによって長さだけでなく向きも変化しています.当然,もう一度行列 B \bm{B} B を作用させたら更に回転します.行列の掛け算が回転を意味していたことを考えれば分かることですが,行列が特殊な形でない限り,x , y x,y x , y 軸方向にどれだけ伸びる...といった単純な考え方は通用しなくなってしまいます.
これが行列のややこしいところです.今やった式の形自体は,y = A x y = Ax y = A x のような,一次関数のような形を取っているのに,その挙動がややこしくなってしまうのです.
モチベーション
これはたとえば,微分方程式なんかを考えると残念さが分かります.
先程の行列 A , B \bm{A,B} A , B の問題は以下のように書き換えられます.
行列A \bm{A} A
x ˙ = 2 x y ˙ = 3 y あるいは ( x ˙ y ˙ ) = ( 2 0 0 3 ) ( x y ) \dot{x} = 2x\\
\dot{y} = 3y\\
\\[1em]
\text{あるいは}
\\[1em]
\begin{pmatrix}
\displaystyle \dot{x} \\
\displaystyle \dot{y}
\end{pmatrix}=
\begin{pmatrix}
\displaystyle 2 & 0 \\
\displaystyle 0 & 3
\end{pmatrix}
\begin{pmatrix}
\displaystyle x \\
\displaystyle y
\end{pmatrix} x ˙ = 2 x y ˙ = 3 y あるいは ( x ˙ y ˙ ) = ( 2 0 0 3 ) ( x y )
行列B \bm{B} B
x ˙ = 2 x + y y ˙ = x + 3 y あるいは ( x ˙ y ˙ ) = ( 2 1 1 3 ) ( x y ) \dot{x} = 2x + y\\
\dot{y} = x + 3y\\
\\[1em]
\text{あるいは}
\\[1em]
\begin{pmatrix}
\displaystyle \dot{x} \\
\displaystyle \dot{y}
\end{pmatrix}=
\begin{pmatrix}
\displaystyle 2 & 1 \\
\displaystyle 1 & 3
\end{pmatrix}
\begin{pmatrix}
\displaystyle x \\
\displaystyle y
\end{pmatrix} x ˙ = 2 x + y y ˙ = x + 3 y あるいは ( x ˙ y ˙ ) = ( 2 1 1 3 ) ( x y )
これらは,x , y x,y x , y の時間変化が行列A , B \bm{A,B} A , B との掛け算によって決まるという力学系を考えています.行列が特殊な形でない限り A \bm{A} A の方が,どれだけ掛けても回転を意識しないで軸方向への伸びを考えればいいだけなので明らかに楽ですよね.
よって,行列 B \bm{B} B のような一般のベクトルについても,こういう回転しない不変の軸 を考えたい,という発想が生まれます.
求め方
行列 A \bm{A} A が簡単な形になっていたのは,見ればわかりますが対角成分以外が0という形を取っているからです.これによって x , y x,y x , y 軸以外の方向が関係なくなっているわけです.
このことから, 今考えている問題は B \bm{B} B をどうにかして λ I \lambda \bm{I} λ I という形に表せないか,という問題であることに気付きます.I \bm{I} I は単位ベクトル.
即ち,
A x = λ I x \bm{A}\bm{x} = \lambda \bm{I} \bm{x} A x = λ I x
となる λ \lambda λ と x \bm{x} x を探す問題です.なので,
( A − λ I ) x = 0 (A - \lambda \bm{I})\bm{x} = 0 ( A − λ I ) x = 0
を解きます.ここで先程のように x \bm{x} x を ( x , y ) (x,y) ( x , y ) とするとこの式は
( A − λ I ) x = ( a − λ b c d − λ ) ( x y ) = x ( a − λ c ) + y ( b d − λ ) = ( 0 0 ) (A - \lambda \bm{I})\bm{x} \\
\\[1em]
= \begin{pmatrix}
a-\lambda & b \\
c & d-\lambda \\
\end{pmatrix}
\begin{pmatrix}
x \\
y \\
\end{pmatrix}
\\[1em]
= x \begin{pmatrix}
a-\lambda \\
c
\end{pmatrix} + y
\begin{pmatrix}
b\\
d-\lambda
\end{pmatrix} =
\begin{pmatrix}
0\\
0
\end{pmatrix} ( A − λ I ) x = ( a − λ c b d − λ ) ( x y ) = x ( a − λ c ) + y ( b d − λ ) = ( 0 0 )
という形で表せます.これを満たす x \bm{x} x は,自明解として x = 0 \bm{x} = \bf{0} x = 0 が自明解として存在しますが,これは除きます.なぜなら,軸になりえないからです.
また, ( a − λ c ) \begin{pmatrix} a-\lambda \\ c\end{pmatrix} ( a − λ c ) と ( b d − λ ) \begin{pmatrix} b\\ d-\lambda \end{pmatrix} ( b d − λ ) が線形独立な場合には先程の自明解以外がありえません.
従って,この問題の解は ( a − λ c ) \begin{pmatrix} a-\lambda \\ c\end{pmatrix} ( a − λ c ) と ( b d − λ ) \begin{pmatrix} b\\ d-\lambda \end{pmatrix} ( b d − λ ) が線形従属 である,即ち ( a − λ b c d − λ ) \begin{pmatrix}
a-\lambda & b \\
c & d-\lambda \\
\end{pmatrix} ( a − λ c b d − λ ) の行列式が 0 であることを満たす必要がある,ということになります.
線形独立,従属,行列式の関係については行列式の解説を参照してください (今はないけど未来の筆者がやるはず).
固有値
つまり,
∣ A − λ I ∣ = 0 |A - \lambda \bm{I}| = 0 ∣ A − λ I ∣ = 0
を解く問題に帰着しました.行列式の定義より
∣ A − λ I ∣ = ∣ ( a b c d ) − λ ( 1 0 0 1 ) ∣ = ∣ a − λ b c d − λ ∣ = ( a − λ ) ( d − λ ) − b c = λ 2 − ( a + d ) λ + a d − b c |A - \lambda \bm{I}| =
\begin{vmatrix}
\begin{pmatrix}
a & b \\
c & d \\
\end{pmatrix} -\lambda
\begin{pmatrix}
1 & 0 \\
0 & 1 \\
\end{pmatrix}
\end{vmatrix}\\
\\[1em] =
\begin{vmatrix}
a-\lambda & b \\
c & d-\lambda \\
\end{vmatrix}
\\[1em]
= (a-\lambda)(d-\lambda) - bc\\
= \lambda^2 - (a+d)\lambda + ad - bc ∣ A − λ I ∣ = ( a c b d ) − λ ( 1 0 0 1 ) = a − λ c b d − λ = ( a − λ ) ( d − λ ) − b c = λ 2 − ( a + d ) λ + a d − b c
となります.ここで,行列のトレース τ \tau τ および行列式 Δ \Delta Δ を用いると
∣ A − λ I ∣ = λ 2 − ( a + d ) λ + a d − b c = λ 2 − τ λ + Δ |A - \lambda \bm{I}| = \lambda^2 - (a+d)\lambda + ad - bc\\
= \lambda^2 - \tau \lambda + \Delta ∣ A − λ I ∣ = λ 2 − ( a + d ) λ + a d − b c = λ 2 − τ λ + Δ
となり,求める固有値 λ \lambda λ の値は
λ 1 , 2 = τ ± τ 2 − 4 Δ 2 \lambda_{1,2} = \frac{\tau \pm \sqrt{\tau^2 - 4\Delta}}{2} λ 1 , 2 = 2 τ ± τ 2 − 4Δ
と求まります.
固有ベクトル
あとは,得られた固有値を
( A − λ I ) x = 0 (A - \lambda \bm{I})\bm{x} = 0 ( A − λ I ) x = 0
に代入し,計算することで,対応する固有ベクトル x \bm{x} x も求まります.代入はそれぞれの λ \lambda λ で別に行い,別の固有ベクトルを求めます.
たとえば λ = λ 1 \lambda = \lambda_1 λ = λ 1 に対しては,
( a − λ 1 b c d − λ 1 ) ( x y ) = ( 0 0 ) \begin{pmatrix}
a-\lambda_1 & b \\
c & d-\lambda_1 \\
\end{pmatrix}
\begin{pmatrix}
x\\
y
\end{pmatrix} =
\begin{pmatrix}
0\\
0
\end{pmatrix} ( a − λ 1 c b d − λ 1 ) ( x y ) = ( 0 0 )
を解きます.つまり
( ( a − λ 1 ) x + b y c x + ( d − λ 1 ) y ) = ( 0 0 ) \begin{pmatrix}
(a-\lambda_1)x + by\\
cx +(d-\lambda_1) y
\end{pmatrix}=
\begin{pmatrix}
0\\
0
\end{pmatrix} ( ( a − λ 1 ) x + b y c x + ( d − λ 1 ) y ) = ( 0 0 )
この式から,x , y x,y x , y の比が分かります.あとは,この比を満たすものは全て固有ベクトルになります.一般的には,そのうち最小の整数比のものを選んで固有ベクトルとすることが多いです.
たとえば,最小の整数比が1:2だった場合,
固有ベクトル x = t ( 1 2 ) ( t は任意定数 , t ≠ 0 ) 固有ベクトル \bm{x} = t
\begin{pmatrix}
1\\
2
\end{pmatrix}
(t\text{は任意定数}, t\neq0) 固有ベクトル x = t ( 1 2 ) ( t は任意定数 , t = 0 )
や,
固有ベクトル x = C ( 1 2 ) 固有ベクトル \bm{x} = \mathbb{C}
\begin{pmatrix}
1\\
2
\end{pmatrix} 固有ベクトル x = C ( 1 2 )
などと表記することが多いです.C \mathbb{C} C は複素数の意.
これによって,何度掛けても回転しない不変の軸を求める事ができました.
例題と確認
最後に,本当に回転しない軸が求められたのかを例題で確認してみます.
A = ( 1 1 4 − 2 ) \bm{A} =\begin{pmatrix}
1 & 1\\
4 & -2
\end{pmatrix} A = ( 1 4 1 − 2 ) の固有値,固有ベクトルを求め,図示せよ.
まず
λ 2 − τ λ + Δ = 0 \lambda^2 - \tau \lambda + \Delta = 0 λ 2 − τ λ + Δ = 0
を解きます.τ , Δ \tau, \Delta τ , Δ をそれぞれ計算して代入すると,
λ 2 + λ − 6 = 0 ( λ + 3 ) ( λ − 2 ) = 0 \lambda^2 +\lambda - 6 =0\\
(\lambda+3)(\lambda-2) = 0 λ 2 + λ − 6 = 0 ( λ + 3 ) ( λ − 2 ) = 0
となるので,λ = 2 , − 3 \lambda = 2,-3 λ = 2 , − 3
と固有値が求まります.
対応する固有ベクトルは,
( ( a − λ ) x + b y c x + ( d − λ ) y ) = ( 0 0 ) \begin{pmatrix}
(a-\lambda)x + by\\
cx +(d-\lambda) y
\end{pmatrix}=
\begin{pmatrix}
0\\
0
\end{pmatrix} ( ( a − λ ) x + b y c x + ( d − λ ) y ) = ( 0 0 )
より
λ = 2 \lambda = 2 λ = 2 の時,
( − x + y 4 x − 4 y ) = ( 0 0 ) ∴ x = y \begin{pmatrix}
-x + y\\
4x -4y
\end{pmatrix}=
\begin{pmatrix}
0\\
0
\end{pmatrix}
\\[1em]
\therefore x=y ( − x + y 4 x − 4 y ) = ( 0 0 ) ∴ x = y
と分かります.よって固有ベクトルは t ( 1 1 ) t\begin{pmatrix}
1\\1
\end{pmatrix} t ( 1 1 ) です.
λ = − 3 \lambda = -3 λ = − 3 の時,
( 4 x + y 4 x + y ) = ( 0 0 ) ∴ x = − 4 y \begin{pmatrix}
4x + y\\
4x + y
\end{pmatrix}=
\begin{pmatrix}
0\\
0
\end{pmatrix}
\\[1em]
\therefore x= -4y ( 4 x + y 4 x + y ) = ( 0 0 ) ∴ x = − 4 y
なので,固有ベクトルはt ( − 1 4 ) t\begin{pmatrix}
-1\\4
\end{pmatrix} t ( − 1 4 ) ,となります.
では実際,これらの固有ベクトルが行列 A \bm{A} A をかけても向きが変わらないかを確認してみます.
( 1 1 4 − 2 ) ( 1 1 ) = ( 2 2 ) ( 1 1 4 − 2 ) ( − 1 4 ) = ( 3 − 12 ) \begin{pmatrix}
1 & 1 \\
4 & -2 \\
\end{pmatrix}
\begin{pmatrix}
1\\
1
\end{pmatrix} =
\begin{pmatrix}
2\\
2
\end{pmatrix}
\\[1em]
\begin{pmatrix}
1 & 1 \\
4 & -2 \\
\end{pmatrix}
\begin{pmatrix}
-1\\
4
\end{pmatrix} =
\begin{pmatrix}
3\\
-12
\end{pmatrix} ( 1 4 1 − 2 ) ( 1 1 ) = ( 2 2 ) ( 1 4 1 − 2 ) ( − 1 4 ) = ( 3 − 12 )
どちらも,ちゃんと固有値倍されて同じ向きのままですね.
図にすると以下
固有値,固有ベクトルは,今後様々なことを勉強する上で重要になってくる概念です.手計算ができる必要はそれほどありません (3次元以上の行列になるとかなり面倒になってくる) が,内容は把握しておくことを勧めます.
たとえば,主成分分析や力学系の線形安定性解析 なんかにはダイレクトに使います.
行列の微積分
い,いつか...いつかやるんです...本当です...