4 行列の対角化が可能な条件
f-denshi.com  最終更新日:07/11/14  

1.固有空間による直和

[1] いよいよ,2章の懸案事項であった「行列が対角化可能であるための条件」を求めます。まず,「対角化可能」の定義から。

対角化の定義:

ベクトル空間V上の線形写像Tの行列表現T対角化可能であるとは,ある正則行列Pによって,

P-1TPD     [D:対角行列]

と表せることである。  

とします。ここで,Pはベクトル空間Vの基底変換の行列 [#][#] です。対角可能とは,「うまく基底を選びなおしてやる,つまり座標変換してやる[#]ことで,V上の線形写像の表現行列を対角行列にできる」ことを言うのです。  

[2] いま,Tの固有多項式を,

ΦT(λ)=(λ−λ1)d1(λ−λ2)d2 ・・・ (λ−λm)dm 

とします。すなわち,異なる λ1,λ2,・・・,λm の固有値をもち,それぞれの重複度は,d1,d2,・・・,dm であるとします。

  この記号,用語のもとで,これから証明すべき定理を述べると,

定理:
 V上の線形写像Tが対角化可能である必要十分条件は,Tの各固有値λkの固有空間E(λk)に対して,

   dimE(λk)=dk 

が成り立つことである。

つまり,各固有値に対して,その固有空間の次元とその固有値の重複度が等しいければよいのです。特に,固有方程式:ΦT(λ)=0 が重根をもたなければ,Tは対角化可能なことは直ちにわかります。では,定理の証明です。

[証明] 必要性:

[3]  ステップ 1 

「線形演算子Tが対角化可能」   「T は1次独立なn個の固有ベクトルをもつ」 

ことを示します。

 Tが対角化可能ならば,ある基底変換の行列(正則行列),

P=(p1,p2,・・・,pn) [#] が存在して,P-1TPD 
                                                  [ D: 対角行列で対角成分は,μ12,・・・,μn

とかけます[#]。この式の左から P をかけると,TPPD,これを成分で書くと,(P-1P の逆行列)

TP(Tp1,Tp2,・・・,Tpn)
PD(p1,p2,・・,pn) μ1 0・・・・・0 0 1p12p2,・・・,μnpn)
0 μ2 0・・0 0
  
0 ・・・・・0 μn

で示した行列の各列をおのおの比較すれば,

Tpj=μjpj   (j=1,2,・・・,n)

これは行列T の固有方程式であり,固有ベクトルがpj,対応する固有値がμj( j=1,2,・・・,n )であることを示しています。さらに,P が正則である[#]ことから,|P|≠0,すなわち,p1p2,・・,pn が1次独立であることもいえます[#]。したがって,このV上のn個のベクトルは,n次元ベクトル空間V を張ることができます。

(注意: p1p2,・・,pn が1次独立でも固有値μkがすべて相異なるとは限りません。また,μkはλ1,・・・λmのいずれかに相当しています。)

[4]  ステップ 2 

ここで,n個の1次独立な固有ベクトルp1p2,・・,pn を固有値が等しいものどおし集め,次のように記号を改めます

λ1 :  p(1)1,・・・,p(1)d1  : d1個 (=固有値λ1の重複度)
λ2 :  p(2)1,・・・,p(2)d2  : d2個 (=固有値λ2の重複度)
・・・・・・・・・
λm :  p(m)1,・・・,p(m)dm  : dm個 (=固有値λmの重複度)

(もちろん,すべての固有値が異なれば,d1=d2=・・・=dm=1)
ここでの操作はn個の1次独立な固有ベクトルpj を並び替えただけなので,ベクトル p(i)j の全個数はn個 で,

n =d1+d2+・・・+dm                  ・・・・・・・・・・・  [*]

が成り立ち,基底:

p(1)1,・・・,p(1)d1,p(2)1,,・・・,p(2)d2 ,・・・,p(m)1,・・・,p(m)dm

で,n次元ベクトル空間 V を張ることができます。また,各固有空間E(λk)には少なくとも1次独立なdk個のベクトル{p(k)1,・・・,p(k)dk}を含んでいるので,その次元について,

dimE(λk)≧dk

でなければいけないことがわかります。ところが,前章で示したように,dimE(λk)≦dk なので [#],結局,

dimE(λk)=dk

が成り立ちます。(必要性の証明終わり)

なお,[*] は次のように書き換えた方が便利。

dimV = dimE(λ1)+dimE(λ2)+・・・+dimE(λm)  ・・・ [**]

[5] 十分性の証明の前にちょっと,気のきいた言い方を紹介しておきましょう。

上で成り立っているような E(λ1),E(λ2),・・・,E(λm) と V との関係を,

「 T の固有空間: E1),E(λ2),・・・,E(λm) によるV の直和分解 」 ← 直交分解[#]とは別です。

と呼び,

V=E(λ1) E(λ2) ・・・ E(λm)  ・・・・ [*] 

と書きます。もっと一般的に書く(定義する)と,V の部分空間,W1,W2,・・・,Wm があって,

(1) 各Wkがそれぞれ独立した異なる空間を張っている。
   (↑共通部分は,Wi∩Wj={0 },(i ≠ j ) だけ)
(2) Wkの基底のすべてを並べてV の基底とすることができる。
   (↑任意のx∈V が,適当なx1∈W1,x2∈W2,・・・,xm ∈Wmによって,xx1x2+・・・+xm とできる。

の両方が成り立つことをいっています。 言い代えると,各固有空間 Wkから一つずつ任意のベクトルをxk を取り出してきたとき,x1x2,・・・,xm が,1次独立である[#]ということです。この用語を使うと,定理は次のように言い直されます。

定理:
 V上の線形演算子Tが対角化可能である必要十分条件は,V がTの各固有空間によって直和分解されていることである。 

・・・  以上。

十分性:

[6] 十分性の証明です。さっそく上で定義した用語を使いましょう。[**]が成り立つということは,すなわち,

Tの固有空間:E1)E(λ2),・・・,E(λm) によって,V が直和分解されていることです。このとき,各固有空間の基底を

E(λ1)の基底:Σ1={1,・・・,s
E(λ2)の基底:Σ2={s+1,・・・,s+t
    ・・・・・・・・
E(λm)の基底:Σm={v+1,・・・,v+u}  

ただし,s+t+・・・+u=n であり,合計 n個のベクトル,

1,・・・,s ,s+1,・・・,s+t,・・・,v+1,・・・,v+u

は互いに1次独立であり,ベクトル空間V の基底になっているとします。

[8] すると,このn個の基底ベクトル(縦ベクトル)をこの順に並べて作った行列

Q ≡(1,・・・,s ,s+1,・・・,s+t,・・・,v+1,・・・,v+u )  

は正則です。このとき,TQを計算すると,

TQ =(T1,・・・,Ts,Ts+1,・・・,Ts+t,・・・,Tv+1,・・・,Tv+u )
  =(λ11,・・・,λ1s,λ2s+1,・・・,λ2s+t,・・・,λmv+1,・・・,λmv+u )

(1,・・・,s ,s+1,・・・,s+t,・・・,v+1,・・・,v+u )
λ1 O
:
λ1
λ2
O :
λ2
:
λm
QD

となります。 ここで,Dは対角成分として,

E(λ1)の固有値λ1が s個
E(λ2)の固有値λ2が t個
    ・・・・・・・・
E(λm)の固有値λmが u個

が左上から順に並んだ対角行列です。Q は正則行列なので,Q-1を上式の左からかけて,

Q-1TQD

となり,これはQによりTが対角行列Dに変換できることを示しています。 つまり,[**]であるならば,T が対角化可能であること [十分性] が示されました。

[証明終わり]

[目次へ]


補足:

べクトル空間 V は固有空間によって直和分解される。   (次元については何も言えない・・。)

x1∈E(λ1),x2∈E(λ2),・・・,xm∈E(λm)のとき,

x1x2+・・・・+xm0    ・・・・・・・・・・ (h1)
        ⇒      x1x2=・・・・=xm0 

証明:

j = 1,2,・・・,m に対して,

Txj=λjxj

なので,(h1)に T を左からかけて,

Tx1Tx2+・・・・+Txm 
                        =λ1x1+λ2x2+・・・・+λmTxm =0 

(h1)に λ1を左からかけて,

λ1x1+λ1x2+・・・・+λ1Txm =0 

辺々引くと,

0 +(λ2−λ1)x2+(λ3−λ1)x3+・・・+(λm−λ1)xm =0        ・・・・・・・・・・・ (h2)

再び,T を左からかけて,

2−λ1)Tx2+(λ3−λ1)Tx3+・・・+(λm−λ1)Txm 
         =(λ2−λ12x2+(λ3−λ13x3+・・・・+(λm−λ1mxm = 0

(h2)からλ2を左からかけて,

=(λ2−λ12x2+(λ3−λ12x3+・・・+(λm−λ12xm = 0

辺々引いて,

0 +(λ3−λ1)(λ3−λ2)x3+・・・+(λm−λ1)(λm−λ2)xm =0  ・・・・・・・・・・・ (h3)

これを繰り返すと,

m−λ1)(λm−λ2)・・・(λm−λm-1)xm =0 

ここで,係数は0でないので,xm =0  であることがわかりました。 さらに,

x1x2+・・・+xm-10   

について同じように繰り返せば,xm-10 が証明でき,これを繰り返せば,

xm0,・・・,x20x10

であることが証明できます。