7.1 forts. Schur triangularisering og spektralteoremet Vi skal vise to svært sentrale resultat i lineær algebra. Spektralteoremet (Teorem 3 i Lay): dette sier bl.a. at reelle symmetriske matriser er ortogonalt diagonaliserbare, og Schur triangularisering: tilleggsstoff (noe kjennskap). Vi fokuserer på det reelle tilfellet; det finnes generaliseringer til det komplekse tilfellet (men med visse endringer). Minner om at to kvadratiske matriser A og B kalles similære dersom det finnes en invertibel matrise S slik at B = S 1 AS. Da har A og B samme egenverdier. Spesielt enkelt er dette hvis S er en ortogonal matrise (dvs. S er n n og kolonnene er ortonormale); da er nemlig S 1 = S T!! 1/19
Teorem ( Schur triangulering) Anta at A er en n n matrise med reelle egenverdier λ 1, λ 2,..., λ n (telles med multipl., i en viss rekkefølge). Da finnes en (reell) ortogonal matrise U slik at U T AU = T er øvre triangulær, og der diagonalelementene i T er egenverdiene til A, t ii = λ i (i n). Merk: U T er den transponerte av U. T er en matrise. Bevis: La λ 1 være en egenverdi for A og x 1 en tilhørende reell egenvektor (en slik finnes: ta realdel evt. imaginærdel til en kompleks egenvektor). Kan normalisere så x 1 har lengde 1. Kan da utvide x 1 til en ortonormal basis for IR n (først en basis, så ortogonalitet ved Gram-Schmidt, til slutt normaliser). La U 1 være den ortogonale matrisen med vektorene i denne basisen som kolonner, der x 1 er første kolonne. Da har U1 T AU 1 formen [ ] U1 T λ1 AU 1 = O A 1 2/19
der (n 1) (n 1) matrisen A 1 har egenverdier λ 2,..., λ n. (Brukte her ortogonalitet og så på U T 1 (AU 1)). Vi behandler nå A 1 på tilsvarende måte: la x 2 være en reell egenvektor (i IR n 1 ) som hører til λ 2. Kan da finne en ortogonal (n 1) (n 1) matrise U 2 slik at [ U2 T λ2 A 1 U 2 = O A 2 ]. Definer n n matrisen [ 1 O V 2 = O U 2 ]. Lett å se at V 2 er ortogonal, og det er U 1 V 2 også. Får nå λ 1 V2 T U1 T AU 1 V 2 = 0 λ 2. O O A 2 3/19
Fortsetter slik og finner ortogonale matriser U i IR (n i+1) (n i+1) (i n 1) og ortogonale matriser V j (j n 1). Matrisen U = U 1 V 1 V n 1 er ortogonal og U T AU er øvre triangulær som ønsket. Schur triangularisering har en rekke anvendelser. Vi skal her bruke dette resultatet til å vise spektralteoremet. 4/19
Teorem ( Spektralteoremet) La A være en reell symmetrisk n n matrise. Da har A reelle egenverdier λ 1, λ 2,..., λ n (telles med multipl., i en viss rekkefølge) og det finnes en (reell) ortogonal matrise U slik at U T AU = D der D er diagonalmatrisen med diagonalelementer λ 1, λ 2,..., λ n. Kolonnene i U er n ortonormale egenvektorer som hører til de resp. egenverdiene. Bevis: Start med egenvektorlikningen Ax = λx, der x O og x og λ kan være komplekse. Dermed er ( ) x T Ax = λ x T x. Dessuten x T Ax = x T Ax = x T A x = (x T A x) T = x T A T x = x T Ax som viser at x T Ax er reell. Fra ( ) over ser vi da at egenverdien λ må være reell (idet også x T x er reell). Dette medfører at det finnes en tilhørende reell egenvektor (ved å ta realdelen evt imaginærdelen til en kompleks egenvektor; dette blir en ny egenvektor). 5/19
Så A har reelle egenverdier og egenvektorer. Ved Schur triangulering finnes da en ortogonal matrise U slik at U T AU = T der T er øvre triangulær, og har egenverdiene til A på diagonalen. Men da blir T T = (U T AU) T = U T A T U = U T AU = T så T er symmetrisk: da må T være en diagonalmatrise. Kolonnene i U er ortonormale egenvektorer for A, og vi har vist teoremet. Det komplekse tilfelle: Schur triangularisering sier at for enhver kompleks matrise A finnes en unitær matrise U (dvs. Ū T U = I ) slik at Ū T AU = T er øvre triangulær, og T har egenverdiene til A langs diagonalen. 6/19
7.2 Kvadratiske former Funksjoner på R n som er lineærkombinasjoner av ledd av typen xi 2 eller x i x j (der i j) opptrer i mange anvendelser. Disse kalles kvadratiske former. Kvadratiske former på R n kan skrives på formen x T A x der A er en symmetrisk n n matrise. Ved teorien for symmetriske matriser kan vi alltid foreta et ortogonalt variabelskifte som forenkler en gitt kvadratisk form. Et variabelskifte svarer til et bytte av koordinatsystem. Nivåmengder for en kvadratisk form er enkle å beskrive når man velger riktig koordinatsystem. Når n = 2 er nivåkurvene man da får gjerne ellipser eller hyperbler. Skal se til slutt at kvadratiske former (og symmetriske matriser) kan klassifiseres i noen hovedtyper. Disse typene er viktige f.eks. når man studerer stasjonære punkter til reelle funksjoner på R n (ved å se på Hesse-matrisene, jf. MAT1110). 7/19
Definition. En kvadratisk form på R n er en funksjon Q : R n R som kan skrives på formen Q(x) = x T A x der A er en symmetrisk n n matrise. [ ] 5 2 Eksempel. La A = og Q(x) = x 2 5 T A x. Da er Q(x) = [ x 1 x 2 ] [ 5 2 2 5 ] [ x1 x 2 ] = [ x 1 x 2 ] [ 5x 1 2x 2 2x 1 + 5x 2 = x 1 (5x 1 2x 2 ) + x 2 ( 2x 1 + 5x 2 ) = 5x 2 1 4x 1 x 2 + 5x 2 2. ] 8/19
Eksempel. La Q(x) = a x 2 1 + b x 1x 2 + c x 2 2, x = (x 1, x 2 ) R 2. Da er Q(x) = [ x 1 x 2 ] [ a b/2 b/2 c (ved en enkel utregning). Eksempel. La ] [ x1 x 2 ] = x T [ a b/2 b/2 c Q(x) = a x 2 1 +b x 1 x 2 +c x 2 2 +d x 2 x 3 +e x 2 3 +f x 1 x 3, x = (x 1, x 2, x 3 ) R 3. ] x Da er Q(x) = [ x 1 x 2 ] x 3 a b/2 f /2 b/2 c d/2 f /2 d/2 e x 1 x 2 x 3. (Sjekk!) 9/19
Kvadratiske former tilordnet diagonalmatriser er enkle : La D= diag(d 1, d 2,..., d n ) og Q (y) = y T D y, y R n. Da er Q (y) = d 1 y 2 1 + d 2 y 2 2 +... + d n y 2 n (sjekkes på tavla). Med enkel menes altså at det finnes ingen kryssledd av typen y i y j med i j. Vi skal nå se at vi kan alltid gjøre om en kvadratisk form til en enkel kvadratisk form uten kryssledd ved et passende variabelskifte. Husk at et variabelskifte svarer til at vi skifter basis (og dermed koordinatsystem): hvis P = [u 1... u n ] er en n n invertibel matrise og vi foretar variabelskiftet y = P 1 x, mao. x = Py så er y koordinatvektoren til x mhp. basisen B = {u 1... u n } (fordi P 1 er koordinatskiftematrisen fra standard basisen til B, jf. avsn. 4.4 og 4.7). 10/19
Betrakt en kvadratisk form på R n Q(x) = x T A x der A er en symmetrisk n n matrise. Siden A er symmetrisk vet vi fra avsn. 7.1 at A er ortogonalt diagonaliserbar : det finnes da en ortogonal n n matrise P og en n n diagonalmatrise D = diag(d 1,..., d n ) slik at A = PDP 1 = PDP T (siden P 1 = P T ), og da er P T AP = D. Minner om at kolonnene i P er da en ortonormal basis B for R n bestående av egenvektorer for A tilhørende egenverdiene d 1,..., d n. Vi foretar nå variableskiftet y = P 1 x, mao. x = Py. Vi får da at Q(x) = x T A x = (Py) T A(Py) = y T P T APy = y T Dy. Nå er Q (y) := y T D y en kvadratisk form uten kryssledd! 11/19
Vi har dermed vist følgende: Teorem 4. I koordinatsystemet for R n med akser bestemt av en ortonormal egenvektorbasis B for den symmetriske matrisen A, så blir den kvadratiske formen Q(x) = x T Ax gjort om til en kvadratisk form uten kryssledd. Aksene i koordinatsystemet ovenfor kalles ofte hovedaksene (eller prinsipalaksene). [ ] 5 2 Eksempel. La A = og Q(x) = x 2 5 T A x. Man regner lett ut at egenverdiene ] til A er 3 og [ 7, med ] tilhørende, u 2 = 1 1 2. 1 [ enhetsegenvektorer u 1 = 1 1 2 1 ] Sett P = [ 1 2 1 2 1 2 1 2 Variabelskiftet x = Py gir da at og D = diag(3, 7). Q(x) = x T A x = y T Dy = 3y 2 1 + 7y 2 2 (= Q (y)). 12/19
En geometrisk anvendelse For enkelhets skyld ser vi på når n = 2. Betrakt en kvadratisk form på R 2, Q(x) = a x 2 1 + b x 1x 2 + c x 2 2. Hvordan ser nivåkurvene til Q ut? Minner om at nivåkurven til Q svarende til en verdi d R består av alle x = (x 1, x 2 ) i R 2 som er slik at Q(x) = d, mao. som tilfredstiller likningen a x 2 1 + b x 1 x 2 + c x 2 2 = d Vi kan da skifte variabel og gå over til koordinatsystemet angitt i Teorem 4. Likningen ovenfor forenkles da til likningen d 1 y 2 1 + d 2 y 2 2 = d der d 1 og d 2 er egenverdiene til den symmetriske matrisen A tilordnet Q. Kurvene bestemt av denne likningen, og dermed nivåkurvene til Q, lar seg lett beskrive. 13/19
Anta f.eks. at d 1, d 2 og d alle er forskjellig fra 0. Da har vi at hvis d 1, d 2 (og d) alle har samme fortegn så blir kurven en ellipse hvis d 1, d 2 har motsatt fortegn så blir kurven en hyperbel. Eksempel. Betrakt likningen 5 x1 2 4 x 1x 2 + 5 x2 2 = 48, mao. [ ] Q(x) = 48 der Q(x) = x T 5 2 A x med A =, som i 2 5 forrige eksempel. I koordinatsystemet bestemt av egenvektorbasisen for A vi fant da, blir likningen omgjort til 3 y1 2 + 7 y 2 2 = 48, altså til y 2 1 4 2 + y 2 2 ( 48/7 ) 2 = 1 som er likningen for en ellipse (se fig. 3(a) s. 476). 14/19
Eksempel. Betrakt likningen 3 x1 2 + 10 x 1x 2 + 3 x2 2 = 2, mao. [ ] 3 5 Q(x) = 2 der Q(x) = x T A x med A =, 5 3 Man regner lett ut at egenverdiene ] til A er 8 og [ -2, med ] tilhørende, u 2 = 1 1 2. 1 [ enhetsegenvektorer u 1 = 1 1 2 1 ] Sett P = [ 1 2 1 2 1 2 1 2. Variabelskiftet x = Py gjør da likningen Q(x) = 2 om til likningen 8 y 2 1 2 y 2 2 = 2, dvs. y 2 1 (1/2) 2 y 2 2 = 1. Dette er likningen for en hyperbel (som skisseres på tavla). 15/19
Klassifikasjon av kvadratiske former Motivasjon. La Q(x) = x T Ax være en kvadratisk form på R 2. Det er enkelt å sjekke at O = (0, 0) er et stasjonært punkt for Q, dvs. Q x 1 (0, 0) = Q x 2 (0, 0) = 0. Et naturlig spørsmål er derfor : hva slags stasjonært punkt er O? (Se fig. 4, s. 460). Merk at Q(O) = 0. Definition. En kvadratisk form Q på R n kalles positiv definit dersom Q(x) > 0 for alle x O. (Da er O et min. punkt for Q). negativ definit dersom Q(x) < 0 for alle x O. (Da er O et maks. punkt for Q). indefinit dersom Q(x) antar både positive og negative verdier. (Da vil O være et sadelpunkt for Q). 16/19
Merk : man sier også at Q er positiv semidefinit dersom Q(x) 0 for alle x, negativ semidefinit dersom Q(x) 0 for alle x. Teorem 5 Kvadratiske former og egenverdier. La A være en n n symmetrisk matrise. Den kvadratiske formen Q(x) = x T Ax på R n er positiv definit alle egenverdiene til A er positive, negativ definit alle egenverdiene til A er negative, indefinit A har både positive og negative egenverdier. Merk : tilsvarende gjelder det at Q er positiv semidefinit alle egenverdiene til A er ikkenegative, negativ semidefinit alle egenverdiene til A ikkepositive, 17/19
Bevis-skisse. Ved å benytte Teorem 4 kan vi betrakte istedet Q (y) = d 1 y 2 1 + + d n y 2 n der d 1,..., d n er egenverdilisten til A. Ved å studere fortegnet til dette uttrykket er det rimelig opplagt at påstandene i teoremet er sanne. Eksempel. La Q(x) = 5 x1 2 4 x 1x 2 + 5 x2 2 [ ]. 5 2 Siden A = har egenverdiene 3 og 7, som begge er 2 5 positive, så er Q positiv definit. (Dermed er (0, 0) et min. punkt for Q). Eksempel. La Q(x) = 3 x1 2 + 10 x 1x 2 + 3 x2 2 [ ]. 3 5 Siden A = har egenverdiene 8 og -2, så er Q indefinit. 5 3 (Dermed er (0, 0) et sadelpunkt for Q). 18/19
Eksempel. La Q(x) = x1 2 4 x 1x 2 + x2 2 + 4x 2x 3 + x3 2 + 4x 1x 3. 1 2 2 Da er Q(x) = x T Ax der A = 2 1 2. 2 2 1 Vi har sett tidligere (jf. forrige forelesning) at egenverdiene til A er 3 og -3. Dermed er Q indefinit. Merk: Samme terminologi brukes til å klassifisere symmetriske matriser som kvadratiske former: en symmetrisk matrise A kalles positiv definit dersom den tilhørende kvadratiske formen er positiv definit, osv. Teorem 5 har da en tilsvarende formulering for symmetriske matriser. [ ] 5 2 F.eks. er A = positiv definit (jf. tidl. eksempel). 2 5 19/19