FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) TERJE SUND Innledning I matematisk optimering søker en å bestemme maksimums- og minimumspukter for funksjoner som avhenger av reelle variable og av andre funksjoner. Optimal kontrollteori er en moderne utvidelse av klassisk variasjonsregning. Euler og Lagrange utviklet teorien for variasjonsregning på 1700-tallet. Dens hovedingrediens er Eulerlikningen 1 som ble oppdaget allerede i 1744. De enkleste problemene i variasjonsregning er av typen t1 maks F (t, x(t), ẋ(t)) dt t 0 når x(t 0 ) = x 0, x(t 1 ) = x 1, der t 0, t 1, x 0, x 1 er gitte tall og F er en gitt funksjon av tre (reelle) variable. Problemet er alt å bestemme funksjoner x(t) som gjør integralet t 1 t 0 F (t, x(t), ẋ(t)) dt størst eller minst. Optimal kontrollteori har siden 1960-tallet blitt anvendt i studier av mange forskjellige områder, slik som økonomisk vekst, lagerhold, beskatning, uttømming av naturresurser og raketteknologi (spesielt avskjæring av missiler). 1. Differensiallikninger. Mange av problemene i dynamisk optimering, f. eks. i variasjonsregning, kan overføres til løsning av differensiallikninger. I kontrollteori behandles systemer som i utgangspunktet er styrt av differensiallikninger. Derfor blir løsning av differensiallikninger sentralt i optimeringsteori. Første ordens differensiallikninger er likninger på formen G(t, x, ẋ) = 0, (ẋ = dx/dt, x = x(t)) 1 Eulerlikningen er en partiell differensiallikning på formen F x d dt ( F ẋ ) = 0, der F er en funksjon av 3 reelle variable, x en ukjent funksjon av én variabel t og ẋ(t) = dx dt (t). F x betyr den partiellderiverte av F mhp. annen variabel x, F F x (t, x, ẋ), og ẋ er den partiellderiverte mhp. tredje variabel ẋ. 1
2 TERJE SUND Mange av dem kan skrives på formen (1) ẋ(t) = F (t, x(t)) Av disse kan noen typer løses ved formler. Spesielt gjelder dette for 1.1 Separable likninger Disse kan skrives dx dt = f(t) g(x), dvs. g(x) dx = f(t) dt (separasjon av variable), g(x) dx = f(t) dt, eller G(X) = F (t) + C, der F (t) = f(t) og G (x) = g(x) og C er en vilkårlig konstant. Hvis G har en invers funksjon G 1 på et intervall I, har vi derfor x(t) = G 1 (F (t) + C), t I Dette er et spesialtilfelle av lineære likninger som vi skal studere nedenfor. Eksempel 1. Løs likningen, og bestem en løsningskurve gjennom det oppgitte punktet: (1 + t 2 )ẋ = tx, (t 0, x 0 ) = (0, 3). Løsning: dx dt = t 1 + t x, 2 dx x = t 1 + t dt, 2 ln x = 1ln(1 + 2 t2 ) + C 1, eller x = e 1 2 ln(1+t2 )+C 1 = C 2 e ln 1+t 2 = C 2 1 + t2, der C 2 = e C 1 > 0. Alt er x(t) = C 1 + t 2, C 0. Endepunktbetingelsen x(0) = C = 3 gir løsningen x(t) = 3 1 + t 2, t reell. Oppgave. Løs likningen (1 + t 2 )ẋ = x, (Svar: x(t) = e arctan t+1 ) 1.2. Lineære likninger av 1. orden. Disse likningene er av typen ẋ + a(t)x = f(t), (t 0, x 0 ) = (0, e).
FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 3 der a og f er kontinuerlige funksjoner på et gitt intervall I. Her kan vi multiplisere likningen med en integrerende faktor e A(t), der A(t) = a(t) dt. Dermed får vi [ẋ + a(t)x]e A(t) = f(t)e A(t), d dt (xea(t) ) = f(t)e A(t), xe A(t) = f(t)e A(t) dt + C, ( ) x(t) = e A(t) ( f(t)e A(t) dt + C) Eksempel 2. Likningen ẋ x = t, er lineær og A(t) = ( 1) dt = t (Vi trenger bare en enkelt løsning for A(t) og kan derfor velge integrasjonskonstanten som vi ønsker.) x(t) = e t [ te t dt + C] = e t [ te t + e t dt + C] = e t [ te t e t + C] = Ce t t 1 Oppgave Påvis at den generelle løsningen av likningen ẋ+a(t)x = f(t) kan skrives u + v, der u er en enkelt løsning av likningen og der u(t) = C exp [ A(t)] er den generelle løsningen av den homogene likningen ẋ + a(t)x = 0. Nyttig spesialtilfelle: Vi betrakter den lineære likningen ẋ + ax = b, der a og b er gitte konstanter. Dette er en lineær første ordens differensiallikning med konstante koeffisienter. I tillegg er likningens høyreside og konstant. Formelen i ( ) gir her x(t) = e at ( be at dt + C) = b a + Ce at, der a 0. Tilfellet a = 0 gir x(t) = bt + C. Normalt kan en likning av typen ẋ(t) = F (t, x(t)) ikke løses eksplisitt ved en formel der bare elementære funksjoner inngår. Vi kan da forsøke å beregne løsninger ved rekkeutvikling eller studere generelle trekk ved løsningene. Ofte vil det og være nyttig i anvendelser å approksimere løsningene numerisk. Det kan da være naturlig først å stille spørsmålet om eksistens og éntydighet av en løsning. Ofte har vi eksistens og éntydighet lokalt:
4 TERJE SUND 1.3 Setning. (Eksistens- og éntydighetssetning). Betrakt differensiallikningen ẋ = F (t, x), x(t 0 ) = x 0. Anta at F og df er kontinuerlige på en åpen mengde A dx R2 og at (t 0, x 0 ) A. Da eksisterer en løsning x = x(t) definert på et åpent intervall om t 0 Hvis to slike løsninger begge er definert på et felles åpent intervall I om t 0, er de like på I. 1.4 Differensiallikninger av 2. orden Slike likninger kan skrives G(t, x, ẋ, ẍ) = 0, der G er en gitt funksjon av fire variable. De likningene vi møter i praksis, kan ofte skrives Eksempel 3. ẍ = F (t, x, ẋ) ẍ = t + sin t Høyre side avhenger her bare av t. Integrasjon av likningen gir ẋ = t 2 /2 cos t + C 1, x = 1 6 t3 sin t + C 1 t + C 2, der konstantene C 1 og C 2 kan velges fritt. Eksempel 4. ẍ = t + ẋ Her er høyresiden uavhengig av x. Substitusjonen u = ẋ, u = ẍ gir da (via et tidligere eksempel) u u = t, u = C 1 e t t 1, x = C 1 e t 1 2 t2 t + C 2. Normalt gir eksplisitt løsning av en 2. ordens differensiallikning en formel x = x(t, C 1, C 2 ), der integrasjonskonstantene kan velges fritt. Spesifiserer vi en initialbetingelse på formen x(t 0 ) = x 0, ẋ(t 0 ) = ẋ 0, kan konstantene C 1 og C 2 bestemmes. 1.5 Lineære differensiallikninger av 2. orden.
FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 5 Disse likningene kan skrives (2) ẍ + a(t)ẋ + b(t)x = f(t), der a, b og f er gitte kontinuerlige funksjoner på et reelt intervall I. Her fins det ingen eksplisitt løsningsformel slik som vi hadde for 1. ordens lineære likninger. Selv ikke homogene 2. ordens likninger (3) ẍ + a(t)ẋ + b(t)x = 0 vil generelt ha noen eksplisitt løsningsformel. Vi kan imidlertid klarlegge strukturen av løsningene. Nedenfor skal vi vise følgende resultater: 1.6 Setning. Den homogene likningen har generell løsning ẍ + a(t)ẋ + b(t)x = 0 x(t) = C 1 u 1 (t) + C 2 u 2 (t), der u 1 og u 2 er to ikke-proporsjonale (alt lineært uavhengige) løsninger og C 1 og C 2 er to vilkårlige konstanter. Eksempel 5. Selv for den tilsynelatende enkle Bessels differensiallikning t 2 ẍ + tẋ + (t 2 α 2 )x = 0 (α 0 en konstant), kan løsningene ikke uttrykkes ved de vanlige elementære funksjonene. Løsningene kalles Besselfunksjoner og kan uttrykkes ved hjelp av potensrekker om 0. De er på formen f(t) = t r n=0 (Se f.eks. Apostol, Calculus vol II, 7.19) a n t n 1.7 Setning. Den inhomogene lineære annen ordens differensiallikningen ẍ + a(t)ẋ + b(t)x = f(t) har generell løsning x(t) = C 1 u 1 (t) + C 2 u 2 (t) + u (t), der C 1 u 1 + C 2 u 2 er den generelle løsningen av den homogene likningen og u er en enkelt (partikulær) løsning av den inhomogene likningen.
6 TERJE SUND Eksempel 6. Betrakt likningen ẍ x = e t Den tilhørende homogene likningen ẍ x = 0 har løsninger u 1 = e t og u 2 = e t som ikke er proporsjonale. Dessuten har den inhomogene likningen en partikulær løsning u = 1 2 tet (Det kan sjekkes ved innsetting i likningen). Den generelle løsningen blir derfor x(t) = C 1 e t + C 2 e t + 1 2 tet. Homogene lineære likninger med konstante koeffisienter. Ifølge Setning 1.6 trenger vi to ikke-proporsjonale løsninger u 1 og u 2 for å løse den generelle homogene lineære differnsiallikningen av orden 2. For det spesielle tilfellet at likningen har konstante koeffisienter a og b, fins det en elementær metode. Betrakt nemlig likningen (1) ẍ + aẋ + bx = 0, der a og b er reele konstanter. La oss forsøke en løsning av typen x(t) = e rt, der r er en reell konstant. Innsetting i (1) gir da: dvs. r 2 e rt + are rt + be rt = 0, (2) r 2 + ar + b = 0 Likning (1) har derfor en slik løsning hvis og bare hvis r er en rot i den karakteristiske likningen (2) tilordnet (1). Vi kan da drøfte følgende mulige tilfelle: (a) Hvis a 2 4b > 0 vil likning (2) ha to forskjellige reelle røtter r 1 og r 2, vi har to ikke-proporsjonale løsninger u 1 (t) = e r 1t og u 2 (t) = e r 2t. Ifølge Setning 1.6, er da den generelle løsningen av (1) u(t) = C 1 e r 1t + C 2 e r 2t (b) Hvis (2) har en dobbeltrot (sammenfallende reellle røtter) r, dvs. r = a 2 (b2 = 4a), får vi en løsning u 1 (t) = e rt. I tillegg er det lett å se at u 2 (t) = te rt og er en løsning. Merk at u 1 og u 2 er ikke-proporsjonale. Vi setter u = u 2 og sjekker at dette er løsning: u = e rt + rte rt, ü = re rt + r(1 + rt)e rt = (2r + r 2 t)e rt,
og FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 7 ü + a u + bu = [2r + r 2 t + a(1 + rt) + bt]e rt = [(r 2 + ar + b)t + 2r + a]e rt = (0 + 0)e rt = 0, siden r 2 + ar + b = 0 og r = a 2. Dermed er u 2 løsning av (1). Generell løsning er dermed u(t) = C 1 e rt + C 2 te rt = (C 1 + C 2 t)e rt. (c) a 2 4b < 0 : Da har r 2 + ar + b = 0 to komplekse røtter r = α + iβ, α = a, β = b a2. Da vil funksjonene u 2 4 1(t) = e αt cos βt, u 2 (t) = e αt sin βt være to ikkeproporsjonale løsninger av (1). Generell løsning er derfor Kontroll: e αt (C 1 cos β t + C 2 sin β t) Vi vil utføre kontrollen for funksjonen x(t) = e αt cos β t, utregningene er analoge for e αt sin β t. Her er og ẋ = αe αt cos β t βe αt sin β t = e αt (cos β t β sin β t) ẍ = αe αt (α cos β t β sin β t) + e αt ( αβ sin β t β 2 cos β t) = e αt ((α 2 β 2 ) cos β t 2αβ sin β t), ẍ+aẋ+bx = e αt [(α 2 β 2 ) cos β t 2αβ sin β t+aα cos β t aβ sin β t+b cos β t] Her er e αt [(α 2 β 2 + aα + b) cos β t (2αβ + aβ) sin β t] α 2 β 2 = a2 4 (b a2 4 ) = a2 2 b, aα = a2, 2α + a = a + a = 0, 2 ẍ + aẋ + bx = e α t [( a2 2 b a2 2 + b) cos β t β 0 sin β t] = 0
8 TERJE SUND Utnyttelse av komplekse løsninger. Ved to komplekse løsninger r = α ± iβ av den karakteristiske likningen, finner vi akkurat som for tilfelle (a) med to reelle røtter, at funksjonene e (α±iβ)t = e α t (cos β t ± i sin β t) er løsninger av (1). Dermed er og realdelen u 1 (t) = e α t cos β t og imaginærdelen u 2 (t) = e α t sin β t og løsninger av (1) hver for seg. Dette er lett å se ved innsetting i den lineære differensiallikningen. Noen spesielle inhomogene likninger. Betrakt nå den lineære inhomogene likningen med konstante koeffisienter, (3) ẍ + aẋ + bx = f(t), der a og b er reelle konstanter. I noen spesielle tilfelle kan vi gjette oss til formen på en partikulær løsning u. Deretter kan vi bestemme u ved ubestemte koeffisienters metode. Eksempel 7. Betrakt likningen ẍ 4ẋ + 4x = t 2 2t + 2 Her er høyre side et 2.-gradspolynom i t. Vi gjetter på en løsning x av samme type, dvs. x(t) = At 2 + Bt + C. Da blir ẋ = 2At + B, ẍ = 2A, ẍ 4ẋ + 4x = 2A (8At + 4B) + (4At 2 + 4Bt + 4C) = 4At 2 + (4B 8A)t + 2A 4B + 4C som alt skal være lik t 2 2t + 2 for alle reelle t. Det gir A = 1, 4(B 2A) = 2, 2A 4B + 4C = 2, 4 og A = 1 4, B = 0, C = 3 8 x(t) = 1 4 t2 + 3 8
FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 9 er en partikulær løsning. Den generelle løsningen er da ifølge Setning 1.7 og tilfelle (b) ovenfor (den karakteristiske likningen har r = 2 som dobbeltrot): Oppgave 1 u(t) = C 1 e 2t + C 2 te 2t + 1 4 t2 + 3 8 Løs likningen ẍ 2ẋ + x = t 2 2t + 2. (Svar: u (t) = t 2 + 2t + 4, u 1 (t) = e t, u 2 (t) = te t ) Oppgave 2 Løs likningen ẍ + 2ẋ + x = t 3 + 2t + 1. (Svar: u (t) = t 3 6t 2 + 20t 27, u 1 (t) = e t, u 2 (t) = te t ) Eksempel 8. Betrakt likningen (4) ẍ + aẋ + bx = pe qt, p 0, der p og q er reelle konstanter. Vi prøver med x(t) = Ape qt, ẋ = Apqe qt, ẍ = Apq 2 e qt, ẍ + aẋ + bx = A(pq 2 + apq + bp)e qt = Ape qt (q 2 + aq + b) = pe qt. Demed m A = 1/q 2 + aq + b, hvis q 2 + aq + b 0, og x(t) = pe qt /q 2 + aq + b er en partikulær løsning. Hvis q 2 + aq + b = 0, dvs q er en rot i den karakteristiske likningen, prøver vi med x(t) = Bte qt. Da blir ẋ = Be qt (1 + qt), ẍ = Bqe qt (1 + qt) + Be qt q = Bqe qt (2 + qt), ẍ + aẋ + bx = Be qt (2q + q 2 t + a + aqt + bt) = Be qt [(q 2 + aq + b)t + 2q + a]be qt (2q + a). Da dette skal være lik pe qt for alle t, må B = p/2q + a, hvis 2q + a 0 og x(t) = p 2q + a teqt
10 TERJE SUND er en løsning. Hvis og 2q + a = 0, dvs. at b a 2 /4 = 0 og a = 2q, er q dobbeltrot i den karakteristiske likningen. Vi prøver da og det gir x(t) = cte qt, ẍ + aẋ + bx = ce qt [bt 2 + a(2t + qt 2 ) + 2 + 2qt + 2tq + q 2 t 2 ] = ce qt [(q 2 + aq + b)t 2 + 2(a + 2q)t + 2] = pe qt, c = p/2 og dermed er x(t) = p 2 t2 e qt en løsning. I neste avsnitt skal vi se at det fins en generell metode til å bestemme en partikulær løsning av den inhomogene lineære likningen ẍ + a(t)ẋ + b(t)x = f(t) med ikkekonstante koeffisienter, sant to ikkeproporsjonale løsninger u 1 og u 2 av den homogene likningen er kjent. Det å bestemme u 1 og u 2, er imidlertid ikke alltid mulig. Lagranges metode med variasjon av konstantene. Betrakt likningen (1) ẍ + a(t)ẋ + b(t)x = f(t), definert på et åpent intervall I. La oss anta at vi kjenner to lineært uavhengige løsninger u 1 og u 2 av den homogene likningen (2) ẍ + a(t)ẋ + b(t)x = 0. Vi vil forsøke å bestemme deriverbare funksjoner c 1 (t) og c 2 (t), slik at funksjonen x(t) = c 1 (t)u 1 (t) + c 2 (t)u 2 (t) er en partikulær løsning av (1). Vi har ẋ = ċ 1 u 1 + ċ 2 u 2 + c 1 u 1 + c 2 u 2 Siden c 1 og c 2 er to ukjente funksjoner som vi ønsker å bestemme, trenger vi to likninger der c 1 og c 2 inngår sammen med kjente funksjoner som a, b, og f. Hvis vi krever at (3) ċ 1 u 1 + ċ 2 u 2 = 0, blir ẋ = c 1 u 1 + c 2 u 2 og den andre-deriverte blir Krever vi videre at ẍ = ċ 1 u 1 + ċ 2 u 2 + c 1 ü 1 + c 2 ü 2 (4) ċ 1 u 1 + ċ 2 u 2 = f,
ser vi at FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 11 ẍ = c 1 ü 1 + c 2 ü 2 + f, ẍ+a(t)ẋ+b(t)x = c 1 ü 1 +c 2 ü 2 +f +a(t)(c 1 u 1 +c 2 u 2 )+b(t)(c 1 u 1 +c 2 u 2 ) f + c 1 (ü 1 + a(t) u 1 + b(t)u 1 ) + c 2 (ü 2 + a(t) u 2 + b(t)u 2 = f. Velger vi c 1 og c 2 slik at de lineære (3) og (4) er oppfylt, vil vi derfor ha funnet en partikulær løsning x. Løser vi det lineære systemet (3) og (4) for ċ 1 og ċ 2, får vi ċ 1 = fu 2 /(u 1 u 2 u 1 u 2 ) = fu 2 /W ċ 2 = fu 1 /(u 1 u 2 u 1 u 2 ) = fu 1 /W, der W = u 1 u 2 u 1 u 2 kalles Wronski-determinanten til likningen. Vi skal se nedenfor at W ikke er null i noe punkt. Integrasjon av uttrykkene for ċ 1 og ċ 1, gir: c 1 (t) = u 2 (t)f(t)/w (t) dt, c 2 (t) = u 1 (t)f(t)/w (t) dt. Her har vi brukt følgende Lemma Wronski-determinanten W (t) = u 2 u 1 u 2 0 for alle t i definisjonsintervallet I til differensiallikningen (1). I beviset av lemmaet brukes Eksistens- og éntydighetssetningen for lineære differensiallikninger (av n-te orden her): Setning Anta at a 1, a 2,..., a n og f er kontinuerlige funksjoner på et åpent reelt intervall I, og la x 0, x 1,..., x n 1, være n gitte tall. For hver t 0 I har den lineære differensiallikningen d n x dt + a d n 1 x n 1 dt + + a nx = f n 1 én og bare én løsning x på I som oppfyller betingelsene x(t 0 ) = x 0, dx dt (t 0) = x 1,... dn 1 x dt n 1 (t 0) = x n 1. Bevis: Se Tom. M. Apostol, Calculus, vol. II, Chapter 9. La oss anvende siste setning til å vise at Wronskideterminanten W = u 1 u 2 u 2 u 1 til en lineær 2. ordens differensiallikning (som i (1)) aldri er null, der u 1 og u 2 er to lineært uavhengige løsninger av den homogene
12 TERJE SUND likningen (2). Anta at W (t 0 ) = 0 for en t 0 I. Vi søker en motsigelse. W (t 0 ) = 0 impliserer at søylene i determinanten W (t 0 ) = u 1(t 0 ) u 2 (t 0 ) u 1 (t 0 ) u 2 (t 0 ) er lineært avhengige. Alt fins reelle tall λ 1 og λ 2 slik at ( ) ( ) ( u1 (t λ 0 ) u2 (t 1 + λ 0 ) 0 u 1 (t 0 ) 2 = (λ u 2 (t 0 ) 0) 2 1 + λ 2 2 0), λ 1 u 1 (t 0 ) + λ 2 u 2 (t 0 ) = 0 λ 1 u 1 (t 0 ) + λ 2 u 2 (t 0 ) = 0 Men da oppfyller løsningen λ 1 u 1 +λ 2 u 2 av (2) de samme initialbetingelsene som 0-funksjonen i punktet t 0. Ved éntydighets-setningen ovenfor er da λ 1 u 1 + λ 2 u 2 = 0, som motsier at u 1 og u 2 var lineært uavhengige. Dermed er W (t 0 ) 0, for alle t I. Dermed gir løsningsformlene vi fant for c 1 og c 2 mening, og vi har funnet en partikulær løsning av (1) gitt ved u2 (t)f(t) u1 (t)f(t) (5) x(t) = u 1 (t) dt + u 2 (t) dt W (t) W (t) Merk. Det fins ingen generell metode for å bestemme lineært uavhengige løsninger av lineære homogene (2. ordens) differensiallikninger. Eksempel 9. Betrakt likningen ẍ x = ln t Her er u 1 (t) = e t, u 2 (t) = e t lineært uavhengige løsninger av den homogene likningen ẍ x = 0. Videre er et e t = 2, e t e t en partikulær løsning er gitt ved x(t) = et e t ln t dt e t 2 2 e t ln t dt Disse integralene kan ikke uttrykkes ved elementære funksjoner. Eksempel 10. La oss finne en partikulær løsning x av ẍ+x = 1 sin 2 t. Her er u 1 (t) = cos t og u 2 (t) = sin t lineært uavhengige løsninger av
ẍ + x = 0 og FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 13 Dermed er x(t) = cos t = cos t 2 = cos t 2 W (t) = cos t sin t sin t cos t = 1. sin t sin 2 dt + sin t t cos t sin 2 t dt cos t ln[1 ] + sin t( 1/ sin t) 1 + cos t ln[1 cos t 1 + cos t ] 1 = cos t ln tan t 2 1. Oppgave. La u 1 og u 2 være lineært uavhengige løsninger av ẍ + a(t)ẋ + b(t)x = 0, t I. Vis Abels formel for Wronskideterminanten: W (t) = W (c) exp R t c a(s) ds (der t, c I) (Vink: Ẇ + a(t)w = 0) Bevis av struktursetningene for lineære 2. ordens likninger. Vi vil nå anvende Eksistens- og éntydighetssetningen for lineære differensiallikninger til å vise struktursetningene for den generelle løsningen av lineære 2. ordens likninger. Betrakt først den homogene likningen (2) ẍ + a(t)ẋ + b(t)x = 0 på et åpent intervall I. Vi ønsker å vise at enhver løsning av (2) kan skrives x = c 1 u 1 + c 2 u 2, der u 1 og u 2 er to lineært uavhengige løsninger av (2). Vi velger en fast, vilkårlig t 0 i I. Ved Eksistens-delen av setningen nevnt ovenfor, fins det to løsninger u 1 og u 2 av (2) slik at u 1 (t 0 ) = 1, u 1 (t 0 ) = 0 u 2 (t 0 ) = 0, u 2 (t 0 ) = 1 Her er u 1 og u 2 lineært uavhengige: Hvis λ 1 og λ 2 er reelle tall, ikke begge lik null, slik at følger λ 1 u 1 + λ 2 u 2 = 0-funksjonen, 0 = λ 1 u 1 (t 0 ) + λ 2 u 2 (t 0 ) = λ 1 0 = λ 1 u 1 (t 0 ) + λ 2 u 2 (t 0 ) = λ 2,
14 TERJE SUND λ 1 = λ 2 = 0 og {u 1, u 2 } er lineært uavhengig. Anta at x er en vilkårlig løsning av (2), og velg en fast t 0 I. Vi setter x(t 0 ) = x 0, ẋ(t 0 ) = ẋ 0 og betrakter det lineære likningsystemet c 1 u 1 (t 0 ) + c 2 u 2 (t 0 ) = x 0 c 1 u 1 (t 0 ) + c 2 u 2 (t 0 ) = ẋ 0 Dette systemet har en éntydig løsning for c 1 og c 2 hvis determinanten W (t 0 ) 0. Vi tidligere at W (t) aldri er null. Alt er c 1 u 1 + c 2 u 2 en løsning av (2) som oppfyller nøyaktig de samme initialbetingelsene i t 0 som løsningen x. Ved éntydighet, må derfor x = c 1 u 1 + c 2 u 2 på intervallet I. Vi ser på den inhomogene likningen (1) ẍ + a(t)ẋ + b(t)x = f(t), der a, b og f er kontinuerlige funksjoner på I, og anta at u er en partikulær løsning av (1). La videre u 1 og u 2 være to lineært uavhengige løsninger av den korresponderende homogene likningen. Hvis x er en vilkårlig løsning av (1), vil vi vise at x kan skrives x = c 1 u 1 + c 2 u 2 + u, for passende konstanter c 1 og c 2. Ved innsetting i likning (2), ser vi at x u er en løsning av den homogene likningen. Dermed vet vi at det fins reelle konstanter c 1, c 2 slik at men det betyr at som vi skulle vise. x u = c 1 u 1 + c 2 u 2, x = c 1 u 1 + c 2 u 2 + u 2. Differenslikninger. I anvendelser måles ofte tiden t i heltallige multipla av tidsenheten (som kan være f.eks. sekunder, minutter, timer, døgn, uker, eller måneder). Vi sier da at t er en diskret variabel. I dette kapitlet vil alle variable være diskrete. Som regel vil de kunne ta verdiene 0, 1, 2,.... Et systems tilstand ved tiden t, vil betegnes ved x t. En første ordens differenslikning er på formen G(t, x t, x t+1 ) = 0, der G er en gitt funksjon av tre (reelle) variable. De likningene vi skal studere, kan som regel skrives på den enklere formen x t+1 = F (t, x t ),
FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 15 der F er en gitt funksjon av to variable. Hvis en initialverdi x 0 er gitt, kan vi bestemme alle x t, t = 0, 1, 2,..., rekursivt fra differenslikningen: x 1 = F (0, x 0 ), x 1 = F (1, x 1 ),..., x t = F (t 1, x t 1 ),.... Eksempel 1(Forrentning av kapital) La x t være (en persons, et firmas eller et fonds) kapital ved tiden t (t = 0, 1, 2,... ) og la r = 1 + p/100 (p > 0) være rentefaktoren. Da er x t+1 = rx t For gitt startkapital x 0, får vi x 1 = rx 0, x 2 = rx 1 = r 2 x 0,..., x t = r t x 0,.... Dvs. at kapitalen vokser eksponentielt med tiden t. Den lineære 1. ordens differenslikningen x t+1 = ax t + b der a og b er gitte reelle konstanter, kan løses slik: x 1 = ax 0 + b, x 2 = ax 1 + b = a 2 x 0 + ab + b = a 2 x 0 + (a + 1)b. x 3 = ax 2 + b = a 3 x 0 + (a 2 + a + 1)b. Vi gjetter at (1) x t = a 2 x 0 + (a t 1 + a t 2 + + t + 1)b (t > 0). La oss vise (1) ved induksjon. Formelen er opplagt riktig for t = 1 siden x 1 = ax 0 + b av differenslikningen. Anta som induksjonshypotese, at (1) er riktig for t = k, der k > 0 er et helt tall. Ved differenslikningen og induksjonhypotesen er da x k+1 = ax k + b = a(a k x 0 + (a k 1 + + a + 1)b) + b = a k+1 x 0 + (a k + a k 1 + + a + 1)b, formelen (1) gjelder for t = k + 1. formelen gjelder for alle t = 1, 2, 3,.... (1) kan og skrives Ved induksjon følger det at (2) x t = a t x 0 + 1 at 1 a b = at (x 0 b 1 a ) + b (a 1). 1 a For a = 1 gir (1) at x t = x 0 + tb. Hvis spesielt x 0 = b/(1 a), i (2), blir x t = b/(1 a), alt konstant. x = b/(1 a) kalles et likevektspunkt for differenslikningen. Denne verdien kan vi og få direkte fra differenslikningen ved å kreve at
16 TERJE SUND x = ax + b. For a < 1 finner vi dessuten x ved å la t gå mot uendelig: lim x t = b t 1 a = x. x kalles da et stabilt likevektspunkt for differenslikningen. Vi har følgende fire tilfelle: (1) 0 < a < 1 : Løsningen x t konvergerer monotont mot likevektspunktet x. (2) 1 < a < 0 : Konvergente svingninger mot x. (3) a > 1 : Løsningen x t divergerer monotont mot +. (4) a < 1 : Løsningen x t svinger eksplosivt (og x t når t ). Eksempel 2. Et lån L tilbakebetales i slutten av hver måned. Månedlig rente er p%. Vi finner en differenslikning for restlånet x t etter t måneder: Sett r = 1 + p/100, x 0 = L. Da blir x t+1 = rx t b. La oss bestemme x t uttrykt ved r, L og b fra formel (2): x t = r t L 1 rt 1 r b Antar vi at lånets tilbakebetalingstid er 20 år= 240 måneder, blir x 240 = r 240 L r240 1 r 1 b = 0, b = r 240 L r 1 r 240 1 Hvis nå L = 250000, p = 0, 5 %, finner vi b = 1791, 08. Annen ordens differenslikninger. Vi skal studere annen ordens differenslikninger av typen x t+2 = F (t, x t, x t+1 ), t = 0, 1, 2,..., der F, x 0 og x 1 er gitt. Verdiene x t kan da bestemmes suksessivt: x 2 = F (0, x 0, x 1 ), x 3 = F (1, x 1, x 2 ),...
FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 17 Vi forutsetter at F er definert for alle aktuelle verdier av de variable. Dermed følger både eksistens og éntydighet av løsningen med en gang. Annen ordens likninger av typen (3) x t+2 + ax t+1 + bx t = 0 kalles homogene lineære (annen ordens) differenslikninger med konstante koeffisienter a og b. Prøver vi med en løsning av typen x t = e ρt, ser vi ved innsetting i likningen at e ρ(t+2) + ae ρ(t+1) + be ρt = 0. Etter forkortning med e ρt, gir dette r = e ρ må oppfylle likningen (e ρ ) 2 + ae ρ + b = 0, r 2 + ar + b = 0 Dette kalles den karakteristiske likningen til differenslikningen. Det er alt naturlig å søke løsninger av (3) på formen x t = r t, der r oppfyller den karakteristiske likningen. Ved innsetting ser vi at dette gir løsninger. Vi merker oss at r t gir mening både for negative og komplekse r, da t er heltallig. Som for lineære homogene differensiallikninger ser vi (av Eksistensog éntydighets-setningen) at enhver løsning av (3) kan skrives x t = c 1 u t + c 2 v t der u t og v t er to lineært uavhengige løsniger av (3), og der c 1 og c 2 er konstanter. Vi vil drøfte de forskjellige mulighetene for røttene r 1 og r 2 av den karakteristiske likningen. To forskjellige reelle røtter r 1 r 2 : Da er u t = r t 1 og v t = r t 2 to lineært uavhengige løsninger av (3). Dermed kan enhver løsning skrives x t = c 1 r t 1 + c 2 r t 2 for passende konstanter c 1 og c 2. Krever vi at løsningen skal ha gitte initialverdier x 0 og x 1, får vi likningssystemet c 1 + c 2 = x 0 c 1 r 1 + c 2 r 2 = x 1
18 TERJE SUND til å bestemme c 1 og c 2. Det gir (f.eks. ved Cramrs regel) x 0 1 x 1 r 2 c 1 = 1 1 = x 0r 2 x 1 r 2 r 1 r 1 r 2 og 1 x 0 r 1 x 1 c 2 = = x 1 r 1 x 0 r 2 r 1 r 2 r 1 som gir den éntydige løsningen av differenslikningen (3) i dette tilfellet. En reell (dobbeltrot) r = a/2: Da er u t = r t en løsning. Vi forsøker med v t = tu t. Innsatt i (3) gir dette: (t + 2)u t+2 + a(t + 1)u t+1 + btu t = t(u t+2 + au t+1 + bu t ) + (2r t+2 + ar t+1 ) = 0 + r t+1 (2r + a) = 0. Generell løsning blir derfor x t = (c 1 + c 2 t)r t, der c 1 og c 2 er vilkårlige konstanter. Her er c 1 og c 2 éntydig gitt av initialverdiene x 0 og x 1 : eller c 1 = x 0, (c 1 + c 2 )r = x 1, c 1 = x 0, c 2 = x 1 c 1 r r To komplekse røtter r = ρe ±iθ : Vi har da komplekse løsninger = x 1 r x 0 x t = r t = ρ t e ±itθ = ρ t (cos(tθ) ± i sin(tθ)). Siden differenslikningen er lineær, er og realdelen u t = ρ t cos(tθ) og imaginærdelen v t = ρ t sin(tθ) og løsninger: Setter vi x t = u t + iv t inn i differenslikningen, fr vi nemlig (u t+2 + au t+1 + bu t ) + i(v t+2 + av t+1 + bv t ) = 0, u y og v t er løsninger. Initialbetingelsene gir nå og c 1 = x 0 ρ(c 1 cos θ + c 2 sin θ) = x 1
FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 19 c 2 = x 1 ρc 1 cos θ = x 1 ρ sin θ ρ sin θ x 0 tan θ I dette tilfellet er løsningen en svingning (med periode 2π/θ) multiplisert med eksponentialfunksjonen ρ t. Tallet ρ kalles vekstfaktoren. Vi kan og skrive c 1 cos(θt) + c 2 sin(θt) = A cos(θt + ω) for passende konstanter A og ω. Summeformelen for cosinus gir nemlig: det er nok å velge A cos(θt + ω) = A cos(θt) cos ω A sin(θt) sin ω, A cos ω = c 1 og sin ω = c 2, A = c 2 1 + c 2 2, ω = arctan c 2. c 1 Derfor bestemmes amplituden A og fasen ω i svingningene av konstantene c 1 og c 2, alt av initialverdiene x 0 og x 1. Derimot bestemmes perioden 2π/θ og vekstfaktoren ρ av differenslikningen. Av løsningstilfellene 1.-3. ovenfor kan vi drøfte oppførselen til x t når t. Vi hadde 1. r 1 r 2, begge reelle: x t = c 1 r1 t + c 2 r2 t 2. r 1 = r 2 = r : x t = (c 1 + c 2 t)r t 3. r 1 = ρ exp iθ, r 2 = ρ exp iθ : x t = ρ t (c 1 cos θt + c 2 sin θt) Hvis r 1 < 1 og r 2 < 1, vil da ri t 0, i = 1, 2 lim t x t = 0. Differenslikningen kalles da stabil (asymptotisk stabil). Hvis r 1 > 1 eller r 2 > 1, vil x t divergere når t. Likningen kalles da ustabil. Eksempel 3. (a) Anta x t = r t : For r < 1 vil da lim t x t = 0. Hvis 0 < r < 1, vil x t ha en dempet svingning mot 0. For 1 < r < 0, vil x t ha en dempet svingning mot 0. Hvis r > 1, vil x t vokse monotont mot + når t. Hvis r < 1, vil x t ha eksplosive (udempete) svingninger. (b) x t = ρ t cos θt, eller x t = ρ t sin θt. De trigonometriske funksjonene gir harmoniske svingninger med periode 2π/θ. Faktoren ρ t gir dempete svingninger hvis 0 < ρ < 1, og eksplosive svingninger hvis ρ > 1. Eksempel 4. Fibonacci-tallene er definert rekursivt ved Fibonacci-følgen blir F 0 = 0, F 1 = 1, F t+2 = F t+1 + F t, t = 0, 1, 2,... 0, 1, 1, 2, 3, 5, 8, 13, 21, 34,...
20 TERJE SUND Siden Fibonaccitallene er gitt ved den lineære, homogene differenslikningen F t+2 F t+1 F t = 0 som har karakteristisk likning r 2 r 1 = 0, er løsningsformelen F t = Ar 1 t + Br 2 t, r 1 = 1 2 (1 + 5), r 2 = 1 2 (1 5). Initialbetingelsene F 0 = 0, F 1 = 1 gir A + B = 0, Ar 1 + Br 2 = 1, B = A, A(r 1 r 2 ) = 1, eller A = 1 5 = B. Det gir Binets formel F t = 1 [( 1 + 5 ) t ( 1 5 ) t ] 5 2 2 F.eks blir F 20 = 6765 = 1 [( 1 + 5 ) 20 ( 1 5 ) 20 ] 5 2 2 Inhomogene likninger. En partikulær løsning av den inhomogene lineære likningen ( ) x t+2 + ax t+1 + bx t = f(t) kan vi finne ved ubestemte koeffisienters metode (som for tilsvarende differensiallikninger), dersom høyresiden f(t) er en lineær kombinasjon av polynomer, trigonometriske funksjoner og eksponentialfunksjoner, eller produkter av slike. Den generelle løsningen av ( ) vil være gitt ved den generelle løsningen av den homogene likningen x t+2 + a t x t+1 + b t x t = 0 pluss en partikulær løsning av ( ). Dette vises som for lineære differensiallikninger. Eksempel 5. Vi betrakter x t+2 + ax t+1 + bx t = c (t = 0, 1, 2,... ), der c er konstant, og prøver med en konstant-løsning u t = A. Det gir vi har A = løsning. u t+2 + au t+1 + bu t = (1 + a + b)a, c hvis 1 + a + b 0. Da er u 1+a+b t = c 1+a+b en partikulær
FORELESNINGER I OPTIMAL KONTROLLTEORI (MAT 2310) 21 Anta 1 + a + b = 0. Vi prøver da med en løsning av typen u t = At. Det gir u t+2 + au t+1 + bu t = A(t + 2) + Aa(t + 1) + Abt = At(1 + a + b) + A(2 + a) = A(2 + a) = c en partikulær løsning er gitt ved u t = c t hvis a 2. a+2 Anta a = 2 og 1 + a + b = 0, alt a = 2 og b = 1. Vi prøver med en partikulær løsning u t = At 2 : u t+2 + au t+1 + bu t = A(t + 2) 2 + Aa(t + 1) 2 + Abt 2 At 2 (1 + a + b) + At(4 + 2a) + A(4 + a) = A(4 + a) = 2A = c, u t = c a+4 t2 = c 2 t2 er en partikulær løsning. Eksempel 6. Vi løser ( ) x t+2 x t = sin t Først bestemmer vi en partikulær løsning u t = A sin t + B cos t. Da blir u t+2 u t = A sin(t + 2) + B cos(t + 2) A sin t B cos t = A sin t cos 2 + A cos t sin 2 + B cos t cos 2 B sin t sin 2 A sin t B cos t = (A cos 2 B sin 2 A) sin t + (A sin 2 + B cos 2 B) cos t Alt må A(cos 2 1) B sin 2 = 1 A sin 2 + B(cos 2 1) = 0 Systemets determinant er = (cos 2 1) 2 + sin 2 2 = 2(1 cos 2), A = 1 1 sin 2 0 cos 2 1 = cos 2 1 2(1 cos 2) = 1 2 B = 1 cos 2 1 1 1 0 = sin 2 2(1 cos 2) Da de karakteristiske røttene til den homogene likningen er ±1, er den generelle løsningen av ( ) x t = 1 sin 2 sin 2 sin t + 2 cos 2 1 cos t + C 1 + C 2 ( 1) t.