HØGSKOLEN I GJØVIK MATEMATIKK 30, HØSTEN 2004 LINEÆRE APPROKSIMASJONER TIL f, KJERNE- REGELEN, GRADIENT OG RETNINGSDERIVERT v/ Hans Engenes, august 2004 En variabel: Hvis f er en én-variabel-funksjon og a er et indre punkt i D f (definisjonsmengden til f) der f er deriverbar, da har førstegradsuttrykket (1) f(a)+f (a)(x a) en bedre nærhet til f(x) i nærheten av x = a enn noe annet førstegradsuttrykk. Faktisk er det slik at avviket (differensen) mellom f(x) og(1)går mot 0 raskere enn x a, når x a, slik: f(x) (f(a)+f ( ) (a)(x a)) f(x) f(a) (2) lim = lim f (a) =0 x a x a x a x a (dette er jo bare en gjentakelse av definisjonen av f (x)). Videre kan vi innse at (1) er det eneste førstegradsuttrykket med en så god nærhet til f(x) i nærheten av x = a, dvs. hvis A og B er to konstanter slik at f(x) (A + B(x a)) lim x a x a da må A + B(x a) være identisk med (1), dvs. A må være lik f(a) ogb må være lik f (a). Oppgave 1: Innse dette (dvs. bevis at påstanden er korrekt!) Hvis vi nå skriver x istedetforx a (dvs. x erstattes med a + x), og skriver f for funksjonstilveksten f(x) f(a) =f(a + x) f(a), da kan vi sammenfatte det ovenstående slik: Differensen f f f f (a) x (a) x går mot 0 raskere enn x, dvs.: lim x 0 x hvis vi lar ɛ( x) stå for uttrykket ( f f (a) x)/ x, daer (3) f = f (a) x + ɛ( x) x =0 =0,så der ɛ( x) 0når x 0. Det første leddet på høyre side i (3) er lineært i x, og kalles lineærapproksimasjonen til f. Merk at vi ikke har hatt bruk for andre forutsetninger enn at f er deriverbar i a. 1
To variable: Hvis f er en to-variabel-funksjon og (a, b) er et indre punkt i D f, da kan en også sette opp en best mulig førstegradstilnærming (approksimering) til f (og dermed en best mulig lineærapproksimering til f) i(a, b), hvis f er partiellderiverbar m.h.p. både x og y ien hel omegn om (a, b), og hvis derivertfunksjonene f x og f y er kontinuerlige i en hel slik omegn. Under disse forutsetningene skal vi vise at det fins to funksjoner, ɛ 1 ( x, y) og ɛ 2 ( x, y), som begge går mot 0 når ( x, y) (0, 0) og som er slik at: (4) f = f x (a, b) x + f y (a, b) y + ɛ 1 ( x, y) x + ɛ 2 ( x, y) y for alle ( x, y) som er slik at rektangelet med hjørner i (a, b), (a+ x, b), (a, b+ y) og (a+ x, b+ y) ligger inne i en omegn om (a, b) derbåde f x og f y er kontinuerlige. Merk både likheten mellom (3) og (4), og forskjellen m.h.t. forutsetninger om funksjonen f. I beviset for påstanden ovenfor får vi bruk for Sekantsetningen: For enhver funksjon g som er kontinuerlig på etlukketintervall[a, b] ogderiverbar i det åpne intervallet (a, b), fins det minst ett tall c (a, b) slik at g(b) g(a) =g (c)(b a). Når f og (a, b) oppfyller de krav vi har stilt, da er funksjonen g, gittved:g(x) =f(x, b), kontinuerlig på [a, a + x] og deriverbar i (a, a + x), så ifølge Sekantsetningen fins det minst ett tall c 1 mellom a og a + x slik at g(a + x) g(a) =f(a + x, b) f(a, b) =g (c 1 ) x = f x (c 1,b) x. Videre er funksjonen h, gittved:h(y) =f(a + x, y), kontinuerlig på [b, b + y] og deriverbar i (b, b + y), så ifølge Sekantsetningen fins det minst ett tall c 2 mellom b og b + y slik at h(b + y) h(b) =f(a + x, b + y) f(a + x, b) =h (c 2 ) y = f y (a + x, c 2 ) y. Dermed har vi følgende: f = f(a + x, b + y) f(a, b) = =(f(a + x, b + y) f(a + x, b)) + (f(a + x, b) f(a, b)) = = f y (a + x, c 2 ) y + f x (c 1,b) x = = f x (a, b) x + f y (a, b) y +(f x (c 1,b) f x (a, b)) x +(f y (a + x, c 2 ) f y (a, b)) y = = f x (a, b) x + f y (a, b) y + ɛ 1 ( x, y) x + ɛ 2 ( x, y) y der vi har satt ɛ 1 ( x, y) =f x (c 1,b) f x (a, b) ogɛ 2 ( x, y) =f y (a + x, c 2 ) f y (a, b). Disse uttrykkene innebærer at (i) ɛ 1 ( x, y) 0når x 0, fordi f x er forutsatt å være kontinuerlig i (a, b) og c 1 skal holde seg mellom a og a + x, ogat (ii) ɛ 2 ( x, y) 0når ( x, y) (0, 0), fordi f y er forutsatt å være kontinuerlig i(a, b) ogc 2 skal holde seg mellom b og b + y. Dermed har vi fullført beviset for påstanden øverst på denne siden. 2
Merknader: (i): Formel (4) ovenfor uttrykker funksjonstilveksten f i et fastholdt punkt (a, b) som en sum av en del (de to første leddene), kalt lineærapproksimasjonen til f, som er lineær i argumenttilvekstene x og y, og en del (de to siste leddene) som er (vanligvis) ikke-lineær i x og y og som går mot null raskere enn x og y. (ii): Med tanke på anvendelser av formel (4) er det av mindre betydning ågånærmere inn på hva de to epsilon-funksjonene egentlig er. Det er nok åviteatdepasser i formel (4) og at de begge 0når ( x, y) (0, 0). Disse kravene bestemmer ikke de to epsilon-funksjonene entydig. Beviset ovenfor gir riktignok en slags formler for dem, men formlene inneholder to tallstørrelser (c 1 og c 2 )somsekantsetningen garanterer eksistensen av, uten å angi formler eller annen beregningsmåte for dem. Dessuten kunne vi lagt opp beviset annerledes, f.eks. ved ågå veien om punktet (a, b + y) i stedet for (a + x, b), noe som ville ha ført til andre epsilonfunksjoner. (iii): Lineærapproksimasjonen til f (se merknad (i) over) er entydig bestemt, i den forstand at hvis A og B er konstanter og α 1 ( x, y)ogα 2 ( x, y)ertofunksjoner som begge 0når ( x, y) (0, 0), og f = A x + B y + α 1 ( x, y) x + α 2 ( x, y) y for alle ( x, y) innenfor en omegn om (0, 0), da må A være lik f x (a, b) ogb må være lik f y (a, b). Oppgave 2: Vis at påstanden i den siste merknaden er korrekt. (iv): En to-variabel-funksjon f som er slik at funksjonstilveksten f i(a, b), for alle ( x, y) innenfor en omegn om (0, 0), kan uttrykkes slik som i formel (4), med to funksjoner, ɛ 1 ( x, y) ogɛ 2 ( x, y), som begge går mot 0 når ( x, y) 0, sies å være deriverbar i punktet (a, b). Beviset ovenfor fastslår dermed at enhver to-variabel-funksjon med kontinuerlige partiellderiverte i en omegn om (a, b) er deriverbar i (a, b). Videreføring til tre og evt. enda flere variable er rett fram (se neste avsnitt, inklusive oppgave 3 nedenfor). (v): En to-variabel-funksjon f som er deriverbar i (a, b), i den strenge forstand fastslått i merknad (iv) over, må også værekontinuerlig i(a, b). Det er forøvrig lett ågi eksempler på to-variabel-funksjoner som er diskontinuerlige i et gitt punkt og som likevel har partiellderiverte i dette punktet (se oppgave 13.6.43 i E&P). (vi): Vi har tidligere vært inne på at det er visse uklarheter med begrepet tangentplan i et gitt punkt på grafen til en to-variabel-funksjon f. Vi skal se nedenfor(se Viktig spesialtilfelle på side 7) at det nettopp er deriverbarhet i (a, b) som garanterer at ett enkelt plan gjennom punktet (a, b, f(a, b)) i R 3 inneholder alle grafens tangenter gjennom det samme punktet, slik at dette planet virkelig er et tangentplan til grafen til f. 3
Flere enn to variable: Hvis f er en n-variabel-funksjon (variable: x 1,x 2,,x n ), og (a 1,a 2,,a n )eretindre punkt i D f, og hvis alle de førsteordens partiellderiverte til f er kontinuerlige i en omegn om (a 1,a 2,,a n ), da kan en vise at det fins nn-variabel-funksjoner ɛ 1,ɛ 2,,ɛ n (som vi oppfatter som funksjoner av argumenttilvekstene x 1, x 2,, x n ), som alle går mot 0 når ( x 1, x 2,, x n ) (0, 0,, 0), slik at: n n (5) f = f xi (a 1,a 2,,a n ) x i + ɛ i ( x 1, x 2,, x n ) x i i=1 i=1 Liksom i to-variabel-situasjonen er det av mindre betydning å få fullstendig kjennskap til de n epsilon-funksjonene. Deres eksistens kan påvises ved n anvendelser av Sekantsetningen, noe som medfører at de uttrykkene som fremkommer for disse funksjonene inneholder symboler for tallstørrelser som Sekantsetningen fastslår eksistensen av, uten å angi formler eller andre former for beregningsmåter for dem, slik som tallstørrelsene c 1 og c 2 i to-variabel-situasjonen ovenfor. Oppgave 3: Vurder hvordan de fem merknadene på forrige side kan tilpasses situasjoner med flere enn to variable. Kjerneregelen, gradient og retningsderivert Hvis f er en to-variabel-funksjon (variabel-symboler: x og y), og de to variablene erstattes med hver sin kjernefunksjon av en (enslig) variabel, t (dvs. hvis vi setter x = x(t) og y = y(t)), da fremkommer et uttrykk for en ny (sammensatt) funksjon av t: (6) z = z(t) =f(x(t),y(t)) og vi spør her etter en sammenheng mellom z (t) (den deriverte av den sammensatte funksjonen), x (t), y (t) (de deriverte av kjernefunksjonene), og f x og f y (de deriverte av den ytre funksjonen). For at denne problemstillingen skal ha mening må vi forutsette at kjernefunksjonene er deriverbare i et gitt punkt t = t 0 (og da er de også kontinuerlige der), samt at den ytre funksjonen har førsteordens partiellderiverte i punktet (x(t 0 ),y(t 0 )). Vi forutsetter ikke deriverbarhet av den sammensatte funksjonen, men lar det være en del av spørsmålet. Selvsagt vil enhver tilvekst t i t medføre tilvekster ( x og y) ix og y, som videre medfører en tilvekst ( z eller f) if, såsant vi overalt holder oss innenfor de nevnte funksjonenes definisjonsmengder. Hvis vi forutsetter at f er deriverbar i punktet (x(t 0 ),y(t 0 )) (se merknad (iv) på side 3), da kan vi bruke formel (4) med (a, b) =(x(t 0 ),y(t 0 )): f (7) t = f x(x(t 0 ),y(t 0 )) x t + f y(x(t 0 ),y(t 0 )) y t + ɛ 1( x, y) x t + ɛ 2( x, y) y t Hva skjer her når t 0? I første ledd på høyre side av likhetstegnet er første faktor upåvirket av denne grenseprosessen, mens andre faktor nærmer seg x (t 0 ), så heleførste ledd nærmer seg f x (x(t 0 ),y(t 0 ))x (t 0 ). Det andre leddet vil nærme seg f y (x(t 0 ),y(t 0 ))y (t 0 ). I de to siste leddene er begge faktorer påvirket av grenseprosessen. De to siste-faktorene nærmer seg h.h.v. x (t 0 )ogy (t 0 ), men de to første-faktorene ( epsilon-funksjonene ) 4
begge går mot 0, fordi t 0medførerat x 0og y 0(både x(t) ogy(t) erjo kontinuerlige i t 0, fordi vi har forutsatt at de er deriverbare der), dvs. ( x, y) (0, 0), og da gjelder første setning i merknad (v) ovenfor. Konklusjonen blir da følgende, når vi lar t 0 i (7): Hvis x(t) og y(t) er deriverbare i t = t 0, og f er deriverbar i punktet (x(t 0 ),y(t 0 )) (noe som er tilfellet hvis f har kontinuerlige partiellderiverte overalt i en omegn om (x(t 0 ),y(t 0 ))), da er den sammensatte funksjonen z = f(x(t),y(t)) deriverbar i t = t 0, og følgende sammenheng gjelder mellom de deriverte: ( ) dz (8) = f x (x(t 0 ),y(t 0 ))x (t 0 )+f y (x(t 0 ),y(t 0 ))y (t 0 ) dt t=t 0 som uttrykker kjerneregelen i to variable (med kjernefunksjoner i en felles variabel). Hvis f er en tre-variabel-funksjon kan vi bruke formel (5) med n =3og(a, b, c) = (x(t 0 ),y(t 0 ),z(t 0 )), og forøvrig samme resonnement som med to variable, og vi får: Hvis x(t), y(t) ogz(t) erderiverbareit = t 0,ogf er deriverbar i punktet (x(t 0 ),y(t 0 ),z(t 0 )) (noe som er tilfellet hvis f har kontinuerlige partiellderiverte overalt i en omegn om (x(t 0 ),y(t 0 ),z(t 0 ))), da er den sammensatte funksjonen w = f(x(t),y(t),z(t)) deriverbar i t = t 0, og følgende sammenheng gjelder mellom de deriverte: ( ) dw (9) = dt t=t 0 = f x (x(t 0 ),y(t 0 ),z(t 0 ))x (t 0 )+f y (x(t 0 ),y(t 0 ),z(t 0 ))y (t 0 )+f z (x(t 0 ),y(t 0 ),z(t 0 ))z (t 0 ) som er kjerneregelen i tre variable (med kjernefunksjoner i en felles variabel). Hvis også kjernefunksjonene har flere enn en variabel, da får vi en sammensatt funksjon av de variablene som opptrer i kjernefunksjonene, og en kan spørre etter sammenhengen mellom de partiell-deriverte av den sammensatte funksjonen og de partiellderiverte av kjernefunksjonene og av den ytre funksjonen. Resonnementene ovenfor kan beholdes u- forandret, bortsett fra de opplagte nødvendige symbolendringene. Se forøvrig side 898 99 ie&p. Merk at den sammensatte funksjonen i (8) kan tolkes som f-verdiene langs den parametriserte kurven (x, y) = (x(t),y(t)) i R 2, uttrykt som funksjon av parameteren t, og den sammensatte funksjonen i (9) har en tilsvarende sammenheng med en parametrisert kurve i R 3. Slike parametriseringer har vi tidligere skrevet på vektorform: r(t) =x(t) ı + y(t) j eller r(t) =x(t) ı + y(t) j + z(y) k ( posisjonsvektoren ), og vi vet at v(t) = r (t) er tangentvektor i bevegelsesretningen i ethvert punkt på kurven. Hvis vi nå definerer gradienten til f slik: (10) z = f(x, y) z = f =gradf def = f x (x, y) ı + f y (x, y) j og slik: (11) w = f(x, y, z) w = f =gradf def = f x (x, y, z) ı + f y (x, y, z) j + f z (x, y, z) k da kan (8) og (9) uttrykkes på en felles og sterkt forkortet form, slik: 5
(12) ( ) df = f v(t 0 ) dt t=t 0 (Kjerneregelen) der høyre side fremstår som et skalarprodukt av to vektoruttrykk, der første faktor (som her må oppfattes som gradientens verdi i det punktet som svarer til t-verdien t 0 ) bare er knyttet til funksjonen f, mens andre faktor bare er knyttet til den parametriserte kurven. Merk likheten med den velkjente(!) kjerneregelen i én variabel! Hvis vi nå spesialiserer til en parametrisering der v(t) erkonstantlik en gitt enhetsvektor u, da vil størrelsen (df /dt) t=t0 = f v(t 0 )= f u bare avhenge av funksjonen f, punktet som svarer til t = t 0 og retningen u, og vi skal kalle denne størrelsen den retningsderiverte til f i det nevnte punktet, i retningen gitt ved u, og betegne den med symbolet D u f: (13) u =1 D u f def = f u som sier nøyaktig det samme som følgende alternative definisjon: (14) v 0 D v f def = f v v (Retningsderivert) Merk at når farten v(t) er konstant lik 1, da er tid (t) og veilengde (s) identiske,så endring av f-verdi m.h.p. t er lik endring av f-verdi m.h.p. veilengden s, så den retningsderiverte er lik endring av f-verdi pr. lengdeenhet i retningen gitt ved u. Hvis f har to variable, da kan dette sees i sammenheng med grafen til f, slik: I rommet, R 3, velger vi et punkt (a, b) i det indre av definisjonsområdet D f (som er et område i xy-planet), og en enhetsvektor u tegnes inn med fotpunkt i (a, b, 0). Gjennom punktet (a, b, 0) tenker vi oss et vertikalt plan (dvs. parallelt med z-aksen), som inneholder den u vi nettopp tegnet. Dette vertikalplanet og det planet gjennom (a, b, f(a, b)) som inneholder de to hovedtangentene til grafen i dette punktet (dvs. tangentene i x-retningen og i y-retningen, som eksisterer fordi vi må forutsette at f er partiellderiverbar i (a, b)) danner en skjæringslinje i R 3. Denne linjens stigningskoeffisient i u-retningen er lik D u f. Det omtalte planet gjennom (a, b, f(a, b)), som inneholder de to hovedtangentene, er det eneste planet som har en mulighet til å være et tangentplan til grafen til f i punktet (a, b, f(a, b)). Vi skal se senere (se Viktig spesialtilfelle på side7)atdeter et tangentplan hvis f er deriverbar i (a, b) i den betydningen som er fastslått i merknad (iv) på side 3. Ved hjelp av begrepet retningsderivert kan vi nå gi en forklaring på hva gradienten til f egentlig er. Et skalarprodukt av to vektorer med fastholdte absoluttverdier (lengder) og variable ( regulerbare ) retninger får maksimal verdi når de to vektorene er ensrettet (dvs. parallelle (ikke antiparallelle)). Anvender vi dette på høyre-siden i formel (13) over får vi følgende forklaring på betydningen av gradientens retning: Gradienten til f peker i den retningen som gir maksimal verdi for den retningsderiverte. Samtidig får vi også en forklaring på betydningen av gradientens absoluttverdi: Gradientens absoluttverdi (lengde) i et gitt punkt er lik maksimalverdien av den retningsderiverte til f i punktet (bruk formel (14) over, med v = f, sammen med formelen a a = a 2 fra 6
vektorregningen). Dette kan sammenfattes slik: Hvis f er deriverbar overalt i det indre av D f (noe som er tilfellet hvis f har kontinuerlige partiell-deriverte overalt i det indre av D f ), da er f en vektorfunksjon som i ethvert indre punkt i D f peker i retningen for maksimal f-økning pr. lengdeenhet, og som har lengde (absoluttverdi) lik den maksimale f-økningen pr. lengdeenhet. Merk at det her ikke er sagt noe om antall variable i f. En annen viktig egenskap for gradienten fremkommer ved følgende resonnement: Hvis P er et indre punkt i D f,ogc er en parametrisert kurve gjennom P som er slik at f har en konstant verdi på C, davilvenstresideiformel(12)overværelik0(den deriverte av en konstant er alltid lik 0), så høyre side i (12) må også være lik 0, dvs. at gradienten til f i punktet P, f, måstånormaltpå tangentvektoren v(t 0 )tilkurvenc i P.Hvisnå f har to variable, damåkurvenc være nivåkurven til f gjennom P,og konklusjonen er: (15) z = f(x, y) f er i ethvert punkt en normalvektor til nivåkurven gjennom punktet. Hvis f har tre variable, da gjelder det siste avsnittet ovenfor om enhver kurve C som ligger på nivåflaten til f gjennom punktet P, dvs. at verdien av f i P er en normalvektor til tangentvektoren v(t 0 )ip til enhver kurve gjennom P som ligger på nivåflaten til f gjennom P, og det betyr at alle tangentene i P til den nevnte nivåflaten må ligge i et felles plan (det planet som f i P er normalvektor til), dvs. at nivåflaten har et tangentplan i P. Mer kortfattet kan vi uttrykke oss slik: (16) w = f(x, y, z) f er i ethvert punkt en normalvektor til nivåflaten gjennom punktet. Viktig spesialtilfelle: Grafen til en to-variabel-funksjon f er identisk med en nivåflate til tre-variabel-funksjonen g gitt ved: g(x, y, z) =f(x, y) z, nærmere bestemt nivåflaten gitt ved: g(x, y, z) = 0. Dette kommer av at den omtalte grafen pr. definisjon er løsningsmengden til likningen z = f(x, y), og denne har selvsagt samme løsningsmengde som likningen for den omtalte nivåflaten (f(x, y) z =0).Lanå(a, b) være et indre punkt i D f,ogantaatf er deriverbar i (a, b). Vi kan da innse at funksjonen g (definert som ovenfor) må være deriverbar i punktet (a, b, f(a, b)). (Ekstraoppgave: Innse dette.) Ifølge kommentarene rett over formel (16) kan vi nå konkludere med: Hvis en to-variabel-funksjon f er deriverbar i punktet (a, b) slik dette er definert i merknad (iv) på side 3 (noe som er tilfellet hvis f har kontinuerlige partiellderiverte overalt i en omegn om (a, b)), da har grafen til f et tangentplan i punktet (a, b, f(a, b)). En normalvektor til dette tangentplanet (og dermed til selve grafen) i det nevnte punktet kan settes opp slik: (f(x, y) z) (a,b) = f x (a, b) ı + f y (a, b) j k 7