(ii) g = (f B)^{-1} \: V \to B \subset R^m er deriverbar med Dg(f(u)) = (Df(u))^{-1} \: R^m \to R^m for alle u i B.

MAT1300 Analyse I 5. mai 2009 13.3. Det inverse funksjonsteoremet Vi vil bruke kontraksjonsprinsippet for å bevise følgende teorem: Teorem 13.13 (Det inverse funksjonsteoremet): La U \subset R^m være åpen, og la f \: U \to R^m være deriverbar med kontinuerlig derivert Df. La w \in U og anta at Df(w) \: R^m \to R^m er invertibel. Da finnes det en åpen B \subset U \subset R^m med w \in B, og en åpen V = f(b) \subset R^m, slik at (i) f B \: B \to V er bijektiv (= invertibel), og (ii) g = (f B)^{-1} \: V \to B \subset R^m er deriverbar med Dg(f(u)) = (Df(u))^{-1} \: R^m \to R^m for alle u i B. Med andre ord, hvis f er kontinuerlig deriverbar og Df er invertibel i w så er f invertibel i en åpen omegn om w, med deriverbar invers g = f^{-1}. Den deriverte av inversen D(f^{-1}) er lik den inverse av den deriverte (Df)^{-1}, evaluert i henholdsvis f(u) og u. I tilfellet m=1 er dette forholdsvis velkjent. Eksempel: La h \: U = (e, \infty) \to (1, e) \subset R være definert ved h(x) = y, der x^y = y^x. Vi vet da at ln(x)/x = ln(y)/y, så om f \: (1,e) \to (0,1) \subset R er gitt ved f(y) = ln(y)/y, med invers g = f^{-1} \: (0,1) \to (1,e), så er h(x) = g(ln(x)/x) for alle x i (e, \infty). Det inverse funksjonsteoremet forteller oss at g er deriverbar, med derivert g'(f(y)) = 1/f'(y) for y i (1,e). Altså er h deriverbar, med derivert h'(x) = g'(f(x)) f'(x) = g'(f(y)) f'(x) = f'(x)/f'(y) for alle x i (e, \infty). Lemma 13.2: La f \: R^m \to R^m med f(0) = 0. Anta at det finnes en \delta>0 og en 0<\eta<1 slik at (f(u)-f(v)) - (u-v) \le \eta u-v for alle u, v i \bar B(0, \delta). [Spesielt vil da f(u) - u \le \eta u for alle u i \bar B(0, \delta).] (i) For hver y i \bar B(0, (1-\eta)\delta) finnes det da en og bare en løsning x i \bar B(0, \delta) til likningen f(x) = y. (ii) Hvis vi skriver x = g(y) for denne løsningen, så er

g(y) - y \le \eta (1-\eta)^{-1} y. Bevis: (i) La y \le (1-\eta)\delta. Vi lar Tx = x + y - f(x) slik at likningen y = f(x) er ekvivalent med fikspunkt-betingelsen Tx = x. La X = \bar B(0, \delta) med den Euklidiske metrikken. Da er X lukket i R^m, og derfor komplett. For x i X er x \le \delta, så Tx = x + y - f(x) \le y + f(x) - x \le y + \eta x \le (1-\eta)\delta + \eta\delta = \delta så Tx i X, og T \: X \to X. For u, v i X er Tu - Tv = u + y - f(u) - v - y + f(v) = (f(u)-f(v)) - (u-v) \le \eta u-v så T er en kontraksjonsavbildning. Altså har T et entydig fikspunkt x i X, slik at Tx = x, som er ekvivalent med at y = f(x). (ii) Fikspunktet x = g(y) er grensen av følgen (T^n y)_n i X. Vi har T^n y - y \le \sum_{j=0}^{n-1} T^{j+1} y - T^j y \le \sum_{j=0}^{n-1} \eta^j Ty - y \le (1-\eta)^{-1} Ty - y. Når n \to \infty går T^n y \to x = g(y), og siden venstresiden er en kontinuerlig funksjon i T^n y får vi i grensen at g(y) - y \le (1-\eta)^{-1} Ty - y = (1-\eta)^{-1} y + y - f(y) - y = (1-\eta)^{-1} f(y) - y \le \eta(1-\eta)^{-1} y.

QED. Lemma 13.4: La f \: R^m \to R^m med f(0) = 0. Anta at det finnes en \delta_0>0 slik at f er deriverbar på B(0, \delta_0) \subset R^m. Anta videre at Df er kontinuerlig i 0, og at Df(0) = I (= identitetsavbildningen R^m \to R^m). (i) Da finnes det en \delta_1>0 med \delta_1 < \delta_0, og en \rho>0, slik at for alle y i \bar B(0, \rho) finnes det en og bare en løsning x i \bar B(0, \delta_1) til likningen f(x) = y. (ii) Hvis vi skriver x = g(y) for denne løsningen, så er funksjonen g \: \bar B(0, \rho) \to \bar B(0, \delta_1) \subset R^m deriverbar i 0, med Dg(0) = I. Bevis: (i) Siden Df er kontinuerlig i 0, og Df = I, kan vi finne en \delta_1>0 slik at \delta_1 < \delta_0 og Df(w) - I < 1/2 for alle w i \bar B(0, \delta_1). Ved middelverdiulikheten for funksjonen h = f - I, gitt ved h(x) = f(x) - x, får vi (f(u)-f(v)) - (u-v) = h(u)-h(v) \le u-v \sup_{ w \le \delta_1} Dh(w) = u-v \sup_{ w \le \delta_1} Df(w)-I \le u-v /2 for alle u, v i \bar B(0, \delta_1). La \rho = \delta_1/2. Ved Lemma 13.2, med \eta=1/2, er det da for hver y i \bar B(0, \rho) en og bare en løsning x i \bar B(0, \delta_1) til likningen f(x) = y. (ii) Vi skriver x = g(y) for denne løsningen. La \eta>0. Siden Df er kontinuerlig i 0 finnes \delta(\eta)>0, med \delta(\eta)<\delta_1, slik at Df(w) - I < \eta for alle w i \bar B(0, \delta(\eta)). Ved samme argument som ovenfor får vi at (f(u)-f(v)) - (u-v) \le \eta u-v for alle u, v i \bar B(0, \delta(\eta)). Ved Lemma 13.2(ii) vil da g(y)-y \le \eta(1-\eta)^{-1} y

for alle y i \bar B(0, (1-\eta)\delta(\eta)). Siden f(0) = 0 er g(0) = 0 og g(y) = g(0) + I(y) + \epsilon(y) y der \epsilon(y) \le \eta(1-\eta)^{-1} for alle y med y \le (1-\eta)\delta(\eta). Siden \eta>0 var vilkårlig valgt, og \eta(1-\eta)^{-1} \to 0 når \eta \to 0, så betyr dette at \epsilon(y) \to 0 når y \to 0. Altså er g deriverbar i 0, med Dg(0) = I. QED. Nå generaliserer vi til tilfellet der Df(0) ikke er identiteten, men invertibel, og deretter til tilfellet der f er definert i en omegn av w i R^m, og Df(w) er invertibel. Lemma 13.8: La f \: R^m \to R^m med f(0) = 0. Anta at det finnes en \delta_0>0 slik at f er deriverbar på B(0, \delta_0) \subset R^m. Anta videre at Df er kontinuerlig i 0, og at Df(0) er invertibel. (i) Da finnes det en \delta_1>0 med \delta_1 < \delta_0, og en \rho>0, slik at for alle y i \bar B(0, \rho) finnes det en og bare en løsning x i \bar B(0, \delta_1) til likningen f(x) = y. (ii) Hvis vi skriver x = g(y) for denne løsningen, så er funksjonen g \: \bar B(0, \rho) \to \bar B(0, \delta_1) \subset R^m deriverbar i 0, med Dg(0) = Df(0)^{-1}. Bevis: La \alpha = Df(0), og se på F(x) = \alpha^{-1}f(x). Da er DF(0) = I, så F er lokalt invertibel, med invers G =F^{-1}. La g(y) = G(\alpha^{-1} y). Da er G og g deriverbare i 0, med DG(0) = I og Dg(0) = \alpha^{-1}. Resten er detaljer. QED. Lemma 13.9: La f \: R^m \to R^m og w i R^m. Anta at det finnes en \delta_0>0 slik at f er deriverbar på B(w, \delta_0) \subset R^m. Anta videre at Df er kontinuerlig i w, og at Df(w) er invertibel. (i) Da finnes det en \delta_1>0 med \delta_1 < \delta_0, og en \rho>0, slik at for alle y i \bar B(f(w), \rho) finnes det en og bare en løsning x i \bar B(w, \delta_1) til likningen f(x) = y. (ii) Hvis vi skriver x = g(y) for denne løsningen, så er funksjonen g \: \bar B(f(w), \rho) \to \bar B(w, \delta_1) \subset R^m deriverbar i 0, med Dg(f(w)) = Df(w)^{-1}. Bevis: La F(x) = f(x-w) - f(w). Da er F(0) = 0 og DF(0) = Df(w) er invertibel, så F er lokalt invertibel, med invers G = F^{-1}. La g(y) = G(y- f(w)) + w. Da er G og g

deriverbare i henholdsvis 0 og f(w), med Dg(f(w)) = DG(0) = DF(0)^{-1} = Df(w)^{-1}. Resten er detaljer. QED. Vi får et bedre resultat ved å anta at Df er kontinuerlig og invertibel på en åpen mengde U, enn bare i et enkelt punkt w. Lemma 13.11(iii): La U \subset R^m være åpen og f \: U \to R^m deriverbar. Hvis Df er kontinuerlig på U, og invertibel i et punkt w i U, så finnes det en åpen omegn B \subset U med w i B, slik at Df(u) er invertibel for hver u i U. Bevis: Determinanten til lineæravbildningen Df(u) \: R^m to R^m er en kontinuerlig funksjon av u, og er ulik 0 for u=w. Altså er den også ulik 0 i en åpen omegn B om w. Da er Df(u) invertibel for alle u i B. QED. Lemma 13.12: La U \subset R^m være åpen og f \: U \to R^m deriverbar. Hvis Df er kontinuerlig og invertibel i hvert punkt i U, så er f(u) åpen i R^m. Bevis: La w i U. Siden U er åpen finnes en \delta_0>0 slik at B(w, \delta_0) \subset U. Per antagelse er Df kontinuerlig i w, og Df(w) er invertibel. Ved Lemma 13.9(i) finnes da en \delta_1>0 med \delta_1 < \delta_0, og en \rho>0, slik at for alle y i \bar B(f(w), \rho) finnes det en og bare en løsning x i \bar B(w, \delta_1) til likningen f(x) = y. Altså er \bar B(f(w), \rho) \subset f(\bar B(w, \delta_1)) \subset f(u). Dette viser at f(u) er en omegn om hvert av sine punkter, og derfor åpen. QED. Teorem 13.13 (Det inverse funksjonsteoremet): La U \subset R^m være åpen, og la f \: U \to R^m være deriverbar med kontinuerlig derivert Df. La w \in U og anta at Df(w) \: R^m \to R^m er invertibel. Da finnes det en åpen B \subset U \subset R^m med w \in B, og en åpen V = f(b) \subset R^m, slik at (i) den restrikterte funksjonen f B \: B \to V er bijektiv (= invertibel), og (ii) den inverse funksjonen g = (f B)^{-1} \: V \to B \subset R^m er deriverbar med Dg(f(u)) = (Df(u))^{-1} \: R^m \to R^m for alle u i B. Bevis: (i) Ved Lemma 13.11(iii) finnes en \delta_0>0 slik at B(w, \delta_0) \subset U, og Df(u) er kontinuerlig og invertibel for hver u i B(w, \delta_0). Ved Lemma 13.9 finnes det da en \delta_1>0 med \delta_1 < \delta_0, og en \rho>0, slik at for alle y i \bar B(f(w), \rho) finnes det en og bare en løsning x i \bar B(w, \delta_1) til likningen f(x) = y. La

B = \{x \in B(w, \delta_1) : f(x) \in B(f(w), \rho) \} = B(w, \delta_1) \cap f^{-1}(b(f(w), \rho)) Dette er en åpen delmengde av U, siden f er kontinuerlig. Vi har f(b) \subset B(f(w), \rho) \subset \bar B(f(w), \rho). Det betyr at f B er injektiv, siden f(x) = y = f(x') med y i \bar B(f(w), \rho) bare har en løsning x = x' i \bar B(w, \delta_1). La V = f(b) \subset R^m. Da V åpen ved Lemma 13.12, og f B \: B \to V er bijektiv. (ii) Formelen for Dg(f(u)) følger fra Lemma 13.9 anvendt ved u i stedet for w. QED.