3.10. Der Satz über implizite Funktionen

Motivation:
Seien x,y , r > 0 und sei ein Zusammenhang

0 = ϕ(x,y) = x2 + y2 r2

gegeben. Die Lösungsmenge dieser Gleichung ist ein Kreis vom Radius r um den Ursprung. Wir fragen uns nun, ob wir diese Beziehung nach einer der Variablen (z.B. x) auflösen können, es also eine Funktion y = y(x) gibt, so dass

y = y(x) ϕ(x,y(x)) = 0.

Sind also alle Punkte, welche die Ausgangsgleichung x2 + y2 r2 = 0 erfüllen beschreibbar durch eine Funktion y(x)? Dabei meinen wir nicht die Frage, ob wir die Fuktion y(x) hinschreiben können, sondern ob es die Fukntion y(x) prinzipiell gibt.
Global ist das nicht möglich, da zu jedem x zwei Funktionswerte y(x) gehören müssten, Funktionen sind aber nacheindeutige Relationen. Lokal ist dies eventuell möglich, die Antwort kann aber auch negativ sein.
Als zweites Beispiel betrachten wir

0 = ϕ(x,y) = x2 y2.

Der geometrische Ort aller Punkte, welche diese Gleichung erfüllen sind nun die beiden Winkelhalbierenden, welche sich im Ursprung senkrecht schneiden. In einer Umgebung des Ursprungs ist auch eine lokale Auflösbarkeit nicht möglich.
Suchen wir nun nach geeigneten Sätzen, welche Aussagen über die Auflösbarkeit treffen, so können wir weder globale Aussagen, noch Aussagen vom Typ “überall lokal Auflösbar” erwarten, da diese bereits in den einfachsten Beispielen falsch sind. Wir können jediglich lokale Aussagen, unter gewissen Voraussetzungen erwarten.
Angenommen ϕ lässt sich schreiben als

0 = ϕ(x,y) = ϕ(x0,y0) + ϕh + r(h)

mit h = (x x0,y y0)t. Erfüllt der Punkt (x0,y0) ebenfalls die Ausgangsgleichung, so ist ϕ(x0,y0) = 0. Gleichzeitig drücken wir ϕ mit Hilfe der partiellen Ableitungen aus und erhalten

0 = ϕ x(x x0) + ϕ y(y y0) + r(h)

bzw.

ϕ y(x0,y0)(y y0) = ϕ x(x0,y0)(x x0) + r(x,y).

Ist nun ϕy|(x0,y0)0, so folgt

(y y0) = ϕ y1 ϕ x (x x0) + r(x,y) .

Wäre ϕ nun eine affine Funktion, sodass r(x,y) = 0, so hätten wir eine auflösende Funktion gefunden. Dennoch: Sucht man nach allgemeinen Aussagen, so müssen diese auch im Spezielfall affiner Funktionen funktionieren und wir sehen, dass die Invertierbarkeit von ϕy|(x0,y0) von zentraler bedeutung sein wird.
Etwas allgemeiner seien x = (x1,,xm) m, y = (y1,,yn) n. Unter ϕ(x,y) = 0 wollen wir dann einen Satz von Gleichungen

ϕ1(x1,,xm,y1,,yn) = 0, ϕn(x1,,xm,y1,,yn) = 0,

welche gleichzeitig erfüllt sein sollen, verstehen. Ziel ist es nun alle y-Variablen mit Hilfe der xk auszudrücken. Das wir genauso viele Gleichungen wie aufzulösende Variablen betrachten ist dabei kein Zufall.
Um obige Rechnung nocheinmal durchzuführen betrachten wir die Jakobimatrix

J = ϕ1 x1 ϕ1 xmϕ1 y1 ϕ1 yn ϕn x1 ϕn xmϕn y1 ϕn yn .

Wir sehen dabei, dass die Jakobimatrix in zwei Blöcke zerfällt. Für den linken Block, welcher alle Ableitungen nach den x-Variablen enthält schreiben wir im Folgenden ϕx, dies ist eine (n × m)-Matrix. Für den rechten Block, welcher alle Ableitungen nach den y-Variablen enthält schreiben wir im Folgenden ϕy, dies ist eine (n × n)-Matrix. Explizit:

ϕ x = ϕ1 x1 ϕ1 xm ϕn x1 ϕn xm ,ϕ y = ϕ1 y1 ϕ1 yn ϕn y1 ϕn yn .

Die Verschiebung

h = x x0 n,y y0 mt

ist dann ein Vektor in m+n. Angenommen, wir haben wieder die selbe Relation wie oben, d.h.

0 = ϕ(x,y) = ϕ(x0,y0) =0 + ϕ (x0,y0)h + r(x,y),

wobei wir dies als Kurzschreibweise für die n Gleichungen für ϕ1,,ϕn verstehen, so erhalten wir nun

0 = ϕ x(x0,y0)(x x0) + ϕ y(x0,y0)(y y0) + r(x,y)

bzw.

(y y0) = ϕ y1 ϕ x (x x0) + r(x,y) ,

falls ϕy|(x0,y0) invertierbar ist.
Noch allgemeiner haben wir einen Raum für die x-Werte, einen für die y-Werte und einen Raum in dem die Gleichungen erfüllt sein müssen. Wir betrachten im Folgenden daher drei Banachräume E,F und G. Mit

(x,y)E×F := xE + yF

wird auch E × F zu einem normierten Raum. Sind E und F vollständig, so auch E × F. Sei nun V offen in E × F und

ϕ : V E × F G,

so definiert die Gleichung ϕ(x,y) = 0 eine Teilmenge von V , wobei wir annehmen, dass es ein (x0,y0) V gibt, so dass ϕ(x0,y0) = 0 ist.

DEfiNITION 3.10.1 (Lokale Auflösbarkeit). Eine Funktion ϕ(x,y) ist in einer Umgebung von (x0,y0) lokal nach y auflösbar genau dann, wenn es ein ε,δ > 0 und eine Funktion f : Uε(x0) Uδ(y0) gibt, sodass folgende zwei Eigenschaften erfüllt sind:

  1. Wenn x Uε(x0), dann ist ϕ(x,f(x)) = 0.
  2. Wenn (x,y) Uε(x0) × Uδ(y0), dann folgt ϕ(x,y) = 0 y = f(x).

DEfiNITION 3.10.2 (Partielle Frechet-Ableitung nach Unterräumen). Seien ϕ : V E × F G und x,x0 E, y,y0 F. Dann ist

T = ϕ x(x0,y0) = ϕE(x 0,y0) L(E,G)

genau dann, wenn

ϕ(x,y0) = ϕ(x0,y0) + ϕE(x x 0) + o(x x0),

für x x0 bzw.

S = ϕ y(x0,y0) = ϕF (x 0,y0) L(F,G)

genau dann, wenn

ϕ(x0,y) = ϕ(x0,y0) + ϕF (y y 0) + o(y y0),

für y y0.

SATZ 3.10.3 (Lokale Auflösbarkeit impliziter Funktionen). Seien E,F,G Banachräume, V E × F offen und ϕ : V G mit ϕ(x0,y0) = 0 für ein (x0,y0) V . Desweiteren seinen die folgenden Aussagen erfüllt

  1. ϕ sei stetig in (x0,y0),
  2. ϕF = ϕ y existiere auf V und ϕ y() : V L(F,G) sei stetig,
  3. ϕ y(x0,y0) sei auf G invertierbar und ϕ y(x0,y0) 1 L(G,F).

Dann ist ϕ in einer Umgebung von (x0,y0) lokal auflösbar.


Schritt 1:
Wähle ε1,δ1 > 0 mit Uε1(x0) × Uδ1(y0) V . Für ein festes x Uε1(x0) betrachte

A = A(x) : Uδ1(y0) F,yAy = y ϕ y1ϕ(x,y).

Wegen ϕ(x,y) G und ϕ y 1 L(G,F) ist auch ϕ y 1ϕ(x,y) F und A somit wohldefiniert. Gleichzeitig ist ϕ y 1 als ein inverser Operator gegeben, d.h. selbst wieder invertierbar und besitzt damit einen trivialen Kern. Es folgt somit

Ay = y ϕ(x,y) = 0.

Die Abbildung A ermöglicht es also das Lösungen der Gleichung ϕ(x,y) = 0 in ein Fixpunktproblem zu überführen. Im weiteren Verlauf des Beweises wollen wir daher versuchen den Banachschen Fixpunktsatz auf A anzuwenden.

Schritt 2:
Wir wollen nun zeigen, dass A = A(x) eine Kontraktion ist für festgehaltenes x Uε1(x0). Seien nun y1,y2 Uδ1(y0). Dann erhalten wir mit einer Anwendung des Hauptsatzes der Differentialrechnung

Ay1 Ay2F sup yy1,y2¯Ayy L(F,F) y1 y2F .

Wir benötigen also die Frechet-Ableitung von Ay. Dafür betrachten wir

A(y + k) = (y + k) ϕ y(x0,y0) 1ϕ(x,y + k) Ay = y ϕ y(x0,y0) 1ϕ(x,y)

Subtrahieren wir beide Zeilen voneinander, ergibt das

A(y + k) Ay = k ϕ y(x0,y0) 1 ϕ(x,y + k) ϕ(x,y) ϕy(x,y)k+o(kF)

Die untere Klammer folgt aus der partiellen Frechet-Differenzierbarkeit von ϕ(x,y) in y, was vorausgesetzt wurde. Wir setzen an dieser Stelle um abzukürzen ϕy = ϕ y. Wir fügen geschickt die Identität an der Stelle, wo das k steht, ein und erhalten

A(y + k) Ay = ϕy(x 0,y0) 1ϕ y(x 0,y0)k ϕy(x 0,y0) 1 ϕ y(x,y)k + o(k F ) = ϕy(x 0,y0) 1 ϕ y(x 0,y0) ϕy(x,y) =Aykϕy(x 0,y0) 1o(k F ) =o(kF)

Also gilt folgende Gleichheit

Ay = ϕ y(x 0,y0) 1 L(G,F) ϕy(x,y) ϕ y(x 0,y0) L(F,G).

Offensichtlich ist Ay L(F,F). Nun wollen wir die Operatornorm von Ay abschätzen. Da Ay ein Produkt von zwei linearen Abbildungen ist, erhalten wir

Ay L(F,F) ϕy(x 0,y0) 1 L(G,F) ϕy(x,y) ϕ y(x 0,y0)L(F,G).

Da nach Voraussetzung ϕy(x 0,y0) 1 L(G,F) ist, ist die Norm davon eine feste Konstante. Zusätzlich wissen wir nach Voraussetzung, dass ϕy : V L(F,G) stetig ist. Aus diesem Grund existieren ε2,δ2, so dass 0 < ε2 < ε1 und 0 < δ2 < δ1 erfüllt ist und zusätzlich folgende Eigenschaft gilt

Ay(x) L(F,F) α < 1.

Fassen wir unser Ergebnis zusammen. Für (x,y) Uε2(x0) × Uδ2(y0) und y1,y2 Uδ2(y0) gilt

Ay1 Ay2F αy1 y2F .

Wir erkennen, dass A(x) = A die Kontraktionseigenschaft erüllt.

Schritt 3:
Dieser Schritt ist wichtig um Sicherzustellen, dass unsere Kontraktion wirklich wieder in sich selbst abbildet. Wir wählen δ3 = δ2 2 > 0. Wir wollen in diesem Schritt folgende Aussage beweisen:

ε3 > 0 : y y0F δ3 A(x)y y0F δ3

für alle x Uε3(x0). Also schätzen wir, wie folgt, ab

A(x)y y0F A(x)y A(x)y0F + A(x)y0 y0F

Für den Term A(x)y A(x)y0F können wir die Kontraktionseigenschaft aus Schritt 2 verwenden und erhalten

A(x)y A(x)y0F αy y0F .

Wir müssen nur noch

A(x)y0 y0F

abschätzen. Dafür verwenden wir die Defintion von A(x), die in Schritt 1 definiert wird und berechnen damit A(x)y0. Wir erhalten

A(x)y0 y0F = ϕy(x 0,y0) 1ϕ(x,y 0)F ϕy(x 0,y0) 1 L(G,F) ϕ(x,y0)G = ϕy(x 0,y0) 1 L(G,F) ϕ(x,y0) ϕ(x0,y0)G.

Die letzte Gleichheit folgt aus ϕ(x0,y0) = 0. Nun wissen wir nach Voraussetzung, dass ϕ stetitg ist. Also können wir ε3 > 0 so wählen, dass für alle x Uε3(x0) folgendes gilt

A(x)y0 y0F (1 α)δ3.

Wir setzen nun unsere Ungleichungen wieder zusammen und erhalten

A(x)y y0F αy y0F + (1 α)δ3.

Da y Uδ3(y0) folgt

A(x)y y0F αδ3 + (1 α)δ3 = δ3.

Schritt 4:
Wir wollen nun den Banachschen Fixpunktsatz verwenden. Zuerst definieren wir uns unseren Banachraum. Das ist der Raum (M,d) mit

M := {y F|y y0| δ3} d(y1,y2) := y1 y2F .

Dieser Raum ist wirklich ein Banachraum, weil F einer ist und M ein abgeschlossener Unterraum von F ist. Für x Uε3(x0) gilt zudem

A : M M.

Das liegt an der Eigenschaft aus Schritt 3, dass für y Uδ3(y0) folgt

A(x)y y0F δ3.

Dass die Operatornorm von A unter unseren Voraussetzungen kleiner eins ist, wissen wir aus Schritt 2. Also wenden wir den Fixpunktsatz von Banach an und erhalten ein eindeutiges y M mit

Ay = y ϕ(x,y) = 0.


Anmerkung: Die so gefundene Funktion y = y(x) ist stetig im Punkt x = x0, was aus der Definition von A(x)y folgt und der Tatsache, dass ϕ(x,y) stetig in (x0,y0) vorausgesetzt wurde.

Frage: Was kann man nun über die Funktion y = y(x) aussagen. Man kann sie meistens nicht explizit hinschreiben. Trotzdem möchte man die Minima bzw. Maxima berechnen. Der folgende Satz hilft uns für diese Fragestellung.

SATZ 3.10.4. Ist unter den Voraussetzungen des vorigen Satzes ϕ : V E × F G partiell in x Frechet-differenzierbar und ist ϕx : V L(E,G) stetig im Punkt (x0,y0), dann ist y = y(x) im Punkt x0 Frechet-differenzierbar und

y(x 0) L(E,F) = ϕy(x 0,y0) 1 L(G,F) ϕx(x 0,y0) L(E,G).

Zu allererst wissen wir, dass ϕ(x0,y0) = 0 gilt. Zusätzlich verbinden wir x0 + h = x, so wie y0 + h = y, so dass die Gleichung ϕ(x0 + h,y0 + k) = 0 immer noch erfüllt ist. Nun wenden wenden wir den Hauptsatz der Differentialrechnung in der x-Koordinate an und erhalten

ϕ(x0 + h,y0) ϕx(x 0,y0)hG = ϕ(x0 + h,y0) ϕ(x0,y0) ϕx(x 0,y0)hG sup xx 0,x0 + h¯ϕx(x,y 0) ϕx(x 0,y)hE.

Wir machen dasselbe nun in der y-Koordinate für

ϕ(x0 + h,y0) + ϕy(x 0 + h,y0)kG = ϕ(x0 + h,y0 + k) ϕ(x0 + h,y0) ϕy(x 0 + h,y0)kG sup yy 0,y0 + k¯ϕy(x 0 + h,y) ϕy(x 0 + h,y0)L(F,G)kF

An dieser Stelle wollen wir folgenden Term abschätzen

ϕx(x 0,y0)h ϕy(x 0,y0)kG ϕx(x 0,y0)h + ϕ(x0 + h,y0)G + ϕ(x0 + h,y0) ϕy(x 0 + h,y0)kG + ϕy(x 0 + h,y0)k ϕy(x 0,y0)kG

Nun können wir die Ungleichungen, die wir davor bewiesen haben verwenden und erhalten schließlich

ϕx(x 0,y0)h + ϕy(x 0,y0)kG 2 sup (x,y)Uε(x0)×Uδ(y0)ϕy(x,y) ϕ y(x 0,y0)L(F,G) kF + sup (x,y)Uε(x0)×Uδ(y0)ϕx(x,y) ϕ x(x 0,y0)L(E,G) hE.

Mit dieser Ungleichung arbeiten wir später weiter. Weiterhin für k = y y0 und h = x x0 mit ϕ(x,y) = 0 = ϕ(x0,y0), zeigen wir, dass

k|F ChE

Zuerst geben wir eine Normabschätzung an

y y0 = A(x)y A(x0)y0 = A(x)y A(x)y0 + A(x)y0 A(x0)y0,

folgt

y y0F A(x)y A(x)y0F + A(x)y0 A(x0)y0F .

An dieser Stelle schätzen wir wieder, wie im vorherigen Satz in Schritt 2, wie folgt ab

y y0F αy y0F + A(x)y0 A(x0)y0F .

Offensichtlich folgt nun

(1 α)y y0F A(x)y0 A(x0)y0F ϕy(x 0,y0) 1 ϕ(x,y 0) ϕ(x0,y0) ϕx(x0,y0)h+o(h|)

Die untere Klammer folgt aus der Voraussetzung, dass ϕ(x,y) Frechet differenzierbar in x ist. Weil y y0 = k ist gilt

(1 α)kF ϕy(x 0,y0) 1 L(G,F) ϕx(x 0,y0)h + o(hE)G.

Für hinreichend kleines ε > 0 mit hE < ε folgt

kF ChE.

An dieser Stelle wenden wir uns nochmals unserer Abschätzung, die wir zu Beginn gemacht haben

ϕx(x 0,y0)h + ϕy(x 0,y0)kG 2 sup (x,y)Uε(x0)×Uδ(y0)ϕy(x,y) ϕ y(x 0,y0) o(1)L(F,G) kF ChE + sup (x,y)Uε(x0)×Uδ(y0)ϕx(x,y) ϕ x(x 0,y0)L(E,G) o(1) hE.

Die Eigenschaft des o(1) folgt aus der Stetigkeit von ϕx bzw. ϕy nach Voraussetzung. Also gilt

ϕx(x 0,y0)h + ϕy(x 0,y0)k = o(hE).

Das Landau-Symbol verändert sich nicht, wenn wir auf ihn einen linearen Operator anwenden. Daher gilt

ϕy(x 0,y0) 1ϕ x(x 0,y0)h + k = o(hE).

Mit k = y y0 folgt

k = y y0 = ϕy(x 0,y0) 1ϕ x(x 0,y0)h + o hE

die Definition der Frechet-Ableitung.

Merkregel: Wenn wir uns die Funktion f(x) := ϕ(x,y(x)) = 0 betrachten, wobei x m und y n und voraussetzen, dass y(x) in x stetig differenzierbar ist, erhalten wir indem wir f(x) nach x ableiten und die Kettenregel verwenden

0 = (ϕx,ϕ y) 1 y x(x) = ϕx + ϕ y y x(x).

Sofern nun die Inverse von ϕy existiert, ergibt sich

yx(x) = ϕ y1ϕ x.

BEISPIEL 3.10.5. Sei E = F = G = mit ϕ(x,y) = 0 y = y(x). Wir leiten folgende Gleichung nach x ab.

0 = ϕ x,y(x)

und erhalten mit der Kettenregel

0 = (ϕx,ϕ y) 1 y x = ϕx + ϕ y y x

In diesem Fall erhalten wir die von uns bekannte Formel

yx = ϕx ϕy.

Da wir im skalaren Fall sind, ist die Division tatsächlich definiert. Wir verwenden diese Formel um yx zu berechnen für unser altbekanntes Beispiel:

ϕ(x,y) = x2 + y2 r2 = 0,x,y,r > 0.

Offensichtlich gilt ϕx = 2x und ϕy = 2y, also ist

yx(x) = 2x 2y = x y = x r2 x2.

Das hätte man in diesem Fall auch direkt sehen können, indem man y = r2 x2 nach x ableitet. Man erkenne, dass es keine lokale Auflösbarkeit in einer Umgebung um die Punkten P(r0) und Q(r0) gibt, da ϕy(x,y) in diesen Punkten verschwindet.
Frage: Wie berechnet man in diesem Fall y(x)? Hierfür starten wir mit unserer bekannten Formel

0 = (ϕx,ϕ y) 1 y x = ϕx(x,y(x)) + ϕ y(x,y(x)) y x(x)

und leiten diese ein weiteres mal nach x ab. Mit der Produkt- und Kettenregel erhalten wir

0 = ϕxx 1 + ϕ xy y x + ϕyx y x + ϕyy y x2 + ϕ y2y 2x

Weil unsere zweiten partiellen Ableitungen stetig sind, gilt ϕxy = ϕ yx. Somit lässt sich unser Ergebnis folgendermaßen vereinfachen

0 = ϕxx 1 + 2ϕ xy y x + ϕyy y x2 + ϕ y2y 2x.

Weil wir im skalaren Fall sind, dividieren wir durch ϕy

2y 2x = ϕxx + 2ϕ xy y x + ϕyy y x 2 ϕy .

Für y x verwenden wir, die schon hergeleitete Formel yx = ϕx ϕy. Somit erhalten wir insgesamt

2y 2x = ϕxx + 2ϕ xy y x + ϕyy ϕx ϕy2 ϕy = ϕxx (ϕ y)2 + 2ϕ xy y x (ϕy)2 + ϕ yy ϕ x2 (ϕy)3 .

Hausaufgabe: Berechnen Sie mit dieser Formel y(x), wobei offensichtlich ϕxx = ϕ yy = 2 und ϕxy = 0 gelten, um die Rechnungen zu vereinfachen. Zusätzlich überprüfe man sein Ergebnis, indem man die Ableitung von

y(x) = x r2 x2

direkt berechne.

BEISPIEL 3.10.6. Es seien nun (x,y) E = 2 und z F = . Wir betrachten die Gleichung

ϕ(x,y,z) = 0 z = z(x,y).

Frage: Wie berechnet man z y? Wie schon im vorherigen Beispiel verwenden wir die Gleichung ϕ(x,y,z(x,y)) = 0 und leiten diese nach y ab

0 = ϕx,ϕ y,ϕ z x y y y z y = ϕx,ϕ y,ϕ z 0 1 z y .

Wir lösen die Gleichung nach z y auf und erhalten

z y = ϕy ϕz.

Aufgabe: Berechnen Sie auf ähnliche Weise wie im vorherigen Beispiel 2z x2, 2z y2 und 2z xy.

An dieser Stelle wollen wir kurz diskutieren, was passiert, wenn wir die Rolle der Variablen tauschen. Das heißt konkret, dass wir annehmen können, dass wir die Gleichung ϕ(x,y,z) = 0 mit x,y,z , jeweils lokal nach x = x(y,z),y = y(x,z) oder z = z(x,y) auflösen können. Wie in Beispiel 3.10.6 erhalten wir folgende drei Gleichungen, indem wir die Gleichung ϕ(x,y,z) = 0 jeweils nach x,y und z ableiten

x y = ϕy ϕx,y z = ϕz ϕy,z x = ϕx ϕz.

Nun multiplizieren wir diese miteinander und erhalten

x y y z z x = 1.

Man sollte sich nicht zu dem Gedanken verleiten lassen, dass sich die partiellen Ableitungen einfach kürzen, denn es steht auf der rechten Seite 1.

BEISPIEL 3.10.7. Wir nehmen folgendes Szenario an. Seien U := Uε(x0) E und V := V ε̃(y0) F. Wir betrachten eine glatte Funktion f : U V mit y = f(x) und wollen uns fragen, wann diese invertierbar ist. Dazu definieren wir uns die Abbildung ϕ(x,y) := y f(x) und setzen wie gewohnt

ϕ(x,y) = y f(x) = 0 y = f(x).

Wir wollen nun x darstellen als Inverse von y, d.h. x = x(y). Damit wir eine lokale Auflösbarkeit bekommen, muss nach dem Satz der lokalen Auflösbarkeit impliziter Funktionen gelten, dass ϕx1 existiert. In unserem Fall ist

ϕx = f(x)

die Frechet Ableitung von f und diese muss invertierbar sein! Wir erkennen zusätzlich, dass ϕy = 1 ist und verwenden die bekannte Formel aus Satz 3.10.4

x y = ϕx1 ϕ y = f(x) 1 1

BEISPIEL 3.10.8. Wir wollen nun Beispiel 3.10.7 im n diskutieren, das heißt E = F = n. Die Gleichung y = f(x) lässt sich wie folgt darstellen

y = f(x) y1 = f1(x1,,xn) = y1(x1,,xn) yn = fn(x1,,xn) = yn(x1,,xn) Gleichungssystem.

Wir leiten nun alle Gleichungen jeweils nach allen Raumrichtungen in x ab und erhalten dann für die Frechet-Ableitung von f(x)

f(x) = D(y) D(x) = D(y1,,yn) D(x1,,xn) = y1 x1y1 xn yn x1 yn xn := J.

Nun folgt, dass die Existenz von f(x) 1 genau dann gewährleistet ist, wenn J als Matrix invertierbar ist. Dieses ist äquivalent dazu, dass det(J)0. Nehmen wir nun an, dass wir f invertieren dürfen. Wir erhalten dann die folgenden Gleichungen

f1(y) = x(y 1,,yn) x1 = x1(y1,,yn) xn = xn(y1,,yn) .

Wir berechnen nun die Frechet-Ableitung von x(y) und erhalten

x(y) = D(x) D(y) = D(x1,,xn) D(y1,,yn) = x1 y1 x1 yn xn y1 xn yn

Wir verwenden nun die Formel x(y) = x y = f(x) 1, die in Beispiel 3.10.7 hergeleitet wurde und erhalten den folgenden Zusammenhang

x1 y1 x1 yn xn y1 xn yn = x(y) = f(x) 1 = y1 x1y1 xn yn x1 yn xn 1.

Die Invertierbarkeit ist im Sinne einer Matrix zu bestimmen. Man beachte, dass im Allgemeinen die folgende Ungleichheit gelte yk xl xl yk 1.

DEfiNITION 3.10.9. f : U n V n ist ein Diffeomorphismus der Klasse Cp genau dann, wenn

  1. f : U V bijektiv ist,
  2. f Cp(U,V ) und f1 Cp(V,U).

Bis jetzt haben wir noch keine Aussage darüber, ob f1 Frechet-differenzierbar ist, sofern f Frechet-differenzierbar war. Der nächste Satz klärt auf.

SATZ 3.10.10 (Umkehrfunktion). Es gelte f : G n n, wobei G offen sein soll. Sei f Cp(G, m) mit y0 = f(x0) und x0 G. Weiterhin sei

J(x0) = f(x 0) = f1 x1 f1 xn fn x1 fm xn x=x0

als Matrix invertierbar. Dann gibt es offene Mengen x0 U(x0) := U, y0 V (y0) := V , so dass

f : U V

ein Cp-Diffeomorphismus ist.

Wir wollen diesen Satz nicht beweisen, sondern an dieser Stelle wollen wir wissen, wie dieser Satz wirkt. Dafür betrachten wir folgendes Beispiel.

BEISPIEL 3.10.11. Wir betrachten die Abbildung die x,y auf ihre Polarkoordinaten abbildet. Also konkret sei f : + × [0, 2π) 2 2 mit folgender Funktionsvorschrift gegeben

f(r,θ) := x(r,θ) y(r,θ) = r cos(θ) r sin(θ) .

Wir berechnen nun die Frechet-Ableitung von f und erhalten

f(r,θ) = x rx θ y r y θ = cos(θ) r sin(θ) sin(θ) r cos(θ) .

Offensichtlich ist det f(r,θ) = r > 0. Wenn wir uns also außerhalb einer Umgebung um die Null bewegen, haben wir hier einen Cp-Diffeomorphismus vorliegen für p . Der Grund dafür ist die lokale Invertierbarkeit da r > 0 und alle partiellen Ableitungen von f glatt sind, was mit einer Anwendung des vorherigen Satzes bedeutet, dass f1 auch glatte partielle Ableitungen besitzt.