Está en la página 1de 6

Lección 20

Función implícita

20.1. Planteamiento del problema


Puede decirse que el teorema de la función inversa nos permite resolver localmente ciertos
sistemas de ecuaciones. Para usar la misma notación que en la generalización que buscamos,
intercambiamos los nombres de las variables. Dada una función f = ( f1 , f2 , . . . , fN ) : Ω → RN ,
donde Ω es un abierto de RN , consideramos el sistema de N ecuaciones
f1 (y1 , y2 , . . . , yN ) − x1 = 0
f2 (y1 , y2 , . . . , yN ) − x2 = 0
(1)
... ... ... ... ... ...
fN (y1 , y2 , . . . , yN ) − xN = 0

en las 2N variables reales x1 , x2 , . . . xN , y1 , y2 , . . . , yN , con la condición y = (y1 , y2 , . . . , yN ) ∈ Ω .


Es más cómodo escribir también x = (x1 , x2 , . . . , xN ) ∈ RN , con lo que el sistema se resume en
una sola ecuación vectorial
f (y) − x = 0 (2)
en dos variables vectoriales, cuyas soluciones son pares (x, y) ∈ RN × Ω tales que f (y) = x .
El problema que nos interesaba era tratar de invertir la función f , que es tanto como expresar
y como función de x , es decir, intentar que la igualdad (2) sea equivalente a una igualdad de
la forma y = g(x) para conveniente función g . Digamos que resolver la ecuación (2) con y
como incógnita, o lo que es lo mismo, resolver en sistema (1), en las incógnitas y1 , y2 , . . . , yN ,
es tanto como encontrar la función g .
Olvidando cuestiones de diferenciabilidad, esto es fácil cuando f es inyectiva, y el resultado
se puede expresar como una equivalencia del tipo indicado, con g = f −1 :

(x, y) ∈ RN × Ω , f (y) − x = 0 ⇐⇒ x ∈ f (Ω) , y = f −1 (x) (3)

Podemos decir que hemos resuelto globalmente la ecuación (2) , pues en ambos miembros
aparecen todas sus soluciones o, si se quiere, la función g está definida en el conjunto más
grande posible.

126
20. Función implícita 127

Como f no tiene por qué ser inyectiva, en general sólo resolvemos localmente la ecuación
(2) , gracias al teorema de la función inversa (local). Partiendo de una solución (a, b) de la
ecuación (2) , es decir, b ∈ Ω y a = f (b) , y con adecuadas hipótesis sobre f , el teorema nos
da dos abiertos V y U de RN , con b ∈ V ⊂ Ω , tales que la restricción de f a V es una biyección
de V sobre U. Escribamos este resultado de forma que pueda compararse con (3) . Tomando
W = U ×V tenemos un abierto de RN × RN tal que (a, b) ∈ W ⊂ RN × Ω y si g : U → V es la
función inversa de la restricción de f a V , hemos obtenido:
(x, y) ∈ W , f (y) − x = 0 ⇐⇒ x ∈ U , y = g(x) (3 0 )
Obsérvese por qué esta equivalencia sólo resuelve localmente la ecuación (2) . A diferencia de
(3) , la función g no está definida en el conjunto más grande posible f (Ω) , sino solamente
en el abierto U , un entorno del punto a , que está contenido en f (Ω) . Este carácter local del
resultado también se refleja en el primer miembro de (3 0 ) , pues en él no aparecen todas las
soluciones de la ecuación (2) , sino solamente las que pertenecen a W = U ×V , un entorno de
la solución de partida (a, b) .
Pues bien, hacemos ahora un planteamiento mucho más ambicioso, sustituyendo la ecuación
(2) por otra más general, que será de la forma
F(x, y) = 0 (4)
donde x e y son variables vectoriales, en principio independientes, y queremos saber hasta
qué punto esta igualdad equivale a expresar una de ellas como función de la otra, tanto da si
queremos y como función de x o a la inversa, pues la asimetría ha desaparecido.
Nótese que seguimos trabajando con sistemas de ecuaciones, así que (4) será la ecuación
vectorial que resuma un sistema de, digamos M ecuaciones, luego la función F tomará valores
en RM y tendrá M componentes: F = (F1 , . . . , FM ). El sistema será formalmente indeterminado,
es decir, con más incógnitas que ecuaciones, lo que significa que F será función de, digamos
N + M variables reales, es decir, estará definida en un abierto Ω ⊂ RN+M = RN × RM . Nótese
que el número de incógnitas ya no tiene por qué ser el doble que el de ecuaciones, es decir,
podemos tener M 6= N . Como disponemos de M ecuaciones, podemos aspirar a “despejar” M
incógnitas que, sin perder generalidad pueden ser las M últimas, denotadas por y1 , . . . , yM , a las
que queremos expresar como funciones de las N primeras, que serán x1 , . . . , xN .
Así pues, tenemos el sistema de M-ecuaciones
F1 (x1 , . . . , xN , y1 , . . . , yM ) = 0
F2 (x1 , . . . , xN , y1 , . . . , yM ) = 0
(5)
... ... ... ... ... ...
FM (x1 , . . . , xN , y1 , . . . , yM ) = 0
con N + M incógnitas, que escribiendo x = (x1 , . . . , xN ) ∈ RN e y = (y1 , . . . , yM ) ∈ RM se
resume en la ecuación vectorial (4) , en la que nos centramos a partir de ahora. Sus soluciones
son pares (x, y) ∈ Ω tales que F(x, y) = 0 .
Pretendemos ahora que la igualdad F(x, y) = 0 sea equivalente a una igualdad de la forma
y = ϕ(x) para conveniente función ϕ . Digamos que resolver la ecuación (4) es tanto como
encontrar la función ϕ .
20. Función implícita 128

Claramente, este problema es mucho más general que el de la función inversa, luego no
debemos esperar nada mejor que lo obtenido en ese caso particular. Dicho de otra forma, no
podemos aspirar a resolver globalmente la ecuación (4) , sino tan sólo localmente. Comparando
con la ecuación (2) , no podemos esperar una equivalencia análoga a (3) sino a (3 0 ) . Para ello
debemos disponer de una solución de partida, es decir, de un par (a, b) ∈ Ω tal que F(a, b) = 0 ,
cuya existencia no está ahora garantizada. Supondremos que tal solución existe, pues en otro
caso, el conjunto de soluciones de la ecuación (4) es vacío y no hay nada que estudiar.
Nuestro objetivo es, por tanto, encontrar un abierto W de RN × RM , con (a, b) ∈ W ⊂ Ω ,
otro abierto U de RN y una función ϕ : U → RM tales que

(x, y) ∈ W , F(x, y) = 0 ⇐⇒ x ∈ U , y = ϕ(x) (6)

Se dice entonces que la ecuación (4) define a y como función implícita de x en un entorno
del punto a , con y = b para x = a . Naturalmente, deberemos hacer algunas hipótesis acerca de
la diferenciabilidad de F , y esperamos que ϕ resulte ser diferenciable en todo punto de U.
Queda claro que esperamos, para el problema general de existencia de una función implícita,
exactamente la misma repuesta local que tenemos para el problema de la función inversa. Pues
bien, con hipótesis enteramente análogas a las del teorema de la función inversa, esto es lo que
asegurará el teorema de la función implícita que vamos a obtener. Su demostración consiste en
aplicar el teorema de la función inversa a una función construida a partir de F , luego el nuevo
teorema es consecuencia fácil del que ya conocemos, pero a su vez es más general, luego en
realidad ambos teoremas son equivalentes.
Nótese finalmente que el problema de la existencia de una función implícita tiene interés
incluso en el caso N = M = 1 y, aunque buscamos una función real de variable real ϕ , el
resultado se escapa del ámbito del cálculo en una variable, puesto que la función F está definida
en un abierto Ω de R2 .

20.2. Teorema de la función implícita


Vamos a probar exactamente el resultado que hemos anunciado:

Teorema. Sea Ω un abierto de RN × RM y F : Ω → RM una función diferenciable en


todo punto de Ω . Sea (a, b) ∈ Ω tal que F(a, b) = 0 y supongamos que la función diferencial
DF : Ω → L(RN+M , RM ) es continua en el punto (a, b) . Considerando el abierto Ωa ⊂ RM y
la función Fa : Ω → RM , dados por

Ωa = { y ∈ RM : (a, y) ∈ Ω } y Fa (y) = F(a, y) ∀ y ∈ Ωa

suponemos finalmente que la diferencial DFa (b) es biyectiva. Entonces existen un abierto W de
RN × RM , con (a, b) ∈ W ⊂ Ω , un abierto U de RN y una función ϕ : U → RM , diferenciable
en todo punto de U , tales que:

(x, y) ∈ W , F(x, y) = 0 ⇐⇒ x ∈ U y = ϕ(x) (6)


20. Función implícita 129

Demostración. Consideramos la función H : Ω → RN × RM definida por



H(x, y) = x , F(x, y) ∀ (x, y) ∈ Ω

que claramente verifica H(a, b) = (a, 0) , y aplicaremos a H el teorema de la función inversa,


en el punto (a, b) . Empezamos observando que H es diferenciable en todo punto de Ω , pues
sus dos componentes lo son. Pero conviene calcular explícitamente la diferencial de H en cada
punto de Ω .
Para ello, consideramos las proyecciones lineales naturales de RN × RM sobre RN y RM ,
que denotamos por π1 y π2 respectivamente, es decir, escribimos:

π1 (x, y) = x y π2 (x, y) = y ∀ (x, y) ∈ RN × RM

Por otra parte J1 y J2 serán las inyecciones lineales de RN y RM en RN × RM , dadas por

J1 (x) = (x, 0) ∀ x ∈ RN y J2 (y) = (0, y) ∀ y ∈ RM

De esta forma, para todo (x, y) ∈ Ω , tenemos claramente


   
H(x, y) = (x, 0) + 0 , F(x, y) = J1 (x) + J2 F(x, y) = J1 π1 (x, y) + J2 F(x, y)

lo que se resume escribiendo


H = J1 ◦ π1 + J2 ◦ F

Para todo (x, y) ∈ Ω , como F es diferenciable en (x, y) lo mismo le ocurre a H , con

DH(x, y) = J1 ◦ π1 + J2 ◦ DF(x, y) (7)

y deducimos que

DH(x, y) − DH(a, b) = J2 ◦ DF(x, y) − DF(a, b) k 6 J2 DF(x, y) − DF(a, b)

también para todo (x, y) ∈ Ω . Como por hipótesis, DF es continua en el punto (a, b) , vemos
que DH también lo es. Para aplicar el teorema de la función inversa, sólo queda comprobar que
DH(a, b) es biyectiva, para lo cual usaremos la hipótesis sobre la función Fa .
 
Observamos que para todo y ∈ Ωa se tiene Fa (y) = F (a, 0)+(0, y) = F J1 (a)+J2 (y) ,
y la regla de la cadena nos da

DFa (y) = DF(a, y) ◦ J2 ∀ y ∈ Ωa , luego DFa (b) = DF(a, b) ◦ J2 (8)

Para comprobar que DH(a, b) es biyectiva, bastará ver que es inyectiva, es decir, que la igualdad
DH(a, b)(u, v) = (0, 0) con (u, v) ∈ RN ×RM , sólo se cumple para u= v = 0 . En efecto, usando
(7) tenemos (0, 0) = DH(a, b)(u, v) = (u, 0) + 0 , DF(a, b)(u, v) , de donde deducimos, por
una parte que u = 0 , y por otra que
   
0 = DF(a, b)(u, v) = DF(a, b)(0, v) = DF(a, b) ◦ J2 (v) = DFa (b) (v)

donde, para la última igualdad, hemos usado (8) . Como por hipótesis, DFa (b) es biyectiva,
tenemos v = 0 , como queríamos.
20. Función implícita 130

El teorema de la función inversa nos da un entorno W de (a, b) y un entorno V de (a, 0) ,


ambos abiertos de RN × RM , tales que W ⊂ Ω y la restricción de H a W es una biyección de
W sobre V , cuya inversa es diferenciable en todo punto de V . Dicha inversa es por tanto una
biyección K : V → W que es diferenciable en todo punto de V y verifica que

H K(x, z) = (x, z) ∀ (x, z) ∈ V

Tomando U = J1−1 (V ) = {x ∈ RN : (x, 0) ∈ V } , tenemos un abierto de RN tal que a ∈ U


y la última igualdad nos dice que

H K(x, 0) = (x, 0) ∀x ∈ U (9)

Consideremos ahora las dos componentes de la función x 7→ K(x, 0) , de U en W , pues la


segunda es la función ϕ : U → RM que buscamos. Más concretamente, definimos
 
ψ(x) = π1 K(x, 0) y ϕ(x) = π2 K(x, 0) ∀x ∈ U

Claramente ϕ es diferenciable en todo punto de U , pues basta observar que ϕ = π2 ◦ K ◦ J1 .


Sólo queda comprobar que W , U y ϕ verifican la equivalencia (6) .

Para todo x ∈ U , tenemos que ψ(x) , ϕ(x) = K(x, 0) ∈ W ⊂ Ω y (9) nos dice que
 
(x, 0) = H ψ(x), ϕ(x) = ψ(x) , F ψ(x), ϕ(x) ∀x ∈ U

de donde deducimos que ψ(x) = x , y entonces también que



x, ϕ(x) ) ∈ W y F x , ϕ(x) = 0

Tenemos así la implicación hacia la izquierda de la equivalencia (6) .


Recíprocamente, si (x, y) ∈ W y F(x, y) = 0 , tenemos que (x, 0) = H(x, y) ∈ V , luego x ∈ U.
Además, también sabemos que K(x,  0) ∈ W y H K(x, 0) = (x, 0) , pero H es inyectiva en W ,
luego (x, y) = K(x, 0) = x , ϕ(x) , de donde y = ϕ(x) como queríamos demostrar. 

Conviene comentar brevemente las hipótesis del teorema anterior. Que F sea diferenciable
en todo punto de Ω y que DF sea continua, no ya en el punto (a, b) , sino incluso en todo punto
de Ω , son hipótesis muy poco restrictivas. Se trata simplemente de que la ecuación F(x, y) = 0
sea manejable con técnicas de cálculo diferencial. En la práctica estas dos hipótesis se suelen
comprobar con un simple vistazo a la función F .
Piénsese por ejemplo que cuando las componentes de F son funciones polinómicas en
N + M variables, estas hipótesis se cumplen sobradamente y, aún en este caso tan particular, el
sistema de ecuaciones (5) que estamos estudiando puede ser extraordinariamente complicado,
por no hablar de lo que ocurre cuando las componentes de F involucran funciones trascendentes
como la exponencial o las trigonométricas.
La tercera hipótesis, que DFa (b) sea biyectiva, parece más rebuscada, pero es muy natural
y también suele ser fácil de comprobar. Naturalmente DFa (b) será biyectiva si, y sólo si, su
matriz jacobiana tiene determinante no nulo, así que veamos cual es esa matriz jacobiana.
20. Función implícita 131

De la igualdad (8) se deduce claramente que

∂ Fa ∂F
(b) = (a, b) ∀ j ∈ IM
∂yj ∂yj

cosa que también se comprueba directamente, sin más que escribir la definición de las derivadas
parciales de ambas funciones vectoriales, pues ambas definiciones son idénticas. Por tanto,
las columnas de la matriz jacobiana de Fa en el punto b son las M últimas columnas de la
matriz jacobiana de F en el punto (a, b) . Por tanto, no hay necesidad de considerar la función
Fa , basta considerar la matriz JF(a, b) ∈ MM×(N+M) y comprobar que el determinante de la
submatriz M × M formada por sus últimas M columnas no se anula. Pensemos además que
en la práctica, lo que pretendemos es expresar M variables, que no tienen por qué ser las M
últimas, como funciones implícitas de la restantes. Por tanto, la auténtica hipótesis para poder
aplicar el teorema de la función inversa es que la matriz JF(a, b) tenga rango M , pues entonces
habrá M columnas que forman una matriz cuadrada con determinante no nulo y esas columnas
nos indican las variables que podemos expresar como funciones implícitas de las restantes.
Se comprende ahora el papel que juega esta hipótesis, por analogía con el caso en que F
es lineal y DF(a, b) = F . Dicho intuitivamente, que la matriz DF(a, b) tenga rango menor que
M , significa intuitivamente que una o más de las ecuaciones de nuestro sistema es consecuencia
de las restantes, al menos en un entorno del punto (a, b) . Digamos que el rango de la matriz
DF(a, b) es el máximo número de ecuaciones verdaderamente independientes, y esto explica
que sea también el máximo número de variables que el teorema anterior nos permite expresar
como funciones implícitas de las restantes. Por poner un ejemplo muy obvio, si añadimos una
ecuación al sistema repitiendo una ecuación, el sistema pasará a tener M + 1 ecuaciones, pero
eso no nos va a permitir “despejar” más variables.

Finalmente, merece la pena destacar el caso particular N = M = 1 del teorema anterior:

Sea Ω un abierto de R2 , F : Ω → R una función diferenciable en todo punto de Ω y


(a, b) ∈ Ω tal que F(a, b) = 0 . Supongamos que las dos derivadas parciales de F son
∂F
continuas en el punto (a, b) y que (a, b) 6= 0 . Entonces existen un abierto W de R2 ,
∂y
con (a, b) ∈ W ⊂ Ω , un abierto U de R y una función ϕ : U → R , derivable en todo
punto de U , tales que:

(x, y) ∈ W , F(x, y) = 0 ⇐⇒ x ∈ U y = ϕ(x)

También podría gustarte