Está en la página 1de 231

1

1.1

Sucesiones de n umeros reales


N umeros reales

En el conjunto de los n umeros reales tenemos denidas dos operaciones binarias, suma y producto, y una relaci on de orden (a, b) a + b (a, b) ab a b. Ellos cumplen los siguientes axiomas: A1 Conmutatividad de la suma. Para todo par ordenado (a, b) de n umeros reales, a + b = b + a. A2 Asociatividad de la suma Para toda terna (a, b, c) de n umeros reales, (a + b) + c = a + (b + c). A3 Existencia de elemento neutro, o cero, para la suma. Existe un n umero real, que denotamos 0, con la condici on de ser a + 0 = a para todo n umero real a. A4 Existencia de elemento inverso, u opuesto, para la suma. Existe, para cualquier n umero real a, un n umero real, a, que satisface a + (a) = 0. A5 Conmutatividad del producto. Para todo par ordenado de n umeros reales (a, b), se tiene ab = ba. A6 Asociatividad del producto. Para toda terna de n umeros reales (a, b, c), se tiene (ab)c = a(bc). A7 Existencia de unidad para el producto. Existe un n umero real, 1, 1 = 0, tal que a 1 = a para todo n umero real a. A8 Existencia de elemento inverso para el producto. Para todo n umero real a, a = 0, existe un n umero real, a1 , o 1/a, que satisface aa1 = 1. A9 Distributividad del producto con respecto a la suma. Para toda terna de n umeros reales (a, b, c), vale que a(b + c) = ab + ac. A10 Transitividad del orden. Si a b y b c, entonces a c. A11 Antisimetr a del orden. Si a b y b a, entonces a = b.

1 Sucesiones de n umeros reales A12 Para dos n umeros reales cualesquiera a, b, es a b, o b a. A13 a b a + c b + c para todo n umero real c. A14 0 a y 0 b implican 0 ab.

A15 Axioma de completitud. Todo conjunto acotado superiormente tiene supremo. De estos axiomas se deducen las siguientes propiedades: P1 El elemento neutro para la suma es u nico, pues si hubiera dos, digamos 0 y 0 , ser a 0 = 0 + 0 = 0 . P2 a + b = a + c b = c. En particular, el opuesto de a, a, es u nico. Luego (a) = a. Escribimos a b en lugar de a + (b). P3 ab = 0 es equivalente a a = 0 o b = 0. P4 El conjunto de los n umeros reales, sin el 0, satisface los mismos axiomas con respecto al producto (Axiomas 5, 6, 7 y 8) que el conjunto de todos los n umeros reales con respecto a la suma (Axiomas 1, 2, 3 y 4). Luego aqu ellos satisfacen las mismas propiedades que estos para la suma. A saber, el elemento neutro para el producto es u nico. Si a = 0 y ab = ac, entonces b = c. En particular, el inverso es u nico. Adem as (a1 )1 = a. Si b = 0, entonces ab1 (= a(1/b)) tambi en se escribe a/b. El cero no tiene inverso, ya que a0 = 0 para todo n umero real a. P5 Si a = 0, b = 0, entonces (ab)1 = a1 b1 . P6 Se tiene (a)b = a(b) = (ab). En particular, a = (1)a. P7 Cuando a b y a = b, se escribe a < b. As , a b es equivalente a a < b o a = b. P8 Para dos n umeros reales cualesquiera a, b vale una y s olo una de las siguientes relaciones a < b, a = b, b < a (b < a tambi en se escribe a > b). P9 a b y b < c implican a < c. P10 a b y c d implican a + c b + d. Si adem as a < b o c < d, entonces

1 Sucesiones de n umeros reales a + c < b + d.

P11 a b es equivalente a a + c b + c. a < b es equivalente a a + c < b + c. P12 Las relaciones a b, 0 b a, a b 0, b a, son equivalentes. Las siguientes relaciones son tambi en equivalentes: a < b, 0 < b a, a b < 0, b < a. P13 Si a 0, b 0, entonces a + b 0. M as a un, es a + b > 0 o a = b = 0. P14 Para cualquier n umero real a, se dene |a| = a si a 0 a si a < 0.

Se tiene | a| = |a|, |a| = 0 si y s olo si a = 0. P15 Si > 0, entonces la relaci on |a| es equivalente a a . |a| < es equivalente a < a < . P16 Para a, b reales cualesquiera, se tiene |a + b| |a| + |b|, ||a| |b|| |a b|. P17 Si c 0, entonces a b ac bc. P18 Regla de los signos {a 0 y b 0} ab 0 {a 0 y b 0} ab 0 {a > 0 y b > 0} ab > 0 {a > 0 y b < 0} ab < 0 {a < 0 y b < 0} ab > 0. P19 Para dos n umeros reales cualesquiera a, b se tiene |ab| = |a||b|. P20 Si a > 0, entonces a1 > 0. Si c > 0, entonces la relaci on a b es equivalente a ac bc, y la relaci on a < b es equivalente a ac < bc. La relaci on 0 < a < b es equivalente a 0 < b1 < a1 . P21 Para cualquier n umero real a se dene 1 si a > 0 1 si a < 0 sig (a) = 0 si a = 0.

1 Sucesiones de n umeros reales Sigue que sig (ab) = sig (a) sig (b), a = |a| sig (a).

P22 Las relaciones 0 < a1 a2 , 0 < b1 b2 , implican a1 b1 a2 b2 . Si adem as a1 < a2 o b1 < b2 , entonces a1 b1 < a2 b2 . P23 La relaci on a2 b2 es equivalente a |a| |b|. La relaci on a3 b3 es equivalente a a b.

1 Sucesiones de n umeros reales

1.2

Sucesiones num ericas


N R,

Consideremos una aplicaci on esto es, una ley de correspondencia que asigna a cada n umero natural n un n umero real an . Estos n umeros reales an , imagen de los n umeros naturales, quedan ordenados de acuerdo con la relaci on < que existe en N. Debe entenderse ordenados con respecto a su enumeraci on, no con respecto a su valor num erico: a1 , a2 , a3 , . Esto se llama una sucesi on de n umeros reales. Tambi en se la indica {an }. Ejemplos {1/n} = 1, 1/2, 1/3, {1/2n } = 1/2, 1/4, 1/8, {n} = 1, 2, 3, n+1 n = 2, 3/2, 4/3,

0, 1/2, 0, 1/3, 0, 1/4, 0, 1/5, 0, 1, 0, 2, 0, 3, 0, 1, 0, 11, 0, 111, 0, 49, 0, 499, 0, 4999, {1} = 1, 1, 1, . Puede ocurrir que an se aproxime a un determinado n umero real l a medida que n crece. En este caso l se llama l mite de la sucesi on dada, y se indica l = lim an , o bien an l cuando n .
n

La denici on precisa es la siguiente: l = limn an si y s olo si para cada > 0, arbitrario, existe un

n umero natural n0 , que depende de , tal que para n > n0 vale |an l| < .

1 Sucesiones de n umeros reales

Recordar que |an l| < es equivalente a l < an < l + . Conviene considerar aqu el caso de l mite innito. Si bien no es un n umero, tambi en se simboliza limn an = , o an cuando n . limn an = si y s olo si dado un n umero real M > 0, arbitrario, existe n0 (M ) N tal que para n > n0 es |an | > M . limn an = + (respectivamente ) si y s olo si dado un n umero real M > 0, arbitrario, existe n0 (M ) tal que para n N, n > n0 , vale an > M (respectivamente an < M ). Dada una sucesi on, puede ocurrir que tenga l mite nito (sucesi on convergente), o l mite innito (sucesi on divergente) o bien que no tenga l mite, ni nito ni innito (sucesi on oscilante). Se puede probar f acilmente que estos tres casos son excluyentes entre s .

1.3

Propiedades de los l mites nitos

Supongamos que an l cuando n . (a) Desde un t ermino en adelante, es decir, para todo an con n > n0 , an se conserva mayor que cualquier n umero menor que l, y menor que cualquier n umero mayor que l. (b) Si sig (l) = 0 entonces a partir de un t ermino en adelante, an tiene el mismo signo que l. (c) Si dos sucesiones tienen l mites distintos, entonces los t erminos de la de mayor l mite superan a los de menor l mite desde un t ermino en adelante. (d) Si an a, bn b, y a partir de un t ermino en adelante es an < bn , entonces a b. (e) El l mite es u nico. (f) Si an l, bn l, y a partir de un t ermino en adelante es an cn bn , entonces cn l.

1 Sucesiones de n umeros reales

1.4

Subsucesiones

Una sucesi on es una aplicaci on g : N R. Supongamos que tenemos una aplicaci on h : N N, estrictamente creciente, es decir, h(n) < h(m) si n < m. Luego la composici on g h, N N R, es una aplicaci on de N en R. Por lo tanto es tambi en una sucesi on, que por provenir de la otra de esa manera se llama subsucesi on de la otra. Si, por ejemplo, tenemos la sucesi on a1 , a2 , , y h(1) = 3, h(2) = 5, h(3) = 6, h(4) = 10, , entonces la subsucesi on que se forma es {bn }, donde b1 = a3 , b2 = a5 , b3 = a6 , b4 = a10 , . Proposici on Si una sucesi on es convergente (respectivamente, divergente), entonces cualquier subsucesi on de ella ser a tambi en convergente (respectivamente, divergente). Una sucesi on {an } se dice creciente (respectivamente, decreciente) si a1 a2 a3 (respectivamente, a1 a2 a3 ). Si todas las desigualdades son estrictas, entonces se llaman estrictamente crecientes o estrictamente decrecientes. Una sucesi on {an } se dice acotada superiormente (respectivamente, inferiormente) si existe un n umero real M > 0 tal que an < M (respectivamente, an > M ). Proposici on Toda sucesi on creciente (respectivamente, decreciente) y acotada superiormente (respectivamente, acotada inferiormente) tiene l mite nito. La demostraci on de esta Proposici on se basa en el Axioma 15 de los n umeros reales. En realidad, lim an resulta ser sup(an ) en el caso creciente e inf(an ) en el caso decreciente. Observar que la condici on de ser creciente, o decreciente, basta pedirla a partir de un t ermino en adelante. Lo mismo para la acotaci on superior o inferior, ya que una cantidad nita de n umeros siempre est an acotados. Un ejemplo notable de sucesi on acotada superiormente y estrictamente creciente es {(1 + 1/n)n }.
h g

1 Sucesiones de n umeros reales

Una sucesi on {an } puede no tener l mite pero s pueden tenerlo subsucesiones de ella. Si una subsucesi on de {an } tiene un l mite l, entonces l se llama l mite de oscilaci on de la sucesi on {an }. De esta manera, una sucesi on puede tener muchos (en realidad, innitos) l mites de oscilaci on. Por ejemplo, sea {an } la sucesi on 1, 0, 1, 0, 1, . La subsucesi on a 1 , a 3 , a5 , tiene l mite 1, mientras que la subsucesi on a 2 , a 4 , a6 , tiene l mite 0. Puede probarse f acilmente que esta sucesi on tiene s olo estos dos l mites de oscilaci on. Una sucesi on tiene siempre l mites de oscilaci on, con valor nito o innito. De entre todos los l mites de oscilaci on hay uno que es el mayor de ellos, nito o innito. Se le da el nombre de l mite superior, y se simboliza lim sup an o lim an . Asimismo, siempre hay un menor l mite de oscilaci on, nito o innito, que se llama l mite inferior de la sucesi on, y se denota lim inf an o lim an . Valen los siguientes resultados: (a) lim sup an = + si y s olo si {an } no es acotada superiormente. (b) lim inf an = si y s olo si {an } no es acotada inferiormente. (c) La sucesi on {an } tiene l mite, nito o innito con signo determinado, si y s olo si lim inf an = lim sup an . En este caso el valor de su l mite es el coincidente de lim inf an y lim sup an .

Un criterio general de convergencia


Comprobar si una sucesi on tiene l mite por su misma denici on supone conocer el valor del l mite. Existe un criterio que permite determinar la existencia de l mite nito de una sucesi on sin conocer su supuesto l mite. Es la llamada

1 Sucesiones de n umeros reales condici on de Cauchy.

Denici on Una sucesi on an se dice de Cauchy si dado > 0, arbitrario, existe n0 ( ) N tal que si n, m N, n n0 , m n0 , entonces |an am | < . Proposici on Una sucesi on an tiene l mite nito si y s olo si es de Cauchy. Demostraci on: Supongamos que an l, l nito. Dado > 0, existe n0 N tal que |an l| < /2 si n n0 . Luego, si n n0 , m n0 , sigue que |an am | = |an l + l am | |an l| + |l am | < /2 + /2 = . Por lo tanto {an } es de Cauchy. Rec procamente, supongamos ahora que {an } es de Cauchy. La demostraci on sigue los siguientes pasos: 1ro Una sucesi on de Cauchy es acotada. En efecto, un conjunto nito de n umeros reales es acotado. Luego el conjunto {a1 , a2 , , an0 } es acotado. Para n > n0 tenemos |an | = |an an0 + an0 | |an an0 | + |an0 | < |an0 | + . Luego el conjunto {an0 +1 , an0 +2 , } es tambi en acotado. Como la uni on de dos conjuntos acotados es otro conjunto acotado, sigue que la sucesi on {an } es acotada. 2do Debido a los puntos (a) y (b) anteriores, toda sucesi on acotada tiene l mite superior y l mite inferior nitos. 3ro Debe ser l = lim inf an = lim sup an = l. En efecto, supongamos que l < l, y sea = l l > 0. Como estamos suponiendo que {an } es una sucesi on de Cauchy, sigue que existe n0 N tal que |am an | < /3 si m n0 , n n0 . Por otra parte, existe una subsucesi on {ani } de {an } tal que ani l, y existe otra subsucesi on {ami } de an tal que ami l. Por lo tanto, a partir de un cierto t ermino de la primera subsucesi on vale |ani l| < /3. An alogamente, a partir de cierto t ermino de la segunda subsucesi on vale |ami l| < /3.

1 Sucesiones de n umeros reales Sigue que para estos t erminos = |l l| = |l ami + ami ani + ani l| |l ami | + |ami ani | + |ani l| < |ami ani | + 2/3 .

10

Luego |ami ani | > /3. Pero esto est a en contradicci on con el hecho de que erminos de la sucesi on {an } satisfacen a partir del t ermino an0 , todos los t |an am | < /3.

1.5

C alculo de l mites

A diferencia de lo que ocurre con las operaciones de suma y producto de n umeros reales, no existe un algoritmo general que permita calcular l mites de sucesiones. El m etodo consiste entonces en calcular por denici on el l mite de determinadas sucesiones sencillas para despu es reducir a estas sucesiones de expresi on m as complicada. Para realizar esto debemos saber c omo se comporta el l mite cuando operamos con sucesiones. Suma Dadas dos sucesiones {an }, {bn }, podemos formar la sucesi on suma {an + bn } = a1 + b1 , a2 + b2 , . Para el l mite de la sucesi on suma tenemos los siguientes casos: {an {an {an {an lim(an + bn ). Producto Dadas dos sucesiones {an }, {bn }, la sucesi on producto es {an bn } = a1 b1 , a2 b2 , . Obtenemos que {an a, bn b} an bn ab {an 0, {bn } acotada } an bn 0 {an , |bn | > K > 0} an bn . a, bn b} an + bn , {bn } acotada } an + bn +, bn +} an + bn , bn } an + bn a+b + .

Si an +, bn , entonces no puede darse una respuesta general para

1 Sucesiones de n umeros reales

11

Si an 0 y bn , entonces no hay respuesta general para el l mite del producto. Cociente La sucesi on cociente es {an /bn } = a1 /b1 , a2 /b2 , . Sigue que {an a, bn b = 0} {{an } acotada , bn } {|an | > K > 0, bn 0} {an , {bn } acotada } general para el l mite del cociente. Logaritmos Si > 0, = 1, b > 0, se dene log b a un n umero x que satisface x = b. Dada la sucesi on {bn }, bn > 0, queda formada la sucesi on {log bn } = log b1 , log b2 , . Si bn b > 0, entonces log bn log b. En efecto, suponiendo > 1, para > 0 es > 1, < 1. Luego, como bn /b 1, sigue que a partir de un n en adelante es < bn /b < . Tomando logaritmo en estas dos desigualdades sigue que < log bn log b < , lo que prueba que log bn log b. Si bn 0, bn > 0, y > 1, entonces log bn . Si, en cambio, < 1, entonces log bn +. Potencia Si {an }, an > 0, {bn }, son dos sucesiones, entonces puede construirse la sucesi on potencia
b1 b2 n {ab n } = a1 , a2 , .

an /bn an /bn an /bn an /bn

a/b 0 .

Si an 0 y bn 0, o bien an , bn , entonces no hay respuesta

1 Sucesiones de n umeros reales


b n Si an a > 0, y bn b, entonces ab n a .

12

Adem as

{an {an {an {an {an {an {an {an {an {an

0, bn b > 0} 0, bn b < 0} a > 1, bn +} a > 1, bn } a < 1, bn +} a < 1, bn } 0, bn +} 0, bn } +, bn +} +, bn }

n ab n n ab n bn an n ab n n ab n bn an n ab n bn an n ab n n ab n

0 + + 0 0 + 0 + + 0.

En los siguientes casos no puede darse una respuesta general. an 0, bn 0, an +, bn 0, an 1, bn +, an 1, bn .

Series num ericas

El concepto de l mite de una sucesi on permite denir una suma de innitos t erminos o serie num erica

ai = a1 + a2 + .
i=1

Sea S1 = a1 S2 = a1 + a2 . . . . . . . . . Sn = a1 + a2 + + an . . . . . . . . . Entonces se dene

ai = lim Sn .
i=1 n

De acuerdo con esta denici on, una serie puede ser convergente, divergente u oscilante, en concordancia con el car acter de la sucesi on de sumas parciales. De las propiedades v alidas para sumas nitas se mantiene la propiedad distributiva: k
i=1

ai =
i=1

kai .

La propiedad asociativa se preserva para series convergentes o divergentes pero no vale en general para series oscilantes. Por ejemplo, la serie 1 1 + 1 1 + es oscilante pues sus sumas parciales son 1, 0, 1, 0, 1, . Pero si asociamos (1 1) + (1 1) + , se convierte en 0 + 0 + 0 + = 0, serie convergente.

2 Series num ericas

14

Serie geom etrica


Sea a = 0, k = 1. La serie

a + ak + ak + ak + = a
i=1

k i1

se llama serie geom etrica de raz on k . La suma parcial en esima es Sn = a + ak + ak 2 + + ak n1 . De aqu kSn = ak + ak 2 + + ak n = Sn+1 a. Por otra parte Sn+1 Sn = ak n . Luego kSn + a Sn = ak n , (k 1)Sn = a(k n 1). Por lo tanto kn 1 1 kn =a . k1 1k a Vemos que, si 0 |k | < 1, Sn converge a 1 . Si k > 1, entonces Sn +. k Si k < 1, entonces Sn . Si k = 1, entonces la serie geom etrica es Sn = a oscilante. En conclusi on, la serie geom etrica de raz on k es convergente cuando y s olo cuando 1 < k < 1.

Criterio de Cauchy para series


Dado que la suma de una serie es el l mite de la sucesi on de sus sumas parciales, el criterio de convergencia de Cauchy para sucesiones es aplicable a las series. Una serie
i=1

ai es convergente si y s olo si dado > 0, arbitrario,


m i=n+1

existe n0 ( ) N tal que para n0 n < m vale |

ai | < .

En particular, si m = n + 1, queda |an+1 | < . Esto dice que si una serie es convergente entonces su t ermino general tiende a 0. Pero !cuidado!, el hecho rec proco no es en general cierto: hay series no convergentes cuyo t ermino general s tiende a cero. El ejemplo t pico es la llamada serie arm onica,

1/i = 1 + 1/2 + 1/3 + .


i=1

2 Series num ericas

15

Convergencia absoluta
Denici on Una serie
i=1 i=1

ai se dice absolutamente convergente si la serie


m i=n+1

|ai | es convergente.
m i=n+1

Dado que |

ai |

|ai |, el criterio de convergencia de Cauchy

arma que una serie absolutamente convergente es convergente. La implicaci on rec proca no es en general cierta: una serie puede ser convergente pero no absolutamente convergente. Por ejemplo, probaremos m as adelante que

(1)i+1 1/i = 1 1/2 + 1/3 1/4 + 1/5


i=1

es convergente, pero

|(1)i+1 1/i| = 1 + 1/2 + 1/3 +


i=1

es divergente.

2.1

Series de t erminos positivos

Si una serie tiene todos sus t erminos positivos (o todos positivos a partir de un t ermino en adelante), entonces la sucesi on de sus sumas parciales es creciente (o creciente a partir de un t ermino en adelante, respectivamente). Si todas estas sumas parciales est an acotadas, entonces la serie ser a convergente. Si las sumas parciales no est an acotadas, entonces la serie ser a divergente a +. Por tanto, una serie de t erminos positivos no puede ser oscilante (Como ai = 1 (ai ), todos los resultados que se obtengan para series de t erminos positivos son tambi en v alidos para series de t erminos negativos). Sean ai , bi , dos series de t erminos positivos, bi convergente. ai es convergente. ai es convergente ai es con(i) Si a partir de un t ermino es ai bi , entonces (Criterio de comparaci on de primera especie). (iii) Si a partir de un t ermino es ai+1 /ai bi+1 /bi , entonces vergente (Criterio de comparaci on de segunda especie). Probemos (iii). Supongamos que la desigualdad vale a partir del t ermino indicado por i0 . Luego ai0 +1 ai0 +2 ai +p bi +1 bi0 +2 b i +p 0 0 0 , ai0 ai0 +1 ai0 +p1 bi0 bi0 +1 bi0 +p1

(ii) Si a partir de un t ermino es ai /bi , entonces

2 Series num ericas donde p N es arbitrario. Sigue que ai0 +p bi +p 0 , ai0 bi0 es decir ai0 +p o bien ai0 bi +p , bi0 0

16

ai ai0 +p 0. bi0 +p bi0


ai0 bi0

Como

es un n umero jo, sigue del criterio de primera especie que

ai

debe ser convergente. Estos criterios de comparaci on permiten decidir cu ando una serie es convergente sabiendo que otra serie de t erminos m as grandes lo es. Asimismo, si una serie de t erminos positivos tiene t erminos m as grandes que los de una serie divergente, entonces aqu ella es tambi en divergente. Las series que se usan para comparar son las series geom etrica y arm onica generalizada. Esta u ltima es

1/i = 1 + 1/2 + 1/3 + ,


i=1

donde > 0. Si 1, entonces la serie arm onica es divergente. Si > 1, entonces es convergente. Aplicando la comparaci on directa con una serie geom etrica de raz on k menor que 1 sigue que si a partir de un cierto t ermino es n an < k,

entonces n=1 an es convergente (Criterio de Cauchy). Si, en cambio, para innitos t erminos an es n an 1, entonces la serie es divergente pues no se cumple la condici on necesaria de convergencia, a saber an 0 cuando n . Si a partir de un t ermino an0 de la serie es an+1 k < 1, an entonces n=1 an es convergente (Criterio de DAlembert). En efecto, escribin+1 an+1 endo an kkn = k , y aplicando el criterio de segunda especie con la serie geom etrica
n=1

k n+1 , convergente, sigue el resultado. Si, en cambio, a partir

2 Series num ericas

17

+1 de cierto t ermino se mantiene an 1, entonces la serie es divergente pues a an partir de alguno de ellos, sus t erminos son crecientes y por lo tanto no puede

cumplirse la condici on necesaria de ser an 0 cuando n . Si a partir de cierto t ermino es n 1 entonces la serie an+1 an M > 1,

an es convergente (Criterio de Raabe). Si, en cambio, a


an+1 ) an

partir de un cierto t ermino es n(1

1, entonces la serie es divergente.

2.2

Estudio de series en general

Las series que no mantienen su signo a partir de ning un t ermino no pueden ser estudiadas por los criterios anteriores. Caso particular de estas series son las llamadas series alternadas. Una serie n N. Una serie alternada es convergente si |an | |an+1 | para todo n N y adem as limn an = 0 (Criterio de Leibnitz). Ejemplo
n+1 1/n n=1 (1)

an se dice alternada cuando sig (an+1 ) = sig (an ) para todo

= 1 1/2 + 1/3 . Puede probarse que esta serie

converge a ln 2. En general, si una serie no conserva el signo de sus t erminos a partir de ning un t ermino, entonces se puede analizar las dos series que se forman con sus t erminos positivos y negativos, respectivamente. Si
i=1

ai es una serie en

tal condici on, llamemos pi a los t erminos de la serie que son positivos, y qi a los t erminos negativos de la serie. Desde un principio supongamos que ai 0 cuando i , ya que si esto no vale la serie no puede ser convergente. Bajo esta suposici on pueden presentarse los siguientes casos: (a) pi y qi ambas convergentes. En este caso ai es absolutamente convergente, y por lo tanto tambi en convergente. Adem as ai = pi + qi , |a i | = pi qi .

2 Series num ericas (b) (c) (d) pi convergente, pi divergente, pi y qi divergente. En este caso tenemos qi convergente. Aqu es ai = +.

18 ai = .

qi ambas divergentes. En este caso

ai se dice condicional-

mente convergente. Reordenando convenientemente sus t erminos es posible obtener una serie convergente a cualquier valor previamente estipulado, divergente u oscilante. Este caso es el de las series convergentes que no son absolutamente convergentes. Por ejemplo, la serie 1 1/2 + 1/3 1/4 + 1/5 .

3
3.1

Funciones reales de variable real


Conjuntos de la recta

Sea A = un conjunto de n umeros reales. A se dice acotado superiormente si existe M IR tal que a M para todo a A. En este caso existe una menor cota superior, llamada extremo superior de A, o supremo de A (sup A). A se dice acotado inferiormente si existe K IR tal que K a para todo a A. La mayor de las cotas inferiores se llama extremo inferior de A o nmo de A (inf A). Un conjunto es acotado cuando lo es superior e inferiormente. En general trabajaremos con determinados conjuntos de la recta, a saber los llamados intervalos. Un intervalo I es un conjunto no vac o de n umeros reales con la siguiente propiedad: cada vez que a I, b I, a < b, entonces c I si a < c < b. Los intervalos acotados son: (a) I = {x IR : a x b}, a b. Intervalo acotado cerrado o intervalo compacto. (b) I = {x IR : a < x < b}, a < b. Intervalo acotado abierto. (c) I = {x IR : a x < b}, a < b. Intervalo acotado semicerrado o semiabierto (cerrado a izquierda, abierto a derecha). (d) I = {x IR : a < x b}, a < b. Intervalo acotado semicerrado o semiabierto (cerrado a derecha, abierto a izquierda). Los intervalos no acotados son: la recta misma, y semirrectas izquierdas o derechas, cerradas o abiertas. Todos estos intervalos se denotan, respectivamente,

3 Funciones reales de variable real [a, b], (a, b), [a, b), (a, b], IR o (, +), (, a], (, a), [a, ), (a, ). Si a IR, un entorno de a es un intervalo abierto de la forma (a , a + ), > 0. Un entorno reducido de a es de la forma (a , a) (a, a + ). Sea A un subconjunto no vac o de IR. a IR se dice punto de acumulaci on de A si todo entorno de a contiene innitos puntos de A.

20

Es obvio que si A es un conjunto de nitos puntos, entonces no existe ning un punto de acumulaci on de A. Por el contrario, si A es un conjunto acotado de innitos elementos, entonces siempre existe al menos un punto de acumulaci on de A. Un conjunto A se dice cerrado si todo punto de acumulaci on de A pertenece al conjunto. De aqu , todo conjunto nito es cerrado. Todo intervalo cerrado es un conjunto cerrado. Un punto a se dice interior a un conjunto A si existe un entorno de a contenido en A. A se dice abierto si todos sus puntos son interiores al conjunto. Todo intervalo abierto es un conjunto abierto. Un conjunto es abierto si y s olo si su complementario es cerrado. IR y son los u nicos subconjuntos de IR cerrados y abiertos simult aneamente.

3.2

Funciones reales de variable real

Sean A y B dos conjuntos no vac os cualesquiera. Se llama funci on de A en B a un mecanismo que asigna a cada elemento de A un elemento en B .

3 Funciones reales de variable real

21

A se llama dominio de la funci on. B se llama codominio o recorrido de la funci on. Se escribe f : A B, o bien A B. Si x A, se denota f (x) al elemento en B que la funci on asigna a x. La imagen de la funci on es el subconjunto del codominio B que consiste de todos los elementos de la forma f (x), con x A. Caso particular es la llamada funci on constante, que asigna a todo elemento x A un elemento jo b B .
f

Una funci on se llama inyectiva si, cada vez que x = y, x, y A, es f (x) = f (y ). Se llama suprayectiva si su imagen coincide con su codominio. Una funci on que al mismo tiempo es inyectiva y suprayectiva se llama biyectiva. Si g : B C es una funci on cuyo dominio contiene a la imagen de f , entonces queda determinada la funci on composici on g f : A C, denida su ley de correspondencia por (g f )(x) = g (f (x)). Cuando el codominio B coincide con el dominio A queda establecida la llamada funci on identidad, caso especial de funci on biyectiva, cuya ley de correspondencia se dene por idA (x) = x para todo x A. Si f : A B es una funci on biyectiva, entonces existe su funci on inversa f 1 : B A, que satisface f f 1 = idB , f 1 f = idA . Hasta aqu hemos visto deniciones v alidas para funciones cuyo dominio y codominio son conjuntos cualesquiera. De aqu en adelante supondremos que

3 Funciones reales de variable real

22

el codominio es IR y el dominio es generalmente un intervalo. Tales funciones reales de variable real permiten una representaci on gr aca de las mismas. Tambi en es a veces posible expresar anal ticamente la ley de correspondencia mediante las operaciones de los n umeros reales. M as a un, de funciones denidas en un mismo dominio pueden obtenerse otras, operando entre ellas. Por ejemplo, la ley de correspondencia puede estar dada por un polinomio Pn (x) = an xn + an1 xn1 + + a1 x + a0 , donde an , an1 , , a0 son n umeros reales jos y x, como es habitual, representa un valor gen erico del dominio de la funci on. O tambi en puede estar dada por un cociente de polinomios Pn (x) , Qn (x) = 0. Q n ( x)

Funci on potencial
Es la denida por f : [0, ) [0, ), f (x) = xp , p > 0, o bien f : (0, ) (0, ), f (x) = xp , p < 0. Como es una funci on biyectiva, tiene funci on inversa, cuya expresi on es x1/p . Luego su inversa es tambi en una funci on potencial.

Funci on exponencial
Es la denida por f : IR (0, ), f (x) = ax , a > 0, a = 1. Como tambi en es biyectiva, existe su funci on inversa, a saber f : (0, ) IR, f (x) = loga x.

3 Funciones reales de variable real

23

Funciones circulares
Consideremos un tri angulo rect angulo de lados a, b, c, donde c es la hipotenusa, que suponemos de longitud 1, y x es el angulo, en radianes, entre los lados a y c. Se dene sen x = b/c, cos x = a/c, tan x = b/a = sen x/ cos x. Denidas en principio en x [0, 2 ], se las extiende a todo x IR por periodicidad. Tenemos que sen (x) = sen x, cos(x) = cos x para todo x IR. Adem as sen2 x + cos2 x = 1. Otras relaciones u tiles son: sen ( + ) = sen cos + sen cos , cos( + ) = cos cos sen sen . Luego sen 2x = 2 sen x cos x, cos 2x = cos2 x sen2 x = 2 cos2 x 1. Las funciones sen x : [/2, /2] [1, 1], cos x : [0, ] [1, 1], tan x : (/2, /2) IR, son biyectivas. Sus funciones inversas son, respectivamente arcsen x : [1, 1] [/2, /2], arccos x : [1, 1] [0, ], arctan x : IR (/2, /2).

3 Funciones reales de variable real

24

Funciones hiperb olicas


Las funciones seno hiperb olico y coseno hiperb olico se denen como sh x : IR IR, sh x = [ex ex ]/2, ch x : IR [1, ), ch x = [ex + ex ]/2. La tangente hiperb olica se dene como tgh x : IR (1, 1), tgh x = sh x/ch x. Tenemos que ch x + sh x = ex , ch x sh x = ex , ch 2 x sh 2 x = 1. Como la funci on seno hiperb olico es biyectiva, existe su funci on inversa. Obtengamos su expresi on. Llamemos y = sh x. Como ch 2 x = sh 2 x + 1 = y 2 + 1, y ch x es siempre positivo, sigue que ch x = + y 2 + 1. Luego y + y 2 + 1 = ex . y 2 + 1).

Tomando en esta igualdad logaritmo neperiano, resulta x = ln(y + As , sh 1 x = ln(x + x2 + 1).

An alogamente se puede obtener la funci on inversa de ch x : [0, ) [1, ).

3.3

L mite de una funci on

Sea f : A IR una funci on real de variable real y supongamos que el conjunto A tiene un punto de acumulaci on a. Vamos a denir el l mite de la funci on f en el punto a. Se escribe l = lim f (x), o bien f (x) l cuando x a.
xa

Por ser a punto de acumulaci on de A siempre existen sucesiones acotadas {xn }, xn A \ {a}, xn a. Denici on l = limxa f (x) si para toda sucesi on xn a, xn A \ {a}, vale que f (xn ) l para n .

3 Funciones reales de variable real

25

Hay que destacar que aqu l puede tomar un valor nito o innito. Observar que esta denici on se basa en la de l mite de sucesiones num ericas y por lo tanto todo lo que vale para estas vale tambi en para el l mite funcional. Por ejemplo, sabemos que el l mite de una suma de dos sucesiones num ericas es la suma de los l mites de cada una de ellas, cuando estos existen con valor nito. Consideremos ahora dos funciones, f : A IR, g : A IR. Luego existe la funci on suma f + g : A IR, denida como (f + g )(x) = f (x) + g (x). Supongamos que f (x) l1 , g (x) l2 , cuando x a. Entonces (f + g )(x) l1 + l2 cuando x a. En efecto, consideremos una sucesi on {xn }, xn A \ {a} para todo n IN, xn a. Como f (x) l1 cuando x a, sigue que f (xn ) l1 , y an alogamente g (xn ) l2 . Por lo tanto (f + g )(xn ) l1 + l2 . Como {xn } es cualquier sucesi on con los requisitos expuestos, queda probada la armaci on mencionada. De la misma manera se puede probar que (f g )(x) l1 l2 , si se dene la funci on producto f g : A IR, (f g )(x) = f (x)g (x). En general, todos los resultados que valen para operaciones con sucesiones valen an alogamente para operaciones con funciones: suma, producto, cociente, potencia, logaritmos. Del mismo modo siguen existiendo las mismas indeterminaciones, a saber: Para la suma: . Para el producto: 0 . Para el cociente: 0/0, /. Para la potencia: 00 , 0 , 1 . Queda claro entonces que todas las reglas que valen para operaciones con sucesiones siguen valiendo para operaciones con funciones. Por ejemplo: Si f (x) 0 para x a y g (x) se conserva acotada en un entorno de a, entonces f (x)g (x) 0 para x a.

3 Funciones reales de variable real

26

Tener presente que l = lim f (x) para x a si para toda sucesi on xn a, xn A \ {a}, vale que f (xn ) l. No basta que para alguna sucesi on {xn } valga lo anterior. Consideremos el siguiente ejemplo. f : (0, ) [1, 1], f (x) = sen (/x) La expresi on /x establece una biyecci on entre el intervalo abierto (0,1) y la semirrecta abierta (, ). Quiere decir que el comportamiento de la expresi on sen (/x) en (0,1) debe ser como el comportamiento de la expresi on sen x en (, ). Por ejemplo, sen x oscila innitas veces en (, ), toma innitas veces el valor 1, el 0, el 1, y en general cualquier valor comprendido entre 1 y 1. Luego tambi en debe ocurrir lo mismo con sen (/x) en el intervalo (0,1). All tambi en debe oscilar innitas veces entre 1 y 1. El cero es punto de acumulaci on del intervalo (0, ), y luego en principio podemos considerar el l mite de sen (/x) para x 0. Como estamos considerando esta expresi on en (0, ), x 0 con valores positivos de x. Esto se indica x 0+ (se lee x tiende a 0 por la derecha). Pero existe el l mite? Como lo sugiere la discusi on anterior, no existe el l mite de esta funci on para x 0. En efecto, consideremos la sucesi on {1/n}, 1/n 0+ , 1/n (0, ) para todo n N. Evaluando la funci on en estos valores obtenemos sen (/(1/n)) = sen n = 0 para todo n, y luego sen (n ) 0. Si 0 fuera el l mite de la funci on, entonces deber a ocurrir que f (xn ) 0 para toda sucesi on xn 0+ . Sin embargo, elijamos xn = 2/(4n + 1), que tambi en tiende a 0 y pertenece al dominio de la funci on. Ahora sen (/xn ) = sen ([4n + 1]/2) = 1 para todo n N, y esta sucesi on tiende a 1. Esta diferencia en los l mites de dos sucesiones distintas implica ya que no existe el l mite de esta funci on en 0. As como para 0 y 1, tambi en podemos probar que dado cualquier c [1, 1] podemos conseguir una sucesi on zn , que depende de c, zn > 0, zn 0+ , tal que sen(/zn ) c. Lo que sucede con esta funci on conduce a denir el llamado l mite de oscilaci on de una funci on en un punto a, y que es el concepto an alogo al de l mite de oscilaci on de una sucesi on num erica.

3 Funciones reales de variable real Denici on

27

l se dice l mite de oscilaci on de f en a si existe alguna sucesi on {zn }, zn a, zn = a, y zn en el dominio de la funci on para todo n, tal que f (zn ) l. En el ejemplo anterior vemos que todo l [1, 1] es l mite de oscilaci on de la funci on en el origen. Cuando la funci on est a acotada en un entorno de a entonces siempre existen el l mite superior e inferior de oscilaci on, que se simbolizan lim sup f (x), lim inf f (x), para x a, o bien limf (x), limf (x), para x a, respectivamente. Si f no est a acotada superiormente en ning un entorno de a, entonces lim sup f (x) = + para x a. Si f no est a acotada inferiormente en ning un entorno de a, entonces lim inf f (x) = para x a. Ahora llamemos h : (0, ) (0, ), h(x) x, g : (0, ) [1, 1], g (x) = sen (/x). Consideremos la funci on producto hg : (0, ) IR, (hg )(x) = x sen (/x). Calculemos lim(hg )(x) para x 0+ . Como h(x) 0 para x 0 (probarlo) y g (x) est a acotada en todo su dominio (aunque bastar a que lo estuviera en alg un entorno de 0), sigue por la regla ya conocida que x sen (/x) 0 para x 0+ . En este caso las innitas oscilaciones de sen (/x) en el intervalo (0,1) no afectan a la existencia del l mite. Este hecho se observa en su gr aca:

3 Funciones reales de variable real


x sen (/x)
0.3 0.2 0.1 0 -0.1 -0.2 -0.3 0.05 0.1 0.15 0.2 0.25 0.3

28

Hay una denici on equivalente de l mite nito de una funci on f en un punto a, punto de acumulaci on de su dominio. Es la siguiente: Un n umero l se dice l mite de la funci on f en a si dado > 0,

arbitrario, existe > 0, que depende de , tal que para aquellos x que est an en el dominio de f y adem as satisfacen 0 < |x a| < , vale que |f (x) l| < . Para l mites innitos est an las siguientes deniciones: lim f (x) = + para x a si dado K > 0, arbitrario, existe > 0, que depende de K , tal que para aquellos x que est an en el dominio de f y adem as satisfacen 0 < |x a| < , vale que f (x) > K . lim f (x) = para x a si dado K > 0, arbitrario, existe > 0, que depende de K , tal que para aquellos x que est an en el dominio de f y adem as satisfacen 0 < |x a| < , vale que f (x) < K . lim f (x) = para x a si dado K > 0, arbitrario, existe > 0, que depende de K , tal que para aquellos x que est an en el dominio de f y adem as satisfacen 0 < |x a| < , vale que |f (x)| > K . Ejemplos 1) f : (0, ) (0, ), f (x) = 1/x, lim f (x) = + para x 0. 2) h : (, 0) (, 0), h(x) = 1/x, lim h(x) = para x 0. 3) g : IR \ {0} IR \ {0}, g (x) = 1/x, lim g (x) = para x 0.

3 Funciones reales de variable real

29

Observar que los tres l mites anteriores se obtienen inmediatamente si se aplica la denici on por sucesiones dada en primer lugar. Por ejemplo, 1/x + para x 0+ pues para cualquier sucesi on xn 0+ vale que 1/xn +. Las deniciones vistas hasta ahora son v alidas para x a, a valor nito. Tambi en se puede denir el l mite de una funci on para x +, x , o bien x , cuando existen sucesiones {xn }, con xn en el dominio de la funci on para todo n y tales que xn +, xn , xn , respectivamente. La denici on por sucesiones es an aloga al caso a nito. f (x) l para x + si para toda sucesi on {xn }, xn perteneciente al dominio de la funci on para todo n, xn +, vale que f (xn ) l. De forma similar se denen los otros dos casos. Y tambi en el caso de l mite innito para x . Con la otra denici on hay que distinguir los casos de l mite nito e innito. Para l mite nito tenemos que: f (x) l para x + si dado f (x) l para x si dado > 0, arbitrario, existe M > 0, > 0, arbitrario, existe M > 0,

que depende de , tal que si x > M vale que |f (x) l| < . que depende de , tal que si x < M vale que |f (x) l| < . f (x) l para x si dado > 0, arbitrario, existe M > 0, que depende de , tal que si |x| > M vale que |f (x) l| < . Para el caso de l mite innito es: f (x) + para x + si dado K > 0, arbitrario, existe M > 0, que depende de K , tal que si x > M vale que f (x) > K . Los otros casos se denen an alogamente. Estos son f (x) para x y adem as todos los que resultan de poner un signo + o un signo en uno u otro lado.

3 Funciones reales de variable real

30

La denici on por l mite de sucesiones es preferible a la otra del y , sobre todo a la hora del c alculo efectivo de un l mite. Sea el siguiente ejemplo: lim f (x) para x 2, donde f : (0, ) (0, ), f (x) = x2 . Por la denici on por sucesiones debemos considerar cualquier sucesi on {xn }, 2 = xn > 0, xn 2, y ver si la sucesi on num erica f (xn ) tiende a alg un valor l que sea independiente de la sucesi on as elegida. Ahora bien, en nuestro ejemplo f (xn ) = x2 n. Pero sabemos por resultados conocidos de sucesiones num ericas que si xn 2 entonces x2 mite de x2 n 4. Como este 4 es siempre el l n , con tal que xn 2, sigue que el l mite de esta funci on para x 2 es 4. Con la otra denici on debemos jar un > 0, arbitrario, y en funci on de este encontrar > 0 tal que para aquellos x que veriquen 0 < |x 2| < , valga que |x2 4| < . Observar en este punto que ya de entrada esta denici on tiene un inconveniente. El valor del l mite, 4 en este caso, no es consecuencia de ning un c alculo, sino que su valor debe ser propuesto para despu es vericar que se trata efectivamente del l mite. Prosigamos. Tenemos que |x2 4| = |x 2||x + 2|. Andamos con suerte puesto que vemos que la expresi on que debemos hacer menor que un prejado depende de |x 2|, sobre el que tenemos libertad para achicarlo tanto como se quiera mediante la elecci on de . Luego |x2 4| = |x 2||x + 2| < |x + 2|. Representa el factor |x + 2| un obst aculo? No, ya que tenemos libertad para elegir . Luego podemos desde ya jar 1, con lo cual |x + 2| < 5. Por lo tanto |x2 4| < 5 y si por otro lado /5 queda |x2 4| < , que era lo buscado. Resumiendo, tenemos que si min{1, /5}, es decir 1 y adem as /5, vale que |x2 4| = |x 2||x + 2| < |x + 2| < 5 , o sea |x2 4| < .

3 Funciones reales de variable real

31

3.4

Comparaci on de variables

De dos n umeros reales jos, digamos x e y , podemos decir si x > y, x = y o x < y . Armaciones del tipo x es mucho m as grande que y , x es muy peque no, etc., no tienen en realidad ning un sentido riguroso. En cambio, si se trata de cantidades variables las armaciones anteriores adquieren un sentido, ya sean variables discretas, es decir que recorren un conjunto de n umeros a saltos, como por ejemplo el conjunto de n umeros naturales, o bien variables continuas, que recorren un conjunto de valores sin saltos, como por ejemplo un intervalo que no se reduzca a un punto. S tiene sentido decir 1/n, para n N, se hace arbitrariamente peque no porque ahora 1/n no representa a una cantidad ja, sino a un conjunto de innitos n umeros. Como sabemos, la armaci on anterior se corresponde con el hecho de que 1/n 0 cuando n . Es muy u til saber comparar variables. Consideremos un ejemplo de series. Sabemos que la serie arm onica 1/n es divergente a +. C omo ser a la serie 1/[n + 10]? Comparemos t ermino a t ermino. Tenemos que 1/[n + 10] < 1/n para todo n N. Luego tenemos que todas las sumas parciales de la segunda serie son menores que las correspondientes sumas parciales de la primera. Pero como la serie mayorante es divergente, no podemos armar nada sobre la serie de t erminos menores. Sabemos que el car acter de una serie depende del comportamiento de sus ultimos t erminos, es decir, a partir de uno cualquiera de ellos. Luego comparemos los t erminos correspondientes de ambas series para n grande, o sea para n . Tenemos que lim n 1/[n + 10] = lim = 1. 1/n n + 10

Como n/[n + 10] < 1, la aproximaci on de esa fracci on a 1 es por la izquierda. El valor del cociente supera a cualquier n umero menor que 1 para n sucientemente grande. Por ejemplo, si jamos 1/2 < 1, tenemos que n/[n + 10] > 1/2 a partir de alg un valor de n. En este caso vemos que a partir de n = 11 se a minorada por cumple esa desigualdad. Luego n=11 1/[n + 10] est 1 1 = 1/2 = +, 2n n n=11 n=11

3 Funciones reales de variable real y por lo tanto la serie

32

n=1

1 = n + 10

10

n=1

1 1 + n + 10 n=11 n + 10

es divergente a +. La causa que ha motivado que la serie de t erminos menores sea tambi en divergente se expresa as : La cantidad variable 1/[n + 10] es del mismo orden que la cantidad variable 1/n para n . Podemos denir en general para variables que dependen de n, (n), (n), lo siguiente: (n) y (n) son del mismo orden para n si para todo n mayor que un n umero jo vale que K1 < (n) < K2 , (n)

donde K1 y K2 son dos constantes jas, K1 > 0. Si en particular

(n) = , = 0, = , n (n) lim

entonces (n) y (n) son cantidades del mismo orden. Si = 1, (n) y (n) se dicen equivalentes. Si (n) =0 n (n) lim

entonces (n) se dice de orden inferior a (n). Por ejemplo, ln n es de orden n inferior a np para todo p > 0 pues limn ln = 0. Quiere decir que si bien np ln n para n , su convergencia a es m as lenta que la de np . Podemos extender esta denici on de orden a cantidades que dependen de una variable continua x, para x tendiendo a un valor jo nito o innito. Concretamente, a funciones f (x), g (x): f (x) y g (x) se dicen del mismo orden para x a, a nito, si en alg un entorno reducido de a se verica K1 < f (x) < K2 , K1 > 0. g (x)

3 Funciones reales de variable real Si limxa


f (x) g (x)

33

= b > 0, entonces f (x) y g (x) son del mismo orden para x a.

f (x) y g (x) son del mismo orden para x + si para todo x mayor que un valor jo es K1 < f (x) < K2 , K1 > 0. g (x)

Como ejemplo comparemos sen x y x para x 0. El l mite del cociente sen x/x es en principio indeterminado, del tipo 0/0. Vamos a resolver la indeterminaci on probando que lim sen x/x = 1. Consideremos el cuarto de circunferencia de radio 1, localizada en el primer cuadrante.

N Q

x O P M

Tenemos que sen x es la longitud del segmento P Q, tan x es la longitud del segmento M N y x es la longitud del arco QM , que es mayor que la longitud del segmento QP . Luego sigue que sen x < x < tan x. Por consiguiente 1 < x/sen x < 1/ cos x, 1 > sen x/x > cos x, 0 < 1 sen x/x < 1 cos x.

3 Funciones reales de variable real

34

Si aceptamos que 1 cos x 0 cuando x 0+ sigue que tambi en 1 sen x/x + tiende a 0 y por lo tanto sen x/x 1 cuando x 0 . Si no sabemos cu al es el l mite de 1 cos x, ponemos 1 cos x = 2sen2 (x/2) y usando otra vez la primera relaci on de desigualdades sigue que 2sen2 (x/2) < x2 /2 y obtenemos 0 < 1 sen x/x < x2 /2, y ahora est a claro que 1 sen x/x queda comprendido entre dos funciones que tienden a 0 cuando x 0+ . Dado que sen x/x es una expresi on par se obtiene que
x0

lim sen x/x = 1.

De esta manera, sen x y x son cantidades equivalentes para x 0.

Funciones continuas

Sea f : A R una funci on y sea c A. f se dice continua en c si cada vez que lim xn = c, xn A, es lim f (xn ) = f (c) para n . Si limxc+ f (x) = f (c), entonces f se dice continua por la derecha en c. Si limxc f (x) = f (c), entonces f se dice continua por la izquierda en c. Una funci on se dice continua en un subconjunto de su dominio si es continua en todos los puntos de ese subconjunto. Cuando una funci on no es continua en c, entonces se dice discontinua en c. Los distintos casos de discontinuidad en c son los siguientes: (a) Discontinuidad evitable Existe limxc f (x), es nito, pero no coincide con f (c). Ejemplo (Todos los ejemplos son en c = 0) f : R R, f (x) = sig2 (x). (b) Discontinuidad de tipo innito Existe limxc f (x), pero con valor innito, con el mismo signo. Ejemplo f : R R, f (x) = 1/x2 0 si x = 0 si x = 0.

(c) Discontinuidad de salto nito Existen los dos l mites laterales, nitos, pero son distintos. Ejemplo f : R R, f (x) = 0
1+e1/x 1e1/x

si x = 0 si x = 0.

(d) Discontinuidad de salto innito Existen los dos l mites laterales, uno de ellos nito y el otro innito, o bien los dos innitos con distinto signo.

4 Funciones continuas Ejemplos f : R R, f (x) = f : R R, f (x) = e1/x 0 1/x 0 si x = 0 si x = 0. si x = 0 si x = 0.

36

(e) Discontinuidad de segunda especie No existe al menos uno de los dos l mites laterales. Ejemplo f : R R, f (x) = sen (1/x) 0 si x = 0 si x = 0.

Si f y g son funciones denidas en A, continuas en c A, entonces f + g es continua en c, f g es continua en c, f /g es continua en c si g (c) = 0. La composici on f g es continua en c si f es continua en g (c) y g es continua en c (no es necesario que f sea continua en c). Todas estas armaciones son consecuencia inmediata de la denici on de continuidad y de la denici on de l mite de sucesiones. Por ejemplo, probemos la u ltima de ellas. Sea xn c para n . Como g es continua en c sigue que g (xn ) g (c), y como f es continua en g (c) sigue que f (g (xn )) f (g (c)). Esto es, (f g )(xn ) (f g )(c) para n . Las siguientes funciones son continuas en todo su campo de denici on: Polinomios, funciones racionales, potencias, exponenciales y sus inversas (funciones logar tmicas), funciones circulares y sus inversas, cuando estas existen, funciones hiperb olicas y sus inversas, la funci on valor absoluto f (x) = |x|. La funci on sig (x) es continua en todo x = 0, donde tiene una discontinuidad de salto nito.

Continuidad en un intervalo cerrado y acotado


Sea f : A R, donde f es continua en A, intervalo cerrado y acotado (intervalo compacto). Veremos algunas propiedades de una tal funci on.

4 Funciones continuas Denici on c A se dice un cero de f si f (c) = 0.

37

Teorema de Bolzano Si a, b A, a < b, y f (a)f (b) < 0, entonces existe un cero de f entre a y b. Demostraci on: Supongamos que f (a) < 0 y f (b) > 0. El caso opuesto se prueba an alogamente. Consideremos el conjunto B = {x A : f (x) < 0}. B = porque a B . Sea c = sup B , es decir c es la menor de las cotas superiores de B . Veamos que f (c) = 0. En efecto, f (c) no puede ser positivo porque si as fuera existir a un entorno de c donde f es positiva en todos los puntos de ese entorno y por lo tanto c no ser a el supremo de B . Aqu estamos usando la continuidad de f . An alogamente se muestra que f (c) no puede ser negativo. El Teorema de Bolzano tiene la utilidad pr actica de permitir calcular (aproximadamente) ceros de funciones continuas. Consideremos una funci on continua f tal que, por ejemplo, f (a) < 0, f (b) > 0. Sea x1 el punto medio entre a y b, es decir x1 = [a + b]/2. Si f (x1 ) = 0 entonces ya hemos calculado (exactamente) un cero de f . Si, por ejemplo, f (x1 ) > 0, entonces consideremos el intervalo [a, x1 ] y su punto medio x2 = [a + x1 ]/2. (Si f (x1 ) < 0 entonces hubi eramos considerado el intervalo [x1 , b]). Como f (a) < 0 y f (x1 ) > 0, por el Teorema de Bolzano debe existir un cero de f entre a y x1 . Si f (x2 ) = 0 ya lo hemos calculado exactamente. Si, por ejemplo, f (x2 ) < 0, entonces consideramos ahora el intervalo [x2 , x1 ], donde f tiene distinto signo en sus extremos. Se calcula su punto medio y se contin ua este procedimiento de la misma forma. La longitud del intervalo inicial es b a, la del segundo es [b a]/2, la del tercero [b a]/4, , la del en esimo intervalo es [b a]/2n1 , expresi on que tiende a cero cuando n . Como dentro de estos intervalos debe haber un cero de f , podemos as calcular este cero con un error peque no. Como consecuencia del Teorema de Bolzano sigue que si una funci on es continua en [a, b] entonces toma cualquier valor comprendido entre f (a) y f (b). En efecto, supongamos que f (a) < f (b) y sea tal que f (a) < < f (b). Consideremos la funci on continua f (x) = g (x). Luego g (a) < 0 y g (b) > 0. Por lo tanto, por el Teorema de Bolzano sigue que existe c, a < c < b, tal que g (c) = 0, o sea f (c) = .

4 Funciones continuas

38

Llamemos C a la imagen de la funci on continua f : [a, b] R, es decir C = {f (x) : x [a, b]}. Supongamos que f (a) < f (b). El resultado anterior se expresa tambi en as : [f (a), f (b)] C . M as a un, podemos decir que el conjunto imagen C es tambi en un intervalo cerrado y acotado. Que es un intervalo sigue como consecuencia del resultado anterior: Cada vez que en C hay dos puntos distintos tambi en est an en C todos los puntos intermedios. Veamos que C es cerrado. Recordemos que un conjunto cerrado es aqu el que contiene a sus puntos de acumulaci on. Sea y un punto de acumulaci on de C . Signica que existe una sucesi on de puntos yn C que converge a y . Por estar yn en C es de la forma yn = f (xn ) para xn [a, b]. Veamos que la sucesi on {xn } tiene una subsucesi on convergente. Si los valores num ericos de xn son en n umero nito esto es evidente. Si el conjunto de valores num ericos xn es innito entonces, como est a acotado, tiene un punto de acumulaci on, digamos c. De aqu existe una subsucesi on xni , xni c. Como [a, b] es cerrado, c [a, b]. Como f es continua, f (xni ) f (c), pero f (xni ) es subsucesi on de f (xn ) y sabemos que toda subsucesi on de una sucesi on convergente es convergente al mismo l mite. Por lo tanto f (xni ) y y de aqu y = f (c), es decir y C . La prueba de que C es acotado se hace con argumentos similares. Supongamos que C no es acotado superiormente. Luego existe una sucesi on {yn }, yn en C, yn +. Sea xn [a, b] tal que f (xn ) = yn . Como se prob o anteriormente, {xn } tiene una subsucesi on convergente, xni c [a, b]. Pero f (xni ) = yni +, por lo que f no ser a continua en c, contradicci on que proviene de suponer que C no es acotado. En ambas partes de la demostraci on se ha usado el siguiente hecho: Si {xn } es una sucesi on acotada entonces tiene una subsucesi on convergente. Este hecho es equivalente al siguiente principio: Un conjunto acotado de innitos puntos tiene al menos un punto de acumulaci on. Como la imagen de una funci on continua con dominio en un intervalo cerrado y acotado es tambi en un intervalo cerrado y acotado tenemos que habr a

4 Funciones continuas

39

un valor m aximo y un valor m nimo de la funci on. Los correspondientes puntos del dominio donde se toman el valor m aximo y m nimo de la funci on se llaman, respectivamente, m aximos absolutos y m nimos absolutos de la funci on. Hemos probado as el llamado Teorema de Bolzano Weierstrass Toda funci on continua con dominio en un intervalo cerrado y acotado tiene m aximo y m nimo absolutos, es decir puntos del dominio donde se toma, respectivamente, el valor m aximo y el valor m nimo de la funci on. Denici on Una funci on f se dice uniformemente continua en un intervalo A si dado > 0, arbitrario, existe > 0, que depende de , tal que, si |x1 x2 | < , x1 , x2 A, vale que |f (x1 ) f (x2 )| < . Si f es uniformemente continua en A entonces es continua en A, es decir en cada punto de A. El hecho rec proco no es cierto en general: Una funci on puede ser continua en A y no ser uniformemente continua en A. No obstante, si A es un intervalo cerrado y acotado s vale esta armaci on. Es el llamado Teorema de Heine Cantor Si f es continua en un intervalo cerrado y acotado A, entonces es uniformemente continua en A. La demostraci on de este Teorema se basa tambi en en el principio de que toda sucesi on acotada tiene una subsucesi on convergente. Los siguientes ejemplos muestran que los Teoremas de Bolzano Weierstrass y de Heine Cantor no valen si f no es continua o si su dominio no es cerrado y acotado. Ejemplos 1) f : [1, 1] R, f (x) = 1/x2 0 si x = 0 si x = 0.

El dominio es un intervalo cerrado y acotado pero f no es continua. No valen ninguno de los dos Teoremas. 2) f : (0, 1] R, f (x) = 1/x. La funci on f es continua pero su dominio es un intervalo no cerrado. No valen ninguno de los dos Teoremas.

Derivada y sus aplicaciones

Sea f una funci on denida en un intervalo A y sea a un punto interior a A. Se dene la derivada de f en c, que se simboliza f (c), al siguiente l mite, cuando este existe: f (c + h) f (c) lim . h0 h La expresi on sobre la que se toma l mite se llama cociente incremental de f en c y es una funci on de h. Como c es un punto interior a A, el cociente incremental est a denido en un entorno reducido de 0, es decir es una funci on de h denida en un entorno reducido de 0 y por lo tanto se puede en principio tomar l mite para h 0. Ejemplos 1) f : A R, f funci on constante, o sea f (x) = M para todo x A. f (c + h) f (c) M M = =0 h h y por lo tanto f (c) = 0. 2) f : A R, f (x) = x. Es f (c + h) f (c) c+hc = =1 h h y por consiguiente f (c) = 1. 3) f : A R, f (x) = x2 . Es f (c + h) f (c) (c + h)2 c2 2ch + h2 = = = 2c + h. h h h Luego f (c) = limh0 (2c + h) = 2c. 4) f : A R, f (x) = ln x. Es f (c + h) f (c) ln(c + h) ln c c+h = = (1/h) ln = ln(1 + h/c)1/h . h h c Cuando h 0, 1/h y 1 + h/c 1. Luego (1 + h/c)1/h e1/c . De aqu sigue que ln(1 + h/c)1/h 1/c y luego f (c) = 1/c. Es

5 Derivada y sus aplicaciones

41

Interpretaci on geom etrica de la derivada


Si f (c) existe entonces tambi en existe la recta tangente a la gr aca de la funci on en c, y f (c) es la pendiente de esa recta tangente. Si existe f (c + h) f (c) lim+ h0 h entonces este l mite se llama derivada lateral por derecha en c y se denota f (c+ ). An alogamente se dene f (c ) = lim
h0

f (c + h) f (c) . h

Si existen ambas derivadas laterales y sus valores coinciden, entonces existe la derivada en el punto. En este caso f se dice derivable en el punto. Puede ocurrir que ambas derivadas laterales existan, con valores distintos. Por ejemplo, f : (1, 1) R, f (x) = |x|. Es f (0 + h) f (0) |h | = lim+ = 1, h0 h0 h h |h| f (0 + h) f (0) = lim = 1. lim h0 h0 h h lim+ f (c + h) f (c) f (c + h) f (c) = lim = +, h0 h h

Puede darse que lim+

h0

o bien que ambos l mites sean . En este caso la funci on f no es derivable en c aunque existe la recta tangente en c, que es una recta vertical. Por ejemplo, f : R R, f (x) = x1/3 . Es lim+ h1/3 f (0 + h) f (0) = lim+ = lim+ h2/3 = + h0 h0 h h

h0

y h1/3 f (0 + h) f (0) = lim = lim h2/3 = +. h0 h h0 h0 h Si ambas derivadas laterales dan , con distinto signo en c, entonces c recibe lim el nombre de punto cuspidal.

5 Derivada y sus aplicaciones Ejemplo f : R R, f (x) = x2/3 . Es lim+ h2/3 f (0 + h) f (0) = lim+ = lim+ h1/3 = +, h0 h0 h h f (0 + h) f (0) h2/3 = lim = lim h1/3 = . h0 h h0 h

42

h0

h0

lim

Si las dos derivadas laterales existen con valor nito en c (no necesariamente iguales) entonces la funci on es continua en c. En efecto, limh0+ [f (c + h) f (c)] =
h0

lim+

f (c + h) f (c) f (c + h) f (c) h = lim+ lim h = 0. h0 h0+ h h

Vale lo an alogo para limh0 [f (c + h) f (c)]. Luego


h0

lim [f (c + h) f (c)] = 0,

es decir
h0

lim f (c + h) = f (c).

Si ponemos x = c + h, esto se escribe limxc f (x) = f (c), que es la continuidad de f en c. Observar que en realidad para obtener la continuidad de f en c bastar a con que el cociente incremental estuviera acotado en un entorno reducido de cero. De esta manera la derivabilidad en un punto implica la continuidad en ese punto. El hecho rec proco no es cierto en general. Existen ejemplos de funciones continuas que no son derivables en ning un punto de su dominio. Si f es una funci on derivable en todo punto interior a A entonces podemos considerar la funci on derivada f : A R, que asigna a cada x A el valor de la derivada de f en x, f (x). Ejemplos (1) f : R R, f (x) = x2 . Funci on derivada: f (x) = 2x. (2) f : (0, ) R, f (x) = ln x. Funci on derivada: f (x) = 1/x.

5 Derivada y sus aplicaciones

43

Con el valor de la derivada de una funci on en un punto podemos construir la recta tangente a la curva gr aca de la funci on en ese punto. Ejemplo Determinar la recta tangente a la curva gr aca de la expresi on f (x) = x2 en el punto x = 1. Tenemos que f (1) = 12 = 1, f (1) = 2(1) = 2. Luego la recta tangente es la que pasa por el punto del plano (1,1) y tiene pendiente 2. La ecuaci on de esta recta es y 1 = 2(x 1), o bien y = 2x 1. La llamada recta normal es en general aqu ella que pasa por el punto considerado y es perpendicular a la recta tangente. Luego su pendiente es el opuesto del inverso de la pendiente de la recta tangente. En el ejemplo anterior esta recta es (y 1) = 1/2(x 1), o bien y = 1/2x + 3/2.
2 1.75 1.5 1.25 1 0.75 0.5 0.25 0.5 1 1.5 2

Recta tangente y recta normal (en trazo discontinuo)

Sea f : A R, f derivable en todo punto interior a A. Sea a un n umero jo y consideremos la funci on af : A R, (af )(x) = af (x). Derivemos por denici on esta funci on en un punto c del interior de A. Es f (c + h) f (c) af (c + h) af (c) = a lim = af (c). h0 h0 h h lim Sigue que (af ) (x) = af (x) para todo x A.

5 Derivada y sus aplicaciones

44

Sea g : A R, tambi en derivable en todo punto interior a A. Calculemos la derivada de la funci on suma f + g : A R, (f + g )(x) = f (x) + g (x). Es f (c + h) + g (c + h) f (c) g (c) = h0 h f (c + h) f (c) g (c + h) g (c) = lim + h0 h h lim f (c + h) f (c) g (c + h) g (c) + lim = h0 h0 h h f (c) + g (c). lim Luego (f + g ) (x) = f (x) + g (x) para todo x perteneciente al interior de A. En resumen, la derivada de una constante por una funci on es igual a la constante por la derivada de la funci on. La derivada de una suma es la suma de las derivadas. Esta propiedad de la derivada se expresa as : La aplicaci on que asigna a una funci on su funci on derivada es lineal. M as a un, la derivada de una combinaci on lineal de funciones es la combinaci on lineal de las funciones derivadas: (a1 f1 + a2 f2 + + an fn ) = a1 f1 + a2 f2 + + an fn , donde a1 , a2 , , an , son constantes jas, y f1 , f2 , , fn , son funciones derivables denidas en un mismo dominio. Ahora vamos a calcular la derivada de una composici on de funciones, (f g ) (x), donde g : A R, f : B R. Suponemos que la composici on est a bien denida, esto es g (A) B . Tenemos que f (g (c + h)) f (g (c)) f (g (c + h)) f (g (c)) g (c + h) g (c) = lim . h0 h0 h g (c + h) g (c) h lim

5 Derivada y sus aplicaciones

45

Como f es derivable en g (c) y (h) := g (c + h) g (c) 0 cuando h 0, sigue que f (g (c) + (h)) f (g (c)) lim = f (g (c)). h0 (h) Por otra parte g (c + h) g (c) = g (c). h0 h Finalmente, como el l mite de un producto es el producto de los l mites, se obtiene que lim (f g ) (c) = f (g (c))g (c). Observar que al dividir y multiplicar por g (c + h) g (c) en la expresi on inicial debe suponerse que (h) = g (c + h) g (c) = 0 para h peque no, h = 0. Empero, el resultado nal es v alido tambi en en el caso (h) = 0. En efecto, si hay una sucesi on hn 0 para la cual (hn ) = 0, entonces, como g es derivable en c, debe ser g (c) = 0. A continuaci on vamos a usar este u ltimo resultado, junto con la expresi on conocida de la derivada del logaritmo neperiano, para obtener derivadas de otras funciones, as como la derivada del producto y cociente de dos funciones. Comencemos por calcular la derivada del producto de dos funciones derivables, f y g . Consideremos la composici on ln(f g )(x). De acuerdo con la regla de la derivada de una composici on de funciones tenemos que [ln(f g )(x)] = Por otra parte ln(f g )(x) = ln f (x) + ln g (x) y luego [ln(f g )(x)] = [ln f (x)] + [ln g (x)] = Igualando ambos resultados se obtiene (f g ) (x) = f (x)g (x) + f (x)g (x). La derivada de un cociente se trata de forma an aloga. Por un lado tenemos que g (x) f (x) [ln(f (x)/g (x)] = . f (x) g (x) 1 1 f (x) + g (x). f (x) g (x) 1 (f g ) (x). (f g )(x)

5 Derivada y sus aplicaciones Por otro lado [ln(f (x)/g (x))] = [ln f (x) ln g (x)] = [ln f (x)] [ln g (x)] = Igualando ambos resultados se obtiene f (x) g (x) = f ( x) f (x) f (x)g (x) f (x)g (x) 2 g (x) = . g (x) g (x) g 2 (x) f (x) g (x) . f (x) g (x)

46

Derivadas de las funciones potencial y exponencial


Consideremos la funci on fp : (0, ) (0, ), fp (x) = xp , p R. Tomando logaritmo neperiano queda ln fp (x) = p ln x, y derivando, fp (x)/fp (x) = p/x. Por lo tanto fp (x) = pfp (x)/x = pxp1 . Observar que para p 1 la funci on potencial se puede denir en x = 0, fp (0) = 0. Derivando directamente en el punto x = 0 se obtiene que la f ormula anterior es v alida tambi en en este punto: f1 (0) = 1, fp (0) = 0 si p > 1. Sea ahora la funci on f : R (0, ), f (x) = ax , a > 0. Tenemos que ln f (x) = x ln a, y luego f (x)/f (x) = ln a, f (x) = ln af (x) = (ln a)ax . En particular, si a = e queda (ex ) = ex .

Derivada de las funciones circulares


La derivada de la funci on f : R [1, 1], f (x) = sen x,

5 Derivada y sus aplicaciones se calcula directamente por la denici on: f (x) = lim sen (x + h) sen h . h0 h

47

Usando que sen (x + h) = sen x cos h + sen h cos x, el cociente incremental se escribe sen h sen x[cos h 1] + . h h Por otra parte cos h 1 = 2sen 2 (h/2). Al tomar l mite para h 0 queda cos x sen h = 1, h0 h lim 2sen 2 (h/2) sen (h/2) = lim sen (h/2) = 0. h0 h0 h h/2 lim Luego (sen x) = cos x. La derivada de la funci on f (x) : R [1, 1], f (x) = cos x, se obtiene r apidamente de la anterior observando que cos x = sen (/2 x). Luego (cos x) = cos(/2 x)(1) = sen x. (tan x) = cos2 x + sen 2 x 1 sen x = = . 2 cos x cos x cos2 x 1 (cot x) = . sen 2 x

Derivada de una funci on inversa


Sea f : A A una funci on biyectiva derivable, con funci on inversa derivable. Como f (f 1 (x)) = x, tenemos que (f f 1 ) = 1. Aplicando la f ormula de la derivada de una composici on de funciones, queda f (f 1 (x))(f 1 (x)) = 1, y por lo tanto (f 1 (x)) = Ejemplo Sea f : [/2, /2] [1, 1], f (x) = sen x. Es f 1 : [1, 1] [/2, /2], f 1 (x) = arcsen x. 1 f (f 1 (x))

5 Derivada y sus aplicaciones Luego (arcsen x) =

48

1 . cos(arcsen x)

Sea = arcsen x. Tenemos que cos2 = 1 sen 2 , con /2 /2. Como 0 para estos valores de , sigue que cos = + 1 sen 2 , pero sen = sen (arcsen x) = x. Luego (arcsen x) = 1 . + 1 x2

Como arcsen x + arccos x = /2, sigue que (arcsen x) + (arccos x) = 0 y por consiguiente (arccos x) = De una forma similar se obtiene que (arctan x) = (arccot x) = 1 , 1 + x2 1 . 1 x2

1 . 1 + x2 Las derivadas de las funciones hiperb olicas y sus inversas son las siguientes: (sh x) = ch x, (ch x) = sh x, 1 , ch2 x 1 , (arg sh x) = x2 + 1 1 , (arg ch x) = 2 x 1 1 (arg tgh x) = . 1 x2 Si la funci on derivada f (x) es tambi en derivable, su funci on derivada (f (x)) es (tgh x) = la llamada derivada segunda de f , que se simboliza f (x). Si f (x) es derivable entonces su funci on derivada f (x) es la derivada tercera de f . De esta manera se obtienen las derivadas sucesivas de f , mientras estas sean derivables.

5 Derivada y sus aplicaciones

49

5.1

Variaci on de las funciones

Cuando una funci on es derivable, su derivadas sucesivas permiten conocer su comportamiento, en cuanto a crecimiento, extremos, concavidad, etc etera. Si en un punto a interior al dominio de una funci on derivable f es f (a) > 0 entonces f es estrictamente creciente en a. Si f (a) < 0 entonces f es estrictamente decreciente en a. Esto sigue como consecuencia directa de la denici on de derivada y propiedades del l mite. Si f (x) > 0 (f (x) < 0) en todo punto x interior a un intervalo entonces f es estrictamente creciente (estrictamente decreciente) en ese intervalo. Ejemplos 1) f : (0, ) R, f (x) = ln x. Es f (x) = 1/x para todo x (0, ). Luego la funci on logar tmica es estrictamente creciente en todo su dominio. 2) f : (0, ) (0, ), f (x) = 1/x. Es f (x) = 1/x2 , que es negativo para todo x (0, ). Luego esta funci on es estrictamente decreciente en todo su dominio. Si f est a denida en un intervalo y a es un punto interior a ese intervalo entonces se dice que a es un m nimo relativo de f si existe un entorno (a , a + ) contenido en el intervalo, tal que f (x) f (a) si a < x < a + .

El punto a es un m aximo relativo de f si f (x) f (a) para x en ese entorno.

5 Derivada y sus aplicaciones

50

Los m aximos y m nimos relativos se llaman en general extremos relativos y se dicen estrictos si las desigualdades anteriores valen estrictamente. Si f es derivable en a y a es un extremo relativo de f entonces f (a) = 0, ya que en a, f no es estrictamente creciente ni estrictamente decreciente. Esta es una condici on necesaria pero no suciente para la existencia de un extremo relativo. Por ejemplo, si f (x) = x3 , f (0) = 0, pero f es estrictamente creciente en 0. Si f es derivable en un entorno reducido de a, (a ) (a + ), entonces una condici on suciente para que a sea un m nimo relativo estricto es que f (x) < 0 si x (a , a) y f (x) > 0 si x (a, a + ). An alogamente, si f (x) > 0 para x (a , a) y f (x) < 0 para x (a, a + ) entonces a es un m aximo relativo estricto. Ejemplos 1) f : [1, 1] R, f (x) = |x|. f no es derivable en 0 pero f (x) = 1 > 0 si x (0, 1) y f (x) = 1 < 0 si x (1, 0). Luego 0 es m nimo relativo estricto. 2) f : [1, 1] R, f (x) = 1 |x|. f (x) = 1 < 0 si x (0, 1) y f (x) = 1 > 0 si x (1, 0). Luego 0 es m aximo relativo estricto. En ninguno de los dos ejemplos la funci on es derivable en 0. De todo esto sigue que para analizar el crecimiento y la existencia de extremos relativos de una funci on derivable se debe estudiar el signo de su derivada. Ejemplo f : R R, f (x) = 3x4 4x3 .

5 Derivada y sus aplicaciones

51

Es f (x) = 12x2 (x 1), f (0) = 0, f (1) = 0. La funci on derivada se anula s olo en 0 y en 1, y por lo tanto estos puntos son los u nicos candidatos a ser extremos relativos. Vemos que f (x) < 0 para x (1, 1) \ {0}, luego 0 no es extremo relativo, sino que all f es estrictamente decreciente. Por otra parte, f (x) < 0 para x (0, 1) y f (x) > 0 para x (1, ). Luego 1 es m nimo relativo estricto. Por consiguiente esta funci on es estrictamente decreciente en (, 1) y estrictamente creciente en (1, ), siendo por lo tanto 1 un m nimo estricto relativo y absoluto. Mediante la derivada segunda se estudia la concavidad de la curva gr aca de una funci on f . Observar que la existencia de f (a) implica la existencia de f (x) para todo x en un entorno de a. Como f (x) es la derivada primera de f (x), sigue que el an alisis que se hizo para f y f vale an alogamente para f y f . As , si f (a) > 0 entonces f es estrictamente creciente en a y si f (a) < 0 entonces f es estrictamente decreciente en a. En particular, si f (a) = 0 y f (a) > 0 entonces, al ser f (x) estrictamente creciente en a, pasa de negativa a positiva en a y por lo tanto a es un m nimo relativo de f . An alogamente, si f (a) = 0 y f (a) < 0 entonces a es un m aximo relativo de f . Si f (a) = 0 entonces f no es estrictamente creciente ni estrictamente decreciente en a. Quiere decir que si a es un extremo relativo de f y existe f (a) entonces necesariamente debe ser f (a) = 0. Si f (x) cambia de signo en un entorno de a entonces a es un extremo relativo de f . Los extremos relativos de f son los llamados puntos de inexi on de f . En ellos se produce por lo tanto un cambio de concavidad de f . As como el cambio de signo de f en a indica la presencia de un extremo relativo de f , un cambio de signo de f en a indica que a es punto de inexi on de f , aunque f (a) no exista. Ejemplo f : [1, 1] R, f (x) = x2 sig x. Es f : [1, 1] R, f (x) = |2x|, f : [1, 1] \ {0} R, f (x) = 2 si x > 0, f (x) = 2 si x < 0. 0 es punto de inexi on de f aunque f no es derivable en 0. El origen es m nimo relativo (y absoluto) de f .

5 Derivada y sus aplicaciones

52

Cuando existen f (a) y f (a), y f (a) = 0, f (a) = 0, entonces a es un punto de inexi on de f . Consideremos otra vez el siguiente Ejemplo f : R R, f (x) = 3x4 4x3 . Tenemos que f (x) = 12x2 (x 1), f (x) = 12x(3x 2). f se anula s olamente en 0 y en 1. Luego estos son los u nicos puntos que pueden ser extremos relativos de f . Vemos que en un entorno de 0, f (x) 0 y luego, al no cambiar de signo f en el punto 0, el origen no es extremo relativo de f sino que la funci on es all estrictamente decreciente. En cambio, f cambia de signo en un entorno de 1, pasando de negativa a positiva. Por lo tanto 1 es m nimo relativo (y tambi en absoluto en este caso). f es estrictamente decreciente en (, 1) y estrictamente creciente en (1, ). f se anula en 0 y 2/3, s olamente. Vemos que f (x) < 0 en (0,2/3) y f (x) > 0 en (, 0) (2/3, ). Luego tiene concavidad negativa en el primer intervalo y concavidad positiva en los dos u ltimos intervalos, siendo por lo tanto 0 y 2/3 puntos de inexi on de f .

5.2

Representaci on param etrica

Sea f : [a, b] R. La gr aca de f puede representarse mediante una curva en el plano. Esta curva tambi en puede representarse a trav es de un par ametro t, que toma valores en un intervalo [ta , tb ], de la forma siguiente x = (t) y = (t), de manera que un punto cualquiera de la curva se corresponde con un u nico valor de t en [ta , tb ]. El punto extremo (a, f (a)) se corresponde con ta , es decir a = (ta ) f (a) = (ta ) y el otro punto extremo (b, f (b)) se corresponde con tb , b = (tb ) f (b) = (tb ). De esta manera la funci on : [ta , tb ] [a, b] tiene funci on inversa 1 : [a, b] [ta , tb ].

5 Derivada y sus aplicaciones

53

Dada una funci on en forma expl cita existe una representaci on param etrica trivial, a saber la que resulta de considerar a la misma variable independiente x como par ametro t: x = x y = f (x), donde x [a, b]. Pero por supuesto existen otras representaciones param etricas no triviales. Ejemplo x = sen t y = cos t, t [/2, /2]. Como x2 + y 2 = 1, esta curva es una semicircunferencia superior de radio 1, correspondiente a la gr aca de la funci on f : [1, 1] R, f (x) = + 1 x2 . Supongamos ahora que f es derivable. Encontraremos la expresi on de f en t erminos de las funciones x = (t), y = (t). Tenemos que y = f (x) = f ((t)) = (t). Luego (t) = f ((t)) (t) = f (x) (t). Por lo tanto f (x) = (t) , (t)

donde x y t est an relacionados mediante x = (t). En el ejemplo anterior f (x) = donde x = sen t. sen t = tan t, cos t

5.3

Teoremas del valor medio

Teorema de Rolle Sea f : [a, b] R, f continua en [a, b] y derivable en (a, b), f (a) = f (b) = 0. Entonces existe un punto c (a, b) donde f (c) = 0. Demostraci on: Si f 0 entonces f 0 en (a, b) y el teorema es trivial. Por lo tanto supongamos que f no es id enticamente nula en [a, b]. Como f

5 Derivada y sus aplicaciones

54

es continua, por el Teorema de Bolzano Weierstrass existen un m aximo y un m nimo absolutos de f en [a, b]. Como los valores m aximo y m nimo de f no pueden ser simult aneamente nulos, sigue que f debe tener un extremo absoluto c en (a, b) y por lo tanto c es tambi en extremo relativo. Luego f (c) = 0. Teorema de Lagrange Sea f : [a, b] R continua en [a, b] y derivable en (a, b). Entonces existe c (a, b) tal que f (b) f (a) = f (c). ba Demostraci on. La recta que pasa por los puntos (a, f (a)) y (b, f (b)) tiene por f (b) f (a) (x a) + f (a). ba Consideremos la funci on g : [a, b] R, y= g (x) = f (x) f (b) f (a) (x a) f (a). ba ecuaci on

g es continua en [a, b] y derivable en [a, b]. Adem as g (a) = g (b) = 0. Luego por el Teorema de Rolle existe c (a, b) tal que g (c) = 0. Pero g (x) = f (x) f (b) f (a) . ba

De aqu la tesis del teorema sigue inmediatamente.

Interpretaci on geom etrica del Teorema de Lagrange

Una importante consecuencia del teorema de Lagrange es la siguiente: Si f : [a, b] R tiene derivada nula en todo c (a, b) entonces f es necesariamente una funci on constante.

5 Derivada y sus aplicaciones

55

En efecto, si en alg un x (a, b) fuera f (x) = f (a) entonces existir a c (a, x) f (x)f (a) donde f (c) = xa = 0. Ahora veamos una generalizaci on del teorema de Lagrange. Volviendo a la representaci on param etrica, puede decirse que esta permite describir curvas en el plano que no son necesariamente gr acas de una funci on. Por ejemplo, la circunferencia completa se describe mediante x = sen t y = cos t, t [/2, 3/2]. En general, unas ecuaciones x = (t) y = (t), t [ta , tb ] pueden describir, por ejemplo, una curva como esta,

donde se indica el punto inicial, que tambi en es el punto nal y de paso intermedio, y donde las puntas de echa indican el sentido de recorrido a medida que aumentan los valores del par ametro t. En este caso, ni (t) ni (t) son funciones biyectivas, aunque s son continuas y m as a un, derivables, si la curva es suave, esto es, con recta tangente en todo punto interior de ella. Si las derivadas (t), (t) no se anulan ni se hacen innito simult aneamente, entonces el teorema de Lagrange sigue valiendo en este caso. Se lo conoce como Teorema de Cauchy. Si la curva se puede partir en una cantidad nita de sectores, donde en cada sector sea la gr aca de una funci on uniforme, entonces la pendiente de la recta tangente a la curva en un punto t (ta , tb ) viene dada por (t)/ (t). Por otra parte, los puntos extremos de la curva

5 Derivada y sus aplicaciones

56

son ((ta ), (ta )) y ((tb ), (tb )). Luego la pendiente de la cuerda que une esos puntos es (tb ) (ta ) . (tb ) (ta ) Teorema de Cauchy Si : [ta , tb ] R, : [ta , tb ] R, son dos funciones continuas, y derivables en (ta , tb ), tales que sus derivadas no se anulan ni se hacen innito simult aneamente, entonces existe t0 (ta , tb ) tal que (t0 ) (tb ) (ta ) = . (tb ) (ta ) (t0 )

5.4

L mites indeterminados

Cuando calculamos el l mite de un cociente f (x)/g (x) para x a puede darse que limxa f (x) = 0 y limxa g (x) = 0, en cuyo caso el l mite queda indeterminado. Si f y g son derivables en a entonces tambi en son continuas en a y por lo tanto
xa

lim f (x) = f (a) = 0, lim g (x) = g (a) = 0


xa

f (x) f (a) g (x) g (a) , g (a) = lim . xa xa xa xa Si adem as g (a) = 0 entonces f (a) = lim
)f (a) limxa f (xx f (a) a = . g ( x ) g (a) g (a) limxa x a

Por lo tanto el l mite ha quedado determinado. Ejemplo sen x . x0 x Ambas funciones son derivables en 0 y adem as g (x) 1 = 0. Luego ese l mite lim es
cos 0 1

= 1.
f (x) g (x)

Si g (a) = 0, esta regla no puede aplicarse. No obstante limxa

puede

existir lo mismo. La siguiente regla es consecuencia del Teorema de Cauchy. Si existe limxa
f (x) g (x)

entonces este l mite es igual a limxa

f (x) . g (x)

5 Derivada y sus aplicaciones En efecto, f (x) lim = lim xa g (x) xa


f (x)f (a) xa g (x)g (a) xa

57

= lim

f (zx ) . xa g (zx )

Esta u ltima igualdad es v alida por el Teorema de Cauchy, pues


f (x)f (a) lim xa xa g (x)g (a) xa

= lim

xa

f (x) f (a) f (zx ) = lim , x a g (x) g (a) g (zx )


f (x) g (x)

donde zx es un punto intermedio entre a y x y por lo tanto zx a cuando x a. Como estamos suponiendo que limxa lim existe, sigue que

f ( x) f (zx ) = lim . xa g (zx ) xa g (x) Puede ocurrir que tambi en este u ltimo l mite quede indeterminado. En este caso la regla puede reiterarse, suponiendo que existe limxa Ejemplo
x 0 f (x) . g (x)

lim

x sen x 1 cos x sen x cos 0 1 = lim = lim = = . 3 2 x 0 x 0 x 3x 6x 6 6

La aplicaci on de la regla se justica yendo de atr as hacia adelante . Como la derivada de la funci on y = 6x es 6 = 0, la primera de las reglas enunciadas sen x 1 = . x0 6x 6 La segunda de las reglas enunciadas permite decir ahora que: Como lim
x0

dice que

lim

sen x 6x

existe, sigue que


x0

lim

1 cos x sen x = lim . 2 x 0 3x 6x 1 cos x x0 3x2 lim

Como existe, sigue que

1 cos x x sen x = lim . 2 x0 x0 3x x3 lim queda indeterminado en la forma f (x) f (1/u) = lim . u 0 g (x) g (1/u)
0 0

Si limx

f (x) g (x)

entonces, haciendo el

cambio de variables x = 1/u, se tiene lim

5 Derivada y sus aplicaciones (u) = f (1/u), g Si f (u) = g (1/u), entonces (u) = f (1/u)(1/u2 ), g f (u) = g (u)(1/u2 ), (u) 0, g donde f (u) 0, cuando u 0. Luego, si existe limu0 lim
(u) f , g (u)

58

entonces este l mite es igual a limu0

(u) f . g (u)

Pero

(u) f f (1/u)(1/u2 ) f (x) = lim = lim . 2 u0 g (u) u0 g (1/u)(1/u ) x g (x) Por otra parte (u) f f (x) = lim . u0 g (u) x g (x) lim
f (x) g (x)

En resumen, tenemos que si limx es


(x) , limx f g (x)

existe entonces el valor de este l mite

por lo que la regla de resoluci on de la indeterminaci on del l mite


f (x) g (x)

puede aplicarse tambi en en este caso. Consideremos ahora la situaci on en que limxa siguiente. Como queda indeterminado por ser limxa f (x) = , limxa g (x) = . En este caso puede hacerse lo 1 1 = 0, lim = 0, xa f (x) xa g (x) lim f ( x) 1/g (x) = lim , xa g (x) xa 1/f (x) lim

pasa que esta indeterminaci on es del tipo 0 , por lo que puede aplicarse la regla 0 anterior al cociente escrito de esta manera. No obstante, puede probarse que (x) tambi en en este caso, si existe limxa f , entonces el valor de este l mite es g (x) limxa
f (x) . g (x)

Si limxa f (x)g (x) es indeterminado (0 ), se escribe f (x)g (x) = o bien f (x)g (x) = para llevarlo al caso
0 0

f (x) , 1/g (x) g (x) , 1/f (x)

Si limxa [f (x) g (x)] queda indeterminado, se escribe f (x) g (x) = 1/g (x) 1/f (x) , 1/(f (x)g (x))

5 Derivada y sus aplicaciones . para llevarlo al caso 0 0

59

Por u ltimo, en la forma exponencial indeterminada se toma logaritmo neperiano para llevarlo a una indeterminaci on del producto o del cociente. Ejemplos 1)
x0

lim xx .

Tomando logaritmo, queda


x0

lim x ln x = lim

x0

ln x 1/x = lim = lim (x) = 0. x 0 1/x 1/x2 x0 lim xx = e0 = 1.

Luego
x 0

2)
x

lim (1 + x)1/x .

Tenemos que
x

lim

ln(1 + x) 1/(1 + x) = lim = 0. x x 1 lim (1 + x)1/x = e0 = 1.

Luego
x

5.5

Movimiento rectil neo

La derivada nos indica la rapidez de cambio de una variable que depende de otra. El ejemplo f sico m as t pico de esta situaci on (pero no el u nico, por cierto) es la velocidad de un m ovil que se desplaza sobre una l nea recta. Podemos representar esta recta mediante un eje vertical. El m ovil cambia su posici on s sobre esta recta en funci on del tiempo t. Para jar su posici on tomamos un punto de referencia sobre el eje vertical, de modo que ella queda determinada por su distancia (por ejemplo, en metros) a este punto de referencia. Por otro lado, si estamos interesados en analizar gr acamente el desplazamiento del m ovil en funci on del tiempo, lo razonable es medir esta variable (por ejemplo, en segundos) sobre un eje horizontal, se nalando tambi en un tiempo de referencia. De esta manera el desplazamiento del m ovil queda gr acamente descrito por la representaci on cartesiana de la expresi on s = s(t).

5 Derivada y sus aplicaciones


s(t)

60

El m ovil se desplaza sobre el eje vertical

La velocidad promedio del m ovil en un intervalo de tiempo [t1 , t2 ] es el cociente incremental entre el espacio recorrido en ese tiempo y t = t2 t1 . La velocidad instant anea en un determinado instante t1 , v (t1 ), es el l mite para t t1 de los cocientes incrementales (velocidades promedio) s(t) s(t1 ) , t t1 tal como sucede en la denici on de derivada de una funci on. Por lo tanto la velocidad instant anea es precisamente la derivada si esta existe de la expresi on s(t) evaluada en t = t1 , s (t1 ). Si la expresi on s(t) es derivable en todo su intervalo de denici on, entonces queda denida en ese mismo intervalo la funci on velocidad instant anea, de expresi on v (t). La aceleraci on promedio del m ovil en un intervalo de tiempo [t1 , t2 ] es el cociente entre el incremento de velocidad instant anea v (t2 ) v (t1 ) y t = t2 t1 . Asimismo, la aceleraci on instant anea del m ovil en un instante t1 , a(t1 ), es la derivada segunda de s(t) si esta existe evaluada en t = t1 , s (t1 ). Ejercicio: Describir la funci on que ja la posici on de un m ovil en movimiento rectil neo si (a) la velocidad instant anea es constante, (b) la aceleraci on instant anea es constante.

Integral de una funci on

La noci on de integral denida de una funci on surge como necesidad de medir areas de guras en el plano partiendo del area ya conocida de un rect angulo: longitud de la base por longitud de la altura. La medida del area de una regi on debe obedecer a ciertos principios intuitivos. Por ejemplo, la medida del area de una gura como esta,

a saber la uni on de dos rect angulos no rampantes (con interiores disjuntos) debe ser la suma de las areas de ambos rect angulos. En general, el area de una uni on nita de rect angulos no rampantes debe ser la suma de las areas de esos rect angulos. De esta manera ya es posible medir areas para guras de este tipo. S olo hay que probar que distintas descomposiciones de la regi on en uni on de rect angulos conducen a la misma area. Empero, el poder medir areas de estas guras elementales no permite por s mismo medir areas de otras regiones intuitivamente medibles del plano. Un c rculo, por ejemplo. En efecto, es visualmente evidente que un c rculo no es una uni on nita de rect angulos. De hecho, ser a imposible medir exactamente el area de un c rculo sin el conocimiento de l mite num erico: el area de un c rculo es el l mite de una sucesi on num erica de areas de regiones elementales. Nos centraremos en el c alculo del area de una regi on limitada por la gr aca de una funci on f : [a, b] [0, ). Queremos calcular el area de la regi on encerrada por la gr aca de f , el intervalo [a, b] y los segmentos de extremos (a, 0), (a, f (a)) y (b, 0), (b, f (b)). Dado que hasta ahora s olo sabemos calcular areas de guras elementales (uni on nita de rect angulos no rampantes), construimos una tal gura contenida en la regi on dada.

6 Integral de una funci on


2 1.5 1 0.5

62

0.5

1.5

Los rect angulos se corresponden con una partici on del intervalo [a, b]. a = x0 < x1 < x2 < < xn1 < xn = b La base de cada rect angulo es un intervalo [xi1 , xi ]. elemental es s =
n i=1 ci [xi

La altura de cada

rect angulo es ci = inf f en [xi1 , xi ]. De esta manera, el area de la regi on xi1 ]. El n umero s se llama suma inferior correspondiente a la partici on dada. Si existe una medida del area de la regi on, digamos A, ser a s A, donde posiblemente valga la desigualdad estricta, a menos que la regi on ya sea una gura elemental. Esto es porque la gura elemental est a contenida en la regi on. Ahora construimos una gura elemental que contenga a la regi on. La partici on de [a, b] es la misma, y por lo tanto la base de los rect angulos es la misma que antes, pero la altura es ahora Ci = sup f (x), x [xi1 , xi ]. El area de esta gura elemental es S = n i=1 Ci [xi xi1 ], y ahora A S . S se llama suma superior correspondiente a la partici on dada. Es visualmente evidente que si la longitud de la base de cada rect angulo se hace m as peque na, entonces tanto la gura elemental contenida en la regi on como la que contiene a la regi on se aproximan a esta. Para todas las correspondientes sumas superiores e inferiores vale la relaci on s A S, suponiendo que existe el area de la regi on, A. Este hecho sugiere considerar el supremo s0 de las sumas inferiores, as como el nmo S0 de las sumas superiores, donde tanto el nmo como el supremo se obtienen variando las particiones del intervalo [a, b]. Si ocurre que s0 = S0 entonces este valor com un es por denici on el area A de la regi on dada. Se escribe
b

A=
a

f (x) dx,

6 Integral de una funci on

63

que se lee integral de f diferencial x y se dice que la funci on es integrable (Riemann). Puede ocurrir que para alguna funci on f sea s0 < S0 . En este caso f no es integrable (R). Si f : [a, b] R, donde f no es necesariamente no negativa, la misma denici on de integral es v alida para este caso. S olo debe tenerse en cuenta que el area va acompa nada del signo correspondiente. Una condici on necesaria y suciente para que una funci on sea integrable (R) es que dado > 0, arbitrario, exista una partici on de [a, b] tal que S s < , donde S y s son las sumas superior e inferior correspondientes a esta partici on, respectivamente. Una funci on continua en [a, b] tiene esta condici on. En efecto, como f es uniformemente continua en [a, b], puede conseguirse una partici on x0 , x1 , , xn de [a, b] tal que para todo i, [xi xi1 ] sea sucientemente peque no, de manera que valga Ci ci < /(b a) para todo i. Luego
n n

Ss=
i=1

[Ci ci ][xi xi1 ] <

ba

[xi xi1 ] = .
i=1

Asimismo, una funci on acotada en [a, b], mon otona creciente o mon otona decreciente, es integrable (R). En este caso podemos conseguir una partici on tal que [xi xi1 ] < /(f (b) f (a)) (o [xi xi1 ] < /(f (a) f (b)) si f es decreciente). Luego
n

Ss=
i=1 n

[f (xi ) f (xi1 )][xi xi1 ] <

f (b) f (a)

[f (xi ) f (xi1 )] =
i=1

f (b) f (a)

[f (b) f (a)] = .

En cualquiera de estos dos casos la integral denida de una funci on f puede obtenerse partiendo el intervalo [a, b] en n subintervalos de igual longitud y tomando l mite para n en las sumas superiores e inferiores, indistintamente. Ejemplo C alculo de
1 0

f (x) dx, donde f : [0, 1] R, f (x) = x.

La partici on del intervalo [0, 1] en n subintervalos de igual longitud 1/n da


1 los puntos 0, 1/n, 2/n, , n , 1. La suma superior para esta partici on es n

6 Integral de una funci on Sn =


n i=1

64

f (xi )[xi xi1 ], donde xi = i/n. Luego


n n

Sn =
i=1

i/n 1/n = 1/n2


i=1

i=

1/n2 [1 + 2 + + n] = 1/n2 y
n

n(n + 1) n+1 = , 2 2n

lim Sn = lim

n+1 = 1/2. 2n

6.1

Propiedades de la integral denida


b a

a) Si f (x) 0 para x [a, b] entonces b) Si c es una constante ja, entonces


b

f (x) dx 0.

cf (x) dx = c
a a

f (x) dx.

c)
b b b

[f (x) + g (x)] dx =
a a

f (x) dx +
a

g (x) dx

La integral denida asigna un n umero real a cada funci on integrable sobre un intervalo. Por las propiedades b) y c) se dice que esta asignaci on es lineal. La propiedad c) se generaliza a una suma nita de funciones integrables. M as precisamente, la integral denida de una combinaci on lineal de funciones c1 f1 (x) + c2 f2 (x) + + cm fm (x) es la combinaci on lineal de las integrales:
b a n n b

ci fi (x) =
i=1 i=1

ci
a

fi (x) dx.

d) Si c es un punto en (a, b) entonces


b c b

f (x) dx =
a a

f (x) dx +
c

f (x) dx.

e) Si f (x) g (x) para x [a, b] entonces


b b

f (x) dx
a a

g (x) dx.

En particular, como |f (x)| es integrable si f (x) es integrable, y |f (x)| f (x) |f (x)|,

6 Integral de una funci on tenemos


a

65

|f (x)| dx
a b

f (x) dx
a b

|f (x)| dx.

Es decir,
a

f (x) dx
a

|f (x)| dx.

Teorema del valor medio


Sea M = sup f (x), x [a, b], m = inf f (x), x [a, b]. Luego m f (x) M para x [a, b] y por lo tanto
b b b

m(b a) =
a

m dx
a

f (x) dx
a

M dx = M (b a).

Es decir, m

f (x) dx M. ba La integral denida de una funci on f partida por la longitud b a del intervalo de integraci on es un n umero comprendido entre el nmo y el supremo de f en ese intervalo. Si f es continua en [a, b] entonces existe [a, b] tal que f () = . Luego en este caso
b

b a

f (x) dx = f ()(b a),


a

donde [a, b].

6.2

Funci on integral

Sea f una funci on integrable (R) en el intervalo [a, b]. Entonces tambi en es integrable sobre un intervalo [a, u] para todo u (a, b]. Para cada u [a, b] tenemos un valor de la integral denida funci on F (u) =
a u u a

f (x) dx. Queda as denida una

f (x) dx,

que se llama funci on integral de f .

6 Integral de una funci on

66

En el caso de la funci on del dibujo de arriba vemos que la funci on integral es creciente porque a medida que u avanza de izquierda a derecha el area va aumentando. En el siguiente caso F (u) crece desde a hasta u, luego decrece desde u hasta v para posteriormente volver a crecer desde v hasta b.

6 Integral de una funci on

67

Gr aco de la funci on f

Gr aco de la funci on integral de f

Si la funci on f est a denida a la izquierda de a tambi en se puede considerar u f (x) dx para u < a si adem as f es integrable en el intervalo [u, a]. Para a estos casos, u < a, se conviene en denir
u a

f (x) dx =

a u

f (x) dx.

Sea u (a, b). Para un peque no incremento h, positivo o negativo, de forma que u + h [a, b], tenemos que
u+h u u+h

F (u + h) F (u) =
a

f (x) dx
a

f (x) dx =
u u+h u

f (x) dx.

Por el Teorema del valor medio sigue que

f (x) dx = h, donde es un

n umero intermedio entre el nmo y el supremo de f en el intervalo [u, u + h] (o [u + h, u] si h es negativo). Luego [F (u + h) F (u)] 0 cuando h 0, lo cual indica que la funci on integral F (u) es continua en [a, b]. Si adem as f es continua en u entonces el valor intermedio , que depende de u y h, tiende a f (u) cuando h 0. Luego F (u + h) F (u) = lim (u, h) = f (u). h0 h0 h As hemos probado que la derivada de la funci on integral en los puntos de F (u) = lim continuidad u del integrando f es el valor f (u). Signica que si f es continua en [a, b] entonces F (u) = f (u) para todo u [a, b], es decir que la funci on integral de una funci on continua es algo as como su antiderivada: una funci on tal que su derivada es la funci on integrando. Volviendo al c alculo de la integral denida
b a

f (x) dx, supongamos que f

es continua en [a, b] y que adem as conocemos una funci on G tal que G (u) = f (u) para todo u [a, b]. Como la funci on integral F (u) tambi en satisface F (u) = f (u) para todo u [a, b] tenemos que [F (u) G(u)] = F (u) G (u) = f (u) f (u) = 0

6 Integral de una funci on

68

para todo u [a, b]. Las u nicas funciones con derivada nula en todo un intervalo son las funciones constantes. Por lo tanto F (u) G(u) = C, C constante. En particular F (a) G(a) = C, F (b) G(b) = C . Como F (a) = 0, sigue que C = G(a) y por consiguiente
b

F (b) =
a

f (x) dx = G(b) G(a),

que es la llamada regla de Barrow, que por lo tanto permite calcular la integral denida de una funci on continua si conocemos una funci on cuya derivada sea el integrando. Esta regla tambi en es v alida si f es continua en [a, b] salvo en una cantidad nita de puntos en [a, b]. Una funci on G tal que G = f en alg un intervalo o dominio de n umeros reales se llama una primitiva de f . Se suele indicar as : G(x) = Ejemplos 1)
1 0 1 0

f (x) dx.

x dx. Una primitiva de la funci on f (x) = x es G(x) = x2 /2. Luego cos x dx = sen x| 0 = sen sen 0 = 0.

x dx = x2 /2|1 0 = 1/2. 2)
0

Integral denida sobre un intervalo no acotado


Si f es integrable en el intervalo [a, u] para todo u > a entonces se puede denir u f (x) dx = lim
a u

f (x) dx.
a

Cuando este l mite existe, f se dice integrable en [a, ). An alogamente para a b f (x) dx o f (x) dx = lima, b a f (x) dx. Ejemplo
1

1/x2 dx. Una primitiva de 1/x2 es 1/x. Luego


u 1

1/x2 dx = 1/x|u 1 = 1/u + 1

y
u

lim (1 1/u) = 1.

6 Integral de una funci on

69

Integrando no acotado
Si f es acotada en el intervalo [u, b] para todo u > a pero |f (u)| cuando u a+ entonces, si existe
b ua+

lim

f (x) dx,
u

se dene Ejemplo

b a

f (x) dx como el valor de ese l mite.

La funci on

f : (0, 1) R, f (x) = 1/ x,

es acotada en todo intervalo [u, 1] para u > 0 y


1 u

1/ x dx = 2 x|1 u = 2 2 u.
1 0

Como limu0+ (2 2 u) = 2, se tiene por denici on

1/ x dx = 2.

6.3

C alculo de primitivas

Por lo que hemos visto, el c alculo de una integral denida, que no sea por la misma denici on, requiere conocer una primitiva continua de la funci on integrando. Si ocurre que la funci on integrando es una derivada de una funci on conocida entonces el c alculo de la integral denida ser a inmediato. Por ejemplo, 1 1/x dx = ln x|2 1 = ln 2. Otras veces el integrando es suma de funciones que son derivadas de funciones conocidas. Dado que la integral es lineal, este caso se resuelve tambi en r apidamente. Ejemplos 1) x2 2 x + 3 dx = x = x dx 2 1/ x dx + 3 = x2 /2 4 x + 3 ln x + C. 1/x dx =
2

2) tan2 x dx =

6 Integral de una funci on sen 2 x dx = cos2 x 1 dx cos2 x 1 cos2 x dx = cos2 x dx = tan x x + C.

70

= =

Integraci on por sustituci on


Este m etodo se basa en efectuar un cambio de variable, x = (t), t = 1 (x). Tenemos f (x) dx = f ((t)) dx. Pero ahora no sirve encontrar una primitiva de f ((t)) sino que se debe calcular una primitiva de f ((t)) (t). Esto es f ((t)) (t) dt. Por lo tanto debe reemplazarse dx por (t) dt. En efecto, sea G tal que G (t) = f ((t)) (t). Luego G (t)/ (t) = f ((t)). Pero por la expresi on de la derivada de funci on de funci on y de la funci on inversa, es G (t)/ (t) = [G(1 (x))] . Por lo tanto queda [G(1 (x))] = f (x) y as se ha encontrado una primitiva de f (x). Ejemplo ln x/x dx. Se efect ua la sustituci on x = et , o bien t = ln x. Como (et ) = et , ahora se debe calcular t t e dt = et t dt = t2 /2 + C.

Finalmente se reemplaza t por ln x : (ln x)2 /2 + C . Si para una funci on derivable g (x) se dene d(g (x)) = g (x) dx (donde d(g (x)) se lee diferencial de g (x)), entonces en algunas integrales es f acil darse cuenta de la sustituci on que se debe hacer. Por ejemplo, en la integral cos(3x) dx hacemos cos(3x) dx = = 1 1 cos(3x) d(3x) = cos t dt = 3 3 1 1 = sen t + C = sen (3x) + C. 3 3

6 Integral de una funci on En la integral ex sen ex dx, teniendo en cuenta que d(ex ) = ex dx, hacemos

71

ex sen ex dx = = sen ex d(ex ) = sen t dt = cos t + C = cos ex + C.

En el siguiente ejemplo, como d(1 x2 ) = 2x dx, tenemos que x dx = 1 x2 d(1 x2 ) dt = 1/2 = 2 1x t = 1/2 ln t + C = 1/2 ln(1 x2 ) + C. = 1/2 En la integral x dx, 1+x

1 teniendo en cuenta que d( 1 + x) = 21+ dx, ponemos esa integral as : x 2 2 x d( 1 + x), y poniendo x = ( 1 + x) 1, queda 2 [( 1 + x)2 1]d( 1 + x) = = 2 (t2 1) dt = 2/3 t3 2t + C =

= 2/3 (1 + x)3/2 2(1 + x)1/2 + C.

Integraci on por partes


La regla de derivaci on de un producto de funciones da (f (x)g (x)) = f (x)g (x) + f (x)g (x). Luego (f (x)g (x)) dx = Como (f (x)g (x)) dx = f (x)g (x), g (x) dx = d(g (x)), f (x) dx = d(f (x)), f (x)g (x) dx + f (x)g (x) dx.

6 Integral de una funci on la igualdad anterior se escribe f (x) dg = f (x)g (x) En particular, si g (x) x, queda f (x) dx = xf (x) Ejemplos 1) ln x dx = = x ln x 2) arctan x dx = x dx = 1 + x2 d(1 + x2 ) = x arctan x 1/2 = 1 + x2 = x arctan x 1/2 ln(1 + x2 ) + C. = x arctan x 3) x3 ln x dx = = ln x d(x4 /4) = (x4 /4) ln x x3 /4 dx = dx = x ln x x + C. xf (x) dx. g (x) d f.

72

= (x4 /4) ln x x4 /16 + C.

Integraci on por expresiones racionales


En la integral 3x3 3x + 1 dx x2 + x 2 efectuamos primero la divisi on del cociente, de modo que quede como suma de un polinomio m as otra expresi on racional, donde ahora el numerador tiene grado menor que el denominador. Como 3x3 3x + 1 = (x2 + x 2)(3x 3) + 6x 5,

6 Integral de una funci on sigue que 3x3 3x + 1 dx = x2 + x 2 = (3x 3) dx + 6x 5 dx = +x2 6x 5 dx. 2 x +x2 x2

73

= 3/2 x2 3x +

Ahora se trata de escribir este u ltimo integrando como suma de fracciones simples. Como x2 + x 2 = (x 1)(x + 2), se pone 6x 5 = (x 1)(x + 2) A B + = x1 x+2 A(x + 2) + B (x 1) = . (x 1)(x + 2) = Luego 6x 5 = A(x + 2) + B (x 1). Como esta igualdad debe ser v alida para todo x R, en particular lo es para x = 1. Luego 6(2) 5 = 17 = 3B, 6(1) 5 = 1 = 3A, y por lo tanto B = 17/3, A = 1/3. Luego 6x 5 dx = (x 1)(x + 2) dx dx + 17/3 = x1 x+2 = 1/3 ln |x 1| + 17/3 ln |x + 2| + C. = 1/3 Finalmente queda 3x3 3x + 1 dx = (x 1)(x + 2) = 3/2 x2 3x + 1/3 ln |x 1| + 17/3 ln |x + 2| + C. Si en la expresi on del denominador hay ceros simples imaginarios, por ejemplo
1 , x(x2 +1)

la descomposici on se efect ua de la siguiente forma. A Bx + C 1 = + 2 x(x2 + 1) x x +1 2 A(x + 1) + Bx2 + Cx = . x(x2 + 1)

6 Integral de una funci on

74

Luego 1 = A(x2 + 1) + Bx2 + Cx. Poniendo x = 0 queda A = 1. Por lo tanto 1 = (B + 1)x2 + Cx + 1. Luego B = 1, C = 0. As dx = x(x2 + 1) x dx dx = 2 x x +1 = ln |x| 1/2 ln(x2 + 1) + C. = El caso en que hay ceros m ultiples se considera de la siguiente manera. Se escribe P (x) = (x a)h q (x) = A0 A1 Ah1 p(x) + + + + , h h 1 (x a) (x a) x a q (x)
K (i) (a) , siendo i! x2 tenemos (x1)3

donde los coecientes Ai est an determinados por la f ormula Ai =

(x) K ( x) = P (K (0) (x) = K (x)). Por ejemplo, en la expresi on q (x) P (x) = x2 , q (x) = 1, K (x) = x2 , K (1) = 1, K (1) = 2, K (1)/2 = 1. Luego

x2 1 2 1 = + + , 3 3 2 (x 1) (x 1) (x 1) x1 y por consiguiente x2 dx = (x 1)3 = 1/2 (x 1)2 2(x 1)1 + ln |x 1| + C. En las expresiones racionales en x y Ejemplos 1) En dx x3 x2 x 2 = t, por lo que x = t2 +2, dx = 2t dt, y la integral se convierte 2t dt = 3t + 2
n

ax+b cx+d

se hace la sustituci on que consiste

en tomar dicha ra z como nueva variable.

ponemos en

t2

6 Integral de una funci on dt dt +4 = t1 t2 = 2 ln |t 1| + 4 ln |t 2| + C = (t 2)4 = ln +C = (t 1)2 ( x 2 2)4 + C. = ln ( x 2 1)2 = 2 2) En la integral x+1 x ponemos x+1 x
1/3 2/3

75

dx

= t,

x+1 = t3 , x + 1 = xt3 , x 1 3t2 dt , dx = . t3 1 (t3 1)2

xt3 x = x(t3 1) = 1, x = Luego la integral queda

t2 dt, (t3 1)2 que es una integral de funci on racional. 3 Si el integrando es funci on racional de x y de varias ra ces de la forma
p

ax + b , cx + d
l

ax + b , cx + d
ax+b cx+d

ax + b ,, cx + d

entonces se hace la sustituci on Ejemplo En

= t, donde l =m.c.m. (p, q, r, ).

3 ponemos 6 6

x dx x+ x

x = t, x = t6 , dx = 6t5 dt, y la integral queda

t6 dt = t2 + t3 1 dt = 1+t = t4 /4 t3 /3 + t2 /2 t + ln |1 + t| + C = = 6 t3 t2 + t 1 + = x2/3 /4 x1/2 /3 + x1/3 /2 x1/6 + ln |1 + x1/6 | + C.

En x2 + px + q dx

6 Integral de una funci on se hace la sustituci on x2 + px + q = x + t, x2 + px + q = x2 + 2tx + t2 ,

76

de donde se puede despejar x como funci on racional de t, por lo que el integrando se convierte en expresi on racional de t. Ejemplo En x2 + 4 dx se pone x2 + 4 = x + t, x2 + 4 = x2 + 2tx + t2 , 4 t2 2 t 4 + t2 , x = , dx = dt. 2t t 2 2t2 Luego la integral queda x= 4 t2 +t 2t 4 + t2 2t2 dt =

16 + 8t2 + t4 = dt = 4t3 4 2 t = + + dt = t3 t 4 2 t2 = 2 2 ln |t| + C = t 8 2 ( x2 + 4 x)2 2 ln | x2 + 4 x| + C. 8 ( x2 + 4 x)2 M as conveniente que la anterior puede resultar la sustituci on x = 2sh t, dx = 2ch t dt. De esta manera, x2 + 4 dx = = 2 = 4 = 4ch 2 t + 4 ch t dt = ch 2 t dt = (e2t + e2t + 2) dt =

= e2t /2 e2t /2 + 2t + C.

6 Integral de una funci on Para pasar a la variable x se usa que et = ch t + sh t y ch t = + Luego queda et = + sh 2 t + 1 + sh t = t = ln Luego la integral resuelta queda x2 /4 + 1 + x/2 2 En la integral
2

77 sh 2 t + 1.

x2 /4 + 1 + x/2,

x2 /4 + 1 + x/2 .

2 x2 /4

1 + 1 + x/2
2

+ 2 ln

x2 /4 + 1 + x/2 + C.

x2 a2 dx

se hace la sustituci on x = ach t, procediendo como en el caso anterior. Si la integral es de la forma a2 x2 dx, cos2 t dt.

se pone x = asen t, dx = a cos t dt, y la integral queda a2 Si el integrando es de la forma Ejemplo x2 + px + q o

x2 + px + q entonces se

completa cuadrados en el trinomio, llev andolo a alguno de los casos anteriores.

x2 + 2x + 3 dx =

4 (x 1)2 dx.

Se hace la sustituci on x 1 = 2sen t, dx = 2 cos t dt. La integral se convierte en 4 cos2 t dt = = 2 2arcsen Teniendo en cuenta que x1 2 (1 + cos(2t)) dt = 2t + sen (2t) + C = + sen 2arcsen x1 2 + C.

sen (2) = 2sen cos = 2sen 1 sen 2 ,

la integral resuelta queda 2arcsen x1 2 +2 x1 2 1 x1 2


2

+ C.

6 Integral de una funci on

78

Integrandos racionales de funciones circulares


Una integral del tipo
dx on sen x se resuelve con la sustituci

t = tan(x/2), x = 2 arctan t, dx = Tenemos que sen x = = 2sen (x/2) cos(x/2) = Por otra parte

2 dt. 1 + t2

2sen (x/2) cos(x/2) 2t = 2 2 cos (x/2) + sen (x/2) 1 + t2

cos2 (x/2) sen 2 (x/2) 1 t2 cos x = = . cos2 (x/2) + sen 2 (x/2) 1 + t2 Por lo tanto una integral de este tipo se transforma en una integral con integrando racional en t. Es dx = sen x = =
2 1+t2 2t 1+t2

dt =

dt = ln |t| + C = t

ln | tan(x/2)| + C. Por otro lado, dx = 1 + cos x = 1


2 1+t2 t2 +1 1+t2

dt =

dt = t + C =

tan(x/2) + C.

6.4

Polinomio de Taylor. Series de potencias


f : R R, f (x) = ex ,
2

La funci on

6 Integral de una funci on

79

es muy usada en teor a de probabilidades y en estad stica. Es una funci on continua en todo R y m as a un, existen todas sus derivadas sucesivas. Tambi en 2 es una funci on integrable (R) en R. Puede probarse que ex dx = 2 . Empero, esta funci on no tiene primitiva expresable en t erminos de las funciones trascendentes estudiadas. Por lo tanto una integral denida de ex sobre cualquier intervalo no tiene un c alculo inmediato. Una manera de remediar esta situaci on es aproximar a la funci on por otras funciones que s tengan integrales de c alculo inmediato. Por ejemplo, polinomios. Cuando la funci on a aproximar tiene derivadas hasta un cierto orden, un polinomio aproximante muy u til es el llamado polinomio de Taylor. Es un polinomio que en un determinado punto del dominio de la funci on coincide con los valores de la funci on y sus derivadas hasta un cierto orden. Escribamos un polinomio P (x) de grado n de la siguiente forma: P (x) = a0 + a1 (x c) + a2 (x c)2 + + an (x c)n . Vemos que P (c) = a0 . Si derivamos P (x) queda P (x) = a1 + 2a2 (x c) + 3a3 (x c)2 + + nan (x c)n1 . Luego P (c) = a1 . Volviendo a derivar P (x) = 2a2 + 6a3 (x c) + 12a4 (x c)2 + + n(n 1)(x c)n2 . Sigue que P (c) = 2a2 . Derivando sucesivamente P (x) puede probarse la f ormula P (i) (c) = i!ai , donde P (i) (c) es la derivada de orden i de P evaluada en c, y P (0) (c) = P (c). Ahora bien, si una funci on f tiene derivadas hasta el orden n en c, entonces P (x) = f (c) + f (c)(x c) + es un polinomio que satisface f (i) (c) P (c) = i! = f (i) (c), 0 i n. i!
(i)
2

f (c) f (n) (c) (x c)2 + + (x c)n 2! n!

P (x) es el polinomio de Taylor de grado n de f desarrollado en c. Es de esperar que esta coincidencia de los valores de P y f en c produzca una aproximaci on de P a f , al menos en las cercan as del punto c. Efectivamente as ocurre, y

6 Integral de una funci on

80

tanto mayor es la aproximaci on de P a f cuanto m as alto es el grado de P . Consideremos, por ejemplo, la funci on f : R R, f (x) = sen x. Para esta funci on, tenemos f (0) = 0, f (0) = cos 0 = 1, f (0) = sen 0 = 0, f (0) = cos 0 = 1, f (4) (0) = sen 0 =, f (5) (0) = cos 0 = 1. Luego su polinomio de Taylor de grado 5, desarrollado en cero, es P (x) = x x3 /3! + x5 /5!. Como las derivadas sucesivas de la funci on f : R R, f (x) = ex son la misma funci on, tenemos que en este caso x2 x3 xn + + + . 2! 3! n! x Tanto las funciones sen x como e tiene derivadas sucesivas de todos los ordenes. P ( x) = 1 + x + Cabe preguntarse entonces: Si en lugar de considerar el polinomio de Taylor de grado n consideramos la suma innita, o sea una serie, coincidir a esta serie con la funci on en todo punto? Por ejemplo, ser a x2 x3 xn + + + + ? 2! 3! n! Sumar series ya sabemos. Hay que calcular las sumas parciales de orden n y ex = 1 + x + luego tender n . As , 1+x+ x2 x3 xn x2 xn + + + + = lim 1 + x + + + 2! 3! n! 2! n! .

La respuesta a esta pregunta es armativa en muchos casos, en particular para estas dos funciones aqu consideradas. Esta serie se llama serie de Taylor de la funci on dada, desarrollada en el punto c. La funci on que se desarrolla debe tener necesariamente derivadas sucesivas de todos los ordenes, pero esta condici on no es suciente para que f sea desarrollable en serie de Taylor. En general, T (x) = f (c) + f (c)(x c) + f (c) f (n) (c) (x c)2 + + (x c)n + . 2! n!

6 Integral de una funci on Las funciones que admiten un desarrollo en serie de Taylor en todo R se llaman anal ticas. Obviamente los polinomios son funciones anal ticas. Tambi en lo son ex , sen x, cos x, sh x, ch x, y muchas otras funciones obtenidas de estas. En efecto, es x2 x3 xn e =1+x+ + + + + 2! 3! n!
x

81

para todo x R. As , por ejemplo, e = 1 + 1 + 1/2 + 1/6 + + 1/n! + , e2 = 1 + 2 + 4/2! + 8/3! + + 2n /n! + , e1 = 1 1 + 1/2 1/3! + + (1)n /n! + . En general, una serie de la forma

ai xi = a0 + a1 x + a2 x2 +
i=0

se llama serie de potencias. Las series de Taylor con desarrollo en cero son casos particulares de series de potencias. Aplicando el criterio de Cauchy para sumaci on de series num ericas de t erminos positivos se prueba que una serie de potencias es absolutamente convergente para x en un intervalo (R, R), donde R = 1/ lim sup
n

|an |.

Puede ocurrir que R = 0, en cuyo caso la serie converge s olo cuando x = 0. En el mejor de los casos R = , es decir la serie converge para todo x R. R se llama radio de convergencia de la serie. Para las series de Taylor de funciones anal ticas vale R = . En cambio, para funciones no anal ticas pero con derivadas de todos los ordenes vale 0 R < . Ejemplo La serie de potencias 1 + x + x2 + + xn +

6 Integral de una funci on

82

tiene radio de convergencia R = 1. Luego es absolutamente convergente para |x| < 1. Para estos x, y s olo para estos x, es 1 + x + x2 + + xn + = 1/(1 x). Para x = 1 la serie diverge a . Para x = 1 la serie oscila. Para |x| > 1 es tambi en divergente u oscilante, y absolutamente divergente. Una propiedad interesante de las series de potencias es que su convergencia es uniforme en todo x perteneciente a un intervalo [a, a] contenido en (R, R). Signica que dado |
i=n

> 0, arbitrario, existe n0 N, n0 = n0 ( , a) tal que

ai xi | < para todo n n0 .

Volviendo al punto inicial, vemos que la funci on f : R [0, ), f (x) = ex


2

es anal tica, puesto que ex lo es. M as a un, para obtener su serie de Taylor podemos reemplazar x por x2 en la serie de ex , quedando ex = 1 x2 + x4 /2 x6 /3! + x8 /4! + (1)n x2n /n! + . Supongamos ahora que queremos calcular
u 0
2

ex dx
2

para alg un u > 0. En el intervalo [0, u] los polinomios de Taylor de ex , es decir las sumas parciales de los primeros n t erminos de su serie de Taylor, se aproximan uniformemente a ex y por lo tanto las integrales denidas de esos polinomios tambi en se aproximan a
u 0 u x2 e 0
2

dx. As ,

ex dx
u

(1 x2 + x4 /2 x6 /3! + + (1)n x2n /n!)dx


u 0

x3 x5 x7 x2n+1 + + + (1)n 3 2!5 3!7 n!(2n + 1) u3 u5 u7 u2n+1 = u + + + (1)n . 3 10 42 n!(2n + 1) = x

6 Integral de una funci on

83

As como en este ejemplo, se pueden calcular integrales denidas, aproximadamente, de integrandos que carecen de primitivas expresables como funciones algebraicastrascendentes. Aun si la serie resultante no es una serie de potencias. Por ejemplo, la funci on de Cauchy, f (x) = e1/x si x = 0, f (0) = 0, tiene derivadas sucesivas de todos los ordenes, con valor nulo en el origen. Luego no es desarrollable en serie de Taylor, y por ende no anal tica. Sin embargo, podemos obtener una expresi on en serie no de potencias de esta funci on reemplazando x por 1/x2 en la serie de ex . Sigue que e1/x = 1
2 2

1 1 1 (1)n + + + + x2 2x4 3!x6 n!x2n

para todo x = 0. La convergencia de esta serie ser a uniforme en todo intervalo cerrado que no contenga al cero. As , por ejemplo, si queremos hallar
2 1

e1/x dx,

calculamos su valor aproximado mediante


2

1
1

1 1 1 (1)n + + + x2 2x4 3!x6 n!x2n

dx =
2

1 1 1 (1)n x+ 3 + + + x 6x 3!5x5 n!(2n 1)x2n1

.
1

7
7.1

Aplicaciones de la integral
Areas

Por su propia definici on, una integral definida permite obtener el area de una regi on expresable en t erminos de funciones. Debe tenerse en cuenta que la integral denida considera como negativa el area de aquellas regiones que se encuentran por debajo del eje de abscisas. As , por ejemplo,
0

cos x dx = 0.

Si se desea calcular el area total de la regi on de la gura, independientemente de si parte de la regi on queda por debajo del eje de abscisas, se debe hacer
0 /2

cos x dx +
/2

( cos x) dx = 1 + 1 = 2.

Como regla general, el area de una regi on encerrada entre curvas, gr acas de funciones, se calcula como
b

[f1 (x) f2 (x)] dx,


a

donde f1 (x) y f2 (x) son las funciones cuyas gr acas limitan a la regi on por arriba y por debajo, respectivamente.

7 Aplicaciones de la integral
4

85

0.5

1.5

Ejemplo Area encerrada por y = x2 , y = + x, entre 0 y 2. Es + x para 0 x 1 f1 (x) = x2 para 1 x 2, f2 (x) = Luego
1

x2 + x

para 0 x 1 para 1 x 2.

A=
0

[+ x x2 ] dx +
1 1

[x2

x] dx =
2

1 + 3

2 3/2 x3 x3 2 3/2 x + x = 3 3 0 3 3 1 8 2 8 1 2 10 2 8 + = . 3 3 3 3 3

7.2

Volumen y supercie de un s olido de revoluci on

Sea f una funci on positiva sobre un intervalo [a, b]. Imaginemos que cada punto sobre la curva, gr aca de la funci on, gira r gidamente alrededor del eje de abscisas, es decir manteniendo su distancia a dicho eje. Se forma as un s olido de revoluci on, si pensamos en el cuerpo lleno, o una supercie de revoluci on, si se considera s olo su envoltura. Para calcular el volumen de este cuerpo partimos el intervalo [a, b] en n subintervalos iguales de longitud (b a)/n.

7 Aplicaciones de la integral

86

y
2 1.5 1 0.5 1 2 3 4

12 0 -1 -2

2 1 0 -1 -2

x
Supercie de revoluci on engendrada por la curva de la anterior gura

El volumen aproximado de cada sector peque no de revoluci on es el producto del area del c rculo base por la altura del sector, (b a)/n. El area del c rculo 2 base es f (xi ), donde xi es un punto del subintervalo considerado. El volumen aproximado de todo el cuerpo es la suma de los vol umenes de estos peque nos sectores, o sea
i

f 2 (xi )(b a)/n. El volumen exacto del cuerpo es lim f 2 (xi )(b a)/n =
i a b

f 2 (x) dx.

Para calcular el area de la supercie de revoluci on se procede an alogamente. En este caso se aproxima la curva gr aca de la funci on por una poligonal obtenida a trav es de la partici on del intervalo [a, b].

7 Aplicaciones de la integral
2

87

1.5

0.5

0.5

1.5

El area aproximada de la supercie de revoluci on de cada peque no sector es 2f (xi ) Escribimos que y/x = f (xi ), donde xi es un punto interior al intervalo que se est a considerando. El punto xi que apareci o antes puede considerarse como este mismo punto. Luego el area aproximada de la supercie total es
n

x2 + y 2 .

x2 + y 2 =

y 2 1 + ( ) x. x

Si suponemos que f es derivable en [a, b] sigue por el Teorema del valor medio

2f (xi ) 1 + (f (xi ))2 xi .


i=1

El area exacta es el l mite de esta expresi on para n , lo que equivale a xi 0 para todo i. Pero este l mite es por denici on
b

2
a

f (x) 1 + (f (x))2 dx.

Ejemplo Volumen y area de una esfera de radio r. La esfera est a engendrada como s olido de revoluci on por la semicircunferencia y = + r 2 x2 . Luego su volumen es V x3 = (r x ) dx = r x 3 r
2 2 2 r r r

= r3

r 3

r3 +

r 3

4 = r3 . 3

7 Aplicaciones de la integral Para calcular el area de su supercie derivamos la expresi on de arriba, y = x/ r2 x2 = x/y. Luego
r r

88

A = 2
r r

1 + (y )2 dx = 2
r r

1 + x2 /y 2 dx
r r

= 2
r

y 2 + x2 dx = 2
r

r dx = 2r

dx = 4r2 .

7.3

Longitud de curvas
Si una funci on f tiene derivada continua, salvo a lo m as en una cantidad nita de puntos, entonces la curva dada por su gr aca es recticable, es decir se puede medir su longitud.

Para calcularla se aproxima la curva por una poligonal obtenida a trav es de una partici on del intervalo [a, b] en peque nos subintervalos, tal como se procedi o para obtener la supercie de un s olido de revoluci on. La longitud de cada segmento es x2 + y 2 = 1 + (y/x)2 x, donde, por el Teorema del valor medio, y/x = f (xi ), siendo xi un punto interior al subintervalo de la partici on correspondiente. En este caso sigue que la longitud exacta de la curva es
n b

L = lim Ejemplo

1 + (f (xi ))2 xi =
i=1 a

1 + (f (x))2 dx.

Longitud de la curva catenaria y = ch x, entre 0 y a. Es L=


0 a

1 + sh 2 (x) dx =
0

ch x dx = sh x|a 0 = sh a.

Si la curva est a expresada en coordenadas param etricas x = (t) y = (t), para t [ta , tb ], entonces la f ormula para la longitud de la curva es
tb

(1)

L=
ta

( (t))2 + ( (t))2 dt.

(2)

7 Aplicaciones de la integral

89

7.4

Movimiento en dos dimensiones

Estamos ya en condiciones de hacer un viaje en dos dimensiones. La posici on de un m ovil en su recorrido a trav es de una curva en el plano queda descrita precisamente por (1), donde el par ametro t representa al tiempo. La velocidad promedio del m ovil en un intervalo de tiempo [t1 , t] es el cociente entre la longitud del camino recorrido en ese tiempo y t t1 . Teniendo en cuenta la f ormula (2), esto es vp (t, t1 ) =
t t1

( (t))2 + ( (t))2 dt t t1

La velocidad instant anea en t1 es vi (t1 ) = lim vp (t, t1 ).


tt1

Si suponemos que las funciones derivadas y son ambas continuas entonces, por el teorema del valor medio del c alculo integral, sigue que vi (t1 ) = ( (t1 ))2 + ( (t1 ))2 .

Podemos decir que esta es una velocidad instant anea escalar que ignora la direcci on y sentido que lleva el m ovil en el instante t1 . Por razones f sicas (todos hemos experimentado la fuerza o empuj on que recibimos cuando vamos dentro de un coche que toma una curva) es importante considerar una velocidad instant anea dirigida que s tenga en cuenta los cambios de direcci on o sentido del m ovil. Esto se consigue mediante la denici on del vector velocidad. Este vector, llam emoslo V , tiene una direcci on con un sentido, y una magnitud, que resultar a precisamente ser igual a la velocidad instant anea escalar. Aqu tenemos una representaci on gr aca:

7 Aplicaciones de la integral

90

1.5

0.5

0.5

1.5

2.5

Un vector en R2 tiene dos componentes. La denici on del vector V responde al hecho de que el movimiento sobre una curva del plano equivale a un desplazamiento sobre el eje x y otro sobre el eje y en el plano cartesiano xy . Como ambos desplazamientos son rectil neos, sus razones de cambio vienen dadas por las derivadas y , respectivamente. De esta manera, el vector velocidad en un instante t es V (t) = ( (t), (t)). Si se considera en R2 el producto escalar usual, que lo convierte en el espacio eucl deo E 2 , entonces el m odulo de V (su magnitud) es precisamente la velocidad instant anea escalar vi . La aceleraci on tangencial escalar, a1 , es la raz on de cambio de la velocidad instant anea escalar. Luego a1 (t) = v i (t) = El vector aceleraci on, A(t), es A(t) = ( (t), (t)). Obviamente su direcci on o sentido no tienen por qu e ser los mismos que la direcci on o sentido del vector velocidad V . No obstante, podemos descomponer el vector A(t) en la suma de dos vectores ortogonales, uno de ellos con la direcci on de V , llam emoslo A1 (t), y el otro con una direcci on perpendicular a V , digamos A2 (t). (t) (t) + (t) (t) ( (t))2 + ( (t))2 .

7 Aplicaciones de la integral

91

1.5

A1 A A2

0.5

0.5

1.5

2.5

A1 (t) es el vector aceleraci on tangencial, mientras que A2 (t) es el vector aceleraci on centr peta, de direcci on ortogonal al anterior y con un sentido hacia la parte de adentro de la curva trayectoria. Para obtener sus expresiones consideremos la base ortonormal de E 2 , {B1 (t), B2 (t)}, donde B1 (t) = 1 1 V (t), B2 (t) = ( (t), (t)). ||V (t)|| ||V (t)||

As , B1 (t) es un vector unitario con la direcci on y sentido de V , y B2 (t) es un vector unitario perpendicular a V . Luego resulta que A1 (t) = (A(t) B1 (t))B1 (t) = a1 (t)B1 (t), A2 (t) = (A(t) B2 (t))B2 (t) = a2 (t)B2 (t). N otese que a1 (t) es precisamente la aceleraci on tangencial escalar, cuya expresi on hab a sido deducida antes como raz on de cambio de la velocidad instant anea escalar. Por otro lado, a2 (t) es la aceleraci on centr peta escalar. Si el m ovil tiene una masa m, independiente del tiempo, la segunda ley de Newton arma que la fuerza centr peta que se ejerce sobre el tiene una magnitud igual a ma2 (t). Asimismo, act ua sobre el m ovil una fuerza tangencial de magnitud ma1 (t).

7.5

Trabajo en un desplazamiento rectil neo

Si sobre un cuerpo se ejerce una fuerza que provoca un desplazamiento del mismo, entonces se ha producido un trabajo. Si el desplazamiento es rectil neo

7 Aplicaciones de la integral

92

y la magnitud de la fuerza, digamos F , es constante entonces se puede medir esa cantidad (escalar) de trabajo mediante el producto de la magnitud de la fuerza por la distancia recorrida: T = F x, donde se supone que el cuerpo se desplaza sobre el eje de abscisas desde x = a hasta x = b, x = b a. Si F no es constante, sino que depende de x, entonces el trabajo realizado desde a hasta b es el l mite de una suma de trabajos correspondientes a peque nos subintervalos de una partici on del intervalo [a, b]. Este proceso es precisamente el que se sigui o para denir la integral denida de la funci on F (x) entre a y b. Por lo tanto
b

T =
a

F (x) dx.

(3)

Sup ongase ahora que un gas ideal contenido en un cilindro ejerce una presi on p(x) que produce el desplazamiento rectil neo de un embolo desde x = a hasta x = b. La fuerza F (x) que act ua sobre el embolo es F (x) = p(x)S, donde S es la supercie del embolo, que es tambi en la supercie de la secci on transversal del cilindro. Usando la f ormula (3) y teniendo en cuenta la sustituci on v = xS, donde v es el volumen del gas correspondiente a la posici on x del embolo, sigue que el trabajo de expansi on del gas es
vb

T =
va

p(v/S ) dv.

Si el gas ideal se expande a temperatura constante (expansi on isot ermica) vale la ley de Boyle-Mariotte, que arma que el producto de la presi on por el volumen es constante. Luego
vb

T =
va

C/v dv = C ln

vb . va

Si el gas se expande a presi on constante, p0 , (expansi on isob arica) entonces


vb

T =
va

p0 dv = p0 (vb va ).

7 Aplicaciones de la integral

93

Por u ltimo, si el gas se expande sin intercambio de calor con el exterior (expansi on adiab atica), vale la ley de Poisson, que establece que el producto de la presi on por una potencia v k , donde k es una constante mayor que 1, es constante. De aqu
vb

T =
va

C/v k dv =

C k1

1
k 1 va

1
k 1 vb

k1 Como C = p(a)va va , se deduce que

p(a)va T = k1

va vb

k1

8
8.1

M etodos num ericos en C alculo


Ecuaciones de una variable

Sea f una funci on continua denida en un intervalo [a, b]. Un cero de f es un valor c [a, b] que satisface f (c) = 0. Tambi en se dice que c es una ra z de la ecuaci on anterior. Para mucha funciones f no existen f ormulas que permitan calcular ra ces de esa ecuaci on en forma exacta. En estos casos deben emplearse m etodos de aproximaci on de los ceros. El Teorema de Bolzano da un buen punto de partida para lograr tal nalidad. En efecto, si f (a)f (b) < 0, entonces el Teorema arma que debe de existir un cero en el intervalo (a, b). Si ahora evaluamos la funci on en su punto medio c1 = (a + b)/2, entonces o bien f (c1 ) = 0, o f (a)f (c1 ) < 0, o f (c1 )f (b) < 0. De esta manera, o ya hemos encontrado el cero (primer caso), o bien volvemos a una situaci on similar a la del comienzo, pero donde ahora la longitud del intervalo de b usqueda se ha reducido a la mitad (segundo o tercer casos). Sigue ahora un proceso recurrente, que termina cuando la precisi on de la estimaci on del cero sea la deseada. Al respecto, dado que el error que se comete es la diferencia en valor absoluto entre nuestra estimaci on y el verdadero cero, si la estimaci on se ja en el punto medio del intervalo de b usqueda, tendremos que una cota superior del error ser a la mitad de la longitud de este intervalo. Por ejemplo, si la longitud del intervalo inicial, b a, es igual a 1, entonces una estimaci on del cero mediante c1 dar a una cota del error igual a 1/2. Si pasamos al intervalo siguiente tendremos una cota del error igual a 1/4. En general, si hemos hecho i particiones del intervalo inicial, la cota del error ser a igual a 1/2i+1 . Una variaci on de este m etodo es el llamado de la posici on falsa o Regula Falsi. La u nica diferencia que tiene con la t ecnica anterior es que estima al

8 M etodos num ericos en C alculo

95

Estimaci on de un cero por el m etodo de la posici on falsa

cero de f mediante el cero de la funci on lineal que pasa por los puntos (a, f (a)) y (b, f (b)). As , la estimaci on en el primer paso es c1 = b f (b)(b a) . f (b) f (a)

Una ulterior modicaci on conduce al llamado m etodo de M uller. Consiste en elegir tres puntos iniciales, a < b < c, y considerar la funci on cuadr atica P (x) = r(x c)2 + s(x c) + t, que pasa por los puntos (a, f (a)), (b, f (b)) y (c, f (c)). Ahora la estimaci on del cero de f en el primer paso viene dada por el cero de la funci on cuadr atica m as cercano al punto c. Su expresi on es c1 = c 2t . s + sig (s) s2 4rt

En el segundo paso (y an alogamente en los siguientes) se reitera el procedimiento anterior, ahora usando los puntos b, c y c1 . Este m etodo es particularmente eciente en el c omputo de las ra ces de polinomios. Es de destacar que encuentra tanto ra ces reales como complejas. Los dos primeros m etodos expuestos aqu coinciden en el hecho de que las sucesivas estimaciones de la ra z siempre convergen al cero verdadero de la funci on. En efecto, esto est a garantizado por los distintos signos que toma

8 M etodos num ericos en C alculo

96

la funci on en los extremos de cada intervalo de b usqueda. No es el caso del m etodo de Mller, donde puede darse que en los tres puntos la funci on tome el mismo signo. Esto hace que en algunos casos las sucesivas aproximaciones no converjan a ning un punto. Por el contrario, en los casos de convergencia, esta suele ser m as r apida que con los dos procedimientos anteriores. Este rasgo de la t ecnica de Mller se da tambi en con el que es posiblemente el m etodo m as cl asico en este tema, que es el conocido como m etodo de Newton, o Newton-Raphson. Adem as de que es necesario para su aplicaci on la existencia y continuidad de la derivada f , su convergencia depende del buen comportamiento de la derivada segunda f en un entorno de la ra z.

8.2

Interpolaci on y aproximaci on polin omicas

Ya hemos visto en la secci on 6.4 que si una funci on f tiene derivadas hasta el orden n en un punto a entonces existe el polinomio de Taylor de grado n de esa funci on, desarrollado en a, Pn . Este polinomio es precisamente aqu el cuyas derivadas coinciden con las correspondientes primeras n derivadas de f en a. Esta coincidencia hace que el polinomio de Taylor de la funci on pueda considerarse como una aproximaci on de ella en un intervalo I , centrado en a. Esta aproximaci on es muy buena en las cercan as del punto a, pero deja de serlo a medida que nos alejamos de ese punto. M as precisamente, si existe la funci on derivada de orden n + 1 de f , entonces mediante una reiterada aplicaci on del Teorema de Cauchy, visto en la unidad 4, se prueba que f (x) Pn (x) = f (n+1) (c(x))(x a)n+1 , (n + 1)!

donde c(x) est a entre a y x. Si f (n+1) es una funci on acotada en el intervalo I , entonces la igualdad anterior permite acotar el error que se comete al aproximar la funci on por su polinomio de Taylor. La deciente aproximaci on de Pn fuera de las cercan as del punto a obedece a que su determinaci on sigue de condiciones establecidas s olamente en el punto a. Si se pretende obtener una aproximaci on razonablemente buena en todo el intervalo I entonces habr a que pensar en mecanismos de aproximaci on que tengan en cuenta el comportamiento de la funci on en todo I y no s olamente en el punto a. Esta idea conduce a la teor a de aproximaci on de funciones, iniciada en la segunda mitad del siglo pasado y ampliamente desarrollada durante este siglo. Se trata de denir una medida que cuantique el grado de

8 M etodos num ericos en C alculo

97

distanciamiento entre la funci on y un polinomio en el intervalo I . Dada una tal medida, el proceso contin ua con la obtenci on de un polinomio que realice la m nima distancia a la funci on. M as concretamente, supongamos que I (f, P ) indica una medida de distanciamiento entre una funci on continua f y un polinomio arbitrario P . Llamemos IPn al conjunto de todos los polinomios de grado a lo sumo n. Entonces P0 IPn se llama un mejor aproximante de f entre los polinomios de IPn , con respecto a I , si I (f, P0 ) I (f, P ) para todo P IPn . Las siguientes son medidas de distanciamiento muy utilizadas: max |f (x) P (x)|, x I, |f (x) P (x)| dx,
I

(4) (5) (6)

|f (x) P (x)|2 dx.


I

La tercera de ellas tiene la ventaja de presentar c alculos m as manejables para la obtenci on del mejor aproximante.
3 2 1 -3 -2 -1 -1 -2 -3 1 2 3

En el dibujo vemos la gr aca de la funci on f : [, ] R, f (x) = sen x, su polinomio de Taylor de primer grado desarrollado en cero y el mejor aproximante entre los polinomios de IP1 con respecto a la medida de distanciamiento (3). Los mejores aproximantes obtenidos con las tres medidas anteriores, si bien no son iguales, presentan la caracter stica com un de ser interpolantes de la funci on en al menos n + 1 puntos distintos del intervalo I . Es decir, existen n + 1 puntos diferentes en I en los cuales el mejor aproximante coincide con

8 M etodos num ericos en C alculo

98

la funci on. Los puntos de coincidencia tambi en dependen de la medida I que se use. Que el mejor aproximante de una funci on resulte un interpolante de esta es algo natural. El intento de acercar un polinomio a la funci on fuerza a aqu el a coincidir con la funci on en algunos puntos. La coincidencia no puede ser total, a menos que la funci on ya sea un polinomio en IPn . Es conveniente tener una f ormula para los polinomios interpolantes de una funci on en n + 1 puntos distintos de su dominio. En realidad existe un u nico polinomio en IPn con estas condiciones. Para jar ideas, supongamos que queremos encontrar el polinomio cuadr atico que coincide con una funci on f en tres puntos distintos de su dominio, x0 , x1 , x2 . El m etodo de Lagrange se basa en la observaci on de que el polinomio f (x2 ) (x x0 )(x x1 ) (x2 x0 )(x2 x1 )

vale f (x2 ) en x = x2 y vale cero en x = x0 y x = x1 . De esta manera se deduce que el u nico polinomio interpolador en IP2 viene dado por la expresi on f ( x0 ) (x x1 )(x x2 ) (x x0 )(x x2 ) (x x0 )(x x1 ) + f (x1 ) + f (x2 ) . (x0 x1 )(x0 x2 ) (x1 x0 )(x1 x2 ) (x2 x0 )(x2 x1 )

Ejercicio: Obtener la expresi on general del polinomio en IPn que coincide con f en los n + 1 puntos distintos x0 , x1 , , xn . El m etodo de Newton consiste en escribir el polinomio interpolador de la funci on en los puntos xi , i = 0, 1, , n, en la forma (suponemos n 2) P (x) = Pn2 (x) + c1 (x x0 ) (x xn2 ) + c0 (x x0 )(x x1 ) (x xn1 ). Tanto el polinomio Pn2 como los coecientes c0 y c1 quedan un vocamente determinados por las condiciones de interpolaci on. El coeciente c0 es el correspondiente al t ermino de mayor grado del polinomio interpolante de f en los n + 1 puntos x0 , x1 , , xn . Teniendo en cuenta esta denici on, v alida para todo n 0, lo renombramos c0 = f [x0 , x1 , , xn ]. Observar que en la anterior notaci on no importa el orden de los puntos que aparecen entre corchetes. Por denici on, c1 = f [x0 , , xn1 ]

8 M etodos num ericos en C alculo

99

y Pn2 es el u nico polinomio en IPn2 que interpola a f en los puntos x0 , , xn2 . Luego, por denici on de f [x0 , , xn2 , xn ], es Pn2 (xn ) + f [x0 , , xn2 , xn ](xn x0 ) (xn xn2 ) = f (xn ), es decir f [x0 , , xn2 , xn ] = Como P (xn ) = f (xn ), sigue que f [x0 , x1 , , xn ] = f (xn ) Pn2 (xn ) f [x0 , , xn1 ](xn x0 ) (xn xn2 ) = (xn x0 ) (xn xn2 )(xn xn1 ) = xn xn1 f [x0 , , xn2 , xn ] f [x0 , , xn1 ] . xn xn1 Intercambiando xn1 con x0 sigue la denci on m as conocida de la llamada diferencia dividida de orden n: f [x0 , x1 , , xn ] = f [x1 , , xn1 , xn ] f [x0 , , xn1 ] . xn x0
f (xn )Pn2 (xn ) (xn x0 )(xn xn2 )

f (xn ) Pn2 (xn ) . (xn x0 ) (xn xn2 )

f [x0 , , xn1 ]

Por su propia denici on, resulta evidente que f [x0 ] = f (x0 ) y f (x1 ) f (x0 ) . x1 x0 De esta manera las diferencias divididas quedan denidas por recurrencia. Por f [x0 , x1 ] = u ltimo, se concluye que el polinomio interpolador de Newton tiene la forma P (x) = f [x0 ] + f [x0 , x1 ](x x0 ) + + f [x0 , x1 , xn ](x x0 )(x x1 ) (x xn1 ). Si la funci on f tiene derivadas continuas hasta el orden n en su dominio entonces una sucesiva aplicaci on del Teorema del valor medio prueba que f [x0 , x1 , , xn ] = f (n) (n )/n!, donde n es un punto intermedio entre el m nimo y m aximo de los puntos xi . En este caso es interesante notar que cuando todos los puntos xi se aproximan

8 M etodos num ericos en C alculo

100

a un punto a entonces el polinomio interpolante converge al Polinomio de Taylor de grado n de la funci on, desarrollado en a. Signica que bajo estas circunstancias la interpolaci on en n + 1 puntos distintos se transforma en una interpolaci on en un u nico punto, pero donde ahora la coincidencia se da en todas las derivadas hasta el orden n.

Espacio vectorial sobre los reales

Sea V un conjunto no vac o. Llamaremos A, B, V, V1 , etc., a los elementos de V . Supongamos que en V hay denida una operaci on binaria entre sus elementos, que llamaremos suma, y que simbolizamos por +. As , para cualquier par de elementos de V , digamos A y B, A + B es otro elemento de V . Requerimos de esta suma que tenga las siguientes propiedades: 1) A + B = B + A A, B V (Propiedad conmutativa). 2) A + (B + C ) = (A + B ) + C A, B, C V (Propiedad asociativa). Esta propiedad permite escribir sin ambigedad A + B + C . 3) Existe en V un particular elemento, que se llama elemento neutro, o elemento nulo, o simplemente cero, que denotamos O, que satisface A + O = A A V . 4) Para todo elemento A en V existe un elemento en V , llamado opuesto de A, que se denota A, tal que A + (A) = O. Ejercicios i) El cero es u nico. ii) A V , su opuesto es u nico. Cu al es el opuesto de cero? Un conjunto no vac o V en el que exista una operaci on de suma con estas cuatro propiedades se llama grupo conmutativo o abeliano. Ahora bien, si queremos que V sea un espacio vectorial debemos pedir la existencia de otra operaci on, llamada externa, porque opera un n umero real con un elemento de V . De esta manera, a R y B V , existe el producto a izquierda, aB , que es otro elemento de V . Esta operaci on tiene las siguientes propiedades: 5) (a + b)V = aV + bV . 6) a(B + C ) = aB + aC 7) a(bC ) = (ab)C 8) 1A = A A V

9 Espacio vectorial sobre los reales Ejercicios iii) Probar que aO = O a R iv) Probar que 0A = O A V Un conjunto V , con las operaciones de suma y producto por un n umero real a izquierda, que veriquen las propiedades 1) a 8), se llama espacio vectorial sobre R.

102

Un espacio vectorial debe tener por elementos a O, de acuerdo con la propiedad 3). Pero, rec procamente, un conjunto con un u nico elemento, O, con las operaciones O + O = O, aO = O a R, es un espacio vectorial, pues se verican las propiedades 1) 8). Se llama espacio vectorial nulo y es un ejemplo trivial de espacio vectorial. El mismo conjunto de numeros reales, R, con las operaciones habituales de suma y producto, es un espacio vectorial. Ejercicio: comprobar que (R, +, .) es un espacio vectorial. Llamamos R2 al conjunto de pares ordenados de n umeros reales (a, b), donde se dene (a, b) + (c, d) = (a + c, b + d), (a, b) = (a, b) Ejercicio: compruebe que R2 es un espacio vectorial. Como ya se sabe, los elementos de R2 se pueden representar por puntos del
d sA B d d d d  A I   A + B  

     B  d E

plano (indicados en el dibujo por las puntas de las echas). An alogamente se dene el espacio Rm , para m > 2 (R1 = R).

9.1

Subespacios

Sea V un espacio vectorial no nulo. Si S V y S es tambi en un espacio vectorial, se entiende con las mismas operaciones de V , entonces S se dice

9 Espacio vectorial sobre los reales

103

subespacio de V . S ser a un subespacio de V si y s olo si valen las siguientes condiciones: a) A, B S , vale que A + B S . b) R y A S , vale que A S . Est a claro que {O}, donde O es el elemento nulo de V , es siempre un subespacio de V . Ejemplo Consideremos V = R2 . Sea S = {(0, a), a R}. S es un subespacio de R2 . En efecto, sean A y B dos vectores arbitrarios de S . Luego ser a A = (0, a), B = (0, b), y A + B = (0 + 0, a + b) = (0, a + b), y este elemento tambi en est a en S . Por otra parte, si U es el subconjunto de V = R2 de la forma U = {(1, a), a R}, entonces U no es subespacio de R2 , pues, por ejemplo, (1, 1) U , (1, 2) U , pero (1, 1) + (1, 2) = (2, 3) / U. Ejercicio: compruebe que tampoco se cumple la condici on b). Sea V un espacio vectorial tal que existe A V , A = O. Es decir, V = {O}. El subconjunto de V de la forma {A : R} es un subespacio de V . En efecto, veamos que se cumplen las condiciones a) y b). La suma de dos elementos cualesquiera de este subconjunto es 1 A + 2 A = (1 + 2 )A, que vemos pertenece al conjunto. El producto a izquierda de un elemento de este subconjunto por un n umero real es: 1 (0 A) = (1 0 )A, que tambi en pertenece al subconjunto. Luego es subespacio vectorial. Se lo denota < A > y se dice que es el subespacio generado por el vector A.

9 Espacio vectorial sobre los reales

104

An alogamente, si A y B son dos vectores de V , A = O, B = O, el subconjunto de V de la forma {1 A + 2 B, 1 , 2 R} es un subespacio de V , que se denota < A, B > y se llama subespacio generado por A y B . En general, si tenemos una cantidad nita de vectores de un espacio V , digamos A1 , A2 , ...Am , se llama combinaci on lineal de esos vectores al vector 1 A1 + 2 A2 + ... + m Am , donde 1 , 2 , , m , son reales arbitrarios. Entonces el subespacio generado por A1 , A2 , ..., Am es el conjunto formado por todas las combinaciones lineales de esos vectores, y se simboliza < A1 , A2 , ..., Am > . Ejemplo Ya vimos que S = {(0, a) : a R} es un subespacio de R2 . Coincide con el subespacio < (0, 1) >, es decir, el subespacio generado por el vector (0, 1), ya que (0, a) = a(0, 1). Ejercicio. Comprobar que es tambi en S =< (0, a0 ) >, con a0 jo, a0 = 0. Sean S y T dos subconjuntos de un mismo espacio V . Se dene S + T = {A + B : A S , B T }. Si S y T son subespacios de V , entonces S + T es tambi en subespacio de V . En efecto, la suma de dos vectores de S + T es C1 + C2 = (A1 + B1 ) + (A2 + B2 ), donde A1 , A2 S , B1 , B2 T . Luego C1 + C2 = (A1 + A2 ) + (B1 + B2 ). Como S es subespacio, A1 + A2 S . Como T es subespacio, B1 + B2 T . Luego C1 + C2 S + T .

9 Espacio vectorial sobre los reales

105

Por otra parte, el producto por un real a izquierda de un vector de S + T es C = (A + B ), donde A S , B T . Luego C = A + B . Como S es subespacio, A S . Como T es subespacio, B T , y por lo tanto C S + T . Como es sabido, la intersecci on de dos conjuntos es el conjunto formado por los elementos que est an simult aneamente en ambos conjuntos. Si S y T son subespacios de un espacio V , su intersecci on S T es tambi en un subespacio de V . Si S y T son dos subespacios de un espacio V y S T = {O}, entonces el subespacio suma S + T se llama suma directa de S y T y se simboliza S T . En este caso todo elemento de S T se puede poner, de una u nica manera, como suma de un vector de S m as un vector de T . En efecto, si A1 + B1 = A2 + B2 , A1 , A2 S , B1 , B2 T , entonces A1 A2 = B2 B1 S T . Luego debe ser A1 A2 = B2 B1 = O, por lo tanto A1 = A2 , B1 = B2 . Rec procramente, si todo vector de S + T se puede poner, de una u nica forma, como suma de un vector de S m as un vector de T , entonces S + T es suma directa, es decir, S T = {O}. En efecto, si A S T , A = O, entonces O = O + O = A + (A), es decir, el vector nulo se puede escribir de dos formas distintas como suma de un vector en S m as un vector en T . Si un espacio V es suma directa de dos subespacios S y T , es decir, V = S T , entonces S y T se llaman subespacios suplementarios de V .

9 Espacio vectorial sobre los reales Ejemplo En V = R2 , sean: S = {(a, 0) : a R}, T = {(0, b) : b R}.

106

Es muy f acil probar que R2 = S T , y por lo tanto S y T son subespacios suplementarios de R2 (Ejercicio). Si U y V son dos espacios vectoriales, el producto cartesiano U V = {(A, B ), A U , B V} es tambi en un espacio vectorial con la operaci on de suma denida por (A1 , B1 ) + (A2 , B2 ) = (A1 + A2 , B1 + B2 ), y el producto a izquierda denido por (A, B ) = (A, B ). De esta manera, R2 = R R, y si se dene an alogamente el espacio producto cartesiano de n espacios vectoriales, n N, se obtiene que Rn = R R R, donde R gura n veces en la parte derecha de esta igualdad. Sea S un subespacio de un espacio V y sea A0 un vector en V . El conjunto A0 + S = {A0 + A, A S} se llama variedad lineal. Es decir, una variedad lineal es el trasladado de un subespacio. Ejercicio: Probar que una variedad lineal A0 + S es un subespacio si y s olo si A0 S . Ejemplo En R2 , el conjunto {(1, b), b R} es una variedad lineal porque se puede poner, por ejemplo, como (1, 0) + S , donde S es el subespacio (0, b), b R. La variedad lineal A0 + S se dice dirigida por S o que tiene la direcci on de S .

9 Espacio vectorial sobre los reales

107

9.2

Aplicaciones lineales

Sean U y V dos espacios vectoriales sobre R. Una aplicaci on :U V se dice lineal si a) (A1 + A2 ) = (A1 ) + (A2 ) A1 , A2 U , b) (A) = (A) R, A U . Cuando V = U , la aplicaci on lineal recibe el nombre de endomorsmo. Cuando V = R, la aplicaci on lineal se llama forma lineal. Ejemplos 1) Sea 0 un n umero real jo. Entonces : U U , dado por (A) = 0 A, es una aplicaci on lineal, que recibe el nombre de homotecia de raz on 0 . Ejercicio: Probar que en efecto es lineal. El caso 0 = 1 corresponde a la aplicaci on identidad. El caso 0 = 0 corresponde a la aplicaci on nula. 2) Sea V = S T . Entonces todo A V se escribe de una u nica forma como suma de un vector en S m as un vector en T : A = B + C, B S , C T . Quiere decir que cada vector en V determina un u nico vector en S y un u nico vector en T . Esto determina a su vez dos aplicaciones 1 y 2 , 1 : V S , 2 : V T , de manera que A = 1 (A) + 2 (A). 1 y 2 resultan aplicaciones lineales. Probemos, por ejemplo, que 1 es lineal. Tenemos que A1 = 1 (A1 ) + 2 (A1 ), A2 = 1 (A2 ) + 2 (A2 ). Luego A1 +A2 = 1 (A1 )+1 (A2 )+2 (A1 )+2 (A2 ). Como 1 (A1 )+1 (A2 ) S , 2 (A1 ) + 2 (A2 ) T , y la forma de poner cualquier elemento de V como suma de uno de S m as uno de T es u nica, sigue que 1 (A1 + A2 ) = 1 (A1 ) + 1 (A2 ) y 2 (A1 + A2 ) = 2 (A1 ) + 2 (A2 ).

9 Espacio vectorial sobre los reales Por otra parte, si A = 1 (A) + 2 (A) entonces, R, A = 1 (A) + 2 (A).

108

Como S y T son subespacios, 1 (A) S , 2 (A) T , y por lo tanto 1 (A) = 1 (A) , 2 (A) = 2 (A). Estas aplicaciones lineales se llaman proyecciones, de V sobre S , 1 , de V sobre T , 2 . M as precisamente, 1 se llama proyecci on de V sobre S paralelamente a T , 2 se llama proyecci on de V sobre T paralelamente a S . Sean U y V dos espacios vectoriales sobre R y sea :U V una aplicaci on lineal. U y V se llaman dominio y codominio de la aplicaci on, respectivamente. La imagen de la aplicaci on, que se nota Im, es el subconjunto del codominio V , denido por Im = {V V : existe U U , (U ) = V }. Probemos que Im es un subespacio de V . Sean V1 , V2 Im. Luego existen U1 , U2 U tal que (U1 ) = V1 , (U2 ) = V2 . Por lo tanto, como es lineal, (U1 + U2 ) = (U1 ) + (U2 ) = V1 + V2 . Luego V1 + V2 Im. Ahora sea V Im. Luego existe U U tal que (U ) = V . Por lo tanto (U ) = (U ) = V , por lo que V Im para todo R. Puede ocurrir que Im coincide con V . En este caso todo vector en V proviene de alg un vector de U mediante . Cuando esto sucede se dice que es suprayectiva. Ejemplo: las proyecciones son suprayectivas (Ejercicio). Ahora deniremos un particular subespacio del dominio de . Sea N = {U U : (U ) = O}.

9 Espacio vectorial sobre los reales

109

Este subconjunto de U se llama n ucleo de . Observar que el vector O que aparece en su denici on es el cero de V . Probemos que es un subespacio. Sean U1 , U2 N . Luego (U1 + U2 ) = (U1 ) + (U2 ) = O + O = O. Por consiguiente U1 + U2 N . Sea U N . Luego (U ) = (U ) = O = O para todo R. Luego U N . Si N = U entonces (U ) = O U U y por lo tanto es la aplicaci on nula. Si en cambio N = {O} ( este es el cero de U ) entonces el u nico vector de U que se aplica mediante al cero de V es el cero de U . En este caso la aplicaci on se llama inyectiva. La inyectividad de es equivalente al siguiente hecho: Dos vectores distintos de U se aplican a dos vectores distintos de V . En efecto, sea N = {O}, y sean U1 , U2 U , U1 = U2 . Luego debe ser (U1 ) = (U2 ), porque si fuera (U1 ) = (U2 ) seguir a que (U1 ) (U2 ) = O, es decir (por la linealidad de ) (U1 U2 ) = O, es decir (como N = {O}), U1 U2 = O, o sea U1 = U2 , contradicci on. Rec procamente, si dos vectores distintos y arbitrarios de U se aplican mediante a dos vectores distintos de V , entonces debe ser N = {O}. En efecto si fuera N = {O} entonces existir a A U , A = O, (A) = O, o sea que dos vectores distintos de U se aplican al mismo vector de V . Si : U V es una aplicaci on lineal inyectiva y suprayectiva al mismo tiempo (o sea, biyectiva), entonces se llama isomorsmo y los espacios U y V se dicen isomorfos. Supongamos ahora que tenemos tres espacios vectoriales U , V , W . Si : U V es lineal y : V W es lineal, entonces queda determinada la aplicaci on composici on : U W , denida como ( )(U ) = ((U )) U U . Esta composici on de aplicaciones lineales resulta tambi en lineal (Ejercicio). Si y son inyectivas entonces es inyectiva. Si y son suprayectivas entonces es suprayectiva. Luego si y son biyectivas (isomorsmos),

9 Espacio vectorial sobre los reales

110

es tambi en biyectiva (isomorsmo). Si : U V es isomorsmo, entonces existe la llamada aplicaci on inversa, que se denota 1 , 1 : V U , que es tambi en un isomorsmo, y que satisface 1 = idV , 1 = idU , donde idV : V V , idV (V ) = V V V , y an alogamente para idU . Consideremos ahora el conjunto de todas las aplicaciones lineales : U V , donde U y V son dos espacios vectoriales jos. Este conjunto no es vac o, ya que la aplicaci on nula, esto es la que aplica todo vector de U al cero de V , es lineal. Si 1 y 2 son dos aplicaciones lineales de U a V , podemos denir una aplicaci on suma 1 + 2 : U V , de la siguiente manera (1 + 2 )(U ) = 1 (U ) + 2 (U ) U U. Asimismo, podemos denir el producto a izquierda de una aplicaci on de U a V por un n umero real , : U V , ()(U ) = (U ) U U . Observar que estas operaciones son posibles porque se est a operando en realidad con vectores del espacio V . Por este motivo, estas operaciones cumplen con las propiedades 1) a 8) de un espacio vectorial, y por ende convierten al conjunto de todas las aplicaciones lineales de U a V en un espacio vectorial, llamado Hom(U ,V ). Este espacio tiene por elementos o vectores a aplicaciones lineales entre dos espacios vectoriales jos. Como ejemplo, supongamos que U = R. Consideremos entonces el conjunto de todas las aplicaciones lineales : R V . Si V = {O}, la u nica aplicaci on que se puede denir es la aplicaci on nula y por lo tanto Hom(R, {O}) es isomorfo a {O}. Supongamos que V = {O}. O sea que en V hay vectores no nulos. Obviamente los vectores de R son n umeros reales y por tanto los denotamos con letras min usculas.

9 Espacio vectorial sobre los reales

111

Tenemos que (1) = A para alg un A V . Como = 1 R y es lineal sigue que () = (1) = (1) = A. Signica que cualquier aplicaci on lineal entre R y V queda determinada por su valor en 1, (1). A su vez (1) puede ser cualquier vector de V . Por lo tanto hay una correspondencia (biun voca) entre Hom(R,V ) y V . M as a un, esta correspondencia es lineal y por consiguiente Hom(R,V ) es isomorfo a V (Ejercicio). (Se puede usar mbolo de isomorsmo). = como s Sea V un espacio vectorial, V = {O}. Sea A V , A = O. El subespacio generado por A, < A >= {A, R}, se llama una recta vectorial, dirigida por A. El trasladado de una recta vectorial, es decir una variedad lineal B0 + < A >, se llama recta af n, o simplemente recta. Si H es un subespacio suplementario de una recta vectorial < A >, entonces H se llama hiperplano vectorial. Por tanto H satisface V =< A > H. El trasladado de un hiperplano vectorial se llama hiperplano af n. Sea : V R una forma lineal no nula. Luego existe A V , a = (A) = 0. Sea B un vector arbitrario en V , (B ) = b R, y consideremos el vector B (b/a)A V . Tenemos que (B (b/a)A) = (B ) (b/a)(A) = b (b/a)a = 0. Por lo tanto B (b/a)A N . Como B es un vector arbitrario de V y B = (b/a)A + (B (b/a)A hemos probado que V =< A > +N . Ahora bien, sea V < A > N . Como V < A > es V = cA. Como V N es (cA) = 0. Pero 0 = (cA) = c(A) = ca. Luego c = 0 y V = O. Hemos probado que V =< A > N , es decir que el n ucleo de una forma lineal no nula es un hiperplano vectorial en V . Rec procramente, probaremos en lo que sigue que todo hiperplano vectorial en un espacio V es el n ucleo de alguna forma lineal : V R. Sea H un hiperplano vectorial en V . Luego, por denici on de hiperplano vectorial, V =< A > H, donde A V , A = O.

9 Espacio vectorial sobre los reales Tenemos que para B V , B = 1 (B ) + 2 (B ), donde 1 : V < A >, 2 : V H son las proyecciones inducidas por la suma directa dada.

112

Tenemos que 1 es lineal y 1 (B ) = B A, B R. Consideremos la forma : V R, denida por (B ) = B . resulta lineal. En efecto, evaluemos (B1 + B2 ). Para esto debemos calcular a su vez 1 (B1 + B2 ) = 1 (B1 ) + 1 (B2 ) = B1 A + B2 A = (B1 + B2 )A. Luego (B1 + B2 ) = B1 + B2 = (B1 ) + (B2 ). Por otra parte 1 (B ) = 1 (B ) = B A. Luego (B ) = B = (B ), y resulta una forma lineal. Veamos ahora que N = H. Sea V N . Adem as V = 1 (V ) + 2 (V ), 1 (V ) < A >, 2 (V ) H. Como (V ) = 0 sigue que 1 (V ) = (V )A = O. Luego V = O + 2 (V ) = 2 (V ) H. As , hemos probado que N H. Sea ahora V H. Luego 1 (V ) = O pues V = O + V . Por consiguiente 1 (V ) = 0A y (V ) = 0. Sigue que H N y por lo tanto N = H.

9.3

Independencia lineal. espacios vectoriales

Representaci on de

Sea V un espacio vectorial, V = {O}. Sea A V , A = O. Si R, = 0, entonces A = O. En efecto, si fuera A = O seguir a que 1 (A) = (1 )A = 1A = A = 1 O = O, que es una contradicci on, ya que A = O. Se deduce que, si 1 = 2 , entonces 1 A = 2 A. En efecto, si 1 A = 2 A

9 Espacio vectorial sobre los reales

113

entonces O = 2 A 1 A = (2 1 )A y por lo tanto ser a 2 1 = 0, es decir 1 = 2 . Por otro lado, 0A = O. Luego el u nico real que da por resultado A = O es = 0. Esta es una propiedad que no posee el vector nulo. En efecto, O = O para todo R. Como ya sabemos, el conjunto de vectores {A : R}, que lo hemos denotado por < A >, es un subespacio vectorial de V , llamado recta vectorial. Ahora este nombre queda justicado. Existe una correspondencia biun voca entre < A > y R, pues todo vector de < A > es de la forma A para un u nico R, y rec procamente, todo n umero real determina el vector A < A >. R < A > A. M as a un, esta correspondencia es lineal, pues si 1 1 A, 2 2 A, entonces (1 + 2 ) (1 + 2 )A = 1 A + 2 A, y 1 (1 )A = (1 A). Luego < A > = R. Sea B V . Sabemos que 0A + 0B = O + O = O. Es decir, si en una combinaci on lineal de dos vectores de V los n umeros reales que multiplican a izquierda son ambos nulos, el resultado es el vector nulo de V . Pero podemos preguntarnos: si alguno de esos dos reales no es nulo, puede ser O el resultado de esa combinaci on lineal ? La respuesta depende de d onde elegimos el vector B . Si B < A > la respuesta es armativa. En efecto, si B = O < A > entonces 0A + 1O = O + O = O, y 1 = 0. Si B = A, con = 0, entonces ()A + 1B = O. Si en cambio, B / < A >, la respuesta es no. En efecto, supongamos 1 A + 2 B = O. Si 2 = 0, queda 1 A = O y luego 1 = 0 (estamos suponiendo A = O). Si 2 = 0 queda
1 1 1 1 O = 2 O = 2 1 A + 2 2 B = 2 1 A + B, 1 y por consiguiente B = 2 1 A, es decir B < A >.

En este punto conviene introducir las siguientes deniciones.

9 Espacio vectorial sobre los reales Un vector A se dice linealmente dependiente si A = O para alg un real = 0. Se dice tambi en que el sistema {A} es ligado. Si A no es linealmente dependiente entonces se dice que es linealmente independiente, o tambi en que el sistema {A} es libre. Dos vectores A,B se dicen linealmente dependientes (l.d.) si 1 A + 2 B = O, no cumpli endose 1 = 2 = 0. Tambi en se dice que el sistema {A, B } es ligado. Se dicen linealmente independientes (l.i.) cuando no son linealmente dependientes. En este caso tambi en se dice que el sistema {A, B } es libre.

114

De la discusi on anterior se deduce que para un sistema de un vector {A}, este es ligado si y s olo si A = O. Las tres armaciones siguientes son equivalentes: (i) {A, B } es ligado (ii) A < B > o {B } es ligado (B = O). (iii) B < A > o {A} es ligado (A = O). Vimos que si {A} es libre entonces < A > / < A > entonces, = R. Si B por las equivalencias anteriores, {A,B } debe ser un sistema libre y < A, B > debe ser un subespacio m as grande que < A >. Es decir, < A >< A, B >, siendo esta una contenci on estricta. Veremos que < A, B > on , = R2 . En efecto, vamos a mostrar una aplicaci :< A, B > R2 , que resultar a lineal y biyectiva. Sea 1 A + 2 B < A, B >. Denimos (1 A + 2 B ) = (1 , 2 ) R2 . Veamos que es lineal. Sean C = 1 A + 2 B, C = 1 A + 2 B,

9 Espacio vectorial sobre los reales dos vectores en < A, B >. Es C + C = 1 A + 2 B + 1 A + 2 B = (1 + 1 )A + (2 + 2 )B. Luego, por la denici on de , es

115

(C + C ) = (1 + 1 , 2 + 2 ) = (1 , 2 ) + (1 , 2 ) = (C ) + (C ). Falta ver que (aC ) = a(C ) para todo a R. Tenemos que aC = a(1 A + 2 B ) = a1 A + a2 B. Por denici on de es (aC ) = (a1 , a2 ) = a(1 , 2 ) = a(C ). Luego es lineal, y es claramente suprayectiva. Veamos que tambi en es inyectiva. Como es lineal, basta ver que N = {O}. Esto tambi en es evidente, ya que si (1 A + 2 B ) = (1 , 2 ) = (0, 0), entonces 1 = 0, 2 = 0 y por lo tanto 0A + 0B = O. Luego es un isomorsmo. Tenemos entonces que si {A} es libre, < A > = R. Si {A, B } es libre, < A, B > = R2 . El vector A, que genera a < A >, y forma un sistema libre, se llama una base de A. Hay que destacar que cualquier vector no nulo de < A > es tambi en una base de < A >. Por ejemplo, 2A = O y < 2A >=< A >. En efecto, el conjunto {(2A) : R} es igual al conjunto {A : R}, dado que (2A) = (2)A, y cuando recorre todo R, 2 tambi en recorre todo R. Signica que hay innitas bases de < A >, tantas como vectores no nulos. Si B < A >, {A, B } ya no es base de < A > porque si bien A y B tambi en generan a < A >, ahora el sistema {A, B } no es libre. Si {A, B } es un sistema libre entonces {A, B } es base de < A, B >. Todo par de vectores l.i. de < A, B > ser a tambi en base de ese subespacio. Una base de < A, B > no puede estar constituida por s olo un vector porque en este caso A y B ser an m ultiplos de ese vector y por lo tanto no ser an l.i.

9 Espacio vectorial sobre los reales

116

Pero una base tampoco puede estar formada por m as de dos vectores. En efecto, probaremos a continuaci on que tres vectores en < A, B > son necesariamente l.d. Supongamos que C1 , C2 , C3 son tres vectores l.i. de < A, B >. Entonces C2 , C3 deben ser l.i. (Ejercicio). Si A < C2 , C3 > y B < C2 , C3 > sigue que < A, B >< C2 , C3 > pero como < C2 , C3 >< A, B > se obtiene que < C2 , C3 >=< A, B > . Luego C1 < C2 , C3 > y {C1 , C2 , C3 } ser a ligado, contrariamente a lo que estamos suponiendo. Supongamos entonces que, por ejemplo, A / < C2 , C3 >. Se deduce que {A, C2 , C3 } es un sistema libre. Ahora se repite el razonamiento con otros vectores. Si B < A, C3 >, como A < A, C3 >, seguir a que < A, B >< A, C3 > y por lo tanto < A, B >=< A, C3 >. De aqu se deduce que C2 < A, C3 > y {A, C2 , C3 } no ser a un sistema libre. Entonces B / < A, C3 >, es decir {A, B, C3 } es un sistema libre. Pero esto es una contradicci on, pues C3 < A, B >. La contradicci on proviene de suponer que {C1 , C2 , C3 } es libre. En conclusi on, toda base de < A, B > estar a formada por dos vectores l.i. M as generalmente, se dice que B1 , B2 , , Bn , n N, son linealmente dependientes (l.d.), o bien que el sistema {B1 , B2 , , Bn } es ligado, si vale que 1 B1 + 2 B2 + + n B n = O para reales 1 , 2 , , n , no todos nulos. Si B1 , B 2 , , B n no son l.d., entonces se dice que son linealmente independientes (l.i.), o bien que el sistema {B1 , B2 , , Bn } es libre.

9 Espacio vectorial sobre los reales Si un espacio vectorial V es generado por un sistema libre, es decir V =< B1 , B2 , , Bn >, entonces este sistema se llama una base de V . Cualquier otra base de V estar a formada por n vectores l.i. de V . Este n umero natural n, que depende por tanto de V , y no de la base que se considere, se llama la dimensi on del espacio V (n = dim V ).

117

As , una recta vectorial, es decir un espacio generado por un vector l.i. B1 (o sea B1 = O) tiene dimensi on 1. Resulta < B1 > = R. Un espacio generado por un sistema libre {B1 , B2 } tiene dimensi on 2 y resulta < B1 , B2 > = R2 . En general, un espacio generado por un sistema libre {B1 , B2 , , Bn }, n N, tiene dimensi on n y resulta < B1 , B2 , , Bn > = Rn . Sea V un espacio vectorial de dimensi on n, es decir, generado por una base formada por n vectores. Entonces en V no puede haber m as de n vectores l.i. Por otra parte, n vectores l.i. de V forman una base del espacio. Si S es un subespacio de V de dimensi on r, entonces r n. Si {S1 , , Sr } es una base de S entonces se pueden encontrar en V n r vectores l.i., Cr+1 , , Cn , de modo que {S1 , , Sr , Cr+1 , , Cn } sea base de V . Este resultado se conoce como extensi on de base: Toda base de un subespacio de V puede extenderse a una base de V. Los vectores l.i. que se agregan a la base de S son a su vez base de un subespacio U , suplementario de S , es decir V = S U.

9 Espacio vectorial sobre los reales Rec procamente, si V = S T entonces dim V = dim S + dim T .

118

Ahora sean V y W dos espacios vectoriales de dimensi on n y m, respectivamente. Sea : V W una aplicaci on lineal. Como ya se sabe, N es un subespacio de V , e Im es un subespacio de W . Probemos que dim V = dim N + dim Im. En efecto, sea {V1 , , Vr } una base de N . Si r = n entonces es la aplicaci on nula y dim Im = 0, por lo que la f ormula es v alida. Si r < n entonces podemos extender {V1 , , Vr } a una base de V agregando n r vectores Vr+1 , , Vn linealmente independientes. Veamos que {(Vr+1 ), , (Vn )} es una base de Im. Probemos primero que este sistema es libre. Supongamos r+1 (Vr+1 ) + + n (Vn ) = O. Como es lineal la igualdad anterior se escribe (r+1 Vr+1 + + n Vn ) = O. Luego r+1 Vr+1 + + n Vn N . De aqu sigue que r+1 Vr+1 + + n Vn = 1 V1 + + r Vr , es decir 1 V1 + + r Vr r+1 Vr+1 n Vn = O. Pero {V1 , , Vn } es una base de V y por lo tanto es un sistema libre, por lo que 1 = = r = r+1 = = n = 0. Veamos ahora que < (Vr+1 ), , (Vn ) >= Im. Sea W Im. Luego W = (A), A V . Pero A = a1 V1 + + ar Vr + ar+1 Vr+1 + + an Vn ,

9 Espacio vectorial sobre los reales y (A) = ar+1 (Vr+1 ) + + an (Vn ), pues V1 , , Vr N y por lo tanto (V1 ) = = (Vr ) = O. De aqu W < (Vr+1 ), , (Vn ) >, como se deseaba probar. En particular, si es inyectiva entonces N = {O} y {(V1 ), , (Vn )} resulta una base de Im.

119

10

Sistemas de ecuaciones lineales

Recordemos que un espacio vectorial de dimensi on n sobre el cuerpo R de los n umeros reales es isomorfo a Rn . El isomorsmo procede de la siguiente manera: Fijada una base en el espacio vectorial, a un vector se le asigna la n-upla formada por sus componentes con respecto a la base jada. Convenimos en escribir esta n-upla en disposici on de columna y la llamaremos vector columna de Rn . Tener presente entonces que las componentes dependen tanto del elemento del espacio vectorial como de la base jada. Sean V y W dos espacios vectoriales de dimensi on n y m, respectivamente, y sea una aplicaci on lineal entre V y W . Sean {V1 , , Vn } y {W1 , , Wm } bases de V y W , respectivamente. Fijadas estas bases quedan establecidas, por lo dicho anteriormente, los isomorsmos entre V y Rn , y entre W y Rm . Es decir, un elemento de V se corresponde con un vector columna de Rn y un elemento de W se corresponde con un vector columna de Rm . A continuaci on obtendremos el mecanismo que permite expresar las componentes de (X ) en t erminos de las componentes de X para un elemento arbitrario X en V . Tenemos que (V1 ) = a11 W1 + a21 W2 + + am1 Wm (V2 ) = a12 W1 + a22 W2 + + am2 Wm . . . . . . (Vn ) = a1n W1 + a2n W2 + + amn Wm Si X = x1 V1 + x2 V2 + + xn Vn entonces (X ) = x1 (V1 ) + x2 (V2 ) + + xn (Vn ) = (a11 x1 + a12 x2 + + a1n xn )W1 + (a21 x1 + a22 x2 + + a2n xn )W2 + . . . (am1 x1 + am2 x2 + + amn xn )Wm . Vemos que el vector columna asociado a (X ) es una combinaci on lineal de los vectores columna asociados a (V1 ), (V2 ), , (Vn ), donde por coecientes guran las componentes de X : a1n a12 a11 a2n a22 a21 + + x + x x1 . . . . n 2 . . . . . . amn am2 am1

10 Sistemas de ecuaciones lineales Tambi en podemos escribir esta expresi on en notaci on matricial: a11 a12 a1n x1 a21 a22 a2n x2 . . . . . . . . . . . . . . . . am1 am2 amn xn

121

Observar que la determinaci on de la matriz A de arriba, de orden mxn, es inmediata: Se trata de la matriz que tiene por columna j a las componentes de (Vj ), j = 1, 2, , n. Se puede armar entonces que una aplicaci on lineal entre espacios vectoriales de dimensi on n y m tiene asociada una matriz de orden mxn, la cual permite obtener mediante la operaci on anterior las componentes de cualquier elemento que est e en la imagen de , Im . Otra vez debe tenerse presente que esta matriz depende no s olo de sino tambi en de las bases consideradas en el dominio y codominio de la aplicaci on. Fijadas estas bases, existir a por lo tanto una correspondencia entre el espacio vectorial Hom(V , W ) de todas las aplicaciones lineales entre V y W y el espacio Mmn de todas las matrices de orden mxn. Esta correspondencia es claramente biyectiva. Por consiguiente Mmn se convierte en un espacio vectorial isomorfo a Hom(V , W ) si en el se dene una suma y un producto a izquierda por un escalar real de tal forma que la suma de matrices sea aquella matriz que se corresponde por la biyecci on anterior a la suma de las aplicaciones lineales que tienen por asociadas a las matrices sumandos, y an alogo procedimiento para el producto por escalar. La suma as denida resulta la suma usual de matrices sumar coeciente a coeciente y an alogamente para el producto por escalar, esto es multiplicar cada coeciente de la matriz por el escalar considerado. Supongamos ahora que tenemos otra aplicaci on lineal, llam emosla , entre el espacio W de antes y otro espacio U de dimensi on s. Fijada una base en U , la aplicaci on tiene asociada una matriz de orden sxm, llam emosla B . Por otra parte, la aplicaci on composici on tiene asociada tambi en una matriz de orden sxn. Por lo dicho anteriormente, su columna j est a formada por las

10 Sistemas de ecuaciones lineales componentes del vector (Vj ) = ( (Vj ))

122

y las componentes de este vector se obtienen a su vez multiplicando la matriz B por el vector columna de componentes de (Vj ), que es precisamente la columna j de la matriz A. En consecuencia, las columnas de la matriz asociada a la composici on se obtiene multiplicando la matriz B por las correspondientes columnas de la matriz A, lo que dene a la matriz producto BA. Por lo tanto esta matriz producto es la asociada a la composici on .

10.1

Rango de una matriz

El isomorsmo entre Hom(V , W ) y Mmn hace que propiedades de una aplicaci on lineal se reejen en correspondientes propiedades de su matriz asociada A. Por ejemplo, consideremos el subespacio de W , Im( ). Este subespacio est a generado por el sistema { (V1 ), , (Vn )}. Su dimensi on, digamos r, es el n umero que se corresponde con la mayor cantidad posible de vectores linealmente independientes de este sistema. Es decir, en el hay r vectores l.i. y no m as. Por otra parte, observar que las componentes de los vectores de este sistema son precisamente las columnas de la matriz A. Luego, por el isomorsmo existente entre W y Rm sigue que la matriz A tendr a tambi en r columnas m linealmente independientes de R y no m as. Sus columnas linealmente independientes ser an precisamente aqu ellas que se corresponden con vectores linealmente independientes del sistema anterior. Este n umero r, que si se habla de es dim(Im ), es lo que se llama rango de A si se habla de la matriz A, asociada a . Es un resultado conocido en teor a de matrices que el rango de una matriz es tambi en la cantidad maximal de las linealmente independientes, interpretando las las de una matriz de orden mxn como vectores de Rn . A continuaci on vamos a mostrar este resultado haciendo uso de la interpretaci on de las matrices como asociadas a aplicaciones lineales. Digo mostrar y no

10 Sistemas de ecuaciones lineales

123

probar porque para facilitar su comprensi on voy a considerar una matriz de orden 4x4 con valores num ericos concretos, digamos la matriz 2 1 1 2 5 2 3 4 A= 1 1 2 0 . 1 6 0 7 Por la teor a anterior, a esta matriz la podemos interpretar como asociada a una aplicaci on lineal entre un espacio vectorial V de dimensi on 4 y un espacio vectorial W , tambi en de dimensi on 4, y supuesto que se han jado bases en V y en W . Como antes, llamamos a estas bases {V1 , V2 , V3 , V4 } y {W1 , W2 , W3 , W4 }, respectivamente. La matriz A tiene sus tres primeras columnas linealmente independientes en R4 , pero no sus 4 columnas l.i., ya que es f acilmante vericable que su cuarta columna es la suma de las dos primeras menos la tercera. Que sus tres primeras columnas son vectores l.i. de R4 no es tan r apidamente vericable; para averiguarlo pueden aplicarse varios m etodos que m as adelante veremos, ya que en este momento no es lo que nos preocupa. Por consiguiente el rango de A es tres. Bajo esta hip otesis, debemos probar que la matriz A tiene tres las l.i. y no m as. Recordemos que las columnas de A, vectores 4 columna de R , son, de izquierda a derecha, las componentes de los vectores de W (V1 ), (V2 ), (V3 ) y (V4 ), respectivamente. Sabemos por otra parte que la correspondencia entre el vector columna de componentes de un vector de W y este vector es precisamente lo que establece el isomorsmo entre R4 y W . Por lo tanto, como los isomorsmos preservan la independencia lineal, sigue que los vectores (V1 ), (V2 ) y (V3 ) deben ser vectores l.i. en W puesto que se corresponden mediante este isomorsmo con las tres primeras columnas de A, que son vectores columna de R4 linealmente independientes. Por lo tanto podemos encontrar un cuarto vector en W , digamos W , tal que { (V1 ), (V2 ), (V3 ), W } es una base de W . Consideremos ahora un automorsmo : W W tal que ( (V1 )) = W1 , ( (V2 )) = W2 , ( (V3 )) = W3 , (W ) = W4 . La aplicaci on es en efecto un automorsmo pues lleva una base de W , { (V1 ), (V2 ), (V3 ), W }, en otra base de W , a saber la originalmente considerada. Sea B la matriz asociada a con respecto a esta u ltima base actuando

10 Sistemas de ecuaciones lineales

124

tanto en su dominio como en su codominio. Luego la aplicaci on composici on :V W tiene por matriz asociada a BA, con respecto a las bases de V y W originalmente consideradas. Pero cu ales son las columnas de esta matriz producto? Ya sabemos calcularlas: son las componentes de los vectores (Vj ), j = 1, 2, 3, 4, con respecto a la base {W1 , W2 , W3 , W4 } de W . Ahora bien, (V1 ) = W1 = 1W1 + 0W2 + 0W3 + 0W4 , (V2 ) = W2 = 0W1 + 1W2 + 0W3 + 0W4 , (V3 ) = W3 = 0W1 + 0W2 + 1W3 + 0W4 y (V4 ) tiene con respecto a (V1 ), (V2 ) y (V3 ) la misma relaci on que sus correspondientes componentes (Por qu e?), por lo cual (V4 ) = (V1 ) + (V2 ) (V3 ) y (V4 ) = (V1 ) + (V2 ) (V3 ) = W1 + W2 W3 + 0W4 . Por consiguiente 1 0 BA = 0 0 0 1 0 0 0 1 0 1 . 1 1 0 0

Las tres primeras las de esta matriz , consideradas como vectores de R4 , son l.i. En efecto, si a(1, 0, 0, 1) + b(0, 1, 0, 1) + c(0, 0, 1, 1) = (a, b, c, a + b c) = 0, entonces a = b = c = 0. Llegado a este punto el lector puede vislumbrar lo que ocurre en el caso general: Por la forma en que se ha construido la aplicaci on , en la matriz BA aparecen r columnas que resultan ser los primeros r vectores de la base can onica de Rm y en este caso una generalizaci on inmediata del c alculo anterior prueba que en BA existen r las l.i. Ahora bien, si la matriz BA tiene r las l.i. entonces la matriz A debe tener al menos tambi en r las

10 Sistemas de ecuaciones lineales

125

l.i. Por lo siguiente: Las las de BA son combinaciones lineales de las las de A; luego el subespacio de Rn generado por las las de BA est a contenido en el subespacio generado por las las de A y por lo tanto su dimensi on debe ser menor o igual a la de este. En conclusi on, una matriz debe tener al menos tantas las l.i. como columnas l.i. Pero ahora se aplica el mismo argumento a la llamada matriz transpuesta. Si en general A es una matriz de orden mxn entonces su transpuesta, A , es una matriz de orden nxm que tiene por las las columnas de A (y por tanto tiene por columnas las las de A). Por ejemplo, para la matriz A que estamos considerando 2 5 1 1 2 1 A = 1 3 2 2 4 0 es 1 6 . 0 7

Aplicando la conclusi on anterior tanto a la matriz A como a su transpuesta A sigue que una matriz cualquiera debe tener la misma cantidad maximal de las y columnas linealmente independientes.

10 Sistemas de ecuaciones lineales

126

10.2

Matrices cuadradas

Supongamos ahora que es un endomorsmo en un espacio V de dimensi on n, : V V . Para hablar de matriz asociada deben jarse tambi en ahora dos bases de V , una actuando en el dominio de y otra en el codominio de . Estas bases pueden ser distintas o iguales. En cualquier caso la matriz asociada resultar a de orden nxn. Si es automorsmo entonces el rango de su matriz asociada ser a n (y s olo en el caso de automorsmo ser a n). En este caso se dice que la matriz es no singular. Por ejemplo, consideremos la aplicaci on identidad, idV , idV (A) = A para todo vector A en V , que es obviamente un automorsmo. Calculemos su matriz asociada supuesto que hemos jado la misma base, digamos {V1 , , Vn }, en el dominio y codominio de idV . Para i = 1, 2, , n es idV (Vi ) = Vi . Las componentes de los vectores de la base con respecto a la misma base son claramente los vectores de la base can onica de Rn . Luego la matriz asociada a idV resulta en este caso la llamada matriz identidad: I= 1 0 . . . 0 1 . . . . . . 0 0 0 0 . . . 1 .

Tener presente que la matriz identidad est a asociada a la aplicaci on identidad siempre y cuando jemos la misma base en el dominio y codominio de la aplicaci on. Es decir, si jamos bases distintas en el dominio y codominio de la aplicaci on identidad entonces su matriz asociada no ser a la matriz identidad aunque por cierto ser a una matriz no singular. Para una matriz no singular A de orden nxn existe otra matriz de orden nxn, llamada inversa de A, y que se denota A1 , tal que AA1 = A1 A = I . La matriz A est a asociada a un automorsmo . La existencia de la matriz inversa proviene a su vez de la existencia del automorsmo inverso 1 . Es precisamente su matriz asociada. Est a claro que la matriz inversa es tambi en no singular y (A1 )1 = A.

10 Sistemas de ecuaciones lineales

127

10.3

Estudio matricial de sistemas

El siguiente es un sistema de m ecuaciones con n inc ognitas: a11 x1 + a12 x2 + + a1n xn a21 x1 + a22 x2 + + a2n xn . . . am1 x1 + am2 x2 + + amn xn = c1 = c2 . . . . . . = cm

Los coecientes aij y los t erminos independientes ci son datos, mientras que las variables xj son las inc ognitas, i = 1, 2, , n, j = 1, 2, , m. Resolver este sistema signica encontrar valores num ericos que reemplazados en el lugar de las inc ognitas xj veriquen las m ecuaciones del sistema. Observar que este sistema se puede escribir en notaci on matricial: AX = C , donde A es la matriz de coecientes, de orden mxn, tal que en su la i y columna j encontramos el coeciente aij , X es el vector columna de inc ognitas xj y C es el vector columna de t erminos independientes ci . X es un vector columna de Rn y AX es un vector columna de Rm . La aplicaci on : Rn Rm , (X ) = AX, es lineal. En efecto, (X1 + X2 ) = A(X1 + X2 ) = AX1 + AX2 = (X1 ) + (X2 ) y (cX ) = A(cX ) = c(AX ) = c (X ). Si jamos las correspondientes bases can onicas en Rn y Rm , entonces la matriz asociada a esta aplicaci on lineal es precisamente A. Sus columnas son n vectores de Rm . Denotemos a estos vectores A1 , A2 , , An . Recordemos que (X ) = AX = x1 A1 + x2 A2 + + xn An , es decir la aplicaci on resulta ser tambi en una combinaci on lineal de las columnas de A. Nuestros datos son estos n vectores columna y el vector C .

10 Sistemas de ecuaciones lineales

128

Por lo tanto este sistema tendr a alguna soluci on si y s olo si el vector C es combinaci on lineal de los vectores A1 , , An , o dicho de otra manera, si C Im =< A1 , , An > . Una base de este subespacio de Rm est a formado por un conjunto maximal de vectores columna l.i. de A. La cantidad, digamos r, de vectores que la componen es tanto la dimensi on de Im como el rango de la matriz A. Por lo tanto C Im si y s olo si el rango de la llamada matriz ampliada, esto es la matriz cuyas columnas son {A1 , A2 , , An , C }, es tambi en r. Ahora bien, en el caso de existencia de soluciones, puede darse que esta sea u nica o no. Analicemos m as en detalle esta situaci on. Supongamos que X0 es una soluci on del sistema, es decir (X0 ) = C. N es un subespacio del dominio de , Rn . Si S es un vector arbitrario de N , es (S ) = AS = O. Luego (X0 + S ) = (X0 ) + (S ) = C + O = C y por lo tanto X0 + S es otra soluci on del sistema. Rec procamente, si X1 es una soluci on del sistema entonces X1 X0 N pues (X1 X0 ) = (X1 ) (X0 ) = C C = O. Por consiguiente X1 = X0 + (X1 X0 ). As hemos probado que toda soluci on del sistema es suma de una soluci on ja y de un vector arbitrario de N .

10 Sistemas de ecuaciones lineales

129

Signica que el conjunto de todas las soluciones del sistema es una variedad lineal de Rn , esto es la suma de un vector jo de Rn y un subespacio de Rn , N . De esta manera, si N = {O } entonces habr a una u nica soluci on del sistema. Si, en cambio, dim N > 0, habr a innitas soluciones. Ahora bien, como n = dim N + dim Im = dim N + r, sigue que dim N = 0 si y s olo si r = n. La discusi on anterior nos permite enunciar el llamado Teorema de Roch e Frobenius Un sistema de ecuaciones lineales tiene alguna soluci on si y s olo si el rango de la matriz de coecientes del sistema es igual al rango de la matriz ampliada. La soluci on ser au nica si este valor com un del rango es igual al n umero de inc ognitas. Si en cambio el valor del rango es estrictamente menor que el n umero de inc ognitas entonces habr a innitas soluciones. Observar que este teorema es puramente te orico, permite determinar si un sistema tiene soluci on o no, si esta es u nica o no, pero en el caso de existencia de soluciones no da ning un m etodo para calcularlas. A continuaci on estudiaremos un m etodo para obtener las soluciones.

10.4

M etodo de Gauss para matrices no singulares

Supondremos primero que la matriz A es de orden nxn y no singular. En este caso sabemos que A tiene una matriz inversa A1 . Este sistema debe tener soluci on porque el rango de A es n y el rango de la matriz ampliada es tambi en n porque en Rn no puede haber m as de n vectores l.i.; adem as la soluci on es u nica porque n es el n umero de inc ognitas. La soluci on X satisface AX = C.

10 Sistemas de ecuaciones lineales Luego A1 (AX ) = (A1 A)X = IX = X = A1 C.

130

Por lo tanto la soluci on es el producto a izquierda de la matriz inversa de A por el vector columna de t erminos independientes. Vemos que la aplicaci on directa de este m etodo implica calcular una matriz inversa de otra. No obstante, veremos en lo que sigue un procedimiento de obtenci on de la soluci on que est a sugerido por el c alculo anterior pero que no necesita de la determinaci on expl cita de la matriz inversa de A. La matriz inversa A1 es la u nica matriz tal que A1 A = I . Ahora bien, sabemos que multiplicar a izquierda una matriz da por resultado otra matriz cuyas las son combinaciones lineales de las las de aqu ella. Por ejemplo, en el producto 9 1 0 4 0 4 1 7 2 5 6 0 8 1 0 1 1 0 0 0 0 1 0 1 2 0 1 2 5 3 3 1

la primera la de la matriz resultado es la siguiente combinaci on lineal: 9(1, 0, 2, 5) + 0(1, 1, 0, 3) + 2(0, 0, 1, 3) + 8(0, 1, 2, 1) = (9, 8, 36, 59). La segunda la de la matriz resultado es 1(1, 0, 2, 5) + 4(1, 1, 0, 3) + 5(0, 0, 1, 3) + 0(0, 1, 2, 1) = (5, 4, 7, 32). La tercera la de la matriz resultado es 0(1, 0, 2, 5) + 1(1, 1, 0, 3) + 6(0, 0, 1, 3) + 0(0, 1, 2, 1) = (1, 1, 6, 21). Por u ltimo, la cuarta la de la matriz resultado es 4(1, 0, 2, 5) + 7(1, 1, 0, 3) + 0(0, 0, 1, 3) + 1(0, 1, 2, 1) = (11, 8, 10, 42). Esta forma de operar es as en cualquier producto que se pueda efectuar, sean las matrices cuadradas o no. En nuestro caso particular la la i de la matriz resultado I es la combinaci on lineal de todas las las de A, actuando por coecientes los correspondientes elementos de la la i de la matriz A1 . Signica que la matriz A es transformada en la matriz identidad I efectuando combinaciones lineales de sus las. Sabiendo esto, intentamos ahora transformar una matriz no singular A en la

10 Sistemas de ecuaciones lineales

131

matriz identidad en sucesivas etapas y recurriendo s olo a efectuar combinaciones lineales de sus las. Es decir, colocar unos en la diagonal principal y ceros fuera de esta diagonal mediante apropiadas combinaciones lineales de sus las. Estas consisten en lo siguiente: para colocar un 1 en un lugar de la diagonal principal necesitaremos multiplicar la la correspondiente por un n umero distinto de 0; para colocar un cero en un lugar fuera de la diagonal principal necesitaremos hacer una combinaci on lineal de dos las; si eventualmente aparece un 0 en un lugar de la diagonal principal entonces necesitaremos intercambiar dos las. Cualquiera de estas tres acciones corresponde a efectuar una combinaci on lineal de todas las las de A o, equivalentemente, a multiplicar A por su izquierda por una matriz, en este caso no singular. Por ejemplo, sea 2 2 A= 0 0 1 1 0 5 3 0 4 0 0 1 . 0 2

Necesitamos colocar un 1 en el lugar del coeciente a11 = 2. Para esto multiplicamos la primera la de A por 1/2. Pero observar que esta transformaci on 1/2 0 0 0 0 1 0 0 de A signica multiplicar a izquierda por la matriz M1 = 0 0 1 0 . 0 0 0 1 As , 1 1/2 3/2 0 2 1 0 1 . M1 A = 0 0 4 0 0 5 0 2 Ahora debemos colocar un 0 en el lugar a21 (= 2) de esta matriz. Para ello reemplazamos su segunda la por la siguiente combinaci on lineal de sus dos primeras las: 2(1, 1/2, 3/2, 0) + 1(2, 1, 0, 1). Esto signica a su vez multiplicarla a izquierda por la matriz 1 0 0 0 2 1 0 0 M2 = 0 0 1 0 . 0 0 0 1

10 Sistemas de ecuaciones lineales As , 1 1/2 3/2 0 0 0 3 1 . M2 M1 A = 0 0 4 0 0 5 0 2

132

Dado que ya hay ceros en los lugares a31 y a41 de esta matriz pasamos a operar en su segunda columna. Lo primero que hay que hacer es colocar un 1 en el lugar a22 para despu es colocar ceros en los lugares que le siguen por debajo. Pero en este ejemplo a22 = 0 por lo que es imposible transformarlo en 1 multiplicando la la por cualquier valor. En este caso (y s olo en este caso) debe intercambiarse la la por otra la que le siga por debajo y que tenga un elemento no nulo en el lugar correspondiente, en este ejemplo la cuarta la. Siempre se encontrar a una la por debajo con estas condiciones pues si as no fuera las dos primeras columnas de esta matriz ser an l.d., lo que es imposible pues la matriz de partida A es no singular y las transformaciones que estamos efectuando sobre ella no alteran este car acter. En efecto, las matrices Mi que multiplican a izquierda la matriz A son no singulares y producto de matrices no singulares da por resultado una matriz no singular. Volviendo a nuestro ejemplo debemos intercambiar entonces la segunda y cuarta las de la matriz M2 M1 A. Esta operaci on equivale a multiplicar a izquierda esta matriz por la 1 0 0 0 0 0 0 1 matriz M3 = , 0 0 1 0 . As 0 1 0 0 1 1/2 3/2 0 0 5 0 2 . M3 M2 M1 A = 0 0 4 0 0 0 3 1 Ahora s multiplicamos la segunda la de esta u ltima lo que matriz por 1/5, 1 0 0 0 0 1/5 0 0 equivale a multiplicar a izquierda por la matriz M4 = , 0 0 1 0 . As 0 0 0 1 1 1/2 3/2 0 0 1 0 2/5 . M4 M3 M2 M1 A = 0 0 4 0 0 0 3 1 Pasando a la tercera columna (ya que hay ceros en los lugares a32 y a42 ) debemos colocar un 1 en el lugar a33 (= 4), lo que se logra multiplicando la

10 Sistemas de ecuaciones lineales

133

tercera la por 1/4. Esto equivale a su vez a multiplicar a izquierda esta u ltima matriz por la matriz M5 (Cu al es M5 ?) De esta manera 1 1/2 3/2 0 0 1 0 2/5 . M5 M4 M3 M2 M1 A = 0 0 1 0 0 0 3 1 Para colocar un 0 en el lugar a43 (= 3) reemplazamos la cuarta la por la siguiente combinaci on lineal de la tercera y cuarta las: 3(0, 0, 1, 0) + 1(0, 0, 3, 1) = (0, 0, 0, 1). 0 0 . 0 1

Esto equivale a multiplicar a izquierda por As ,

1 0 M6 M5 M4 M3 M2 M1 A = 0 0

1 0 la matriz M6 = 0 0 1/2 3/2 0 1 0 2/5 . 0 1 0 0 0 1

0 1 0 0

0 0 1 3

Esta u ltima matriz es un ejemplo de matriz triangular superior pues consta de ceros debajo de la diagonal principal. Ahora debemos colocar ceros sobre la diagonal principal empezando por la cuarta columna. Para colocar un 0 en el lugar a24 (= 2/5) reemplazamos la segunda la por la siguiente combinaci on lineal de la segunda y cuarta las: 1(0, 1, 0, 2/5) + (2/5)(0, 0, 0, 1) = (0, 1, 0, 0). Esto signica multiplicar a izquierda por la matriz 1 0 0 0 0 1 0 2/5 . M7 = 0 0 1 0 0 0 0 1 Para colocar un 0 en el lugar a13 (= 3/2) de esta u ltima matriz reemplazamos su primera la por la siguiente combinaci on lineal de su primera y tercera las: 1(1, 1/2, 3/2, 0) + (3/2)(0, 0, 1, 0) = (1, 1/2, 0, 0), lo que equivale a multiplicar a izquierda por la 1 0 3/2 0 1 0 M8 = 0 0 1 0 0 0 matriz 0 0 . 0 1

10 Sistemas de ecuaciones lineales

134

Para nalizar este proceso resta poner un 0 en el lugar a12 de esta u ltima matriz. Para ello reemplazamos su primera la por la siguiente combinaci on lineal de su primera y segunda las: 1(1, 1/2, 0, 0) + (1/2)(0, 1, 0, 0) = (1, 0, 0, 0). Esta operaci on equivale a multiplicar 1 0 M9 = 0 0 De esta forma, tenemos que M9 M8 M7 M6 M5 M4 M3 M2 M1 A = I, por lo cual M9 M8 M7 M6 M5 M4 M3 M2 M1 = A1 y por lo tanto X = M9 M8 M7 M6 M5 M4 M3 M2 M1 C. Por consiguiente la soluci on X se obtiene efectuando sobre el vector columna C el mismo procedimiento aplicado a la matriz A, esto es las mismas combinaciones lineales de las ejercidas por la multiplicaci on a izquierda de las matrices M1 , M2 , , M9 . De aqu , si las mismas combinaciones lineales se aplican a la matriz ampliada, es decir la matriz A con el agregado del vector columna C por u ltima columna, entonces una vez que A se transforme mediante estas combinaciones lineales en la matriz identidad, en la u ltima columna de la matriz ampliada transformada tendremos la soluci on del sistema. 1 2 Por ejemplo, supongamos que C = 3 . Luego la matriz ampliada es 4 2 2 0 0 1 1 0 5 3 0 4 0 0 1 0 2 1 2 . 3 4 a izquierda por la matriz 1/ 2 0 0 1 0 0 . 0 1 0 0 0 1

Para resolver este sistema de cuatro ecuaciones con cuatro inc ognitas realizamos en esta matriz ampliada las mismas combinaciones lineales de las que hicimos antes en la matriz A y que transforman a esta en la matriz identidad.

10 Sistemas de ecuaciones lineales Las sucesivas etapas son: Colocaci on de matriz 1 1/2 3/2 2 1 0 0 0 4 0 5 0

135 un 1 en el lugar a11 . Se obtiene la 0 1/2 1 2 . 0 3 2 4

Colocaci on de un 0 en los lugares por debajo del 1 colocado en la diagonal. Se opera con la primera la y la la al cual pertenece el coeciente que ha de transformarse en 0. Se obtiene la matriz 1 1/2 3/2 0 0 3 0 0 4 0 5 0 0 1/2 1 1 . 0 3 2 4

Colocaci on de un 1 en el lugar a22 . Como aqu a22 = 0 debemos antes intercambiar la segunda la con la cuarta la. Se obtiene 1 1/2 3/2 0 1/2 0 1 0 2/5 4/5 . 0 0 4 0 3 0 0 3 1 1 Colocaci on de ceros en los lugares a32 y a42 . Se opera en cada caso con la segunda la y la la a la que pertenece el elemento que hay que transformar en 0. En este ejemplo nada debe hacerse al respecto dado que ya hay ceros en esos lugares. Se pasa ahora a 1 0 0 0 colocar un 1 en el lugar a33 . Se obtiene 1/2 3/2 0 1/2 1 0 2/5 4/5 . 0 1 0 3/4 0 3 1 1

Colocaci on de un 0 en el lugar a43 . Se opera con la cuarta y tercera las. Se obtiene 1 1/2 3/2 0 1/2 0 1 0 2/5 4/5 . 0 0 1 0 3/4 0 0 0 1 13/4 Se opera con la segunda y cuarta las. Se 3/2 0 1 0 0 1/2 0 1/2 . 0 3/4 1 13/4

Colocaci on de un 0 en el lugar a24 . obtiene 1 1/2 0 1 0 0 0 0

10 Sistemas de ecuaciones lineales Colocaci on de un 0 en el lugar obtiene 1 0 0 0

136

a13 . Se opera con la primera y tercera las. Se 1/2 1 0 0 0 0 1 0 0 5/8 0 1/2 . 0 3/4 1 13/4 lugar a12 . Se opera con la primera y 0 3/8 0 1/2 . 0 3/4 1 13/4

Por u ltimo, colocaci on de un 0 en el segunda las. Se obtiene 1 0 0 0 1 0 0 0 1 0 0 0

La soluci on del sistema es x1 = 3/8, x2 = 1/2, x3 = 3/4, x4 = 13/4.

10.5

M etodo general de Gauss

Supongamos que ahora debemos resolver un sistema donde m n, es decir donde puede haber m as inc ognitas que ecuaciones. Si las m las de la matriz de coecientes A son linealmente independientes entonces podemos decir que el sistema tiene soluci on. En efecto, el rango de A es en este caso m y por lo tanto en A debe haber tambi en m columnas l.i. Por otro lado, la matriz ampliada tambi en debe tener rango m y no m as porque es una matriz de m las, y observar que en general el rango de una matriz ampliada no puede ser menor que el rango de la matriz original ya que la cantidad de columnas l.i de esta lo son tambi en de la matriz ampliada. Por lo tanto, el teorema de Roch e Frobenius nos permite decir en general que si un sistema lineal de m ecuaciones con n inc ognitas es tal que las m las de la matriz de coecientes son l.i. entonces el sistema tiene soluci on. Si n = m la soluci on es u nica y estamos en el caso considerado anteriormente. Si n > m entonces habr a innitas soluciones que, como ya sabemos, ser an de la forma X0 + S , donde X0 es una soluci on particular del sistema y S es un elemento arbitrario en N , es decir que S satisface AS = O. Como m = rango de A = dim Im y n = dim N + dim Im

10 Sistemas de ecuaciones lineales sigue que dim N = n m.

137

Luego una base de N consiste en n m vectores l.i. de ese subespacio y por lo tanto cualquier soluci on del sistema se escribe como una soluci on particular X0 m as una combinaci on lineal, con escalares reales arbitrarios, de n m soluciones l.i. del llamado sistema homog eneo asociado AX = O. Consideremos por ejemplo el siguiente sistema: x1 1 3 5 1 x2 = 2 5 2 4 x3 x4

4 6

(7)

En este ejemplo las dos las de la matriz de coecientes son l.i. pues una la no es m ultiplo de la otra. Luego hay soluci on, y como hay cuatro inc ognitas sigue que el conjunto de soluciones constituye una variedad lineal de dimensi on 2 = 4 2 inc ognitas, a saber el conjunto de R4 de la forma X0 + aS1 + bS2 , donde X0 es una soluci on arbitraria del sistema (7), a y b son reales arbitrarios y S1 y S2 son dos soluciones l.i. del sistema homog eneo x1 1 3 5 1 x2 = 0 . (8) 0 x3 2 5 2 4 x4 Determinemos una soluci on arbitraria del sistema (7). Como la matriz de coecientes tiene dos ( y no m as ) columnas l.i. habr a 2 = 4 2 inc ognitas a las que podremos asignarle valores arbitrarios y resolver despu es en las dos inc ognitas restantes. En este caso las dos primeras columnas de la matriz de coecientes son l.i. por lo cual podemos asignar un valor arbitrario a cada una de las inc ognitas x3 y x4 . Es obvio que lo m as pr actico es asignarle a ambas valor nulo para luego resolver 1 3 2 5 x1 x2 = 4 6 .

10 Sistemas de ecuaciones lineales

138

Este es un sistema cuadrado que se resuelve por la forma ya conocida, esto es operando como ya se sabe sobre la matriz ampliada 1 3 4 2 5 6 . (9)

Determinamos ahora dos soluciones l.i. del sistema homog eneo (8). Aqu tambi en debemos asignarle valores a x3 y x4 pero ahora no podemos asignarles valores nulos a ambos pues en este caso obtendr amos tambi en la soluci on nula para x1 y x2 , y la soluci on nula no es l.i. Procederemos as : para obtener la primera soluci on le damos a x3 el valor 1 y a x4 el valor nulo para luego resolver el sistema 1 3 2 5 x1 x2 = 5 2 ,

que se resuelve operando sobre la matriz ampliada 1 3 5 2 5 2 para luego resolver el sistema 1 3 2 5 x1 x2 = 1 4 , . (10)

Para obtener la segunda soluci on le damos a x3 el valor nulo y a x4 el valor1

que se resuelve operando sobre la matriz ampliada 1 3 1 2 5 4 son de la forma (a1 , b1 , 1, 0) y (a2 , b2 , 0, 1) y ya sus dos u ltimas componentes lo son. Ahora bien, las tres matrices (9), (10) y (11) sobre las que tenemos que 1 3 operar tiene en com un la matriz cuadrada de coecientes que es 2 5 la que determina las operaciones a realizar, por lo que claramente conviene operar conjuntamente sobre la siguiente matriz ampliada del sistema (7): 1 3 5 1 4 2 5 2 4 6 . . (11)

Estas dos soluciones del sistema homog eneo (8) son efectivamente l.i. porque

Como ya sabemos, las sucesivas transformaciones son las siguientes: 1 3 5 1 4 0 1 8 2 2 1 3 5 1 4 0 1 8 2 2

10 Sistemas de ecuaciones lineales 1 0 19 7 2 0 1 8 2 2 Luego cualquier soluci on del sistema (7) es (2, 2, 0, 0) + a(19, 8, 1, 0) + b(7, 2, 0, 1), con a y b n umeros reales arbitrarios. .

139

Una observaci on a tener en cuenta es la siguiente: aqu ellas inc ognitas en las que se resuelva el sistema deben corresponderse a columnas l.i. de la matriz de coecientes. En el ejemplo anterior se resolvi o el sistema en las inc ognitas x1 y x2 y eso fue correcto porque las dos primeras columnas de la matriz de coecientes eran l.i. Pero no es necesario darse cuenta de esta situaci on antes de comenzar el procedimiento. El proceso mismo detecta las columnas l.i. Por ejemplo, consideremos el sistema de tres ecuaciones con seis inc ognitas que da lugar a la siguiente matriz ampliada: 1 0 1 2 1 3 0 2 1 1 4 0 3 2 . 0 2 2 0 5 0 1 Comenzamos a transformarla de la manera ya conocida: 1 0 1 2 1 3 0 1 0 1 2 1 3 0 0 1 1 0 2 3 2 2 3 2 0 1 1 0 0 2 2 0 5 0 1 0 2 2 0 5 0 1 1 0 1 2 1 3 0 1 0 1 2 1 3 0 0 1 1 0 2 3 2 0 1 1 0 2 3 2 . 0 2 2 0 5 0 1 0 0 0 0 1 6 5 En esta etapa es imposible colocar un 1 en el lugar a33 . Lo que ocurre es que las tres primeras columnas de la matriz de coecientes son l.d. Entonces hay que intercambiar la tercera columna con la quinta columna o la sexta columna (no con la cuarta pues seguir a habiendo un 0 en el lugar a33 ni con la s eptima, que es la de t erminos independientes). Pero cuidado! A la hora de considerar las inc ognitas habr a que tener presente su correspondiente intercambio. Intercambiamos tercera con quinta columnas y continuamos el proceso ya explicado: 1 0 1 2 1 3 0 1 0 1 2 1 3 0 0 1 2 0 1 3 2 0 1 0 0 1 15 12 0 0 1 0 0 6 5 0 0 1 0 0 6 5

10 Sistemas de ecuaciones lineales 1 0 0 2 1 9 5 0 1 0 0 1 15 12 . 0 0 1 0 0 6 5

140

El sistema se ha resuelto en las inc ognitas x1 , x2 y x5 . Las soluciones son por lo tanto de la forma (5, 12, 0, 0, 5, 0) + a(2, 0, 0, 1, 0, 0) + b(1, 1, 1, 0, 0, 0) + c(9, 15, 0, 0, 6, 1). Consideremos ahora el caso m as general, esto es un sistema de m ecuaciones con n inc ognitas AX = C del cual no sabemos previamente si tiene o no soluciones. Sin preocuparnos por esta cuesti on aplicamos el procedimiento conocido de resoluci on que consiste primero en transformar la matriz ampliada de forma que en su diagonal principal aparezcan unos y que en los lugares por debajo de la diagonal principal aparezcan ceros (triangularizar la matriz). Esto va a ser posible mientras haya las l.i. Si todas las las de A son l.i. este proceso se continuar a hasta la u ltima la, habr a soluciones y estas se obtendr an como se explic o anteriormente. Si no todas las las de A son l.i. entonces aparecer a en alguna etapa una la de ceros en la matriz transformada de A. Si el u ltimo coeciente de esta la en la transformada de la matriz ampliada, es decir el correspondiente al vector columna de t erminos independientes, no es cero entonces el sistema no tiene soluciones y por lo tanto el proceso se termina. Si en cambio este coeciente es cero el procedimiento se contin ua previa eliminaci on de esta la completa de ceros. Si en ning un momento del procedimiento se presenta la situaci on de bloqueo anterior y por lo tanto se logra triangularizar a la matriz A, entonces el sistema tiene soluci on, una o innitas, y estas se obtienen de la manera ya sabida. Ejemplos Se parte como siempre de 1 3 1 1 2 1 3 5 1 1 3 2 4 1 7 3 1 0 0 0 la matriz ampliada del sistema. 1 1 3 1 1 1 2 0 5 5 3 0 3 0 4 4 1 2 7 0 11 11 7 3 3 1 1 1 1 1 3/5 0 . 0 0 7/5 2 0 0 68/5 3

En este punto ya podr amos advertir que el sistema es incompatible. Recordemos que la transformaci on de estas matrices ampliadas equivale a multiplicar a

10 Sistemas de ecuaciones lineales

141

izquierda por matrices no singulares, en este caso de orden 4x4. Esto conduce siempre a obtener matrices transformadas que se corresponden con sistemas equivalentes al inicial, es decir sistemas que tiene soluci on si y s olo si lo tiene aqu el, y en este caso con las mismas soluciones. En este ejemplo el sistema inicial es equivalente al siguiente: 1x1 + 0x1 + 0x1 + 0x1 + 3x2 + (1)x3 + 1 x4 1x2 + (1)x3 + (3/5)x4 0 x2 + 0x3 + (7/5)x4 0 x2 + 0x3 + (68/5)x4 = = = = 1 0 2 3

De la tercera ecuaci on se obtiene x4 = 10/7 y de la cuarta ecuaci on se obtiene x4 = 15/68 = 10/7, por lo que estas dos ecuaciones son incompatibles. Pero supongamos que no advertimos esta incompatibilidad y continuamos el proceso. Este se contin ua intercambiando tercera y cuarta columnas (hay ceros en los lugares a33 y a43 ) y transformando en 1 el coeciente a33 = 7/5. Queda 1 3 1 1 1 1 3 1 1 1 0 1 3/5 1 0 0 0 1 3/5 1 . 0 0 0 0 1 0 10/7 1 0 10/7 0 0 68/5 0 3 0 0 0 0 115/7 La u ltima la muestra la incompatibilidad del sistema. Ocurre que la cuarta la de la matriz de coecientes es combinaci on lineal de sus tres primeras las l.i. Luego su rango es tres mientras que el rango de la matriz ampliada es cuatro, sus cuatro las por un lado, y sus columnas primera, segunda, tercera y quinta por otro lado, son l.i. Apliquemos ahora el procedimiento al siguiente sistema de 5 ecuaciones con 6 inc ognitas: 1 3 2 1 3 4 1 1 4 1 4 1 3 5 7 6 0 2 5 3 1 0 2 2 3 4 3 3 2 3 1 5 7 10 1

10 Sistemas de ecuaciones lineales 1 3 4 1 0 5 5 3 0 5 5 3 0 4 4 1 0 11 11 7 1 0 0 0 0 3 1 0 0 0 4 1 1 3/5 0 0 0 7/5 0 68/5 1 0 0 3 0 3 2 1 3 10 2 8 8 7 7 .

142

1 0 2 0 3/5 8/5 0 0 0 2 17/5 3/5 3 83/5 53/5

La tercera la se elimina. Ha dado una la de ceros porque la tercera la de la matriz ampliada es combinaci on lineal de sus dos primeras las. A continuaci on se hace necesario intercambiar tercera con (por ejemplo) cuarta columnas para evitar el cero en el lugar a33 . Esto ha sucedido porque la tercera columna de la matriz de coecientes es combinaci on lineal de sus dos primeras columnas. Por lo tanto el sistema inicial es equivalente al siguiente: x1 x2 2 x3 8/5 A1 x4 = 3/5 , x5 53/5 x6 donde 1 0 A1 = 0 0 3 1 1 3/5 0 7/5 0 68/5 4 1 0 0 1 0 0 3/5 . 2 17/5 3 83/5

El proceso contin ua 1 0 0 0 1 0 0 0

de la siguiente manera: 3 1 1 3/5 0 1 0 68/5 3 1 1 3/5 0 1 0 0 4 1 0 2 1 0 3/5 8/5 0 10/7 17/7 3/7 0 3 83/5 53/5 4 1 0 2 1 0 3/5 8/5 . 0 10/7 17/7 3/7 0 115/7 115/7 115/7

Se debe intercambiar ahora cuarta con quinta columnas. Esto ya era previsible, dado que la cuarta columna de esta u ltima matriz, es decir la tercera de la matriz de coecientes inicial, es combinaci on lineal de las dos primeras

10 Sistemas de ecuaciones lineales

143

columnas. Se hubiera evitado este segundo intercambio si en el primero se afectaban las columnas tercera y quinta en vez de tercera y cuarta. Se muestra entonces en esta etapa que el sistema inicial es equivalente al siguiente: x1 x2 2 x4 8/5 A2 x5 = 3/7 , x3 115/7 x6 donde 1 0 A2 = 0 0 3 1 1 1 3/5 0 0 1 10/7 0 0 115/7 4 0 1 3/5 . 0 17/7 0 115/7 .

Se obtiene ahora la matriz ampliada triangularizada 1 3 1 1 4 0 2 0 1 3/5 0 1 3/5 8/5 0 0 1 10/7 0 17/7 3/7 0 0 0 1 0 1 1

En este punto ya podemos decir que el sistema tiene soluciones. Tanto la matriz de coecientes como la matriz ampliada iniciales tienen rango cuatro. Sus las primera, segunda, cuarta y quinta son l.i., as como sus columnas primera, segunda, cuarta y quinta (la coincidencia es casualidad, podr a darse en otro caso que otras cuatro columnas fueran l.i.). Dado que hay seis inc ognitas, las soluciones constituyen una variedad lineal de dimensi on dos. Como ya se sabe, se resuelve entonces en las inc ognitas x1 , x2 , x4 y x5 , transformando la submatriz cuadrada principal en matriz identidad: 1 3 1 0 4 1 3 1 3 0 0 1 3/5 0 1 3/5 8/5 0 1 0 0 0 0 0 1 1 0 0 1 1 0 0 0 1 0 1 1 0 0 0 1 0 0 0 1 0 1 0 1 0 0 1 0 1 . 0 0 1 0 0 1 1 0 0 0 1 0 1 1 Las soluciones son de la forma (1, 1, 0, 1, 1, 0) + a(1, 1, 1, 0, 0, 0) + b(0, 0, 0, 1, 1, 1). 0 0 0 1 4 0 4 1 0 1 0 1 1 0 1 1

11

Producto escalar

Sea V un espacio vectorial distinto del espacio nulo. Un producto escalar es una operaci on entre vectores de V dada por la evaluaci on de una forma bilineal , sim etrica y denida positiva. Esto es A B = (A, B ), donde : V V R, tiene las siguientes propiedades: (a1 A1 + a2 A2 , B ) = a1 (A1 , B ) + a2 (A2 , B ). (A, b1 B1 + b2 B2 ) = b1 (A, B1 ) + b2 (A, B2 ). (A, B ) = (B, A). (C, C ) > 0, cualesquiera sean tanto los vectores A, A1 , A2 , B, B1 , B2 en V como los escalares reales a1 , a2 , b1 , b2 y para todo vector C no nulo. Un espacio vectorial V donde hay denido un producto escalar se llama espacio eucl deo. La longitud o norma de un vector se dene como A = (A A)1/2 . La norma de un vector tiene las siguientes propiedades A 0 y A = 0 si y s olo si A = 0. aA = |a| A . |A B | A B (Desigualdad de Cauchy-Schwarz). A + B A + B (Desigualdad de Minkowsky). En la desigualdad de Cauchy-Schwarz se da la igualdad si y s olo si A y B son linealmente dependientes. En la desigualdad de Minkowsky se da la igualdad si y s olo si A = cB con c 0.

11 Producto escalar Dos vectores A y B de un espacio eucl deo se dicen ortogonales o perpendiculares si A B = 0. Observar que A+B
2

145

= (A + B ) (A + B ) = A A + 2A B + B B.

Una consecuencia inmediata de esta igualdad es el llamado Teorema de Pit agoras Si A y B son ortogonales entonces A+B
2

= A

+ B 2.

Si S es un conjunto de vectores de V entonces se dene S (se lee S ortogonal) al conjunto de todos los vectores de V que son ortogonales a cada elemento de S . Es f acil probar que S es siempre un subespacio de V , es decir toda combinaci on lineal de dos vectores de S est a tambi en en S . Dos subconjuntos de V se dicen ortogonales si cada elemento de uno de ellos es ortogonal a cada elemento del otro. Proposici on Si V = U W , y U , W son subespacios ortogonales entonces U = W y W = U . Demostraci on: Sea A un vector en U . Como A es ortogonal a todo vector de W , sigue que A est a en W y luego U W . Sea ahora B un vector en W . Como V es suma directa de U y W , B se puede escribir como B = B1 + B2 , B 1 U , B 2 W . Luego 0 = B B2 = ( B1 + B2 ) B2 = B1 B2 + B2 B2 = 0 + B2 B 2 , y por lo tanto B2 = O y B = B1 , por lo cual B est a en U y W U . De esta manera U = W . La otra igualdad se prueba en forma an aloga. Si V = U U entonces todo vector de V se escribe de manera u nica como suma de dos vectores ortogonales, A = A1 + A2 , A1 A2 .

11 Producto escalar En este caso A1 y A2 se llaman proyecciones ortogonales de A sobre U y U , respectivamente.

146

Si U es una recta vectorial entonces U es un espacio suplementario de U , es decir V = U U . En efecto, si U =< A > y C es un vector en V entonces A2 = C [C A/A A]A es un vector ortogonal a A, como se verica f acilmente haciendo su producto escalar, y C = [C A/A A]A + A2 , por lo que C se escribe como la suma de un vector en U =< A > y otro en U . Si A tiene norma 1, es decir A A = 1, entonces la proyecci on de C sobre < A > es [C A]A. Signica que en este caso la longitud del vector proyectado es precisamente el producto escalar C A. En Rn se puede denir el siguiente producto escalar, que llamaremos producto escalar can onico y que convierte a Rn en el espacio eucl deo E n . Si A = (a1 , a2 , , an ), B = (b1 , b2 , , bn ), denimos A B = a1 b1 + a2 b2 + + an bn . Se prueba f acilmente que esta operaci on es efectivamente un producto escalar. En este caso la norma de un vector A es
2 1/2 2 . A = (a2 1 + a2 + + an )

El concepto de vectores ortogonales es el ya conocido de la geometr a euclideana del plano, es decir vectores que forman entre ellos un angulo de 90 grados. Si C yA son vectores de norma 1 entonces la proyecci on de C sobre A es el coseno del angulo comprendido. Luego si ahora C y A son vectores no nulos cualesquiera, C/ C y A/ A son vectores de norma 1 y por lo tanto [C/ C ] [A/ A ] = cos , donde es el angulo comprendido entre ellos y de aqu C A= C A cos .

11 Producto escalar

147

Pero importa aclarar que estos conceptos y f ormulas son v alidos para este producto escalar en particular, no para cualquier otro producto escalar. En un espacio vectorial de dimensi on n pueden denirse innitos productos escalares. No obstante, veremos que estos innitos espacios eucl deos resultantes son isomorfos al espacio E n . Dos espacios eucl deos V y U se dicen isomorfos si existe entre ellos una aplicaci on lineal biyectiva que respeta el producto escalar, es decir, si A y B son dos vectores cualesquiera de V entonces A B = (A) (B ). De paso, veremos la expresi on general que tiene todo producto escalar en un espacio eucl deo V de dimensi on n . Sea {B1 , B2 , , Bn } una base de V tal que Bi Bj = aij . Sean A y B dos vectores arbitrarios de V , A = a1 B1 + a2 B2 + + an Bn , C = c1 B1 + c2 B2 + + cn Bn . Entonces AC = a1 c1 (B1 B1 ) + a1 c2 (b1 B2 ) + + a1 cn (B1 Bn )+ a2 c1 (B2 B1 ) + a2 c2 (B2 B2 ) + + a2 cn (B2 Bn )+ . . . an c1 (Bn B1 ) + an c2 (Bn B2 ) + + an cn (Bn Bn ) = aij ai cj ,
i,j

que en notaci on matricial se puede escribir (a1 , a2 , , an )M o bien (a1 , a2 , , an )M (c1 , c2 , , cn ) , donde M es la matriz de coecientes aij = Bi Bj . Signica que una vez conocido el producto escalar entre los elementos de una base queda determinado el c1 c2 . . . cn ,

11 Producto escalar

148

producto escalar entre vectores cualesquiera del espacio mediante la expresi on anterior. La matriz M asociada al producto escalar depende tanto de este producto escalar como de la base que se ha elegido para expresar los vectores del espacio por sus componentes. Esta matriz debe reunir ciertas condiciones; es obviamente una matriz cuadrada y sim etrica dado que aij = Bi Bj = Bj Bi = aji para 1 i, j n. Adem as debe satisfacer que si A es un vector de componentes (a1 , a2 , , an ), A = O, entonces A
2

= A A = (a1 , a2 , , an )M (a1 , a2 , , an ) > 0.

Una matriz que satisface estas propiedades se llama denida positiva. Una condici on necesaria y suciente para que una matriz sim etrica M , de coecientes aij , sea denida positiva es que a11 a a > 0, 11 12 a12 a22 a11 a12 a13 > 0, a12 a22 a23 a13 a23 a33 > 0, , |M | > 0.

Es decir, los determinantes de todos los menores principales de M deben ser positivos. Toda matriz sim etrica denida positiva dene un producto escalar en el espacio vectorial Rn . Ahora bien, en todo espacio eucl deo existen bases ortogonales y ortonormales. Este resultado es consecuencia de que una recta vectorial tiene un subespacio ortogonal que es suplementario de el. As , en un espacio eucl deo de dimensi on 1 toda base es obviamente ortogonal. En un espacio eucl deo V de dimensi on 2 se elige un vector no nulo. El subespacio ortogonal de la recta que genera es un subespacio de dimensi on 1 y luego un vector no nulo aqu con el vector anterior forman una base ortogonal de V . Por lo tanto todo espacio eucl deo de dimensi on 2 tiene una base ortogonal. En un espacio eucl deo V de dimensi on 3 el subespacio ortogonal a una recta tiene dimensi on 2; luego una base ortogonal aqu junto con un vector base de la recta vectorial forman una base ortogonal de V . Y as siguiendo. O sea que mediante un procedimiento inductivo se prueba

11 Producto escalar

149

que en todo espacio eucl deo de dimensi on nita hay bases ortogonales. Por consiguiente hay tambi en bases ortonormales, que se consiguen multiplicando los vectores ortogonales por el escalar inverso de su norma. Si en un espacio eucl deo V se elige una base ortogonal para expresar los vectores mediante sus componentes entonces es claro que la matriz M asociada al producto escalar resulta una matriz diagonal, es decir si M tiene coecientes aij , es aij = 0 si i = j . Si la base elegida es ortonormal entonces la matriz asociada resulta la matriz identidad I . Luego en este caso el producto escalar toma la forma (a1 , a2 , , an )I (c1 , c2 , , cn ) = a1 c1 + a2 c2 + + an cn , que es el producto escalar que dene el espacio E n . Luego todo espacio eucl deo V de dimensi on n es isomorfo a E n . Basta expresar los vectores de V mediante componentes referidas a una base ortonormal. Cabe aclarar que cuando se cambia de base el producto escalar no cambia. S olo se modica su expresi on de c alculo pero no el resultado de este c alculo. Supongamos que {V1 , V2 , , Vn } es una base de V , no necesariamente ortogonal, y que M es la matriz asociada al producto escalar denido en V con respecto a esta base. Luego si A y C son dos vectores de V de componentes (a1 , a2 , , an ) y (c1 , c2 , , cn ), respectivamente, tenemos que A C = (a1 , a2 , , an )M (c1 , c2 , , cn ) . Supongamos ahora que {B1 , B2 , , Bn } es una base ortogonal de V . Existe una matriz no singular P tal que si (x1 , x2 , , xn ) son las componentes de un vector arbitrario X de V respecto a la base {V1 , V2 , , Vn } y (x1 , x2 , , xn ) son las componentes del mismo vector con respecto a la base {B1 , B2 , , Bn } entonces (x1 , x2 , , xn ) = (x1 , x2 , , xn )P. En particular, el vector de componentes de B2 es (0, 1, 0, , 0) y en general el vector de componentes de Bi ser a la n-upla compuesta por ceros, salvo un 1 en su lugar i. Pero multiplicar estas n-uplas (las) a izquierda de P da por resultado la primera la de P , la segunda la de P, , la i- esima la de P ,

11 Producto escalar

150

respectivamente. Signica que las las de la matriz P son las componentes de la base ortogonal referidas a la base dada inicialmente {V1 , V2 , , Vn }. Por otra parte, A C = (a1 , a2 , , an )P M P (c1 , c2 , , cn ) . Esta u ltima es la expresi on del mismo producto escalar cuando las componentes de los vectores se reeren a la base ortogonal {B1 , B2 , , Bn } y por lo tanto su matriz asociada es ahora D = PMP , que por lo tanto debe ser necesariamente diagonal. Si dij es el coeciente que est a en la la i y columna j de D entonces dij = Bi Bj . Este producto escalar es 0 si i = j y es igual a Bi
2

si i = j . Por lo tanto, la

matriz P es precisamente aqu ella que se necesita para transformar la matriz M en matriz diagonal. Como M es sim etrica ocurrir a que la multiplicaci on de P por su izquierda la transformar a en triangular superior y la multiplicaci on de P por la derecha de P M transformar aa esta en diagonal. En resumen, la obtenci on de P provee de un m etodo para encontrar componentes de una base ortogonal. Ejemplo Supongamos que en R3 tenemos denido el producto escalar dado por la matriz 2 1 1 1 1 M = 1 1 1 2

cuando se reeren los vectores a la base can onica de R3 . Los vectores de esta base no son ortogonales para este producto escalar. Encontraremos una base ortogonal. La matriz P se obtiene de forma que su producto a izquierda de M triangularice a esta. La siguiente matriz coloca ceros en los lugares a21 y a31 de M : 1 0 0 1 2 0 . 1 0 2 2 1 1 1 1 . Ahora hay que colocar un cero La matriz producto queda 0 0 1 3 en el lugar a32 de esta matriz. Para eso se la debe multiplicar a izquierda por

11 Producto escalar la matriz 1 0 0 0 1 0 . 0 1 1

151

Luego la matriz P es 1 0 0 1 0 0 1 0 0 0 1 0 1 2 0 = 1 2 0 . 0 2 2 1 0 2 0 1 1 Las tres las de esta matriz son las componentes de los vectores ortogonales para el producto escalar considerado. Como la base de referencia es la can onica, los vectores de R3 de la base ortogonal hallada coinciden con sus vectores componentes.

12

Determinantes

Sea V un espacio vectorial no nulo. Como ya se ha visto en la unidad de producto escalar, una forma bilineal es una aplicaci on : V V R, lineal en cada componente. Supongamos ahora que V tiene dimensi on dos. La forma bilineal se llama alternada si (A, B ) = (B, A) para todo par de vectores en V . Puede probarse f acilmente que esta condici on es equivalente a (A, A) = 0 para todo A V . De ahora en adelante denotar a una forma bilineal alternada. Observar que esta queda determinada por el valor (V1 , V2 ), donde {V1 , V2 } es alguna base de V . En efecto, si A = 1 V1 + 2 V2 , B = 1 V1 + 2 V2 , entonces (A, B ) = (1 V1 + 2 V2 , 1 V1 + 2 V2 ) = (1 2 2 1 ) (V1 , V2 ). Llamemos 0 a la forma bilineal alternada que satisface 0 (V1 , V2 ) = 1. Entonces queda claro que toda otra ser a m ultiplo de aqu ella. Por ejemplo, si (V1 , V2 ) = a, entonces = a0 . Ya que tanto la suma usual de formas bilineales alternadas como el producto a izquierda por un escalar de una tal forma tambi en lo son (ejercicio), la conclusi on anterior arma que con estas operaciones el conjunto de todas las formas bilineales alternadas es un espacio vectorial de dimensi on 1. Consideremos ahora un endomorsmo : V V. Es f acil vericar que si es no nula, entonces (A, B ) ( (A), (B )) (12)

12 Determinantes

153

es una forma bilineal alternada. Luego, por el resultado anterior, esta expresi on debe ser m ultiplo de (A, B ): ( (A), (B )) = d (A, B ). (13)

Este n umero d no depende de la forma bilineal que se considere, dado que toda otra forma bilineal alternada es m ultiplo de y por lo tanto la ecuaci on (13) queda inalterada si se reemplaza por cualquier otra forma bilineal alternada. Este hecho es importante. El n umero d depende exclusivamente de la aplicaci on lineal . Se lo llama determinante de . En vista de que un endomorsmo tiene, jada una base del espacio V , una matriz asociada, cabe preguntarse por la relaci on entre esta matriz y el determinante del endomorsmo. Sea entonces M= a11 a12 a21 a22

la matriz asociada a con respecto a una base {B1 , B2 }. Recordemos que de acuerdo con la interpretaci on de M , se tiene (B1 ) = a11 B1 + a21 B2 , (B2 ) = a12 B1 + a22 B2 . Sea una forma no nula. Por (13) sigue que (a11 a22 a21 a12 ) (B1 , B2 ) = ( (B1 ), (B2 )) = d (B1 , B2 ). Luego d = (a11 a22 a21 a12 ) = a11 a12 . a21 a22 (14)

El n umero d tambi en se llama determinante de la matriz M , y se suele simbolizar por det (M ) o bien por |M |. Notar que, en virtud de (12), 0 (A, B ) = 1 1 2 2 = 1 2 2 1 ,

donde 0 es la forma denida arriba y (1 , 2 ), (1 , 2 ) son las componentes de A y B con respecto a la base {V1 , V2 }, respectivamente. Enunciaremos y probaremos a continuaci on propiedades del determinante. (a) Si es la aplicaci on identidad entonces su matriz asociada es la matriz identidad. Sigue inmediatamente de (13) o de (14) que su determinante es 1.

12 Determinantes

154

(b) Si 1 y 2 son dos endomorsmos de V en V , entonces la composici on 2 1 es otro endomorsmo. Por (13) su determinante satisface ( 2 ( 1 (A)), 2 ( 1 (B ))) = det ( 2 1 ) (A, B ), donde elegimos como cualquier forma no nula. Por la denici on del determinante de 2 , sigue que ( 2 ( 1 (A)), 2 ( 1 (B ))) = det ( 2 ) ( 1 (A), 1 (B )). A su vez, por la denici on del determinante de 1 , se obtiene ( 1 (A), 1 (B )) = det ( 1 ) (A, B ). Se concluye que det ( 2 1 ) = det ( 2 ) det ( 1 ). (c) Si es un endomorsmo biyectivo, es decir un automorsmo, entonces existe la aplicaci on inversa 1 , que compuesta con da por resultado la aplicaci on identidad. Usando (a) y (b) sigue que 1 = det ( 1 ) = det ( ) det ( 1 ). (d) Sigue inmediatamente de (c) que una matriz no singular, o sea una matriz asociada a un automorsmo, tiene un determinante no nulo. Rec procamente, si una matriz es singular, es decir, asociada a un endomorsmo no biyectivo, entonces tiene un determinante nulo. En efecto, si : V V es no biyectivo y {B1 , B2 } es una base de V , entonces (B1 ) y (B2 ) son linealmente dependientes. La demostraci on se completa resolviendo el siguiente ejercicio: Si A y B son linealmente dependientes, entonces (A, B ) = 0. (e) Si M1 es la matriz que se obtiene de M intercambiando dos columnas de ella, entonces det (M1 ) = det (M ). Esto es evidente a partir de la ecuaci on (14). Bajo el marco de endomorsmos, supongamos que M1 y M est an asociadas a 1 y , respectivamente. Luego det (M1 ) = det ( 1 ) y det (M ) = det ( ), y adem as ( 1 (B1 ), 1 (B2 )) = det ( 1 ) (B1 , B2 ), ( (B1 ), (B2 )) = det ( ) (B1 , B2 ), (15) (16)

12 Determinantes

155

donde es una forma no nula y {B1 , B2 } es la base de V que se us o para determinar M . Por la construcci on de M1 , se tiene que 1 (B1 ) = (B2 ), 1 (B2 ) = (B1 ). Luego ( 1 (B1 ), 1 (B2 )) = ( (B2 ), (B1 )) = (B1 , B2 ). Usando (15) y (16) se deduce que det ( 1 ) = det ( ). (f) De (14) se sigue que si M es la matriz traspuesta de M , entonces det (M ) = det (M ). (g) Usando (e) y (f) se prueba que el intercambio de dos las en una matriz modica los valores de los correspondientes determinantes en un cambio de signo s olamente. (h) De (13) o de (14) se deduce que el determinante de una matriz con dos columnas o las iguales es cero. Se prueba tambi en f acilmente que a11 + b11 a12 a21 + b21 a22 a11 a12 + b12 a21 a22 + b22 Se concluye que a11 + a12 a12 a21 + a22 a22 a11 a12 + a11 a21 a22 + a21 = = a11 a12 , a21 a22 a11 a12 , a21 a22 = = a11 a12 a21 a22 a11 a12 a21 a22 + + b11 a12 , b21 a22 a11 b12 . a21 b22

cualquiera sea el real . En vista de (f), lo an alogo para las es tambi en v alido. A continuaci on veremos la aplicaci on de los determinantes en la resoluci on de un sistema compatible determinado de ecuaciones lineales, M x1 x2 = b1 b2 .

Sabemos que en el contexto de espacio vectorial esto signica resolver en X = x1 V1 + x2 V2 la ecuaci on (X ) = B, donde B = b1 V1 + b2 V2 es un vector conocido en V , {V1 , V2 } es una base de V , y : V V es un automorsmo, tambi en conocido, que tiene a M= m11 m12 m21 m22

12 Determinantes

156

por matriz asociada con respecto a la base dada. Luego la ecuaci on anterior se escribe (x1 V1 + x2 V2 ) = x1 (V1 ) + x2 (V2 ) = B. Sea 0 la forma que satisface 0 (V1 , V2 ) = 1. De aqu 0 (x1 (V1 ) + x2 (V2 ), (V2 )) = x1 0 ( (V1 ), (V2 )) = x1 det (M ) = 0 (B, (V2 )), y 0 (x1 (V1 ) + x2 (V2 ), (V1 )) = x2 0 ( (V2 ), (V1 )) = x2 det (M ) = 0 (B, (V1 )). Como M es una matriz no singular, su determinante es no nulo, por lo que es posible despejar las inc ognitas x1 y x2 de las ecuaciones de arriba: x1 = 0 (B, (V2 ))/ det (M ), x2 = 0 ( (V1 ), B )/ det (M ). Finalmente, debido a (12), se tiene que 0 (B, (V2 )) = b1 m12 , 0 ( (V1 ), B ) = b2 m22 m11 b1 . m21 b2

Estas son las llamadas f ormulas de Cramer. Si ahora V es un espacio vectorial de dimensi on tres, se dene una forma trilineal alternada a una aplicaci on : V V V R, lineal en cada componente y tal que (A, B, C ) = 0 cada vez que entre A, B y C hay al menos dos vectores iguales. El valor absoluto |(A, B, C )| es independiente de la posici on que ocupen los vectores A, B y C en el argumento de . En cambio, si |(A, B, C )| > 0, su signo depende de esta posici on. De hecho, su signo ser a el mismo que el de (A, B, C ) si y s olo si la nueva reordenaci on equivale a una cantidad par (dos en este caso) de intercambios simples. Por ejemplo, sig (C, A, B ) = sig (A, B, C ),

12 Determinantes

157

ya que para llegar a la reordenaci on (C, A, B ) a partir de (A, B, C ) hace falta intercambiar A con C y despu es A con B , o bien intercambiar B con C y despu es hacerlo entre A y C . Por otra parte, se tiene por ejemplo que sig (B, A, C ) = sig (A, B, C ), ya que una reordenaci on se obtiene de otra mediante un u nico intercambio simple. Sea ahora {V1 , V2 , V3 } una base de V . Sea A = a1 V1 + a2 V2 + a3 V3 , B = b1 V1 + b2 V2 + b3 V3 , C = c1 V1 + c2 V2 + c3 V3 . Luego (A, B, C ) = a1 b2 c3 (V1 , V2 , V3 ) + a1 b3 c2 (V1 , V3 , V2 ) + a2 b1 c3 (V2 , V1 , V3 ) + a2 b3 c1 (V2 , V3 , V1 ) + a3 b1 c2 (V3 , V1 , V2 ) + a3 b2 c1 (V3 , V2 , V1 ). Ahora bien, por ser alternada se tiene (V1 , V2 , V3 ) = (V2 , V3 , V1 ) = (V3 , V2 , V1 ) = (V1 , V3 , V2 ) = (V2 , V1 , V3 ) = (V3 , V1 , V2 ). Luego (A, B, C ) = (a1 b2 c3 + a2 b3 c1 + a3 b2 c1 a1 b3 c2 a2 b1 c3 a3 b1 c2 )(V1 , V2 , V3 ). Esta u ltima es la f ormula an aloga a (12) para el caso de dimensi on tres. As como en el caso de dimensi on dos, ella sugiere que la expresi on encerrada entre par entesis ser a el valor del determinante a1 b1 a2 b2 a3 b3 de la matriz c1 c2 . c3

En general, la denici on de determinante de una matriz de orden n, con n > 3, es similar a la vista aqu . En este caso debe considerarse una forma multilineal o n-lineal alternada. Se deduce que el valor del determinante de una matriz se obtiene mediante una suma (de n! sumandos) de productos de n factores. Estos factores se eligen de cada una de las n columnas, de manera

12 Determinantes

158

que no aparezcan dos elementos de una misma la. Si la reordenaci on de los elementos del factor con respecto a la posici on original 1, 2, , n supone una cantidad par de intercambios simples, entonces el signo de este factor coincide con el signo del factor correspondiente a la posici on original. De lo contrario, tiene un signo opuesto al de aqu el. Es claro que todas las propiedades (a) - (g) vistas para el caso de dimensi on dos, as como las expresiones an alogas de las f ormulas de Cramer, siguen valiendo en el caso general. M as a un, sus demostraciones son las mismas que las aqu expuestas. En la demostraci on de (f) se usa la expresi on concreta del c alculo del determinante de una matriz. Pero vale destacar que puede probarse tambi en recurriendo a la interpretaci on de determinante de un endomorsmo. Si se procede de esta manera es necesario entonces caracterizar al endomorsmo que tiene por matriz asociada a la traspuesta de otra. A su vez esto requiere de la herramienta de un producto escalar. En la unidad siguiente de diagonalizaci on de matrices se presentar a una situaci on similar cuando se intente caracterizar a los endomorsmos que tienen por matriz asociada a una matriz sim etrica. En cuanto al c alculo efectivo de un determinante puede decirse que el m etodo m as pr actico consiste en triangular superiormente a la matriz mediante combinaciones lineales de las que no afecten al valor del determinante. Si es necesario hacer intercambio de columnas o de las debe tenerse presente que el determinante cambia de signo. Por otra parte, el determinante de una matriz triangular es el producto de los elementos de la diagonal principal. Como ejemplo calcularemos el siguiente determinante: 4 6 2 1 3 0 1 1 1 1 0 1/2 . 0 1 1 1

d=

Para transformar la matriz en triangular superior conviene primero intercambiar la primera con la tercera columna ya que de esta manera conseguimos dos ceros en la primera columna. El proceso se detalla a continuaci on. d= 1 6 0 1 0 0 1 1 4 1 2 1/2 3 1 1 1 1 6 4 1 0 1 2 1/2 = 0 0 3 1 0 7 3 2

12 Determinantes 1 0 0 0 6 4 1 1 2 1/2 0 3 1 0 11 11/2 1 0 = 0 0 6 1 0 0 4 1 2 1/2 3 1 0 11/6

159

= 11/2.

13

Diagonalizaci on de matrices

Sea M una matriz cuadrada de orden n, n > 1. Sabemos que esta matriz representa a un endomorsmo : V V, donde V es un espacio vectorial de dimensi on n, siempre que hayamos jado dos bases en V , una de ellas actuando en V como dominio de , y otra actuando en V como codominio de . Es claro que estas dos bases pueden ser la misma para ambas interpretaciones del espacio V . Por ejemplo, si suponemos que estas dos bases son iguales a la base {B1 , B2 , , Bn } de V , entonces M es la matriz asociada al endomorsmo que act ua de la siguiente manera: y1 x1 y2 x2 = M . . , . . . . yn xn de tal forma que y1 B1 + y2 B2 + + yn Bn es el vector imagen de x 1 B1 + x 2 B2 + + x n Bn mediante este endomorsmo. Ahora bien, veamos qu e ocurre si M es una matriz diagonal. Para jar ideas, supongamos n = 3, pero teniendo siempre presente que los argumentos empleados en lo que sigue son v alidos para cualquier entero n > 1. Sea entonces 1 0 0 M = 0 2 0 . 0 0 3 Luego, por (17), y teniendo en cuenta que las componentes de los vectores de la base B1 , B2 , B3 son (1,0,0),(0,1,0) y (0,0,1), respectivamente, sigue que (B1 ) = 1 B1 , (B2 ) = 2 B2 , (B3 ) = 3 B3 . Si M no es diagonal, est a claro que lo anterior no va a valer para los vectores de esta base. Pero podemos preguntarnos si no habr a otra base, digamos {V1 , V2 , V3 }, para la cual existan reales 1 , 2 , 3 cumpliendo (V1 ) = 1 V1 , (V2 ) = 2 V2 , (V3 ) = 3 V3 . (18)

(17)

13 Diagonalizaci on de matrices

161

Esta pregunta tiene una respuesta relativamente f acil, al menos te oricamente. Est a claro que la respuesta es armativa si y s olo si la matriz asociada a con respecto a esta nueva base es diagonal. Esta u ltima matriz es de la forma P 1 M P, donde P es la matriz, no singular, del cambio de base, esto es, la matriz que transforma las componentes de un vector de V con respecto a la nueva base {V1 , V2 , V3 } a las componentes de ese mismo vector con respecto a la base original {B1 , B2 , B3 }. La matriz P es precisamente aqu ella que tiene por columnas, en el orden correspondiente, a las componentes de los vectores V1 , V2 , V3 con respecto a la base {B1 , B2 , B3 }. Si existe P tal que P 1 M P es una matriz diagonal, entonces la matriz M se dice diagonalizable. Como todas las bases de V est an en correspondencia biun voca con todas las matrices no singulares, tenemos el siguiente resultado: Una matriz cuadrada M , asociada a un endomorsmo : V V , es diagonalizable si y s olo si existe una base de V , {V1 , V2 , V3 }, que satisface (18). Un vector A = O en V que satisface (A) = A (19)

para alg un real se llama un autovector de (o tambi en autovector de la matriz M ), mientras que el n umero real se llama autovalor de (o autovalor de M ). De esta manera el resultado anterior, ahora en general, puede decirse tambi en as . Una matriz cuadrada M , de orden n, es diagonalizable si y s olo si tiene n autovectores linealmente independientes. Observar que las deniciones de autovector y autovalor se reeren en principio a un endomorsmo : V V . En otras palabras, son deniciones independientes de cualquier base que elijamos para describir expl citamente la acci on de . Dado que todas las matrices de la forma P 1 M P , con P no singular,

13 Diagonalizaci on de matrices

162

est an asociadas al mismo endomorsmo, ocurrir a que todas ellas tendr an (de existir) los mismos autovectores y autovalores. Este hecho tambi en permite plantear la cuesti on que conduce a la obtenci on de autovectores y autovalores de una matriz M asociada a un endomorsmo . Est a claro que el planteo inicial es la ecuaci on (19). Si A = a1 B1 + a2 B2 + a3 B3 (suponemos otra vez n = 3) entonces (19) es equivalente a 0 0 a1 a1 a1 M a2 = a2 = 0 0 a2 . 0 0 a3 a3 a3 Si m11 m12 m13 M = m21 m22 m23 , m31 m32 m33

entonces esas dos ecuaciones son equivalentes a m11 m12 m13 a1 0 m21 m22 m23 a2 = 0 . m31 m32 m33 a3 0

(20)

Este sistema lineal de ecuaciones tiene soluciones a1 , a2 , a3 , no todas nulas, si y s olo si el determinante de la matriz de coecientes es nulo. Este determinante resulta un polinomio en (aqu de grado 3, en general de grado n). Se llama polinomio caracter stico de la matriz M . Todo radica entonces en que este polinomio tenga ra ces reales. Una ra z real 1 de este polinomio ser a un autovalor de M . El paso siguiente consiste en obtener los autovectores correspondientes a este autovalor 1 . Es decir, obtener las soluciones de (20) reemplazando por 1 en su matriz de coecientes. Estas soluciones autovectores forman un subespacio de V , de dimensi on 1 o m as, llamado autoespacio de , o de M . De este modo se obtienen todos los autovalores y autovectores de M . Si de all se encuentran tres (en general n) autovectores linealmente independientes, entonces M es diagonalizable y la matriz P que la diagonaliza tiene precisamente por columnas a las componentes de estos autovectores linealmente independientes. Por el contrario, si no hay tres (en general n) autovectores linealmente independientes, entonces M no es diagonalizable. Ejemplos

13 Diagonalizaci on de matrices 1) Hallar los autovalores y autovectores de la matriz 2 1 0 M = 0 1 1 . 0 2 4 Tenemos que 2 1 0 0 1 1 0 2 4 = ( 2)2 ( 3).

163

Por consiguiente M tiene 2 autovalores, a saber 2 y 3. El autovalor 2 produce los autovectores cuyas componentes son soluci on de 0 1 0 a1 0 0 1 1 a2 = 0 . a3 0 2 2 0 La matriz de coecientes de este sistema tiene rango 2, y por lo tanto hay s olo una soluci on linealmente independiente, por ejemplo (1,0,0). Es decir, el vector B1 , o cualquier m ultiplo no nulo de el, es un autovector de M . El autovalor 3 produce los autovectores cuyas componentes son soluci on de 1 1 0 a1 0 0 2 1 a2 = 0 . 0 2 1 a3 0 Tambi en esta matriz de coecientes tiene rango 2. Una soluci on linealmente independiente del sistema es (1,1,-2). Luego B + B2 2B3 , o cualquier m ultiplo no nulo de el, es otro autovector linealmente independiente con el anterior. En conclusi on, en este ejemplo s olo podemos encontrar dos autovectores linealmente independientes, y por lo tanto la matriz M no es diagonalizable. 2) Hallar los autovalores y autovectores de la matriz 1 1 2 M = 0 5 1 . 0 0 7 Sabiendo que el determinante de una matriz triangular, como es la anterior, es el producto de los elementos de su diagonal principal, es muy f acil obtener sus autovalores. Estos son 1,5 y 7. Procediendo como en 1) resultan los

13 Diagonalizaci on de matrices

164

autovectores linealmente independientes cuyas componentes son (1,0,0),(1,4,0) y (1,-2,4). Luego esta matriz M es diagonalizable, y por lo tanto 1 0 0 P 1 M P = 0 5 0 , 0 0 7 donde 1 1 1 P = 0 4 2 . 0 0 4

El ejemplo 2) anterior muestra un hecho que tiene validez general. Si una matriz cuadrada tiene r autovalores distintos, entonces sus r autovectores correspondientes son linealmente independientes. En particular, si una matriz de orden n tiene n autovalores distintos, entonces es una matriz diagonalizable. La demostraci on de esa armaci on se apoya en la siguiente Proposici on Si A 1 , A2 , , A r , r 2 , es un conjunto de autovectores linealmente independientes correspondientes a autovalores distintos entre s , entonces toda combinaci on lineal de ellos, que no se reduzca a un m ultiplo de uno de ellos, no puede ser autovector. Demostraci on: Sea B = a1 A1 + a2 A2 + + ar Ar , donde al menos dos coecientes son no nulos. Si B fuera autovector tendr amos a1 A1 + + ar Ar = B = (B ) = a1 (A1 ) + + ar (Ar ) = a1 1 A1 + + ar r Ar . Como los vectores A1 , , Ar son linealmente independientes y al menos hay dos coecientes ai no nulos, la igualdad entre el primer t ermino y el u ltimo t ermino de las ecuaciones anteriores implicar a que debe ser igual a dos reales distintos i , lo que es contradictorio. Corolario 1 Si A 1 , , Ar

13 Diagonalizaci on de matrices

165

son autovectores correspondientes a r autovalores distintos entre s , entonces ellos son linealmente independientes. Demostraci on: Si r = 1, la armaci on es obvia. Si r > 1, entonces el n umero de vectores linealmente independientes entre A1 , , Ar debe ser al menos dos, porque si hubiera s olo uno con esta condici on, los dem as ser an m ultiplos de el y por lo tanto tendr an los mismos autovalores. Pero entonces todos deben ser l.i., ya que si as no sucediera habr a uno de ellos combinaci on lineal de al menos otros dos, lo que contradice la Proposici on anterior. Corolario 2 Si una matriz de orden n tiene n autovalores distintos entre s , entonces existe una u nica base constituida por autovectores, salvo multiplicidad en cada uno de ellos, y por lo tanto es diagonalizable. Demostraci on: Aplicando el Corolario 1 sigue que debe haber una base de autovectores y por lo tanto la matriz es diagonalizable. Todo autovector debe ser necesariamente un m ultiplo de alg un vector de esta base, ya que si fuera combinaci on lineal de al menos dos de ellos se contradir a el Corolario 1. Notar que la armaci on rec proca del Corolario 1 no es cierta en general. Por ejemplo, dos autovectores pueden ser linealmente independientes y tener autovalores iguales.

13.1

Matrices sim etricas

Recordemos que M es una matriz sim etrica si M =M , donde M es la matriz transpuesta de M , esto es la matriz que se obtiene de M intercambiando sus las por columnas. En este caso se tiene un resultado importante: Toda matriz sim etrica es diagonalizable. Recurriremos a la teor a general de espacios vectoriales para probar esta aseveraci on. Como de costumbre, interpretamos a una matriz cuadrada M de orden n como asociada a un endomorsmo : V V , supuesto que hemos jado una base {B1 , B2 , , Bn } de V . Pero ahora hay que traducir el hecho de ser

13 Diagonalizaci on de matrices

166

M sim etrica a una propiedad de su endomorsmo asociado . Esta idea debe quedar clara. Obviamente no todas las matrices cuadradas son sim etricas. Por lo tanto aqu ellas que s lo son deben estar asociadas a determinados endomorsmos. Es decir, endomorsmos que posean alguna propiedad adicional, de tal forma que estos, y s olo estos, tengan matrices asociadas sim etricas. Ahora bien, no es posible determinar una tal propiedad s olamente a partir de los conceptos derivados exclusivamente de la estructura de espacio vectorial: subespacios, independencia lineal, base, dimensi on. Concretamente, para determinar esa propiedad necesitamos el concepto de producto escalar. Supongamos entonces que en V tenemos denido un producto escalar A B . Decimos que un endomorsmo : V V es sim etrico (respecto al producto escalar) si (A) B = A (B ) para cualquier par de vectores A, B en V . Veamos que la matriz asociada, con respecto a una base ortonormal de V , a un endomorsmo sim etrico es una matriz sim etrica. Para ello recordemos que, jada esta base ortonormal de V , la acci on de un producto escalar est a dada por b1 b2 A B = (a1 , a2 , , an ) . = a1 b1 + a2 b2 + + an bn , . . bn donde (a1 , a2 , , an ) y (b1 , b2 , , bn ) son las componentes de A y B con respecto a la base ortonormal dada, respectivamente. Si (21) es verdadero entonces (a1 , a2 , , an )M b1 b2 . . . bn = (a1 , a2 , , an )M b1 b2 . . . bn , (21)

ya que (a , an )M son las componentes de (A), escritas como vector 1 , a2 , b1 b2 la, y M . son las componentes del vector (B ), escritas como vector . . bn

13 Diagonalizaci on de matrices

167

columna. Como la igualdad anterior es v alida para vectores A y B cualesquiera, sigue que debe ser M = M , es decir M es una matriz sim etrica. Teniendo ya caracterizada la propiedad de los endomorsmos que tienen por matrices asociadas a matrices sim etricas, debemos probar ahora, de acuerdo con la secci on anterior, que tales endomorsmos poseen n autovectores linealmente independientes. En realidad probaremos a un algo m as, a saber que ellos poseen n autovectores ortogonales (recordemos que la condici on de ortogonalidad implica independencia lineal). Teorema Todo endomorsmo sim etrico posee n autovectores ortogonales. Demostraci on: Se divide en dos partes. En la primera parte se prueba que existe un autovector de . En la segunda parte se procede por inducci on para llegar al resultado nal. Supongamos entonces que : V V satisface (A) B = A (B ) para todo par de vectores A, B en V . Primera parte Consideremos el conjunto S = {A V : A A = 1}. Para cada A S consideremos el n umero A (A). En t erminos de las componentes con respecto a una base ortonormal, este producto escalar se escribe a1 a2 (a1 , a2 , , an )M . . . . an Esta operaci on representa una funci on continua de Rn en R. El conjunto de todas las componentes correspondientes a vectores de S es compacto y por lo tanto la funci on anterior alcanza all un m nimo. Es decir, existe A1 S tal que A1 (A1 ) A (A) para todo A S . Ahora probaremos que A1 es un autovector de . Como A1 est a en S , vale que A1 = O. Llamemos U al subespacio ortogonal a A1 . Es decir, todo vector en U es ortogonal a A1 . Sea B un vector arbitrario en U S . Para todo n umero real consideremos el vector A1 + B y sea = A1 + B . 1 Por el Teorema de Pit agoras, 2 = 1 + 2 . Adem as, (A1 + B ) S , por lo

13 Diagonalizaci on de matrices que la funci on de 1 1 (A1 + B ) ( (A1 ) + (B )) = 1 (A1 (A1 ) + 2 (A1 ) B + 2 B (B )) 1 + 2

168

(22) (23)

toma un m nimo absoluto, y tambi en relativo, en = 0. Como esta funci on es derivable para todo valor de , sigue que su derivada evaluada en = 0 debe ser nula, por lo cual (A1 ) B = 0. Como B es un vector arbitrario en U S , se concluye que (A1 ) es ortogonal a U . Pero esto signica precisamente que (A1 ) est a en el subespacio generado por A1 , es decir (A1 ) = A1 para alg un real , o sea que A1 es efectivamente un autovector de . Observar que la hip otesis de que es sim etrica se ha usado en el desarrollo de (22), por lo cual se obtiene el t ermino 2 (A1 ) B en (23). Segunda parte Con la notaci on de la primera parte de la demostraci on, U es el subespacio, de dimensi on n 1, ortogonal al autovector A1 . Si B U entonces (B ) tambi en est a en U . En efecto, (B ) A1 = B (A1 ) = 0, ya que (A1 ) es un m ultiplo de A1 y B es ortogonal a todo m ultiplo de A1 . Quiere decir que , restringido al subespacio U , es tambi en un endomorsmo y adem as es obviamente sim etrico. Este hecho permite aplicar un argumento inductivo. Por la primera parte del resultado existe en U un autovector, digamos A2 , para la restricci on de a U . Por estar en U , A2 es ortogonal a A1 . Ahora se considera el subespacio de U ortogonal a A2 y se vuelve a aplicar el mismo razonamiento. La t ecnica de la demostraci on por inducci on permite probar que cuando este procedimiento llega a su t ermino, entonces puede exhibirse una base ortogonal de V consistente de n autovectores del endomorsmo . Esto concluye la demostraci on. Este resultado asegura que el polinomio caracter stico de una matriz sim etrica tiene n ra ces reales, contando la multiplicidad de las mismas (puede haber ra ces dobles, triples, etc.) Si las n ra ces resultan todas distintas entre s , entonces por el Teorema y el Corolario 2 sigue que existe una u nica base de V formada por autovectores ortogonales, salvo multiplicidad. Signica que

13 Diagonalizaci on de matrices

169

en este caso el m etodo de c alculo de la secci on anterior conduce necesariamente a obtener autovectores ortogonales. En el caso general puede armarse que autovectores correspondientes a autovalores distintos son ortogonales pero de hecho habr a, en el caso de ra ces m ultiples, autovectores no ortogonales correspondientes al mismo autovalor. Ejercicio. Probar por c alculo directo que una matriz sim etrica no diagonal de orden 2 tiene autovalores distintos. Ejemplo Encontrar los autovalores y autovectores de la matriz 3 1 1 M = 1 3 1 1 1 3 y diagonalizarla. El polinomio caracter stico de M es (2 )2 (5 ). Luego hay dos autovalores distintos, 2 y 5. El autovalor 2 produce un autoespacio de dimensi on 2 y el autovalor 5 produce un autoespacio de dimensi on 1. Cualquier autovector del primero de ellos ser a ortogonal a un autovector del otro autoespacio. Pero, obviamente, dentro del autoespacio de dimensi on 2 pueden encontrarse autovectores no ortogonales entre s . El autoespacio de dimensi on 2 est a formado por los autovectores cuyas componentes son las soluciones del sistema 1 1 1 a1 0 1 1 1 a2 = 0 . 1 1 1 a3 0 Por ejemplo, dos componentes correspondientes a autovectores ortonormales pueden ser (1/ 2, 1/ 2, 0) y (1/ 6, 1/ 6, 2/ 6). El autoespacio correspondiente al autovalor 5 est a formado por los autovectores cuyas componentes son soluciones del sistema 2 1 1 0 a1 1 2 1 a2 0 . = a3 1 1 2 0 La componente correspondiente al u nico autovector ortonormal en este autoes pacio es (1/ 3, 1/ 3, 1/ 3).

13 Diagonalizaci on de matrices 2 0 0 Luego P 1 M P = 0 2 0 , donde 0 0 5 1/2 1/6 1/3 P = 1/ 2 1/6 1/3 . 0 2/ 6 1/ 3

170

En este caso no hay una u nica base de autovectores. Podemos elegir, por ejemplo, como autovectores correspondientes al autovalor 2 a aqu ellos que tienen por componentes (1, 1, 0) y (0, 1, 1), y como autovector correspondiente al autovalor 5, a aqu el que tiene por componente a (1, 1, 1). Para la matriz 1 0 1 1 1 tambi Q = 1 en vale que 0 1 1 2 0 0 Q1 M Q = 0 2 0 . 0 0 5

14

M etodos num ericos en Algebra

Todo sistema matem atico que implique operaciones entre n umeros reales se enfrenta con la cuesti on de la cantidad de cifras signicativas exactas que habr an de usarse en los n umeros involucrados en esas operaciones. Si un n umero real se escribe en la forma a1 a2 ar 10s , donde ai son d gitos, es decir n umeros enteros entre 0 y 9, a1 = 0, y s es un entero, entonces este n umero tiene r cifras signicativas. Esto supone que un n umero usado en el c alculo puede no ser exactamente igual al que debe intervenir, y esto hace a su vez que se produzcan errores en las operaciones. En la primera parte de esta unidad veremos algunas formas de uso del m etodo de Gauss para la resoluci on de un sistema compatible determinado que minimiza el error de redondeo producido por esa situaci on. Consideremos el siguiente Ejemplo En la resoluci on del sistema 0, 003000x1 + 59, 14x2 = 59, 17 5, 291x1 6, 130x2 = 46, 78 se consideran todos los valores num ericos con cuatro cifras signicativas exactas, tanto los valores iniciales como los resultados parciales. Si as se procede, se obtiene x1 = 10, 00, x2 = 1, 001. Sin embargo la soluci on exacta es x1 = 10, x2 = 1. El tremendo error obedece a lo relativamente peque no del valor 0,003. En estos casos es recomendable llevar el elemento con mayor valor absoluto de la primera columna a la primera posici on de la diagonal principal mediante un intercambio de las. Si as se hace, entonces debe resolverse el sistema equivalente 5, 291 6, 130 46, 78 0, 003000 59, 14 59, 17 .

Trabajando tambi en ahora con cuatro cifras signicativas exactas, la soluci on resulta ser la correcta. Para sistemas de orden superior el proceso se aplica cada vez que se reinician los c alculos en cada columna. Una variante del procedimiento anterior es la siguiente.

14 M etodos num ericos en Algebra

172

Sean aij , 1 i n, 1 j n + 1, los coecientes de la matriz ampliada del sistema. Para cada i se dene mi = max |aij |, 1 j n + 1, y se lleva a la primera posici on de la diagonal principal, mediante intercambio de las, a aquel coeciente de la primera columna que produce el mayor valor entre las expresiones |ak1 |/mk , 1 k n. An alogamente al caso anterior, este m etodo se aplica sucesivamente en cada submatriz principal hasta llegar a la matriz transformada triangular superior. Por u ltimo, otro procedimiento alternativo consiste en realizar apropiados intercambios de las y columnas de manera que los elementos de la diagonal principal queden ordenados, en su valor absoluto, de mayor a menor. Es decir, la matriz de coecientes as reordenada satisface |a11 | |a22 | |ann |. Con este proceder no debe perderse de vista que el intercambio de columnas supone un correspondiente intercambio de inc ognitas a tener en cuenta una vez resuelto el sistema.

M etodos iterativos
El m etodo de Gauss es directo, en el sentido de que la soluci on se calcula exactamente mediante un algoritmo nito. Si hay error en la soluci on, esto es debido exclusivamente a que en los c alculos intermedios hay recortes en las cifras signicativas exactas. Por el contrario, existen m etodos, llamados iterativos, que parten de una soluci on aproximada para posteriormente calcular una sucesi on de soluciones que se espera converja a la soluci on exacta. De entre estos m etodos veremos dos, a saber los que se conocen bajo el nombre de Jacobi y de Gauss-Seidel. La matriz de coecientes debe estar condicionada de forma que todos los elementos de su diagonal principal sean no nulos. Si de entrada no se da esta condici on entonces, mediante un apropiado intercambio de las, es siempre posible conseguirla. Sea el sistema de orden n, A x1 x2 . . . xn b1 b2 . . . bn ,

donde A es una matriz no singular de orden n, con coecientes aij , y donde suponemos que su soluci on es no nula. Bajo la suposici on de que aii = 0 para todo 1 i n, queda claro que podemos despejar la inc ognita xi de la i- esima

14 M etodos num ericos en Algebra ecuaci on, resultando el sistema equivalente X = T X + C,

173

(24)

donde T es una matriz de orden n que depende s olo de A, con ceros en su diagonal principal, X es la matriz columna de inc ognitas y C es una matriz columna que depende de B y de los elementos de la diagonal principal de A. Se ja un valor inicial X0 y usando (1) se obtiene la secuencia X1 = T X0 + C, X2 = T X1 + C, , Xk = T Xk1 + C, . Se espera que la sucesi on X0 , X1 , , Xk , converja a la soluci on exacta. Este hecho no siempre se da, si bien pueden darse condiciones sucientes sobre la matriz A para que ello ocurra. Otra cuesti on que se presenta con este m etodo es determinar para qu e valor de k puede asegurarse que Xk es una soluci on aceptable del sistema. Un criterio para determinar este valor de k obedece a una situaci on general para toda sucesi on. Es de esperar que si Xk1 y Xk dieren poco, entonces tambi en disten poco del l mite de la sucesi on. Luego un criterio razonable es parar la iteraci on cuando (Xk Xk1 )/(Xk ) sea menor que una cantidad peque na prejada, donde (X ) se dene como la mayor de las coordenadas de X , consideradas en valor absoluto. A mayor exigencia de exactitud, tanto m as peque na ser a esta cantidad prejada. Un valor razonable puede ser 103 o 104 . Este es el m etodo de Jacobi. En cuanto al m etodo de Gauss-Seidel, debe decirse que es una modicaci on no demasiado sustancial del m etodo anterior, si bien da en general mejores resultados que aqu el. Consiste en lo siguiente. Cuando se usa la ecuaci on (1) para obtener X1 a partir de X0 vamos calculando en un orden sus coordenadas. Calculada mediante (1) la primera coordenada de X1 , usamos este valor, en lugar de la primera coordenada de X0 , para obtener las siguientes coordenadas de X1 . Hallada de esta manera la segunda coordenada de X1 , usamos tambi en este valor, en vez de la segunda coordenada de X0 , para obtener las siguientes coordenadas de X1 . Y as siguiendo. Signica que tambi en se usa la ecuaci on (1) pero con un vector X0 que se va modicando a partir del c alculo de la segunda coordenada. Este proceso de realimentaci on concluye en la obtenci on etodo de de un vector X1 , que es en general distinto que el hallado con el m Jacobi. Para obtener los siguientes vectores de la sucesi on se procede de la misma manera. El criterio de parada de la iteraci on es tambi en el mismo que para el m etodo de Jacobi.

14 M etodos num ericos en Algebra Ejemplo Consideremos el sistema 10 1 2 0 x1 1 11 1 3 x2 2 1 10 1 x3 0 3 1 8 x4

174

6 25 = 11 . 15

Despu es de despejar xi de la i- esima ecuaci on se obtiene x1 3/5 x1 0 1/10 1/5 0 x2 1/11 0 1/11 3/11 x2 + 25/11 . = x3 1/3 1/10 0 1/10 x3 11/10 x4 15/8 0 3/8 1/8 0 x4 0 0 etodo de Gauss-Seidel Comenzando con el vector inicial X0 = 0 , por el m 0 se obtiene 0, 6 1, 030 1, 0065 2, 3272 2, 037 2, 0036 X1 = 0, 9873 , X2 = 1, 014 , X3 = 1, 0025 , 0, 8789 0, 9844 0, 9983 1, 0009 1, 0001 2, 0003 , X5 = 2, 0000 . X4 = 1, 0003 1, 0000 0, 9999 1, 0000 Se tiene que (X5 X4 )/(X5 ) = 0, 0008/2 = 4.104 . La soluci on exacta es x1 = 1, x2 = 2, x3 = 1, x4 = 1.

C alculo de autovalores y autovectores


En muchas aplicaciones, sobre todo en la F sica, surge la necesidad de calcular los autovalores y autovectores de una matriz cuadrada de orden n. Un autovalor es la ra z de un polinomio de grado n, el llamado polinomio caracter stico de la matriz. Es bien sabido que para n > 4 no hay f ormulas generales para el c omputo de tales ra ces, lo que lleva a recurrir a t ecnicas de c alculo aproximado. En estos casos es sumamente u til tener una idea de la localizaci on de las ra ces. El siguiente teorema da una respuesta a esta cuesti on. Teorema del c rculo de Gerschgorin Sea A = {aij } una matriz cuadrada de orden n. Entonces sus autovalores reales, cuando existen, se encuentran en la uni on de n intervalos de la forma |x aii |
j =i

|aij |, i = 1, , n.

14 M etodos num ericos en Algebra

175

Con esta informaci on es posible ahora aplicar m etodos iterativos del c alculo de las ra ces del polinomio caracter stico de A, tal como se vi o en la unidad 7. Posteriormente se hallan los autovectores resolviendo el correspondiente sistema lineal homog eneo por alguno de los m etodos disponibles.

15

Funciones de varias variables


R2 := {(x, y ) : x R, y R},

En esta unidad trabajaremos con funciones denidas en conjuntos de

teniendo en cuenta que muchos de sus conceptos y resultados pueden extenderse a funciones denidas en conjuntos de Rn , n > 2. Los conjuntos que usaremos como dominio de funciones ser an generalmente conjuntos convexos. Un conjunto A en R2 se dice convexo si cada vez que (a, b) A, (c, d) A, entonces todos los puntos del segmento que une esos dos puntos est an tambi en en A, esto es (a, b) + (1 )(c, d) A para todo , 0 1. Observar que una denici on an aloga es v alida en Rn , n 1. En realidad, la denici on es pertinente en todo espacio vectorial. Ocurre que en R los u nicos conjuntos convexos son los intervalos. La extensi on del concepto de intervalo a R2 (y m as generalmente a Rn ) ser a el de producto cartesiano de intervalos, es decir rect angulos. Los rect angulos son conjuntos convexos pero ahora no son los u nicos convexos de R2 . Un c rculo, por ejemplo, es un conjunto convexo. Esta mayor cantidad de conjuntos convexos obedece a la mayor dimensi on de R2 sobre R. De alguna manera este hecho introduce una complicaci on en el an alisis de las funciones de dos o m as variables. Diremos que una sucesi on {(xn , yn )} de puntos en R2 converge o tiende a un punto (a, b) si la sucesi on xn tiende a a y la sucesi on yn tiende a b. Esto signica que dado > 0, arbitrario, vale que |xn a| < , |yn b| < para valores grandes de n. Este hecho sugiere denir como entorno de un punto (a, b) al conjunto de puntos (x, y ) que satisfacen las dos desigualdades anteriores. Una vez denido el concepto de entorno, las deniciones de punto

15 Funciones de varias variables

177

de acumulaci on de un conjunto, punto interior a un conjunto, conjunto cerrado y conjunto abierto son las mismas que en el caso de subconjuntos de R. Por este motivo, las deniciones de l mite funcional y continuidad para funciones de dos o m as variables no tienen ninguna diferencia con respecto a las correspondientes deniciones para funciones de una variable real. Si A R2 , (a, b) es un punto de acumulaci on de A y f : A R, entonces lim f (x, y ) = l para (x, y ) (a, b) si cada vez que la sucesi on (xn , yn ) (a, b), (xn , yn ) A, vale que f (xn , yn ) l. Ejemplos 1) Sea f : R2 R, f (x, y ) = x2 . 1 + x2 + y 2

Luego lim f (x, y ) = 0 para (x, y ) (0, 0) dado que f (xn , yn ) 0 si (xn , yn ) (0, 0). 2) Sea A = R2 \ {(0, 0)} y sea x2 . f : A R, f (x, y ) = 2 x + y2 Si (xn , yn ) (0, 0) con xn = 0, yn = 0, entonces claramente f (xn , yn ) 0. Si en cambio (xn , yn ) (0, 0) con xn = yn = 0, entonces f (xn , yn ) 1/2. Luego el l mite de esta funci on no existe para (x, y ) (0, 0). Si (a, b) A, entonces f se dice continua en (a, b) si lim f (x, y ) = f (a, b) para (x, y ) (a, b). La funci on de 1) del Ejemplo de arriba es continua en (0, 0) as como en todo su dominio. La funci on de 2) es continua en todo punto de su dominio. (Notar que el origen no pertenece al dominio de la funci on.) Una sucesi on {(xn , yn )} se dice acotada si las dos sucesiones, {xn } e {yn }, son acotadas.

15 Funciones de varias variables

178

Un conjunto A en R2 es acotado si toda sucesi on que podamos formar con puntos en el es acotada. Esto es equivalente a que A est e contenido en un rect angulo. Un conjunto cerrado y acotado se llama compacto. Se mantiene el principio de Bolzano-Weierstrass: Todo conjunto acotado de innitos puntos tiene al menos un punto de acumulaci on. Podemos dar la siguiente versi on del Teorema de Bolzano: Si A es un conjunto convexo y f : A R es continua, entonces si f toma distinto signo en dos puntos de A, vale que existe un punto en el interior del segmento que une aquellos puntos donde f se anula. Por otra parte, el Teorema de Bolzano Weierstrass se mantiene sin alteraciones: Si A es compacto y f : A R es continua, entonces f alcanza en A un valor m aximo y un valor m nimo absolutos. Lo an alogo vale para el Teorema de Heine Cantor: Si A es compacto y f : A R es continua, entonces es uniformemente continua, es decir, dado |f (a, b) f (c, d)| < . Como en el caso de funciones de una variable real, estos dos teoremas son consecuencia del principio de Bolzano-Weierstrass. > 0, arbitrario, existe > 0 tal que si (a, b) y (c, d) est an en A, |a c| < , |b d| < , entonces

15.1

Derivaci on

Vimos en funciones de una variable real que la derivada en un punto representa de alg un modo el grado de cambio de la variable dependiente a medida que la variable independiente se acerca a ese punto. En el presente caso tenemos que las dos variables independientes pueden acercarse a un punto (a, b) de R2 por muchos caminos, entre los cuales

15 Funciones de varias variables

179

podemos considerar segmentos, es decir aproximarse al punto a trav es de una linea recta. En particular, podemos acercarnos a (a, b) a trav es de puntos de la forma (x, b), con x a, o bien con puntos de la forma (a, y ), con y b. Si ahora tenemos una funci on u = f (x, y ) tal que (a, b) est a en su dominio, entonces en el primer caso podemos hablar de una derivada de la funci on (de una variable x) f (x, b) en el punto a y en el segundo caso de una derivada de la funci on (de una variable y ) f (a, y ) en el punto b. Si estas derivadas existen, se llaman derivadas parciales de f en (a, b), con respecto a x y con respecto a y , respectivamente. Por consiguiente, sus deniciones son fx (a, b) = lim f (a, b + h) f (a, b) f (a + h, b) f (a, b) , fy (a, b) = lim , h0 h0 h h

respectivamente. Si las derivadas parciales existen en todo el dominio de una funci on entonces existen las funciones derivadas parciales, como as tambi en pueden existir las sucesivas funciones derivadas de orden superior. Ejemplo f : R2 R, f (x, y ) = xsen y + y cos x. Es ux = fx (x, y ) = sen y y sen x, uy = fy (x, y ) = x cos y + cos x, uxx = fxx (x, y ) = y cos x, uyy = fyy (x, y ) = xsen y, uxy = fxy (x, y ) = uyx = fyx (x, y ) = cos y sen x. El hecho de que fxy = fyx no es casualidad. Puede probarse que la existencia y continuidad de una de las derivadas mixtas en un punto implica la existencia e igualdad de la otra derivada mixta en ese punto. Bajo esta hip otesis, en las derivadas sucesivas s olo importa la cantidad de veces que se deriva con respecto a x y a y , sin interesar el orden en que se deriva.

15 Funciones de varias variables

180

En el caso de funciones de una variable real la existencia de derivada en un punto implica la continuidad en ese punto. En general esto no es as en el caso de funciones de dos o m as variables. Empero, si las dos derivadas parciales son acotadas en un conjunto abierto A, entonces la funci on es continua en todo punto de A.

15.2

Diferenciabilidad

La existencia de derivada de una funci on de una variable real en un punto a de su dominio implica que f (a + x) f (a) = f (a) + (x), x con (x) 0 cuando x 0. Esto puede escribirse f (a + x) = f (a) + xf (a) + x (x), donde y = f (a) + xf (a) es precisamente la recta tangente a la curva gr aca de f en el punto a. Signica que para valores peque nos de x, o en otros t erminos, para valores de la variable independiente pr oximos al punto a, la funci on puede representarse aproximadamente como una funci on lineal, siendo su diferencia el t ermino x , innit esimo de orden superior a x. Este mismo concepto puede aplicarse a funciones de dos o m as variables independientes. Si u = f (x, y ) es una funci on para la que existen sus dos derivadas parciales en un punto (a, b) de su dominio, escribimos f (a + x, b + y ) = f (a, b) + xfx (a, b) + yfy (a, b) + , (25)

donde ahora es la distancia del punto (a + x, b + y ) al punto (a, b), es decir = Si ocurre que x2 + y 2 .

0 cuando 0, entonces decimos que la funci on f es

diferenciable en el punto (a, b). Signica que la funci on f puede aproximarse por la funci on lineal u = f (a, b) + xfx (a, b) + yfy (a, b) en un entorno del punto (a, b). Esta funci on lineal tiene por representaci on gr aca al llamado plano tangente a la supercie gr aca de la funci on en el

15 Funciones de varias variables

181

punto (a, b). A diferencia de lo que pasa con funciones de una sola variable independiente, la mera existencia de las dos derivadas parciales no garantiza la diferenciabilidad de la funci on de dos variables independientes. Pero la existencia y continuidad de esas dos derivadas parciales en el punto s implica que la funci on sea diferenciable en ese punto. De valer esta condici on, se dice que la funci on es continuamente diferenciable en el punto en cuesti on. Observar que la diferenciabilidad en (a, b) implica la existencia de un grado de cambio de la funci on f en (a, b) si nos acercamos al punto a trav es del segmento (a + cos , b + sen ), para cualquier valor jo de en [0, 2 ). En efecto, por la ecuaci on (25) sigue que f (a + cos , b + sen ) f (a, b) = fx (a, b) cos + fy (a, b)sen + . Si 0 cuando 0 sigue que el anterior cociente incremental en la direcci on de tiende a fx (a, b) cos + fy (a, b)sen cuando 0. El l mite de este cociente incremental, para 0, es lo que se llama la derivada direccional de la funci on f en la direcci on de . La existencia de la derivada direccional en un punto para toda direcci on no implica que la funci on sea diferenciable en ese punto. M as a un, ni siquiera tienen que existir necesariamente las derivadas parciales. Ejemplo La funci on f : R2 R, f (x, y ) = x2 + y 2 , tiene derivadas direccionales en el origen para toda direcci on , aqu ellas son iguales a 1, pero no es diferenciable en el origen ni existen sus dos derivadas parciales, ya que f (x, 0) = |x|, f (0, y ) = |y |. La representaci on gr aca de esta funci on es un cono con v ertice en el origen.

15.3

Funciones compuestas

En muchas aplicaciones se da el caso de que en la funci on u = f (x, y ) las variables x e y dependen a su vez de otra u otras variables independientes.

15 Funciones de varias variables Supongamos por ejemplo que es x = x(t) e y = y (t). De esta manera queda determinada una funci on compuesta F (t) = f (x(t), y (t))

182

de una variable real t. Propiedades de continuidad y diferenciabilidad se transmiten a trav es de estas funciones. Si f, x e y son continuas en sus correspondientes dominios entonces F resulta tambi en continua en su dominio. Lo an alogo ocurre con la diferenciabilidad. Es muy conveniente conocer la expresi on de la derivada de F (t) en t erminos de las derivadas de f, x e y . Tenemos que F (t) = fx (x(t), y (t))x (t) + fy (x(t), y (t))y (t). Si es x = x(w, z ), y = y (w, z ), entonces queda determinada la funci on compuesta G(w, z ) = f (x(w, z ), y (w, z )). En caso de existencia, sus derivadas parciales vienen dadas por Gw (w, z ) = fx (x(w, z ), y (w, z ))xw (w, z ) + fy (x(w, z ), y (w, z ))yw (w, z ), Gz (w, z ) = fx (x(w, z ), y (w, z ))xz (w, z ) + fy (x(w, z ), y (w, z ))yz (w, z ). De manera an aloga se procede en caso de otras funciones compuestas. Estas f ormulas se conocen con el nombre de Regla de la cadena. Como ejemplo de aplicaci on deduciremos el Teorema del valor medio. Supongamos que la funci on f (x, y ) es diferenciable en un entorno del punto (x0 , y0 ). Consideremos un punto de la forma (x0 + h, y0 + k ) con valores jos de h y k , y sucientemente peque nos para que este punto est e en el entorno en cuesti on. Llamemos t a una variable que recorre el intervalo [0, 1]. Luego el punto (x0 + th, y0 + tk ) est a en el entorno dado para todo valor de t en ese intervalo. Si ahora consideramos la funci on F : [0, 1] R, F (t) = f (x0 + th, y0 + tk ),

15 Funciones de varias variables

183

sigue de la discusi on anterior que F es derivable en [0, 1] y por lo tanto, usando el Teorema del valor medio del c alculo diferencial en una variable, se tiene que F (1) F (0) = F (t0 ), donde t0 es un n umero en el intervalo (0, 1). Por consiguiente, teniendo en cuenta las funciones x(t) = x0 + th, y (t) = y0 + tk y usando la regla de la cadena, se obtiene que f (x0 + h, y0 + k ) f (x0 , y0 ) = hfx (x0 + t0 h, y0 + t0 k ) + kfy (x0 + t0 h, y0 + t0 k ). Ser a de utilidad m as adelante (concretamente en el estudio de extremos relativos) conocer la expresi on de F (t), y particularmente F (0). Observar que tanto F (0) como F (0) son derivadas laterales por derecha, dado que F (t) y F (t) est an denidas para 0 t 1. Supongamos que f tiene derivadas segundas continuas en el entorno dado del punto (x0 , y0 ). Tenemos que F (t) = hfx (x, y ) + kfy (x, y ), donde x = x0 + th, y = y0 + tk. Luego, usando otra vez la regla de la cadena (recordar que las derivadas mixtas son iguales), sigue que F (t) = h2 fxx (x, y ) + 2hkfxy (x, y ) + k 2 fyy (x, y ). De aqu , F (0) = h2 fxx (x0 , y0 ) + 2hkfxy (x0 , y0 ) + k 2 fyy (x0 , y0 ). (26)

15.4

Extremos relativos. Multiplicadores de Lagrange


Se dice que una funci on f : A R tiene un m nimo relativo en un punto (x0 , y0 ) interior a su dominio si f (x, y ) f (x0 , y0 ) para todos los puntos (x, y ) en un entorno de (x0 , y0 ).

15 Funciones de varias variables

184

El m nimo se dice estricto si la desigualdad anterior es estricta. An alogamente se dene un m aximo relativo. Como ocurre en el estudio de funciones de una variable real, el an alisis de las derivadas de la funci on en un entorno del punto permite obtener los extremos (m aximos o m nimos) relativos de la funci on. Suponemos que f tiene derivadas segundas continuas en su dominio. Dado que la existencia de un extremo relativo de la funci on f (x, y ) en (x0 , y0 ) implica la existencia de un extremo relativo de la funci on de una variable f (x, y0 ) (respectivamente, f (x0 , y )) en el punto x0 (respectivamente, y0 ), pasa que debe ser fx (x0 , y0 ) = fy (x0 , y0 ) = 0. (27) Estas son condiciones necesarias para la existencia de extremos relativos pero no sucientes. Signica que los extremos relativos de la funci on se seleccionar an entre aquellos puntos (x0 , y0 ) que satisfacen (27). El criterio de selecci on se discute a continuaci on. Sean h y k dos valores para los que ocurre que (x + h, y + k ) est a en el entorno de arriba, siendo adem as h2 + k 2 = , donde es un n umero positivo jo. Llamemos S al conjunto compacto de todos estos puntos (h, k ). Consideremos otra vez la funci on compuesta de la secci on anterior F (t) = f (x, y ), donde x = x0 + th, y = y0 + tk, 0 t 1. (Notar que F depende tambi en de h y k ). De (26) y (27) sigue que F (0) = 0 para todo (h, k ) S. Si F (0) > 0 para todo (h, k ) en S , entonces, en vista de que la expresi on F (t) = h2 fxx (x, y ) + 2hkfxy (x, y ) + k 2 fyy (x, y ) es continua como funci on de x e y , y S es acotado, sigue que F (t) /2 para todo (h, k ) en S y para todo t en un intervalo [0, t0 ], t0 > 0. Por el teorema del valor medio en una variable, se tiene que F (t) t/2 para t en ese intervalo, y una nueva aplicaci on del teorema del valor medio prueba que F (t) F (0) t2 /2, y por lo tanto F (t) > F (0)

15 Funciones de varias variables

185

para 0 < t t0 y todo (h, k ) S . Volviendo a la denici on de la funci on compuesta F (t), se obtiene que esta u ltima desigualdad arma que el punto (x0 , y0 ) es un m nimo relativo estricto. Por otra parte, debido a la continuidad de F (0) como funci on de h y k y a la compacidad del conjunto S , la condici on F (0) > 0 para todo (h, k ) en S es consecuencia de la condici on F (0) > 0 para todo (h, k ) = (0, 0). A su vez, esta u ltima propiedad arma que la forma cuadr atica ( en h y k ) F (0) es denida positiva. Por u ltimo, esta condici on es equivalente a
2 fxx > 0, fxx fyy fxy > 0.

(28)

En conclusi on, se ha probado que si vale (27), entonces (28) implica que el punto (x0 , y0 ) es un m nimo relativo estricto de f . An alogamente, se demuestra que si (27) se verica, entonces la condici on
2 fxx < 0, fxx fyy fxy >0

asegura que el punto (x0 , y0 ) es un m aximo relativo estricto de f .

Extremos ligados
En ocasiones se presenta la cuesti on de tener que hallar un extremo de la funci on u = f (x, y ) sujeta a condiciones adicionales sobre las variables x e y . Concretamente, condiciones del tipo (x, y ) = 0. Por ejemplo, de todos los puntos del plano que satisfacen la ecuaci on xy 2 + x2 y = 1, queremos encontrar aqu ellos que est an a m nima distancia del origen. En este caso, se debe minimizar la expresi on x2 + y 2 , o bien (lo que es equivalente) minimizar x2 + y 2 , con la restricci on adicional de ser (x, y ) = xy 2 + x2 y 1 = 0. En general, este clase de problema puede resolverse con el m etodo llamado multiplicadores de Lagrange. Consiste en encontrar a su vez los extremos de la funci on de x e y f (x, y ) + (x, y ), (29)

15 Funciones de varias variables

186

donde es un par ametro, en principio desconocido. Las soluciones de las ecuaciones (en x, y y ) fx (x, y ) + x (x, y ) = 0, fy (x, y ) + y (x, y ) = 0, junto con la ecuaci on (29), proporcionan las soluciones buscadas. Consideremos el ejemplo anterior. Las ecuaciones que deben resolverse son 2x + y 2 + 2xy = 0 2y + x2 + 2xy = 0 x2 y + xy 2 1 = 0. (30) (31) (32)

Multiplicando la primera de ellas por x, la segunda por y , y sumando, queda 2(x2 + y 2 ) + 3 = 0, por lo que = 2 (x2 + y 2 ). Usando esta u ltima expresi on y substrayendo (31) 3 de (30) sigue que 2 (x y ) 2 + (x2 + y 2 )(x + y ) = 0. 3 Esta u ltima ecuaci on implica que, o bien x = y, 2 2 + (x2 + y 2 )(x + y ) = 0. 3 En el primer caso sigue de (32) que x=y=
3

1/2.

Estos valores de x e y son en efecto soluciones de (30),(31) y (32). La ndole geom etrica del problema indica entonces que el punto
3

1/2,

1/2

es el m as cercano al origen entre todos los puntos del primer cuadrante, x > 0, y > 0, que satisfacen (32). Supongamos ahora que 2 2 (x + y 2 )(x + y ) = 2. 3

15 Funciones de varias variables Teniendo en cuenta que (32) es equivalente a xy (x + y ) = 1,

187

(33)

se obtiene de estas dos ecuaciones que 2 (x2 +y 2 ) = 2xy . Escribiendo x2 +y 2 = 3 (x + y )2 2xy , sigue que (x + y )2 = xy. u y v , se obtiene x + y = xy = 1. Este sistema de dos ecuaciones, sim etrico en x e y , da las dos soluciones 1 5 51 x= ,y = , 2 2 51 1 5 x= ,y = . 2 2 Ambas son soluciones de (30),(31) y (32), por lo que ellas representan a los puntos del segundo y cuarto cuadrantes, respectivamente, m as pr oximos al origen entre todos aqu ellos que satisfacen (32). (34) Llamando u = x + y, v = xy , y observando que (33) y (34) son ecuaciones en

15.5

Ajuste lineal. M etodo de m nimos cuadrados

En las ciencias experimentales es algo usual el estudio de relaciones entre variables. En algunos casos es posible encontrar en teor a una ley matem atica que determina con precisi on el comportamiento de esa relaci on. Por ejemplo, la segunda ley de Newton establece que la fuerza que se ejerce sobre un cuerpo es la derivada del producto de su masa y velocidad. En otras ocasiones puede determinarse una relaci on emp rica a trav es de la observaci on experimental. Un ejemplo de esto se ve en la unidad 18. Consideremos el siguiente ejemplo f sico-deportivo. Se deja caer una pelota de baloncesto desde una determinada altura (x) y se mide la altura de su primer bote (y ). Obviamente existe una relaci on (creciente) entre x e y . Para tener una idea de esta relaci on se obtienen 9 pares de datos correspondientes (xi , yi ). Estos son (en cms): (90,63), (100,73), (100,70), (110,79), (110,80), (120,88), (130,96), (140,105), (150,116). Con estos datos se observa el siguiente gr aco:

15 Funciones de varias variables

188

110 100 90 80 100 110 120 130 140 150

La representaci on de los puntos en el plano permite suponer una relaci on lineal entre las variables x e y . Ahora surge la cuesti on de hallar una funci on lineal y = a + bx que ajuste convenientemente a los datos experimentales. En otras palabras, obtener valores de a y b de tal forma que la recta y = a + bx pase cerca de los puntos experimentales. Una manera de hacer esto es minimizar
n

F (a, b) =
i=1

(yi a bxi )2 ,

donde n es el n umero de pares de datos experimentales. En nuestro caso n = 9. Esto signica encontrar un m nimo relativo, que tambi en ser a absoluto, de la funci on F (a, b). Luego las dos derivadas parciales de esta funci on de a y b deben anularse. Estas dos condiciones son:
n

(yi a bxi ) = 0
i=1 n

(yi a bxi )xi = 0,


i=1

que equivalen a un sistema lineal de dos ecuaciones con dos inc ognitas, a y b. Sus soluciones son:
n n 2 yi n i=1 xi i=1 xi yi i=1 xi a = n n 2 2 n i=1 xi ( i=1 xi ) n n n i=1 xi yi n i=1 yi i=1 xi b = . n n 2 n i=1 xi ( i=1 xi )2 n i=1

En nuestro ejemplo, a = 15, 3125 cms., b = 0, 864583.

15 Funciones de varias variables

189

110 100 90 80 100 110 120 130 140 150

15.6

Integraci on

Sea f : A R una funci on continua, f (x, y ) 0, y donde A es un rect angulo compacto, esto es el producto cartesiano de dos intervalos compactos, [a, b] y [c, d]. En este caso puede denirse la integral doble de f sobre A de una forma an aloga al caso de funciones de una variable. Sendas particiones de los intervalos [a, b] y [c, d] producir an una partici on del rect angulo A en rect angulos m as peque nos, digamos Ai . Sabiendo que el area de un rect angulo es el producto de las longitudes de sus lados, y simbolizando por m(Ai ) a esta area, sigue que podemos denir las sumas superiores e inferiores, a saber S (f ) =
i

Ci m(Ai ), s(f ) =
i

ci m(Ai ),

donde Ci es el m aximo de f en Ai y ci es el m nimo de f en Ai . Ambas sumas dependen obviamente de la partici on dada. Adem as, s S . Cuando la partici on se va construyendo de forma tal que el m aximo de las areas de Ai tiende a cero, entonces ocurre que ambas sumas convergen a un valor num erico com un, digamos V , y se escribe V =
A

f (x, y ) dxdy.

Este n umero V se corresponde con el volumen del cuerpo que se forma bajo la supercie gr aca de la funci on f y sobre el rect angulo A. Si la funci on toma valores negativos en una parte de A, el c alculo de la integral doble considera ese signo en la parte correspondiente. Tal como pasa en la integral de una funci on de una variable, no es necesario, sino s olo suciente, que la funci on f sea continua para la existencia de la integral. En cuanto a su c alculo efectivo, ocurre afortunadamente que se puede reducir a su vez al c alculo de dos integrales sucesivas o iteradas. Esto se realiza de la siguiente manera. Se integra primero la funci on f (x, y ), consider andola como funci on de la variable

15 Funciones de varias variables

190

y s olamente, en el intervalo [c, d] (en otras palabras, la variable x se supone constante por el momento). El resultado de esta operaci on ser a una funci on de la variable x s olamente. As , podemos escribir
d

g (x) =
c

f (x, y ) dy.

Luego se integra la funci on g (x) en el intervalo [a, b], con lo cual resulta
b

V =
a

g (x) dx.

Debe destacarse que el otro orden en la iteraci on de la integraci on produce el mismo resultado, es decir
d b

V =
c a

f (x, y ) dx dy.

Ejemplo C alculo de V =
0 0 1 1

xexy dxdy.

Integramos primero con respecto a la variable y :


1 0

xexy dy = exy

y =1 y =0

= ex 1.

Luego V =
0

ex 1 dx = (ex x)

1 0

= e 2.

Como se dijo al principio de esta unidad, los conjuntos interesantes de R no se limitan a rect angulos. La teor a de integraci on en dos o m as variables
2

ser a por cierto muy pobre si el c alculo de integrales se redujera a operar s olo sobre rect angulos. De hecho, la teor a existente permite integrar sobre conjuntos (del plano, por ejemplo) a los que se les puede asignar un area. Los conjuntos convexos, y tambi en otros no convexos, se incluyen en esta clase. Supongamos ahora que D es un conjunto convexo y compacto del plano, y consideremos el rect angulo m as peque no que lo contiene, digamos [a, b] [c, d]. Si hacemos como antes una partici on de este rect angulo en peque nos rect angulos Ai , veremos que algunos de estos Ai quedan inclu dos en D, otros quedan completamente fuera de D y otros quedan en parte dentro y en parte fuera de D. Estos u ltimos son precisamente aqu ellos que contienen puntos de la

15 Funciones de varias variables

191

frontera de D. Si nos detenemos a observar esta u ltima clase de rect angulos de la partici on, veremos que a medida que el m aximo de la areas de los peque nos rect angulos tiende a cero, ocurre que el area total de ellos tambi en tiende a cero, es decir, su contribuci on en las sumas que conducen a la denici on de la integral se vuelve despreciable. Este es justamente el hecho que permite construir la integral de una funci on sobre un conjunto de este tipo. Ahora su c alculo efectivo supone cierta complicaci on. Empero, puede probarse que la t ecnica de integraci on iterada es similar al caso del rect angulo. Si integramos primero con respecto a la variable y , entonces para cada valor de x en el intervalo [a, b], aqu ella recorre los valores de un intervalo [y1 (x), y2 (x)], que ahora depende obviamente de x. De todas maneras, esta primera integraci on con respecto a y resulta en una funci on de x, funci on que debe integrarse ahora en el intervalo [a, b]. El procedimiento es similar si se opta por el otro orden de integraci on. Ejemplo C alculo de V =
D

x3 exy dxdy,

donde D es el conjunto convexo encerrado por el eje y , la recta y = 1 y el arco de par abola y = x2 . Para cada x en el intervalo [0, 1] debemos integrar esa funci on con respecto a y entre y1 = x2 e y2 = 1. Con respecto a la variable y , una primitiva de x3 exy es x2 exy . Luego
1 x2

x3 exy dy = x2 ex x2 ex .

Ahora debemos integrar esta u ltima funci on con respecto a x en el intervalo [0, 1]. Una primitiva de x2 ex es x2 ex 2xex + 2ex (integraci on por partes) y 2e5 x3 2 x3 una primitiva de x e es e /3. Luego V = 3 .

16

Ecuaciones diferenciales

Una ecuaci on diferencial es una ecuaci on donde intervienen las derivadas de una funci on, de una o varias variables. Su estudio corresponde a una de las ramas de las matem aticas que m as aplicaciones ofrece a las otras ciencias en general. El problema es encontrar una funci on de la cual sabemos ciertas relaciones de sus derivadas. Por ejemplo, se quiere encontrar una funci on x = x(t) que satisface x (t) + P (t)x = Q(t), donde P (t) y Q(t) son funciones conocidas. O bien una ecuaci on del tipo x (t) + m2 x = A sen t, donde m, A y son constantes num ericas.

Ca da de cuerpos
Por cierto que la F sica nos provee de numerosos ejemplos de ecuaciones diferenciales. Uno de los m as simples es la que describe el movimiento de un cuerpo en ca da libre: x (t) = g, donde x(t) es la funci on que da la altura del cuerpo en el instante t y g es la aceleraci on de la gravedad, por lo que su valor debe considerarse negativo. Integrando en ambos lados de la ecuaci on anterior obtenemos v (t) = x (t) = gt + v0 , donde v (t) es la velocidad del cuerpo en el instante t, y por lo tanto v0 es la velocidad en el instante inicial t = 0. Una segunda integraci on de esta ecuaci on nos da nalmente la funci on que rige la posici on del cuerpo en cada instante t: x = gt2 /2 + v0 t + x0 , donde x0 es la altura inicial del cuerpo. Si ahora suponemos que el aire ejerce una fuerza de resistencia proporcional a la velocidad x (t) del cuerpo (tambi en con valor negativo), entonces la ecuaci on tiene la forma mx (t) = mg cx (t),

16 Ecuaciones diferenciales

193

donde se ha usado la segunda ley de Newton, la cual arma que la fuerza que act ua sobre el cuerpo es el producto de su masa m por su aceleraci on. Ya que x (t) = v (t), la ecuaci on anterior puede escribirse mv (t) = mg cv (t), o bien v (t) = 1. g + cv (t)/m Integrando en ambos lados de esta u ltima ecuaci on, donde el lado izquierdo se integra por el m etodo de sustituci on, queda m ln(g + cv (t)/m) = t + c1 . c Despejando, se obtiene m v (t) = (g + Kect/m ). c Una segunda integraci on determinar a la posici on x(t) del cuerpo.

Desintegraci on radiactiva
La ley de desintegraci on del radio arma que la velocidad de desintegraci on es en cada instante proporcional a la cantidad de radio. Luego esta ley produce la siguiente ecuaci on: R (t) = kR(t), donde R(t) es la cantidad de radio en el instante t y k es la constante de proporcionalidad. Integrando la ecuaci on R (t)/R(t) = k, donde el lado de la izquierda se integra por el m etodo de sustituci on, se obtiene ln R(t) = kt ln R0 , donde R0 es la cantidad de radio en el instante t = 0. Luego R(t) = R0 ekt . Es de destacar que esta ley de decrecimiento exponencial rige en muchos fen omenos f sicos, como por ejemplo en el proceso de enfriamiento de un cuerpo, donde el ritmo de disminuci on de la cantidad de calor del cuerpo es proporcional a la diferencia de temperatura entre dicho cuerpo y el medio que lo rodea.

16 Ecuaciones diferenciales

194

Movimiento de un p endulo
Un p endulo simple es un punto material de masa m suspendido de un hilo de longitud l. Suponemos que el p endulo se mueve siempre dentro de un plano jo.

d d

d d

d d d mg sen c mg

d d

La posici on del p endulo en un instante t viene dada por la funci on (t), que es el angulo que forma el hilo con la vertical. El valor = 0 corresponde a la posici on de equilibrio (posici on vertical) y suponemos que los valores positivos de se obtienen cuando el p endulo se desplaza en sentido contrario a las agujas del reloj. El peso del punto material, mg , es la fuerza que produce el movimiento del p endulo. Esta fuerza se descompone en dos componentes, una en la direcci on del hilo y otra en direcci on perpendicular a la anterior, con un sentido dirigido siempre hacia la posici on de equilibrio. Es esta segunda componente la que determina en realidad el movimiento. Su expresi on en valor absoluto es |mg sen |. Por otra parte, la funci on derivada (t) es la velocidad angular, y se sabe que la velocidad tangencial del punto ser a l (t). Si soltamos el p endulo en un instante t = 0 en un valor 0 > 0, este iniciar a su desplazamiento hacia la posici on de equilibrio. La velocidad tangencial ser a negativa porque el angulo disminuir a su valor, pero en valor absoluto aqu ella

16 Ecuaciones diferenciales

195

ir a aumentando hasta pasar por la posici on de equilibrio. Luego la aceleraci on tangencial ser a tambi en opuesta a la componente del peso que produce el movimiento. Por lo tanto, usando la segunda ley de Newton, se obtiene la ecuaci on diferencial que describe el movimiento del p endulo simple. Esta es ml (t) = mg sen , o bien g (t) = sen . l Sirva como comentario que las soluciones de esta sencilla ecuaci on diferencial no pueden encontrarse entre aqu ellas que son combinaci on nita de funciones elementales. La generalidad de este hecho dio lugar a un avance espectacular en el estudio de las funciones de variable real, concretamente al desarrollo de funciones mediante series, principalmente series de potencias y series trigonom etricas. Una simplicaci on de la ecuaci on anterior permite encontrar una soluci on r apida. Es consecuencia de considerar un movimiento del p endulo para pequeos valores del angulo . En este caso puede aproximarse sen por , resultando la ecuaci on g (t) = (t). l M as adelante veremos que ella es resoluble mediante funciones trigonom etricas, logr andose una descripci on de las pequeas oscilaciones del p endulo muy cercana a la realidad experimental.

16.1

Ecuaciones de primer orden


Son aqu ellas en las que interviene la derivada primera de una funci on pero no derivadas de orden superior.

Un caso sencillo es el llamado de variables separables. Es una ecuaci on de la forma y = g (x)h(y ). Se resuelve encontrando por un lado una primitiva de 1/h(y ), digamos H (y ), considerando a y como variable independiente por el momento, y por otro lado

16 Ecuaciones diferenciales

196

una primitiva de g (x), digamos G(x). Como la derivada de la funci on H (y (x)), con respecto a x, es precisamente y /h(y ), sigue la ecuaci on H (y (x)) = G(x) + C, que en muchos casos permite despejar y en funci on de x. Ejemplo La ecuaci on y = 3 x2 y 2 se resuelve integrando 1/y 2 con respecto a y y por otro lado integrando 3x2 , lo que da 1/y = x3 + C . Luego y = 1/(x3 + C ).

Funci on homog enea


Una funci on f (x, y ) se dice homog enea de grado cero si f (x, y ) = f (x, y ) para todo = 0 y todo (x, y ) en su dominio. D andole a el valor 1/x, con x = 0, sigue que f (x, y ) = f (1, y/x). Consideremos una ecuaci on y = f (x, y ), donde f (x, y ) es una funci on homog enea de grado cero. Luego, para x = 0, y = f (1, y/x). Si llamamos z (x) al cociente y (x)/x, se obtiene que x z (x) es una funci on derivable. Como xz (x) = y (x), su derivada satisface z (x) + xz (x) = y (x). (35)

16 Ecuaciones diferenciales Luego (35) se escribe z (x) + xz (x) = f (1, z ), o bien z 1 = , f (1, z ) z x

197

que resulta ser una ecuaci on de variables separables. Una vez resuelta, se calcula y mediante y = xz (x). Ejemplo Resolver y = x2 2y 2 . xy

La funci on del lado derecho es homog enea de grado cero. Es f (1, z ) = (1 2z 2 )/z = 1/z 2z. As , f (1, z ) z = 1/z 3z = (1 3z 2 )/z. Luego debemos resolver la siguiente ecuaci on de variables separables: zz 1 = . 2 1 3z x Integrando ambos lados de esta ecuaci on, se obtiene 1 ln(1 3z 2 ) = ln(1 3z 2 )1/6 = ln(Cx). 6 Como el logaritmo es una funci on inyectiva, sigue que en la ecuaci on anterior sus argumentos deben ser iguales. Operando se obtiene z = u ltimo la soluci on es y=x 1 [Cx]6 3
1/2 1[Cx]6 3 1/2

. Por

Ecuaciones exactas
Supongamos que una funci on y = y (x) satisface la ecuaci on F (x, y (x)) = C,

16 Ecuaciones diferenciales

198

donde F (x, y ) es una funci on de dos variables independientes y C es una constante. En este caso se dice que la funci on y = y (x) viene dada en forma impl cita por la relaci on F (x, y ) = C, supuesto que hay un u nico valor de y satisfaciendo esa relaci on para cada valor de x. Cabe destacar aqu que la existencia de esta funci on y = y (x) puede asegurarse s olo localmente bajo las siguientes condiciones. Estas son: Que exista un punto (x0 , y0 ) tal que F (x0 , y0 ) = C . Tener F (x, y ) derivadas parciales de primer orden continuas en un entorno del punto (x0 , y0 ). Ser Fy (x0 , y0 ) = 0. Si estas condiciones se cumplen, entonces puede garantizarse que existe un entorno de x0 y un entorno de y0 (de ah la existencia local de y = y (x)) tal que para todo x en el primer entorno existe un u nico valor y en el segundo entorno que satisface F (x, y ) = C . Este resultado se conoce con el nombre de Teorema de la funci on impl cita. Suponiendo entonces la existencia, al menos localmente, de la funci on y = y (x), y dado que la funci on F (x, y (x)) es constante, se tiene que su derivada ser a nula para todo valor de x en el entorno de existencia de y = y (x). Usando la regla de la cadena, sigue que esta derivada es Fx (x, y ) + y Fy (x, y ). Si ahora consideramos una ecuaci on diferencial del tipo g (x, y ) + y h(x, y ) = 0, podemos preguntarnos si existir a una funci on F (x, y ) tal que Fx = g (x, y ) y Fy (x, y ) = h(x, y ) para todo par (x, y ) en su dominio. (37) (36)

16 Ecuaciones diferenciales Si as ocurre, esta ecuaci on diferencial se llama exacta.

199

En este caso, la discusi on anterior muestra que su soluci on ser a cualquier funci on y = y (x) dada por la forma impl cita F (x, y ) = C . La cuesti on consiste entonces en determinar cu ando una ecuaci on diferencial del tipo (36) es exacta. Una condici on necesaria es que gy (x, y ) = hx (x, y ). (38)

En efecto, esto es consecuencia de la igualdad de las derivadas cruzadas, Fxy = Fyx (estamos considerando la validez de las hip otesis sucientes sobre F para que se d e esta igualdad). Afortunadamente (38) es tambi en suciente para que (36) sea una ecuaci on diferencial exacta. Como veremos, una demostraci on de este hecho construye de paso una funci on F (x, y ) que lleva a la soluci on buscada. Para ello, primero encontramos, mediante integraci on, una funci on G(x, y ) tal que Gx (x, y ) = g (x, y ). Luego esta misma igualdad la cumple toda funci on G(x, y ) + (y ), donde (y ) es cualquier funci on derivable. Como nuestro objetivo es hallar una funci on que satisfaga (37), y la funci on anterior ya satisface, por su misma construcci on, la primera de esas condiciones, probamos con la segunda de ellas, a saber Gy (x, y ) + (y ) = h(x, y ). Esta igualdad permite de paso calcular la funci on inc ognita (y ) mediante integraci on de la funci on h(x, y ) Gy (x, y ). Pero entonces es requisito ineludible que esta u ltima funci on sea en realidad s olo funci on de y . Y as sucede, dado que su derivada parcial con respecto a x es hx (x, y ) Gyx (x, y ) = hx (x, y ) gy (x, y ), que es una funci on id enticamente nula, precisamente por (37). Por consiguiente, una soluci on de (36) viene dada en forma impl cita por G(x, y ) + (y ) = C.

16 Ecuaciones diferenciales Ejemplo La ecuaci on diferencial ey + (xey + 2y )y = 0

200

es exacta, como se puede vericar f acilmente. Para obtener una soluci on de ella, encontramos primero una funci on G(x, y ) cuya derivada con respecto a x y sea e . Esto da, por ejemplo, G(x, y ) = xey . Ahora hallamos la funci on (y ) calculando una primitiva de xey + 2y Gy (x, y ) = xey + 2y xey = 2y. Esto da (y ) = y 2 . Luego la soluci on de esta ecuaci on diferencial exacta viene dada en forma impl cita por xey + y 2 = C.

Ecuaciones lineales
Una ecuaci on lineal de primer orden puede escribirse en la forma y + A(x)y = B (x). (39)

Sea P (x) una funci on cuya derivada es A(x). Multiplicando ambos lados de (39) por eP (x) , queda y eP (x) + A(x)yeP (x) = B (x)eP (x) . Notar ahora que el lado izquierdo de la ecuaci on anterior es (yeP (x) ) , por lo que (39) se escribe (yeP (x) ) = B (x)eP (x) . De aqu sigue inmediatamente que una soluci on de (39) viene dada por y = eP (x) B (x)eP (x) dx + C ,

donde C es una constante arbitraria. Ejemplo

16 Ecuaciones diferenciales Para resolver la ecuaci on y + y = 3x, x

201

comenzamos por encontrar una primitiva de 1/x, por ejemplo ln x. Como e ln x = 1/x, eln x = x, la soluci on general es y= 1 x 3x2 dx + C = x2 + C . x

Ecuaciones reducibles en el orden


La ecuaci on general de segundo orden G(y , y , y, x) = 0 puede ser resuelta mediante la integraci on de dos ecuaciones de primer orden en los siguientes casos particulares. Si en la ecuaci on no gura la variable y entonces, mediante la sustituci on z = y , se la lleva a la ecuaci on de primer orden G(z , z, x), que una vez resuelta en z permite el c alculo de la soluci on nal, a saber y = z (x) dx. Si en la ecuaci on no aparece la variable x, entonces hay que hacer la suposici on de que la derivada y (x) puede expresarse en t erminos de la funci on y (x), es decir y = p(y ). Esto es posible si existe, al menos localmente, la funci on inversa de y = y (x). Por lo tanto se tiene que y = dp dy dy = = p p. dx dy dx

La ecuaci on original se transforma entonces en la ecuaci on de primer orden G(pp , p, y ) = 0. Si de aqu puede obtenerse la expresi on de p(y ), entonces y (x) es la soluci on de la ecuaci on y = p.

16 Ecuaciones diferenciales

202

16.2

Ecuaciones lineales de segundo orden

Una ecuaci on lineal de segundo orden tiene la forma y + A(x)y + B (x)y = R(x). (40)

Como ya se ha dicho anteriormente, esta ecuaci on diferencial no tiene en general una soluci on dada por una combinaci on nita de funciones elementales. Cabe preguntarse entonces si tiene alguna soluci on. Esta cuesti on tiene su respuesta en el siguiente Teorema Si A, B y R son funciones continuas en un intervalo compacto I , entonces para cada x0 I y para n umeros reales arbitrarios y0 , y0 existe una u nica funci on soluci on de (40), con dominio en el intervalo I , satisfaciendo y (x0 ) = y0 , y (x0 ) = y0 . Este es s olo un teorema de existencia, es decir no da ning un m etodo constructivo de las soluciones. Cuando R(x) 0 entonces la ecuaci on se llama homog enea. Puede probarse que la soluci on general de la ecuaci on homog enea est a dada por una combinaci on lineal de dos soluciones linealmente independientes, digamos a1 y1 (x) + a2 y2 (x), donde a1 y a2 son constantes arbitrarias. Esto es consecuencia de la linealidad de la derivaci on. Observar que la funci on id enticamente nula es siempre soluci on de la ecuaci on homog enea. Por otro lado, la soluci on general de la ecuaci on (40) es la suma de una soluci on particular de esta m as la soluci on general de la ecuaci on homog enea. Cuando se conoce una soluci on de la ecuaci on homog enea es posible determinar otra soluci on. En efecto, supongamos que y1 (x) satisface y1 + A(x)y1 + B (x)y1 = 0. (41)

Ponemos y2 (x) = y1 (x)u(x), donde u(x) habr a de hallarse de modo que y2 (x) verique (41). Por lo tanto, reemplazando y1 por y2 en (41) y usando que y1 es una soluci on, se llega a u y = 2 1 A. u y1 Integrando ambos lados de esta ecuaci on, se obtiene ln u = 2 ln y1 A dx,

16 Ecuaciones diferenciales es decir u = Finalmente, u=

203

1 R e 2 y1 1 R e 2 y1

A dx

A dx

dx.

As , y2 = uy1 , y puede probarse sin dicultad que y1 y la funci on y2 as obtenida son linealmente independientes. Ejemplo No es dif cil notar que y1 = x es una soluci on de la ecuaci on 1 1 y + y 2 y = 0. x x Luego otra soluci on linealmente independiente con aqu ella es xu donde u= 1 R (1/x) dx e dx = x2 1 ln x e dx = x2 x3 dx = x2 /2.

Por consiguiente, y2 = x1 /2 y la soluci on general viene dada por a1 x + a2 x1 .

La ecuaci on homog enea con coecientes constantes


Para la ecuaci on y + ay + by = 0, (42) donde a y b son constantes, existe un m etodo general de resoluci on. Este se basa en probar una soluci on de la forma y = emx . Reemplazando y por esta funci on en (42) se obtiene (m2 + am + b)emx = 0. Como emx nunca se anula, se concluye que la expresi on de arriba encerrada entre par entesis debe anularse. Sabemos que existen dos valores, digamos m1 y m2 , reales o complejos, que anulan esa expresi on. Hay tres posibles casos: Ra ces reales distintas En este caso em1 x y em2 x son dos soluciones linealmente independientes de (42).

16 Ecuaciones diferenciales Ra ces complejas distintas

204

Aqu m1 = r + is, m2 = r is, donde i es el n umero imaginario. Dos soluciones linealmente independientes son erx cos sx y erx sen sx. Ra ces reales iguales Como ahora hay s olo un valor num erico m1 que anula la expresi on cuadr atica m2 + am + b, tenemos en principio s olo una soluci on de (42). Empero, recurriendo al m etodo de obtenci on de una soluci on conoci endose otra, es posible deducir que en este caso em1 x y xem1 x son soluciones linealmente independientes de (42). Ejemplos 1) La ecuaci on y + y 6y = 0 conduce a resolver m2 + m 6 = 0. Las soluciones de esta ecuaci on cuadr atica son 2 y -3. Luego la soluci on general de la ecuaci on diferencial es a1 e2x + a2 e3x . 2) La ecuaci on y + 2y + y = 0 produce una ecuaci on cuadr atica asociada con una ra z doble, a saber -1. Luego su soluci on general es a1 ex + a2 xex . 3) La ecuaci on y + 9y = 0 produce la ecuaci on cuadr atica m2 + 9 = 0, cuyas soluciones son los n umeros complejos conjugados 3i. La soluci on general de la ecuaci on diferencial es a1 cos 3x + a2 sen 3x.

17

Estad stica y Probabilidad

La estad stica, como rama de las matem aticas, es una disciplina que en sus aspectos aplicados intenta obtener conclusiones sobre determinadas caracter sticas de una poblaci on de individuos, real o virtual, a trav es de una observaci on directa de una parte de esa poblaci on (muestra). En el siguiente ejemplo pr actico, si bien muy simple, est an encerradas las ideas fundamentales de una aplicaci on estad stica. Se trata en este caso de la estimaci on de un par ametro poblacional. Supongamos que deseamos determinar el n umero n de peces que habitan en un lago. Para ello se capturan 1.000 peces, se los marca con un punto rojo y se los devuelve con vida al lago. Al cabo de un tiempo se hace una segunda captura de 1.000 peces y se observa que entre ellos hay exactamente 100 peces marcados. Con estos datos, c omo puede estimarse el n umero total de peces en el lago? Ha de suponerse que la poblaci on total se mantiene constante entre ambas capturas. Tambi en que la segunda captura de 1.000 peces representa una muestra aleatoria de la poblaci on. Que signica esto? Pues que la probabilidad de pescar un determinado grupo de 1.000 peces es la misma para todos los posibles grupos de 1.000 peces que se pueden formar con todos los peces del lago. La palabra probabilidad est a usada aqu , en principio, en un sentido coloquial, tal como se la usa en conversaciones sobre cualquier tema: la probabilidad de que una persona gane las elecciones, de que el equipo A gane el partido de f utbol al equipo B, de que ma nana llueva, etc. En armaciones de este tipo el t ermino probabilidad no tiene m as sentido que expresar la opini on subjetiva del que las formula. No obstante, en ellas es posible darle un sentido matem atico objetivo. De hecho, el concepto de probabilidad es una entidad matem atica denida actualmente con todo rigor. Es precisamente en este concepto en el que se apoya la estad stica para justicar sus m etodos. Podemos decir que la probabilidad es un n umero real asociado a un suceso aleatorio, esto es, un suceso que puede darse o no ante la realizaci on de un determinado experimento. Este n umero est a comprendido entre 0 y 1. El suceso imposible tiene probabilidad 0. El suceso cierto tiene probabilidad 1. Son estos dos sucesos especiales. En general, un suceso que a veces se da

17 Estad stica y Probabilidad

206

y otras veces no se da cuando se realiza el experimento tendr a un valor de probabilidad comprendido estrictamente entre 0 y 1. Llegado a este punto, es posible intuir el signicado objetivo de probabilidad. M as a un, comprender la relaci on entre un experimento concreto y un modelo matem atico probabil stico que lo interprete adecuadamente. El ejemplo de los peces en el lago responde al esquema, muy usado en aplicaciones, de una urna que contiene n bolillas. El experimento consiste en extraer al azar r bolillas, r < n, sin reposici on. Esto u ltimo quiere decir que si ellas se extraen de una por vez, las bolillas que se van sacando no se reponen en la urna. El n umero de posibles resultados de este experimento se corresponde con el n umero total de grupos diferentes de r bolillas que pueden formarse con las n bolillas de la urna, donde dos grupos son diferentes si al menos hay una bolilla en uno de ellos que no est a en el otro. Este n umero es precisamente el combinatorio n r = n! . r!(n r)!

Luego este experimento tiene

n resultados distintos. Como todas las bor lillas en la urna tienen igualdad de oportunidades de ser extra das, es razonable suponer que los resultados son equiprobables. Este hecho, y en vista de los axiomas que la denen, hace que la probabilidad de extraer un grupo de r bolillas de un conjunto de n bolillas sea 1 n r , (43)

ya que la suma de las probabilidades de todos los resultados posibles debe ser 1. Ahora bien, si en la urna tenemos n1 bolillas rojas (total de peces marcados en el lago) y n n1 bolillas blancas (total de peces sin marcar) podemos preguntarnos por la probabilidad pn (k ) de que en la muestra extra da de r bolillas haya exactamente k bolillas rojas y r k bolillas blancas. Usando otra vez que la probabilidad de extraer un grupo de r bolillas est a dado por (43), resulta que pn (k ) se obtiene sumando la expresi on de (43) tantas veces como grupos distintos de r bolillas puedan formarse con k bolillas rojas y r k bolillas blancas. Este u ltimo n umero es el producto de los combinatorios

17 Estad stica y Probabilidad n1 k y n n1 rk . Luego n1 k n r n n1 rk

207

pn (k ) =

Est a claro que k puede tomar valores enteros, desde 0 hasta el m nimo entre r y n1 . Son valores de lo que se llama una variable aleatoria. En este caso, una variable aleatoria discreta. Los valores de la variable, junto con sus correspondientes probabilidades, forma la llamada distribuci on en probabilidad de la variable. A la del presente ejemplo se le da el nombre de distribuci on hipergeom etrica. Volvamos ahora a la cuesti on inicial, una vez que hemos comprobado que el modelo de la distribuci on hipergeom etrica es el adecuado para el experimento de la captura de peces de un lago. En nuestro caso, n es el n umero total de peces en el lago. Es un valor desconocido pero jo, no variable. Es lo que se llama un par ametro poblacional. El experimento de la captura y recaptura de peces ha sido dise nado para estimar su valor. Adem as tenemos que n1 = 1.000, r = 1.000, k = 100. Por lo tanto, la probabilidad de pescar 100 peces marcados en una captura de 1.000 peces es 1.000 100 n 1.000 900 900

pn (100) =

Un m etodo de estimaci on de n, llamado de m axima verosimilitud, consiste en determinar aquel valor de n que produce la m axima probabilidad pn (100). En otras palabras, encontrar el m aximo de la funci on pn (100) : IN R. En nuestro caso es evidente que n debe ser al menos 1.900, a saber los 1.000 peces marcados m as los 900 sin marcar que aparecieron en la segunda captura. Pero p1.900 (100) es una probabilidad extremadamente baja. Haciendo los c alculos pertinentes se obtiene que el estimador de m axima verosimilitud es n = 10.000. Es esta una estimaci on puntual. Por cierto que no hay por qu e esperar que en el lago haya exactamente 10.000 peces. En un n umero de esta magnitud es m as razonable permitir ciertos m argenes. Suena m as realista

17 Estad stica y Probabilidad

208

armar, por ejemplo, algo como se espera que en el lago habiten entre 8.000 y 12.000 peces. A n de hallar estos l mites, se razona de la siguiente manera. De haber en el lago un n umero bajo de peces se tendr a que la proporci on de peces marcados ser a grande, por lo que la probabilidad de pescar 100 peces marcados, o menos, en una captura de 1.000 peces, ser a muy peque na. Por ejemplo, si n = 2.000, entonces el porcentaje de peces marcados es del 50%. Es de esperar entonces que en la segunda captura se mantenga aproximadamente este porcentaje. Concretamente, puede calcularse que si ya n = 8.500, entonces la probabilidad de extraer menos de 100 peces marcados es 0,04. La probabilidad de este mismo suceso ser a inferior para valores m as bajos de n. An alogamente, de haber en el lago un n umero signicativamente superior a 10.000, ocurrir a que la proporci on de peces marcados ser a baja, por lo que ser a improbable pescar 100 o m as peces marcados. Por ejemplo, si ya n = 12.000, la probabilidad de este suceso es 0,03, y es a un inferior para valores m as grandes de n. Por consiguiente, una estimaci on (por intervalo) aceptable de n est a entre 8.500 y 12.000.

17.1

Variables aleatorias continuas

La distribuci on en probabilidad de una variable aleatoria discreta est a totalmente caracterizada por los valores que toma la variable junto con sus correspondientes probabilidades. Por otra parte, una variable continua tiene la propiedad de poder tomar cualquier valor comprendido entre dos valores distintos. En este caso no tiene signicaci on dar probabilidades de valores individuales de la variable. De hecho, estas probabilidades ser an siempre 0. S tiene signicaci on hablar de la probabilidad de que los valores de la variable recorran, por ejemplo, un intervalo [a, b], a < b. Si llamamos X a la variable aleatoria, esto se expresa P (a < X < b). Por lo tanto, una variable continua debe ser caracterizada de tal manera que podamos determinar, al menos te oricamente, esas probabilidades. Esto se consigue dando una funci on f : R R, llamada funci on de densidad de X , sujeta a las siguientes condiciones: 1) f 0, 2)

f (x) dx = 1.

17 Estad stica y Probabilidad

209

Toda funci on que verique 1) y 2) puede ser considerada como funci on de densidad de una variable aleatoria X , y su relaci on con ella es precisamente que P (a < X < b) =
a b

f (x) dx

para cualquier a < b. De esta manera la variable continua queda probabil sticamente caracterizada. La esperanza matem atica o media de una variable aleatoria continua es un n umero cuya expresi on es

E (X ) =

xf (x) dx.

Puede considerarse como un valor representativo de la variable en lo que hace a su posici on. El grado de dispers on de los valores de la variable alrededor de su media est a dado por la varianza

V (X ) =

(x E (X ))2 f (x) dx,

o bien, si deseamos trabajar con las mismas unidades que las de la variable, por el desv o est andar D(X ) = V (X ).

Un ejemplo importante de variable aleatoria continua, llam emosla G, es la llamada normal o de Gauss. Su funci on de densidad es
(x)2 1 e 22 , 2

donde = E (G), = D(G). La llamada variable normal est andar es aqu ella para la cual = 0, = 1. En el siguiente dibujo observamos las funciones de densidad de una variable normal est andar y de una variable normal de media 0 y varianza 0,25 (en azul). La menor dispersi on de esta u ltima alrededor de su media, o en otras palabras, la mayor concentraci on de sus valores alrededor de su media, provoca la mayor agudeza de la curva.

17 Estad stica y Probabilidad


0.8

210

0.6

0.4

0.2

-3

-2

-1

17.2

Estimaci on de la media poblacional

Cantidades de naturaleza tan dispar, como por ejemplo, el peso de glucosa en 100 ml de plasma sangu neo de adultos sanos o el tiempo de vida de ciertas l amparas, pueden tener, desde el punto de vista de su distribuci on poblacional, un comportamiento af n. Ambas cantidades var an de individuo a individuo. Por eso mismo decimos que son variables. En otras palabras, no es posible predecir un valor num erico exacto para un determinado individuo. No obstante, si analizamos estos valores para un gran n umero de individuos observaremos que su distribuci on obedece a una cierta ley. As , puede hablarse de un peso medio, o un tiempo medio de vida, entendiendo con esto que los valores individuales oscilar an, por arriba y por debajo, alrededor de esa cifra. Una visi on aproximada de la distribuci on de una variable X puede obtenerse mediante una muestra aleatoria de n datos, digamos x1 , , xn . Esto se consigue particionando un intervalo que contenga a aqu ellos en subintervalos de igual longitud, intervalos de clase, y luego contando el n umero de datos, la frecuencia, que han ca do en cada subintervalo. Esta informaci on suele representarse en un gr aco bidimensional, donde la frecuencia se indica en el eje vertical y los intervalos de clase en el eje horizontal. Se construye as un diagrama de barras, donde la base de cada barra se corresponde con un intervalo de clase y la altura de la barra mide el valor de frecuencia respectivo. De esta manera, es de esperar que el diagrama de barras muestre un dibujo que se aproxima a la curva gr aca de la funci on de densidad de X . Supongamos ahora que la variable X tiene una distribuci on normal, con media y desv o . Una estimaci on puntual de se hace a trav es del promedio

17 Estad stica y Probabilidad de n observaciones de la variable, a saber x=


n i=1

211

xi

n
n i=1

El promedio puede considerarse como una observaci on de la variable X= Xi n ,

donde X1 , , Xn son variables independientes con la misma distribuci on que X , y (x1 , , xn ) es una observaci on de la variable n-dimensional (X1 , , Xn ). Sin rigor, puede armarse que las variables son independientes cuando el valor que toma una cualquiera de ellas no inuye en los valores que toman las otras. Bajo estas hip otesis puede probarse sin dicultad que la variable X / n tiene una distribuci on normal est andar. Por lo tanto, al tener una distribuci on conocida, es posible determinar un n umero a de tal forma que, por ejemplo, P a < X <a / n = 0, 90.

Operando en estas dos desigualdades se obtiene que hay una probabilidad de 0,90 (nivel de conanza) de que la media verique la siguiente doble desigualdad: X a/ n < < X + a/ n. Si el desv o es conocido, entonces reemplazando X por una observaci on x se determina un intervalo de estimaci on para la media. Notar que el c alculo del intervalo viene acompa nado por una armaci on probabil stica que da garant as sobre la conabilidad del resultado. Notar tambi en que el valor de a aumenta a medida que el nivel de conanza crece hacia 1. Si no es conocido entonces se lo estima mediante la variable S= En este caso la variable continua X S/ n
n i=1

Xi X n1

17 Estad stica y Probabilidad

212

tiene una distribuci on conocida con el nombre de t de Student, con n 1 grados de libertad. Luego tambi en es posible aqu hallar un intervalo de estimaci on para la media. Su expresi on es x bs/ n < < x + bs/ n, donde x y s son las observaciones muestrales de X y S , respectivamente, y b es obtenido, como en el caso anterior, a partir del nivel de conanza utilizado.

La distribuci on t de Student
Se dene la variable 2 n , con n grados de libertad, como la suma de los cuadrados de n variables normales independientes, todas ellas con media 0 y varianza 1. La variable t de Student se dene como el cociente Z 2 n /n ,

donde Z es una variable normal est andar, independiente de 2 n. Vamos a probar ahora que si X1 , X2 , , Xn son n variables normales independientes, todas ellas con media y varianza 2 , entonces la variable n(X ) = S n(X )
2 i=1 (Xi X )

Pn

n1

tiene una distribuci on t de Student con n 1 grados de libertad. Para ello vamos a demostrar a su vez que esta u ltima expresi on responde a la denici on anterior. Observaremos que hay aqu una interesante aplicaci on de la teor a de diagonalizaci on de matrices. Notar que
n

(Xi X )2
i=1

es una forma cuadr atica, que se puede escribir matricialmente como X1 X2 (X1 , X2 , , Xn )M . , . . Xn

17 Estad stica y Probabilidad

213

donde M es una matriz sim etrica. Sus coecientes de la diagonal principal 1 1 son todos iguales a 1 n , y todos los restantes coecientes son iguales a n . Como M es sim etrica, existe una matriz ortonormal P (es decir, su transpuesta coincide con su inversa) tal que P 1 M P es una matriz diagonal D. M as a un, los coecientes de la diagonal principal de D, digamos dii , son los autovalores de M , y las columnas de P (o las las de P 1 ) son sus correspondientes autovectores. Luego, si se efect ua el cambio lineal de variables Y1 Y2 . . . Yn bles como
2 d11 Y12 + d22 Y22 + + dnn Yn .

= P 1

X1 X2 . . . Xn

se tendr a que la forma cuadr atica se escribir a en t erminos de las nuevas varia-

En vista de la forma de M , se observa inmediatamente que el vector que tiene todas sus componentes iguales a
1 n

es un autovector de esta matriz, correspon-

diente a un autovalor nulo. An alogamente, tambi en se observa f acilmente que los n 1 vectores que se obtienen colocando 1 y 1 en forma consecutiva, y 0 en los restantes lugares, son autovectores pertenecientes al autoespacio ortogonal al primer autovector, todos ellos correspondientes a un autovalor igual a 1. Notar que los vectores de este autoespacio son aqu ellos cuyas componentes suman 0. Sabemos adem as que podemos encontrar en este autoespacio n 1 autovectores ortonormales. Es decir, si sus componentes son (pi1 , pi2 , , pin ), 2 i n, se tiene que pi1 + pi2 + + pin = 0,
2 2 p2 i1 + pi2 + + pin = 1.

Como estas componentes son precisamente las las de la matriz P 1 , sigue que Y1 = n X, y Yi = pi1 X1 + pi2 X2 + + pin Xn

17 Estad stica y Probabilidad

214

para i 2. Por lo tanto, por propiedades de la media y varianza, se deduce que E (Y1 ) = nE (X ) = n, V ar(Y1 ) = nV ar(X ) = 2 , y para i 2, E (Yi ) = 0, V ar(Yi ) = 2 . Por otro lado, por propiedades de la variable normal, todas las variables Yi resultan normalmente distribuidas. Adem as, como P es una matriz ortonormal, la independencia de las variables Xi se transmite a las variables Yi . En las nuevas variables, la forma cuadr atica se escribe
n

Yi2 .
i=2

Se concluye que la variable n(X )


Pn
2 i=1 (Xi X )

(Y1

n)/

Pn

2 i=2 (Yi / )

n1

n1

tiene, por su misma denici on, una distribuci on t de Student con n 1 grados de libertad.

18
18.1

Aplicaciones a la Qu mica
Cin etica qu mica

La raz on de cambio de una reacci on qu mica depende de la cantidad de materia de los reactivos que se combinan a una determinada temperatura. El mecanismo que regula este proceso se conoce como ley de raz on de cambio experimental. El conocimiento de esta ley emp rica (debe ser determinada experimentalmente) es a menudo el primer paso para comprender la sucesi on de eventos moleculares que los reactivos llevan a cabo para formar productos. Concretamente, esto se logra estudiando la correspondencia entre la raz on de cambio de la cantidad de materia de los reactivos que toman parte en la reacci on por unidad de tiempo y la cantidad de materia del producto que se forma en ella. Por ejemplo, si los reactivos A y B se combinan para formar los productos C y D, esto se simboliza a A + b B c C + d D, donde a, b, c y d son los coecientes estequiom etricos de las correspondientes sustancias. La cantidad de materia o de part culas de cada sustancia, su concentraci on, se da en moles por litro. La concentraci on de una sustancia, por ejemplo, A, se denota por [A]. Durante el proceso de la reacci on qu mica las concentraciones van cambiando con el tiempo t. Ellas son, por tanto, funciones de t. En la reacci on de arriba, por ejemplo, [A] y [B ] disminuyen con t (funciones decrecientes) mientras que [C ] y [D] aumentan con t (funciones crecientes). Ahora bien, interesa analizar la rapidez o raz on de cambio de la modicaci on de la concentraci on de las sustancias que intervienen en la reacci on. Esta informaci on se obtiene precisamente por las respectivas derivadas, [A] , [B ] , [C ] , [D] , que son tambi en funciones del tiempo t. Por lo dicho arriba, ser a [A] < 0, [B ] < 0, [C ] > 0, [D] > 0.

18 Aplicaciones a la Qu mica

216

En cuanto a su magnitud, ellas son proporcionales a sus coecientes estequiom etricos. Por todo ello, se tiene la siguiente relaci on: 1 1 1 1 R = [A] = [B ] = [C ] = [D] . a b c d Este n umero R, com un a todas las sustancias, puede denirse como la raz on de cambio de la reacci on qu mica, por ser precisamente independiente de las sustancias que intervienen en ella. Por cierto que R depende del tiempo t, por lo que es importante intentar hallar una relaci on expl cita para R(t). Es natural que R dependa de la concentraci on de los reactivos como as tambi en de la concentraci on de los productos que se forman en la reacci on. Tambi en depende de la temperatura. Pero si esta se mantiene constante durante el proceso, puede eliminarse como variable independiente. Para hacer una simplicaci on adicional, puede suponerse que muy al comienzo de la reacci on la raz on de cambio inicial, digamos R0 , s olo depende de la concentraci on de los reactivos. Pero de qu e forma depende? Por una l ogica que se sustenta en la ley de acci on de masas, puede deducirse que R0 depende del producto de las concentraciones. Despu es de introducir par ametros de ajuste en forma de exponentes para las concentraciones, se obtiene (por ejemplo, para la reacci on de arriba) la siguiente expresi on: R0 (t) = k [A]m [B ]n , donde k, m y n son constantes. Observar entonces que R depende del tiempo t a trav es de las concentraciones de los reactivos A y B. Supuesta la validez de esta ley, surge ahora la cuesti on de calcular el valor de las constantes k, m y n para cada caso particular. Esto puede hacerse con el siguiente m etodo. Se realizan experimentos con apropiados valores de concentraci on inicial de los reactivos y se mide en cada uno de ellos el valor de R0 . Por ejemplo, consideremos la siguiente reacci on entre H2 y Br2 , llevada a cabo a una temperatura constante de 25 grados cent grados. H2 + Br2 2 HBr2 . Los datos de 5 experimentos se dan a continuaci on. La concentraci on inicial del reactivo se indica con el sub ndice 0.

18 Aplicaciones a la Qu mica Experimento [H2 ]0 1 0,10 2 0,10 3 0,20 4 0,10 5 0,30 [Br2 ]0 0,10 0,20 0,10 0,30 0,10 R0 2,000 x 105 2,828 x 105 4,000 x 105 3,464 x 105 6,000 x 105

217

Notar que en los experimentos 1 y 2 las concentraciones de [H2 ]0 son iguales pero no as las de [Br2 ]0 , mientras que en experimentos 2 y 3 son iguales las concentraciones de [Br2 ]0 pero no las de [H2 ]0 . Como veremos, este hecho permite calcular las constantes k, m y n usando estos tres experimentos. Dado que R0 = k ([H2 ]0 )m ([Br2 ]0 )n , dividiendo la ecuaci on anterior con los datos del experimento 2 entre la misma ecuaci on con los correspondientes datos del experimento 1, sigue que 1, 414 = 2n , por lo que n = 1/2. Procediendo an alogamente con los datos de experimentos 1 y 3, se deduce que 2 = 2m , y de esta manera m = 1. Observar que tambi en otros pares de experimentos podr an haber sido usados, obteni endose los mismos valores de ambas constantes. Utilizando ahora cualquier experimento se halla el valor de k . Este es 6,324 x 104 .

La concentraci on como funci on del tiempo


La ley de raz on de cambio experimental permite expresar la raz on de cambio de la concentraci on de una sustancia que toma parte en una reacci on qu mica en funci on de las concentraciones de los reactivos. Se supone siempre que esta ley es v alida en el comienzo del proceso. Conociendo esta informaci on, es posible tambi en encontrar la ley expl cita que relaciona la concentraci on del reactivo con el tiempo. En efecto, su soluci on se obtiene resolviendo una ecuaci on diferencial. Lo haremos a continuaci on en casos muy simples. Consideremos la siguiente reacci on:

18 Aplicaciones a la Qu mica A C En esta situaci on tenemos que R0 = [A] ,

218

ya que el coeciente estequiom etrico de A es 1. Supondremos tres casos para la ley de raz on de cambio experimental. Caso I. [A] = k [A]. La soluci on general de esta ecuaci on es [A] = Cekt , donde C es una constante positiva. Su valor debe ser igual a la concentraci on de A en t = 0. Por lo tanto queda [A] = [A0 ]ekt . (44)

Es usual en las ciencias experimentales tener una representaci on visual de sus resultados. En el presente caso, se trata de una funci on exponencial. Dado que la representaci on m as simple es la de una l nea recta, es un hecho com un transformar las variables involucradas de forma que la relaci on resultante sea lineal. En este caso esto se logra tomando logaritmos neperianos en (44): ln[A] = ln[A]0 kt. La importancia de este proceder radica en lo siguiente. Si se realiza un experimento que permita obtener valores correspondientes de [A], digamos [A]i , para distintos instantes de tiempo ti , entonces la representaci on cartesiana de los datos (ti , ln[A]i ) debe reejar esa relaci on lineal. El ajuste de una recta a esos datos permitir a hallar una estimaci on de su ordenada al origen, ln[A]0 , y de su pendiente, k . Asimismo, notar que (44) es tambi en equivalente a ln Caso II [A] = k [A]0 = k. [A]0 = kt. [A]

18 Aplicaciones a la Qu mica La soluci on particular es [A] = [A]0 kt. Aqu la relaci on funcional es directamente lineal. Caso III [A] = k [A]n ,

219

donde n > 1. En este caso la soluci on particular, siempre bajo la condici on inicial de que la concentraci on de A en t = 0 sea [A]0 , satisface 1 1 = 1 + (n 1)kt. [A]n1 [A]n 0 Escrita de esta manera, vemos que curva decreciente. Como [A] = nk [A]n1 [A] , y [A] es negativo, se deduce que la concavidad de esa curva es siempre hacia arriba. Consideremos ahora dos reactivos, A y B, que reaccionan de la manera siguente: A + B C Como los coecientes estequiom etricos de A y B son ambos iguales a la unidad, sigue que R0 = [A] = [B ] . experimental dada por R0 = k [A][B ]. Observar que la segunda igualdad en (45) implica que las funciones [A] y [B ] dieren en una constante. Luego, como para todo t es [B ] [A] = [B ]0 [A]0 , sigue que [B ] = [A] + [B ]0 [A]0 . (45) Supongamos que el proceso se lleva a cabo bajo la ley de raz on de cambio
1 [A]

depende linealmente del tiempo. La

dependencia directa de [A] en funci on del tiempo da, como ya sabemos, una

18 Aplicaciones a la Qu mica Por consiguiente, la ecuaci on diferencial que se debe resolver es [A] = k [A]([A] + [B ]0 [A]0 ).

220

Esta ecuaci on de variables separables, f acil de resolver, conduce a la relaci on 1 [A] ln = kt + M, [B ]0 [A]0 [A] + [B ]0 [A]0 donde la constante M se determina d andole a t el valor 0. Queda M= 1 [A]0 ln . [B ]0 [A]0 [B ]0 [A][B ]0 [B ][A]0

Reemplazando este valor de M en la ecuaci on anterior, sigue que 1 ln [A]0 [B ]0 independiente t. = kt,

que a su vez permite despejar la concentraci on [A] en funci on de la variable

Mecanismos de dos pasos consecutivos


Una reacci on (irreversibe) del tipo
1 2 X Y Z,

donde k1 y k2 son constantes de raz on de cambio, conduce a resolver el siguiente sistema: [X ] (t) = k1 [X ](t) [Y ] (t) = k1 [X ](t) k2 [Y ](t) [Z ] (t) = k2 [Y ](t), con las condiciones iniciales [X ](0) = [X ]0 , [Y ](0) = 0, [Z ](0) = 0. Este sistema puede ser resuelto separadamente, obteni endose [X ](t) de la primera ecuaci on, luego hallando [Y ](t) de la segunda ecuaci on, y nalmente resolviendo [Z ](t) de la tercera. Sus soluciones son [X ](t) = [X ]0 ek1 t [X ]0 k1 (ek2 t ek1 t [Y ](t) = ) k1 k2 k1 ek2 t k2 ek1 t [Z ](t) = [X ]0 1 k1 k2

18 Aplicaciones a la Qu mica

221

Sigue un gr aco con la representaci on de las tres funciones, en negro, azul y rojo, respectivamente.
2 1.5 1 0.5

Por el contrario, existen situaciones en las que el sistema se presenta de tal forma que no es posible resolver las ecuaciones separadamente. Por ejemplo, en reacciones reversibles, A B. M as precisamente, podemos encontrarnos en general con el siguiente sistema: [X ] (t) [X ](t) [Y ] (t) = M [Y ](t) , [Z ](t) [Z ] (t) donde M es una matriz de coecientes constantes. Si M es diagonalizable entonces existe una matriz P de manera que P 1 M P = D, donde D es una matriz diagonal, digamos d1 0 0 D = 0 d2 0 . 0 0 d3 Si ahora se efect ua la transformaci on lineal de variables [X ] [U ] [Y ] = P [V ] , [Z ] [W ] y teniendo en cuenta que las derivadas se transforman de la misma manera, el sistema anterior se escribe en las nuevas variables como [U ] (t) [U ](t) P [V ] (t) = M P [V ](t) , [W ](t) [W ] (t)

18 Aplicaciones a la Qu mica es decir, [U ] (t) = d1 [U ](t) [V ] (t) = d2 [V (t)] [W ] (t) = d3 [W ](t).

222

Tenemos aqu tres ecuaciones independientes, de resoluci on inmediata. Por u ltimo, se expresan las soluciones en t erminos de las variables originales.

18.2

Una aplicaci on en Farmacolog a

La acci on de un f armaco sobre un organismo vivo es consecuencia de complicados procesos f sico-qu micos que se producen a un nivel celular. Puede armarse en general que en toda ciencia experimental el estudio de sus procesos espec cos exige un intenso trabajo de laboratorio que debe estar apoyado por el conocimiento de leyes (matem aticas) que los explican y regulan. Rec procamente, todo modelo matem atico que quiera ser u til y aplicable tiene que ser conrmado por los datos experimentales. Como ejemplo de lo dicho se ver a a continuaci on un an alisis de la interacci on de dos drogas sobre un receptor. La droga A causa un efecto, medido en latidos por minuto, sobre un receptor beta de tejido muscular de coraz on. La droga P bloquea parcialmente la acci on de A, en el sentido de que si se suministra la droga A en presencia de una dosis de P, entonces se necesita una mayor dosis de A para obtener el mismo efecto de antes. Es claro que existe una relaci on funcional entre el efecto (variable dependiente E ) y la concentraci on de A (variable independiente), E = f ([A]). Como se ver a despu es, es muy conveniente disponer de una expresi on concreta para la funci on f . Este tipo de relaciones suelen ser obtenidas experimentalmente. En nuestro caso la expresi on E= M [A] +O [A] + N (46)

ofrece una buena aproximaci on con la realidad experimental. Los siguientes son datos experimentales reales, con una representaci on de los mismos: [A] 109 E 0,02 0,2 138 141 0,6 2 6 163 198 222 10 20 228 237 40 240 60 100 244 246

18 Aplicaciones a la Qu mica E
240 220 200 180 160 140 0 20 40 60 80 100

223

[A] 109

El siguiente gr aco muestra los mismos datos, ajustados adem as por el m etodo de m nimos cuadrados mediante una curva dada por la expresi on de (46). E
240

220

200

180

160

140 0 20 40 60 80 100

[A] 109

La funci on ajustada resulta ser E= 112, 5[A] + 133, 7. [A] + 1, 65 x 109

En virtud de la disposici on de los valores de [A], es usual representar esos datos en funci on de log([A]). En nuestro ejemplo ellos son -10,699 -9,699 -9,222 -8,699 -8,222 -8 -7,699 -7,398 -7,222 -7

18 Aplicaciones a la Qu mica

224

N otese ahora c omo ellos se distribuyen en forma homog enea. Su representaci on gr aca es la siguiente: E
240 220 200 180 160 140 -10 -9 -8 -7

log[A]

La expresi on de la funci on ajustada es ahora E= M 10x + O, 10x + N (47)

donde x = log([A]). Presenta un cambio de concavidad, de positiva a negativa, cosa que no ocurre con la funci on de (46), que mantiene siempre su concavidad negativa. Estos hechos se corroboran matem aticamente hallando las respectivas derivadas segundas en las funciones de (46) y (47). Se encontrar a que el punto de inexi on se da precisamente en x = N . Como se arma al comienzo de esta secci on, si ahora se administra la droga A en presencia de una dosis del antagonista parcial P, entonces se necesitar a m as dosis de A para obtener el mismo efecto que en ausencia de P. Aqu tenemos una imagen de este hecho: E
240 220 200 180 160 140 -10 -9 -8 -7

log [A]

Los puntos en color rojo corresponden al efecto de A en presencia de una dosis ja de P. En este momento conviene introducir la siguiente notaci on.

18 Aplicaciones a la Qu mica

225

Llamaremos [A]2 (respectivamente, [A]3 ) a las concentraciones de A actuando en ausencia (respectivamente, en presencia) del antagonista. An alogamente, denotemos con E2 y E3 a los correspondientes efectos. De la observaci on del gr aco se deduce una explicaci on de por qu e el calicativo de parcial para el antagonista P. Es un hecho experimental que la presencia en el receptor de un antagonista puro hubiera producido un desplazamiento paralelo de los puntos azules con respecto a la curva concentraci on-efecto de A en ausencia de P. En particular, para todo valor de [A]3 ser a E3 < E2 . Por otra parte, se observa del gr aco que para valores bajos de [A]3 la presencia del antagonista parcial produce un mayor est mulo, mientras que s hay un bloqueo del efecto para concentraciones [A]3 m as altas.

An alisis de [A]2 en funci on de [A]3


Una vez administrado, P ocupa qu micamente un sitio en el receptor beta. La fracci on de sitio que ocupa viene dada por yp = [P ] , [P ] + KP

donde KP es la constante de equilibrio de disociaci on de P. Es de relevancia en farmacolog a estimar el valor de esta constante. Para ello se parte de un modelo matem atico conocido que relaciona linealmente concentraciones equiefectivas as precisamente, si [A]2 y [A]3 producen el mismo efecto sobre de [A]2 y [A]3 . M un receptor dado, entonces [A]2 = a + (1 yP )[A]3 , donde a es una constante que depende de A y P. Hay que destacar que esta relaci on rige para concentraciones [A]3 cuyos respectivos efectos E3 est an por debajo de E2 . El siguiente paso consiste en conrmar experimentalmente la ecuaci on (48). Para ello se deben calcular concentraciones equiefectivas. Parece razonable (48)

18 Aplicaciones a la Qu mica

226

hacerlo del siguiente modo. Se consideran concentraciones [A]3 que veriquen la condici on anterior, as como sus correspondientes efectos E3 . Haciendo ahora uso de la ecuaci on (46), que establece una ley para la curva concentraci on-efecto de A actuando en ausencia de P, se determina el valor de [A]2 que produce ese mismo efecto. Llamemos U a este valor interpolado de [A]2 . El cambio de nombre est a justicado. En efecto, mientras que [A]2 es una variable independiente, U es una variable que depende de [A]3 . En otras palabras, [A]2 es un dato bajo control del experimentador. En cambio, U es una respuesta sujeta a la aleatoriedad, tanto de la variable E3 como de los par ametros ajustados M, N y O. De (46) sigue que U= (E O)N . M +OE

Utilizando siete datos de [A]3 del ejemplo anterior se obtiene la siguiente tabla de pares correspondientes de datos [A]3 , U : [A]3 x 109 U x 109 2 6 10 1,383 1,653 2,368 20 3,778 40 60 100 6,711 9,808 20,987

A continuaci on se presenta un esquema gr aco del procedimiento utilizado: E

18 Aplicaciones a la Qu mica

227

240

220

200

180

160

140 0 20 40 60 80 100

[A] 109

La representaci on de los datos obtenidos, indicados en la tabla anterior, es la siguiente,

18 Aplicaciones a la Qu mica U 109


20

228

15

10

20

40

60

80

100

[Z ] 109

donde se ha renombrado Z a la variable independiente [A]3 . Tal como lo prev e el modelo matem atico dado por ecuaci on (48), se observa una relaci on lineal entre las variables. El ajuste de una l nea recta a esos datos, es decir, determinar con ellos una pendiente y una ordenada al origen, permitira a su vez calcular el coeciente KP , ya que la pendiente de esa funci on lineal es 1 [P ] , [P ] + KP

y la concentracion [P ] es un dato conocido. El ajuste lineal se efect ua, como es usual, por el m etodo de m nimos cuadrados. Si denotamos por Zi , 1 i n, a los n valores experimentales de [A]3 , y por Ui a los correspondientes valores interpolados de [A]2 , entonces, como ya se ha visto en la secci on 15.5 , el m etodo de m nimos cuadrados consiste en minimizar
n

(Ui a bZi )2
i=1

(49)

en los par ametros a y b. Recordar: Z es una variable independiente, controlada por el experimentador, pero U es una variable aleatoria, cuya expresi on te orica (E3 O)N . (50) M + O E3 Todos los par ametros del lado derecho de la ecuaci on anterior est an sujetos a U= variaci on. La variable aleatoria E3 es directamente la respuesta a la acci on de una droga. Por otra parte, los par ametros M, N y O han sido calculados ha partir de datos experimentales, y por lo tanto tambi en variables. No obstante, viene dada por

18 Aplicaciones a la Qu mica

229

para simplicar los argumentos te oricos que siguen a continuaci on podemos suponer que estos u ltimos son valores medios jos. En otras palabras, los interpretamos como constantes num ericas que reemplazadas en la ecuaci on (46) dan la respuesta te orica media a la acci on de A sobre un receptor beta sin la presencia del antagonista parcial P. Notar que la forma de calcular el valor interpolado Ui hace que no todos ellos tengan la misma conabilidad. En efecto, la menor pendiente de la curva dosis-respuesta para valores grandes de [A]2 implica que una m nima variaci on en E3 ya produce una alteraci on relativamente grande en el correspondiente Ui . Por el contrario, la mayor pendiente de esa curva para valores bajos de [A]2 supone una menor sensibilidad del resultado frente a perturbaciones en la variable E3 . En conclusi on, tanto mayor es el error en Ui cuanto m as alto es su valor. Ahora bien, c omo se mide este error? En teor a estad stica se lo mide por la varianza de Ui . Como Ui depende de la variable E3 mediante la ecuaci on (50), la varianza de Ui puede escribirse en t erminos de la varianza de E3 . Para deducir esta relaci on hay que sumar a la simplicaci on de arriba la de reemplazar la expresi on de (50) por la funci on lineal suministrada por su polinomio de Taylor de primer grado, desarrollado en el valor medio de E3 . Para cada i este valor medio es de la forma M0 Zi + O0 . Z i + N0 Bajo estas condiciones puede deducirse que la varianza de Ui es un n umero proporcional a (Zi + N0 )4 . Recordar que N0 es el punto de inexi on de la curva dosis-respuesta de A en presencia de P. La f ormula (49) no es en este caso la m as apropiada para efectuar el ajuste por m nimos cuadrados, ya que la expresi on de (49) asigna a cada dato Ui la misma signicaci on. Lo razonable es que los datos m as conables tengan mayor peso que aqu ellos m as sujetos a error. Esto se logra introduciendo un factor de peso en cada sumando de (49) que asigne una mayor intervenci on a los

18 Aplicaciones a la Qu mica

230

datos menos err oneos. Este factor es precisamente una cantidad proporcional al inverso de la varianza de Ui . En conclusi on, ahora se debe minimizar
n

i=1

1 (Ui a bZi )2 (Zi + N0 )4

en los par ametros a y b. En nuestro ejemplo, el empleo de esta t ecnica produce las siguientes estimaciones: b=0,14 U 109
20

KP = 17 x 108 .

15

10

20

40

60

80

100

[Z ] 109

El hecho de que la varianza de la variable Ui sea proporcional a 1 (Zi + N0 )4 puede ser confrontado mediante una simulaci on de los experimentos. M as precisamente, para cada valor de concentraci on Zi pueden generarse distintos valores de correspondientes efectos mediante la expresi on M0 Zi + O0 + Z i + N0 donde
i ij ,

puede considerarse como una variable aleatoria normalmente dis-

tribuida, con media 0 y varianza 1. Mediante programas apropiados pueden generarse, para cada i, un determinado n umero, digamos ni , de observaciones on normal. De esta manera se tiene en cuenta ij obedeciendo esa distribuci la variaci on que existe en experimentos reales en los efectos de individuos

18 Aplicaciones a la Qu mica

231

diferentes. Si para cada uno de estos efectos simulados se determina el valor interpolado Uij , entonces se estar a en condiciones de estimar la varianza de U i mediante la f ormula de la varianza muestral, a saber s2 i =
ni j =1 (Uij

Ui )2 . ni 1

Si la expresi on propuesta para la varianza de Ui es correcta, entonces es de esperar que s2 i sea aproximadamente igual a C , (Zi + N0 )4 donde C es una constante ja que no depende de i. En este caso, log s2 a i ser aproximadamente igual a log C 4 log(Zi + N0 ), por lo cual una representaci on en el plano cartesiano de los puntos (log(Zi + N0 ), log s2 i) deber a mostrar una disposici on lineal de los mismos.

También podría gustarte