Está en la página 1de 1044
Educaciovw por todos Educacon panda todor no es un proyecto lucrativo, sino un esfuerzo colectivo de estudiantes y profesores de la UNAM para facilitar el acceso a los materiales necesarios para la educacion de la mayor cantidad de gente posible. Pensamos editar en formato digital libros que por su alto costo, o bien. porque ya no se consiguen en bibliotecas y librerias, no son accesibles para todos. Invitamos a todos los interesados en participar en este proyecto a sugerir titulos, a prestarnos los textos para su digitalizacion y a ayudarnos en toda la labor técnica que implica su reproduccién. El nuestro, es un proyecto colectivo abierto a la participacion de cualquier persona y todas las colaboraciones son bienvenidas. Nos encuentras en los Talleres Estudiantiles de la Facultad de Ciencias y puedes ponerte en contacto con nosotros a la siguiente direccion de correo electrénico: eduktodos@hotmail.com http://eduktodos.dyndns.org INTRODUCCION AL CALCULO Y AL ANALISIS MATEMATICO Vol. 2 RICHARD COURANT y FRITZ JOHN Instituto Courant de Ciencias Matemdticas Universidad de Nueva York Con la asistencia de ALBERT A. BLANK Profesor de Mateméticas Universidad Carnegie~ Mellon Pittsburgh, Pennsylvania ALAN SOLOMON Profesor de Mateméticas Universidad del Negev Beer-Sheva, Israel 4 LIMUSA NORIEGA EDITORES MEXICO © Espafia * Venezuela * Colombia VERSION AUTORIZADA EN ESPANOL DE LA OBRA PUBLICADA EN INGLES CON EL TITULO! INTRODUCTION TO CALCULUS AND ANALYSIS. Vowume Il © Nina Courant, Ernest Courant ano GeatRuoe Mosen, as Executons oF THE Estate of Richaro Courant, ano Faitz JOHN, COLABORADOR EN LA TRADUCCION: HERNAN PEREZ CASTELLANOS INGENIERO INDUSTRIAL. PROFESOR TITULAR DE MATE MATICAS EN LA ESCUELA SUPERIOR DE INGENIERIA Mecénica ¥ EvécTRica bét Instituto PouTécnco Nacionat, Mexico. Revision: SAUL HAHN GOLDBERG Doctor €N MATEMATICAS DEL INsTITUTO COURANT DE LA UNIVERSIDAD DE Nueva York. PROFESOR ASOCIADO DEL CENTRO DE InvesTIGACiON Y Es- Tupi0s AVANzADOS DEL INsTITUTO PoLITEcNICO Naciona, Mexico. ROLANDO V. JIMENEZ DOMINGUEZ Doctor EN FISICA, PROFESOR E INVESTIGADOR DE a Escueta Surerion 0€ Fisica y MATEMATICAS. et InstiTuTo PouTécnico NAcionaL, México. «LA PRESENTAGION Y DISPOSICION EN CONJUNTO DE INTRODUCCION AL CALCULO Y AL ANALISIS MATEMATICO. Vowumen 2 SON PROPIEDAD DEL EDITOR, NINGUNA PARTE DE ESTA ‘OBRA PUEDE SER REPRODUCIDA O TRANSMITIOA, MEDIANTE NINGUN SISTEMA © METODO, ELECTRONICO (© MECANICO (INCLUYENDO EL FOTOCOPIADO,LA GRA- BACION © CUALQUIER SISTEMA DE RECUPERACION Y ALMACENAMIENTO DE INFORMACION),SIN. CONSEN ‘TIMENTO POR ESCRITO DEL EDITOR. DERECHOS RESERVADOS: © 1999, EDITORIAL LIMUSA, S.A. ve C.V. GRUPO NORIEGA EDITORES Batoenas 95, México, D.F. C.P. 06040 @ (5)521-21-05 01(800) 7-06-91-00 (2 (6)512-29-03 limusa @ noriega.com.mx 2 wwwnoriega.com.mx CANIEM Nom, 121 NOVENA REIMPRESION fwereso en México ISBN 968-18-0640-9 Prélogo La obra Differential and Integral Calculus. Vols. I y If, de Ri- chard Courant, ha tenido mucho éxito al iniciar a varias genera- ciones de estudiantes en las matemAticas superiores. En su contexto, esos voliimenes se basaron en el hecho de que las matemAticas se originan de la unién de la imaginacién intuitiva y el razonamiento deductivo. Al preparar esta revisi6n, los autores se esforzaron en mantener el equilibrio entre estos dos criterios que caracterizaron a la obra original. Aunque Richard Courant fallecié antes ver la pu- blicacién de esta revision del Volumen II, todos los cambios prin- cipales fueron acordados y redactados por los autores antes de que el Dr. Courant muriera. Desde el principio, los autores se dieron cuenta de que el Volumen II, que trata de las funciones de varias variables, se tendria que revisar mas a fondo que el Volumen I. En particular, parecia con- veniente estudiar los teoremas fundamentales de la integracién en dimensiones superiores con el mismo rigor y generalidad que se aplicé a la integracién en una sola dimensién. Adem4s, habia gran namero de conceptos nuevos y temas de primordial importancia, los cuales, en opinién de los autores, constituyen una introduccién al anilisis. En los capitulos 6, 7 y 8 que tratan, respectivamente, de Ecua- ciones Diferenciales, Calculos de Variaciones y Funciones de una Variable Compleja, s6lo se hicieron pequefios cambios. En la parte mas importante del libro, capitulos 1 al 5, se conservé lo mAs posible el esquema original de dos desarrollos mas o menos paralelos de cada tema a niveles diferentes: una introduccién informal basada en ar- gumentos mas intuitivos, y un estudio de las aplicaciones que propor- cionan los fundamentos para las demostraciones subsecuentes. El material de Algebra lineal, contenido en el capitulo I original, parecia inadecuado como fundamento para la estructura ampliada del cAlculo. Por tanto, todo este capitulo (que ahora es el capitulo 2) se reescribis completamente y ahora incluye todas las propiedades basicas de los determinantes y las matrices de n-ésimo orden, las for- 5 6 —Prélogo mas multilineales, los determinantes de Gram y las variedades li- neales. En el nuevo capitulo 1 se analizan todas las propiedades fun- damentales de las formas diferenciales lineales y sus integrales. Con esto el lector ya est4é preparado para empezar con el estudio de las formas diferenciales exteriores de orden superior agregadas al capi- tulo 3. También, en el capitulo 8, se encuentra una nueva demostra- cién del teorema de la funcién implicita por medio de aproxima- ciones sucesivas y un estudio de los puntos criticos y los indices de los campos vectoriales en dos dimensiones. En los capitulos 4 y 5 se agreg6é bastante material sobre las pro- piedades fundamentales de las integrales mdltiples. Aqui nos enfren- tamos a una conocida dificultad: se debia demostrar que las integrales sobre una variedad M, definidas con bastante facilidad subdividiendo M en partes convenientes, son independientes de la subdivisién particular. Esto se resolvié mediante el uso sistematico de la familia de conjuntos mensurables de Jordan con su propiedad de intersecci6n finita y de particiones de la unidad. Con el fin de mi- nimizar las complicaciones topolégicas, s6lo se consideraron varieda- des que encajaban suavemente en el espacio euclidiano. Se estudié la nocién de “orientaci6n” de una variedad con el detalle necesario para el estudio de las integrales de las formas diferenciales exteriores y sus propiedades de aditividad. Con estas bases, se dan las demostraciones para el teorema de la divergencia y para el teorema de Stokes en n dimensiones. A la seccién sobre las integrales de Fourier en el ca- Pitulo 4 se le agregé un anilisis de la identidad de Parseval y las in- tegrales maltiples de Fourier. Para la preparaci6n de este libro fue inapreciable la ayuda ge- nerosa e ininterrumpida, proporcionada por los dos amigos de los autores, los profesores Albert A. Blank de la Universidad Carnegie- Mellon y Alan Solomon de la Universidad del Negev. Casi en todas las paginas se advierte la influencia de sus criticas, correcciones y sugerencias. Ademas, ellos prepararon los problemas y ejercicios para este volumen.! También debemos dar las gracias a nuestros colegas, los Profe- sores K. O. Friedrichs y Donald Ludwig, por sus valiosas y construc- tivas sugerencias, asi como a John Wiley and Sons y su departamento editorial por el continuo estimulo y ayuda que nos brindaron. FRITZ JOHN Nueva York ‘En contraste con el volumen I, éstos se han incorporado por completo en el texto; se pueden encontrar sus soluciones al final del volumen. Contenido Capttulo1 Funciones de varias variables y sus derivadas 1.1 Puntos y conjuntos de puntos en el plano y en el espacio 25 a. Sucesiones de puntos: Convergen- cia, 25 b. Conjuntos de puntos en el plano, 28 c. La frontera de un con- junto. Conjuntos cerrados y conjuntos abiertos, 30 d. La cerradura como conjunto de puntos limite, 33 e. Pun- tos y conjuntos de puntos en el es- pacio, 34. 1.2 Funciones de varias variables in- dependientes 36 a. Funciones y sus dominios, 36 b. Los tipos més sencillos de funciones, 37 c. Representacién geométrica de las funciones, 38 1.3 Continuidad 42 a. Definicién, 42 b. El concepto de limite de una funci6n de varias va- riables, 44 c. El orden de anulacién de una funcién, 47 1.4 Las derivadas parciales de una fun- cién 52 a. Definicién. Representacién geo- métrica, 52 b. Ejemplos, 58 c. La 7 8 Contenido 1.6 17 1.8 1.9 continuidad y la existencia de las derivadas parciales, 61 d. Cambio de] orden de la derivaci6n, 62 La diferencia al total de una funcién y su significado geométrico a. El concepto de diferenciabilidad, 67 b. Derivadas direccionales, 73 c. Interpretacién geométrica de la diferenciabilidad. E] plano tangente, 73 d. La diferencial total de una fun- cién, 76 e. Aplicacién al cAlculo de errores, 79 Funciones de funciones (funciones compuestas) y la introduccién a nuevas variables independientes a. Funciones compuestas. La regla de Ja cadena,81 b. Ejemplos, 87 c. Cambio de las variables indepen- dientes, 88 El teorema del valor medio y el teorema de Taylor para funciones de varias variables a. Observaciones preliminares acerca de la aproximacién mediante poli- nomios, 93 b. El teorema del valor medio,.95 c. Teorema de Taylor para varias variables independientes, 97 Integrales de una funcién que dependen de un parémetro a. Ejemplos y definiciones, 100 b. Continuidad y diferenciabilidad de una integral con respecto al para- metro, 103 c. Intercambio de in- tegraciones. Regularizacién de fun- ciones, 109 Diferenciales e integrales de linea a. Formas diferenciales lineales, 112 b. Integrales de linea de formas 67 81 93 100 112 Contenido 9 diferenciales lineales, 115 c. Depen- dencia de las integrales de linea con respecto a los puntos extremos, 122 1.10 El teorema fundamental sobre la in- tegrabilidad de las formas diferen- ciales lineales 125 a. Integraci6n de diferenciales totales, 125 b. Condiciones necesarias para que las integrales de linea de- pendan tnicamente de los puntos ex- tremos, 126 c. Insuficiencia de las condiciones de integrabilidad, 128 d. Conjuntos simplemente conexos, 132 e. El teorema fundamental, 185 APENDICE A.1. El principio del punto de acu- mulaci6n en varias dimensiones y sus aplicaciones a. El principio del punto de acu- mulacién, 138 b. Criterio de conver- gencia de Cauchy. Compacticidad,139 c. El teorema de cobertura de Heine- Borel, 140 d. Una aplicacién del teorema de Heine-Borel a conjuntos cerrados que estén contenidos en con- juntos abiertos, 142 A.2. Propiedades basicas de las funciones céntinuas 144 A.3. Nociones bisicas de la teoria de los conjuntos de puntos 144 a. Conjuntos y subconjuntos, 144 b. Union e intersecci6én de conjuntos, 147 c. Aplicaciones a los conjuntos de puntos en el plano, 149 A.4. Funciones homogéneas 151 10 Contenido Capitulo 2 21 2.2 2.3 2.4 Vectores, matrices, transformactones lineales Operaciones con vectores 155 a. Definicién de los vectores, 155 b. Representaci6én geométrica de los vectores, 157 c. Longitud de los vec- tores, 4ngulos entre direcciones, 160 d. Productos escalares de vectores, 165 e. Ecuaci6n de hiperplanos en forma vectorial, 167 £. Dependencia lineal de vectores y sistemas de ecuaciones lineales, 170 Matrices y transformaciones lineales 178 a. Cambio de base. Espacios lineales, 178 b, Matrices, 182 c.Operaci. ies con matrices, 186 d. Matrices cuadradas. La reciproca de una matriz. Matrices ortogonales, 189 Determinantes 196 a. Determinantes de segundo y tercer orden, 196 b. Formas lineales y mul- tilineales de vectores, 200 c. Formas multilineales alternantes. Definicién de determinantes, 204 d. Propie- dades principales de los determinan- tes, 209 e. Aplicacién de los deter- minantes a los sistemas de ecuaciones lineales, 214 Interpretacién geométrica de los determinantes 219 a. Productos vectoriales y volmenes de paralelepipedos en el espacio tridimensional, 219 b. Desarrollo de un determinante respecto a una columna. Productos vectoriales en dimensiones superiores, 227 c. Areas de paralelogramos y volamenes de paralelepipedos en dimensiones su- periores, 230 d. Orientacién de paralelepipedos en el espacio n di- 2.5 Capttulo 3 3.1 3.2 3.3 Contenido 11 mensional, 236 e. Orientacién de planos e hiperplanos, 242 £. Cambio de volumen de los paralelepipedos en las transformaciones lineales, 244 Nociones vectoriales en el anilisis 246 a. Campos vectoriales, 246 b. Gradiente de un escalar, 248 c. Divergencia y rotacional de un campo vectorial, 251 d. Familias de vectores. Aplicaci6n a la teoria de las curvas en el espacio y al movimiento de particulas, 255 Desarrollos y aplicaciones del cdiculo diferenczal Funciones implicitas 263 a. Observaciones generales, 263 b. Interpretacién geométrica, 264 c. El teorema de la funcién implicita, 266 d. Demostraci6n del teorema de la funci6n implicita, 271 e. El teorema de la funcién implicita para mas de dos variables independientes, 274 Curvas y superficies en forma im- plicita 276 a. Curvas planas en forma implicita, 276 b. Puntos singulares de curvas, 282 c. Representaci6n implicita de superficies, 284 Sistemas de funciones, transfor- maciones y aplicaciones 287 a. Observaciones generales, 287 b.Coordenadas curvilineas, 293. Ex- tensién a més de dos variables in- dependientes, 295 d Formulas de derivaci6n para las funciones inversas, 298 e. Producto simbélico de apli- caciones, 304 £. Teorema general sobre la inversion de las transfor- 12 Contenido 3.4 3.5 3.6. 3.7 maciones y de los sistemas de fun- ciones implicitas. Descomposici6n er. aplicaciones primitivas, 308 g. Cons trucci6n alternativa de la aplicacién inversa por el método de las apro- ximaciones sucesivas, 314 h. Fun- ciones dependientes, 321 i. Obser- vaciones finales, 323 Aplicaciones a. Elementos de la teoria de super- ficies, 326 b. Transformaci6n confor- me en general, 337 Familias de curvas, familias de superficies y sus envolventes a. Observaciones generales, 339 b. Envolventes de familias unipara- métricas de curvas, 341 c. Ejemplos, 345 d. Envolventes de familias de superficies, 353 Formas diferenciales alternantes a. Definici6n de formas diferenciales alternantes, 357 b. Sumas y productos de formas diferenciales, 360 c. De- rivadas exteriores de formas diferen- ciales, 363 d. Formas diferenciales ex- teriores en coordenadas arbitrarias, 367 MAximos y minimos a. Condiciones necesarias, 376 b. Ejemplos, 379 c. Maximos y minimos con condiciones subsidiarias, 382 d, Demostraci6n del método de mul- tiplicadores indeterminados en el caso ms sencillo, 386 e. Generalizacién del método de los multiplicadores in- determinados, 389 £. Ejemplos, 393 APENDICE A.J Condiciones suficientes para los valores extremos 326 339 357 376 398 A.2 A.3 AS AG Capitulo 4 4.1 4.2 4.3 4.4 4.5 Contenido Ndimeros de puntos criticos rela- cionados con los indices de un cam- po vectorial Puntos singulares de curvas planas Puntos singulares de superficies Relacién entre la representaci6n de Euler y la de Lagrange del movi- miento de un fluido Representacién tangencial de una curva cerrada y la desigualdad isoperimétrica Integrales multiples Areas en el plano a. Definicién de la medida de Jordan de un 4rea, 421 b. Un conjunto que no tiene Area, 425 c. Reglas para las operaciones con 4reas, 426 Integrales dobles a. La integral doble como un vo- lumen, 429 b. El concepto analitico general de la integral, 431 c. Ejem- plos, 435 d. Notacién. Extensiones. Reglas fundamentales, 437 e. Esti- maciones de la integral y el teorema del valor medio, 439 Integrales sobre regiones en tres y mis dimensiones Derivacién en el espacio. Masa y densidad Reduccién de la integral miltiple a integrales simples repetidas a. Integrales sobre un recténgulo, 444 b. Cambio del orden de inte- gracién. Derivacién bajo el signo in- 13 405 413 416 417 419 421 429 44) 442, 444 14 Contenido 4.6 4.7 4.8 4.9 4.10 tegral, 446 c. Reduccién de integrales dobles a integrales simples para regiones mAs generales, 448 d. Exten- sién de los resultados a regiones en varias dimensiones, 453 Transformaci6n de integrales mal- tiples a. Transformacién de integrales en el plano, 454 b. Regiones de mas de dos dimensiones, 460 Integrales maltiples impropias a. Integrales impropias de funciones sobre conjuntos acotados, 464 b. Demostracién del teorema general de la convergencia para las integrales impropias, 468 c. Integrales sobre regiones no acotadas, 472 Aplicaciones geométricas a. CAlculo elemental de volamenes, 474 b. Observaciones generales sobre el calculo de volimenes. Sélidos de revolucién. Volamenes en coorde- nadas esféricas, 446 c. Area de una superficie curva, 479 Aplicaciones fisicas a. Momentos y centro de masa, 488 b. Momento de inercia, 491 c. El pén- dulo compuesto, 493 d. Potencial de masa que se atraen, 496 Integrales miltiples en coordenadas curvilineas a. Resolucién de integrales multiples, 503 b. Aplicaci6n a las areas barridas por curvas en movimiento y vold- menes barridos por superficies en movimiento. Férmula de Guldin. El planimetro polar, 506 Voliamenes y reas superficiales en cualquier nimero de dimensiones 454 463 474 488 503 51l Contenido a. Areas de superficies e integrales de superficie en mAs de tres dimensiones, 511 b. Area y volumen de la esfera n dimensional, 513 c. Generalizaciones. Representaciones paramétricas, 517 4.12 Integrales simples impropias como funciones de un par4metro a. Convergencia uniforme. Depen- dencia continua del parametro, 521 b. Integraci6n y derivaci6n de las in- tegrales impropias con respecto a un parametro, 524 c. Ejemplos, 527 d.Evaluacién de las integrales de Fresnel, 532 4,13 La integral de Fourier a. Introduccién, 535 b. Ejemplos, 537 c. Demostracién del teorema de la in- tegral de Fourier, 540 d. Rapidez de la convergencia en el teorema de la integral de Fourier, 543 e. Identidad de Parseval para las transformadas de Fourier, 546 f. La transformacion de Fourier para funciones de varias variables, 548 4.14 Las integrales eulerianas (Funcién gamma) a. Definicién y ecuacién funcional, 556 b. Funciones convexas. Demos- tracién del teorema de Bohr y Mo- lerup, 558 c. Los productos infinitos para la funci6n gamma, 562 d. El ‘worema de extensién, 566 e. La fun- cién beta, 568 f. Derivacién e inte- gracién de orden fraccionario. Ecuaci6n integral de Abel, 571 APENDICE: ANALISIS DETALLADO DEL PROCESO DE INTEGRACION Al Areas a. Subdivisiones del plano y areas in- teriores y exteriores correspondientes, 15 521 535 556 574 16 Contenido AQ A.3 AA Capitulo 5 5.1 5.2 5.3 5.4 575 b. Conjuntos mensurables de Jor- dan y sus areas, 577 c. Propiedades basicas de las areas, 579 Integrales de funciones de varias variables a. Definicién de la integral de una funcion f(x, y), 584 b. Integrabilidad de las funciones continuas e integrales sobre conjuntos, 586 c. Reglas basicas para integrales multiples, 589 d. Reducci6n de integrales miltiples a integrales sencillas repetidas, 592 Transformaci6n de 4reas e integrales a. Aplicaciones de conjuntos, 595 b. Transformaci6n de integrales mil- tiples, 601 Nota acerca de la definicién del area de una superficie curva Relact6n entre las integrales de superficie y las de volumen Relaci6n entre las integrales de linea y las integrales dobles en el plano (Los teoremas de la integral de Gauss, de Stokes y de Green) Forma vectorial del teorema de la divergencia. Teorema de Stokes Formula para la integraci6n por partes en dos dimensiones. Teorema de Green El teorema de la divergencia aplicado a la transformacién de in- tegrales dobles a. El caso de las aplicaciones biu- nivocas, 621 b. Transformacién de integrales y grado de la aplicaci6n, 624 584 595 602 605 614 619 621 55 5.6 5.7 5.8 5.9 5.1L Contenido Derivacién de area. Transformacién de Au a coordenadas polares Interpretacion de las f6rmulas de Gauss y de Stokes mediante flujos bidimensionales Orientacién de superficies a. Orientacién de superficies bidi- mensionales en el espacio tres, 639 b. Orientacién de curvas sobre super- ficies orientadas, 652 Integrales de formas diferenciales y de escalares sobre superficies a. Integrales dobles sobre regiones planas orientadas, 654 b. Integrales de superficie de formas diferenciales de segundo orden, 657 c. Relacién entre las integrales de formas di- ferenciales sobre superficies orien- tadas y las integrales de escalares sobre superficies no orientadas, 659 Teoremas de Gauss y de Green en el espacio a. Teorema de Gauss, 663 b. Apli- cacién del teorema de Gauss al movimiento de fluidos, 668 c. El teorema de Gauss aplicado a fuerzas en el espacio y fuerzas superficiales, 671 d. Integraci6n por partes y el teorema de Green en tres dimen- siones, 674 e. Aplicacién del teorema de Green a la transformacién de AUa coordenadas esféricas, 675 Teorema de Stokes en el espacio a. Enunciado y demostracién del teorema, 678 b. Interpretacién del teorema de Stokes, 682 Identidades de integrales en dimen- siones superiores 7 628 632 639 854 663 678 689 18 Contenido APENDICE: TEORIA GENERAL DE Al AQ AB AA AS Capttulo 6 6.1 LAS SUPERFICIES Y DE LAS IN- TEGRALES DE SUPERFICIE Superficie e integrales de superficie en tres dimensiones a. Superficies elementales, 692 b. In- tegral de una funci6én sobre una superficie elemental, 695 c. Super- ficies elementales orientadas, 697 d.Superficies simples, 699 e. Particiones de la unidad e integrales sobre super- ficies simples, 703 El teorema de la divergencia a. Enunciado del teorema y su in- variancia, 706 b. Demostracién del teorema, 708 Teorema de Stokes Superficies e integrales de superficie en espacios euclidianos de dimen- siones superiores a. Superficies elementales, 714 b. In- tegral de una forma diferencial sobre una superficie elemental orientada, 717 c. Superficies simples m-dimen- sionales, 718 Integrales sobre superficies simples, teorema de la divergencia de Gauss y formula general de Stokes en dimen- siones superiores Ecuaciones diferenciales Las ecuaciones diferenciales para el movimiento de una particula en tres dimensiones a. Las ecuaciones de movimiento, 725 b. El principio de conservacién de la energia, 727 c. Equilibrio. Estabi- lidad, 659 d. Oscilaciones pequefias 692 706 712 714 721 725 6.2 6.3 6.4 6.5 6.6 6.7 Contenido 19 en torno a una posici6n de equilibrio, 733 e. Movimiento planetario, 737 f£.Problemas con valores en la frontera. El cable cargado y la viga cargada, 744 La ecuacién diferencial lineal general de primer orden 751 a. Separacién de variables, 751 b. La ecuaci6n lineal de primer orden, 753 Ecuaciones diferenciales lineales de orden superior 756 a. Principio de superposicién. So- luciones generales, 756 b, Ecuaciones diferenciales homogéneas de segundo orden, 761 c. La ecuacién diferencial no homogénea. Método de variacién de parametros, 764 Ecuaciones diferenciales generales de primer orden 770 a. Interpretacién geométrica, 770 b. Laecuacién diferencial de una fami- lia de curvas. Soluciones singulares. Trayectorias ortogonales, 773 c. Teo- rema de existencia y unicidad de la solucién. 776 Sistemas de ecuaciones diferenciales y ecuaciones diferenciales de orden superior 783 Integraci6n por el método de coe- ficientes indeterminados 785 El potencial de cargas atractivas y la ecuacién de Laplace 787 a. Potenciales de distribuciones de masa, 788 b. La ecuacién diferencial del potencial, 792 c. Capas dobles uniformes, 794 d. El teorema del valor medio, 797 e. Problemas con valores en la frontera para el circulo. Integral de Poisson, 799 20 Contenido Capitulo 7 6.8 71 7.2 7.3 7.4 Mas ejemplos de ecuaciones diferen- ciales parciales que surgen en la fisicomatematica a. La ecuacién de onda en una di- mensi6n, 802 b. La ecuacién de onda en el espacio tridimensiogal, 804 c. Las ecuaciones de Maxwell en el espacio libre, 806 Cdlculo de vartaciones Funciones y sus extremos Condiciones necesarias para la exis- tencia de valores extremos de un funcional a. Anulacién de la primera variacién, 818 b. Deduccién de la ecuacién diferencial de Euler, 820 c. Demos- traciones de los lemas fundamentales, 823 d. Solucién de la ecuacién di- ferencial de Euler en casos especiales. Ejemplos, 825 e. Anulaci6n idéntica de la expresi6n de Euler, 829 Generalizaciones a. Integrales con mAs de una funcién argumento, 830 b. Ejemplos, 832 c. Principio de Hamilton. Ecuaciones de Lagrange, 834 d. Integrales que in- volucran derivadas superiores, 837 e. Varias variables independientes, 838 Problemas en que existen condi- ciones subsidiarias. Multiplicadores de Lagrange a. Condiciones subsidiarias ordi- narias, 840 b. Otros tipos de con- diciones subsidiarias, 843 802 813 818 830 840 Contenido 21 Capitulo 8 Funciones complejas representadas por series de potencias 8.1 Funciones complejas representadas por series de potencias 847 a. Limites y series infinitas con tér- minos complejos, 847 b. Series de potencias, 850 c. Derivacién e in- tegracion de series de potencias, 852 d. Ejemplos de series de potencias, 855 8.2 Fundamentos de la teoria general de las funciones de una variable com- pleja 857 a. El postulado de la diferenciabi- lidad, 857 b. Las operaciones mAs sencillas del cAlculo diferencial, 861 c. Transformacién conforme. Funcio- nes inversas, 865 8.3 Integracién de funciones analiticas 868 a. Definicién de la integral, 868 b. Teorema de Cauchy, 870 c. Apli- caciones. El logaritmo, la funcién ex- ponencial y la funcién potencia general, 872 8.4 Formula de Cauchy y sus aplica- ciones 879 a. Férmula de Cauchy, 879 b. Des- arrollo de funciones analiticas en series de potencias, 881 c. La teoria de funciones y la teorfa del potencial, 884 d. El reciproco del teorema de Cauchy, 885 e. Ceros, polos y residuos de una funci6n analitica, 886 8.5 Aplicaciones a la integracién com- pleja (Integracién de contorno) 890 a. Demostraci6n de la formula (8.22) 890 b. Demostracién de la formula (8.23), 891 c. Aplicacién del teorema de los residuos a la integracién de 22 Contenido funciones racionales, 892 d. El teorema de los residuos y las ecua- ciones diferenciales lineales con. coeficientes constantes, 895 8.6 Funciones multiformes y la exten- sion analitica 898 Lista de datos biograficos 1028 Indice 1031 INTRODUCCION AL CALCULO Y AL ANALISIS MATEMATICO VOLUMEN Ii CAPITULO 1 Funciones de varias variables y sus derivadas Los conceptos de limite, continuidad, derivada e integral, como se desarrollaron en el Volumen I, también son basicos.en dos o m4s variables independientes. No obstante, en dimensiones superiores debe tratarse con muchos fenémenos nuevos que no tienen con- traparte en lo absoluto en la teorfia de las funciones de una sola variable. Por regla general, un teorema que puede probarse para funciones de dos variables, puede aplicarse con facilidad a funciones de mas de dos variables sin cambio esencial alguno en la demostra- cién. Por lo tanto, en lo que sigue, a menudo nos restringiremos a funciones de dos variables, en donde las relaciones pueden concebrse geométricamente con mayor facilidad, y estudiaremos las funciones de tres o mas variables sélo cuando con ello se pueda entender mejor este tema; ésto también conduce a interpretaciones geométricas mas simples de nuestros resultados. 1.1 Puntos y conjuntos de puntos en el plano y en el espacio a. Sucesiones de puntos: Convergencia Una pareja ordenada de valores (x,y) puede representarse geométricamente por el punto P que tiene a x y y como coordenadas en algan sistema coordenado cartesiano. La distancia entre dos pun- tos P = (x, y)y P’ =(x’, y’) esta dada por la formula PP = Ve — xP + — 9, la cual es basica para la geometria euclidiana. Se usa la nocién de distancia para definir las vecindades de un punto. La vecindad ¢ de 25 26 Introduccién al cAlculo y al an4lisis matemAtico un punto C = (a, B) consiste de todos los puntos P = (x, y) cuya dis- tancia desde C es menor que €; geométricamente éste es el disco! cir- cular con centro en C y radio € que se describe mediante la desigual- dad (x — a)? + (y — BP <2 Consideraremos sucesiones infinitas de puntos P; = (m1, y1), Pa = (x2, y2), 4 Pu = (Xn, Yn); Por ejemplo, Pn = (n, n®) define una sucesién cuyos puntos se en- cuentran sobre la parabola y = x®. No todos los puntos en una su- cesi6n tienen que ser distintos. Por ejemplo, la sucesién infinita Pn = (2, (-1)")_s6lo tiene dos elementos distintos. La sucesién Pi, Ps, . . .,es acotada si puede hallarse un disco que conteénga a todos los Pn,ésto es, si existen un punto Q y un nimero M ‘tal que P,Q 0 existe un numero N tal que Pn se encuentra en la vecindad ¢ de Q para todo n > N? Por ejemplo, para la sucesién de puntos definida por Pn = (e cos n,e-"/4 sen n), se tiene lim Px = (0, 0) = Q,dado que aqui ae nid PrQ = e-"4—>0 para. n—> 00 Se observa que los Py se aproximan al origen Q a lo largo de la es- 1La palabra “circulo”, como se usa comanmente, es ambigua, refiriéndose ya sea a la curva oa la regién limitada por ella. Seguiremos la practica corriente de reservar el término “circulo” s6lo para la curva y el término “regién circular” 0 “disco” para la region bidimensional. De modo semejante, en el espacio distinguimos la “esfera” (es decir, la superficie esférica) del s6lido tridimensional “bola” que limita. *De modo equivalente, cualquier disco con centro en q contiene a todes menos aun niimero finito de los Pa. También se usar la notacién P, -> Q cuando n> © Funciones de varias variables y sus derivadas 27 Figura 1.1 Sucesién convergente Ps. piral logaritmica con ecuacién r = e~®4 en las coordenadas polares r, 0 (ver la Fig. 1.1). La convergencia de la sucesi6n de puntos Pn = (%n, yn) hacia el punto Q = (a, b) significa que las dos sucesiones de naimeros xn y Yn convergen por separado y que lim xn =a, lim yn = 0. nee ne En efecto, la pequefiez de PnQ implica que tanto x, — a COMO yn - b son pequeifias, ya que |xn — a| S PaQ, |yn — b| S PnQ; inversamen- te, PrQ = Ven — a + (yn — BY S |xn — a] + lyn — Ol, de modo que PnQ —— 0 cuando tanto xn —> a como ya— b. Precisamenté como en el caso de las sucesiones de niémeros, puede probarse que converge una sucesién de puntos, sin conocer el limite, aplicando el criterio intrinseco de Cauchy para la convergencia. En dos dimensiones, este criterio afirma que: Para la convergenciéa de una sucesién de puntos Pa = (xn, yn) es necesario y suficiente que, para cada ¢ > 0, se cumpla la desigualdad PaPm < & para todan, m que sean mayores que un valor apropiado N = N(e). La demostracién se deduce inmediatamente aplicando el criterio de Cauchy para las sucesiones de nameros a cada una de las sucesiones xn y yn. 28 Introduccién al calculo y al andlisis matematico b. Conjuntos de puntos en el plano En el estudio de las funciones de una sola variable x, generalmen- te se permite que x varie sobre un “intervalo”, el cual podria ser cerrado o abierto, acotado o no acotado. Como posibles dominios de funciones en dimensiones superiores, se tiene que considerar una gran variedad de conjuntos y se tienen que introducir términos que describan las propiedades ms sencillas de tales conjuntos. Por lo comtin se consideraran curvas o regiones bidimensionales en el plano. En el Volumen I (Capitulo 4), se han estudiado con amplitud las cur- vas planas. Normalmente se dan en la forma “no paramétrica” y = f (x), o bien, en la “paramétrica” por medio de una pareja de fun- ciones x = ¢(t), y = y(t), 0 bien, en la forma “implicita” mediante una ecuacién F(x, y) = 0 (en el Capitulo 3 se tratara m4s acerca de las representaciones implicitas). Ademas de las curvas, se tienen conjuntos bidimenstonales de puntos, formando una regzén. Una regién puede ser el plano xy com- pleto o una porci6on del plano limitada por una curva simple cerrada ¥ y oo: oO Figura 1.2 Una regién simplemente ‘Figura 1.3 Una region triplemente conexa. conexa. ES Figura 1.4 Una regién R no conexa. Funciones de varias variables y sus derivadas 29 (formando, en este caso, una regién simplemente conexa como se muestra en la Fig. 1.2) 0 por varias de esas curvas. En el dltimo caso se dice que es una regi6n miiltiplemente conexa, y el namero de cur- vas frontera da lo que se conoce como conectividad; por ejemplo, la Fig. 1.3, muestra una regi6n triplemente conexa. Un conjunto plano puede no ser conexo' en lo absoluto, y consistir de varias porciones separadas (Fig. 1.4). Generalmente, las curvas frontera de las regiones que van a con- siderarse son seccionalmente suaves. Es decir, cada una de esas curvas consiste de un nimero finito de arcos, y cada arco tiene una tangente que gira de manera continua en todos sus puntos, incluyendo los puntos extremos. Por lo tanto, tales curvas pueden tener cuando mas un namero finito de esquinas. En la mayoria de los casos se describira una regién por medio de una o mas desigualdades, donde la igualdad se cumple sobre alguna porcién de la frontera. Los dos tipos mas importantes de regiones, a las cuales recurriremos a cada momento, son las regiones rectan- gulares (con lados paralelos a los ejes coordenados) y los discos cir- culares. Una reg?6n rectangular (Fig. 1.5) consiste de los puntos (x, y) cuyas coordenadas satisfacen desigualdades de la forma a 0, la vecindad ¢ de Q contiene al menos un punto de S. Para todo nimero natural n es posible elegir un punto Pn de S que pertenece a la vecindad ¢ de Q, con = 1/n. Evidentemente, los Pp convergena Q. e. Puntos y conjuntos de puntos en el espacio Una terna ordenada de nimeros (x, y, z) puede representarse en la manera usual mediante un punto P en el espacio. Aqui, los na- meros x, y, 2, las coordenadas cartesianas de P, son las distancias (con signo) de P desde tres planos mutuamente perpendiculares. La distancia PP’ entre los dos puntos P = (x, y, 2) y P’ = (x, y’, 2’) esta dada por PP = VQ — xP + 0 — y+ @ — 2 La vecindad ¢ del punto @ = (a, b, c) consiste de los puntos P = (x, y, 2) para los cuales P@ < e; estos puntos forman la bola dada por la desigualdad (x — a)? + (y — bP + (2-0? <8 Las an4logas a las regiones planas rectangulares son los parale- lepipedos' rectangulares descritos por medio de un sistema de des- igualdades de la forma a x? es abierto. eCual es la frontera de un segmento lineal considerado como un subcon- junto del plano x, y? 2También se usan los términos “celda” e “intervalo” para describir regiones rectan- gulares de este tipo, en dimensiones superiores. SAsf, el sistema de moléculas de un gas en un recipiente puede describirse por la posicién de un solo punto en un “espacio fase” con un nimero muy grande de di- mensiones. Yendo incluso mAs adelante, en algunas partes del andlisis se acostumbra representar una sucesién infinita de nameros x1, x2,. .. por un punto (x1, 2, . « .) en un es- pacio con un ntimero infinito de dimensiones. 36 Introduccién al cAlculo y al an4lisis matemAtico Problemas 1.1 1. Sea P un punto frontera del conjunto $ que no pertenece a S. Probar que existe una sucesién de puntos distintos P1, Pz... en $ que tiene a P como limite. Probar que la cerradura de un conjunto es cerrada Sea P cualquier punto de un conjunto $ y Q cualquier punto fuera del conjunto. Probar que el segmento rectilineo P@ contiene un punto fron- we tera de S. 4. Sea G el conjunto de puntos (x,y) para el cual x <1, y <1/2yy<0 si x = 1/2. gContiene G sélo puntos interiors? Proporcionar la evidencia necesari 1.2 Funciones de varias variables independientes Funciones y sus dominios Las ecuaciones de la forma warty u=xty4 0 u= log(l— x? —y%) asignan un valor funcional u a una pareja de valores (x, y). En los primeros dos ejemplos se asigna un valor de u a cada pareja de valores (x, y), mientras que en el tercero la correspondencia tiene sig- nificado sélo para aquellas parejas de valores (x,y) para las que se cumple la desigualdad x? + y? ~1 En general, se dice que u es una funcidn de las variables indepen- dientes x y y siempre que alguna ley f asigna un valor Gnico de uo sea, la variable dependiente) a cada pareja de valores (x, y) que perte- necen a un cierto conjunto especificado, 0 sea, el dominio de la fun- cién. Asi, una funcién wu = f(x, y) define una aplicactén de un con- junto de puntos en el plano x, y —el dominio de f— sobre un cierto conjunto de puntos del eje u, el recorrido de f. De modo semejante, se dice que u es una funci6n de las 7n variables x1, xz,. . . , Xn si para cada conjunto de valores (x1,...,%n) que pertenecen a cierto conjunto especificado, se asigna un valor Gnico correspondiente de ut JA menudo se piensa en las funciones f como si asignaran un valor a un punto P, en lugar de a la pareja (x,y) de coordenadas que describen a P. Entonces se escribe AAP) en lugar de flx,y). Esta notacién es particularmente dtil cuando se define geométricamente la relacién funcional entre los puntos P y los valores f(P), sin hacer referencia a un sistema coordenado x, y especffico. Funciones de varias variables y sus derivadas 37 Asi, por ejemplo, el volumen wu = xyz de un paralelepipedo rec- tangular es una funcién de la longitud de los tres lados x, y, z; la declinacién magnética es una funci6n de la latitud, la longitud y el tiempo; la suma x1 + x2 + +++ + Xn es una funcién de los n tér- minos %1, %2,..., Xn. Se debe observar que el dominio de una funcién es una parte in- dispensable de su descripcién. En los casos en donde u = f(x, y) se da mediante una expresién explicita, resulta natural tomar como do- minio de f todas las (x, y) para las que esta expresién tiene sentido. No obstante, se puede definir por “restriccién” las funciones dadas por la misma expresi6n, pero que tengan dominios menores. Asi, se puede usar la formula u = x? + y? para definir una funcién con dominio x? + y? < 1/2. Precisamente como en el caso de funciones de una variable, una correspondencia funcional u = f(x, y) asocia un valor tinico de u con el sistema de variables independientes x, y. De esta manera, ningén valor funcional es asignado por una expresién analitica que sea mul- tiforme, tal como arc tan y/x, a menos que se especifique, por ejem- plo, que el “arc tangente” es valido para la rama principal con valores que se encuentren entre —1/2 y + 1/2 (ver el Volumen I, p. 214); ademas, tiene que excluirse la recta x = 0.2 b. Los tipos mds sencillos de funciones Precisamente como en el caso de una variable independiente, ias funciones mas sencillas de m4s de una variable son las funciones en- teras ractonales o polinomios. El polinomio mas general del primer grado, o funcién lineal, tiene la forma u=ax+t byte, donde a, 6 y c son constantes. El polinomio general de segundo grado tiene la forma Tomando el valor principal, se ve que u = arc tan y/x para x > Onoes otra cosa sino el angulo polar del punto (x,y) medido a partir del eje x positivo. Este angulo polar puede atin definirse geométricamente de una manera obvia como una funcion univaluada con valores entre -n y m si se excluye precisamente el origen y los puntos sobre el eje x negativo, pero entonces el angulo polar ya no esté dado por arc tan y/xen la region extendida, si se entiende que el arco tangente se refiere a la rama principal. 38 Introduccién al cléulo y al an4lisis matematico u = ax? + bry + cy? + dx + ey +f. Su dominio es el plano x, y completo. El polinomio general de cual- quier grado es una suma de un numero finito de términos a@mnx™y” (llamados monomios), donde m y n son enteros no negativos y los coeficientes @mn son arbitrarios. El grado del monomio amnx"y" es la suma m + n de los exponen- tes de x y y, siempre que el coeficiente @mn no se anule. El grado de un polinomio se determina por el grado mayor de cualquiera de los monomios con que tenga un coeficiente no anulable (después de combinar los términos con las mismas potencias de x y y). Un po- linomio que consiste de monomios que tienen el mismo grado N se llama polinomio homogéneo o forma de grado N. Asi, x? + 2xy, 0 bien, 3x3 + (7/5) xy + 2y3 son formas. Extrayendo las raices de las funciones racionales, se obtienen cier- tas funciones algebraicas', por ejemplo, = fe=y (CD) u=,/——-~ 3/\e Te Vxtyt Vad4 xy ° La mayorfa de las funciones mas complicadas de varias variables que se usaran aqui se pueden describir en términos de las funciones bien conocidas de una variable, tal como u=sen(xarccosy) obien u = log: y. c. Representacién geométrica de las funciones Tal como se representan las funciones de una variable mediante curvas, se pueden representar las funciones de dos variables, geo- métricamente, por medio de superficies. Con este fin, considérese un sistema coordenado rectangular x,y,u en el espacio y marquese por encima de cada punto (x, y) del dominio R de la funcién en el plano x, y, el punto P con la tercera coordenada u = f(x, y). Conforme el punto (x, y) varia sobre la region R, el punto P describe una super- ficie en el espacio. Se toma esta superficie como la representacién geométrica de la funcién. Inversamente, en la geometria analitica, las superficies en el es- pacio se representan por funciones de dos variables, de modo que en- 1 Véase la p. 275 respecto a una definicion general del término “funcién algebraica”. Funciones de varias variables y sus derivadas 39 tre tales superficies y las funciones de dos variables existe una re- lacién reciproca. Por ejemplo, a la funcién u=VIi-x2—y le corresponde él hemisferio que se encuentra por encima del plano x, y, con radio unitario y centro en el origen. A la funcién wu = a? + y® le corresponde un lamado paraboloide de revolucion, que se ob- tiene haciendo girar a la parabola u = x% alrededor del eje u (Fig. 1.9). A las funciones u = x — y® y w= ay, les corresponden para- boloides heperbélicos (Fig. 1.10). La funci6n lineal u = ax + by +¢ tiene un plano en el espacio como “grafica”. Si en la funcion u = f(x, y) no aparece una de las variables independientes, digamos y, de modo que w slo depende de x, 0 sea w = g(x) la funcién se representa en el espacio x, y, u mediante una superficie cilindrica generada por las perpendiculares al plano u,x en los puntos de la curva u = g(2). Figura 1.9 u =x? + y*%. Figura 1.10 u =x? — Sin embargo, esta representacién por medio de coordenadas rec- tangulares tiene dos desventajas. Primero, la imagen geométrica fracasa cuando se trata de tres o mas variables independientes. Segundo, incluso para dos variables independientes, a menudo resul- ta mas conveniente limitar la discusién al plano x,y Gnicamente, ya que en el plano se pueden trazar esquemas y realizar construcciones geométricas sin dificultad. Desde este punto de vista, a veces es preferible otra representacién geométrica de una funcién de dos variables, por medio de lineas de contorno. En el plano x,y se toman 40 Introduccién al calculo y al andlisis matem4tico todos los puntos para los cuales u = f(x, y) tiene un valor constante, digamos u = k. Por lo comin, estos puntos se encontraran sobre una curva o curvas, la llamada linea de contorno o curva de nivel, para el valor constante dado k de la funcién. También pueden obtenerse es- tas curvas, cortando la superficie u = f(x,y) por medio del plano u =k paralelo al plano x, y y proyectando las curvas de intersecci6n perpendicularmente sobre el plano x, y. E] sistema de estas lineas de contorno, marcadas con los valores correspondientes fi, kz,.... de la altura &, nos da una represen- tacién de la funci6n. En la practica, se asignan valores en progresion aritmética a k, digamos k = vh, donde v = 1, 2, . . . Entonces la dis- tancia entre las lineas de contorno proporciona una medida de la in- clinacién de la superficie u = f(x, y), porque entre dos lineas con- secutivas cualesquiera el valor de la funcién cambia en la misma can- tidad. La funcién sube o baja con rapidez donde las lineas de contor- no estén muy préximas; en cambio, donde las lineas se separan, la superficie es achatada. Este es el principio con el que se construyen los mapas topograficos como los del U.S. Geological Survey (Servicio Geografico y Geolégico de los E.E.U.U.) En este método, la funcién lineal u = ax + by + ¢ se representa por un sistema de rectas paralelas ax + by + c = k. La funcién u = x? + y? se representa por un sistema de circulos concéntricos (ver la Fig. 1.11). La funcién u = x2 — y®, cuya superficie tiene “forma de silla de montar” (Fig. 1.10), se representa por el sistema de hipér- bolas que se muestra en la Fig. 1.12. Figura 1.11 Lineas de contorno de Figura 1.12 Lineas de contorno de us x+y us xt — yy Funciones de varias variables y sus derivadas 41 El método de representar la funcién u = f(x, y) mediante lineas de contorno tiene la ventaja de poder extenderse hacia funciones de tres variables independientes. Entonces, en lugar de las lineas de con- torno, se tienen las superficies de nivel f(x,y, 2) = k, donde k es una constante a la cual se le pueden asignar cualquier sucesi6n apropiada de valores. Por ejemplo, las superficies de nivel para la funcién u = x? + y? + 22 son esferas concéntricas alrededor del origen del sistema coordenado x, y, 2 Ejercicios 1.2 1. Evaluar las siguientes funciones en los puntos indicados: (@) z = (cot are (x +y9)\* tan are (x — y) Lak )woemeew, para zays @z 00s 2, oy e, yslogn (d) z= cosh (x + 5), x = log y= logy 1 yod pez =xty @z=2=> ws . Al igual que en el Volumen I, a menos que se haga una excepcion ex- plicita, se considera el dominio de una funcién definida mediante una expresion formal como el conjunto de todos los puntos para los cuales la expresion tiene significado. Dar el dominio y el recorrido de cada una de las siguientes funciones: (@)z=vzFy @ z= V3— x? — 29? (b) z= 2x9? () 2= y= (&) z= log (x? — y*) 3 2 i @)z=tanare zap (e) z = log (x + By) (m) z= tan are 5 Ey (f) z= vx sen y (n) z= cos arc tan @) w= Vax xe — yt? x+y (0) z= arc cos log (x + 9) (h)z= (p)2z= Vy cos x. @ . Cual es el nGimero de coeficientes de un polinomio de grado n en dos variables ? En tres variables? ¢En k variables? 42 Introduccién al cAlculo y al an4lisis matemitico 4. Para cada una de las funciones siguientes, hacer un esquema de las lineas de contorno correspondientes a z = —2, —1, 0, 1, 2, 3: (@) z= xy ) z=x?+y2-1 © z=2—y¥ @ z= 1 @) z=y (I ~ spy 5. Trazar las lineas de contorno para z= cos (2x + y) correspondientes a 2=0,+1,+1/2 6. Hacer un esquema de las superficies definidas por (a) z= 2xy (b) z= x8 +52 ()z=x-y. @z=x (©) z=sen (x + »). 7. Encontrar las curvas de nivel de la funcion 1+ vx? + y® = 108 Tes x . Hallar las superficies sobre las cuales la funcién u = 2 (x® + y?)/z es cons- tante, 1.3 Continuidad a. Definicién Como en la teoria de las funciones de una sola variable, el concep- to de continuidad figura de modo prominente cuando se consi- deran funciones de varias variables. La proposici6én de que la fun- cién u = f(x, y) es continua en el punto (, n) debe significar, hablan- do en términos generales, que para todos los puntos (x, y) cercanos a (é, 0), el valor de f(x, y) sélo difiere un poco del valor f(é, n). Esta idea se expresa de manera mas precisa como sigue: Si f tiene el dominio R y Q@ = (E, n) es un punto de R, entonces f es continua en Qs? para cada & > 0 existe un 8 > Otal que @ If(P) — FQ) = If, ») — FE, 0) 0 existe un § = &(¢) positivo tal que |f(P) — f(Q)| <« para dos puntos cualesquiera P, Q en R de distancia < 5.! La can- tidad 8 = &(e) se lama médulo de continuidad para f, Se tiene el teorema bisico: Una funcién f que esté definida y es continua en un conjunto cerrado y acotado R es uniformemente continua en R. (La demos- tracién se encuentra en el Apéndice de este capitulo.) El caso en el que puede hallarse un médulo de continuidad proporcional a ¢ (ver el Volumen I, p. 43) es de suma importancia. Se dice que una funcién f(P) definida en R es continua segtin Lips- chitz si existe una constante L tal que (3) If(P) - f(Q)|< L PQ para todos los puntos P, Qen R. (L se llama “constante de Lipschitz”; la relacién (8) es la con- dicién de Lipschitz”.) Es evidente que una funcién f continua segan Lipschitz es uniformemente continua y tiene a § = ¢/L como médulo de continuidad? b. El concepto de limite de una funcién de varias variables La nocién de limite de una funci6n esta intimamente relacionada con la nocién de continuidad. Supongamos que f(x, y) es una funcién con dominio R. Sea Q = (&,n) un punto de la cerradura de R. Se dice que f tiene el limite L cuando (x,y) tiende hacia (&,n) y se es- cribe TEI requerimiento esencial que hace uniforme a la continuidad es que 5 dependa de & pero no de Po de Q. 2La clase atin mas amplia de funciones f “continuas segtin Hélder” se obtiene cuan- do se remplaza la condicién de Lipschitz (8) por la condicion de Hélder If) -fQISL PQr para todo P, QenR. Ly q son constantes y 0 G n) PQ si para cada € > 0 puede hallarse una vecindad 6) PQ = VE- EP +O mP <8 de (E, n) tal que If(P) — L|=|f, 9) — L| 0. Entonces, en particular, (4) implica que If€ n) — Li Oy de aqui que L = f(E, n). Pero entonces, por de- finicién, la relacién lim fx, y) = FG, n) (xe 9G es idéntica a la condici6n para la continuidad de f en (€, ). De aqui que la continuidad de la funcién f en el punto (é,n) es equivalente a la proposicién de que f estd definida en (é, n) y que f(x, y) tiene el limite fl, n) cuando (x, y) tiende a (é, n). Si f no esta definida en el punto frontera (é, n) de su dominio pero tiene un limite L cuando (x, y) -»(, n), puede extenderse natural- mente la definicién de f al punto (é, n), poniendo f(E, n) = L; enton- ces la funcién f extendida en esta forma ser4 continua en (, n).Si f(x, y) es continua en su dominio R, puede extenderse la definicion de f como limite no inicamente a un solo punto frontera (, 9) sino simul- taneamente a todos los puntos frontera de R para los cuales f tiene un limite. Una vez mas, la funcién extendida que resulta es continua, como el lector puede verificar como un ejercicio. Témese, por ejem- plo la funcién '0 bien, im f(x, 9) = L para (x, y) + &, n) o también lim f(x, 9) = L. re yn 2La nocién no tiene sentido para puntos (, n) exteriores a R, ya que entonces exis- ten puntos arbitrariamente proximos a (&, n)en los que f esté definida, y podria con- siderarse como Ifmite a todo L. 46 Introduccién al cAlculo y al an4lisis matematico fx, y) =e definida para toda (x, y) con y > 0. Obviamente, esta funci6n es con- tinua en todos los puntos de su dominio R, el semiplano superior. Considérese un punto frontera (6,0). Para #0, evidentemente se tiene lim f(x, y) = lim e* = 0 (x 9G, se cuando se restringe y a valores positivos. Si, entonces, se define la funci6n extendida f*(x, y) por f*(x, y) = F(z, ») para y > Oy toda x, y por f*(x, 0) =0 para x # 0, la funcin f* sera continua en su dominio R*, donde R* ¢s el semiplano superior cerrado y 2 0 con la excepcién del punto (0, 0). En cl origen f* no tiene limite, y de aqui que no es posible definit £*(0, 0) en tal forma que la extension sea continua en el origen. En efecto, para (x, y) sobre la parabola y = kx®, se tiene fox, y) =e", ‘Lendiendo al origen a lo largo de parabolas diferentes se obtienen valores limite diferentes, de modo que no existe un limite Gnico de Fix, y) cuando (x, y) > 0. También puede relacionarse el concepto de limite de una funcién fix, y) con cl de limite de una sucesion (ver el Volumen I, p. 82). Supéngase que f tiene el dominio Ry lim _ f(z,y) = L. yen Sea Pn = (sn, Jn) paran = 1,2,. . ., cualquier sucesién de puntos en R para la cual lim Pp = (6, n). Entonces la sucesion de nameros f(xn, neo Yn) tiene el limite L. Porque f(x, y) diferiré arbitrariamente poco de L para toda (x, y) en R suficientemente préxima a (E, 0), y (Xn, Yn) es- tara suficientemente préxima a (6, n) tan s6lo haciendo 7 lo suficien- temente grande. Reciprocamente, lim f(x,y) cuando (x, y) > (, n) nto existe y tiene el valor L si para cada sucesién de puntos (xn, yn) en R Funciones de varias variables y sus derivadas 47 con limite (6, 0) se tiene lim f(xn, yn) = L. La demostracién puede ser Poe proporcionada facilmente por el lector. Si nos restringimos a los pun- tos (E, n) en el dominio de f, se obtiene la proposicién de que la con- tinuidad de f en su dominio R significa precisamente que © tim fan, yn) = FE, 0) stempre que lim (xn, yn) = (6, n) 0 bien que Vim f(xn, yn) = f(lim xn, lim yn), donde slo se consideran las sucesiones (xn, yn) en R que convergen y tienen sus limites en R. Entonces, en esencia, la continuidad de una funcién f nos permite el intercambio del simbolo para f con el de limite. Es evidente que las nociones de limite y de continuidad de una funcién se aplican con igual propiedad cuando el dominio de f no es una region bidimensional sino una curva o cualquier otro conjunto de puntos. Por ejemplo, la funcién flat y) = +9)! esta definida en el conjunto R que consiste de todas las rectas x + y = const. = n, donde n es un entero positivo. Es obvio que f es con- tinua en su dominio R. Se mencioné con anterioridad (p. 42) que cuando f(x, y) ¥ g(x,y) son continuas en un punto (&,n). entoncesf + g,f—g, f+ g,y, para g(,n) #0, también f/g son continuas en (, n). Estas reglas se de- ducen inmediatamente a partir del enunciado de la continuidad en términos de la convergencia de sucesiones. Para cualquier sucesién (xn, Yn) de puntos que pertenecen a los dominos af yg y que conver- ge a (é, n), por (6) se tiene Tim fn, yn) = FE 0), im gen, Yn) = BG 0) Entonces, se concluye la convergencia de f(xn, Yn) + gn» Yn), €tC., a partir de las reglas para operar con sucesiones (Volumen I, p. 72). c. El orden de anulacién de una funcién Si la funcién f(x,y) es continua en el punto (E, 0), la diferencia f(x, y) — FE, n) tiende a 0 conforme x tiende af y y tiende an. In- 48 Introduccién al cAlculo y al an4lisis matemAtico troduciendo las nuevas variables h = x — § y k = y — n,se puede ex- presar ésto como sigue: La funcién ¢(h, k) = f(E+h,n +h) -f6 7) de las variables h y k tiende a 0 a medida que / y k tienden hacia 0. Con frecuencia encontraremos funciones (h, k) que tienden hacia cero conforme h y k lo hacen. Como en el caso de una variable in- dependiente, para muchos fines resulta util describir el comporta- miento de ¢(h, k) cuando h->+0 y k->0 con mas precision, distin- guiendo entre diferentes “6rdenes de anulacién” y “érdenes de mag- nitud” de g(h, &). Con este fin, se basan las comparaciones en la dis- tancia p= VPFR = VE — OP del punto con coordenadas x=§&+hy y=1 + k desde el punto con coordenadas & y ny se hace uso de la definicién siguiente: Una funcién ¢(h, k) se anula conforme p — 0 por lo menos en el mismo orden que p = VA? + R®, siempre que exista una constante C independiente de h y k tal que se cumpla la desigualdad | oh, 4} bp |S¢ para todos los valores lo suficientemente pequefios de p; es decir, siempre que exista un 5 > 0 tal que se cumpla la desigualdad para todos los valores de h y k tales que 0 < vA? + k® <5. Entonces se es- cribe simbdlicamente: ¢(h,k) = O(p). Es ms, se dice que ¢(h, k) se anula para un orden superior a p si el cociente $(h, k)/p tiende a 0 conforme p — 0. Esto se expresara mediante la notacién simbélica g(h k) = o(p) cuando (h, k) +0 (ver el Volumen I, p. 253, donde se explican los simbolos “o” y “O” para las funciones de una sola variable). Consideremos algunos ejemplos. Como \Al 1k| vee St YER S11 las componentes h y & de la distancia p en la direccion de los ejes x y y se anulan por lo menos en el mismo orden que la propia distancia. TGon el fin de evitar confusiones, sefialaremos expresamente que un orden superior de anulacién cuando p +0 implica valores menores en la vecindad de p = 0; por ejemplo, p? se anula en un orden superior a p y p? es menor que p cuando p.est& préximo a 0. Funciones de varias variables y sus derivadas 49 Lo mismo es cierto para una funcién lineal homogénea ah + bk.con constantes a y 6 o para la funcién p sen Para valores fijos a mayores que 1, la potencia p* de la distancia se anula en un orden superior a p; simbélicamente, p* = o(p) para a > 1. De modo se- mejante, un polinomio cuadratico homogéneo ah? + bhk + ck?, en las variables A y k, se anula en un orden superior a p conforme p > 0 ah? + bhk + ck® = o(p). En forma mas general, se usa la definicién siguiente. Si se define la funcién de comparacién w(h, k) para todos los valores diferentes de cero de (h,k) en un circulo suficientemente pequefio alrededor del origen, y que no sea igual a cero, entonces ¢(h, k) se anula por lo menos en el mismo orden que oh, k) conforme p > 0 si para alguna constante C elegida apropiadamente, se cumple la relaci6n (hk) oh, b) 2S en una vecindad del punto (h, k) = (0, 0).Esto se indica por medio de la ecuaci6n simbélica g(h, k) = O(w(h, k)). De modo semejante, g(h hk) se anula en un orden superior a o(h, k),o bien, Hh, k) = of(a(h, . gh, R) AD) si Gk) Por ejemplo, el polinomio homogéneo ah? + bhk + ck? por lo menos es del mismo orden que p?, ya que 0 cuando p> 0. lah? + bhk + ck?| =| lal + Flb1 + lel) (A? + Re) También p = o(1/|logp|), ya que lim (p log p) =0 (Volumen I, p. 252). °o Ejercicios 1.3 1, La funcion 2 = (x — y)/(x +) es discontinua a lo largo de y Hacer un esquema de las curvas de nivel de su superficie para 2 1, £2. 2Como se ven las curvas de nivel paraz = -Em,y m grande? 2. Examinar la continuidad de la funcién z = (x? + y)—V/z* $y, donde 2=0para x= y= 0. Hacer un esquema de las curvas de nivel z = k (k = —4, —2, 0,2, 4). Presentar (en una grAfica) el comportamiento de z como una funcién de x Gnicamente, para y=—2, —1, 0, 1, 2. De modo 50 Introduccién al cAlculo y al andlisis matem4tico semejante, presentar el comportamiento de 2 como una funcion de y Gnicamente, para x=0, 1,2. Por dltimo, presentar el comporta- miento de Z como una funcién de inicamente, cuando 0 es constante (siendo ¢, © coordenadas polares). . Verificar que las funciones (a) f(x, y) = x8 — Bxy? (b) ae, y) = x4 — 6xty? + 94 son continuas en el origen, determinando el médulo de continuidad 3¢). ~ gEn qué orden se anula cada funci6n en el origen? . Demostrar que las funciones siguientes son continuas: (a) sen(? + y) (b) - _sen xy vx + x84 93 © 33 (a) x® log (x? + y*) donde, en cada caso, la funcién se define en (0, 0) como igual al limite de la expresion dada. Hallar un médulo de continuidad, 8 = &(e, x,y), para las funciones con- tinuas o (@) f(x, ») = VI + x? + 2? b) f(x,y) = V1 + eH, ¢Dénde es discontinua la funcién z = 1/(x® — y)? ¢Dénde es discontinua la funcién z = tan ny /cos x? ¢Para qué conjunto de valores (x, y) es continua la funciénz = 7y cos ? Demostrar que la funcién z= 1/(1 — x* — y®) es continua en el disco unitario x? + 9? <1, 10. Encontrar la condicién para que el polinomio Se ePue P= ax? + 2bxy + cy? tenga exactamente el mismo orden que p% en la vecindad de x = 0, y = 0 (es decir, que tanto P/o? como p*/P sean acotados). 11. Determinar si las funciones siguientes son continuas 0 no, y si no lo son, dénde son discontinuas: x 2% x +yt On (a) sen 1 2 Funciones de varias variables y sus derivadas 51 x+y? e+y @ . Demostrar que las funciones 2 f(x, = a(x, Y) = Byyox a + om 5 ticnden a 0 si (#, »)se aproxima al origen a lo largo de cualquier recta, pero que fy g son discontinuas en el origen. Determinar si las funciones siguientes tienen limite en x = y = Oy dar el limite cuando exista. @ oa (e) exp [= |x — yl Ile — Bay +99) a) yy P y cy + y’ 2 2 “ere © Ixl 2 2 © Bees @ |x @ -= ==! (ays 192! Vet ah — Day + y2 x+y + Lyle] . Hallar un médulo de continuidad 8(¢) para aquellas funciones del Ejer- cicio 13 que tengan limite en x = y=0, donde las funciones estan definidas en el origen por medio de sus valores limite. Demostrar que f(x, y, z) = (x? + y® — 2*)/(x® + y? + 2?) no es continua en (0, 0,0). . Probar que si P(x, 9)y Q(x, 9)son, cada uno, polinomios de grado n > 0 que se anulan en el origen. Re, N= ae eS no es continua en el origen. . Hallar los limites de las expresiones ‘siguientes conforme (x, y) tiende a (0, 0) en una forma arbitraria: sen (x? + 92) e+y (by 228 (x4 + y4) x + y2 e-Ma2+y2) © Ty @ . Demostrar que la funcién 2 = 3(x — y)/(x + y) puede tender hacia cual- quier limite conforme (%, y) tiende hacia (0, 0). Dar ejemplos de las variaciones de (x, y)tales que 52 Introduccién al cAlculo y al an4lisis matematico (a) lim z=2 z20 wo (b) lim z=-1 z20 yr (© lim z noexiste ze 7 19. Si f(x,y) +0 conforme (x,y) + (0,0) a lo largo de todas las rectas que pasan por el origen, f(x,y) —*0 conforme (x, y) — (0, 0) a lo largo de cualquier trayectoria? 20. Investigar el comportamiento de z= ylogx: en una vecindad del origen (0, 0). 21. Para z= f(x,y) = (x* — y)/2x, trazar las graficas de (a) z= f(x, x*) (b) z=f(z, 0) © z2=f(@,1) @) z=f(x, x) ¢Existe el limite de f(x, y)conforme(x, y) > (0, 0)? 22. Dar una interpretacion geométrica de la proposicién siguiente: $(h, k) se anula con el mismo orden que p = vA? + F. Problemas 1.3 . Considérese la funcion continua f extendida a la funcién f* definida de modo que f* =f en el dominio de fy f*(Q) = lim f(P) para todos los Pa puntos Q sobre la frontera de f donde el limite existe. Probar. que f* es continua. . Probar que lim f(%, ¥) cuando (x, ¥) — (, 1) existe y tiene el valor L si y slo si, para cada sucesién de puntos (xn, yn) en el dominio de f con limite (, 9) se tiene lim f(xn, yn) = L. ne 1.4 Las derivadas parciales de una funcién a. Definicién. Representacién geométrica Si en una funci6n de varias variables se asignan valores numericos definidos a todas excepto a una de las variables y s6lo se deja variar a esa variable, digamos x, la funci6n se transforma en una funcién de una sola variable. Considérese una funcién u = /(x, y) de las dos variables x y y y asignese a y un valor fijo definido y = yo = c. La Funciones de varias variables y sus derivadas 53 # & 3S y recon) y i Figura 1.18 y Figura 1.14 Seccciones de u = f(x,y). funcion resultante u = f(x, yo) de la sola variable x puede represen- tarse geométricamente cortando la superficie u = f(x, y) mediante el plano y = yo (ver las Figs. 1.13 y 1.14). La curva de intersecci6n asi formada en el plano se representa por la ecuacién u = f(x, yo). Si se deriva esta funcién en la manera usual, en el punto x = xo, supo- niendo que f esta definida en una vecindad de (xo, yo) y que la de- rivada existe} se obtiene la derivada parcial de f(x, y) con respecto a x en el punto (xo, Yo): m feo +h, AW ofl f(x0, Yo) ey Geométricamente, esta derivada parcial denota la tangente del angulo entre una paralela al eje x y la recta tangente a la curva u = f(x, yo). Por lo tanto, es la pendiente de la superficie u = f(x, y) en la direcci6n del eje x. Se usan varias notaciones diferentes para representar estas de- rivadas parciales, una de las cuales es la siguiente: lim ho Mest eae) = [ory TLC ACE ENED Si se desea hacer resaltar que la derivada parcial es el limite de un cociente de diferencias, se la denota por of a az ° axl INo trataremos de definir una derivada en los puntos frontera del dominio (excepto, en ocasiones, como limite de los valores de las derivadas parciales cuando se aproxi- ma el punto frontera por medio de puntos interiores). 54 Introduccién al calculo y al andlisis matemAtico Aqui se usa el simbolo especial d en lugar de la d ordinaria usada en la derivacién de funciones de una variable, con el fin de indicar que se trata con una funcién de varias variables y se esta derivando con respecto a una de ellas. Para algunos fines resulta conveniente usar el simbolo D de Cauchy (mencionado en la p. 158 del Volumen I) y escribir af of — De, pero nosotros rara vez usaremos este simbolo. Exactamente en la misma forma se define la derivada parcial de f(x, y) con respecto a y en el punto (xo, yo), por la relacion Yim Ao dot B= fn. 20) — f(xy, 9) = Dyflao, 0) Esto representa la pendiente de la curva de interseccién de la super- ficie u = f(x, y) con el plano x = xo perpendicular al eje x (Fig. 1.14). Pensemos ahora en el punto (Xo, yo), — considerado hasta ahora fijo— como variable y, en consecuencia, omitamos los subindices 0. En otras palabras, pensemos que se lleva a cabo la derivacién en cual- quier punto (x, y) de la region de definicion de f(x, y). Entonces las dos derivadas son ellas mismas funciones de x y y, urls, 9) = fale, 9) = FED yaya, 9) = lx, 9) = LED wn Por ejemplo, la funcién u = x* + y® tiene las derivadas parciales Uz = 2x (en la derivaci6n con respecto a x, el término y? se considera como una constante y, en consecuencia, tiene la derivada 0) y uy = %y. Las derivadas parciales de u = x*y son uz = 3x*y y Uy = x*. De modo semejante, para una funcién de cualquier nimero n de variables independientes, las derivadas parciales se definen por aflseas x2,» « «5 Xn) _ yp fa + hy x2,» «5 en) — fly ey « «end x1 ss) h = fay(a, x2, . Xn) = Dayflxi, x2, . . . , Xn); suponiendo que el limite existe. Funciones de varias variables y sus derivadas 55 Por supuesto, también pueden formarse derivadas parciales su- periores de f(x, y), derivando una vez mas las derivadas parciales de “primer orden”, fz(x, y) y fy(x, y), con respecto a una de las variables y repitiendo este proceso. El orden en el que se realizan las derivaciones se indica por el orden de los subindices o por el orden de los simbolos dx y dy en el “denominador” de derecha a izquierda* y se usan los simbolos siguientes para las segundas derivadas: a (af) _ OF 6 _ yyy sll- and = fee = Of, Sl) = EL = fev = Dede, ale)= eee fuz = DyDif, 2 (f) = 2 = fy = Dor. De la misma manera, las terceras derivadas parciales se denotan por att) azlaxe] = ax8 GPF) Of _ Sylaxe) = ay dat = fem 8 | ef )= OF Balirdy) = Sat dy = y asi sucesivamente y, en general, las n-ésimas derivadas por alone) ~ Sun = am yim) ay axe oe y asi sucesivamente. Las diferentes notaciones para las derivadas parciales tienen sus respectivas ventajas. Escribiendo df(x, y)/@x, o bien, Dzf(x, y) para la derivada parcial de la funcién f(x, y) con respecto a su primer ar- gumento se hace resaltar que la derivacién tiene el caracter de un ¥Esto es consistente con la notacién generat para los productos simbélicos de operadores (ver el Volumen I, p. 55). En realidad, en la mayorfa de los casos de in- terés no importa el orden en el que se levan a cabo las derivaciones (ver la p. 62). 56 Introduccién al cAlculo y al an4lisis matematico operador Dz o d/0x que actda sobre la funcién, escrito simbélica- mente como un factor que multiplica a la funcién. La notacién para las derivadas superiores es consistente con esta idea de un producto: (8 -)_ _# aybe!)= aa Una desventaja de la notacién de operador es su incomodidad cuan- do se va a indicar para qué valores de las variables independientes se toman las derivadas. Por ejemplo, si f(x, y) = x2 + Qxy + 4y?, en- tonces su derivada respecto a x en el punto x = 1, y = 2 puede es- cribirse como f = DyDuf. ( af(x, 2) fa Fell, 2) = (2x + 2y) jan No debe escribirse simplemente como afd, 2) ya que /(1, 2) tiene el valor constante 21 y, de aqui, que tiene a 0 como su derivada respecto a x. Tal como en el caso de una variable independiente, el tener derivadas es una propiedad especial de una funcién, incluso no gozada por todas las funciones continuas.* Con todo, esta propiedad es poseida por todas las funciones de importancia practica, excepto tal vez en puntos excepcionales aislados 0 curvas. Ejercicios 1.4a 1, Encontrar dz/0x, d2/y para cada una de las funciones siguientes: (a) z= ax" + by™, a,b, m,n constantes (h) z = 37'¥ (b) z = 2xev* + By @ z=log («+3) = 0% 43% er (z= 25 43% G) z= cos (x? +9) (@) z=are tan 4 (ks) 2 = tan (xy + e*) () z= x42 @z= *Véase las pp. 69 y 70 respecto a una explicaci6n del término “diferenciable”, el cual implica mas que la existencia de las derivadas parciales con respecto ax y ay. ry ad * oe ~ Funciones de varias variables y sus derivadas 57 (@) z= 9" (m) z = xeY + ye* (g) 2 = xin yo (n) 2 = xv . Hallar las primeras derivadas parciales de las siguientes funciones: (@) ¥x2 +92 @ ——. vitxtyte (b) sen (x? — y) (©) y sen vz (c) ev (@) log VI+ x? +52 Encontrar todas las primeras y segundas derivadas parciales de las si- guientes funciones: (a) xy (b) log xy (©) tan (are tan x + arc tan y) @) x” © ec . Sea w= f(x,y, 2) = (cos x/sen y)e%, Hallarfs, fy, fe para x=, y= n/2, 2 = log 3. . Para f(x, y) = y cosh x + xsenh yhallar f,? + fy2, en x = 0, = 0. Demostrar que las funciones u =e? cos y, v =e sen y, satisfacen las condiciones uz = Uy, Uy = —vz. . Demostrar que las funciones del Ejercicio 6 satisfacen la ecuacién di- ferencial parcial fez + fuy = 0. Hagase lo mismo para las funciones (a) log vx? + y2® y (b) arc tan® c) y © ate (d) 3x%y — y% (e-) Vx-+ Vx2 + 92 . Parar = vx2 + y® + 2% hallar rez + ryy + ree. Hallar una constante @ para la cual, si z = y® + ayx®, entonces zzz + zy = . Probar que la funcion C1, XE). Xe Eas EIT KS (ex? xa? Foe Fonte satisface la ecuacion aya, + feat to 0 + fone, = 0. 58 Introduccién al calculo y al andlisis matematico Problemas 1.4a 1, @Cuantas n-ésimas derivadas tiene una funcién de tres variables? ede hk variables? . Dar un ejemplo de una funcién f(x, y) para la cual fr exista y fy no. . Hallar una funcién f(x, y) que sea una funcién de (x? + y) y que tam- bién sea un producto de-la forma (x) $(y); esto es, resolver la ecuacién F(x, ¥) = $(2* + y) = Y@)Uy) para las funciones desconocidas. 4. Probar que cualquier funcion de la forma wpe t+ 1) r) vds, 9,2) =D 4 =D (donde r? = x? + y? + 22), satisface la ecuacion Ure + Uyy + Uez = Ute. b. Ejemplos - En la practica, la derivacién parcial s6lo incluye conceptos que el estudiante ya domina. Porque, de acuerdo con la definicién, todas las variables independientes se mantienen constantes, excepto aquélla con respecto a la cual se esta derivando. Por lo tanto, simplemente tienen que considerarse las otras variables como constantes y Ilevar a cabo la derivacién de acuerdo con las reglas mediante las cuales se derivan las funciones de una sola variable independiente. A conti- nuacién se dan algunas derivadas parciales de varias funciones sen- cillas. 1. Funcién: f(x, ») = xy Primeras derivadas: Segundas derivaaas: fex=0, fev=fue=1, fw = 0 2. Funcién: Funciones de varias variables y sus derivadas 59 fx, y) = vx? + ye? Primeras derivadas: y Vx + y' f= [De donde, para el radiovector r = Vx% + y@ desde el origen hasta el punto (x,y), las derivadas parciales con respecto ax y ay estan dadas por cosg = a/r, y sen ¢ = y/r, donde ¢ es el angulo que el radiovector forma con la direccién positiva del eje x.] Segundas derivadas: -—_* sen? g fe = Tayi __ sen § cos $ yep ro 3. Reciproco del radiovector en tres dimensiones: __ 1 1 10.9.2) = Faas =} Primeras derivadas: Zz, fe - Segundas derivadas: 1 | 3x2 1, ay? 1, Be fez=—iat te fw=- ts fe=— ate 60 Introduccién al calculo y al an4lisis matem4tico 3x3 3yz 32x fou = fee = "2, fue = fev =, fer = fa = ‘4 . 1 . De ésto se ve que para la funcién f =—-—-——— , la ecuaci6én f ve + yt zt 24 yt 4 28 fen + fur + fr =—9, + EAE TZ) _ 9 se cumple para todos los valores de x, y, z excepto 0, 0, 0; se dice que la funcién f(x, y, 2) = 1/r satisface la ecuacién diferencial parcial (“‘ecuacién de Laplace”) fax + fuv + fer = 0. 4, Funcién: f(x,y») = Feo Primeras derivadas: fe = ~FED o-e-as*iay, 2ysl -1 f= ayaa + Segundas derivadas: )4) xa)? + Sar? (2-a)*/4y, Por lo tanto, se satisface la ecuacién diferencial parcial fre — fy = 0 idénticamente en x y y. Funciones de varias variables y sus derivadas 61 c. La continuidad-y la existencia de las derivadas parciales Para una funcién de una sola variable, la existencia de la deri- vada en un punto implica la continuidad de la funci6n en ese punto (ver Volumen I, p.166). En contraste con ésto, la posesién de las derivadas parciales no implica la continuidad de una funcién de dos variables: por ejemplo, la funcién u(x, y) = 2xy/(x® + y), con u(0, 0) = 0, tiene derivadas parciales en todo punto y, empero, ya se ha vis- to (p. 48) que es discontinua en el origen. Geométricamente hablan- do, la existencia de las derivadas parciales restringe el comporta- miento de la funci6n en las direcciones de los ejes x y y Gnicamente, y no en las otras direcciones. Sin embargo, la posesién de derivadas parciales acotadas implica la continuidad, como se afirma en el teorema siguiente: St una funcion f(x,y) tiene derivadas parciales f, y fy en todo punto en un conjunto abierto R y estas derivadas satisfacen en todo punto las desigualdades Ife, f(x, , z) que la existencia y la condicién de ser acotadas de las primeras derivadas parciales son suficientes para la continuidad de f. 1. Demostrar que las siguientes funciones f(x, y) son continuas: @) fea [PP HIF O () fle, ») = ha + y4) log (x? + y*), A 2 ye 0. d. Cambio del orden de la derivacién En todos los ejemplos de derivacién parcial dados en las pp. 58-60, se encuentra que fyz = fry; En otras palabras, no existe diferencia si se deriva primero con respecto a x y luego con respecto a y, 0 si se deriva primero con respecto a y y después con respecto a x. En ge- neral, ésto es cierto bajo las condiciones del teorema siguiente: Si las derivadas parciales “mixtas” fry * fy, de una funci6n f(x, y) I dominio de f es un rectingulo con lados paralelos a los ejes, se cumple la desigualdad para dos puntos cualesquiera (x,y) y (x +h, +) en el dominio. Entonces se concluye que fes incluso continua segin Lipschitz (ver la p. 44). Funciones de varias variables y sus derivadas 63 son continuas en un conjunto abierto R, entonces se cumple la ecuacién (10) fos = fey en todo R; es decir, no importa el orden la derivaci6n con respecto a xyay. La demostracién, como la de la subsecci6n anterior, se basa en el teorema del valor medio del cAlculo diferencial. Considérense los cuatro puntos (x, y), (x + h, y), (x, y+ k), y (x + A, ¥ + k), donde h#0yk#0. Si(x,y)es un punto del conjunto abierto R y si h y k son lo suficientemente pequejfios, estos cuatro puntos pertenecen a R. Formese ahora la expresin a) A=f(xt+hy +k) —f(x+h,y)— fx, y + k) + fe, 9). Introduciendo la funcién (x) = fix, y + k) — fx, y) de la variable x y considerando la variable y simplemente como un “parametro”, A toma la forma A = g(x + h) — o(x). Aplicando el teorema del valor medio del cAlculo diferencial resulta A = hd'(x + 8h), donde @ se encuentra entre 0 y 1. No obstante, a partir de la defi- nicién de ¢(x),se tiene 8 (x) = fala, y + k) — falx, »), y como se ha supuesto que la segunda derivada parcial “mixta” fy existe, nuevamente puede aplicarse el teorema del valor medio y en- contrar que (12) A = hhfyx + Oh, y + O'R), donde 6 y 6’ denotan dos nameros no especificados entre 0 y 1. Exactamente de la misma manera se puede introducir la funcién VO) = fe +h, ) — 1,9) y expresar 4 como A=wy + k)— vo). 64 — Introduccién al cAlculo y al anAlisis matematico Asi se llega a la ecuaci6n A = hhfry(x + Oh, y + 01’), donde 0 < @:<1 y 0 < 61’ <1, y si se igualan las dos expresiones para A se obtiene la ecuacién fuxlx + Oh, y + OR) = fey(x + Oh, y + O1'R). Si aqui se hace que A y & tiendan simultaneamente a 0 y se recuer- da que las derivadas fzs(x, y) y fyz(x, y) son continuas en el punto (x, y), inmediatamente se obtiene fac, Y) = fala, ”), lo que debia demostrarse.* El teorema sobre la reversibilidad del orden de la derivaci6n (es decir, sobre la conmutatividad de los operadores de derivacién Dz y Dy) tiene consecuencias de largo alcance. En particular, se ve que el ¥Para Investigaciones més refinadas, a menudo resulta Gtil saber que el teorema sobre la reversibilidad del orden de la derivacién puede probarse con hipotesis mas Aébiles, En efecto, basta con suponer que, ademés de las primeras derivadas par- ciales fz y fy, solo existe una derivada parcial mixta, digamos fy:, y que esta de- rivada es continua en el punto en cuestién. Para probarlo, regrésese a la ecuacién (11), dividase entre hk y, a continuacién, hagase que k sola tienda hacia 0. Entonces el segundo miembro tiene un limite y, en consecuencia, el primer miembro también tiene un limite y they) = fol») Ademis, arriba se probé, con la Gnica hipotesis de que fyz existe, que A ; Ax fule+ Oh, y + 0%. En virtud de la continuidad supuesta de fyz, se encuentra que para ¢ > 0 arbitrario y para todos los valores de A y k suficientemente pequefios, fil, 9) — © < foal + Oh, 9 + OF) = (use + unns+ + + +)dx + (usbytunny+ + + +)dy = uz dx + uy dy. Esta ecuacién muestra que se obtiene la parte lineal del incremento de la funcién compuesta u = f(é, 0,.-.) = F(x, 9), escribiendo primero esta parte lineal como si &,n,. . . fueran las variables in- 84 Introduccién al calculo y al anAlisis matematico dependientes y, a continuacién, remplazando dé, dn,... por las partes lineales de los incrementos de las funciones § = ¢(x, y), 1 = v(x, 9), . .. Este hecho manifiesta la conveniencia y la flexibilidad de la notacién diferencial. Con el fin de probar la proposicién (18), simplemente se tiene que aplicar la hipétesis de que las funciones de referencia son diferen- ciables. A partir de ésto se concluye que correspondiendo a los in- crementos Ax y Ay de las variables independientes x y y, las can- tidades &, n, . . . cambian en las cantidades (20a) AE = be Ax + Ey Ay + erv(Ax)® + (Ay)? (20b) An = nz Ax + ny Ay + e2v(Ax)? + (Ay) - - - donde los nameros £1, &2,.. . tienden hacia 0 cuando Ax >0 y Ay > 0 0 cuando V(Ax)? + Gy) 0. Las derivadas ¢z, $y, Wz, Wy se to- man para los argumentos x, y. Es mas, si las cantidades &, 1, . . . sufren los cambios Ag, An, .. ., la funcién uw = f(é,0,.. .) cam- bia en la cantidad Ql) Aw= feb + fodn be + + 8V(RQEE Ene R ee donde la cantidad 6 tiende hacia 0 cuando AE +0 y An 0, y fe fn tienen los argumentos & 1. Usando aqui por Ag, An, .. . las can- tidades dadas por las formulas (20a, b) que corresponden a los in- crementos Ax y Ay en x y y, se encuentra una ecua¢ién de la forma (22) Au = (feb + fr + + + +) Ax + (feby + fry ++ + +) Ay + ev(Axy? + (Ay) Aqui, para Ax = pcos a, Ay =p sena, p = V(Ax) + Gy), la can- tidad ¢ esta dada por & = eife + xf, + 3V(z cos a + gy sen a + €1)" + (Wz COS @ + Wysen a + 62)? Fee + Cuando p> 0, las cantidades Ax, Ay, e1, €2 tienden hacia 0, y de aqui que lo mismo sucede con Ag, An, y 8. Por otra parte, fe, fn, . . « » $2 $v) Wz, Wy,» . permanecen fijas. Como consecuencia, lim ¢ = 0. P+0 Funciones de varias variables y sus derivadas 85 De (22) se concluye que wu, considerada como una funcién de las variables independientes x, y, es diferenciable en el punto (x, y) y que du esta dada por la ecuacién (20). A partir de esta expresién para du se encuentra que las derivadas parciales uz, uy tienen las ex- presiones (19) 0 (18). Es evidente que este resultado es independiente del nimero de variables independientes x, y, . . .. Sigue siendo valido, por ejemplo, si las cantidades &, 1, . . . sélo dependen de una variable indepen- diente x, de modo que u es una funcién compuesta de la variable x anicamente. Para calcular las derivadas parciales superiores s6lo es necesario derivar los segundos miembros de las ecuaciones (19) con respecto a x yy, tratanto a fe, fa, . . . como funciones compuestas. Restringién- donos, por simplicidad, al caso de tres funciones &, n, y 6, se obtiene* (23a) Ur = feebe® + fanz? + fecbe® + 2fenEmnz + WAnenabe + 2febale + fiber + fatter + febex, (23b) ury = fesbreby + famany + fecbeby + fen(Exny + Eynz) + fa(maeby + nube) + feclEcky + bub2) + febry + finay + febev, (23c) Uy = fesby® + fanny® + feeby® + 2fenbyny + 2fretacy + 2fecbuby + febvy + fanuy + febv. Ejercicios 1.6a 1, Encontrar todas las derivadas parciales de primero y segundo orden con respecto ax y y para las funciones siguientes: (a) z =u log v, donde u = x*, v= 7 l+y (b) z =e, donde u = ax, v = cos y (©) 2=ware tan v, donde w= y= aly ty —x @ z2=8 (+ 9%, ev) (©) z= tan (x arc tan y). qui se supone que f es una funcién de &, n de clase C? y que & n, ¢ son fun- ciones de x, y, de clase C2, Se concluye que la funcién compuesta u de x y y, a su vez, es de clase C®. 86 Introduccién al calculo y al andlisis matematico we Calcular las derivadas parciales de primer orden para 1 (9) © = TErESFF bay cons) x (©) w= are sen F553 (©) w= x? +y log (i +22 +92 + 2%) (@) w= arc tan V@ y=) & Calcular las derivadas de (a) z=x, @ 2=(Q)")". . Probar que si f(x, y) satisface la ecuacién de Laplace af | oF 9x2 T Jy? - también la satisface $(x, y) =f x y e+ Ey’ o . Probar que las funciones (a) f(x, y) = log Vx? $52, 1 () g@, 9,2) = vx? $y? + 22” ©) h(x, y, 2, w) = Pryte pw satisfacen las respectivas ecuaciones de Laplace, (@) fez + fuy = 0, (b) gaz + Byy + 82 =0, {©) hax + Ayy + hee + Aww = 0. Problemas 1.6a . Probar que si f(x, y) satisface la ecuacién de Laplace eciannets ax? dy? y siu(x, ») y v(x, y) satisfacen las ecuaciones de Cauchy-Riemann, du_ %, du__av Ox ~ Dy’ Dy = Hx entonces la funcién (x, ») = f(u(x, y), v(x, y) ) también es una solucion de la ecuacién de Laplace. Probar que siz = f(x, y) es la ecuacién de un cono, entonces nr Funciones de varias variables y sus derivadas 87 fesfuy — fey? =0 3. Sea f(x, y, 2)=g(r), donde r= Vx2 +9? FR (a) Caleular fez + fuv + fee. (b) Probar que si fe + fur + fez = 0, entonces f (x, », 2)= 4 + 6, don- de ay 6 son constantes. 4. Sea f(xi, x2,. . . , Xn) = g(r), donde rave pape ee bat (a) Calcular feyz, + feaze + * * + + fenen (comparar con 1.4a, Ejercicio 10). (b) Resolver f2y21 + fesze + * + * +fentn = 0. b. Ejemplos' 1. Consideremos la funcién u = exp (x? sen*y + 2xy sen x sen y + y*). Haciendo u=ent, E= x2 sen%y, n= Qxy senxseny, C= yx se obtiene bz =2xsen’y, z= 2ysenxseny+2xycosxseny, Cz = Ey = 2x* sen y cos y, Ny = 2x sen x seny + 2xy sen x cosy, ly = 2y; ug = Un = uy = ent, De aqui que Uz = 2 exp (x*sen2y + Qxy sen x sen y + y?) (x sen2y + y sen X seny + xy cos x sen y) Uy = 2 exp (x? sen®y + Qxy sen x sen y + y?) (x? sen y cosy + x sen x sen y + xy senx cosy + y). 2. Para la funcion u = sen (x? + 92) 'Se observa que las derivaciones siguientes también pueden llevarse a cabo direc- tamente, sen aplicar la regla de la cadena para funciones de varias variables. 88 Introduccién al cAlculo y al an4lisis matematico se pone = x? + y® y se obtiene Uz = 2x cos (x? + 2), Uy = 2y cos (x? + y?) Urz = — 4x2 sen(x? + y2) + 2 cos (x? + y%), Ury =— 4xy sen(x? + y?) Uyy = — 4y? sen (x? + y2) + 2 cos (x? + y?). %, Para la funcién u = arc tan (x* + xy + y%), la sustituci6n € = x®, n = xy, ® conduce a cy; us = —— 22 ty T+ (+ ay + yy)?” wy = —— 2 +» 1+ (8 + xy + yh?" c. Cambio de las variables independientes La aplicaci6n de la regla de la cadena (19) a un cambio de las variables independientes es particularmente importante. Por ejem- plo, sea u =f(E, n) una funcién de las dos variables independientes & n, las cuales se interpretan como coordenadas rectangulares en el plano §,n. Pueden introducirse nuevas coordenadas rectangulares x, y en ese plano (ver el Volumen I, p. 361) relacionadas con §, 9 por medio de las férmulas (24a) S=axt By, 1 = ae + Boy o bien, (24b) z=m&+am, y= Bib + Ben Aqui, a1 =cosy, G2=—seny, Bi=seny, fe=cosy, donde y denota el Angulo que el eje positive & forma con el eje po- sitivo x. Entonces la funcién u = f(E, n) se “transforma” en una nueva funcién Funciones de varias variables y sus derivadas 89 u = f(E, n) = flax + Bry, aax + Boy) = F(x,y), la cual se forma a partir de f(é, 0) mediante un proceso de com- posicién como el que se describe en la p. 81. Se dice que la variable dependiente wu esta “referida a las nuevas variables independientes x y y, en lugar de & y 1.” Las reglas de derivacién (19) de la p. 88 inmediatamente propor- cionan (25) Ur = Usd +Und2, — Uy = Ue + UnBe, donde wz, wy denotan las derivadas parciales de la funcion F(x, y), y us, un , las derivadas parciales de la funcién f(E, n). Asi, las deri- vadas parciales de cualquier funcién se transforman de acuerdo con la misma regla (24b) que las variables independientes, cuando se giran los ejes coordenados. Esto es cierto también para la rotacién de los ejes en el espacio. ! Otro cambio importante de las variables independientes es el de las coordenadas rectangulares (x, y) en las coordenadas polares (r, 9). Las coordenadas polares estén relacionadas con las coordenadas rec- tangulares por las ecuaciones (26a) =rcos 0, y=rsend - 2p ye Z = (26b) r= Ve +r, 8 = arc cos Very eee ee +e Refiriendo una funcién u = f(x, y) a coordenadas polares, se tiene u = f(x, y) = f(r cos 8, r sen 0) = F(r, 8), y u aparece como una funcién compuesta de las variables indepen- dientes r y 0. De aqui que, por la regla de la cadena (19), se obtiene sen 0 a x Uz = Urrx + Ue = Ur 7 uy 2 = ur cos 0 — uo en ' x cos Uy = Urry + Ueby = Ur + wo Zr = ursenO + uo Esto proporciona la ecuaci6én TPero, en general, no para otros tipos de transformacién de coordenadas 90 —Introduccién al cAlculo y anAlisis matemAtico (28) ve? + yt = ut + 1 ut, Por las reglas (23a, b, c), las derivadas superiores estan dadas por sen? 0 cos § sen 0 Urx = Urr COS*O + U9 ap — Ditty OS KSB r r sen? 0 cos @ sen @ + Up —— + 2u0 re , cos @sen 0 cos? 0 cr es a r' Ury = Uzy = Urr cos @ sin 0 — uo sen? @ — cos? 6 tug cos 0sen 0 28 . cos Uyy = Ury Sin? 0 + woo 72 + 2ure cos? 0 cos 0 sen 6 Uy ——— — 2ue . r re Esto conduce a la expresién en coordenadas polares del llamado laplaciano Au, el cual aparece en la ecuacién “de Laplace” o “del potencial” Au = 0 (ver la p. 60). 1 (29) Au = ure + Uyy = Ure + woo + Ur = lrael ae) + ao Inversamente, se puede aplicar la regla de la cadena para expresar Ur y Wo en términos de uz y Uy. De esta manera se encuentra (30a) Ur = UrXy + Uyr = Ur cos 0 + Uy send, (80b) Up = Unit + Uy = —Uar senO + uyr cos 0. También pueden deducirse estas ecuaciones resolviendo las relaciones (27) para uy y ue. Incidentalmente, ya se ha encontrado la ecuacién (30a) como la expresién para la derivada de u en la direccién del radiovector ren la p. 72. En general, siempre que se dan las relaciones que definen una fun- cién compuesta, u=fGn---)s E=dx,y), n= Wlx,9),-.- Funciones de varias variables y sus derivadas 91 pueden considerarse éstas como si refirieran u a las nuevas variables independientes x,y en lugar de 6, n,. . . . Conjuntos correspon- dientes de valores x, y y &1,... de las variables independientes asignan el mismo valor a u, ya sea que se considere como una funcién f@,n...)de&n,. . «0 bien, como una funcién F(x, y) = f(x, 9), w(x, y),...) dex, y. En las derivaciones de una funcién compuesta u = f(6, 0, - - - ), se debe distinguir claramente entre la variable dependiente u y la funcion /(G, 0, . . - ), la cual asigna valores de u a valores de las variables independientes &, n, . . . . Los simbolos de derivacién us, Un, - - -no tienen significado hasta que se especifica la relacién fun- cional entre w y las variables independientes. Por lo tanto, cuando se trata con funciones compuestas u = f(6, n,...) = F(x, y), en realidad no se debe escribir uz, un, 0 bien, uz, uy sino f(é, n), fa(E, 0) o bien, F:(x, y), F,(x, y), respectivamente. Empero, por brevedad, a menudo se usan los simbolos mas sencillos uz, un, Uz, Uy, cuando no existe riesgo de confusién. Entonces la regla de la cadena se escribe en la forma (31) Ur = Ueber + Unt2, Uy = Uaby + Unty, lo cual hace innecesario dar los “nombres” f o F para la relacién funcional entre u y €, 7 ox, y. El ejemplo que sigue ilustra el hecho de que la derivada de una cantidad u con respecto a una variable dada depende de la natu- raleza de la relacién funcional entre u y todas las variables indepen- dientes; en particular, depende de cu4l de las variables independien- tes se mantenga fija durante la derivacién. Con la “transformacién identidad” § = x, 1 =y, La funcién u = 2 +7 se transforma en u=2x+y, y se tiene uz = 2, wy = 1. Si, no obstante, se introducen las nuevas variables independientes § = x (como antes) y § + 1 = v, se encuentra que u = x + v, de modo que uz = 1, u» = 1. Por tan- to, la derivacién con respecto a la misma variable independiente x da resultados diferentes para diferentes elecciones de la otra variable. Ejercicios 1.6 1. Sea u = f(x, y), donde x = r cos ®, y =r sen 0, ExpresarVus® + uj? en términos de ur y uo. 2. Probar que la expresién fzz + fw es invariante bajo la rotacién del sis- tema coordenado. 92 Introduccién al calculo y al an4lisis matem4tico 2 . Demostrar que bajo los cambios lineales de variables x = a& + Bn, y = 16 + 8 las derivadas frx(x, y), fev(x, ¥), fuv(x, y) se transforman de la misma manera que los coeficientes a, 6, c, respectivamente, del polinomio. ax? + 2bxy + cy® 4, . Dado z =r? cos ®, donde r y 0 son coordenadas polares, hallar zz y 2y enel punto 0 = 7/4,r = 2. Expresar 2r y 20 en términos de 2: y 2y. Por medio de la transformacién & =a + ax + By, 1 = b— Bx + ay, en la que a, b, a, B son constantes y a? + 6? = 1, la funcion u(x, y) se trans- forma en una funcion UG, 9) de& y ». Probar que UsgUnn — Usa? = use uy — Uay? a . Mostrar cémo se transforma la expresion Ty — Trz bajo la intro- duccion de una variable z = x/y en lugar de y. - (a) Probar que la funcion A, =f (x —y) + Ble +9) para cualesquiera funciones f, 8, dos veces continuamente diferenciables, satisface la condicién haz = hy. (b) De modo semejante, demostrar que H(x, y) = f(x — iy) + a(@ + iy), con i? = —1, satisface la condicion Hzz = —Hyy. Problemas 1.6c . Transformar el laplaciano uss + Uvy + Use a las coordenadas polares tridimensionales 7, 8, ¢ definidas por x =rsen0 cos ¢ y =rsen@ seng z=rcos 6, Comparar con 1.6a, Problema 3. Hallar los valores a, 6, ¢, d tales que bajo la transformaciéné = ax + by, = cx + dy, donde ad — be # 0, laecuacion Afss + 2Bfev + Cf = 0 quede I (a) fee + fan = 0 (b) fen =0 (A,B, C, constantes) cEn ésto siempre posible? Funciones de varias variables y sus derivadas 93 1.7 El teorema del valor medio y el teorema de Taylor para funciones de varias variables a. Observaciones preliminares acerca de la aproximacién mediante polinomios Ya se ha visto en el Volumen I (Capitulo V, p. 451) cémo puede aproximarse una funci6én de una sola variable en la vecindad de un punto dado con una exactitud mayor que el n-ésimo orden, por medio de un polinomio de grado n, el polinomio de Taylor, siempre que la funcién posea derivadas hasta el (nm + 1) —ésimo orden. La aproximaci6n por medio de la parte lineal de la funcién, como la da la diferencial, s6lo es el primer paso hacia esta aproximacién mas exacta. En el caso de funciones de varias variables, por ejemplo, de dos variables independientes, también puede buscarse una represen- tacién aproximada en la vecindad de un punto dado, por medio de un polinomio de grado n. En otras palabras, se desea aproximar. f(x +h, y + k) por medio de un “desarrollo de Taylor” en términos de los incrementos h y k. Mediante un artificio sencillo, este problema puede reducirse a un problema para funciones de una sola variable. En lugar de-consi- derar precisamente f(x + h, y+), se introduce una variable adicional t y se considera la expresién (31) F(t) = f(x + ht, y + kt) como una funcién de ¢, manteniendo fijas x, y, h, y k por el momen- to. Conforme varia ¢ entre 0 y 1, el punto con coordenadas (x + At, y + kt) recorre el segmento rectilineo que une (x, y) y (x + h, y+ k). El desarrollo de Taylor de F(t) de acuerdo con potencias de t proporcionar4, para t= 1, una aproximacién para f(x + h, y + &) del tipo deseado. Empecemos por calcular las derivadas de F(é). Si se supone que todas las derivadas de la funcién f(x, y) que se van a escribir son continuas en una regién que contiene por completo al segmento rec- tilineo, la regla de la cadena (18) inmediatamente da ! TPor la regla de la cadena, se tiene FO= ite + ht, y + kt) = hfe, n) + kn, n) 94 Introduccién al calculo y al andlisis matematico (32a) FO) = hfs + Fy (82b) F(t) = Whar + 2hkfzy + fy, y, en general, por induccién matematica se encuentra que la n-ésima derivada esté dada por la expresién (82c)— FOW(t) = fy + (?) AO Hfanty + (5) AP? Yen ny2 $e +Rfyn, la cual, como en la p. 78 puede escribirse simbélicamente en la for- ma a aye Fon =(rZ +k al f. En esta formula, la potencia simbélica de la derecha debe desarrollarse por el teorema del binomio y, a continuacién, las potencias de 4/ax, ajay multiplicadas por f deben remplazarse por las n-ésimas deri vadas correspondientes a%f/ax", aufjax"-dy,.... En todas estas derivadas deben escribirse los argumentos x + ht y y + kt, en lugar de x y y. Ejercicios 1.7a . Para F(t) = f(x + ht, y + kt), hallar F’(1) para: (a) f@, ») = sen(x + ») = ) f@ N= y (c). f(x, y) = x? + 2xy? — y4 we . Encontrar la pendiente de la curva z(t) = F(t) = f(x + ht, y + kf) ent = 1, parax=Qy=Lh=bk=tLy donde &= x + ht, n=y + kt. Aqui se escribefa(x + ht, y + kt) en lugar de fe(x + ht, y + kt) ya que (nuevamente por la regla de la cadena). 2 fle + ht, y + kt) = fel + ht, y + ht) si se consideran x, y, h, k, como variables independientes. Funciones de varias variables y sus derivadas 95 (a) f(x, y) = x? +»? (b) f(x, y) = exp [x? + (y —1)4] (c) F(x, y) = cos = (y — 1) sen rx? b. El teorema del valor medio Antes de estudiar las aproximaciones de orden superior por medio de polinomios, deduciremos un teorema del valor medio analogo al ya conocido para las funciones de una variable. Este teorema rela- ciona la diferencia f(x + h, y + 8) — f(x, y) con las derivadas par- ciales fc y fy. Expresamente se supone que estas derivadas son con- tinuas. Aplicando el teorema del valor medio ordinario a la funcién F(t) , se obtiene F() — FO) _ jp 7 = Fs), donde 6 es un nimero entre 0 y 1; usando (31) x (32a) se deduce que fe. thy +k) fey) = hfx-+ Oht, y+ Okt) + kfy(x + Oht, y + Okt). Haciendo t = 1, se obtiene el teorema del valor medio para funciones de dos variables en la forma (33) Ka +h, y +b) — fe, ») = hfdx + Oh, y + OR) + kfy(x + Oh, y + Oh) = hflé, 0) + Fflé, n)- Por tanto, la diferencia entre los valores de la funci6n en los puntos (x+h,y +k) y (x,y) es igual a la diferencial en un punto inter- medio (é, n) sobre el segmento rectilineo que une los dos puntos. Vale la pena hacer notar que se tiene el mzsmo valor de @ tanto en fr como en fy. Tal como para las funciones de una sola variable (Volumen I, p. 178 puede usarse el teorema del valor medio para obtener un médulo de continuidad para una funcién f(x, y) y, mAs precisa- mente, para demostrar que una funcién f como la anterior es con- tinua segin Lipschitz. Con el fin de aplicar el teorema del valor medio, debemos poder unir dos puntos por medio de un segmento rectilineo, a lo largo del cual f esté definida. Sup6ngase entonces que 96 Introduccién al cAlculo y al andlisis matematico el dominio R de f(x, y) es convexo, es decir, que el segmento rec- tilineo que une a dos puntos cualesquiera de R se encuentra com- pletamente en R. Sea f continuamente diferenciable en R y sea M una cota para el valor absoluto de las derivadas de f: Ifelx, 0 y k0, se tiene Rn = 0{V2 + By). A partir del teorema de Taylor para funciones de una variable, el paso (noo) a la serie infinita de Taylor nos conduce a los desarrollos de muchas funciones en series de potencias. Con las funciones de varias variables, tal proceso, incluso cuando es posible, en general es demasiado complicado. Para nosotros, la importancia del teorema de Taylor descansa mas bien en el echo de que el incremento f(x + h, y + k) — f(x,y) de una funcién se descompone en incrementos df, df... de 6rdenes diferentes. o 2 ro Funciones de varias variables y sus derivadas 99 Ejercicios 1.7 Hallar el polinomio de segundo grado que proporciona la mejor apro ximacion de sen x sen y en la vecindad del origen. . Para f(x, y) = x8 + 4y?x, dar una aproximaci6n del valor def (2.1, 2.9). . Para f(x, y) = x/y + y/x, estimar el error al aproximar el valor de f(.9, .9) por f(1, 1). . Desarrollar la funci6n f(x + h, y + k) en potencias de h, k, para (@) F(x, y) = x8 — 2x*y + y? (b) f(x, y) = cos (x + 2y)en x = By=5 (©) Fle, y) = xty + 2y*x — V3x2, . Desarrollar f(x, y, z) = xyz? en potencias de x, y — 1,2 +1. . Obtener los primeros términos de los desarrollos de Taylor de las fun. ciones siguientes en une vecindad del origen (0,0): (a) z= arc tan wep (f) z= log (1 — x) log GQ — ») (b) z= cosh x senh y (@) z=er-vt (c) z= cos x cosh (x + y) (h) z= cos (x + y) e-#? (d) z=e* cosy (i) z= cos (x cos y) fe) z= ccs G) z=sen (x? +») . Estimar el error al remplazar cos x/cos y pot 1 ® — Ge — y2) E 1—5@?—y*) para Ix|, lyl<@- Problemas 1.7 . Hallar la serie de Taylor para las funciones que siguen e indicar su region de validez 1 @) 7 x—9 (b) eztv, . Demostrar que la ley de los cosenos en trigonometria esférica, cos z = cos x cos y +sen xsen y cos 8, se reduce a la ley euclidiana de los cosenos, 2? = x? + y? — Qxy cos 6 en la vecindad del origen. 100‘ Introduccién al c4lculo y al andlisis matematico 3. Si f(&, ») es una funcion continua con primeras y segundas derivadas continuas, entonces etim FRR 4) — 2Flh, €-1) + FO, 0). Fex(0, 0) = kim he = . Probar que la funcién f(x,y) = exp (—y? + 2xy) puede desarrollarse en una serie de la forma & An 2M, que converge para todos los valores de x y y y que los polinomios H(z), Namados polinomios de Hermite, satisfacen (a) Hn(x) es un polinomio de grado n. (0) Hn!) = 2nHn-a(x) (©) Hay — 2xHy + 2nHy-1 = 0 (2) Hy” — 2xHy’ + 2nHn = 0. 1.8 Integrales de una funcién que dependen de un parametro El concepto de integral multiple de una funcién de varias va- riables se tratara en los Capitulos IV y V. Por el momento s6lo se es- tudiaran las integrales sencillas que surgen en relacién con tales fun- ciones. a. Ejemplos y definiciones Si f(x, y) es una funcién continua de x y yen la region rectan- gular a < x =B,a Sy S b, puede considerarse fija a la cantidad x e integrar la funcién f(x,y), considerada como una funcién de y Gnicamente, sobre el intervalo a < y S b. Asi se llega a la expresién f f(x, y) dy, la cual atin depende de la elecci6n de la cantidad x. De este modo, se esté considerando no sélo una integral sino la familia de integrales ° . : . Jf? f@, ») dy obtenida para valores diferentes de x. La cantidad x, « se mantiene fija durante la integracién y a la cual se le puede asignar cualquier valor en su intervalo, recibe el nombre de pardmetro. Por lo tanto, la integral ordinaria aparece como una funcién del pa- rdmetro x. Funciones de varias variables y sus derivadas 101 Las integrales que son funciones de un parémetro,ocurren fre- cuentemente en el anilisis y sus aplicaciones. Por ejemplo, como puede demostrarse facilmente por medio de la sustituci6n xy = u , se tiene fi d = are sen x o Vi— xe se para —1 —1. Puede representarse la regién de definicién de la funcién f(x, y) geométricamente y considerar la paralela al eje y correspondiente al valor fijo del parametro x, como en la Fig. 1.15. Se obtiene la fun- cién de y que debe integrarse, considerando los valores de la funcién f(x, y) como una funcién de y a lo largo de la recta de intersecci6n AB de la paralela con el rectangulo. También es posible hablar de integrar la funcién f(x, y) a lo largo del segmento AB. Figura 1.15 Este punto de vista geométrico sugiere una generalizacion. Si el dominio de definicién R de la funcion f(x,y) tiene la forma que se 102 Introduccién al cAlculo y al an4lisis matematico Figura 1.16 muestra en la Fig. 1.16, tal que cualquier paralela al eje ycorta a la frontera cuando mas en dos puntos, entonces, para un valor fijo de x, nuevamente pueden integrarse los valores de la funcién f(x,y) a lo largo de la recta AB en la cual la paralela al eje y se intersecta con la region R. Los puntos inicial y final del intervalo de integracién variaran a su vez con x. Entonces se tiene que considerar una integral del tipo (39) S22 fey) dy = FO), wit) es decir, una integral con la variable de integracién y, en la cual aparece el parametro x tanto en el integrando como en los limites de integracion. Si se representa la funcién f(x, y) por medio de la super- ficie z = f(x, y) en el espacio x, y, z, entonces, para una funcién positiva f, se puede considerar el cilindro con generatrices paralelas al eje z que tiene como su base al dominio R de f en el plano x, yy limitado en su parte superior por la superficie z = f(x, y). Un valor fijo de x corresponde a un plano paralelo al plano y, z, el cual se in- tersecta con el cilindro s6lido en una cierta region plana. El area de esa regién esta dada por la integral de la formula (39). Por ejemplo, la integral Vi-at — x2 — x2 view V1 9 dy representa el area de la interseccion del hemisferio 0pd- Pa es discontinua en x= +1y en x= —1, pero la integral (como una integral impropia) tiene significado. La derivacién formal con res- pecto al parametro k da am rw SiG Para investigar si esta ecuaci6n es correcta, se repite el argumento por el cual se obtuvo la formula de derivacién. Esto da kx? dx x)\(1 — Rx*)5* Fi + 1) — FA) _ fi " ful + 0h, x) dx f 1 La diferencia entre esta expresién y la integral obtenida por la de- rivacién formal es v + Oh)*x?] 3° a-f" _ (tee _ “Ja vi—2\ V1 — (+ OAPs va = Se debe demostrar que esta integral tiende a 0 con h. Con este fin se marca alrededor de & un intervalo ko Sk S ki que no contenga los valores +1, y se elige A tan pequefio que k + 0h se encuentre en este intervalo. La funcién __k va— es continua en la regién cerrada—1Sx<1, ko SkSkiy, porlo tanto, es uniformemente continua. Consecuentemente, la diferencia h+oh _ [= & + ony vi permanece por debajo de una cota &, que es independiente de x y ky la cual tiende a 0 con h. De aqui que Funciones de varias variables y sus derivadas 109 Hye ais f) 2S _x ne = Ms, donde M es una constante independiente de €. Es decir, la integral A tiende a 0 conforme h lo hace, lo cual se queria demostrar. Por consiguiente, es permisible la derivacién bajo el signo integral en este caso. En otros casos se aplican consideraciones similares. Las integrales impropias con un intervalo infinito de integraci6n y que dependen de un parametro se discutiran en la p. 521. Ejercicios 1.8b 1. Sea » F(R) = f° ax) oe, by dx, donde B(x, 2) y Bx(x, k) son continuas para a 0, se forma el promedio de f sobre el cuadrado con centro en (x, y) y lados de lon- gitud 2h paralelos a los ejes: Lope pee (420) Fue») = gia fo as [Fe wan _uxth,y +h) — uxe+h,y—h)— ux—h,y +h) + ulx—h, yh). ~ 4h? Es evidente que Fy(x, y) tiene primeras derivadas continuas y una segunda derivada mixta continua®. Para ver que F(x, y) se apro- xima a f(x, y) para h pequeiia, se observa que pay (42) Fats 9) = fle) = gia fo as "6 w) - fee, han. Como f es uniformemente continua en algiéin rectangulo R’ que con- tiene a R en su interior, se sabe que f, para ¢ dado y h suficiente- mente pequefia, variara en menos que ¢ en todo cuadrado de lado 2h contenido en R’, Entonces |f(E, n) — f(x, y)| < © en (42f), y |Fa(x, y) — f(x, y)| <<. De aqui que Yim F,(x, y) = f(x, y) uniformemente para (x, y) en R. VEsto puede lograrse continuando a f como constante a lo largo de rayos perpen- diculares a uno de los cuatro lados del rectangulo y continuando a f hacia los puntos restantes del plano como constante a lo largo de rayos que parten de uno de los cuatro vértices 2Para tener a Fa(x, 9) definida para todos los puntos del rectangulo R, tiene que haberse definido f un tanto mas alla de R. 112 Introduccién al cAlculo y al andlisis matem4tico Puede asi hallarse una funcién suave F,(x, y) arbitrariamente préxima a f(x, y). 1.9 Diferenciales e integrales de linea a. Formas diferenciales En la Seccién 1:5d se definié la diferencial total du de una fun- cién u = f(x, y, 2) como la expresién 43) dy = A») dx + UID) gy 4 TE ID a, Esta definicin para la diferencial de una funci6n de varias variables es sugerida por la regla de la cadena de la derivacién. Porque si x, y, z son funciones dadas de una variable t, (44) x=, y=v, z= x0, entonces la derivada de la funcién compuesta_ u = f [o(t), (2), x(0)] de acuerdo con la regla de la cadena (19), es du_ofdx , of dy , af dz (45) dt ~ dxdt * aydt + d2dt" Para funciones u de una sola variable real ¢, la diferencial se ha definido como du = 24 dt. De donde, en este caso por (45), —(# dx , ody , of da) du = lan dt + ay att sean) _ ade ~ ax'dt of dy ay 4 of dz at + 3 at a+ aa dt, lo cual formalmente concuerda con (43), si se recuerda que x, y, 2 (como funciones de ft) tienen las diferenciales dx = oe ay, =& dz ~ dt a =F dt, dz= a dt. Asi, la diferencial du = df(x, y, 2), como la da la ec. (48), propor- ciona inmediatamente la diferencial du = du dt de u “a lo largo de Funciones de varias variables y susderivadas 113 cualquier curva” representada paramétricamente en la forma (44). La diferencial du, como se define mediante (43), es una funcién de las’seis variables x, y, z, dx, dy, dz que es lineal y homogénea* en las variables dx, dy, dz, con coeficientes que son funciones de x, y, z. (Por supuesto, no se requiere que las diferenciales dx, dy, dz tengan que se “pequefias” en sentido alguno; tal restriccién sélo surge si se desea usar du como una aproximaci6n para el incremento Au = f(x + dx, y + dy,z + dz) — f(x,y,2), como se explicé en la p. 69). La forma diferencial lineal mas general en el espacio x, y,z se representa por la expresién (46) L= A(x,y,z) dx + B(x, y,z) dy + C(x, y, z) dz. Esta es una funcion L de las seis variables x, y, z, dx, dy,dz que es una forma lineal en las variables “diferenciales” dx, dy, dz, con coeficientes que dependen de x, y, z. Las diferenciales totales du de las funciones son las formas diferenciales lineales especiales L que tienen coeficientes de la forma f(x,y, 2) an A=F@Y2 p_ A%Y2) , de? Ox” ay para una funci6én apropiada f = f(x, y, 2). Si una forma diferencial Les la diferencial total de una funcién, se dice que es una forma diferencial exacta o que es integrable. No toda forma diferencial es integrable; es necesario que los coeficientes A, B, C de L satisfagan ciertas “condiciones de integrabilidad”: Si los coeficientes A, B, C de la forma diferencial L son de la clase C1 (es decir, tienen primeras derivadas continuas; ver la p. 69) y si L es exacta, entonces se cumplen las ecuaciones aB_ aC _ ac aA _ (48) 3e ay = ae ae = aA aB_ ay = ax Las ecuaciones (48) simplemente son consecuencias de las reglas para la intercambiabilidad de las segundas derivadas. Si A, B, C tienen primeras derivadas continuas y pueden escribirse en la forma *La funcién lineal m4s general de las tres variables &, n, ¢ es AE + Bn+CC+D con coeficientes A, B, C, D que no dependen de E, n, ; se dice que la funcién lineal es “homogénea” o que es una “forma lineal” cuando D = 0 (ver la p. 38). 114 Introduccién al cAlculo y al an4lisis matematico (47), entonces f tiene segundas derivadas continuas. De aqui que, por el teorema de la p. 63, no importa‘el orden de la derivacién. Asi, por ejemplo, aA_ dof _aaf _aB ay ~ dyax axdy dx’ y de modo semejante para las otras identidades dadas en (48). De aqui que, por ejemplo, la forma diferencial lineal L=ydx+zdy+xdz no es integrable, ya que aqui ox 2 7 By =e 7 by THO Por otra parte, las condiciones de integrabilidad (48) son satisfecha por la forma diferencial L = yz dx + zx dy + xy dz, la cual, de hecho, es la diferencial total du de la funcién u = xyz. En la Seccién 1.10 se discutiré hasta qué punto las condiciones (48) son también suficientes para expresar L como una diferencial total. Se obtienen condiciones semejantes para la integrabilidad cuando el namero de dimensiones es diferente de tres. Para dos variables in- dependientes x,y la forma diferencial lineal generales L = A(x, ) dx + B(x, ») dy. Si L es la diferencial du de una funcién u = f(x, ¥), los coeficientes A, B satisfacen la ecuacién dA _aB GA _ OB _ 9, dy = ax Por otra parte, en cuatro dimensiones se obtienen, correspondiendo a las ecuaciones (48), se’s condiciones de integrabilidad, para lo cual se forman todas las segundas derivadas mixtas posibles de una funcién f de cuatro variables. La raz6n por la que tiene sentido considerar una forma diferen- cial L, incluso cuando no es una diferencial exacta, es que, a lo largo de cualquier curva C dada paramétricamente en la forma r=o, y=vd, z2=x(0, Funciones de varias variables y sus derivadas 115 L se transforma en la diferencial L= (4$ dx +c0Pa Aa t BY e+ de una funcién de una sola variable. Esta funcién es simplemente la dada por la integral indefinida fee fla des ps cela b, Integrales de linea de formas diferenciales lineales Con el propésito de discutir la integracién de las formas diferen- ciales lineales sobre lineas, es importante tener una imagen clara de los conceptos y propiedades de los arcos orientados y las curvas ce- rradas. Se recomienda al lector que lea nuevamente el Volumen I, pp. 333-340, donde se hacen todas las observaciones pertinentes para el caso de las curvas planas. Estas se aplican con igual propiedad a las curvas en espacios de cualquier nimero de dimensiones.* Sin pér- dida de generalidad, hablaremos acerca de las integrales sobre curvas en el espacio tridimensional x, y, 2 Un arco simple T es un conjunto de puntos P = (x, y, z) que pueden representarse paramétricamente en la forma (49) x=, y=v, z2=10; astsd, donde 9, y, % son funciones continuas de t para a 0. De lo contrario, los ty son decrecientes, to = b, ta = a, y Atv<0, En nuestra notaci6n para el intervalo del parametro, a siempre representa el menor de los valores a, b y, por tanto, puede corresponder ya sea al punto inicial o al final del arco I'*. Si ahora se aplica el teorema fundamental de existencia para las integrales definidas como limites de sumas de Riemann (ver el Volumen I, pp. 192 y siguientes, se encuentra que F = lim Fy existe ae y esta dado por la formula (56).* El factor « = + 1 surge de la hi- potesis hecha en ese teorema de que los puntos de subdi: mn ty usados al formar la suma de Riemann constituyen una sucesi6n creciente. Cuando la orientacién de I* corresponde a la ¢ decrecien- te, tienen que recorrerse los valores tv en el orden opuesto, empezan- do con fn y terminando con to, y cambiar el signo de Atv. Es evidente que la definicién de integral de linea y la formula (56) pueden extenderse al caso en donde.I* es una curva simple cerrada orientada.* En este caso, se forma la suma de Riemann seleccionan- do n puntos Pi, Po, . . . , Pn sobre I'* que se sigan mutuamente en el orden determinado por la orientacién y se pone Po=Pn enla expresi6n (54) para Fr. *Los valores intermedios ty, ty’, ty’, y no necesitan ser los mismos para la conver- gencia (ver las observaciones en la p.195, Volumen I). *Tal curva tiene una representacién paramétrica continua (53), con ¢ diferentes correspondientes a puntos diferentes, excepto que f = @ y t = b proporcionan el mis- mo punto. Es més, se especifica un orden ciclico sobre *, correspondiente a ¢ creciente, o bien, decreciente (véase el Volumen I, p. 389). Siempre puede represen- tarse T como suma de arcos simples orientados Ti* en la forma (51), donde para i=2,...,m el punto final de Ti#.1 es el punto inicial de T* y donde el punto final de Fa* es el punto inicial de Ps*, Funciones de varias variables y sus derivadas 121 En el Volumen I ya se han encontrado ejemplos de integrales sobre curvas en el plano x, y. Asi, se ha representado el 4rea orien- tada limitada por una curva orientada cerrada I*, en la forma = aS *at - 9) (ver el Volumen I, p. _); es decir, como la integral de linea a=3f xdy—ydx. BJ pe Otro ejemplo es proporcionado por el trabajo W que realiza un cam- po de fuerzas con componentes p, o al producir un movimiento desde un punto Po hasta un punto Pi a lo largo de una curval* = PoP, referido a la longitud de arco s como pardmetro. Aqui, (ver el Volumen I, p. 420) = [pi oB wef" (6 ae tae) lo cual puede escribirse como w= J pdr ody. De la misma manera, puede definirse el trabajo realizado por fuerzas en el espacio con componentes Pp, 6, 7, al producir un movimiento a lo largo de un arco I* en la direccién dada por su orientacién, como una integral de linea W=fodr+ody+rdz, Ejercicios 1.9b 1. Hallar fedx+xdy+ydz (a) sobre el arco de la hélice x=cost, y=sent, que une a los puntos (1, 0, 0) y (1, 0, 2x); (b) sobre el arco parabélico x=xo(l—t), y=y(l—-t%), z=t que une los puntos (0, 0, 1) y (0, 0, —1) (para constantes xo, yo). 122 Introduccién al cAlculo y al andlisis matemAtico c. Dependencia de las integrales de linea con respecto a los puntos extremos Regresemos a la forma diferencial general L dada por (52). Sea un arco simple (atin no orientado) con una representacién para- métrica (53) seccionalmente suave. Para dos puntos cualesquiera Po, Pi sobre I correspondientes a los valores to, t: del parametro t, puede formarse la integral = ("as pP4c® r= [" (agi + BG + cfiae. Por la formula (57), I es igual a,fL extendida sobre el subarco orien- tado PoP: de P que tiene a Po como punto inicial y a Pi como punto final. Se deduce que I no depende de la representacién pa- ramétrica particular. Se escribe I= fit El valor de I es determinado por la pareja ordenada de puntos Po, Pi y el arco simple del cual ellos son puntos extremos. Para Po fijo puede definirse una funcién f = f(P) a lo largo del arco T, por medio de la integral indefinida (58) AP) = fie = . (49+ BS + 0%) a. Entonces, tomando a f como una funcién de la variable indepen- diente ¢, se tiene ee af. 4 gd ot (69) wen 4g t Bat Ca: Asi, escribiendo esta ecuaci6n como af= Hat = Adz + Bdy+Cdz=L, se expresa la forma diferencial lineal L (que no necesita ser exacta) como la diferencial de una funcién /f; pero tiene que recordarse que esta relacién sélo se cumple a lo largo de una curva especial I , sobre la cual f esta definida. Para dos puntos cualesquiera P y P’ de T , Funciones de varias variables y sus derivadas 123 (60) Jt = ney 10. Esto se deduce inmediatamente si se expresan las integrales de linea como integrales sobre la variable ¢ y se aplica la relacién fundamen- tal entre las integrales definidas e indefinidas (ver el Volumen I, p. 190). Si I*, el arco T con una cierta orientacién, tiene el punto inicial A y el punto final B, se encuentra, en particular, que (1) St = Sob = KB - Ka), Si Po, . . . , Pn son puntos sobre I en el orden determinado por la grientacién de I*, con Po = A, Pn = B, se tiene L = f(B) — f(A) = x [f(Pvsa) — f(P oy] _ I ge L. v0 py Si se denota el subarco con punto ini Pv, se tiene al Py y punto final [v,1* por (ee L =f L. Py Tyai* Aqui la orientacién de I'v* concuerda con la de ', de modo que Malt +Tot +e + e+ Pn® Por lo tanto, las integrales de linea son aditivas: 62) S. De modo semejante, si se intercambian los puntos extremos de I'*, Sut Estas reglas son particularmente interesantes cuando se aplican a curvas cerradas orientadas que se representan como sumas de arcos simples orientados. Considérese un namero de curvas simples ce- rradas orientadas Ci*,. . . , Cn* (ver la Fig. 1.19), las cuales pueden tener porciones en comin. Supéngase que un arco simple T comin a L= Ltee-e te * ry 40 y Tp* (63) S.2 124 Introduccién al cAlculo y al andlisis matem4tico ce ct ea a A Zz ce c+ Figura 1.19 Aditividad de las integrales de linea sobre curvas cerradas. dos de las curvas, C;* y Cx*, recibe orientaciones opuestas de C;* y Cx* y que las porciones de las curvas no comunes a dos cualesquiera de ellas se suman a una curva cerrada orientada C*. Escribiendo cada integral de linea sobre una curva C;* como la suma de integrales sobre arcos simples y sumando todas estas integrales, las contribu- ciones de los arcos comunes se cancelan y queda la formula Cn* 6) Sota Sy bet Se En particular, estas situaciones surgen cuando las C;* son curvas planas que forman las fronteras de regiones bidimensionales Ri que no se traslapan y que juntas forman una regién R con curva frontera C*,teniendo todas las C;* y C* la misma orientacién, M4s general- mente, la region R y su frontera C* pueden estar sobre una superficie y R puede estar subdividida mediante arcos en subregiones R; con curvas frontera C;* cuyas orientaciones se ajustan entre si en la forma descrita. Una aplicacién un tanto diferente del mismo principio ocurre en el teorema siguiente. Considérense dos curvas orientadas C* y C’* (ver As ce AL Figura 1.20 Funciones de varias variables y sus derivadas 125 Fig. 1.20) subdivididas por los puntos Ai,..., Any A1’,..., An, respectivamente, en el orden del sentido de orientacién, y supéngase que cada pareja de puntos correspondientes At y Ai’ se unen por medio de una curva. Si se denota la curva orientada cerrada A;Ags1 Aui’Ar (identificando Anj1 con Ai y Anyi’ con Ai’), por Cr*, enton- ces (68) sf fi ver 1.10 El teorema fundamental sobre la integrabilidad de las formas diferenciales lineales a. Integracién de diferenciales totales Una clase particularmente importante de formas diferenciales (66) L=Adx+Bdy+Cdz son las diferenciales totales de funciones u = f(x, y, z), con A, B,C de la forma ae pF o_af (67) A=3, ay? = 32° donde f es una funcién con primeras derivadas continuas. Mientras que, en general, el valor de Spe L no sélo depende de los puntos ex- tremos sino del curso completo de la curva, aqui es valido el teorema siguiente: La integral de una forma diferencial. lineal L, que es la diferencial total de una funcién f, es igual a la diferencia de los valores de f en los puntos extremos y no depende del curso de I'* entre esos puntos. Esto es, se obtiene el mismo valor para f.* L, para todas las curvas T* que se encuentren en el dominio de f y tengan el mismo punto inicial Po y el mismo punto final Pi. Para la demostracién, sup6ngase que la curva I* se refiere a un parametro t, donde to corresponde al punto inicial Po y t; al punto final Pi. Por (57), p. 119). _ (1(,de , pdy Sate fi (492 + BY +c) at. 126. Introduccién al cAlculo y al andlisis matemAtico Entonces, por la regla de la cadena de la derivaci6n [ ver la formula (18), p. 83] se tiene (68) fata Soar =1\2 = ne - Ao, donde se escribe fPi) = x(t), (ts), 2(4)) para i = 0,1. Se observa que, en lugar de requerir que la integral sea indepen- diente de la trayectoria, igualmente sélo podria requerirse que la in- tegral sobre una curva simple cerrada I* tenga el valor 0, porque si se divide la curva '* por medio de dos puntos Po y Pi en dos arcos orientados I'1* y T'2*, se tiene res Tit + Pat, donde, digamos, Tr tiene el punto inicial Py y punto final Pi, mien- tras que [2* tiene el punto inicial Pi y el punto final Po (ver la p. 124). Entonces fat Aqui —Is* tiene el mismo punto inicial Po y el mismo punto final Pi que T:*. La anulacién de fL sobre la curva cerrada [* significa exactamente lo mismo que la igualdad de L tomada sobre los dos ar- cos simples cerrados que tienen a Po como punto inicial y a P; como punto final. See! + Sear ® = See = b. Condiciones necesarias para que las integrales de linea dependan tinicamente de los puntos extremos Solo bajo condiciones muy especiales una integral de linea es in- dependiente de la trayectoria, o bien, lo que es equivalente, la in- tegral de linea a lo largo de una trayectoria cerrada es 0. Por ejem- plo, si una curva cerrada C* en el plano x,y forma la frontera de una region de 4rea positiva, entonces la integral de linea f(x dy—y dx) sobre C* no es 0. En la seccién precedente se probé que para la in- dependencia de fL de la trayectoria que une los puntos extremos, es suficiente que L sea una diferencial total. La tarea principal de la Funciones de varias variables y sus derivadas 127 teoria de las integrales de linea es demostrar que esta condicién tam- bién es necesaria y, a continuacién, expresar esta condicién necesaria y suficiente en una forma conveniente para las aplicaciones. Investiguemos esta cuestién de la independencia para las inte- grales sobre curvas en el espacio tres. Pero los resultados y demos- traciones son exactamente andlogos en cualquier nimero de dimen- siones. Se establece la hipétesis de que L = Adx + Bdy + Cdz es una forma diferencial lineal con coeficientes A, B, C que son fun- ciones continuas de x, y, 2 en un conjunto abierto R del espacio. En- tonces se cumple el teorema siguiente: La integral de linea f{ L tomada sobre un arco simple orientado '* en R es independiente de la eleccién particular de [* y queda deter- minada tinicamente por los puntos inicial y final de I* sty s6lo si L es la diferencial total de una funci6n f(x, y, z) en R. Ya se ha probado en la p. 95 que esta condici6n es suficiente; es decir, para una diferencial exacta L = Adx + Bdy + Cdz la in- tegral [LZ es independiente de la trayectoria. Es facil ver que la con- dicién es necesaria. Supéngase que fi-«L slo depende de los puntos extremos de I*, Se desea demostrar que existe una funci6n u(x, y, 2) definida en R para la cual du = L. Sin pérdida de generalidad, se puede suponer que dos puntos cualesquiera de R pueden conectarse por medio de un arco poligonal simple que se encuentre comple- tamente en R.! Se elige un punto fijo Po en R y se define la funcién u = u(x,y, 2) = u(P) en cualquier punto P de R como fL exten- dida sobre cualquier arco simple con punto inicial Po y punto final P. Con el fin de calcular las derivadas parciales de u, considérese cualquier punto (x, y,z)= P de R (Fig. 1.21). Entonces, como R es abierto, todos los puntos (x + h, y, z) = P’ también perteneceran a R, siempre que |h| sea lo suficientemente pequefio. Denotemos por y* el segmento rectilineo orientado que une P y P’, mientras que '* denotara una trayectoria poligonal simple que une Po con P. Siem- pre puede modificarse [* ligeramente para hacer que el ultimo lado de este arco poligonal, que tiene a P como punto final, no sea para- lelo al eje x. Entonces '* y y* no tienen punto en comin aparte de P (al menos para |h| lo suficientemente pequejio) y I* + y* representa *EI conjunto abierto R siempre puede descomponerse en subconjuntos conexos que tengan esta propiedad (ver el Apéndice 112). Entonces se define u en cada uno de éstos por medio de la construcci6n indicada. 128 —Introduccién al calculo y al andlisis matemtico Figura 1.21 un arco simple con punto inicial Pp y punto final P’, Se concluye [ver (62), p. 123] que u(x + h,y, 2) — w(x, y,2)= uP) -—WP)=f, ,b- fb ath =f A(t, y, 2) dt 2 Dividiendo entre h y pasando al limite con h > 0, se encuentra que, en efecto, Bux, ¥, 2) _ ax =A, y, de modo semejante, au/@y = B y du/dz = C. Esto demuestra que du = L. c. Insuficiencia de las condiciones de integrabilidad Sin embargo, el teorema sobre la independencia de las integrales de linea que acaba de probarse no tiene gran valor a menos que se tenga alguna manera de averiguar si una diferencial dada L es una diferencial total o no. Es de desear tener alguna condicién que s6lo comprenda los coeficientes A, B, C de L = Adx + Bdy+Cdz y que se verifique con facilidad. Ya se han reconocido las condiciones de integrabilidad aB_ aC _ ac aA _ aA 0B_ ©) ay = ae az = ay ~ ae = 9 como necesarias para la existencia de una funcién u = f(x, y, z) con Funciones de varias variables y sus derivadas 129 la propiedad de que L = du. Una forma L que satisfaga a (69) recibe el nombre de cerrada. De aqui que toda forma exacta es cerrada. Como las integrales de linea s6lo pueden ser independientes de la trayectoria particular que une a dos puntos cualesquiera cuan- do L es una diferencial total, se ve que las condiciones (69) son necesarias, si L debe depender tinicamente de los puntos extremos de la trayectoria de integracién. ¢También son suficientes estas con- diciones? Son suficientes si nos permiten construir una funcién u = f (x, y, 2) para la cual of. _ of _ of (70) A=3 Bay, C=5,- El resultado sorprendente es que las condiciones de integrabilidad (69) son casi suficientes, pero no lo bastante, para asegurar que L sea la diferencial total de una funcién u y, por tanto, para asegurar la independencia de fZ de la trayectoria. Las identidades (69) por si mismas no son suficientes pero se vuelven suficientes si se agrega una hip6tesis de caracter muy diferente, una hipétesis que se refiere a una propiedad geométrica de la regién del espacio en la que se con- sidera L. Un contraejemplo sencillo muestra que las condiciones (69) por si solas no son suficientes para garantizar que f L tomada sobre cual- quier curva cerrada sea 0. Considérese la diferencial xdy ~ydx m oe correspondiente a la eleccién de los coeficientes y x =a B= Pry? c=0, la cual esta definida, excepto para los puntos sobre la recta x = y = 0' (el eje z). Se verifica facilmente que se satisfacen las condiciones de integrabilidad (69) y, por tanto, que L. es cerrada. Cuando se in- tegra alrededor del circulo unitario C*: x = cos t, y= sent, z=0 en el plano x, y, orientado positivamente con respecto a ¢, se en- cuentra fie =f" ag z+ Be) ) at = £ (sen? t + cos?2) dt’ = 240. 130 Introduccién al clculo y al andlisis matematico En realidad, es facil calcular {LZ alrededor de cualquier curva ce- rrada C para la L dada por (71). Introdizcase el angulo polar @ de un punto P = (x, y, z) por medio de x (72) cos 0 = sen0 = yy? ¥ es decir, el Angulo formado con el plano x,z por el plano que pasa por P y el eje 2 (ver la Fig. 1.22). Entonces (73) d0 = dare tan% =L, Figura 1.22 de modo que L se representa como la diferencial total de la funcién u = 6. Las complicaciones surgen del hecho de que las formulas (72) definen los valores de @ sdlo dentro de miltiplos enteros de 2n. Em- pezando con algunos valores posibies 8 para 0 en un punto Po, puede definirse 6 en cualquier punto P uniendo P con Po mediante una curva continua y tomando P OP) = + f do=o+ fb Po (ver el Volumen I, p. 484). Pero 0(P) definida de esta manera es multiforme, dependiendo de la eleccién de la curva: para una curva cerrada C*, la expresién Funciones de varias variables y sus derivadas 131 1 xf, % representa el namero de veces que C se enrolla alrededor del eje z en el sentido del movimiento de las manecillas del reloj (ver la Fig. 1.23). De aqui que el valor de (74) im ao {a9 = 40 =) p\* Figura 1.23 tomada para dos trayectorias diferentes con los puntos extremos Pp, P ¢s el mismo sélo si al ir a lo largo de una trayectoria desde Po has- ta P y regresar a lo largo de la otra trayectoria hasta Po , se circunda cero veces el eje 2. Puede evitarse que cualquier trayectoria vaya alrededor del eje z, considerando sdélo puntos (x, y, 2) con y #0, 0 bien, y = 0 y x > 0, erigiendo, por decirlo asi, una pared a lo largo del semiplano y=0, x50 la cual no debe cruzarse. Los puntos no excluidos forman una regi6én 132 Introduccién al cAlculo y al an4lisis matematico R en la cual puede asignarse a 6 un valor Gnico con —n1) = (1 = A) xolt) + Ana(d). Figura 1.24 Aqui Cy se obtiene geométricamente uniendo los puntos de Co y Ci que pertenecen a la misma ¢ por medio de un segmento rectilineo y tomando el punto que divide tal segmento en la raz6n A/(1 — A). Todos los puntos obtenidos de esta manera se encuentran en R, debido a la convexidad de R. Un tipo diferente de conjunto sim- plemente conexo a través de trayectorias esta representado por un cascar6n esférico. Por otra parte, no simplemente conexo es el con- junto R obtenido eliminando el eje z del espacio x, y, 2. Aqui las dos trayectorias (semicirculos) x = cos 7t, y =sen at, z=0; Ostsl x=cosmt, y=-senm, z=0; OStS1 tienen los mismos puntos extremos pero no pueden deformarse una en la otra sin cruzar el eje 2, que no pertenece a R.1 TEsto se deduce del teorema fundamental que sigue y del hecho de que existe una forma diferencial cerrada, la dada por (71), cuya integral sobre el circulo completo no se anula. Funciones de varias variables y sus derivadas 135 e. El teorema fundamental Ahora puede enunciarse la relacién entre las nociones de formas diferenciales cerrada y exacta: Si los coeficientes de la forma diferencial L = A dx + Bdy + C dz tienen primeras derivadas continuas en un conjunto R simple- mente conexo y satisfacen las condiciones de integrabilidad (75a) Be-—Cy=0, Cz—Az=0, Ay—Bz=0, entonces L es la diferencial total de una funcién u definida en R: (75b) A=u, B=uy, C=u. Para la demostracién, basta con demostrar que la integral de L extendida sobre cualquier arco poligonal simple en R con pun- to inicial P’ y punto final P” tiene un valor que depende tnicamente de P’ y P” (ver la p. 97). Represéntense, respectivamente, los dos ar- cos orientados Co* y Ci* paramétricamente por (76a) x= got), y=volt), z2=x(), OStS1 y (76b) x=¢(), y=w), z2=n); OSt<1 con t= 0 dando P’ y t=1 dando P”. Aplicando la conectividad simple de R, pueden “encajarse” las trayectorias (76a, b) en una familia! continua (76c) x= 60), y= v(t), = x(t, 2) reduciéndose a (76a, b) para 1 = 0,1 ya P’, P” parat = 0,1. Porla formula (56), p..119 se tiene mo J.B-S, 1 = S (Axi + Bye + Cz) [ny — (Axe + Bye + Cze)|aeo] dt, o* donde x, y, z son las funciones de ¢, 2 dadas por (76c). Supéngase, para empezar, que esas funciones tienen primeras derivadas conti- nuas con respecto a f, y una segunda derivada mixta continua para 0StS1,0N0,de lo cual se deduce que Funciones de varias variables y sus derivadas 139 los puntos (xo, yn) del conjunto tienden al punto limite (xo, no), el cual, por tanto, es un punto de acumulacién del conjunto. En el segundo caso, debe haber un numero infinito de valores distintos de x que son las abscisas de puntos del conjunto y puede elegirse una sucesién x1, x2, . . . de estas abscisas que tienden a un limite &. Para cada Xn, sea Px = (xn, Yn) un punto del conjunto con abscisa xn. Las Yyn forman un conjunto infinito y acotado de ntimeros; de aqui que puede elegirse una subsucesi6n nj, Yng, . - . que tiende a un limite y. La subsucesién correspondiente de abscisas xn, Xng,.. . atin tiende al limite &; de aqui que los puntos Pn, Png)... tienden al punto limite (€, 9). De donde, en cualquier caso, puede hallarse una su- cesion de puntos del conjunto que tiende hacia un punto limite y queda demostrado el teorema. b. Criterio de convergencia de Cauchy. Compacticidad Una consecuencia del teorema de Bolzano- Weierstrass es que toda sucesién infinita y acotada de puntos Pi, P2,... tiene una subsu- cesién convergente. En efecto, si la sucesién contiene un ntimero in- finito de elementos distintos, éstos forman un conjunto infinito de puntos distintos, de los cuales, de acuerdo con el principio de Weier- strass, puede elegirse una sucesién que converja a un punto Q, Si la sucesién no contiene un ndmero infinito de elementos distintos, en- tonces al menos uno de sus elementos debe repetirse con una frecuen- cia infinita; entonces existe un punto Q que aparece con una fre- cuencia infinita en la sucesién, y la subsucesién formada por los elementos que son iguales a @ converge al punto Q. Una consecuencia importante es el criterio de convergencia de Cauchy: Una sucesién de puntos Pi, P2,.. . en el plano (y de modo se- mejante una sucesion en el espacio euclidiano n-dimensional) conver- ge aun limite si y s6lo si para cada & > 0 existe un ntimero N = N(«) tal que la distancia entre Pn y Pm es menor que e siempre que tanto n como m sean mayores que N. La demostracién se desarrolla exactamente igual que la corres- pondiente para las sucesiones de nimeros reales dada en el Volumen I (p. 97). Se ve inmediatamente que una sucesién que satisface la condicién de Cauchy es acotada; de aqui que, por el teorema pre- cedente, contiene una subsucesi6n convergente con un limite Q y en- tonces se deduce inmediatamente que toda la sucesién converge a Q. 140 — Introduccién al cAlculo y al andlisis matemAtico Un conjunto S de puntos en el plano se calificé como cerrado si todos los puntos frontera de S pertenecen a S. El limite Q de toda sucesién convergente de puntos de un conjunto cerrado S es nue- vamente un punto de S (ver la p. 33). Como se ha visto que toda sucesién infinita y acotada contiene una subsucesién convergente de puntos, se encuentra que toda sucesién infinita formada por puntos de un conjunto S de puntos en el plano, acotado y cerrado, contiene una subsucestén que converge a un punto de S. Generalmente se dice que un conjunto S es compacto? si toda sucesién formada por ele- mentos de S contiene una subsucesién convergente con un limite en S. De aqui que un conjunto cerrado y acotado de puntos en el plano (o en el espacio euclidiano n-dimensional) es compacto. El lector puede verificar facilmente el reciproco: Todo conjunto compacto de puntos en el plano es cerrado y acotado. En el futuro, a menudo nos referiremos a los conjuntos cerrados y acotados simplemente como conjuntos compactos. c. El teorema de cobertura de Heine-Borel Una consecuencia notable del principio de Bolzano- Weierstrass es el teorema de Heine-Borel: Sean dados un conjunto S compacto (es decir, cerrado y acotado) y un sistema >) de un ntmero infinito de conjuntos abiertos que cubren a S en el'sentido de que cada punto de S pertenece a, por lo menos, uno de los conjuntos abiertos en >). Entonces puede hallarse un ntimero finito de conjuntos en 3) que cubrena S. Como una ilustraci6n, considérese el conjunto infinito $ de puntos sobre el eje x que consiste de los puntos. Pn = (1/n, 0) para n = 1,2, y del origen Po = (0, 0). Este es un conjunto cerrado. Para 1,2, . . .,denotemos por S, el disco abierto V(x—Iny +? < wk 5 38n? con centro en Pr y radio 1/3n2, y por So el disco 1 x2 + ); porque si cada una de las cuatro partes de S pudiera ser cubierta de esta manera, el propio S seria cubierto. Llamaremos Qi a esta parte de Q. Subdi- vidase ahora Qi. en cuatro partes iguales. Por el mismo argumento, una de las cuatro partes de Qi es un cuadrado Qs tal que los puntos de S que se encuentran en Qz o sobre su frontera no pueden ser cubiertos por un namero finito de los conjuntos abiertos en 3). Con- tinuando en esta forma, se obtiene una sucesi6n infinita de cua- drados Qi, Qz, Qs, . . . cada uno contenido en el precedente, con su tamafio. reduciéndose hasta 0 y tales que los puntos de S en la ce- rradura de cualquier Qn no pueden ser cubiertos por un nimero finito de los conjuntos en >}. Evidentemente, para cada n puede hallarse un punto P, de S que se encuentre en el interior o sobre la frontera de Qn. Entonces Pi, Pz, . . . es una sucesién de puntos de S. Como S es acotado, la sucesién es acotada y debe tener una subsu- cesién que converge a algGn punto A. Como S es cerrado, A es un punto de Sy, por tanto, esta contenido en un conjunto abierto Q que pertenece a >). Pero entonces, una vecindad completa de A per- tenece a ese conjunto abierto , digamos, la vecindad que consiste de los puntos que se encuentran a una distancia menor que « de A. Puede elegirse un m tan grande que Pp, se encuentre a una distancia menor que ¢/2 de A y que la diagonal de Qn tenga una longi- tud menor que ¢/2. Entonces el cuadrado completo Q, est4 contenido en la vecindad ede A y, por tanto, también en Q .Se ve que el con- junto Q del sistema >. contiene por si solo a un cuadrado completo Qn y a su frontera, lo cual es contrario a la hipétesis para la sucesi6n Qn. Esto completa'la demostraci6n. 142 Intreduccién al cAlculo y al an4lisis matem4tico d. Una aplicacién del teorema de Heine-Borel a conjuntos cerrados que estén contenidos en conjuntos abiertos Sea R un conjunto abierto en el plano.’ Por definicién, todo pun- to Pde R tiene una vecindad que se encuentra completamente en R. Para puntos P préximos a la frontera de R, la vecindad tiene que ser muy pequefia. Es notable el hecho de que para P confinado en un subconjunto cerrado S de R, puede hallarse un tamaiio uniforme para las vecindades que estén contenidas Si un conjunto cerrado y acotado S esta contenido en un conjunto abierto R, existe un & positivo tal que la vecindad « de todo punto P de S esté contenida en R. En otras palabras, los puntos que no estan en R se encuentran por lo menos a una distancia € de todos los pun- tos de S$? Para la demostraci6n, se aplica la hipétesis de que R es abierto. Para todo punto P en R existe un disco con centro en P que esta con- tenido en R. El radio de este disco, llamémosle r, depende de P; es decir, r = r(P). Témese ahora para cualquier P en S, el disco abierto de radio 4r(P) y centro en P. Por el teorema de Heine-Borel, puede hallarse un nimero finito de estos discos que cubren el conjunto compacto S. Por tanto, puede hallarse un nimero finito de puntos Pi, . . ., Pn en S tales que todo punto P de S esté contenido en uno de los discos de centro Py y radio $r(Pr) parak =1,.. .,n. Seacel menor de los nimeros positivos +r(P1),. . .,4.r(Pn). Entonces, para todo Pen S, la vecindad ¢ de P se encuentra en R, porque P se en- cuentra en algtn disco de centro Px y radio +r(Px ). Por construc- cién, el disco concéntrico D de radio r(Px) esté completamente en R. Como PPx < 4r(Pr) y ¢ < 4r(Pr), el disco D contiene al disco de radio P alrededor de P. Esto demuestra que el disco de radio & y centro P esté en en R. Como ejemplo, considérese una curva S que se encuentra en el conjunto abierto R. Tal curva es un conjunto de puntos P = (x,y) que puede representarse en la forma x=¢), y=) 1Todo lo que se dice en este parrafo’se aplica con igual propiedad a las dimensiones superiores si se sustituye el término “disco” por el de “bola”. 2Es esencial que S sea acotado. Si, por ejemplo, R es el semiplano abierto y > Oy S €s conjunto cerrado que consiste de los puntos en el plano x, y con y > 1/x,x > 0, la frontera de R se aproxima arbitrariamente a los puntos de S. Funciones de varias variables y sus derivadas 143 con el auxilio de dos funciones continuas ¢ y W, donde el parametro ¢ varia sobre un intervalo cerrado 0 <¢<1.! Tal curva S es un con- junto cerrado de puntos. En efecto, sea Pi, P2,. . . una sucesién de puntos sobre S que converge a un punto P, Considérense los valores correspondientes del parametro: ti, tz, . . ., los cuales todos estan en el intervalo cerrado a 0. Si f es continua en cada punto de S, para cada punto. 6 en S exis- te una vecindad 8 de P de un cierto radio 8 = 8(P) tal que |f(Q) — f (P)| por su semejanza con los signos < y > de la aritmética (0, mAs precisamente, con los sig- nos < y >). Los simbolos en cuestién comparten con estos tltimos las propiedades basicas: SCT y TCS implicaque S=T SCT y TCR implicaque SC RI Una diferencia basica entre los signos “contenido en” para los con- juntos y los signos de orden para los nimeros es que para los nameros reales siempre se tiene x < y, o bien, y < x, mientras que para los conjuntos ninguna de las proposiciones S C T’, o bien, TC S tiene que cumplirse. El simbolo C sélo define un ordenamiento “parcial” entre conjuntos; de dos conjuntos es posible que ninguno contenga al otro. TEste es el silogismo comGn de la légica: Si todos los puntos con la propiedad A tienen la propiedad B y todos los objetos con la propiedad B tienen la propiedad C, entonces todos los objetos con la propiedad A tienen la propiedad C. Funciones de varias variables y sus derivadas 147 b. Unién e interseccién de conjuntos Durante las dltimas décadas, un gran namero de simbolos légicos ha encontrado amplia aceptacién en las matematicas, de modo que ahora es costumbre expresar muchos teoremas matemAticos com- pletamente en notacién simbélica sin el uso de palabras ordinarias 0 estructuras de oraciones.' El uso de la notacién simbélica apropiada ha sido esencial para el desarrollo de las matemAticas desde sus prin- cipios; de hecho, en algunos casos raros, se ha retardado el progreso en algin campo durante siglos precisamente por la falta de una notacién apropiada; tal vez ese fue el caso con el Algebra en la an- tigtiedad. Por otra parte, una notacién demasido concentrada puede requerir un gran esfuerzo del lector que trate de relacionar la infor- maci6n en la forma “dishidratada” con su experiencia ordinaria. Los autores de libros que no estan dedicados ante todo a la légica y a los fundamentos de las matemAticas transigen en el uso de las abre- viaturas logicas, de acuerdo con sus gustos y los requerimientos de los temas especiales bajo consideracién. Existen dos simbolos mas de la teoria de conjuntos que encon- traremos casi indispensables posteriormente en este libro, a saber, los simbolos para las operaciones de “unién” e “interseccién” de conjun- tos. Dados dos conjuntos S$ y T se escribe S U T para la “union” de los dos conjuntos, es decir, para el conjunto de los elementos que es- tan en S“o” en T: SUT={a:aES 0 aeET}2 De modo semejante, la “interseccién” S$ 1) T de S y T se define como el conjunto de los elementos que pertenecen tanto a S como a T: SNT={a:aeES y aeET}. iEjemplos de simbolos usados con frecuencia son los que siguen: {x1, 82, . » +) Zn} el conjunto cuyos miembros son precisamente x1,. . «xn § x T:el conjunto de las parejas ordenadas (a,) cona € Sy b © T (“producto car- tesiano” de los conjuntos S, T) =>: “implica” ax: “existe una x” vx: “ para toda x”. 2Aqui la palabra “o", como el latin vel, no es exclusiva. SU T' consiste de los ele- mentos que pertenecen por lo menos a uno de los dos conjuntos S, T pero puede per- tenecer a ambos. 148 Introduccién al cAlculo y al an4lisis matematico Por ejemplo, si Sy T son intervalos sobre _eje de los nimeros reales ysi S= {x:3 —1. La interseccion de la misma familia de discos contiene dnicamente al punto (1, 0). c. Aplicaciones a los conjuntos de puntos en el plano Algunos de nuestros primeros resultados y definiciones (ver las pp. 80) se pueden reescribir mas compactamente en la notacién in- 150 Introduccién al cAlculo y al andlisis matemAtico troducida en las dltimas secciones. Por tanto, dado un conjunto S de puntos en el plano, se obtiene una descomposicién del plano com- pleto m en tres conjuntos ajenos, a saber, el conjunto S® de los puntos interiores de S, el conjunto 4S de los puntos frontera de S y el con- junto S, de los puntos exteriores de S. n= S°UISUS o m4s precisamente, n= S°+4S+ Se Puesto que los conjuntos son ajenos: 8°) aS =I3S 1 Se= Se S°=O. Aqui SCSCS +458. El conjunto § definido por q) $=S89+05=SUaS es la cerradura de S. Se tiene S° = S para S abierto y S = S para S cerrado. El lector puede verificar, como ejercicios, las proposiciones si- guientes: aS = aS (‘La frontera de un conjunto siempre es cerrada”.) § = § (“La cerradura de un conjunto siempre es cerrada”.) (S%)9 = S°, (S.)° = Se(“Los conjuntos S°.y S, son abier- tos”.) Aa) SUPC(SUTY, SUTCSUT %b) SU T)CaSuaT La unién de conjuntos abiertos es abierta. La unién de un namero finito de conjuntos cerrados es cerrada. La interseccién de un némero finito de conjuntos abiertos es abierta. La interseccién de conjuntos cerrados es cerrada. Las ultimas proposicionesindican un tipo de simetria (‘“duali- Funciones de varias variables y sus derivadas 151 dad”) entre las nociones de “‘abierto” y “cerrado”, “unién” e “inter- seccién”. Esto se hace mAs preciso si se introduce el complemento C(S) de un conjunto S, es decir, el conjunto de puntos en el plano x que no pertenecen a S:* C(S) = (P: Pen, Pe S}=n-S. Se tiene C(S) =S., ACS) = 9S, — C(Se) Se, Si S es abierto, C(S) es cerrado, y viceversa. El complemento de la interseccién de varios conjuntos es la unién de sus complementos. En esta notacién, el teorema de Heine-Borel toma una forma par- ticularmente simple. “Una familia F de conjuntos cubre a un con- junto S“, significa simplemente que S est4 contenido en la unién de los conjuntos de F. Entonces el teorema simplemente dice: Si F es una familia de conjuntos abiertos en el plano y si S es un conjunto acotado y cerrado tal que SC UT, Ter entonces se puede hallar un nimero finito de conjuntos Ti, Tz, . - -, Tn & F tales que SCU Tr. kaa A.4, Funciones homogéneas Las funciones homogéneas mas simples que ocurren en el anilisis y sus aplicaciones son las formas o polinomios homogéneos en varias variables (ver la p. 38), Se dice que una funci6n de la forma ax + by es una funcién homogénea de primer grado en x y y, que una fun- cién de la forma ax? + bxy + cy? es una funcién homogénea de segundo grado y, en general, que un polinomio en x y y(o en un niimero mayor de variables) es una funcién homogénea de grado h si, en cada término, la suma de los exponentes de las variables indepen- dientes es igual a h, es decir, si los términos (independientemente de los coeficientes constantes) son de la forma x, xi-ly, ah By, yh, 1 Para conjuntos $ de puntos en el espacio tres X, el complemento de S de define como 2! — S,el conjunto de los puntos de 5 que no pertenecen a S. 152 Introduccién al calculo y al an4lisis matematico Estos polinomios homogéneos tienen la propiedad de que se cumple la ecuacién f(tx, ty) = tf(x, y) para todo valor de ¢. M4s generalmente, se dice que una funci6n f(x y+.) es homogénea de grado h si satisface la ecuacién f(tx, ty,. . .) = f(x,y, -- -) Ejemplos de funciones homogéneas que no son polinomios, son tan(2) (h=0), tsen 5 + yt +x log = T> (h=2), Otro ejemplo es el coseno del Angulo entre dos vectores con las com- ponentes respectivas x, y, 2 y U, UV, W: xu + yu + zw _ Jety +o ie+ ore (h= 0). La longitud del vector con componentes %, y, 2, Vat yt eB es un ejemplo de una funcién que es positivamente homogénea y de primer grado; ésto es, la ecuacién que define a las funciones ho- mogéneas no se cumple para esta funci6n a menos que ¢ sea positiva o sea igual a 0. Las funciones homogéneas que también son diferenciables satis- facen la ecuacién diferencial parcial de Euler xfe + Yfy + afets + + =hf(x,y,%-..) Para probar ésto, se derivan ambos miembros de la ecuaci6n f(tx, ty, .. .) = f(x,y, . .-) con respecto a t; ésto puede hacerse, dado que la ecuaci6n es una identidad en ¢t. Aplicando la regla de la cadena a la funcién de la izquierda, se obtiene xftx, ty...) + Wilte, ty, ..)t+ + + SA fe,y,...). Si se hace la sustitucién ¢ = 1 en ésto, se llega a la conclusi6n. Inversamente, es facil demostrar que la homogeneidad de la fun- Funciones de varias variables y sus derivadas 153 cién f(x,y,...) es una consecuencia de la relacién de Euler, de modo que Ja relacién de Euler es una condicién necesaria y suficiente para la homogenetdad de la funcién. El hecho de que una funcién es homogénea de grado h también puede expresarse diciendo que el valor de la funcién dividida entre x* s6lo depende de las razones y/x, 2ix,.... Por lo tanto, basta con demostrar que de la relacién de Euler se deduce que si se introducen las nuevas variables la funci6n BGI d= BME MG I= BENG) ya no depende de la variable & (es decir, que la ecuacién ge = 0 es una identidad). Para probar ésto, se aplica la regla de la cadena 1 h &=(fetnhyt+-- en gil 1 h = (he + fv ++ + am pail La expresion de la derecha se anula en virtud de la relacién de Euler y queda probada la proposicion. También puede probarse esta proposicién en una forma mas elegante, pero menos directa. Se desea demostrar que, a partir de la relacién de Euler, se deduce que la funcién at) = Uf(%, 9, .- .) — f(x, ty. . -) tiene el valor 0 para todos los valores de t. Es obvio que g(1) = 0. Una vez mas, 8 (t) = ht f(x,y, . «) — afte, ty... .) — yflte, ty...) . Aplicando la relacién de Auler a los argumentos #x, ty,.. . se en- cuentra que afdix, ty...) + yhlts, ty, te =P Kin. .), y, por tanto, g(t) satisface la ecuacién diferencial 154 Introduccién al cAlculo y al andlisis matematico h Bs) =8O;- Si se escribe g(é) = Y(t", se obtiene g’(t) = g(t) + ty’), de modo que (2) satisface la ecuacion diferencial ty) = 0, la cual tiene la solucion Gnica y = constante = c. Ya que para t= 1 es obvis que y(#) = 0, la constante c es 0 y, asi, g(t) = 0 para todos los valores de ¢, lo que tenia que demostrarse. CAPITULO 2 Vectores, matrices, transformaciones lineales En el Volumen I, Capitulo 4, ya se han estudiado los vectores en dos dimensiones. Los conceptos geométricos en dimensiones supe- riores hacen incluso més esencial el uso de los vectores. Los vectores sirven para expresar muchas ecuaciones complicadas concisamente, en una manera que exhibe con claridad aquellas caracteristicas que no dependen de la seleccién particular de los sistemas de coorde- nadas. 2.1 Operaciones con vectores a. Definicién de los vectores Se introducen los vectores en el espacio n dimensional como en- tidades que pueden sumarse entre si y multiplicarse por escalares. Es- pecificamente, un vector A es un conjunto de n ndimeros reales! @,..-.,@2 enun orden definido. A=(a1,.. .,@n) (Siempre emplearemos las letras negritas para denotar a los vectores.) Los ntimeros ai,. . . ,@n se llaman componentes de A. Dos vectores A=(ai, . . .,4n) y B = (bi,. . ., bn) son iguales si y sélo si tienen las mismas componentes. 1Para nuestros propésitos basta con considerar Gnicamente nameros reales como componentes, aunque en otros contextos también se-usan vectores sobre otros cam- pos numéricos. is matemAtico 156 Introducci6n al calculo y al ani La suma de dos vectores cualesquiera A = (a1, . . ., dn) y B= (bi, ...«,6n) se define por (la) A+ B= (ai + bi, a2 + be,.. .,an + ba); se define el producto del vector A = (ai,. . . , Gn) por el escalar (es decir, el ntmero real) 4 como (1b) AA = (Aan, Aaa, . . ., Aan)? Mas generalmente, a partir de cualquier namero finito de vectores A = (ai, a2... , Gn), B= (bi, bz, . . ., bn). . », D=(di, da, . . , dn) yun némero igual de escalaresA, yn, . . . , y puede formarse la combinacion lineal A+ ~B++ ++ +yD=(Qar+pbite +++ ydi,..., Aan + pbn ++ + + +ydn). En particular, cualquier vector A = (ai, . . ., dn) puede representarse como una combinacién lineal de los n “vectores coordenados” (2a) E. =(,0,0,.. .,0), Ex = (0,1,0,...,0),..., En= (0,0,0,...,1). Obviamente, (2b) A= aE; + a2E2 ++ + + + anEn. Se usa el simbolo 0 para el “vector cero”, cuyas componentes son todas cero: 0 = (0, 0,..., 0). Se escribe —A parael vector (—1)A = (-a1, —a2,..., —@n). Trivialmente, a partir de estas definiciones se concluye que las sumas de vectores y los productos con escalares obedecen todas las leyes algebraicas usuales, siempre y cuando tengan significado.’ Ejemplos de objetos que se representan de modo conveniente por Los vectores son diferentes de otros objetos que pueden describirse por medio de conjuntos ordenados de n nimeros reales (por ejemplo, puntos en el espacio eu- clidiano n dimensional o sobre una esferaen n +1 dimensiones) precisamente por el hecho de que permiten las “operaciones lineales” A + By 4A. La adicién de puntos definida de modo semejante en términos de sus coordenadas no tendria significado geométrico, al menos. ningtin significado independiente del sistema coordenado es- pecial que se use. Los vectores se representardn posteriormente por medio de parejas de puntos (ver la p. 140). Vectores, matrices, transforimaciones lineales 157 medio de vectores se tienen en las funciones que son combinaciones lineales de un némero finito de funciones elegidas apropiadamente. Asi, el polinomio general de grado Sn en la variable x, P(x) = ao + ix + a2x? + + + + + Gn”, puede representarse por el solo vector A = (ao, a1,. . . ,@n) en el es- pacio (n + 1) dimensional. La adici6n de vectores y la multiplicacién por escalares corresponden entonces a las mismas operaciones Ile- yadas a cabo para los polinomios. De modo semejante, el polinomio trigonométrico general de n-ésimo grado, f(x) = a0 + 3 (ax cos her + be sin he) (ver el Volumen I, p. 577) puede representarse por medio del vector (ao, a1, . . ., Gn, bi, bz, . . ., bn) en el espacio (2n + 1) dimensional. La function lineal homogénea general de tres variables, U = aX + exe + Gaxs se representa por el vector (a1, a2, a3) en el espacio tridimensional, y la forma cuadrdtica general en tres variables, u = aix1® + aex2 + asxs® + 2aaxexs + 2asxsxi + asxixe por el vector (a1, a2, a3, 24, 45, a6) en el espacio hexadimensional. b. Representacién geométrica de los vectores Los vectores en el espacio n dimensional, precisamente como en el plano, pueden concebirse geométricamente como ciertas aplicaciones Estas leyes son las siguientes: @A+B=B+A,A+B+O=A+B+C @) MA+B)=AA+AB, @+WA=2A + uA, Qu)A = AA) (3) Existe un elemento dinico O tal que A + O = A para todo A (4) Existe un elemento Gnico— A para A dado, tal que A + (—A) =0 (5) 0A = 0, 1A =A para todo A. Generalmente, los conjuntos de objetos para los cuales estan definidas la adicion de los objetos y la multiplicacién por escalares, y obedecen estas leyes, se llaman espacios vectoriales. 158 Introduccién al cAlculo y al an4lisis matematico del espacio, las traslaciones o desplazamientos paralelos.. El vector A=(ai, a2,..., Gn) puede describirse como la traslacién del es- pacio euclidiano n dimensional R" que aplica cualquier punto P = (x1, x2, ...,%n) en el punto P’ = (x1', x2’, . . ., ¥n') con coorde- nadas (8a) xa! = x1 + a1, x9! = x2 + G2, . «Xn! = Xn + ant La traslacién, o el vector correspondiente A, queda determinada de modo énico si para un punto particular P = (x1, 2, . . - » Xn) se da laimagen P’ =(x1',xx/,...,%n’) obviamente, por (3a), (3b) A = (x1! — a1, 22! — x2, .. «Xn! — Hn). Esta traslacin se denotaré por A = PP’ y se dir4 que el vector x queda representado por la pareja ordenada de puntos P y P’. En esta representacién, a P se le da el nombre de punto inicial y a P’ el de punto terminal o final. En los dibujos coménmente se indica el vector A = PP’ por medio de una flecha que se extiende desde P hasta P’. El mismo vector A tiene muchas representaciones A = PP” por medio de una pareja de puntos P y P’, El punto inicial P es com- pletamente arbitrario, dado que la aplicacién definida por A puede actuar sobre cualquier punto y, entonces, determinar una imagen P'2 El vector cero, 0, corresponde a la “aplicacién identidad” en la que cada punto se aplica sobre si mismo: 0= PP. Como en el plano (Volumen I, p. 384), la suma de dos vectores A=(a,..., an), B= (bi,..., bx) proporciona el producto simbélico de las aplicaciones correspondientes. Si A lleva al punto P = (x1, .. ., %n) hacia el punto P’ = (x1',. . . , xn’) y B lleva al punto P” hacia el P” =(xv’,...,n”, entoncesC = A + B corresponde a la traslacién que lleva a P hacia P”, puesto que wi = xe + bt = (ae + as) + be = me + (et BY) . , n. En notacién vectorial, se tiene parai= TSe entiende que los dos puntos P y P’ se encuentran en R* y que sus coordenadas se toman con respecto al mismo sistema coordenado. *Ocasionalmente, se usa la notacién P’— P para el vector PP’, la cual, de acuerdo con la formula (3b), sugiere la nocién de vectores como diferencias de puntos. Vectores, matrices, transformaciones lineales 159 (4) A+B = PP’ + PP” = PP’. Si se representa B en la forma PP” dandole el mismo punto inicial P de A, se encuentra que A + B = PP” queda representado por la diagonal del paralelogramo con vértices P, P’, P", P” (ver la Fig. 2.1). Figura 2.1 Adicion de vectores. Intercambiando el punto inicial y el final del vector A = PP’ = (x1 — x1, x2! — x2, . . . , Xn’ — Xn)se obtiene el vector opuesto oy PP = (a1 — x1, %2 — 2!) 2, Xn — Xn!) = (-1I A= A. La aplicacién P’—P, correspondiente a —A, es la inversa a la aplicacién A; Ilevando a cabo primero A y, a continuacién, —A se llega a la aplicacién identidad, de acuerdo con la férmula (-A)+A=(-14+DA=0A=0, Correspondiendo a (4), se tiene la tan usada férmula para la diferen- cia de dos vectores A = PP’ y B = PP” con punto inicial comin: . os ~ os -. . _. (4a) B—A-= PP" — PP = PP” + PP = PP + PP” = PP". La diferencia de los vectores PP” y PP” se representa aqui por el tercer lado del triangulo con vértices.P, P’, P”. Con cada punto P=(x1,..., Xn) puede asociarse un vector nico que tiene al,origen como punto inicial y a P como punto final; éte es el vector 160 Introduccién al calculo y al andlisis matematico = OP = (x1, . . «5 Xn), el llamado vector de posicién de P. Las componentes del vector de posicion de P son precisamente las coordenadas de P. Por ejemplo, el vector coordenado Ei = (0,...,0,1,0,...,0) de la formula (2a) es el vector de posicién del punto sobre el eje x, positivo que se Figura 2.2 El vector PP’ como diferencia de los vectores de posicin. encuentra a la distancia 1 del origen. Cualquier vector A = PP’ puede escribirse siempre como la diferencia de los vectores de po- sicién de su punto final y su punto inicial: (6) PP = OP - OP (ver la Fig. 2.2). c. Longitud de los vectores, éngulos entre direcciones La distancia entre dos puntos P = (m,..-,*n)y Po = (xi',.. .,%n’) en el espacio euclidiano n dimensional R* esta dada por la formula’ © MGV = may? F ea! = x2) Fe Fn = on) Como sélo entran en la expresién para r las diferencias de las coor- denadas correspondientes de P, P’, se ve que la distancia es la misma para todas las parejas de puntos P, P’ que representan al mismo vec- TEn dos o tres dimensiones puede deducirse la formula geométricamente aplicando el teorema de Pitégoras. En dimensiones superiores la expresién para r puede con- siderarse como la definicién de distancia entre dos puntos en el espacio euclidiano n dimensional, cuando se refiere a un sistema coordenado cartesiano. Vectores, matrices, transformaciones lineales 161 tor A = PP’. Arse le da el nombre de longitud del vector Ay se es- cribe r =|A]. El vector A = (a1,. . . ,@n) tiene la longitud (6a) [Al =Var® + a2? + + + Fan® El vector 0 = (0, 0,. . . , 0) tiene longitud 0. La longitud de cual- quier otro vector es un namero positivo. En la geometria euclidiana los 4ngulos pueden expresarse en tér- minos de longitudes. Esto se logra por medio de la férmula trigo- nométrica (“ley de los cosenos”) que da el angulo ¥ entre los lados a y ben un triangulo con lados a, 6, ¢: —e 5 5 a+b 2 (6b) cos Y= Esta formula se aplica a un tridngulo con vértices P,P’, P”. (Fig. 2.3a). Los lados a y b del triangulo son las longitudes de los vectores A = PP, B = PP”, mientras que el lado c es la longitud del vector @) (b) Figura 2.3 Representacién vectorial de una recta que pasa por un punto dado con una direccion dada. C=PP' = PP" - PP =B-A. Para A=(4,..-,@n), B=(bi,...,bn) 162 Introduccién al cAlculo y al an4lisis matematico se tiene C=(,...,¢n)=(b1—a1,..., bn — an). Por (6b), cos y = AR+IBI? =1C1? 2)A] |B] donde IAPS Sat, (Bie = Soe, | ejpe= h(a Por tanto, para A+0,B +0, abi + aebe ++ + + +a) Vart+e es Fan Vb + () cos y= Se ve que el angulo y en el triangulo PP’P” sdlo depende de los vectores A = PP’ y,B = PP”. En consecuencia, a la cantidad cos 1, dada por la formula (7), se le da el nombre de coseno del dngulo! entre los vectoresA = (a1,...,@n) y B=(bi,.. ., bn). La formula (7) para el cos y en realidad siempre define Angulos reales y entre dos vectores cualesquiera diferentes de cero A, B,dado que siempre proporciona un valor con |cos y|< 1. Esta es una con- secuencia inmediata de la desigualdad de Cauchy-Schwarz (Volumen I, p. 15) (8) (abi + a2bz + + + + + ann)? SG? + a2? $+ + + +an®\(bi? + be? + + + + + bn?) Al calcular los angulos entre el vector A y cualquier otro vector B, a partir de (7), s6lo se requiere conocer las cantidades ed BS Tattoo) TEI propio angulo y queda determinado de manera dnica s6lo si se restringe y aen- contrarse en el intervalo 0S Sn. Remplazando y por 2nm -t y (donde n es un en- tero), se obtienen todos los demas Angulos con el mismo valor de cos ¥, y cual- quiera de éstos se considerara como un Angulo entre A y B. Vectores, matrices, transformaciones lineales 163 que se conocen como cosenos directores de A. Todos los vectores diferentes de cero con los mismos cosenos directores forman los mis- mos Angulos con otros vectores y, por tanto, puede decirse que tienen la misma direccién. De (7) se concluye que los cosenos directores de A pueden interpretarse como los cosenos de ciertos 4ngulos: (10) & = cos a, donde a es el Angulo entre A y el i-ésimo “vector coordenado” Ex = (,...,0,1,0,...,0). Los n cosenos directores del vector A satisfacen la identidad* (11) cos? a + cos? a2 + + + + cos? On El tinico vector sin cosenos directores (y, por tanto, sin direccién) es el vector cero. Dos vectores A y B que no sean iguales a 0 tienen la misma direc- cién si y sdlo si tienen los mismos cosenos directores, es decir, si 1 1 Laz ies. A= By IA] Evidentemente, éste es el caso si y sdlo si A y B satisfacen una re- lacion A = 4B, donde A es positiva. Aqui 4 = [A|/|Bles la raz6n de las longitudes de los vectores. Un vector de longitud 1 se llama vector unitario. El vector Gus 8) = Tay A cuyas componentes son los cosenos directores de A, es el vector unitario en la direccién de A. El vector —A = (—ai,. . . , —@n) opuesto a A tiene los cosenos directores —&. Se dice que su direcci6n es opuesta a la de A. Los vec- tores A y B (ninguno de los cuales es el vector cero) son paralelos si tienen la misma direccién, o bien, si tienen direcciones opuestas, pero para que exista paralelismo es necesario que A = AB donde } es cualquier namero A 4 0.Lascomponentes ai, . . ., @n de cualquier Tn dos dimensiones la relacién cos? a1 + cos? a2 = 1 nos permite elegir para Ga el valor 2/2 — ax, En tres o mas dimensiones la relacion (11) entre los cosenos directores no corresponde a relacién lineal simple alguna entre los propios angulos ay 164 Introduccién al calculo y al andlisis matematico vector A # 0 paralelo a una direccién dada se llaman ntimeros direc- tores para esa direcci6n. Si a un vector unitario (1, . En) se le asigna el origen 0 como punto inicial, el punto final P = (&1, . . - , 6x) es un punto sobre la “esfera unitaria” (es decir, la esfera de radio 1 y centro en el origen 0) E12 + Gee ++ © » + En? = 1. Dado que existe exactamente un vector unitario en cualquier direccién dada, se ve que las diferentes direc- ciones en el espacio n dimensional pueden representarse por los pun- tos de la esfera unitaria. Los puntos de la esfera que corresponden a direcciones opuestas estan diametralmente opuestos. Intuitivamente, puede imaginarse una recta como una curva de “direccién constante”. Esto sugiere que una recta en el espacio n dimensional se defina como un lugar geométrico de los puntos con la propiedad de que todos los vectores # 0 con punto inicial y punto final sobre la recta sean paralelos. Esta definicién conduce inme- diatamente a una representaci6n vectorial para las rectas. Para cualesquiera puntos distintos P, Q sobre la recta L, el vector PQ es paralelo a un vector fijo A, es decir, PQ =A (A #0). Si se mantienen fijos P y A y se hace que Q recorra todos los puntos de la recta L, para el vector de posicién de Q se tiene la f6rmula (ver la Fig. 2.3b) (12) 0@ = OP + PQ = OP + 2A. Aqui el parametro 4 varia sobre todos los valores reales; el valor 4 = 0 corresponde al punto Q = P. Si Q tiene las coordenadas x1, . xn; P, las coordenadas ¥1, . . - , ¥n;-y A, las componentes ai,..., @n, la formula (12) corresponde a la representacién paramétrica de la recta = Ye + has G +n) donde el parametro A varia sobre todo 2 real. El punto P divide a la recta L en dos semirectas, o “rayos”, que se distinguen por el signo de 2. Para <0. el vector P@ tiene la misma direccién que A (“apun- Vectores, matrices, transformaciones lineales 165 ta” en la direcci6n de A); para’ > 0, el vector P@ apunta en la direccién opuesta. D. Productos escalares de vectores La cantidad que aparece en el numerador de la formula (7) para el Angulo 4 entre dos vectores A = (a1,. . . ,@n) yB = (bi... , bn) se llama producto escalar de Ay B y se denota por A+ B: (13) A+B =aibi + azb2 ++ + + + anda. Expresado en términos de entidades geométricas, puede escribirse como (14) A-B=(A| |B] cos y. El producto escalar de dos vectores es el producto de sus longi- tudes multiplicado por el coseno del dngulo entre sus direcciones. Si A= PP,B = PP”, puede interpretarse p= |A| cosy geométri- camente como la proyeccién (con signo) del segmento PP’ sobre la recta PP” (ver la Fig. 2.4). p recibe el nombre de componente del vector A en la direccin de B. Por la formula (14), se tiene (14a) A-B=p|BI. De donde, el producto escalar de los vectores A, B es igual a la com- ponente de A en la direccién dé B multiplicada por la longitud de B. Si B es el vector coordenado E; = (0,..., 1,. . . 0) en la direc- cién del eje x; positivo, la componente de A en la direccion de B es simplemente ai, la 7-ésima componente del vector A. A partir de la definicién (13), facilmente se verifica que el producto escalar satis- face las leyes algebraicas usuales (15a) A-B=B-A (ley conmutativa) (15b) MA +B) =(AA)+B=A- (AB) (ley asociativa)* Tpor supuesto, también es igual a la componentes de B en la direccién de A, mul- tiplicada por la longitud de A. 2Como el producto escalar de dos vectores no es un vector sino un escalar, no existe ley asociativa que involucre productos escalares de tres vectores, 166 Introduccién al cAlculo y al an4lisis matematico Pp Figura 2.4 Producto escalar de los vectores A= PP’ y B= PP” (15c) A-(B+C)=A-B+A-C, (A+B)-C=A-C+B-C (leyes distributivas). La importancia fundamental del producto escalar proviene del hecho de que, expresado en términos de las componentes de los vec- tores A y B, tiene la sencilla expresién algebrazca (13), mientras que, al mismo tiempo, tiene una interpretacién puramente geométrica representada por la formula (14), la cual no hace mencién de las componentes de los vectores en sistema coordenado especifico alguno. Los productos escalares no son Utiles Gnicamente para describir 4n- gulos sino que forman la base para deducir también expresiones analiticas para las areas y volamenes. A partir de la desigualdad de Cauchy-Schwarz (8) se concluye que el, producto escalar satisface la desigualdad (16) |A-B/ SIA! |BI, la cual expresa que cos |S 1. Se vera (p. 231) que la igualdad en (16) s6lo se cumple si los vectores A y B son paralelos.o si al menos uno de ellos es el vector cero. Nétese que, por (6a) y (13), para B = A queda (17a) A-A=IAl, Es decir, el producto escalar de un vector consigo mismo es el cuadrado de su longitud. Esto también se deduce a partir de (14), ya que el vector A forma el angulo y = Oconsigo mismo. La importante relaci6n Vectores, matrices, transformaciones lineales 167 (17b) A+B=0 para los vectores A, B diferentes de cero corresponde a cos y = 0, 0 bien, 7 = 7/2. Esta relacién caracteriza a los vectores A, B como “perpendiculares” u “ortogonales” o “normales” entre si. Por otra parte, A» B > 0 significa cos y > 0; es decir, puede asignarse a y un valor con 0 < y < 1/2; las direcciones de los vectores forman un 4n- gulo agudo. De modo semejante, A - B < 0 significa que los vectores forman un Angulo con 2/2 < y c.El vector A apunta hacia el semiespacio A + X > c. Con ésto quiere darse a en- tender que un rayo que emana de un punto Q del hiperplano en la direccién de A consiste de los puntos cuyos vectores de posicién X Figura 2.5a Ley de formacién del determinante de tercer orden Vectores, matrices, transformaciones lineales 169 satisfacen a A+ X >. En efecto, los vectores de posicién X de los puntos P de ese rayo estan dados por ~s a X= OP= 0Q@+)A=Y+)AA [ver (12)], donde Y¥ es el vector de posicién de Q y 4 es un nimero positivo. Entonces es obvio que A+X=A-+Y+A+)A=c+A)lAl?> ce. Mas generalmente, cualquier vector B que forma un Angulo agudo con A, apunta hacia el semiespacio A- X > c, dado queA-B>0 implica que A+X=A-+-(¥+1B)=A-Y+AA-Boc. Si la constante c es positiva, el semiespacio A+ X n, es decir, st el ntimero de incégnitas es mayor que el niimero de ecuaciones. La dltima proposicién puede plantearse geométricamente en una forma diferente, si se interpreta cada una de las ecuaciones (25a) como si enunciara que cierto producto escalar de dos vectores en el espacio n dimensional se anula. Entonces, una solucién no trivial x1, . ++ )%m corresponde a un vector X= (x1,..., Xm) #0. La anulacién del producto escalar de dos vectores que no se anulan sig- nifica que los vectores son mutuamente perpendiculares. Las ecuaciones (25a) afirman que X es perpendicular a los n vectores(a11 G12, . + +» 1m), (21,22, . . . , dam), » (Gnt,n2,---,@nm). En- tonces se tiene: Dado un conjunto de vectores que no se anulan, cuyo niimero es menor que la dimensién del espacio, puede hallarse un vector que sea perpendicular a todos ellos (y por tanto, por lo es- tablecido en la p. 171 es independiente de ellos). Regresando a los vectores en el espacio n dimensional, se observa una consecuencia mas del teorema fundamental: Todo vector ¥ en el espacio n dimensional depende de n vectores dados Ai,...,An, siempre que A1,..., An sean independientes. Puesto que como los n+ 1vectores Ai,...,An, Y deben ser dependientes, se tiene una relacion de la forma zA1 + z2Ae ++ + + +-2nAn + ent Y= 0, donde no todas las cantidades zi, . . . , Zn+1 se anulan. Entonces 2n+1 #0, ya que de lo contrario Ai,..., An serian dependientes, lo sque'seria opuesto a la hipétesis. Se concluye que 174 Introduccién al cAlculo y al andlisis matematico (26) Y= x1A1 + xoAot + + + + xnAn donde = - we i ua G= +m). Incidentalmente, los coeficientes xx en la representacién (26) de Y como una combinacién lineal de los vectores independientes Au, . . ., An estan determinados de manera tnica, porque si hubiera una segunda representaci6n Y = yiAi + yeAo ++ + + + ynAn restando se concluirfa que (a1 — yi)Ai + (2 — yo)Aa + + + + + (en — yn)An = 0. Aqui, para los vectores independientes Ai,..., Anse concluye que todos los coeficientes se anulan y, por tanto, que x1 = yi,..., Xn = Yn. Por otra parte, si A1,...,An son dependientes, evidentemente puede encontrarse un vector Y que no dependa de Aj, . . . , An, por- que, en ese caso, uno de los vectores Ai,. .., An depende de los otros, digamos An de Ai, . . ., An-1; entonces, un vector Y depen- diente de Au, . »An también es dependiente de Au,. . ., Ant No obstante, existen vectores Y en el espacio n dimensional que no dependen de n — 1 vectores dados (ver la p. 173). Como la independencia de Ai, . . . , An es equivalente al hecho de que el sistema correspondiente de ecuaciones lineales homogéneas (25a) tiene s6lo la solucion trivial, se ha deducido el siguiente teo- rema basico acerca de la resolubilidad de sistemas de ecuaciones lineales, a partir del teorema fundamental: El sistema de n ecuaciones lineales 111 + Gieke ++ + + + AinXn = V1 (27) 2x1 + Grexe ++ + + + GanXn = yo Gnixi + Gnax2 ++ + + + GnnXn = Yn tiene una solucién tinica x1,..., Xn para cualesquiera niumeros Vectores, matrices, transformaciones lineales 175 dados y1,.. . , Yn Siempre que las ecuaciones homogéneas a@iixX1 + Gi2x2 + + + * + dinkn = 0 (27a) Gaix1 + Geexe + + + + + dentn = 0 Gnix1 + Gnaxe ++ + + + Annktn = 0 solo tengan la soluci6n trivial x1 = x2 = + + + = Xn = 0. Stel sistema (27a) tiene una soluct6n no trivial, pueden hallarse los valores ¥1,.. . 5 Yn para los cuales el sistema (27) no tiene soluci6n. Aqui se tiene un teorema puramente de existencia, que no da in- dicacién sobre cémo se puede obtener realmente la solucién 4X1, x2. ++%n, si existe. Esto puede lograrse por medio de determinantes, como se discute en la Secci6n 2.3, a continuacién. Procederemos a realizar la demostracién del teorema fundamen- tal, aplicando la inducci6n sobre la dimensién n. El teorema afirma que cualesquiera n +1 vectores Ai,..., An, Y en el espacio n dimensional son dependientes. Para n= 1, los vectores se vuelven escalares y la proposicién que debe probarse es la siguiente: Para dos ntimeros cualesquiera Y y A pueden hallarse’ los ntimeros %o, %1, los cuales no se anulan simultaneamente, tales que xo¥ + mA = 0. Esto es trivial. Si ¥ = A = 0, tomese x9 = x1 = 1; en todos los demas casos, tomese x = A, x1 = —¥. Supé6ngase que se ha probado que n vectores cualesquiera en el es- pacio (m — 1) dimensional son dependientes. Sean A1,..., An, Y vectores en el espacio n dimensional. Se desea probar que Ai,..., An, ¥ son dependientes. Esto es evidentemente elcasosi Ai, ..., An, solos ya son dependientes. Por tanto, nos restringiremos al caso en el que Ai, . . . , Anson independientes; se probara que entonces Y es dependiente de Ai, . . . , An. Basta con probar que cada uno de los vectores coordenados Ei, . . .En, que se tienen en (22), depende de Ai,...,An, porque, por (23), cualquier vector Y es una combi- naci6n lineal de los E; y, por tanto, también de los Ax, si los Ei pueden expresarse en términos de los Ax, Sélo se probara que E, depende de Ai,...,An, ya que la demostracién para los otros E; es semejante. Basta con demostrar que el sistema de ecua- ciones 176 Intreduccié6n al cAlculo y al an4lisis matematico x1 + aiaxe ++ + * + AinXn=0 (28) inn G -,n-1) Gnixi + Gna, ++ + + + Gnntn = 1 tiene una solucién x1,...,%n. Ahora bien, las primeras n — 1 ecuaciones, las cuales son homogéneas, tienen una solucién no trivial %1,.+.,%n, como consecuencia de la hipétesis de induccién de que” vectores en el espacio (n — 1) dimensional son dependientes. Para esa soluci6n, sea Gnity + On2k2 ++ + + + QanXn = Aqui c + 0, ya que de lo contrario los vectores Ai, ..., An serian dependientes. Dividiendo x1, x2,..., Xn entre c, entonces se ob- tiene la solucién deseada del sistema (28). Esto completa la demos- traci6n del teorema fundamental. Ejercicios 2.1 1. Dar la representacién coordenada de la recta que pasa por el punto P = (—2, 0, 4) yen la direccion del vector A = (2, 1, 3). 2. (a) + Xm' Am, el vector PP’ = OP’ — OP = (x — mA + + + + + (Xn! — Xm)Am tiene como componentes con respecto a la base Ai,..., Am las diferencias de las coordenadas afines de los puntos P y P’. De acuerdo con la definicién dada, una variedad lineal unidimen- sional Si que pasa por el punto Pp es el lugar geométrico de los pun. tos P con vectores de posicién de la forma ~— OP =B+ mAi donde B y A: son vectores fijos (Ai # 0) y x1 varia sobre todos los numeros relaes. Por supuesto, Si es simplemente la recta que pasa por Po paralela a la direccién del’ vector Ai (ver la p. 163). Una 180 Introduccién al calculo y al andlisis matemAtico variedad lineal bidimensional, o plano bidimensional, Sz consiste de los puntos P con vectores de posicién OP = B + xiAi + x2Ae donde B, Ai, Az son vectores fijos (Ai y Az independientes) y x1 y x2 varian sobre todos los ntimeros reales. Los espacios lineales n dimen- sionales Sn son idénticos al espacio completo R"; porque cualquier vector Y es dependiente de 7 vectores linealmente independientes Ai, .,An (ver la p. 167) y, por consiguiente, el vector de posicién de cualquier punto P es representable en la forma OP =B+xmAr++ + + + xnAn Puede verse que las variedades lineales (n — 1) dimensionales son idénticas a los hiperplanos definidos en la p. 167: porque dados n — 1 vectores cualesquiera Aj, ...,An-1 en el espacio n dimensional, puede hallarse un vector A perpendicular a todos ellos (ver la p. 173). Entonces, para OP =B+uArts + + tx i Ant se tiene la relacién A-OP=B-Atm-Ar:At+ ++ +a1An1:A=BeA = constante, lo cual es precisamente una ecuaci6n lineal para las coordenadas de P. En general, la determinacién de las componentes 1 de un vector Y con respecto a una base Ai, .. . , Am requiere la solucién de un sistema de ecuaciones lineales del tipo (25). En un importante caso especial, los x; pueden hallarse directamente, a saber, cuando los vectores base forman un sistema ortonormal. Se dice que los vectores Ai, . . ., Am son ortonormales si cada uno de ellos tiene longitud 1 y dos cualesquiera de ellos son ortogonales entre si, es decir, si (32) a, — [lparai =k Av Ae = (bari Zh Vectores, matrices, transformaciones lineales 181 Si un vector Y es de la forma Y= x1Ai + x2Ae ++ + + +xmAn, se encuentra, usando las relaciones de ortogonalidad (32), que (383) Y+ Ar = x1A1+ At + xeAe+ Ar t+ + + + +xmAm+ Ai =x @=1,...,m). En particular, Y = 0 implica x: = 0 para i = 1,. .,. ,m; por tanto, los vectores ortonormales siempre son independientes. La formula (83) muestra que la componente x del vector ¥ con respecto a una base ortonormal Ai, . ..,Am es igual a la componente Y + A: del vector Y¥ en la direccién de Ai. Los vectores coordenados Ei, . . . , En definidos por las ecuaciones (22) forman precisamente una base or- tonormal asi, y las componentes del vector Y = (y1, . » Yn) con res- pecto a esta base son las cantidades Y - Ei = yi. Una base ortonormal también se distingue por el hecho de que la longitud de un vector y el producto escalar de dos vectores esta dada por las mismas férmulas que las de la base original Ei, . . . , En. Dados dos vectores cualesquiera Y y Y’ de la forma (84a) Y=mAr+++++4mAm, Y wAl ++ + + +%m'An se tiene (84b) YY’ = (wiAr ++ + + + xmAm)+ (xr'Ar+ + + + + tm'Am) = mAr+ (mA ++ + + + 4m'Am) te > +xmAm + (x1'A1 + + + + + Xm'Am) = xin! + xexe! te 6 6 + xmXm'1 En el caso particular Y’ = Y se encuentra, para la longitud del vector Y, la formula (84c) IWl= VY¥-Y=vxe+- - + Xm®. '§in las relaciones de ortogonalidad s6lo podria concluirse que Y + Y’ esta dado por la expresion mas complicada Y+Y'= Steusie donde cur = Ac Ax. a 182 Introducci6n al calculo y al an4lisis matematico Si la variedad lineal m dimensional Sm que pasa por el punto Po es generada por los m vectores ortonormales Ai, . . . ,Am, el sistema correspondiente de coordenadas afines se llama séstema coordenado cartesiano para el espacio Sm. Los vectores coordenados Ai, . . . ,Am son mutuamente perpendiculares y de longitud 1. La distancia d en- tre dos puntos cualesquiera con coordenadas cartesianas(x1, . . . , Xm) y (xr’,...,%m’) estd dada por la formula d= v(x" — met + + + Gm! = xm)? Mas generalmente, cualquier relacién geométrica basada en la nocién de distancia (tales como Angulo, 4rea, volumen) tienen la misma expresién analitica en cualquier sistema coordenado carte- b. Matrices La relacién (35a) Y=smArt++ +++ amAm entre los vectores Ai, . . . , Am, Y en el espacio n dimensional puede escribirse como un sistema de ecuaciones lineales [ver (25), p. 172] auix1 + Giaxe + + + + + AimXm = y1 (35b) Q2ix1 + Ge2x2 + + + + + GamXm = ye nix + Anax2 + + + + + AnmXm = Yn que relacionan las componentes y1, . . . , yn del vector ¥ en el sis- tema coordenado original con las componentes 21, . . . ,%m de Y con respecto a los vectores base Ay = (au, ax, . ., dnt) parai=1,..., m. Las relaciones lineales (35b) entre las cantidades x: y yj quedan completamente descritas por medio del sistema de n x m coeficientes ay. El sistema de coeficientes colocados en un arreglo rectangular pau az ss dim Gz. azz + + + Gam (36) a=| “|, Gn Gn2 + * * Gnm Vectores, matrices, transformaciones lineales 183 como aparecen en (35b), se llama matriz. (Normalmente, las ma- trices se denotaran por medio de letras minidsculas negritas.) La matriz a dada en (36) tiene mn “elementos” Qj; Estos elementos se arreglan en m ‘columnas” aun aie /@1m\ a1 a2 { a2m \. : Nami! \ane o bien, en 7 “filas” (a1 ai +++ aim), (az azz + + + dem), (Gn. Gnz + + + Gnm). Dos matrices se consideran iguales sélo si concuerdan en el nimero de filas y columnas y si los elementos correspondientes son los mis- mos. Las columnas de la matriz a pueden identificarse, respectivamen- te, con el conjunto de componentes de los vectores A1, As, . . ., Am. Con frecuencia la matriz a, cuyas columnas se forman a partir de las componentes de los vectores Ai, Az, . . ., Am, se esctibira como (37) a = (Ai, As... An). El sistema de ecuaciones (35b) que expresa fas n cantidades 51, - +)¥ncomo funciones lineales de las m cantidades x1, . . . , Xm puede resumirse en la sencilla ecuacién simbélica (38) aX=Y, donde X representa al vector (x1,. . ., xm) y Yalvector (yi,..., yn). Si los vectores columna Aj, . . . , Am de la matriz a son indepen- dientes, (38) puede interpretarse como la descripcién de un cambio de base, 0 un cambio del sistema coordenado, para los vectores. 184 Introduccién al cAlculo y al an4lisis matemAtico La ecuaci6n relaciona las componentes *1, . . . , %m del vector con respecto a la base Ai,...,Am en el subespacio Sm, con las com- ponentes yi, . . . , Yn del mismo vector con respecto a la base Ei, . . ., E, para el espaciocompleto S,. Esto podria llamarse la inter- pretacién “pasiva” de (38), en el cual los objetos geométricos —los vectores— permanecen fijos y s6lo se cambia el sistema de referencia. Existe otra interpretaci6n, “activa”, en la cual se cambian los vec- tores en lugar del sistema coordenado. Entonces las ecuaciones (36). describen una aplicacién de los vectores (x1, . . . , Xm) en un espacio m dimensional sobre los vectores (y1, . . - , yn) en un espacio n di- mensional. Una aplicacién dada por la ecuacién (38) 0, con mas detalle, por el sistema equivalente de ecuaciones (35b), recibe el nombre de lineal o afin. Por ejemplo, el sistema de ecuaciones (88a) y= 3m — Ean, ye — pnt gm, correspondiente a la matriz » I | 1 le Cole coho | cole wwIbo Cole 'En una aplicacién afin de vectores, las componentes y; del vector imagen Y son funciones lineales homogéneas de las componentes x: del vector original X, como en las formulas (35b). Si se identifican X y Y como vectores de posicién de puntos, las formulas (35b) definen una aplicacién de los puntos (x1, . . ., Xm) en el espacio R™ sobre los puntos (1, . . ..¥x) en el espacio R”, Las aplicaciones de puntos obtenidas en esta forma son las aplicaciones afines especiales que llevan el origen de R” hacia el origen de R*. La aplicacién afin mas general de puntos esta dada por las ecua- ciones lineales no homogéneas *) we x ajxct + by G aD) (Puede obtenerse a partir de una aplicacién especial, llevando el origen hacia el origen por medio de una traslacion con componentes bj). Aplicando la transfor- Vectores, matrices, transformaciones lineales 185 puéde interpretarse como una aplicacién de los vectores X = (x1, x2) en el plano sobre los vectores ¥ = (91, yz, ys) en el espacio tridimen- sional. Aqui los vectores imagen todos satisfaran la relacion (38b) yitye+y3=0 y, por tanto, son ortogonales al vector N = (1, 1, 1). Identificando los vectores X, Y con vectores de posicién de puntos, en (38a) se tiene una aplicacién del plano x1 x2 sobre el plano zen el espacio y1 y2 7s con la ecuacién (38b). Geométricamente, el punto (y1, y2, ys) se ob- tiene proyectando el punto (x1, xz, 0) perpendicularmente sobre el plano x. Alternativamente, la ecuacién (38a) puede interpretarse pasivamente como una representaci6n paramétrica para el plano x, con x1y x2 jugando el papel de parametros. Matrices diferentes dan lugar a aplicaciones lineales diferentes porque, por (35b), los vectores coordenados Ei =(1,0,...,0, Ex=(@,1,...,0),... se aplican sobre los vectores = (a1, @21, . . . , @ni), Az = (aia, a22,. . .,Gn2),... De donde, los vectores columna Ai, Az, . . .,An de la matriz ason precisamente las imagenes de los vectores coordenados Ei, Ex,..., E,. De aqui que la matriz a queda determinada de manera unica por la aplicacin. De importancia particular son las aplicaciones lineales Y = aX del espacio vectorial n dimensional hacia st mismo; éstas aplican un vector X = (x1,...,%n) sobre un vector Y = (yi,.. .,¥n) con el mismo nimero de componentes. Tales aplicaciones corresponden a matrices a con tantas filas como columnas, las llamadas matrices maci6n (*) a dos puntos P’ = (x1',.. ., xn’), P” = (x1",.. ., xm") con imagenes Q =O. 4 In, Q" =n", . . ., yn"), se ve que la aplicacién correspondiente de los vectores P™P” = (x1" — a1/,.- +5 Xm” ~ xm") = (a1, Xm) sobre los vec- tores QQ” = (yn! = 91',. + 5 yn! — yn!) = (yn, . Yn) est dada por las ecua- ciones homogéneas (35b). 1La recta que une a (21, x2, 0) y (yi, 2, ys) €s paralela ala normal N dex. 186 Introducci6n al cAlculo y al andlisis matematico cuadradas.' Escrito en términos de las componentes, la aplicacién. Y = aX correspondiente a una matriz cuadrada a con n filas y columnas toma la forma (27), p. 174. El teorema basico de la re- solubilidad de los sistemas de n ecuaciones lineales para n cantidades desconocidas (p. 174) ahora puede enunciarse alternativamente como sigue: Para una matriz cuadrada a existen dos postbilidades mutuamen- te exclustvas: (1) aX + 0 para todo vector X #0 (2) aX = O para algin vector X +0. En él caso (1), para todo vector Y existe un vector tinico X tal que Y = aX. En el caso (2), existen vectores Y¥ para los cuales la ecuacién Y =aX no se cumple para vector X alguno.? Se dice que la matriz a es singular en el caso (2) y no singular en el caso (1). Dado que la existencia de una solucién no trivial X de la ecuacién aX =0 es equivalente a la dependencia de los vectores columna de la matriz a, se ve que una matriz cuadrada a es singular sty solo si sus vectores columna son dependientes. c. Operaciones con matrices Es costumbre denotar los elementos de una matriz a como en (36), por medio de letras que llevan dos subindices, tales como aj. Los subindices indican la localizacién o direccién del elemento en la matriz, dando el primer subindice el namero de fila y el segundo el namero de columna. Para una matriz con n filas y m columnas que tiene los elementos aj, el subindice 7 varia sobre 1, 2,..., ny el subindice ¢ sobre 1, 2, . . ., m. A menudo la ecuacién (36) se abrevia en la formula a= (a), la cual exhibe los elementos de la matriz a pero no muestra los nimeros de filas y columnas, los cuales tienen que deducirse en relacién con el contexto.* En el ejemplo Las matrices mas generales con ntimeros arbitrarios de filas y columnas se conocen como matrices rectangulares. 2En el caso (1) la ecuacion ¥ = aX representa una aplicacién uno a uno del espacio vectorial n dimensional sobre si mismo. En el caso (2) la aplicacién no es uno a uno ni sobre. 3La letra a en ay es el nombre de una funcién real de las variables independientes j ¢ i. El dominio de esta funcién consiste de los puntos en el plano j, 7 cuyas coor- Vectores, matrices, transformaciones lineales 187 1! 2! Blos++ ml! \ 2! 3! Abe ee (meD! | a=(a) =| 2! ay BE +++ (m2)! nt (n+ YD! (m $2)!+ + + (mtn—I)! se tiene az = (i+ j — 1)! La adicion de matrices y la multiplicacién de matrices por es- calares se definen en la misma forma que para los vectores. Si a = (aj y b = (bx) son matrices del mismo “tamafio” —es decir, con el mismo namero de filas y columnas— se define a + b como la matriz que se obtiene sumando los elementos correspondientes: at b= (ay + dj). De modo semejante, para un escalar 1 se define 4a como la matriz que se obtiene multiplicando cada elemento de a por el factor A: da = (hay). Se verifican inmediatamente las reglas (39) (a+b)X=aX+bX, (Aa) X = aX) para las aplicaciones de los vectores X determinadas por las matrices. Mas significativo es el hecho de que matrices de tamajios apropiados pueden multiplicarse entre si. Se obtiene una definicién natural del producto de dos matrices a, b, considerando el producto simbolico, 0 composictén, de las aplicaciones correspondientes (ver el Volumen I, p. 52). Si a = (aj) es una matriz con m columnas y n filas, y si X = (x1, + %m) €S un vector con m componentes, entonces a determina las aplicaciones Y = aX del vector X sobre el vector Y = (yi, - +, ¥n)_ con las n componentes v4 G=1....n). denadas son enteros, con 1 Sj Sn, 1SisSm. Normalmente una funcién f de dos variables independientes x, y se escribe como f(x,9), y, aqui, una notacién més consistente seria a(j, i) en lugar de la acostumbrada aj. 188 Introduccién al calculo y al an4lisis matemAtico Si ahora b = (bgj) es una matriz con n columnas y # filas, entonces la aplicacion Z = bY aplicara a Y sobre el vector Z = (zi, . . . , 2p) con las p componentes a= s bi 7 = x % bry ay xe = & Chi Xi, car Aa mi donde +m). (40) cu = 3) byan (R= 1... ,pii= - Por tanto, Z = eX, donde c = ba = (cxi) es la matriz con p filas ym columnas y cuyos elementos estan dados por la férmula (40). En con- secuencia, se define el producto c = ba de las matrices b y a como la matriz con elementos cxi dados por (40). Se observa que el producto ba est4 definido sélo si el nimero de columnas de b es el mismo que el nimero de filas de a. Esto corres- ponde al hecho obvio de que el producto simbélico de dos aplica- ciones s6lo se puede formar si el dominio del primer factor contiene al recorrido del segundo. Por tanto, pudiera suceder muy bien que esté definido el producto ba pero no el producto ab con los factores en orden inverso. Pero incluso cuando tanto ba como ab estan de- finidos, en general no te cumple la ley conmutativa de la multipli- cacién, ab = ba para las matrices. Por ejemplo, para se tiene Sin embargo, facilmente se verifica a partir de la formula (40) que la multiplicacién de matrices obedece las leyes asociativa y distri- butiva (41a) a(be) = (ab)c, (41b) a(b+c)=ab+ac, (a+ b)e=ac + be, Vectores, matrices, transformaciones lineales 189 (para las matrices de tamajios apropiados). Podria decirse que estan permitidas todas las manipulaciones algebraicas para las matrices, mientras estén definidos los productos que intervienen y no se inter- cambien los factores. La aplicacién de vectores determinada por la matriz a, la cual se ha escrito como Y = aX, puede considerarse como un ejemplo es- pecial de la multiplicacién matricial stempre que se escriban X y Y como “vectores columna”, es decir, como matrices con una sola columna y con m y n filas, respectivamente: m1 yn | x ye x=[- |, vel’ ‘Xm \yn d. Matrices cuadradas. La rectproca de una matriz. Matrices ortogonales De importancia particular en las aplicaciones son las matrices con el mismo ntimero de filas y columnas, las llamadas matrices cua- dradas (las matrices mas generales, con nameros arbitrarios de filas y columnas, se conocen como matrices rectangulares). El orden de una matriz cuadrada es el nimero de sus filas o columnas. Dos matrices cuadradas cualesquiera del mismo orden 7n pueden sumarse 0 mul- tiplicarse. En particular, pueden formarse potencias de una matriz de este tipo: a=aa, a®=aaa,+--. La matriz cero, 0, de orden n es la matriz en la que todos los elementos son 0, 0 bien, en la que todas las columnas son vectores cero: (42a) 0=(@,0,...,0). Esta matriz tiene las propiedades obvias (42b) at+0=0+a=a, ad=0a= (para todas las matrices a de n-ésimo orden); 190 Introduccién al calculo y al andlisis matemAtico (42c) 0X = 0 para todos los vectores X con n componentes. La matriz unidad de orden n, denotada por e, es la matriz corres- pondiente a la aplicacion identidad de vectores X: (43a) eX =X para todo vector X. Como entonces, en particular, eEy = Ex para todos los vectores coordenados Ex, se encuentra que la matriz unidad tiene a los vectores coordenados como columnas: (43b) e = (Ei, Ex,...,En) = {nmediatamente se verifica que e juega el papel de una “unidad” en la multiplicacién de matrices: (48¢) ae=ea=a para toda a de n-ésimo orden. Se dice que una matriz b de n-ésimo orden es la rectproca de la matriz a de n-ésimo orden, si (44) ab =e. Si b es la reciproca de a, entonces a corresponde a la inversa de la aplicacién de vectores proporcionada por b, porque si b aplica un vector Y sobre X, (es decir, si X = bY), entonces a aplica a XK de vuelta sobre Y, ya que aX = abY = eY = Y. Ms concretamente, si se conoce una reciproca b de la matriz a = (aj), puede escribirse una solucién X = (x1, x2, . . . , Xn) del sistema de ecuaciones lineales @11%1 + ai2xe + + + + + Ainkn = @zix1 + Grave + + + + + Gankn = yo GniX1 + Gnet2 + + + + + AnnXn = In Vectores, matrices, transformaciones lineales 191 para cualquier (91, . . ., yn) = ¥ dado. En efecto, puesto que abY = eY = Y, se tiene una soluci6n dada por X = bY, es decir, por x1 = buy ++ + + + binyn Xn = bniyi ++ + + + banyn. Todo numero real a, excepto cero, tiene un reciproco 6 para el cual ab = 1. No obstante, existen matrices diferentes de la matriz cero que no tienen reciproca. Si a tiene una reciproca b, la ecuacién aX = Y tiene, para cada vector Y, la solucion X = bY, ya que abY = eY=Y. Por tanto (ver la p. 186), la matriz a debe ser no singular; es decir, las columnas de a son vectores independientes. Las matrices sin- gulares no tienen reciproca. La condicién ab = e para la matriz reciproca b de a puede escribirse en la forma (45) DL Girbrk = ejr, =I donde ajr, brx, eje denotan, respectivamente, los elementos generales de las matrices a, b, e. Para k fija, se tiene en (45) un sistema de n ecuaciones lineales para el vector Bg = (biz, box, . . . , bnx), el cual representa la k-ésima columna de la matriz b. Si la matriz a es no singular, existe una solucién Gnica By de (45) para cada k. De aqut que una matriz a no singular tiene una y solo una rectproca b. Sea a cualquier matriz no singular y b su reciproca; ésto es, ab =e. Tomese un vector arbitrario X y pongase Y = aX. Puesto que tanto Z = X como Z = bYson soluciones de las ecuaciones Y = aZ y como la solucin es tinica, debe tenerse bY =X para todo vector X. De donde (ver la p 185), aes la reciproca de b. ba Comanmente, la recfproca de una matriz a no singular se denota 192 Introduccién al cAlculo y al andlisis matemAtico por a“! Se tiene (46) aa!=ala=e, donde e es la matriz unidad. La reciproca puede calcularse resolvien- do el sistema de ecuaciones lineales (45) para las bre. Como los elementos ez de la matriz unidad tienen el valor 0 para j#k yl para j = k, las ecuaciones (45) afirman que el producto escalar de la j-ésima fila de la matriz a con la k-ésima columna de la matriz a tiene el valor 0 para j # ky 1 para j = k. Es mas, comoa™! a = ese ve que el producto escalar de la j-ésima fila de a~! con la k-ésima columna de a también tiene el valor 0 para j # k y 1 para j La multiplicacion por las reciprocas nos permite “dividi ecuacion entre matrices por una matriz no singular. Por ejemplo, la ecuacién matricial ab=c, donde a es una matriz no singular, puede resolverse para b multi- plicando la ecuacion desde la izquierda por a: ale = a-“(ab) = (a1a)b = eb = b. De modo semejante, la ecuacién ba=c conduce a cat=b. Desde el punto de vista de la geometria euclidiana, las matrices cuadradas mAs importantes son las llamadas matrices ortogonales, las cuales corresponden al paso de un sistema coordenado cartesiano hacia otro sistema del mismo tipo, o bien, a transformaciones lineales que conservan la longitud. Se dice que una matriz cuadrada a es or- togonal si sus vectores columna Au, . . ., An forman un sistema or- tonormal: 0 para ith (47) Ars Ar 1 para i=k Vectores, matrices, transformaciones lineales 193 (ver la p. 180). Como los vectores que forman un sistema ortanormal son independientes, se concluye que las matrices ortogonales siempre son no singulares. La relacién vectorial aX = Y correspondiente a la matriz a, interpretada pasivamente, describe cémo est4n relacio- nadas las componentes yi, . . . , yw de un vector con respecto a los vectores coordenados Ei,..., En con las componentes del mismo vector con respecto a la base Ai,..., An. Para una matriz orto- gonal a, la base Ai, . . . , An consiste de n vectores mutuamente or- togonales de longitud 1, formando un sistema coordenado “carte- siano”, en el cual la distancia esta dada por la expresi6n usual (ver la p. 182). Interpretada activamente, Y = aX representa una apli- cacién lineal en la que los vectores coordenados E: se aplican sobre los vectores Ay. Esta aplicaci6n lleva un vector X=(m,...,%n)=xEit+: + ++ xnEs hacia el vector Y=aX=a(mEit+ + + + + xnEn) = maki ++ + ++ xnaEn smArts + ++ xnAn La aplicaci6n conserva la longitud de cualquier vector ya que, por (47), VWY|2?= Ye Y= (e1Ai+ + + + + xnAn) + (mrArt + + + + xnAn) sate ss + xe? =|X]2 Mas generalmente, fa aplicacién conserva el producto escalar de dos vectores cualesquiera y, por consiguiente, también los 4ngulos entre las direcciones, como se verifica facilmente. Estas aplicaciones que conservan la longitud se conocen como transformaciones or- togonales 0 movimientos rigidos. En dos dimensiones se identifican facilmente con los cambios de ejes coordenados que se discutieron en el Volumen I (p. 361). Un vector Ai de longitud 1 en dos dimen- siones es de la forma Ai = (cos y, sen y),con algan 4ngulo y apropiado. Los tnicos vectores Ag de longitud 1 que son perper diculares a Ai son Ao= {eos (r + 3) sen (r + a= (-sen, cos 1) 194 Introduccién al cAlculo y al andlisis matemAtico A= ow f=), sm (r=) = ons oo) Por tanto, la matriz general ortogonal de segundo orden es de cual- quiera de las dos formas (48) ( cos Y —sen ¥ cos ¥ sen Y ) seny cos ¥ . ) obien, a= ( sen Y —cos Y Las relaciones de ortogonalidad (47) permiten escribir de in- mediato la inversa a~! de una matriz ortogonal a. Simplemente se toma como a-! la matriz que tenga los Ax como vectores fila; el producto escalar de la j-ésima fila de a! con la k-ésima columna de a es entonces 0 paraj # ky 1 para j = k,como es requerido por la relacion a“ a =e, En general, para cualquier matriz a = (ajx), 8€ define la transpuesta aT = (bjx) como la matriz que se obtiene de a intercambiando filas y columnas. Mas precisamente, bj, = axy.! Para una matriz ortogonal simplemente se tiene (49) a-l=at, Por ejemplo, (7 meet ys cos ¥ ven) sen Y cos —senyY cos ¥ De acuerdo con (46), puede escribirse (49) como (49a) aTa=e, aa? = La segunda relacién muestra que en una matriz ortogonal, el pro- ducto escalar de la j-ésima fila es 0 paraj # ky 1 paraj = k. Asi, en una matriz ortogonal los vectores fila también forman un sistema or- tonormal. iPensando en a escrita como un arreglo rectangular, se define la “diagonal prin- cipal de a como la linea que va de la esquina superior izquierda hacia abajo con pendiente —1, Es la Iinea que contiene a los elementos a11, 22, as3, . . .. La trans- puesta de a se obtiene “reflejandola” en la diagonal principal. Ry ° = o > @ = Vectores, matrices, transformaciones lineales 195 Ejercicios 2.2 . En cada caso, describir el espacio que pasa por P generado por los vec- tores Ax. (a) P=(-1,2,); Ar =, 0, 3) (b) P= (2,1,-4) Ar=(,—2,), Ae = (1,0, —) © P=(,1,-4,2), Ar=(,-2,1,2), Ae=(1,0, 1,2). . Verificar que E: = (2/3, 2/3, — 1/3), Ex = (1/v2, —1/v2, 0), Es = (v2/6, /2/6, 2V2/3) forman una base ortonormal y obtener las representaciones de los vectores dados en términos de esta base: (a) Al=(V2, V2, V2) (b) Az = (, —3, 3) () As = (1,0, 0) . Dados los vectores linealmente independientes A1, Aa, . . .,Am, cons- En truir los vectores unitarios mutuamente perpendiculares Ei, Es, . - con la propiedad de que Ex sea una combinaci6n lineal de A1, As, - Ax, para k=1,2,...,m. _ A partir del resultado del Ejercicio 3, probar el teorema fundamental de la dependencia lineal. . ¢Cuél es la distancia al punto P = (xo, yo, 20) desde la recta dada por =at+b, y=ct+d, z=et+f? (Sugerencia: Encontrar el pie de la perpendicular bajada desde P a la recta.) {Tiene una solucién no trivial el siguiente sistema de ecuaciones? x + 2y +32 =0 ax + 8y+2=0 ax ty+22=0 Hallar la representacion del vector (a1, a2, as) con respecto ala base Ai = (1, 2, 3), As = @, 3, 1), As = (3, 1, 2). . Determinar la matriz para pasar de las coordenadas cartesianas para la base Ei, Ex, Eo hacia las coordenadas afines para la base Ai, Az, As dada en el Ejercicio 7. . Probar que si la matriz a es singular, existen vectores Y para los cuales Y = aX no tiene soluci6n. Obtener los productos ab y ba para las matrices 196 Introduccién al cAlculo y al an4lisis matematico 120 21 °0 =|0 01) »b (3-3) 210 1021 . Encontrar las condiciones para que la matriz de 2 x 2 ab ed tenga una reciproca y dar esa reciproca si existe. 12. Demostrar que s6lo existe una matriz unidad. 13. Hallar la reciproca de ab, si tanto a como b son no singulares. 14. A veces se define una matriz singular de n x n como una matriz que aplica el espacio n dimensional sobre un espacio de dimensién inferior. Demostrar que esta definicion es equivalente a la dada aqui. 15. Interpretar geométricamente las matrices dadas en (48). 16. Probar que a es ortogonal si y sélo si a7 = a}, 17. Demostrar que la transpuesta de un produeto ab es el producto b?a? de las matrices transpuestas en orden inverso. 18. Demostrar que el producto de matrices ortogonales es ortogonal. 19. Verificar que la aplicacién por medio de una matriz ortogonal conserva el producto escalar; es decir, sia es ortogonal, entonces (aX) + (a¥) = KY 20. Demostrar que cualquier matriz que conserva la longitud es ortogonal. 21. Probar que una transformacién afin leva el centro de masa de un sis- tema de particulas hacia el centro de masa de las particulas imagen. 2.3 Determinantes Determinantes de segundo y tercer orden El andlisis matematico incluye el estudio de aplicaciones no li- neales en espacios de varias dimensiones. No obstante, tal estudio tiene que ser precedido por el de las aplicaciones lineales Y = aX, donde X y Y son vectores y a una matriz. En particular, es de gran importancia el analizar la estructura de la inversa de una aplicaci6n de este tipo 0 —lo que es lo mismo— analizar la estructura de las soluciones de un sistema de n ecuaciones lineales Vectores, matrices, transformaciones lineales 197 auix1 + Giex2 ++ + + + Cinta = 1 (50) Gaixi + a2exe, ++ + + + Gann = ye GQnixXi + AnaX2 ++ + + + AnnXn = Yn para n cantidades desconocidas x1, . . . , Xn. EI proceso €e resolver n ecuaciones lineales en n variables conduce a ciertas expresiones algebraicas llamadas determinantes, los cuales tienen un gran ndmero de términos. Al principio, la definicién ex- plicita y las propiedades de los determinantes parecen ser un tanto mistificadas. El misterio desapareceraé cuando basemos la definicién de determinante en una sola propiedad, la de ser una forma mul- tilineal alternante de 7 vectores en el espacio n dimensional. De este punto de vista conceptual se pueden deducir con facilidad todas las propiedades importantes de los determinantes. En capitulos poste- riores de este libro se veré que los determinantes tienen una impor- tancia extrema al extender el c4lculo diferencial e integral hacia dimensiones superiores. Resulta instructivo escribir completamente la soluci6n explicita de las ecuaciones (50) para unos cuantos de los primeros valores de n. Para n = 1 se tiene Gnicamente la ecuacién aux = y1 con la solucién Ma mss, (60a) Dari Para n = 2 se tiene el sistema aux + aiex2 = 1 a2ix1 + de2x2 = ya. Multiplicando la primera ecuacién por azz, la segunda por aie y res- tando, se elimina x2 y se encuentra una sola ecuacién para %1; de modo semejante, multiplicando la primera ecuacién por aa y la segunda por aii y restando se elimina x1. De esta manera se encuen- tran para x1, X2 las expresiones 198 Introduccién al cAlculo y al andlisis matemAtico 2291 — aizy2 4 = Wye = aay @1122 — ai2dei” Q11d22 — 12021" (0b) a= Para n = 3 se tiene el sistema aux1 + aiex2 + ais%s = yi (50c) @2ixX1 + G22x2 + a23x%3 = yo a3ixX1 + Agexz + a33xX3 = Ys. Puede reducirse este sistema a dos ecuaciones para 21, x2, eliminando asi a x3, multiplicando la segunda ecuaci6n por ais/az3_y restandola de Ja primera, y multiplicando la tercera ecuacién por ais/a33_y res- tandola de la primera. Entonces pueden resolverse, como se hizo an- tes, las dos ecuaciones resultantes para xi, xz tnicamente. Después de un poco de manipulacién algebraica se encuentra que (50d) _G22ds3y1 + i2d2sy2 + a13ds2y2 — Gisd22Ys — deads2y1 — G12033y2_ ~ Griaeza3s + a12a2sas1 + disd21dae — Gisde2as1 — d11d23032 — @12021035" con formulas semejantes para x2 y x3. Para n = 4, los calculos se hacen completamente pesados y resulta evidente que solo un pro- cedimiento sistematico puede traer orden a los resultados. Se observa que, en cada caso, la solucién x; toma la forma de un cociente, donde el denominador es una funcién de los coeficientes ay tinicamente, es decir, una funcién de la matriz a = (aj). Para n= 1 esta funcién es simplemente el propio coeficiente a11.Para n = 2, el denominador 11422 — G12d21, formado a partir de los elementos de la matriz ai diz a= > G21 22 se llama determinante de la matriz ay se escribe au a2 (la) @11422 — aizan = det(a) a2i a22 Vectores, matrices, transformaciones lineales 199 Es evidente que los numeradores en (50b) también pueden escribirse como determinantes, dando lugar a las expresiones |” a2 |on yn | 2a an_y: | (61b) ns Rg = jo au a an al Ga aae az azz | Por supuesto, estas formulas s6lo tienen sentido si el determinante del denominador no tiene el valor 0. La formula (50d) sugiere introducir como determinante de la matriz de tercer orden a1 a2 ais a=| an a22 ars a31 a32 a33 ala expresion (62a) @11G22433 + Gi2d23a31 + 13421032 — @i3d22d31 — @11@23032 — a12021033 m1 a2 as =det(a)= | a2 a2 ars a31 @sz_ 33 La ley de formaci6én de un determinante de tercer orden de este tipo puede expresarse por medio de la “regla de la diagonal” (Fig. 2.5a), la cual es muy facil de recordar. Se repiten las dos primeras columnas después de la tercera; se forma el producto de cada triada de ni- meros que se encuentran en las diagonales, multiplicando los pro- ductos asociados con las diagonales inclinadas hacia abajo a la de- recha por +1 y hacia abajo a la izquierda por —1; y se suma. (jEsta regla slo se cumple para los determinantes de tercer orden!). Con la ayuda de los determinantes de tercer orden se puede es- cribir la soluci6n del sistema (50c) en la forma mAs concisa 200 = Introduccién al cAlculo y al anilisis matematico Yi aie ais any a3 @11 a2 Y1 ye G22 des G21 Ye Gog G21 G22 ye sz a: a: a: asi a: = 7 Guawas |" ~ Jan awau | [au aw as| a1 ae as | G21 G22 a23 G21 G22 G23 @31 32 G33 31 G32 G33 G31 G32 G33 Figura 2.5a Por analogia, se define el determinante de la matriz de primer or- den a = (an) con base en (50a), como au = det(a). Entonces se ve que en cada uno de los casos n = 1,2,3 la soluci6n (x1,. . ., %n) del sistema (50) puede describirse como sigue (“regla de Cramer”): Cada incégnita x1 es el cociente de dos determinantes. En el denominador se tiene el determinante de la matriz a = (ajx); en el numerador se tiene el determinante de la matriz obtenida rempla- zando la i-ésima columna de la matriz a por las cantidades y1,y2, -2¥n Que aparecenen el segundo miembro de las ecuaciones. b. Formas lineales y multilineales de vectores Con el fin de definir los determinantes de orden superior y enun- ciar sus propiedades principales, es necesario hacer uso de algunas nociones algebraicas generales. Una‘funcién f(ai, . . ., an) de las n variables independientes a1, -,@n puede considerarse como una funcién del vector A=(a1,. .., @n) y escribirse en la forma f(A). Se dice que f es una forma lineal en Asi Vectores, matrices, transformaciones lineales 201 (63a) f(A + B) = f(A) + fB) para dos vectores cualesquiera A, B y (53b) QA) = (A) para cualquier vector Ay cualquier escalar 2. Las dos reglas (53a, b) pueden resumirse en el requerimiento tinico de que (64a) fQA + HB) = Af(A) + Hf(B) para cualesquiera vectores A, B y escalares A, p. Escrita con detalle, Ja regla (54a) se convierte en (64b) fQar + phi. .., han + Hbn) =Af(a,.. ., an) + uf(br, . . ., b; Por ejemplo, la funcién AA) = a2 — 27a3 es una forma lineal, mientras que AA) =|Al= Var +o + + + an? no lo es. La relaci6n (54a) implica inmediatamente la regla mas general para las formas lineales (64c) fQaAr+ + + + + AmAm) = af(Ar) + + + + + Amf(Am) validas para cualesquiera vectores Au,.. .,Am y escalares Ai,..., dm Esta regla proporciona una expresién explicita para la forma lineal m4s general en el vector A. Usando los vectores coordenados E;, . . ., Ea, se tiene, por (2b), la representacién A=(a,...,@n) = aiE1 + a2E2 ++ + + + anEn para el vector A. De aqui que, por (54c), fes de la forma 202 = Introduccién al calculo y al andlisis matematico (55a) (A) = aif(E1) + a2f(E2) + + + + + anf(En) = cdi + Coda ++ + + + Cnn donde los ¢; tienen los valores constantes (55b) ce = f(Ei). Combinando los coeficientes c en el vector C = (ci, . . - , Cn), se tiene (65¢) fA) = CA. La forma lineal mds general en un vector A es el producto escalar de A con un vector constante apropiado C. Una funcién f(A, B) de dos vectores A=(a1,. . ., an), B=(bi, .. «,bn) recibe el nombre de forma bilineal en A, B si f es una forma lineal en A para B fijo y una forma lineal en B para A fijo; ésto sig- nifica que se requiere que (56a) fO.A + UB, C) = 4f(A, C) + nf(B, ©) (56b) f(A, AB + WC) = af(A, B) + nf(A, C) para cualesquiera vectores A, B, C y escalares 4, ». El ejemplo mas sencillo de una forma bilineal es el producto escalar f(A, B) = A-B. En este ejemplo, las reglas (56a, b) se reducen simplemente a las leyes asociativa y distributiva (15b, c), p. 165, para los productos es- calares. A partir de (56a, b), mas generalmente se encuentra que (6c) f(aA + BB, yC + 3D) = af(A, yC + 5D) + B/(B, yC + 5D) = ayf(A, C) + adf(A, D) + Byf(B, C) + B5f(B, D). Por tanto, puede operarse con las formas bilineales como con los productos ordinarios al “multiplicar” las expresiones. Usando nuevamente la descomposicién Vectores, matrices, transformaciones lineales 203 A=(a,...,@n)=aiEi++ + ++ anEn B=(bi,...,6n) = biEi ++ + + + bnEn para los vectores A, B, se llega a la formula {(A, B) = f(aiEi + a2E2 ++ + + + anEn, b1E1 + be2E2 + + + + + bnEn) = 3) aybif(Ey, Ex). an De aqui que la forma bilineal m4s general en A, B esta dada por (67a) AA, B) = 3 enasbe ie con coeficientes constantes (67b) eye = f(s, Ex). Para B = A, la forma bilineal f pasa a la forma cuadrdtica (67c) HA, A) ‘al 2a Cie. ie De manera semejante se definen las formas trilineales f(A, B, C) en los tres vectores A, B, C como funciones que son formas lineales en cada vector por separado. Se encuentra, exactamente como antes, que la forma trilineal, mas general esta dada por una expresién (68a) f(A, B,C) = 3 enraybecr, donde 0) caer = (By, Ex Er). Pueden definirse formas multilineales f mas generales en cualquier namero m de vectores, en una manera obvia. Lo nico nuevo es sdlo cuestién de notaci6n, ya que no se asocian letras diferentes con vec- tores diferentes. Se denotan los vectores por Ai, As, . . ., Am y se in- troducen sus componentes aj: mediante” 204 + Introduccién al cAlculo y al an4lisis matemAtico =(au,ae,...,@n1), Az = (a12, d22,. . . ,An2),-- +5 Am = (dim, Gam, - » - nm). La funcién f es una forma multilineal f(Ai, . . . , Am)en.Ai, Az, . .., Am si es una forma lineal en cada vector cuando los otros se man- tienen fijos. También puede considerarse a f como funci6n de la matriz a= (At, Ao,. . .,Am) = (aie) que tiene a Ai, Aa, . . ., Am como vectores columna. Andlogamente a (58a), la forma multilineal m4s general en Ai, Az,.. ., Am esta dada por > jie tm (59a) f(A1, As, . - donde’ (69b) Chint * + tm = fEn, Esa - +» Em). c. Formas multilineales alternantes. Definicién de los determinantes Los determinantes de segundo y tercer orden definidos en las fér- mulas (51a) y (52a) son formas multilineales especiales. El deter- minante de segundo orden en (51a), p. 198, es una forma bilineal de los dos vectores bidimensionales (60a) Ai = (au, a21), Az = (a2, a22); TE] uso de subindices para los subindices en estas formulas es un tanto incémodo. Aqui juje,. . . pdm Tepresenta cualquier combinacién de m nimeros seleccionados del conjunto de némeros 1, 2, ... , n. Una combinacién de este tipo también podria considerarse como una funcién j(#) cuyo dominio es el conjunto de nameros k = 1,2, 4m y cuyo recorrido esta en el conjunto de nameros j=1,2,...,n. Cual quiera de estas combinaciones o funciones da lugar a un término en la suma dada en la formula (59a). Vectores, matrices, transformaciones lineales 205 el determinante de tercer orden en (52a) es una funci6n trilineal de los vectores tridimensionales (60b) Ai = (an, @21, 31), Ao = (aie, a22, ase), As = (a1, ds, asa). (La linealidad de los determinantes separadamente en cada vector se deduce por inspecci6n, a partir del hecho de que cada producto en el desarrollo explicito contiene exactamente un factor con un segundo subindice dado.) La caracteristica extra que coloca a los determinan- tes aparte de las otras formas multilineales es su caracter alternante. Se dice que una funcién de varios argumentos (que pueden ser vectores o escalares) es alternante, si cambia solamente de signo cuando se intercambian dos cualesquiera de los argumentos. Ejem- plos de funciones alternantes de argumentos escalares son (61a) Hx, y) =¥— % (61b) Hx, y, 2) = (@— WE - x)(y — %). Una funcién f de dos vectores n dimensionales Ai, Az es alternan- te si f(A, Az) = — f(Az, Ai) para todos Ai, Ae. Esto implica, en particular para Ai = Ae = A, que f(A, A) = 0. Sea n = 2 y f una funci6n alternante de los vectores Ai, Az dados por (60a), la cual también es una forma bilineal. Entonces f(a, Es) = (Es, Ex) = 0, (Ex, Ei) = — f(E1, E2). De (57a, b) se deduce que (62a) f(Ai, As) = AanEs + aE2, aE + a22E2) 1 |e det(Ar, As), = (ai1@22 — ai2a21) = ae 206 = Introduccién al cAlculo y al anAlisis matematico donde la constante c tiene el valor (62b) = /(Es, E2). Por tanto, toda forma bilineal alternante de dos vectores Ai, Az en el espacio bidimensional difiere del determinante de la matriz con columnas Ai, Ag sélo en un factor constante c. Mas generalmente, una forma bilineal alternante de dos vectores en n dimensiones puede escribirse f(Aa, As) = x Cirajaee, donde Cik = —Cky, cy = 0. Combinando los términos con subindices que difieren sélo en una permutacion, puede expresarse f como una combinacién lineal de determinantes de segundo orden: (62c) f(A, As) = >) cax(ajaee — axiaje) FER 4 Qy Qj = 3 cn | je |, FER | ae one Para una funcién alternante f de tres vectores, se tienen las re- laciones (63a) f(A, B,C) = —f(B, A, C) = — f(A, C, B) = —f(C, B, A), de lo cual se deduce que también (63b) {(A, B, C) = f(B, C, A) = f(C, A, B). En particular, f se anula siempre que dos de sus argumentos sean iguales. Sean Ai, Ae, As los vectores tridimensionales dados por (60b). Por (58a, b), la forma trilineal alternante general fen Ai, Az, As es Vectores, matrices, transformaciones lineales 207 flA1, AAs) = 3) cnranarars . jkrad Aqui, usando (63a, b), caer = f(Ej, Ex, Er) = tprf(E1, Ex, Es), con er = 0, si dos de los ntimeros j, k, r son iguales y (64a) £123 = £231 = ts12 =1, &213 = €132 = E321 = — Haciendo uso del hecho de que la funcién ¢(x, y, 2) de la formula (61b) cambia de signo siempre que se intercambian dos de sus ar- gumentos, para &, se encuentra la expresi6n concisa (64b) evr = sgn oj, k, 7) = sgn (r —k) (7 — j) (k — J). Comparando con la expresién (52a), p. 199 para un determinante de tercer orden se encuentra que au a2 as (64c) f(Ai, Az, As) =c | a2 daze ads. 32, ag donde c = f(E:, Es, Es) es una constante. Se tiene el mismo resul- tado que en dos dimensiones: La forma trilineal alternante mas general en tres vectores tridimensionales Ai, Az, As difiere del deter- minante de la matriz con columnas Au, As, As, s6lo en un factor cons- tante c. Entonces, obviamente, el determinante de tercer orden de la matriz con columnas Au, As, A3_ es esa forma trilineal alternante en los vectores Ai, As, As, determinada de manera anica, que tiene el valor 1 cuando Au, Az, As son respectivamente iguales a los vectores coordenados Ey, Ee, Es.* Ahora resulta evidente la manera en que pueden definirse los determinantes de orden superior. Sea a la matriz TLa ditima condicién expresa que la matriz unitaria e tiene el determinante 1, 208 Introduccién al cAlculo y al andlisis matematico (65a) : , G@nl nz st Onn con vectores columna Aj, Az, ..., An. Sea f una forma alternante multilineal en Ai, . . ., An. Entonces f esta dada por (59a). Aqui los coeficientes cj,42 . . . j, tienen la forma (65b) Chie» «+ in = f(En, Eyg, - - - , Byn). Estos cambian de signo siempre que se intercambian dos cualesquiera de los némeros jt, j2,..., jn. Denotemos por ¢(x1,..., Xn) él producto (65c) (x1, 2,» » Xn) = (xn — Xn-1) (Xn — Xn-2) * + + (Xn — x2) (an — 21) (Xn-1 — Xn-2)* © + (Xn-1 — x2) (Xn-1 — m1) (x3 — x2) (x3 — m1) (x2 — m1) © peed. a ane ~ F&cilmente se ve que ¢ es una funcién alternante de los escalares 11, +» Xn que se anula sélo cuando dos de esos escalares son iguales. Entonces, (65d) Epi + - + in = 8B G(r, ja, - - - Jn) es una funci6n alternante de ji, . . . , jn, la cual s6lo toma los valores +1, 0,—1.Para ji, . . . , jn restringidos a los valores 1, 2, . . ., m, s€ tiene &172 . . . i = 0, a menos que los nimeros ji, . . . , jn sean dis- tintos, es decir, a menos que formen una permutactén de los nameros 1, 2,..., m.Sedice que ji, . . .,jnes una permutacién par de 1, 2, + MS Ej 52. . «in = +1Ly que es una permutact6n impar si E4142... jn= 1. Uma permutacién par puede reacomodarse en el orden 1, 2, ..., por medio de un namero par de intercambios de dos Vectores, matrices, transformaciones lineales 209 elementos; una permutaci6n impar, por medio de un néimero impar de tales intercambios. Obviamente, por (65b), (65e) Chit + + in’ = Site - + in (Ea, En). Se define el determinante de la matriz a dada en (65a) como a1 az tt Gin (66a) det(a) = | G21 azz + + + Gan nt Anz ann = Pe inin «+ + in IAI? «+ + Ginn Peed Entonces se tiene el resultado: La forma multilineal alternante f més general en n vectores n dimensionales Au, . An difiere del deter- minante de la matriz con columnas Ai, ..., An sélo en el factor constantec = f (Ei, . . ., En). d. Propiedades principales de los determinantes La férmula (66a) da el desarrollo explicito de un determinante de n-ésimo orden en términos de sus n? elementos aj. Contando sélo los términos con coeficientes é,j. . . . jn,que no se anulan, el determinan- te es una forma de n-ésimo grado en los ajx que consiste de m! tér- minos. Cada término (aparte del coeficiente &,j) ... . j, = +1) es un producto de n de los elementos, uno de cada columna y de cada fila. En principio, la formula de desarrollo hace posible calcular un deter- minante para cualesquiera valores dados de los elementos. En la practica, sin embargo, la formula tiene. demasiados elementos que deben tomarse en cuenta (120 en el-caso de los determinantes de quinto orden; 3 628 800 en el caso de los determinantes de décimo orden) como para ser util para llevar a cabo calculos numéricos, y se han ideado métodos mas eficientes para evaluar los determinantes. Las propiedades basicas de los determinantes se han incorporado ya en su definicién como formas multilineales alternantes de n vec- tores A1, Az, . . ., Anen el espacio n dimensional. Si a es la matriz con estos vectores como vectores columna, se escribe det(a) = det(Au,.. ., An). 210 ~~ Introducci6n al clculo y al andlisis matematico Inmediatamente se concluye que el determinante de la matrix cuadrada a cambia de signo si se intercambian dos columnas cuales- quiera de a; en particular, el determinante de una matriz a con dos columnas idénticas se anula. Aplicando la linealidad del determinan- te en cada uno de sus vectores columna separadamente, se encuentra que multiplicar una columna de la matriz a por un factor 2. tiene el efecto de multiplicar el determinante de a por 4.1 Por ejemplo, (67a) det(AAi, Az... , An) = Adet(Ai, Az, . . . , An). En particular, para 2 = 0 y A, arbitrario, se encuentra que (67b) det(0, Az, . . . , An) = 0. Por supuesto, se aplican las mismas consideraciones a cualquier otra columna y se encuentra que el determinante de una matriz a se anula si cualquier columna de a es el vector cero. A partir de la multili- nealidad de los determinantes, con més generalidad se concluye que (67c) det(A1 + AAz, Aa, . . . , An) = det(Ai, Az, . . ., An) + Adet(As, Az, ..., An) = det(Ai, As,..., An), dado que la matriz (Az, Ag, . . ., An) tiene dos columnas idénticas. En general, el valor del determinante de la matriz.a no cambia si se suma un miiltiplo de una columna de aa una columna diferente.” De importancia fundamental es la ley de multiplicacién para los determinantes: El determinante del producto de dos matrices a y b de n-ésimo or- den es el producto de sus determinantes: (68a) det(ab) = det(a) « det(b). Escrito en sus elementos, la regla toma la forma TMultiplicar todos los elementos de la matriz de n-ésimo orden a por el factor 4 ¢ equivalente a multiplicar cada una de sus n columnas por 4 y, por tanto, conduce a multiplicar el determinante de a por 4". De donde, (Aa) = 2" det (a). 2Obviamente, multiplicar una columna por el factor 4 y sumarla a la misma colum- na cambia el valor del determinante en el factor 1 + 2. Vectores, matrices, transformaciones lineales 211 a1 az +++ ain bu bis ts bin Qa. G2 t+ Gan bar bez + + + ben (68b) | * ; sofxte a : Qni Qnz + + + Ann! | bar bnz + + + Onn fem cre +++ em] C21 C22 . . Con ene + + + can | donde (68c) Cie = Gnbiy + ajeba ++ + + + ajnbne = x Ojrbrk. 4 Esta ley es una consecuencia sencilla de la definicién dada para los determinantes. Sea c = ab la matriz producto. Manténgase la matriz a fija y considérese el determinante c en su dependencia res- pecto a b. Por (68c), el k-ésimo vector columna de la matriz c Ce = (Cre, Can, - . «5 Cn) tiene los elementos cj que son formas lineales en el k-ésimo vector columna B; de la matriz b. Se concluye que det(c) es una forma lineal en el vector Bg cuando se mantienen fijas las otras columnas de b. También resulta evidente que intercambiar dos columnas de b corresponde exactamente a intercambiar las columnas correspon- dientes de c. De aqui que det (c) es una forma multilineal alternante en los vectores columna de la matriz b. Por consiguiente (ver la p. 209). det(c) = y det(b), donde ¥ es el valor de det(c) para el caso en el que Bi = Ei, B: = Ex,...,Bn=En, o bien, donde bes la matriz unidad e. Ahora bien, si b = e, entonces obviamente c = ab = ae = a, y, comoconsecuencia, y = det (a). Esto prueba (68a). 212 Introduccién al cAlculo y al an4lisis matematico En Ia p. 157 se definié la transpuesta a7 de la matriz: a como la matriz obtenida a partir de a intercambiando filas y columnas. Se tiene entonces el sorprendente hecho de que una matriz cuadrada.y su transpuesta tienen el mismo determinante: (68d) det(a7) = det(a) o bien, au aa see ani au aie sre din a2 a2 see an2 aa. 22 se aden (68e) | « : yy ol. 6 : ain Gan * * * Gnn Gn GQn2 * * * Qnn Para n = 2,3 facilmente se verifica esta identidad a partir de las expresiones explicitas (51a), (52a), pp. 161-2. Para n general sola- mente se indicar4 la demostraci6n, la cual‘ puede basarse en‘la f6r mula del desarrollo (66a) para det(a). En cada término de la suma con coeficiente que no se anule, pueden reacomodarse los factores dé acuerdo con los primeros subindices de modo que Gjy10jy2 . . . Ajnn = Aik, A2ey « » - Ankn, donde 1, ke, . . ., kn forman nuevamente una permutacién de los némeros 1, 2,. . .,.' Facilmente se demuestra que Efe + + in = Skike + + kn (ésto se deja como un ejercicio para el lector). Por tanto, n det(a) = 2 eo kn @1k\@2ke » » + Onkn = det(at). 1 n=l B Una consecuencia inmediata de la formula (68d) es que un deter- minante puede considerarse como una funcién multilineal alternante de sus vectores fila. En particular, un determinante cambia de signo st se intercambian dos filas cualesquiera. Mirando a Ji, ja,...,Ja como una funcién que aplica al conjunto 1, 2, sobre st mismo, se tiene en fi, kz,...., kx precisamente la funcién inversa; es decir, la ecuaci6n jr= es equivalente a ke =r. Vectores, matrices, transformaciones lineales 213 La regla de multiplicacién (68a) afirma que el producto de los determinantes de dos matrices cuadradas a, b es igual al determinan- te de la matriz ab cuyos elementos son los productos escalares de los vectores fila de a con los véctores columna de b. Se hace uso ahora del hecho de que el determinante de una matriz a es igual al deter- minante de su transpuesta a7, la cual se obtiene intercambiando las filas y columnas de a. Entonces se deduce que det(a) - det(b) = det(a7) « det(b) = det(aTb). De donde, el producto de los determinantes de las matrices a y b también es igual al determinante de la matriz aTb, obtenida forman- do los productos escalates de las columnas de a con las columnas de b. Si a=(Ai,..., An) y b=(Bi,. . ., Bn), se obtiene la identidad (68f) det(Ar,. . ., An) + det(Bi, . . ., Bn) fAr+ Br Ar-Be - . -Ar- By lAe+Bi Az+Bz . . .Az~ Bal IAn- Bi An- Bo + Bal Una aplicacién simple de estas reglas a las matrices ortogonales a, para las cuales [ver la formula (49), p. 194] a“! = a7 o bien, aa = e, da det(a?a) = det(a7) - det(a) = [det(a)]? = det(e) = 1. Consecuentemente, el determinante de una matriz ortogonal sélo puede tener los valores +10 —1. En la p. 245 se dara la inter- pretacién geométrica de este resultado. 214 Introduccién al cAlculo y al an4lisis matematico e. Aplicacién de los determinantes a los sistemas de ecuaciones lineales Los determinantes proporcionan una herramienta conveniente para decidir cuando n vectores Ai, Ao,..., An en el espacio dimensional son dependientes 0, lo que es equivalente, cuando la matriz cuadrada acon columnas Aj, . . ., An es singular. La condicion necesaria y suficiente para que una matriz cuadrada sea singular es que su determinante se anule. Sea, en efecto, a singular. Entonces los vectores columna Au, As, ., An son dependientes. Por tanto, uno de los vectores columna, digamos Ajes dependiente de los otros: = AsAe + AsAs+ + + + + AnAn De la multilinealidad de los determinantes se concluye que det(a) = det(eAe + MeAa + + + + AnAn, Ao, As... ., An) = Asdet(As, Az, As, . . ., An) + Aa det(As, As, As, An), + +++ + 2adet(An, As, As. . .,An) =0, ya que cada una de las matrices tiene una columna repetida.' Inversamente, si a es no singular, existe (ver la p. 191) una re- ciproca b = a“! de a: donde e es la matriz unidad. Por la regla de multiplicaci6n para los determinantes, se deduce que det(a) - det(b) = det(e) = y, por tanto, det (a) # 0. Esto prueba que a es singular si y sdlo si det (a) = 0. Considérese ahora el sistema de ecuaciones lineales TMas generalmente, este argumento demuestra que una forma multilineal alternante se en m vectores en el espacio n dimensional se anula idénticamente para m > n, dado Pi Pi que entonces los vectores son necesariamente dependientes. Vectores, matrices, transformaciones lineales 215 ayixi + Qiexe + + + + + inten = 91 Gaix1 + Geexe + + + + + denn = ye (69a) . Qmixi + GnoXe + + + + + dnntn = yn correspondiente a la matriz a. Siguiendo la discusién de lap. 185 tienen que distinguirse los dos casos: (1) det (a) # 0 y (2) det (a) = 0. En el caso (1), las ecuaciones (69a) tienen una solucién unica para cada y1,...,n. En el caso (2), no siempre existe una solucién y nunca es dnica. Ahora no sélo tenemos una prueba explicita para distinguir entre los dos casos con la ayuda de los determinantes, sino que también encontraremos los medios para calcular la solucién en el caso (1). Introduciendo el vector Y¥ = (91, y+ + +, Yn)y puede escribirse el sistema (69a) en la forma (69b) xiAi + xeAe+ +++ + xnAn = Y, donde los Ax son los vectores columna de la matriz a. Entonces, det(Y, Az, As,.. ., An) = det(xiA1 + x2A2 + +++ + XnAn, As, As, .. ., An) = x1 det(A1, Ae, As, . . ., An) + x2 det(Ae, As, As, . . ., An) + x3 det(As, Az, As,...,An)+++> + xn det(An, Az Az, .. ., An) = x det(Ai, Az, . . ., An) y, de modo semejante, det(Ai, Y, As, . . ., An) = x2 det(Ai, Az,..., An), y asi sucesivamente. Si la matriz a es no singular, puede dividirse en- tre su determinante y obtener la soluci6n x1, x2, . . ., Xn expresada por medio de determinantes: 216 Introduccién al calculo y al andlisis matemAtico _ det(Y, Az, An) _ det(Ai, Y, = det(Ai, Az,..., An) ** = det(A, Az, - _ det(Ar,Ay .. ., Y) 79%" = det(Ai,Ag, . . -, An)” Este es la regla de Cramer para la solucién de n ecuaciones lineales con n incégnitas. Ejercicios 2,3 1, Evaluar los determinantes siguientes: j3 4 5 | rudy (@))4 5 6 | ()2 3 4 56 7| 3-17 rid 1 x x} (b)}1 2 4 @)1 yx 9] i139 lz 2] 2. Encontrar la relacion que debe existir entre a, b, c con el fin de que el sistema de ecuaciones 3x + 4y + 5z=a 4x + By + 6z=b bx + 6y + 7z=c pueda tener una solucién. 3. (a) Verificar que el determinante de la matriz unidad es 1. (b) Demostrar que si a es no singular, entonces det (a-!) = 1/det (a). 4. Obtener los valores de (a) esa, (b) e213, (©) agai, (d) esasa1 5. Demostrar que el determinante abe def lg h kl siempre puede reducirse a la forma Vectores, matrices, transformaciones lineales 217 «a O °| 0p 0 io 0 y| simplemente por medio de la aplicacién repetida de los procesos si- guientes: (1) intercambiar dos filas 0 dos columnas y (2) sumar_ un mél- tiplo de una de las filas (0 columnas) a otra fila (o columna). Una matriz es diagonal si as = 0 siempre que i + j. Demostrar que el determinante de la matriz diagonal (ay) den X nes el producto an az + Qnne La matriz (ay) es triangular superior si ay =0 siempre que j donde ft) =(h — 8) (2 — f (ts — t) (ts — 8). 18. Probar que cualquier forma bilineal fen A y B puede escribirse A+ (cB) = (e7A) +B 14. Probar que en una transformacién afin no singular la imagen de una cuadrica ax? + by? + c2® + dxy + exz +fyz+exthytizt+j=0 es otra cuadrica. 15. Si los tres determinantes a a bi be’ a az | br bs | ler co| cal’ no se anulan todos, entonces probar que la condicién necesaria y su- ficiente para la existencia de una soluci6n de las tres ecuaciones ax+ay=d bix+ by =e ax+ey=f Vectores, matrices, transformaciones lineales 219 ja a d D=|b bs e la a fl 16. Enunciar la condicién para que las dos rectasx = ait + bi, y = ast-+ be, z=ast+bsy x=cit + di,y = cet + de, z=cat + ds se intersecten o sean paralelas. 17. Probar (68d), verificando que no importa si los factores en cada término del desarrollo (66a) estan ordenados por sus indices primero o segundo, sea, con Qjy1 Qjge * * * Ajnn = Aik, G2ky** * Ankny obtener que e419 + «+g = CbykQ oe ke 18. Probar que la transformaci6n afin x! = ax + by Fez y =dx+ey+ fz 2 = gx thy the deja por lo menos una direccién inalterada. 2.4 Interpretacién geométrica de los determinantes a. Productos vectoriales y voliimenes de paralelepipedos en el espacio tridimensional En el Volumen I (p. 388) se definié el “producto cruz” de dos vec- tores A = (ai, az) y B = (bi, b2)en el plano como el escalar (70a) A x B= aibz — aabi. Aqui |A x B| representa el doble del area del triangulo con vértices Po, Pi, Ps, donde A = PoPi, B = PoP». A |A x B| se le da el nom- bre de Area del paralelogramo definido por los vectores A, B, es decir, del paralelogramo con vértices sucesivos Po, P1, Q, Ps. El signo de Ax B determina la orientacién del paralelogramo.! En no- tacién de determinantes el producto cruz toma la forma iSe tiene A X B > Osiel sentido (en el mismo 0 en el contrario al movimiento de las. manecillas del reloj) en el que se siguen los vértices sucesivamente es el mismo que el del “cuadrado coordenado” con vértices sucesivos (0, 0), (1, 0), (1, 1.) ©, 1)- 220 Introduccién al calculo y al an4lisis matematico {ar br} (70b) AxB= he |= det(A, B). 2 | ae Por tanto, |det(A, B)| puede interpretarse geométricamente como el 4rea del paralelogramo definido por los vectores A, B. Se encon- trar4n interpretaciones andlogas para los determinantes de orden superior. Para los tres vectores A = (a1, az, as), B = (b1, be, bs), C = (ce, cy 3) en el espacio tridimensional, resulta natural formar el déter- minante a bh o | det(A,B,C) =} az bz cz !as bs cs Escrito como una forma lineal en el vector C se tiene, por (52a), (Mla) det(A, B,C) = (a2bs—asb2)c1 + (a3b1 —a1bs)c2+ (aib2—aabi)es =Z-C, donde Z = (21, 22, 2s) es el vector con componentes | a2 bz (71b) 21 = debs — asbe = 5 Jas bs} as b; 22 =asb1—aibs =|" , a bh | 6 25 = aib2 — ab =|“ | | a2 be Al vector Z se le da el nombre de “producto vectorial” o “producto cruz” de los vectores A, B y se escribe Z = A x B.! Entonces, por definici6n, (71c) det(A,B,C) = (A x B)- C. \E] producto vectorial de dos vectores en tres dimensiones es nuevamente un vector, en contraste con los productos cruz de los vectores en dos dimensiones y los productos escalares en cualquier némero de dimensiones, los cuales son escalares. Vectores, matrices, transformaciones lineales 22] Debido a esta férmula, a veces se da el nombre de triple producto vectorial de A, B, Cal escalar det(A, B, C). Las componentes z del vector Z = A x B son a su vez deter- minantes de segundo orden y, por tanto, son formas bilineales alter- nantes de los vectores A, B. Esto conduce inmediatamente a las leyes para la multiplicacién de vectores: (72a) (AA) x B= A x (AB) = (A x B); (72b) (A’+ A”) x B= A’x B+ A” x B; Ax (B’+ BY) =Ax B+ Ax B’; (72c) AxB=-BxA. La relacién (72c) podria llamarse la ley “anticonmutativa” de la mul- tiplicacién. Esta ley tiene la importante consecuencia de que (72d) A x A=0 para todos los vectores A. Con ms generalidad, el producto vectorial de dos vectores A, B se anula si y sélo si A y B son dependientes. Porque, por ( c), la relacion A x B = 0es equivalente a det(A, B, C) = 0 para todos los vectores C, o bien, al hecho (ver la p. 214) de que A, B, C son dependientes para todo C. Ahora bien, siempre puede hallarse un vector C que sea in- dependiente de A y B (ver la p. 173). Entonces, la dependencia de A, B, Cimplica que A y B son dependientes. El producto vectorial A x B es perpendicular tanto al vector A como al B, ya que por (71c), (72e) (A x B) + A = det(A, B, A) = 0, (A x B) - B = det(A, B, B) = 0. De aqui que, para A= PoP, y B = PoP. independientes, la direc- cién de A x B es una de las dos direcciones perpendiculares a cual- quier plano PoP:Pz definido por A y B. La longitud del vector A x B también tiene una interpretacion geométrica sencilla. Por (71b), se tiene (72f) | A x B]? = (aabs — bz)? + (aabi — aibs)? + (abe — azbi)? 222 = Introduccién al calculo y al andlisis matemAtico = (ai? + a2? + a3®) (b12+ b2? + bs?) — (abi + a2bz + abs)? = |A/?|B[? — (A- BY? * Usando el hecho [férmula (14), p. 131] de que A-B=|A||B| cosy, donde *y es el Angulo entre las direcciones de A y B, de (72f) se em cuentra que |A x B| = v/AP[BP— [APIBP cos? 7 = |A|B|seny Para A = PoP;, B = PoP en |B|sen y (donde a y se le asigna un valor entre 0 y z) . se tiene la distancia de la recta PoPi al punto P2 (Fig. 2.6). De aqui que (exactamente como en dos dimensiones), la cantidad |A x B| da el 4rea del paralelogramo con vértices Po, Pi, Q, Ps “definido” por los vectores A, B, o el doble del area del trién- gulo con vértices Po, Pi, Pe. Las’ componentes individuales del producto A x B = (21, 22, 23) también pueden interpretarse geométricamente. Por ejemplo, la ex« presion 23 = aibe — aabi es precisamente el producto cruz de los vectores bidimensionales (41, az) y (b1, b2) [ver (70a)]. Si Po tiene las coordenadas &1, &2, s, en |23] se tiene el 4rea del’ paralelogramo en el plano x1, x2 con vértices. 1,82). G1 + ai, Ge + aa), (Er + a + bi, Ee + ae + be), Er + b1, Ge + be). Este paralelogramo es precisamente la proyeccién sobre el plano x1,x2 del paralelogramo con vértices Po, Pi, Q, P2, definido,.en el espacio por los vectores A, B (ver la Fig. 2.7). Si A x B tiene los cosenos directores cos f1, cos Bz, cos Bs, se tiene [ver (9), p. 162] |zs| = |A x B||cos Bs}. TEsta identidad incidentalmente proporciona una demostracién inmediata de la desigualdad de Cauchy-Schwarz |A+BISIAl [BI (ver la p. 166). También suministra la informaci6n adicional de que el signo de igualdad se cumple si y sdlo si los vectores A y B son dependientes. Vectores, matrices, transformaciones lineales 223 - eel (G1 + ants + 42,0) x Figura 2.7 Componentes del producto vectorial A x B =(21, 22, 2s)interpretadas como areas proyectadas. Por tanto, |cosfs| da la razon del area del paralelogramo definido por A y B al drea de su proyecci6n sobre el plano 21, x2. Aqui Bs es el angulo entre la normal al plano que pasa por Po, P1, Poy el eje xs. Por supuesto, éste es el: mismo Angulo que se encuentra entre el plano que contiene al paralelogramo definido por A y B y el plano x1, x2.! 1En general, el area de Ja proyeccién de una figura plana sobre un segundo plano es igual al producto del area de la figura original por el coseno del 4ngulo entre los dos planos, lo que se aclarara cuando se discutan las transformaciones de las inte- grales. 224 Introduccié6n al c4lculo y al an4lisis matematico Si A = PoP, y B = PoP» son vectores independientes, se tiene A x B = PoR, donde el punto R se encuentra sobre la recta que pasa por Po perpendicular al plano PoP:P2 y a una distancia de Po igual al doble del 4rea del triangulo PoP:P2. Esto fija a R casi de modo nico. Sélo existen dos puntos con estas propiedades, que se encuen- tran en lados opuestos del plano. Puede decidirse cual de estos pun- tos es el punto final R del vector A x B = PoR por medio del si- guiente argumento de “continuidad”. El producto vectorial A x B depende continuamente de los vectores A, B, ya que sus componentes son funciones bilineales de las de A, B. Entonces la direccién de A x B también depende continuamente de A y B, con tal que A x B# 0, es decir, con tal que se evite que A y B se hagan 0 0 queden paralelos. Siempre pueden cambiarse los dos vectores A y B conti- nuamente, de tal manera que A y B nunca sean 0 o queden paralelos hasta que, por ultimo, A coincida con el vector coordenado E: = (1, 0,0) y B con el vector Ez = (0,1,0). Esto equivale a deformar el triangulo PoP:P2 continuamente y sin degeneracién, de modo que Po vaya hacia el origen y Pi, P2 queden, respectivamente, sobre los ejes positivos x1 y x2 a la distancia 1 del origen. En el proceso, el punto R sobre la recta que pasa por Po perpendicular al plano PoP: P nunca cruza ese plano. Ahora bien, por (71b), Ei x Ez = (0,0,1) = Es En un sistema coordenado “derecho”, el tipo que comanmente sé usa, la direccion de Es se fija sin ambigiiedad como normal a Ey Ez, en tal forma que la rotacién de 90° alrededor del eje xs que lleva E; hacia Ez se ve como en sentido contrario al movimiento de las manecillas del reloj desde el punto (0,0,1). Entonces, generalmen- te, si el sistema coordenado es derecho la direccin de.A x B = Pok es tal que la rotaci6n alrededor de la recta PoR del vector A = PoPi hacia el vector B = PoP2 en un 4ngulo y entre 0 y m se ve como en sentido contrario al movimiento de las manecillas del reloj cuando se observa desde R (ver la Fig. 2.8). De modo semejante, en un sis- tema coordenado izquierdo la rotacién por 90° de Ei hacia Ez 'se ve como si fuera en el sentido del movimiento de las manccillas del reloj observada desde (0, 0, 1), y lo mismo acontece entonces con la Vectores, matrices, transformaciones lineales 225 Figura 2.8 Producto vectorial A x B en un sistema coordenado derecho. rotacion de A hacia B, observada desde el punto final R de A x B = —> PoR. Generalmente, una terna ordenada de tres vectores independien- tes A, B, C define un cierto sentido u orientacion. Si A = PoPi, B = PoP2, y C = PoPs, puede girarse la direccién de A hacia B en un 4n- gulo entre 0 y 2 enel plano PoP:P2. Por definicién, el sentido de la terna A, B, Ces el que parece tener (en sentido contrario 0 en el sentido del movimiento de las manecillas del reloj) esa rotaci6n, cuando se observa desde el lado del plano hacia el cual apunta C.! La terna B, A, Ctiene la orientacién opuesta. La orientacién de la terna A, B, A x B siempre es la misma que la de los vectores coordenados Ei, Ez, Es. Se dice que la terna A, B, Cest4 orientada positivamente con res- pecto al sistema coordenado %1, x2, x3 si tiene la misma orientaci6n TE] mismo tipo de orientacién determina la diferencia entre los tornillos izquierdos y derechos. El movimiento de un tornillo consiste de una combinacién de un movi- miento de traslacién a lo largo de un eje y de uno de rotaci6n alrededor de ese eje. La distincién entre los dos tipos de tornillos se define por el sentido de la rotaci6n, en el sentido del movimiento de las manecillas del reloj o contrario a é1, cuando se ob- serva desde esa direcci6n del eje en la cual avanza la traslaci6n. 226 Introduccién al calculo y al an4lisis matematico que la de la terna de vectores Ei, Ez, Es, y que esté orientada ne- gativamente si tiene la orientacion opuesta. Para que la terna A, B, Cesté orientada positivamente con respecto a las coordenadas x1,x2, *% es necesario y suficiente que (73) det(A, B,C) > 0 Porque, sea A = PoP, B = PoPi, C = PoPs. la relacion (78) sig nifica que (A x B)-C>0, es decir, que las direcciones de los vectores A x B y C forman un 4n- gulo agudo. Como A x B es normal al plano PoP1Pz, ésto implica que el vector PoPs apunta hacia el mismo lado del plano que el vec- tor A x B. De aqui que A, B, Cy A, B, A x B tienen la misma orientacion, que es la de Ei, Ea, Es. Los tres vectores independientes A, B, C, cuando se les da el mis mo punto inicial Po “definen” o “generan” un cierto paralelepipedo, a saber, el que tiene los puntos finales P1, Po, Ps de A, B, C como vértices adyacentes al vértice Po. Se dice que el paralelepipedo esté orientado positiva o negativamente con respecto al sistema coor denado x1, x2, x3 segin sea la orientacién de la terna A, B, C. Un intercambio de dos cualesquiera de los vectores A, B, C invierte la orientaci6n para el paralelepipedo generado por los vectores. Sea @ el Angulo formado por la direccion de los vectores Cy A x B. Por (71c), (74a) det(A, B,C) = |A x B||C| cos 0 i[a orientacién del paralelepipedo puede imaginarse como una orientaci6n atri- buida a cada cara del paralelepipedo (es decir, como un sentido asignado al poll gono frontera de la cara) de manera tal que a una arista comén de dos caras vecinas se le asignan sentidos opuestos en la orientacién de las dos caras. La orientacién de todas las caras queda determinada de manera nica si se prescribe el sentido de una de las artistas para una sola cara. Para la orientacion del paralelepfpedo generado =< por A, B, G, el sentido de la arista PoP; en la cara definida por los vectores PoPs ¥ = PoP: es el que va de Po hacia Pi (ver la Fig. 2.9). Vectores, matrices, transformaciones lineales 227 Figura 2.9 Volumen V = |A x Bh del paralelepfpedo. Como A x B es perpendicular al plano PoP:P2, el 4ngulo entre la recta PoPs y el plano PoPiP: es 4x — 0. De donde, (4b) = |C]|cos 6] = ict fsen(§ — 6)| es la distancia del plano PaP:Ps, al punto Ps es decir, la altura del paralelepipedo desde Ps. Dado que el volumen V del paralelepipedo es igual al area |A x B| de una de las caras multiplicada por la al- tura correspondiente h, de (74a, b) se concluye que (T4c) V=|A x Bih = |det(A,B,C)|. Osea, el volumen de un paralelepipedo generado por los tres vectores A, B, C es el valor absoluto del determinante de la matriz con co- lumnas A, B, C. Por lo tanto, el valor de det(A, B, C) determina tanto el volumen como la orientacién del paralelepipedo generado por A, B, C. Este hecho se expresa por medio de la f6rmula (74) det(A, B,C) = eV, donde V es el volumen del paralelepipedo generado por los vectores A, B, C; ¢ = +1 si el paralelepipedo est4 orientado positivamente con respecto a las coordenadas x1,x2x3, y € = —1 si est orientado negativamente. b. Desarrollo de un determinante respecto a una columna. Productos vectoriales en dimensiones superiores Sélo en tres dimensiones puede definirse un producto A x B de 228 = Introduccién al calculo y al an4lisis matemAtico dos vectores A, B que dé nuevamente un vector.' El andlogo mas aproximado en n dimensiones seria un “producto vectorial” de n — 1 vectores. Tomando n vectores, Ai = (au, . . .,@n1),. . «, An = (in, . « «, nn) en el espacio n dimensional, puede formarse el determinante de la matriz (Ai, ..., An) con esos vectores como columnas. El deter- minante de esta matriz es una forma lineal en el altimo vector An y puede escribirse como un producto escalar (75) det(Ai,.. ., An) = 2101 + zea2 + +++ + 2ndn = Z+An, donde el vector Z = (zi, . . ., 2n) s6lo depende de los n — 1 vectores Ai, As, ...,An-1. Obviamente, Z es lineal en cada uno de los vec- tores Ai,..., An-1 por separado, y es alternante. A Z se le da el nombre de producto vectorial de Ai, . . ., An-1 y se denota por (76) Z= Aix Asx +++ x Ani. Por (75), es evidente que Z-Av=Z-As=...=Z+Anid se ve que el producto vectorial de n — 1 vectores es ortogonal a cada uno de ellos, como en tres dimensiones. La longitud del producto vectorial Z también puede interpretarse geométricamente como el volumen del paralelepipedo orientado(n — 1) dimensional generado por los vectores Aj, . . ., An-1, como se ver4 posteriormente. Precisamente como en tres dimensiones, las componentes de Z pueden escribirse como determinantes, en analogia con la formula (71b). Primero deduzcamos esa expresién como determinante para la componente Zn de Z. Por (75), 2n = Z+En = det(Ai, . . ., An-1, En), TEn dimensiones superiores no es posible asociar con los dos vectores A, B un tercer vector C hacia afuera del plano generado por A, B, de una manera geométrica, es decir, mediante una construccién que determina a C de modo Gnico y no cambia bajo los movimientos rigidos Vectores, matrices, transformaciones lineales 229 donde + 0,1) es el n-ésimo vector coordenado. Tomar An = En en la férmula general de desarrollo (66a), p. 209, para los determinantes equivale a remplazar el dltimo factor aj,» en cada término por 1, para jn = 7 y por 0, para jn“ n. Para jn =n, el coeficiente &, . . . im-1m Se anula, a menos que ji, . . ., jn—1 Constituyan una permutacién de los nameros1, 2, . . ., ™ — 1.En ese caso el coeficiente (65c, d) se reduce a By. + in-ain = Ei + + + in-in = SENS (jr, « - «y Jay n) = sgn (n — jna)s + + (m— ja) (iry- - +s jn-a) = sgn $ (ji, - . -,Jn-1) = iy - - in-ae De (66a) se deduce que 1, (77a) 2n = 2a St 8 inn Qyyh Giga + + Ajy—yn-d pda | qu aie +e md az ane ee G2 nd Qn-11@n-12 . 6 Qnt nt Se ve que 2n es igual al determinante de la matriz obtenida a partir de la matriz (Ai, . . ., An) omitiendo la altima fila y la altima co- lumna. Generalmente, se define un menor de una matriz a como el determinante de una matriz cuadrada obtenida a partir de a omi- tiendo algunas de las filas y columnas, mientras que se conservan las posiciones relativas de los elementos restantes. El menor complemen- tario a un elemento ajx de una matriz cuadrada aes el que se obtiene a partir de a omitiendo la fila y la columna que contienen al elemen- to ajk. Por tanto, zn es igual al menor complementario a ann. Las otras componentes del vector Z tienen representaciones se- mejantes. Por ejemplo, por (75), se tiene 2n-1 = det(Ai, . . ., An-1, En-1). 230 = Introduccién al cAlculo y al an4lisis matemAtico Con el fin de evaluar este determinante se intercambian las dos dl- timas filas (ver la p. 212) lo cual cambia el signo del mismo. Enton- ces la ultima columna En-1 pasa hacia En y, a partir del resultado anterior, se encuentra que —2Zn-1 es igual al determinante que se ob- tiene omitiendo la Gltima fila y la Gltima columna de la nueva matriz o, lo que es equivalente, es igual al menor complementario al ele- mento G@n_-1n en la matriz original. De modo semejante se encuentra que +z para cadai=1,.. .,m es igual al menor complementario al elemento ain, donde el signo positivo se aplica para n — i paryel negativo para n — i impar. Por tanto, la férmula (75) constituye un desarrollo de un deter- minante de n-ésimo orden en términos de determinantes de (n — 1) -ésimo orden, los menores complementarios a los elementos de la dil- tima columna. Por ejemplo, para n = 4 se tiene la formula au az ais 2 G21 22 d23 2 2 (77b) 2 d31 a3 a33 “| | a4 | i 1 2 @41 G42 as aaa G21 a22 as | |au aie ais | | = aii} a3. ase a3 | + aes | asi sz ass | a4 Gaz G43 faa aa ass | | au az ais | au az ana | asi a21 22 aes | + @4a{ cer aoe “| | @a1 aaz aus | asi asz as33 Intercambiando las columnas se pueden deducir formulas se- mejantes para desarrollar un determinante en términos de los me- nores complementarios a los elementos de cualquier columna dada. Los desarrollos de este tipo juegan un papel en muchas demostra- ciones basadas en la induccién sobre la dimensién del espacio, como se vera posteriormente en las secciones que siguen. c. Areas de paralelogramos y voliimenes de paralelepipedos en dimensiones superiores Las superficies en el espacio se pueden construir a partir de paralelogramos infinitesimales. Por consiguiente, las formulas para Vectores, matrices, transformaciones lineales 231 las areas de superficies curvas y para las integrales sobre superficies requieren el conocimiento de una expresién para el area de un paralelogramo en el espacio. De modo semejante, las férmulas para los volamenes o las integrales de volumen sobre variedades curvas se tienen que basar en expresiones para volimenes de paralelepipedos en dimensiones superiores. Tales expresiones se deducen facilmente con la maxima generalidad, con la ayuda de los determinantes. La cantidad basica asociada con los vectores es el producto escalar de dos vectores A=(a,.. an) y B= (bi... ., bn) el cual en cualquier sistema coordenado cartesiano esta dado por A+Beaibit+ + +anbn. Mientras que las componentes individuales a; y bx de Ay B depen- den del sistema coordenado cartesiano especial que se use, el produc- to escalar tiene un significado geométrico independiente: A-B= |A||B| cos y, donde |A|, |B] son las longitudes de los vectores Ay By y es el Angulo entre ellos. Se deduce que cualquier cantidad que se puede expresar en términos de productos escalares tiene un significado geométrico in- variante y no depende del sistema coordenado cartesiano especial que se use. La cantidad mis sencilla expresable en términos de productos es- calares es la distancia entre dos puntos Po, Pi, que es la longitud del vector A= PoPi. El cuadrado de esa distancia esté dado por (78a) |AJ2?=A-A. Con los dos vectores A, B en el espacio n dimensional, puede asociar- se el drea de un paralelogramo generado por los dos vectores si se les da un punto inicial comtin Po. Sea A = PoP; y B = PoP2, Los vec- tores entonces generan un paralelogramo Po. Pi, Q, P2 que tiene a Pi y P2 como vértices adyacentes al vértice Po. Por la geometria elemen- tal, el 4rea a del paralelogramo es igual al producto de los lados ad- yacentes multiplicado por el seno del angulo y que forman: 232 = Introduccién al cAlculo y al an4lisis ratematico Al|Blsen 7 = ¥/AP[BP—[APIBFE cos? y = vVIAFIBP=(4> BP como ya se encontré en la p. 222 para el caso especial n = 3.se puede escribir esta formula para el 4rea a de manera mas adecuada, en la forma de un determinante para el cuadrado de a: A-A A-B ‘78b) 2 = (A- A)(B- B) — (A+ B\(B- A) = (78) a? = (A- AYB-B)—(A+BYB-A)=| Fg El determinante que aparece aqui a la derecha se llama determinan- te de Gram de los vectores A, B y se denota por F(A, B). Es evidente, con base en la deduccién, que T(A, B) >0 para todos los vectores A, B, y que sdlo se cumple la igualdad si Ay B son dependientes.? Puede deducirse una expresién semejante para el cuadrado del volumen V de un paralelepipedo generado por los tres vectores A, B, Cen el espacio n dimensional. Represéntense los vectores en la forma A=PP, B=PP:, C= PoPs y considérese el paralelepipedo que tiene a Pi, Pz, P3 como vértices adyacentes al vértice Po. Su volumen V puede definirse como el producto del 4rea a de una de sus caras multiplicado por la altura h correspondiente. Eligiendo como a el 4rea del paralelogramo generado por los vectores A y B, tiene que tomarse como h la distan- cia del plano que pasa por Po, Pi, Pe al punto P3.De donde, via nat = nr(a,B)=ne|4°4 4° B| |B-A B-B TEs decir, si cualquiera de los vectores se anula (|A| 0 bien, |B| =0) 0 si son pa- ralelos (sen y = 0). Vectores, matrices, transformaciones lineales 233 Se interpreta h como la distancia “perpendicular” del plano Po P P, a Ps, es decir, la longitud de ese vector D = PP3 que es perpen- dicular al plano y tiene su punto inicial P en el plano. Para un punto Pen el plano PeP:Pz el vector PoP debe ser dependiente de A = PoP; y B = PoP» (ver la p. 179) PoP =A + iB. De aqui que el vector D tiene la forma D = PPs = PoPs — PoP = C — 2A — 1B con las constantes 1, apropiadas. Si D tiene que ser perpendicular al plano generado por Ay B, se debe tener (79a) A-D=0, B-D=0. Esto conduce a un sistema de ecuaciones lineales para determinar } yu (79) A+C=2A+A+ UA-B, B-C=)B-A+uB-B. El determinante de estas ecuaciones es precisamente el determinante de Gram IA, B). Suponiendo que A y B son vectores independien- tes, se tiene [(A, B) # 0. Entonces, existe una solucion determinada de manera nica 2, p de las ecuaciones (79) y, de aqui, un vector tnico D = PP3 perpendicular al plano PoP:P2 y con punto inicial en ese plano. La longitud de ese vector es igual a la distancia h, de modo que, por (79a) he = |Di2?=D-D=(C~AA—uB)-D =C-D-2A-D-pB-D =C-D=C-C-AC-A- pC-B. Esto conduce a la expresi6n (79¢) V2 = (C-C —AA+C — pB- C) I(A,B). 234 Introduccién al cAlculo y al an4lisis matem4tico Esta expresién para el cuadrado del volumen del paralelepipedo definido por A,B,C puede escribirse en forma mAs adecuada como el determinante de Gram formado a partir de los vectores A,B,C: A-A A+B A-C (79d) v2=|B-A B-B- B-C|=T(A,B,©). C-A C-B C-Cl Con el fin de demostrar la identidad de las expresiones (79c) y 79d) para V2, se hace uso del hecho de que el valor del determinanteI(A, B,C) no cambia si de la tltima columna se resta 4 veces la pri- mera columna y #t veces la segunda columna: j|A-A A+B A-C-—2A-A-—pA-B] B-A B-B- B-C-—AB-A-—pB-B|. C-A C-B C-C—2C-A-1C-B) T(A,B, C) = De (79b) se deduce que A-A A-B T(A,B,C)=|B-A B-B : 1C-A C-B C-C-2C-A-uC-B Desarrollando este determinante en términos de la altima columna, se regresa inmediatamente a la expresin (79c). La formula (79d) muestra que el volumen V del paralelepipedo generado por los vectores A, B, C no depende de la eleccién de la cara ni de la altura correspondiente usadas en el calculo, porque el valor de [(A, B, C)no cambia cuando se permutan A, B, C. Por ejemplo, puede obtenerse T (A, B, C) intercambiando las dos pri- meras filas y, a continuaci6n, las dos primeras columnas en el deter- minante para I(A, B, C). La formula (79c) puede escribirse como T(A,B,C) = |D]|2/(A,B). Se deduce que T(A,B,C) 20 Vectores, matrices, transformaciones lineales 235 para cualesquiera vectores A, B, C. Aqui slo puede cumplirse el si no igual si P(A, B) = 0 o bien, D = 0. La relacion (A, B) = 0 im- plicaria que A y B son dependientes. Si D = 0,se tendria C = 1A + pB, de modo que C dependeria de A y B. De aqui que el deter- minante de Gram I(A, B, C) se anula si'y sélo si los vectores A,B,C son dependientes. Para n = 3, la férmula (79d) se deduce inmediatamente a partir de la formula (74c) para el volumen V de un paralelepipedo orien- tado generado por los tres vectores A,B,C en el espacio tridimen- sional. Esta es una consecuencia de la identidad (68f), p. 213, de acuerdo con la cual det(A, B, C) det(A, B,C) = (A, B, C). La expresi6n para V? como un determinante de Gram tiene la ven- taja de mostrar que V es independiente del sistema coordenado car- tesiano especial que se use, y de aqui que V tiene un significado geométrico. Puede proseguirse hacia los “voltimenes” V de paralelepipedos tetradimensionales generados por cuatro vectores A = PoPi, B = PoP:, C = PoPs, D = PoPs en el espacio n dimensional (n > 4). De- finiendo V como el volumen del paralelepipedo tridimensional ge- nerado por los tres vectores A, B, C multiplicado por la distancia del “plano” tridimensional que pasa por los puntos Po, P1, Ps, Ps al punto Py, se llega, exactamente a través de los mismos pasos anteriores, a una expresién para V2 en la forma de un determinante de Gram: j[A:A A+B A.C A.D) |B-A B-B B-C_ B-D| @) Y= oa cB ceo cep) “BOD |D-A D-B D-C D-D\ Si aqui n = 4, el determinante de Gram se convierte en el cuadrado del determinante de la matriz con columnas A, B, C, D, y se encuen- tra que (80b) V = |det(A, B, C, D)|. Mas generalmente, m vectores A1,..., Am en el espacio n dimensional, a los cuales se les asigna un punto inicial comin Po, 236 = Introduccién al cAlculo y al anAlisis matematico generan un paralelepipedo m dimensional. El cuadrado del volumen V de ese paralelepipedo esta dado por el determinante de Gram Ar Ar Ars Ag + + + Ais Am Az-Ar Ag+ Az + + + Az+Anm (la) V?= . . . =T(Ai,..., A me Ar Am+ Ao ++ + Am: An| Si m =n se obtiene, para el volumen del paralelepipedo generado por n vectores en el espacio n, la formula (81b) V = |det(Ai,. . ., An)|. Por inducci6n sobre m se prueba que T(Aa,. . -, Am) 20, donde la igualdad se cumple si y sélo si los vectores Ai, . . ., Amson dependientes.* d. Orientacién de paralelepipedos en el espacio n dimensional Posteriormente, en el Capitulo 5, cuando necesitemos un método consistente para fijar el signo de las integrales miltiples, tendremos que hacer uso de los volimenes con signo y las orientaciones de los paralelepipedos en el espacio n dimensional. Para el volumen definido por n vectores Ai,..-,An en el es- pacio n dimensional se tiene, por (81b), la expresién V = |det A,..., An)l. det(A1, . . ., An) recibe el nombre de volumen en las coordenadas (x1 + + + x») del paralelepipedo, ortentado generado por Ai, .. ., An. Se dice que el paralelepipedo, o que el conjunto de vectores Ai, . . ., Tin el caso de los vectores dependientes Ai, . . ., Am con punto inicial comtn Po el paralelepipedo generado por estos vectores “se contrae” hacia una variedad lineal de m-1 dimensiones 0 menos y tiene un volumen m dimensional igual a 0. Vectores, matrices, transformaciones lineales 237 An _ esta orientado positivamente con respecto al sistema coordenado si det(Ai, . . ., An) es positivo, negativamente si el determinante es negativo. Por tanto, (81c) det(Ai,.. ., An) =eV, donde V es el volumen del paralelepipedo generado por los vectores Ai,...,An y € = +1 0 bien, —1 de acuerdo con que el paralelepi- pedo esté orientado positiva o negativamente con respecto al sistema coordenado. Mientras que el cuadrado de det (Ai, . . ., An) tiene un signifi- cado geométrico independiente del sistema coordenado cartesiano, éste no es el caso para el signo del determinante. El intercambio, por ejemplo, de los ejes x1 y x2 conduce al intercambio de las dos pri- meras filas dei determinante y, por tanto, a un cambio del signo en el det(A1, . . ., An). Sin embargo, lo que tiene un significado geo- métrico independiente es la afirmacién de que dos paralelepipedos n dimensionales en el espacio n dimensional tienen la misma orien- tacién u orientaciones puestas. Considérense dos conjuntos ordenados de vectores Ai,..., An Bi,...,Bn en el espacio n dimensional, donde se supone que cada conjunto consiste de vectores independientes. Obviamente, los dos conjuntos tienen la misma orientacién —es decir, ambos estan orientados positivamente o ambos negativamente con respecto al sis- temax1+ + + Xn Si y s6lo si se satisface la condicién (62a) det(Ai,.. ., An) + det(Bi, . . ., Bn) > 0. Usando la identidad (68f), esta condicién puede escribirse en la forma (82b) fA, ..., An; Bu, Bn] > 0, donde el simbolo de la izquierda denota la funcién de 2n vectores definida por 238 = Introduccién al cAlculo y al an4lisis matemAtico Ai-Bi Ai+Be +++Ar- Ba Ao+Bi Ag+ Be +++ A2- Ba (82c) [A1, . . ., An; Bi,. . ., Br] = . : : Bi An-Be +++ An+ Bun Nétese que para Bi = Au,. . ., Bn = An, el simbolo [Au, . . ., Ani Bi,..., Bujse reduce al determinante de Gram F(Ai,. . ., An): Las formulas (82b, c) hacen evidente que tener la misma orientacién es una propiedad geométrica que no depende del sistema coordenado cartesiano especifico que se use. Esta propiedad se denota simbéli- camente por (82d) O(Aa, . . «, An) = Q(B, . . ., Bn) y la propiedad de tener la orientacién opuesta'por (82e) O(Ay, . . An) = —Q(B), . . ., Bn). Entonces, generalmente, para dos conjuntos de n vectores indepen- dientes en el espacio n dimensional, (82f) Q(Bi, . . ., Bn) = sgnfAn, . . ., An; Bi. . ., BuJO(Ai, . . ., An). TLa orientacion individual Q de una n-ada de vectores no representa un “ntimero” La formula (82f) s6lo asocia un valor -+1 con la raz6n de dos orientaciones, mien- tras que las formulas (82d, ¢) expresan la igualdad o la desigualdad de las orien- taciones. Por supuesto, es posible describir las dos diferentes orientaciones posibles de las n-adas completamente por medio de valores numéricos, digamos, dando ¢l valor Q = +1 a una de las orientaciones, el valor Q = ~1 a la otra. No obstante, es- to involucra la seleccién arbitraria de una “orientacién estandar” que Ilamamos_ +1 — por ejemplo, la dada por los vectores coordenados —mientras que las relaciones (82d, e, f) tienen un significado independiente de cualquier valor numérico que se le asigne a Q. Situaciones andlogas son comunes en toda la extensién de las mate: maticas. Por ejemplo, en la geometria euclidiana la igualdad de las distancias e in- cluso la raz6n de las distancias tienen un significado, aun cuando no se les asignan valores numéricos a las distancias (como en los Elementos de Euclides). Es cierto que las distancias pueden describirse por medio de ntmeros reales tales que la raz6n de las distancias es precisamente la de los nimeros reales correspondientes. Esto re- quiere la seleccion arbitraria de una “distancia estandar” (por ejemplo, un metro), la cual se refieren todas las demas distancias y, en consecuencia, en cierto sentido in- troduce un elemento “no geométrico”. Vectores, matrices, transformaciones lineales 239 El conjunto Ai, . . ., An esta orientado positiva o negativamente con respecto a las coordenadas x1 + + + Xn segtin que (88a) OA, . . ., An) = Q(En, . . ., En) © bien que (83b) Q(AL, . . ., An) = —Q(Ei, . - ., En), donde E1,..., En son los vectores coordenados. En ocasiones se denotara la orientacién Q(Ei, . . ., En) del sistema coordenado, por Qx1, X2, «+, Xn). Para dos conjuntos de n vectores en el espacio n dimensional, Ai, ., An y Au,...,An se tiene, por (82c), (81b), (84a) [Ai,.. Any Av’, . ., An!) = 86’ VV" Aqui Vy V’ son, respectivamente, los voltimenes de los paralelepi- pedos generados por los dos conjuntos de vectores; los factores e, & dependen de sus orientaciones y de la de los vectores coordenados: (4b) e=sgn[Ai,...,AnjEi,..., En) (4c) e = sgn[Ar,..., An’; Ei,. . ., En. El producto (84d) ee’ = sgn [Ai, . An; Ay’, . . -, An’ es independiente de la eleccién del sistema coordenado y tiene el valor +1 si los paralelepipedos tienen la misma orientaci6n, pero es —1si sus orientaciones son opuestas. Usando la definicion en términos de productos escalares, se puede formar la expresi6n (85a) (Au, . . -, Am; A’, An’) 240 Introduccién al calculo y al andlisis matematico Ar-Ar Ai + Ay! see Ar: Am’ Az Ar Az + Ay! +++ Aes Am’ Am: Ar Am>+ As! Am + An’ para cualesquiera 2m vectores Au, . An! en el espacio n dimen- sional. Es evidente, a partir de la definicién, que esta expresién es una forma multilineal en los 2m vectores. Por ejemplo, el vector Ar’ solo en la primera columna y los elementos de esa columna son for- mas lineales en Ai’. Dado que el determinante completo es una forma lineal en los elementos de la primera columna, se concluye que es una forma lineal en Ai’. También es evidente, de (85a), que la ex- presion es una funci6n alternante de los vectores Ai’, . ., An’ para A,...,Am fijos, y una funcién alternante de Aa,.. ., Am pa ra Ai’, . . ., Am'fijos. Se concluye (ver la nota al pie de la p. 286) que (85b) (Aa...) Am; Ad’, . . ., An’) = 0 siempre que los m vectores Au, . . ., Am 0 los m vectores Ay’,. «++ An'sean dependientes. En particular, (85b) siempre se cumple cuan- dom>n. Supdéngase entonces que m 0. Entonces, por (85c), (85d) sgn [A1,.. ., Am; Ai’,.. ., An’) = ee’. Asi, la condicién [Ai,..., Am; Ar,..., An‘) >0 para cualesquiera Ai,..., Amen m yAi,...,Am'en 1’ significa que ambos conjuntos de vectores estén orientados positivamente 0 que ambos est4n orientados negativamente con respecto a los sistemas coordenados en esos espacios. e. Orientacién de planos e hiperplanos La eleccién de un sistema coordenado cartesiano particular en una variedad lineal m dimensional x determina un cierta orien- tacion Qi, . . ., Em), donde Ei, ..., Em son los vectores coordenados. Esta eleccién fija cuales conjuntos de m vectores Ai, . . ., Am en 1 se dice que estan orientados positivamente, a saber, aquellos con la misma orientaci6n que E1,...,Em. Denotamos por n* la combinacién del espacio lineal x con la seleccién de una orientacién particular en m y a m* se le da el nombre de variedad lineal orientada. Se escribe Q(n*) para la orientacién seleccionada y se dice que m vectores indepen- dientes Ai, . . ., Am en 7 estan orientados positivamente si O(Ag, . . ., Am) = Q(x*). Se dice que n* esté orientada positivamente con respecto a un sis- tema coordenado cartesiano particular si la orientacién de los vec- tores coordenados es la misma que la de n*, Un plano bidimensional orientado n* puede imaginarse como un plano con un sentido positivo de rotaci6n distinguido. Si una pareja T§e verifica facilmente que 1 = 0 solo cuando y n’ son perpendiculares entre st, es decir, cuando 7’ contiene un vector ortogonal a todos los vectores en x. Con mayor generalidad, el coeficiente puede interpretarse como el coseno del angulo entre las dos variedades (ver el problema 18, p. 246). Vectores, matrices, transformaciones lineales 243 de vectores A, B est4 orientada “positivamente” con respecto a n* el sentido positivo de rotacién de n* es el sentido de la rotacién en un angulo menor que 180° que lleva la direccién de A hacia la de B.' Si el plano bidimensional orientado 1n* se encuentra en un plano tridimensional orientado o*, pueden distinguirse un lado posttivo y uno negativo de x*. Sea Po cualquier punto de n*, Témense dos vec- tores independientes B = PoP:, C = PoP: en n* para los cuales (86a) QUB, C) = A(n*) Se dice que un tercer vector A = PoP3, independiente de B, C, apunta hacia el lado posttivo de n* si (86b) Q(A, B, C) = Ao*). Si o* esta orientado positivamente con respecto a un sistema coor- denado cartesiano, puede remplazarse la condicién (86b) por (86c) det(A, B, C) > 0 en ese sistema. Si o* est orientado positivamente con respecto al sistema coordenado derecho usual, entonces el lado positivo de un plano orientado r* es aquél desde el cual el sentido positivo de rotacion en %* se ve como en sentido contrario al movimiento de ! manecillas del reloj. La misma terminologia se aplica a los hiperplanos orientados n* en el espacio orientado n dimensional o*. Dados m — 1 vectores Az, . +, An en ™* con (87a) Az, .. A Qe"), se dice que un vector Ai apunta hacia el lado positivo de x* si TNétese que la orientacién de n* sélo puede describirse sefialando una pareja es- pecifica de vectores B, C en x orientada positivamente, o bien, un objeto giratorio especifico en m (por ejemplo, un reloj) que tenga el sentido de rotacién que se distin- gue. No existe manera abstracta de decidir si una rotacién dada es en el sentido oen sentido contrario al movimiento de las manecillas del reloj, como tampoco existe una manera abstracta de decir lo que es la derecha y lo que es la izquierda. Estas cues- tiones s6lo pueden decidirse por referencia a algunos objetos estandar. 244 = Introduccién al cAlculo y al andlisis matemAtico (87b) OA, . . ., Ani, An) = Q(o*), f. Cambio de volumen de los paralelepipedos en las transfor- maciones lineales Una matriz cuadrada a = (ajx) con n filas y columnas determina una transformaci6n o aplicacién lineal Y = aX de los vectores Xen el espacio n dimensional hacia los vectores ¥ del mismo espacio. Aqui se supone que X y Y estan referidos-a los mismos vectores coorde- nados Ei,...,En. Para X =(x1,..., xn), Y=(yi,..., yn), la transformaci6n, escrita en sus componentes, tiene la forma we x Airy G=1.. 40). 4 Un conjunto de n vectoresBi = (bn, . . ., bn), . . «) Bn = (bins ban) se transforma en el conjunto de n vectores Ci = (cui, . . «, cm) (cin, . . ., Cnn), donde n Ce = 4 Apbre , F= Por la regla para el determinante de un producto de matrices (p. 210), se tiene (88a) det(Ci, . . ., Cn) = det(a) - det(Bi, . . ., Bn). Esta formula contiene las dos f6rmulas (88b) |det(Ci, . . ., Cn)| =|det(a)| |det(Bi, . . ., Bn)| (88c) sgn det(Ci, . . ., Cn) = [sgn det(a)][sgn det(Bi, . . ., Bn)]. Estas dos reglas pueden enunciarse inmediatamente en lenguaje geométrico: La transformacién lineal del espacio n dimensional sobre st mismc correspondiente a una matriz cuadrada a, multiplica el volumen de todo paraleleptpedo generado por n vectores por el mismo factor constante det(a). Esta transformaci6n conserva la orientacién de todos los paraleleptpedos n dimenstonales si det (a) > 0, y cambia la Vectores, matrices, transformaciones lineales 245 orientacién de todos ellos si det (a) < 0.1 Para un movimiento rigido la matriz a es ortogonal y, por tanto (ver la p. 218), su determinante es +1, o bien, —1. Por tanto, los movimientos rigidos conservan el volumen de os paralelepipedos. Aquéllos para los que det(a) = +1 conservan el sentido; los otros lo invierten. Ejercicios 2.4 1. Tratar el niimero 5 de los Ejercicios 2.2 en términos de productos vec- toriales. 2. En una rotacién uniforme, sean («, 8, y) los cosenos directores del eje de rotacion, el cual pasa por el origen, y « la velocidad angular. Hallar la velocidad del punto (x, y, 2). 3. Demostrar que el plano que pasa por los tres puntos (x1, 1, 21), (2, 9a 22), (xs, ys, 23) esta dado por mx yy uz x2—x yo—-y za—z x3—X% ys—y z—-z 4, Encontrar la distancia ms corta entre las dos rectas / y I’ en el espacio, dadas por las ecuaciones x = at+b, y=ct+d, z=et+fyx=at +b, yHctt+d,z=et+f 5. Demostrar que el area de un poligono convexo con los vértices sucesivos Pi(x1, y1), Po(x2,y2), . . .,Pa(%n,yn) esta dada por la mitad del valor absoluto de | x2 xs Xn XL te xe yi ye feet + | x xn Yn-1 Yn v | ye ys yn Wn 6. Probar que el drea del triangulo con vértices (x1, 1), (x2, y2), y (xs, ys) es. i]/™ md g| 2 2 1 xs ys 1 7. Si los vértices del triéngulo del ejercicio anterior tienen coordenadas racionales, probar que el triéngulo no puede ser equilatero. TEs importante hacer resaltar las hipétesis en este teorema. Sélo los volamenes de paralelepipedos n dimensionales se multiplican por el mismo factor; los de dimen- siones inferiores se multiplican por factores que varfan con su localizacién. También tiene que suponerse que imagen y original se refieren al mismo sistema coordenado, sies que ha de cumplirse la proposicién acerca de las orientaciones. 246 Introduccién al cAlculo y al anAlisis matematico 8. (a) Probar la desigualdad be | SV FOF Nat ED? CNal* + BE OM), ? (b) Cuando se cumple el signo de igualdad? © Probar las identidades vectoriales (a) Ax (Bx C) = (A-C)B— (A+B) C (b) Kx ¥Y)+ (Xx YD = (K+ XD (V+ YD — (KV YX) (c) [X x (Y x Z] + {1¥ x @ x X)] x [Z x & x YI} =0. 10. Dar la f6rmula para una rotacién en un Angulo ¢ alrededor del eje +: yiz=1:0:—1 tal que la rotacién del plano x = z sea positiva cuando se observa desde el punto (—1, 0, 1). 1 . Si A, B y Cson independientes, usar las dos representaciones de X = (A x B) x (C xD) obtenidas en el Ejercicio 9a para expresar D como una combinacién lineal de A, B y C. 12. Sean Ox, Oy, Oz y Ox’, Oy’, Oz’ dos sistemas coordenados derechos. Supéngase que Oz y Oz’ no coinciden; sea 0 el angulozOz’ (0 < 0 <7). Tracese la semirrecta Ox1 a 4ngulos rectos tanto con Oz como con OZ y tal que el sistema Ox1, Oz, Oz’ tengan la misma orientacién que Or, Oy, Oz. La Onxies la recta de interseccién de los planos Oxy y Ox’y’. Sea ¢ el Angulo x0x1 y ¢ el angulo x1Ox’ y supéngase que se miden en ¢l sentido positivo usual en sus respectivos planos Oxy y Ox’y’. Encontrar la matriz para el cambio de coordenadas. 13. Sean = y x’ dos subespacios lineales m dimensionales del mismo espacio” dimensional, con las respectivas bases ortonormales E1, E2,. . .,Em Y Ey, Ey’,. . ., En’. Demostrar que » = [E1, Ez, . . ., Em; Ev’, Ex, . En’]=0_ si y solo sim y 7’ son ortogonales, es decir, uno de los es pacios contiene un vector perpendicular a todos los vectores del otro. 2.5 Nociones vectoriales en el anAlisis a. Campos vectoriales El an4lisis matemAtico entra en juego cuando nos interesamos en una variedad vectorial dependiente de uno o mAs parametros que varian de manera continua. Si, por ejemplo, se considera un material que ocupa una porcién de espacio y que se encuentra en estado de movimiento, entonces en un instante dado cada particula del material tendra una velocidad definida que se representa por medio de un vector U=(u1, ws, ws).S€ dice que estos vectores forman un campo vectorial en la regién en Vectores, matrices, transformaciones lineales 247 cuestion. Entonces, las tres componentes del vector del campo aparecen como tres funciones ur(x1, x2, X3), Ur(X1, X2, x3), Wa(x1, x2, x2) de las tres coordenadas x1, x2, x3 de la posicién de la particula en el instante en cuestién. Comanmente se representaria U como un vector con punto inicial (x1, x2, x3). Del mismo modo, las fuerzas que actian en puntos diferentes del espacio forman un campo vectorial. Como ejemplo de un campo de fuerzas considérese la fuerza gravitacional por unidad de masa ejer- cida por una particula pesada, de acuerdo con la ley de atraccién de Newton. De acuerdo con esa ley, el campo vectorial F = (fi, fz, fs) en cada punto (x1, x2, x3) esta dirigido hacia la particula que atrae y su magnitud es inversamente proporcional al cuadrado de la distancia de la particula al punto. Los campos vectoriales, como U o F, tienen un significado fisico independiente de las coordenadas. En un sistema coordenado car- tesiano %1, x2, x3 dado, el vectur U tiene las componentes wi, U2, Us que dependen del sistema coordenado. En un sistema coordenado cartesiano diferente, el punto que originalmente tuvo las coorde- nadas x1, x2, xg recibe las coordenadas 1, y1,y3 donde las yi y las xx estan relacionadas por medio de ecuaciones de la forma Yi = Quix + aiexe + aisxs + b1 (89a) 2 = Gaix1 + a22xX2 + araxg + be 33 = @31X1 + Ag2x%2 + assx3 + bs, o bien, (89b) w= x Ojexe + b; G = 1,2, 8). Entonces, las componentes v1, v2, v3 del vector U en el nuevo sistema coordenado estan dadas por las relaciones homogéneas correspon- dientes: 3 (89c) y= 2 OjeUr G =1,2,3). La matriz a = (aj) es ortogonal, de modo que (ver la p. 194) su reciporca es igual a su transpuesta. En consecuencia, las soluciones 248 Introducci6n al cAlculo y al anlisis matemAtico de las ecuaciones (89b), (89c) para xx y ux toman la forma (894) ae = 3 anys — bd) (k= 1,2,3), (89e) ue = x ayn; (k=1,2,3) Tres funciones cualesquiera u:,U2, Us de las variables x1, x2, *3 determinan un campo de vectores U con componentes U1, U2, Us en las coordenadas x1, x2, x3. Si el campo ha de tener un significado in- dependiente de la eleccién de los sistemas coordenados, las com- ponentes u; de U en un sistema coordenado cartesiano 1, 2, Y3 deben estar dadas por la férmula (89c), siempre que las » y las % estén relacionadas por las f6rmulas (89a). b. Gradiente de un escalar Un escalar es una funcién s = s(P) de los puntos P en el espacio. En cualquier sistema coordenado cartesiano en el que el punto P esté descrito por sus coordenadas x1, x2, x3, el escalar sse convierte en una funcién s = f (x1, x2, xs). Las tres derivadas parciales as Bay 7 ferns, m2, 23), u= Fy as Ua = 955 = Farle, x2, 28), 4: us = is = fay(x1, x2, X3)- pueden considerarse como componentes, en las coordenadas 1, x2, x3 de un vector U = (wi, ue, us). En cualquier nuevo sistema coordenado cartesiano i, ye, ¥s enlazado, con el original por medio de las relaciones (89a), o bien, (c3d), el escalar s queda representado por la funcién = B(yL 2, Ys) = 1 (3 ante — 2), Banoe — be), Barston — 8). Por la regia de la cadena de la derivaci6n (p. 55), se tiene Vectores, matrices, transformaciones lineales 249 a Wy = Fy, = Bri InI) = os xe 1 OxK Ay; a = Do uraye. R=L Usando las relaciones (89c), se ve que el vector U tiene las compo- nentes Uy = s/dy; en el sistema 41, ¥2,93. Ast, las derivadas parciales del escalar s formado en cualquier sistema coordenado cartesiano, constituyen las componentes de un vector U que no depende del sis- tema. A U se le da el nombre de gradiente del escalar s y se escribe U = grad s. Por la férmula (14b), p. 73, la derivada de s en la direccién con cosenos directores ai, cos az, cos ag est dada en las coorde- nadas 41, 2, x3 por _ as as as (90) Dis = Gy, CO801 + 5 Costa + Ze, COs Gs. Introduciendo el vector unitario R = (cos a1, cos dz, cos as) en la direcci6n con Angulos directores aj, az, a3, puede escribirse la deri- vada de s en esa direccién, en notaci6n vectorial, como (90b) Dis = R + grad s. A partir de la desigualdad de Cauchy-Schwarz (ver la p. 182) se en- cuentra, para|R| = 1. |Ds|S|R||grad s| =|grads| De donde, la derivada de s en cualquier direccién nunca es mayor que la longitud del gradiente de s. Tomando como R al vector unitario en la direccién de grad s, se encuentra para la derivada direccional el valor 1 = Dos = Tgrad oy 8724 8) + (grad s) = |grad s| 250 Introducci6n al cAlculo y al an4lisis matem4tico Por tanto, Ja longitud del vector gradiente de s es igual a la rapidez mdxima de cambio de s en cualquier direccién. La direccién del gradiente es aquella en la que el escalar s crece mas rdpidamente, mientras que en la direccion opuesta s decrece con mayor rapidez. En el Capitulo 3 regresaremos a la interpretacién geométrica del gradiente. No obstante, inmediatamente puede darse una idea in- tuitiva de la dérecci6n del gradiente. Restringiéndonos primero a los vectores en dos dimensiones, tenemos que considerar el gradiente de un escalar s = f(x1, x2). Se supondr que s se representa por medio de las curvas de nivel (0 Iineas de contorno) s = f(x1, x2) =constante = en el plano 21, x2,Entonces, obviamente, la derivada de s en un pun- to Pen la direccién de la curva de nivel que pasa por P es 0, porque si Q es otro punto sobre la misma curva de nivel se cumple la ecuacién s(Q) — s(P) = 0; dividiendo por la distancia p entre Qy Py haciendo que p tienda a 0, en el limite (ver la p. 72) se encuentra que la derivada de s en la direccién tangencial a la curva de nivel en Pes 0. Asi, por (90b), R. grad s = 0 si R es un vector unitario en la direccién de la tangente a la curva de nivel y, por lo tanto, en todo punto el vector gradiente de s es perpendicular a la curva de nivel que pasa por ese punto. Se cumple una proposicién exactamente analoga para el gradiente en tres dimensiones. Si se representa el es- calar s por medio de sus superficies de nivel s = f(x1, x2, x3) =constante = c, el gradiente tiene componente cero en toda direccién tangencial a la superficie de nivel y, por consiguiente, es perpendicular a la super- ficie de nivel. En las aplicaciones frecuentemente se encuentran campos vec- toriales que representan el gradiente de una funcién escalar. Puede tomarse como un ejemplo el campo gravitacional de fuerzas debido a una particula de masa M concentrada en un punto Q = (E1, &2, &3) Denotemos por F = (fi, f2, fs) la fuerza ejercida por la masa atractiva M sobre una particula de masa m localizada en el punto P = (x1, x2, x3). Dendtese por R el vector R = QP = (x1 — 1, x2 — 2, 23 — &5). Vectores, matrices, transformaciones lineales 251 Por ia ley de Newton de la gravitacién, F tiene la direccién de —R y la magnitud C/|R]2, donde C = ymM (aqui y denota la constante universal de gravitacién). De donde, o bien, 4 C Teas G— mt Gm lame Derivando, inmediatamente se verifica que fi u c Gj = 1,2, 3). De aqui que @) F = grad ©, donde VEr = x1)? + Ge — 22)? + Es — x9)? =|RI es la distancia entre las dos particulas en Py Q. Si un campo de fuerzas es el gradiente de una funci6n escalar, a menudo esta funcién escalar recibe el nombre de funcién de poten- cial del campo. En el estudio del trabajo y la energia (pp. 728 y 788 se considerar4 este concepto desde un punto de vista mas general. c. Divergencia y rotacional de un campo vectorial Derivando, a cada escalar se le ha asignado un campo vectorial: el gradiente. De modo semejante, a cada campo vectorial U se le puede asignar un cierto escalar, conocido como divergencia del cam- po vectorial U. Para un sistema coordenado cartesiano xi, x2, x3 es- pecifico en el que U = (1, uz, ws), se define la divergencia del vector U como la funci6én (92) 252 Introduccién al cAlculo y al an4lisis matematico es decir, como la suma de las derivadas parciales de las tres com- ponentes con respecto a las coordenadas correspondientes. Puede demostrarse que el escalar div U definido de esta manera no depende de la eleccién particular del sistema coordenado cartesiano.' Sup6n- gase que las coordenadas 41, y2, ysde un punto en un sistema coor- denado diferente estan relacionadas con x1, x2, x3 por medio de las ecuaciones (89b); entonces, las componentes v1, v2, vs de U en el nuevo sistema estan dadas por las relaciones (89c). A partir de la regla de la cadena para la derivaci6n se tiene div U py Dux _ se Oux Oy) xx ay; axe Our a = uk OOS oy Bs OH dy, day, moe 8, avy Fi Ox,” lo cual demuestra que se llega al mismo escalar div U en cualquier otro sistema coordenado. Aqui nos restringiremos a la definicién formal de la divergencia; posteriormente (Capitulo V, Seccién 9) se discutira su interpretacion fisica. Adoptaremos el mismo procedimiento para el llamado rotacional de un campo vectorial U. El rotacional es a su vez un vector B= rot U. Si en un sistema coordenado x1, x2, x3 el vector U tiene las com- ponentes w1, u2, us, se definen las componentes bi, bz, bs de rot U por dus _ dus dur _ dus ug dur (93) b= ae, — ag’ 8 = aay ~ Ox’ © = der — Sxa" Este no seria el caso para otras expresiones formadas a partir de las primeras de- rivadas de las componentes del vector U, por ejemplo, dur , du _ dus oxi * Ome axe obien, aur | dus | dus axe * Axa * Oxi" Vectores, matrices, transformaciones lineales 253 Puede verificarse, como en los otros casos, que la definicién dada del rotacional de un vector U en realidad proporciona un vector in- dependiente del sistema coordenado particular, siempre que todos los sistemas coordenados cartesianos considerados tengan la misma orientacién. No obstante, se omiten estos calculos aqui en virtud de que en el Capitulo 5, p. 683, se dara una interpretacién fisica del rotacional que ilustra claramente su carActer vectorial. Los tres conceptos de gradiente, divergencia y rotacional pueden relacionarse entre si si se usa un vector simbélico con las componentes a a a dx1’ Axe’ Oxa" Cominmente, este operador diferencial vectorial se denota por medio del simbolo V (proninciese “del”). El gradiente de un escalar s es el producto del vector simbélico V con la cantidad escalar s; es decir, es el vector a. a 94) grad s = Vs (aes 8 Sas La divergencia de un vector U = (ui, wz, us) es el producto escalar . a a a (94b) divU=V-U=5 ut aus t 5, ue Por ultimo, el rotacional del vector U es el producto vectorial (94) rot U=VxU us — 3 uz, su — 5 Us, 3 Un — 3 Gg Bxe aa 4 Oxi? Axe a a a a a ws) [ver (71b), p. 219]. El hecho de que el vector V es independiente del sistema coordenado que se use para definir sus componentes, se deduce de la regla de la cadena para la derivaci6n; bajo la transfor- macién de coordenadas (89d), por la regla de la cadena se tiene TNos vernos forzados a escribir aqui el vector antes del escalar en el producto Vs, en contraposicién con nuestra costumbre, en virtud de que las componentes del vector simbélico Y no son conmutativas con los escalares ordinarios. 254 Introduccién al calculo y al an4lisis matematico 9 _ & Axe 9 _ a ay; = BA ayy Ben = Bo om lo cual muestra que las componentes de V se transforman de acuer- do con la regla (89c) para los vectores. Esto hace obvio que también Vs,V+U y V x U no dependen del sistema de coordenadas.' Para concluir, se mencionaran unas cuantas relaciones que se presentan continuamente. El rotacional de un gradiente es cero; en simbolos, (95a) rot grads = V x (Vs) =0. La divergencia de un rotacional es cero; en simbolos, (95b) div rot U vex Uj=0. Como se ve con facilidad, estas relaciones se deducen a partir de las definiciones de divergencia, rotacional y gradiente, usando la inter- cambiabilidad de las derivaciones. Las relaciones (95a, b) también se deducen formalmente si se aplican las reglas ordinarias para los vec- tores al vector simbélico V, ya que entonces V x (Vs) =(V x V)s=0, V-(V x U) = det(V, V, U) =0. Otra combinacién extremadamente importante de los operadores diferenciales vectoriales es la divergencia de un gradiente: Bs as | Os _ dxx® * dxe? * Axa? ~ (95c) div grad s = V+ (Vs) = As. Aqui VEsta proposicién tiene que restringirse en el caso del rotacional. En general, la magnitud y la direccién del producto vectorial de dos vectores tiene un significado geométrico, como se explicé en la p. 225, excepto que el producto cambia hacia el opuesto cuando se cambia la orientacién del sistema coordenado cartesiano que se usa. Esto implica, para un vector U, que rot U = V x U se comporta como un vec: tor mientras no se cambie la orientaci6n del sistema coordenado (es decir, mientras sélo se usen tranformaciones ortogonales con determiante +1. Cambiar la orien- tacién del sistema coordenado conduce a cambiar rot U hacia su opuesto. combiancién Vectores, matrices, transformaciones lineales 255 (954) asvevae eye Le D) EVV gett Gxat * Oxat se conoce como “operador de Laplace” o “laplaciano” La ecuacién diferencial parcial as | &s , as (9e) As= ax? 0x2 Oxs' ~ satisfecha por muchos escalares importantes s en la fisicomatematica se conoce como “ecuacién de Laplace” 0 “ecuacién del potencial”. A veces también se usa la terminologia del “anilisis vectorial” cuando el namero de variables independientes es diferente de tres. Un sistema de n funciones wi, . . ., Un de n variables independientes x1, .. ., Xn determina un campo vectorial en el espacio n dimen- sional. Entonces, los conceptos de gradiente de un escalar y del operador de Laplace conservan su significado. Nociones analogas a la de rotacional de un vector se vuelven més complicadas. La formu- lacién mis satisfactoria para las analogas de las relaciones (95a, b) en n dimensiones es mediante el cAlculo de las formas diferenciales ex- tertores, el cual se describiré en el capitulo siguiente. d. Familia de vectores. Aplicacién a la teoria de las curvas en el espacio y al movimiento de particulas Ademas de los campos vectoriales también consideraremos a las variedades uniparamétricas de vectores, llamadas familias de vec- tores, donde los vectores U =(ui, ue, us) no corresponden a cada pun- to de una region en el espacio sino a cada valor de un solo parametro t. Se escribe U = U(t). La derivada del vector U puede definirse naturalmente como (96) GU = tim} (UG +h) — UO). Es obvio que esta derivada tiene las componentes du, duz dus (960) / dt’ dt’ di” Facilmente se verifica que esta derivacién vectorial satisface leyes andlogas a las ordinarias para las derivadas: 256 Introduccién al clculo y al andlisis matemético a =4yi4y. 4ayne% a (97a) gUtW=GU+GV; Fan =Fu+r.gu d _y. av, dU (97b) gu w=U- G+ Sev av, a d (97c) av x V)=Ux att dt * Vv. Estas nociones se aplican al caso en el que la familia de vectores con- siste de los vectores de posicién X = X (t) = OP de los puntos P sobre una curva en el espacio dada en representacién paramétrica como: x1 = Pit), x2 = ga(t), x3 = g(t). Entonces X = (x1, x2, x3) = (Gi), dell), $a(0)). El vector dX/d¢ tiene la direcci6n de la tangente a la curva en el pun- to correspondiente a t; puesto que el vector AX = X(t + At) — X(t) tiene la direccién del segmento rectilineo que une los puntos con valores del parametrot t + At.Lo mismo se cumple para el vector AX/ At, cuando At > 0. A medida que At — 0 la direccién de esta cuer- da se aproxima a la direccién de la tangente. Si en lugar de ¢ se in- troduce como par4metro la longitud de arco s de la curva, medida desde un punto de partida definido, puede probarse que 2 aX dX _ ds “ds ~ 1 (98) |= La demostraci6n sigue exactamente los mismos lineamientos que la demostraci6n correspondiente para las curvas planas (ver Volumen I, p. 354). Por tanto, dX/ds es un vector unitario. Derivando ambos miembros de la ecuacién (98) con respecto a s, usando la regla (97b), se obtiene dX @X , @X dX_,dX @X 8) ds ° det + de? ds ~ > ds * dst = Esta ecuaci6n afirma que el vector Vectores, matrices, transformaciones lineales 257 aX (dim dim dm) ds? =(e ds?’ ds? es perpendicular a la tangente. Este vector recibe el nombre de vector curvatura o vector normal principal y su longitud 1 (100) k= . se llama curvatura de la curva en el punto correspondiente. El re- ciproco p = 1/k de la curvatura se llama radio de curvatura, como antes. El punto que se obtiene midiendo desde el punto sobre la cur- va una longitud p en la direccién del vector normal principal se llama centro de curvatura. Se demostraré que esta definicién de curvatura concuerda con la dada para las curvas planas en el Volumen I (p. 854). Para cada s, el vector Y = dX/ds tiene longitud 1 y se encuentra en la direccién de la tangente. Si se pjensa en los vectores Y(s + As) y Y(s) como si tuvieran eb origen como punto inicial comin, entonces la diferencia AY = Y(s + As) — ¥(s) queda representada por el vector que une los puntos finales. El 4ngulo B entre las tangentes a la curva en los pun- tos con parametros s y s + Ag es igual al angulo entre los vectores¥(s) y ¥(s + As). Entonces |AY| =|¥(s + As) — ¥(s)| = 2 sen, dado que 1¥(s)| =|¥(s + As)| = 1. Usando 2 ee para 6-0, se encuentra que @X ds*® | = lim on ~|EEl-me l-us fm ds-o As De aqué-que k es el limite de la raz6n del Gngulo entre las tangentes 258 Introduccién al clculo y al andlisis matematico en dos puntos de la curva y la longitud de arco entre esos puntos a medida que los puntos tienden a unirse. Pero este limite define la curvatura para las curvas planas. ' El vector curvatura cumple una funcién importante en la me- c4nica. Supéngase que una particula que se mueve a lo largo de una curva tiene el vector de posicién X(#) en el instante ¢. Entonces la velocidad del movimiento esté dada tanto en magnitud como en direccién por el vector dX/dt. De modo semejante, la aceleracié6n esta dada por el vector d?X/d¢?, Por la regla de la cadena, se tiene dX _ ds dX dt dt ds y @X _ d’s dX (ds\? d?X (201) Ge = ae ae tq) ge En vista de lo que ya se sabe acerca de la primera y segunda deri- vadas del vector X con respecto a s, la ecuacién (101) expresa los siguientes hechos: el vector aceleracién del movimiento es la suma de dos vectores. Uno de éstos esta dirigido a lo largo de la tangente a la curva y su longitud es igual a d?s/dé®, es decir, a la aceleracién del punto en su trayectoria (la rapidez de cambio de la magnitud de la velocidad o aceleracién tangencial). El otro es normal a la trayec- toria, esta dirigido hacia el centro de curvatura y su longitud es igual al cuadrado de la magnitud de la velocidad multiplicado por la cur- vatura (la aceleracién normal). Para una particula de masa unitaria, el vector aceleracién es igual a la fuerza que actéa sobre la particula. Si no acttia fuerza alguna en la direccién de la curva (como es el caso para una particula restringida a moverse a lo largo de una curva, sujeta Gnicamente a las fuerzas de reaccién que acttian normales a la curva), la aceleracién tangencial se anula y la aceleracién total es normal a la curva y de magnitud igual al cuadrado de la velocidad multiplicado por la curvatura. in el caso de curvas en el espacio no es posible, como para Jas curvas planas, iden- tificar B con el incremento Aa de un 4ngulo de inclinacién a. La raz6n es que el Angulo entre ¥(s) y ¥ (s + As) generalmente no es igual a la diferencia entre los 4n- gulos que los vectores ¥(s) y ¥ (¢ + As) forman con alguna tercera direccién fija. Los Gngulos entre las direcciones en el espacio no son aditivos como lo son ene! plano. te * Vectores, matrices, transformaciones lineales 259 Ejercicios 2.5 . Verificar que el vector de posicion PQ de un punto Q con respecto a un punto P se comporta como un vector en un cambio de coordenadas. . Deducir las identidades siguientes. (a) grad (a8) =a grad 6 +B grad a (b) div (@U) U- grad a +adiv U (©) rot(@U) =gradaxU+e rot U (d) div (U x V)=V> rot U—U- «rot V. . Sea U + v el simbolo para el operador a a a Us 5, + Ungy + Ur 5. Demostrar que (a) grad(U+ V) = U+vV + V+vU+U x rot V+ Vx rot U (b) rot (U x V) = Udiv V— VdivU+V-vU—U-~ wv. . Para el operador laplaciano A establecer que AU = grad div U — rot rot U . Hallar la ecuacién del llamado plano osculador de una curva x = f(t), y = g(t), 2 = A(é)en el punto to, es decir, el limite de los planos que pasan por tres puntos de la curva, a medida que estos puntos se aproximan al punto con parametro to. . Demostrar que tanto el vector curvatura como el vector tangente se en- cuentran en el plano osculador. . Sea C una curva suave con una tangente que gira de manera continua. Sea d la distancia ms.corta entre dos puntos sobre la curva y / Ja lon- gitud del arco entre los dos puntos. Probar que d — | = o(d) cuando des pequefia. Probar que la curvatura de la curva X = X(t),siendo ¢ un parémetro ar- bitrario, est4 dada por pa XX = Oe XN, (x’|8 . Si X = X(s) es cualquier representaci6n paramétrica de una curva, probar que el vector d*X/dt? con punto inicial X se encuentra en el plano osculador en X. . $i C es una curva cerrada continuamente diferenciable y A un punto no sobre C, existe un punto B sobre de C que se encuentra a una distancia mis corta de A que cualquier otro punto sobre de C. Probar que la rec- ta AB es normal a la curva. 260 Introduccién al cAlculo y al an4lisis matematico ll. 14, 16. Se traza una curva sobre del cilindro x* + y® = a? tal que el Angulo en- tre el eje z y la tangente en cualquier punto P de la curva es igyal al 4n- gulo entre el eje y y el plano tangente en P al cilindro. Probar que las coordenadas de cualquier punto P de la curva pueden expresars¢ en tér- minos de un parametro @ por medio de las ecuaciones x=acos®, y=asen9, z=c+a log send, y que la curvatura de la curva es (I/a) sen 0 (1 + sin? 6), . Encontrar la ecuacién del plano osculador (ver el Ejercicio 5) en el pun- to @ de la curva x = cos 0, y =sen 0, z= f(0). Demostrar que f(8) = (cosh A9)/A, cada plano osculador toca a una esfera cuyo centro es el origen y cuyo radio es V@¥ 1/A®). . (a) Probar que la ecuacién del plano que pasa por los tres puntos fi, ts, ta sobre la curva 1 1 x= gat’, y= Ot, z=ct q|PAl=—a-P . (a) Sean A, B, C tres puntos fijos no colineales y P un punto en mo- vimiento. Sean a, b, c vectores unitarios en las direcciones PA, PB, PG, respectivamente; expresar el vector velocidad P como una com- binacion lineal de estos vectores: P= au+bu+ cw. Probar que a= [Apr {lla + bw + (a+ ew] a— vb — we}. (b) Probar que el vector aceleracién B del punto Pes B=ca+ b+ ye, donde . a+b 1 arc 1 vant wl gop eae) * (a7 ~je=P iI" con expresiones similares para 8 yy. . Probar que si z = u(x, y) representa la superficie formada por las tan- gentes de una curva arbitraria, entonces (a) todo plano osculador de la curva es un plano tangente a la superficie y (b) u(x, y) satisface la ecuacion Uzalyy — Uzy® CAPITULO 3 Desarrollos y aplicaciones del calculo diferencial 3.1 Funciones implicitas a. Observaciones generales Frecuentemente, en la geometria analitica se da la ecuacién de una curva no en la forma y = f(x) sino en la forma F(x, y) = 0. Una recta puede representarse de esta manera por medio de la ecuaci6n ax + by +c=0, y una elipse, por la ecuacién x?/a? + y?/b? = 1. Para obtener la ecuacién de la curva en la forma y = f(x) debe “resolverse” la ecuacién F(x, y) = 0 para y. En el Volumen I se con sider6 el problema especial de encontrar la inversa de una funcién y = f(x), es decir, el problema de resolver la ecuacién F(x, y) = ¥ f(x) = 0 para la variable x. Estos ejemplos sugieren la importancia de los métodos para resol ver una ecuaci6n F(x, y) = 0 para x, o bien, para y. Tales métodos se encontraran incluso para ecuaciones que comprenden funciones de mis de dos variables. En los casos mAs sencillos, como los de las ecuaciones antes men- cionadas para la recta y la elipse, puede hallarse facilmente la so- lucién en términos de funciones elementales. En otros casos puede hallarse una aproximaci6n de la solucién, tan exacta como se desee. No obstante, para muchos fines resulta preferible no trabajar con la forma resuelta de la ecuacién o con estas aproximaciones sino, por el contrario, sacar conclusiones acerca de la soluci6n estudiando direc- tamente la funcién F(x, y), en la cual no se da preferencia a ninguna de las variables x, y sobre la otra. No ‘toda ecuacién F(x, y) =0 es la representacién implicita de una funcién y = f(x), o bien, x = ¢(y). Es facil dar ejemplos de 263 264 Introduccién al calculo y al an4lisis matematico ecuaciones F(x, y) = 0 que no permiten solucién alguna en términos de funciones de una variable. Asi, la ecuacién x? + y? = 0 sélo es satisfecha por la pareja de valores x = 0, y = 0, mientras que la ecuacién x? + y? +1 = 0 no es satisfecha por valores reales en lo ab- soluto. Por lo tanto, es necesario investigar con mayor cuidado las circunstancias bajo las cuales una ecuaci6n F(x, y) = 0 define una funcién y = f(x) y las propiedades de esta funcién. Ejercicios 3.la 1, Supéngase que para alguna pareja de valores (a, b), f(a, 6) = 0.Si se co- noce a, dar un método iterativo de construccién para encontrar b. ¢Bajo qué condiciones sobre f sera aplicable este método? b. Interpretacién geométrica Con el fin de aclarar la situacién, representemos la funcién F(z, y) por medio de la superficie z = F(x, y) en el espacio tridimen- sional. Las soluciones de la ecuacién F(x, y) = 0 son las mismas que las soluciones simultaneas de las dos ecuaciones z = F(x, y) yz =0. Geométricamente, el problema es determinar si la superficie z= F(x, ¥) se intersecta con el plano x, y en las curvas y = f(x) 0 x= #(y). (Aqui no nos interesa qué tanto puede extenderse tal curva de interseccién.) Una primera posibilidad es que la superficie y el plano no tengan puntos en comin. Por ejemplo, el paraboloidez = F(x, y) = x2 + 2 +1. se encuentra completamente por encima del plano x, y . Aqui no existe curva de interseccién. Obviamente, sélo es necesario con- siderar los casos en los que exista al menos un punto (xo, yo) en el que F(xo, yo) = 0; el punto (xo, yo) constituye un “punto inicial” para la solucién. Conociendo una solucién inicial, se tienen dos posibilidades: el plano tangente en el punto (xo, yo) es horizontal, o bien, no lo es. Si el plano tangente es horizontal, facilmente puede ilustrarse por medio de ejemplos que puede ser imposible extender una solucién y = f(x) ox = g(y) desde (xo, yo). Por ejemplo, el paraboloide z =x? + y® tiene la solucién inicial x = 0, y = 0, pero no contiene a otro punto en el planox, y. Como contraste, la superficie z = xy con la soluci6n inicial x = 0, y se intersecta con el plano x, y a lo largo de las rectas x = 0 y y = 0; pero en ninguna vecindad del origen Desarrollos y aplicaciones del célculo diferencial 265 Figura 3.1 La superficie u = xy. Figura 3.2 Lineas de contomno de u = xy. puede representarse la interseccién completa por una funcién y= f(x) oporuna funcién x = ¢(y), (ver las Figs. 3.1 y 3.2). Por otra par- te, es perfectamente posible que la ecuacién F(x, y) = 0 tenga una soluci6n de ese tipo, incluso cuando el plano tangente en el punto dado por la solucién inicial sea horizontal, como en el caso F(x, y) = (y-— x)*=0. Por consiguiente, en el caso excepcional de un plano tangente horizontal no se puede hacer una proposicién general definida. 266 Introduccién al calculo y al an4lisis matematico La otra posibilidad es que el plano tangente en el punto dado por la solucién inicial no sea horizontal. Entonces, imaginando intui- tivamente la superficie z = F(x, y) como aproximada por el plano tangente en una vecindad de la solucién inicial, es de esperar que la superficie no pueda combarse lo suficientemente rapido como para evitar cortar el plano x,y cerca de (%o, yo) en una sola curva de inter- seccién bien definida, y que una porcién de la curva cerca de la solucién inicial pueda representarse por la ecuacién y = f(x) 0 x= $(y). Analiticamente, la afirmacién de que el plano tangente no es horizontal significa que F2(xo, yo) y Fy(xo, Yo) no son ambas cero (ver la p. 74. Esta es la base para la discusi6n en la subsecci6n siguiente. Ejercicios 3.1b 1, Examinando la superficie de z = f(x, y),determinar si la ecuacion f(x, 9) = 0 puede resolverse para y como una funcién de x en una vecindad del punto indicado (xo, yo), para @) f@&y=2—y, x=yo=0 (b) fx, y) = log @& +), x0 = 15, yo= —5 ©) f@,y)=sen[a@+y]—1, x0 = yo = 1/4 @ fe n=? +y¥—y, xo=yo=0. c. El teorema de la funcién implicita Ahora se enunciaran las condiciones suficientes para la existencia de las funciones implicitas y, al mismo tiempo, se dara una regla para derivarlas: Supéngase que F(x,y) itene derivadas continuas Fr y Fy en una vecindad de un punto (xo, yo), donde qa) F(xo, yo) = 0, Fy(xo, yo) # 0. Entonces, con centro en el punto (xo, yo), existe algin rectangulo (2) XM -aSxSx+a, y—-BSySyt+B tal que para cada x en el intervalo I dado por x» -aSxSx+a, la ecuacién F(x, y) = 0 tiene exactamente una soluci6n y = f(x) que se encuentra en el intervalo yo— 8 Sy S yo + B. Esta f satisface la condici6n inicial yo = f(x0) y, para toda x en I, Desarrollos y aplicaciones del clculo diferencial 267 (3) F(x, f(x) = (8a) yo-BSf(x)Sy0+B (8b) F(x, f(x)) # 0. Ademds, f es continua y tiene una dertvada continua en I, dada por la ecuacion “ y=f@=-F. Este es un teorema de existencia estrictamente local para las soluciones de la ecuacién F(x, y) = 0 en la vecindad de una soluci6n inicial (xo, yo). No indica cémo hallar esa solucién inicial 0 cémo decidir si la ecuacién F(x, y) = 0 es satisfecha por cualquier (x, y)de alguna manera. Estas son cuestiones globales y que estan mas alla del alcance del teorema. Tambien, la unicidad y la regularidad de la solucién y = f(x), s6lo pueden garantizarse localmente, es decir, cuando se restringe y al intervalo yo — B < y < yo + B, La necesidad de tales restricciones es evidente observando el sencillo ejemplo de la ecuaci6n. Fe, y=? + -1=0. Para toda x tal que —1 0. De lo contrario, remplacese simplemente la funcién F por —F, lo cual deja invariantes los puntos descritos por la ecuacién F(x, y) = 0.Supuesto que F(x, y) es continua, puede hallarse un rectangulo R con centro en (xo, yo) y lo suficientemente pequefio como para que R se encuen- tre por completo en el dominio de F, y F,(x, y) > m/2en todo r. Sea Rel rectangulo Xo -aSxSxt+a, y—-BSySyo+B (ver la Fig. 3.4). Supuesto que F(x, y) también es continua, se con- cluye que F, es acotada en R. Asi, existen las constantes positivas m, M tales que © Fixy>F, |FAx ISM ~ para (yen R. Para cualquier x fija entre xo — a y xo + a, laexpresién F(x, y) es una funcién continua y monétonamente creciente de y para yo — B SySyo+B.Si @ F(x,yo + B)>0, F(x, ¥0 — B) <0, 272 ~Introduccié6n al cAlculo y al an4lisis matematico puede asegurarse que existe un solo valor ¥, intermedio entre yo — y yo +B, en el cual F(x, y) se anula. Entonces, para la x dada, ecuacién F(x, y) tendr una sola solucién y = f(x) para la cual yo-B m/2se deduce que F(x, yo + B) = [F(x yo + B) — Fle, a0) + Fle, 90) > 5 mB — Mo, Fx, 90 — B) = — [F(x 90) — Fle, 90 — B+ Fla,90) < — 5 mB + Ma De donde las desigualdades (7) se cumplen para cualquier x en el in- tervalo x» -a m/2>0. Para x = xo la ecuacién F(x, y) = 0 tiene la solucién y = yo correspondiente al punto inicial. Como, evidentemente, yo se encuentra entre yo — B y yo.+ B, se ve que f(xo) = yo. Ahora se deducen la continuidad y la diferenciabi- lidad de f(x) a partir del teorema del valor medio para funciones de varias variables, aplicado a F(x, y)[ver (33), p.95]. Seanx yx +h dos valores entre xo — a y xo + a. Sean y = f(x) yy + k= f(x + h) los valores correspondientes de f , donde y y y + # se encuentran en- tre yo—B y yo +6. Entonces F(x, y) = 0, F(x + h,y +k) =0. Se concluye que O= F(x t+h,y +k) — F(x, y) = F(x + Oh, y + Ok) h + Fx + Oh, y + ORR, Desarrollos y aplicaciones del c4lculo diferencial 273 donde 9 es un valor apropiado entre 0 y 1.1 Como Fy # 0, puede dividirse entre F, y asi encontrar que a hk _ _ Fax + Oh, y + 0h) h ~ ~ Fy(x + 0h, y + 0h)" Puesto que |Fz| < M, |Fy|> m/2 para todos los puntos del rectan- gulo considerado, se encuentra que el segundo miembro esta acotado por 2M/m, De donde tes Mia. De aqui que k = f(x + h) — f(x) > 0 cuando h - 0, lo cual demuestra que y = f(x)es una funcién continua. De (8) se conluye que, para x fija y para y = /(x), lim f+) =f) _ _ jy Foe + Oh, y + OR) _ _ Fel, y) hoo h hea Be(x + Oh,y + Ok) Fy(x, 9)" Esto establece la diferenciabilidad de f y, al mismo tiempo, propor- ciona la férmula (4) para la derivada. La demostracién se sustenta en la hipétesis de que F,(xo, yo) # 0, de lo cual pudo concluirse que Fy tiene signo constante en una vecin- dad lo suficientemente pequefia de (xo, yo) y que F(x, y), para x fija, es una funcién monétona de y. La demostracién nos dice simplemente que la funcién y = f(x) existe. Es un ejemplo tipico de un “teorema de existencia” puro, en el cual no se considera la posibilidad practica de calcular la soluci6n. Por supuesto, podria aplicarse cualquiera de los métodos numéricos discutidos en el Volumen I (pp. 494 y siguientes) para hallar una aproximacién de la solucién y de la ecuaci6n F(x, y)= 0, para x fija. Ejercicios 3.1d. 1. Dar un ejemplo de una funcién f(x, y) tal que (a) pueda resolverse (a) f(x, y) = 0 para y como una funci6n de x cerca de x = xo, y = yo, y (b) feo, yo) = 0. 1Obsérvese que aqui se puede aplicar el teorema del valor medio, puesto que el seg- mento que une a dos puntos cualesquiera del rectangulo|x — xolSa, ly — yolSB se encuentra por completo dentro de éste. 274 —Introduccién al cAlculo y al anlisis matematico 2. Dar un ejemplo de una ecuacién F(x, y) = 0 que pueda resolverse para y como una funcion y = f(x) cerca de un punto (xo, yo), tal que f no sea diferenciable en xo. . Sea $(x) definida para todos los valores reales de x. Demostrar que la ecuacién F(x, y) = 98 — y? + (1+ x) y—¢(x)=0 define un valor nico de y para cada valor de x. @ e. El teorema de la funcién implicita para mas de dos variables independientes El teorema de la funci6n implicita puede hacerse extensivo a una funci6n de varias variables independientes, como sigue: Sea F(x, y,..., 2, u) una funcién continua de las variables in- dependientes x,y,.. . z,u, con derivadas parciales continuas F:, Fy, . + Fe, Fu. Sea (x0, 90, . . . , 20, uo) Un punto interior del dominio de definicién de F, para el cual F(X0, Yo, . - «5 0, Uo) = y Fu(xo, 50, . - -, 20, Uo) # 0. Entonces puede marcarse un intervalo uo— BS uS uot B alre- dedor de up y una regién rectangular R que contenga a (xo, Yo, .:. » 29) en su interior, tales que para todo (x,y,.. ., zen R se satisfaga la ecuacion F(x,y,.. .,2,u)=0 por exactamente un valor de u en el intervalo uo —B Su.S uo + B.1 Para este valor de u, el cual sé denota por u = f(x,y, . . .,2), la ecuactén F(x,9, + 1% (BI, - - 2) = 0 se cumple idénticamente en R; ademas, uo = f(x0, yo, . . «5 20), uo — B< f(x,y, - +52) < Uo + Bs Fults y,- . 2 fltry,. . 2) #0. La funcién f es una funcién continua de las variables independientes %, Y,....,2,9 posee derivadas parciales continuas dadas por las ecuaciones. (9a) Fr + Fufc = 0, Fy + Fufy 1B] valor B y la region rectangular R no estan determinados de modo snico. La aseveraci6n del teorema es valida si B es cualquier namero positivo lo suficientemen- te pequefio y si se elige R (que depende de B) lo suficientemente pequeiia. Desarrollos y aplicaciones del c4lculo diferencial 275 La demostracién sigue los mismos lineamientos que se dieron en la seccién anterior para la solucién de la ecuacién F(x, u) =0,y no presenta mas dificultades. Resulta sugerente combinar las formulas de derivacién (9a) en la ecuaci6n Gnica (9b) Frdx + Fydy + +++ + Fidz+ Fudu =0. O sea, si las variables x,y, . . ., 2, u, uno son independientes en- tre sf sino que estan sujetas a la condicién F(x,y, . . .,2,u) =0,en- tonces las partes lineales de los incrementos de estas variables, de modo semejante, no son independientes sino que estén relacionadas por medio de la ecuaci6n lineal dF = F,dx + Fydy+++++ Fidz+ Fudu=0. Si se remplazaduen (9b) por la expresi6n urdx + wdy + +++ + u zdzy, a continuaci6n, se iguala a cero el coeficiente de cada una de las diferenciales mutuamente independientes dx, dy, . . ., dz se ob- tienen nuevamente las formulas de derivacién (9a). Incidentalmente, el concepto de funcién implicita nos permite dar una definicién general de funcién algebraica. Se dice que u = f(x, y, -) es una funcién algebraica de las variables independientes x,y,... Siu puede definirse implicitamente por medio de una ecuacion F(x, y,..., u) = 0, donde F es un polinomio en los ar- gumentos x,y,.. .,u; brevemente, si uw “satisface una ecuacién al- gebraica”. Una funcién que no satisface ecuacién algebraica alguna se llama trascendente. Como ejemplo, apliquemos las férmulas de derivacién estable- cidas a la ecuaci6n de la esfera. F(x, y, u) = +y+uwe-1=0. Para las derivadas parciales se obtiene x z Us=— 7, Wy=—-7, * ue’ “ y derivando atin mas 1 x 2 + u? Ure = — 5 + Sur = - SS, uu u x x Ury = uy = - % 276 Introduccién al cAlculo y al andlisis matemAtico 1 Uy = —— + Sp uy = — w uw” Ejercicios 3.le Demostrar que la ecuacién x + y + z= sen xyz puede resolverse paraz cerca de (0, 0, 0). Encontrar las derivadas parciales de la solucién. 2. Para cada una de las ecuaciones siguientes, examinar si tiene una s0- lucién Gnica para z como una funcién de las variables restantes cerca del punto indicado: (a) sen x + cos y + tan z (b) x? + 2y? + 822 — w= (©) 1+x+y=cosh(x+2)+senh(y+2) (@@=y=z=0). 0 @=09=5,2=9 @=1y=2,z=-1,w=8) 8. Demostrar que x+y + 2+ xyz? =0 define a z implicitamente como una funcién de x y.x en una vecindad de (0,°0, 0). Desarrollar z hasta el cuarto orden en potencias de x y 9. 3.2 Curvas y superficies en forma implicita a. Curvas planas en forma implicita La descripcién de una curva plana por una ecuaci6én de la forma y = f(x) da preferencia asimétrica a una de las coordenadas. Se en- contré (ver el Volamen I, pp. 344-345) que la tangente y la normal a la curva estan dadas, respectivamente por las ecuaciones (10a) M—-y- &6- xf) =0 y (10b) a - yf +6-x=09, donde 1 son las “coordenadas corrientes” de un punto arbitrario sobre la tangente o la normal, y x, y son las coordenadas del punto sobre de la curva. La curvatura de la curva es -_f _ (40e) k= Gaon (ver el Volumen I, p. 857). Para un punto de inflexién se cumple la condicién (10d) f(x) =0 Desarrollos y aplicaciones.del c4lculo diferencial 277 Ahora se obtendran las formulas simétricas correspondientes para curvas representadas implicitamente por medio de una ecuacién del tipo F(x, y) = 0. Se hace ésto bajo la suposicién de que en el punto en cuestién F’; y Fy no son ambas 0, de modo que qa) PF? + Fy? 40. Si se supone que F, + 0, digamos, puede sustituirse en (10a, 6) f(x) por su valor dado en (4), p. 267, y, de inmediato, obtener la ecuacién de la tangente en la forma (12a) ( — x)Fr + (n - »)Fy = 0 y la de la normal en la forma (12b) ( — x)Fy — (1 — y)Fx = 0. Para F, = 0, F; # 0 se obtienen las mismas ecuaciones, partiendo de la solucion de la ecuaci6n implicita F(x, y) = 0 en la forma x = g(y). Los cosenos directores de la normal a la curva en el punto (x,y) —es decir, los cosenos directores de la normal a la recta con ecuacién (12a) en el plano &, n- estan dados por Fe Fy (12c) cos = Re Re’ sena = aR + FA (ver (20), p. 169). De modo semejante, los cosenos directores de la tangente a la curva —es decir, de la normal a la recta (12b)— son- (12d). (12d) cos B = VF2+ FR sen B = etre En realidad se tienen dos direcciones normales a la curva en un punto dado, aquélla con los cosenos directores (12c) y la opuesta. La normal dada por (12c) tiene la misma direccién que el vector con componentes Fz, Fy, el gradiente de F (ver la p. 248). Se vi, en la p. 249, que la direccién del vector gradiente es aquella en la que F se incrementa mas rapido; asi, en un punto de la curva F(x, y) = 0 el gradiente apunta hacia la region F > 0 y lo mismo se cumple para la direccion normal determinada por las formulas (12c). La f6rmula (5), p. 268, proporcioné la expresién para la segunda derivada, y”= f(x), de una funcién dada en la forma implicita F(x, y) = 0. Se deduce que la condicién necesaria, f” = 0, para la 278 — Introduccién al calculo y al andlisis matematico ocurrencia de un punto de inflexién, puede escribirse como (13) Fi} Fer — 2F2FyFry + Fo’ Fyy = 0 para curvas dadas implicitamente. En esta formula no hay preferen- cia por ninguna de las dos variables x, y. Es completamente simétrica y ya no requiere la hipétesis de que Fy # 0. Por supuesto, esta carac- teristica simétrica refleja el hecho de que la nocién de punto de in- flexion tiene un significado geométrico bastante independiente de cualquier sistema coordenado. ‘ Si se sustituye la formula (5) para f(x) en la f6rmula (10c) para la curvatura k de la curva, nuevamente se obtiene una expresién! simétrica en x y y, Fy?Fo — 2F 2FyFry + Fe’ Fyy (14a) Rk Fe + Fy : Introduciendo el radio de curvatura (14b) P=p se encuentran las coordenadas &, 1 del centro de curvatura, el punto sobre la normal interior que se encuentra a la distancia p de (x, y) (ver el Volumen I, p. 358), Fr F, By Re? VIP Vey Re (140) b= 2-0 Re Si en lugar de la curva F(x, y) = 0, se considera la curva F(x,y) =, donde ¢ es una constante, todo en las discusiones precedentes per- manece igual. Sélo tiene que remplazarse la funcién F(x, y) por F(x, y) — ¢,lacual tiene las mismas derivadas que la funcién original. 1.Por tanto, para estas curvas, la forma de las ecuaciones de la tan- gente (normal, etc.) son exactamente las mismas que se dieron. *Para el signo de la curvatura, véase el Volumen I, p. 857. La curvatura k, definida por la formula (14a), es positiva si F crece sobre el lado “externo” de la curva, es decir, si la tangente a la curva cerca del punto de contacto se encuentra en la regién F20. Desarrollos y aplicaciones del c4lculo diferencial 279 La clase de todas las curvas F(x, y)-—c=0 que se obtienen cuando se deja que c recorra todos los valores de un intervalo, fornia la familia de “‘lineas de contorno”, o “curvas de nivel”, de la funcion F(x, ¥); (ver la p.40). Mas generalmente, a partir de una ecuacién de la forma F(x, y, 0) = 0, la cual para cada valor constante del paraémetro ¢ proporciona una curva [, en forma implicita, se obtiene una familia uniparamétrica de curvas. Para un punto (x,¥) que se encuentra sobre la curva Te —es decir, que satisface la ecuacién F(z, y, ¢) = 0— se aplican todas las formulas antes deducidas. En particular, el vector gradiente (F2(x, ¥,c), F(x, y, c)) es normal a I’, en el punto (x, ). Como ejemplo, considérese la elipse ey (15a) Fay) 5+h= Por (12a), la ecuaci6n de la tangente en el punto (x, y) es 6- 9+ —Yjpe= de aqui que, de (15a), ge ny a +h = 1 De (14a) se encuentra que la curvatura es ath (ay? + 64x28 * (15b) Sia > b, ésta tiene su valor maximo a/b? en los vértices y = 0, x = ta. Su valor minimo b/a? ocurre en los otros vértices x = 0, y = +b. Si dos curvas F(x, y) =0 y G(x,y) = 0 se intersectan en el punto (x,y). el dngulo entre las curuas se define como el angulo w formado por sus tangentes (o normales) en el punto de interseccién. Si se recuerda que los gradientes dan la direcci6n de la normal y se aplica la formula (7), p. 162, para el angulo entre dos vectores, se encuen- tra que 280 = Introduccién al cAlculo y al an4lisis matematico _ FiGz + FyGy O= [FE + FP VGP + GP (16) cos Aqui cos ® queda determinado de modo tnico si se escoge © como él Angulo entre las normales de las dos curvas en las direcciones en que se incrementan Fy G. Poniendo @ = n/2 en (16), se obtiene la condicién para la orto- gonalidad, es decir, para que las curvas se intersequen a 4ngulos rec- tos en el punto (x, y): (16a) FGz + FyGy = Si las curvas se tocan —es decir, tienen tangente y normal conmunesen el punto donde se encuentran — sus vectores gradiente(F,, Fy) y (Gz, Gy) deben ser paralelos. Esto conduce a la condicién (6b) FG, — FyGz Como ejemplo, considérese la familia de parabolas (17a) F(x, 9,0) = 9? ~ ole + s)=0 (ver la Fig. 3.9, p. 292), las cuales tienen todas al origen como foco (“parabolas confocales”). Si ci > Oy c2 < 0,las dos parabolas Fe, y,c1) = y= Bale + )=0 Ft, y, 60) = 9% — 2ea(x + f)=0 se cortan perpendicularmente en dos puntos; porque en los puntos de interseccién 1 x= — (arte), Y= — cree, y de aqui que Fx, y, 01) Fel, y, ¢0) + Fy(x, y, 1) Fy(x, y, c2) = 4(c1c2 + y?) = 0. Desarrollos y aplicaciones del célculo diferencial 281 Por (14a), la curvatura de la parabola (17a) esta dada por E B= ey it En el vértice x = —c/2, y = 0, ésto se reduce a 1 koa. lel Entonces, el centro de curvatura o centro del cérculo osculador en el vértice tiene, por (14c), las coordenadas b=—$tlelsme=5, 1=0, de modo que el foco (0, 0) se encuentra a la mitad entre el vértice y el centro de curvatura. Ejercicios 3.2a . Encontrar las ecuaciones de la tangente y de la normal para las curvas dadas implicitamente por medio de las relaciones que siguen: (a) x2 + 2y2—xy=0 (b) et seny + e¥ cos x = (©) cosh (x + 1) —seny @ 2+ =y +senx (e) x8 + y4=coshy (f) + yF=L . Calcular la curvatura de la curva re sen x + cos y en el origen. . Encontrar la curvatura de la curva que esta dada en coordenadas polares por la ecuaci6n f(r, 0) = 0. 4, Probar que las intersecciones de la curva (x+y — a) + 2Taxy =0 eo con la recta x + y = a son inflexiones de la curva. . Determinar a y 6, de modo que las cénicas 4x% + 4xy + y? — 10x — 10y + 11 (y + bx — 1 — bP — alby— x +1— 6) 0 se corten ortogonalmente en el punto (1, 1) y tengan la misma curvatura en este punto. Sean K’ y K” dos circulos que tienen dos puntos A y B en comin. Demos- trar que si un circulo.K es ortogonal a K’ y K”, entonces también es or- togonal a todo circulo que pasa por A y B. 2 282 Introduccién al cAlculo y al anAlisis matem4tico b. Puntos singulares de curvas En muchas de las formulas de la seccién anterior aparece en dl denominador la expresién F,” + F,’. En consecuencia, es de esperat que ocurra algo desusado cuando esta cantidad se anula, es decir, cuando F; = 0y F, = 0 en un punto de la curva F(x,y) = 0.En un punto asi, la expresion y’ = —F/Fy para la pendiente de la tangente pierde su significado. Se dice que un punto P de una curva es regular, si en una vecin- dad de P la variable x, o bien la variable y, puede representarse como una funcién continuamente diferenciable de la otra. En ese caso la curva tiene una tangente en P y es, con bastante precisién, aproximada por esa tangente en una vecindad de P. Si un punto de la curva no es regular se dice que es singular o que es una singula- ridad. Por el teorema de la funcién implicita se sabe que si F(x, y) tiene primeras derivadas parciales continuas, entonces un punto de la cur- va F(x, y) = Oes regular si en ese punto F,2 + Fy? 0, porque si Fy# 0 en P, puede resolverse la ecuaci6n F(x, y) = 0 y obtenerse una solucion tnica continuamente diferenciable, y = f(x). De modo semejante, si Fz # 0 puede resolverse la ecuaci6n para x. Un tipo importante de singularidad es un punto miiltiple, 6 decir, un punto por el cual pasan dos o mas ramas de la curva. Por ejemplo, el origen es un punto miltiple de la lemniscata (Volumen I, p. 102) (x? + 92)? — 2a%(x? — y2) = 0. Es evidente que en la vecindad de un punto miltiple no puede ex presarse la ecuacién de la curva de modo Snico en la forma y = f(2) ox =g(y). Un ejemplo de una singularidad que no es un punto multiple lo proporciona la curva cabica F(x, y) =» — x? = 0, (ver la Fig. 3.5). Aqui, en el origen F, = Fy = 0. Resolviendo parax,¥ puede ponerse la ecuaci6n de la curva en la forma Y=fe) = V8, donde f es continua pero no diferenciable en el origen. La curva tiene una ctispide en ese punto. Desarrollos y aplicaciones del c4lculo diferencial 283 Figura 8.5 La curva y3 — x? =0, Una curva puede ser regular en un punto donde tanto Fz como Fyse anulan. Esto lo ejemplifica F(x, y) = y° — x4 Nuevamente aqui, Fz = Fy = 0 en el origen. Pero resolviendo para y se encuentra y= fe) = Vx, donde f(x) es continuamente diferenciable para toda x. De donde el origen es un punto regular. Como F'es una funci6n par de x, la curva es simétrica con respecto al eje y. Es convexa y toca al eje x en el origen, como la parabola y = x*. Sin embargo, el origen es un punto algo especial para la curva, puesto que alli /” se vuelve infinita y la curva tiene curvatura infinita. El ejemplo trivial de la ecuacién F(x, y) = (y— x)? =0 que representa a la recta y = x muestra que no tiene que asociarse comportamiento peculiar alguno con los puntos de una curva F(x, y) =0 para la cual F,? + F,? = 0. En el Apéndice 3 se trataran los puntos singulares mAs sistematicamente. Ejercicios 3.2b 1. Discutir los puntos singulares de las curvas siguientes en el origen: (a) F(x, y) = ax + by® — exy =0 b) FG, y) = (y? — 2x7)? — x8 = 0 (©) Fix. y (+ el2)y —x=0 284 Introduccién al calculo y al anAlisis matematico @ F(x, y= Qa —x)— x8 =0 () F(x, ») = (y — 2x)? — 8 = 0. 2. La curva x + y® — Saxy =0 tiene un punto doble en el origen. ¢Cuales son sus tangentes alli? 3. Trazar una grafica de la curva (y — x)? — x8 = 0, y mostrar que tiene una céspide en el origen. ¢Cu4l es la peculiaridad de esta caspide al com- pararla con la céspide de la curva x — y? = 0? 4. Demostrar que cada una de las curvas (x cos « — y sena — 6)? = e(x sena + y cos @)%, donde « es un parametro y 6, ¢ son constantes, tiene una cispide y qué todas las ctispides se encuentran sobre un circulo. 5. Sea (x,y) un punto doble de la curva F(x,y) = 0. Calcular el angulo¢ entre las dos tangentes en (x, y),suponiendo que no todas las segundat derivadas de F se anulan en (x, y). Encontrar el angulo entre las tangentes en el punto doble (a) de la lemniscata, (b) de la hoja de Descartes (ver la p. 269). 6. Hallar la curvatura en el origen de cada una de las dos ramas de la curva yax + by) = cx? + exty + fry® + gy’. c. Representacién implicita de superficies Hasta ahora, normalmente hemos representado una superficie en el espacio x, y, z por medio de una funcién 2 = f(x, y). Puede resultar inconveniente, para una superficie dada en el espacio, la preferencia por coordenada z.implicada en esta representacién. Es mas naturaly mis general representar las superficies en el espacio implicitamente por medio de ecuaciones de la forma F(x, y, z)= 0 6 F(x, y,2)= constante. Por ejemplo, es mejor representar una esfera alrededor del origen por medio de la ecuaci6n simétrica x? + y? + 2? — r? = Oque porz = + Vr?—x2—y®. La representaci6n explicita de la superficie aparece entonces como la representacién implicita especial F(x, y, 2) =z-f(x, y) =0. Con el fin de deducir la ecuaci6n del plano tangente en un punto P de la superficie F(x, y, 2) = 0, se hace la suposici6n de que en et punto (18) Fe + FP + FP #0, es decir, que al menos una de las derivadas parciales no es 0.1 Si, ‘Precisamente como para las curvas, la anulacién del gradiente de F por lo comin corresponde a un comportamiento singular de la superficie. No se discutira la na turaleza de tales singularidades. Desarrollos y aplicaciones del célculo diferencial 285 digamos, F, 4 0, puede encontrarse una ecuaci6n explicita z = f(x, y) para la superficie cerca de P. El plano tangente en P tiene la ecuacién (19a) G-2=6-x)fet+ (n- fy en las coordenadas corrientes &, 1, ¢ (ver la p. 74). Sustituyendo las derivadas de f por sus valores fz = —F:/F:, fy = —Fy/Fz, de acuer- do con las férmulas (9a), p. 274, se obtiene la ecuacién del plano tangente en la forma (19b) @ —x)Fr+ (n—y)Fy + 6 — 2)F: =0. La normal al plano tangente (19b) tiene la misma direccién que el vector gradiente (Fz, F,, F,) (ver la p. 168). De aqui que los cosenos directores de la normal estén dados por las expresiones Fz _ (19) cosa = eT RT Re 8 8 = TRE cosy = Feo OS = VRE + Fe + Fe" Aqui, mas precisamente, se ha tomado esa normal del plano que apunta en la direccién de F crectente (ver la p. 249). Si dos superficies F(x, y,z) = 0 y G(x, y, z) = 0 se cortan en un punto, el éngulo w entre las superficies se define como el angulo entre sus planos tangentes o, lo que es lo mismo, el angulo entre sus nor- males. Este esta dado por FiGz + FyGy + FiGe (20a) CSO = Vey FE+ Fe VGl+GP+ Ge" En particular, la condicién de perpendicularidad (ortogonalidad) es (20b) FiGz + FyGy + F:Gz = 0. En lugar de una superficie dada por una ecuacién F(x, y, 2) = 0, puede considerarse, con mayor generalidad, superficies dadas por F(x,y, 2) = ¢, donde c¢ es una constante. Valores diferentes de ¢ proporcionan superficies de nivel diferentes para la funcién F (ver la p. 41. En cualquier punto (x, y, 2) e1 vector gradiente (Fz, Fy, Fz)es normal a la superficie de nivel que pasa por ese punto. De modo semejante, la ecuacién (19b) da el plano tangente a la superficie de nivel. 286 Introduccién al cAlculo y al andlisis matemtico Como un ejemplo, considérese la esfera wet yt 2a re : Por (19b), el plano tangente en el punto (x, y, z) es ( — x)2x + (n — y)2y + (C — 222 =0, 0 bien, bx+nyt+te=r Los cosenos directores de la normal son proporcionales a x,y, 2, & decir, la normal coincide con el radio vector trazado desde el origen al punto (x, y, 2). Para el elipsoide mas general con los ejes coordenados como eje principales, 2 y2 | 22 x @tptenl, la ecuaci6n del plano tangente es Ejercicios 3.2c 1. Encontrar el plano tangente (a) de la superficie 23 + Qxy? — 729 + By +1=0 en el punto (1, 1, 1); (b) de Ja superficie (x? + y®)? + x? — y? + Tay + 8x + 24#—2=14 enel punto (1, 1, 1); (c) de la superficie sen? x + cos (y + 2) = 3 en el punto (x/6, 7/3, 0). (d) de la superficie 1+ x cos nz + yseNnz — 2? en el punto (G, 0, 1); (c) de la superficie Desarrollos y aplicaciones del calculo diferencial 287 cos x + cos y + 2senz=0 en el punto (0, 0, —7/2); (f) de la superficie x? + y? = 22 +8en z en el punto (0, 0, 0). 2. Probar que las tres superficies de la familia de superficies x —-; __ ee Vou, VTE + yey vet VP PE =w que pasan por un solo punto son ortogonales entre si. 3. Los puntos 4 y B se mueven uniformemente con la misma velocidad; A parte del origen y se mueve a lo largo del eje z, B parte del punto (a, 0, 0) y se mueve paralelamente al eje y. Encontrar la superficie generada por las rectas que los unen. 4, Demostrar que el plano tangente en cualquier punto de la superficie x? + y? —2%=1 intersecta a ésta en dos rectas. 5. Si F(x, y, 2) = 1es la ecuacién de una superficie, siendo F una funcién homogénea de grado h, entonces el plano tangente en el punto (x,y. 2) esta dado por EF: + 0Fy + Ce = h. 6. Sea z definida como una funcién de x y y por medio de la ecuaci6n x3 + y8 + 29 — 3xyz = 0. Expresar 2z y Zy como funciones de x, y, z. 7. Hallar el angulo de interseccion de las siguientes parejas de superficies, en los puntos indicados: (a) 2x4 +4 3y3 — 422 = —4, 1+ x2 + y? = 2%,en(0, 0,1) (b) x¥ + y* = 2, cosh (x + y — 2) + senh (x + z— 1) =1,en(1, 1,0) (c) x*+ y® = er, x? + 2% = ev,en (1, 0, 0) (d) 1+ senh (x/V2) = cosh (y/vz), x + y® = 2% — 1,en (0, 0, 1) (©) cos x(x? + y) +sen r(x? +2z)=1, 2x9 + y% = 29 en(0, 0, 0). 3.8 Sistemas de funciones, transformaciones y aplicaciones a. Observaciones generales Los resultados que se han obtenido para las funciones implicitas ahora nos permiten considerar sistemas de funciones, es decir, discutir varias funciones simultaneamente. En esta seccién se considerara el caso particularmente importante de los sistemas en los cuales el numero de funciones es igual al numero de variables independientes. 288 introducci6n al cAlculo y al an4lisis matem4tico Empecemos por investigar el significado de tales sistemas en el caso de dos variables independientes. Si las dos funciones (21a) & = g(x,y) y n= (x,y) son ambas continuamente diferenciables en un conjunto R del plano x, y,el dominio de las funciones, este sistema de funciones puede in- terpretarse de dos maneras diferentes. La primera interpretacién (“activa”) es por medio de una aplicacién o transformacién. (La segunda, como una transformaci6n de coordenadas, se discutir4 en la p. 246.) Al punto P con coordenadas (x, y) en el plano *,y le corres- ponde el punto imagen II con coordenadas (é, ) en el plano &, 1 Un ejemplo es la aplicaci6én o transformacién afin §=ax+ by, n=cx+dy donde a, 6, c, d son constantes (ver la p. 183). Frecuentemente (x, y) y (6, 1) se interpretan como puntos de unoy el mismo plano. En este caso se habla de una aplicaci6n o una trans- formaci6n del plano x,y hacia sé mismo. El problema fundamental relacionado con una aplicacién es el de su inversién, o sea, la cuestién de cuando y cémo, en virtud de las ecuaciones § = $(x,¥) y 1=y(x, y), x y y pueden considerarse como funciones de § yn, y cOmo determinar las propiedades de estas fun- ciones inversas. : Si cuando (x, y) varia sobre el dominio R de la aplicacién, las im4genes (£, n) varian sobre un conjunto B en el plano &, n, se dice que B es el conjunto imagen de Ro el recorrido de la aplicacién. Si dos puntos diferentes de R siempre corresponden a dos puntos di- ferentes de B, entonces para cada punto (6,1) de B existe un solo punto (x, y) de R para el cual (€, n) es la imagen. (El punto (x, 9) s¢ llama imagen inversa, por contraposicién a la imagen.) Es decir, pueden invertirse la aplicacién de modo tnico, determinando a x y) como las funciones (21b) x=gn), y=A.n), las cuales estan definidas en B. Entonces se dice que la aplicacién (21b) tiene una inversa tinica o que es una aplicacién uno a uno, y4 la transformacién (21b) se le da el nombre de transformacién 0 aplicact6n inversa de la original. Desarrollos y aplicaciones del calculo diferencial 289 Si en esta aplicacién el punto P = (x, y) describe una curva en el dominio R, normalmente su punto imagen (é, n) describiré también una curva en el conjunto B, que se llama curva imagen de la pri- mera. Por ejemplo, a la recta x = c, que es paralela al eje y, le co- rresponde en el plano &, n la curva dada en forma paramétrica por las ecuaciones (22a) €=96 9) n=v¢c,»), donde y es el parametro. De la misma manera, a la recta y = k le corresponde la curva (22b) § = 6, h), n= w(x, &). Si a c y k se les asignan sucesiones de valores equidistantes ci, ce, C3, ...¥ ki, ke, ka, . . ., entonces la “red de coordenadas” que consiste de las rectas x = constante y y = constante (por ejemplo,la red de rectas en un papel milimétrico comén) da lugar a una red correspondiente de curvas, la red curvilinea, en el plano &, 1 (Figs. 3.6 y 3.7). Las dos familias de curvas pueden escribirse en forma implicita. Si se re- presenta la aplicacién inversa por las ecuaciones (21b), las ecuaciones de las curvas son simplemente G Figura 3.6 y Figura 8.7 Redes de curvas x = constante y y = constante en el plano x, y y el plano, 1. (22c) sGn =e y hE, n) = k, respectivamente. En muchas situaciones la red curvilinea propor- ciona una ¢magen geométrica Gtil de la aplicaci6n (21a), preferible a la interpretacién de las ecuaciones como una superficie bidimen- sional en el espacio tetradimensional *, y, , 0. 290 Introducci6n al calculo y al andlisis matematico De la misma manera, las dos familas de rectas§ = y yn = xendl plano § corresponden a las dos familias de curvas oxy) = 7 y wx, y) = en el plano x, y. Como ejemplo, considérese la inversién (también llamada apli- cacién por radios recfprocos o reflexién con respecto al cérculo unitario). Esta transformaci6n esta dada por las ecuaciones (23a) g q oe =”, e+ yp? =~P+y- Al punto P = (x, y) le corresponde el punto I = (&, n) que se encuen- tra sobre el mismo rayo y que satisface la ecuacién 1 1 2 ——— = (23b) += 2 yz on a Pp? de donde, la longitud del vector de posicién OP es el reciproco de la longitud del vector de posicién Of. Los puntos en el interior del cir- culo unitario x? + y? = 1 se aplican sobre puntos en el exterior del circulo, y viceversa. De (23b), se encuentra que la transformaci6n in- versa es oe =i. Serpe YS Bane Ja cual nuevamente es una inversién; es decir, la imagen inversa de un punto coincide con su imagen. Como dominio R de la aplicacién (28a) puede tomarse el plano x,y completo, con excepcion del origen, y como recorrido B el plano &, 1 completo pero también excluyendo el origen. Las rectas e=(7y 1 = kenel plano &, ncorresponden respectivamente a los circulos x+y? — y ety—ly=o Y en el plano x, y De la misma manera, la red coordenada rectilinea en el plano x, y corresponde a las dos familias de circulos que tocan al eje & y al eje 1 en el origen. Como un ejemplo mas, considérese la aplicaci6n =x —y?, n= xy. Desarrollos y aplicaciones del c4lculo diferencial 291 Las curvas & = constante dan lugar en el plano x, y a las hipérbolas rectangulares x? — y? = constante, cuyas asintotas son las rectas x = y yx = — y, Las rectas = constante también corresponden a una familia de hipérbolas rectangulares que tienen a los ejes coordenados como asintotas. Las hipérbolas de cada familia cortan a las de la otra familia a 4ngulos rectos (Fig. 3.8). Las rectas paralelas a los ejes en el plano x,y corresponden a dos familias de parabolas en el plano &, 9: las parabolas n? =4c?(c? — &) corresponden a las rectas x = c y las pa rabolas n2 =4h%(k? + &) corresponden a las rectas y = k. Todas estas par4bolas tienen al origen como foco y al eje § como eje; forman una familia de parabolas confocales y coaxiales (Fig. 3.9). Las transformaciones uno a uno tienen una importante inter- pretacién y aplicacién en la representacién de las deformaciones 0 movimientos de sustancias distribuidas de modo continuo, como los fluidos. Si se imagina una sustancia de este tipo como si estuviera dis- persa, en un instante dado, sobre una regién R y, a continuacién fuera deformada por un movimiento, en general la sustancia dispersa originalmente sobre R cubrir4 una regién B diferente de R. Cada particula de la sustancia puede distinguirse, al principio del movi- miento, por medio de sus coordenadas (x,y) en R, y al final del movimiento, por sus coordenadas (6,7) en B. El cardcter biunivoco de la transformacién obtenida al llevar (x, y)acorrespondercon (6, ) Figura 3.8 Familias ortogonales de hipérbolas rectangulares. 292 Introduccién al calculo y al an4lisis matem4tico Figura 3.9 Familias ortogonales de parabolas confocales. es simplemente la expresién matematica del hecho fisico obvio de que particulas separadas permanecen separadas. Ejercicios 3.3a . Encontrar las curvas imagen de las rectas x = const., y transformaciones siguientes: (a) E=e7 cosy, y=erseny (b) E=(—y/2, 0 = Vxy (©) = vx]y, 1=cos(x +») @ea=xty, naytxP—-1 (@) =x, q=y* (f) E=senhx, 4=coshy (g) E=sen(x+y), 1 =cos(x — y) (hy E=em2, neem, nw . Hallar la imagen de la regién limitada por la curva cosh? x + senh ?y = 1 bajo la aplicacién & = e#, 4 = ev. . Hallar la imagen del rectangulo 1 =-—*_ a =—ayy) T= eB Ty es una transformaci6n conforme; Desarrollos y aplicaciones del calculo diferencial 303 (b) probar que la inversa de cualquier circulo es otro circulo o una recta: (c) encontrar el jacobiano de la inversion. 5. Sean Ki, Kz, Ks tres circulos que pasan por 0 y que tienen intersecciones pareadas distintas, digamos P1, Pz, Ps, en otros puntos. Demostrar que la suma de los angulos del triangulo curvilineo P1 P2 Ps, formado por arcos circulares, es 7. 6. Probar que una transformacién del plano u=9x,y), v= (x,y) es conforme si las funciones 9 y } satisfacen las identidades e=by w= — He 7. Probar que si todas las normales de una superficie z = u(x, ¥) cortan al eje z, entonces la superficie es una superficie de revoluci6n. 8. La ecuacion (a> b) determina dos valores de t que dependen de x y y: t= (x,y), te = w(x, y). (a) Probar que las curvas t) = constante y te = constante son elipses hipérbolas que tienen todas los mismos focos (cénicas confocales). (b) Probar que las curvas t1 = constante y fa = constante son ortogo- nales. (c) tr y t2 pueden usarse como coordenadas curvilineas (las llamadas coordenadas focales). Expresar x y y en términos de estas coorde- nadas. (a) Expresar el jacobiano A(t, t2)/0(x, y) en términos de x y y. (c) Encontrar la condicién para que dos curvas, representadas para- métricamente en el sistema de coordenadas focales por las ecua- ciones h=fAQ), t=fQ) y t= gi), te = ga(u) sean ortogonales entre si. 9. (a) Probar que la ecuaci6n en ¢ 1 (@>b>0c) tiene tres raices reales distintas 11, t2, ts, las cuales se encuentran res- pectivamente en los intervalos —0 [Ex(ayy D — myDy) — Ex(nzvD — ayDz)] = D> [nxEwD — EyDy) — nyExyD — e. Producto simbélico de aplicaciones Empecemos con algunas observaciones acerca de la composicién de transformaciones. Si la transformaci6n (28a) F=sy), n=vw(x,y) da una aplicacién biunivoca de los puntos (x,y) de una regién R sobre los puntos (E,n) de la region B en el plano &, n, y si las ecua- ciones (28b) u=6E,7), v= ¥E,n) dan una aplicacién biunivoca de la regién B sobre una regién R' en el plano u, v, entonces se genera una aplicacién biunivoca de R sobre R’. Naturalmente, esta aplicacién se llama aplicacién o transfor macién resultante y se dice que se obtiene por la composici6n de las dos aplicaciones dadas y que representa su producto simbélico. La transformaci6n resultante esta dada por las ecuaciones u = O6(x,y), W(x, 9), v= PO, y), WO, 9); de la definicién, inmediatamente se deduce que esta aplicacién es biunivoca. Por medio de las reglas para derivar funciones compuestas, se ob- tiene Desarrollos y aplicaciones del calculo diferencial 305 a a (28a) Fg Oe + rvs, FF = edy + Orv, (29b) Ov _ vege + Vays, 2% = Vey + ¥ ax ee Wa, ay > Py my. En notaci6n matricial (p. 188). du du ax 3: D ©. se (0) y | _ ( Dy )e *) dv dv Ye Yn /\we Wo ox dy Comparando ésto con la ley para la multiplicacion de los determi- nantes (ver la p.210),se encuentra’ que el jacobiano de u y v con respecto a x y yes du dv _ du dv @la) Bx dy ~ ay az = (Bey — On ¥e)(Grvy — syz)- Es decir, el jacobiano del producto simbélico de dos transformaciones es igual al producto de los jacobianos de las transformaciones in- dividuales, o sea, en la notaci6n (25), au, v) _ au, v) dé, n) (@1b) ax, 9) ~ ale, n) dx, 9)” En esta ecuacién se observa que el simbolo que se adopté para los jacobianos es el adecuado. Cuando se combinan transformaciones, los jacobianos se comportan de la misma manera que se comportan las derivadas cuando se combinan funciones de una variable. El jacobiano de la transformaci6n resultante difiere de cero siempre que se cumpla lo mismo para las transformaciones individuales (0 com- ponentes). Si, en particular, la segunda transformaci6én u=%€,n), v= ¥E,n) es la inversa de la primera, b=»), n=v(x,») \Ppor supuesto se puede obtener el mismo resultado multiplicando directamente. 306 = Introduccién al cAlculo y al an4lisis matem4tico y si ambas transformaciones son diferenciables, la transformacién resultante sera sencillamente la transformacién idéntica; ésto es, U = x,v = y. Obviamente, el jacobiano de esta Ultima transformaci6n 6 1, de manera que nuevamente se obtiene la relaci6n (26). Incidentalmente, de ésto se deduce que ninguno de los dos ja- cobianos se puede anular: aE, n) ax, y) _ | d(x,y) dE ny Para una pareja de funciones continuamente diferenciables 4(x,y) y W(x,y) que tienen un jacobiano que no se anula, pueden encontrar se férmulas para la aplicaci6n de direcciones correspondiente, en un punto (xo, yo) = Po. Una curva que pasa por un punto Po puede des- cribirse paramétricamente por medio de las ecuaciones x= f(t), ¥= g(t), donde f(to) = xo, (to) = yo. La pendiente de la curva en Po est dada por _ alto) ms fo)” De modo semejante, la pendiente de la curva imagen §= fs), 1 = (fg) en el punto correspondiente a Po es _ anfdt _ waf' + we! _¢+dm (32) M= Ge /dt ~ bsf’ + bye’ a+ bm’ donde a, 6, c, d son las constantes = Gxlx0, Yo), b = gu(x0, Yo), ¢ = Yalxo, Yo), d = Wu(x0, Yo)- La relacién (32) entre la pendiente m de la curva original en Poyla pendiente }: de la curva imagen es la misma que para la aplicaci6n afin: & = (xo, yo) + a(x — x0) + b(y — yo), 1 = w(xo, yo) + e(x — x0) + d(y — yo). que da una aproximacidn de la aplicacién cerca de Po. Dado que Desarrollos y aplicaciones del célculo diferencial 307 du _ ad—be dm ~ (a + bm)?” se encuentra que u es una funcién creciente de m para ad — be > 0 y una funcién decreciente para ad — be < 0.1, Las pendientes crecientes corresponden a 4ngulos de inclinacién crecientes 0 a una rotacién en sentido contrario al movimiento de las manecillas del reloj de las direcciones correspondientes. De donde, du/dm > 0 implica que se conserva el sentido de la rotaci6n contrario al movimiento de las manecillas del reloj, mientras que se invierte cuando du/dm <0. Ahora bien, ad — bc es precisamente el jaco- biano dé&n)_ $e gy x,y) We Wy evaluado en el punto Po. Se concluye que la aplicacién © = 6(x,y),0 = W(X, ¥) conserva o invierte las orientaciones cerca del punto (x0,yo) Segdin que el jacobiano en ese punto sea posttivo o negativo. Ejercicios 3.3e 1. Para cada una de las siguientes parejas de transformaciones, encontrar (u, v){@(x, y) eliminando primero & y 7, y, a continuacién, aplicando (31b): 1 u = 5 log @ + 9%) E=er cosy 2 wo {ya 2re tan? sesresteente u=2— 7? —=xcosy {> 2Eq n=xseny @ {¥Escosn a(x? + 92) v =e sen y —yl(x2 + y2) 2. ¢En cuales de las transformaciones sucesivas siguientes pueden definirse x,y como funciones continuamente diferenciables de u,v en una vecin- dad del punto indicado (uo, v9)? e* sen y; 2&n, uo = 1, vo = 0; (a) = et cosy, usa — 73, (b) E = cosh x + senh y, 7 = senh x + cosh y; u=e,v= er, uo = vo (©) 6 = x8 — 99, 4 = x? + 2xy?; u=B+n, v= —E; uo=1, w=0. ‘De modo mas concreto, ésto se cumple localmente, excluyendo las direcciones don- de mo Ht se vuelven infinitas. 308 Introduccién al cAlculo y al an4lisis matematico 3. Considérese la transformacién { u=o, 1) = f(x) v= ¥6,n) = aly). Demostrar que A) prey pypay He ¥) ate, 9) =F FOV 9G 4. siz=f(x,y) y =x.) 1= 4%), demostrar que dz _ Az,n) | AE, 7) 0% ~ a(x, ¥) | A(x,y) oz _ HE, 2) / HG, 0) a ~ ax, y)/ Oxy) siempre que 4, 1)/(x, y) # 0. f. Teorema general sobre la inversion de las transformaciones de los sistemas de funciones implicitas. Descomposicién en aplicaciones primitivas La posibilidad de invertir una transformacién depende del si- guiente teorema general: Sean $(x, y) y w(x, y) funciones continuamente diferenciables en una vecindad de un punto (xo,y0), para las cuales el jacobiano D = $s Vy — $yWz No es cero en (xo, yo). Péngase uo = o(x0, yo), vo = ¥(% yo). Entonces existen vecindades N de (xo, yo) y N’ de (uo, vo) tales que la aplicacién (38a) u=¢(x,y), v=w(x,y) tiene una inversa tinica (33b) x = g(u, v), y = hty, v) que aplica N’ en N. Las funciones g y h satisfacen las identidades (33c) u = (glu, v), A(u,v)), v= y(g(u, v), A(u, v)) para (u, v) en N', y las ecuaciones (33d) Xo = g(Uo, vo), Yo = (uo, vo). Las funciones inversas gh tienen derivadas continuas para (u; ¥) cerca de (uo, vo), dadas por Desarrollos y aplicaciones del célculo diferencial 309 ax _1 av ax_ 1 awe (3e) du = D dy’ av ~~ D dy ay _ _ldv dy_1 dw (33£) du D ax’ dv” D dx° La demostracién se deduce a partir del teorema de la funcién im- plicita dado en la p. 274, elcual permite resolver una ecuaci6n para una sola variable. En esencia, se invierten las ecuaciones (33a) resol- viendo la primera ecuacién para una de las variables x,y y susti- tuyendo la expresién resultante en la segunda ecuaci6n, obteniendose una ecuaci6n para la segunda variable Gnicamente. Como, por hipétesis, el jacobiano D no se anula en el punto (xo, yo), al menos una de las primeras derivadas de ¢(sx, y) es diferente de cero en ese punto. Supéngase, por ejemplo, que, $x(xo, yo) # 0. En- tonces se puede resolver la ecuacién (34a) u = (x,y) para x. Mas precisamente, se pueden encontrar constantes positivas hi, he, hs tales que, para (34b) lu —uol< hi, ly — yol< he, la ecuacién (34a) tiene una solucién unica x = X(u, y) para la cual |x—x0|< hs. La funcién X(u, y) tiene el dominio (34b) y satisface las ecuaciones (34c) H(X(u, y), 9) = u, X(Uo, Yo) = Xo, y la desigualdad (34d) Xu, y) — xo] < hs. Es mas, X(u,¥) tiene derivadas continuas, para las cuales, por (34c), (84e) GAX(u, y), Y)Xu(u, y) = 1 (34f) bx(X(u, y), W)Xy(u, y) + dA X(u, ¥), y) = 0. Supéngase aqui que hz, hs son tan pequefias que el rectangulo (348) |x — xo] < hs, ly — yol< he 310 Introduccién al cAlculo y al an4lisis matematico queda en el dominio de $(x, 9), w(x, y). Sustituyendo x por la ex presién X(u,y) en las funciones W(, y), se obtiene una funcién com puesta (34h) W(X(u, 9), 9) = xe, ¥) con el dominio (34b). Aqui, por (34c, f), (34i) x(uo, Yo) = (Xo, Yo) = vo j = oy, D (34)) YU, Yo) =W2Xy + Vy= —Vo + Wy = #0; oz ox por (34e), se tiene gr # 0. Se concluye que pueden hallarse constan- tes positivas ha, hs, he tales que, para (34k) Ju —uol am? ax age an > Axe? ? Axe pe 6n > Aan? 7 Ben Para mas de dos variables independientes atin se cumple que cuando se componen las transformaciones sus jacobianos se multiplican entre si. En simbolos, (Er, 2, dm, ne, En) du, na, - _ ws En) syn) A(x1, X2,.. ., Xn) A(x1,42,. . -, Xn) En particular, el jacobiano de la transformacién inversa es el reci- proco del jacobiano de la transformacién original. Los teoremas acerca de la resolucién y composicién de transformaciones, acerca de la inversién de una transformacién y acerca de la dependencia de las transformaciones, siguen siendo validos para tres o mas variables independientes. Las demostraciones son semejantes a las del caso n = 2; para evitar la repeticién inne- cesaria; se omiten. Lo mismo se cumple para la construccién de la aplicacién inversa por e] método de iteracién. En la seccién precedente se vio que, en muchos aspectos, el com- portamiento de una transformaci6n general se semeja al de una trans- formacién afin, y que el jacobiano desempefia el mismo papel que el determinante en el caso de una transformacién afin. La observacién que sigue aclarara atin mas ésto. Dado que las funciones § = ¢(x, y) Desarrollos y aplicaciones del cdlculo diferencial 325 n = w(x, y) son diferenciables en la vecindad de (xo, yo), se pueden expresar en la forma & — 0 = (x — x0)h.x(x0, yo) + (¥ — yo)Su(x0, Yo) + € v(x — x0)? + (— yo)’, 1 — No = (x — xo)w2(x0, yo) + (¥ — Yo)Wxx0, Yo) +8 V(x xo) + (y= Yo} donde € y 6 tienden a cero con V(x = x0)? + (y — yo)? Esto demuestra que para valores lo suficientemente pequefios de |x —xoly |y — yo],la transformacién se puede representar en forma aproximada por medio de la transformaci6n afin E = Go + (x — x0)p(x0, Yo) + (¥ — yo)bAx0, Yo), n= No + (x — xo)yx(x0, Yo) + (¥ — Yolo, Yo), cuyo determinante es el jacobiano de la transformacion original. Ejercicios 3.3i 1. Evaluar a, 1, ¢)/(x, y, 2) para cada uno de los casos que siguen: (a) £ =e cosy cos z e* cos ysenz =et sen y cos (x + y) + cos (y + 2) cos (x + y) + sen(y + 2) = sen(x + y) + cos (y + z) = cosh x + log y = tanh y —senhz =x-¥ (©) (@) & =x cos ysen z sen ysenz x cOsz OSM VSM VAM VAIN () § =xcosy xseny Ten asm 2. Definir la dependencia de las funciones & = f(x, », 2), 1 = a(x, ¥, 2), P 326 Introduccién al cAlculo y al andlisis matem4tico = (x,y, 2), en una regién. Generalizar los resultados de la Seccién h para este caso. . ¢Cuales de las ternas de funciones dada en el Ejercicio 1 son dependien- tes? Dar una ecuacién que relacione las funciones de cada una de esas ternas. . Demostrar que las tres funciones siguientes son dependientes y encontrar una relacién entre ellas: oo * b=xty+e2 qaxet+y? +27 C= xytyzt 2x. 5. Una inversién en tres dimensiones se define por medio de las formulas g =——*— »-— 4 pe “ery ee wey ee w+ yee (a) Probar que no se altera el Angulo entre dos superficies cualesquiera. (b) Probar que las esferas se transforman en esferas, o bien, en planos. (c) Encontrar el jacobiano de la transformacién. 3.4 Aplicaciones a. Elementos de la teorta de superficies Para las superficies, como para las curvas, con frecuencia se prefiere la representacién paramétrica a otros tipos de representa- cién. Para las superficies se necesitan dos parametros en lugar de uno; los denotaremos por u y v. Una representacién paramétrica se puede expresar en la forma (39a) x= u,v), y= V(u,v), 2 = X(u,v), donde ¢, y,y % son funciones dadas de los parametros wy v y el punto (u, v) varia sobre una regién R en el plano u, v. Entonces, el punto correspondiente con las tres coordenadas rectangulares (x, y, 2) varia sobre un conjunto en el espacio x, y, z. Tipicamente, este conjunto es una superficie, la cual se puede representar en la forma explicita z = f(x,y), porque posiblemente se puedan resolver dos de las tres ecuaciones para u y v en términos de las dos coordenadas rectan- gulares correspondientes. Si en la tercera ecuaci6n se sustituyen las expresiones encontradas para u y v, se obtiene una representacién no simétrica de la superficie z = f(x, y).1 De aqui que con el fin de ‘Realmente éste es un caso especial de la forma paramétrica, como se ve poniendo s=uyy=v Desarrollos y aplicaciones del cAlculo diferencial 327 asegurar que las ecuaciones en realidad representan una superficie, solo se tiene que suponer que los tres jacobianos (39b) Wu Wo ku ke gu Be Yu Xv Bu Bo Wu Wo no se anulan al mismo tiempo; en una sola formula, se requiere que (39c) Guy — dou)” + (Wuky — Woxu)® + (Luho — You)® > 0. Entonces, en alguna vecindad de cada punto en el espacio, represen- tado por (39a), sin duda es posible expresar una de las tres coor- denadas en términos de las otras dos. Resulta ventajoso remplazar las tres ecuaciones en la represen- tacién paramétrica (39a) por una sola ecuacién vectorial (40a) X = Ou, v), donde X = (x, y, 2) es el vector de posicién de un punto de la super- ficie y @ denota al vector (u, v) = Gu, v), WCU, v), XU, v)). En cada punto de la superficie con parametros w, v se pueden formar las derivadas parciales del vector de posicion (40b) Xu = Gu, Wu, Xu) y Xv = Gv, Wo, Xo). Entonces la diferencial total del vector X es [ver la formula (15b), p. 77). (40c) dX = (dx, dy, dz) = Xu du + X, du, Los tres determinantes (39b) son precisamente los componentes del producto vectorial X, x Xp de los vectores Xu y Xv (ver la p. 221). La expresion a la izquierda en (39c) representa el cuadrado de la longitud del vector Xu x X», de modo que la condicién (39c) es equivalente a (40d) Xu x X, #0. Por ejemplo, la superficie esférica x* + y? + 2% = r* de radio r se representa paramétricamente por medio de las ecuaciones 328 Introduccién al cAlculo y al an4lisis matemAtico (40e) x=rcosusenv, y=rsenusenv, z=rcosv (0 para las cantidades fundamentales. Los cosenos directores para una de las dos normales a la superficie son las componentes del vector unitario

También podría gustarte