P. 1
Algebra y Geometria

Algebra y Geometria

|Views: 891|Likes:
Publicado porrbld2014

More info:

Published by: rbld2014 on Aug 18, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

03/18/2013

pdf

text

original

aquellos que se obtienen duplicando éstos.

Anim ado por su descubrimiento, Gauss logró encontrar una solución algebraica al problema de construir con regla y compás un polígono regular de n lados y desarrolló un criterio basado en la teoría de números con el cual puede decidirse si un poligono regular de un cierto número de lados puede construirse geométricamente. En 1799 se le concedió el título de D octor por la Universidad de Helmsted. En su tesis, Gauss dio una demostración del Teorem a Fundamental del Algebra, en el que se muestra que toda ecuación algebraica con coeficientes com plejos tiene soluciones complejas. Los números complejos, cuya formulación actual se debe, entre otros, a Gauss, se estudiarán en el capítulo 4. A los 24 años publicó una de las obras más completas de la historia de las matemáticas; sé tituló Disquisitiones Aritmeticae y en ella form uló conceptos y métodos de enorme importancia en el desarrollo posterior de la Teoría de Números, El Duke de Brunswick financió tan generosamente sus investigaciones que en 1803 pudo renunciar a una oferta de profesor en la Academ ia de Ciencias de San Petersburgo. En 1807 fue nombrado profesor de astronomía y director del observatorio de la Universidad de Góttingen, en donde permaneció durante toda su vida. En 1801, Gauss tuvo la oportunidad de aplicar su habilidad matemática y sus ideas en el campo de la astronomía. El primer día del año fue descubierto un asteroide, que posteriormente seria llamado Ceres. A pesar de que pudo ser observado durante 40 días, ningún astrónomo fue capaz de calcular su órbita. C on solamente tres observa­ ciones, Gauss desarrolló una técnica para calcular su órbita de manera que Ceres pudo ser localizado fácilmente a finales de 1801 y comienzos de 1802. El m étodo utilizado en sus cálculos fue publicado en 1809 en su libro Theoria M otus Corporum Coelestium; este m étodo continúa utilizándose actualmente, con ligeras modificaciones, en los cálculos que se realizan con ordenadores. Cari Friedrich Gauss contribuyó de manera decisiva al desarrollo de varias ramas de la matemática durante el siglo x ix. M u rió el 23 de febrero de 1855 y poco después de su muerte se pusieron en circulación varias monedas en su honor.

CAPITULO 2

DETERMINANTES Y SUS APLICACIONES
UNIVERSID AD DE L a KLJt'UíJLICA FA C U LTA D DE TT’ GEMJKRIA DEPARTAV:Eím .. ?;£ DOCUMENTACION Y BIBLIOTECA MONTEVIDEO - UR UG UAY

2.1. 2.2. 2.3.

at

ic

a1

2.4. 2.5. 2.6.

w

.M

at

em

Determinantes de matrices de orden 2 y de orden 3 Definición general de determinante. Propiedades Determinante de un producto de matrices. Cálculo de determinantes de orden n Inversa de una matriz. Regla de Cramer Rango de una matriz. Resolución de sistemas compatibles e indetermina­ dos Determinantes y permutaciones

.c w w

om

En el capítulo anterior se ha llegado a la conclusión de que un sistema de ecuaciones lineales de la forma Ax=b es muy fácil de resolver si se conoce la inversa de la matriz A. También allí se dio un m étodo para calcular la inversa de una matriz, basado en la realización de operaciones elementales con sus filas. En este capitulo introduciremos el concepto de determinante de una matriz, que nos permitirá obtener una fórmula para calcular la matriz inversa de una dada. Las propiedades de los determinantes, básicas en este capítulo y en muchos de los restantes, serán estudiadas minuciosamente. En particular, estableceremos la relación entre el rango de una matriz y la anulación de ciertos determinantes, lo cual nos permitirá encontrar una fórmula para resolver sistemas de ecuaciones compatibles.

2.1.

D E T E R M IN A N T E S D E M A T R IC E S D E O R D E N 2 Y D E O R D E N 3 D ado el sistema a x 1+ b x 2 = e1) c x 1+ d x 2 = e2 J

Dada la matriz

el número ad — bc, a ella asociado, recibe el nombre de determinante de A y se denota mediante \A P o r tanto, hemos demostrado el siguiente resultado: \.
Pro
p o s ic ió n

de dos ecuaciones con dos incógnitas, intentamos buscar condiciones sobre los coeficientes del sistema para que posea solución única. P o r el teorema de RouchéFrobenius esto se cumple solamente cuando

1_______________________________________________________________________________

El sistema (I) posee solución única si y sólo si el determinante de la matriz de sus coeficientes es no nulo. Además, sus soluciones se calculan mediante las fórmulas «1 «2 y x 2 —a c a c b d «i

■c

:)-=

Realizando operaciones elementales con las filas de la matriz de los coeficientes, se tiene:
_ ( a ^\ c Fi ’ aF2^ ( a c ^c \
f

a c

b d

2-

f

¡

( ac

¿,c

om w w w .M at em at ic a1 .c

c

dj

\ca

daj

yo

ad — bc

Si a d - b c es nulo, la matriz A de los coeficientes del sistema tiene rango inferior a 2 y, por tanto, el sistema (I) no tiene solución única. Bajo la condición de que el número ad — bc sea no nulo, el sistema (I) puede resolverse. Multiplicando la primera ecuación por d y la segunda por b y restándolas se obtiene (ad — b c )x l = 6 ^ — e2b

Las fórmulas anteriores reciben el nombre de regla de Cramer para la resolución de sistemas compatibles determinados de dos ecuaciones con dos incógnitas. Observar que las soluciones se obtienen com o fracciones que tienen com o denom i­ nador el determinante de A; el numerador de la fracción de x 1 es el determinante de la matriz que se obtiene sustituyendo la primera columna de la matriz A por el vector columna que aparece a la derecha del sistema (I); el numerador de la fracción que determina x 2 es el determinante de la matriz que se obtiene sustituyendo la segunda columna de la matriz A por el vector columna que aparece a la derecha del sistema (I).
Eje m
plo

A.

E l sistema

2x¡ — x 2 = 1 P o r tanto: e l d — e2b 1 ad — bc = 2-3 —( — 1)-1 = 6 + 1 = 7 Su solución es (ad — bc)x2 = ae2 - ce t ! P o r tanto, ae2 — cel 2 ad — bc
* *

X! + 3x 2 = 0 tiene solución única ya que

M ultiplicando la primera ecuación por c y la segunda por a y restando la primera de la segunda se obtiene

-1 3

2 1

1 0

x.

0

La principal propiedad de los determinantes es su linealidad; esta propiedad, entre otras, se demuestra en el siguiente resultado. T e o r e m a 2 ____ a + a' 0 U) ili) iv) c b + b’ d á + i b' d a b d + d' a c b d

de tres ecuaciones con tres incógnitas tiene solución única. Para encontrar esta solución multiplicamos la primera ecuación por
‘22
«23 «33

y

c+ d

+

la segunda por
*12

Si B es la matriz que se obtiene a partir de una matriz A multiplicando una cualquiera de sus filas por un número real r se tiene que \ \ = r\A\. B Si B es la matriz que se obtiene a partir de A intercambiando dos de sus filas se tiene que \B\=— \A \. Si B es la matriz que se obtiene a partir de A sumando unmúltiplo de una fila de A a otra fila de A se tiene que \ \ = \A B \. El determinante de la matriz identidad es 1. y la tercera por

«13 «33

‘ 32

‘ 12

V)

y las sumamos. Después de realizadas las simplificaciones adecuadas se obtiene: Nota. Las propiedades i) y ii) son las que determinan la linealidad por filas del determinante. Las propiedades ii), iii) y iv) nos muestran el comportamiento del determinante frente a las operaciones elementales con las filas de una matriz.
«22 «32 «23 «21 «33 «22 «32 «23 «33 «32 «33 «12 «32 «13 «12 «13 + «31 «22 «12 «23 «13 «23

a i2

«13

a1

Demostración. Unicamente demostraremos la primera parte de i) dejando el resto de las demostraciones para el lector debido a su sencillez. U tilizando la definición de determinante se tiene que: a + a' c b + b' d a = (ad — cb) + (a'd — cb') = c b d + a' c b’ d

om

.c

=

¿1

b2

+
«33

^3 «22

ic .M at
= (a + a')d - c(b + b') = ad + a'd — cb — cb'

em

P o r analogía con el caso del sistema de dos ecuaciones con dos incógnitas denominamos determinante de la matriz
«1 3 \

w

at

w

w

•*2 3
«33 /

que era lo que queríamos demostrar. Observación. es nulo: a a b b El determinante de una matriz de orden 2 con dos filas iguales

a la expresión que multiplica a x 1 en la fórmula anterior. Una form a sencilla de recordar esta definición es haciendo uso de los conceptos de matriz adjunta de un elemento y de menor. D ada una matriz ( a iJ) i t j = l t 2 , . . . , n se denomina matriz adjunta del elem ento que ocupa el lugar ( i , j ) a la m atriz que se obtiene elim inando la fila i y la columna j de la m atriz dada, y se denota por A u. El determinante de A¡j se denomina menor del elemento que ocupa el lugar (i, j), es decir, a,,P o r ejemplo, en la matriz /I 0 1 -1 3 7 y \A121= 1 4 - 1 5 = - 1 -2\ 3 7/

= ab — ab = 0

A continuación pasamos a estudiar una posible definición del determinante de una m atriz de orden 3. Para ello supongamos que el sistema al í x 1+ a 12x 2 + al3x 3= b 1
a 21x l + a 22x 2 + a 23x 3 = b 2

A=

2

\5
0

-2
3 7/

(II)

A i2 — 2 \5 -1

1

'2 5

« 3 1 * 1 + « 3 2 x 2 + a 33x 3 = ¿3

mientras que
/ 1

U n resultado análogo se obtiene para los términos negativos:

-2 \
- 2 1

y

| 1 = 7 + 10 = 17 ^ 22|
'31
a 32 a 33

(términos negativos)

\5

7 /

C on estas notaciones podemos dar la siguiente definición.
D E F IN IC IÓ N
(D eterm inante de una m atriz de orden 3 ) -------

Esta regla nemotécnica puede emplearse para calcular determinantes, pero sólo funciona con matrices de orden 3. E j e m p l o C. L os términos positivos del determnante de la matriz /
A =

Dada la matriz
^11
A = a 21

a 12
a 22 a 32

^13 \
a 23
a 33¡

1 5

-2 0 - 2 1

3\

\ a 31

\ -l son
1

1

definimos su

determ inante

mediante la fórmula

\A\ = a l l \ A 1 1 \— a 2 1 \ A 2 1 ¡ + fl3il¿43 il

-2 0 1

3 -2 1 : 1 - 0 ■1 + ( — 2)( — 2)( — l) + 5 - 1 - 3 = 11

5 Eje m plo B 1 2 1 2 1 1 0 3 = 1 2 1 2 -1 1
1

om

-1

2 1 1

0 3 -2 2
2 1 0 2

1 2 -1

2 1 1
2

0 3 + (- 1 ) 2
0

1 2 -1

2 1 1

0 3 2

a1 em at ic

.c
y los términos negativos son
1

-2

3

at

w

2

1

3

w

= 1

+ ( - 1)

= 1 •( — 1) — 2 - (4) + ( — l)- 6 = — 15

w

3

.M

5
- 1

0
1

- 2 : + ( — 1 ) 0 - 3 + 1 • 1 •( — 2) + 5( — 2)-1 = — 12
1

P o r tanto, |4 = 11 —( — 12) = 23 (¡com probar el resultado utilizando la definición!). ^|
* * *

Si desarrollamos la expresión que nos da el determinante de una matriz de orden 3 se obtienen los siguientes seis productos: A continuación probamos que el determinante de una matriz de orden 3 tiene propiedades análogas a las enunciadas en el teorema 2 para determinantes de matrices de orden 2. Concretamente:
Teorem
a

\ = a11(a22a33- a 23a32) - a 21{al2a33- a 13a32) + A \
+ a 3 l ( a 12a 2 3 ~ ~ a 1 3 a 2 2) =

fll l a 2 2 a 3 3 + a 2 1 a 1 3 a 3 2 +

3 ___________________________ _______________________________________ _ _ _
i ) , i i ) , i i i ), i v )

+ a 3 1 a 1 2 a 23 — a 3 1 a 1 3 a 2 2 — a 2 1 a 1 2 a 3 3 — a lla 2 3 a 32

Los términos positivos de esta expresión son los productos de los términos de la diagonal principal de A y los productos de los términos que ocupan los vértices de los triángulos de la figura adjunta:

Las propiedades análogas a matrices de orden 3.

y

v)

del teorema 2 son ciertas para

Dem ostración,

i)

Si la primera fila es suma de dos se tiene:
a 1 3 + fl13 a 23 a 33

a i i+ a i i

a i2 + a i2 a 22 a 32

(términos positivos)

a 2j a 31

= ( a n + fl'ii)

a 22 a 32

a 23 a 2l °33

a l2 + a l2 U 32

fl1 3 + fl13
a 33

+ «,

«12+«12

« i 3 + «i:

!

a 22 a 32

a 23 — a 21 a 33

a l2

«13 + «31 «33

«12 «22

«13

+
«23

«32

que se ha obtenido de A sumando a la tercera fila r veces la primera. D ebido a las propiedades í) y ii) ya demostradas se tiene que
« u «12 «22 «12 «13 I I «22 «11 «12 «11 «13 «12 -«ii «22 «23 «13 + «11 «22 «-3 «12 «13 «13 + «23 «21 «12 «13 «12 «13 + «23

«22 «32

«23 «33

«12 — «21 «32

«13 + «31 «33

«12 «22

«13 B| = | X | + r « 21 «23

«11 = «21 «31

«12 «22 «32

«13 «23 + «33

«11 «21 «31

«12 «22 «32

«13 «23 «33

«12 «22

«13 «23

= M| + r

_

en donde en la segunda igualdad se ha utilizado la propiedad i) del teorem a 2. Igualmente puede demostrarse cuando la suma aparece en las filas segunda o tercera. ii) Si multiplicamos una fila de una matriz (por ejemplo, la segunda) por un número real r se obtiene:

que era lo que se quería demostrar. La propiedad y) es inmediata a partir de la definición.

Terminamos esta sección con un ejemplo que muestra cóm o pueden utilizarse las propiedades iii), iv) y v) del teorema 3 para calcular determinantes.
Eje m
plo

D 1 2 2 1 1 0 3 2 iv) 1 0 0 1 ^ -1 5 0 0 2 1 0 2 -3 3 0 0 1 = 0 3 2 »«) 1 0 0 1 — 15 0 0 2 -3 0 0 1 0 0 1 2 1 0 0 -1 1

«12

«13 r a 22
*23 ra2i a 32 a 33

ra 21
^31

ra22

- r a 2i

«12 «32'

«13 «33

«12 + «31 r « 22

«13 '*«23

«32

om

3 = = (- 3 )(5 ) 0 5 0 0 1 0

-1

«31

«32

«33

w

obtenemos:
21 «11 «31

w

.M

en donde se ha utilizado la propiedad ii) del teorema 2. iii) Intercambiando, por ejemplo, la primera y la segunda fila de la matriz A

at

em

at

«32

«33

«32

«33

«22

«23

ic

= ra,

— '"«21

+ '•«31

= r

«21

«22

«23

a1 w
E J E R C IC IO S 2.1 1. «)

«22

«23

«12

«13

«12

«13

.c

«11

«12

«13

que es el mismo resultado que se obtuvo en el ejemplo B.

a22
«12 «32

a 23
«, “13
«33 «22 «32 «23 + «21 «33 «13 «23 «33 «32 «33 «12 «13 — «2i «12 «32 «13 -«11 «33 «32 «33 «22 «23 + «31

«22 «12

«23 «13

Calcular los siguientes determinantes de matrices de orden 2: 2 1 1 2 b) 3 0 — sen a eos a 1 4 e)
c)

a «

1 b sen a — eos a

«12 — «31 «22

«13 «23

= -a ,

d)

eos a sen a

eos a sen a

“ ii
«21

ai2
a 22

2. 3.

H allar la inversa de las matrices c) y d) anteriores. U tilizar la regía de Cramer para resolver los sistemas A x=~b, donde

«31

a3 2

iv)

Tom em os an
B =
«13

«21
«3 1 + r« n

i 22
« 3 2 + '• « 1 2

a 23

a33 + ra13

4. a)

U tilizar la definición de determinante para calcular: 1 2 0 4 1 3 3 0 1 b) 3 7 1 2 0 4 -1 7 -7 c) 1 X
X2

1 y y2 la

1 z
z2

d)

1 0 0

a 1 0

b c 1 para calcular
Eje m

Observación. En la definición que acabamos de dar el determinante de una matriz de orden n se reduce a calcular n determinantes de matrices de orden n — 1; cada determinante de orden n — 1 se reduce a calcular n — 1 determinantes de orden n — 2. Continuando este proceso se llega a obtener determinantes de orden 2, que son fáciles de calcular.
plo

5. Calcular a) y b) anteriores determinantes de orden 3.

utilizando

regla

nemotécnica

A

6. Calcular el determinante de la matriz c) del ejercicio 4 realizando operaciones elementales en sus filas y utilizando las propiedades de los determinantes. 7. Calcular eos a sen a sen a — sen a eos a eos a 1 0 cos a

2 2 2 2 2 2 2 2

3 2 0 1 2 0 1 3 2 1 3 2 0

4 3 3 1 3 3 1 4 3 1 4 3 3

2 2 2

2 0 1

3

2

3 0 1

4

2

3 2 1

4

2

3 2 0

4 3 3

3 -0 2 1 2

3 + 4 2 1 2

3 -2 2 1 2

0 1

3 1

-2

2 1

3 1 + 2

2 0

3
= — 6 + 2 + 12 = í

3

D em ostrar que si a, b y c son números reales, las raíces de la ecuación a —x b son reales. b c —x

2 1

3 1

om

= 0

2 2 2 2 2 P o r tanto 1 0 4

-2

3 1

4 1 + 2

3 2

4 3
= —2 + 2 + 2 = 2

a1

.c

ic

2 0

3 3

at

-2

3 0

4 3

+ 2

3 2

4 3

= 1 2 -1 8 + 2 = - 4

w

.M

2.2. D E F IN I C IO N G E N E R A L D E D E T E R M IN A N T E . P R O P IE D A D E S En esta sección daremos la definición de determinante de una matriz cuadrada de orden n de la forma ia n
a 21 l 22

at

em

w

w

2 2 2 2

3 2 0 1

4 3 3 1 = 1- 8 —0 + 4- 2 — 2( — 4) = 8 + 8 + 8 = 24.

'A

2

!nl

a n2

'' '

a nn J

Esta definición es la generalización de la definición de determinante de matrices de orden 3 dada en la sección 2.1. Recordemos que \AU\ denota el determinante de la matriz de orden n — 1 que se obtiene suprimiendo la fila i y la columna j de la matriz A; \A¡j\ se denomina menor del elemento que ocupa el lugar ( i , j ) en A. D e f in ic i ó n (Determinante de una matriz de orden n) ----------------------------------Dada una matriz A com o arriba, su determinante se define de la forma \A\=al í \Al l \ a2i\A2 í\H — ------h (—l)" + 1a„1|;4„1|

El cálculo de determinantes utilizando la definición dada resulta larguísimo cuando se trata de matrices de orden elevado. El estudio de las propiedades del determinante aliviará este problema. Para demostrar estas propiedades utilizaremos un razonam iento denom inado método de inducción. Este m étodo puede aplicarse cuando se trata de demostrar una propiedad P(n) que depende de un número natural n. Para ello se procede com o sigue: 1.° 2.° Se demuestra que P(n ) es cierta para un cierto número natural n0, que generalmente es pequeño. Se acepta que la propiedad es cierta para todo número k > n0 e inferior a n (hipótesis de inducción) y utilizando esto se demuestra que también es cierta para n.

Estos dos resultados permiten concluir que la propiedad es cierta para todo n ^ n0. En efecto, por 1.° es cierta para n0; utilizando 2.° es también cierta para n0+ 1; utilizando de nuevo 2.°, P(n) es cierta para n0 + 2, y este proceso puede continuarse hasta alcanzar cualquier número natural n por muy elevado que sea. M ostrarem os con un ejemplo sencillo cóm o se aplica el m étodo de inducción. Se trata de demostrar que la suma de los n primeros números impares es n2. ------h(2n— l) = n2 la propiedad que queremos demostrar. Sea P(w) = 1 + 3 + 5 H 1.° P ( l ) = 1 = l 2 es cierta. Para convencerse de que el resultado escierto, el lector puede com probar que P(2) = 1 + 3 = 4 = 22 y P(3) = l + 3 + 5 = 9 = 32. 2.° Supongamos que P(k) es cierta para todo k < n , es decir se 1 + 3 + 5H-----\-{2k— l ) = k2, Ahora, 1 + 3 + 5 + •••+ (2 n — 1) = 1 + 3 + 5 + ■•■+ (2 n — 3) + (2 n — 1) = = (1 + 3 + 5 h------1 [2(n — 1) — 1]) + (2n — 1) = = (n — l ) 2 + (2n— 1) = = n2 — 2n + 1 + 2n — 1 = n2 que era lo que queríamos demostrar. En la igualdad (*) es donde se ha utilizado la hipótesis de inducción, ya que se ha aplicado que P(n — 1) es cierta. Algunos resultados que pueden probarse mediante el m étodo de inducción se proponen como ejercicio al final de esta sección. *
P r o pied ad

D e la definición de determinante deducimos l^l = a 11|^11| - - + ( - l ) ia¡ - 1, 1| ^ - 1, 1| + ( - l ) i+1O K ,il + - + ( - l ) " + 1 „.iM nil a T od os los adjuntos A kl con tienen una fila de ceros y, por tanto, | kl|= 0 por la v4 hipótesis de inducción. Para k = i, está multiplicado por 0 y, por tanto, todos los sumandos de la igualdad anterior son nulos. ■ P r o p ie d a d 2 ( P . 2 ) ________________________________________________________________ ¿> 1 1 a 12
a ln

tiene | |= C

flU

a l2

"■

a xn

k = 1, 2, 3, ..., n — 1

an + b n

ai2 + bÌ2

" '

a in + b in

=

ai1

a i2

"

a in

+

a nl

a n2 a \\ a í2

@n n

a n1

a n2

a nn

a1

.c

om

+

b¡i

bi2

£ bín = |¿| + | |

a nl

a n2

Qn -n

ic

at

*

*

em

at

todo i = 1, 2, ..., n.

w

Si una matriz tiene una fila de ceros, su determinante es nulo.

w

w

l ( P . l ) _______________________________________________________________________________

Demostración. Esta propiedad se ha demostrado para matrices de orden 2 y de orden 3 en la sección anterior. Aceptemos que es cierta para toda matriz de orden menor que n. Tenemos |C|=a11|C11| - - + ( - l ) i+1[a i l +fe1 .1]|C¡1|+ - + ( - l ) " +1a„1|Cnl|

Demostración. 2:

Esta propiedad es fácilmente comprobable para matrices de orden Cada adjunto ckl con k=¿i es una matriz de orden n — 1 con una fila que es una suma; por tanto: a 0 b 0 = a-0 — b 0 = 0 y 0 c 0 d I Q i l = l^*il + donde A ki y Bk son adjuntos de A y B, respectivamente. Sustituyendo este resultado en ¡ la igualdad anterior se tiene: |C|=a11[|Ali|+ |B1¡| ] - - + ( - i r i [a i l + b il]|C¡1l + - + ( - l ) ' , + 1a„1[ K 1|+ |5„1|] Puesto que IC ,^ ^ 1 ^1 = |Ba | se tiene que /4 | | = a 11^ 11|+ - + ( - l ) i+1a¡1M ¡1|+ - + ( - l ) " +1a„1K 1|+ C
+ a n ] J 11|+ - + ( - l ) í + 1b í l |Bii| + . . . + ( - l ) ' , + 1a„i|BBl|= M| + |B B | ■

Aceptemos que es cierta para toda matriz de orden n — 1 y tratemos de demostrarlo para una matriz de orden n con una fila de ceros. Supongamos que los ceros ocupan la fila i de la matriz, es decir:

.M

P r o p ie d a d 3 (P.3) _______________________________________________________________ _ Si B es la matriz que se obtiene a partir de una matriz A multiplicando por un número real r una de sus filas se tiene que \ \ = r\A\. B

la matriz que se ha obtenido de A intercambiando las filas i e i + 1. Tenemos que | | = a u | B i i | - - + ( - l ) í+1a¡ + i,i|fi¡i| + ( - l ) i+2a¡1|B;+ i , 1|+ - + ( - i r +1a„i|Bnl| B Se tiene que

Demostración. En la sección anterior se demostró que el resultado es cierto para matrices de orden 2 y de orden 3. Aceptemos la hipótesis de inducción y supongamos, para simplificar la demostración que /rau
o =

I a 12

’ '

a ln \

al2

« il n \ u

Bn = w

«¡1

•■

ain

= y ¡+ 1,1 4

y

£ ¡+ i,i = |
,

= ^ ¡i “ ¡+ 1,1 “ i + l, n

ra12 ••• a2 2

ra lB\ « 2n

• ■ annj

:/

a2 1

P o r otro lado, B kl con fc#i, í + 1, es una matriz de orden n — 1 con dos filas consecuti­ vas intercambiadas con respecto a A kí\ por la hipótesis de inducción tenemos que |BU | = — l^ k llSustituyendo estos resultados en la igualdad anterior se obtiene: |B|=— a u M ii| + - + ( - l ) í+1a¡+ i , i M i+ i , i | + ( — l ) í+2a¡i M íi| + --— ( - í r X i l A . i N

\ a nl

a n2

"•

a nn I

Tenem os que | B | = ra n | B n | -a 21|B2i| + - - - + ( - l ) " + 1a„i|B„i| El adjunto B X coincide con A u y, por tanto, l- B n lH ^ u l; los adjuntos Bk¡ con 1 tienen una fila que está multiplicada por r y, por tanto, \Bkl\=r\Akl\ debido a la hipótesis de inducción. Sustituyendo estos resultados en la igualdad anterior obtene­ mos \B\=ra11\Al l \ - r a 21\A2i\ + - - - + ( - l ) n+ i r a „ - 1\An-i\=r\A\ U

= - [ f l i i l ^ n l - - + ( - l ) ' +1f l a l ^ i l + ( - l ) ' + 2flí+ i . i l ^ + i . i l + - + ( - l ) " + 1fl1 i K i l ] ,

om at ic a1 .c

= -\A\ Hem os demostrado el resultado cuando se intercambian dos filas consecutivas. Supongamos ahora que se intercambian las filas i y j = i + k de una matriz. Sea
/a n .....
a l n\

.M

at

em

an

w

Si B es la matriz que se obtiene de A intercambiando dos de sus filas, se tiene que \B\=-\A\. \ a ni Demostración. Comenzaremos demostrando el resultado cuando las dos filas que se intercambian son consecutivas. A l igual que en las demostraciones anteriores utilizaremos el m étodo de demostración por inducción. El resultado es cierto para matrices de orden 2 y de orden 3 puesto que se ha demostrado en la sección anterior. Sea, por tanto: .... an J n

w

P r o p ie d a d 4 (P.4) ___________________________________________________________________

w

B=

la matriz que se obtiene de A intercambiando las filas i y j. La matriz B puede obtenerse a partir de A realizando varios intercambios de filas consecutivas. En primer lugar, la fila i de A puede colocarse en la fila j = i + k realizando k intercambios de filas consecutivas; se obtiene así la matriz
/ «11
a ln \

ai+ l,l

a i + l,n

■Fila i

A =

aj i
«¡i

-Fila j = i + k

Y

'» i

!

Para pasar de A a B mediante intercambios de filas consecutivas es necesario intercambiar la fila (ajl( ajn) que ocupa el lugar j — 1 = i + ( k — 1), k — 1 veces para colocarla en la fila i. En definitiva, de A se pasa a B mediante k + (k — í ) = 2 k — l intercambios de filas consecutivas. Cada uno de estos intercambios cambia de signo el determinante y puesto que se hacen un número impar de intercambios se tiene que i«i= ( — P r o p ie d a d 5 (P.5) Si una matriz tiene dos filas iguales, su determinante es nulo. —
mi

Demostración. Multipliquemos la fila i de A por r y sumémosla a la fila k para obtener B; por las propiedades 2 y 3: ai„
a in

\ \ = \A\+r B

>iguales

Demostración.

Sea
I a 11

La matriz cuyo determinante aparece el último en la igualdad anterior tiene dos filas iguales y, por tanto, es nulo por la propiedad 5. Este razonamiento demuestra el resultado. ■ Las propiedades 3 y 6 de los determinantes junto con

''

a í n\

.
«¡1 •
^ in

1 0
— Fila ¡

0 1

•■ 0 ■ ••• 0 = 1

(*)

|/J =
0 0 ••• 1

A=
“ n ■

a¡„

<— — Fila

.c .M at em at ic a1

om
1) 2) 3)

’ V » i • •
a J

,

w

una matriz con dos filas iguales, a saber, las filas i y j; intercambiando estas filas se obtiene la misma matriz; sin embargo, por la propiedad 4, el determinante cambia de signo. P o r tanto, \A\= — \A de aquí se deduce que | 1 = 0, que era lo que queríamos \; /| demostrar. ■ E j e m p l o B. L a matriz

permiten calcular determinantes de una m atriz cuadrada de cualquier orden. El siguiente ejemplo muestra este hecho. En este ejemplo y en otros de cálculo de determinantes en los que se considere necesario, se utilizarán los siguientes símbolos aclaratorios de las igualdades que se escriben: r F j significa que la j-ésima fila de la matriz ha sido multiplicada por el nú­ mero real r. F j + r F k significa que a la j'-ésima fila de la matriz se le ha sumado r veces la fila k. L a propiedad que utilicemos en cada caso se indicará bajo el signo de igualdad.
plo

2 0 A= 3 0

1 1 1 1 5

3 -1 -3 -1 2

5 0 1 0 7

1\ 2 1 2 0/

w

w

Eje m

B 1 0 4 2 2 2 2 2 3 2 0 1 1 4 3 3 1 2 2 0 0 3 2 -6 0 4 3 -4 -2 F j— 4F, Ft -2F¡ P.6 1 0 0 0 2 2 -6 -2 3 2 -1 2 -5 4 3 -1 3 -7 1 0 = 2 •( — 6)( — 2) 0 P .3 0 2 1 0 0 3 1 1 0 4 3/2 2/3 1 F,+3F2 Ft+Fi P.6

V

1

tiene determinante nulo ya que su segunda y su cuarta fila coinciden.

P r o p ie d a d 6 (P.6) ________________________ ____________________________ Si B es la matriz que se obtiene a partir de A sumando un múltiplo de una fila de A a otra fila de A se tiene que | | = \A B \.

F * - í F3 0 0 0

i

0 1 0 0

0 0 1 0

0 0 0

0
Aplicar varias veces P .6 V /V /

una matriz triangular superior. D e la definición de determinante aplicada repetidas veces se tiene:
a 22 a 23

0 0

' ' ■

a 2n

1

0

«33 «33 «3*

'

«3 n

\A = au \ Observar que el resultado es el mismo que el obtenido en el ejemplo A.
* * *
0

— a11a22
0 «nn

— « 1 1 « 2 2 ” ' a nn

«nn

Nota. En el ejemplo anterior solamente se han necesitado P.3, P.6 y (*) para calcular el determinante. Este es un hecho general, es decir, las propiedades P.3, P.6 y (* ) determinan de manera única un número al cual se le denomina «determ inante» y que satisface todas las propiedades y fórmulas que daremos aquí. El lector interesado puede encontrar una exposición de este tipo en el libro de A. G. Kurosch, Curso de álgebra superior, Editorial M ir, 1977. En el ejemplo B puede observarse que cuando tenemos que calcular el determinan­ te de una matriz como

D e la propiedad 7 se deduce que el determinante de una matriz diagonal, es decir, una matriz cuyos elementos son todos nulos excepto los de su diagonal principal, es el producto de los elementos de la diagonal: «11 0 '- O 0 «22 '- O 0 0 «33 ■• o ••• •• ■• 0 0 0
— a U a 2 2 a 3 3 ' " a nn

■• O

•■ o

^nn

/I

0 0
\o

2 0 0

2 - 6 0

3

at

-4 -2

ic

a1 w .M at em

.c

2

3

4 \

om

Es conveniente que el ejercicio siguiente se realice en este momento y sin conocer más propiedades de los determinantes, puesto que más adelante resultará muy sencillo. Ejercicio 1. U na matriz triangular inferior es una matriz que tiene todos sus términos nulos por encima de la diagonal principal. Demostrar que el determinante de una matriz triangular inferior es el producto de los elementos de la diagonal principal. E j e m p l o C. Para calcular el determinante de la matriz 2 0 0 0 2 °\ 1 1 -4 0/

el resultado se obtiene multiplicando los elementos de su diagonal principal, es decir, la diagonal de izquierda a derecha y de arriba a abajo. Este es un resultado general. U na matriz se dice triangular superior si todos sus elementos por debajo de su diagonal principal son nulos.

w

w

2 0 3 4 \6

3 1 0 1 -1

5 2 1 -3 1

P r o p ie d a d 7 (P.7) ___________________________________________________________________ El determinante de una matriz triangular superior es el producto de los elementos de su diagonal.

Demostración.

Sea

la reducimos a una matriz triangular superior mediante operaciones elementales en sus filas y aplicamos las propiedades ya conocidas de los determinantes. Tenemos:

2 0 3 0 0

3 1 0 -5 -1

5 2 1 -1 3 -1

2 0 0 -4 2

0 1 1 -4 -2 Fi ~F3 P.6

-1 0 3 0 0

3 1 0 -5 -1

4 2 1 -1 3 -1

2 0 0 -4 2

-1 1 1 -4 -2

- 1

3
1

4 2 13 -1 3
- 1

2 0 6 -4 2 2
- 1

-1 1 F } - 9F¡ F* + 5F 2 f,+ f2 P.6

-1
0 0 0 0

3 1
0 0 0

4 2 -5 -3 1 4 2 1
0 0

2
0

-

0
F , + 3FÍ

Demostración. Procedemos por inducción en el orden de la matriz. Si A es una matriz de orden 2 puede ser de la forma
0
'21 “ 22

¡Té

0 0 0

9 -5
- 1

-2 -4 -2

6 -4 2 2
0

-1 A= -1 1 -1 -2

o

B=

0

a l2

-1 3
F3 + F4 +

4

-1
1 0 0 0 0

3 1
0 0 0

5F, 3F,

0 12
0 0 0 0 0 0

0
16 2

-1 6

2 2 16

En el primer caso se tiene \A = a 11a22 = al l \Al l \ y en el segundo \ \ = —a 12a21 = \ B — « i 2|^4i2| lo cual prueba que la fórmula es cierta en este caso. , Para que el lector pueda seguir m ejor el caso general hacemos un caso particular de una matriz de orden 3. Sea

P.6

-2
- 1

I
A=
\

0

a1 2
a 22

0
a 23

0

0
-1

1
3 1 0 0 0

2
4 2 1 0 0

-1 6

a2 1 a3 1

2 0 2 2 0
*

-1 1 -1 -2 0
* * D-

a 32 a 33 I

F, - 8 F»

0 0 0 0

Tenemos que 11- 2 - 0 = 0
a 21
a 32

pTé

a 12

0 + fl31 a 33

a 12 a 22

0 — — a 2l a 23

a1 3+ 2a3

a

31a 12f2 l3

om

.c

‘2 “2 1 3
— íJ i 2 [ f l 2 l a 33 a 31a 2 3 ] _ a 12

ic

a1

‘3 “3 1 3

utilidad para simplificar el cálculo de determinantes. Comenzaremos demostrando que puede utilizarse la primera fila de la matriz para calcular determinantes.

w

w

En la definición dada de determinante se ha utilizado la primera columna de la m atriz y sus adjuntos. Nuestro próxim o objetivo es demostrar que también puede calcularse el determinante mediante una fórmula que incluya cualquier otra columna o incluso cualquier fila de la matriz y sus adjuntos. Estos resultados serán de gran

w

.M

que era lo que queríamos demostrar. Aceptemos ahora que el resultado es cierto para toda matriz de orden inferior a n y sea A una matriz de orden n. Si el elemento no nulo ocupa el primer lugar de la primera fila se tiene

at

em

at

M i
A=
*21

o m22

...

o \

\ a nl

a n2

Teorem

a

1

7
ni\¿ni\

Si

D e la definición de determinante deducimos que

/ 0 A=
*21 J2j

0\
@nn

\A = a11\ A u \ - a 21\A2i\ + - - - + ( - l ) " + 1“ \

= au\ A 11\

\ fln l

I

ya que cada adjunto A jx, con j > 1, tiene una fila de ceros y, por tanto, su determinan­ te es nulo (propiedad 1). Supongamos ahora que el elemento no nulo de la primera fila ocupa el lugar j, con j > 1. Tenemos
/ 0 0
a 22

es una matriz con todos los elementos de su primera fila nulos excepto el que ocupa el lugar j, se tiene que A= \ A \ = { - i y +1a J A J

0

0

«1

■\

f l 21

a 2n

\ a nl

a n2

an ,j- 1

An , j

un,j+ 1

•••

am J

D e la definición de determinante deducimos que

por tanto, se han suprimido las dos primeras filas y la primera fila y la y'-ésima columna de A. P o r tanto:

\ A \ = - a 21\A2 í\+ a3í \A3i \ - - + ( - l T + 1 anl\A«1\ El adjunto A n , i > 1, de la fórmula anterior es de la forma

D e manera similar se demuestra que B( \ = 8 ( 3 í 1¿-_1, etc., lo cual demuestra el resultado. ■
^

0

..

«i j

"

0

E j e m p l o D.

El determinante de la matriz

B " = An =

a i - 1,2 «¡+1,2

« i - 1, j ai+ í.j

■■ "

« i + 1, n «¡+l,n

0 1 3

0 2 1 -5

-3 1 0 2

0 -4 -1 0

\

a „2

a n.J

' '•

«n, n

-1 es

y de orden n — 1; por la hipótesis de inducción su determinante es 1 2 1 -5 -4 1 2 -5 -3 4 11 = - 3 - 1 -4 -5 -3

om

3)

3 -1

em

at

donde B <] J_ 1 denota la matriz que se obtiene de B(i) = A n suprimiendo la primera fila Í y la ( j — l)-ésima columna. P o r tanto:

ic

a1

- 1 ---- - 3 0 P.6 0 0

11 -4

.c

= ( — 3)[20 + 3 3 ]= — 159

Solamente falta probar que la expresión entre paréntesis coincide con \Au\- Puesto que

w

w

w

= ( - i y + ■a 1 21|B ._ J ■- a31|B 1 ,[a <2»J <3),_ ,| + • • • + ( - l y a M ' h - i U

.M

MI = - a 21( - i y ai j\B[2) - J + a31( -

,| ....... + ( - l ) ” +1aBl( - l Y a J B f j . ,|= +

at

TEOREMA 2 (Desarrollo por la primera fila) Si / «ll A=
A a 2\

_______________________

«12 •••
a 22

«1„\
a 2n

d22 *31 B U) — A 1 = J
«32

a 2 , j —1

a 2,j + 1

a2»\ \a„i se tiene que an2 a„„ J

*3 , j + 1

\ «„i

\ \ = al l \A11\ - a 12\A12\+ - - - + ( - l ) n+ 1al „\A1 \ A „

se tiene que

Demostración.

Escribimos /« n +0H ------------------ 1-0 0 + íí 1 2 + ' " + 0 ••• : 0 + 0H----- \-aln

1 1 = «21 \B(ñ \ - a 311 1 •••+( - l ) X i \Bÿl i . 1 1 .4 ,1 B<¿1 +
En B^[ se han suprimido la primera fila y la primera columna de A u y, por tanto, se han suprimido las dos primeras filas de A y las columnas primera y y'-ésima de A; de la misma manera, en B1 se han suprimido la primera fila y l a 1 columna de A 21 y, .

«21

«22

Si Aj, j = l , 2, n, es la matriz que tiene todas sus filas iguales a A, excepto la primera, en la que todos sus elementos son nulos excepto el que ocupa el lugar j que es a í j , de la propiedad 2 de los determinantes aplicada reiteradas veces se tiene I ^ I H ^ i l + I ^ H -----P o r el teorema 1, |4j |= ( - i y +1a 1;|4l j | lo cual prueba el resultado deseado. , E je m p lo E. Para calcular el determinante de la matriz / A= \ utilizamos el teorema 2 para obtener 0 2 1 1 3 -1 1 1 + (- 1 ) 3 -1 0 2 3 1 0 -1 ■

signo por la propiedad 5 y, por tanto, se tendría una fórmula para desarrollar el determinante por la tercera fila, comenzando con un sumando positivo. Este razonamiento demuestra el siguiente resultado. TEOREMA 3 (Desarrollo por la i-ésima f i l a ) __________________________________________ Si A = (aiJ)U j= U 2 ....„, se tiene que | A | = ( - l ) í+1ai l | ^ 1| + ( - l ) í + 2ai2|Xi2|+ - + ( - l ) i + "ai„|^J

-1

2

N o es de extrañar que exista un resultado análogo para calcular el determinante utilizando un desarrollo por cualquiera de las columnas. Ello requiere la definición de matriz traspuesta de una dada. Si A es una matriz de orden m x n, se denomina matriz traspuesta de A, y se denota por A ‘, a la matriz de orden n x m que se obtiene poniendo com o í-ésima fila a la ¡'-ésima columna de la matriz A. P o r ejemplo, la matriz traspuesta de

\A| 2 =

-1

om

2

= 2 -( —2 )— 1(3 + 1)— 1-6 = A= es

1 2
3 4 1 2

-2
1 3^ 4

a1

.c

= —4 — 4 — 6 = — 14

at

ic

/
A' =

.M

Sea B la matriz que se obtiene de A = (a¡j)i=i,...,n intercambiando las filas primera y .7=1, segunda. P o r la propiedad 5 tenemos que | 4 = — | | y puesto que /| B j a 2i £=
«1 1

em

at

\

-2

1

/

a22
«1 2

•••

«2„\

w

w

El resultado principal que relaciona la operación de trasposición con el producto de matrices es el siguiente: (.AB)' = B‘A ' siempre que las multiplicaciones anteriores tengan sentido (ver ejercicio 6 al final de esta sección). T e o r e m a 4 ________________________________________________________________________ Si A es una matriz cuadrada, \A = \A'\. \

^ «n 1

«n2•• n •dn I

utilizando el teorema 1 para desarrollar el determinante de B por su primera fila se tiene que \A = - 1 | = - í a21\Bl l \ - a 22\Bl 2\+ •••+ ( - 1 )n+ 1a2n\BlnQ \ £

w

Demostración. Puesto que B i j = A 2j para todo j = 1, 2, ..., n tenemos que

El resultado es cierto para matrices de orden 2 puesto que ai !

\A\= - a 21\A21\ a22\A22\+ ----- ( - l ) " + 1a 2„|^2n| + lo cual nos da una fórmula para desarrollar el determinante de A por la segunda fila. L a principal diferencia con el teorema 1 es que el primer término es negativo. Si ahora intercambiamos la segunda y la tercera fila, el determinante cambia de

\ \= A
«21

— «U «2 2 ~«12«21

ai j 1^1= «21

*12

: «11«22
-*22

« 2 1«12

Supongamos que el resultado es cierto para matrices de orden inferior a n y sea A = (aü)i J=1 una matriz de orden n. Puesto que
f a ll a21
a 22 anl\ u n2

B = At=

a 12

\ a ln

a 2n

' ''

a nn j

por el teorema 2 se tiene que
\A'\ = al ilBnl —« 2 1 ^ 1 2 ! "I----- K ~ ^)"+

El teorema 4 produce otro resultado interesante. En las propiedades 1 a 6 de los determinantes puede sustituirse la palabra «fila» por «columna» y los resultados siguen siendo válidos. Esto permite realizar operaciones elementales con columnas para calcular determinantes. La verificación de estos resultados se deja para el lector. En el ejemplo anterior se observa que el cálculo de determinantes se simplifica si desarrollamos por una fila o columna que presente el mayor número de ceros. Si una matriz no posee ningún elemento nulo es posible realizar operaciones elementales con sus filas o columnas, de manera que el determinante no cambie, pero que la nueva matriz posea varios ceros en alguna de sus filas o columnas. El método combinado de realizar operaciones elementales y utilizar las fórmulas anteriores es el más utilizado para calcular determinantes, debido a que simplifica el número de operaciones a realizar.
E je m p lo G.

Puesto que B 1j = A , 1, j = l , 2, J

n, utilizando la hipótesis de inducción se tiene que = 1^1 ®

\A = a 11|/l11|— a2 l\A2i\ H '\ ------1-(— 1)" +

Sea 4 -3 1 1 -1 1 1 3 0 - 2\ 5 3 1

Los teoremas 3 y 4 producen el siguiente resultado:

.c

om

T e o r e m a 5 (Desarrollo por la j-ésima columna) — ----------------------

2 \ 2

at

\ A \ = ( - i y + 1al j \Al j \ + ( - i y + 2a2j\A2j\+ ■■■+( - 1 y ^ a nj\An

ic

a1

Si A = ( a , j ) ¡ t j =u 2,

se tiene que

1
_2 5 3

w

.M

EJEMPLO F.

Para calcular el determinante de la matriz

at

em

Multiplicando por 2 la segunda columna y restándosela a la primera se tiene —9 4
Cl - 2 C 1

3
0 - 1 1

w

/1
A=

3 5 2\ 3 0 14
2 1/

5
0 0

1 1 1

0 0 3 0
\4 0

w

P.6

1

Desarrollando por la primera columna se tiene 1 0 -1 5 4 1 3 -2 3 1 1

desarrollamos por la segunda columna para obtener 1 3 5 2 0 0
\ \= A

3 0 1 4 1

0 = -3 3 4

3 0 1 4 = —3( —3) 2 1

M|---- 9 1 3 4 4 1 1

3 +51 -1

1 1

3 0

4 0 2 = - 3 ( - 3) 3 4

4 1

Para calcular el primero de estos determinantes restamos la primera fila de la segunda y de la tercera para obtener = 9(— 13)= — 117 1 0 -1 5 3 :
0 0 - 1 1 0 5 -2 -4

en donde el determinante de orden 3 se ha desarrollado por la primera fila.

1 1

- 1 1

-2 -4

=4+2=6

1 1

Para calcular el segundo restamos la primera columna de la segunda y la tercera para, obtener 4
1 1 - 1 1

E JE R C IC IO S 2.2 1. Calcular los siguientes determinantes mediante su desarrollo por la primera columna:

3

-2

4

- 1

-6 2 = 0
- 1

3 — 1
1 1

-6 2

-2 0

a)

4 7 1

2 6 2

1 5 3

b)

3 4 1

0 3 2

1 2 1

c)

1 0 2 0

0 1 1 3

0 2 1 2

7 3 1 1

-2

P o r tanto: \A\= - 9 - 6 + 5 ( - 1 4 ) = - 5 4 - 7 0 = - 1 2 4
* * *

2. C alcular los siguientes determinantes reduciéndolos a una m atriz triangular superior mediante operaciones elementales: a) 2 3 4 5 5 -2 2 1 b) 3 2 1 0 6 1 3 1 -3 0 2 3 9 4 5 2 c) 1 2 2 3 0 1 2 2 3 2 0 1 5 7 4 2 d) 2 0 1 0 0 3 2 3 -2 9 -1 4 4 -6 0 2

Es conveniente escribir una matriz con los signos que se asocian a cada ele­ mento en el desarrollo de los teoremas 3 y 5 con m otivo de ayudar al lector a re­ cordarlos. Esta matriz es

2

.c

-

+

-

+

-

om

+

-

+

-

+

3. Calcular los siguientes determinantes usando sus propiedades y efectuando un número reducido de computaciones.
a)

1 3 5

+
-

+

+
-

+

+
-

a1

0 4 7

2 6 10

b)

1 0 0 0

2 4 0 0

2 2 2 1

1 1 1 1

c)

2 1 4 3

1 0 -1 -1

3 0 2 0

2 1 1 1

d)

2 1 0 4

0 -1 1 1 3

0 2 3 1 1

3 1 -1 -1 -3

5 2 1 0 0

w

w

Eje m

plo

H.

Tratem os de calcular el determinante de la matriz

.M

at

em

at

ic

w

e)

3 0 0 3

0 3 0 3

0 0 3 0

3 3 3 0

f )

1— k 0 3

2 3 —X 1

1 1 1--À

g)

1 2 0 0

1 X 1 1

0 0 y i

1 1 1 1

Ix
A=

a x

a\ a xI

a

\ a a

Las operaciones elementales que se realizan se indican adecuadamente encima del signo de igualdad.

4. Dem ostrar, sin necesidad de calcularlos, que los siguientes determinantes son nulos: a) 1 1 2 -2 1 3 4 5 6 7 4 5 6 7 8 3 -3 -4 5 6 7 8 9 e) b) X 4 z l2 22 32 42 y 3 t 22 32 42 52 2x + 3y 17 2z + 3í 32 42 52 62 42 52 62 72

c)

sen2 a sen2 b sen2 c

1 1 1

eos2 a eos2 b eos2 c

X

a
X

a a
X F}-F2

X

a
X

a a x —a
= X

a a

a
0

x a —x

a x —a

—a

a a —x

a x —a
d) 1 2

3 2 3 4 5 6

a

a —x

= x [x (x — a) —a(a —x )] — a [a (x — a) —a(a —x )] — = (x - íj) [ x 2 + xa - a2- a2] = (x - a)(x - a)(x + 2a)

3 4 5

5. Sabiendo que los números 58.786, 30.628, 12.831, 80.743 y 16.016 son todos divisibles por 13, demostrar que el determinante de la siguiente matriz es también divisible por 13:

2.3.

D E T E R M IN A N T E D E U N P R O D U C T O D E M A T R IC E S . C A L C U L O D E D E T E R M IN A N T E S D E O R D E N n

0 A = 8 1 6.
2

6
8

El primer resultado que queremos probar en esta sección es que el determinante de un producto de matrices cuadradas del mismo orden es el producto de los determinan­ tes de cada una de ellas. Para probar este resultado mostraremos primero que las operaciones elementales con las filas de una matriz pueden expresarse mediante multiplicación por matrices adecuadas. Estudiaremos cada operación elemental por separado. a) Si multiplicamos la fila i de la matriz A —(a¡j) i j=l n por un número real c no nulo el resultado es el mismo que si multiplicamos la matriz A por la izquierda por la matriz

0 6

7 0

Dem ostrar que (A B )' = B 'A ' siempre que las multiplicaciones anteriores tengan

sentido. 7. a) Dem ostrar que si A es una matriz cuadrada de orden n, y r es un número real \rA\=rn\A b) U tilizar a) para decir cóm o cambia el determinante de una matriz de \. orden n si los signos de todos sus elementos se cambian. 8. a) b) c) Una matriz cuadrada A se dice antisimétrica si A = — A 1 . D ar un ejemplo de una matriz antisimétrica de orden 4. (.Sugerencia: utilizar l.b)). ¿Es cierto el resultado de la parte b) si A es de orden par?
1 x
y

o \
E=
-Fila i

.c

om

Dem ostrar que si A es antisimétrica y de orden impar su determinante es nulo.

0
Columna i

ic

a1 em at
En efecto:

9.

Dem ostrar que

«i

bi

=0 es la ecuación de una recta en el plano que pasa

w

w

a-, b por los puntos A 1= ( a 1 b j y A 2 = (a2, b2). ,

.M

/'
EA =

at

/ «ll

«12

' ••

« n al ln\

/«n

*12

«m \

w

Los siguientes ejercicios se refieren al m étodo de demostración por inducción. 10. 11. n+ 1 Demostrar la fórmula 1 + 2 + 3 + - ■+ n = ------n. n (n + \ )(2 n + l) Demostrar la fórmula l 2 + 22 + 32 + - ■+ n ¿ = --------- ----------.

«Í1

«¡2

• •

«¡n

can

cai2

cain

• Fila i

\

\ «n i

«n 2

«nn

«n 1 1

a. 2 wn

«„„/

12. Un polígono se denomina convexo si las líneas que unen dos cualesquiera de sus vértices están en el interior del polígono. Demostrar, mediante el m étodo de inducción, que la suma de los ángulos interiores de un polígono convexo de n lados es 180(n —2). 13. Deducir una fórmula para calcular

b) El resultado de intercambiar las filas i y k de la matriz A = ( a iJ)i J = 1 „ es el mismo que si multiplicamos la matriz A por la izquierda por la matriz

£ = y demostrarla mediante el método de inducción. 14. Si A es una m atriz triangular inferior de orden 3 cuyos elem entos son núme­ ros reales, todos los elementos de su diagon al principal son iguales y A 2 = /, dem ostrar que A es I ó — /.
Columna i Columna k

En efecto: / l 0 0 ••• 1 EA = 1 ••• 0

\ '/

«1 1

a l2

‘ ■

A ln \

«ii

«12

• ■ «ln \
-Fila i

a¡ i

a i2

'

^ in

«u

a k2

«fcn

Las matrices E que aparecen en cada uno de los casos anteriores reciben el nombre de matrices elementales. Observar que toda matriz elemental se obtiene a partir de la matriz identidad realizando la operación elemental correspondiente a su caso. Así, por ejemplo, la matriz elemental del caso b) se obtiene intercambiando las filas i y k de la matriz identidad. Son ejemplos de matrices elementales las siguientes:

o
la matriz

a kl

a k2

-

a kn

«¡i

a¡2

■’

:
a»i a n2 ■ am ¡

«Ù. : «nn/

-Fila k i

/l
E= 0
\

0 o'
0 1 1 o E=

«.i

a n2

1/2 0
0 1

/>
E= 0 0 \0

0 1 0 0

-2 0 1 0

°\
0 0 1/

0

c) El resultado de multiplicar por c la fila i de la matriz A — (aij)ij =1¡2....n y sumárselo a la fila k es el mismo que si multiplicamos la matriz A por la izquierda por

Puesto que toda matriz puede reducirse a una matriz escalonada mediante una sucesión de operaciones elementales, se tiene el siguiente resultado: 0 E=
-Fila k -Fila i

R e su ltad o 1

em

Columna i

Columna k

at

»/ y ,'
.M
En efecto:

a1

.c

om

T o d a matriz cuadrada A puede reducirse mediante una sucesión de matrices elementales E u E 2, E k a una matriz escalonada B tal que Ek - E 2E 1A = B

ic

at

E j e m p l o A.

La matriz

U NIVERSIDAD DE L A REPUB LIC A F A C U L T A D O " TNGEÍ’ TERIA
D E P A R T A M F . N TT O !’ .■ tí

w

h

\
0 0

w

/ «U

«12

«ln \

w

A= «¡1 «i2

D O C U M E N T A C I O N M O N T E V I D E O

Y

B I B L I O T E C A

- U R U G U A Y

EA =
a kl a k2

\

1/

se transforma en la identidad mediante la siguiente sucesión de operaciones elementa­ les: annJ /1 3 0 1 1 l\ F2- 3F, /l 0 2 -5 1 1' -1
f2 <->F3 ^

\ «n l

an2

2 0 Io
F 3-------------- ►

1 1 -1
F 3 + 5F2

1 0

2 1 0

1 1

1 -5

Í^3


2 1 0 l\ 1 1
j\

V \

CClfi

C liçi

C@ i2~^~^k.2

C in~^~& & kn

1 0 0

2
1 O

l '

/l
F i - F¡

2

0’

1
0 l o

1

0 1 0

0 0 1

0 O

0

0

^

«n i

« n2

«un

/

P o r tanto, podemos escribir la igualdad

P r o p o s ic ió n 3_______________________ o\ /1 o 0\ /I O 0\ I o 0 1 o 0 0 1 10 0' -3 1 0 ¡A = I Demostración. Puesto que A es invertible puede reducirse a la identidad mediante una sucesión de operaciones elementales; por el resultado 1 existen matrices elementa­ les E lt E 2, ..., E k tal que Ek- - E 2E 1A = I 2 4 1 2
E JE M P L O D.

/ 1 - 2 o\ / i o - i \ n o
0 1 o 0 1 o

o\ /1 o
0 1

Si A es una matriz invertible, A puede factorizarse com o un producto de matrices elementales.

0 1 -1

\o

0 l / \o 0

l / \o 0

1/ \o o 1/4/ \ o 5 1 / \ 0 1 0 / \

0 0 1;

que el lector puede comprobar.
E je m
plo

B.

L a matriz

A=

P o r tanto, A = E ± l E 2 1---Ek 1 y cada una de las matrices E j 1 es una matriz elemental debido a la proposición 2. ■ Si A es la matriz del ejemplo A se tiene: 1 0 0 \ " 7 1 0 0 \ M /1 0 0 \ “ 1/ I o

se transforma en una matriz escalonada mediante la siguiente sucesión de operaciones elementales:
F1- 2 F l

'2 0

1 0

iF i

1
0

1/ 2 '
0

001
010/

010
\ 0 5 1/

loi

0

- y i o - n -1 0 1 -1 I 01
o' 1/ 0 0\ ll 0 \0 0 1 0 \00 1 \ /1 2 0 0 0 10 1/

o

\0 0 1/4 / \ 0 0

a1

.c

P o r tanto:

om

/ 1 0 0 \ / 1 0 0 \ / 1 0 0 \/ 1 0 0\/I

em

0

1

-2

l/

10

0

at

ic

1/2 0

1

0

1

1/2

1 /\o 0 1

T eorem a 4 Si A y B son matrices cuadradas del mismo orden, \AB\ = \A \ \\B

T o d a matriz elemental posee una inversa, que es también una matriz elemental.

w

w

P r o p o s ic ió n 2_

w

.M

at

Demostración. T o d a m atriz elem ental E se obtiene a partir de la identidad mediante una operación elemental. M ediante la operación inversa de la realizada, que es también una operación elemental, E se transforma en la identidad. I /0 0 0 1 1\ 0

E je m p lo C.

L a inversa de E = /I

^^
0 0\ es 5 1/

es /1 0 \0

L a inversa de E = 0 0\

I

es ella misma. L a inversa de \0 para el lector.

0 10

1 0 . L a com probación se deja - 5 11

Demostración. La demostración la realizaremos en tres etapas. Etapa 1. Si A es una matriz elemental E el resultado es cierto. Para probarlo estudiamos cada uno de los posibles casos de matrices elementales. En el caso a), \EB\ = c\B\ por la propiedad 3 de la sección 2.2; además, \ \ = c y, por E tanto, \EB\ = c\B\ = \E \. \\B En el caso b), \EB\= — \ \ por la propiedad 4 de la sección B 2.2; además,|£|=— 1 por la misma propiedad y, por tanto, \EB\ = \E \. \\B En el caso c), |EB| = |3 por la propiedad 6 de los determinantes; además, £ = 1 J| '| por la misma propiedad y, por tanto, \EB\ = \E \ también en \\B este caso. Etapa 2. Si A es invertible, por la proposición 3 podemos escribir A = E 1E 2---Ek, donde cada E¡ es una m atriz elemental. A plican do repetidas veces el resultado obtenido en la etapa 1 se tiene: \AB\ = \E1E 2- E kB\ = \E1\\E2- E kB\ = - - = \E1\\E2\--\Ek\ B = \\ = \E1E 2---Ek\ B = \A \ \\ \\B

Etapa 3. Si A no es invertible, por el teorema 3 de la sección 1.4, el rango de A es inferior a n y, por tanto, | 1 = 0. En este caso tam bién \AB\ = 0 ya que A puede /| escribirse de la form a A = E ¡ E ¡ ... E¿A', donde las E ¡ son matrices elementales y A ’ tiene una fila de ceros. P o r tanto, \AB\ = \ E [E i ... E kÁ B\ = \E[\\E£ ••• \E \\A ’ k '5| = 0, ya que A B tiene tam bién una fila de ceros. ■ E j e m p l o E. El teorem a sobre el determinante de un producto es útil para

columnas y utilizar las propiedades de los determinantes estudiadas en la sección anterior, hasta convertirla en una matriz triangular. Restando la primera fila de cada una de las restantes se tiene:
X

a

a
0

a • ■
0 0

a —x calcular algunos determinantes. El determinante de la matriz l b 2+ c2 A= \ ab ca ab c 2 + a2 be ca be a2 + b2 I \ 14,1 = a —x

x —a
0

x —a

a —x

0

0

x—

Sumando a la primera columna todas las restantes se tiene: n — l)a
0

puede calcularse fácilmente escribiéndola com o un producto de dos matrices de orden 3. En efecto: Ib A= a \0 y puesto que b a 0 se tiene que \A\=4a2b2c2 * * * c 0 a 0 c = — 2abe b y b c 0 a 0 c 0 a = — 2abe c 0 a 0 \ Ib c c a 0 c 0\ a \A = „\

a x —a
0

a
0

a
0 0

0

x —a

= ( x - a ) ',- 1[jc + ( n - l ) a ]

om

b¡\ 0

bj

0

0

0

••

X —

em

at

ic

a1

Nota. Ver el ejemplo H de la sección anterior, donde se ha calculado este determinante para n = 3.

.c w w w .M
b

La demostración por inducción también puede aplicarse para calcular determinan­ tes de matrices de orden n. Expondremos este m étodo calculando el determinante de la matriz

at

1
Xi

i x2
X\

i

" *3 *3 • '

1
X2

La segunda parte de esta sección está dedicada a dar algunas sugerencias relativas al cálculo de determinantes de matrices de orden n y de matrices de orden elevado que pueden reducirse al cálculo de determinantes de matrices de orden inferior. Comenzamos con el determinante de la matriz de orden n:
/X [ a a a a a ■ ■ ■ ■ a a a

A =

x\

n—

1

1

x 2

-

1

x3

-

1

*r7

que se conoce en la literatura matemática con el nombre de determinante de Vandermonde. Multiplicando cada fila por x ¡ y restándosela a la siguiente se tiene: 1 x 2- x-V1 , , 1
X-> a 3 — X ,1

X
a

x

■■

1
X „ - X i

\a

a

a

X

Ki(xi,

x„) = \An\= 0

x 2(x 2

x x)

x 3( x 3- x l )

X 'K - X l )

El desarrollo de \An\ por una cualquiera de sus filas o columnas no conduce a ningún resultado positivo. L o más adecuado es realizar operaciones elementales con sus filas o

0

X !T 2(X2- X , )

* r 2( * 3 - * l )

•••

x ; _2( x „ - x i )

1

1
*3

i

x2
—{x2 ^ l ) 'C * 3 X l ) ........(■*" ^ l)
.n-2

••
Yn —2

La fórmula D 6 = 3D 5 — 8D4 se denomina fórmula de recurrencia y nos permite calcular D 6 conociendo D s y D A. La misma fórmula de recurrencia aplicada a D s y D4 nos da: D 5 = 3D4 —8D3, P o r tanto: D 6 = 3[3D 4 - 8D3] - 8[3 D 3 - 8D2] = 9D4 - 2 •3 • 8Z)3 + 82D 2 Puesto que D 3 = 3D2 — S D 1 se tiene finalmente que D 6 = 9[3 D 3 - 8D2] - 2 • 3 •8D3 + 82D 2 = 33[3 D 2 - S D J - 9 - 8D2 - 2 • 3 • 8[3D 2- 8 D J + 82D 2 = [3 4 - 32 • 8 - 2 • 32 •8 + 82]Z )2 + + [ - 3 3 ■8 + 2- 3 -8 2] D 1= - l \ D 2 + m D l £>4 = 3D3 —8D2

■ 2 V „ - i (X 2, X3, ..., Xn )

v.n- 2 *3

xn

k= 2

f i

(X* - * l )

donde el símbolo f j significa el producto de todos los factores que aparecen variando k de 2 a n. D e la misma manera se deducirá la fórmula

Vn- i ( x 2, x 3, ..., x„) =

k= 3

n (xk~x2)

V „ - 2( x 3, ..., x„)

Se tiene que 3 4 3 = 9 -8 = 1 y D L= 3 D,

Se deducirá de aquí que Vn( x íf x 2, ..., x j es el producto de todos los factores de la form a (x k— xj) con k > j , es decir:

2

.c

om

por tanto: D 6 = - 71 1 + 168 x 3 = - 7 1 + 504 = 433 * E J E R C IC IO S 2.3 1. Encontrar una sucesión de matrices elementales E lt E 2, ..., E k tal que E k - E 2E 1A sea una matriz escalonada, donde:
/
1

a1

V„(x i,..., x„) =

w

P o r ejemplo, para calcular 3 2 0 0 0 0 observamos que 4 2 D fi = 3D< —2 0 0 0 00 34 23 02 00 0 0 0 0 4 0 3 4 2 3 =3D <-8Z>4 4 0 0 3 4 0 2 3 4 0 2 3 0 0 2 0 0 0 0 0 0 0 0 0 4 0 3 4 2 3

w

w

Finalmente mostramos un m étodo para calcular determinantes de orden elevado siempre que se puedan relacionar con determinantes de orden inferior del mismo tipo.

.M

at

em

*

*

*

at

ic

n frk -x j) 1ú J< k^ n

*

*

2 — 1 \

“>

A= ( ‘
\2

°
1

2
1

d) A=

/o

1

l\

1

0 1

1 0

\

1

/

2. Expresar las matrices del ejercicio 1 que sean invertibles com o un producto de matrices elementales. 3. U tilizar el teorema sobre el determinante de un producto para dem ostrar la fórmula
1

\A~l |= \\ A cuando A es una matriz invertible.

4.

Sean A, B y C matrices cuadradas de orden n y formemos la matriz fA C 0N B

8.

Dem ostrar que 1 n n n 2 n n n 3 ■■ n •■ n •■ n

D=

de orden 2n. á) Dem ostrar que A D-C 0 L /„ 0 0 B 9.

n

n

n

■■ n

b) 5.

U tilizar este resultado para demostrar que \D = \A\\B \ \. Calcular el determinante de la matriz b / A= a -b —c \ -d a -d c c d a -b d\ —c b a

Encontrar una fórmula de recurrencia para calcular 1 1 D n= 0 1 1 1 0 1 1

0 0 1

- • •• • •• •

0 0 0

0 0 0

0

0

0

0

1

1

hallando A A'. 6.

[Sol.: (a2 + b2 + c2 + d 2) 2.]

om a1 .c
1 + x 2y2 í + x 3y2 1 + x 2y 3

en función de D n_ l y D n_ 2. U tilizarla para calcular D s y D 9. [Sol.: D 8= 0 , D g = - 1 . ] 10. U na sucesión de Fibonacci (Fibonacci fue un matemático italiano del siglo XIII) es una sucesión de números que comienza con 1 y 2 y en la que cada número es la suma de los dos inmediatamente anteriores. Es decir, 1, 2, 3, 5, 8, ... Dem ostrar que el rc-ésimo término de la sucesión de Fibonacci coincide con 1 -1 \Fn\= 1 0 1 1 0 0 0 0 0 0 0 0

Escribir la matriz

w

com o un producto de matrices y calcular su determinante. [So/.: 0.] 7.

w

w

\

.M

l + x 3y 1

l + x 3> 3 >

at

A=

l + x 2y l

em

at

ic

Calcular los siguientes determinantes reduciéndolos al determinante de una matriz

0 - 1 1 1

triangular (todas las matrices son de orden n). a) 2 2 2 2 2 —x 2 2 2 2 —x • 2 2 2 b) 1 1 1 2 x+1 2 3 3 x+1 • n n n donde F n es una matriz de orden n. 11. 2 c) n 1 1 2 1 n 1 1 2 • 2 —x 1 2 3 ■ x+ 1 Calcular

0

-1

1

0

0

0

x— 1
1

1
X— 1

1
1

1
1

1

1

JC-1

1

1 n

1
■■ ■ n

1

1

x— 1

1 1 1

[Sol.: a) 2 ( - x f ~ \ b) ( x - l) ( x - 2 ) - - - ( x - n + 1). c) ( n - í f - l [ 2 n - 1].]

12. Calcular el determinante de la m atriz de orden n, A = (a y) , donde aij = \i — j\. (Sugerencia: hacerlo para n = 2, 3, 4, e intentar deducir la fórm ula general para dem ostrarla por inducción.)

13.

Calcular 1 1 1 1
X

que ocupa el lugar (i, j ) de la matriz A. Con esta notación la fórmula anterior se escribe de la forma
.-c2 X3

1 2 4

1 3 9

1 4 16 Sea

\A = an cn + a i2c¡2 + - - - + a ¡nc¡, \

’ CU 2.4. IN V E R S A D E U N A M A T R IZ . R E G L A D E C R A M E R co f (A ) = C = En esta sección comenzaremos dando una fórmula para calcular la inversa de una matriz utilizando la teoría de los determinantes. A continuación usaremos esta fórmula para resolver sistemas de ecuaciones lineales cuya m atriz de sus coeficientes es invertible. Comenzaremos dando una condición necesaria y suficiente para la invertibilidad de una matriz haciendo uso del concepto de determinante. T e o r e m a 1 ____ ______________________________________________________________________ Sea A una matriz cuadrada de orden n. Las siguientes condiciones son equivalentes:
C 21

C12
C 22

Cl C2 n

\C„l

la matriz de los cofactores de los elementos de A, que se denomina matriz de cofactores de A. Con esta notación se tiene que la matriz A C ‘ tiene com o valor \A en todos los \ lugares de su diagonal principal. Es decir,

a1

1) 2) 3)

A es invertible. rango (A) = n.

.c

om

aii AC' =

al2

aín\

I c1 1

c„i\

j\A\

? \

an

a¡ 2

\A \

<_

-Fila i

ic

em

\A\¿0.

W

an2

at

■/

?
Columna i

at

M I/

Demostración. Y a sabemos que 1) y 2) son equivalentes por el teorema 3 de la sección 1.4 (capítulo 1). Basta demostrar, por tanto, que 1) y 3) son equivalentes. Si A es invertible, A puede escribirse como un producto de matrices elementales de la forma A = E 1E 2---Ek debido a los resultados de la sección anterior. Puesto que el determinante de un producto es el producto de los determinantes se tiene que \ \ = \El \\E2\---\Ek\ A

w

.M

w

Si logramos probar que los términos de A C que no están en la diagonal principal son todos nulos, se tendría que A C = \A\In y, por tanto, A ~ 1= — C \A \ lo cual nos da una fórmula para calcular la inversa de la matriz A. La demostración completa de la fórmula anterior para calcular A ~ l se da en el siguiente teorema: Teorema 2 Si A es una matriz invertible se tiene que A~l = — C

La parte derecha de esta igualdad es no nula, ya que toda matriz elemental tiene determinante no nulo; por tanto, Esto prueba que 1) implica 3). En la etapa 3 del teorema 4 de lasección anterior se ha demostrado que si A no es invertible, M| = 0; esto prueba que 3) implica 1), ya que si \ \ es no nulo y A no fuera A invertible se tendría una contradicción. ■ Suponiendo que |/4|#0, nos proponemos encontrar una fórmula para calcular A ~ l . Si A = ( a ij)¡ -=1 „, del desarrollo de su determinante por la fila i-ésima tenemos que

M I = ( — 1)‘ + 'an \An \ +
El número c¡- = ( — l ) i+J'|/4 - , iJ|

( — l ) ‘ + 2a¡2\Ai2\ -1-(— l ) ‘ + ”ai„\Ai„ H \

w

Ml
donde C es la matriz de cofactores de A.

¡ = 1 , ..., n, j = l , ..., n, se denomina cofactor del elemento

Demostración. D e la discusión precedente se deduce que la dem ostración se completa si probam os que los elementos de A C ‘ que no están en su diagonal son nulos. Sea i#/' e intentemos calcular
a i l Cj l + a i 2CJ2 H --------1 a inc j n ■ -

P o r tanto:

/
C = co f (A ) =

1 1 6

3 3 -2

-1 -1 3

Esta expresión coincide con el desarrollo por la fila j del determinante de la matriz
/a l l a l2

\
P o r el teorema 2:
/

4

f l ln\

1

/

1/7

-6 / 7 3/7 -1 / 7

4/7 -2 / 7 3/7

an

a i2

. Fila í

B=
a il a i2 a ir

A~l = — C'=\\ A

3
- 1

3/7

Fila j

\
* * *

■1/7

(¡Com probarlo!)
\«n l

«nn I

que se obtiene de A sustituyendo la fila j por la i. Puesto que B posee dos filas iguales, | | B = 0 y, por tanto:
a i l Cj l + a i 2Cj 2 H -------- 1 a inc jn = 0 "

w

A = | -1
0

1
1

2 7

.M

1 2 o\

at

em

E j e m p l o A.

L a matriz

at

ic

si i # j, que era lo que queríamos demostrar.

a1

Notas. 1) U na matriz con determinante nulo se dice que es una matriz singular, de manera que una matriz invertible también recibe el nombre de matriz no singular. 2) Es conveniente que el lector se ejercite en el cálculo de inversas de matrices de orden 3 hasta el punto de que pueda calcularlas sin necesidad de escribir la matriz de los cofactores.
* * *

.c

om

U tilizando el teorema 2 pueden resolverse sistemas de ecuaciones lineales de la forma:
a l l x 1 + a l 2 x 2- l ------- ^ a l nx n = f) 1

w

3

w

fl 2 1 X l + a 2 2 X 2

-^ a 2„ X„ = b 2

es invertible puesto que 1 \A = \ -1 0 2 1 1 0 2 3

anlx 1+ an2x 2 H ---- h an x n= bn . n 1 0 0 2 3 1 0 2 = 1 3 escrito A x = b en notación matricial, siempre que A sea no singular o invertible. En efecto, por el teorema 2:
= 7#0

3 1

2 3

/cu
1
-

c 2í

■■ ■

cBl\

Ib Á

Para calcular su inversa comenzamos calculando la matriz de sus cofactores: 1
c i i = .

x= A

b = — C 'b = — \\ A \\ A
Cln C2n

1

2

- i
: ;
c t• = ? 12 —

2

1
2
C-> i — ■

3

= _ = i1
0

0
1 0

_

3

= 3 _ = i

-1
:i C(i= c 13 — _

1 1
2
= - 1 . = 1

0
1

w
b„cn\ bn cnj
Componente j

A iC u + 1 3 = —6 ; c2 0 3 = 3

b2c 2! + ••■+

0

1

1
'\ Á \

b1 l j + c

b2c2J-\ -------1 -

2 0
C31

1 2

—4

;

c32 —

1 0 -1 2
— 2 ; c33 —

1 2
-1 1

= 3 ^ 6 iC i„+ b2c2„-\-------1 b„c

Por tanto, para todo j = 1, 2, ..., n se tiene que = r ^ 7 Íb l c lj + b2c 2]+ - - - + b„c„j] \\ A

P o r el teorema 3:

Xj

8 1 1 1 4

3 0 2 0

0 1 0 0

0
8

3
2 - 1

0 = 4 1

0
-1 1

3
2 - 1

0

8

3
2

La expresión entre paréntesis es el desarrollo del determinante de la matriz an
Aj =

X l= 3 l

1

+
1

= - 1 2 + 13 = 1

4

0

bí b2
l 2n

ai\

2
i

8 1 1 4 3 0 2 0 3 0
2

0 1 0 0 8 1
1

0
2 8 1 - 1 1 0

1 0 1 2

0
0 -1 1 1

W i

■■ ■

Columna j

bn t

...

= 2

1

- 1

8

0 - 1

4

1

+
1

=

1 0 -8 = 2

4

por la columna j. H em os probado el siguiente resultado:
i

0 0
1 1

2 1 1 1

3
0 2 0

8 1

0 2 0 0 1 1 2

X, = ---TEOREMA 3 ( Regl a de Cramer) --------------------------------------------------------------3 - 1

1 0
1

3
0

8 1

0

- 1 - 2 2

- 2

=—

5 4

1

= —0
1

-4 5

=

0

om

a1

Si A es una matriz invertible de orden n, el sistema de ecuaciones lineales A x = Ti es com patible determinado y sus soluciones se calculan mediante la fórmula

4 0
1

5

.c

2
1

8 1
1

ic

at

1 0
1

2 = 0 1

3
2

8 1
=

em

w

donde A¡ es la matriz A en la que se ha sustituido la columna j por el vector b.

w

.M

w X J=U | '

■ . i

**= —

0 0

2-

3 +
2

8 1

= 16 + (3 — 16) = 3

at

0

4

0
C.

4

Eje m

plo

w

Para determinar si el sistema hom ogéneo
x

1+

3x 2 +

x

3

+

x

4

= 0'

Eje m

plo

B.

E l sistema

2x 1 + 2x 2 + 2x 3 = 0

2 x t + x 3= 0
2-Xj -(- 3 x 2 = 8
x \

+ x 3= 1
= 1

— x 1— x 2 — x 4 = 0 tiene soluciones no triviales basta calcular el determinante de la matriz A de sus coeficientes. Si |/1|#0 solamente posee la solución trivial y si \A = 0 posee soluciones \ no triviales, ya que en este caso r ( A ) < n debido al teorema 1. Puesto que
1

2*2 — X ¿

*i + x 4= 4

tiene solución única, ya que 3
2
0 - 1

1 2 1
0

1
0 0 - 1
f

1 2f

3
- 1 0 - 1

1
0 1 0

+ 1
- 1
0 - 1 F2= F t P.2

2 1 0 1

3
0 2 0

0 1 0 0 - 1

0 2 0
= —

2

1-

f

3

- 1

3
2 0 - 1

0

2

P.6

2
- 1

0 1

= —4 + 3 = — 1 # 0
1

- 1

1

el sistema posee infinitas soluciones.

E JE R C IC IO S 2.4 1. Hallar las inversas de las siguientes matrices, calculando primero la matriz de cofactores (com probar los resultados): /l /l a) 3
1 1 0 - 1 0

8.

D ada la aplicación lineal T: IR3 1— IR3 mediante T(x, y, z) = (x + 2y + z, 3x + y ► + 2z, 3x + 2j^ + 2z), demostrar que T es invertible y encontrar su inversa.

9. Sea A una matriz invertible de orden n y triangular superior. Dem ostrar que A ~ 1 es también triangular superior. 10. a) Resolver los siguientes sistemas de ecuaciones utilizando la regla de Cramer. x ¡ + 2 x 2— x 3 = 7
2

3\
1

3\
- 1

2
3

2

d) 4 /

0 \ 0

4
1

0

b)

2 x j + 3 x 2 — 5x3—2 = 0 3 xt — x 2 + 2x 3 + 1 = 0 5 x ! + 4 x 2 —6 x 3 — 3 = 0

x !+ x 2 + x3 = 6 )

°/ c)

x x —x 2 + 3x 3 = — 1 ) 2xj + x 2 + 4 x 3 + 8 x 4= — 1 Xj + 3x 2 — 6 x 3 + 2x 4 = 3 3xí — 2 x 2 + 2 x 3 — 2 x 4 = 8

2.

Demostrar que si A =

d/

con M |#0, A

* = — ---- ad — cb

d -c

-tí a

utilizando el

teorema sobre la inversa de una matriz. 3. 4. 5. Dem ostrar que ( A ~ l )‘ —{ A ') - 1 . Probar que |cof(/4)| = M|"_1. H allar la inversa de las siguientes matrices:

2x¡ — x 2 + 2x 3 = 4 11. H allar los valores de m para los que el siguiente sistema posee soluciones no triviales:

a)

0 0 0

1 0 0

0

0

a=£ 0 ’ b *0

at

0 0 0

1

1 0 1 0 0 0 0

1 1 1 0

1 1 1 1/

w

1

w

\o

o
2
2 " -1 \ "-1\

.M

1-1 1-1 1- 1

ic

) -1 /1 1 1 A b / 1 1

1-1

c)

/1

0

0

a1

0

.c

om

2

x —_ + z = 0 v

x + my — z = 0 x+y+z= 0

a b

-b
0

at

em

12.

H allar la inversa de cada una de las siguientes matrices: b) 11
0 0 0

w

6.
a)

a)

í cos a \sen a

— sen a cos a

\ —sen a c)

cos a sen a

sen a — cos a

H allar la inversa de las siguientes matrices de orden n: 11 1
2 22 2 22

cos a sen a

•••

b)

11 +x
1

1

i i
1+ x

1 1 1

0
0

1
0

2
1

2 »-2
2«-3

i +x

\

i0

cos a /

U n polinom io de grado n con coeficientes reales es una expresión de la forma / (x ) = a 0 + a ,x + a 2 x 2H -------ban n con 0 ,-elR, 7 = 0 , 1 , ..., n y a „ # 0 . x , 13. Encontrar un polinom io / de grado 2 tal que /(1) = 2 ,/ ( — 1) = 4 y / (3 )= 1 6 .

\o

o

o

1+ x

7. E ncontrar los valores de a y Z para los que las matrices siguientes son inver> tibles: a) I a+ 1
1 1 1 1

14. Dem ostrar que n + 1 valores distintos de la variable x determinan de manera única un polinom io de grado n. [ Sugerencia: reducir el problema a demostrar que el determinante de una cierta matriz es no nulo y observar que esta matriz es la que origina el determinante de Vandermonde.] 15. Dem ostrar que si un polinom io de grado n tiene n + 1 soluciones reales distintas ha de ser el polinom io nulo. [N o t a : x 0 elR es solución de / si / (x o) = 0.] 16. D ecir para qué valores d e 'a es invertible la m atriz A = (aiJ , donde ai} = i —j ) si i > j y a¡j = a en el resto de los casos.

b)

i2

0

0

\

c)

a- 1
1

0 f l +1
\
,0 1

-1
fl- 3

^ 0

a+ 2

2.5.

R A N G O D E U N A M A T R IZ . R E S O L U C IO N D E S IS T E M A S C O M P A T IB L E S E IN D E T E R M IN A D O S

E j e m p l o B.

En la matriz 2 2
0

4
1

6 1

\

En la sección 1.2 del capítulo 1 definimos el rango de una matriz com o el m ayor número de sus vectores columna que son linealmente independientes. En el teorema 1 de la misma sección se demostró que el rango de una matriz coincide con el número de peldaños de su matriz escalonada. En esta sección utilizamos los determinantes para obtener el rango de una matriz. Demostraremos también el sorprendente resultado de que el rango de los vectores filas de una matriz coincide con el rango de sus vectores columna. D ada una m atriz A de orden m x n se denomina menor de orden k de A al determinante de cualquier m atriz de orden k form ada con los elem entos de la intersección de k cualesquiera de sus filas y k cualesquiera de sus columnas. E j e m p l o A. Dada
1 2 2 2

A=

0

1 los menores de orden tres son: 2 2 4 2 2
6

1

3

4/

0 0 1 ,
1 1 3

0 0 1

2
0

4
1

6 1

2
0

4
1

6 1

1 1 4

1

3

4

1

3

4

que son todos nulos. Sin embargo, el menor de orden 2: 3
1

4\
1

2
0

4
=
1

A=

-1 1

2

0 2/

un menor de orden 3 es /
- 1

\

2 I

.M

at

1

2

0

1

2

2

0

0

- 2

em

2

1

1

- 1

2

1

= 0

4

5

at

ic

1

2

3

4\

1

2

4

1

2

4

a1

.c

es no nulo y, por tanto, es un menor básico de A; sus columnas básicas son la primera y la tercera y sus filas básicas son la primera y la segunda. Es fácil encontrar otros menores básicos de orden 2 de esta matriz.

om

El rango de la matriz A del ejemplo B es 2, ya que

2 4
I 2 6 \

l l

1 0 1

2 3\
1 1 4/ /l
0 0 1 0 0

w

w

w

y menores de orden 2 son, por ejemplo:

0

0 1

1

1
4 I

> )

0

¡¡o

h

i
0 O 0 O

2 3\
1 1 1 V

/

1
- 1 2

2

3
1 1

4\
1 1 0 1

/

1
- 1 2

2

3
1 1

4\

l 1
2 4

3

l1

3

= - i

y
\

\

12

0 2

12

0 2

2

2

= -4

0

1 1 0

\

I1
0

/

Los menores de orden 1 de una matriz son sus elementos. Si A es una matriz cuadrada de orden n solamente hay un menor de A de orden n que coincide con \A \. En este mismo caso los menores de los elementos de A son menores de orden n — 1. Sea A una matriz no nula; siempre podemos encontrar un único número R que satisface las siguientes condiciones: 1) 2) A posee al menos un menor no nulo de orden R. Todo menor de A de orden mayor que R es nulo.

que coincide con el número R de la matriz A. Esto nos hace pensar en la certeza del siguiente resultado: T e o r e m a 1 ___________________________________________________ Dada una matriz no nula, el número R anteriormente definido coincide con su rango.

Cualquier menor de A de orden R que no es nulo se denomina menor básico; las columnas de la matriz de las que proviene este menor básico se denominan columnas básicas y a las filas se les denomina fdas básicas.

Demostración. El número R anteriormente definido no se altera mediante trans­ formaciones elementales en la matriz; la demostración de esta afirmación se deja com o ejercicio para el lector (ver el ejercicio 7 al final de esta sección).

Así pues, el número R para una matriz A no nula coincide con el número R para su matriz escalonada B. L a matriz escalonada B es de la forma

Demostración. D ebido a las propiedades de los determinantes se puede suponer, sin pérdida de generalidad, que el menor básico ocupa las R primeras filas y las R primeras columnas de la matriz A, donde r(A ) = R. Es decir:
*11

ni

n2

n3

n„
a lR a ln\

c
A= *R 1 aRR

Y

a mR

a mn j

donde |C|/0. Sea Uj, j = 1, 2, ..., n, el y'-ésimo vector columna de la matriz A. Para dem ostrar 1 ) basta probar que cualquier vector V j es com binación lineal de los vectores U ¡, U 2, ..., U R. donde las matrices sombreadas pueden ser no nulas. El núm ero R para la m atriz B no puede ser superior a p, ya que cualquier m enor de orden p + 1 incluiría una fila de ceros. P o r otro lado, ha de ser igual a p, puesto que podemos tomar las p primeras filas y las columnas n l 5 n2, n3, ..., np para obtener Si l ^ j ^ R , ~v¡ es uno de los vectores lineal de ellos. Si j > R ~v2, ~vR y, por tanto, es combinación

consideramos el sistema homogéneo au ■■ ■ a iR :
a RR

aij\ :
a Rj

A A
*2

/ o\
0

.c

om

0
=

at

1*0

ic

a1

(I)
\ 0/

.M

at

0

em

\ami

am R

amj/ \ x j /

P o r tanto, R coincide con el número de peldaños de B; por el teorema 1 de la sección 1 . 2 este número coincide con el rango de la matriz. ■

de m ecuaciones con R + 1 incógnitas. Puesto que el rango de la m atriz de los coeficientes de este sistema es R, que es menor que el número de incógnitas, el sistema tiene infinitas soluciones. D e todas estas soluciones siempre podemos elegir una de la forma

w

w

w

/ 1

2 1

o\ es 2 , ya que

lX ld l\ l\
' x, d,\
1 2

E j e m p l o C.

El rango de la matriz A =

\
3
0 0

2

1

1 2

2 1 1

0

1 2

0

0

1

2

Vi

3 5 C2-2C¡

_3 -5

3 5

II O

_

w W
= -3 / 0 . con dj / 0 , ya que si todas las soluciones tuvieran d¡ = 0 el sistema (I) sería equivalente al sistema
« u ■

dR

3 5

3 5

2

1

3

3

3

a ir\

<x1 \ TEOREMA 2 (Teorem a del menor básico) Sea A una matriz no nula. 1) Cualquier columna de A es combinación lineal de sus columnas básicas. 2) El mismo resultado es cierto para las filas de A.
a Rl ' a RR

K I ii
a ml a mR /

que únicamente posee la solución nula. Sustituyendo esta solución en (I) tenemos la igualdad
M il • ’

o equivalentemente: 2cx +3c2=

1 '1
^

2d1+ 3d1 = 4 d1+ d2 = 0

a lR

c1 + c 2 = l j
f l l¿

/o \
a Rl a RR a Rj

lo cual es un buen ejercicio para el lector. * * *

dR

\ a ml

a mR

^m j

w
/ «i;\

\0 / C o r o l a r io

3 _________________________________

Esta igualdad puede escribirse de la forma / a u\ ^ « ir ^ + dj

El número máximo de columnas linealmente independientes de una matriz es igual al número máximo de sus filas linealmente independientes.

Demostración. C o r o l a r io 4

r(A ) = riA').

a RR

Rj

.M

at

di vj = - T j v r

dR

em

at

ic

que coincide con dí U 1-\ ------^dR~vR + d j V j = 0 . Puesto que d j # 0 se deduce que

a1

.c
Demostración. Si A es una matriz cuadrada con |/4|=0, r ( A ) < n (teorema 1 de la sección 2.4); por el teorema 2 se obtiene el resultado deseado. P o r otro lado, si ~ u T 2, - , v ' n son los vectores columna de A y T)n= oc1 + a 2 F2 H v T V1 — + a „ _ 1 F „ _ 1 realizando las operaciones elementales: C n — otiCi — a 2 C 2 — sobre sus columnas se tiene que «u \A = \
2

om

y.,/

\ R °ml

W

El determinante de una matriz (cuadrada) es nulo si y sólo si una de sus filas (columna) es combinación lineal de las restantes filas (columnas) de la matriz.

lo cual prueba que ~Üj es combinación lineal de ..., ~vR. El resultado por filas se obtiene de considerar la matriz traspuesta A ' de A, que ha de tener el mismo rango que A debido al teorema 4 de la sección 2.2. ■
Eje m
plo

w

w

w

— (x l C n_ x .n_

D.

L a matriz

«12 «22

« l,n —1 « 2 ,n- 1

0 0

«21

=0

A=

1 \ 3 1 1 1

«ni

an 2

«n,n-l ¡2 3

0

l\
0

\ 0/ 4
2 1

determinante de la matriz \o
1

es nulo, ya que su tercera

1

tiene rango 2 puesto que

3 1

=2 — 3 = — 1. P o r tanto, las filas tercera y cuarta son las restantes? * * *

combinación lineal de sus filas primera y segunda. Estas combinaciones lineales se encuentran resolviendo los sistemas (1, l) = Cl(2, 1) + c2(3, 1)

y

(4, 0) = d1(2, l ) + d2(3, 1)

Los- resultados que hemos obtenido sobre el rango de una matriz se aplican a continuación para resolver sistemas compatibles e indeterminados.

Ej e m p l o F.

Deseamos resolver el sistema
Xj + 2x2= 1

E j e m p l o G.

El sistema 2 x y — 3x 2 + 5x 3 + 7x 4 = 1

2x¡ + x 2 + 3x3 = 2 3 * ! + x 2 + 5x 3 = 3 /1 Sea A 2 \3
2

(I)

4xj — 6 x 2 + 2x 3 + 3x 4 = 2 2xj — 3x 2 — l l x 3 — 15x4 = 1

° \ 3 5
1 2 1 1 2 1

/ 1

2

0

1

\ la matriz

1
1

la matriz de sus coeficientes y A =

2 13
\3 1 5

2
3/

es com patible e indeterm inado, ya que r(/l) = 2 = r (/ l)< 4 = número de incógnitas 5 7 (¡com probarlo!). Puesto que = 1 # 0 podemos suprimir la tercera fila y pasar al 2 3 segundo miembro de las igualdades las incógnitas Xj y x 2 para obtener 5x 3 + 7x 4 = 1 — 2 x t + 3x 2 2x 3 + 3x 4 = 2 — 4xj + 6 x 2 Resolviendo por la regla de Cramer se tiene 1— 2xj + 3x 2 7 3 = 3 — 6 x j + 9x 2 — 14 + 28xx — 42x2 =
1

ampliada. Puesto que

2

1

3 =0 y
2

= —3, r(,4) = 2, y puesto que la cuarta

3 1 5 columna de A coincide con la primera, r (A ) = 2. P o r el teorema de Rouche-Frobenius, el sistema es com patible e indeterm inado. Puesto que A tiene com o básicas sus dos primeras filas, por el teorema 2 la tercera debe de ser combinación lineal de las dos restantes; por tanto, la tercera ecuación del

a1

.c

om

sistema no introduce nuevas soluciones en (I). Podem os suprimirla del sistema y tenemos el sistema equivalente: Xj + 2 x z = 1 2 x 1+ x 2 + 3x 3 = 2

x ,=

2 —4 x ¡ + 6 x 2

= 22xj — 33x 2 — 11 5
2

at

ic

at

Poniendo a la derecha de las igualdades las incógnitas correspondientes a las columnas no básicas se tiene

em

1— 2xj + 3x 2 —4 x 1+ 6x
= 10 — 2 0 x j + 30 x 2 — 2 + 4 x í — 6 x 2 =
1

w

w

.M

2x j + x 2 = 2 — 3x 3 Resolviendo este sistema por la regla de Cramer en función de x 3 se tiene:

w

x i + 2x2 = 1

= — 16xt + 2 4 x 2 + 8 Haciendo x 1= c 1, x 2 = c 2 se tiene: (x ls x 2, x 3, x 4) = (c1; c2, 22c 1— 33c2 — 11, — 16Cj + 24c2 + 8 ) =
= (0 ,0 ,

-11, 8) + C j(l,

0,

22, - 1 6 ) +

c 2(0 ,

1, - 3 3 , 24)

2

— 3x 3
1 2 1 2 2 2 1 1

1

1—4 + 6 x 3 -3

x, =

= 1 —2 x , Resumimos a continuación los pasos a seguir para resolver un sistema compatible e indeterminado: 1) Detectar un menor básico de A. Suprimir las ecuaciones que corresponden a filas no básicas de A. Poner a la derecha de las ecuaciones aquellas incógnitas que corresponden a columnas no básicas de A. Resolver por la regla de Cramer.

—3x 3

2

— 3x 3 — 2 -3

x ,=

2) 3) 4)

Haciendo x 3 = c se tiene (x j, x 2, x 3) = ( l — 2 c, c, c) = ( l, 0 , 0 ) + c( — 2 , 1 , 1 )

En la sección 1.2 (capítulo 1) se demostró que todo sistema hom ogéneo e indeter­ minado tiene k = n — r(Á) soluciones linealmente independientes de manera que cual­ quier otra solución del sistema es com binación lineal de las anteriores (véase la proposición 3 de la citada sección). Para terminar esta sección daremos una nueva demostración de este resultado. Sea /4x = 0 u n sistema hom ogéneo y sea R = r(/1). Podem os suponer, sin pérdida de generalidad, que un menor básico de A está en su parte superior izquierda. Resolvien­ do A x = 0 con las reglas dadas para resolver sistemas compatibles e indeterminadas se tiene el sistema equivalente:
Ü 1 1X 1 +

P o r tanto, (zí , z2,

zR) es solución del sistema «ii* i + •••+ í,irX r = 0 |

a R ix i

+•■•+

í í r r - x:J = o ( {

que se ha obtenido de (I) poniendo x R + 1 = 0 , ..., x„ = 0 , com o corresponde a las n — R últimas componentes de ~ e0. Puesto que el determinante de la matriz de este sistema es no nulo (¿por qué?), el sistema solamente posee la solución trivial. P o r tanto, ^ 0 = 0 y tenemos
e = u R + 1^*1 H \-u„e„-R

+ ° I R XR = — a l,R + lXR + l

a l nX n 1

:
amlx l +

:
+ a mRx R =

:
«m, R + l x R + 1

:
~ a mnx n )

u> que era lo que deseábamos demostrar. E JE R C IC IO S 2.5
1

Sea U J= (vj l , vJ2, ■■ vJR), j = 1, ..., n — R, la solución que se obtiene de (I) haciendo x R+j ■, = 1 y x R+k = Ó si k=£j, k = 1, 2, ..., n — R, en la parte derecha del sistema. Los vectores
R+i

.

Encontrar, mediante menores, el rango de las siguientes matrices: ¡2 -1 3 5
1

a)

-2

4\

b)

(l
2

2
1 1

3^
0

c)

n 3

2

\

om

? j = (vn , Vj2, ..., vJR, 0, ..., 0, 1, 0, 0),
7

4 - 2
\2 — 1

1 7
8 2

1

/

= 1, ..., n — R, son linealmente independientes ya que el rango de la matriz
i’ l l
V21

ic

a1

\1

- 2 /

i 4 0/

.c
d)

•>

V 1R V2R

em

V22

0

1

... 0

_M en or básico de orden n — R

at

l >12

/4
8

3

-5

2

3\
2

6 - 7 4 3 - 8 2 3 1 2 - 5

at

es n — R. Falta demostrar que cualquier otra solución de A x = 0 es combinación lineal de
e

w

w

n - R , 1 Vn - R , 2 ■ ■ Vn - R , R >

.M

4 4

7

O O

1

1

i s 2 ,..., e „ ~ r , .
Sea

w

2. e = (wl5 u2, ..., uR, uR + 1, ..., u„)

Encontrar el rango de la matriz /l 2 a —1
- 1

2\ 5

a

otra solución de A x = J). Consideremos el vector ? 0 = ~ e - u R+ El vector ~0 es de la forma e 4. é '0 = (z 1 z 2, ..., zR, 0 , 0 , ..., 0 ) , com o fácilmente puede comprobarse. Además, e* es solución de A x = 0, ya que es 0 combinación lineal de soluciones de este mismo sistema (proposición 2 de la sección a) --------- u„?„ _ R

\i

io

-e

i/
son siempre linealmente depen-

para los distintos valores del número real a. 3. Dem ostrar que n + 1 vectores cualesquiera de ff dientes.

Probar que los siguientes sistemas son compatibles e indeterminados y resolverlos. 3 x 1 + 4 x 2 + x 3 + 2x 4 = 3
6x

b)

4 x 1+ x 2 — 2x3 + x 4 = 3
x 1— 2x2 — x 3+ 2x4 = 2 2xj + 5x2— x 4= — 1 3xj + 3 x 2— x 3— 3x4 = 1

! + 8 x 2 + 2 x 3 + 5x 4 = 7

9 x t + 12x2 + 3x 3 + 10x4 = 13

1.2).

c)

X, + x , + x.

1
E=

x 1+ 3x2= 0

\
-fila i -fila j ;

2 x x + 6 x 2 + 3x 3 = 3

5. Estudiar mediante menores y aplicando el teorem a de Rouche-Frobenius la compatibilidad de los siguientes sistemas: a)
x + 2y + 2z = 3 y+2z= 2 3x + 2 y = 1 5x + l y + 6 z = 2 — b) 2x + z = 0

\

...

demostrar que el número R para E A coincide con el número R para A. Notas. En este problema, A es una matriz cuadrada. Las demostraciones de estos resultados deben realizarse sin utilizar el teorema 1. Este problema completa la demostración del teorema 1 de esta sección.

4x — 6y = 2
2 x + \2y + z = 7

c)

2x + y = 2 2x + 3z = 4 x + 2y + 5t = 0

d)

x + 5^ + 2z = 3 2y + 5z + 3í = 2 - 2 x + 4y + 2 r = 1

2.6.

D E T E R M IN A N T E S Y P E R M U T A C IO N E S

Presentaremos a continuación una nueva fórmula para calcular el determinante de una matriz cuadrada. Esta nueva fórmula requiere el concepto de permutación. Recibe el nombre de permutación de los números naturales 1 ,2, ..., n toda

.c at ic a1 at em

om

6.

D ado el sistema de ecuaciones lineales
3 x , + x 2 — 8 x 3 + 2x 4 + x 5 = 0 2 x j — 2 x 2 — 3 x 3 — 7x4 + 2 x 5 = 0 x t + l l x 2 — 12x3 + 34x4 — 5 x 5 = 0 x 1— 5x 2 + 2 x 2 — 16x4 + 3x 5 = 0

aplicación biyectiva del conjunto {1, 2, ..., n} en sí mismo. Las permutaciones se representarán con las letras griegas a, / y, ... ?, E j e m p l o A. Las permutaciones de los números naturales 1 y 2 son a: {1, 2 } i - * { l , 2} dada por oc(l) = l y a(2) = 2, y / : {1, 2} i »{1, 2} dada por >9(1) = 2 y ? — 0 (2 )= 1 . A continuación escribimos las permutaciones de los números naturales 1, 2 y 3: a,: a2: a i( l ) = l , a2(l ) = 2, a x(2) = 2, a t(3) = 3 « 2(2 )= 1 , a2(3) = 3

encontrar el mayor número de soluciones que sean linealmente independientes. Indicar uno de estos conjuntos linealmente independiente de soluciones. 7. a) Sea E una matriz elemental de la forma

w

w

.M

w

a3: a3(l ) = 3, a4: « 4(1) = 3, a5: a s(l ) = 2, a6: a6( l ) = l , A l lector se le ha pedido sección 1.3.

a3(2) = l, a3(3) = 2 a4(2) = 2, a4( 3 ) = l « s(2) = 3, « s(3) = l a6(2) = 3, a6(3) = 2 2 de la

todas estas aplicaciones en el ejercicio

0
E=

o
b)

-fila i;

En el ejemplo anterior puede observarse que para escribir una permutación no es necesario escribir los elementos del conjunto inicial; basta con escribir ordenadamente la imagen de los elementos en su orden natural. Así, por ejemplo: a 3 = (3 1 2)

demostrar que el número R para E A coincide con el número R para A. Sea E una matriz elemental que se ha obtenido intercambiando dos filas de la matriz identidad; demostrar que el número R para E A coincide con el número R para A. Sea E la matriz elemental de la forma

y
«5

= (2

3

1)

c)

donde a 3 y o¡ 5 son com o en el ejemplo A.

Si llamamos Sn al conjunto de todas las permutaciones de meros naturales y a e S „ podemos escribir a = (a (l) a( 2 ) ••• a(n))

los

n

primeros nú­

Dada una permutación a de Sn, diremos que en a se ha realizado una inversión si se han intercambiado entre sí dos elementos de su imagen. El resultado de realizar una inversión en una permutación es, de nuevo, una permutación. E j e m p l o B. y = (14325) es una permutación que se obtiene 8 * * * de a = (54321)reali­

Observar que esta «sum a algebraica» posee 6 elementos y que cada uno de sus términos tiene 3 elementos, de manera que cada uno de estos tres elementos proviene de distinta fila y distinta columna que los restantes. Además, el subíndice de las filas está siempre ordenado, mientras que el subíndice de las columnas forma una permuta­ ción de los elementos 1, 2 y 3. P o r tanto, los 6 términos anteriores pueden escribirse de la forma a.la(l)a2a(2)“ 3a(3)> aeS,

zando una inversión; a saber, se han invertido el 1 y el 5.

Sea ka el número de inversiones que es necesario realizar en la permutación a para transformarla en la permutación identidad; el número kx no es fijo para una permuta­ ción a € Sn sino que varía con el orden en que se realicen las inversiones. Sin embargo, , si por un procedim iento se ha necesitado un número par (im par) de inversiones cualquier otro procedimiento debe necesitar un número par (impar) de inversiones. P o r tanto, el número sig (a) = ( — 1 )*« que recibe el nombre de signatura de oí, no depende de la forma en que se realicen las inversiones. Este resultado puede encontrarse demostrado en cualquier libro de teoría de grupos. Si ka es par, la signatura de a es + 1 y entonces diremos que a es una permutación par; si ka es impar, la signatura de a es — 1 y entonces diremos que a es una permutación impar. E j e m p l o C. Dada la permutación a = (53142) podemos invertir el 1 y el 5 para obtener a! =(13542); a continuación invertimos el 2 y el 3 para obtener a 2 = (12543); finalmente invertim os el 3 y el 5 para obtener a 3 =(12345), que coincide con la permutación identidad. P o r tanto, sig (« ) = ( - 1 ) 3 = - 1 El proceso que hemos seguido para hallar la signatura de a puede esquematizarse de la siguiente forma: « = (53142) (13542) * * * (12543) — (12345)

afectados de un signo «p o s itiv o » o «n ega tivo». Para determinar el signo de cada uno de estos sumandos observamos que los términos positivos corresponden a las permuta­ ciones pares a¡, a2 y cc3 del ejemplo A y los términos negativos corresponden a las permutaciones impares a4, a5 y a 6 del ejemplo A. P o r tanto: *13 *2.1 *31 “ 22 *31 “ 23 — X (sig («))a 15,(1)022(2)^33(3)
asSx

“ 33

Este resultado sugiere el siguiente:

om a1 .c

T e o r e m a 1 ____________________ Sea A = (aiJ j = l ....„ una matriz de orden n; si definimos )¡ & {A )= se tiene que \A = A(A). \ (SÍ § (a))a la(l)a 2 a(2 ) ' “ an < ) an

em

at

ic

w

w

w

.M

at

cteS„

Antes de demostrar el teorema 1 necesitamos los siguientes resultados: L e m a 2 ________________________________ _ _ _____________________________________

Si A es una matriz ( a ¡ / ) , j = e n la que la y-ésima fila es una suma de la form a aij = b¡j + b'¡j, 7 = 1 , 2 , ..., n y escribimos / " ii ai 2 ■

■ aln\
■ bin ; B

/ «ii

ai 2

■aln\
■ b'in

Pasamos a continuación a encontrar una fórmula para el determinante, que utiliza el concepto de permutación. Si comenzamos con matrices de orden 3 sabemos que ai i a2i «3 i a12 a22 ü32 a l3 a23 — a l l a22a33~^a l2a23a31 + fll 3^21^32 a33 ~ a13a22a31 — ú12í,2la 33— fll l°23a32

B=

bn

b¡ 2

=

b'n

b'i2

\a„i se tiene que

an2

■ an „J

\ a „i

an 2

am

A (A ) = A(B) + A(B')

Demostración.

P o r la definición de A se tiene que

Puesto que la columna j se ha intercambiado n - j veces para llevarla a la última columna, se tiene que A ^ - M - ir ^ )

Á ( A ) = £ (sig(oí))aia(i)• ••aiX ■ am(n) = (i)■ ■
aeS„

=

X (sig (a ))a
aeS„

l a(l)'''

+

^ia(¿)] '' '«n5t(n) —

Observando que ( — 1 ) “ " = ( — 1 )" se tiene que A (/ y = ( — l ) - " +^A(5J = ( - l ) n+JA(Bj) .) Para calcular A (Bj) utilizamos la definición de A y se obtiene: A(B j)= £
aeS„ =n

= £ (sig (a))ala(1 )--A-a(¡)-••«»«(»)+ Z (sig ( a))a i « ( i ) " ’ bW ) " ' an«(») = = A (B ) + A ( F )

(*)

(sig c¿)blxW ---b „_ÍM n_ u .bnm)

L e m a 3 ------------------------------------------------------------Si A = (aiJ ¡ j = j ....„ y A j denota la matriz )
«11

ya que si a (n )# n , bn t(n = 0. T o d a permutación a e S n que satisface a(n) = n puede a ) interpretarse com o una permutación [ i e S n. í sin más que definir /?(/c) = a(/c), 1 ^ k ^ n - 1 ; «ln recíprocamente, si /?eS„_i podemos definir oceS„ ot(n) = n; además, sig (a) = sig (/?). Por tanto: tal que a(k), l^ fe ^ n - 1 y

« ¡j

0 •••

anj

•••

0

om

que se obtiene de A sustituyendo todos los elementos de la última fila por cero excepto el que ocupa la columna j, se tiene que

Y j (SÍ8 0 )^ la (l)"'^ n -l,p (n -l)
0eS„-

= b„„A(Bn n)

.c at ic a1

Puesto que bn = anj y B nn = A nj, se tiene que n
A( Bj ) = an A ( A nj) j

A ( A j ) = ( - l T +jan A ( A nj) J

donde A nj denota la matriz adjunta del elemento que ocupa el lugar (n, j).

at

em

w

.M

Sustituyendo este resultado en la fórmula (* ) se obtiene de resultado deseado.

Demostración. Comenzamos observando que si B es la matriz que se obtiene de A intercambiando dos columnas se tiene que A (B) = — A(/4); la demostración de este

resultado se pide en el ejercicio 3 al final de esta sección. Intercambiamos la columna j de A j con todas las columnas posteriores a ella hasta llevarla a la última columna de la matriz; se obtiene así la matriz

Demostración del teorema 1. Realizaremos la demostración mediante el m étodo de inducción. Si A es de orden 3 ya hemos com probado anteriormente que el resultado es cierto; el lector puede com probar que el resultado es también cierto si A es de orden 2. Supongamos que el teorema es cierto para toda matriz de orden inferior a n y sea A — ( a ij)i,j= una matriz de orden n. La matriz A puede escribirse de la forma / l1 2 « 1»
a 2n

w

w

\

fb u b2i

•’ ’

b ij-i b2, j — i

¿ 1, b2j

•••

b i,n- 1 K > •• a
1

b i„\ b2n

A=

\ « n l + 0 + — b0 0 + an2-\ ------b0
Aplicando repetidamente el lema 2 se tiene que

•••

0 + 0H------bfl nn J

c“

K < < o, E 6 % 3

^

\ o /» i i a2 i

• ■‘ '

0

0

0

b„n / au \ a2J

ai,j- i a2,j—1

al,j+ 1 a2.j+l

" "

al,n a2,n

A (A ) = A ( A 1 + A ( A 2) + - - + A (Aj) + ••■+ A(A„) ) donde A¡, j = 1, 2, ..., n, es como en el enunciado del lema. P o r el lema 3 se tiene que

lo

0

0

••

0

«ni

A(/l) = ( - i r í anlA (A nl) + ... + ( - \ r jan A ( A nj) + • • • + ( - I f a ^ A J J

Puesto que las matrices A n¡, j = 1, 2, inducción se tiene que

n, son de orden n - 1 , por la hipótesis de

CAPITULO 3

A (A ) = { - i r + í anl\Ani\ + - + ( - ^ n+j^j \Anj\+ - + ( - í ) 2na J A J = \ \ A donde la última igualdad se debe al teorem a 3 de la sección 2.2 (desarrollo del determinante por la última fila). Esto termina la demostración. I La fórmula del determinante resulta engorrosa cuando se trata de matrices de orden superior a tres si queremos utilizarla en el cálculo práctico. P o r otro lado, es bastante eficiente para realizar algunas de las demostraciones de las propiedades de los determinantes, que se expusieron en la sección 2 de este mismo capítulo. P o r ejemplo, la propiedad 1, que expresa que si una matriz tiene una fila (columna) de ceros su determinante es nulo, es fácil de demostrar. Basta observar que en todos los términos de A(/l) aparece un elemento nulo y, por tanto, \A = A (A ) = 0. Las \ demostraciones de otras propiedades se piden en los ejercicios al final de esta sección.

LA GEOMETRIA DEL PLANO Y DEL ESPACIO

E J E R C IC IO S 2.6 1. Dadas las permutaciones a = (23154) , £ = (13245) , .
7

3.1. 3.2. 3.3. 3.4. 3.5.

Rectas en un plano Rectas y planos en el espacio Distancias y ángulos. Producto escalar Figuras en el plano y en el espacio Areas y volúmenes. Producto vectorial

ic

= (53412)

a1 .M
La geometría es la rama de la matemática que estudia la forma y el tamaño de las figuras, así com o las trasformaciones que sobre ellas se ejercen. Depen­ diendo de que las figuras estén en un plano o en el espacio se obtienen las geometrías descritas en el título de este capítulo. L a antigua civilización griega poseía muchos conocimientos acerca de la geometría. Estos conocimientos fueron recogidos por uno de sus mejores expo­ nentes, Euclides, que los recopiló en un libro denominado Los elementos. La traducción de este libro, que llegó a Europa a través de la civilización árabe, ha sido la base de todo el estudio de la geom etría hasta finales del siglo XIX. Los elementos están basados en un sistema de verdades evidentes, denominadas axiomas, a partir de las cuales se deducen las propiedades de las figuras mediante un razonamiento lógico. Ejemplos de propiedades de las figuras son los siguientes: filas 1) Los ángulos formados por rectas perpendiculares entre sí son iguales.

k = (31856472)

¿ = (4321)

calcular la signatura de cada una de ellas y la signatura de J?°a, £ _ 1 y y ° P ~ l . 2. Indicar el signo de los términos a12a23 a31a ^ y ai 4 a 2 i a 3 2 a 43 en determinante de una matriz de orden 4. 3.

a) Dem ostrar que si / es la permutación que se obtiene de a intercambiando a(i) y ?

a(/c), i # k, se tiene que sig (/?) = — sig (a). b) Dem ostrar que si B es la matriz que se obtiene de A intercambiando dos columnas , se tiene que A (B) = — A(v4). 4. Dem ostrar que si B es la matriz que se obtiene de A multiplicando una de sus filas que A( B) = rA(A).

por r se tiene 5.

U tilizar el problem a 3 para demostrar que si A es una m atriz con dos

idénticas se tiene A(/1) = 0.

w

w

w

desarrollo del

at

em

at

.c

om

: H

N

129

2)

Las mediatrices de los catetos de un triángulo rectángulo se cortan en el punto m edio de la hipotenusa.

Si las rectas y l2 son perpendiculares, diremos que tenemos un sistema de coordenadas rectangulares o cartesianas. La primera componente se denomina abscisa del punto y la segunda ordenada. D e acuerdo con esta nomenclatura la recta l¡ se denomina eje de abscisas y l2 se denomina eje de ordenadas, escribiéndose también por O X y O Y, respectivamente. A la izquierda de O en la recta y por debajo de O en la recta l2 se toman medidas negativas. El punto de intersección O se denomina origen de coordenadas (figura 2 )

En el siglo XVII el filósofo y matemático francés R. Descartes introdujo la noción de coordenada de un punto; todo punto tiene una representación con respecto a unas rectas dadas que se cortan. Los trabajos de los matemáticos durante los dos siglos siguientes mostraron que las propiedades geométricas de las figuras pueden demostrarse más fácilmente Utilizando el sistema de represen­ tación mediante coordenadas cartesianas. Esta forma de estudiar la geometría se denomina geometría analítica. La geom etría analítica sustituyó a la geom etría de Los elementos de Euclides a finales del siglo x ix y actualmente es la forma más extendida de estudiar la geometría. L a geom etría analítica del plano y del espacio ocupará gran parte de nuestra exposición en este capítulo; dedicaremos también alguna sección a estudiar propiedades de las figuras desde el punto de vista euclídeo.

Dadas dos rectas en un plano que se cortan en un punto O, cualquier otro punto del plano queda determinado por dos números que reciben el nombre de componentes con respecto a las rectas dadas. Estas componentes se obtienen de la siguiente manera. Fijada una unidad de medida u en cada una de las rectas l l: l2, todo punto P del plano tiene com o componentes x e j i , donde x es la distancia, medida con la unidad u, del punto P a la recta l2 siguiendo una paralela a /t, e y es la distancia del punto P a la recta l x siguiendo una paralela a l2, midiendo la distancia con respecto a la unidad de medida u (figura 1 ).

.M

at

3.1.

RECTAS EN U N P L A N O

em

at

ic
U n plano dotado de un sistema de coordenadas se designa por R 2. O tra form a de tratar a los puntos de IR2 es considerarlos com o el extremo de un vector cuyo origen es el origen de coordenadas (véase la figura 3). El álgebra de los vectores se ha estudiado en la sección 1.2 del capítulo 1. La suma de los vectores iTj y tf2 es la diagonal del paralelogramo que tiene com o lados los vectores y ~ (véase figura 4.a)). El producto de un vector V por un número real c es v2

y )

w

w

w

a1

.c

om

Fig. 3

otro vector cuyo extrem o es el punto que tiene com o com ponentes c veces las componentes de IT; el vector cv tiene el mismo sentido que V si c es positivo y distinto sentido si c es negativo (ver figura 4.b)).

donde t es un número real. Si P = (p r, p2) y v = ( v 1, v2) cualquier punto (x, y) de la recta r se escribe de la forma (x, y) = (p u p j + tiv^ v2). Igualando componentes se tiene: Dados dos puntos P = ( x 1 y x) y Q —{x2, y2), se denomina vector P (), al vector con , origen en P y extremo en Q; sus componentes son

om

x = p 1 + tvl 'l y = p2 + tv2j que se denominan ecuaciones paramétricas de la recta r. E j e m p l o A. Para encontrar las ecuaciones paramétricas de la recta que pasa por los puntos P = {2, 1) y Q = ( — 1, 3) observamos que uno de sus vectores directores es P@ = ( — 3, 2) y puesto que pasa por el punto P = (2, 1) se tiene (x, y) = ( 2 , l ) + f( — 3, 2 ) o bien
X = 2 —

y, por tanto, es equivalente al vector que tiene com o origen O y extremo un punto R de coordenadas ( x 2 — x 1 y2 — yi);

w

w

w

.M

at

em

at

ic

P @ = ( x 2- x l , y 2 - y ¡ )

a1

.c

3í|

y = l + 2 rj

\

Q= (-1 ,3 )
i^, i i i i ■

i \ i

.

D ado un vector ~v, el conjunto de puntos tv, donde t es un número real, determina la recta que pasa por el origen de coordenadas y tiene a V com o vector director (ver figura 6 .a)). La recta r que pasa por el punto P y tiene a tf com o vector director se representa mediante el conjunto de puntos P + tv
Fig. 7

Nota. L a representación paramétrica de una recta no es única; en el ejemplo anterior podríam os tomar = tf com o vector director y Q com o uno de los puntos de la recta; se obtendrían en este caso las ecuaciones

Si v2 = 0, la ecuación general de la recta es x = p2. Estos casos particulares correspon­ den a rectas paralelas a los ejes de coordenadas (ver figura 8 ).

(x, y ) = ( - l ,

+

1

que representan la misma recta.

En la recta de ecuaciones paramétricas x = p i + tv1 y = p2 + tv2 podemos eliminar la variable real t despejándola en cada una de las ecuaciones e igualando los resultados; se obtiene . x -p i t— _y P2 E j e m p l o B. Para encontrar las ecuaciones cartesianas de la recta que pasa por el punto P = ( 2, 1) y tiene com o vector director ( — 1, 5) escribimos sus ecuaciones paramétricas

at

x -p l = y -p 2 Vi v2

em

at

y, por tanto:

ic w w .M
y eliminamos t: x —2 t= v2x - v 1 + v1 y p2- v 2p 1= 0 P o r tanto:
- 1

a1

.c

,

í

om

w

siempre que ^ y d2 sean no nulos. La igualdad anterior puede escribirse de la forma

y— 1 = _ 5~'

o bien 5x + _ — 1 1 = 0 y ax + by + c = 0 , que se denomina ecuación general de la recta en coordenadas cartesianas. Si 1^ = 0 , las ecuaciones paramétricas de una recta se escriben de la forma x = px y = p 2 + tvi Puesto que de la primera de las ecuaciones ya se ha eliminado el parámetro t, la ecuación general de esta recta es Puesto que fijados x e y este sistema tiene una sola solución en t, del teorema de Rouche-Frobenius se deduce que O tra form a de eliminar t en (I) es considerar que tenemos un sistema de dos ecuaciones con una incógnita t, mientras que x e j son constantes, es decir, el sistema —t = x — 5t = y — l J

Puesto que r\

- 1

j = l hemos de tener que

—1 ^

x—2 v- 1

= 1 , y esto es equivalente a

EJEMPLO C. ya que

Las rectas de ecuaciones 3x + 2> —7 = 0 y 6x + 4 _ y + l= 0 son paralelas,

- 1

x —2
= 0.

5

> '-1 * * *

Desarrollando este determinante se obtiene — que es el mismo resultado que obtuvimos anteriormente. y + 1 — 5.x + 10 = 0 Si las rectas están dadas en coordenadas paramétricas podem os estudiar su posición relativa pasándolas a coordenadas cartesianas. Sin embargo, también puede conocerse su posición a partir de sus coordenadas paramétricas, com o se muestra en el siguiente ejemplo.
Eje m plo

Dadas dos rectas en un plano pueden darse los siguientes casos: a) b) c) Las Las Las dos rectas se cortan en un solo punto. dos rectas son paralelas. dos rectas coinciden.

D.

Dadas las rectas de ecuaciones r i- (x, y) = ( 1 , 0 ) + f( — 1 , 2 ) r 2: (x, y) = ( - 2, l) + s ( - l , - 3 )

flj a2

bx b2

/O

En el caso tí) el sistema (II) no posee solución, y, por tanto, se ha de tener íiA a2 b/í¡ i \a2 b, b2 -C j —c 2

w

Rouché-Frobenius esto sucede solamente cuando

w

w

tendremos el caso a) si el sistema (II) posee una sola solución; por el teorema de

.M

at

r2 = a2x + b2y + c 2 = 0

(II)

em

r í = a1x + b 1y + c 1= 0

at

ic

a1

Si se conocen las ecuaciones de las rectas en coordenadas cartesianas podemos determinar su posición relativa, es decir, cada uno de los casos anteriores, estudiando las soluciones del sistema form ado por las dos ecuaciones. Si las ecuaciones son

.c

om

Figura 9

Finalmente, si las rectas coinciden el sistema (II) posee infinitas soluciones y, por tanto, se ha de tener que

ambas se cortan si y sólo si existe un único valor de t y un único valor de s para los cuales se obtiene el mismo resultado de x e y. P o r tanto, el sistema (1, 0) + í ( - l , 2) = ( - 2 , l ) + s ( - l , - 3 ) tiene solución única en t y s. Igualando componentes se tiene 1—1= — 2 — s i 2 í= l- 3 s J — t + s = — 3| 2í + 3 s = lJ

En los ejercicios no es conveniente m em orizar los resultados obtenidos, sino obtenerlos en cada caso mediante la utilización del teorema de Rouché-Frobenius.

Este sistema posee solución única, ya que
-1 1

E j e m p l o E. Las rectas (1, 2) + t( — 1, 4) y ( — 1, 0) + s(2, — 8 ) son paralelas o coincidentes, ya que (2, — 8 ) = — 2 (— 1, 4). Para determinar si son paralelas o coinci­ dentes escribimos el sistema que se obtiene de igualar las dos ecuaciones: l- r = - l + 2s — t — 2 s = —2 4í + 8 s = — 2

2

3

= —3 —2 = — 5 # 0

P o r tanto, las rectas dadas se cortan en un único punto. Para encontrar las coordena­ das del punto de corte encontramos los valores de t y s que satisfacen el sistema anterior y sustituimos en las ecuaciones de las rectas: -3 t= 1 -5 1 3 — 10 —2 " -5 2 ; -1 2 -5 -3 1 -5 1

2 + 4 t = —8 s Puesto que

=

0

tenemos que (1, 0) + 2( — 1, 2) = ( — 1, 4) ( — 2, l ) + ( — 1)( — 1, — 3 ) = ( — 1, 4)

-1
y puesto que

-2

Se trata, por tanto, del punto ( — 1, 4). Observar que solamente es necesario calcular el valor de t o el de s, pero no ambos, para obtener el punto de corte. El hallar los dos valores sirve de adecuada comprobación.

= 1,

om

-1
4 se tiene que

-2
-2

Supongamos que las rectas de ecuaciones

Q + sTT = ( q l , q 2) + s(vu v2)

.M

at

em

at

P + tü' = (p 1, p2) + t(uu u2)

ic

a1

.c

= 2 + 8 = 10#0

son paralelas o coincidentes. En el primer caso el sistema

rl

w

p 1+ tul = q 1+ s v 1 p2 + tu2 = q 2 + sv2

w

w

‘ 4

“ 2 8

- 2 |= 2 . -2 ,

(II I)

Las rectas, por tanto, son paralelas. * * *

no posee soluciones y en el segundo posee infinitas soluciones. En cualquier caso, aplicando el teorema de Rouché-Frobenius el rango de la matriz de los coeficientes de sus incógnitas ha de ser 1 y, por tanto, se tiene
Mi
u2 -V! -v2

Para terminar esta sección observamos que la ecuación
1 1

x ai

y a2 b2

Mi
= 0 <> U2

V1 V2

= 0

1

Puesto que los vectores u y ? son no nulos, por el teorema del menor básico (teorema 2 de la sección 2.5) se obtiene que u es una combinación lineal de tf, es decir: u =cv P o r tanto, los vectores u y ~ son proporcionales. v Recíprocamente, si u y V son dos vectores proporcionales, las rectas que los tienen com o vectores directores son paralelas o coincidentes.

determina una recta que pasa por los puntos A = {ai , a2) y B = (b 1, b2). Para probar este resultado observar que desarrollando el determinante por la primera fila se tiene:
«1 ¿1

a2
b2

1

—x
1

a2

1

at ¿>i

b2

+y

1

que es la forma general de la ecuación de una recta en coordenadas cartesianas; además, la recta pasa por los puntos A = (a1, a2) y B = ( b l , b2), ya que al sustituir x e y

por los correspondientes valores de A y B se obtiene un determinante con dos filas iguales.

7. Dem ostrar que la recta que pasa por los puntos P y Q tiene com o ecuaciones paramétricas ( l - t ) P + tQ

E J E R C IC IO S 3.1 1. D ados P = ( l , 0), Q = ( — 1,2), u = ( l , - 1 ) y ^ = (3, - 2 ) , hallar las ecuaciones paramétricas y cartesianas de las siguientes rectas, y dibujarlas: a) b) c) 2. Recta que pasa por P Recta que pasa por P Recta que pasa por Q y tiene com o vector director y tiene com o vector director y tiene com o vector director 2u. u + lf. u — 2v.

o

bien sP + tQ con s+ í = l

8.

Dadas las rectas secantes de ecuaciones a 1x + b 1 + c 1 = 0 y a2x + b2y + c2 = 0

com probar que para cada par de valores t, s la ecuación t(a1x + b 1 + c 1) + s(a2x + b2y + c 2) = 0 y (*)

Dem ostrar que la ecuación de una recta que pasa por los puntos P = (p u p2) y Q

= (<h> Í 2 ) puede escribirse de la forma <2 ~ P 2 / Í * y - p 2 = ---------( x - P i ) , Q1 - P 1 es una recta que pasa por el punto P de intersección de las anteriores y que todas ellas se obtienen así. [ N o t a : (* ) se denomina la ecuación del haz de rectas que pasan por P.}

si

q l - p 1¥=0

3.

Determinar la posición relativa de los siguientes pares de rectas y encontrar el

a) b) c) d) 4. a)

(x, y) = {2,l ) + í(l, 1) x+ y=l 2 x —y = 4 (x, y) = t ( - 1,2)

y y y y

(x, y) = ( l , 0) + s ( - 5 , - 5 )

Determinar ecuaciones paramétricas de las siguientes rectas, y dibujarlas: x — 2y = 5 b) 2x —y = 3 c) x= 3 d) y= 0

[ N o t a : El resultado no es necesariamente único.] 5. D ada la recta de ecuación ax + by + c = 0, demostrar que todas lasrectas paralelas a ella tienen una ecuación de la form a ax + by + c' = 0 con c’ e R. [N o t a : El conjunto de las rectas paralelas a una dada se denomina haz de rectas con la propiedad citada.] Encontrar la ecuación del haz de rectas paralelas a la recta que pasa por (1, 2) y tiene ( — 1 , 1 ) com o vector director.
6.

w

(x, y) = (1, 0) + s(2, 3)

w

w

(x, y ) = (2 , 0) + t ( - 2 ,

-4 )

.M

2x — y = 2

at

em

at

punto de intersección si se cortan:

ic
9. a) b) c)

a1

.c
U tilizar el problema anterior

om

[N ota : El número (q 2 — p2)/(c i —P i ) se denomina pendiente de la recta.] l

para encontrar:

La recta que pasa por (1, 1) y por la intersección de x + y = 2, 2x + y = 5. Ecuaciones del haz de rectas Ecuaciones del haz de rectas que pasan p or el punto (1, 4). que pasan por el punto (0, 0).

Encontrar las ecuaciones paramétricas y cartesianas de las siguientes rectas, com probando el resultado si se cree posible: a) b) c) Paralela a (x, y) = (3, 3) + í(2, 1) que pasa por (1,0). Paralela a 2x — y = 5 que pasa por (1, —2). Paralela por el punto ( — 2, — 3) a la recta que pasa por (1 ,0 ) y (0, 1).

3.2. R E C T A S Y P L A N O S E N E L E S P A C IO D e manera análoga a com o se hizo en el plano puede introducirse en el espacio un sistema de coordenadas de manera que todo punto del espacio quede determinado por tres números, que se denominan sus componentes. Basta para ello considerar tres rectas

que se cortan en un solo punto, que será el origen, y cualquier otro punto queda determinado por su «distancia» a cada uno de los planos que determinan dos de las rectas dadas tom ada paralelamente a la tercera (ver figuras 1 y 2 ).

*

*

*

Dados dos puntos P y Q en IR3, la ecuación de la recta que pasa por P y Q tiene com o ecuaciones paramétricas

P + t{Q -P)
Si las rectas dadas, que se denominan ejes de coordenadas, son perpendiculares, tenemos un sistema de coordenadas rectangulares o cartesiano. Cada punto del espacio queda determinado por sus tres componentes, que se denotan por (x, y, z) o ( x 1; x 2, x 3). Denotarem os por IR3 al espacio con un sistema de coordenadas rectangulares. T o d o punto P de IR3 puede interpretarse com o un vector que tiene com o origen el origen de coordenadas y com o extremo el punto P. L a suma de vectores y el producto de un vector por un número real tienen en IR3 la misma interpretación geométrica que en el plano (ver sección 3.1). Dados un punto P e R 3 y un vector tf e R 3, el conjunto de puntos que se representa de la forma P + tV donde í es un número real, determina la recta que pasa por P en la dirección de ~v. Si P = (Pu Pi> P i ) y = v 2 > v3) podemos escribir
x = Pi + tvi 1

ic

a1

.c

ya que uno de sus vectores de dirección es ~ = Q — P. P o r tanto, la ecuación paramétriv ca de una recta que pasa por P y Q puede escribirse de la forma ( l - t ) P + tQ o bien sP + tQ con s + í = 1.

w

w

w

.M

at

em

at

om

Dadas dos rectas en el espacio, existen cuatro posiciones en las cuales pueden encontrarse (ver figura 4). O bien se cortan en un solo punto, o se cruzan sin cortarse, o son paralelas en el sentido de que sus vectores directores son proporcionales o son coincidentes. L a posición relativa de dos rectas en el espacio puede determinarse estudiando el sistema form ado al igualar las correspondientes coordenadas de las dos rectas dadas y determinando si sus vectores directores son o no proporcionales en los casos segundo y tercero.

y = p2 + tv2 i z = p 3 + tv3 )

(1 )

E j e m p l o A. L a recta que pasa por el punto P = (l, 2, 3) y tiene a ~ v = ( — 1, 1, 2) com o vector director tiene com o ecuaciones paramétricas x = 1 —t Ì y= 2+ t z = 3 + 2í )
Figura 4

Eje m p l o

B.

Para determinar la posición relativa de las rectas (x, y, z) = (l, 0 , l) + r ( - l , 1 , 0 )

el sistema no posee ninguna solución. P o r tanto, las rectas dadas se cruzan o son paralelas. Puesto que sus vectores directores no son proporcionales (¿por qué?), ambas rectas se cruzan.

y
(x, y, z) = ( 0 , 1 , 2 ) + s(2 , 0 , 1 ) igualamos las correspondientes coordenadas para obtener el sistema ( 1 , 0 , l ) + t ( - l , 1 , 0 ) = (0 , 1 , 2 ) + s(2 , 0 , 1 ) o equivalentemente: — t —2 s = — 1 j t= l i — s= 1 ) Puesto que / -i r \
1 —2

Dada una recta en coordenadas paramétricas com o en (1), podemos despejar t de cada una de las igualdades para obtener: t= x ~Pi Vi t - y ~ Pl v2 t = Z ~ P3 v3

siempre que vlt v2 y v3 sean no nulos. Tenemos, por tanto, las igualdades x - p i = y - p 2_ z - p 3 V1 v2 v3

que se transforman en las tres igualdades siguientes: \ v2x - v 1 = v2p 1- v i p 2 y

0 = 2

om

v3y - v 2z = v3p2- v 2p3 v3x - v í z = v3p l - v 1 p3 cada una de las cuales es deducible de las otras dos com o se deduce fácilmente de la form a en que se han obtenido. P o r tanto, podemos escribir v2x ~ viy = v2p i - v 1 ) p2~ v3y - v 2z = v3p2- v 2p3¡ com o las ecuaciones de la recta dada, que reciben el nombre de ecuaciones carte­ sianas. E j e m p l o C. Para hallar las ecuaciones cartesianas de la recta que pasa por los puntos P = (l, 0, 1) y Q = ( — 2 , 1 , 2 ) escribimos sus ecuaciones paramétricas (x, y, z) = (l, 0 , l ) + í( — 3, 1 , 1 ). Tenemos, por tanto:

1 0 - 1

0

1 1

0 0

- 2 - 1

0 1

= - 1

- 2 - 1

0 1

w

- 1

- 2

- 1

- 1

- 2

- 1

w

w

ya que

.M

at

\

0

- 1

1

/

em

r

1

0

1

=3

at

ic

1-1

-2

-

a1

y

1\

.c

0

- 1/

Si alguna o algunas de las componentes del vector V son nulas (¡no todas pueden ser nulas!) se obtienen rectas en posiciones especiales con respecto a los ejes y planos coordenados. P o r ejemplo, si v1= v2 = 0, u3# 0 se obtiene una recta paralela al eje O Z que pasa por el punto P = (p l 5 p2, p3); esta recta tiene com o ecuaciones cartesianas x = Pu } ’ = P2

Si queremos encontrar las ecuaciones cartesianas de este plano, es decir, ecuaciones que solamente contengan x, y y z y no los parámetros t y s, basta con eliminar estos parámetros entre las tres ecuaciones de (4). Esto puede hacerse mediante el m étodo de sustitución, pero es más conveniente considerar (4) com o un sistema de tres ecuaciones con incógnitas t y s que, fijadas x, y, z, sólo posee una solución; por el teorema de Rouche-Frobenius se ha de tener

Se invita al lector a buscar otros casos particulares. * * *

Dados dos vectores u y ? en R 3 no proporcionales y un punto P de IR3 el conjunto de puntos que se representa de la forma Para que esto se cumpla es necesario que P + fu + sT ui con t y s números reales es un plano que pasa por el punto P y tiene u y F com o vectores directores.
P-TT + T “2

v1 X - P i v2 v-, ^3 y —p2 =
Z~P 3

0

u-,

om a1 .c

P o r la propiedad 3 de los determinantes (ver sección 2.2) para columnas se tiene
X
y —

ic

«1 « 2 «3

Vi V2 »3

U!
U2 «3

fl

P1 P2 = P3

em

V2 »3

0

.M

at

at

w

w

w

Desarrollando el primero de los determinantes por la última columna se tiene
Mi

u2
“ 3

v2 x — »3

«1 «3

»1

«i

Vi z—
m2

Vi V2 v3

P1 P2 P3

V3

u2

v2
“ 3

que podemos escribir de la forma ax + by + cz + d = 0 Esta ecuación recibe el nombre de ecuación cartesiana o en coordenadas rectangula­ res de un plano. Casos particulares de esta ecuación son, por ejemplo, x = — d o z = 0. El primero es un plano que contiene a todos los puntos de la form a ( - d , p 2, p3) con p2, p 3 cualesquiera números reales y, por tanto, es un plano paralelo al plano determinado por los ejes O Y y O Z que pasa a distancia —d del origen (ver figura 7). El segundo es el plano determinado por los ejes O X y O Y (ver figura 7). Se invita al lector a tratar de visualizar geométricamente otros casos particulares de la ecuación cartesiana .de un plano.

Si P = (p 1 , p2, p3), « = ( « ! , U2, u3) y v' = (v l , v2, v3) la ecuación del plano que pasa por P y tiene u y V com o vectores directores puede escribirse con las igualdades x = p l + t u 1+ s v 1 ) y = p 2 + tu2 + sv2
Z = P 3 + tU 3 + SV3 )

(4)

que reciben el nombre de ecuaciones paramétricas del plano considerado.

¿1
Planos paralelos Planos que se cortan en una recta

E j e m p l o D. Las ecuaciones paramétricas del plano que pasa por el punto P = (1, 1,0) y tiene com o vectores directores u = ( — 1, 0, 2) y tf = (l, 3, 3) son x = 1 —í + s 1 y = l+ 3 s 1-

Figura

em

Su ecuación cartesiana es
- 1 0 2 1

at

ic

a1 w .M at

z = 2t + 3s )

La posición relativa de dos planos puede determinarse a partir de sus ecuaciones, utilizando el teorema de Rouché-Frobenius para determinar el número de puntos en común que ambas poseen. U n estudio de este tipo se realiza en los dos próximos ejemplos.
E j e m p l o E. Para hallar la posición relativa de los planos de ecuaciones 2x + 3y — z = 1 y — x — 2 y + z = 0 estudiamos el sistema

x —1 y -í

3 3

.c

om

w

z

w

2x + 3y — z = O —x —2 y + z = 0 J Puesto que

Tenemos, por tanto: x —1 y -í z + 2x — 2
= —

- 1 0 2

1

x —1 y- 1 z
0 0

1

1

3 5

y - 1 z + 2x — 2 rI

3 3

3 5

2 j

3 ^

-1 \ i j =

/ l

2 j

3 - 1 1 ' . 2 1 o

< 3 = número de incógnitas

= — 3z — 6 x + 6 + 5y — 5 = — 6 x + 5_y — 3z + 1 * * * el sistema tiene infinitas soluciones. Puesto que ( ^ | es un menor básico de la V- 1 —2 / matriz de los coeficientes, las soluciones dependen de un solo parámetro y, por tanto, los planos se cortan en una recta. Para determinar la ecuación de esta recta escribimos el sistema en la forma

Las posibles posiciones relativas de dos planos en el espacio son las siguientes (véase figura 8 ): a) b) c) Los dos planos se cortan en una recta. Los dos planos son paralelos. Am bos planos coinciden.

2x + 3y = 1 + z i — x — 2 y = —z j

y lo resolvemos utilizando la regla de Cramer:
1

y, por tanto, el rango de la matriz ampliada es 3. Esto nos lleva a deducir que no existen soluciones del sistema anterior y, por tanto, los planos dados son paralelos.

+z —z -2 —2z + 3z
-= 2 — z

x=

2

3

1

-1 - 2
2 1

Observar que en el ejemplo F los vectores directores de la segunda recta son combinación lineal de los vectores directores de la primera recta, ya que ( 1 , 2 , - 1 ) = (1,4, 0 ) + ( 0 , 1 , - 1 )

+z —z —2 z + 1 + z
^ 1

y
(2 , 1 , 1 ) = 2 ( 1 , l , 0 ) - ( 0 , 1 , - 1 ) = z —1 . Este resultado es cierto en general: si dos planos son paralelos, los vectores directores de uno de ellos son combinación lineal de los vectores directores del otro y el recíproco también es cierto. La demostración de este resultado se pide en el ejercicio 7 al final de esta sección.
E j e m p l o G. Tratemos de hallar el plano paralelo al de ecuación x + y + z = 0 que pasa por el punto P = ( 1, 1, 1).

—1

Haciendo z = t, se tiene (;x, y, z) = ( 2 — í, í — 1 , t) = ( 2 , - 1 , 0 ) + í ( - l , 1 , 1 ) que son las ecuaciones paramétricas de la recta intersección de los dos planos dados.

.c

om

Escribimos el plano dado en ecuaciones paramétricas; para ello basta con determi­ nar tres de sus puntos que no estén alineados; por ejemplo: ¿ = (0 ,0 ,0 ), B = (l, - 1 , 0 ) , C = (0, 1, - 1 )

E j e m p l o F.

Dados los planos de ecuaciones paramétricas

ic

a1 em at

Estos puntos no están alineados, ya que los vectores u = Á B = (1, — 1, 0) y F = I ? = (0, 1, - 1 )

(x, y , z ) = { 1 , 0 , l ) + í(l, 1 , 0 ) + s(0 , 1 , - 1 ) (x, y, z) = ( 0 , 0 , 3) + Kl, 2 , — l ) + m(2, 1, 1)

w

.M

at

1

+ í = /+ 2m 1

t —l —2 m = — \ t + s — 2l — m = 0 —s + l — m = 2

w

das obtenemos el siguiente sistema:

w

tratamos de determinar su posición relativa. Igualando las correspondientes coordena­

no son proporcionales (¿por qué?). Puesto que el plano dado pasa por el punto A = (0 , 0 , 0 ) y tiene u y V como vectores directores su ecuación paramétrica es (x, y, z) = (0 , 0 , 0 ) + í(l, — 1 , 0 ) + s(0 , 1 , - 1 ). C om o vectores directores de un plano paralelo a éste pueden tomarse u y ? y debido a que el plano pedido pasa por el punto P = (l, 1, 1) sus ecuaciones paramétri­ cas son

t + s = 2l + m > 1 —s = 3 — l + m ) Puesto que

0 -1 —2 1 -2 -1 1 1 - 1/

Fi-F ¡

/I 0 lo

0 -1 1 -1 -1 1

2 1

0 -1 f3-f2 0 1 -1 0 \ 0 o /I

2\ 1 0/

(x, y, z) = (l, 1 , l) + í(l, - 1 , 0 ) + s(0 , 1 , - 1 ) Su ecuación en coordenadas cartesianas es
1 0 0 1 0 - 1

^
<
■ f-' 'C r* C)

x —1

1

0 1 - 1

x—1 x + y -2 z—1 = z — \ + x + y — 2 = x + y + z —3

el rango de la matriz de los coeficientes del sistema anterior es 2. P o r otro lado:
1 1 0 - 1 0 1 - 1 0 2 1 0 0 - 1 0 1 - 1 1 2

=

- 1

y- 1
z —1

= 0
0

^ £■ £ . ■
& Lj O

;’ W O Q *'* £ « z

S

¿ * “

= 3

es decir, x + y + z = 3.

# ?#1# <

5 O 5 £ « ü 3 Q £ s x s

O tra forma de resolver este problema es utilizando el resultado del ejercicio 8 al final de esta sección; en él se pide demostrar que las ecuaciones de todos los planos paralelos al plano de ecuación ax + by + cz + d = 0 pueden escribirse de la forma ax + by + cz + d' = 0 , donde d1 toma valores en los números reales. Aceptando este resultado, la ecuación del plano que se busca es de la form a x + y + z + d’ = 0; el valor de d' se calcula imponiendo que el punto P = ( 1, 1, 1) sea un punto de este nuevo plano; por tanto:
1

2. Dados los siguientes pares de rectas en IR3, determinar su posición relativa y si se cortan, encontrar el punto de intersección: a) b) c) (x, y, z) = ( - l , 2, l) + í(4, 3, 2) (x, y, z) = (0, 1, 5) + í(l, 3, - 2 ) 2x + 3y —z = 3l x — 3y = 4 J y x + y= 2 y - z = —1 J y y | (x, y, z) = (0, 1,0) + s(l, 3, 2) (x, y, z) = (5, 5,3) + s(4, 1, 0)

+ 1 + 1 + d' = 0 .

3.

Hallar la ecuación de la recta paralela a la de ecuación 3x — y + z = l l x + y — 3z = 0J

La ecuación del plano buscado es x + y + z —3 = 0 que pasa por el punto ( 1 , 1 , 1 ). que es el mismo resultado que se obtuvo anteriormente.

4. D e todas las rectas que pasan por el punto P = (0, 2, - 1), hallar la que corta a las rectas de ecuaciones
O
b s e r v a c ió n

1.

Dados dos planos de ecuaciones ax + b y + cz = d

( 1 , 1 , 2) + t(2, - 1 , 0 )

y

om

a'x + b'y + c z = a c’z d' ambos determinan una recta si y sólo si a b V
*

(5)

(0 , 1 , l ) + s( —3, 1 , 2 ) 5. Dados P = (l, 2, 3), Q = ( - 1, - 2 , - 3 ) , R = (0, 1, - 1 ) , u = ( 0, 1, - 1 ) y tf = (5, 1, 2), hallar las ecuaciones paramétricas y cartesianas de los siguientes planos: a) b) c)
6.

at

ic

a1

.c
c\
c)

^

em

Plano que pasa por P, Q y R. Plano que pasa por P y R y es paralelo a la recta que pasa por Q y tiene u —IT com o vector director. Plano que contiene a i? en la dirección de u + 2V y 2u+~v. Determinar, si es posible, la intersección de los siguientes pares de planos en IR3: x

P o r tanto, dos ecuaciones de la forma que aparecen en (5) son también ecuaciones cartesianas de una recta siempre que se cumpla la condición ( 6 ).
O
b s e r v a c ió n

2. Son numerosos los diferentes ejercicios que pueden hacer­ se referentes a rectas y planos en el espacio. A l lector se le invita a que realice todos losejercicios propuestos al final deesta sección y quetambién realice algunos de su propia cosecha. Es conveniente también que, siempre que sea posible, se realicen adecuadas representaciones geométricas de las rectas y planos que aparecen en un proble­ ma.

w

w

w

.M

"

at

a) b) c)

y + z = l y 2x + 2y — 3z = 4
t ( l , 1, — l ) + l)

(x, y, z) =

s(0 ,

1,

- 2 ) y (x,

y,

z) = ( 0 ,

1, 0 ) +

/(0 ,

1, —

l)

+

m(2, 3, 5)

(x, y, z) = (2, 3,

+ (0, 1, 2) + s(3, 1, - 5 ) y x - 6 y + 3 z + l = 0

7. Dem ostrar que dos planos son paralelos o coinciden si y sólo si los vectores directores de uno de ellos son combinación lineal de los vectores directores del otro.
8.

D em ostrar que las ecuaciones de los planos paralelos al plano de'ecuación ax + by + cz + d = 0 pueden escribirse de la forma ax + by + cz + d' = 0 con d' un número real.

E J E R C IC IO S 3.2 1. D ados P = ( 1, 1, -1 ), Q = ( 0, 1,2), u = ( - 1 , 2 , 0 ) y tf = (l, - 1 , -1 ), hallar las ecuaciones paramétricas y cartesianas de las siguientes rectas en IR3, y dibujarlas: a) b) c) Recta que pasa por P con vector director u —~v. Recta que pasa por P y Q. Recta que pasa por Q con vector director 3ü\
7t:

9. Escribir las ecuaciones paramétricas y cartesianas de los siguientes planos y rectas en IR3: a) Recta que pasa por g = (0, 2, 1) y es paralela al plano 3x —z + 2 = 0

y al plano que pasa por P = ( l , 0, 1), Q y el origen.

b)

Plano paralelo a la recta r: ( 2 , l , 0 ) + í(l, 2 , 1 ) por el punto Q y que contiene al punto (1, 3, 0).

Si los puntos P y Q están en IR3 y tienen com o coordenadas P = (Pu P 2 , P3) Q = ( q i. «2, q3) aplicando el teorema de Pitágoras a los triángulos rectángulos P Q S y P S R se obtiene el siguiente resultado:

c) d)

Todas las rectas que pasan por P y son paralelas a n y, entre ellas,la que corta a r. El plano que pasa por R = ( 2, 1, 1) y contiene a la recta 3x + y — z = 2] — 2y + z = l

d(P, Q) = v/(<?i - P i ) 2 + (q 2 - P 2 ) 2 + (q 3 ~ P 3 )2

(véase figura 2 )

e) /) g)

La recta que une R con la intersección de s y el plano x — y — 1. H az de rectas que une R con los puntos de s. H az de planos que pasa por R. [Sugerencia: generalizar el problema 8 de anterior.]
1 1

Q =(<h, q2 q3 , ) la sección

x al by

y a2

z
«3

10.

Dem ostrar que
1

= 0 es la ecuación de un plano que pasa por los

b3

con respecto a un sistema de coordenadas rectangulares, del teorema de Pitágoras se deduce que la distancia de P a Q se puede calcular mediante la fórmula d(P, Q) = ■ j U h ~ P l ) Y+ ( < h - P i ) 1 (ver figura 1) ||tr||=v / ( 3 - l )2 + (4 + l ) 2 + ( - 5 - 2 ) 2 = v / + 25 + 49 = v /78 ' 4 * * * E j e m p l o A. — 5), es La longitud del vector v = Afe, donde A = ( 1, - 1 , 2) y B = {3, 4,

w

P = ÍP i,P 2 )

,

< = (<7i, < 2) 2 7

w

w

Dados dos puntos P y Q en el plano, de coordenadas

.M

at

3.3. D IS T A N C IA S Y A N G U L O S . P R O D U C T O E S C A L A R

em

at

ic

a1
D a d o un vector T = A É en el plano o en el espacio se denomina longitud de tf y se T designa por | t| a la distancia entre A y B. Palabras sinónimas de longitud de un |f | vector son módulo de un vector y norma de un vector.

.c
La longitud de un vector posee las siguientes propiedades:
1) 2)

1 c \ C2 C3 puntos A = (al , a2, a3), B = (b u b2, b:

om

|| | = | | | | , donde c es un número real y || denota el valor absoluto de c. cF | c | tT | c ||tr+7Ki|tr|| + ||ir| |.

La segunda propiedad se denomina desigualdad triangular y geométricamente se expresa diciendo que cualquier lado de un triángulo es menor que la suma de los otros dos. Esta propiedad puede demostrarse utilizando la ley del coseno, a saber: \W+v\\2 = \ u \2 + \\v\\2-2\\u | |tf | eos £ (u, V ) \ \ || |

E j e m p l o B. F = ( — 1, 1, 1) en

El coseno del ángulo que form an los vectores u = ( 1, 1, 1) y es eos (u , ~ ] v (u ,F )
1

- (— 1 )+ 1 - 1 + 1 - 1

1

'3 Observar que el ángulo es agudo, ya que su coseno es positivo. Puesto que eos (u, r)Sí — 1, se obtiene que | u + F ||2 ^ | ||2+ ||F||2 + 2||íT | | F | = (||tf|| + ||F||)2 | |u || | de donde se deduce el resultado tomando raíces cuadradas en ambos lados. El ángulo que forman dos vectores u y F en R 2 o en IR3 puede obtenerse utilizando el teorema del coseno; ello nos permite calcular el coseno del ángulo que forman, el cual queda unívocamente determinado si suponemos que 0 (tT, F ) ^ n. Puede obtenerse una fórm ula para calcular eos ( u , F ); si u = ( u l , u2) y ~ v = ( v „ v2), del teorema del coseno se deduce que
( v 1 - u 1) 2 + ( v 2 - u 2) 2

Nota. D e acuerdo con la fórmula (1) dos vectores son perpendiculares si y sólo si su producto escalar es cero, ya que es en este caso cuando su coseno es cero y, por tanto, el ángulo que forman es n/2. D e la definición de producto escalar pueden deducirse las siguientes propiedades:

2)
3) 4)

1)

(u , F ) = (F , u ) para todo par de vectores u y F. (íT + F, co) = (u, c3) + (F, <y) para cualesquiera tres vectores u , T T y c 3 (propie­ dad lineal). (cu, V ) — c(u, F ) para todo número real c y todo par de vectores u y F. (U, u )= | | u ||2 5: 0 para tod o vector u.

= u j + u2 + v2 + v 2 -2\\u\\\\v\\ eos £ (t¡\ F ) 2 í Con la relación de producto escalar pueden atacarse problemas en el plano y en el espacio sobre perpendicularidad y ángulos que forman algunas de las figuras anterior­ mente estudiadas. L o que sigue es una serie de problemas relativos a estos temas; esta serie no es exhaustiva y sería conveniente que el lector se propusiera sus propios problemas sobre estas nociones. * * *

at

em

at

ic

a1
— 2 u 1v 1— 2 u 1v2 = — 2 1tT || || eos £ (t?, F ) | || F de donde se deduce que w ____ _ u1v 1+ u2v2 eos $ ( u , v ) = -1“ II II V II 1

.c w w w
Simplificando obtenemos

om .M

Comenzamos hallando las ecuaciones cartesianas de una recta en un plano sin necesidad de hallar sus ecuaciones paramétricas; supongamos que la recta pasa por el punto P = ( p l , p2) y tiene a u = ( u u u2) com o vector director. U n vector perpendicular a u es F = ( ~ u 2, Uj) ya que

(1)

(u, F ) = — u1u2 + u2u1 = 0 < ■ « D X «

«t

5 S
•a 3 P > « « fiJ ü t;
(4

La expresión que aparece en el numerador de la parte derecha de esta fórmula recibe el nombre de producto escalar de los vectores u y F y se denota por (tT, F). Si los vectores tienen dos componentes tenemos (u, v') = u1v1 + u2v2 Si tienen tres componentes se tendría { u , l f ) = u l v1+ u 2v2 + u3v3 y la fórmula para calcular el ángulo que forman es similar a la ( 1 ).

eeg
ft! 1 fe **3 <- Z Q < o « c u Q
*■ 5

« Q

n < < .Q f¡j
C O

£ O

w. < > &. L

o

o a

s

U n punto X = ( x 1, x 2) está en la recta pedida si y sólo si P % es perpendicular a T ; por tanto: 0 = ( P l , v ) = - ( x 1- p l )u2 + { x 2- p 2)ul = - u 2x i + u1x 2 + c donde c = p 1u2- p 2u1. Esta es la ecuación cartesiana de la recta que tiene a u = ( - u 2, u¡) com o vector perpendicular y pasa por el punto P. U n vector perpendi­ cular a una recta dada se denomina también un vector característico de la recta. D ada la ecuación a1x l + a 2x 2 = c que determina una recta en un plano, un vector perpendicular a ella es a" = (a1, a 2). Para demostrar esto basta escribir la ecuación de la recta en la form a ( a , x ) = c, donde x = ( x 1, x 2); si P = ( P u P 2 ) es un punto de la recta se tiene (a, p ) = c, con p = (p x, p 2); por tanto, tenemos ( a , x ) = ( a , p ’), o equivalentemente: (a, x — p ) = 0 Esto nos dice que (a, x ) = c es la ecuación de la recta que pasa por P y tiene a a como vector perpendicular. E j e m p l o C. P a ra h allar la ecuación de una recta que pasa p o r el punto P = ( l, - 2 ) y tiene a u = (1 , 3) com o vector director, observamos que ~ v = ( - 3 , 1) es un vector perpendicular a u; por tanto: ('v , x ) = — 3 * ! + x 2 = c es la form a de la ecuación pedida; para determinar c sustituimos el punto P = ( 1, - 2 ) y obtenemos —3 — 2 = c P o r tanto, - 3 xj + x 2= - 5 es la ecuación de la recta.

U tilizando el producto escalar puede encontrarse la ecuación cartesiana de un plano en el espacio cuando se conocen un punto del plano y un vector perpendicular a é l Si P = (P\-> Pi, P i ) es un punto del plano y u = ( u u u2, u3) es un vector perpendicular a él, cualquier punto X = ( x u x 2, x 3) del plano satisface

(w, X P ) = 0
com o puede fácilmente observarse en la figura adjunta. La igualdad anterior puede escribirse de la forma M X í + u2x 2 + u3x 3 = c j

at

em

at

ic w w
Recíprocamente, una fórmula com o la anterior determina un plano que es perpen­ dicular al vector tf = (u l5 u2, u3). La demostración es similar a la realizada para la recta en el plano y se deja com o ejercicio. E j e m p l o D. El plano que pasa por el punto P = (l, 3, - 2 ) y tiene a u = ( 2 , - 1 , 4) com o vector perpendicular o característico tiene com o ecuación una expresión de la forma 2x¡

x

w

.M

a1

.c

om

2 + 4x 3 =

c

El valor de c se determina imponiendo que P pertenezca al plano: 2 1 - 3 + 4 ( - 2 ) = — 9 = c. P o r tanto, 2 x l — x 2 + 4 x 3= — 9 es la ecuación del plano. * * *

Sea u un vector cualquiera de R 2 o R 3. El producto escalar puede utilizarse para descomponer todo vector V de IR2 o IR3 en una suma de dos vectores V = 'a + b donde a es un múltiplo de u y b es perpendicular a u (ver figura 6 ).

Figura 4

E je m p lo E. Para descomponer v = (1, 3, tT = ( — 1 , 0 , 1 ) y otro perpendicular a él, escribimos ~v=a + b = c u + b

— 1) en un vector paralelo a

donde b es perpendicular a u. D el razonamiento anterior deducimos que _ ( F , l T ) _ l - ( - l ) + 3-0 + ( - l ) - l C _ | u ||2 ~ | Puesto que a es un múltiplo de u hemos de tener a = cu, con c e U, y, por tanto: V = cu + b Multiplicando escalarmente los dos lados de la igualdad anterior por u y teniendo en cuenta que (B, Ú ) = 0 , ya que V es perpendicular a u, se tiene que (IT, u ) = c(u, u ) D e aquí deducimos que P o r tanto: «■ = — lü* = ( l , 0 , — 1 ) * * y b = V — a = ( 0 ,3 ,0 ) * ( — l )2 + 0 2 + l 2 -2

D ado unpunto P se denomina proyección de P sobre una recta o un plano a un punto P', de la recta o del plano, tal que P P ' esperpendicular a la recta o al plano dados (véase figura 8 ).

P
(u, tí)

y, por tanto:

D e la fórmula (1) y de la fórmula del coseno del ángulo que forman dos vectores

a=
11“

[eos ^ (u , F )]u I I

w

w

deducimos que

w

.M

at

em

at

ic

a1

.c

om

a=cu

(1)

Figura 8

y si u es un vector unitario, es decir, de longitud 1 , se tiene a = ||F||[cos ^ (tf, tT)]tT lo cual demuestra que d es un vector en la dirección de u que tiene |v |feos ^ ( u , v | | com o m ódulo (ver figura 7).

El problema de hallar la proyección de un punto sobre una recta o un plano se resuelve con métodos análogos a los que se utilizaron para descomponer un vector en sus componentes paralela y perpendicular a un vector fijado. En lugar de encontrar fórmulas de manera teórica preferimos realizar algunos ejemplos. E j e m p l o F. de ecuación Queremos hallar la proyección del punto P = (l, 2) sobre la recta r

— 2x + 3y = — 6 en el plano. Un vector perpendicular a la recta dada es IT = ( — 2, 3) y, por tanto, u = (3, 2) es un vector director de la recta. Si tomamos un punto de la recta, por ejemplo, A = (0, — 2), P ' será de la forma: P ' = A + cu. Además, P P ' es perpendicular a tT y, por tanto, 0 = { P P ' , u ) = ( P A + c u, u ) = ( P A , u ) + c( u, u ) =
Figura 7

= ( ( - 1 , - 4 ) , (3, 2)) + c((3, 2), (3, 2)) = - 1 1 + c - 13

D e aquí deducimos que c = 11/13 y, por tanto, /33 F = (o,- 2 ) ^ 113 , 2) = ^ - , - - 4J\ (

Figura 10

si Q¥=P'- Puesto que ya sabemos calcular la proyección P ' de P también sabemos calcular la distancia de un punto a una recta o a un plano. En los casos de la distancia de un punto a una recta en un plano o de un punto a un plano en el espacio se obtiene una fórmula sencilla, que es conveniente encontrar.
P R O P O S IC IÓ N 1 ( Distancia de un punto a un p la n o )_______________________________

Figura 9

a1

.c

om

La distancia del punto P = (p u p 2, p3) al plano de ecuación a1x 1+ a 2x 2 + a3x 3 + c = 0 está dada por la fórmula
la l P l +

a 2Pl

+

a iPd, + c \

o = (Á ? \ ? ) = ( a ? + p p ', t ) = ( a P , r ) + c ( i r , v ) =
= ((0, 0, 3), (1, 1, — 2)) + c ((l, 1, - 2 ) , (1, 1, - 2 )) = - 6 + c6

w

w

w

Á P ' es perpendicular a tí. P o r tanto:

.M

E je m p lo G. Queremos hallar la proyección del punto P = { 1, 2, 3) sobre el plano de ecuación x + y - 2 z = 3; sabemos que un vector perpendicular a este plano es ~ v = (1, 1, - 2 ) . Si P ' es la proyección de P sobre el plano n hemos de tener P P ' = c~v; además (ver figura 8), si A es un punto del plano, por ejemplo, A = ( í , 2, 0), se tiene que
71

ic

at

em

at

J a j + a2 + a2 2 3

Demostración.

La ecuación del plano puede escribirse de la forma (a, x ) + c = 0

Así pues, c = 1 y P P ' = ? = ( 1, 1, - 2 ) . C om o P ' = P + P P ', se tiene P ' = ( 1, 2, 3) + (l, 1, — 2) = (2, 3, 1)

donde a = ( a u a2, a3) y x = ( x l5 x 2, x 3). Puesto que a es un vector perpendicular al plano, la distancia d(P, n) del punto P al plano n es de la forma | í7 | , donde t debe de | ?| ser elegido de manera que P + t a = P 'e n

*

*

*

Se denomina distancia de un punto P a una recta o a un plano a la menor de las distancias del punto P a cada uno de los puntos de la recta o del plano. U tilizando el teorema de Pitágoras se demuestra que la distancia de P a una recta o a un plano coincide con la distancia de P a la proyección P ' de P sobre la recta o el plano considerados. Para demostrar esto basta observar que si Q es otro punto de la recta o del plano (ver figura 1 0 ) se tiene iip^ii 2 = i i P F i i 2 + iiP 'e n 2 > i iF ? 'ii 2
Figura 11

Para obtener t sustituimos en la ecuación del plano:
0

= (a , O P ') + c = (a, Ó P + t a ) + c = (a, Ó P ) + t(a, a ) + c

D e aquí deducimos que t _ ~ ( a , O P ) —c son vectores que tienen la dirección de cada una de las bisectrices buscadas. Basta para ello observar que los triángulos A B D y A C D son isósceles e iguales. Las ecuaciones serán ( u ~ v A + t [ ----- + —
l«ll II i>l

y, por tanto, -(a, 6 P ) - c d{P, n ) = | í ? | = |< | ( a , Ó P ) + c\

que coincide con la fórmula anunciada en la proposición.

U n razonamiento similar al anterior permite obtener el siguiente resultado, que se deja com o ejercicio. PROPOSICIÓN 2 ( Distancia de un punto a una recta en el plano) _______________ La distancia del punto P = (p u p 2) a la recta de ecuación al x 1+ a 2x 2 + c = 0 está dada por la fórmula

at

\al p 1+ a 2p2+c\ 'a \ + a \

ic

a1

.c

om

Figura 12

.M

at

em

E j e m p l o I.

Deseamos hallar las bisectrices de las rectas de ecuaciones r l : x —y = — \, r 2: 2x + y = 4

7t:

3 x j — 2 x 2 + 7x 3 = 5

es |3-1—2-3 + 7-( —2 )— 5 | d(P, n) = v /32 + ( - 2 ) 2 + 72 |-22| ^62 22 s/62

w

w

w

E j e m p l o H.

L a distancia del punto P = (l, 3, —2) al plano de ecuación

U n vector perpendicular a r x es (1, — 1), luego un vector director de r t es

u=( , )

11

Tratamos de hallar ahora las bisectrices de dos rectas dadas que se cortan. Tanto en el plano com o en el espacio sus ecuaciones serán de la forma A + tu y A + stf u ^ tí
llwll

donde A es el punto de corte. Puesto que rud es fácil demostrar que

y

v ^v ^

son vectores de igual longi-

,

.

tf
lltrii Figura 13

U n vector perpendicular a r 2 es (2, 1), luego un vector director de r2 es ? = ( l - 2) Los vectores directores de las bisectrices serán u + V = (1 , 1 ) + (1 , - 2 ) ^ “ 75

a) b) c) d) (’) /i (j) h) i) j)

Distancia de P a Q. El coseno del ángulo que forman los vectores El coseno del ángulo que forman las rectas Ecuación cartesiana de la recta que pasa por Ecuación cartesiana de la recta que pasa por yr 2. P y es perpendicular a r v R y es perpendicular a r2. y en otro perpendi­ y PR.

Descom poner el vector P Q en un vector paralelo a la recta cular a ella. H allar la proyección del punto Q sobre la recta r 2. H allar la distancia de Q a r 2 y de P a r v H allar el simétrico del punto P con respecto a la recta r v Encontrar las ecuaciones cartesianas de las bisectrices de Dados los puntos P = (l, 0, 0), Q = ( 1, 0, 1) y R = (2, 3, - 2 ) y 3x — y + z = 3, r 2: x + 2y — z = 2

Hirii — Hirii

U n punto por el que pasan las bisectrices es el punto de intersección de las rectas dadas; el lector puede com probar que este punto es A = (\, 2). P o r tanto:

y r 2. los planos

(x, y ) - ( l ,

+

2.

son las ecuaciones paramétricas de las bisectrices. * * * se pide:

om .c

a1

Para terminar esta sección recordamos que el ángulo que forman dos planos se define com o el ángulo que forman sus vectores perpendiculares (ver figura 13). P o r tanto, el coseno del ángulo que forman dos planos puede calcularse mediante la fórmula obtenida al comienzo de esta sección. Si el lector desea realizar algún ejercicio relacionado con este concepto puede intentar hallar el ángulo que forman los planos de ecuaciones

a) b) c) d)

Distancia de P a Q y de Q a R. El coseno del ángulo que forman los planos y r2.

at

ic

Ecuación del plano perpendicular al vector P § que pasa por R. La proyección del punto P sobre el plano r x.

em

'i Descom poner el vector QR en un vector perpendicular a r 2 y otro paralelo a r 2. ) Encontrar las ecuaciones cartesianas de la recta perpendicular al plano por R. i hj i) 3. que pasa

w

w

3x — 2y + z = 0

y

2x + y — 3z = 0

.M

at

Hallar la ecuación del plano perpendicular a la recta intersección de los dos planos dados y que pasa por Q. Distancia de Q a r 2 y de P a r v Hallar el punto simétrico de P respecto del plano r l .

w

Dados los puntos P = (0,0, 1) y Q = (0, 3, 0) y las rectas de ecuaciones: r i- (1, 1, 0) + í(2, 0, 1), r2: (0, 0, - 2 ) + s(l, - 1 , 3)

se pide: a) E J E R C IC IO S 3.3 1. Dados los puntos P = (l, 0), Q = { — 1, 1) y R = (2, 1) y las rectas d) e) /) b) c) Dem ostrar que y r 2 se cruzan.

Ecuación del plano perpendicular a r¡ que pasa por P. Ecuaciones paramétricas y cartesianas de la recta paralela a r t que corta a r 2 en el punto (0 , 0 , — 2 ). Ecuaciones de las bisectrices de la recta r 2 y la encontrada en el apartado anterior. La proyección del punto Q sobre r l . Distancia de Q a y de P a r 2.

g) h) i) j)

Descom poner el vector P & en un vector paralelo y otro perpendicular a r t . Ecuación del Ecuación del plano paralelo a que contiene a r 2. contiene a r

plano paralelo a r 2 que

Distancia de r 1 a r 2. [ Sugerencia: hallar la distancia entre los planos de los apartados h) e ()■]

4. U tilizar vectores para demostrar que las diagonales de un rectángulo perpendiculares si y sólo si el rectángulo es un cuadrado. 5.
6.

son

se obtienen_todos los puntos del segmento P Q y solamente éstos. P o r tanto, el segmento P Q puede representarse de la forma (1 —t)P + tQ con 0^ í g 1

Dem ostrar que las bisectrices de dos rectas que se cortan son perpendiculares. Dadas las rectas de ecuaciones x -y + z = lj
1

y + z = 2) 2 x — 2y + z = 0 J

D ado un punto X en el segmento P Q se denomina razón de X con respecto a P y Q al cociente I\PX\\ m w

2x + y = 3 y

demostrar que se cortan y hallar las ecuaciones paramétricas de sus bisectrices. 7.
8.

Hallar la ecuación del plano cuyo punto más cercano al origen es P = (l, — 2, 1).

w

.M

at

10. Encontrar la ecuación del plano perpendicular al de ecuación x — 2y — 2z + 9 = 0 que pasa por los puntos P = (2, — 1, 6 ) y Q = ( 1, —2, 4). [So/.: 2x + 4y — 3z + 18 = 0.]

em

at

ic
La razón de un punto con respecto a otros dos es, por tanto, un número real positivo. D ado un número real positivo r siempre puede encontrarse un punto X tal que su razón con respecto a dos puntos dados P y Q es r. Para encontrar X observamos que ll^ ll r ~W x\\ y además: X = ( í - t ) P + tQ = P + tQ P para algún íe (0 , 1). Para encontrar este valor de t sustituimos X en la fórmula que nos da la razón r y obtenemos

9. Hallar la ecuación del plano paralelo al plano de ecuación 2x — 3y — 6 z — 14 = 0 y que dista 5 unidades del origen.

3.4. F IG U R A S S E N C IL L A S E N E L P L A N O Y E N E L E S P A C IO : SUS E C U A C IO N E S En las secciones anteriores hemos estudiado las rectas y los planos por medio de sus ecuaciones. En esta sección estudiaremos otras figuras en el plano y en el espacio. En todas ellas se observará que si sus ecuaciones paramétricas sólo dependen de un parámetro las figuras son curvas o trozos de curvas, mientras que si depende de dos parámetros se trata de superficies o trozos de superficies. Comenzamos con el segmento que une los puntos P y Q, donde P y Q pueden ser puntos del plano o del espacio. L a recta que contiene a P y Q tiene com o ecuación paramétrica P + t ( P § ) = P + t ( Q - P ) = ( l - t ) P + tQ donde t es un número real. Si imponemos la restricción

w

w

a1

.c

om

H allar la ecuación de un plano que determine con los ejes coordenados segmentos de longitudes 2, 3 y 1, respectivamente.

\\tQ P\\

t

||(l-r)G ?ll
D e aquí podemos despejar t en función de r: r t = -----1+r

l- í

El punto medio del segmento P Q es un punto cuya razón es 1 con respecto a P y Q y, por tanto, t = 1/2. D e aquí deducimos que el punto medio de P Q es i P + Q X = [ l - - ) P + -Q = -

o bien aA + bB + cC, a + b + c = 1, 0 ^ a, b, c ^ 1.

E je m p lo A. Queremos hallar un punto X que tenga razón 2 con respecto a los puntos P = (1, 2, 0) y Q = ( — 1, 0, 3). El punto X será de la form a X = (1 — t ) P + tQ, donde r t= 1+ r P o r tanto: 3

L a demostración de esta última afirmación se deja com o ejercicio para el lector. Cuatro puntos A, B, C y D no coplanarios en el espacio determinan un poliedro de cuatro caras triangulares. Puede demostrarse con un razonamiento análogo al anterior que los puntos de su interior se representan paramétricamente de la forma aA + bB + c C + dD, a + b + c + d = 1, 0 ^ a, b, c, d ^ 1
A

X = [ 1 - ^ ( 1 , 2, 0 ) + ^ ( - 1, 0, 3) = ( ~ , | 2 ).

2

1

^

.c

om

Observar que X es un punto que dista -||PQ|| de P y -||PQ|| de Q.

w

w

( l - t ) B + tC,

0 g í g 1

.M

at

em

Dados tres puntos no alineados A, B y C, en el plano o en el espacio, determinan un triángulo. Los puntos del interior del triángulo pueden determinarse paramétricamente. Los puntos del lado B C tienen com o ecuación paramétrica

at

ic

a1

Figura 4

E je m p lo B. Dados A, B y C, tres puntos en el plano o en el espacio, queremos hallar las ecuaciones paramétricas de la región sombreada. El segmento que une B con C tiene com o ecuaciones paramétricas (1 - t ) B + tC, O g r g 1 .

w

Figura 5

U niendo A con todos los puntos del lado B C se tiene el interior del triángulo, que satisface la ecuación
( l - s ) , l + s [ ( l — í)B + fC ] , O ^ s ^ l , O ^ t g l

Trazando las semirrectas que unen A con cualquiera de los puntos del segmento B C se obtiene la región sombreada. Estas semirrectas tienen por ecuación (1 —sM + s [ ( l - í ) B + tC ], O ^s, O ^ í ^ l

Esto puede escribirse de la forma
( 1 - sM + s( 1 - í )B + síC, O ^ s ^ l ,

O ^ í ^ l

D ado un triángulo cualquiera, se denominan medianas a las rectas que unen un vértice con el punto medio del lado opuesto.

Demostraremos a continuación que las tres medianas de un triángulo se cortan en un punto cuya distancia a cualquiera de los vértices del triángulo es 2/3 de la distancia del vértice al punto medio del lado opuesto. Para demostrar este resultado sean A, B y C los vértices del triángulo; el punto B -f- C 2 medio del lado B C e s ------- . El punto que se encuentra del vértice A a - de la distancia 2 3 de A al punto m edio del lado B C es (ver ejem plo A): / 2\ 2 B+ C 1 B+C A+ B+ C Ecuaciones paramétricas de la circunferencia pueden encontrarse utilizando el ángulo a que forman el radio de la circunferencia con una recta fijada que pase por el centro de la circunferencia. Se tiene que x l — c t = r eos a, P o r tanto, Xj = c t + r cos a x 2 — c2= r sena.

A+B+C

A

om

x 2= c 2 + r sen a son las ecuaciones paramétricas buscadas. L a figura que tiene a

Figura 6

ic

a1

.c

em

Realizando el razonam iento con cualquier otro vértice se obtendrá el mismo

at

x1= c 1+a eos a x2= c2+ b sen a
com o ecuaciones paramétricas recibe el nom bre de elipse (ver figura 8 ). Para encontrar sus ecuaciones cartesianas observamos que

centro de gravedad del triángulo. Otros puntos característicos de un triángulo se obtienen com o intersección de sus alturas, sus bisectrices o sus mediatrices. Los resultados que a ellos les conciernen se proponen en los ejercicios del final de esta sección. * * *

w

w

w

.M

resultado. Esto demuestra nuestra afirmación. El punto donde se cortan las medianas de un triángulo se denomina baricentro o

at

eos a = --------P o r tanto,

X C \ j

y

sen a = ----------

x2 c2

Pasamos a continuación a estudiar las figuras más sencillas en el plano y en el espacio que no pueden formarse con segmentos de rectas. En el plano tenemos la circunferencia, que es el lugar geom étrico de los puntos que equidistan de un punto fijo, llamado centro. L a distancia del centro a uno cualquiera de los puntos de la circunferencia recibe el nombre de radio de la circunferencia. Si C = (c l5 c2) es el centro de la circunferencia y r el radio, un punto X = ( x lt x 2) está en la circunferencia si y sólo si d(X, C ) = r. P o r tanto: ( x í ~ c í ) 2 + ( x 2- c 2) 2 = r 2 es la ecuación implícita de la circunferencia de centro c y radio r.
Figura 8

L a elipse puede definirse de la siguiente manera: el lugar geom étrico de los puntos de un plano cuya suma de distancias a dos puntos fijos, llamados focos, F l y F 2, es constante. * * *

O tra curva que posee una definición «sim ila r» a la de la elipse es la lemniscata de Bernouilli: es el lugar geométrico de los puntos del plano cuyas distancias a dos puntos fijos, llamados focos, F t y F 2, tienen producto igual a c2, con 2 c la distancia entre ambos focos. Si F ¡ = ( — 1, 0) y F 2 = (\, 0), la lemniscata de Bernouilli tiene por ecuación C(x + l ) 2 + >'2 ] [ ( x - l ) 2 + >'2] = l

Si la circunferencia tiene radio 1 y está situada inicialmente com o se muestra en la figura 1 1 , después de que el centro de la circunferencia haya recorrido una longitud t, el punto P se transforma en P', cuyas coordenadas x e y satisfacen

om

x = t — d(B, C) = t — eos a = t — eos

—^ = t —sen t

ic

a1

.c

( x 2+ y 2) 2- 2 ( x 2- y 2) = 0 Escribiendo x = r eos a, y = r sen a tenemos que r 4 = 2 r 2 (cos 2 a —sen2 a) P o r tanto: r 2 = 2 eos 2 a . Esta ecuación, denominada ecuación en coordenadas polares de la lemniscata de Bernouilli, permite obtener la representación gráfica de la figura adjunta. * * * * * *

w

w

Simplificando esta igualdad se obtiene

w

.M

at

Figura 9

em

at

y = 1 + d (C , P ' ) = 1 + sen oc= 1 + sen ( t —— ) = 1 —eos t

La curva que describe un punto de una circunferencia cuando rueda sin deslizar sobre una recta tiene unas ecuaciones paramétricas sencillas. Esta curva recibe el nombre de cicloide, y su gráfica se aprecia en la figura adjunta.

En el espacio la figura más sencilla es la esfera, que posee una definición similar a la de la circunferencia. La esfera es el lugar geom étrico de los puntos del espacio que equidistan de un punto fijo, llam ado centro. L a distancia del centro a un punto cualquiera de la esfera recibe el nombre de radio de la esfera.

2. Describir paramétricamente las regiones I, II, I I I y IV de la figura adjunta, donde A, B y C son tres puntos no alineados.

3. a) b) c) SiC = ( c 1 c 2, c 3) es elcentro de la esfera y r su radio, cualquier punto X , = (x j, x 2,x 3) de ella satisface la igualdad

H allar la intersección de las siguientes figuras en el plano: La recta x = y + 1 y la circunferencia (x — 2) 2 + y2 = 6 .
1

4 y la circunferencia (x — 2) 2 + y 2 = 6 . yj J

El semiplano y ---- — x ^ y/ J

El sector s(4, 1) + (1 — s — í)(l, 2), í > 0 , s > 0 y el semiplano x + 2y — 5 < 0 .

4.

a1

d(X, C) = r P o r tanto:

.c

om

Dem ostrar que un criterio para que la recta A + tu toque a la circunferencia x 2 + y2 = r 2 en un solo punto es que se cumpla la igualdad
«1 “2

ic

r 2 II Mil2 =

a y jS de la figura 12. Tenemos x 3 —c 3 = r eos mientras que ||C?|| = r sen /? D e aquí deducimos que .

que son las ecuaciones paramétricas buscadas. Observar que estas ecuaciones paramé­ tricas dependen de dos parámetros, a y / , lo cual está en concordancia con el hecho de ? que determinan una superficie en el espacio.

!

x 1—c í = r eos x 2 — c 2 = r sen

a sen j? a sen / ? 5. D em ostrar que si A ' y B' son los puntos medios de los segmentos A C y BC, se tiene que P W=\\\AÉW

x 3 —c 3 = r eos

E J E R C IC IO S 3.4 1. Encontrar los puntos que dividen al segmento A B en tres partes iguales, donde A = ( - 1 , 0 , - 3 ) y B = (4, 3, 5).

w

w

son las ecuaciones paramétricas de la esfera de centro C y radio r. Ecuaciones paramétricas de la esfera pueden encontrarse en función de los ángulos

w

.M

at

(Xj - Cj) 2 + (x 2 - c 2 ) 2 + (x 3 - c 3) 2 = r 2

em

at

al

a2

donde u = ( « ! , u2) y A = (au a2).

6.

Se denomina mediatriz de un triángulo a la perpendicular por el punto medio a uno cualquiera de sus lados. Dem ostrar que las tres mediatrices de un triángulo se cortan en un punto que coincide con el centro de la circunferencia circunscrita al triángulo. (Este punto recibe el nombre de circuncentro del triángulo dado.)

10. D ado el triángulo A B C en el plano cuyos vértices tienen com o coordenadas A = ( - 3 , 0), B = (2,1) y C = (0, 3), hallar:
a) b) c) d) Las coordenadas del baricentro. El circuncentro y la ecuación de la circunferencia circunscrita. El incentro y la ecuación de la circunferencia inscrita. El ortocentro.

(V er los problemas 6 , 8 y 9 para las definiciones.)

11. H allar las ecuaciones de la altura relativa al vértice A del prisma de base triangular B C D , donde
A = ( 1 ,1 ,3 ), B = (0, - 1 , 0 ) ,

C = (l, 0 ,0 )

y

D = (0 ,3 ,1 )

12.
7. Dem ostrar que el circuncentro (ver problema anterior) de un triángulo rectángulo a) b) se halla en el punto m edio de su hipotenusa.
8.

Encontrar las ecuaciones paramétricas y cartesianas de las siguientes figuras: L a circunferencia que pasa por los puntos A = (2, 1), B = {0, 3) y C = ( — 1, 0). L a esfera que pasa por los puntos A = ( 1, 2, 0), 5 = (1, 0, 2), C = (3, 0, 0) y D = ( 2 , 1 , y/2).

ic

a1
3.5.

Se denomina bisectriz de un triángulo a cualquier recta que divide a uno cualquie­ ra de sus ángulos interiores en dos partes iguales. Dem ostrar que las bisectrices de un triángulo se cortan en un solo punto que coincide con el centro de la circunferencia inscrita en él. (Este punto recibe el nombre de incentro del triángulo dado.)

.c em at
A R E A S Y V O L U M E N E S . P R O D U C T O V E C T O R IA L

om w
Comenzarem os encontrando una fórmula para determinar el área de un paralelogramo situado en el plano o en el espacio. Observamos, en^ primer lugar, que un paralelogram o queda determ inado p o r dos vectores a y b que son linealmente independientes (ver figura 1 ).

9. Cada una de las rectas que pasan por el vértice de un triángulo y son perpendicu­ lares al lado opuesto reciben el nombre de alturas del triángulo A B C de la figura. Estas alturas coinciden con las mediatrices del triángulo A 'B 'C ' de la figura adjunta. Deducir de este resultado y del problema 6 que las alturas de un triángulo se cortan en un punto. (Este punto se denomina ortocentro del triángulo dado.)

w

w

.M

at

/ / / / J
r B

U NIVERSIDAD DS L A RL'P'ÜÜLlCA

F A C U L T A D DE U - T O T ^ R I A
D EPARTA v ! ;fi

D O C U M E N T A C IO N Figura I M O N T E V ID E O

Y

B IB L IO T E C A

- URUGUAY

Sabemos que el área de un paralelogram o se obtiene multiplicando la longitud de su base por la altura; por tanto:

á re a = | a| - 1 |* | |CP

donde P es la proyección del punto C sobre la recta que contiene a A y B. Puesto que ||C?|| = | F | sen || ( a ; b ), deducimos que (área)2= || |2 ||F||2 sen2 a|
1

Finalmente, recordamos que el área de cualquier figura limitada por segmentos es fácil de calcular a partir del área de triángulos, ya que toda «figu ra » puede «triangular­ se» (ver figura 3 ).

(a, F ) = \ a |2 ||F||2 [ 1 - e o s 2 ■ . (a, F ) ] = \ | % (a, F ) 2 “ = \a\ \ \ 2\\b\ ( a , b ) 2 \2-

= Ila II I I

— l|a||2 ||MI2.

Hem os obtenido el siguiente resultado: P r o p o s ic ió n 1___________________________ Si ~ y F son dos vectores linealmente independientes en el plano o en el a espacio, el área A del paralelogramo determinado por los vectores a* y F se obtiene mediante la fórmula (a, a), ( a , b ) ^ = V /P 'l l 2 l|F||2- ( « , F ) 2 = (a , F ), (F , F ) a = Á(5 = ( 0 , - 5 )

E j e m p l o A. Tratemos de encontrar el área del triángulo de vértices A = ( l , 2), B = ( — 2, 0) y C = ( 1, — 3). Si consideramos los vectores

y
V = A É = { - 3, - 2 )

a1

.c

Si a' = (a 1 a2) y F = (i>1 b2) son dos vectores linealmente independientes en el plano , , tenemos que - || |2 ||F¡|2 - ( a , t>)2 = (al + a l)(b l + b l) — (al b l + a 2b2) 2 = a| = a j b j + a j b l + a l b j + a l b l ~ a 2bl — 2a1b1a2b2—a l b l = 1 = (a 1 ò 2 - a 2 è 1 ) 2 =
al
a2

om

se tiene que 0 -3 P o r tanto, el área pedida es 15/2, -51
- 2

ic

P o r tanto, el área de un paralelogrtamo en el plano coincide con el valor absoluto del determinante formado por las componentes de los vectores que lo determinan. En el espacio también existe una fórmula sencilla, pero es necesario utilizar un concepto que se introducirá más adelante. El área de un triángulo de vértices A, B y C coincide con la mitad del área del paralelogram o determinado por los vectores á £ y AB, com o puede observarse en la figura 2. P o r tanto, las fórmulas para el área de un triángulo se obtienen dividiendo entre 2 las fórmulas para el área del paralelogramo que él determina.

w

w

w

bi

b2

.M

at

12

em

at

= -1 5

E j e m p l o B. Queremos encontrar el área del triángulo que tiene com o vértices los puntos de intersección del plano de ecuación 2 x + y + 3z = 6 con los ejes coordenados (figura 5). Estos puntos son ¿ = (3 ,0 ,0 ), B = (0, 6 , 0) y C = (0, 0, 2)

com o fácilmente puede comprobarse.

demostraremos que el volumen del paralelepípedo que ellos determinan se obtiene com o el valor absoluto del determinante de la matriz. j íij (a, V, c*) = bi \c, Para demostrarlo basta con encontrar un vector co perpendicular al plano determi­ nado por los vectores a" y Z , ya que entonces tendremos que T V = volumen = (área de la base)-1|"cHIcos ^ ( c , c¡5)| Si tomamos a = ( - 3 , 0 ,2 ) de la proposición 1 deducimos que ,4 = - v / ( 9 + 0 + 4)(9 + 36 + 0 )—(9 + 0 + 0) 2 = ^ N l3 -4 5 —81 = / 2 ^ = Íy 5 Ó 4 = 3 V Í4 y 5 * = ( - 3 , 6 ,0 ) ya que la altura del paralelepípedo coincide con |c* |[eos | | ( c , to)|. Para encontrar un vector co = ( x 1, x 2, x 3) que sea perpendicular a o* = (a 1, a2, a3) y b = { b u b2, b3) basta con resolver el sistema (a, a ) = a1x 1+ a2x 2 + a3x 3 = 0 (b , ó)) = b1x 1+ b 2x 2 + b3x 3 = 0 a2 b2 a3 \ b3

om ic a1 .c

Puesto que los vectores a y V son linealmente independientes: ai Pi a2 bi

Observar que en este caso no podemos utilizar el determinante, mientras que sí se utilizó en el ejem plo A. * * *

at

em

at

= 2

U na fórmula en la que interviene un determinante de orden 3 puede utilizarse para calcular el volumen de un paralelepípedo en el espacio. U n paralelepípedo queda determ inado por tres vectores linealmente independientes (ver figura 6 ). Si estos vectores son a = ( a u a2, a 3), V = {bu b2, b3) y c = ( c 1, c 2, c 3)

w

w

w

.M

y, por tanto, el sistema tiene infinitas soluciones. Supongamos que

b, y sea x 3 = í; tenemos que -a 3 ~bi b2

b.

/O

c = o

a2 b2 , t

«i b,

~a3 ~b3

, t

«i

a2 b2

Tom ando í = bi

d2 b2

# 0 , por ejemplo, se tiene que

a2
co =

«3 b3

ai 5

a3 b3

ax i bi

a2 b2

b2

que recibe el nombre de producto vectorial de a y b

DEFINICIÓN 1 (P rod u c to vectorial de dos vectores) ----- -------------------------------Dados los vectores a = (a i, a2, a3) y b = ( b l , b2, b3) en el espacio definimos su producto vectorial com o el vector a2 b2
«3 «i «3 «i

E j e m p l o C. Tratemos de hallar la ecuación cartesiana del plano que pasa por el punto A = (2, 1, 3) y tiene u = ( l , 0, — 1) y V = (2, — 1, 1) com o vectores directores. Un vector perpendicular a u y ~ es v

ü2 b2 u x f = |
- 1

b3

i

0

- 1 1

1

- 1 1
y .

1 2 - 1

0

b,

b3

h

., *

2

_

)= ( - 1 ’ - 3 ’ - 1 > ;

U na form a de recordar las componentes del vector producto vectorial de a y b es observar que corresponden al resultado de eliminar la primera, la segunda y la tercera columna, respectivamente, de la matriz

la ecuación de todos los planos perpendiculares a u x c

es

— x — 3y — z = d /ai \b1 a2 b2 a 3\ b3) El valor de d se calcula con la condición de que el punto A pertenezca al plano; por tanto, tenemos — 2 — 3 — 3 = — 8 = d. La ecuación del plano es

teniendo siempre cuidado de que a la segunda componente es necesario cambiarle el signo. _ O tra form a de recordarlo, procedente de la física, es la siguiente: sean i = (1 , 0, 0), 7 = ( 0 , 1 , 0 ) y I = ( 0 , 0 , 1 ) los vectores coordenados unitarios; podemos escribir x + 3y + z = 8

a1 .M at em at ic

a = a 1 i + a2j ~^~@ 3k

.c
El m ódulo o longitud del producto vectorial de dos vectores tiene una bonita interpretación geométrica. Si los vectores dados son a = ( a u a2, a3) y V = (bu b2, b3), y calculamos ||tf xb\\2 se tiene que

y
F = i + b 2j + b 3k

om

w

w

lia x ¿ II2 = >

a2 b2

2

2

«3

+

«1 *1

«3

+

«i

a2

= (a2b3 - a3b2) 2 + ( a 1b3 - a ^ J 2 +

w

b3

b3

bi

b2

+ (ai b i — ^ i b i ) = « 2 ^ 3 + « 3 ^ 2 + ai b 2 + a2b\ + a\bl + a jb j — - 2 [ a 2b3a3b2 + al b3a3bl = (af + a¡ + a¡)(bf + b\ + b\) -

- a \ b \ » - a l b 2 - a 2bl-2 \ _ a 2b3a3b2+ a l b3a3bí + a l b2a2b { ] = 3 = (al + al + a l)(b l + b$ + b\) ~ ( a 1b í + a2b2 + a3b3) 2 = = \a\ \ \ 20\\2- ( a , V ) 2

De la proposición 1 deducimos el siguiente resultado: El vector a x 5* se obtiene desarrollando «form alm ente» el determinante PROPOSICIÓN 2 ( Area de un paralelogramo en el espacio) ______________________ 7
al

1
a2

k
ai

_E1 área A de un paralelogramo en el espacio determinado por dos vectores a y b coincide con el módulo del producto vectorial de los vectores, es decir:

b\ por la primera fila.

b2

b3

El área del triángulo del ejem plo B podem os calcularla ahora utilizando el producto vectorial. En efecto, tenemos que 0 6 22 0 -3 + -3 22 0 + O 2“ 1 2 / = —3 6 1

D ebido a la proposición 2 se tiene que V = | a x fe | • |c |||cos $ ( í x F , c )| |* | | Si recordamos la fórmula para calcular el coseno del ángulo que forman dos vectores (ver sección 3.3), obtenemos que V=\(a x F , c)|

= l [144 + 36 + 324]1 2 = * v /504 = 3 ^ 1 4 /

que coincide con el resultado encontrado en el ejemplo B.

El producto escalar de a x fe con c* recibe el nombre de producto mixto de los vectores a , fe* y ? . El producto m ixto de tres vectores puede calcularse utilizando un determinante, ya que a2 b2 b3 » fli «3 b3 a2 9 bi ai c2 + bi b2

(a x fe , c*) = ( (

), (c l5 c2, c 3i j =

a2 b2

«3

b3

C l-

«1

«3

a2 b2
C3 —

«I

a2 b2
c2

a3 b3 c3

b,

b3

bi Cl

.c ic a1

om
P r o p o s ic ió n 3 (Volumen de un paralelepípedo)

Todos estos resultados quedan resumidos en la siguiente proposición. _______________________

em

at

*

*

*

tiene que su volumen es F = (á r e a de la base) -1|C P |||cos
$ (a x b , T ) \

w

El problema que nos ha conducido a los resultados anteriores es el de encontrar una fórmula para determinar el volumen de un paralelepípedo en R 3. Este problema puede ser resuelto ahora de una forma elegante. Para el paralelepípedo de la figura 8 se

w

.M

at

El volumen del paralelepípedo determinado por los vectores a, fe* y ~ en el c espacio puede calcularse mediante la fórmula V=\(a xfe*, r ) | y coincide con el valor absoluto del determinante de la matriz
( al fex a2 fe2 @3 \ fe3

||c|||cos ^ (¡rxF , r)|

w

\

C1

C2

donde a = ( a u a2, a 3), fe'=(fe 1 ,fe2 ,fe3) y F = (Cl,c 2 ,c 3).

E je m p lo JD . E l volumen del paralelepípedo determinado por los vectores a ’ = ( 1 , 2 , — 3), fe = ( 0 , 1 , 2 ) y cf = (l, — 2 , — 1 ) es el valor absoluto de

1
0 1 - 2

2
1

-3
1 2 - 2 - 1 - 1 2

+

2
1

-3
2

= - 1 + 4 + 4 + 3 = 10

P o r tanto, V = 10.

U tilizando la proposición 3 puede calcularse el volumen de otras figuras en el espacio. Si se trata, por ejemplo, de un prisma triangular determinado por los vectores <f, F y e (véase figura 9) se tiene que su volumen es V =^\(a x F , ?)| ya que dos de ellos unidos por una de sus caras laterales forman un paralelepípedo determinado por los vectores o*, b y c.

F y c\ y tenemos en cuenta que el volumen de una pirámide es un tercio del área de la
base por la altura, deducimos que V =\ \{a x F , ?)|.
6

O tra form a de llegar a esta conclusión es observando que seis pirámides de base triangular e iguales forman un prisma de base rectangular, com o puede apreciarse en las figuras 10 y 11. (L o s dibujos de estas figuras han sido realizados por Manuel M oreno, 1.° de Físicas U A M , 1985.) El producto vectorial, que nos ha aparecido al intentar calcular áreas y volúmenes de figuras tridimensionales, aparece de manera natural en algunos fenómenos físicos. Se justifica experimentalmente que una carga eléctrica positiva de magnitud q, que se mueve con una velocidad V, dentro de un campo magnético de intensidad i , se encuentra sometida a una fuerza F cuyo m ódulo y dirección están dados por

w

w

w

.M

at

em

at

Si consideramos una pirámide de base triangular determinada por los vectores a,

ic
Una^ corriente que circula por un hilo recto produce un campo magnético cuyo vector F tiene el sentido del producto vectorial del vector que señala el sentido de la corriente, V, en el hilo y el vector Á É de la figura adjunta.

a1

Figura 9

.c

om

Estudiaremos a continuación las propiedades del producto vectorial. Sabemos que el producto vectorial tiene dirección perpendicular a cada uno de los vectores y su m ódulo o longitud coincide con el área del paralelogram o que ambos vectores determinan. Sin embargo, esto no determina completamente el producto vectorial de a y b , ya que la dirección perpendicular a a y b posee dos sentidos ^puestos. Se plantea entonces la pregunta de saber cuál es el sentido del vector a x b . Realizamos algunos ejemplos sencillos. Si e 1= (\, 0, 0), e2 = (0, 1, 0) y e3 = (0, 0, 1), tenemos que ( 0 e x x e 2= [
1 0 0 1 0 0 0 1 0 1

P R O P O S IC IÓ N 4 ( Propiedades del producto vectorial )

___________________

Cualesquiera que sean los vectores a, F y 7 en R 3 se tiene: a) b) c) d) e) a x b = —F x a (a x F , a ) = 0 y (a x F , F ) = 0 Si a y b son no nulos, a x b = 0 si y sólo si a* y fe son paralelos. (a + b ) x 7 = a x c* + F x c (a x b , ~c) = (a, F x Z ) = ( V , ~ x a ) c a x (F x c*) = (a , ~c)b —(a, F)c"

y

= ( 0 , 0 , í ) = e3

f)

0

e2 x e i = l

/

1 0

0 0

0

0 0

0

1

>

1

9

= ~e3
1 0

Nota. Las propiedades a), b) y c) se deducen inmediatamente de las propie­ dades ya conocidas del producto vectorial. El resto de las propiedades pueden demostrarse directamente utilizando la definición de producto vectorial, y se dejan com o ejercicio para el lector. Existen varias formas de calcular la distancia entre dos rectas que se cruzan en el espacio; una de ellas se sugiere en el apartado j ) del problema 3 de la sección 3.3. O tra de ellas puede obtenerse utilizando la proposición 3 de esta sección. D adas la rectas de ecuaciones /V A + tu y r 2: B + s~ v

at

ic
En estos ejemplos se observa que el sentido del producto vectorial de a j y b está dado por el sentido de avance de un tornillo que gira yendo de a hacia b . Otra form a de recordar el sentido del producto vectorial es la regla de la mano derecha: el sentido de a" x F es el sentido en el que apunta el dedo pulgar cuando los dedos de la mano derecha están curvados de a hacia F (véase figura 1 2 ). Las propiedades que conocemos del producto vectorial le determinan totalmente, es decir, el producto vectorial a x F de dos vectores a y F en IR3 que son linealmente independientes es el único vector que satisface las siguientes propiedades: 1) 2) 3) Es perpendicular a a ’ y b . Su longitud es el área del paralelogramo determinado por a y b. Su sentido está dado por la regla del tornillo.

a1 w w .M at em

.c
form am os un paralelepípedo com o se muestra en la figura 13. El volum en del paralelepípedo se obtiene multiplicando el área de la base por la altura a. D e las proposiciones 2 y 3 deducimos que V = |(íT x ~v, Á É ) |= | t x T | ■a |T T |

w

om

Figura 13

Puesto que la altura a del paralelepípedo coincide con la distancia de B al plano que contiene a r x y es paralelo a r 2 y ésta, a su vez, coincide con la distancia entre las rectas dadas, la distancia buscada es d(ri, r 2) = a = \(u x v , AÉ)\/\\u x tf||
Figura 12

E je m

plo

E.

Para calcular la distancia entre las rectas de ecuaciones r{. (1, 0, l ) + í(2, 0, 1) y r2: (0, 1, l ) + s(l, 3, - 1 )

utilizando^! producto vectorial: los vectores a , b y ~ están positivamente orientados si c el vector c tiene el mismo sentido que el vector a 'x F .

calculamos
2 0 1 - 1 0

E JE R C IC IO S 3.5
0 0 - 1 2 1 2 1 - 1 0 1 2 0
= —

1. 4 -1
=

Hallar el área de la figura de vértices A B C D E , donde A = ( - 2,0), B = ( - l , - 2 ), C = (2, 1), D = (0, 1), £ = (-1 ,3 )

(u x ~v, À È ) =
- 1

1

3
1

4
1

6

||tr X ¥11 = 11(2,0, 1) X (1, 3, -1)11 =

(
6

/ 0 3 -1

2 1 - 1

1

\

1 3

>

= |( — 3, 3, 6 | = (9 + 9 + 36)1 2 = n/54. | | / P o r tanto, 2

d(ru r 2) =

plano y del espacio. En un plano no hay una orientación privilegiada: podemos decir cuándo dos pares de vectores tienen la misma orientación, pero no decir cuál es la orientación de cada uno de ellos. Sin embargo, decimos que hay un sentido positivo y un sentido negativo de giro porque siempre miramos nuestro plano de un lado fijo: el papel por el lado en que dibujamos o las agujas del reloj desde fuera del mismo. ¡Si usamos un plano transparente y lo miramos desde atrás, los sentidos de giro cambian!

em

at
2. Hallar las ecuaciones cartesianas de los siguientes conjuntos de a) Plan o que pasa por los puntos A = ( l , 2, 1), B = ( - 1, 3, 0) y C = ( 2, 1, 3). b) Recta perpendicular a las rectas (3, 3, 2) + t(3, - 1 , 2) y (1, 1, 9) + s(5, 1, - 5 )

Terminamos esta sección haciendo algunos comentarios sobre la orientación del

ic

a1

.c

om

^54

w

w

w

.M

at

puntos:

y que pasa por su punto de intersección.
12

c)

Plano perpendicular a la recta de ecuación (1, 2, l ) + í ( - l , 2, 0) punto ( — 1, 2, 3).

que pasa por el

3. D em ostrar que la distancia de un punto A a la recta B + tu en el plano puede calcularse mediante la fórmula

En el espacio no tiene sentido preguntar si el giro en torno a un eje es positivo o negativo y sólo tiene una aparente respuesta si en el eje se ha elegido una dirección positiva y el observador se sitúa en la dirección positiva de este eje. A pesar de no existir una respuesta satisfactoria para definir un sentido de giro positivo o negativo en el espacio, siempre podem os decidir si tres vectores están positivamente orientados

donde A = (a1, a 2), B = (bl ,b 2) y u = { u u u2). [Sugerencia: utilizar que el área de un paralelogram o en el plano puede expresarse com o un determinante.]

4.
a) b) c) d) e) 5.

D ada la pirámide de base A B C D y vértice E, donde A - ( 2, 0, 0), B = ( 3, 1, 0),

CAPITULO 4

C = (0 , 1, 0), D = { - 1, 0, 0) y £ = ( 1, 1, 3), hallar: El área de la cara ABE. El área de la base. El volumen del prisma. La distancia entre las rectas EB y DC. El valor de la altura. Hallar el volumen del prisma determinado por los vectores a = (1 , 2 , - 1 ) ,
6.

LOS NUMEROS COMPLEJOS

F = (0 ,1 ,2 )

y

c = ( l , 2, - 3 )

Dem ostrar las siguientes propiedades del producto vectorial: (a x V , ~ c ) = ( a , V x c ) = ( l ) , c x a * ) a x ( b x c ) = (a, c*)b — (a, b )c"

a) b)

4.1. 4.2. 4.3. 4.4. 4.5.

Los números complejos y sus propiedades Formas trigonométrica y polar de un número complejo Raíces de números complejos Resolución de ecuaciones algebraicas Ejercicios de álgebra lineal con números complejos

ic

a1 w .M
Las sucesivas ampliaciones de los sistemas de números se han realizado para acom odar resultados sorprendentes en los sistemas de números conocidos. Estos resultados sorprendentes provienen, en la m ayor parte de los casos, de la resolución de ecuaciones algebraicas. P o r ejemplo, la ecuación x + 7 = 5, en la que solamente aparecen números naturales, no posee ningún número natural com o solución; su solución es el número negativo —2. Los números naturales, junto con los números nega­ tivos, forman el sistema de los números enteros. Este sistema de números es insuficiente para resolver todas las ecuaciones algebraicas; la ecuación 3 x = 5 no posee com o solución ningún número entero; su solución es el número fracciona­ rio 5/3. Los números enteros, junto con los números fraccionarios, forman el conjunto de los números racionales. Estos números resultan insuficientes para resolver ecuaciones cuadráticas; por ejemplo, la ecuación x 2 = 2 no tiene un número racional com o solución; sus soluciones son los números irracionales v / 2 y —\¡2. Los números racionales, junto con los irracionales, forman el sistema de los números reales. En todos estos sistemas de números están definidas las operaciones de suma, multiplicación, resta y división, que generalizan las operaciones con números naturales. Los números reales no son, sin embargo, suficientes para acoger en su seno

w

w

at

em

at

.c

om

las soluciones de toda ecuación cuadrática. L a ecuación x 2 = — 1 carece de toda solución real, ya que el cuadrado de un número real es siempre un número positivo. N o s vem os,en la necesidad de ampliar el concepto de número para incluir aquellos que permitan resolver esta ecuación. L a idea más sencilla, y a la vez genial, es definir un «n u evo » número, i, de manera que satisfaga la relación fundamental i2= — 1. El nuevo sistema de números que se obtiene añadiendo éste y sus combinaciones a los números reales recibe el nombre de sistema de­ números complejos. Las operaciones que con ellos se realicen deben ser una generalización de las correspondientes operaciones con números reales. Este capítulo está dedicado al estudio de los números complejos.

P o r tanto: [(3 + 2i')3 + ( 1 — i) ] 2 = [ ( — 9 + 46i) + ( i _ j ) ] 2 = ( — 8 + 45i) 2 = ( — 8 ) 2 — 45 2 + + 2 - ( - 8 )- 45/ = -1 .9 6 1 -7 2 0 i. E j e m p l o B. Puesto que i2 = - 1 , tenemos que i4 = ( - l ) 2 = 1; por tanto, si n es un número natural que al dividirlo entre 4 da de resto r, 0 ^ r < 4 , es decir, n = 4/ + r, don­ de l es un número natural, se tiene que

Así, por ejemplo, ¡ 4 3 1 = i 3, ya que 4 3 1 = 4 x 107 + 3; puesto que i 3 = i 2 -i = - i , se tiene que ¡ 4 3 1 = — i. * 4.1. L O S N U M E R O S C O M P L E J O S Y SUS P R O P IE D A D E S U n número com plejo es toda expresión de la forma
z

*

*

El cociente entre dos números complejos, de los cuales el divisor es no nulo, es otro número complejo; si deseamos hallar el cociente entre los números complejos z = a + bi y z' = c + d ¡'# 0 , escribimos

om

= a + bi

z

a + bi

z

= a + bi,

z'

= c + di

w

donde a y b son números reales e i es un número que satisface i2 = — 1. El número real a recibe el nombre de parte real del número com plejo z, y se representa mediante real(z), y el número real b recibe el nombre de parte imaginaria de z y se representa mediante im g(z). L a suma de dos números complejos es otro número complejo, que tiene com o parte real la suma de las partes reales de cada uno de ellos, y com o parte imaginaria la suma de las partes imaginarias de cada uno de ellos; así pues, si

ic em at

a1
El número complejo x + iy es el cociente entre z y z' si se cumple que (c + di)(x + iy) = a + bi. U tilizando la definición de multiplicación de números complejos e igualando las partes reales e imaginarias se tiene que cx — dy = a 1 dx + cy = b\

se tiene que z + z' = (a + c) + {b + d)i. El producto de dos números complejos es otro número complejo que se obtiene multiplicando los números complejos com o si fueran polinomios en la variable i y sustituyendo i2 por — 1 siempre que aparezca. Tenemos, entonces, que z -z ' = (a + bi)(c + di) = ac + adi + bci + bdi2 = (ac — bd) + (ad + be) i. a + bi A. Queremos calcular [(3 + 2 ¿)3 + ( l - i ) ] 2; podemos utilizar el binom io de N ew ton para calcular el cubo de (3 + 2i) y obtenemos
plo

w

w

.M

at

.c
Es fácil obtener las soluciones de este sistema: ca + db c 2 + d2 ’ y cb — ad c 2 + d2 (Observar que la solución es única, ya que c 2 + d2# 0 por ser z V 0.) P o r tanto: ca + db c2 + d2 + .cb — ad c2 + d2
Eje m

c + di

(3 + 2 ¿)3 = 3 3 + 3- 32 -2i + 3- 3- (2i) 2 + (2i) 3 = 27 + 54i — 36 — 8 i = — 9 + 46¿.

La fórmula para calcular el cociente de dos números complejos no es muy difícil de recordar; sin em bargo, es mucho más fácil calcular el cociente de dos números

complejos utilizando la noción de conjugado. Se denomina conjugado del número complejo z' = c + di al número complejo
z’ = c — di

(53)

Existencia de elemento neutro: el número com plejo 0 = 0 + 0/ satisface (a + bi) + 0 = 0 + (a + bi) = a + bi

(54)

Existencia de elemento opuesto: el opuesto de a + bi es —a — bi.

que posee la misma parte real que z’, pero su parte imaginaria se ha cambiado de signo. Al multiplicar un número complejo z' = c + di por su conjugado se tiene
z! •z' = (c + di)(c — di) = c2 + d2

La multiplicación de números complejos tiene propiedades análogas a las de la suma; son las siguientes: (M I) Asociativa: (a + bi)[(c + di)(e + / ¿ )] = [(a + bi)(c + dij](e + f i ) (M 2 ) Conmutativa: (a + bi)(c + d i ) = ( c + d i ) ( a + bi)

que coincide con el denominador de las partes real e imaginaria del cociente entre z y z'. Esto sugiere que para calcular el cociente entre dos números complejos hasta multiplicar el numerador y el denominador por el conjugado del denominador. En efecto, este cálculo proporciona el resultado adecuado, ya que
a + bi c + di a + bi c - d i (ac + bd) + i(bc — ad) c + di c - d i c 2 + d2 ac + bd c 2+ d 2 bc — ad c2 + d2

(M 3 )

Existencia de elemento unidad: el número complejo 1 = 1+0/ satisface {a + bi) 1 = 1 (a + bi) = a + bi

E je m p lo

C.

Queremos expresar el número complejo

.c

om
(M 4 )

em

1

+i

at

ic

(1 -0 (1 + 2 0

Existe el inverso de todo número complejo distinto de cero: el inverso de un número complejo z = a + bi, no nulo, es otro número complejo x + yi tal que (a + bi)(x + y i)= \ . P o r tanto,
1

w

(1 -0 (1 + 20= l + 2 i - i - 2 ¿ 2= l + 2 + ¿= 3 + ¿ . Multiplicando numerador y denominador por 1—i se tiene (1 -0 (1 + 2 0 1+i
3 + ¿ 1- i _ 3 - 3 ¿ + ¿-¿2_ 4 - 2 ¿ _ 2

w

.M

en la forma a + bv, el numerador da como resultado

at

a1

w

x + yi =

a — bi a2 + b 2 a2 + b2 '

(- f e ) a2 + b 2

a + bi

.

l + i l —i
* * *

2

2

de acuerdo con los resultados anteriores sobre el cociente de dos números complejos. Finalmente, la suma y la multiplicación de números complejos están relacionadas mediante la siguiente propiedad: (D I) Distributiva: (a + b i)[(c + di) + ( e + f ¿)] = (a + bi)(c + di) + (a + bi)(e + f i ) . El lector no tendrá gran dificultad en com probar las propiedades anteriormente expuestas. Cuando un sistema de números con operaciones en él definidas satisface las propiedades anteriores recibe el nombre de cuerpo. Podem os hablar, entonces, del cuerpo de los números complejos o del cuerpo de los números reales. * * *

La suma de números complejos cumple las siguientes propiedades, que son semejantes a las propiedades de la suma de números reales: (51) Asociativa:
(a + bi) + [(c + di) + (e + /¿)] = [(a + bi) + (c + di)] + (e + f i )

(52)

Conmutativa:
(ia + bi) + (c + di) = (c + di) + (a + bi)

La validez de las operaciones con números complejos era cuestionada por varios matemáticos anteriores al siglo X IX . El nombre de «im agin arios» que aún se da a los números complejos cuya parte real es nula es un vestigio de este escepticismo. Sin embargo, a comienzos del siglo X IX una sencilla interpretación geométrica de las operaciones con números complejos hizo desaparecer estas sospechas. Esta inter­ pretación geométrica fue encontrada simultáneamente por Wessel (1745-1818), Argand (1768-1822) y Gauss (1777-1855). Esta interpretación geométrica consiste en colocar la parte real de un número complejo en un eje y su parte imaginaria en otro eje perpendicular al primero. El primero de estos ejes se denomina eje real y el segundo eje imaginario. D e esta forma todo números complejo queda representado en un plano mediante un vector, com o puede apreciarse en la figura 1 .

Para poder interpretar geométricamente la multiplicación de números complejos es necesario recurrir a una nueva forma de escribirlos. Esto se hará en la próxima sección.

E JE R C IC IO S 4.1 1. Calcular:

a) 2. , a)

[(2

—3i) 3 — i] 2

b)

c)

[ ( 2 + 0 (2 - 0 ] 2

Expresar los siguientes números complejos en la forma a + bi: 1- i ----1 M ( 3 - 0 ( 2 + /), b) -----------+ * 3+ / (2 — / ) 2 c) --------(3 — i) de
z+ 1

3.Encontrar las partes reales e imaginarias
7 1

2 > z1 ~i

y

— 1 z—r

om a1 .c ic at em at

donde z = a + bi. 4. 5. a) Encontrar dos números complejos tales que su cuadrado sea 8 — 6 / . Dem ostrar las siguientes igualdades: z1 + z 2 = z 1 + z 2 y b) z 1 z2 = z 1 z2

w

Figura 1

.M

L a suma de dos números complejos es un número complejo cuya representación gráfica coincide con la diagonal del paralelogramo que se obtiene con los dos vectores dados (véase figura 2 ).

w

w

donde Zj y z 2 son dos números complejos cualesquiera.

4.2.

F O R M A S T R I G O N O M E T R IC A Y P O L A R D E U N N U M E R O C O M P L E J O

Se denomina módulo de un número complejo z = a + bi a la longitud del vector que le representa, y se escribe de la form a |z|. U tilizando el teorema de Pitágoras se tiene que r= \ z\—\ ¡ a2 + b2 T o d o número complejo posee un módulo positivo, excepto el número complejo z = 0, que posee módulo nulo. El ángulo que forma la dirección positiva del eje real con el vector que representa al número complejo z se denomina argumento de z y se representa mediante

Figura 2

a = arg(z).

El argumento de un número complejo z no está determinado unívocamente, sino que puede variar en un múltiplo de 360° = 2n radianes. En cualquier caso, la trigonom etría elemental nos permite obtener: b tg a = a siempre que a sea no nulo. En el triángulo de la figura 1 puede observarse que a = r eos a y, por tanto: z = r[c o s a + í'sena], que recibe el nombre de forma trigonométrica del número complejo z. y b = r sen a f

Figura 2

*

*

*

Dados los números complejos z t = r (c o s a + ¡'sena) y z 2 = s(cos/ + /sen /?) en su ? forma trigonométrica el resultado de multiplicarlos produce

om

z¡ ■z2 = rs[(eos a eos f?— sen a sen ¡i) + ¿(eos a sen (3 + sen a eos /?)]. U tilizando las fórmulas trigonométricas para el coseno y el seno de una suma de ángulos se tiene que Zi •z 2 = rs[cos (a + /?) + i sen (a + /?)] D e aquí se deduce que el módulo de un producto de números complejos es el producto de los módulos de cada uno de ellos y que su argumento es la suma de los argumentos de cada uno de ellos. Esta afirmación tiene una representación geométrica sencilla que puede observarse en la figura 3.

Eje m

plo

A.

Queremos escribir el número com plejo z = — 2 + 2i en form a trigono­ y su argumento a satisface t g a = —- = — 1 ;

métrica; su m ódulo es r - ^ J 4 + 4 = 2 ^

por tanto, com o el número complejo está en el segundo cuadrante, se tiene a = 135°. Así pues, - 2 + 2i = 2^/2 [eos 135° + i sen 135°]. El lector puede también com probar que 2/ = 2[cos 270° + i sen 270o]
Figura 3

obteniéndose así la form a trigonométrica del número complejo z = — 2i.

w

w

w

.M

at

em

at

ic

a1

.c

Para interpretar geométricamente el cociente z j z 2, donde z2 es nulo, calculamos primero el inverso de z 2. Puesto que z2 = s(cos / + i sen ¡i) ? se tiene que
1

Finalizamos esta sección dando una nueva forma de escribir un número complejo. En cualquier libro de análisis matemático puede encontrarse la fórmula

ex = 1 + x + s(cos 18 — i sen B) 1 1 ----- T T - ----- ----------------2--------- = - [eos ( — /?) + i sen ( — /?)]• s(cos p + i sen p) s s

+ -^y + ■•• H j- + ■■ — •,

x £ IR

— z2 P o r tanto,

lo cual es una aplicación de la fórmula de Ta ylor para funciones de una variable. D e la misma manera puede demostrarse que

1
-= z,

- = - [eos (a — f$) + i sen (a — /?)].

c o sx = 1 ------- 1------------ 1------1-( — 1 ) " -----2! 4! 6! V ; (2b)!

om

D e aquí se deduce que el módulo de un cociente de números complejos es el cociente de los módulos de cada uno de ellos y que su argumento se obtiene restando del argumento del dividendo el argumento del divisor. Hem os probado que el módulo del producto de dos números complejos es el producto de los módulos de cada uno de ellos. El módulo de la suma es, sin embargo, menor o igual que la suma de los módulos de cada uno de ellos, es decir:

senx = x ------- 1------------ h( — 1 ) " ---------3! 5! v ( 2 n + 1)! P o r tanto: a 2 a4 a 6 -------b---------- h2! 4! 6 ! a 3 a5 a7 “f- Í ( 0£------- 1------------ b ' 3! 5! 7!

r[cos a + i sen a ] = r

1

a1

|Zi+Z2| ^ |Zi| + |z2| dándose la igualdad únicamente en algunos casos particulares. L a desigualdad anterior es una inmediata consecuencia de aplicar la desigualdad triangular al triángulo O A B (véase sección 3 del capítulo 3).

.c

ic


1

at

em

. (¿a) 2 (¿a) 3 (¿a)4 (¿a) 5 + ioH-------- -------- -------- -------- h • 2! 3! 4! 5!

at

w

w

w

La similitud de esta última expresión entre corchetes, con la fórmula para ex anteriormente dada, nos lleva a dar la siguiente definición: re'* = r[cos a + i sen a ], que recibe el nombre de fórmula de Euler. La expresión rem se denomina forma polar de un número com plejo; en ella está contenida toda la información necesaria para que el número complejo quede determi­ nado: están dados su módulo y su argumento.

.M

Particularmente interesantes son algunos resultados que se obtienen utilizando el conjugado de un número complejo z = a + bi. Se tiene que z + z = (a + bi) + (a — bi) = 2a = 2 real (z) z — z = (a + bi) — (a — bi) = 2ib = 2i img (z)

E J E R C IC IO S 4.2 1. Calcular su módulo, su argumento y expresar los siguientes números complejos en sus formas trigonométrica y polar: >/3. ^3 .

l + i , ------------1 , -1, — 2 — 2 1
z •z = (a + bi)(a — bi) = a2 + b2 = | : z|
ni —ni

1

1

2.

Calcular em, e2n\ e"

y e * .

4.

Hallar el módulo y el argumento de los siguientes números complejos, sin realizar

las operaciones: ~ -v/3i f* — V ,
1

una raíz n-ésima de <o es cualquier número complejo z que satisface z" = co. Para encontrar z escribimos z = r[cos a + i sen a ]

.,. i (3 — 3i) e imponemos la condición de que su potencia n-ésima sea a>; utilizando la fórmula de D e M o ivre se deduce que r"[cos na + i sen na] = s[cos / + i sen / ¡]. ?

(1 + 0 ( 1 - 0 ,

5. a) b)
6.

Si Zj y z 2 son dos números complejos, demostrar que: l-zií — |z2|^ \ z ¡+ z 2l HZil — |z2| ^ \zl - z 2\ | Probar, sin efectuar cálculos, que si a — bi es no nulo, a + bi/a — bi tiene siempre Igualando los módulos y los argumentos de estos dos números complejos se tiene que r" = s

m ódulo 1 . 7. Dem ostrar que n<x = f} + 2kn, eos (x —----------2

k = 0, ± 1 , ± 2 , ±---

y

sena=2

i

utilizando la fórmula de Euler.

.c

om

en donde se ha tenido en cuenta que dos números complejos iguales poseen argumen­ tos que difieren en un múltiplo entero de 360o = 2jt radianes. Puesto que r y s son números reales positivos se tiene que r= ;y s donde f/s denota la única raíz real positiva del número real positivo s. Además, P 2kn a = — I k = 0 , + 1 , + 2 , ... , n n P o r tanto, los números complejos 'P 2kn\ fp 2kn ------ ) + i sen I — I ------eos | —H n n J \n n -

trica. Observemos, primero, que si deseamos calcular la potencia n-ésima del número complejo

w

Trabemos ahora de encontrar la raíz n-ésima de un número complejo; este proble­ ma tiene una solución sencilla si el número com plejo está escrito en form a trigonom é­

w

w

.M

at

4.3.

R A IC E S D E N U M E R O S C O M P L E J O S

em

at

ic

a1

Q k= </s > z = r[cos a + i sen a] se tiene que z" = r"[cos na + i sen n a ]. Esta fórmula, que recibe el nombre de fórmula de De M oivre (matemático inglés, 16671754), se deduce del hecho de que al multiplicar dos números complejos, el m ódulo es el producto de cada uno de sus módulos y su argumento es la suma de cada uno de sus argumentos. Este resultado fue demostrado en la sección anterior. Demostraremos a continuación que todo número complejo posee n raíces n-ésimas que son también números complejos. D ado el número complejo a> = s [c o s / + ¿sen/?] ?

,

k = 0 , + 1 , + 2 ,...

son raíces n-ésimas de a. En la colección infinita de números complejos {tu*} hay una cantidad infinita de ellos que se repiten. Observar, por ejemplo, que si k = qn + r, k ^ n , 0 ^ r | n - l , se tiene que
(P 2kn\ (P 2rn\ ( P 2rn\ eos ( - -I------ = eos — I- 2qn A -------- = eos — I ------\n n J \n n J \n n J

$

y, análogamente,

P o r tanto, a>k = (or. D e manera similar puede demostrarse que si k es un entero negativo, wk coincide con algún tor, con O ^ r ^ n — 1. Además, todos los a>r, con r e { 0 , 1, 2, ..., n — 1} son distintos, cóm o puede comprobarse fácilmente. Así pues, a > posee n-raíces complejas que escritas en form a polar son
fl + 2kn

se tiene que las raíces pedidas son: 7 1 7 1 eos —+ i sen — = ^ 2 4 4 n 2n\ í ti
1 1

cun = ^ >0

(Oi=-¿/se E j e m p l o A.
71

,

k = 0 , l, 2 , ..., n — l « 1= ^ 2

cos(- + T
'n

+,se„ t- +T
(n

2n = ^ 2 [eos 117° + i sen 117°]

Queremos calcular las raíces cúbicas del número complejo 8i; puesto
71

que 8 i = 8 eos - + i sen -

2

2
71

las tres raíces cúbicas de i son:

COy

:= ^ 2

cos|_ + y

47r\

+ ¡se„ í + y

An = ^ 2 [eos 189° + i sen 189o]

71

eos —+ i sen -

V 5

.i (tí., = ^ 2

6

6

2 _+, 2
(n 2tí

ín 6n\ ín 6n ---- + i sen I —A ------eos —H _ \4 5J \4 5
(% Sn\ (n

= l f 2 [eos 26 I o + i sen 261°]

co1 = 2

'n

2 7i\

cos|6 + y

+ is e n U + y (n 4n —+ —

-2
= -2 i

2

2

0) a

871

eos - - i -----+ i sen —H ------. V4 V V4 5

= 1^2 [eos 333° + i sen 333°]

cu, = 2

.c a1 em at ic w w w .M at
E j e m p l o B. Calculamos a continuación las raíces quintas del número com plejo z = — 1 — i; puesto que — 1 —i = . r-( 5n 57l\ 2\ eo s-----1- i sen — V 4 V

om
D e la fórmula para calcular las raíces n-ésimas de un número complejo se deduce que todas ellas tienen el mismo módulo, a saber, ^fr, y sus argumentos difieren en 2 n/n radianes; por tanto, los extremos de estas raíces son los vértices de un polígono regular de n lados inscrito en una circunferencia de radio ^fr. Este comportamiento puede observarse en los ejemplos anteriores. U n caso particular interesante es calcular las races n-ésimas de 1, las cuales se denominan raíces n-ésimas de la unidad. Puesto que 1 es un número com plejo que tiene m ódulo 1 , de la observación anterior se deduce que los extremos de las raíces n-ésimas de la unidad son los vértices de un polígono regular de n lados inscrito en una circunferencia de radio 1 . Claramente, una raíz n-ésima de la unidad es 1; el resto pueden calcularse con la fórmula anterior. P o r ejemplo, las raíces cuartas de la unidad son: o)0 = 1 [eos 0 ° + i sen 0 °] = 1 co1 = í 2n 2n eos — + i sen — 4 4 At c 4n eo s--- + i sen — 4 4 6n 6n eos — + i sen — 4 4 (tí-, = 1

'n 47r\ cosí —h -----+ i s e n

co, =

1

E J E R C IC IO S 4.3 1. Calcular los diferentes valores de

L a primera igualdad nos permite encontrar bn_ í ( = an conocido bn_ i podemos )\ encontrar í> „ _ 2 de la segunda igualdad, ya que bn_ 2 = a „ _ 1 + z 1 fc„ _ 1 = a „ _ x + z 1a„; conocido b „ . 2 podemos encontrar i> „ _ 3 de la tercera igualdad, ya que fen-3= a n - 2 + z lfen-2= í í n-2 + z l(fln- 1 + z i fln ) Este proceso continúa hasta que se ha calculado b0 de la penúltima igualdad:

yr
2. Calcular las raíces sextas de la unidad. 3. Calcular las raíces cúbicas de la unidad. Sean éstas a>0= 1, (o t y a>2; demostrar que a>1 y &)2 satisfacen la ecuación x 2 + x + 1 = 0 y ambas son conjugadas.

b0 = al + z 1b 1= a 1 + z 1 (a2+ z 1b2) ± ■ ■ = a 1+ a 2z¡ + a 3zj-\-----■ Esta igualdad coincide con a0 = — Z j¿0, ya que z 1 es solución de la ecuación (1). Este procedimiento para calcular el polinom io b „ _ 1x n+1 + ■ ■ + b 1x + b0 se conoce con el ■ nombre de regla de Ruffini y puede esquematizarse com o sigue: «n «n - 1 «n - 2 z lb n-2 «ñ fen-2 fe i - 3 / *" ”
«1

«o Z i ¿>0 I 0 .

4.4. R E S O L U C IO N D E E C U A C IO N E S A L G E B R A IC A S U na ecuación algebraica es una ecuación de la forma an n+ an- l x n~ 1H x ------ha 1x + ao = 0 (1)

Zl )

z lb\ ^0

donde los a,- son números complejos; en particular, si los a¡ son números reales la ecuación anterior se dice que es una ecuación con coeficientes reales. Se denomina solución de la ecuación algebraica (1) a cualquier número com plejo z tal que al sustituir x p or z en la parte izquierda de la ecuación y realizar las operaciones indicadas se obtiene 0 com o resultado. Inicialmente podría pensarse que toda ecuación algebraica con coeficientes reales posee soluciones reales. N ada más lejos de la verdad, puesto que ya sabemos que la ecuación x 2 + 1 = 0 no posee soluciones reales. Sin embargo, posee las soluciones com plejas i y — i. Esto nos lleva a pensar que toda ecuación algebraica posee soluciones complejas. Este resultado se conoce con el nombre de teorema fundamental del álgebra, y se enuncia así: Toda ecuación algebraica de la forma ( 1 ) posee una solución compleja. L a primera demostración correcta de este teorema es debida a C. F. Gauss; la demostración más sencilla requiere conocimientos relativos a funciones de variable compleja y se incluye en cualquier curso dedicado a este tema. Si es una solución de (1), existen números complejos b0, b u ..., bn tal que a„x" + a „ _ 1 x'I~ 1H ------|-a1 + a 0 = (fo„_ 1 x " _ 1 H x ------\-btx + b0) (x — z¡).

a1

.c

om

U tilizando de nuevo el teorema fundamental del álgebra para la ecuación bn^ l x n~ 1 + ■ ■ + b1x + b0 = 0 se obtiene otra solución compleja z 2 de ( 1 ). Repitiendo este proceso ■ n veces podemos escribir a„x" + a „ _ 1 x ', _ 1 + --- + a 1 + a0 = on • ( x - z ^ x - z j- ix - z ,,) . x Algunas de las soluciones z¡ pueden repetirse, con lo cual podemos escribir a„x" + a „ _ 1-\ ------ha1x + a 0 = a„ • (x — z ^ f ^ x — z2)Cl- - { x —zk)Cl. El número Cj se denomina multiplicidad de la raíz zp j = 1 , 2, ..., k. Tenemos, por tanto, el siguiente resultado: Toda ecuación algebraica de la forma ( 1 ) posee n soluciones complejas, donde cada solución está contada el número de veces que indica su multiplicidad. Encontrar las n soluciones de una ecuación algebraica es un problema imposible de resolver en general. Sin embargo, en algunos casos particulares, que aparecen con mucha frecuencia, es posible encontrar las soluciones. Si la ecuación algebraica (1) es de grado 2 y con coeficientes reales, es decir, de la forma a 2 x 2 + a 1x + ao = 0 , la conocida fórmula a0, a u a2e R

Para demostrar este resultado multiplicamos los polinom ios de la parte derecha de esta igualdad e igualamos sus coeficientes con los del polinom io de la parte izquierda. P o r este procedimiento se obtienen las siguientes igualdades: a„ = feB- l í an - l —b„-2~~Zlbn- ú an - 2 —bn- 3 ~ z lbn-2\ —; « 1 — ^ 0 z \bi\ « o z \b <s-

w

w

w

.M

at

em

at

ic

~ f l i + s / a j —4a2a0 2a2 nos permite obtener sus soluciones.

Si la ecuación algebraica es de grado 3 ó 4 y con coeficientes reales, también existen fórmulas para calcular sus soluciones; estas fórmulas resultan bastante complicadas. El lector interesado puede encontrarlas en el libro de A. G. Kurosch, Curso de álgebra superior (Editorial M ir, 1977). Ecuaciones algebraicas de la forma x" — a = 0 donde a es un número com plejo se han resuelto en la sección anterior, ya que simplemente se trata de calcular las raíces n-ésimas del número complejo a. O tros casos particulares pueden verse en los ejercicios al final de esta sección. Para finalizar es conveniente exponer un m étodo para encontrar las soluciones racionales, en particular las enteras, de una ecuación algebraica con coeficientes enteros, si es que ésta posee algunas soluciones del mencionado tipo. Supongamos que la ecuación algebraica con coeficientes enteros a„x" + a „ _ 1 x " _ 1 H ------l-a1x + ao = 0 (1 )

Eje m pl o

A.

Para encontrar las soluciones de la ecuación
3x 3 — 14x2 + 23x — 10 = 0

intentamos averiguar si posee soluciones racionales. Los divisores de a0= — 10 son 1, - 1 , 2, - 2 , 5, - 5 , 10 y - 1 0 Los divisores de a 3 = 3 son 1, - 1 , 3, - 3 . Las posibles soluciones racionales de la ecuación son 1, - 1 , 2, - 2 , 5, - 5 , 10, - 1 0 1 -J _ 2 2 5 5 10 10 y ~ T

3’ I T ’ 3 ’ _ 3’ 3 ’ _ 3’ T

em

A i" A i" - 1 M an - j ^ + an - l J ^ r Y + - - - + al — + aO = 0

at

ic

a1

posee unasolución racional de la forma z = M / N ; siempre podemos suponer que M y N son primos entre sí, ya que en caso contrario podemos eliminar los factores comunes en ambos. Sustituyendo z en la ecuación se tiene:

om .c

U n o de estos números es solución si al sustituirlo en la parte izquierda de la ecuación y realizar las operaciones indicadas se obtiene cero com o resultado. P o r ejemplo, 2 no es solución, ya que 3 •2 3 - 1 4 •22+ 23 •2 - 1 0 = 2 4 - 5 6 + 4 6 - 10 = 4 # 0 . Sin embargo, 2/3 es solución, ya que 23 22 2 8 56 46 3 --r— 14— + 2 3 - - - 1 0 = ------- + ------ 10 = 0. 3 3 3 9 9 3 Haciendo uso de la regla de Ruffini o simplemente dividiendo el polinom io 3x 3 — 14x2 + 23x — 10 entre x —2/3 se tiene

an n+ an_ ! M " ~ 1N + •■• + a ^M N n~ 1 + a0N ” = 0. M L a igualdad (2) puede escribirse de la forma ( a „ M " ~ 1 + a „ _ 1M " ~ 2N ------\-a1N n~ i ) M = - a 0N n

(2)

w

w

w

o bien

.M

at

P o r tanto, M divide a a0N n; com o M y N son primos entre sí, deducimos que M ha de sqr un divisor de a0. L a igualdad (2) también puede escribirse de la forma J V fflj.jM ” " 1 H ------\-a1M N n~ 2 + a0N n~ 1 = —anM ". ) D e aquí se deduce que N divide a a„M"; como M y N son primos entre sí, deducimos que N ha de ser un divisor de a„. Resumiendo, las soluciones racionales de la ecuación algebraica con coeficientes enteros ( 1 ) se encuentran entre aquellos números fraccionarios cuyo numerador es un divisor de a0 y cuyo denominador es un divisor de a„.

3x 3 — 14x2 + 23x — 10 = 3(x 2 - 4x + 5 )^ x —^

P o r tanto, las otras dos soluciones de la ecuación son también solución de la ecuación x 2 —4x + 5 = 0 ; éstas pueden obtenerse mediante la fórmula cuadrática:
4 ± x / l 6 — 20 4+ y ^ 4 _

--------------------- = 2 + i.

Asi pues, z i ~ y

2

z2 = 2 +

1

y z 3 = 2 — i son las tres soluciones de la ecuación dada.

E j e m p l o B.

Queremos encontrar las soluciones de la ecuación x 4 —x 3 — x 2 —x — 2 = 0 .

4.5. E JE R C IC IO S D E A L G E B R A L IN E A L C O N N U M E R O S C O M P L E J O S Todos los conceptos introducidos en los capítulos 1 y 2, así com o los resultados allí obtenidos, pueden ser generalizados a los números complejos. P o r recordar algunos citaremos el m étodo de Gauss para la resolución de sistemas de ecuaciones lineales, el concepto de dependencia e independencia lineal de vectores, el determinante de una matriz y la regla de Cramer. En esta sección proponemos ejercicios relativos a estos conceptos y resultados, en los cuales se utilizan números complejos. Estos ejercicios sirven, además, de repaso de los capítulos 1 y 2 . En los ejercicios que siguen C denota el conjunto de los números complejos. D e acuerdo con esta notación, C" es el conjunto de todos los elementos de la forma (z1 z2, ..., z„), donde cada z, eC . ; 1. U tiliza r el m étodo de elim inación de Gauss para resolver«, si es posible, los siguientes sistemas de ecuaciones lineales con coeficientes complejos: a) x 1 - x 2 + /x3 = n ix 2 x 3 —i i b) X[ — ¿x2 = 2
1

Si posee soluciones racionales, deben ser números enteros puesto que el denomina­ dor ha de ser ± 1 (observar que el coeficiente de x 4 es 1). Estas posibles soluciones son los divisores de — 2 , es decir:
1,

- 1, 2 y - 2

Después de algunos intentos se concluye que x = — 1 y x = 2 son soluciones de la ecuación dada; en efecto: ( _ 1 )4 _ ( _ 1 )3 _ ( _ 1 )2 _ ( _ 1 ) _ 2 = i + i _ i + 1 -2 = 0 .

y
2 4_ 2 3

—2 2 —2 - 2 = 1 6 — 8 —4 —2 —2 = 0

c)

x 1 - x 2= l l íx 2 + x 2 = 0 !* x x + ( l - i ) x 2= i ]

em

at

ic

zj = - 1 , z2 = 2 , z 3 = i

y

z4= - i

a1

.c

soluciones de la ecuación dada son

om

U n a vez dividido el polinom io x 4 — x 3 — x 2 — x — 2 entre (x + 1) y (x — 2) se tiene com o divisor al polinom io x 2 + l. Las soluciones de x 2 + l = 0 son i y —i. P o r tanto, las

x 2 + i x 3 = 1 + 2 iV X1+ X 2 = l + Í )

2. Determinar si los siguientes conjuntos de vectores son linealmente dependientes o independientes y en caso de que sean linealmente dependientes encontrar una com bi­ nación lineal entre ellos: a) c) { ( 1 , /), ( - i , 1 ) } b) { ( 2 , i, 1 + /), (i, - 1 , - 2 /)}

.M

E J E R C IC IO S 4.4

at

{ ( 1 , 1 + i, 0 , 1 - /), ( 0 , 1 , i, 1 + i), ( 1 , 1 , 1 , 2 - 2 /)} Escribir las matrices de las siguientes aplicaciones lineales: f : C 3 i - » C 2 tal que f ( z u z2, z3) = (/z1+ z 2, z2+ íz3) g: C 3 i— <C tal que g{zu z2, z3 = (/z3, iz2, i z j 3 ) h: C 2 h-> C J tal que h(zu z2) = (z1- i z 2, z j + i z j Si f h°f g y hson las aplicaciones del ejercicio 3, b) g°h c) g '1 d) g ~ x °h calcular:

w

1. a) tí)

Resolver las siguientes ecuaciones algebraicas: x 4 — 1 0 x 3 + 35x 2 — 50x + 24 = 0. [So/.: 1, 2, 3, 4.] x 4 + x 3 —x — 1 = 0 . > / 3 ., [So/.: — 1, 1, —-H— — i, —- — i-)
1
yfi.

w

3.
a) b) c) 4-

1

c)

3 ± n/3 í x 3 — x 2 — 3x + 6 = 0. [So/.: —2, — ----- .] 3 1 4 x 3 —4x 2 —5x + 3 = 0 . [S o/ .:—, —, — 1 ] x 4 + 7x2- 144 = 0.[ Sugerencia: hacer x 2 = í.] [So/.: 3, - 3 , 4¿, -4 / .] Dem ostrar la igualdad (x 4 + x 3 + x 2 + x + l ) ( x - l ) = x 5 - l . U tilizar este resultado

w

a) 5.

Calcular los siguientes determinantes:
0

d) e) 2.

e2'
1

e3 e‘ c)

1

+ i
0 1 1

i
1

2i
0 1

b)

1

i para encontrar las soluciones de la ecuación x 4 + x 3 + x 2 + x + 1 = 0 . 3. Dem ostrar que si z es una solución compleja de una ecuación algebraica con d) i
1 0 0 0 1 0 1 0 0 1 0 0 0 1

- i i i

i i e) i

i i —z i

■■ ■

i i

i
1 0 0

coeficientes reales, z es también solución de la misma ecuación. 4. Encontrar las raíces de la ecuación x 2 + 2 x + l —2/ = 0 completando cuadrados. ¿Contradice el resultado de este problema lo demostrado en el problema anterior?

i
1 0

i —z

■■ ■

i

i
1

i

i

i

■■ ■

i —z

6.

H allar las inversas de las siguientes matrices, calculando primero la matriz de los

CAPITULO 5

cofactores: a) i
1 1

b)

11 + i
1

3
2 1 0

i \
1

c)

/I
0

i
1

- 1 \ i

ESPACIOS VECTORIALES

i

\ i

/

\o

0

1/

7.

U tilizar la regla de Cramer para resolver los siguientes sistemas de ecuaciones

lineales con coeficientes complejos: a) Xj + ¡x 2 = 0 —x t + x 3 = — 1 x 2- i x 3 = i
8.

b)

x !+ x 2 = 2 Xj — x 2 = 2 ¿

Encontrar el rango de las siguientes matrices: ! 1 2
\0

a)

i -2 i
1+ ¡

2i \
0
1+ /y

b)

I 2i
1

l+ i\
0

c)

- 1

5.1. 5.2. 5.3.

Definición de espacio vectorial. Ejemplos Base y dimensión de un espacio vectorial Cambio de base Subespacios vectoriales. Intersección y suma de subespacios vectoriales Variedades lineales. Espacio afín

em

at

11
2
\1

z - 1
10

- l\ z

ic
5.1.

a1

9.

Encontrar el rango de la matriz

.c

om .M at w w w

\— 3

2 —i

- 1

5.4. 5.5.

D E F IN I C IO N D E E S P A C IO V E C T O R IA L . E J E M P L O S

- 6 1

para los distintos valores del número complejo z.

10.

Estudiar la com patibilidad o incom patibilidad de los siguientes sistemas y

resolverlos en el caso de que sean compatibles:

El conjunto de los números reales y el conjunto de los números complejos, con los cuales se ha trabajado en los capítulos anteriores, tienen propiedades similares. En ambos pueden definirse dos operaciones + y • que satisfacen ciertas propiedades; estas propiedades han sido enumeradas para los números complejos en la primera sección del capítulo 4. Un conjunto en el que se han definido dos operaciones + y • que satisfacen las propiedades (S I) a (S4) y ( M I ) a (M 4), enunciadas en el capítulo 4 para los números com plejos, recibe el nom bre de cuerpo. Observem os que todos los resultados obtenidos en los capítulos 1 y 2 son ciertos en cualquier cuerpo, con tal que el cuerpo posea infinitos elementos. Todos los resultados de los tres capítulos siguientes son ciertos en cuerpos similares a IR, que denota el cuerpo de los números reales, y a €, que denota> el cuerpo de los números complejos. Sin embargo, nosotros trabajaremos fundamentalmente con IR y C, los cuales se denotarán por K. A l estudiar el conjunto de todos los vectores en el espacio hemos definido la suma de vectores y la multiplicación por un número real y enunciado las propiedades que satisfacían (véase sección 2 del capítulo 1 ). O tros conjuntos a los cuales se les puede dotar de una estructura similar a la del conjunto de todos los vectores en el espacio son los conjuntos formados por matrices.

Si denotamos por J t mXn( K ) = J t mX„ al conjunto de todas las matrices de m filas y n columnas con elementos en el cuerpo IK, se ha demostrado en la sección 3 del capítulo 1, que satisface las mismas propiedades que los vectores, al menos cuando IK es el cuerpo de los números reales. Iguales resultados se obtienen si K coincide con C. En la misma sección en que se estudiaron las propiedades de las matrices se definieron operaciones con aplicaciones lineales de IRm en IR" y se estudiaron sus propiedades. Estas son análogas a las propiedades de las matrices. P o r tanto, el coftjunto L(IRm IR") de todas las aplicaciones lineales de IRm en IR" tiene la misma , estructura que los vectores en el espacio y las matrices. Cuando en varios conjuntos distintos aparecen estructuras similares es conveniente axiomatizar éstas y dar un nombre al ente resultante. L a principal ventaja que se obtiene es que estudiando esta estructura, quedan estudiadas todas las estructuras particulares que en ella se encuadran. Cuando en un conjunto se da una estructura similar a la de los ejemplos anteriores, se dice que se tiene un espacio vectorial.
D
e f in ic ió n

4) +Ü = Ü

D e (S3), (S4) y la propiedad conmutativa se deduce que Ü + ü*=CÍ y ( — u )

E j e m p l o A. 1) El conjunto de los vectores en el plano V2 o el conjunto de los vectores en el espacio V3 con las operaciones dadas en el capítulo 1 son espacios vectoriales reales. 2) El conjunto J í mXn( K ) = J í mxn de todas las matrices de m filas y n columnas con elementos en IK es un espacio vectorial sobre el cuerpo IK. E j e m p l o B. El conjunto IK" = {(x i, x 2, ..., x n / x j e K , j = \ , 2, ..., n} ) con las operaciones ( x 1( x 2, ..., x„) + (>'1 y2, ..., >'„) = ( x I + y 1, x 2 + y2, ...,x „ + y n , ) a (x l5 x 2, ..., x„) = (a x x, ax2, ..., ax„) es un espacio vectorial sobre IK, com o fácilmente puede comprobarse. En particular, IR" es un espacio vectorial real y C" es un espacio vectorial complejo. E j e m p l o C. Sea IR® el conjunto de todas las sucesiones de la forma (a„)^°=i = (aj, a2, ...), con í^elR, con las operaciones (fl.T= i + (¿>X= ! = ( « „ + i y a (a „r= , = ( a a X - 1 •

(Espacio vectorial)

------------ -----------------------------------------------------

propiedades:

w

(53) (54) (M I )

Existe un elemento de V, designado por 0 y denominado neutro, tal que u + ( ) = u para todo u de V. Para todo u de V existe un elemento,_designado por — u y denomina­ do opuesto de u, tal que u + ( — u ) = 0. 1u = u para todo u de K donde 1 denota el elemento unidad de IK.

w

.M

(52)

(Asociativa) u + ( tT+ vv) = (u + tT) + vv para todo u,v y w de V.

at

(51)

(Conm utativa) u +TT= 7 + u para todo u, ~ de V. v

em

at

ic w

U n conjunto V, cuyos elementos se denotan mediante u, V, w, ..., se dice que es un espacio vectorial sobre el cuerpo IK, si en él se han definido dos operacio­ nes: la suma, + , de manera que a cada par de elementos u y V de V se le hace corresponder el elemento u+~v de V, denominado suma de u y V, y la multiplica­ ción por escalares, de manera que a todo elemento u de V y a todo elemento a de IK se le hace corresponder el elemento áu de V, que satisfacen las siguientes

a1
Se deja para el lector la comprobación de que este conjunto es un espacio vectorial real con las operaciones que acabamos de definir. E j e m p l o D. Sea P K[ x ] el conjunto de todos los polinom ios en la variable x sobre el cuerpo IK, es decir, todos los elementos de la forma
n

(M 2 ) a(bu) = (ab)u para todo ¡ T d e F y todo a, b de IK. (M 3 ) (a + b ) u = á u + b u para todo u de V y todo a, b de IK. p(x) = a 0 + a 1 x + - - - + f l „ _ 1 x " “ 1 + a „ x " = £ ajxj , j =o En él definimos las siguientes operaciones: dados
n m

.c

om

(M 4 ) a(u + v’) = au + aV para todo u, ~ de V y todo a de K. v

0 ,-elK

Notas. 1) Los elementos de un espacio vectorial reciben el nombre genérico de vectores y en general se utiliza la notación indicada en la definición para denotarlos. Esto no es obstáculo para que en algunos casos particulares, por ejemplo, matrices o aplicaciones, se utilice la notación propia de cada caso. 2) Las propiedades de (S I) a (S4) se refieren a la suma, las propiedades ( M I ) y (M 2 ) se refieren exclusivamente a la multiplicación por escalares y las propie­ dades (M 3 ) y (M 4 ) son las distributivas de una operación con respecto a la otra. 3) Si IK es IR se dice que V es un espacio vectorial real y si IK es C se dice que V es un espacio vectorial complejo.

p (x )= I
j = 0

ajXJ

y

q ( x ) = £ bjXJ
j =0

con m ^ n su suma es
n m

p(x) + q ( x ) = £ (aj + bj)x i +
J= 0

£
j= n + 1

bjX}.

D ado a e K , definimos n a p ( x ) = Z (aaj)x i j =o Con estas operaciones P K [ x ] es un espacio vectorial sobre K. Si denotamos por Pfó’ Cx] al conjunto de todos los polinom ios en la variable x, de grado menor o igual que n, tenemos de nuevo un espacio vectorial, con las mismas operaciones que en P K [x ]. E j e m p l o E. Sea C ([a, fe]) el conjunto de todas las funciones continuas definidas

P r o p o s ic ió n

1_____________

El elemento neutro de un espacio vectorial es único.

Demostración. Supongamos que 0 t y 0 2 son dos elementos neutros de un espacio vectorial V; por ser Oí un elemento neutro se tiene que 0 1 + 0 2 = 0 2; por ser 0 2 un elemento neutro se tiene que 0 2 + Oj = 0 ^ p u e s to que 0 2 + O 1 = 0 '1 + O2 debido a la propiedad conmutativa, deducimos que O ^ O j , mostrándose así la unicidad del elemento neutro. _

P r o p o s ic ió n 2 ________________________________ ____________________________ ___________ El opuesto de cada elemento en un espacio vectorial es único.

en el intervalo real [a, fe] con valores en IR; con las operaciones ( f + g ) ( x ) = f ( x ) + g(x) y ( a f ) ( x ) = a ( f( x )) Demostración. Supongamos que el elemento ¡f posee dos opuestos y ~ 2; de la v definición de opuesto se deduce que u + v1 = 0. Sumando V2 a ambos lados de esta ecuación y utilizando las propiedades (S I), (S2) y (S3) de espacio vectorial se tiene que F2 + (u + F i) = ( tT + u ) + Fi = 0 + 2 tf2+ ( u + v ' 1) = v 2 + C)=Tf2 D e aquí deducimos que ^ = 1^. g ^

puede comprobarse que C ([a, fe]) es un espacio vectorial. El elemento neutro de este espacio vectorial es la aplicación nula. E j e m p l o F. Sea L(IRm IR") el conjunto de todas las aplicaciones lineales de IRm en , IR"; en la sección 3 del capítulo 1 se han definido operaciones en este conjunto y se ha visto que satisfacen las propiedades requeridas para ser un espacio vectorial real. E j e m p l o G. H a llegado el mom ento de mostrar algunas estructuras que no satisfacen todos los axiomas de un espacio vectorial. Si denotamos por D al conjunto de todas las matrices cuadradas con determinante nulo y en él definimos las mismas operaciones que en - í t mx „, D no es un espacio vectorial; para ello basta observar que

em

at

ic

a1 .M at

.c

om w w w

P r o p o s ic ió n 3_________________________________________________________ ______________ Para todo u de un espacio vectorial V, 0 - íT = 0 .

* - ( '

^0 o j

° 'l

y

J

b J °

Vo

1

0

Demostración. Tenemos la siguiente cadena de igualdades debida a varios de los axiomas de la definición de espacio vectorial i f = 1 •ü' = ( 0 + l)u = 0 •ü* + 1 u = 0 - u + u Esto implica que 0 -u es el neutro del espacio vectorial V, y por tanto, 0 - if = Ü. ■ P r o p o s ic ió n 4______________________________________________________________ _________

son matrices con determinante nulo, mientras que A + B tiene determinante 1. Tam p oco el conjunto de todos los polinom ios de grado exactamente n es un espacio vectorial con las operaciones definidas en P K [x ]. E j e m p l o H. U n ejemplo muy importante es el conjunto S(A) de soluciones del

sistema hom ogéneo ¿x=Ü , A e J í mX„(U) (I)

Para todo elemento u de un espacio vectorial V, ( - l ) i T es su opuesto.

donde x = ( x l5 x 2, ..., x„)elR ". Y a sabemos que 0 es siempre solución de (I) y de los resultados de la sección 2 del capítulo 1 se deduce que si x e j f son soluciones de (I) y aelR , x + y y ax son soluciones de I.

Demostración.

Tenemos que u + (- l)u = 1 ír + ( - l ) i T = ( l + ( - l ) ) i r = 0 -u = 3

Para terminar esta sección daremos algunos resultados que se deducen inmediata­ mente de las propiedades que definen un espacio vectorial.

en donde se ha utilizado (M I), (M 3 ) y la proposición 3. Puesto que el inverso es único, debido a la proposición 2 , queda probado el resultado. ■

P r o p o s ic ió n 5________________________________________________________________________ En todo espacio vectorial V, a - 0 = 0, donde a e IK y 0 es el elemento neutro de V

dependientes. En efecto, si F 1( ..., vn son linealmente independientes y suponemos, por com odidad de notación, que F ls ..., Ft, k ^ n, son linealmente dependientes tendríamos a^ + a2V2 H ------ 1- a*tfk= 0

Demostración, a- 0 = a(Ü + ()) = a -C Í+ a* (T; sumando el opuesto de a-T) en ambos lados se tiene a-C) = (), que era lo que queríamos demostrar. ■

con no todos los aj igual a cero; basta observar que, entonces,
1fliFi + a 2 tf2 H akj?k + 0Vk+ ¡ -i—

+ 0 I^ = (),

con lo cual los vectores originales serían linealmente dependientes. E j e m p l o A. Tres vectores no nulos en V2 son siempre línealmente dependientes. Para demostrarlo tomar 5.2. BASE Y D IM E N S IO N D E U N E S P A C IO V E C T O R IA L u = ( u u u2), Sea V un espacio vectorial sobre un cuerpo IK; un número finito de vectores tT r 2, —, F„ se dice que son linealmente dependientes si existen n elementos de IK, 1, au a2, - , an no todos nulos, tal que ,
0

-

t r = ( v ¡ , v2),

w = ( w u w2)

tres vectores cualesquiera de V2. L a igualdad a f i + a 2F + a 3vv = 0

i^ i + a 2 ^ 2 + — I" an% — 0

(*)

se traduce en

a1

Si los vectores tTj, tf2, ..., V„ no son linealmente dependientes, se dice que son linealmente independientes; por tanto, los vectores tfu F 2, ..., tf„ son linealm ente independientes si cualquier igualdad com o la que aparece en (* ) implica que todos los elementos de IK, at , a2, ..., a„, son nulos. Si en la igualdad (* ) an es no nulo, podem os escribir
_ — 1

om

fll M +^2^1 + a 3w l = 0 ) l a 1 + a2v2 + a3w2 = 0 j u2 que es un sistema de dos ecuaciones con tres incógnitas. Puesto que el rango de la m atriz de los coeficientes es inferior a 3, este sistema hom ogéneo posee infinitas soluciones. Basta elegir una no nula para tener el resultado deseado. Este resultado puede demostrarse también geométricamente com o puede apreciarse en la figura adjunta. L a recta que contiene a u y la recta que es paralela a ? y pasa por

decimos entonces que T „ es una combinación lineal de los vectores ~vl , V2, ..., ~ n'- i . En T v general, diremos que V es combinación lineal de los vectores v'l , tf2, ..., v si existen k "k números ax, a2, ..., ak de IK tal que tf = diVi + a2Tf2 H ------Haktffc . U n conjunto finito de vectores {tTj, ~ 2, ..., tT*} de un espacio vectorial V se dice que v es un sistema de generadores de V si todo elemento de V puede escribirse com o una combinación lineal de los vectores Fj, ~ — vk. v2, , Antes de exponer algunos ejemplos es conveniente realizar algunas observaciones. En primer lugar, observamos que todo conjunto finito de vectores que contiene al elemento neutro es linealmente dependiente; basta observar que f l ' 0 + 0 Éi>2 + " , + 0 'r „ = 0 para cualquier a e IK. En segundo lugar, observaremos que todo conjunto finito de vectores linealmente independientes no puede contener un subconjunto de vectores que sean linealmente

w

w

w

.M

V „ = ------- -------------V2 --------------------- Vn - !

at

al_

a2

em

at

ic

.c

el extremo de w se cortan en un punto B. Observar que si estas rectas no se cortan, u y tf son proporcionales y ya habríamos probado el resultado. En la figura se observa que ÓÉ + BA = w-, por tanto: au + b V = w lo cual prueba el resultado deseado. Este mismo razonamiento muestra que dos vectores linealmente independientes cualesquiera de V2 son siempre un sistema de generadores de este espacio vectorial. E j e m p l o B. En general, n + 1 vectores de IK" son linealmente dependientes; basta observar que esta afirmación se reduce a demostrar la existencia de solucuiones no nulas de un sistema hom ogéneo de n ecuaciones con n + 1 incógnitas (ver ejemplo A); este último resultado es cierto por el teorema de Rouché-Frobenius. En IR3 puede darse una demostración geométrica de este resultado. Supongamos que u ¡ , u 2 y u 3 son tres vectores de IR3 linealmente independientes. P o r el extremo de u 4 se traza una paralela a íT3 hasta que corte al plano que determinan u 1 y u 2. Tenemos que u4 = OS + BA

Este razonamiento muestra, además, que tres vectores cualesquiera linealmente independientes de IR3 son siempre un sistema de generadores de este espacio vectorial. E j e m p l o C. 1) Las funciones p0( x ) = 1, p ^ ^ x , p2(x) = x 2, ..., p„(x) = x" son linealmente independientes, ya que si tenemos la igualdad a0l + a 1x + a2x 2+ - - - + a n n= 0 x para todo x e IR se ha de tener a0 = al = a 2 = ■ ■ = a„ = 0 (véase el problema 15 de la ■ sección 4 del capítulo 2). 2) Las funciones f ( x ) = eos 2 x, g(x) = sen2x y h ( x ) = l son linealmente dependientes en C([0, 27i]), ya que eos 2 x + sen2 x = 1 * D e fin ic ió n 1 * *

_____________________________ ____________________________________

U n conjunto finito de vectores {F j , ~ 2,..., ~ e en} se dice que es una base de un espacio vectorial V si se cumplen las dos siguientes condiciones:

om

1) 2)

Los vectores ~ ~ 2, ...,~en son linealmente independientes, y eu e T o d o elemento T u ? 2>. de V es una combinación lineal de los vectores

em

at
Observar que la condición 2) de esta definición es equivalente al hecho de que el conjunto de vectores {e i, ~ 2, ..., ~ e en} sea un sistema de generadores de V Sin embargo, no todo el sistema de generadores de un espacio vectorial Fes una base; convénzase el lector por su propia cuenta de que tres vectores en V2, dos de los cuales son linealmente independientes, son un sistema de generadores de V2; sin embargo, no pueden form ar una base de V2, ya que son linealmente dependientes, com o se ha mostrado en el ejemplo A. E j e m p l o D. Si ^ = ( 0 , ..., 1, ..., 0 )e lK n donde el 1 ocupa el lugar j, se tiene que , { e 1,'e2,...,en} son linealmente independientes, ya que si

w

w

w

.M

at

ic

a1

.c

Puesto que ÓÉ es un vector del plano determinado por u 1 y u 2 se tiene que Ó É ^ a ^ l + a2u 2. U tilizando este resultado junto con el hecho de que BA = a3u 3 se tiene que u4 = a1u l + a 2u 2 + a3u 3. Si los vectores uu u2 y u3 fueran linealmente dependientes, se tendría una igualdad de la forma a l u l + a 2u 2 + a3u 3 = 0 y, por tanto, los cuatro vectores serían linealmente dependientes, ya que tendríamos la igualdad a l u 1+ a 2u 2 + a3u 3 + 0 - u 4 = 0. .

j= i

¿

a¡£j = ( 0 , 0 , ..., 0 )

se tiene que (au a2, ..., « „ ) = (0, 0, .., 0). P o r tanto, at = a2 = ••• = a„ = 0. Además, si x = (x j, x 2, ..., x „)e lK " se tiene que
n

x= X
j= i

X jT

j

P o r tanto, ( e 1, e2, ...,eh} es una base de IK", que recibe el nombre de base canónica de „ este espacio.

E je m p lo E. 1) El conjunto {1, x, X 2 , ..., x"} es una base de P ^ x ] , ya que son linealmente independientes de acuerdo con el resultado del ejemplo C, y todo polino­ mio p de grado inferior o igual a n puede escribirse de la forma p(x) = a0l + a Lx + a2x 2 H -------b a„x" 2) El conjunto {1, x, x 2, x "} no es una base de P K [x ], ya que el polinom io p(x) =

Puesto que 'e1>'e2,...,'en son linealmente independientes hemos de tener v1= v ' 1, v 2 — v'2, ..., v„ = v'„, que era lo que queríamos demostrar. * * *

U n mismo espacio vectorial puede poseer varias bases; nuestro próxim o objetivo es demostrar que todas ellas han de poseer el mismo número de elementos. P r o p o s ic ió n 2____________ ____________________________________________________________ Si V es un espacio vectorial que posee ,una base con n elementos, cualesquiera n + 1 vectores de V son linealmente dependientes.

= x " + 1 no es combinación lineal de éstos. E j e m p l o F. Las matrices

/I
£ l- ( o o/

í °


°/

í °

°\
°) Y

^

í °

0
1
Demostración. Sea una base de F y sean x u x 2, ..., x „, x n+ 1 cualesquiera n + 1 vectores de V; podemos escribir
n X l ~ n X 2 ~ n X n= n X n+ 1 =

£- ( o

3 -v

son una base de J 2 í 2 (K ). Son linealmente independientes, ya que (a x „ . E . + a A + ^ + a .-E .-^ a2\ /O 0^

X - x j l e j> j = 1

X X j 2 e j ’ •••> J=1

X Xjne p j = 1

£

Xj,n + lej j = 1

at

\c

d

ic

A .(‘
podemos escribir

b

a1

.c

om

implica a1= a 2 = a3= a 4 = 0. Además, si

ya que todo elemento de V es una combinación lineal de los vectores de la base. Tratamos de demostrar que podemos encontrar au a2, ..., a„, a„ + 1, no todos nulos, tal que a 1 x 1 + a 2 x 2 + - + fl(, x „ + a „ + 1 x I 1 + 1 = 0 Esto es equivalente a escribir (1)

w

w

w

.M

A — aE x

b E 2-\ c E 3-\ dE4 -

at

em

ai^ .¿

+

XJ2T j

Si {e\, ~ 2, ...,~en} es una base de un espacio vectorial V y V es cualquier elemento de e V podemos escribir ~ com o combinación lineal de e\, ~ 2, ..., ~ de la forma v e en Igualando las componentes se tiene
--------- h Unfi'n ~ V = V 1T 1 + V 2 e ' 2 -\

aiXJi + a 2 xJ2 + - - - + f l n j„ + an+ 1 xJ „ + i = 0 , x > con VjB K. L os números v¡, v2, ..., vn se denominan componentes de ~ con respecto a la v base 'eu 'e2,...,~en. Las componentes de un vector tf con respecto a una base son únicas, ya que si tenemos v’- v 1e1+ v2 e H ~ 2 ------- b vn e ~n

; = 1 , 2 , ..., n

que es un sistema de n ecuaciones con n + 1 incógnitas; puesto que el sistema es homogéneo, siempre ha de poseer una solución no trivial; esto demuestra el re­ sultado. ■ D e esta proposición se deduce un resultado un poco más general: en un espacio vectorial V que posee una base con n elementos, cualesquiera m vectores de V, con m > n, son linealmente dependientes. Basta observar que n + 1 de los m vectores dados han de ser linealmente dependientes, debido a la proposición 2 , y por tanto, todos ellos han de formar un conjunto de vectores linealmente dependiente. Este resultado se aplica en la demostración del siguiente teorema:

v = ü'iCi + v'tf>2 + ‘ ‘ ‘ + v¿ n se tiene también que Ü = (ü! - « i K i + ( v2 ~ v’ Í e i + ••• + (v„ ~ v'Jen i

T eorem a

3

______________________________________________________________________ — ------------------

Todas las bases de un mismo espacio vectorial V poseen el mismo número de elementos.

e j e m p l o G. Los vectores « ^ ( l , 0, 1, 0), « 2 = (0, !. °)> « 3 = (1, - 1 . 0, 0) y u 4 = (0, 0, 1, — 1) son linealmente independientes en IR4, ya que

/I Demostración. Sean { T u ~ 2, ..., e y {'e\, ~e'z, e*m} dos bases de V; p or el razonamiento anterior m ^ n, ya que en caso contrario los vectores de la segunda base serían linealmente dependientes. Similarmente, n iS m, ya que en caso contrario los vectores de la primera base serían linealmente dependientes. Se tiene, por tanto, que m = n. ■
0 1

0 1 0 0 - 1

1

°\
0 1

0 0

\o

- 1/

P o r la proposición 4 son una base de IR4, ya que dim(IR4) = 4. * * *

El número de elementos que posee una base cualquiera de un espacio vectorial V recibe el nombre de dimensión de V; este número será designado mediante dim (K ). Si el espacio vectorial sólo contiene un elemento, que necesariamente ha de ser su elemento neutro, es decir, V = { 0 } , diremos que V tiene dimensión cero. Las razones para dar esta definición se verán claramente más adelante. D e los ejemplos que hemos realizado anteriormente podemos deducir los siguientes resultados:
1) 2)

Una forma de encontrar una base de un espacio vectorial V es «a ñ a d ir» vectores a un conjunto de vectores linealmente independientes de V; la forma de «añ adirlos» se explica en la demostración de la siguiente proposición:

P r o p o s ic ió n 5________________ _______________________________________________________ de IK" es n, de Pft’ t x ] es n + 1 , Sea V un espacio vectorial de dimensión finita n; todo conjunto devectores linealmente independientes de V puede completarse para obtener una base, es decir, dados k vectores T lt ~e2, ..., ~ek, k < n , de V, linealmente independientes, existen n —k vectores e‘k+ x, T„ de V tal que elconjunto {e ~ 2, ..., ~ek, ~ek + l, ..., ~en} es una base de V. e

la dimensión la dimensión la dimensión

P r o p o s ic ió n

4_______________________ ________________________________________________

.M

at

em

En general, tenemos que la dimensión de J i mXn{ K ) es m x n .

at

ic w w w

3)

de J t 2* 2 W

es 4.

a1

.c

om

Sea V un espacio vectorial de dimensión n. T o d o conjunto de n vectores de V que sean linealmente independientes son una base de V.

Demostración. Puesto que k es inferior a n podemos encontrar un elemento de V linealmente independiente con 'e 1 ~e2, •• , •, en caso contrario, los vectores i?!, é*2, ..., e’b formarían una base de V Sea ~ek+ l este vector. El razonamiento se repite . con el conjunto { ? i , ..., ~ek, ~ek+ j } hasta encontrar n vectores linealmente independientes, que han de ser necesariamente una base, por la proposición 4. ■ * * *

Demostración. Sean u x, u 2, ..., u„ n vectores linealmente independientes; si ~ es v cualquier otro vector de V, los vectores tf, u ,, u 2, ..., u„ son linealmente dependientes por la proposición 2 ; por tanto, existen a0, au ..., a „ e K tal que a o V + a l u 1+ a 2u 2-\ ------l-a„tf„ = 0 con algún a7 # 0. El número a0 debe ser no nulo, ya que en caso contrario los vectores u 1, u 2, ..., u n serían linealmente dependientes. P o r tanto:

Supongamos que V es un espacio vectorial de dimensión finita n; acabamos de probar que k vectores linealmente independientes de V pueden «com pletarse» para obtener una base. Demostraremos a continuación que si S es un sistema de generado­ res de V, de él puede extraerse una base de V. Antes de demostrar este resultado necesitamos el siguiente lema:

Lem a 6 _______________________________________________________________________________ Supongam os que d im (F ) = n; sea S un sistema de generadores de V y supongamos que S = S l u S 2, donde S 1 y S2 son disjuntos. Si los elementos de S2 son combinación lineal de los elementos de S l5 S i es también un sistemá de generadores de V.

V = ------- U ! -------- U 2 ----------------- u n
a0 ao ao

y queda probado que {Jí1, u 2, ..., u„} es un sistema de generadores de K

Demostración.

Supongamos, para evitar com plicaciones de notación, que

Sx

= { e l , ..., é¡} y S2 = { 6*1 + 1 , e'm}- Puesto que los elementos de S2 son combinación lineal de los elementos de S 1 tenemos que i e'k= ' L aikr i> i= 1 Si

k = l+ \ ,...,m .

X* e K

puesto que

S

es un sistema de generadores de V, se tiene que
m

X =

X
i= 1

x ir i-

caso contrario, S se dice linealmente dependiente; es decir, S es linealmente dependiente si existe un subconjunto finito de él que es linealmente dependiente. U n espacio vectorial V en el que se puede encontrar un subconjunto S linealmente independiente y con infinitos elementos, se dice que tiene dimensión infinita. Los espacios vectoriales P K [ x ] y C([0, 27t]), introducidos en la sección anterior, son espacios vectoriales de dim ensión infinita. El conjunto S = { x B n e l^ } es un / conjunto linealmente independiente en P ^ O ] . El conjunto S = {cosnx, sen m x}„,m es sN un conjunto linealmente independiente en C([0, 2n~\). D e las dos últimas afirmaciones anteriores la primera es sencilla de demostrar; la segunda es más complicada y se pide su demostración por parte del lector en el ejercicio 13 de la siguiente sección; en este ejercicio se dan las sugerencias adecuadas para facilitar su resolución.

P o r tanto,
I
x = ' £ x le i + m l <+ m

i1 =
l

X x ke k = Z x ir k =I +1 i1 =
l / m X ka ik

X ** X «* <tí k=l 1 \ =1 + i
1 /
m

/

l

5.3.

C A M B IO D E BASE Supongamos que un espacio vectorial V de dimensión finita posee dos bases B = {é * i, r 2, ..., e„} y B = {é*/, e¡, ...,

= X Xt X ( X e¡+
i= l

\

Sea

S

un sistema de generadores de un espacio vectorial V de dimensión n;

at

em

at

P r o p o s i c i ó n 7 _ ------------------------------------------------------------------------------------------------------------

ic

a1

Esto prueba que S¡ es un sistema de generadores de V.

.c

om

/= 1 \ft = í + 1

/

) = X (X¡* X **«* ) ei "" e¡
¿= 1 \ k= 1 + 1 /

\

Denominaremos base antigua a la primera de ellas y base nueva a la segunda. Com o todo elemento de la base nueva se escribe com o combinación lineal de los elementos de la base antigua podemos escribir: e'í = al l 'e1 + a 2l~ 2 -I------l-tf„iC*„ e e2= a l 2 ^ l + a22^2~^------^an2K e„ « i né?i + a2ne2 -l- •■• -I- annen. (1)

podemos encontrar un subconjunto S x de S que sea una base de V Demostración. Elegir u 1e S tal que m / 0; esto siempre puede hacerse salvo en el *i caso en que K = { 0 } (si ^ = { 0 } la proposición es una trivialidad). Elegir a continua­ ción u 2e S tal que ü*2 es independiente con ¡Ti . Suponiendo que hemos elegido u !, u 2, ..., u k elegir u k+1 e S que sea linealmente independiente con los anteriores. Este , proceso se continúa hasta que es imposible encontrar vectores de S linealmente independientes con los anteriores. Sea

w

w

w

.M

Puesto que es conveniente que el lector se familiarice con notaciones abreviadas escribiremos ( 1 ) de la forma
n

Si = {u 1 «2, •• “ , •> ( }
el subconjunto de S obtenido de esta manera. P o r el lema anterior, Si es un sistema de generadores de V Debido a la elección realizada, los vectores de Si son linealmente independientes; por tanto, S t es una base de V. Se termina así la demostración de la proposición 7. * * * ®

ej

X @íjei, i= 1

j

1, 2

, ..., n.

Direm os entonces que la nueva base se obtiene de la antigua mediante la matriz / «ll
«21 «12 «22

«ln\ ” ■ « 2n

Terminamos esta sección haciendo unos comentarios acerca de la dependencia o independencia lineal de subconjuntos infinitos de un espacio vectorial. U n conjunto infinito S de elementos de un espacio vectorial V se dice linealmente independiente si cualquier subconjunto finito de S es linealmente independiente. En

donde la y-ésima columna de A son las componentes del vector ~e'¡ con respecto a la base antigua, 7 = 1 , 2, ..., n. L a m atriz A se denomina matriz del cambio de base.

Cuando, por necesidades de notación sea necesario hacer constar las bases B y B' escribiremos A = Mg

Tratem os ahora de relacionar entre sí las coordenadas de un mismo vector en las bases nueva B' y antigua B. Supongamos que j c e V , x = x 1 e i + x 2e 2 + ---+ x „ 'e n y además: (2 )

Si B y B' coinciden se tiene que = L a matriz I nx„ es invertible; esto sucede para cualquier matriz de un cambio de base, com o se demuestra en la siguiente proposición. P r o p o s ic ió n 1_---------------------------------------------------------------- ------------------------La matriz A del cambio de base de B a B' es invertible y su inversa es la matriz del cambio de base de B' a B. Podemos, por tanto, escribir: M l= {M % )~ l = A - '

x = x 'l- ¡ + x'2é'2+ ---+ r n e x'n
Sustituyendo en (3) las expresiones dadas en ( 1 ) obtenemos

(3)

I

a¡i?¡ ) + x'2( Z ai2ei ) + - - - + x'„

z

= (« i 1* 1 + a 12x'2 + ■ ■+ a lnx'n) e t + (a2 lx\ + a22x 2 + • • • + a2nx ' J e 2 + ■

+ ' •■+ K i * i + an2x'2 + ■■ amx'„)rn ■+ Com parando esta última igualdad con (2) podemos escribir Demostración. Para demostrar que A es invertible es suficiente demostrar que su determinante es no nulo (véanse los resultados del capítulo 2). Ciertamente, el determinante de A es no nulo, ya que de lo contrario sus columnas y, por consiguiente, los vectores ~e¡, ~ 2, ..., T n de la base B', serían linealmente dependientes. e , Sea A ' = (a'ij) i¡J=1 „ la matriz del cambio de base de B' a B; hemos de demostrar que A ' = A ~ l . P o r definición de A' tenemos
n

x 1— a u x i + a 1 2 X2 H ------ 1- alnx'n

.c

om

x 2 = a21x'1 + a22x'2 H ------ \~a2nx'„ Xn í3nlXj + @n2x 2 “t" ’ *‘ “1 an “ nXn.

at

ic

a1

em

/ * i\ Si convenimos en escribir X = x2 yX' = \x„l

l x 'i\ x'i a las componentes del vector x en la \<l

w

por definición de A tenemos

w

w

.M

í= 1

2

,

at

X auF í' J = l,

antigua y en la nueva base, respectivamente, (4) se escribe brevemente de la forma X = AX' Esto nos permite obtener las coordenadas del vector x* en la base antigua conociendo las coordenadas del mismo vector en la nueva base.

e j=

Z
k= i

n

i

1, 2

, ..., n.

P o r tanto,

ej ~

Z
i= l

a ¡j( a ki e k \ = a kia i j j e k\k = 1 / k= 1 \ ¡= 1 /

X

Z

(

Z

E je m p lo A. Dadas las bases

Sea ^ = ( 1 , 0, 0), é * = (0, 1, 0), é 3 = (0, 0, 1) la base canónica de IR3. 2 T

n

Puesto que Z akia\j es el elemento que ocupa el lugar (k, j ) en el producto de lasi= 1

U i = T i + T 3,

u

2 = ? 2,

U 3 = ~ e 2 + ~e3

matrices A y A' se tiene que I nXñ = M i = AA'. Esto demuestra el resultado deseado.

y
u¡ = e'l — e’ , 2 u2=~e2, u3 = 2 e 1 + F 3 encontrar las coordenadas del vector x = 3 u 1 + 2 u 2 en la base {w/, u2, iT3}. Comenzar observando que ambos conjuntos son bases de IR3. Podem co escribir x = 3(e\ + F3) + 1e2 = 3 ^ + I e 2 + 3~e3. El problema queda reducido

a encontrar la matriz del cambio de base de { e u e2, e 3} a {u\, u'2, i f 3}. D e las expresiones dadas deducimos que la matriz del cambio de base es I / !=
- 1

Las coordenadas antiguas a través de las'nuevas vienen dadas por í x i \ _ í cos<P — sen <j)\/x\\ eos 4>J\x’ J 2 * * * x 1= x ' 1cos<f> — x'2 sen<j) x 2 = x\ sen (j>+ x 2 eos 4 >

10
1

2\
0

\x 2 /

Vsen < P

\

0 0 1/

Escribiendo x = x'l u\ + x'2u'2 + x 3u 3, por los resultados anteriores tenemos que E JE R C IC IO S (S E C C IO N E S 5.1, 5.2 y 5.3) / 1
0

2 \ [x 'A

x2

=>

1. a) Decir si el conjunto F = {/ e C ([0 , 1])/ 2 / (0 )= / (l)} es un espacio vectorial con las mismas operaciones que las definidas en C ([0, 1]). b) Decir si el conjunto
l 3 \

“ 2\

-3 \
-1

^ Je >^ 2 * 2 ^ ) /

^ — fe + C+ íí = 0

1/ P o r tanto, x = — 3u¡ — u'2 + 3if3

3/ es un espacio vectorial con las mismas operaciones que las definidas en J¡f2 x l (U).

at

Sean ~ex, ~ dos vectores perpendiculares unitarios en IR2 en la e2 dirección de los ejes de coordenadas cartesianas. G irando los ejes de coordenadas un ángulo < en sentido positivo (contrario a las agujas del reloj) se obtiene una nueva f>
Eje m plo E.

a1

.c ic em

2. Estudiar si las siguientes familias de vectores son linealmente dependientes o independientes:
a) b) c) {(1, 2), (0, 1)} c IR2. {(1, 0, 0\ — 1)} <= C 2 (com o espacio vectorial sobre €). {e,nt, em 1), + cz Cc ([0, 1]), donde C c ([0, 1]) denota nuas definidas en [0, 1] con valores en C. lasfunciones conti­

w

~ e [ = (eos 0 )é \
e"2 = eos + <pj ~ + sen ^ ex

+

(sen (p )~ e 2

.M

at

base ~e[, ~ 2. ¿Cuál es la matriz del cambio de base?. e En el dibujo se observa que

om w

+ </>^F2 = - (sen <t>)~el + (eos 0 )e * 2

d {(í “!)•(-! )
e) {sen nt, sen 2nt} c C R([0, 1]). 3. Encontrar los valores de z para los cuales los vectores (z, 1, 0), (1, z, 1) y (0, 1, z) son linealmente dependientes en C 3.

con lo que la matriz del cambio de base es ¡> ^eos < A= sen < p — sen < f> eos < fi

w

4. Dem ostrar que en puede definirse una estructura de espacio vectorial real. ¿Cuál es la dimensión de este espacio? 5.
a) Estudiar si los siguientes conjuntos sonbases delespacio vectorial {1, x + 3, ( x + 3)2, ( x + 3)3} en PÍr3 ) [x ]. dado:

C 2

b «¡ i}(i '} (ó!}(! )
{(! !}(_; '!)("! _!}(_ í
6.

Encontrar una base de R 4 que contenga a los vectores (0, 0, 1, 1) y ( 1 , 1, 0, 0).

7. Estudiar si las aplicaciones lineales /1(/2, f 3 y h dadas por /^X j, x 2) = ( x l5 — x 2), /2(x i, x 2) = (x !, x 2) , f 3( x u x 2) = ( 2 x 1, x 2) y /4(x 1; x 2) = ( x , + 2 x 2, x 2) forman una base de L ( U 2, IR2).
8.

es linealmente independiente en C([0, 2n]). [ Sugerencia: observar que 2n (% 2n (eos 2

Sean p t(x), p2(x),

pk(x) polinomios y supongamos que

o

nx)d x /

0,

Jo

(sen 2 m x ) d x / 0 , n, m e N

P l(fll)
p l ( f l 2)

P i(a i) Piiai)

• • ' •

Pk(a i) PÁ ai)

(eos nx)(cos mx) dx =
# 0

(eos nx)(sen mx) dx =

(sen nx)(sen mx) dx = 0
Pi(ak)

P 2( a * )

• •

P k( a k)

si n # m , n, m e fU ] para algunos números reales ay Demostrar que el conjunto {p i(x ), p 2 (x), ..., p*(x)} es linealmente independiente en P r [ x ] . Dada una matriz A e J t f „ x„(IK) definimos su traza com o la suma de los elementos n de su diagonal principal; es decir, si A = ( a ij)ij = i traza (A ) = £ au. D em ostrar que i= i 9. 14. Sea V un espacio vectorial de dimensión n y B = { e x, ..., ~e„} una base de V. Sea A
= (a ij)ij=i,..,n una matriz de orden n con determinante no nulo. Dem ostrar que

n e ¡ = £ flyr „

j = í , 2 , .., n

om ic a1 .M at em at .c w w w

T = { A e J Í nXn(K)/

traza [A ) = 0}

es una base de V. (Observar que este resultado es el recíproco de la primera parte de la proposición 1 de la sección 5.3.) 15. D ecir para qué valores de a los vectores Ü 1 = (a, 0, 1), u 2 = {0, 1, 1) y u 3 = (2, —1, a) form an una base de IR3.

es un espacio vectorial con las operaciones definidas en J ( nxn(K). ¿Cuál es la dimen­ sión del espacio T? 10. a) Dem ostrar que los siguientes conjuntos son bases de IR4: ^ = { ^ = ( 1 , 1 , o, 0 ), ir2 = (o , i, o, 0 ), tf3 = ( 0 , o, i, 1 ), tt4 = ( 0 , o, o, i ) } B 2 = { S Í = (1 ,2 , 0, 0), u2 = (0, 1,2, - 1 ) , u3 = ( l , - 1 , - 1 , - 1 ) , iT4 = (0, 1, 1 ,0 )} b) B 211. Sea ~ ~ 2, ..., ~ k la base canónica de IR" y sea « i =~e2 —~ u2=~e3—~ 2, ..., ¡f„ _ x =~e„ eu e e e1, e Encontrar las componentes del vector V = 3 V l —F 3 + 2V 2 con respecto a la base

5.4.

S U B E S P A C IO S V E C T O R IA L E S . IN T E R S E C C IO N Y S U M A D E S U B E S P A C IO S V E C T O R IA L E S

Algunos subconj untos de un espacio vectorial V son a su vez espacios vectoriales con las operaciones definidas en V; estos subconjuntos especiales reciben el nombre de subespacios vectoriales de V D e f i n i c ió n 1 (Subespacio vectorial) _______________________________________________

- e n- u K = K a) Dem ostrar que { « i , u2, ..., un} es una base de IR".

U n subespacio vectorial de un espacio vectorial V es un subconjunto Vx de K que a su vez es un espacio vectorial con las operaciones definidas en V.

b) Expresar el vector x = é'l + ~ -I------ 1-~e„ com o una com binación lineal de los e2 vectores u1, u2, ..., un. 12. Dem ostrar que el conjunto S = { ( x + 1), ( x — 1), x 2— 1, x 2 + 1} es un sistema de generadores de / ^ [ x ] . Encontrar un subconjunto S t de S'que sea una base de Pltj’ Cx], 13. Dem ostrar que el conjunto

Para demostrar que un subconjunto es un subespacio vectorial no es necesario com probar de nuevo que satisface todas las propiedades de espacio vectorial. En realidad, es suficiente demostrar que la suma de dos elementos de Vx es otro elemento de Vx y que la multiplicación de un elemento de V1 por un elemento del cuerpo IK es otro elemento de V{, es decir: 1) Si u, F e Vu u + F e V¡ Si a e IK y u e Vx, au e Vl .

S = {cosnx, sen m x}„> ¡sN m

2)

En efecto, las propiedades (S I), (S2), (M I), (M 2), (M 3 ) y (M 4 ) se cumplen en por cumplirse en el espacio más grande V; además, 0 ■S* = 0 £ K, y ( — l)u* = — u e V 1 debido a 2), lo cual prueba que las propiedades (S3) y (S4) son también ciertas en Vl .
E j e m p l o A. a) Todas las rectas y planos que pasan por el origen son subespacios vectoriales de IR3. b) Ppj [ x ] es un subespacio vectorial de P R[ x ]; a su vez, P H[ x ] es un subespacio

2

« i y u2 son linealmente independientes, mientras que u3 depende linealmente de los dos primeros. P o r tanto, U u i , u2) = L (u l , u2, u3) y este subespacio vectorial tiene dimensión .

E j e m p l o C. D ada una matriz A de m filas y n columnas y de rango r todas las soluciones del sistema de ecuaciones homogéneo

vectorial de C(IR). c) Los subconjuntos { 0 } y V son siempre subespacios vectoriales de V; éstos reciben el nombre de subespacios vectoriales impropios de V y el resto se denominan propios. * * * Además de ser intuitivamente claro no es difícil demostrar que si V es un espacio vectorial de dimensión finita n, cualquier subespacio V¡ de V tiene dimensión que no supera a n.
E j e m p l o B. Sea S = {ü*!, u 2, ..., «*„} un conjunto de vectores de un espacio vectorial V. Definimos

/tx* = 0, son de la forma

x e lR "

(i)

------1- akuk x = a í ul + a2u2 H donde k = n — r, a^e K¡ y los vectores u¡ son linealmente independientes (véase proposi­ ción 3 de la sección 1.2 del capítulo 1). P o r tanto, las soluciones del sistema homogéneo (I) constituyen un subespacio vectorial de dimensión k = n — r de W . Además, íTj, u2, ..., uk es una base de este subespacio. Recíprocamente, todo subespacio vectorial de IR" puede determinarse por un sistema de ecuaciones lineales homogéneas. Sea V¡ un subespacio de IR" de dimensión k y sea ~e[, ~ 2, ..., ~ k una de sus bases. Completam os esta base hasta obtener una base e e

U S ) = L {u l , u2, ..., «n) = | ¿

ajUj/

a j e K , j = 1, 2, ..., n|.

.c

om

í?i, e2, ..., ek, e k+ 1, ..., e„ de IR". Es claro que si x =x\~e[ + x!2e2 ------b x '„ ^ el vector x pertenece a V¡ si y sólo si X í + i = 0 , ..., xñ = 0 . / Además, si x = x 1 'c1 + x 2e2 H ------h x„e’„, donde {~eu ..., ~ n\ es la base canónica de IR", e realizando el cambio de base adecuado, se tiene que
® = x ' k + l = a k + l , l x l "I------ ^ a k + l , n x n ® = X ' k+2 = a k + 2 , l X l~\------ 1~a k + 2. nX n

a X

ai ai =

X

(a a ¡)U je L (S ).

i =i

J= i

Este subespacio vectorial recibe el nombre de subespacio vectorial generado por S. Los vectores ¡T„ u2, ..., u„ son un sistema de generadores de L(S); de ellos se puede elegir unos cuantos que sean base de L(S) (proposición 7, sección 5.2). P o r tanto, la dimensión de L(S) no supera a n. P o r ejemplo, los vectores ut = (1, 0, l ) , í f 2 = ( — 1, 1 , 0) y if 3 = (1, 1, 2) son linealmente dependientes en IR3, ya que
1 0 1 -1 1 0 1 1 2 C2+2C, 1 0 1 1 1 2 1 1 2

w

w

w

.M

£ ajuj + X bjUj = X (aj + bj)Uj £ L(S) j =i j= i j= i

at

em

at

El conjunto L(S) es un subespacio vectorial de V, ya que

ic

a1

0

Xn

"I“

Cn ln Xn

que es un sistema hom ogéneo de n — k ecuaciones con n incógnitas que determina el subespacio V1. * * *

c 2 =c.

0.

Dados dos subespacios vectoriales V1 y V2 de un espacio vectorial V podemos definir su intersección Vi n * 2 = {íí/w*e Vl y u s V2j y su suma

P o r tanto, L(ui, u2, S es un subespacio vectorial de IR3 de dimensión inferior a 3. *3) Puesto que

1 0

-1 1

= 1
V1 + V2 =

{Ui +

u 2¡u^ e Vu u 2 £ V2}.

C om o puede comprobarse fácilmente estos dos nuevos subconjúntos son también subespacios vectoriales de V. L a relación que existe entre las dimensiones de estos subespacios vectoriales y las dimensiones de los subespacios Vl y V2 queda plasmada en el siguiente resultado:
P r o p o s ic ió n _______________________________________________________________________________________

E j e m p l o D. D os subespacios vectoriales Vx y V2 en IR3, ambos de dimensión 2, que se cortan en una recta, han de tener una suma que coincida con todo IR3, ya que d im í^ + K2) = d im (F 1 + dim (K 2) - d i m ( K 1 n K2) = 2 + 2 - l = 3 ) * * *

d im (K 1) + d im (l/ ) = d im (F 1 + K2) + d im (F 1 n V2) , 2 para cualesquiera subespacios vectoriales Vl y V2 de un espacio vectorial V de dimensión finita.

D e f i n i c ió n 3 _______________________________________________________________________ U n espacio vectorial V es suma directa de dos de sus subespacios Vl y V2 si:

1) v1+ v2= v:
2) V1 n V2 = { 0 }. Utilizarem os la notación V = © V2 para indicar que V es suma directa de los subespacios vectoriales V1 y V2.

Demostración. obtener una base

Sea e t , ..., T¡ una base de Vx n V2; com pletar esta base hasta

e de V¡ y una bas&\

..., e ¡ , f ¡ + 1 ,

Observaciones. 1) El plano IR2 puede escribirse como suma directa de dos rectas no coincidentes que pasan por el origen.

es una base de Vl + V2. D e aquí se deducirá que d i m ^ + V2) = l + ( k - [ ) + (m — [) = k + m — l =

w

.M

at

em

at

ic

S = {e i, ..., e¡,/ ;+ 1 > •••,/*, 9 i+ i> ••> 9m} •

a1

de V2. Demostraremos que

.c

om
2) El espacio IR3 puede escribirse com o suma directa de un plano que pasa por el origen y una recta que le corta en este punto. 3) D e la proposición 2 deducimos que si V = © V2 se tiene que d im (K ) = d im (F i © K2) = d im (F 1 + d im (F 2) ) ya que el subespacio vectorial im propio { 0 } tiene dimensión 0 . Si V = V¡ + V2 todo elemento V e V puede escribirse de la forma ~ = v’l + v'2 con v ü*! e V1 y V2 € V2. Si la suma es directa, esta descomposición es única: P r o p o s ic ió n 4_______________________________________________________________________ i Sean V¡ y V2 subespacios vectoriales de un espacio vectorial V. Las siguientes afirmaciones son equivalentes:

e¡, ■■ e¡, g¡ + 1, ..., gm ■,

que era lo que queríamos demostrar. Para demostrar que S es una base de V1+ V2 basta demostrar que S es un conjunto de vectores linealmente independientes, ya que debido a la construcción realizada resulta claro que todo elemento de V1+ V2 es una combinación lineal de elementos de S. Supongamos, por tanto, que tenemos una expresión de la forma ai£\ H ------\-a¡e¡ + bl + 1 / , + 1 H ------\-bk k + cl+1g l + 1-{------\-cm = 0. f gm El vector iT = a 1 é*1H -----ha{él + bl + í f l + í -\ -------\-bkf ke V l coincide con — ci+ 1 g ¡ + 1 ----— cm e V2 y, por tanto, es un elemento de Vx n V2. C om o V1 n V2 está generado por gm los vectores ~ ..., F, hemos de tener c( + 1 = - - - = c m= 0. P o r tanto, la igualdad anterior eu se transforma en a{ei H ------ha¿el + bl+1f l+ 1 -\ \-bkf k= 0

w

w

= d im (F 1 + d im (F 2) — d im (F 1 n V2) )

1)
2)

v=vl ® v2.
Para todo V e V existe una descomposición única de la forma ~v= con e Vx y tf2 e V2. + V2,

Puesto que { e lt ..., ~ b J l + l , . . . , J k} es una base de Vj deducimos que a 1= - - = al = bl + í e = ■ ■ = b k= Q. Esto termina la demostración. ■ ■

Demostración. Para demostrar que 1) implica 2) es suficiente probar la unicidad; supongamos que 7 = 7 x + 7 2 y 7 = u l - t u 2 con 7 U ui e V, y 72, 72 e K2. Tenemos ¡Ti + IT2 = « ! + u 2

que guarda similitud con la afirmación 2) de la proposición 4. Diremos que V es suma directa de los subespacios vectoriales Vu V2, ..., V„, y escribiremos V = V l ® V 2® - : @ V n o

o bien

v = e v i
7 ¡ — í f 1 = U’ — 7 2. 2

i= 1
n

L a parte izquierda de esta igualdad es un elemento de Vu mientras que la parte derecha es un elemento de V2. Puesto que 0 es el único vector que V¡ y V2 tienen en común, deducimos que 7 1— ul = u2—72 = 0 P o r tanto:

si todo vector 7 de V tiene una descomposición única de la form a 7 = Y, % con i= 1 ( = 1 , 2 , ..., n.

e

Si n = 2, la proposición 4 muestra que esta definición de suma directa y la dada anteriormente son equivalentes. Si n ^ 3 se pide demostrar en el ejercicio 6 al final de esta sección que una condición equivalente de suma directa es la siguiente:

1) ul = 7 l y u2 = 72

Í v t= v i= 1 V¡ n ^ = { ^ } Para t 0 í *0 1 = n

a1 em at ic

que era lo que queríamos demostrar. Para demostrar que 2) implica 1) es suficiente demostrar que V1 n V 2 = {0 } . Si v’ e V i n V2, podemos escribir 7 = T + 0 = 0 + tf. T Puesto que la descomposición ha de ser única se tiene que 7 = 0. Esto prueba el resultado deseado. * * * ■

.c
A partir de aquí puede demostrarse que

om

2)

d im ^ ®

¿

dim (l^),

w

.M

at

Tam bién podemos definir la intersección, la suma y la suma directa de más de dos subespacios vectoriales. En general, dados n subespacios vectoriales V¡, V2, ..., V„ de un espacio vectorial V definimos n P) V¡ = {u eV/u e V ¡ para todo j — 1, ..., n}
j= i

w

lo cual se obtiene aplicando repetidas veces el resultado ya conocido cuando n es igual a 2.

w

E JE R C IC IO S 5.4 1. Los siguientes subconjuntos y familias de vectores de algunos espacios vectoriales son subespacios y bases de éstos. Verificar la verdad o falsedad de esto en los ejemplos siguientes: a) b) {(a, fc )e R 2 / b = l } ; { ( 2 , 1 )} {p (x )e P t 3 ,[ x ] / ( x - 1 ) divide a p(x)}; { x - 1 , x 2- 1 } c o m ( B ) = { A e J i 2x2(U )IB A = A B } con

y
£ Vy= | ¿ Uj/ñj e V p j = 1, ..., n j

c) que reciben el nombre de intersección y suma, respectivamente, de los subespacios vectoriales dados. Estos dos nuevos subespacios son también subespacios vectoriales de V. L a definición de suma directa de varios subespacios vectoriales es un poco más complicada en general, que si solamente hay dos. L a definición más razonable es la 2. a) b)

B^ 2 {(o = )’

2

) ’ (l

o )}
de los elementos

Estudiar si los siguientes subconjuntos de J t 2x2(lR) son subespacios vectoriales: R = { A e J t 2* 2 ( ^ ) ! r(A ) = í } donde r(A) designa el rango de A. r = { y 4 e ^ 2 x 2 (R )/ tra za (> l)= 0 }, donde traza(,4) denota la suma de la diagonal principal de A.

3. Encontrar la dimensión del subespacio generado por los siguientes conjuntos de vectores: a) {(1, 2), (0, 1), ( — 1, 3)} en R 2.

son un subespacio vectorial de R" de dimensión k = n — r. Este subespacio vectorial, que denotamos por S(I), es un subespacio vectorial generado por k vectores linealmente independientes « j , u2, ..., uk que sean solución de (I); es decir: S(I) = L(t/i, u2, ..., uk). Si consideramos el sistema no homogéneo Ax =b, x e R", F e R m (II)

b {(ó il,-) (‘o ) '
4.
H allar en cada uno de los ejemplos siguientes la suma y la intersección del par de subespacios dados, y com probar que se verifica la ecuación d im (í/ ) + d im (F 2) = d im (F 1 + T2) + d im (F 1 n V2) 1 / a) b)
^2

sabemos que sus soluciones pueden escribirse de la forma x ^ i f + CiifiH------hckuk, Cje R (teorema 2, sección 1.2, capitulo 1). P o r tanto, si denotamos por S (II) al conjunto de las soluciones de (II), podemos escribir S (II) = 7f + S(I)

V1= com ^ = {p (x ) e

V2 = com ^
1 [x]/.x

^

(ver el ejercicio 1 para la definición de com (B)).

+ 1 divide a p(x)},

= {p W £ P fc 3 ) M / * — 1 divide a p(x)\

c)

L {s e n t, eos t}, L ( e u, e ~ u) considerados ambos com o subespacios del espacio vectorial real C c ([0, 1]).

a)

— {A e J í 2 x 2{C)/A = A '} (matrices simétricas) sé = { A e J t 2 x 2 (C)/í4 = — A '} (matrices antisimétricas)

b)

P = { f : [ — 1, 1 ] i— R//( — r )= / (t )} (funciones pares) > / = {/ : [ — 1, l]i-> R / / ( — t) = —f ( t ) } (funciones impares)

V2 = { / : [ - 1 ,

1] i-» R//(í) = 0, t ^ 0}

6 . Sean V1, V2,V„ subespacios vectoriales de un espacio vectorial V Dem ostrar que si n ^ 3 las siguientes afirmaciones son equivalentes:

w

w

c)

Vl = { f : [ — 1,

1] i— R//(t) = 0, í ^ 0} ►

w

[,Sugerencia: g{t) = (g(t) + g (-1))/2 ) + ( g { t ) - g ( - í))/2 )]

.M

at

em

at
..., n. Este conjunto se obtiene trasladando S(I) = L ( u l , u2, ..., uk mediante el vector V. Si k = 1 ) se obtiene una recta, si k = 2 se obtiene un plano y, en general, si k > 2 los objetos que se obtienen se denominan k-planos. Tod os ellos reciben el nombre de variedades lineales. Este tipo de construcción puede hacerse no solamente en R", sino en otros espacios vectoriales. Sea 3P un conjunto de elementos, que se denominarán puntos, y F un espacio vectorial. El par (á'*, V) recibe el nombre de espacio afín, A, si todo par ordenado M , N de puntos puede ponerse en correspondencia con un solo vector Tf de V, lo cual escribiremos de la forma M N = ~v, y que satisface las siguientes propiedades: 1) 2) Para todo punto M y para todo vector ~ de V, existe un solo punto N tal que v M N = Tf. Escribiremos entonces N = M+TT. Para cada tres puntos M , N y P se tiene que M N + W P = M P .

n

a)

V= © ^ i= 1 V = Y ,V ¡y K 'n ( Z % ) = {0^} Para t°d o i = 1,

b)

5.5.

V A R IE D A D E S L IN E A L E S . E S P A C IO A F I N

En el ejemplo C de la sección anterior se observó que si A es una matriz de m filas y n columnas de rango r, las soluciones del sistema hom ogéneo Ax = 0 , x e R"

(I)

ic

a1

.c

om

5. D ecir cuáles de los siguientes pares de subespacios se suman directamente y cuál es la suma (directa o no) en cada caso:

En la primera etapa el cambio de sistema de referencia se realiza de la siguiente manera, si (x x, x 2, ..., x„) designan las coordenadas del punto X con respecto al sistema de referencia 3 , y (p u p2, ..., pn las del punto P con respecto a 01 se tiene que 9 ) M
Figura 2

Ó l = ÓP + P X por tanto: (x l5
X 2,

(X l , x 2, ..., x„) = (P l , p2, ..., p„) + (x'1; x i, ..., x ’ ); n

..., x n = ( x l — Pj, x 2 — p2, ..., x„ — p„). )

En muchas ocasiones el conjunto & de puntos y el espacio vectorial V coinciden com o conjuntos; éste es el caso de IR2, IR3, o en general, de IR" o C". El espacio afín A se dice que tiene dimensión n si el espacio vectorial V subyacente a A es de dimensión n. T o d o subconjunto de A de la forma P+Vx donde P es un punto y Vx es un subespacio vectorial de V, recibe el nombre de variedad lineal de A. C om o casos particulares de variedades lineales podem os citar las rectas, los planos y, en general, los hiperplanos en IR". * * *

En la segunda etapa se trata de realizar únicamente un cambio de base en el espacio vectorial subyacente: si (x'/, x 2, ..., x¡¡) son las coordenadas del punto X con respecto a ® " y A es la matriz del cambio de la base { e x, ? 2, .., e„} a la base {uu u2, ..., « „ } se tiene que / x i\ = A
\ <l

jx '{\
X

Com binando los resultados de estas dos etapas se tiene:

a1

En un espacio afín A un sistema de referencia está form ado por un punto O, que se considera el origen, y una base { e*l 5 ~e2, ..., ?„} del espacio vectorial subyacente. Utilizarem os la notación M = { 0 \ e u ? 2, ..., en} para designar este sistema de referencia. D ado un punto X , existe un vector x de V que está en correspondencia con el par de puntos O, X ; si x = x l e*! + x { e 2 H ------ 1- x„~e„ diremos que (x 1 x 2, ; x n) son las coordenadas del punto X con respecto al sistema de referencia 0t. P o r abuso de notación escribiremos ------ 1- x„e„. O X = x 1 í + x 2e2 H T D a d o un nuevo sistema de referencia 01" = {P ; u u u2, ..., u¡,} en el espacio afín, las coordenadas del punto X con respecto a este nuevo sistema de referencia serán distintas de las anteriores. Para encontrar estas nuevas coordenadas (x'/, x 2, ..., x'„') de X con respecto a M " procedemos en dos etapas: a) b) Cam biamos el sistema de referencia 01 a 3? = { P; ~ , ~ 2, el e solamente hemos variado el origen. Pasamos de M ' a 0t" dejando fijo el origen y realizando el cambio de base en el espacio vectorial subyacente. T„}, de manera que

om

.c

I X1\ x2 = A~1 \ x 'j

/ X l-P l\ n \ X2 = A~' x2 - p 2 = - A - 1 \Xn~Pni f P l\ P2 + A~l í X l\ X2

em

at

ic

\ x j

\pj

\ x j

at

w

.M

que nos da las coordenadas de X con respecto al sistema de referencia 0t " .
E j e m p l o A. Sea X un punto de coordenadas (3, 4) en un sistema de referencia á? = {0', elt e2} del espacio afín IR2 y sea -W = {P ; uu u2} un nuevo sistema de referencia,

w

w

donde P tiene com o coordenadas (1, 3) con respecto a 0t y ^ = ^ + 2 ^ , u2 = 2e'í —~ 2. e Las coordenadas del punto X con respecto a 01," son

-K :; hg - M - e

E j e m p l o B. Sea S l = { 0 ; ~e2, ~e3 } un sistema de referencia en R 3 con respecto al cual el plano n tiene de ecuación x 1 + x 2 + x 3 = 2. Sea ¡X = {P; u2, u3} un nuevo sistema de referencia tal que P = (l, 1 , 0 ), « i = — e^ + e^, u2 = — ~e2 + ~ e 3 y u3 = e l + e 2

CAPITULO 6

+ ~ 3. e

Para encontrar la ecuación del plano n con respecto a S í observamos que ( x l5 x2, x 3) = (l, 1 , 0 ) + í( — 1 , 0 , l) + s(0 , — 1 , 1 ) son coordenadas paramétricas del plano 7 por tanto, las coordenadas ( x l5 x 2, x 3) de t; un punto X de n se transforman en (x\ x'2, x 3) de manera que , / - í\
1 - 2 1 1 1

APLICACIONES LINEALES ENTRE ESPACIOS VECTORIALES

—s / \ t+ s j

\

1

6.1. 6.2. 6.3. 6.4. 6.5.

Definición de aplicación lineal. Ejemplos M atriz de una aplicación lineal. Operaciones con aplicaciones lineales Cambio de base para aplicaciones lineales Aplicaciones lineales inyectivas y suprayectivas. Núcleo y rango de una aplicación lineal El espacio dual de un espacio vectorial

ic

a1
6.1.

.c em at
D E F IN I C IO N D E A P L I C A C I O N L IN E A L . E J E M P L O S

P o r tanto, x 3 = 0 es la ecuación del plano n con respecto al sistema de referencia Sí.

E J E R C IC IO S 5.5 1. En el plano, y respecto a la referencia canónica á?, se dan los puntos A = ( 1, 1) y B = ( - 2, 0), los vectores ^ = ( 1 , 2 ) y u2 = ( - 1, 1) y la recta r = x 1 - x 2 = l. Hallar: a) b) Las coordenadas de B con respecto al sistema de referencia S í = {A; mí,íT2}. L a ecuación de la recta r con respecto a SI'. un ángulo a en = (x ! — l ) 2 + x 2 ecuación de C a S il

w

w

w

.M

at

om
En la sección 3 del capítulo 1 hemos definido el concepto de aplicación lineal de R" en R m Recordamos que en ese contexto toda aplicación lineal quedaba determinada . por una matriz de m filas y n columnas; además, las siguientes propiedades caracteri­ zan una aplicación lineal A entre estos espacios: 1) 2) A ( x + y ) = A ( x ) + A ( y ) para todo x*, ~ e R " y A ( r x ) = r A ( x ) para todo x e R ” y todo número real r. (Ver los teoremas 1 y 2 de la sección antes citada.) Utilizaremos esta caracterización para definir las aplicaciones lineales entre dos espacios vectoriales cualesquiera. En la siguiente sección mostraremos que, fijadas dos bases en los espacios vectoriales, toda aplicación lineal queda determinada por una matriz.
D e f in ic ió n

2.

Sea á f el sistema de referencia en el plano que se obtiene girando sentido positivo los vectores de un sistema de referencia dado J?. Si C = 4 es la ecuación de una circunferencia respecto a St,, encontrar la respecto a SI'. ¿Cuál es el centro de la nueva circunferencia respecto

3. D ado el plano de ecuación x¡ - x 2+x3= 3 con respecto a un sistema de referencia SI en IR3, encontrar un sistema de referencia ffl! de IR3 en el que el plano anterior tenga por ecuación x'2 = 0 .

1 (Aplicación lineal) - _______ ____________________________________________

4.

D ada la circunferencia C s ( x , - l ) 2 + ( x 2 - l ) 2 = 9 en el plano, encontrar sus

Sean V y W espacios vectoriales; una aplicación lineal A de V en W es una aplicación A: V > W tal que: \— 1) 2) A ( v + w ) = A ( v ) + A ( w ) para todo tT, w eV . A(a'v) = a A (v ) para todo a e K y todo TíeV.

ecuaciones en el sistema de referencia S í = {A; ui,tr2}, donde A = (3 , 3), ü\ =

. ¿Qué tipo de curva es C en el sistema de referencia S i l

249

Nota.

Observar que ambos conjuntos V y W deben ser espacios vectoriales

dada por

sobre el mismo cuerpo IK. En el capítulo 1 se han dado varios ejemplos de aplicaciones lineales entre los espacios vectoriales R" y R m Recordamos únicamente los giros en el plano y la . simetría con respecto a un eje en

R 2 .

l ! '\

A ((Z í, z2, ..., z„)) = A

z2

E je m p lo A. D ado un número real a, la aplicación que asocia a cada polinom io del conjunto P H[ x ] su valor para x - a es una aplicación lineal; esta aplicación queda definida mediante las siguientes expresiones: A: P u [ x ] i ► ¡A(p(x)) = p(a). U El hecho de que A es una aplicación lineal se deduce de las siguientes igualdades: A(p(x) + q(x)) = A((p + q)(x)) = (p + q)(a) = p(a) + q{a) = = A(p{x)) + A{q(x)

w
es una aplicación lineal, que recibe el nombre de aplicación lineal asociada con la matriz A. E je m p lo C. Sea D la aplicación que a cada polinom io le hace corresponder su derivada, es decir: D: P K[ x ] i ► R[x]/ D (a 0 + a tx + ••• + a„x") = al + 2a2x-l----- h na„x" ~ 1. P Esta es una aplicación lineal, ya que la derivada de una suma de funciones es la suma de las derivadas de cada una de las funciones y la derivada de un número real por una función coincide con el producto del número real por la derivada de la función. Observar que si el conjunto inicial de esta aplicación es P ^ ’ Cx], com o conjunto final podemos tomar el mismo, o incluso P}J_ 1 ,[x ]; esto es cierto ya que la derivada de un polinom io de grado no superior a n es otro polinom io de grado no supe­ rior a n — 1 . E j e m p l o D. La aplicación que a cada matriz cuadrada le hace corresponder su determinante no es una aplicación lineal, ya que, en general, el determinante de una suma de matrices no coincide con la suma de los determinantes de cada una de ellas. Baste com o ejemplo el siguiente:

A(cp(x)) = A (cp)(x)) = (cp)(a) = c(p(a)) = cA{p(x))

E j e m p l o B.

D ada la matriz

de elementos complejos, podemos definir la aplicación A: C 3 i >C 2 —

w

w

w

.M

at

em

at

ic

para todo número real c.

a1

.c

om

y

'-«í: : k : m : x
* * *

:)■•

dada por A ((z lt z2, z3)) = (iz1+ z2, z 1+ iz2 + z3). Puesto que Aplicando repetidas veces las propiedades 1) y 2) de la definición de aplicación lineal entre espacios vectoriales se consigue demostrar que la imagen, mediante una aplicación lineal, de una combinación lineal de vectores del espacio vectorial inicial es una combinación lineal de vectores del espacio vectorial final. D e forma más precisa:

A{{z 1 , z2, z 3)) = ^ l Z 2

donde en la parte derecha se realiza una multiplicación de matrices, es fácil demostrar que A es una aplicación lineal. En general, dada una matriz A e .JÍmxn(K ), la aplicación

i

cjr j ) = t cA J i= i n.

vj)

donde Cj-elK y D} e V para todo j = 1, 2,

Otras propiedades que se deducen inmediatamente de la definición de aplicación lineal son las siguientes:

P r o p o s ic ió n 2 ___________ _________________________________________________________ Sea A una aplicación lineal entre los espacios vectoriales V y W. Se tienen los siguientes resultados: 1) 2) La imagen del elemento neutro de V mediante A es el elemento neutro de W, es decir, ,4(0) = 0. La imagen mediante A del opuesto de un elemento tf de V es el opuesto de A ( v ) , es decir, A ( — tf) = — A (v ).

Estos dos resultados son suficientes para probar que de W. * * *

es un subespacio vectorial B

Si el subespacio V¡ tiene 1 ^ , ..., T fk} com o base, todo elemento vv de W¡ puede escribirse com o combinación lineal de los vectores A ( t^), ..., A (vk). Esto es cierto ya que tom ando V e V 1 tal que A ( v ) = w se tiene que

w = A (v ) = ^ Demostración. Para demostrar 1) escribimos X (Ü ) = A(Q + 0 ) = ¿ ( 0 ) + A (U ) y restamos ,4(0) en ambos lados. Para demostrar 2) basta observar que

Z CjV^J = X CjA(Vj)

P o r tanto, Wt coincide con el subespacio generado por los vectores /((Tf,), ..., A (vk), es decir, Wx = L ( A ( v 1), ..., A (vk)). En consecuencia, la dimensión de W1 no puede superar k. Hem os probado el siguiente resultado: P r o p o s ic ió n 4________________________ ____________________ ________________________

X (- t T ) = X ((- l)T r ) = (- l ) / l ( t r ) = - A ( v )

P r o p o s ic ió n 3------------------------- ----------------------------------------------------------------Sea A: Vb-> W una aplicación lineal entre espacios vectoriales. La imagen mediante A de cualquier subespacio vectorial de V es un subespacio vectorial de W.

em

at

ic .M at
Demostración. Sea V1 un subespacio vectorial de V y sea W¡ = A (V ¡) la imagen de

a1 w w w

vectoriales se tiene el siguiente resultado:

.c

om

En el capítulo 1 demostramos que la imagen de una recta mediante una aplicación lineal de R" en R m es otra recta o un punto. Para aplicaciones lineales entre espacios

La imagen mediante una aplicación lineal de un subespacio vectorial de dimensión k es un subespacio vectorial de dimensión no superior a k.

Para finalizar esta sección demostramos que una aplicación lineal queda determi­ nada cuando se conocen las imágenes de los elementos de una base del espacio inicial. El enunciado preciso de esta afirmación se da en el siguiente teorema: T e o r e m a 5 ______________________________________________________ ____________________ Sea B = { e u ~ 2, ..., e*„} una base de un espacio vectorial V y sean vv,, vv2, ..., wn e n vectores cualesquiera de otro espacio vectorial W. En estas condiciones, existe una única aplicación lineal A de V en W tal que
A (e j) = Wj,

Vl mediante A. Recordamos que W1= A ( V 1) = { A ( v 1 f v i e V } . ) Sean vv,, w[ e W{, existen, por tanto, dos vectores t^, A(v"{) = vv,'. Entonces vv*! + w; = /1(F,) + A { v [) = A ( v 1 + üV) y puesto que T , + tf.'e Vu por ser V¡ un subespacio vectorial de V, se tiene que w, T + w ¡e W v Tom em os ahora a e K y existe vl e V l tal que A ( v 1) = w P o r tanto, 1. aw1= aA(iíl ) = y puesto que aí^ e Vlt por ser V¡ un subespacio vectorial de V, se tiene que avv, e W1.
6

7 = 1 ,2 ,...,«

Demostración.
n

Definimos A de la siguiente manera: dado V e V podemos escribir entonces definimos
n A (v )=

tal que / 4fy1) = w 1 y

~v=

Yj

vf p

con v j e

j= i

£
i= i

vjwj.

A partir de aquí es un simple ejercicio comprobar que A es la única aplicación lineal tal que 4 (é }) = vv}, 7 = 1 , 2 , ..., n. ■

6.2.

M A T R I Z D E U N A A P L I C A C I O N L IN E A L . O P E R A C IO N E S C O N A P L IC A C IO N E S L IN E A L E S

implica las siguientes igualdades:

En esta sección, y mientras no se indique lo contrario, V y W denotarán dos espacios vectoriales sobre el mismo cuerpo K y A una aplicación lineal de V en W. Sea B = { e í ,~e2 , ..., e*„} una base de V y B = { J 1, f 2, . . . , f m una base de W. El } elemento A (e ¡) es un vector de W y, por tanto, podemos escribir A ( T l ) = al l f 1+ a21f 2-\ -------t-«m f m i Análogamente, A (e ’) = 2
flj.2 / 1 + « 2 2 / 2 H------ 1" a m 2 / m

y¡ =

X aux j,
i= 1

Í = l , 2 , ..., m.

( )

1

Con notación matricial, podemos escribir / y i\ / * i\
*2

y2
\JW

\Xn l

A{e„) = «in / i + a2nJ2 + ■*‘ + Qm nfm Estas igualdades se escriben abreviadamente de la forma
m

N o sólo toda aplicación lineal puede representarse mediante una m atriz con respecto a dos bases dadas, sino que recíprocamente, fijadas bases B = {'e1, ..., ~e„} y B = {/ i» ->X i} en l ° s espacios inicial y final, respectivamente, y dada cualquier matriz de orden m x n A —(a¿:)i= 1 m , }= 1 ....n a¿¡ e (K

M e ¡ ) = X aufb i= 1 En estas condiciones diremos que
I
a i i

j = l , 2 , ...., n.

om
a í2

<¡ln\

at

em

A=

a2 1

a22

■ a2n

ic

a1

n existe una única aplicación lineal que tiene a A como matriz: si x = X x / j definimos i= 1
m

.c

A(x )=

'

.M

W i

a m2

® nI m

at

i= 1

X

y¡A

es la matriz de la aplicación A con respecto a las bases B y B. Observar que la y-ésima columna de la matriz de la aplicación lineal A son las componentes de A(ej) con respecto a la base B de W. Para ser precisos sería necesario designar la m atriz A con un sím bolo que incluyera las bases B y B; este sím bolo podría ser M%(A). N osotros preferimos denominar a la m atriz con la misma letra que a la aplicación, siempre que esta econom ía en la notación no sea causa de incomprensión. D ado x e V, podemos escribir
n

w

w

donde y t, y2, ..., ym están dados por las relaciones que aparecen en ( 1 ). Nota. Si los espacios vectoriales V y W coinciden y en ambos se toma la misma base B para representar una aplicación A, su matriz se dice que está dada con respecto a la base B. E je m p lo A. Sea R 2 la rotación de ángulo a, en el plano, alrededor del origen en sentido positivo. R x es una aplicación lineal de IR2 en IR2 que, referida a la base canónica del plano, tiene com o matriz /eos a R* = ( ysen a (V er el ejemplo B de la sección 5.3.) E j e m p l o B. En el espacio vectorial real IR3 consideramos el subespacio V1 — { ( * ! , x 2, 0)/xu x 2 e IR}. Si B = { e 1, ~ 2, é"3} es la base canónica de IR3, y S es la simetría e con respectóla! subespacio vectorial Vu se tiene que S(Ti) = Ci, S(e2) = e2, S(e3) = - e 3— sen a eos a

X = £ x/j
j=i

e

y=

m

A (x )=

X
;= 1

y¡f¡-

L a relación entre las coordenadas y¡ y Xj viene dada por la matriz A. En efecto, la igualdad

w

En un mismo espacio vectorial V, la aplicación que lleva todo vector de V en sí mismo se denomina aplicación identidad. Es fácil com probar que, con respecto a cualquier base de V, la matriz de la aplicación identidad es

I '

0 1 .

\ ,

/\ o

' 1 /,

si el espacio vectorial tiene dimensión n. P o r tanto, su matriz con respecto a la base canónica es EJEMPLO E. Sea D la aplicación derivación del ejemplo C de la sección 6.1 y consideremos D com o una aplicación de en P|J_ 1 )[x ]. Sea £ = { 1 , x, x 2, ..., x "} una base de P j f [ x ] y B = { 1, x, x 2, ..., x n_1} una base de P <n ^ [x ]. Tenemos ~
D(1) = 0, D ( x ) = 1, D ( x 2) = 2x,
D ( x 3)

S=

1 1
0 \o

0
1 0

°\0
- 1

= 3x 2,..., £>(x") = nx" ~ 1

1
P o r tanto, la matriz de D con respecto a las bases B y B es la matriz de orden n x ( n + 1 ) dada por

Observar que las simetrías pueden definirse con respecto a cualquier subespacio vectorial de R 3.

om

a1

E je m p lo C.

Sea P la proyección ortogonal de un vector de IR3 sobre el plano xOy,

.c

0 10 0
0
0

at

ic

P es una aplicación lineal de R 3 y puesto que

0
0
0

2
0
0

0
3
0

°\

em

P ( e 1) = ~ e1,

P ( e 2) = ~ 2 e

y

i 3(é’3) = 0 -

D-

0

w

.M

at

w

w

:
\0 0 0 0

! •••
0

n /

E je m p lo F. Tratam os de encontrar una base en R 3 de manera que la matriz de la simetría con respecto al subespacio vectorial ^ ^ { ( x , y, z )e R 3/x + y + z = 0 } sea

/1 P =
0

o
1

0

\

o o/

\o

o

E je m p lo D. Dados dos espacios vectoriales V y W la aplicación nula que envía todo vector de V al elemento neutro de W es una aplicación lineal, cuya matriz es la matriz nula con respecto a cualesquiera bases de K y W.

En el ejemplo B se ha resuelto el caso en que el subespacio vectorial coincida con el plano xOy. U n estudio detallado del ejemplo citado nos da la idea adecuada para resolver el problema planteado aquí: basta tomar dos vectores cualesquiera de Vx que sean linealmente independientes y un tercero que sea perpendicular a V1. P o r ejemplo,

Puesto que toda aplicación lineal puede representarse mediante una m atriz y recíprocamente, el siguiente resultado no debe extrañar al lector T e o r e m a 2 __________________________________________________________________________ Sean V y W espacios vectoriales de dimensiones n y m, respectivamente; entonces, el espacio vectorial L { V , W ) tiene dimensión n x m .

S i= ( l, - 1 , 0 ) ,

u2=(0, 1, -1 ),
* * *

«3=(1, 1, 1)

Y a hemos mencionado anteriormente que si en los espacios vectoriales V y W, de dimensión finita n y m, respectivamente, se fijan bases, existe una correspondencia biunívoca entre las aplicaciones lineales de V en W y el conjunto de las matrices ■^mxní^X de orden m x n sobre el cuerpo IK. Puesto que el conjunto J f mxn( K ) posee una estructura de espacio vectorial, no es de extrañar que en el conjunto de todas las aplicaciones lineales entre dos espacios vectoriales puedan definirse dos operaciones que le den estructura de espacio vectorial. Estas operaciones ya han sido definidas en el capítulo 1 cuando los espacios vectoriales son IR" y IRm Las operaciones que daremos aquí son una copia de aquellas. . Sean V y W dos espacios vectoriales sobre el mismo cuerpo K; el conjunto de todas las aplicaciones lineales de V en W se designará mediante el símbolo L (V ; W).

Demostración. Hem os de exhibir n x m elementos de L(V, W ) que formen una base de este espacio. Fijadas B = {eu y E = {fu

bases de K y W, respectivamente, definimos, para j = l, ..., n, ¿= 1, ..., m, (f¡ E j 0 k) = \ "
0

si si

j= k ) j # k

k = l , 2, ..., n.

a1

Si A y B son elementos de L (V ; W ), definimos su suma mediante (A + B ) ( v ) = A ( v ) +B(~v) para todo V e V.

.c

om

Esta definición se simplifica, en cuanto a su notación, si utilizamos un símbolo denominado delta de Kronecker: _ Í 1 Sjk
¡k — <

si

j = k] (’

k = \, 2 , ..., n j = l , 2 , ..., n.

ic

at

^0

;'#/c

w

.M

Si A es un elemento de L (V ; W ) y c es un elemento de IK, definimos la multiplicación de c por A mediante

em

at

Entonces podemos escribir
^jkfi’

w

(ci4)f¡r) = c(/4f¡r))

para todo ~ e V. u

w

Ejii^k)

^

1» ^5

Las operaciones que acabamos de definir tienen ciertas propiedades que coinciden con las enumeradas para matrices en la sección 3 del capítulo 1. U na forma elegante y rápida de enumerar estas propiedades se da en el siguiente teorema: T e o r e m a 1 __________________________________________________________________________ Sean V y W dos espacios vectoriales sobre un mismo cuerpo IK; el conjunto L (F ; W ) de las aplicaciones lineales entre V y W, con las operaciones anterior­ mente definidas, es un espacio vectorial sobre el cuerpo IK.

Puesto que Ej¡ ha sido definido para los elementos de una base de V, determina una única aplicación lineal de V en W, que seguiremos denotando por Ej¿ este resultado se ha demostrado en el teorema 5 de la sección anterior. Para finalizar la demostración del teorema es necesario probar que

i= 1 es una base de L(V, W). Sea
n m

I La dem ostración com pleta de este resultado se deja para el lector; nosotros observaremos que el elemento neutro de este espacio es la aplicación nula y el opuesto de una aplicación A es la aplicación —A definida por (- / t )(u )= - 0 4 (u )).
n m

X % £ * = 0

j = i ;= i

una combinación lineal nula de los elementos de E (0 designa la aplicación nula de V en W)-, para todo fc = l, 2, ..., n
m
i= 1

Si V y W coinciden escribimos L ( V ) en lugar de L ( V ; V).

E

Yj ajiE n(ek) = ^ a kiT i = 0 e W .

j = i i= 1

Puesto que B es una base de W se deduce que ak¡ = 0, i = 1, 2, m. Esto prueba que E es un conjunto de aplicaciones lineales linealmente independientes. Falta probar que E es un sistema de generadores de L(V, W). Sea A e L ( V , W ) y sea A = (a¡j) su matriz con respecto a las bases B y B; para todo ~ ke V tenemos e
m m m

Dadas A e L ( V ; W ) y B e L ( W ; X ) definimos la composición de A y B mediante (B °^ )(IT ) = B(/l(tr)). Dadas las B ° A e U y ; X). condiciones impuestas sobre A y B es fácil comprobar que

A (e k) = X aikf ¡ = X aikE ki(ek) = £ Eki(aikek). i= 1 1=1 i= 1 Puesto que E Ji(Tk) = 'S si j ^ k , podemos escribir
m n m n

Si los espacios V, W y X tienen dimensión finita y si denotamos por M (A ), M {B ) y M ( B ° A ) las matrices de A, B y B ° A , respectivamente, con respecto a bases de antemano fijadas se tiene el siguiente resultado: M (B ° A ) = M (B )-M (A ). La demostración es análoga a la dada en la sección 1.3 para aplicaciones lineales entre espacios vectoriales de la forma IR". La repetimos aquí para conveniencia del lector. Sean columna la base {<?)}?= j, {/ ,},= !, {gk} k= i bases de V, W y X , respectivamente. La i'-ésima de la matriz de B 0 A son las componentes del vector (B ° A)(e¡) con respecto a por tanto, si escribimos ¿ se tiene
/ m \ m

A (e k) = I I £ 7¡(flyTt) = X Z aijEji(A h i= 1 J= 1 i= l j= l D e aquí se deduce que
m n

A= 1 1 ¡= ij= i ya que ambas aplicaciones coinciden sobre los elementos de una base de V Esto termina la demostración del teorema 2.

om

A

B = (bkj) ki UJ^

em

*

*

*

at

ic

Nota. Más adelante se dará otra demostración del teorema 2 estableciendo una correspondencia biyectiva entre L(V, W ) y J t m* n K ) de manera que se conserve la ( dimensión. (V er sección 6.4.)

a1

.c

B ° A ( e¡) = B(A(e¡)) = B Í I aJ A = £
m
/

a ^ T j) =
m \

En estas condiciones se tiene que M ( A + A ' ) = M ( A ) + M ( A ')

w

w

Con la misma situación que al comienzo de esta sección, sean A y A' dos aplicacio­ nes lineales de V en W. Sean M (A ), M ( A ’), M ( A + A ') y M ( c A ) las matrices de las aplicaciones lineales A y A ' con respecto a las bases B y B de V y W, respectivamente.

.M

at

p

\

p

/

w

= I aJi( I M i = I j= i \ *= i / k = i \ j = i

I

h fiji k j

y
M ( c A ) = c M (A ), ceK .

m Esto prueba que £ bkjan es el elemento que ocupa el lugar (k, i) de la matriz M ( B 0 A); j= i este valor coincide con el valor del elemento que ocupa el lugar (k, i) en el producto de matrices M ( B ) M (A ).

Estas igualdades expresan que la matriz de la aplicación lineal «su m a» coincide con la suma de las matrices de cada una de las aplicaciones y que la matriz de la aplicación lineal cA coincide con el producto de la matriz A por el escalar c. Las demostraciones de estos resultados son análogas a las realizadas en la sección 3 del capítulo 1 para aplicaciones lineales de IR" en IRm y, por tanto, se dejan para el lector. * * *

6.3.

C A M B IO D E BASE P A R A A P L IC A C IO N E S L IN E A L E S

Sean V y W dos espacios vectoriales, sobre el mismo cuerpo, de dimensiones n y m, respectivamente. Sea A una aplicación lineal de V en W con matriz A = ( a lj)í ? U ] : i

Con dos matrices se puede definir su producto siempre que concurran circunstan­ cias favorables. El producto de matrices corresponde a la composición de aplicaciones lineales, que definimos a continuación.

con respecto a las bases B = { e l , ..., y B = { f l, de F y W, respectivamente. Si deseamos conocer la matriz A ' = (a¡J){T l j ” l de la misma aplicación A, con

respecto a dos nuevas bases B' = {e¡, ..., e '„} y B' = { f ¡ , de V y W, respectiva­ mente, es necesario realizar los cambios de base adecuados en los espacios inicial y final. Para que el lector siga con mayor facilidad el razonamiento, realizamos el siguiente diagrama: II V x l e 1+ - - - + x „ e n I I
x

Sustituyendo ( 2 ) en (1) se obtiene

[Á \ D /i = AC

[A \ n < • Q 3 < U ti x o < á o a g

w

B= c¿

£n}

A = (au )

f
lD fa 1 toi II

B’ = {ëV, ..., ?„’}

------------ -*
A '-(a 'u)

y ifl H ------^>m/m I I y I I
y 'l f l H -------- ^y 'm fm

w
¡y 'A y'2 = D ~ 1A C

\X J '

Puesto que D es una matriz de un cambio de base, posee inversa; por ta n to ^ :

¡ x \\ X2

Si escribimos x e F d e la forma Xj é\ + ••• + x„e„ = x = x\e\ + ••• + x'„e'„ e p A { x ) de la forma
y i f l + - - - + ym fm y .Vl / l + " " + y m fm

[ ymJ

\ < l

Com parando esta expresión con (3) se obtiene

.c

W w
j x i\ x2

w

w

= A

w

yi

(1)

.M

l yi\

/ * i\

at

em

escribir

at

ic

los resultados de la sección anterior, junto con los relativos al cambio de base en un mismo espacio vectorial, que se estudiaron en el capítulo anterior, nos permiten

a1

om

A' = D ~ l A C

(4)

que nos permite calcular la matriz A ' de la aplicación A con respecto a las bases B' y B', conocida la matriz A de la misma aplicación con respecto a las bases B y B y las matrices C y D del cambio de base de B a B' y de B a B', respectivamente. En muchos casos los espacios inicial y final de una aplicación coinciden. Si, además, B y B coinciden y B' y B' coinciden la fórmula del cambio de base es más sencilla. Si A es la matriz de la aplicación A e L ( V ) con respecto a una base B de V, la matriz A ' de la misma aplicación con respecto a una base B' de V está dada por A' = C ~ l A C

= C

/ X l\ X2

í y l\

/ y 'A = D y2 (2 )

y2

donde C es la matriz del cambio de base de B a B'. Observar que, en este caso, |A'| = | 4 , ya que el determinante de un producto de y| matrices es el producto de los determinantes de cada una de ellas. E je m p lo A. Una aplicación lineal A tiene, en una base {e j, ~ 2} de un espacio e vectorial de dimensión 2 , la matriz

\ ”l x

\X' J

\ y j

\ ym j

l y\\ y'2 = A'

IX A
x '2 (3) \x'„

A=

6

-1

\ y m/

Queremos determinar la matriz de esta aplicación lineal en la base e¡ = e'i + 2 e 2,e'2 = 2eí + 3é*2. Puesto que la matriz del cambio de base es

En las igualdades anteriores C y D son las matrices del cambio de base de B a B' y de B a B', respectivamente.

C=

la matriz A' de esta aplicación en la base {e ¡, ~ 2j es e

':G K
Eje m plo

:X K í
En la base B' = { u 1= ( l , 1, 0), IT2 = (0, 2, 1), ü* = (l, — 1, 2)} determinada por dos 3 vectores de Vl y un vector, u3, perpendicular a él, la matriz S’ de S es

B.

Sea A: (R3 1—> R 3 la aplicación dada por A ( x u x 2, x 3) = ( x 1+ x 2, x 3, x 2- x 3)

donde ( x u x 2, x 3) son las coordenadas de un punto x e R 3 con respecto a la base canónica en IR3. Sea B ’ la base {e*3, ei, F2} que se obtiene permutando los elementos de la base canónica. Puesto que la matriz de A en la base canónica es . A = Í0
^0

/1 S' =
0

0 1 0

o ''
0

I 0
1 - 1

o i \°

- 1/

ya que S(w'1 = u1, S(u2) = u2 y S(u3) = —u3. Puesto que la matriz del cambio de base de ) la base canónica a B’ es

y la matriz del cambio de base es

.c

om

em

C=

0

0 0

at

l 1 la matriz A de A en la base B ’ es

w

.M

° )
o\/o
1 - 1 0 1

1

at

ic

!0

1

o\

a1

/ 1 1 2

0 1 1

1

\

\ se tiene que

0

2

/

Io
A-0 1

i
0

oY1 /l
1

1
o
1

1 o
0 0 1 0

w

w

S' = C _1SC P o r tanto:

S = CS’C ' 1.

o

o

o

7
/

\
0 1

0

(

s=
1 1

10 1
1 2 1

1

\ /i
0

o
1

o\ j l o
1

o
2 1

n -1 -i
2

0 1

0

l\ o
0

\

/ -I
0

0 1

1 1

^

\o

2

1 \o

o

■1 / \o

/

o
1

o
0

o
1

\o

/ \ -1

/

\

1

o

oI

jl
1 \0

0 2 1

- l\
1

4 2 -4

2 4 4

—4\ 4 -2 /

- 2/

Ej e m p l o C. Queremos encontrar las ecuaciones de la simetría S con respecto al subespacio vectorial Vl = {(x, y, z)}/x — y + 2z = 0}, referida a la base canónica de R 3. La estrategia consiste en encontrar en primer lugar una base de R 3 en la cual la matriz de la simetría sea lo más sencilla posible y a continuación realizar un cambio de base para pasarla a la base canónica.

Así pues, (2
2

S(x,, v 1

1

2

1

2

2
X 3,

2

2

1

X 2, X , ) = I - X , H — X 2 ----- X 3,

Xi ■ f ' X , H

— - X j + - X 2— ; X 3

3M

3

3

3

3

3

3

3

3

3

donde (x l5 x 2, x 3) son las coordenadas de un vector x e R 3 con respecto a la base canónica.

5. La traza de una matriz cuadrada A se define com o la suma de los elementos de su diagonal principal y se designa por traza(A). Demostrar que la aplicación T: J ? mx„(K)h-+K es lineal. D ar una base de J ? mxn( K ) y encontrar la matriz de T con respecto a esta base y a la base canónica de IK.
6 .Dadas

E J E R C IC IO S (S E C C IO N E S 6.1, 6.2 Y 6.3) 1. Estudiar cuáles de las siguientes aplicaciones son lineales entre los espacios

vectoriales dados: a) b) c) d) e) f) g) M b: J 2 x 2 ( R ) h J 2k j([R) dada por M b{A) = A B con B = SB: J ? 2x2(U ) h - > J f 2x2(R ) dada por S b(A ) = A + B con B e J 2 * 2 W

A: !R3 h->[R3 mediante A ( x u x 2, x 3) = ( x 2, x 3, 0) y B: R 3 k->[R2 dada por B {x ux 2, x 3) = (x , + x 3, x 2) calcular A n= A ° ° A para todo n e t\ y J B ° A . [ Sugerenc encontrar las matrices de A y £ .] Sabiendo que la aplicación A lleva los vectores «*, = ( 1 , 0 , 0 ), w2 = ( 1 , 1 , 0 ) y u3 = ( 1 , 1 , 1 )

7.

(2
C B: J 2 X2 ( R ) ^ J ' 2 x 2 (® ) dada por C B{A) = A B — B A con B = ( S:

1

fija-

de IR3 en los vectores vvi= (2 , 1, 2), vv2 = (3, 1,2) y vv3 = ( 6 , 2, 3)

dada por S(A) = -£A + A ‘) donde ¿ f = { A e J t nXn{C)IA = A t}.

respectivamente, encontrar la matriz de A en las siguientes bases:
a)

La base canónica de IR3. La base { « i , u2, u3}.

R: J Í 2x2(U)h-> £/> ) dada por R (A ) = AA'. n(U A: P P f x ] i - » ^ ’ [ x ] dada por A(p(x)) = p ( x + 1).

b)

om a1 .c em at ic .M at w w w

B:

dada por A{p(x)) = p(x) + 1.

8.

Encontrar las ecuaciones de las siguientes aplicaciones lineales realizando cambios de base adecuados: a) b) c) Simetría con respecto a la recta (x, y, z) = t{ 1, 1, 1). Proyección sobre el plano x —_ + z = 0. y G iro de 90° con respecto a la recta x + _ = 0, z = 0. y

2. Sea A: [R3 1 > IR3 dada por A ( x u x 2, x 3) = (x ! + x 2, x 3, x t + x 3). Encontrar la matriz —■ de A con respecto a la base canónica. Hallar la imagen mediante A de los siguientes subespacios vectoriales de R 3.
a) K = { ( x i> x 2 > x 3) e í R 3/ x 1 +

x 2 + x 3= 0 } .

b) c)

V2= {(Xi, x 2, 0)/x¡, x 2e¡R}. K3 = { ( x 1; x 2, x 3) = í(l, - 1 , l)/t e R }.

9. Sea T: P ^ O ]i-> F (u 3 | x ] tal que T ( l ) = x 2 + 1 , T ( x ) = - x , T (x 2) = x 3 y T ( x 3) = x 2 [ + x — 1. Calcular T ( x 2 + 2x + l ) y T ((x — 2)2 + x 3). Encontrar la m atriz de T con respecto a la base { 1 , x, x 2, x 3} de ^ ’ [x ],

En cada caso indicar la dimensión del subespacio y la dimensión de su imagen mediante A. 3. Encontrar las matrices de las siguientes aplicaciones lineales con respecto a las bases canónicas de los espacios vectoriales dados: a) b)
c)

10. Sea A e L ( V ; W)\ si V1 es un subespacio vectorial de V, la aplicación A puede considerarse com o una aplicación lineal de Vl en W; esta aplicación recibe el nombre de restricción de A a Vu y se designa con el símbolo A\V1. En los siguientes casos encontrar una base del subespacio vectorial dado y la matriz de la aplicación dada restringida a este subespacio con respecto a esta base:
a) A: IR3 1—► 2 / ^ (x l5 x 2, x 3) = (x j + x 2, x 2 + x 3) R = {(^ í» x 2 > x i ) ! x i ~ 2x 2 + 3x 3 = 0} b) A: C 2 t-*-C3/A(zu z 2) = (z 1 + z 2, iz2, ¡z,) K = {(z i, z 2)/zi =

M B y C B del ejercicio 1. A: P l 2>[x] h- U V A (p (x )) = (p(0), p (l), p(2), p(3)). A: P ^ l x ] ^ P ^ W / A ( p ( x ) )
=

p(x+ \ ).

4.

Respecto de la base canónica en IR3 hallar las matrices de las siguientes aplicacio­

nes lineales: a) b) c) d) e) G iro de o grados con respecto al eje z. í Simetría con Simetría con respecto a la recta respecto a la recta x = 0, y = 0. x = y, z = 0.

11.

D ada A e L ( V ) y A elK , demostrar que el conjunto E(Á) = { x e V / A ( x ) = Á x }

Proyección sobre el plano x —y + z = 0. Simetría con respecto a la recta (x, y, z) = t( 1, 1, 1).

es un subespacio vectorial de V. En los siguientes casos encontrar una base de E(Á): a) A - . U 3'r ^ U 3I A { x í , x 2, x 3) = { - 2 x l , - x 2, —x l + x 3), Á = -\ .

b)

A: IR4 i >[R4 tal que —

A ( x u x 2, x 2, x 4) =

2 -6^ /I 0 l X l \ 3 0 1 -1 1 3 r *3 0 0 0 2/ \ 0 °

A = 2; A = l ; A = 0

w

c)

A: € 3 i-> C 3 M (z i, z2, z3 = (2z 1+z3 ) ,

- z2, -3 z! - z3 );

A= e

En el caso de aplicaciones lineales cada uno de los tipos anteriores recibe un nombre especial: una aplicación lineal inyectiva recibe el nombre de monomorfismo; si la aplicación lineal es suprayectiva se le da el nombre de epimorfismo; finalmente, si la aplicación lineal es biyectiva se dice que es un isomorfismo. El objetivo de esta sección es encontrar condiciones sencillas que sirvan para determinar si una aplicación lineal es de cualquiera de los tipos anteriores. Comenzamos con las aplicaciones lineales inyectivas. Para ello necesitamos definir el concepto de núcleo de una aplicación lineal; dada una aplicación lineal A: V\--+W definimos el núcleo de A, que se denota mediante ker ( A ) , com o el conjunto de todos los V e V tal que ¿ ( ! f ) = 0 ; es decir: k e r (¿ ) = {v e V/A(v) = 0 }.

12. Sea el espacio vectorial de las matrices simétricas de orden n con elementos en el cuerpo IK. Definimos T: J í nxn( K ) ^ < ? n( K ) mediante T ( A ) = - ( A + A'). a) b) Encontrar una base de £fn (K). Encontrar la matriz de T con respecto a la base canónica de de ¿ f n( K ) encontrada en a). y a la base
1

Nota. En algunos textos se utiliza N ( A ) en lugar de ker (A); la notación ker (A ) es la que se utiliza en toda la literatura matemática inglesa; esta notación viene de la palabra inglesa kernel, que significa «nú cleo».

M = { x y = x 2/xu x 2 e 1
£3

at

em

at

a)

T: IR2 i— 3 dada por T ( x x, x 2) = ( x í + x 2, x 1; x 2) y >IR

ic

a1 .M

13. Sea T una aplicación lineal de IR” en IRm demostrar que T transforma variedades ; fc-dimensionales de IR" en variedades /-dimensionales de IRm con /^ k. En las siguientes , aplicaciones lineales hallar la imagen de las variedades lineales dadas:

.c w w w

om

El subconjunto ker (A ) no es nunca vacío, ya que 0 e k e r (¿ ); esto se deduce de que ,4 ( 0 ) = 0 , com o se ha demostrado en la sección 6.1. El subconjunto ker(/l) es, además, un subconjunto distinguido de V; se tiene el siguiente resultado:

P r o p o s ic ió n 1_______________________________________________________________________ Si A: V i ► es una aplicación lineal entre espacios vectoriales, ker (A ) es un — W subespacio vectorial de V.

b)

T:

dada por la matriz / T=
\
1 -1 0 0 1 1 1 0 1

'

Demostración. por tanto:

Si x e ~ son elementos de ker(^4) se tiene que A (x ) = 0 y A {y ) = 0; y

y M = { ( x 1, x 2, x 3 x 1-2 x 2+x 3= 4}. )/ 14. Sea V el espacio vectorial de las funciones reales de variable real generado por sen x y eos x. Calcular el determ inante de la aplicación «d e riv a c ió n » definida en V.

A ( x + y ) = A ( x ) + A ( y ) = () + (í = 0 de donde deducimos que x + y e k e r ( , 4 ) . Si x e k e r ( ^ ) y c e K se tiene que A ( c x ) = c A { x ) = c •0 = 0

6.4. A P L IC A C IO N E S L IN E A L E S IN Y E C T IV A S Y S U P R A Y E C T IV A S . N U C L E O Y R A N G O D E U N A A P L I C A C I O N L IN E A L Sean V y W dos espacios vectoriales sobre el mismo cuerpo K y A una aplicación lineal de V en W. Recordamos que A es inyectiva si A ( x ) = A ( y ) implica x = y ; la aplicación A es suprayectiva si para todo ~ e W existe x e V tal que A ( x ) = 'y o y equivalentemente A ( V ) = W, donde A ( V ) denotadla imagen de Fm ediante A; finalmente, recordamos que A es biyectiva si es a la vez inyectiva y suprayectiva.

de donde se deduce que ex e ker (A). Estos dos resultados prueban la proposi­ ción. ■

P r o p o s ic ió n 2_______________________________________________________________ Una aplicación lineal A: V ^ W es inyectiva si y sólo si k e r (¿ ) = { 0 }.

Demostración. Supongamos que A es inyectiva; si x ek e r(/ l) se tiene A (x ) = 0; puesto que A es lineal, ¿ ( 0 ) = 0, y, por tanto, podemos escribir

El rango de la matriz de los coeficientes de este sistema es 2 (observar que la tercera ecuación es combinación lineal de las dos primeras). U tilizando las dos primeras ecuaciones e introduciendo los parámetros x 3 = c 1; x 4 = c2, x 5 = c3 tenemos que

¿ ( x ) = 0 = .4(0).

x2— C 2 — C 3

Puesto que A es inyectiva, x = 0; esto prueba que

y
* 1 = ~ (c 2 - c 3) - c 1- c 2 - c 3 = - c ! - 2 c 2

ker (^4) = { 0 } Así pues, Supongamos ahora que k e r(A ) = { 0 } y probemos que A es inyectiva. Si A ( x ) = A (y ), se tiene que A ( x - Y ) = A { x ) - A ( y ) = ~$ que son las ecuaciones paramétricas de k e r (T ). Observar que el núcleo de esta aplicación tiene dimensión 3. * * *
(x l5 x 2, x 3, x 4, x 5) = ( - c 1- 2 c 2, c2 - c 3,
c u c

2,

c3) =

= Cl( - l , 0, 1, 0, 0) + c 2( - 2 , 1 ,0 , 1, 0) + c3(0, - 1 , 0 , 0 , 1)

por tanto, x - y e k e r ( A ) ; com o k e r (/ 4 )= {0 } deducimos que 3 *— } f = ^ , o equivalente­ c mente, x = y , que era lo que deseábamos demostrar. ■ E je m p lo A. Para estudiar si ^4: IR2 1 ► 3 dada por A ( x u x 2) = (2 x 1+ x 2, — IR x 1+ 2 x 2, 3 x 1 es una aplicación lineal inyectiva hemos de encontrar ker(/l). Si ) (x l5 x 2) e ker(/l) hemos de tener A ( x : , x 2) = (0, 0, 0); esta igualdad se transforma en x2

2 x¡ +

= 01

x t + 2 x 2 = 0 >

at

em

at

Supongamos ahora que la aplicación linéal A es suprayectiva, es decir, que A es un epimorfismo; en estas condiciones se ha de cumplir que A ( V ) = W, donde A ( V ) es la imagen de V mediante la aplicación A. El conjunto A ( V ) recibe el nombre de imagen de A, y se designará, de ahora en adelante, mediante im g(A ). P o r tanto, A es suprayectiva si y sólo si im g (¿ )= W P o r la proposición 3 de la sección 6.1 sabemos que la imagen de cualquier subespacio vectorial de V es un subespacio vectorial de W\ en particular, img ( A ) , que es la imagen de V mediante A, es un subespacio vectorial de W.
E j e m p l o C. Queremos encontrar la imagen de la aplicación T del ejemplo B y decidir si es suprayectiva. La estrategia más sencilla es observar que la imagen de una base cualquiera de IR5 es un sistema de generadores de im g (T ): si B = { ? u ~ 2, ~ 3, ~A, e e e
5

que es un sistema hom ogéneo de tres ecuaciones y dos incógnitas. Puesto que la matriz de sus coeficientes tiene rango 2 , que coincide con el número de incógnitas, la única solución posible es la trivial x 1 = x 2 = 0. P o r tanto, k e r (¿ ) = {(0, 0 )} y A es inyectiva. E j e m p l o B. matriz es Tratem os de encontrar el núcleo de la aplicación T: R 5 i— R 3, cuya »

w

w

w

3 x 1= 0 )

.M

ic

a1

.c

om

es una base de R 5 y v v e im g (T ) existe ~ = X v j e j e U s tal que T(tT) = vv; así pues, v

11 1 1 T= 0 1 0
\1 0 1

1 1\ -1 1 2 0/

j= i

T ‘v J=J (X & j Í
con lo cual queda probado el resultado. (Relacionado con este resultado, ver el problema 9 al final de esta sección.) P o r tanto, T ( e 1) = ( 1, 0, 1), T (e 2) = (l, 1, 0), T (e 3) = ( l , 0, 1),

Se trata, por tanto, de encontrar todos los vectores x = ( x 1; x 2, x 3, x 4, x s) tal que

x 1 + X 2 + x ji + * 4 + X 5 = 0 1

x 2 —x 4 + x 5 = 0 >. x 1 + x 3 + 2 x4 = 0 j

T (e 4) = ( 1, - 1 , 2 ) ,

T ( e 5) = ( l , 1,0)

son un sistema de generadores de im g (T ); de este sistema de generadores es necesario extraer el mayor número de ellos linealmente independientes, y así podremos encontrar im g (T ). Puesto que la matriz que tiene a estos vectores por columnas es T y ya sabemos que T tiene rango 2, solamente es posible encontrar dos vectores linealmente independientes. Podem os tomar im g (T ) = L ((l,0 , 1), (1, 1,0)). Debido a que im g (T ) tiene dimensión 2, llegamos a la conclusión de que T no es suprayectiva. Si queremos encontrar las ecuaciones cartesianas de im g (T ) hemos de eliminar los parámetros c t y c 2 de las ecuaciones (.Vi, y 2 , 3>3) = C i( 1 . Así pues, c i + c 2 = yi !) + c 2 ( 1 , 1 , 0 ).

Probam os en primer lugar que B es un sistema de generadores de img (,4); si vv e img (A), elegimos V e V tal que A ( v ) = w ; puesto que n
V =

X
1

CjVj

se tiene que

w = A (v ) = A

i cj ^í ] = i cja o?j) j =i / j= i ^ k; por

debido a que T 1, ..., ~ k son elementos de ker(/l) se tiene que ^ ( ^ = 0 si 1 v tanto,

W=

Z
j = k+ 1

cJA (Vj)

c2= y 2 ■

at

*

*

*

ic

a1

D e aquí deducimos y2 + y 3 = y! sin más que sustituir las dos últimas ecuaciones en la primera.

.c

om

c i = y 3_

y queda probado que B es un sistema de generadores de img(/1). Finalmente, probamos que los elementos de B son linealmente independientes. Supongamos que tenemos una relación de la forma

i
j = k+ 1

CjA(Vj) = d.

(1)

w

w

dim (ker ( T )) + dim (im g ( T )) coincide con la dimensión del espacio inicial de T. Este resultado es cierto en un contexto más general; le enunciaremos y demostrare­ mos a continuación. Después obtendremos algunas de sus consecuencias relacionadas con las aplicaciones lineales inyectivas y suprayectivas. T e o r e m a 3 __________________________________________________________________________ Sean V y W dos espacios vectoriales de los cuales V es de dimensión finita y sea A: V \-> W una aplicación lineal. Entonces, dim (ker (A)) + dim (im g (,4)) = dim ( V)

w

.M

En los ejemplos B y C se observa la siguiente relación entre las dimensiones del núcleo de T y de su imagen:

at

em

U tilizando la linealidad de A , la igualdad anterior se escribe de la forma

Ai

X

CjVj) = 0

\j=k+1

Esto implica que el vector

£
j = k+ 1

c ^ - e k e r ^ ) . Puesto que k er(X ) está generado por los

vectores t?i, ..., ~k podemos escribir v
n

ct + 1 trk + 1 + - --+ c ntr„=

X
j = k+ 1

cJ j?J= c 1v1+ - - - + c k v ~ k.

Puesto que {tfj, ..., ~v„} es una base de V la igualdad anterior^solamente es posible si C[ -■■■ = ck = ck+ 1= --- = cn= 0. En particular, la igualdad (1) solamente es cierta cuando todos los Cj son nulos. Se termina así la demostración del teorema. ■ Para deducir algunos corolarios de este teorema es necesario hacer uso del concepto de rango de una matriz estudiado en los capítulos 1 y 2 . Sea A una aplicación lineal entre los espacios vectoriales V y W, ambos de dimensión finita n y m, respectivamente. Sea A la matriz de la aplicación lineal A en dos

Demostración. Sea k = dim (ker (^ )) y n = d im (F ). Elegimos una base {tfj, ..., tfk} de ker(/l) y la completamos con vectores tft+1, ..., tf„ hasta obtener una base de V. Es suficiente probar que B = {A(vk 1 + ), A(vn es una base de img (,4), ya que entonces )}

.. ,

dim (ker (X )) + dim (img (A )) = k + (n — k) = n = dim ( V).

bases cualesquiera de F y W; para encontrar el núcleo de A es necesario resolver el sistema homogéneo

En particular, una aplicación lineal de IR3 en IR2 no puede ser inyectiva y una aplicación lineal de IR3 en IR4 no puede ser suprayectiva. * * *

Para terminar esta sección estudiamos las aplicaciones lineales biyectivas o isomorfismos entre espacios vectoriales. Supongamos que V y W son espacios vectoriales de dimensión finita, y que A es un isom orfism o entre ellos. D el corolario anterior deducimos que donde x l5 x„ son las coordenadas de un vector de V con respecto a la base elegida. D ebido a la proposición 3 de la sección 1.2 (capítulo 1) este sistema posee n — r(A) soluciones linealmente independientes que generan todas las restantes, donde r(A) denota el rango de la matriz A. Podem os, por tanto, concluir que dim (ker (A )) = dim ( V) — r(A). Com parando esta igualdad con el teorema 3 se deduce que dim (im g (X )) = /-(¿). dim ( V) = r(A) = dim ( W ) Otras consecuencias sencillas de algunos resultados anteriores se recogen en el siguiente teorema. T e o r e m a 4 __________________________________________________________________________ Sean V y W espacios vectoriales de dimensión finita n y sea A: V i - * W una aplicación lineal. Las siguientes condiciones son equivalentes: a) A es biyectiva. A es inyectiva. ker (/!) = { ( ) } . A es suprayectiva. El rango de A es n.

om .c a1 at ic .M at em

Puesto que im g (¿ ) no depende de las bases que se elijan en V y W para encontrar su matriz, de la igualdad anterior se deduce que todas las matrices de la aplicación A tienen el mismo rango. Podemos, por tanto, definir el rango de una aplicación lineal A, que seguiremos escribiendo mediante r(A), com o el rango de una cualquiera de sus representaciones matriciales. U na vez hechos estos comentarios el lector no tendrá ninguna dificultad en demostrar los siguientes resultados:

b) c) d) e)

Demostración.

Entre b), c), d) y e) se tienen las siguientes equivalencias:
Prop. 2

w

w

w

C o r o l a r i o _______________________________ '--------------------------------------------------Sean V y W espacios vectoriales de dim ensión finita y A: V i— W una > aplicación lineal. Entonces: a) b) A es inyectiva si y sólo si r(^ ) = d im (F ). A es suprayectiva si y sólo si r(A) = á\m(W).

b)
Cor. 0

o

c)

e)

<=>
Cor.

d)

P o r tanto, todas ellas son equivalentes entre sí. Finalmente, a)=>b), ya que toda aplicación biyectiva es inyectiva y puesto que b) y d) son equivalentes en este contexto y ambas implican a) se tiene que a) y b) son equivalentes. Esto termina la demostración. ■ D irem os que dos espacios vectoriales cualesquiera son isomorfos si podem os encontrar un isomorfismo entre ellos. Para que esto ocurra entre espacios vectoriales de dimensión finita ya sabemos que ambos han de ser de la misma dimensión. El recíproco también es cierto. T e o r e m a 5________________________________________________________________________ D a d o cualquier número natural n, todos los espacios vectoriales de dimen­ sión n sobre un mismo cuerpo son isomorfos.

EJEMPLO D. Supongamos que V y W son espacios vectoriales de dimensión finita y A: Vh-> W una aplicación lineal. Si A es inyectiva, k e r ( ¿ ) = { 0 } y, por tanto, d im (K ) = d im (im g (/!)); com o img (.4) es un subespacio vectorial de W concluimos que d im (F ) ^ dim (W 0 Si A es suprayectiva, del teorema 3 se deduce que dim ( V) ^ dim (img (/4)) = r (A ) = dim ( W )

Demostración. Sean V y W espacios vectoriales de dimensión n sobre el mismo cuerpo y sean B = { IT,, Tf„} y B = {w u ..., vv„} bases de V y W, respectivamente. Para definir el isomorfismo A entre V y W basta definirlo sobre los elementos de la base B: A(vj) = xvp j = 1 , 2 , ..., n P o r el teorema 5 de la sección 6.1 A se extiende a una aplicación lineal de V en W. Puesto que r(A) = n, ya |ue E es una base de W, del teorema anterior deducimos que A ■es un isomorfismo. ®

Finalmente, hemos de probar que F es suprayectiva; dada una aplicación lineal A de IRm con matriz M ( A ) con respecto a las bases canónicas, basta observar que , F (M (A )) = A Puesto que los espacios ^ mX„(IK ) y L ( V ; W ) son isom orfos y ^ mX„(IK ) tiene dimensión m x n deducimos que d im (L (F ; W )) = d i m ( J t mXn( K ) ) = m x n Hemos dado otra demostración del teorema 2 de la sección 6.2. * * *

E j e m p l o E. 1) Tod os los espacios vectoriales reales de dimensión n son isomorfos a IR" y todos los espacios vectoriales complejos de dimensión n son isomorfos a C". En general, todos los espacios vectoriales de dim ensión n sobre un cuerpo IK son

isomorfos a IK". 2) Los espacios vectoriales

y R 4 son isomorfos entre sí.

E j e m p l o F. Sean V y W espacios vectoriales de dimensión n y m, respectiva­ mente, sobre un mismo cuerpo IK. Deseamos probar que los espacios vectoriales

Observación. Supongamos que A es un isomorfismo entre dos espacios vectoriales V y W de dimensión n; debido al teorema 4 su rango es n y, por tanto, la matriz M ( A ) de A en cualesquiera bases de V y W es invertible. L a inversa de M ( A ) es la matriz de la aplicación inversa de A.

om ic a1 at em .c at

J f mxn( K )

y

UV\ W )

son isomorfos. Puesto que V es isomorfo a K " y W es isom orfo a IKm es suficiente con encontrar un isomorfismo entre J i mxn( K ) y. L ( K " ; IKm )

E JE R C IC IO S 6.4 1. Dadas las siguientes aplicaciones lineales encontrar las ecuaciones paramétricas del núcleo y la imagen comprobando en cada caso la ecuación dim (ker) + dim (im g) = dimensión del espacio inicial e indicar si son inyectivas o suprayectivas: a) b) c) d) A: U 3h-» IR3 / ^ (x 1; x 2, x 3) = (x i + x 3, x 2, Xj + x 2 + x 3). B: c 2 i >C2/B{zu z2) = (iz1+ z 1, z 1+ iz2). — C: IR2 i >IR4 /C(x1, x 2) = ( x 1 x ! + x 2, 2 x u x i + 2 x 2). — , D: C 3 H-+C 3/D tiene com o matriz /I D=
0 2 0

' z i\ F (A ) = A

V

/

para todo (z l5 z 2, ..., z „)e IK". Observar que F{A ) es la aplicación que tiene com o matriz A en las bases canónicas de IK" y K m y, por tanto, F ( A ) e L ( K n IKm ; ). Es necesario probar que F es un isomorfismo; com o F es claramente una aplicación lineal, hemos de probar que es biyectiva. Comenzamos encontrando su núcleo: si F (A ) = 0 se tiene que (z i /0 \ eK "

w

w

w

mo es la siguiente: dada A e M mx „ definimos

.M

(ver el problema 10 al final de esta sección). L a elección más natural de este isomorfis-

\

\

/

2. Describir el núcleo y la imagen de las siguientes aplicaciones lineales, indicando si son inyectivas, suprayectivas o biyectivas:

para todo T = (z 1; ..., z„)elK "; eligiendo T = e’ , j = U 2, ..., n, deducimos que a¡¡ = 0 para J todo ¿= 1, 2, ..., m por tanto, A coincide con la matriz cero, que es por tanto el úni­ \ co elemento del núcleo de F.

b)

C B: J ( 2 x 2 (R ) >-> M 2 x 2 (IR) tal que Cb(A ) = A B —BA con

11. Sea A e L ( V ; W ) una aplicación lineal inyectiva; demostrar que toda base de V se transforma mediante A en un conjunto de vectores linealmente independientes. Deducir de este resultado que si existe una aplicación lineal inyectiva entre dos espacios vectoriales V y W de dimensión finita, se ha de tener d im (K )^ d im (W 0 (ver ejemplo D).
Sea A ' e U y ; W ) una aplicación lineal suprayectiva; demostrar que toda base de V se transforma mediante A ' en un sistema de generadores de W. Deducir de este resultado que si existe una aplicación lineal suprayectiva entre dos espacios vectoria­ les V y W de dimensión finita, se ha de tener d im (K ) 2: dim { W ) (ver ejemplo D).

c) d)

A:

tal que A ( l ) = x 2 + 1, A (x ) = x + 2, A ( x z) = x 3 —x y A ( x 3) = 1.

La aplicación derivación de Pfií’ Ex] en PjJ' u [x ],

12.

3. Describir el núcleo y la imagen de la aplicación lineal traza e indicar lasdimensio­ nes de cada uno de ellos. (L a definición de la aplicación traza se hadado en el problema 5 de la sección anterior.)

4.
a) b) c)

Dada A e L ( V ; W), demostrar los siguientes resultados: A 2 —A ° A = 0 si y sólo si im g ( A ) c k e r (A). k e r(A ) c ker(/í2) c ker(/l3) c ••• <= k e r(/ l"~ x) <= k e r(A ") c img (A) img (A 2) => im g(/ l3) => ■■■=> im g (A " -1 ) img 04") => •••

13. D a r un ejem plo de espacios vectoriales V y W y aplicaciones lineales A y A ' e U y ; W ) y una base B de V tal que:
a) b) A sea inyectiva y A (B ) no sea base de W. A ' sea suprayectiva y A'(B) no sea base de W. (V er los problemas 11 y 12.)

5. Construir aplicaciones que sean isomorfismos entre los siguientes pares de espacios vectoriales: a) b) c) C 5 y IR10. Pfc">[x] y

a) b) 7. a) b)
8.

ker (A\VJ = ( k e r (A )) r\ Vi.

.M

at

6. Sea A: V \ * W una aplicación lineal y V¡ un subespacio vectorial de V; denotare­ — mos por A\Vt la restricción de A a Vv Dem ostrar que:

em

at

ic

Jíf3x2(U ) y IR6.

a1
6.5. E S P A C IO D U A L D E U N E S P A C IO V E C T O R IA L D ado un espacio vectorial V sobre un cuerpo IK, podemos considerar el conjunto L (V : K ) de todas las aplicaciones lineales de V en el espacio vectorial K. Obsérvese que IK es un espacio vectorial de dimensión 1 sobre IK. Este espacio ha sido estudiado con m ayor generalidad en la sección 6.2. En particular, el teorema I de la sección citada nos permite concluir que L ( V ; IK) es un espacio vectorial sobre IK. Este espacio vectorial recibe el nombre de espacio dual del espacio vectorial V y se utiliza comúnmente el símbolo V*, en lugar de L (V ; IK), para indicarlo. P o r tanto, V * es el espacio vectorial de todas las aplicaciones lineales de V en K. Los elementos de V * son aplicaciones lineales y, por tanto, se indicarán con letras mayúsculas. Algunos autores prefieren utilizar letras minúsculas seguidas de una * en la parte superior derecha, tal com o v*, e*, etc. L a primera de estas notaciones será la que se utilice en el teorema que se enuncia en esta sección. Si V es un espacio vectorial de dimensión finita n, del teorema 2 de la sección 6.2 se deduce que el espacio dual V * tiene dimensión n. El siguiente teorema exhibe una base B * asociada de manera única y natural a una base fijada 8 de K Obsérvese que la demostración de un teorema más general, que incluye a éste, se ha dado en la sección ker ( B ° A ) => ker (A). dim Fj + dim W1= n

C "

+ 1.

Sean A e L ( V ; W ) y B e I i W \ X). Dem ostrar que im g ( 5 ° A ) cz im g (B) y que

Dem ostrar que r(B ° A ) ^ r(A ) y r(B ° A ) ^ r(B).

Sea V un espacio vectorial de dimensión n y W un espacio vectorial arbitrario. Dados dos subespacios vectoriales Vx de V y W¡ de W tal que

demostrar que existe una aplicación lineal A \ V \ - * W tal que ker (A ) = Vl e img (A ) = WV 9. Sea A un isomorfismo de los espacios vectoriales V y W, ambos de dimensión finita. Dem ostrar que toda base de V se transforma en una base de W. 10. Sean V y W espacios vectoriales de dimensiones n y m, respectivamente. D em os­ trar que L (F ; W ) es isom orfo a L(IK"; IKm ). En los siguientes problemas V y W son espacios vectoriales de dimensión finita.

w

w

im g/l = im g(¿| Ki) si Vl + k e r ( ¿ ) = V.

w

.c

om

14. Sea A un isomorfismo de V en W. a) Demostrar que toda base de V se transforma en una base de W mediante A. b) Dem ostrar que toda base de W se transforma en una base de V mediante A ~ K Deducir de a) o de b) que si V y W son isomorfos, dim V = dim W.

6.2

(teorema 2 ): íiclu im os la demostración porque este caso particular puede servir para

aclarar el caso más general anteriormente descrito.

para tod o i = 1, 2, ..., n. P o r tanto, c¡ = 0, i = 1, 2, ..., n, ya que Ej(T¿) es no nulo solamente si j = i. Esto prueba que B * es un conjunto de aplicaciones lineales lineal­ mente independientes. Finalmente, dada A e V * se tiene que

T e o r e m a 1 _____________ _____________________________________________________________ Sea V un espacio vectorial de dimensión base de V. Existe una única base B * = { E lt E 2, ..., £ „ } de V * tal que £ ¡(e ¡)= 1 para todo i = 1, 2, ..., n, y E f f l = 0 si i # j. L a base B* se denomina base dual de B. ya que si ~v= Y v j^ j tenemos que j= i finita n y B = {~ e 1 e 2, ..., ~ n una , e} A = Y A (ej)Ej j= i

j= i Nota. L a propiedad de B* enunciada en el teorema se escribe más fácil­ mente utilizando el simbolismo denominado de la delta (<5) de Kronecker que se ha introducido en la demostración del teorema 2 de la sección 6.2. Recordemos , que Sjf, j, i e h J es un número definido com o sigue: c Jl í1
[0

¿

A (e j)E j(v )= ¿

A {? j)V j= ¿

A {v¡e¡) = A ( ¿

/ (TT). 1 /

j= i

j= i

v= i

P o r tanto, B * es un sistema de generadores de V * y queda totalmente demostrado el teorema. ■
E j e m p l o A. Tratem os de encontrar = {«?!, ~ 2, F3} de R 3. La aplicación lineal e

la base dual de la satisface
E l ( e 3) = 0

base

canónica

B

a1

si i = í si i # j .

om

.c

£ ^ = 1 ,

E l ( e 2) = 0,

Demostración. Para j = 1, 2, ..., n definimos E j de la siguiente manera: dado T T n = Y vjej e V tomamos i= 1 E j ( v ) = vj es decir, la j-ésima coordenada de tf en la base B. Es fácil com probar que E j e V * para todo j = 1, ..., n, y que E¡ satisface la propiedad requerida en el teorema. Unicamente falta demostrar que B * = { E l , E 2, Si tenemos una igualdad de la forma £ „ } es una base de V*.

w

.M

EjCed = Sji,

j, ¡ = 1 , 2 , ..., n.

at

em

Con esta notación los elementos de la base dual de B satisfacen

P o r tanto, E 1( x í , x 2, x 3) = E 1( x 1eh + x { e 2 + x 3e'3) = x 1. 1 D e manera similar se concluye que
E 2( x
u

at

ic

x 2, x 3) = x 2

y

E 3( x

u x

2,

x

3) =

x

3

E j e m p l o B. Sea B = { u 1= ( 1, 1, 0), u2 = (0, 1, 1), tT3 = (l, 0, 1)} una base de IR3; queremos encontrar la base dual, B*, de B. Denotem os por U ¡, U 2,U 3 los elementos de B*. P o r definición de B* tenemos que

w

w

l/1 « 1 = l, ( ) P o r tanto,
U 1( e 1 +~e2) = l ,

t/1 « 2) = 0 , (

t/ 1 (u3) = 0 .

U 1( e 2 + e'3) = 0,

U f á + ~e3) = 0.

D ebido a la linealidad de U 1 tenemos que
U 1( e 1) + U 1( e 2) = l

U i(é*2) + U j(F 3) = 0 ¿ CjEj = 0 j= i donde 0 representa la aplicación lineal nula, se tiene que [/ 1 ( r i )+ C / 1 (e 3) = 0 Resolviendo este sistema se obtiene U 1 e 1 = U 1 2) = ~, ( ) (e U 1 (ë'3) =

j= i

¿

CjEfed = 0

P o r tanto,
1 1 1

CAPITULO 7
V i(x i, x 2, X 3 ) - x ¡ + 2 X 2 2^3'

D e manera similar se obtienen los otros dos elementos de la base B *:
1 1 1

VALORES Y VECTORES PROPIOS. FORMA DE JORDAN

U 2( x » x 2, x 3) = ~~~x1-t-—X2 + ~ x 3
1 1 1
+ —x 3

U 3(x¡,

X 2,

X 3) — — X j

— x2 —

7.1. E J E R C IC IO S 6.5 1. 2. Encontrar la base dual de iJ = {ü'1 = ( l , 2, 1), tí2 = (0, 1, 1), ü 3 = ( l , 1, 1)} en IR3. * 7.2. 7.3.

In tro d u c c ió n Subespacios in variantes. V a lo re s y vecto res p ro p io s de una a p lica ció n lin eal F o r m a de Jord á n de m atrices de o rd en 2 F o r m a de Jord á n de m atrices de ord en 3 A p lic a c io n e s lineales y subespacios in varian tes T e o re m a de cla sificación de Jordán O b te n c ió n de la fo rm a de Jord á n de una m a triz a u to va lo res c o m p le jo s F o r m a de Jord á n real de m atrices reales c o n El teorem a de C ayley-H am ilton

om .c a1 at ic em w w .M at w

Encontrar la base dual de B = {1, x + 1, x 2 - 2 , x 3 - x 2} en el espacio vectorial

7.4. 7.5. 7.6. 7.7. 7.8. 7.9.

P|f>[x] de todos los polinom ios de grado no superior a 3.

7.1.

I N T R O D U C C IO N

En el ejemplo A de la sección 6.3 se demostró que si la aplicación lineal A tiene com o matriz

con respecto a una base { e u e *2}, la misma aplicación A con respecto a la base e’¡ = ? 1 + + 2 ?2, ~ 2 = 2Y1+ 3 z~ tiene com o matriz ?' 2

A 'J 2 \0

° 3

Tenemos, pues, que A ' = C ~ 1A C o equivalentemente A = C A ' C ~ 1, donde C es la matriz del cambio de base. ^

L a matriz de la aplicación lineal A en la base {e"í, e"2} es mucho más sencilla que correspondiente en la base L a matriz A ' es diagonal. A la vista de este ejemplo podem os preguntarnos si, dada una aplicación lineal A, siempre puede encontrarse un cambio de base de manera que la matriz de A con respecto a la nueva base sea diagonal. U n ejemplo muy sencillo nos hace perder la esperanza de resolver afirmativamente esta pregunta: la matriz 1 A=
0 1 1

A pesar de que no todas las matrices son diagonalizables, el objetivo de este capítulo es encontrar la forma «m ás sencilla» en que una matriz dada puede transfor­ marse mediante un cambio de base; esta forma «m ás sencilla» se denominará matriz de Jordán de la matriz dada. (El nombre se debe al matemático Camille Jordán — Lión, 1838-Milán, 1922— , que ayudó a comprender la clasificación de las aplicaciones lineales.) N o sólo puede utilizarse la forma de Jordán de una matriz para clasificar las aplicaciones lineales en un espacio vectorial, sino que podemos utilizarla para realizar operaciones con matrices. C om o ilustración tratemos de encontrar la sexta potencia de la matriz

6
no puede diagonalizarse. a En efecto, supongamos que existe una matriz C = I supóngame determinante |C tal que |, a 0 Tenemos, pues, que
0

-2

A= b , ) de cambio de base, con d

6 -.1

c

D ebido al ejemplo A de la sección 6.3 podemos escribir:

A - c P Entonces:

° )c - '

con

c J \

l

C ~ XA C = A =

P

a1

.c

om

ic

at

- i:
aa ca bp\ 1 ( d d PJ\C \\-c

at

d

-b \

J_

A 6=

2

0

C

:)C :
— b\ a )
1

-c

a J\C\ — aba + abp

em

0

3

c2 6

‘ - c ñ

0

° Y c - = c P os 3
2 - 1

0 3;

, c -

fadoL — bcfi

.M

0

26 2 7

2- 36 37

-3

2

w

w

\C \ \ c d x-c d p

- b e a + adp

w

0 — 3 -2 6 + 4 -3 6 — 3 -2 7 + 2 -3 7

36 2 7 —2 -3 6 2 8 —3 7

2 -1

Com parando la primera y la ültima de estas matrices se tiene:

1

= — (adot — bcP) || C

(1 ) 7.2. S U B E S P A C IO S IN V A R IA N T E S . V A L O R E S Y V E C T O R E S P R O P IO S D E U N A A P L IC A C IO N L IN E A L

0 = — cd( a — P) || C 1 = — ab( — a + P) . || C
1

(2 )

(3) (4)

= — ( — bctx + adP) || C

D ado un espacio vectorial V y una aplicación lineal A: V\-> V, es decir, A e L ( V ) , un subespacio vectorial W de V se llama invariante respecto a A si A ( W ) a W, es decir, la imagen A { x ) de todo vector x e W es un elemento de W. E je m p lo A. Sea A e L (K 2) una aplicación lineal en IR2 cuya matriz respecto de una base [ e u ~ 2} de R 2 está dada por e

D e (2) se deduce que o bien c = 0, o bien d = 0, o bien a = p. Si c = 0, de (1) y (4) se deduce que a = \C\/ad = P, y sustituyendo esto en (3) se obtiene la contradicción 1 = 0 . Si d = 0 se obtiene la misma contradicción mediante un razonamiento semejante. Final­ mente, si a = P, (3) es claramente una contradicción.

Entonces, W1 = { x í eí /xí e IR} y W2 = { x 2e2/x2e U } son invariantes respecto de A. En efecto, A ( x 1T 1) = x 1 ( e 1) = x 1 A (2e1 = (2 x 1)T 1e W l )

con respecto a la base canónica, y los elementos de n son de la forma W = x¡e'1+ A x 1e'2 + x 3~ Ae IR, tenemos que e3, [l P (v ) =
0 \0 0 1 0 0

\/ /\

*1

\

I X1 \ Axt \ « /

y
A ( x 2e’2) = x 2A ( e 2) = x 2? 2 e W2. E j e m p l o B. Sea R x una rotación de ángulo a # 0 en IR3 con respecto al eje Oz. Geométricamente se observa que el plano xOy y la recta Oz son invariantes con respecto a esta aplicación. Para com probar algebraicamente que el plano xO y es invariante observar que la matriz de con respecto a la base canónica de IR3 es cos a R= sen a — sen a cos a
0 0

o
0

Axt
X3 I

El elem ento x ^ + A x ^ es de nuevo un elemento del plano n. Otros subespacios invariantes de esta proyección ortogonal son el plano xOy, el eje Oz y cualquier recta del plano xO y que pase por el origen de coordenadas.

\ .

0

0

1/

Para cualquier aplicación lineal A e L ( V ) el subespacio £ = { 0 } , form ado sólo por el elemento nulo, es invariante ya que ¿ ( 0 ) = 0 y el propio espacio vectorial V es también invariante. P r o p o s ic ió n 1 ___________________________________________________________________ L a intersección y la suma de subespacios invariantes respecto de una aplicación lineal A e L ( V ) son subespacios invariantes respecto de A.

Si x = x 1'e1+ x 2e2 es un elemento del plano xOy se tiene que /cos a sen a \ y, por tanto, RJ^x ) = (x j eos a —x 2 sen a )e 1+ ( x 1 sen a + x 2cos a )T2 que es de nuevo un elemento del plano xOy. E j e m p l o C. Sea P la proyección ortogonal de IR3 sobre el plano x O y x todo plano n que contiene al eje Oz es invariante. En efecto, com o la matriz de P es /l P =
0 0 1 0 0

— sen a cos a
0

0 0 1

\

/ X! cos a — x 2 sen a \

w

w

.M

at

em

at

ic

a1

/

0

.c

om
Demostración. Sean Wlt W2 subespacios vectoriales de V que son invariantes respecto de A; si x e Wx n W2 se tiene que x e y x e W2; com o Wx y W2 son invariantes tenemos que A ( x ) e Wx y A (x ) e W2; así pues, ¿ ( x ) e Wx n W2. Esto prueba que Wx n W2 es invariante. Sea ahora x = x ’ 1+ 5t2 e W 1 + W2; com o A es lineal y Wu W2 son invariantes respecto de A, se tiene que A (x ) = A ( x 1+ x 2) = A (x + A ( x 2) e W 1 + W2

x 1 sen a + x 2cos a

w

'

con lo que se demuestra que W1 + W2 es también invariante. El razonamiento es similar si se consideran más de dos subespacios vectoriales. ■ Si W es un subespacio vectorial de V, de dimensión 1, -y es invariante respecto de una aplicación lineal A e L ( V ) tenemos que si x e W, no nulo, A(x") = Ax; si J es otro vector de W, y = ax con a e K; asi pues, A ( y ) = A{ a x ) = a A ( x ) = a(Ax ) = A(oix) = Ay y, por tanto, satisface la misma ecuación que x . Esto nos conduce a la siguiente definición: D e f i n i c ió n 2 (Valores y vectores propios) --------------------------------------------------

o
0

\o

o

,

U n vector x # 0 de un espacio vectorial V sobre IK se llama vector propio de una aplicación lineal A e L { V ) si existe un escalar A e IK tal que A ( x ) = á x ; este número A se denomina valor propio de la aplicación A correspondiente al vector x*.

Nota.

O tra nomenclatura que se utiliza para vectores propios y valores

Puesto que

propios es la de autovectores y autovalores, respectivamente. Observar que, por el razonamiento realizado antes de la definición 2, si x es un vector propio de A con autovalor X, todo elemento no nulo del subespacio unodimensional generado por 3T es un autovector de A con el mismo autovalor X. Supongamos que una aplicación lineal A en un espacio V de dimensión n tiene n vectores propios linealmente independientes T u ~ 2, ..., ej, con valores propios e /j, X2, ..., X„, respectivamente; tomando { e u ~ e2, K } com o una base de V se tiene que

:X
--Z

K ;w;

A ( e í ) = X1e l , A (e 2) = X2e2, ..., A (e n = Xnen ) y, por tanto, la matriz de A con respecto a esta base es la matriz diagonal se tiene que A ( x ) = 2x y A ( y ) = y y con lo que x e y son vectores propios de A con valores propios 2 y 3, respectivamente. C om o {x, y } forman una base de IR2, ya que

0

\

\0 \ )
A es diagonal, hemos probado el siguiente resultado:

\

1

2

2 ,

3

= 3 —4 = — 1 # 0

la matriz A es diagonalizable en IR y su matriz diagonal asociada es

a1

Recíprocamente, toda aplicación lineal que tiene una matriz diagonal en una cierta base tiene a los elementos de esta base com o vectores propios. Si decimos que una aplicación lineal A e L ( V ) es diagonizable si existe una base de V en la cual la matriz de

om

.c

2

0

0

3

P r o p o s ic ió n 3________ _— -----------------------------------------------------------------------------

at

em

at

ic w w
A continuación mostramos cóm o se calculan autovalores y autovectores de una aplicación lineal. Supongamos que x es un vector propio de una aplicación lineal A en un espacio vectorial V y que X es su autovalor, es decir, A ( x ) = Xx. Sea {e\, ~ 2.....~ n) una base de e e V y x = x l e'l h ------Si A = (a¡j) es la matriz de A con respecto a esta base tenemos que n n / n Y X xjej = X ^ Xj?j = X x = A ( x ) = A l £ XjT j J= i j'=i \ j= i

V formada por vectores propios.

D e f i n i c ió n 3 ---------- ----------------------------------------------------------------------------Una matriz A e J t nXn( K ) se dice diagonalizable en IK si la aplicación lineal A: IK"i-» IK" que la tiene como matriz es diagonalizable.

D e esta definición se deduce que A e J í n * „(IK) es diagonalizable en IK si existe una matriz C s J Í „ xn{IK), con determinante no nulo, tal que A ' = C ~ 1A C es una matriz diagonal.
Ejem plo

w

.M

Una aplicación lineal A e L ( V ) es diagonizable si y sólo si existe una base de

=
D. Demostrar que x = e ’¡ + 2e2 e y = 2é’l + 3é’ son vectores propios de 2

i

- A

e j ) =

i

x

l

i

a,e;.)= ¿
/

¿
/

j= i

J=i

\ ¡= i

¡= i \ j= i

la aplicación lineal A de matriz

Puesto que f a , 'e2, ..., ~ n) es una base de V hemos de tener e

(a 1 1 - / l)x 1 + a 1 2 x 2 + - - - + a lnx„ = 0 con respecto a la base diagonalizable en IR? ~ 2j de IR2 y encontrar sus autovalores. ¿Es esta matriz e
a 2 i x i "I- ( ^ 2 2 X)x2 H --- l-a2 nx„ = 0

(1)

i x i + an x 2 + ••• + (a„„ - Á)x„ = 0 2

Puesto que (1) es un sistema homogéneo, para que posea una solución no nula se ha de tener que el determinante de la matriz de sus coeficientes sea nulo, esto es: fln - A a2 1 a12 a22 k din a2n = \A — kl\ = 0 (2 )

y, por tanto, 2x, + 2 x 2 = 0 ; así pues, los vectores propios correspondientes a k2= — 1 son de la forma b ( \~h C om o y ^ ^ forman una base de R 2 la proposición 3 nos permite deducir y el cambio de base viene dado

a nl

ani

que A es diagonalizable, con matriz diagonal ^ por la matriz

donde I denota la matriz identidad. L a igualdad (2) es una ecuación en k de grado n y sus soluciones en K son los autovalores de A. A partir de ahora restringiremos nuestra atención a espacios vectoriales sobre el cuerpo IR o sobre C. Si V es un espacio vectorial complejo, la ecuación ( 2 ) tiene n soluciones complejas contando cada una con su multiplicidad, debido al teorema fundamental del álgebra (ver la sección 4 difl capítulo 4). Si V es un espacio vectorial real no podemos asegurar que la ecuación (2) tenga n soluciones reales. EJEMPLO A. en R Determinar los valores y vectores propios de la aplicación lineal de

c=|

2
-5

1
-1

que tiene com o matriz

at

ic

Los valores propios se determinan resolviendo la ecuación

a1

.c

om

A=

El polinom io (2) se denomina polinomio característico de la aplicación A o de la matriz A. Para poder hablar propiamente de «p olin om io característico» es necesario demostrar que el polinom io (2) no depende de la base elegida en V para escribir su matriz. Para demostrar esto, sea P B(k) = \A — kl\ el polinom io característico de la aplicación A en la base B = { e l , ~ ..., éT„} y sea P B.(X) = \A' — kl\ el polinom io caracte­ e2, rístico de A en la base B' = {e[,~e'2, si C es la matriz del cambio de base sabemos que A ’ = C ~ 1A C y, por tanto, P B.(k) = \A'-kI\ = \C~1A C - k I \ = \C~1A C - C ~ l kIC\ = = \C~1\\A — kI\\C\ = \A — kI\ = P B(k) Esto prueba que el polinom io característico no depende de la base elegida en V para representar A. * * *

0 = \ A -k I\ =

Sus raíces son k t = 6 , k2 = — 1 y, por tanto, éstos son los autovalores de A. El subespacio invariante correspondiente a k 1= 6 satisface las ecuaciones

w

w

w

= ( l —k)(4 — k ) — 10 = k2 — 5k — 6.

.M

at

5

4

0

1

5

4 —k

em

1

2

'l

0

1 -A

2

A continuación realizamos más ejemplos de cálculo de autovalores y autovectores. A \ %1 1= 6 o equivalentemente (A — 6 /)
Eje m plo

B.

La notación R a de ángulo a en el plano tiene com o matriz

esto es: f cos a -5 5 2\/x> —2/1x2 con respecto a la base canónica de R 2. Sus autovalores son las soluciones de la ecuación los vectores propios correspondientes a i j = 6 son de la form a a( tenemos ). Para k2— — 1 cos a — k 0 = \ R .-U \ = — sen a cos a — k = (cos a — k)2 + sen2 a = R„=. , sen a — sen a cos a

y, por tanto, - 5 x j + 2x 2 = 0 (la otra ecuación es combinación lineal de ésta). Así pues

2
5

2
5

sen a

= k2 — 2 (cos a)k + 1

Sus soluciones son = cosa + /sena, Á2 = eos a — i sen a. Estas soluciones son números complejos excepto si < = 2kn o a = (2 fc + \)n con k un número entero, en cuyo caso los x valores propios son reales. Si tx = 2kn se tiene que
1 0 1

Puesto que
cos a — 1 cos — 1 sen a sen a

sen a

cos a — 1

=(c o s a — 1) + sen a = 2 —2 co sa = 4sen

R„ =

0

el sistema (3) tiene únicamente la solución x ! = x 2= 0 si ot=£2kn con k entero. En este caso los vectores propios correspondientes a I j = l son de la forma ( 0 , 0 , x 3). Si o = 2kn se trata de la aplicación identidad y en este caso todos los vectores de IR3 c son invariantes. Si a = ( 2 f c + l ) 7i, A2 = A3 = — 1 y sus vectores propios son todos los del plano x0_y; en este caso tenemos una simetría con respecto al eje Oz.

que es la aplicación identidad; en este caso todo vector de IR2 es un vector propio con valor propio 1. Si x = ( 2 k + \)n se tiene que
-1

R„

0

Esta es la matriz de una simetría respecto al origen de coordenadas; sus vectores propios se determinan de la ecuación {Rx — ( — l)/)(x*) = 0, esto es, 0 •x = 0 ; por tanto, todos los vectores no nulos de IR2 son vectores propios de esta simetría; su autovalor es — 1 .

La proposición 3 nos da una condición necesaria y suficiente para saber cuándo una aplicación lineal es diagonalizable, a saber, que exista una base del espacio vectorial V formada por vectores propios; en algunos casos puede resultar laborioso el encontrar esta base. U na condición que es suficiente para poder asegurar la diagonalización de una matriz está contenida en la proposición siguiente: P r o p o s ic ió n 4______________________________________________________________________ Los vectores propios de una aplicación A correspondientes a valores propios distintos dos a dos, son linealmente independientes.

/cosa R„ = I sen a

—sena cos a

0

\

em

0

at

ic .M at
Nota. Darem os dos demostraciones de esta proposición; una de ellas a continuación y la otra al final de esta sección. Demostración. Realizaremos la demostración por inducción según el número de autovalores. Si sólo hay un autovalor Ax y es uno de sus autovectores, x^ es linealmente independiente puesto que X j / 0 por definición de vector propio. Supongamos que existen dos autovalores A l 5 k2 con vectores propios x^, x*2, respectivamente, y que / Á 2. Si F „ x 2 fueran linealmente dependientes podríamos encontrar a 1 a 2 no nulos a la vez, tal que ? a 1 x 1 + a 2 jT2 = 0. Aplicando A a ambos miembros de (4) tenemos (4)

0
Su polinom io característico es cosa —A
0

0

1/

—sena cosa —A

0 0

=

sena
0

= ( 1 — X)(A2 — 2(cos a)Á + 1 )

0 1- A

cuyas soluciones son A 1 = l, X2 — cosa + 1 sena> A3 = cosa — /sena. L os vectores propios para = 1 son las soluciones en IR3 de las ecuaciones I cos a — 1
0

— sen a cosa— 1
0

0 0 0

\ / V
*2
\ *3

w

w

w

a1

.c

com o matriz

om

E je m p lo C.

L a rotación R x de ángulo a, en el espacio, alrededor del eje 0z tiene

a 1 ¿(x*1) + a 2 /l(3r2) = a 1 A 1 x 1 + a 2 A2 x 2 = 0 y multiplicando (4) por k2 tenemos a 1 A2 x 1+ a 2 A2 x 2 = 0 .

(5)

=

sena
0

esto es: (cosa — l)X j — (sen a)x 2 = 0 (sen a )xj + (cos a — l ) x 2 = 0

(6 )

(3)

Restando ( 6 ) de (5) obtenemos oí1 á 1— k2) x 1 = 0; com o A í # A 2, hemos de tener a t = 0 ; ( sustituyendo a, en (4) obtenemos a 2 = 0, lo cual es una contradicción. Para demostrar la proposición por inducción supongamos que es válida para

cualesquiera k — l valores propios y que tenemos k valores propios klt k2, ..., kk distintos dos a dos con vectores propios x , x 2, ..., xjt, respectivamente. Supongamos que tenemos una combinación lineal de la forma a 1 x 1 + a 2 x 2 + - - - + a tx t = Ü. Aplicando A a ambos miembros de (7) tenemos (7)

Observación. U na matriz A puede ser diagonalizable y tener autovalores múltiples, por ejemplo, la matriz identidad es diagonalizable y tiene com o único auto valor 1 . E j e m p l o E. Tratemos de encontrar los valores de a e IR para los que la matriz ¡0 A=
0 0 0 0 0

\

a
0

A (

T

aj x j ) =

X
;= i

<*jA ( X j ) =

X
i =i

*j/.Jx J = Q.

() 8
o O

\a

j

\j= i

J

es diagonalizable (en IR3). Su polinom io característico es
1

y multiplicando (7) por kk tenemos

}= i Restando (9) de ( 8 ) obtenemos

X «/**;= 0-

( 9)

0

=

&

0

= ( - k ) ( a - k ) ( - k ) = (a -k )k 2

1

a

0

—k

Los autovalores de A son k = a (simple) y k = 0 (doble). Si a = 0, A es la matriz nula, que es diagonal y, por tanto, diagonalizable. aJ (/J~/.k J = 0 . )x -

.c

j =i
Puesto que los /, son distintos dos a dos, la hipótesis de inducción nos permite concluir que a a 2, ..., a * . , son cero; sustituyendo en (7) se obtiene a* = 0 y, por tanto, { x 1; ..., x,,} son linealmente independientes. ■

om

X

Si a / 0, hemos de estudiar si existe una base de autovectores para poder utilizar la proposición 3. Los autovectores correspondientes a k = a satisfacen: /xi ^

at

ic

a1

em

fo\
0
***

o

at

x2
\X J

axj = 0 a x 1— ax3 = 0
r, ^ * 1 = ° ’ *3 =

0;

.M

w

w

E j e m p l o D.

Estudiaremos si la matriz
- 2 1 1 0 1

\01

I 6 A= \6 \o es diagonalizable. Su polinom io característico es

\

- 1

w

por tanto, son de la forma x = ( 0 , x 2, 0), x 2 elR. (1 )

/ Los autovectores correspondientes a 1 = 0 satisfacen:
/0 0 0 0 0

\ / x j\ x2 =

/0 \
0

a 0

<=>

ax2 = 0 axx= 0

<=> Xj = 0 , x 2 = 0

6-k

-2 -1 -k

1 1
l-k

0=

6 0

= (1 - k )

6-k 6

-2 - l - k

\a

oj\ x3j

\0 /

= (l- A )(A - 2 p - 3 ), por tanto, son de la forma F = ( 0 , 0 , x 3), x 3e l (2 )

0

con lo que sus valores propios son k1= 3, k2= 2, k3 = l; sean e'1, ~ ~ vectores propios e2, e3 correspondientes a ku k2 y k3, respectivamente; com o los autovalores son distintos dos a dos, ~eu ~ ~ son linealmente independientes; por estar en un espacio de dimensión 3 e2, e3 forman una base y por la proposición 3 la matriz A es diagonalizable. * * *

C on los vectores que aparecen en (1) y (2) no puede obtenerse una base de IR3 y, en consecuencia, la matriz A no es diagonalizable si a / 0 . En resumen, la matriz A es diagonalizable si a = 0 y no es diagonalizable si a # 0.

Sea A e L ( V ) , donde V es un espacio vectorial de dimensión finita sobre K y sea A0 un autovalor de A, con A0 e IK. Denominamos subespacio propio correspondiente a A0 al subconjunto £(A0) = ker (A — A0/). Observar que £(A 0) contiene todos los vectores propios correspondientes al valor propio A0 junto con el vector 0. Puesto que el núcleo de cualquier aplicación lineal es un subespacio vectorial de V, tenemos que £(A0) es un subespacio vectorial de V Además, de los resultados de la sección 6.4, se deduce que dim (£(A0)) = dim (ker (A - A0/)) = dim ( V) - dim (im g (A - A0/)) = = dim ( V ) — r(A — A0/) El siguiente ejemplo queda com o ejercicio para el lector.

implica a¡ = 0, V i '= l , 2, ..., n. Aplicando A a ambos miembros de la igualdad (1) se deduce que

=0
i= 1 D e manera similar se obtienen las relaciones

(2)

¿ a¡A?ü;. = 4 i= 1
m

¿
1=1

a¡A"_ 1 t? = '5 j

Escribiendo

^ fc= i
ti

las relaciones anteriores implican

n

n

E j e m p l o F.

Encontrar los subespacios propios de la aplicación lineal ¿ e L ( [ R 3),

que tiene com o matriz

i= 1

Z a¡%=°> Z aM * = o , ., Z *Arl^= o . .
i=1
1=1

om at ic a1 .c

/3 A= 0 \o

1 7
0

5\ 0 1¡

para todo k = 1, 2, ...,m. Para cada fc= 1, 2, ..., m, las igualdades anteriores determinan un sistema deecuaciones lineales y hom ogéneo en las incógnitas (a 1vlk, ..., a„vnk). Puesto que la matriz de los coeficientes de este sistema es

.M

El siguiente ejemplo sirve para mostrar que una matriz con elementos reales puede no ser diagonalizable en IR y, sin embargo, ser diagonalizable en C.

at

. "=

/ 1 1
Ai : A2 :

w

em

/O A = ¡ VI

- 1 0

w

w

E j e m p l o E.

L a matriz

W1
su determinante es el determinante de Vandermonde y, por tanto,

es diagonalizable en €, ya que sus autovalores son A¡ — i y A2 — i, que son distintos (ver proposición 4). Sin embargo, el lector puede com probar directamente que la matriz A no es diagonalizable en IR . * * *

1,1 n (^ ) 4= -^
1

£j<k£n

Demostración alternativa de la proposición 4. Supongamos que A e L ( V ) , donde V es un espacio vectorial de dimensión n, y sea B = { e 1, ~ 2, •• ^m} una base de V. Sean e •> A l5 A2, ..., A„ autovalores de A distintos dos a dos y sean tfl5 ~ v2, ~v„ autovectores correspondientes a A1; A2, A„, respectivamente. Para demostrar que ui, tf2, ..., Vn son linealmente independientes hemos de demos­ trar que una relación de la forma ¿ ¡x¡v¡= 0 , í=1 a ¡e!K

(ver la sección 2.3). Puesto que los a ¡ son distintos dos a dos, \A„\^0, y, por tanto, el sistema anterior sólo tiene la solución trivial. Así pues, aiv¡k = 0 para todo k = l , 2, ..., m. D e aquí deducimos que
m
a-¡Vi = * i

Z
k=

1

v ik^k = ^

i = 1 ’

2>•• n •>

(1)

Puesto que los ^ son no nulos, ya que son autovectores, concluimos que a¡ = 0 para todo /=1, 2, ..., n. Esto prueba que los autovectores ifj, ~v2, K son linealmente independientes, que era lo que queríamos, demostrar. ■

E JE R C IC IO S 7.2 1. H allar los autovalores reales y los autovectores de IR" de las siguientes matrices:

5. D ecir cuáles de las siguientes matrices pueden reducirse a una matriz diagonal y encontrar una matriz de cambio de base P:
0 0 1 0 0

4 ] e) 1-3 -3 -5 J - i )

b)

(5 V4

')

0

/ l V3 l) g)

d)

M
V 0 -O 2 1 M 1 0 0 1 oj -1

(-1 fl) -3 1 -3
3

14 “ M b) 3 1/
1

- 1 2 - 1

- 1 \
- 1

r c

1 0 0 0

\

0 0

0 1 0

ll

2/

/
- 2

0 0
1

0 0
- 2

-1 \
- i

/) f)

/ i

2 2 0

2 2 - 2 0

—1 \

\l

/

6.

Encontrar los autovalores y autovectores de la aplicación derivación, D, en í H ' M la b
1 0 0

3
0 0 - 1 - 1 1

l ) 2\ 0 -1 )
0

\ 2
0

-1

\ es diagonaliza-

h)

2 2 1

-í\ 0
1

7.

Determinar para qué valores de a, b e IR la matriz A =

0

\0
/ 5; d) 1; — *> —2; i) 2.]
8.

0

1/

- 1

\3

ble en IR . /1 Estudiar para qué valores reales de a la matriz A =
0 \ 0

om

[So/.: a) 1, —2; h) 3; c) no hay; d) — l ; e ) ± 1;/) 0, N/5, ble en real.

-2
1 0

-2 —a \ es diagona/

a1 at ic

2. En los casos del ejercicio anterior en los que sea posible, hallar una base de IR" form ada por autovectores, y la matriz, en esa base, de la aplicación dada.

.c
lizable. 9. D ada la matriz

em

lo
- 1

\ ■]

\ 3.

-3 I

\

- 2 /

.M

- 1

at

[So/.: a)

b)

c)

¡
A= 0
\ 0

2 - 2
a a

6 \
4 —a —a /

Dem ostrar que el subespacio generado por los vectores ^ + 2F2 y ~ + F 3 + 2F4 es e2 que en la base

w

w

w

probar que A es diagonalizable en C 3 para todo a e < C - {0 , 1}; probar que también es diagonalizable para a = l y que no lo es para a = 0 . /I
0 2 \2 - 1 - 1 - 1 0 1 2

4
0

- 2 1 2

10 10. Encontrar los valores de a, b e IR para que la matriz A = 0 \a zable, sobre los números reales. en

0

l\ 0
0

b
0

sea diagonali/

4.

Encontrar los autovalores y los autovectores de las aplicaciones lineales de

IR" que están dadas por las siguientes matrices:
0 0 0 0 0

- 1

a)

1

2 5

2

\ b)

-5 I4 5 -7 -9

2

\ c)

h 0 0 \l

°\
0 0 1

0 0 0

-3
0

3 - 2¡

3 4/

Sea A e U U 2) ( = aplicaciones lineales en IR2) tal que existe una base de IR2 en la (a b\ . , . que su matriz A = [ es simétrica. Probar que los autovalores de A son reales y \b CJ distintos, a menos que a = c y b = 0, en cuyo caso A = a l y a es el único autovalor. (4 2\ Encontrar los autovalores y autovectores de la matriz A dada por A = en la base canónica.

11.

I " 1

V V 2

/

Sea S = I i con ot2 + B2 = 1 la matriz de í f en la base canónica. H allar los V -°7 autovectores y autovalores de y 7 ¿Existe alguna interpretación geom étrica de la . aplicación y ?

12.

En esta sección encontraremos la forma de Jordán de aplicaciones lineales A e L ( V ) donde V es un espacio vectorial de dimensión dos.

Sea A e L ( V ) y supongamos que su matriz es Sea P = ( X ^ I con a2 + B2 = < la matriz de P e L ( U 2) en la base canónica. x \p i H allar los autovalores y autovectores de P. ¿Existe alguna interpretación geométrica de la aplicación P? en una cierta base fijada anteriormente. Su polinom io característico es 14. Si A es una matriz triangular de orden n cuyos elementos de la diagonal principal son todos diferentes, probar que A es diagonalizable. (p (A ) = 15. Probar que si A es una aplicación lineal de IR" con n autovalores distintos, cualquier aplicación lineal B de IR" que conmute con A tiene una base de autovectores, y todo autovector de A es un autovector de B. 16. Dada una suma directa V = W ® Z podemos definir E e L ( V ) com o E ( V ) = T si t? = w+~z con w e W , T e Z ; equivalentemente E ( v ) e Z y ( I — E ) ( v ) e W. a) b) Probar que E 2 = E, W = k e r(£ ) y Z = im g(£ ). / a —A b c d —X = (a — X)(d — X) — bc 13. a b c d

A=

con lo que (p(A) = 0 es una ecuación de grado 2 en la variable X. Tendremos dos casos diferentes según que las dos soluciones de esta ecuación sean iguales o distintas. Las raíces del polinomio característico son distintas: / ^ ¡i. . En este caso la matriz A es diagonalizable (proposiciones 4 y 3 de la sección 7.2), su forma de Jordán es 'A
0 0

C A S O I.

ic

Encontrar los autovalores de la aplicación £.

a1

.c

om

em

at

fi

w

7.3.

F O R M A D E J O R D A N D E M A T R IC E S D E O R D E N 2

w

y la matriz P del cambio de base tiene com o primera columna las coordenadas de un vector x que satisface (A — ÁI)x = 0 (esto es, x e k e r ( A — XI)) y com o segunda columna las coordenadas de un vector y que satisface (A — p.l)y = ( ) (esto es, ~ e ker (A — jul)). y
Eje m
plo

w

.M

at

D ada una matriz A e J i n x „ (K ), la «form a más sencilla» a la cual puede reducirse mediante un cambio de base recibe el nombre de matriz de Jordán de A. Ya hemos observado en la sección 7.1 que la «form a más sencilla» no es siempre la matriz diagonal. A la matriz de Jordán de A se le representa por J , o J A cuando sea necesario, y a la matriz del cambio de base de A a J se le representa por P\ así pues, se tiene

A.

Encontrar la forma de Jordán J de A =

'3 2

-4 -3 y la matriz del

cambio de base. C om o 3 —X 2 -4 —3—X = (3 — A)( — 3 — A) + 8 = A2 — 1

0

=

J = P ~ 1A P

sus autovalores son A ^ l , X2 = — 1; su matriz de Jordan es
'1 0 - 1

o equivalentemente A = PJP~K

J=

Si Aj = 1, tenemos 2 -4 \ / x A /O
2 x j — 4 x 2 = 0;

Es conveniente observar que, aun cuando los elementos de A sean reales, las matrices J y P pueden ser complejas.

(, 4 - / ) x = 3

4Ax

asi pues,

Si ambas soluciones de esta ecuación coinciden se ha de tener a+ d k=-

ker (A — /) = - c( ^

)/ c e K ^ .

(a + d)2 — 4{ad—bc) = 0

y

Para X-, = — 1 tenemos

o equivalentemente,

(a — d)2 + 4 b c = 0

y

X=

+

.

(1 )

asi pues,

A l calcular (A — XI)2 encontramos

ker(v4 + / ) = ^c( | )/

ceK^.

( A - X I ) 2- f a ~ ^ \ b

° d -X J

Y-í

(a ~ ^ 2 + cb ~ \ b (a -X ) + b (d -X )

(a -X )c + c(d -X ) bc + ( d - X ) 2 ■

Tom ando Í^ J com o base de k e r ( A - I ) y í | j com o base de k er(A + 1) obtenemos

que coincide con la matriz cero si utilizamos las igualdades ( 1 ).

1

1

w

CASO II. Las raíces X y n del polinomio característico coinciden: X = ¡x. En este caso calculamos ker (A — XI). Si kex(A — XI) tiene dimensión 2 podemos encontrar una base de autovectores de A y por la proposición 3 de la sección 7.2 la m atriz A es diagonalizable; su form a de Jordán es

at

em

at

ic

a1

l/ \ 0

- 1/\1

.c

/2 A= [

1 \ / 1

0 \ / 2

lx_1

Sea E 1= k e r ( A — XI) y E 2 = k e r (A — XI)2; el lema 1 nos dice que E 2 coincide con el espacio vectorial V que estamos considerando y que es de dimensión dos. C om o E¡ tiene dimensión 1 podemos encontrar u2 s E 2 — E{, tomar ^ = ( A — XI)(u2). Los vectores « i , u2 son linealmente independientes puesto que u2$ E 1y u1e E 1 (ya que (A — XI)(u1) = (A — XI)2(u2) = 0(u2) = 0 ) y ninguno de ellos es el vector nulo.C om o V es un espacio de dimensión 2, {1^, u2} es una base de V. En esta base tenemos (A — /.I)(u1 = 0 ) (A — X I)( u 2) = u 1 o A (u 1) = Xu1 A(íí2) = u1+ Xu 2

w

w

.M

om

con lo que la matriz de la transformación lineal en esta base es X 1

y la matriz del cambio de base queda determinada por cualquier base de ker (A — XI). Si, por el contrario, ker (A — XI) tiene dimensión 1 no podemos encontrar una base de autovectores en V; en este caso observamos que se tiene el siguiente resultado: L e m a 1________________________________________________________________________________ Si A tiene dos autovalores iguales X, (A — X I)2 = 0.

0

k.

Esta no es una matriz diagonal, pero es casi diagonal, y es la forma de Jordán de la matriz A en este caso. Podem os resumir estos resultados en la siguiente proposición, en donde K designa el cuerpo de los números reales o el de los complejos.
Pro
p o s ic ió n

Demostración.

L a demostración es sólo un ejercicio de cálculo; si A = ^

a

c ^ ), sus

2__________________________

autovalores satisfacen la ecuación a —X b c d -il

D ada una matriz A e J ¡ f 2x2( K ) siempre puede encontrarse una matriz J e J Í 2x2( K ) de una cualquiera de las formas

0=

= (a — X)(d — X) — bc = X2 — (a + d)X + ad — bc.

o °) 6 (o 1 • ^ e ) K

y una matriz F e ^ # 2 x 2 (IK) de determinante no nulo, tal que A = PJP~X La matriz J se denomina matriz de Jordán de A.

L a matriz de Jordán es J = pues, hemos de tener
0

2 0

1

-2
y la matriz del cambio de base es P =
■2

1
; asi
0

2

2

-2
-2

l\ /2
0

I V —2
2

lw

-2 E je m p lo B. Reducir la matriz A = ^ ^ 4 ^) a su forma de Jordan-

4

A 0

A - 2

O-

El polinom io caracteristico de la matriz A es —A -2 2 4 -A

lo cual puede comprobarse fácilmente.

= (4 — A)( — A) + 4 = / 2 — 4A + 4 = (A — 2)2

E j e m p l o C. Encontrar todas las funciones x (f) que coinciden con su derivada segunda, esto es, x "(í) = x(í). Si llamamos _y(t) = x'(t) podemos escribir x ’(t) = y(t)

que tiene com o raíz (o solución) A = 2. Con A = 2 se tiene que

E 1= k e r { A - 2 I ) = l [ 1 j / x j = x 2 U

j c í j / c e IK

y '( t ) = x ( t ) que en forma matricial se escribe como

ya que
-2 -2 2Vx,
<=> X , = x ,

em

at

2 /1 x 2

ic

a1

.c

om

at

Sabemos, debido al lema 1, que E 2 = k e r ( A - 2 I ) 2 tiene dimensión 2; elegimos u2 de manera que u2 no esté en £ x; por ejemplo:

.M

Encontramos la forma de Jordan de A = l

,0

1 0

.

‘.1

; como /’

w

w

w

u? =

-A
1

1 -À = A2 — 1 = (A + 1)(A — 1)

Entonces,
■2
- 2

la matriz A es diagonalizable (sus autovalores son distintos) con matriz de Jordán u 1= ( A - 2 I ) ( u 2) =
2 \ /l

- 2' \— 2
"1 0^ - 1

2 )\ 0 1

J=
0

Para encontrar la matriz del cambio de base calculamos £ ( l ) = k er(A —/) y £ ( — 1) = ker (A + /):
1

lV x j
O X ,= X 2 O £ ( — l)

1

= |c(

I/ceí

-lj{ x 2 °\ í / -r, x t = — x 2 -*> £ ( — l ) = <c ye e l

: :)(;

y calcular Podem os tom ar Uj = entonces
1

y u2= |

^

com o vectores de la nueva base. Tenem os 3 l ^ 10 K

: :)-c ■;)(: -X r
1

3.

D ado un polinom io p ( x ) = £ a„x", definimos
n= 0

- lV l

OV

1/2

1/2

P ( A ) = £ <*„A"
n= 0

1
P o r tanto,

lA o

— —1/2 1A

1/2
D ada < = ^ 4 ^ ^ Jordán de A.

y p(x) = x 2 + 5x + 6 , calcular p(A ) haciendo uso de la form a de

-1 V 1
/ (t)J \í l)\ 0

OV

1/2

l/2 \/x ( t)
1/2

—1 / \ —1 / 2

4.

Si pA(x) es el polinom io característico de la matriz A, demostrar que pA(Á ) = 0, donde A e J ? 2* 2 ( Q - (Este resultado se conoce con el nombre de teorema de CayleyHamilton; un resultado análogo es cierto para matrices de orden superior.) 5. Sea A una m atriz de orden 2 tal que A 2 = 0. D em ostrar que para tod o X, \ A - X l \ = X 2.

o equivalentemente,

at

ic

a1
1A.

-1/2

.c

í/2j\y(t))

\0

—1/ \ —1/2 12/ /

om at em w w w .M

1/2

l/ 2 \ / x '( í ) \ _ / l O V

1/2

l/2 V x (t)

Si hacemos u(t) = ^ x ( t ) + ^ y ( t ) y v(t) = - ^ x ( í ) + ^ y ( í ) tenemos u' = u y v ' = - v , de donde se deduce u(t) = u0e‘, C om o x(t) = u — v tenemos x(t) = u0e‘ — v0e ~ ‘ v(t) = v0e~'

F O R M A D E J O R D A N D E M A T R IC E S D E O R D E N 3

En esta sección realizaremos varios ejemplos de diagonalización de aplicaciones lineales entre espacios vectoriales de dimensión 3, que nos servirán para comprender m ejor los resultados teóricos necesarios para la obtención de la form a de Jordán de aplicaciones en espacios vectoriales de cualquier dimensión. Los resultados generales se expondrán en las secciones siguientes. A l final de la sección resumiremos los procedimientos seguidos en estos ejemplos. E j e m p l o A. Intentaremos reducir la matriz ( A=
0 2 - 1 - 1

que son todas las funciones buscadas, cuando u0 y v0 son dos constantes cualesquiera.

3

s

§
& Ci < fc; cj 9 <? < t» S E1 g Q W ¡2¡ ^ O o *
W £ H

E J E R C IC IO S 7.3

\- - 2

1 .
2.,

(l Encontrar la form a de Jordan de ,4 = 1

1 \

I y calcular A .

,

,

a su form a de Jordán. Sus autovalores satisfacen la ecuación 0 = \A-XI\ = - X 3- 2 X 2 + 4A + 8 = - ( X - 2 ) ( X + 2 )2, y, por tanto, son X = 2 (simple) y fi = — 2 (doble).

g e,.œ o -j a, « j D 2 r- ° U; o 3 g ^5 ^ W » Q o < Q

Probar por inducción que

J u í ¡ a,

en ^

Calculem os £(2) = k e r ( 4 - 2 J ) , que es el subespacio vectorial definido por las ecuaciones /O 2 \0
0 0

J

que es un subespacio de dimensión 2. C om o £ 1 (2) + £ 2 ( —2) llena todo el espacio, podem os elegir una base de V de manera que la m atriz de A sea, en esta base, bastante sencilla. La forma de elegir esta base se muestra a continuación. /O' Sea tí 3 =
0

\ ( x i\ x2

-3 -4

-1

—4 / \x 3 /

(:)
\0

2X}

3x 2

x 3—0

— 4 x 2 — 4 x 3 = 0;

| un vector de £ 2( — 2 ) que no está en £ j ( — 2 ) y tomemos

/

\1 , 10\ Ü2 — (A -b 21) \ l/
\ - 2

tom ando x 3 = — 1 se tiene x 2 = l, x 1 = l, con lo que « j =

I l\
1

/

2 2
- 1

3 1 -1

1\

es un autovector

\-l /
correspondiente a 1 = 2 ; además, tenemos que d im (£ ( 2 ) ) — 1 . Para n = —2, E 1( - 2 ) = k e r ( A + 2 I) es el subespacio vectorial definido por las ecuaciones
2

1

/

Fácilmente se comprueba que {uu u2, es una base y en esta base la expresión de la aplicación A que tiene a A com o matriz es A (u l ) = 2u1, A (u2) = — 2u2, A (u3) =
u

2 — 2u3

om

\

-2

2

1

- 1

-1

con lo que /
1 1 - 1 1 1 0 0 1

.c

\

1 1 - 1

1

0

\

/2
0

0
- 2

0\
1

ic

a1

o
1 1

at

em

at

/

/

\0

0

-

2

/

.M

con lo que

La matriz de la derecha de esta expresión es una matriz de Jordán de A. ♦ * /i E j e m p l o B. Reducir la matriz A =
1

- 1

w

w

I

1

'

w

*
0 0 - 1

o\ a una forma de Jordan.

\

li

\1
C om o £(2) + £ t( —2) no llena tod o el espacio vectorial no podem os elegir una base de autovectores. Es necesario en este caso realizar un truco análogo al realizado en el caso de raíces iguales para matrices de orden 2. Calculamos £ 2 ( —2) = ker(/4 + 2J)2, que es el subespacio vectorial que tiene por ecuaciones / 2
2

-1

0/

C om o |A — XI\ = (1 — A)(A 2 — 1) = (1 —Á)(X+ 1)(A— 1), los autovalores de A son A = 1 (doble), f i = — l (simple). Para 1 = 1,
0 0 0

3
1

l \ 2/ x 1

/ 8 8 0
0

0 \ (x í

\

M
\ X3

/°\
0
< >Xi = X2+ X3 f

\-2
por tanto,

-1

1/

\ — 8 -8

/

w y, por tanto,

\0 /

/ í\ E í( í j = k e r ( A - I ) = ia

+ b 0

í1 ^

¡a, b escalares

\0 /

\ í¡

Para / = — 1,

C o m o no existe una base de a u to vec to re s p roced em o s a ca lcu la r £ 2( — 2) = ker (A + 2 I)2:

¡2
1 \ 1 - 1

O
1 - 1

0

\ / Xi

12
1 1

0 1

0 \ [ x 1\

/0 \
0

Xj = 0

/
- 1

0

1 1

■1 \: ( x i \
0
1 /

1

/ \*3

\2 0

0 / \ x3/

X !+ X 2 = X 3 \0 1 \

x2
\ X3 ¡

x, = x .

«

i

y, por tanto, /1 \ fo \ + b \o] ¡a, b escalares|

/o \
£ 1 - l ) = ker(>l + /) = ^a (
1

E 2( - 2 ) = { a Ja escalar

0

\l/

W C om o E j M + E j Í — I ) llena todo el espacio la matriz A es diagonalizable y se tiene Puesto que con £ 2( —2) no se llena todo el espacio vectorial calculamos £ 3( —2) = ker (A — AI)3; com o {A — A l)3 = 0, lo cual puede comprobarse fácilmente, formamos la cadena de subespacios. £ i ( —2) ^ £ 2( —2) cp £ 3( —2 )= V

1

1

0 \ “ 1

/l
1 \0

1 0 1

0 1

\

1

o

0

\

om a1 .c

1

/

y eleguimos u3 e V de manera que u3 £ £ 2( — 2); por ejemplo,

at

ic

/1 \ «3 :
0 \0

E j e m p l o C.

Tratem os de encontrar una form a de Jordán de la matriz

em

w

/ —2 A= \

1

-l\

.M

at

/

o

1

-3/ M ,=

w

-1

-1

0

w

Tom am os u2 = (A + 2I)u3, u1 = (A + 21)u2; tenemos I
- 1

0

1 1

- 1 \
0

/
- 1

0

\ u, =

I
- 1

0

1 1

1 0

\/
- 1

0

\ =

/ - 1 \
- 1

Puesto que \A-AI\ = - A 3- 6 A 2- 1 2 A - 8 = - ( A + 2)3, los autovalores de A son A = —2 (triple). C om o

\

0

1

-1/

\

°l

\

0

1

o/\

o

1-1

/

con lo que { u 1, u2, u3} es una base; en esta base,

/

o
- i

i
i

-iX/xA

A (u 1 = —2u1, ) con lo cual deducimos í - l i 1 \

A(u2) = ul —2u 2,

A ( u 3) = u 2- 2 u 3

\
se tiene que

o

1

0

1 \ _1

/ -I A —1 \- l

0

1

\

1 -2 0 \
0

1

0

\

- 1 - 1 0 /a escalar j-. \-l
0 0

—1
0

0 =
0

—2
0

1 - 2 /

£ x( — 2) = ker (A + 21) = < a

w

1

/

/

Ejem plo

D.

Encontrar una forma de Jordán de la matriz

En esta base, X(ü*1 ) = —u l 5 y, por tanto, A ( u 2) — A (u3) =
u

2 -

u

3

Sus autovalores son A = — 1 (triple) puesto que \A — AI\ = — (/ + 1)3. Las ecuaciones de £ 1 ( - l ) = ker(>í + /) son ¡ - I
0

-1
- 1

l \_
0

1 /0
\ 0

-1
0

l\
0 0

/ - I
=
0 - 1

o
1 0- 1

o\
/

O O A l l \ / . x i\ /

—1

/

\

0

0
\ - l
por tanto,

0
0

o
l/\x,/

X, = x3
Resumimos a continuación el procedim iento utilizado en la obtención de las matrices de Jordán de los ejemplos anteriores. Una vez calculados los autovalores A se obtienen los núcleos de A —AI, donde A es la matriz dada; si estos núcleos llenan todo el espacio vectorial puede encontrarse una base de autovectores y la matriz es diagonalizable; si los núcleos no llenan todo el espacio vectorial es porque existen autovalores dobles o triples y en este caso es necesario calcular la cadena de los núcleos de (A — Aiy, j = 1, 2, 3, Cuando se haya llenado todo el espacio vectorial procederemos a elegir una base adecuada com o se ha mostrado en los ejemplos.

m o
\ 1

Io \
+ b /

at

ic

k er{A + I ) 2:

a1 .M at em
E JE R C IC IO S 7.4 1. Encontrar una form a canónica de Jordán y el cambio de base correspondiente de las siguientes matrices:
- 1

Puesto

que

E i(- l)

no

llena

todo

el espacio

vectorial encontramos

£ 2( - l ) =

/O
0

0 0 \ /x ! \
0 0

x2

w

w

w

\0

0 0 )\x3 j

\0 /

.c

om

w

/a, b escalaresj

Tenemos la cadena £ , ( - ! ) ^ E 2( - 1) = V, con lo cual podemos elegir w3e V - E ^ - l ) : /1 \ por ejemplo, u3 =
0

-i\
1 - 1

A= . Tom am os ahora u2 = (A + I ) u 3

13
1

I , B=

1

2
1 1

1\
1

( 4 , C2 [l

-1 1 -1 I 3

-2' -2

13 , D0

2 4
1

2\
1 2

2 \-i

\ 1

- 1

1/

oj
0 1

lo
2 10 6

/
1 0

\0 / /- 1 u ,=
0 1

lo \ /1 \ / -I E=
1

- 1

—2 ^ 3
0 1

/ —2 , F = \
- 1

-í\
- 1 0

~ 3\
- 1 2
,

fo H 1

, G= /

4 \3

0 0 0
\ - l

\ 1

3/

1

0

- t)

\ 1

- 1

0 l/\o/
2. H allar C 6. 3. Encontrar todos los subespacios invariantes de la aplicación A: IR3 1— IR3 dada por * la matriz I u, = A= 2
4
- 2 2

C om o £ i ( - l ) es un espacio de dimensión 2 aún podem os elegir t ^ e f ^ - l ) de manera que {u }, u2, u3] sea una base de V; tomar, por ejemplo,

\

0

2 lj

\ - l

1

a

X P v

fi\ v yj los auto valores y auto vectores de A. la matriz de ¿ e L ( R 3) en la basecanónica;supongamos que

4.

SeaA = \X ^

Supongamos, por el contrario, que P A(X) no posee raíces reales y sea / = a + i(i una de sus raíces complejas. Sea A e J ( nX„(R) la matriz de A en una base cualquiera del espacio vectorial. Los elementos T = (z¡, ..., z „)e

rango (A ) = 1 y t r ( A ) = a+ P + y = 1.H allar .

C "

tal que (A — X 1 )T = 0 pueden escribirse de la forma z2 = x 2 + iy2, ..., z„ = x„ + iy„

Z i= X i+ í> i,

donde x p yj son números reales. Escribiendo todas las ecuaciones del sistema (A - X I) ? = 0 tenemos 7.5. A P L IC A C IO N E S L IN E A L E S Y S U B E S P A C IO S IN V A R IA N T E S t fu (* i + <>i) + a12( x 2 + iy2) + •••+ a ln{xn+ iyn = (a + iP )(x 1 + iy1) ) En esta sección daremos dos propiedades de las aplicaciones lineales que nos ayudarán en la demostración del teorema de Jordán sobre la reducción de matrices a su forma «m ás sencilla». Si A es una aplicación definida en un espacio vectorial complejo, con matriz A respecto de una base fijada, el polinom io característico P a (X) = \A-XI\ <*1 1 * 1 de esta aplicación tiene tantas soluciones complejas com o el orden del polinom io (este resultado se conoce con el nombre de teorema fundamental del álgebra y ha sido enunciado con anterioridad en el capítulo 4). Si X0 es una solución de P A(X) = 0 con autovector ~0 el subespacio v, = es invariante: + + a12x 2 a22x 2 + •••+ + •••+ a lnx n a2nx„ = = axí ~ P y l ax 2- f i y 2 a2i(x i + i y j + a22( x 2 + iy2) + ••• + a2n( x n+ iyn = (a + ifi)(x2 + iy2) )

am ( x 1+ iy i) + an2( x 2 + iy2) + ••• + an n+ iyn = (a + ip)(x„ + iyn n(x ) ) Igualando las partes reales e imaginarias obtenemos los sistemas

om

a21x ¡

A{av0) = aA(v0) = aX0v* e L(v0). 0

.M

at

em

at

L 0 {a /e } (F) %aC

a1

.c

(I)
a n lx l

ic

+

a „ 2x 2

+

• •+

a nnX n

=

xx n- [ l y „

w

H em os probado el siguiente resultado: P r o p o s ic ió n 1___________ ____________________________________________________________ T o d a aplicación lineal en un espacio vectorial complejo posee un subespacio invariante de dimensión 1 .

tfuyi «21^1

+ +

a i2 y 2

+ +

•+

a íny n a 2ny n

= =

ay 1+ p x 1 <xy2 + P x 2 y (II)

w

a22y2

■ •+

w

Onl^l

+

a n2y 2

+

• •+

a„n y„

=

* > ’+ „

Pxn

Considerando los vectores reales En el caso de que la aplicación lineal esté definida sobre un espacio vectorial real, su polinom io característico puede tener todas las soluciones complejas y en este caso no podemos realizar el razonamiento anterior para obtener un subespacio de dimen­ sión 1 ; se tiene, sin embargo, el siguiente resultado: A ( u ) = < — pv, xu P r o p o s ic ió n 2________________________________________________________________________ T o d a aplicación lineal en un espacio vectorial real posee un subespacio invariante de una o dos dimensiones. A ( v ) = av + pu. (1 ) u = r e a l z = x l e 1+ ■■■+ x ne„ los sistemas (I) y (II) nos permiten escribir iT = im g 7 = + ••• + y„en

P o r tanto, el subespacio W generado por los vectores u y ~ es invariante respecto de v A. Unicamente falta demostrar que este subespacio es de dimensión dos; esto es cierto porque si u y V fuesen linealmente dependientes tendríamos 1 = yu con y e R y, por T tanto, A(tT) = au — pv = (a — Py)u con lo que A tendría un autovalor real, en contra de lo supuesto. ■

Demostración. Si el polinom io característico P Á(X) = \A — Xl\ de la aplicación A tiene al menos una raíz real se procede com o en el caso complejo para encontrar un subespacio invariante de dimensión uno.

Nota. Si se mira a la demostración anterior, se deduce de (1) que la matriz de A. restringida al plano W, con respecto a la base real {u, V } tiene la forma

Los vectores (reales) 3\ ■i\ r= | 7 o/

A \w~ E j e m p l o A.

i ~ P„ \

o c

P uj

«*' = | - 1

1/

Si existe un autovalor complejo A de la matriz (l A= 5
- 1 0

\

3
0

generan el mismo subespacio W de antes (observar que V ' = —V); por tanto, el plano invariante es el mismo y la matriz coincide con la dada en ( 2 ), si se toma la base {u, F }. * * *

\2

encontrar un plano invariante en IR3 y la matriz respecto de la base {real z , im g z } de la restricción a este plano, donde z* es un autovector correspondiente a A. Puesto que \A-AI\ = ( - 4 - A ) ( A 2- 4 A + S) los autovalores de A son A = - 4 , n = 2 + 2i, r¡ = 2 - 2 i . Los autovectores (complejos) correspondientes a n se obtienen del sistema
( 1 + 2 í)z 1 +
z2

La otra observación que haremos en esta sección se refiere a la matriz de una aplicación lineal A en un espacio vectorial V el cual puede descomponerse en suma directa de dos o más subespacios invariantes respecto de A. Supongamos que V = Wx © W2 es suma directa de los subespacios Wx, W2 que son invariantes respecto de A; recordemos que V = W l ® W 2 si y sólo si V = W 1+ W2 y si + vv2 = 0 con W je Wj se tiene w ¡ = 0, j = 1 , 2. Sea {F l5 ..., é’ \ una base de W¡ y r {e ’r+ 1 , K j una base de W2; com o Wl y W2 son invariantes tenemos:
A (? i) = a 1i T 1 + - - - + a r l T l

= 0"

a1

.c

^2z 1 - ( 6 + 2 í) z 3 = 0

om

5 z1 + ( 1 - 2 í) z 2 = 0

A ( e r)
A {e r+ l)

= a u e x + - - + a rrer
= «r+ l.r+ l^ r+ l H --------| - « n,r +l ^* n

w

3+ i = <a

.

.M

y, por tanto, el subespacio invariante (com plejo) correspondiente a /i es ker (A ~ f i l ) -1 — 7/ J/a e C >. Tom ar los vectores (reales)

at

em

[ z 1 = ( 3 + í )z 3

at

[z 2 = - ( 1 + 2 í)z 1 |

ic

A (Tn)

=

ar + u „er+1 +

w

w

con lo que la matriz de A respecto de la base {T u ..., ~ n e'r+1, ..., e~„} tiene la forma e

/
u = \
- 1

3\
V=

/ I

- c :,)
con A x matriz de dimensión r Se tiene, pues, que, en este corresponden a las matrices de tes. Los elementos que están y A 2 matriz de dimensión n — r. caso, la matriz de A puede dividirse en «ca jas» que A restringidas a cada uno de los subespacios invarian­ fuera de estas «ca jas» son todos ceros. Si se conocen m subespacios invariantes de A, que llenan todo V mediante una suma directa, la matriz de A puede escribirse de la forma

!/

\
2

que son los que generan el plano invariante W en R 3 correspondiente a / i = 2 + 2 i ; con respecto a esta base: ( 2

A]w = ( - 2

2
rj¡)z —(A

(2 )
n í)z

Para el autovalor r¡ = 2 — 2¡, que es el conjugado de n, el sistema (A

Ia'
en una base convenientemente elegida.

o \

= 0 tiene las soluciones z = ( z 1 z 2, z 3) con z¡, z 2, z 3 com o antes, con lo cual , 3—i \

La demostración de este último resultado es muy similar a la demostración del resultado anterior; el lector no tendrá ninguna dificultad para realizarla por sí solo.

Denominaremos matriz elemental de Jordán de orden k y autovalor A e C a la matriz J k(X) de orden k cuyos elementos son todos nulos, excepto los de la diagonal principal, que valen X, y los situados inmediatamente encima de la diagonal principal, que son unos. P o r ejemplo:

E J E R C IC IO S 7.5 1. En los casos siguientes, hallar los autovalores (reales o complejos) y los correspon­ dientes autovectores de C"; y cuando haya un par de autovectores conjugados u, ü y la matriz respecto de la base hallar el correspondiente plano invariante en {real tí, img u } de la restricción a este plano. 0
0 0 0 1 1 - 1 0 0 0 - 1 0

x
0

i
X J 3(X) =

IX 0

1

o\ 1 Ij

X
0

J4 = (A)

V

0

lo
a)
0

1 -l\
1 1

A
d)
1 1 1

y así sucesivamente. + i —i Llamaremos matriz de Jordán a cualquier matriz cuadrada formada por yuxtaposi­ ción de matrices elementales de Jordán a lo largo de la diagonal, de la forma
\

0
0

b) /

c)

1

—i

\3


0
n/3'

°/
om

J k M i) J M

o\

[S ol ■ a)

1,

i

i

-> /3
1

0

a1

.c

b) 0 c) d) ±¿; { x 2 = x 4 = 0 };
1 0, 2

\ 0
T e o r e m a d e c l a s if ic a c ió n d e Jo r d a n . T o d a m atriz cuadrada (real o com pleja) es equivalente a una matriz de Jordán (compleja), determinada de manera única salvo por permutaciones de las matrices de Jordán elementales que la componen.

{ x j = - x 2, x 3 = 0 }

w

2. Sea A e L ( V ) una aplicación lineal invertible y ^ un subespacio vectorial de V invariante por A. D em ostrar que W es también invariante por A ~ l .

w

.M

at

—i

em

o

at

- i

ic
Existen varias demostraciones de este teorema; la que nosotros daremos se basa en la obtención práctica de la matriz de Jordán de una dada. La demostración será larga y en ella habrá varios lemas que servirán para que el lector comprenda m ejor el resultado final. Sea X e C un autovalor de una matriz A de orden n de la cual queremos obtener su form a de Jordán. Form amos la cadena creciente de subespacios vectoriales £ i(A ) c E 2(X) c ••• c E j(X) c ■ ■ ■ donde Ej(X) = ker (A — Xiy. C om o están contenidas en un espacio de dimensión finita existe al menos un número natural m e N tal que E m = E m+1(X); sea p e M el (X) menor de estos números naturales m; este p tiene la propiedad de que a a partir de él todos los subespacios E P+1(X), EP+1(X), ... coinciden con E P(X). Esto está contenido en el siguiente lema: L e m a 1 __________________________ ___________________________ Si Ep(X) = E p+1(X), entonces E p(X) = E q(X) para todo q > p .

7.6. T E O R E M A D E C L A S IF IC A C IO N D E J O R D A N C on la experiencia acumulada en los ejemplos que hemos realizado en las secciones precedentes, nos disponemos a demostrar a continuación el teorema de clasificación de matrices, que se atribuye a C. Jordán, y que es uno de los teoremas más profundos del álgebra lineal. El lector que desee comenzar aprendiendo la form a de obtener matrices de Jordán puede pasar directamente a la sigiente sección, en donde se hace un resumen de cóm o se calculan y se dan varios ejemplos. Es conveniente, sin embargo, que se lea el enunciado del teorema de clasificación que a continuación se expone. D os matrices A, B e . J „ ( C ) se dicen equivalentes si existe un cambio de base P tal que

P - 1AP = B.

w

Demostración. L a demostración la realizamos por inducción en r, donde q = p + r. Si r = 1 la conclusión coincide con la hipótesis y no es necesario demostrar nada. Supongamos que el lema es cierto para q = p + r y demostrémoslo para q = p + r + 1. Sea x e £ p+r+ 1 (A), es decir, (A - u y + r(A - U ) x = ( A - u y +r+1x = ~ 6 . P o r tanto, ( A - Á I ) x e £ p+r(A) = £p(A) (por la hipótesis de inducción); entonces ()= ( / ! - X i y ( A - A I ) x = ( A - U ) p+1x y, por tanto, x e £ p + 1 (A) = Ep(A). Hem os probado que Ep+r+ 1 (A)c= E p(/1), de donde se deduce la igualdad puesto que la otra inclusión es trivial de verificar. ®

entonces, 0 = (A - A / )'- fc- 1 (TT) = (^l — A/ ) p " 1 ^ j
r

ajiíj

de aquí deducimos que £ a ^ e E ^ ^ A ) . Puesto que los u¡ se han elegido de £ p(A) j= i - £ p _ x(A) hemos de tener
r

£ ctjUj=0 o j'=i

a1= a 2 = ••• = a r = 0

y, por tanto, F = 0. Esto prueba la segunda parte del lema 2 y termina su demos­ tración. Q El lema 2 muestra que la familia de vectores B p = { u ( ~ 1 = ( A - Á I ) p~ 1u 1, ..., tf}= (/ 4 —A / )^ , u u = (A — Á i y ~ 1u 2,

Sea F = {iTj, u2, ..., u r} un conjunto de vectores linealmente independientes de £ p(A) — £ p- i(A ) de manera que L({t?i, u2, ..., ü"r}) © E p^ 1 = E p{X). (Observar que si d¡ (X) = d im (Ej(X)), r = dp — dp- 1 Probaremos a continuación que las imágenes sucesivas de ). los vectores w*!, tf2, ..., ü"„ mediante potencias (A — X I)k, 1 ^ k ^ p — 1, form an un conjunto de vectores linealmente independientes. L ema 2

..., tf2 = (A —

Xl)u2, u2,

..., « r 1 = ( ^ - A / ) í’ - 1 u r, ..., ü V ^ - A / ) « , , iTr} de las potencias de todos los vectores de F p son linealmente independientes; además,

om

Con
- Á l ) ku r } c z

las

con d icion es

anteriores,

{ ( A — XI ) ku

{A — XI ) ku 2, ..., ( A

.c

E p_ k(X) son linealmente independientes y

u ^eE ^A )

=>

/l(MP-1 = A u f ' 1 )

at

ic

L ( { ( A - Á l ) ku u ...., ( A - X l ) kur} ) f ] E p. k^ 1 = { Ü} (X)

a1

{ a — á i ) ( a — x i y ~ 1u 1 = u % ~ 1 => ^ ( M f - 2) = t r f - 1+ A ü T - 2

em

(A — /J)u 1= u }
i f f -1 e E 1(À)

+ Xux A ( u r i) = A « f ' 1 ^ ( u r 2)= M i_ i + A u f- 2

que { A - M ) kU j e E p_ k{X) para t o d o j = l , ..., r. Supongamos que tenemos una combinación lineal de la forma £ ccj(A - Xl)ku¡ = 0; }= i com o (A — U f es lineal tenemos

.M

at

Demostración.

Puesto que (A

A/)p k (A

— X I ) kU j —

(A

— Á iy uj— 0,

hemos probado

M - A / ) M - A / ) í,- 2 u 2 = u r 1

w

w

w

(y4 — A/)Ü* = U2 2

A( u2) = u 2 + A u 2

M -A / )^ ¿

ccju^j = 0.

Entonces, la matriz de X restringida al subespacio vectorial generado por B p, que es invariante, tiene la forma

Si probam os que { A - X I ) k es inyectiva en L (£ p) ( = espacio generado por F p), de la
r

anterior igualdad podemos deducir £ ajuj = 0, lo cual implica cij = 0 , para todo j j= i = 1 , ..., r puesto que los u} son linealmente independientes. Para probar que (A — A/)*1 es inyectiva en L ( F P) basta observar que ker (A — H f n L ( F p) = £ t(A) n L ( F P) c: E p _ j n L (E p) = { 0 }

/JM )

M

0

\

\ o Finalmente, sea ~ e E p -^ ^ ^ A ) y tal que v

'W M Ì

t f = ¿ a/A — Alfa/, )= i

es decir, está form ada por la yuxtaposición de r matrices elementales de Jordán de orden p todas ellas colocadas sobre la diagonal principal.

Demostración. Sea V e E p(Á); entonces A~v = (A — AI)~v + XV y, por tanto, basta demostrar que (A — Xl)v e E p(X). Pero N (A - M ) P(A - U ) v = ( A - ) . i y + ' v = ( A - ) . ¡ ) { A - M y v = 0, ■

lo cual prueba el resultado deseado.

Hasta ahora hemos conseguido obtener la forma de Jordán asociada con la matriz A restringida a los subespacios máximos Ep(/) de cada autovalor. El último paso es «p e g a r» adecuadamente las matrices de todos los autovalores. Sean Xu k2, ..., km (m ^ n) todos los autovalores distintos de A y sean B (l¡) = B', i = 1 , ..., m, las bases de los autoespacios máximos £ P¡(1 ¡) correspondientes a Á¡. Tom ar

Si demostramos que

(1)
Es conveniente ahora observar la figura 1 para aclarar la situación; los elementos de B p que están en £ p_ !(A ) puede que no llenen todo el espacio entre £ p_ i(A ) y £ p_ 2 (A); en este caso se eligen {u r+1, ..., u,} linealmente independientes de Ep- i ( ¿ ) — £ p_ 2 (A) y se procede com o en el caso anterior (las mismas demostraciones sirven) para encontrar una colección B p de vectores linealm ente independientes con respecto a la cual la matriz de A restringida a L (B p_ j) tiene la forma V iW J P- i W \ 0 I• ' » - . < « /

om ic a1 .c

donde V es el espacio vectorial en el cual estamos trabajando, la última observación de la sección 7.5 nos permite escribir la matriz de A respecto de la base B com o

em

¡ AKs^)
j

=

w

w

0\

.M

at

A \ pi (X2 e )

0\
Á\E„l

w

at

0

•>/

donde cada una de las matrices A\% (¿,) es una yuxtaposición de matrices elementales de Jordán. Esto probaría la primera parte del teorema. La demostración de (1) se da en los dos lemas siguientes. L em a 4 Si iTjeE pj(Àj), j = 1 , 2, ..., s y v±-\------1- vs= 0, se tiene que =7T2 = ••• = ~ s= (). v

es decir, está formada por la yuxtaposición de /— r matrices elementales de Jordán de orden p — 1 . Este proceso se repite hasta llegar a elegir un conjunto de vectores B 1 de E ,(/.) — L ( B P) u ■ ■ u L ( B 2) que sean linealmente independientes. ■ P o r la form a en que se han ido eligiendo los vectores, la colección fi(A) = Bp u B p _ 1 u uB2 uBi

forman una base de E P{X) = ker (A — XI)P. En esta base la matriz de A restringida a £ p(A) es una yuxtaposición de matrices elementales de Jordán de diversos órdenes asociadas con el auto valor L L e m a 3 __________________________ _________________________________________________ El subespacio máximo £ p(l), asociado con un autovalor A, es invariante.

Demostración. L a dem ostración se realiza por inducción sobre s. Si s = 1 el resultado es trivial. Supongamos que se cumple para s vectores v'l , ..., ~ s y sea v % + i ^ E Pt+l(Ás+1) (s + 1 m); si Ü H *i ------bFs+ tfs+i = 0 se tiene que

o equivalentemente (A — As+ J ) ”-*% + ■ ■+ (A — As+ 1I ) P-+*'vs= (í. ■ C om o ( A - A S+1I ) es inyectiva en £„,(/,) para j # s + 1 (¿demostración?) se tiene que Vi + ••■+ vs= 0 . P o r la hipótesis de inducción, tTj = ••• = ü j = 0 y consecuentemente tfs+ 1 = 0 . ■

P o r tanto, v 0 — V 1-------- v me k e i ( A —A0I); puesto que A0 no es au tovalor de A, k e r(A — A0I ) = { 0 } y entonces tT = TTjH 0 1-Ü me L (B ), lo cual es también una contra­ dicción. ■ Esto concluye la demostración de la primera parte del teorema de clasificación de Jordán. El hecho de que la matriz de Jordán es única salvo permutaciones de las matrices de Jordán elementales que la componen se deduce de que éstas quedan determinadas por las dimensiones de los núcleos ker (A — /.¡l)k

L e m a 5 _______________________________________________________________________— -------7

= 1 , 2 , ..., m, k = l , 2 , ..., pj. Nota. La demostración que acaba de darse está tomada de unas notas de R. M oriyón: Clasificación de Jordán de matrices, U .A .M .

V = E P¡(A1) + E P2(A2) + - + E PJ A J

Demostración. Supongamos, en contra de lo que queremos demostrar,que B = {tfi, v2, ..., % } con N < n , y consideremos B = {v'l , tf2, - , ~ n} una base de V que se v
n

obtiene ampliando B. Sea H = L ( B — B). Si para cada 7 = 1, ..., n, A ’vJ= £
k= 1

defini-

La obtención del autoespacio máximo E P(A) asociado con un autovalor A mediante la estabilización de la cadena E^A) cr E 2(A)

mos una aplicación lineal A 0 de H en H mediante n X
k=N+ 1

.c

A oVj=

«frk-

j

=

N + l,...,n .

om

c

cr Ej(A) <=

at

A 0 posee un autovalor A0 y un autovector T0e H . C om o XIT0 — /l0ír0 e L (B ), existen v 'ie E pi(Á1), ..., vme E pJ A J tal que

ic

a1

puede aliviarse si se conoce la siguiente propiedad: dim E p(A) = multiplicidad de A. (3)

at

em

w

Si A0 = AU aplicando ( A - A J ) " a ambos miembros tenemos ( A - A 1I ) n+ 1v0 = ( A - A 1I ) ’tv2 + - + (A - A J T v m. C om o (A - A J ) es un automorfismo de E PJ(Aj), j = 2, ..., m (inténtese demostrar; ver ejercicio 8 ), existen w, e EpJA^, ..., wme E P ( A J tal que (A — A1 m I)wj = 'V p j = 2, ..., m, con lo cual se tiene ( A - A 1i r + l v0 = ( A - A l i r + 1w2 + - - + ( A - A 1 T +1wm I . Puesto que p x n + l tenemos que V0 — W2 -------- 0 Que es 1° mismo, r 0e E P1(A1 + ■ ■ + E PJ A J = L ( B ) , lo cual es absurdo puesto que T 0 e H , ~ ) ■ ? v0^ 0 . Si A0 coincidiera con cualquier otro de los se realizaría un argumento similar. P o r último, si A0 no fuera ningún autovalor de A, (A — A0I ) sería un automorfismo de E PJ(Aj), 7 = 1, 2, ..., m (ver ejercicio 8 ); existirían, por tanto, vv}e E p.(Aj), 7 = 1, 2, ..., m, tal que (A — A0I)wj = 7/, sustituyendo en (2) tendríamos {A — A0I)v ’o = (A — A0I } v ¡ H -------1- {A — A0I ) v m m

w

w

.M

AV0 = A0T 0 + T?! H T ------1 tfm - _

(2)

El resto de esta sección lo dedicaremos a demostrar esta propiedad. Sean Au ..., Am los autovalores de A con multiplicidad r¡, ..., rm respectivamente: esto es, , \ A -A I\ = (A -A J 'x --.x (A -A m Y"' L em a 6 dim E (A¡) ^ r¡, /= 1, 2, ..., m

(4)

Demostración. C om o V = ¿ p j/ , ) © ••• © EpJ A m deducimos de la última observa­ ) ción de la sección anterior que la matriz de A en una base adecuada puede escribirse de la forma

^2

\ donde A j = A\Ep^j)- P ° r tanto,

IX /

\A-AI\ = \Al -A I\ x ••• x \Am-A I\

C o m o X — Xi no divide a \Aj — X-I\, j ^ U j = 1, m, se tiene que (X — X¡)rt divide a \A¡ — XI\; por tanto, \A¡ — XI\ es un polinom io de grado por otro lado, el grado de \A¡ — XI\ coincide con dim E P.(X¡). Esto prueba el resultado deseado. ■ Si n es la dimensión del espacio vectorial V, de (1) se deduce que w= dim E p¡ (AJ + ••• + dim E Pm J (X y de (4) se deduce que n = r 1 + ■■■+rm D el lema 6 y estas dos expresiones se deduce que rj — dim E Pj(Xj) j = 1, 2, ..., m, que es lo que se afirma en (3).

7. Sea E P(X) el autoespacio máximo correspondiente a un autovalor X de la aplicación T e L ( V ) y sea d j= dim (£ / / ))—dim (E ¡ _ j(Á)) j = 1, 2, ..., p. Dem ostrar que d . Z d ^ - ^ d ^
1

.

8. Si X0 no es un autovalor de sé, demostrar que s i — X0I es un automorfismo de E P(X), donde X es un autovalor de ,r y E P(X) es su autoespacio máximo. (V er lema 5 de J la demostración del teorema de Jordán.)

Una aplicación lineal T se dice nilpotente si existe k e N tal que T k= 0; si, además, Tk_1 0, a k se le llama orden de nilpotencia de T. D ado T e L ( V ) nilpotente, se dice que es nilcíclico si existe u e V tal que V = U u , T u , T 2u, ..., T * - 1 tT), con T fc_1u ^ (). 9. Si T es nilcíclico con orden de nilpotencia k y u e V es tal V— L(u, Tu, ..., T k~ l u ), demostrar que { « , Tu, ..., T k~ l u ) es una base de V. que

E J E R C IC IO S 7.6

om

10. Si IT, = T k~ l u, u2 = T k~ 2u, ..., uk_ j = T u , uk = u, con u y T com o en el ejercicio 9, encontrar la matriz de T en esta base.

a1

1. Escribir todos los tipos posibles de forma de Jordán de matrices de orden menor o igual que cuatro.

Io1 \
o i

em

at

2.

at

Sea A una m atriz real de orden 2 y C la m atriz de un cambio de base; de­ mostrar directamente que tra za (¿) = traza ( C ~ 1AC ), donde la traza de una matriz se define com o la suma de los elementos de su diagonal principal. 3. a) Si A es una matriz de orden 3 y C la matriz de un cambio de base, demostrar que traza ( A ) = traza ( C ~ 1AC). [ Sugerencia: utilizar el hecho de que el polinom io característico no depende de la base elegida.] b) Generalizar el resultado anterior para matrices de orden n.

ic

.c
íi.

r=

, calcular V

para todo n eW . Dem ostrar que / = 0 es el

\

0/

w

w

w

.M

único autovalor de un operador nilpotente (ver ejercicio 4).

4.
b)

c)

a) Dem ostrar que T k- X kI = ( T - X I ) ( T k~ l + X T k- 2 + • • + X k~ 1 • I). Am y q ( T ) = a0I + a 1 T H ------\-amT m demostrar que: X , Si q{X) = a0 + a 1X-\------- ham auto valor de T = > q (X ) autovalor de q(T ). (Este problema nos indica entre qué valores buscar los autovalores para casos sencillos.) Qué valores posibles de autovalores puede tener T si: 1) T 2 = T\ 2) T 2 = / es una involución; 3) T " = l , n ^ 3; 4) T 2 = — /. Si T es invertible y A es autovalor de T, demostrar que A - 1 es autovalor de T -1 .

7.7.

O B T E N C IO N D E L A F O R M A D E J O R D A N D E U N A M A T R I Z

En esta sección daremos algunos ejemplos de obtención de la forma de Jordán de una matriz dada; el algoritm o que utilizaremos se basa en la demostración dada en la sección anterior. Para aquellas personas que no hayan leído la sección anterior realizamos a continuación un resumen del «a lg o ritm o » que de ella se sigue.

d)

5. a) Supongamos que T y S conmutan, esto es, T S = ST. D em ostrar que ker(S) e im g(S ) son invariantes por T. b) Probar que si p y q son polinomios, entonces p ( T ) q ( T ) = q {T )p (T ). En consecuencia, ker ( q ( T ) ) e img(<y(T)) son invariantes por p(T).
6 . Dados T, S e L ( V ) , dim V = n , tales que ambos poseen n autovalores distintos dos a dos (no necesariamente iguales), probar que T S = S T o T y S tienen los mismos autovectores.

1) D ada una matriz A se comienza calculando los autovalores de A; sean éstos Xx, ..., Xm con multiplicidades r l5 ..., rm respectivamente, tal que r l -l------h rm , = n. 2) Para cada autovalor X se calcula la cadena de subespacios E 1 = k e r ( A - X I ) % E 2(X) = ker (A — XI)2 % (X) 5 E P(X) = ker (A - X l f = E p + l (X) = ker (A - X l f + 1 = •••

formada por los núcleos de las potencias sucesivas de (A —XI); la cadena anterior se estabiliza después de un cierto número de pasos p (el subespacio E p(X) se denomina autoespacio máximo asociado a X). El valor de p puede obtenerse sabiendo que dim E P(X) = multiplicidad de X. Nota. Es conveniente ahora observar la figura 1 de la sección 7.6.

Eje m

plo

A.

Tratem os de encontrar una forma de Jordán J de
0 2 - 1 1 0

- 6 \ 3 3 2/

A=

0
0

1 0 0

\° 3) Tom ar el mayor número posible de vectores linealmente independientes de E p(X) — £ p_ 1 (A); sean éstos F p = { u u ..., ur}. Las imágenes sucesivas mediante (A — XI) de cada uno de los vectores de F p forman una matriz elemental de Jordán: J p(X). En el subespacio generado por F p y las potencias sucesivas mediante ( A — XI) de los elementos de F p la matriz de A respecto a la base B p(X) = ( A - X i y - \ F P) K ■■■vj ( A - X I ) ( F p) U F p J está formada por la yuxtaposición de r matrices elementales de Jordán de orden p dispuestas sobre la diagonal principal. y una matriz P tal que A P = PJ.

Puesto que \A — XI\ = {X — 1)3(A — 2), los autovalores de A son X = l (triple) y n = 2 (simple). Calculamos £ 1 ( l ) = ker(/l —/):
0 2 - 1 0 0 1

o

1° 0 0
\0

0 0 0

3 3

/ X l\ x2
*3

l°\
0
0

x3 = 0 x¿ = 0

1 / \ XJ

W
/°\1

om

l ' \

.c

E i(l) = L

0 0

.M

at

4) Se elige a continuación el m ayor número posibles de vectores de E p .^ X ) — £ p_ 2 (A) que sean linealmente independientes entre sí y linealmente indepen­ dientes con la colección B p(X); sean éstos

em

at

\°/ Calculamos E 2( l ) = k e r(A —I ) 2:

w
0 0 °\/*i\ j o \
0 0 0 0 0

ic

a1

w

jo
0 0

0
0 0 - 1

2

2

w

...,

u,}.

/ x i\

w

3
0 0

X2 X3
\ XJ

l°\ 0
0

jO
0 0

||x2 | x3 “

| 0

Las imágenes sucesivas de cada uno de estos vectores mediante ( A —XI) nos dan un conjunto de vectores linealmente independientes Bp_ j(A ) con respecto a los cuales la matriz de A es una yuxtaposición en la diagonal principal de r — l matrices de Jordán elementales de orden p — 1.

3 >/

3

o
0

x¿ = 0

\ °l

\0

0 01l \ x j

\0 /

O

o

5) Se continúa realizando el procedimiento descrito en 4) hasta llegar a E x(X) en donde se eligen, si es posible, los vectores necesarios para que junto con todos los vectores anteriormente elegidos se tenga una base B(X) del autoespacio máximo E p(X).

w w.
C om o (A — I ) 3 = (A — I ) 2, £ 2 (1) es el autoespacio máximo correspondiente a X = l . Tom am os

6) L o s pasos desde el 2) hasta el 5) se repiten con cada uno de los autovalores X¡, com o los autoespacios máximos son invariantes respecto de A (lema 3, sección 7.6) la matriz de Jordán de A es la yuxtaposición de las matrices de Jordán de A restringida a El cambio de base viene dado por todos los vectores anteriormente elegidos.

£iA p¡. ()

l0 \
0
Uy =

w

/
ul = ( A - I ) u 2 = \
- 1

2\
0 0

/>\
. . _ : O ; elegimos = , que es de £ , ( 1 ) y es linealmente inde
0

Calculamos £ 1 ( l ) = k e r (X - / ):

2x2+3x 3= 0 2x3= 0
2x4 = 0 x4+ x 5= 0

/

\o/

x 2 = x3= x4= x5= 0

pendiente con tT, y u2. Finalmente calculamos £ 1 (2) = k e r (^ — 2/):

/ -I
0 0 - 1

0 - 1 0 0 - 1

2

/o\
0

—Xj + 2x3—6x4= 0 —x2—x3+ 3x4= 0 x 3= 3x4
Calculamos E 2( l ) = k e r (A — I ) 2:

£ i(l) = L

o
0

\

0

w
0
£
i

V .

í/°\
(2 ) = L

3

/0 0

04 6 0 \ 00 4 0
00
0 0 0 0

4x 3+ 6x4= 0 x4= 0 x, = 0

om

.c

W J

(A — I ) 2 =

0
0 \0

2
1 0 0

2
1

a1

.M

3
W

at

Tom ando u4

0

em

l°\

at

ic

/

se tiene una base del espacio vectorial; por tanto:

l ' \

/°\)
'

0

w

w

£ 2(1) = m

w

2 0
P =
0 0

1 0
3
1

\
J= /

-10 0 0
1 0
0 0

11
0

1 1

°\ o o

IW
Calculamos £ 3 ( l ) = k er(/ l—I ) 3:

w
4
2
x4 = x s= 0

o \o

o o

/o

2/
( A - I ) 3=

0 0 14 ó \
00
00

0
0

4
2

0 \o
Eje m plo

00

1

1

00

o o/

B.

Reducir la matriz A =

a su forma de Jordan y

/°\
0 1

encontrar P tal que A P = PJ. Puesto que \A —X I\ = ( k — \)\X — 2), los autovalores de A son X = l (cuádruple), fi = 2.

£ 3( i ) = - L )

o o

o o

.W

\o/

Calculamos £ 4 ( l ) = k e r (¿ —/)4:
14 4
2 1

P o r tanto, /o o o
14 \ 4
1 1 1 1 1 0 0 1 0 0

6 0

0 4 0
0 2

0 0
0

14\ 4
2

0 0 0
(A -iy

0 0
\o

0 0
o

0 0
o

x4 = ■

, P=

0

i
2

0
\0

0 0
0 0 - 1

1

1
0/

O

/

°\1
O O

*
E je m
plo

*

*

C.

Tratem os de hallar la forma de Jordán de la matriz

/0
A=

1
1

-1
0
0

o\
1
0

w
C om o £ 5 (1) = £ 4 (1), ya que ( A - 1 ) 5 = ( A ~ I ) A, £ 4( 1) es el autoespacio máximo. Esto tiene que ser así porque el subespacio ker (A — 21) es al menos de dimensión 1 . Tom am os

0 - 1
1

\0

-2

0 1/

at

ic

6

a1

.c

Sus autovalores satisfacen la ecuación (A 2 + 1)(A2 + 1) = 0 y, por tanto, son X = i, ¡ i = — i (ambos dobles). Calculamos £ x(i) = ker (A — il):

om

em

° 0\ u4 =
0 1

l °0 \ ; w3 = (A -/ )u 4 =
2 0

4

— iz1+ z 2— z 3 = 0 <=> z l + z 2 — iz3 = 0 Z4 = ( l + ¡ > 2

0

Calculamos ker (X - 2 1 ) = £ i ( 2 ):

2 h
0 0 0 0 - 1 0 0 - 1

3
2

0
0 2

0 0 0 1 - 1

-xt + 2 x 2 + 3x 3 = 0

x2 *3
X4

w

w

w

w

\o /

w

.M

at

;

u2 = ( A - I ) u 3-

0

;

= (^4 — /)íT2 =

— —

x x

2 + 2x 3 = 0 3 + 2x 4 = 0

Calculamos E 2(i) = ker (A — i l ) 2 / - 2 ( A - M ) 2=
0

0 0

0 0

- 2 - 2i —2 + 2 i
- 2 0

2i

1 - 2 1

\

0

w
/14\
2

x 5= 0

i

\/Z /°\ l\
0
z4 /

( — 1 + í)z 2 = ¡z 4
2 zt + (1

-2 i
\ 0

i

-2
0

+ i)z 2 — 2 ¿z3 = 0

Ai

- 2 - 2 (7 \

\0/

£i(2) = L'

l‘\ °\ I
E 2(i) — L
1

+ i
1

W

\°l

\ 2 il

Puesto que dim E 2(i) — 2 = multiplicidad de i, aquí se «estabiliza» la cadena de subespacios. Tom am os

E JE R C IC IO S 7.7 En los ejercicios siguientes hallar la forma de Jordán de la matriz dada y la matriz de paso.

1

- 1 0

0 1 0 1

u -,-

l ,1 ° \ + ¡

0

— 1 —i
1 - 2

l + i
1

, u1= ( A — il)u 2 =
1

¡6 1
8

-9 - 13 17
- 2

5
8

\ 2I i

—i
0

4\ 7
8

\ 0

\i
1 2 1 0

11
1

Para calcular E 1( — i) = k e r ( A + i I ) observamos que A + i I = A — i I y, por tanto, el sistema (A + iI)z '= 0 es equivalente al sistema (A — i/)z = 0, que coincide con el sistema utilizado para calcular ker(/l — ¡7) excepto que 1 es sustituido por z. Entonces

3/ -l\

/3
0 1

- 1 0 1 0

i i
0 2

0

E 1 - i ) = L{ \ ° l D e manera similar se tiene

i /

0

0 - 2 0 0

om

/2 5 3 \l

- 2\
2

2 1 0

.c

ic

a1

-3
0

1

1

y podemos elegir íT4 y u3 com o los conjugados de u2 y uu respectivamente; es decir,

w

w

\0 /

\ —2iJ

w

.M

E 2( - i ) = L

at

0

l- i

em

M / 0\

at

/

7.8.

F O R M A D E J O R D A N R E A L D E M A T R IC E S R E A L E S C O N A U TO V A LO R E S CO M PLEJO S

1

—i
1

0\
u ,=

0

Ua = \ -2 i¡

\ 0/
la m atriz de
1 0 0 0 0 1

Aunque una aplicación lineal esté definida en un espacio vectorial real, su form a de Jordán, obtenida com o en las secciones 6 y 7, puede ser compleja. U na muestra se tiene en el ejemplo C de la sección anterior. En esta sección trataremos de dar una «form a de Jordán» real de toda aplicación lineal definida en un espacio vectorial real. Si la forma de Jordán de una matriz A obtenida mediante el procedimiento de las secciones 6 y 7 es real, a ésta se le llama forma de Jordán real de A; si, por el contrario, alguno de los autovalores de A es com plejo se dará en esta sección su fo rm a de Jordán real. Comencemos con el ejemplo C de la sección anterior. Sus autovalores eran X = i, n = — i (dobles); la forma de Jordán de A es
1 0 0 0

Puesto que A ( u l ) = iu1, A (u 2) = u 1+ i u 2, A ( u 3) = — iu3, A (u4) = u3 — Jordán de A es i

0 0

0 0 1

J =\

0

i
0 0

i
0 0

0 0

—i
0

—i
0

—i

—i

y una base B es { « j , u2, uu u2} (base del espacio vectorial com plejo Vc obtenido a partir del espacio vectorial real V (ver ejercicio 4 al final de esta sección)), donde

Observar que J está formada por dos matrices iguales B yuxtapuestas sobre la diagonal principal y la matriz identidad encima de ellas, esto es:

/ 0\

U

B \0

1 B

1

+ í
1

> «2=

\ 2* / Toihar / '\
0

además, B es la matriz dél subespacio invariante real de dos dimensiones asociado con el autovalor X = i com o en la proposición 2 de la sección.7.5.

Sea A una aplicación lineal en un espacio vectorial real V con al menos un autovalor complejo. Definiendo en V x V la suma (* i . .Vi)+ ( * 2, y2) = (x ! + x 2, y i + y 2) y la multiplicación por números complejos (ia + ib)(x, v) = (ax — by, ay + bx) ,

tf, = real ul =

0

\°/

1

0

at

ic

\ 2/

a1

.c

v, = real u7 = I

w 2 = im g u2 =

om

/°\
se observa que { 1 ^, w 1; tf2, w2} es una base (real) de V; en esta base se tiene

V x V se convierte en un espacio vectorial complejo, que se denota por Vc (ver ejercicio 4). Los elementos de este espacio vectorial complejo se denotan mediante (x, y) = x + iy. Definiendo A c ( x + i y ) = A ( x ) + iA (y), A c es una aplicación lineal en Vc . T o d a base de V es una base de Vc y, por tanto, A c posee la misma matriz que A en esta base. Así pues, la matriz A es equivalente en Vc a una matriz de Jordán J y Fc puede escribirse com o una suma directa de autoespacios máximos KC = £ P1 (A 1 ) ® - 0 £ P.(A J . (1 )

ll\
= v,1— w » Aw , = = wx + v2. P o r tanto,
1 0 1 1 0

w

w

= — w2

;

Aw x=

= V,

w

i° \
0

w

.M

at

em

Si Á = (x + i[¡ es un autovalor complejo de A, con 0 ^ 0 , X=oc — i/? es también un autovalor de A puesto que A es real: en efecto, si \A — Á = 0 se tiene que /| 0 = \A -X I\ = \ A -Z l\ = \A-Xl\. Además, las ecuaciones (A — XI)k = 0 son equivalentes a {A — I l f f = 0 y, por tanto, T las bases de los autoespacios máximos E P(X) y E p(X) pueden elegirse conjugadas. Sean


1 \0

°\ - 1
1 0 2


0

1 0 0 0

0 1 1 0

°\
1 0 2

1

0 - 1 0

1 0 0 0 - 1

1

°\
0 0 1

0

0 0 0

A
1

B = {Uk —(A — XI)uk- 1, ..., u 2 = (A — XI) u 1 S*!} ,

1

/

\0

{

0

°/

y
E = { W k, W 2, f j

que es una form a de Jordan real de A.

dos colecciones de vectores linealmente independientes que originan dos matrices elementales de Jordán: Jk Jk$)

Para ut _ *

t

tenemos que Ac(uk_ l) = uk+ Áuk_ í y, por tanto,

A(l?k

_ +iA(wk_ = ctt_ uk+ _= i) i) A(T j)= Xuk j
+ *wfc + (a + ¿7 T _ i + iwk_ l ) = ) ?)(T k

=

de orden fe. D ebido a (1), basta encontrar una «form a de Jordán real» que agrupe estas matrices para tener una «form a de Jordán real» de A. Tom em os los vectores reales que son las partes real e imaginaria de los elementos de B, es decir, vk = real uk , wk= im g uk (2 )

= (% + <xTk- 1- P w k_ 1 + i(v?k+ pvk- 1+<x\irk- 1), ) de donde se deduce que
^ f ó - i H ü i + a t ^ - i - M - i ; 4vvt-i) = wt+ M _ 1 + a v v t _ 1. ( 4)

!?*-! = real uk- l , v v ^ ^ i m g

P o r el mismo razonamiento se obtienen expresiones análogas a estas últimas para X(ü}) y i4(w}) con j = 1 , 2 , ..., fe— 2 , es decir,

Y2 = real u2 T?! = real u:

, ,

w 2 = im g u2 vv, = img u¡

(5) P o r tanto, la matriz de A restringida al espacio vectorial generado por (2), en la base ( 2 ), ordenada de izquierda a derecha y de arriba a abajo, es

El conjunto de vectores de (2) es linealmente independiente; en efecto, si tenemos

om

a1

k £ aA +

k

I
j= i

_ PjWj = 0,

.c

'

a ~P

P a

1 0

0 1

ic

j=i
U j + U: _ u¡ ft¡

em

at

a ~P

P o c

1 0

0 1 1 0 0 1

puesto que T7 = — j

y vv¡ = se tiene que

w

w

.M

at

w

a -P

P O í

com o los elementos de B u B son linealmente independientes (¿por qué?) se tiene que otj — ifij = 0, ctj + ipj = 0, de donde se deduce que i ¡ = /^ = 0, j = 1 , ..., fe. Encontraremos ahora la m atriz de A restringida al espacio vectorial generado por los elementos de (2). Puesto que A ( (uk) = l u k tenemos

Esta matriz está formada por la yuxtaposición sobre su diagonal principal de las matrices del subespacio invariante real de X con matrices identidad de orden 2 encima de la diagonal principal, y ceros en el resto. L a m atriz de Jordán real de A se obtiene mediante yuxtaposición de matrices del tipo anterior y matrices elementales de Jordán correspondientes a autovalores reales.
Eje m
plo

A.

Encontrar la forma de Jordán real J de

A (v k) + iA(wk) = A c (uk) = Xuk = (a + ip)(vk+ iwk) = = (zv’ ~ P w k + í '( M + awi) k ) e igualando las partes reales e imaginarias obtenemos A (vk) = dvk- P w k ; A(wk) = pvk+ uwk (3) y una matriz real R tal que A R = RJ.
0

2 A= \0
1

-3
0

- 1 0 - 1

L a ecuación característica de A es — A3 — 1 = 0 , con lo que sus autovalores son las soluciones de A3= — 1 , es decir,
1

Í i -

2

2
0

A

Aj = — 1 ,

A2 = e’ i /3 =

_

1

+

,

X = e ~ * il3 =

-iy fi

3

y/3.

2

2

i

0

\ 1

lZ l° l\\ l VI \ 3 °
z2 =
0

z, = 0

Z ,= l2 +

2

¿|Z

'3 — f-— i —

2

2

0

Tom ando

A k l = — 1 le corresponde la matriz elemental de Jordán J x( — 1) = ( — 1) y al par de

í o\
1

3/2 \ ,tTi = | 0
1

om

autovalores conjugados X2 y

le corresponde la matriz

, Hi = / \

0 0

.M

/i £ \ vi 2i /r 2
2 2

a1

.c

\
se tiene

0/

em

at

ic

l o ¡ 4 \

at

R=
1

2
1

2

0

0

- 1

0 1

0

w

w

con lo que

w

\o

o /

0

V*
2 1 2

El lector puede comprobar ahora que en la base { u u vu W;} la aplicación dada por A tiene com o matriz J.

J=
0

2

-> / 3
2

E JE R C IC IO S 7.8 1.
1

Encontrar la forma de Jordán real de las siguientes matrices:

+ i^/3

Para

encontrar

R

calculamos

E ^ — 1) = ker {A + 1)

y

E, a)

lo
0

1
1 1

-1 \
0

/o
— 2\

0

- 1

l\

0
C) ' 1 \°

0
1

0
0 0

-1

b)

= ker ^ 4 - ( l + ^

) l \

l)

\3

°/

1

/

/3

0

~ 3\

/o '
o

3xx = 3x 3
X j = 0

/°N
1

/a

—/ 0 1 ? a
0

0
\l

0
0

0
0/

2.

Sea G =

¡3
\ 0

0 | la m atriz de G eL (IR 3) en la base canónica, con a 2 + / ? 2 = l.
1

\0 .

\0 ,

342 a) 3. H allar los subespacios invariantes de G, así com o los autovalores. Sea G = | con a 2 + / 2 = l la matriz de G e L (IR 2) en la base canónica. j 3 O bservar que el p o lin o m io característico de la m atriz A del ejem plo anterior es p (X ) = X2 + 1 y, p o r tanto, la m atriz A satisface su p o lin o m io característico. Este resultado, para todas las matrices de orden 2, es el que dem ostró Cayley. T eo r e m a d e C a y l e y -H a m il t o n p a r a m a t r ic e s d e o r d e n 2 -------------------------T o d a m atriz de orden 2 satisface su p o lin o m io característico.

\P
a) b) c)

a/

H allar los autovalores y autovectores de G. P robar que G es un giro de ángulo (p determinado p or a = eos (p, / = sen cp. ? Si z = u + iv e C 2 es autovector de G, probar que la matriz de G en la base {u, tf} es A ' o A dependiendo de que el autovalor correspondiente sea X = a + í/? o I = a —if¡. a) Sea V un espacio vectorial real y sea Vc = { x l -\-ix2l x l , x 2e V \ con las opera­ ciones ( x x + ix 2) + (.V1 + iy2 = (x i + J i ) + i(x 2 + y 2) ) (a + ih ) ( x l + i x 2 = {ax1—b x 2) + i{bxl + a x 2) )

4.

Demostración.

/a Si A = ( ^

b\ ) su p o lin o m io característico es

p { x ) = \A — xl\ =

a —x c

b

\

d — xI

= x 2 — (a + d ) x + (ad — cb).

Com o Dem ostrar que Vc es un espacio vectorial complejo. b) Si ¿ t/eL(V ), demostrar que jrfc definida en Vc por j¡/c ( x 1+ i x 2) = s¡/(x1) + i ^ ( x 2 ) es una aplicación lineal en Vc .

A 2 — (a + d)A + (ad — cb) I =

om

= / a2 + be \ca + cd

ab + bd\ _ f a 2 + ad cb + d 2J i^ac + db

ab + bd\ ad + d 2J +

A
\0

0

\ _ / 0 \0

0

\

a1

.c

y

(y

n P Í X) =

X
k= 0

akxk ~ fl«X" + an ~ lXn 1 + ■ + a í X + a 0> '■

w

m atrices de orden 2 . D a d o un p o lin o m io p ( x ) con coeficientes com plejos,

w

w

.M

En 1858 A rthur C a y ley (1821-1895) enunció un resultado que más tarde sería co n ocid o com o el teorem a de C ayley-H a m ilton , y que él dem ostró solamente para

at

em

at

7.9. E L T E O R E M A D E C A Y L E Y - H A M I L T O N

se obtiene el resultado deseado. El teorem a de C a y ley-H a m ilto n para matrices de orden n es sim ilar al enuncia­ d o anteriorm ente y fue dem ostrado p or H am ilton . L a idea de la dem ostración es conseguir dem ostrar el teorem a para matrices elementales de Jordán y a partir de aquí llegar al resultado para una m atriz general haciendo uso del teorem a de clasificación de la sección 7.6. Antes de enunciar y dem ostrar el resultado concreto darem os varios lemas. L e m a 1. -— -----------------------------------------------------------------------------------------------Si A es una m atriz de orden h cuyos elem entos son todos nulos excepto los que están encim a de la diagon al principal que son unos se tiene que A h = 0.

y una m atriz A de orden n, definim os p (A ) = ^ k= o don d e A ° = /. Es decir, se reem plaza x p o r la m atriz A teniendo en cuenta que A ° — I. Si p ( A ) es la m atriz nula decim os que A satisface el p o lin o m io p {x ). akA k = a„An + an_ l A n 1 + ••• + a l A 4- (I qA 0

ic

Demostración.

Si h = 2,
0

*Y

_i)fo

1

\ _ /O

0

0 0/ ~ lo 0/V0 0/ _ lo 0
Si h = 3, /O
1 0 \ 3

E je m plo A . ya que

L a m atriz A - ^

^

satisface el p o lin o m io p ( x ) = x 2 + 1,

/O

0

l\ / 0

1

0

\

(0

0

0\

0
\ 0

01
0 0/

=

0 0 0
\0 0

00
0 0

1
/

=

0
\o

0
o
0

0
/

0 / \ 0

O bservar que el efecto que se produce al m ultiplicar una m atriz A p o r sí misma es desplazar la línea de unos hacia arriba. P ara realizar la dem ostración procedem os por inducción en el orden de A. Si el resultado se cumple para tod a m atriz de orden h:

L e m a 3. — ---------------------------------------------------------------------------------------Si J es una m atriz de Jordán, / satisface su p o lin o m io característico.

lo

Demostración.
1 0 0 0 1 0

U n a m atriz de Jordán es de la form a

o o
1

_0

0 1 1 0 0 0 1 0

0

o\ í ° h

1 0 0

0 1 0

0 0 1

• ■ 0 • •
0

o 0

o
1

o 0

0 0

H k i A l) J = A , ( /2 ) i

0

\

• ■ 0 • • • •

0 0

0 0

0 0

1

0

0

0

1

0

0 0

0 0

0 0

1 0

{h+ 1 ) 0/

0 0 0

\

o

h ^ i)j l

/o
o o

o o o

o o o o o

lo

0 0 ■ • o\ 0 0 1 0 ■• 0 0 0 0 1 •■ 0
1

O 0 0 •• 0 0 0 0 •■ 0 0 0 0 ■• 0

y, p o r tanto, un p o lin o m io característico es P ( x ) = i= i

( x — A¡}ki. C o m o ( J - A-/)*'

em

en donde la penúltim a igualdad ha hecho uso de la hipótesis de inducción.

at

ic

0/

a1

o

o

.c
Estamos ya preparados para dem ostrar el teorem a de C a yley-H a m ilton en su versión general.
T e o r e m a d e C a y l e y -H a m il t o n ----------------------------------------------------------------------------------

o

o

o

o

0 0 0 0 ■• 1 0 0 0 ■ • 0/ \°

0

0 0 •• 0 0 0 •■ 0/

característico. Demostración. Demostración. Entonces Á 0\ IX A .
,0

w

Si Jk(X) es una m atriz elemental de Jordán, J k{X) satisface su p o lin om io

w

w

L e m a 2. --------------------------------- -— --------------------------------------------------------------

.M

at

om

i n (J ~ V ) * ‘ i= 1 el resultado es nulo ya que las / matrices que se m ultiplican tienen al m enos una caja nula en filas y columnas diferentes. ■ tiene la caja i nula deb ido al lem a 2, al calcular el produ cto P j ( J ) =

T o d a m atriz A satisface su p o lin o m io característico.

Sea PA { x ) =

£
1= 0

a¡xl el p o lin o m io característico de la m atriz A.

El p o lin o m io característico de J k{X) es P jk (X)ix ) =

_

xf ■

P o r el teorem a de clasificación de Jordán dem ostrado en la sección 7.6, A es equivalente a su m atriz de Jordán, es decir, existe una m atriz P tal que J = P ~ 1A P . O bservar que PA{ x ) = P j ( x ) ya que A y J son equivalentes: P A{ x ) = \ A - xl\ = \ P J P ~ 1 = \J Entonces, J (x / ) P “ 1| = \P\\J P x IW P -'l =

1

0' i
1

\0

X

■ Al

xl\ = P j i x ) .

{0

- 1 0

- 1

° \ -1 0/

k

o \

1 •• ° \ . 0 0 . 1 0/ \
¡0

1= 0

a,Al =

¿ ü ' Í P J P ' 1)1 = P ( ¿ aiJ l) P - 1 = PpA ( J ) P - 1 = 1= 0 1 0 =

= 0

donde la última igualdad es debida al resultado prob a d o en el lem a 1 .

donde la última igualdad se debe al lem a 3 ya que J satisface su p o lin o m io característico P 7 (x ). ■

E j e r c ic io s

7.9

1.

D em ostrar directam ente que las siguientes matrices satisfacen su p o lin o m io

característico: a) A = b) B c) C = /
0 2

B IO G R A F IA Cam ille Jordan nació el 5 de enero de 1838 en Lión y murió el 20 de enero de 1922 en Milán. Fue un matemático cuyos trabajos en grupos de permutaciones y en la teoría de ecuaciones hizo posible un perfecto entendimiento de las teorías del eminente matemático francés Évariste Galois. Jordan com enzó trabajando en geom etría. Su Traité des substitutions et des équations algébriques (1870) (Tratado sobre las permutaciones y ecuaciones algebraicas), por el cual obtuvo el premio Poncelet de la Academia de Ciencias de Francia, fue fundamental en el entendimiento de la teoría de G alois sobre los grupos de permuta­ ciones, lo cual fue aplicado para la resolución de ecuaciones algebraicas. También resolvió un problema propuesto por Niels Henrick A bel acerca de la no solubilidad de una cierta ecuación algebraica mediante radicales. Jordan publicó sus lecciones y sus investigaciones en análisis en Cours d’analyse de l ’École Polytechnique (3 vols., 1882) ( Curso de análisis de la Escuela Politécnica). En la tercera edición (1909-15) de su trabajo en análisis, la cual contiene muchas más investigaciones de Jordan que la primera, trató la teoría de funciones desde un punto de vista moderno, trabajando con funciones de variación acotada; sus trabajos en este campo fueron aplicados a la curva que hoy se conoce con el nombre de «curva de Jordan». Las álgebras de Jordan se llaman así en su honor. En topología, Jordan probó (1887) que un arco simple no divide al plano y que una curva cerrada simple divide a un plano en dos partes. A pesar de que estas afirmacio­ nes son intuitivamente obvias, su demostración requiere sofisticados métodos. C. Jordan fue profesor de matemáticas en la École Polytechnique (París, 18761912). Tam bién fue editor de la revista matemática Journal de Mathématiques Pures et Appliquées (1885-1922).

\-2
0 0 0 0' 1

2.

D eterm in ar todas las matrices A tal que A 1 =

0

1

3.

D eterm in ar todas las matrices A tal que Á 2 =

0

w

w

w

.M

at

em

at

ic

a1

.c

om

347

EJERCICIOS DE REPASO: CAPITULOS 1 A 7
FA C U LT A D DE IN G E N IE R IA DEPARTAM ENTO DE DOCUMENTACION Y BIBLIOTUCft MONTEVIDEO - U R U G U A Y

«t<ÜV£RSÍDAD DE LA REPUBLICA

A continuación presentamos varios ejercicios que pueden servir para repasar los conceptos introducidos anteriormente. Los ejercicios del 1 al 37 están ordenados de acuerdo con el orden de los capítulos de este libro. El resto son problemas que se han propuesto en varias convocatorias a los alumnos de prim er curso de las licenciatu­ ras de M atem áticas y Físicas de la U niversidad A u tó n om a de M adrid.

a1

.c

om

1. U tilizar el m étodo de eliminación de Gauss para encontrar todas las soluciones del sistema:
X 1+ X 2 ~ 2*3 + X4 = 1

at

ic

2x 1 — x 2 + 3x 4 = — 2

em

4 x x + x 2 —4 x 3 + 6 x 4 = 0 2. Sea
r

.M

at

w

w

w

el m ayor número de soluciones linealmente independientes del sistema:
Xj +

2x 2

+

4x3 —

3x4 = 0

3xl + 5x2+ 6x3— 4 x 4 = 0 4 x 1+ 5 x 2 — 2 x 3 + 3 x 4 = 0
3 xj + 8 x 2 + 2 4 x 3— 19x4 = 0

Hallar 3.

r

y encontrar

r

soluciones linealmente independientes de este sistema.

Resolver el siguiente sistema:
X 1
Xi X i+ X 2 x i + x 2+ x 3

+ x 2 + x3 + x4 + x5 = 1
+
x

3+ +

x x

4+ 4+ +

x x x

5= 2 5 = 3^5= 4

+ x 2 + x3 + x 4

= 1

349

4.

10. Estudiar la compatibilidad o incompatibilidad del sistema x + y + az = 1 x + by + z = 1 • 2x + y + z = 1

Probar que «i a2
«3 -by. - b ,

«i ~b 2 a2 ~
b 2

ai - b 3 a2 ~ b 3
«3 «4

«i

- b

a2 - b -b .
«4

~bi

~b 2 a4 - b 2

~b3 ~b3

fl4 - b i según los valores reales de a y b y encontrar sus soluciones en los casos en que sea compatible. 5. Sean a y b dos números reales, no nulos y distintos. Estudiar el rango de la siguiente m atriz para los distintos valores de xeIR : x b A = a ^b b a b\ x b a b x b a b xI

- b

11. Si A e J t nXJ[R) no es invertible, demostrar que existe B e J f „ xn(U), B=¿0, tal que A B = 0. 12. a) Encontrar la ecuación del haz de rectas que pasa por el punto P = (3, 1).

j

b) D e todas las rectas que pasan por el punto P del apartado anterior, determinar la ecuación cartesiana de aquellas cuya distancia al origen sea 1 . 13. a) Encontrar el punto de intersección de las rectas (x, y, z) = (0, l , 2 ) + t(l, - 1 , 3) (x, y, z) = (3, 0, 4) + s(l, 1, - 4 )

om a1 .c em at ic

6.

H allar la inversa de la siguiente matriz siempre que sea posible:

b)

/x
0 0

1

0 1

° \
0 1

Hallar la ecuación cartesiana de la recta perpendicular a las dos anteriores que pasa por su punto de intersección.

X
0 0

14. Encontrar la ecuación cartesiana de la recta que pasa por P = ( í , 1, 1) y es paralela a los planos

X
0

.M


7.
( - 2
x

X)

at

%{. x + y + z= 1
n 2: (x, y, z) = t(l, 1 , 2 ) + s(l, - 1 , 1 ) 15. Sean P ¡ y P 2 las proyecciones ortogonales del punto P = ( — 1, 2,0) sobre los planos de ecuaciones n{. x —y —z = 2 n2\ (x, y, z) = ( 1 , - 1 , 0 ) + í(l, 0 , l ) + s(l, 2 , 0 ) Encontrar P t, P 2 y el área del triángulo P X P 2. P

! +

x

3, -

x

2, - X

í

).

8.

a) Sean u x = (1, 0, 1), u 2 = (0, 1, 1) y u 3 = (3, - 1 , a). D ecir para qué valores de a e IR

el conjunto £ = { 1?!, w2, íT3} es una base de IR3. b) Si B es la base anterior con a = 1 y (x i, x 2, x'3) son las coordenadas del vector (x ¡, x 2, x 3 )e !R 3 respecto de la base B, hallar la ecuación en coordenadas x [, x 2, x 3 del plano a : 2 x j — x 2 + 3x 3 = 1 9. Calcular el siguiente determinante de orden n + 1:
1 1 1 1 1 1

w

w

Encontrar todos los vectores x e R 3 tal que T ( x ) = — x , donde T ( x í , x 2, x 3) =

w

16.

H allar la distancia entre las rectas x —y + z = l 1 > 2x + y = 3 J y+ z= 0 x — 2y + z = l

r,:

y

r 2:

••• •••
1

1 1

+ «!
1 1

1

-f- d2

17. D ado el plano n: 5x — 3 v + 4z = 1, hallar la recta paralela al vector (5, 3, —4), contenida en n y que esté más próxima al punto ( 1 , 0 , 0 ). 18. Dados los puntos A = (2, — 1, 1) y B = (0, 1, 2), la recta r de ecuación (x, y, z) = (1, 0, 0) + t(3, —2, 1) y el plano k: 2x + z — 1 = 0 , hay exactamente dos paralelogra-

1

1

1

1+

mos, uno de cuyos lados es el segmento A B y cuyos dos restantes vértices están, respectivamente, en r y t i . H allar los vértices de estos paralelogramos y el volumen del paralelepípedo que los tiene por caras. 19. H allar la ecuación de un plano que contenga a la recta x - 1 = y = z y diste lo

26.
b)

a) Encontrar las ecuaciones de la simetría S en IR3 con respecto a la recta (x, y, z) = í ( - l , 1 , 2 ). H allar las ecuaciones de la proyección P en [R3 sobre el plano x + y —z = 3. Si T, S: V v -+ W son aplicaciones lineales, demostrar que k e r ( T ) n ker(S ) c ker ( T
A B

27.
+ S).

mismo del origen que del punto P = (2, 4, —4). 20. Encontrar la recta r que corta y es perpendicular a las rectas x = —t r,: y = 2 + 2t i — —2 21. H allar la longitud de la proyección x — l —t y= 3 -t z = —3+ f ortogonal del segmento PQ, donde y r 2 dadas por

28. 29.
b)

Sean V t - t - W t — X aplicaciones lineales. Si B ° A > = dim (A r), probar que A y B son suprayectivas.

es

supráyectiva

y d im ( W )

a) Sea A e L ( R 2" + J); demostrar que k e r (^ )# im g (^ l). Sea A e L((R2"); demostrar que ker (4 ) = im g (A ) si y sólo si A 2 = A ° A = 0 y dim (im g (A )) = n.

P = ( 3 , 1, 2) y Q = ( - 5 , 0 , 1), sobre el plano 3x + 2z = 0. 22. En los siguientes casos hallar los valores de x para los cuales el determinante de

30. a) Hallar las ecuaciones paramétricas de k e r (T ) y de im g (T ), si T: IR3 1— IR3 está > dada por T ( x u x 2, x 3) = ( x 1+ 2 x 2 + x 3, b)
x x+

la matriz dada es nulo: / 3 —x a) A= \
6 8 - 1

2 x 2, 2 x 2 + x 3)

/ 4 —x °
2

-5 - 4 —x
0

7 9

\

Encontrar la intersección de k e r (T ) e im g (T ). Encontrar la form a de Jordan de las matrices -3 '
- 1

om a1 .c

— 3 —x
- 6

\

b)

B= \

1

31.

5- x j
0 - 2

5 —x /

at

/3 — x 4 c) C=
0

-4 — 5 —x
0 0

2 4 -2

ic

/

-

1

2

/o y B=
1 \1 - 1

1 0

- 1 \
1 2

A= \

0
1 - 1

1

em

3 —x
2

.M

at

V

/

0

w

w

\ 23. b)

- 1 -. {1,

indicando el cambio de base.
/ 0 1

a) Encontrar la matriz del cambio de base de B — {1, x, x 2, x 3, x } a B Encontrar las coordenadas del polinom io / (x ) = 5 + 4x + 3x 2 + 2 x 3 + x 4

w

o'
0 2

x - 1 , ( x - 1 ) 2, ( x - 1 ) 3, ( x - 1 )4} en P ^ [ x ] ,

32.

Encontrar la forma de Jordan de A =

1
\ 0

0
0

y calcular /

/0

1

0

\ es diagonalizable, justificando la respuesta.

33. con respecto a la base B'. 24. Encontrar la dimensión y una base del subespacio vectorial generado por los 34.

D ecir si la matriz A =

0

0

2

lo 0 2 /
Encontrar la forma de Jordan de las matrices

vectores Si = ( 1 , 0 , 0 , - 1 ), m = ( 2 , 1 , 1 , 0 ), 2 u3 = (l, 1 , 1 , 1 ) A= Encontrar la ecuaciones cartesianas de este subespacio. 25. Dados los vectores 1 1 = (2 , 1, — 1), u2 = {3, 0, 1) y u3 = ( l , 2, — 3), determinar el T subespacio que generan y hallar la intersección de dicho subespacio con el generado por « i = (5, 1, 0), T 2 = (1, — 1, !)• T
\ 0 I / 1

uA= ( 1 , 2 , 3,4),

*r5 = (0 , 1, 2, 3)

/ -1 i
1 - 1

0

\
B=

1

2
1

3
2 1

" \ n- 1 n —2

\ o

1

ambas de orden n.

2 0
35. D ada la matriz A = \ — 1 3 a) b) c) 1 0

0
15 1 , calcular:

41.

Encontrar bases del núcleo L: Pt 3 )[ x ] h-> P [2)M dada por

y

de

la

imagen

de

la

aplicación

lineal

L i a x 3 + b x 2 + cx + d) = ( a - c + 2d)x2 + { - 2 a + b)x + ( b - 2 c + 4d)

El polinom io característico y la forma de Jordán de A. — Á * + 4 A 2 — 5A + 2. P (A ), donde P ( x ) = - x 6 + 4x 5 - 5x 4 + 2x 3 - 31. In
1

42.

a) Estudiar si la aplicación T: R 3 i— 3 dada por >K

l\
1

T ( x u x 2, X 3 ) = -^(
6

4xj + 4 x 2, 5 xx + 4 x 2, - x ! - 2 x 2 - 6 x 3)

36. Sea A . -

1 \ 1

n
1

con n eH . es diagonalizable. b) Encontrar los subespacios invariantes de dimensión 1 de la aplicación T.

nj

a) b) c)

Dem ostrar que A n es diagonalizable para todo n. Calcular A ~ 1 cuando exista. Si A ~ 1 no existe, encontrar ker(/ln e \mg(An ) ).

43.

L a suma de tres números positivos no nulos es M ; el primero, másel doble del segundo, menos el triple del tercero es 5 y el primero, más el triple del segundo, menos 7 veces el tercero es 0. Encontrar estos tres números.

37. Encontrar (razonadamente) los auto valores de A 10 si A es la matriz

44.

Dados los puntos P = (l, 2, — 1) y Q =

(l,

3, 2) y la recta

r

de ecuación

1

- 1

om

I A=

(2x + y — z = 6 (x — y + z = 1 Hallar: a) la proyección ortogonal de P sobre r; b) un punto situado en el plano perpendicular a r por P y que esté a la menor distancia posible de Q.

* 38.

*

*

em

at

ic w .M at

0

- 1

1

a1

.c w w
b) a) b) c) IÁ T j n L ( T 2). ) L (7 ;) + L ( r 2).

-1

2

-1

Discutir, según los valores de a y b, el sistema a x —y + 2z = l x + ay—4z = 0 — x + y —2z = b

45. a) Sean A = ( l , 0, 1), B = ( 2, 1, 1) y C = ( — 1,0, 1) tres puntos en el espacio; encontrar el cuarto vértice D del paralelogramo de la figura adjunta.
Encontrar los vértices E de las pirámides rectas que tienen com o base A B C D y cuyo volumen es 2 (hay 2 vértices).

y resolverlo cuando sea compatible indeterminado. 39. Se consideran los puntos P = ( 1, 2, - 1 ) , Q = ( 0, 1, 2) y los planos n y n' descritos por las condiciones siguientes: n pasa por P y es perpendicular a (1, 1, 1) y v! pasa por Q y es perpendicular a P&. Se designa por r la recta intersección de n y rí. Determinar las ecuaciones cartesianas de la recta que pasa por P y es perpendicular a r. 40. á) Considerar los puntos A = ( 1, 1, 0) y B = ( 0, 1, 1). Determinar un punto C sobre la recta r: (0, 1, l ) + s(l, 0, 1), cuya distancia a la recta determinada por A y B sea 2S¡ 2 . b) Determinar un punto D sobre la recta r': (1, 1, l ) + í ( 0 , 1, 0) de tal manera que el volumen del paralelepípedo determinado por los puntos A, B, C y D sea 4, donde C es la solución del apartado a) que tiene todas sus coordenadas positivas. 46. Dados los conjuntos de vectores 7’1 = { ( 1 , 1,0), (1 ,0 ,1 )} y T2 = {( 1, 1,1), (0 ,1 ,1 )} en IR3, determinar: La relación de inclusión entre L (T i) y L {T 2).

47. Encontrar la matriz, en la base canónica, de la transformación lineal A de IR3 en IR3 que lleva u¡ en T donde íj, ¡T i= (2 , 3, 5), u2 = (0 ,1 ,2 ), ~ 2 = ( l , 1, - 1), v u3 = (1 ,0 ,0 )

^ = ( 1, 1, 1),

F3 = (2, 1, 2)

48. Estudiar para qué valores del parámetro a e R , los vectores ui = (1 , — 1, 1, — 1), u2 = (a, 1 , 1 , a), u3 = ( 2 , 0 , 2 , 0 ) y tf4 = ( - 1 , a, 1 , a) son linealmente dependientes y encon­ trar la relación que existe entre estos vectores para los valores de a que los hagan linealmente dependientes. 49. Encontrar las ecuaciones paramétricas y cartesianas de la proyección de la recta

CAPITULO 8

ESPACIOS EUCLIDEOS

( 2 , 1 , l) + t ( - l , 0 , 2 ) sobre el plano 2x + y - z = 0. 50. Los puntos X = (0, 0, 0), B = (4, 3, 0) y C = (0, 0, 2) son vértices de una cara de un paralelogramo de volumen 20. H allar la ecuación del plano que contiene a la cara opuesta a la dada. 51. Se considera la base de

C 3

siguiente:

B = { ( 1 , 1 , 1 ), ( 1 , 1 , 0 ), ( 0 , - 1 , 2 )} y la aplicación lineal A, de C 3 en C 2, que cumple: A ( 1, 1, 1) = (¿, 1), a) b) A ( 1, 1,0) = (1, - i ) , A ( 0, - 1 , 2) = (2 + i, l - 2 i ) 8.1. 8.2. 8.3. 8.4. 8.5.
8 .6 .

D e fin ic ió n de esp acio eu clídeo. E jem p lo s L o n g itu d e s, án gu los y o rto g o n a lid a d Bases o rto n o rm a le s en un esp acio eu clíd eo C o m p le m e n to o rto g o n a l. P ro y e c c io n e s A d ju n ta de una a p lica ció n A p lic a c io n e s au toadju n tas A p lic a c io n e s o rto g o n a les: p a rte I A p lic a c io n e s o rto g o n a les: p a rte I I E structu ra de las a p lica cion es lineales n o singulares

.c ic at w w w .M at em a1

Determinar bases del núcleo y de la imagen de la aplicación A del problema anterior. la
— 1

om

Determinar la matriz de A en las bases canónicas de C 3 y C 2.

8.7.
8 .8 .

l\ 3 según los distintos
2

52. Estudiar laposibilidad de diagonalizar la matriz

0
^0

1
2

8.9.

1

valores de a.

8.1.

D E F IN I C IO N D E E S P A C IO E U C L ID E O . E J E M P L O S

U na gran variedad de hechos geométricos se basan principalmente en la posibili­ dad de medir las longitudes de segmentos y los ángulos entre ellos. Obsérvese que esto no es posible en un espacio vectorial. Para introducir el concepto de longitud de un vector y de ángulo entre dos vectores fijémonos en el espacio vectorial V2 de los vectores en el plano.

357

La idea intuitiva que poseemos de longitud de un vector, que designamos por | x |, es | |

donde x = ( x l5 x 2), y =(>’1; y2) y en general el espacio vectorial IR" con (x , F ) = x 1 y 1 + --- + x„y„

||x

| = v / x f + x f , mientras que para el coseno del ángulo a, que forman x" e y, se tiene | (x , y ) cosa = -----------

(1)

llx IIIIFII

1 J

donde x = ( x 1;..., x „) e y = (y l5 ..., y„). Las propiedades a) a d) son fáciles de verificar y se dejan com o ejercicio para el lector. E je m p lo B. D ados x = ( x 1 x 2) e y = ( y x, y2) vectores en ?

en donde (x, y ) denota el producto escalar de dos vectores x = x 1e\ + x 2<2 e y = y { e 1 í + y 2< 2- R ecordar que el produ cto escalar de dos vectores en el plano ha sido ? introducido en la sección 3.3 (capítulo 3) y que la fórmula (1) ha sido demostrada en la misma sección. La fórmula (1) relaciona ángulos con medidas y con productos escalares y es la base para introducir axiomas en un espacio vectorial, de manera que en los nuevos espacios se puedan estudiar propiedades geométricas. Nuestra táctica es definir estos espacios, que serán los espacios euclídeos, a partir de una definición axiomática de «produ cto escalar». Darem os en esta sección la definición de estos nuevos espacios, así com o algunos ejemplos. En secciones posteriores estudiaremos los conceptos de medida, ángulo y ortogonalidad en estos espacios; finalmente estudiaremos diversos tipos de aplicaciones

R 2, definimos

L a aplicación que acabamos de definir de R 2 x R 2 en IR es un producto escalar: las propiedades b) y c) se deducen de las propiedades de la multiplicación de matrices; para probar a) y d) observamos que (x , y ) = x 1 y 1 + x 2 y 1 + y 2 x 1 + 2 y 2 x 2;

.c

om

lineales entre ellos.

de aquí se deduce la propiedad conmutativa; para probar la propiedad d) observar que
(x ,
x

a1

DEFINICIÓN 1 (Espacio eu clíd e o)--------------------------------------------------------------U n espacio vectorial real £ se dice euclídeo si hay una regla que asigne a cada par de vectores x , y e £ un número real llamado producto escalar de los vectores x e y , designado por ( x , y ) , de manera que se cumplen las siguientes propieda­

) =

x

2 + 2 x 1x 2 + 2 x 2 = ( x 1 +

x

2) 2 -I- x 2 .

ic

at

at

em

P o r tanto, tenemos un nuevo espacio euclídeo en el espacio vectorial

R 2.

b) c) d)

Distributiva: ( x , y + T ) = (x , j f ) + (x , 7 ) para todo x , y\“z e £ . ( k x , y ) = k ( x , y ) para todo x , y e E y todo A e R . ( 5T, x * ) > 0 para tod o x # 0 .

w

a)

Simétrica: ( x , y ) = (y , x ) para todo x*, y e £ .

w

w

des:

E je m p lo C. Si x = ( x l5 x 2), y 2) 6 ^ 2 y definimos (x , y ) = x 1 y 1, esto no es un producto escalar en R 2 puesto que no se cumple la propiedd d)\ en efecto, si x = ( 0 , x 2 ) # 0 se tiene ( x , x ) = 0 . E j e m p l o D. En el espacio r é(\_a, b j) de las funciones continuas reales definidas en intervalo [a, b], el producto escalar de las funciones f ( t ) y g(t) se define com o

.M

el

( f g) = J f ( t ) g ( t ) d t , D e b) y a) se deduce: b') (x + ? , y ) = (x , y ) + (?, y ) para todo x , J,~z e E . obteniéndose un espacio euclídeo. El mismo producto escalar sirve para convertir el espacio vectorial ^ ([a , /?]), de los polinoifiios en el intervalo [a, fe], en un espacio euclídeo. * * *

D e c) y a) se deduce: c') (x , A y ) = Á ( x , y ) para todo x , y e £ y tod o l e R . D e b) se deduce que (0 + y , x ) = ( y , x ) = (0 , x ) + (y , x ) o ( 0 , x ) = 0. P o r la propiedad simétrica ( x , 0 ) = 0. En particular, ( x , x ) = 0 si x = 0. E j e m p l o A. El espaco vectorial

Sea E un espacio euclídeo de dimensión finita ti (es decir, el espacio vectorial asociado a £ es de dimensión finita n) y sea B = {tTt, u 2, ..., «*„} una base de £. En esta base, si x e E e y e E , podemos escribir: n x = ' Z x ¡Jíh ¡= i n J = Y . yF r i

R2

con

(x , y ) = x i y l + x 2y2

U tilizando las propiedades b) y c) del producto escalar se tiene que

Para el ejemplo D de las funciones continuas reales definidas en el intervalo [a, 6 ] se tiene (1 )
'b

(*\ ? ) =
L a matriz

X xj¡T„ X yjuj = Z
i j= i /

I

x y f i íi , uj)

¡= ií= i

2 \f(t)\2dt,

fe n ia n i).

I (Mi>
(ü\,

Mi) (m > ^ l) 2
u 2) { u 2 , u 2 )

(^m
••• ( « « > “2 )

\

La longitud de un vector x e E multiplicado por un número real k coincide con \ \ k veces la longitud de x , ya que

P = P B=

\ (^1,

w (^2) W • (w W n) n) • „, „) •

I

\ k x \ = J { k x , k x ) = J k 2{x, x ) = \k\J(x, x ) = |l|||x |. | T o d o vector de longitud 1 se dice unitario; euclídeo puede normalizarse, es decir, hacerle bola unidad es el conjunto de todos los x e E unidad es el conjunto de todos los x e E tal * * todo vector x no nulo de un espacio unitario, multiplicándole por l/||x |. La | tal que ||x||gl, mientras que la esfera que | x | = l. || *

recibe el nombre de matriz del producto escalar con respecto a la base B. Con esta notación la expresión ( 1 ) puede escribirse de la forma

( x , y ) = (x l,

x „)PE
/

w

vectorial.

w

La matriz P „ de un producto escalar es siempre simétrica debido a la propiedad a) y los elementos de su diagonal principal son todos positivos debido a la propiedad d). Podem os prguntarnos si estas dos condiciones son suficientes para que una matriz P defina un producto escalar; la respuesta es negativa, pues el lector puede encontrar un contraejemplo en el ejercicio 1 propuesto al final de la siguiente sección. En el capítulo 1 2 , dedicado a las formas bilineales y cuadráticas, se dará una condición necesaria y suficiente para que una matriz defina una producto escalar en un espacio

ic

a1

.c

om

y„

Dados dos vectores x, ~ de un espacio euclídeo definimos el coseno del ángulo a y que forman entre ellos como (x, y ) eos a = ----------11*1113*1

at

em

at

(2)

en analogía con la fórmula (1) de la sección anterior. Para que (2) tenga sentido es || | necesario demostrar que el valor absoluto del cociente ( 3^ y )/||x | | y | es menor o igual que 1 . PROPOSICIÓN 1 ( Desigualdad de Schwarz) _______________________ En todo espacio euclídeo E,

8.2.

L O N G IT U D E S , A N G U L O S Y O R T O G O N A L ID A D Ifó 301 ^ 1 *1 1 3 1 1 1 *1 La longitud (o norma) de un vector x en un espacio euclideo se define com o para todo x , f e E . 11*1 = V ( x , x ) , xeE. Demostración. P o r la propiedad d) del producto escalar se tiene (lx* — ~ , kx —"y) ^ 0 y
•••, X n).

Obsérvese que ^/(x, x ) tiene sentido debido a la propiedad d) del producto escalar. En el ejemplo A de la sección anterior se tiene:
||X ¡I = -y/X 1 “j" • • ■"1 X n , “
X

w

.M

En el ejemplo B de la misma sección se tiene que
11*1

para todo número real /; de las propiedades a), b) y c) del producto escalar se deduce que r = ( x 1; x 2). k2¡\x¡\2-2 k ( x , y )+ \ { y \ \ 2 ^ 0 .

=■>/(**, x ) = s/{ x 1+ x 2) 2 + x 2,

L a parte izquierda de esta ecuación es una expresión cuadrática en X que n o puede tener raíces reales distintas, y, por tanto, su discriminante ha de ser íS 0 ; por tanto: ( x , 7 ) 2-||x |2 ||7U2 g o . | T o m a n d o raíces cuadradas se deduce |(x*, D l ^ l l x 'l l y l l , que es el resultado que deseábamos probar. ■

Una proposición simple, asociada con el concepto de ortogonalidad, es la siguiente: * * * L em a2 ____ - ________ __________________________________________________________________

Si los vectores no nulos x\, x 2, ..., x„ son ortogonales entre sí en un espacio euclideo, también son linealmente independientes.

En R" con el producto escalar «usual» dado en el ejemplo A la desigualdad de Schwarz se escribe de la form a

Demostración. Supongamos que a 1 1+ a2x 2-\ x ------ 1- a „x „= 0 ; hallando el producto escalar con x y se tiene <xi(xi, x j + a ^ x !, x 2) + - - - + a „ ( x u x„) = ( x u 0 ) = 0 o equivalentemente a J x j l ^ O , ya que los vectores son ortogonales entre sí; com o ||xJI^O, se tiene 0 ^=0. D e forma similar se deduce a2 = ••• = a„ = 0. ■ * * *

j= i

I

xJ-yj

(3)

y en el espacio ^ ([a , fe]) es

<

[ / (t )]2dt J

íg (t)T d t

(4)
.c om

L a desigualdad (3) se atribuye al matemático francés Cauchy, mientras que (4) es * * *

Podem os ahora trasladar teoremas de la geometría elemental a este nuevo marco de la «geo m etría » en los espacios euclídeos. Comencemos con el teorema de Pitágoras. P o r analogía con los vectores en el plano podem os considerar j f + jr com o la hipotenusa de un triángulo rectángulo determinado por los vectores ortogonales x e y. P o r la definición de producto escalar y la ortogonalidad de x* e y se tiene:

at

ic

a1

atribuida al matemático ruso Buniakovski.

Ix + y II2 = (x + }T, X + 30 = Ix II2 + 2(x , y ) + |j ||2 = | x J|2 +

\\y ||2

w

(x, y ) = 0 En el espacio vectorial V2 de los vectores en el plano esta definición coincide con la idea intuitiva de perpendicularidad: es decir, los vectores form an un ángulo de 90°.
Ej e m p l o

.M

at

Finalmente introducimos el concepto de ortogonalidad o perpendicularidad entre dos vectores de un espacio euclideo: dos vectores x , y e £ se dicen ortogonales si

em

Esta igualdad representa el teorema de Pitágoras en los espacios euclídeos.

w

w

y
X

A.

L os vectores

?i =(i, o,..., o), f2=(o, i, o,..., o),..., s;=(o, o,..., i)
son ortogonales dos a dos en el espacio euclideo R " con el producto escalar usual E je m p lo B. En # ( [ — jt, n j ) los vectores del sistema trigonom étrico
1,

O tra propiedad geométrica que puede demostrarse en los espacios euclídeos es la desigualdad triangular, es decir, en todo triángulo la longitud H^f + yH de uno de sus lados es menor o igual que la suma de las longitudes de los otros dos. Para demostrar esto, se utiliza la desigualdad de Schwarz para obtener

llx + y | | 2 = (x + y ,
por tanto:

x +y)=

||x ||2 + 2(x, y ) + \\y||2 ^

^ | x ||2 + 2 | x | | y | + n j*| | 2 = (||x | + | y ||)2 | | || | | |

cosí, sent, co s 2 í, sen 2 r , ..., e o s nt, senn t , ...

son ortogonales dos a dos; por ejemplo, si n=¿m: que es el resultado deseado.
1

\\x+y\\ S

llxll + llyH

(eos nt sen m t ) d t = -

sen(n + m ) t d t ~ - |

sen(n —m ) t d t = 0

puesto que n ^ m . El resto se comprueba de manera similar.

E J E R C IC IO S (S E C C IO N E S 8.1 Y 8.2) 1. a) b)
c) d) e)

8 . Sea (£, ( , )) un espacio euclídeo y {u 1; ..., u„\ un conjunto de vectores ortogona­ les de E. Demostrar:

¿Cuáles de las siguientes funciones ( , ): IR2 x R 2 i-v IR definen un producto escalar?: a) ( x , y ) = x í y 1 + 2x2y2 + 2y1x 2- 3 x 1y2 ( x , y ) = x 1 i - x 2y2 y
(x, y ) = x 1y 1 + 2 x 1y 2 + 3y 1x 2 + 7x 2y 2 (x, y ) = x 1y 1 + 2 x 2y 2 + 3 x 1y 2 + 3 x 2y 1 (x, y ) = 2 x 1y 1 + 3 x 2y 2 + 2 x 1y 2 + 2 x 2y 1

n Ifíf u )l2 T — ^ V = ll^ll2, V iT e £ (desigualdad de Bessel). ¡= i lililí Si los {u ¡} son una base ortogonal de E ,____ _ " (F, UiXtTi,w ) _____ (u, w ) = 2_ ----------2-----5 w e E (identidad de Parseval) ¡= i llu¡ll

b)

Justificar la respuesta. Encontrar la matriz, en la base canónica, de aquellas funciones que sean producto escalar. 2. Encontrar la expresión analítica del módulo de un vector y del coseno del ángulo de dos vectores en R 2 para aquellas de las funciones en 1, que sean producto escalar. 3. 4. Encontrar el ángulo entre las aristasopuestas de un tetraedro regular.

9. Dem ostrar que la desigualdad de Schwarz es una igualdad si y sólo si los vectores son proporcionales.

10.

Dem ostrar la siguiente generalización del teorema de Pitágoras: | x*i + x 2 + •■ + x j 2 = II*! II2 + ||x2 II2 + ••• + ||xj2 | •

si los vectores x\, x~ ..., x ne E son ortogonales dos a dos. 2, 11. Si x e y son dos vectores cualesquiera en un espacio euclídeo E, demostrar que II* ■y I I ^ III* II - \ \ f III-

a) b) c)

w

4(u, F)=||ü’ + F ||2 — ||íf—F||2, V«; V e V (polarización) 2(u, V ) = )|íf + t f ||2 — ||ül2 — ||ül2, Vtf, 7? e K es una función | |: Vt— (R que | | >

w

w

2||u |2 + (|F||2)= | | u + F | (2 + | (u - F | | 2, VíT, V e V (ley del paralelogramo). |

.M

6.

Sea (V, ( , )) un espacio euclídeo. Demostrar:

at

em

<>4, B } = traza (A B ‘) es un producto escalar.

at

ic
8.3. BASES O R T O N O R M A L E S E N U N E S P A C IO E U C L ID E O En un espacio euclídeo E una base se dice ortogonal si sus elementos son ortogon a­ les dos a dos; si, además, los elementos de una base ortogonal son de longitud 1 , la base se llama ortonormal. Y a hemos demostrado en la sección 8.2, lema 2, que todo conjunto de vectores, en un espacio euclídeo, ortogonales dos a dos, son linealmente independientes. Dem ostra­ remos a continuación que en todo espacio euclídeo existen bases ortogonales; en el proceso de la demostración daremos un procedimiento, denominado método de ortogonalización, que permite obtener una base ortogonal a partir de cualquier base del espacio vectorial. En la literatura matemática también se le llama método de GramSchmidt. TEOREMA 1 (M étodo de ortogonalización) __________________________________________

5.

En el espacio vectorial ^ 3 x 3 (IR) de las matrices reales de orden 3, demostrar que

7. Sea V un espacio vectorial. Una norma en V
satisface: i) | tí| 5:0, V i T e F y ||iT||=0 o u = 0 | | ii) iii) a) | / f| = W llñ l, Vw eV, X e K ( = R o € ) |U | ||u+Tf|| ^ | tf| + | tf| (desigualdad triangular). | | | |

Si V es un espacio vectorial euclídeo con producto escalar ( , ) el m ódulo de un vector es una norma que satisface la ley del paralelogramo. P robar que si V es un espacio vectorial con norma | | que satisface la ley del paralelogra­ || mo, entonces existe un producto escalar ( , ) en V tal que | if| = ( u , u ) l/2. En | | consecuencia, la condición necesaria y suficiente para que una norm a sea el m ódulo de un producto escalar es que satisfaga la ley del paralelogramo. [ Sugeren­ cia: comenzar demostrando que ( u í + u2, F ) = (¡T1; V ) + (u 2, tf).] (ver problema 6 ). Sea | x | = |xj + |x2| definida en IR2. Dem ostrar que | | es una norma en R 2, pero | | | | no es el m ódulo de ningún producto escalar en (R2.

a1
Sea Xu x 2, ..., x k, ... una sucesión finita o infinita de vectores linealmente independientes en un espacio euclídeo E y sea L k = L { x l , ..., x k), el espacio vectorial generado por los k primeros vectores. Entonces, existe un conjunto de vectores % , y 2, .., y k, ... tal que: a) b) E l espacio vectorial Lk= L ( y 1, ..., y*) coincide con L k para todo entero positivo k. El vector yk+ l es ortogonal a L k para todo entero positivo k.

tí)

.c

coordenados en R", con el producto escalar usual.

om

Encontrar los cosenos de los ángulos entre la recta

x 1= x 2 = --- = x„ y los ejes

Nota. Un vector y en un espacio euclideo se dice ortogonal a un subespacio vectorial L si es ortogonal a todos los vectores de L; si L está generado por los vectores x l , x 2, ..., x t, basta probar que y es ortogonal a cada uno de los k vectores x}, j = 1 , 2 , k; en efecto, si x = £ aj * j se 9 ue j= i

EJEMPLO A. Encontremos una base ortogonal en el espacio — 1, 1]) de los polinom ios de grado menor o igual que 3 en el intervalo [ — 1, 1] con el producto escalar del ejem plo D (sección 8.1). Tom em os com o base inicial x l = 1, x 2 = ( x 3 = t2,x 4 = t 3. Elegimos y i = x x = 1, y 2 = t , + a - l y calculamos a para que (y!, y 2) = 0 :

(, y )= ( I a x , y * ^.
\j= i J

)

= X
j= i

aj(Xj> T ) =

0

/

0=C F i» >'2)= (1 » f + a ) = ( l , t ) + ( l , <*) =

td t + o c

dt = 0 + 2a;

T e o r e m a 2 __________________________________________________________________________ por tanto, y 2 = í. Tom am os y 3 = t 2 + A1 • 1 + A2 í: En todo espacio euclideo E de dimensión finita existen bases ortonormales.

Demostración. Sea { x u ..., una base cualquiera de E\ tomamos {/ i, y 2, ..., y n com o en el método de ortogonalización del teorema 1 ; esta nueva } colección genera todo el espacio vectorial debido a a) y son ortogonales debido a b). Para encontrar una base ortonormal tomar Demostración del teorema 1. que y*! e y* sean ortogonales: 2 ¡IW jh i = 1 > n• H A l" Tom ar y^ = X j e } r2 = * 2 + a>ri; elegimos a de manera 3’

x 2,

x„}

.c

om

at

ic

o = (F i, y 2)=(7i’ 2 + x y 1) = ( y 1, x 2)+ a (F j, y ^ x

a1

0 = (y 2, ^ 3)=

í :-

t 3d t + Á 1

t dt-\- h2

t z dt = X2 - => A2 = 0;

El denominador de esta fracción es no nulo, puesto que y x ^ 0; de la construcción realizada se deducen inmediatamente las propiedades a) y b) para k = 2. Procedemos ahora por inducción; supongamos que hemos elegido y u y 2, .. y k, de ., manera que L k= L k y son ortogonales dos a dos. Tomemos T/í+l = * k + l + ^ l F l + ^ 2 > ^ -----y escojamos At, Á2, ..., Xk de modo que y t + 1 sea ortogonal a y\, y 2, ..., y k. Para ello tenemos

w

w

a

II7 J 2

w

.M

(Ji. x 2)

at

em

de donde se deduce que

por tanto:

Tom am os y¿ = t 3+ X1- 1 + X 2t + Á3[

— ^ )■

0 = (y 1( y 4) = j*

í 3dí + Ax

J

dt + À2

td t + X3

J

^ t2—^ j d t = 2Aj

Aí = 0 ;

o = (y * + 1, 7 j ) = { x k+1, 7 j ) +
de donde deducimos que

X 0 j , y}),

j=

1, 2

,..., k 0 = ( y 2, y 4) = j* t * d t + X1 ^ í d í + A2 J í 2 d l + A 3 j* í ^ í 2 —- ^ d t =

2

2

- - + 3 A2 -

,

C om o antes, el denominador de esta fracción es no nulo y L k+ 1= L k + l.

finalmente,
0

francés quien los introdujo en 1785. Dem ostrar que los polinom ios y„{t) coinciden, salvo constantes numéricas, con los polinom ios dados por la fórmula = C y 4 ) —(y3 í 3) + A i(y 3> i ) + ^2(.V3> y3> ?
1

^ 3) = IV t2- - j dí = 0 + /Í3 l|y3 l| 2 Pn(t) = ~ í ( t 2~ i n n = o, 1,2, 3

/

í 3 dt + 0 + 0 + ki

A3 = 0;
por tanto,
3 3

Este fórmula fue encontrada en 1814 por el matemático portugués Rodrigues. Ejercicio. En el espacio vectorial /_ %
& ([ —

o , oo]) de o

las funciones continuas en la

recta real, demostrar que (f g) = *= < - 5 t;

f ( x ) g ( x ) e * 2 es un producto escalar y encontrar

los tres primeros términos de la ortogonalización de la familia de funciones 1 , x, x 2, x 3, Nota. Es necesario saber que

Resumiendo, í ,
1 3 3

y 1 = 1 . y 2=í> y3= t - y y* = t
es una base ortogonal de este espacio.

5*

o“ * 2 dx —. T í

om at ic a1 w
0

* *

*

/I
0

0 1

-

\

.M

at

la m atriz del producto escalar en esta base es

em

Sea { e x, <f2, ..., ~en una base ortonorm al en un espacio euclídeo E. Puesto que } ('e ¡, e’j) = Su, í, 7 = 1 , 2, ..., n (¿recuerda la < de Krónecker introducida en el capítulo 6 ?), 5

.c w w
0 1

E JE R C IC IO S 8.3

1. Sean m \=( —2, — 1, 1), m = (0, — 1,0) y ü* = ( l , — 1,0) tres vectores linealmente * 2 3 independientes de IR3. Definimos un producto escalar en IR3 afirmando que { u u u2, u 3} es una base ortonormal. Encontrar la expresión analítica de este producto escalar en la base canónica de IR3.

2.

Dados x*! = (1 , 0, 0), x 2 = (4 , —2, 0) y x 3 = (l, 1, 5) en R 3, construir los vectores y u

y 2 e y3 del teorema de ortogonalización. (IR3 tiene el producto escalar usual.)
3. Sean ^ = (1 ,2 ,0 ,0 ), u2 = ( 1,0,0,2) y tT = (l, — 1, — 1,2) tres vectores de IR4. Sea 3 W = L ( u l , u2, u3) el subespacio engendrado por u¡, u 2m 3. a)
b)

\o

o-

/

n n Por tanto, si x = £ x¡e¡ e E e ~ = £ y¡e¡ e E se tiene que y

Encontrar una base ortonorm al {ITj, ~ tí3J de W usando el m étodo de ortonorv2, malización. Extender la base encontrada en o) a una base ortonorm al de IR4.

t=i

j= 1
(x; y ) = x 1 > 1 + x 2 } ’2 + ---+x„.F„ > (3)

que nos da una form a sencilla de expresar en coordenadas el producto escalar de un espacio euclídeo, cuando en él se ha elegido una base ortonormal. Recíprocamente, si un producto escalar tiene una expresión com o en (3) en una cierta base, esta base es ortonormal; basta observar que de (3) se deduce que ( e¡, e’j) = 0 si i y Ce Ejercicio. T ¡) = 1 • 1 = 1 , i, j = 1 , 2 , ..., n. 1 Los polinom ios = 1, y2 = t, y3 = t2 — 3 = í 3—- 1 encontrados en el

4. U tilizar el m étodo del teorem a de ortogon alización para construir una base ortogonal en el subespacio tridimensional de IR4 generado por los vectores i/, = (1,2, 1,3), u2 = (4, 1, 1, 1) y u 3 = (3, 1, 1,0). 5. Sea { X y ) = x 1 1+ ( x l + x 2) ( y 1+ y 2) + ( x 1+ x 2 + x 3) ( y 1+ y 2 + y 3) un producto esca­ y lar en R 3. Encontrar una base ortogonal de M c R si: a)
b)

M

= {xeU 3

/ x 1= x 2 = x 3}

M = { x e R 3 / X j + 2 x 2 + 3x 3 = 0 }

ejemplo A reciben el nombre de polinom ios de Legendre, porque fue este matemático

6. En IR5 con el ¡r2 = (o , i, o, i, 0 )

producto y ¡r3 = (o ,

escalar usual,ortonorm alizar los vectores u\ = (1 , 0, 1, 0, 0 o, i, o, i).

7. Sean « = ( 1 , 2, 3, 4), Tf = (0, 3, - 2 , 1) y w = (1 , vectores de la forma vv + oìu + pv, a, P e IR que son mente.
8.

1, O 0 )elR 4. Encontrar todos los , ortogonales a u y vsimultánea­

Se tienen las siguientes propiedades de los subespacios ortogonales. 1) W1 y W2 son ortogonales si y sólo si todos los vectores de una base de W1 son ortogonales a cada uno de los vectores de una base de W2.

Sean a = (1, 2, 0, - 1, 0), F = (0, 1, - 1, 1, 0) y c = (0, C U , 2^1)e IR5. Descom poner c* en dos vectores, uno de ellos combinación lineal de a y fe y el otro ortogonal Sea £ u n espacio euclideo. Demostrar que u +
tf

al anterior. 9. y
t f — Tf

En efecto, si {uu ..., uk} es una base de W ¡ y {tr l5 ..., v}} es una base de W 2 y si x e ^ , y e W 2 podemos escribir x = x 1 1+ ••• + x kuk, ~ y = y 1v i + ---+yj'vj; por tanto, « ' —_ k i (*. ; y ) = Z X ¡= 1 1= 1 ya que (ü), tf,) = 0 para todo i = 1 , ..., k, 1=1, El recíproco es obvio.

son ortogonales si y sólo

si | w| = | T | || | f| .

^ ¡)= o

10.

Encontrar una base ortonorm al para cada uno de los subespacios siguientes:

a) {(x, y, z )e íR 3 / x + y - z = 0 } (R 3 tiene el producto escalar usual). b) jp (x )e P (R 3 ) [ - l , 1 ] / X ~ J ~ = P (X) I < en escalar dado 'por c) p(x) q(x) dx). ^ se considera el producto

2)

Si W¡ 1 W2 se tiene que W1 n W2 = (Ü}.

J-i

{ A e J í ix2{ U ) / traza M ) = 0 } (en ^ r 3 x 3 (IR) se considera el producto escalar dado

Para dem ostrar esta afirm ación suponer que W2; entonces 3T e W1 y x e W2, com o W11 W 2 se tiene que (x, x') = 0, y de la propiedad d) del producto escalar se deduce que x = 0 .

en el problema 5 de la sección 8.2). Dem ostrar que si (x, x ) = x\ + x\ + ••• + x\ en una base de un espacio euclideo,

.c ic a1

esta base es ortonormal.

om
D ado un subespacio vectorial W de un espacio euclídeo E el conjunto W L = {y e E / y l x * para todo x e W ) es un subespacio vectorial de E, que recibe el nombre de complemento ortogonal de W. Para dem ostrar que W 1 es un subespacio vectorial de E basta observar que si y i, y 2 e W 1 y a, b e U , (ay\ + by2, x ) = a (y1; x ) + b(y2, x ) = 0 y, por tanto, áyy + by2 e W 1. E j e m p l o A. En IR3, con el producto escalar usual, querem os encontrar el complemento ortogonal de W = { { x l , x 2, x 3) / X! = x 2, x t, x 2, x 3elR}. Una^base de W es m\=(1, 1,0), u2 = (0, 0, 1); un elemento y pertenece a W 1 si y sólo si y es perpendicular a u l y a u2. Si tomamos y = y { e'l + y 2 ^ 2 + y 3 ^ 3 se tiene que
0

11.

e f in ic ió n

D os subespacios W 1 y W2 de un espacio euclídeo E se dicen ortogonales, y se escribe W1 J_ W2, si todos los vectores de Wt son ortogonales a todos los vectores de W2. En IR3 con el producto escalar usual, un plano y una recta perpendicular a él, qtie pasen por el origen, son ortogonales (figura 1 ); sin embargo, dos planos que son perpendiculares en el sentido de la geometría de IR3 no son ortogonales, ya que los vectores x 2 de la figura 2 no son ortogonales.

w

w

w

D

1 (Subespacios ortogonales) ___ ______________________________________

.M

at

8.4. C O M P L E M E N T O O R T O G O N A L . P R O Y E C C IO N E S

em

at

= (y, u j = ( y i + y 2 ~ 2 + y 3 e3, T x + e2) = y x + y 2 e
3 ) = ya

o = (K w2 ) = t v i ^ i + y 2 * 2 + y 3 ^

Este sistema es un sistema hom ogéneo con tres incógnitas, cuya m atriz de los coeficientes tiene rango 2 ; por tanto, determina un subespacio de dimensión 1 ; este subespacio tiene por ecuaciones y 3 = 0 , y x = —y 2 y, por tanto, está generado por el vector Tf= ( — 1, 1,0). Así pues,
Figura 1 Figura 2

W 1 = L { - 1, 1 ,0 )}

E j e m p l o B. En IR2, con el producto escalar dado en el ejemplo B de la sección 8.1 queremos hallar el complemento ortogonal de la recta r: x 1= x 2. Puesto que r está generada por u = (1 , 1), tenemos que y = ( y i , _y2) e r l si Y sólo si

Si x

-

£ XiU¡, las igualdades anteriores se transforman en

0 = {y, u ) = (y i , y 2)^|

y i + 2 3' 2 ) ^

= 2 J' 1 + 3^

° -

X aijUj, X */«i = x
V =
i

i= 1

j= 1

X

a i j ( ïïr

«• ,)

P o r tanto, r 1 es una recta de ecuación 2yx = — 3y2, es decir, generada por tT = (3, - 2 )

° X -(
\j=l

/ «

a 2jUj,

X
■•= 1

X iu A =

¿
i=l

/

X
j= 1

a 2 j ( U j , MÎ)

° -

(X

a rjUp

,J = 1

X *K = X ¡¡
í= 1

que es un sistema hom ogéneo de r ecuaciones con n incógnitas x u x 2, - , x„. Las soluciones de este sistema forman el subespacio ortogonal a W. Si la base B es ortonorm al el sistema anterior se transforma en

al l xí +a12x2\ -------h alnx„ = 0

om

.c

a2lxí +a22x2t ------- ha2nx„ = 0 arlx l +ar2x 2 + ■•• +arnx„ = 0
(I)

at

ic
En este ejem plo se observa que el com plem ento ortogonal de un subespacio vectorial depende en gran medida del producto escalar utilizado. Observar que en este ejemplo los subespacios r y r 1 no son perpendiculares en el sentido de la geometría clásica estudiada en el capítulo 3. * * *

a1 .M at em w w w
El procedimiento seguido en los dos ejemplos anteriores para encontrar el comple­ mento ortogonal de un subespacio vectorial se generaliza a continuación. Sea E un espacio euclídeo con base S = {tTx, íT2, ..., tf„} y sea W un subespacio vectorial de E generado por los r vectores linealmente independientes
n Vi = n a l¡Up »2 = n a

Ejercicio. Si W es un subespacio vectorial de un espacio euclídeo E, demostrar que ( W 1 ) 1 = W . P r o p o s ic ió n 2___________________ Sea W un subespacio vectorial de un espacio euclídeo E, entonces E es suma directa de W y su complemento ortogonal W x .

Demostración. Si x e W n W 1 se tiene que x e W y x e W l \ por tanto, (x, x ) = 0, de donde deducimos que x = 0. Así se comprueba que W n W l = { 0 }. Falta probar que W + W 1 = E. Para ello sea B = {~eu ..., ~ una base ortogonal de W er} y completémosla hasta obtener una base ortogonal {é í, ...,'er, é^ + i, ...,%} de E; s i~ z e E podemos escribir

X
j= l

X
j= l

2j ü p

% =

X

«r/ j-

j = 1

z= X1 z¡ =' = 1 z¡^+ í = X+ 1 z ? i e; X r

=

T+y.

Los elementos x e W 1 quedan caracterizados por las relaciones ( v t , x ) = 0 , ( % x ) = 0 , ..., ( v „ x ) = 0

Claramente x e W; puesto que, además, y e W l ya que para todo j = l , ..., r

( ep y ) = (ej, ya que esto es suficiente para demostrar que x es perpendicular a todos los elementos de W. se tiene el resultado deseado.

£
i=r+ 1

ziei )= 0

Observación. D e esta proposición y de la proposición 2 de la sección 5.4 se deduce que dim (H /) + dim (W /±) = dim (£).

que es un sistema de r ecuaciones con r incógnitas A1; ..., Ar; puesto que la proyección P ( x ) de un vector x e E es única, este sistema debe tener una única solución; por tanto, su determinante («!,«!) ••• (Ur, Ut )

Sea W un subespacio vectorial de un espacio euclídeo E. Puesto que E = W © W L, de la caracterización de suma directa (ver proposición 4 de la sección 5.4) se deduce que todo x e E posee una descomposición única de la forma x = y + T con ~yeW, T e W 1. El vector y recibe el nombre de proyección ortogonal de x sobre W y se escribe y = P w( x ) = P ( x ), mientras que T es la proyección ortogonal de x sobre W 1 y se escribe T = Q fV( x ) = Q (x ).

D = («i, M r) ••• (Ur, Ur)

debe de ser no nulo y las soluciones j vienen dadas por ( u u Uj), ..., (x, Ui), ..., (ur, « i )
columna j

v

1

D,

,

j = 1 , 2 , ..., r

(S i.

(x, ur), ..., (ur, M r)

de acuerdo con la regla de Cramer.

om em at ic a1 w
ángulo que forma x con P ( x ); por tanto, (x, p ( x )) eos (x, W ) = eos (x, P ( x )) = |x||||P(x)|| _ (y + x y )_ llxIMiyil ||y||2 ||x|!||y|| _iip(x)|| |; |

EJEMPLO C. Tratem os de encontrar el ángulo que forma el vector p(t) = t 2 con el plano generado por los vectores p0( t ) = 1, p 1(t) = t en el espacio Pfe3 )( [ - 1 , 1]) de los polinom ios de orden menor o igual que tres con el producto escalar de la integral dado en el ejemplo D de la sección 8.1. Sea W = L ( 1, r); com o eos £ ( t2, W ) = c o s £ (r2, P (t2)) comenzamos calculando P ( í 2); tenemos que P ( í2) = Ar l + A 2 f, de manera que t 2 — P ( t 2) es perpendicular a W; por tanto, •i
0

En las aplicaciones es conveniente conocer cóm o se resuelve el problem a de encontrar la proyección P(x") de un vector x sobre un subespacio W que tiene {u*!, ..., ur} com o base (no necesariamente ortogonal). L a solución de este problema se encuentra de la siguiente manera: com o P ( x ) e W hemos de tener P (x ) = A jUj + •••+ Arur; además, Q ( x ) e W 1 y, por tanto, (Q ( x ), Uj) = 0 para todo j = 1, 2, ..., r. C om o x = P ( x ) + 2 ( x ) se tiene que g ( x ) = x —P ( x ) y, por tanto, (x, Mj) A jí«!, Ui) •“ Ar(ur, Mj) 0

w

w

.M

El ángulo que forma un vector x e E con un subespacio vectorial W se define com o el

at

.c

= ( 1 , t 2 — P ( t 2)) = í 1 t 2d t - f

J-l
'1

J-i
'i

k ,d t-

J
'i A ,í 2 d t = — A,
- 1

0 = (í, t 2- P { t 2)) =
%

-i

t 3 dt —

-i

Ajtdí —

de donde se deduce que P ( í 2 )= l/ 3 . U na vez calculada la proyección se tiene que

eos * ( í 2, W ) = eos * (í 2, l/3 ) = ^ i ^

3
^ 2 / ^ 5

vg

(II)
(x, Ur) A j(lij, M r) ***Ar(wr, M r) 0

l|í2ll

3

E j e m p l o D . Considerem os el hiperplano W ' de IR3 (considerado com o un espacio euclídeo con el producto escalar usual) que se obtiene trasladando el subespacio W de ecuaciones x j = x 3 mediante el vector ó‘ = (0, 1, 1). D ado x = (2 , 1, 2) quere­ mos hallar % 1 de manera que x = f + T y 7 sea ortogonal a W (ver figura adjunta) e f e W'.

Observar que el ejemplo D podía haberse realizado siguiendo los procedimientos de geometría clásica en el espacio estudiados en el capítulo 3. La definición axiomática de espacio euclídeo nos da entonces otro procedimiento para resolver el problema de las proyecciones. L e m a 3 _______________________________________________________________________________ Sea W un subespacio vectorial de un espacio euclídeo E y sea x e E . Si x = y + r con Y e W , se tiene que
11? 11

^ n e(x)ii

Demostración.

Basta aplicar el teorema de Pitágoras de la siguiente manera:

\\?\\2= \ \ x -y \ \ 2 = \\P(x) + Q ( x ) - y \ \ 2= \ \ P ( x ) - f + Q ( x ) \ \ 2 = = \\P(x)-y\\2 + \\Q(x)\\2 ^\\Q(x)\\2 donde la última igualdad se debe a que P ( x ) —~ e W y Q{x ) e W 1 y Si restamos a" de la igualdad x = f + 7 se tiene x —a’ = ( y ~ a ) + T ; donde j f —a e W y T e W l . P o r tanto, 1 coincide con la proyección Q(x — a ) dex —a sobre W 1.Hallam os primero P ( x - a ) ; com o W está generado por T í = (\, 0, 1) y e 2 = ( 0 , 1 , 0 ) se tiene que ■

om at ic a1 .c

E l lem a 3 dem uestra que si x = P ( Z ) + Q { x ) con P ( 3c ) e W, y Q ( x ) e W 1, P ( x ) es la m ejor aproxim ación a x de W . P a ra calcular P ( x ) puede procederse de la manera que se explica a continuación. T o m a n d o una base o rto g o n a l .. ., v r}
r

em

de W p odem os escribir P (£ ) =

.M

at

£ e^¡. C o m o Q ( x ) es perpendicular a Vj. 1= 1

w

w

P(x - c í ) = Al e 1-\-A2e2\
además: 0 = (e*1 (x — a ) — P ( x — a')) = (2 + 0 + 1) — k x2 => k l = 7>l2 ,

w

(x, Vj) = ( P ( x ) + Q{x), Vj) = (P (x ), Vj) = C ,P,||2 y, por tanto, los coeficientes de P(x) se calculan con la fórm ula

_

(x, U)

J

._ J

0 = (e*2, (x - a ) - P { x - a ) ) = 0 - / l 2 - 1 => A2 = 0. que se llam an com ponentes de x en la dirección de V j, j = 1 , ..., r. 3 P o r tanto, P ( x —a ) = - e l , con lo cual
E je m p l o E. Tratem os de encontrar la función de la form a ¿34 + a2 sen x + + a3 eos x + a 4 sen 2x + a5 eos 2 x que m ejor aproxim e a la función

T = Q ( x - a ) = x - a - P ( x - a ) = (2, 0, i ) - ^ ’

=

- 2 :)‘

A hora es sencillo calcular y puesto que

. f- 1 f(x ) = < JK ’ I 1

si . si

-n
0

g x < 0 ^ x ^ rt

xe

r — n, 71 L J

*

*

*

según el produ cto escalar. L a m ejor aproxim ación es aquella en que los üj son las com ponentes de / en la dirección de 1, sen x, eos x, sen 2x y eos 2x. En este caso las com ponentes üj reciben el nom bre de coeficientes de Fou rier de /

Com o

C o n una cantidad infinita de funciones trigonom étricas se consigue la a p ro x i­ m ación (/, 1 ) = f ( x ) dx =
— l d x +

!

1 d x =

— n

+

n

=

0

4

1

/ ( * ) ~ n „¿ o 2 « + 1 sen ( 2n + = el prim er coeficiente ax es nulo. Com o n ||sen x ||2 = sen 2 x dx = l — eos 2x dx = n 4 4 4 - sen x + —- sen 3x + — sen 5x n 3n 5n que consta de los tres prim eros sumandos de la serie anterior. 1 ,r ï 1 a2 = - (.f sen x ) = 7 1 Tí f ( x ) sen x dx = J n
1 4 = i [2 + 2] = n L J n

Pueden dibujarse algunas de las primeras sumas parciales de esta serie para com prob ar que cada vez se aproxim an más a la función f . En la figura siguiente se dibuja

el segundo coeficiente es:

-sen x d x +

sen x dx

.M

at

En el gráfico adjunto se dibujan la función / y su aproxim ación - sen x.

em

at

{ 1 , sen x, eos x, sen 2x, eos 2 x } es - sen x. T T

ic

4

a1

D e m anera sim ilar el lector puede calcular el resto de los coeficientes, que serán tod os nulos. P o r tanto, la m ejor aproxim ación a / en el espacio generado por

.c w w w
P o n ie n d o x = ^ se obtiene la aproxim ación

om

«

.

1

4

------- 1------------ 1------ 1------- L 3 5 7 9 11

1

1

1

1

1

...

en la que los denom inadores son todos los núm eros impares.
E j e m p l o F. El lema 3 se utilizará en este ejemplo. D ada una fu n ción /(t) definida en el intervalo [a, ¿>], y t u t2, ..., t„ e [a, b], se trata de encontrar un polinom io p(t) de grado k < n y tal que la desviación cuadrática media de la función f, definida por

* ( /; p)2= t
j= i sea mínima.

U (tj)-p (tj)l2

Si en el espacio de todas las funciones definidas en los puntos t u t 2, ..., í„, definimos A ñ adien d o funciones trigonom étricas pueden lograrse m ejores «a p ro x im a c io ­ n es» de esta función. ( f ff )= z f Ü j M i j ) , j =i f 9 funciones

381 se tiene un espacio euclideo de dimensión n. En este espacio euclídeo el problema planteado se reduce a encontrar la proyección P ( f ) de / sobre el subespacio de todos los polinom ios de grado no superior a k, ya que entonces \)Q{f)\\2 = o(f, P ( f ) ) 2 es minimo, de acuerdo con el lema 3. Este problema ya sabemos resolverlo: se tendría P { f ) = lo + Áj t + ••• + Xktk donde los / son soluciones de un sistema semejante a (II). .k Realizamos un ejemplo sencillo para ilustrar las afirmaciones anteriores. Suponga­ mos que queremos encontrar un polinom io de grado 2 de manera que la desviación cuadrática media de la función/(t) = eos nt en los puntos t 1= 0 , t 2 = 1 , í 3 = 2 sea mínima para este polinom io en el intervalo [ 0 , 2 ], El polinom io mínimo P ( f ) será de la forma P ( f ) = X0 + A1t + A2t2 de manera que E JE R C IC IO S 8.4 P o r tanto, P ( / ) - 1 - 4 t + 2f2, que ha sido dibujado con trazo fino en la figura adjunta.

É
x i É

ca
% ;* w

O « 3

-~ t í J Q C¡

9
a

s ° % < U

i) —a0(i, í ) - ^ ,i)—
0{ l ,

Á 2{t2,

i) = o

1. a)

Encontrar el complemento ortogonal del subespacio W de E cuando: £ = R 3, W = L ( u , t f ) con tí = (1 ,0 , 1), tT = (2, — 1 , 1). £ = IR4, H/= { x e l R 4 / + x 2 + x 3 + x 4 = 0 y 2x¡ — x 2 = 0}.

S

H « y Q < < > a. fe! w Q 5 y

< o

(/> í ) - ¿ o ( l . t ) - ¿ i ( t , t ) - ¿ 2( t 2 , í) = o

£ ^ 5

om .c ic a1 em at .M at w w w
= 4 c) d) 5. a)
10

(/ t 2) - A

r )— x1t í 2 (, 2)-A2 t ,í )=0 (2 2

b)

Utilizando el producto escalar anteriormente definido obtenemos
1

En ambos espacios se considera el producto escalar usual. 2. Sea W com o en l.b) y W(3, 2) = {x e IR 4 / x 1 + x 2 + x 3 + x 4 = 3, 2 x l — x 1 = 2 ] una subvariedad afín trasladada de W. a) b) Encontrar la expresión analítica, en la base canónica de IR4, de la proyección ortogonal sobre W. Similarmente sobre W { 3 , 2 ).

— A03 —Aj3 —A25 = 0

1 —103 —A¡5 —129 = 0 3 -2 0 5 -^ 9 -1 2 1 7 = Puesto que 3 3 5 tenemos:
1 1 0

0

3 5 9

5 9 17

3
0 2

3
2 6

5 4 = 3

2
6

4 ’ 12

+ 2

3 2

5 4

12

3. Sea E un espacio euclídeo, A y B subconjuntos de E y W y Z subespacios vectoriales de E. Demostrar: i ’ a) = {u e £ / (u, F ) = 0 , V tfe < 4 } es un subespacio vectorial de £: ^ vcciunaj ae 1= ( A 1) a) A L 1 = { A L ) 1 = L ( A ) - PS íW ir « 1 -----(A), es decir, el subespacio engendrado por A b) A c B => B 1 c: A . (W + Z )1= W 1 n Z l . ( W r \ Z ) 1 = W 1 + Z 1.

3 5 9
1 1

5
1

1

3
2 6 1 0

5 4
12

—'

1

9 17 5 9

3 3 3 5 3
1

= 4

0 2

= -• 2 [ 1 2 — 1 0 ] = 1

3
1
~

5 4 17 1
0

-------„lyvu-L / = (5 2, 4. En R 4 descomponer j =\ j ,, z, — 2 , 2) en una suma de dos vectores, un vector g" te . . ) vTi 2 perteneciente al subespacio vectorial generado p o r 75 , = Í(2 , 1 , 1 , — 1 ) y ~S = (U 1 , ^, 0 ) y porT^ 3 r" un vector h ortogonal a este subespacio. = ----- 4-4 = - 4 4 Encontrar el complemento ortogonal de cada uno de los subespacios del ejercicio de la sección 8 .3 . Adem ás En J 3 ll 3 (lR) con el producto escalar ( A , B ) = traza(AB)', hallar el complemento ortogonal del subespacio de las matrices diagonales de ^ 3 x 3 ((R). Determinar la proyección ortogon al y la mínima distancia de una matriz X = ( \- \ c / í m ------ c k oi y ia minima distane — ( x - ) e J //f / D -i 'tT V 1 lp lt r ir ^ c al subespacio de las matrices diagonales.

3 3 5 9

4

0

17 1 1 3
1

5 3 ~4
0

3 3
2

A2 —4

3 5

5

9

3

= -•2 -4 = 2 4

b)

6. En IR4 con el producto escalar usual determinar las ecuaciones de la proyección ortogonal sobre el subespacio generado por ( 1 , 1 , — 1 , 0 ) y ( 0 , 0 , 2 , 1 ). 7. Sea £ un espacio euclídeo y W un subespacio vectorial de £; designar por P w la proyección ortogon al sobre W. D em ostrar que ( P ^ ( x ) , y ) = (x; P w( y )) para todo
x, y e E.
8.

La definición anterior plantea dos preguntas inmediatas: 1.a 2.a ¿Existe siempre una aplicación adjunta de una dada? Si existe una aplicación adjunta de A, ¿es única?

Sea E un espacio euclídeo; £ * = L (£ , IR) = {/ : £i~*IR |/ lineal} se denomina el

Comenzaremos contestando a la segunda de manera afirmativa; para probar que la adjunta de A es única supongamos que existen aplicaciones lineales B y C tales que (A x , y ) = (x, B (y )), ( A ( x ) , y ) = (x, C (jf));

espacio dual de E. Teorema de representación de Riesz. Para cada/ e E * existe un único uf e E tal que f ( v ) = (ur , V), V v e E . L a aplicación / (- » « / de £ * i— ►£ es biyectiva y satisface uf + g = uf + ug y uXf = Auf (luego es lineal). Sea £ = R 3 y f e E * definido por /(e*1 = 2, f ( e 2) = 1, f ( e i ) = — 1. Encontrar u f . ) 9. Sea £ un espacio euclídeo, W c £ un subespacio, P: E i— £ la proyección ortogo ­ ►

entonces tenemos (x*, B (y ) ) = ( X C ( y )), o equivalentemente (x, B ( y ) — C ( y ) ) = 0 para tod o x , y e E ; tom ando 3 = (B — C )( y ) se tiene T ((fl- C )(B (B -C )y ) = 0 y por la propiedad d) del producto escalar se tiene (B — C )(Y ) = 0 => B ( y ) = C (y ), lo cual prueba que B y C coinciden. En el razonamiento anterior se ha obtenido el siguiente resultado, que merece la pena destacar para su uso futuro:

nal sobre W. Demostrar: a) ' i u e E , | w —P(íT)|| ^ || — vv |, V w e W (P ( u ) es el punto de W a distancia mínima | íT | de ¡7). 10. En lo que sigue se supone: (a) que no se conoce la descomposición E = W ® W1 y

b)

Sea Q: E i >£ definido por 0 ( u ) com o el único Y e W satisfaciendo (*). Probar que —

w

.M

at

a)

Probar que para cada u existe un único T e W

satisfaciendo (*).

em

at

||íT—T¡] ^ \ u — vv | , \ |

'iw e W

(* )

ic

a1

(b) que para cada u e £ existe al menos un Y e W tal que

.c

om
L e m a 2 ____ ___________________________________________________________________________ Si B, C e L ( E ) y son tales que (x; B (y )) = ( X C fy )) para todo tiene B = C . x, y e E , se La pregunta primera tiene también una respuesta afirmativa si d im (£ ) = n < o o . Para demostrarlo, sea {'e1, ..., ~e„j una base ortonormal de £ y A = (aij))Z\\ - ,n la matriz n de A en esta base; sea A ‘ la traspuesta de la matriz A y sea A ' la aplicación lineal de matriz A ' en esta misma base; demostraremos que A ' es la aplicación adjunta de A. Tenemos que

( u - Q ( u ) , w ) = 0, V w e W . c) P rob a r que Q 2 = Q y Q e L ( E ) (aplicaciones lineales de £ en £ ) y, por tanto, es una proyección. Además, im g Q = W. Nota: debido a c), g = P es la proyección ortogonal sobre W.

w

w

(A(%), ek = (au e l -i------1- anien ? k) = aki ) ,

y
8.5. A D J U N T A D E U N A A P L I C A C I O N D e f i n i c ió n 1______________________________________________________________________ Sea £ un espacio euclídeo y A una aplicación lineal de £ en £, es decir, A s L ( E ) ; una aplicación A ’ € L ( E ) se dice que es adjunta de A si para todo x , y e E se tiene n (Ax, y ) = (x, A 'y ) * = I
¿=1

(e¡, A '(ek)) = (e¡, akl'eí -\ ----- 1- aknen = aki )

con lo cual tenemos (A(e¡), ~ k) = (ei, A '(ek)) para todo i, k = 1, 2, ..., n. C om o todo vector e de £ es combinación lineal de los vectores de la base, de la igualdad que acabamos de probar se deduce que Á es la adjunta de A; en efecto, si n F = I yjtj j =l

8 .6 .

A P L IC A C IO N E S A U T O A D J U N T A S

tenemos que D e f i n i c ió n 1 ( Aplicación autoadjunta) _________________________________________ Sea £ un espacio euclídeo y A s L ( E ) ; la aplicación A se dice autoadjunta si su adjunta A ' coincide con A, esto es, A ' = A. D e forma equivalente, lo cual prueba el resultad«) deseado. H em os demostrado el siguiente resultado: para todo x , y e £. P r o p o s ic ió n 3_____________________________________________________________________ Para toda aplicación lineal A e L(E), donde E es espacio euclídeo de dimen­ sión finita, existe una única aplicación adjunta A ' de A, cuya m atriz en una base ortonorm al es la transpuesta de la m atriz de A. * * * Si A es la matriz de una aplicación A e L (E ) en una base ortonormal, sabemos que A ' es la matriz de A ' en esta misma base; si A es autoadjunta se ha de tener A —A'. P o r tanto, la matriz de una aplicación autoadjunta en una base ortonorm al es simétrica. En la sección ánterior se ha demostrado que la aplicación adjunta de la identidad / e L (£ ) es ella misma; tenemos en / el primer ejemplo de una aplicación autoadjunta. Las aplicaciones autoadjuntas tienen las siguientes propiedades: 1. La suma de aplicaciones autoadjuntas es autoadjunta, ya que (A + B)' = A ’ + B' = A + B. La aplicación inversa de una aplicación autoadjunta invertible es autoadjunta, ya que ( A ~ 1 ' = ( A ' ) ~ l = A ~ l . ) L a composición de dos aplicaciones autoadjuntas es autoadjunta si y sólo si las aplicaciones conmutan, ya que (A B)' = B 'A ' = BA y, por tanto, (A B ') = A B si y sólo si B A = AB. (Ax, y ) = (x, Ay )

A continuación damos algunas propiedades de la aplicación adjunta de una dada. a) /' = /, donde I denota la aplicación identidad (basta observar que (/(x*), y )

om a1 .c at em at ic w w w .M

= (x, y ) = ( x , / (y )) para todo x, j f e £). b) ( A J = A, ya que

2. 3.

(A { x ), f ) = (% A '( y ) ) = ( A ’(y), x ) = ( y 0 4 ')'(x )) = ((A ')'(x ), y ) para todo x, y e £ . c) (A + B)' = A ' + B', ya que

(x, (A + B ) ’y ) = {{A + B )x. y ) = { A x , y ) + ( B x , y ) = { x , A '( y ) ) + ( x , B 'y ) = (x, (/T + B ')y ) ; para todo x, y e £. d) ( A 0 B)' = B' ° /!', ya que (x, (A ° B ) J ) = (X = B (x ), y ) = (Bx, A ’{y )) = {x, B' ° A '( y ) ) para todo x, y e £. e) Sí A posee inversa, se tiene ( A ~ 1)' = ( A ' ) ~ 1. C om o A ° A ~ 1 = / se deduce de d) y a) que (A 0 A ~ * ) ' = ( A ~ 1)' ° A ' = /' = /, lo cual prueba que la invesa de A ' es la adjunta de la inversa. Nota. Las propiedades anteriores tienen su traducción para matrices trans­ x

En el ejercicio 11 de la sección 7.2 se pide demostrar que los autovalores de toda matriz simétrica de orden 2 son reales; además, del mismo problema se deduce que toda matriz real simétrica de orden 2 es diagonalizable. N os preguntamos si toda matriz simétrica (o equivalentemente toda aplicación autoadjunta) es diagonalizable en los números reales con independencia de su orden. En esta sección daremos una respuesta afirmativa a tal pregunta y demostraremos, además, que los vectores de la nueva base pueden tomarse ortonormales. En lo que sigue, y mientras no se indique lo contrario, A denota una aplicación lineal de un espacio euclídeo £ en sí mismo.
Teo rem
a

1 _____________________________________________________________________________________

Si W es un subespacio vectorial de £ invariante con respecto a A e L ( E ) , su complemento ortogonal W L es invariante respecto de la aplicación adjunta A' de A.

puestas; por ejemplo, d) S£ escribe com o (A B )' = B ‘A ‘.

Demostración. Sea y € W 1; queremos demostrar que A'(y ) e W 1. Para todo x e W se tiene que (x^ A '( y ) ) = ( A ( x ) , y ) = 0, ya que y e W 1 y A { x ) e W por ser W invariante con respecto a A; la igualdad (x, /t'(y)) = 0 para todo x e W implica que A ' ( y ) e W l , que era lo que queríamos demostrar. ■

Si A es una aplicación autoadjunta, se tiene A' = A, y del teorema 1 se deduce inmediatamente el siguiente corolario: C o r o l a r io 2 _ ---------------------------------------------------------------------------------------Si A es autoadjunta y W es un subespacio vectorial de E invariante con respecto a A, W 1 es invariante con respecto a A.

euclideo se tiene una base de autovectores ortonormales, y en està base la matriz de A tiene la forma

0

T e o r e m a 3 ________________________________________________________________________ T o d a aplicación autoadjunta A en un espacio euclídeo de dimensión finita tiene todos sus autovalores reales. E j e m p l o A. matriz simétrica

V
Reducir a su form a diagonal mediante una base ortonorm al la

i Demostración. Sea A la matriz de la aplicación A. Supongamos que esta matriz posee al menos un autovalor complejo, que denotaremos por a + í/i con /?#0.En ción 7.5 del capitulo 7 se demostró que existen vectores u, % no nulos simultáneamente, tal que A ( u ) = ocu — p v , D e aquí deducimos A ( v ) = ¡3u +txV. A= la sec­ .v7«

v 's 3

Sus autovalores son las soluciones de 0 = \A — A/| = ( l — A)(3 — A) — 8 = A2 — 4A — 5; por tanto, Aj = 5, A2= — 1 . Puesto que - 4 J s

om

- fty A j6
- 2 A y )

— 4x + v /8 y = 0 => k e r (^ —5/) = L < “ 1 =

w

.M

Puesto que A es autoadjunta se tiene que (Atí, V ) = (u, A V ) y, por tanto, 0 = /3(\\u\\2 + ||tf||2). D e aquí deducimos que / = 0, que contradice el hecho de que ? es no nulo. Esta contradicción prueba el resultado deseado. ■

em

at

ic

( u,

AV)

=

P(u, u )

+ a ( u , t f)

a1

(Au, V ) = a(u, v’) — P(v, ~v)

.c

tomamos ~ e L { u ,) unitario: el Si l«ill Puesto que
1 / 2

\ = / l/v/3 \ V2/y3/

T E O R E M A 4 ( Diagonalización de matrices simétricas)

-------------------------------------

L a matriz de una aplicación autoadjunta puede ser reducida en una base ortonorm al determinada a una matriz diagonal. tomamos íf2 e L (u 2) unitario: Observación. D el teorema 4 se deduce que toda matriz simétrica es diagonalizable. \m y24\y8/ V
2A/6/

Demostración. Sea A una aplicación autoadjunta y un autovalor de A; por el teorema 3, Ax es real. Sea ~ un autovector de A correspondiente a Ai de manera que el sea unitario. Sea W x = Ue'i) el subespacio generado por e\; com o A es autoadjunta, del corolario 2 se deduce que es invariante respecto de A. La aplicación A restringida a sigue siendo autoadjunta y, por tanto, podemos elegir ~ 2 e e tal que ~ sea un autovector unitario de autovalor real A2 de A. e2 Tom am os W 2 = L ( T 1, ~e2) com o el subespacio generado por ~ey y e*2; W 2 es invariante respecto de A y el proceso puede repetirse para obtener A3, autovalor real, y ~ autovector unitario, ortogonal a ^ y ~ e3, e2. Después de repetir este proceso tantas veces com o la dim ensión del espacio

w

w

at

Observar que ~e¡ y ~ 2 son ortonormales. La matriz de A en la base {ei, e e *2} es ^5
0 - 1 0^

J=

P o r tanto, en la base {éT15 ~ 2j A produce una «d ila ta ció n » en el «eje». e que se obtiene multiplicando por 5, y una «sim etría» con respecto a la recta L{~eí } (ver figuras 1 y 2 ).

2. Sean ^ = ( 1 , 1, 0), u2 = ( 1, 0, 1) y tf3 = (l, 2, 0) los vectores de una base de IR3. Estudiar si la aplicación / leL (IR 3) es o no es autoadjunta, cuando su matriz asociada en la base { « i , u2, if3} es
a) A= \° I 1 -4 2 3 2 \ 3 0 \ b) / -4 4 3

-6
7 4

\

L a imagen de la figura O ABC es OA'B'BC’ marcada en trazo grueso (figura 2).

3. D ia gon a liza r en una base orton orm a l cada una de las siguientes aplicaciones, dem ostrando en prim er lugar que son autoadjuntas: a) b) c) A: IR2 1 ► — IR2, A(x, y) = ( 2 x + y , 2y + x) S 1 ► 3 — IR3, A{x, y, z) = (y + z, x + z, x + y)
^2

x2W

^ ^ 2 x 2 (R), T ( A ) = A <

4.
5.

Sea T una aplicación lineal de un espacio euclídeo E en sí mismo. Dem ostrar que T + T ’ es autoadjunta. Con T com o en el problema 4, demostrar que ker ( T ') = [im g ( T ) ] 1 e im g (T ') = [k e r (T ) ] 1

a1
Aj? = x 1A1 1H r ------h x nÁn Tn con lo cual en esta base A se reduce a n «dilatacion es» a lo largo de los nuevos ejes; las dilataciones pueden o no cambiar el sentido según que el autovalor sea positivo o negativo.

.c w w .M
en la base { e u ...,'en} del teorema 4, si x = x { e 1+ ■■■+ x n e : ~n

om at
Podem os ahora dar la interpretación geométrica de las aplicaciones autoadjuntas;

em

at

ic

6.

Dem ostrar que toda matriz simétrica S e J í nx „(IR) determina una aplicación lineal autoadjunta en todo espacio euclídeo de dimensión n.

w

8.7.

A P L IC A C IO N E S O R T O G O N A L E S : P A R T E I

E J E R C IC IO S 8.5 Y 8 . 6 1. a) b) c) d) Encontrar la aplicación adjunta de las siguientes aplicaciones. T: R 3 i— IR3, T (x, y, z) = {x + y + z, x + 2y + 2z, x + 2 y + 3 z ) ► A: IR3 IR3, A ( x , y , z ) = ( - y + z, - x + 2z, x + 2y)

Sabemos que ?n todo espacio euclídeo E existe el concepto de longitud de un vector; es natural, por tanto, preguntarse cuáles son aquellas aplicaciones que conser­ van la longitud de los vectores de E. A las aplicaciones que conservan la longitud de los vectores de E las llamaremos ortogonales; su estudio, así com o su significado geométrico, serán el objetivo principal de las dos próximas secciones. En lugar de dar la definición utilizando la longitud de los vectores, la daremos utilizando la noción de producto escalar. C om o mostraremos más adelante, ambas definiciones son equivalentes. En lo que sigue E se utiliza para designar un espacio euclídeo y A una aplicación lineal de E en E; además, cuando sea necesario utilizar la matriz de la aplicación A se entiende que E es de dimensión finita. D e f i n i c ió n 1 _______________________________________________________________________

A: P Ü ’ M ^ P ^ C x ] , ^ ( x ) ) = x ¿ p ( x ) - ¿ ( x p(x)) T . M 3 x 3 (IR) t-> J ( 3 x 3 (IR), T ( A ) = A ' + A Nota. L o s productos escalares de R 3, y M 3 x 3 (K ) son com o en el

Una aplicación lineal A de un espacio euclídeo E se llama ortogonal si {A{x\ A(y)) = (x, y ) para todo x , y e £ (es decir, A conserva el producto escalar).

ejercicio 10 de la sección 8.3.

Puesto que si A es ortogonal, l i n i 2 = ( x , Z ) = (A(x'), A ( x ) ) = l ¡ A ( x ) l ¡ 2

Para todo x = ( x x, x 2 )e !R 2 se tiene

y

(!G„(x)(|2=

c o s $ (x , y ) = — ~ —

, ___ (*,F (^* A(y)) ) (x),
I M I I I y ll M ( * ) | | M O O ll

(C< 0P &
y sen cp

“ sen<¡í,Y X! eos (p/\x2

x ¡ eos < — x 2 sen<p p XjSen cp + x 2 cos(p

= c o s $ ( A ( x ) , A {y ))

A,-**
= (x j eos (p — x 2 sen (p)2 + ( x i sen cp + x 2 eos (p)2 = x\ + x\ = || |2. x | Esto prueba que ser ortogonal. conserva la longitud de los vectores y por la proposición 2 debe de

deducimos que toda aplicación ortogonal conserva las longitudes de los vectores y los ángulos entre ellos. Se tiene, además, la siguiente proposición: P r o p o s ic ió n 2______ _______________________________________________________________ T oda aplicación lineal A en un espacio euclídeo E que conserve la longitud de los vectores es una aplicación ortogonal. Demostración. Para todo 5 f e A se tiene c,

EJEMPLO B. En (R2 cualquier simetría con respecto a un subespacio vectorial unidimensional es una aplicación ortogonal. Encontremos primero las ecuaciones de la simetría Sv con respecto a W = L (u ). D ado x e IR2, x + f = P w( x ) donde P w( x ) es la proyección de x sobre W e Y = P w( x ) — x\ además, x + 2 y = S jr( T ) com o puede apreciarse en la figura 1. Estas igualdades producen Sjr(x ) = 2 í’ »f'(x ) — x = ( 2 P W— I ) ( x ) Para encontrar i V ( x ) escribimos P w ( x ) = áu e imponemos la condición de que 7 = i V ( x ) - x = / U T -x sea perpendicular a u: 0 = (u, Xu - x ) = A \ \ \u 2-(u, x) \ P o r tanto, (u, x )_ Pw(x ) —

| \A(x + y)\\2= ( A { x ) + A (y ), A ( x ) + A ( y ) ) = \\A(x)]\2 + 2 (A (x ), A ( y ) ) + \\A(f) \ | 2

y

= | x + )r||, ||A(x)|| = | x | y M O O IIH IT II se deduce que |* ||

E je m p lo A. Cualquier giro en R 2 (con centro el origen de coordenadas) es una aplicación ortogonal. Este resultado, que es geométricamente intuitivo, puede demos­ trarse algebraicamente. Para ello suponer que el giro es un giro de ángulo (p en el sentido positivo (contrario a las agujas de un reloj) y que, por tanto, su matriz viene dada (respecto de una base ortonormal) por (cosq> G p= \ < \ sen < p —sen q>' eos cp

w

aparte del ejemplo trivial de la aplicación identidad.

w

H a llegado el momento de dar algunos ejemplos de aplicaciones ortogonales,

w

.M

lo cual prueba que A es ortogonal.

at

em

(A {x ), A ( y ) ) = ( x yf )

at

ic

a1

.c

Teniendo en cuenta que A conserva la longitud de los vectores y, p o r tanto, \\A(x -f-Jf)||

om

\\x+y\\2= ( ? + y , x + y ) = \ \ x ||2 + 2 (x , y)+\\y\\2.

Figura 1

D e aquí deducimos que la matriz de P w con respecto a la base canónica {e’1, e2} de es u,u l u2

En IR3 las posibilidades de aplicaciones ortogonales son mayores; a continuación daremos algunos ejemplos. E j e m p l o C. En IR3 el giro G con respecto a una «recta » (subespacio vectorial de dimensión 1) de amplitud q es una aplicación ortogonal. >

UiU í u2 \ 11« donde u = uí ~ e1+ u 2e2. Puesto que S ^ x ) = ( 2 P w- l ) ( x ) la matriz de Su con respecto a la base canónica es f '2u\ llull 2 2 u 1u 2 \ II« 2u\
- 1

2uí u2

\
1

(u\ — u\

2u 1u 2 u \ -u \

M 2 \ 2 u l u2

/

Podem os com probar ahora que Su es una aplicación ortogonal puesto que si x = ( x u x 2) e U 2, Supongamos que L = L ( u l ) y que W = L 1 = L ( u 2, u3), de manera que ü\, u2 y u3 son ortonormales; entonces {íT1( u2, tf3} es una base ortonorm al de IR3 y en esta base / 1 G=
0 0

.c

S A *)= -, implica que

2 ' 2

u1u2

u \ - u \ ) \ x 2)

\2u1u2x 1- ( u l - u 2) x 2J \\u\\2 l

om

1

( u \ —u\

2u1u2 \ ( x 1

(ul — u l ) x 1+ 2 u 1u2x 2\

1

a1

o
eos q> sen (p

o
— sen (p eos cp

\
/

at

usuim i 2 _

— [(u f - u\)2x\ + 4u2 u2x f + 4u f u j x i + (u¡ - u2 )x^] =

em

at

ic

Nota.

Si hubiéramos elegido { « , i í 1 } com o la base en IR2, la matriz de S j

w

w

■[(m? + ul)2x + (ul + u2) 2x 2] = x2 + x = | x \ 2 ¡ \ |

w

E je m p lo D. La simetría SL con respecto a una recta L, en IR3, es una aplicación ortogonal. En la base { u u u2. u *3} elegida com o en la figura adjunta se tiene:

.M

/l
SL = 0 i»
- 1

0 0\
0 o - . ,

con respecto a esta base sería
1 0 - 1

°

La matriz de Su con respecto a la base canónica en M2 puede encontrarse a partir de aquí realizando un cambio de base.

Si el lector intenta encontrar más aplicaciones ortogonales en IR2 tendrá serias dificultades. Quizá puede pensar en la simetría con respecto al origen de coordenadas, pero puede convencerse fácilmente que esta simetría es un giro de 180° y, por tanto, ha sido incluida en el ejemplo A. De hecho demostraremos en la próxima sección que las únicas aplicaciones ortogonales de IR2 son los giros y las simetrías con respecto a una recta (o simetrías axiales). (Así se explica el lector las dificultades anteriores.)

Observar que esta simetría es en realidad un giro de 180°, y, por tanto, es un caso particular del ejemplo C. E j e m p l o E. L a imagen tridimensional que produce un espejo es una aplicación ortogonal; se trata simplemente de una simetría con respecto al plano del espejo. Si W es el plano, Sw designa esta simetría, y elegimos una base ortonorm al {tfj, u2, tT3} com o en la figura se tiene

Demostración. Sea {e^, ..., e„j una base ortonorm al tal que {e¡, ..., e¡,}, donde ~e) = A ( e j ) , j = 1, 2, ..., n, es también ortonormal. Para todo n r = Y
¡= 1

n XiCn y = 'Z y / j j= i

del espacio euclídeo se tiene
0 1 0

/1

°\
0

Sfv

0 \0

(A (x ), A ( f ))=

¿ x¡yj{A(eJ, A(eJ))= ¿ x iyj (e"i,e " j) = f j x iyi ij= 1 i,j= 1 ¿=1

- 1 / mientras que n n X e })= X x j i i,j= 1 i= l ■

(x, y ) =

y,

por tanto, A conserva el producto escalar. Si A es una

om

aplicación ortogonal y A denota su adjunta (ver sección 8.5) se tiene

ic

a1

.c

que (x, y) = { A (x ) , A { J ) ) = {x, A ' ° A ( y ) )

em

at
¿Serán todas estas las posible«- 'plicaciones ortogonales de IR3? Recomendamos al lector que trate de encontrar alguua más y le advertimos que la respuesta a la pregunta anterior la encontrará más adelante en la próxim a sección. N o sólo llegaremos a la determinación de las posibles aplicaciones ortogonales de IR3 sino de cualquier espacio euclídeo de dimensión finita. Este trabajo requiere el estudio de los autovalores de aplicaciones ortogonales. Antes de comenzar este estudio daremos algunas propiedades útiles de las aplicaciones ortogonales. Es claro que toda aplicación ortogonal transforma toda base ortonorm al en una base ortonormal; el recíproco también es cierto y está contenido en la proposición siguiente: P r o p o s ic ió n 3___________________ ___________________________________________________ T od a aplicación lineal A que transforma al menos una base ortonorm al en una base ortonorm al es ortogonal.

w

*

*

*

para todo x, y. D el lema 2 de la sección 8.5 se deduce que A ° A = /. Recíprocamente, si A ' ° A = I, A es una aplicación ortogonal. D e aquí se deduce que toda aplicación ortogonal tiene una inversa, a saber: A ~ 1 = A y, por tanto, es no degenerada. La inversa de una aplicación ortogonal es también ortogonal puesto que

w

w

.M

at

A ~ l ° ( A - l y = A - l ° ( A ' ) - l = £ o A ) - 1= I y la com posición o producto de dos aplicaciones ortogonales A y B es también ortogonal puesto que (A ° B)'(A ° B) = B ’ ° ( A ' ° A ) ° B = B' ° / ° B = I Sin embargo, la suma de dos aplicaciones ortogonales no es, en general, una aplicación ortogonal (dar un ejemplo). Sea A A 'A = I o estas dos igual a 1 la matriz de A en una base ortonormal; puesto que A ' ° A = I deducimos que equivalentemente A ' = A ~ 1 T o d a matriz A que satisface una cualquiera de . ecuaciones se llama ortogonal. El determinante de una matriz ortogonal es o a — 1 , ya que

\A\2 = \A \ = \A\\A\ = \AA\ = \ = l. \\A I\

El conjunto de las matrices ortogonales de orden n con elementos reales se designa por 0(n; IR) y, por tanto, 0{n; U) = { A s J { nxn{U) / A 'A = I )

Puesto que A es invertible, d im (,4“ 1 (W^)) = dim W; además, W c: A ~ i (W ), ya que W es invariante respecto de A. D e aquí deducimos que A ~ 1( W ) = W. P o r tanto, A ~ 1( x ) e W y se tiene (x, A ( y ) ) = { A ~ l ( x ) , 30 = 0

En el conjunto 0(n; IR) la multiplicación de matrices es una operación interna, ya que el producto de dos matrices ortogonales es otra matriz ortogonal: basta observar que este resultado ha sido demostrado para aplicaciones ortogonales. Esta operación es asociativa, puesto que lo es la multiplicación de matrices (ver capítulo 1 ); la matriz identidad es ortogonal, ya que /'/ = /•/ = / y la inversa de una matriz ortogonal es también una matriz ortogonal, ya que anteriormente se ha demostrado para aplicacio­ nes ortogonales. P o r poseer estas propiedades, el conjunto 0{n; IR) se dice que es un grupo con respecto a la multiplicación de matrices. Ejemplos de grupos han aparecido implícitamente en los capítulos anteriores. Se invita al lector a localizarlos. * * *

Así pues, ,4(30 e IP 1'

8 .8 .

A P L IC A C IO N E S O R T O G O N A L E S : P A R T E II

En esta sección clasificaremos las aplicaciones ortogonales en un espacio euclídeo E de dimensión 2 ó 3. La clasificación consistirá en encontrar todos los posibles tipos de aplicaciones ortogonales en E, de manera que toda aplicación ortogonal sea de uno de estos tipos. Comenzaremos clasificando las aplicaciones ortogonales en un espacio euclídeo de dimensión 2 y deduciendo de aquí algunos resultados de la geom etría plana. A continuación daremos un teorema general sobre la form a de Jordan real de aplicacio­ nes ortogonales en un espacio euclídeo de dimensión n, del cual deduciremos la clasificación de las aplicaciones ortogonales en un espacio euclídeo de dimensión 3. Sea A una aplicación ortogonal en un espacio euclídeo E de dimensión 2 (en particular IR2), que tiene com o matriz
a ll
a 12

(xx (¿ ), , ) (x
= P o r tanto,

A ( x ) ) = (Xx,

A)=2, xA (x

x) ■

w

w

w

autovector x se tiene

.M

Demostración.

Si

A

es un autovalor real de una aplicación ortogonal A con

at

em

at

ic

Los autovalores reales de una aplicación ortogonal son iguales a 1 o a — 1.

a1

T e o r e m a 4 __________ ________________________________________________________________

.c

om

Procedemos ahora al estudio de los autovalores de aplicaciones ortogonales.

a2i

a22

en una base ortonorm al B = {é\, ~ 2} de E. Puesto que A ‘A = I se tiene que e an a 12 Deducimos de aquí las igualdades a2 + a 21 = l u a\2 + « 2 2 = 1 « 1 1 ^1 2 + ^ 2 1^ 2 2 = 0 Podem os elegir < y i¡/ de manera que las dos primeras igualdades sean ciertas, es decir, p a l l = coscp, a2! = sen<p, a 12 = cos\¡/, a22 = senij/. a 2 i\ / a n a22 ai 2N _ \ a22J
1 0 0 1

A 2

= l y A = ± l.

Observación. La matriz de una aplicación ortogonal puede tener autovalo­ res complejos; por ejemplo, el giro del ejemplo A tiene com o autovalores A = eos (p ± i sen (p. Si dispusiéramos de un «producto escalar» en un espacio vectorial complejo podríamos demostrar que los autovalores complejos de toda matriz ortogonal tienen módulo 1. Esto se hará en el capítulo siguiente. T e o r e m a 5____ ________________________________________________________________________ Si un subespacio vectorial W de un espacio euclídeo E es invariante respecto a una aplicación ortogonal A, W L es también invariante respecto de A.

J c2 \i 1

Demostración.

Si y e W 1 y x e W se tiene (x, A ( f ) ) = ( A ° A ~ l ( x ) , A ( y ) ) = ( A ~ 1( x ) , jf).

Sustituyendo en la tercera se obtiene eos < eos ip + sen (p sen i¡/= eos (\ — (p) = 0 p j/

n 3n n P o r tanto, i¡/ — q = — o \ — ( p = — . Si i¡j — (p = ~ > ¡/

1)

La composición de dos simetrías axiales es una rotación de ángulo el doble del ángulo comprendido entre los ejes de simetría (observar que la composición de dos simetrías tiene determinante 1 ).

/ eos (p A= ‘ sen (p

— sen q > eos (p

y, por tanto, A es la rotación de ángulo (p alrededor del origen de coordenadas. (En particular, si < = 0 se tiene la aplicación identidad y si < = n se tiene la simetría p p respecto del origen de coordenadas.) 3n En el segundo caso, esto es, \ — q>=— , ¡/ 2) La composición de una rotación con respecto al origen y una simetría axial es de nuevo una simetría axial (observar que su determinante es — 1 ).

I eos (p sen < p

sen (p — eos (p

A es una matriz simétrica y, por tanto, corresponde a una aplicación autoadjunta; en la sección 8 . 6 se demostró que A tiene com o matriz

ic

a1

J-{ o

x 2)

.c
3)

om

Ai

o\

k ¿ 2 = \ \ = \A = J \

y, por tanto, y X2 tienen signo opuesto. En consecuencia, en una (posiblemente nueva) base ortonorm al { e í, ~ 2} A tiene com o matriz e

w

w

w

sen cp

— eos (p

= - 1

.M

eos < p

sen < p

at

em

en una (nueva) base ortonormal; por el teorema 4 de la sección anterior, Xl = 1 o — 1 y Á2 = l o — 1. Además,

La composición de dos giros con respecto al origen es otro giro con el mismo centro.

at

Pasamos ahora a clasificar las aplicaciones ortogonales en espacios euclídeos de cualquier dimensión finita.
te o re m a

2-

* - ( '
\0

0

La matriz de una aplicación ortogonal se reduce en una base ortonormal determinada a la forma

->

que representa una simetría con respecto al « e j e » e*/. En resumen, tenemos el siguiente resultado: T e o r e m a 1 ________________________________________ T o d a aplicación ortogonal de IR2 es una rotación de ángulo (p alrededor del origen de coordenadas (el determinante de esta aplicación es 1 ) o bien una simetría axial (con determinante — 1 ). D e este teorema se deducen resultados de la geometría elemental plana que nos serán útiles en el capítulo 1 0 , que estará dedicado al estudio de los m ovim ientos en el plano y en el espacio. Enunciamos alguno de ellos dejando la demostración para el lector: eos <pk, — sen (pk sen cpk, eos cpk
0

Demostración. Procedemos por inducción en la dimensión n del espacio euclídeo. Si n = 1 es claro, puesto que sólo podemos tener A = ± l . Para n = 2 el teorema 2 coincide con el teorema 1 , que ya hemos demostrado. Sea ahora E un espacio euclídeo de dimensión n y A una aplicación ortogonal. Pueden ocurrir dos casos: 1. La aplicación A tiene un valor propio real / = + 1 (esto ocurre necesariamente si n es impar). Si es un autovector unitario correspondiente a este autovalor tomamos W = L ( e 1); com o W 1 es invariante por A (ver sección 8.7) la hipótesis de inducción nos dice que la matriz de A\wi es de la forma del teorema 2. Añadiéndole el vector ~ se eY obtiene una base de E en la cual A tiene la matriz deseada. 2. La aplicación A no tiene valores propios reales. A debe de poseer al menos un autovalor complejo (y su conjugado) y en consecuencia tiene también un subespacio W de dimensión 2 invariante. P o r el teorema 2,

eje e*! (en particular c) es un giro de ángulo 180° alrededor de e^); / ) es un giro de ángulo cp alrededor de ~ seguido de una simetría con respecto al plano determinado ex por {éT2, ~ e3} (es decir, composición de e) y b)); d) es un caso particular de / ) con cp = 180° y corresponde a una simetría con respecto al origen de coordenadas. ¿Había deducido el lector todos los casos posibles? * * *

El lector que ha llegado hasta aquí debe probar los conocimientos adquiridos intentando por su cuenta y riesgo los ejercicios que a continuación realizamos. E j e r c ic i o A. Encontrar en la base canónica de R 2 la matriz de la simetría (ortogonal) con respecto a la recta 2x - y = 0. Solución. La recta está generada por el vector = podríam os aplicar el

eos (p
A\w =

-sen cp eos cp

0

o

A\w =
0 - 1

sen<p

resultado del ejemplo B, sección 8.7, pero preferimos hacerlo de nuevo. En la base ortonorm al

sen (p

eos < p

Podem os ahora estudiar las posibles aplicaciones ortogonales en IR3. D el teorema 2 adecuada han de se desprende que sus matrices en una base ortonormal tener una de las siguientes formas: a) h
1 1 - 1 - 1

b)

c)

\

d)

- 1 - 1

w

w

C om o W 1 es invariante (sección 8.7) podemos aplicarle la hipótesis de inducción para obtener una base de W en la cual A\wi es com o en el teorema 2. Añadiéndole [e u ~ e2} adecuadamente se obtiene el resultado deseado. ■

w

.M

at

em

at

A\w =

ic

eos < p

-sen cp

a1
donde u 1 = (
- 1

.c

om

adecuada. El segundo caso no puede darse, puesto en una base ortonorm al {e, que ello implicaría la existencia de autovalores reales. P o r tanto,

) la matriz de esta simetría es

/ / -I
0

1 0

/ \

/ M Puesto que
1 01 - 10

e)

/

1 0

o eos q > sen cp —sen cp eos (p j
0

f) \

0 0

eos cp sen cp

— sen cp eos (p

\0

Estas formas tienen la siguiente interpretación: a) es la identidad; b) es una simetría con respecto al plano determinado por ~e-¡)\ e) es un giro de ángulo cp alrededor del

la matriz de la simetría en la base canónica (la antigua) es

C om o / 1 J= \ 4
- 1 - 1

J l/ J 5 { 2 /^ /5 = /l/>/5 V2/>/5

- 2 / ^ / 1 l/v/5 A °

0\ft/y/5

-2 /y/sy =
1/

V^/

-2 / V / \/l 5 l/ js

Oy

1/^5

2/V 5\ = l / - 3 1/^5/ 5\ 4

A ° - 1A - 2 / v / 5

3

se trata de un giro de 180° alrededor de L (u j) o, equivalentemente, una simetría respecto a la recta

E j e r c i c i o B.

D em ostrar que la matriz
1 0 0 - 1 0 0

Term inam os esta sección con una observación. D ada una m atriz ortonorm al O e O ( n ; R), del teorema 2 de esta misma sección se deduce que existe una matriz C tal que 0 = CAC~1 donde A es com o en el teorema 2, es decir, una forma de Jordán real de O, y C es la matriz del cambio de base de la base canónica de IR" a una base ortonorm al B = {«*!, u2, ..., n*„} de R". P o r tanto, la aplicación lineal en R" que tiene com o matriz C transforma una base ortonorm al en otra base ortonormal; esto es suficiente para asegurar que C es una matriz ortogonal. D ebido al teorema 4 de la sección 8 . 6 el mismo razonamiento anterior muestra que si S es una matriz simétrica con valores reales, existe una matriz diagonal D, y una matriz ortogonal C tal que S= CDC~i Si C es ortogonal se tiene, además, que C ~ i = C'. Se tiene así el siguiente resultado: P r o p o s ic ió n 3______________________________________________________________________ 1) 2) Dada O e O (n ; R) existen C e O («; R) y A com o en el teorema 2 tal que O = CAO. Dada S e J f nxn( R) y tal que S = S', existen C e O ( n ; R) y D e J í nxn(U ) diago­ nal, tal que S = C D C ' .

! 0 A=
\ 0 1

demuestra que A es ortogonal. Su interpretación geométrica se deduce del estudio de sus autovalores. C om o A es simétrica sus autovalores han de ser reales y, por tanto, iguales a ± 1 (sección 8.7). U n cálculo adecuado muestra que A^ = \, Á2 = - 1 (doble) son sus autovalores. Para = 1, \ /1 x= y z= 0
1

-1 1 0

1 -1

0 0

k e r(A —1) = L (u 1

=

0

-2

/

\0 , 7 2

Para A2= — 1: E JE R C IC IO S 8.7 Y 8 . 8 l x= -y k e r(A + I ) = L u* =
- 1 0 1

\

w

0 0\ 0 1 °\ / 0 1 0 I 1 1 0 =/ 1 0 0 1 0 0 r 0 \ 0 1/ o 0 0 - 1 / \ 0 -1 0

w

w

.M

at

em

at

ic

Solución.

El cálculo

a1

.c

en la base canónica de R 3.

om

es ortogonal; interpretar geométricamente la aplicación A que tiene a A com o matriz

1. Sean t f j ^ l , 1,0), u2 = ( 1,0, 1) y tf3 = (l, 2, 0) los vectores de una base de R 3. Estudiar si A e L (R 3) es o no es ortogonal cuando su matriz en la base {u u u2, ü está *3} dada por :

a)

I
- 1 \ - 2

4
- 1 - 2

3
- 1

6

\

b)

-5
1

1\ O 1/

c)

I 1 1
\ 0

O 2
1

- 1

\ 3
1

8.

Sea

con a2 + / ? 2 = l la matriz de T en la base canónica, de [R2.

-3 /

3

/

a)

D em ostrar que T es la simetría (ortogonal) con respecto a la recta ax + by = 0, donde b2 — a2 a¿ b2 a2 + b¿ ’ 3/5 -4 / 5 -la b a2 + b2 -4/5 -3 /5

2.

Sea T e L (IR 3) una aplicación lineal cuya matriz en la base canónica de R 3 es / O T= I O\

O O - l

\-l

O

0/

b) c)

Encontrar la recta de simetría para T = Encontrar T para la recta y = 0.

Dem ostrar que T es ortogonal. Encontrar una base ortonorm al de IR3 en la que T tenga com o matriz la forma canónica de Jordán (real).

9.

3.

Sea P =

con a2+ P 2 = 0 Ia matriz de P en la base canónica. C

En un espacio vectorial euclídeo E de dimensión 3 se considera la base ortonorm al a) Demostrar que P es la proyección ortogonal sobre la recta ax + by = 0, donde a = b2/(a2 + b2), = — ab/(a2 + b2). 3/(e, ) = ^e'i +ye’ + 2e3. 3 2 b) Si P es laproyección sobre la recta ax + by = 0 y T es la simetría (ortogonal) respectode la perpendicular a ax + by = 0, demostrar que T = I - 2 P . Encontrar la recta de proyección para P = [ ^ \3/10 Encontrar P para la recta y = 0 . Encontrar las ecuaciones de la simetría con respecto al plano 2x + y + z = 0. ) 9/10/

B = { e i , ~ 2, e'i} y f : E \ -*E lineal, definida por e 3 /(i’i) = 2T1—2T2 + T3, 3/(e2 = 0 + ^ 2 ~ 26*3, ) í^’i

om a1 at ic em w w w .M at .c

H allar a, P y y de manera qu e/ sea una aplicación ortogonal y encontrar la matriz d e / en la base B. 4. Sea T e L ( E ) una involución, es decir, T 2 = I. Dem ostrar que T es una simetría

c) d)

ortogonal si y sólo si T = T . 5. Sea V un espacio vectorial real y A una aplicación ortogonal. Probar que si A es una raíz del polinom io característico de A, entonces /[ = 1. (Dem ostrar este resultado sin utilizar la complexificación de V, es decir, utilizando únicamente m étodos reales: si A = ix + ip, existen u, ~ v e V tal que A u = a u —p v ’ y A ~v=pu + a £ )
6.

10.

11. Sean (£, ( , )) y (F, < , » dos espacios euclídeos; una aplicación lineal T: E h ^ F se dice que es una isometría si T satisface:
( T ( u ) , T ( v ) ) = (u, v ) para todo u, v e E . decir, razonadamente, cuáles de las siguientes aplicaciones son isometrías: a)
b)

Sea E un espacio euclídeo y T: E i-> E una aplicación que conserva el producto

escalar, es decir, (T (x ), T (y )) = (x, y ) para to d o x , y eE. D e m o s tra r que T es lin ea l. [ Su ge ren c ia : ca lcu la r

T: IR2 1— IR3, T(x, y) = (x, 0, y) ► T: P ^ M h - y P ^ l x ] , T(p (x)) = xp(x)

I

x 0

0 0\
y
0

||T ( x , y ) — T ( x ) — T(y)\\2 y \ \ T(ax)-a T(x )\ \2.)
1. a) b) c) Sea E un espacio euclídeo y T : £ n £ una aplicación. Dem ostrar que las condiciones T es una aplicación ortogonal. ( T ( u ), T ( v ) ) = ( u , V ) para todo u ,~ v e E . ||T(íT)— r(Tf)|| = |m—IT | para todo u , T í e E y T (0 ) = 0. | |

c)

T '.U i v -* J íix3 ( U ) , T ( x , y , z ) =

0
zI

\ 0

siguientes son equivalentes:

Nota. Los productos escalares de los espacios anteriores son los ya utilizados varias veces en los problemas anteriores.

(Notas: condiciones b) y c) no suponen que T sea lineal. Hacer la demostración siguiendo el plan c) => b) => a) => c). L a may or dificultad está en probar que Tes lineal en el paso b) => a); para ello hemos propuesto el problema 6 .)

8.9.

E S T R U C T U R A D E L A S A P L IC A C IO N E S L IN E A L E S N O S IN G U L A R E S

con los k¡ ^ 0 (ver el lema anterior). Sea S la aplicación autoadjunta que tiene como matriz
0

En esta sección demostraremos que toda aplicación lineal no singular, es decir, bíyectiva, de un espacio euclídeo E, de dimensión finita, en sí mismo es la composición de una aplicación autoadjunta y una ortonorm al de E. P o r tanto, el estudio de las aplicaciones lineales no singulares en un espacio euclídeo queda reducido al estudio realizado en las secciones anteriores.

M (S ) =

\
b á se*orto.o 'ím a í’ ur)” r qU' * “

0

aUtoadj" nl¡> P > « °

a . matriz es simé, r¡ca en la

PueSto „ue W W
T e o r e m a 1 ______________ _______ __________________________________________________ T o d a aplicación lineal no singular A en un espacio euclídeo E de dimensión finita es de la forma .1 = 0 S

. « (Í| tenemos que SI = S ,S = 8: a d e m .s_
\M(S)¡2 = \M(B)\ = \M(A')\ ■\M(A)Í = \M(A)¡2

P o r tanto, )M (S M y 5 posee una inversa ara conclu«- la demostración del teorema tomamos 0 = A
5

D IV E R S ID A D FA C U LTA '.} nr. w r w i m * DEPART ^ NT5NTO Í)E DOCUMENTACION Y ----- ^-^TTTTiF.r) . UW IGÍ-5AT

'

donde S es una aplicación autoadjunta y O es ortogonal. con lo cual tenemos la igualdad A = 0 ° S . Solamente falta probar que 0 es ortogonal: 0 ' o 0 = ( í4 « s - 1 ) ' » ( ^ ° r 1 ) = ( S ' = (S _ 1 ) ° S 2 0 s ~ l =1

Para demostrar este teorema necesitamos el siguiente lema:

om

at

ic

L e m a 2 - _____ _____________________________________________________________________ Sea A una aplicación lineal en un espacio euclídeo E de dimensión finita; la aplicación B = A ' ° A es autoadjunta y los autovalores de B son no negativos.

a1

.c

> ( A ' ° A ) ° S - 1= ( S - 1y ° B ° S - 1=

Demostración.

L a cadena de igualdades B ’ = ( A 1° A )' = A ' 0 ( A J = A' ° A = B

Este teorema, junto con el teorema 2 de la sección 8 . 8 (teorema de clasificación de las aplicaciones ortogonales) y el teorema 4 de la sección 8 . 6 (diagonalización de aplicaciones autoadjuntas) nos permite interpretar geométricamente las aplicaciones lineales no singulares en un espacio euclídeo de dimensión finita: toda aplicación de este tipo se reduce a varias rotaciones alrededor de ciertos ejes, a varias simetrías alrededor de hiperplanos y a varias dilataciones (positivas) a lo largo de ejes ortogona­ les dos a dos. El lector no se sentirá extrañado si decimos que el teorema 1 tiene una inter­ pretación para matrices reales cuadradas no singulares, es decir, de determinante no nulo. Tenemos el siguiente resultado: T e o r e m a 3 _________________ ______________________________________________________

muestra que B es autoadjunta. Sea k un auto valor de B con autovector u. D ebido al teorema 4 de la sección 8 .6 , l e IR. Además, O (A (u ), A ( u ) ) ~ ( u , A ' ° A ( u ) ) = (u, B (u )) = (u, k u ) = k\\u\\2

w

w

w

.M

at

em

D e aquí deducimos que k ^ O, ya que | t | > 0 . Esto termina la demostración del lema |T |

Sea A e J í nx„(R) con \A\=^0~, existen dos matrices O e O (n ; que A = O S.

y S simétrica, tal

2.

Demostración del teorema 1. P o r el teorema 4 de la sección 8 . 6 existe una base ortonorm al U de E en la cual la matriz de la aplicación autoadjunta B = Á ° A es de la forma /¿i M (B ) =
\ 0 0

Demostración. Considerar A como una aplicación lineal en el espacio euclídeo IR” con el producto escalar usual. P o r el teorema 1, < = 0 °S 4

\

k j

con O ortogonal y S autoadjunta. Si denotamos por A, O y S las matrices de las aplicaciones A, 0 y S, respectivamente, en la base canónica de IR", se tiene el resultado deseado. ■

Se invita al lector a demostrar el teorema 3 directamente, siguiendo los pasos de la demostración del teorema 1 ; de esta form a obtendrá un m étodo para calcular las matrices 0 y S del teorem a 3. Algunos ejercicios relativos a este teorema se encuentran al final de esta sección.

E J E R C IC IO S 8.9 1. D ada A e J í nxn(U ) con \A\^0, demostrar directamente que existen dos matrices,

B IO G R A F IA Euclides vivió alrededor del año 300 antes de Cristo, pero no se conocen ni la fecha ni el lugar exactos de su nacimiento. D e su vida sólo se conoce que enseñó y fundó una escuela en Alejandría en la época de Ptolom eo I que reinó desde el año 323 hasta el año 285 antes de Cristo, aproximadamente. Euclides es el matemático más prominente de la antigüedad, conocido por su libro Los elementos. Este libro ejerció una influencia enorme en el pensamiento matemático hasta el siglo X IX , en el que nuevas formas de geom etría no euclideana fueron introducidas. Parte de Los elementos es una recopilación de trabajos de otros matemá­ ticos puestos por primera vez juntos mediante un razonamiento lógico.

O e 0(n; R ) y S simétrica, tal que A = O S . 2. Para las siguientes matrices, encontrar la descomposición A = O S del problema 1.

/ -1
a) A = ( ^ ) b) A= \ 0
1

0
1
0

- i
0
0

[S »/ .:«)

3.

D ada una matriz B e J í n x n (R), decimos que C e J í nx „(R) es una raíz cuadrada de B

siempre existe una raíz cuadrada de B. b) Encontrar una raíz cuadrada de

w

w

w

.M

at

em

at

ic

si C 2 = B. a) Dem ostrar que si B es autoadjunta y todos sus autovalores son no negativos,

a1

.c

om

409

CAPITULO 9

ESPACIOS HERMITICOS

9.1. 9.2.

P r o d u c to h erm ític o A p lic a c io n e s en tre espacios h erm íticos

om a1 .c w w w .M at em at ic

9.1.

P R O D U C T O H E R M IT IC O

En el capítulo anterior hemos introducido la noción de producto escalar en un espacio vectorial real, obteniendo así los espacios euclídeos, en los cuales se pueden definir las nociones de longitud de un vector y de perpendicularidad de dos vectores. En este capítulo dotaremos a los espacios vectoriales complejos de una estructura adecuada para poder definir las nociones de longitud de un vector y de perpendiculari­ dad de dos vectores en el espacio vectorial complejo. El nuevo concepto que introduci­ remos en un espacio vectorial complejo recibirá el nombre de producto hermítico y los nuevos espacios así obtenidos se llamarán espacios hermíticos. Advertim os al lector que muchos de los resultados en espacios hermíticos son similares a los resultados en espacios euclídeos y que las demostraciones de aquellos son similares a las de éstos. D ebid o a esto, muchas de las demostraciones serán omitidas en este capítulo.
D E F IN IC IÓ N 1 (P rod u cto h e rm ítico )_________________________________________________

Sea H un espacio vectorial complejo. Una aplicación ( , ) : / / x 'H i ► se dice —C que es un producto hermítico si satisface las siguientes propiedades: a) b) c) d) (z, w) = (w, T ) para todo % w e H . (X w+~v) = (z, w) + (X T?) para todo X w , V e H . (2.X w) = 1(7, vv) para todo 7, vtf e /í y k e €. (X 7 ) > 0 para todo 7 / 0 y (X 7 ) = 0 o 7 = Ü.

Nota. Para tod o número com plejo k = a + ib, I - = a — ib recibe el nom bre de conjugado de k. El estudio de los números complejos se realizó en el capítulo 4. Para nuestros más inmediatos propósitos en este capítulo recordaremos que a se denomina la parte real de k y se designa por re (A), y b se denomina la parte imaginaria de k, y se designa por im(A). Además, k l = ( a + ib)(a — ib) = a2 + b2 = \ \ k2 donde \ \ se utiliza para representar el m ódulo de X. k

los polinom ios del conjunto anterior de grado no superior a n son espacios hermíticos con el mismo producto hermítico que el definido en Cc ([a , fe]). L a com probación de las afirmaciones anteriores se deja com o ejercicio.

Supongamos que el espacio hermítico H es de dimensión finita n, es decir, el espacio vectorial complejo H tiene dimensión n, y sea £ = {u i, u2, ..., u*„} una base de H. Si X w e H podemos escribir

;r=

i= 1

Z

z i“ i.

VV= Y

J= 1

w jUj

D e las propiedades b) y a) del producto hermítico se deduce b') (z +w, ~v) = (X IT) + (w, V ) para todo 7, w, Tf e ü

con z¡, w, e C para todo /= 1,..., n. Utilizando (1) se tiene el siguiente resultado:

D e las propiedades c) y a) del producto hermítico se deduce:
(z , w ) = í ¿
Zfo 1

¿
j= 1

wjUj ) = /

¿

¿

z ; vv,.(M;, Uj )

c')

(X kw) =

T ) = k(w, T ) = A(vv, T ) = I(z , w) La matriz

( 2)

¡ =l j = l

para todo % w e H y / e C . Observar que esta propiedad es diferente de la correspon­

om

diente para el producto escalar.

I

(“ «l) l.
( « 1» “i)

( U 2,

Mi)

.c

(K , « l ) ^ (%, u2)

a1

em

at

propiedades b) y c) junto con b') y c') se deduce:
n m
k=l

ic

Sean

z*2, •• %> ^ i, w 2, ..., w „e H y a 1, a 2, ..., a„, j3l5 J •• /¡„eC ; combinando las •> ?2, •>

P = P*

( « 2 . « 2)

\ ( U U U„)

( U 2, U „ )

(U „,U „)J

j= 1

k= 1

/

j= í

w

w

* D e f i n i c ió n 2 (Espacio hermítico)

*

*

w

.M

I

E

)= I I

* j M zp

wk )

() !

at

recibe el nombre de matriz del producto hermítico con respecto a la base B de H. Con esta notación la igualdad ( 2 ) puede escribirse de la forma / (z, W) = (z 1, ..., Z„)PB \

------------------------------------------------------------

U n espacio vectorial complejo H que posee un producto hermítico recibe el nombre de espacio hermítico. U n ejemplo de espacio hermítico es € " con el producto hermítico dado por

\

/

(X w = z1w ) 1+z2w + ---+z„w„ 2
donde z = (zu z2, ..., z„) y w = (wl , w2, .., w„). O tro ejemplo de espacio hermítico es el conjunto C c ([a , í>]) de las funciones continuas con valores complejos definidas en el intervalo [a, fe] c IR, con el producto hermítico dado por
"6

D ebid o a la propiedad a) del producto hermítico (u¡, u¡) = (ü }, tf¡) para tod o i # j, la m atriz P B no es, en general, simétrica, com o ocurría en el producto escalar, sino que es necesario hallar el conjugado de cada uno de los elementos de la matriz. D ada una matriz A = (aij)i z j con a¡j e C, se denomina conjugada de A a la matriz Z = ( a ^ ) ‘ = i ’— ;^, que se obtiene hallando el conjugado de cada uno de los elementos de A. U na matriz cuadrada A = ( a íj), Z\\;;;’l se dice simétrica conjugada si j ¡ Á ‘ = A, donde Á ' representa la matriz traspuesta de A. Si A es simétrica-conjugada, a¡¡ = a¡j para tod o ¿= 1, ..., n; puesto que un número com plejo es igual a su conjugado si y sólo si este número es real, deducimos que los elem entos de la diagonal principal de una m atriz simétrica-conjugada son números

_
f(x )g {x )d x

i f g)~-

para to d a / g e C c ([a, fe]). En particular, los conjuntos P c ([a, fe]) de todos los polino­ mios con coeficientes complejos definidos en el intervalo [a, fe] y fe]) de todos

reales. Además, aij = aj ¡, i # j, y, por tanto, los elementos simétricos con respecto a la diagonal principal son conjugados entre sí. Así pues,

los números A(w, z ) y X(z, w) son conjugados, ya que X(z, w) = A(vv, Y ) = A(w, z ) y, por tanto, su suma coincide con el doble de la parte real de /(w, Y); tenemos, pues, 0 ^ ||zl2 + 2real(A(w , Y ) ) + | w | |A| 2 | |2 Puesto que la parte real de todo número complejo nunca supera a su módulo tenemos la desigualdad Org ||vv||W + 2 m|(vv, z)| + | | z ||2 Esta ecuación cuadrática en |1|g R no puede tener raíces reales distintas (el razonamiento es el mismo que en el caso euclídeo) y, por tanto, su discriminante ha de ser negativo o nulo: |(vv, z)| 2 -||z||2 ||w||2 ^ 0 de donde deducimos el resultado deseado. A partir de la desigualdad de Schwarz triangulares: pueden demostrarse las desigualdades

I a12 a
11

“ 12

«m \ a2„

a22

A= an I n

\

E je m p lo A.

L a m atriz -4 = ^

1

j ' j es simétrica-conjugada.

Nota. El lector habrá quedado convencido de que la m atriz P B del produc­ to herm ítico con respecto a una base B es siempre una m atriz simétricaconjugada.

En un espacio hermítico H la longitud o norma de un vector z e H mediante II?\\=s/(% T )

se define

om

ic

a1

.c

| |z+ vv| | á

||z II + ||vv||,

|||TII -

lla lli ^

||z - v v l l

at

donde la raíz cuadrada se tom a siempre positiva. Observar que la definición tiene sentido ya que (z ,? )3 :0 debido a la propiedad d) del producto hermítico. Para todo A e C se tiene la igualdad:

em

A pesar de que no puede definirse el concepto de ángulo en un espacio hermítico (¿por qué?), podemos dar la noción de ortogonalidad: Y e H es ortogonal a w e H si (X vv) = 0 Podem os definir, por tanto, el complemento ortogonal W 1, de un subespacio vectorial W de H: W 1 = { Y e H / (Y, vv) = 0 para todo vve W } Enun espacio herm ítico el teorema de Pitágoras es también cierto: ortogonal a vv, si Y es

Y e H . U n vector de norma 1 se dice unitario. T o d o vector no nulo Y e H puede ser normalizado, es decir, multiplicado por un número complejo A de manera que AY sea unitario: basta tomar
1

w

U T \ l=y /(A T, A z ) = y A l ( Y , Y ) = J \ á \ j 2(% ? ) = | | | | A|z |

w

w

.M

at

| v + z||2 =||vv| | 2 + ||z||2 |v En un espacio hermítico se cumple también la desigualdad de Schwarz: En los espacios unitarios puede realizarse el proceso de ortogonalización de un conjunto de vectores linealmente independientes; el proceso es exactamente igual que en los espacios euclídeos, por lo cual se omite aquí. En particular, tod o espacio hermítico de dimensión finita posee una base ortonormal, es decir, una base formada por vectores unitarios mutuamente ortogonales.

|(w, z )| ^ ||vv|| l i n i ,

w ,Y e H

L a demostración es similar a la del caso euclideo, excepto que debe tenerse cuidado en las operaciones con números complejos (para el caso euclideo ver la sección 8 . 2 del capítulo 8 ). L a demostración procede de la siguiente manera: si A e C , 0 ^ ( Y + Aw, Y + Aw) = |Y ||2 + 1 (7 , w) + A(w, Y ) + 1 | 1w ||2 | 12 |

E je m p lo B. Queremos aplicar el proceso de ortogonalización a los vectores « i = (¿, 0, 0), íT2 = (0, i, 1) y ¡r 3 = ( l , 0, 1) del espacio herm ítico C 3 con el producto

hermítico usual. Tom am os ~éi = Ui y la condición (<?2, e\) = 0 :
0

= íT2 -f- Xel con / s C ; calculamos k im poniendo

P o r tanto,

= (e 2, T J = (u2, e j + A(ei, T 1 = 0 + A - 1 . )

i

a‘A

% J = (A(?i),

=

A * ( e ij) =

P o r tanto, ~e2 = u2. Finalmente, tomamos ~ e3~=u3 + oíeí + f } e 2 , a, f i e C H em os llegado a la conclusión de que la matriz de A * en la base ortonorm al B es la conjugada-traspuesta de A , es decir, A'. Esta m atriz se suele denominar también adjunta de A y se denota con el símbolo A*. Las propiedades de la aplicación adjunta A * son las mismas que las dadas en la sección 8.5 para la aplicación adjunta en espacios euclídeos. * * *

y calculamos a y / ) con las condiciones (e t , F3) = 0 y ( e 2, e ^ ^ O .
0 0

= ( e u T 3) = ( e u u3) + a ^ , T t) = i + á • 1 = (e 2, e3) = (e 2, u 3) + /?(e2, ^ 2 ) = 1 + + 1]

P o r tanto, a = - / o, equivalentemente, a = i, y /?= - 1/2 o, equivalentemente, /?= -1/2. El tercer vector es F 3 = « 3 + ¡T 1 - ^ ? 2 = ( 1 , 0 , l ) + (
1 , 0, 0)

—(0 , i, 1 ) = ^ 0 ,

Sea A e L ( H ); la aplicación A se dice autoadjunta si A * —A. P o r tanto, si A es autoadjunta en H, la m atriz de A en una base ortonorm al ha de satisfacer A = Á‘

a1

.c

om

es decir, A debe ser una matriz simétrica-conjugada; a estas matrices se les da también el nombre de hermíticas.
* * *

at .M at em

9.2.

A P L IC A C IO N E S E N T R E E S P A C IO S H E R M ÍT IC O S

ic

En esta sección estudiaremos algunos tipos particulares de aplicaciones de un espacio hermítico en sí mismo, así com o la diagonalización (com pleja) de algunos de estos tipos. D a d o un espacio hermítico H y una aplicación A e L (H ), se denomina adjunta de A y la llamaremos A * a toda aplicación lineal que satisface ( A ( z ) , w ) = (z, A*(w )) , % w eH .

Las aplicaciones de un espacio hermítico H en sí mismo que conservan el producto hermítico reciben el nombre de unitarias. P o r tanto, A e L ( H ) es unitaria si y sólo si (A (z ), A(w)) = (% w) Si A es unitaria se ha de tener (X A * 0 A(w)) = (X w) para todo X , w e H , y por tanto, A * ° A = I. Si A y A * representan las matrices de A y A * en una base ortonorm al de H, la igualdad anterior se escribe de la forma A *-A = l o, equivalentemente, A _1= A *. Las matrices que satisfacen una cualquiera de las dos desigualdades anteriores reciben el nombre de matrices unitarias. El conjunto de todas las matrices unitarias de orden n se denota por U(n) y, por tanto, U ( n ) = { A e J ? nxn(C ) / Á ' - A = l ) . , % w eH .

Si el espacio hermítico H es de dimensión finita, lo cual siempre se supondrá cierto de aquí en adelante, la existencia y unicidad de la aplicación adjunta A * de A se demuestran com o en el caso de espacios euclídeos. Es conveniente dem ostrar la existencia para encontrar la relación que existe entre las matrices de A y A * en una base ortonorm al de H. Sea A = (a¡j) la matriz de A e L ( H ) en una base ortonorm al B = { T U <f2> tanto, n M e j ) = Y ai f r i= 1 Si C = (cu) es la m atriz de A * e L ( H ) se tiene que ^ * (e ,)= ¿ c 0 ¡ . j= i por

w

w

w

Puesto que la composición de aplicaciones unitarias es otra aplicación unitaria y la inversa de una aplicación unitaria siempre existe y es una aplicación unitaria, el conjunto U{n) es un grupo con respecto a la multiplicación de matrices. Se invita al lector a com probar con detalle este resultado. Los autovalores de una aplicación unitaria deben ser números complejos de modulo 1 y los autovalores de una aplicación autoadjunta deben ser reales. En efecto, si A e L ( H ) es una aplicación unitaria y 1 es un auto valor de A con auto vector ~zeH, se tiene (X ~z) = {A{X), A ( z ) ) = (,IX, X z) = XX(X z ) = | | | z' | | 2 A2 | de donde resulta | |= 1. A Si A e L (H ) es una aplicación autoadjunta y A un autovalor de A con autovector ~zeH, se tiene A||T||2 = A (z; 7 ) = (XX, X ) = (A (z ), T ) = (X A ( z ) ) = (X AF ) = X||z*||2 de donde resulta que A = X y, por tanto, A e IR . * * *

Para reducir una aplicación normal a su forma más sencilla es necesario tener conocimiento de sus posibles autovalores y de sus subespacios invariantes. P r o p o s ic ió n l _ ________________________ Sea A e L ( H ) una aplicación normal. T o d o autovector T e H autovalor es un autovector de A*, con autovalor A.

AC e

de A, con

Demostración. El subespacio P(A) de todos los autovectores de A que tienen el mismo autovalor A es invariante por A *, ya que si T eF (A ), A - A * (? ) = A * 0 A ( z ) = A * (A z ) = XA *(z) y, por tanto, A *(z )e P {X ). Además, si 7, w eP(X), (A *(X ), w) = (% A(w)) = (% Avv) = X (z, w) Tom ando en particular w = A *(z) — XXeP(X ) se tiene que (A * ( X ) — X% A *(z) — XT) = 0

em

A continuación nos dedicaremos a demostrar que tanto las aplicaciones autoadjuntas com o las aplicaciones unitarias en espacios hermíticos pueden diagonalizarse. (Com parar este resultado con los resultados análogos para aplicaciones autoadjuntas y aplicaciones ortogonales en espacios euclídeos obtenidos en el capítulo anterior.) Nuestra form a de proceder es dem ostrar que una clase de aplicaciones, que definiremos a continuación, y que engloba a las anteriores, es diagonalizable. U na aplicación lineal A e L { H ) se dice normal si conmuta con su adjunta, es

om

ic

a1

.c

de donde se deduce A * ( z ) = X?. P r o p o s ic ió n 2_____________________________________________________________________ Sea A e L ( H ) una aplicación normal y sea P(A) el subespacio vectorial de todos los autovectores de A con el mismo autovalor A e C. Entonces, g(A ) = P(A)-L es invariante por A.

w

w

A* ° A = A ° A* E j e m p l o A. 1. Si A es autoadjunta, A es normal, ya que A * ° A = A ° A * = A ° A. 2. Si A es unitaria, A es normal, ya que A * ° A = A ~ 1 ° A = I y A ° A * = A ° A ~ 1= l. 3. L a aplicación cuya matriz es

w

.M

decir,

at

at

Demostración. además,

Si w eQ (X ) y T e P { X ) se tiene que A * ( z ) = Xz (proposición 1) y,

(<4(w),z*) = (w, A * (T )) = (vv, X ?) = A(w, T ) = 0 de donde se deduce que A(yv)eQ(X). ■

N =

,

X jsC

\ }
/ 'A'i2 0 \

El siguiente teorema nos da la diagonalización de toda aplicación normal en un espacio hermítico. T e o r e m a 3 ( Teorema e s p e c t r a l ) ____________________________________________________ La matriz de una aplicación normal A en un espacio hermítico puede ser reducida en una base ortonorm al determinada a una matriz diagonal.

en una base ortonormal, es también normal ya que

N *-N = \ 0

IA I2

= N ■N * W 2 /

C o r o l a r io

___________ _______________________________________________________

Las matrices simétricas conjugadas y las unitarias son diagonalizables.

Demostración. Realizamos la demostración por inducción en la dimensión n del subespacio hermítico H. Si n = 1 el teorema es cierto. Supongamos que n > 1 y sea P ^ ) el subespacio de autovectores de A con autovalor Ax; si P (X ¡) = H, cualquier base ortonorm al de H produce una matriz diagonal con en su diagonal principal. Si P (A i) ^ H, Q(Ai) = W i ) x es de dimensión mayor o igual que 1 y menor que n. P o r la hipótesis de inducción,

Para futuras referencias enunciamos este resultado a continuación; observar que este resultado es el análogo para espacios hermíticos de la proposición 3 de la sección

P r o p o s ic ió n 4_ 1) D ada A e U ( n ) , existe C e U ( n ) tal que e^ 0 2) \ _ C' ev" l
0

í i J
>11 PU i ) ' 0

l

/

0 \

Al

o

A = C¡

1 /

Puesto que H = P{Al ) ® Q { Á l ), A puede reducirse a una matriz diagonal (yuxtaposición de las dos anteriores) en una base ortonormal.

Dada S e ^ £ nxn(C) y tal que S = S\ existe C e U ( n ) tal que

En el caso particular de que A sea unitaria, sus autovalores han de ser de m ódulo 1, es decir, k = eu y, por tanto, puede reducirse a p
0 0

5 = c (o--■ l Y

om em at ic a1 .c

Si A es autoadjunta, sus autovalores son reales, lo cual se ha demostrado anteriormen­ te, y, por tanto, puede reducirse a Áje l

En espacios hermíticos existe un resultado análogo al enunciado en el teorema 1 de la sección 8.9, capítulo 8 , en espacios euclídeos. Se tiene entonces que toda aplicación lineal no singular A en un espacio hermítico puede escribirse de la forma A = U °S donde S es autoadjunta y U es unitaria. La demostración de este resultado es análoga a la dada para el teorema 1 de la sección 8 .9 , capítulo 8 . En el caso de espacios hermíticos este resultado tiene una interpretación elegante; si A estuviera definida en el espacio hermítico C, la m atriz de A sería un número com plejo a + bi no nulo, la matriz de S sería un número real r y la matriz de U sería un número complejo de m ódulo 1 , e‘> ; por tanto,

,

0

'A

0

A= C
0

C~

donde C es la matriz del cambio de base de la base canónica a B. P o r tanto, C transforma una base ortonorm al en otra base ortonorm al y esto es suficiente para asegurar que C e U(n). P o r tanto,

w

manera que

w

Sea A e U ( n ); por el teorema espectral existe una base ortonorm al B de C" de

w

.M

at

a + bi = eivr que es la form a polar de un número complejo. Entonces, la fórmula

(e ^ A = C[

0

.

C' A = U °S

U n razonamiento similar produce

puede interpretarse com o la «form a p o la r» de una aplicación no singular y de hecho recibe el nombre de descomposición polar de A. Evidentemente, también existe una descomposición polar de toda matriz A e .M nx „(C) no singular, lo cual puede deducirse de la descomposición polar para aplicaciones. Puesto que no lo hicimos en el capítulo anterior, daremos aquí una demostración directa de este hecho.

S= C

con C e l/ (n ), si S es simétrica-conjugada o hermítica.

P r o p o s ic ió n

5 ------------ ------------------------------------------------------------------------------------------------

Sea A e J f nxn(C ) con M |#0; existen dos matrices U e U ( n ) y S simétricaconjugada, tal que A = U S. Demostración. L a aplicación B = A * A es simétrico-conjugada, ya que B * = B' =

Finalmente, queremos resaltar que todo espacio euclídeo puede convertirse en un espacio hermítico. Y a sabemos (sección 7.8) que todo espacio vectorial real E puede convertirse en un espacio vectorial complejo E c ; podemos tomar H = E C y definir

(u + iv, T + (w)c = [(u, T) +(v, vv)] + 1[ —(%?) +(u, w)]

(A y= ( A 1 )' —A ‘A = B 'A A

donde ( , ) denota el producto escalar en E, y u + i v , z' + i w e H . El lector puede com probar que ( , )c es un producto hermítico en H (ver el ejercicio 6 al final de esta sección). Las aplicaciones autoadjuntas en E son también autoadjuntas en H y las aplicacio­ nes ortogonales en E son unitarias en H; consecuentemente, los autovalores de aplicaciones ortogonales son números complejos de m ódulo 1 (comparar este resultado con el teorema 4 de la sección 8.7, capítulo 8 ).

P o r la proposición 4 tenemos que existe C e U(n) tal que

B= C
\ 0

C*

,

kj B [

i,¡

E JE R C IC IO S (C A P I T U L O 9) 1. En el espacio hermítico C 3 con el producto hermítico usual encontrar el com ple­ mento ortogonal del subespacio vectorial generado por el vector T = (i, 0 , 1 ).

D e la definición de B se deduce que los k¡ > 0. Tom ar

om
\ \ = |X|2 / 0 . Tom ando U B

s

at

y observar que S es invertible, ya que ¡S|2 =

x •• x k„ = •

ic

a1

.c

= c ( ' o ‘ -\ a : ) c '

2. Sea C 2 con su producto hermítico usual. Estudiar si son unitarias las siguientes matrices: / 1 + s/2
3 + 2i 5

em

= A S ~ 1 se tiene que A = U S y S es simétrica conjugada, ya que

i

at

a) 2 -i
1

—i + i b)
1

2
c) -k /2

1

“i- / -i

2

+ ¿

.M

w

w

/

- 1

- 1

w

Unicamente falta demostrar que U es unitaria: U * U = U tU = { A - S ~ 1)t( A - S ~ 1) = ( S " 1 ) -i> A‘ A S_1 =

3. Encontrar las matrices de Jordán de las dos últimas matrices del ejercicio 2, así com o matrices de transición, siendo estas últimas unitarias si la matriz de partida es unitaria. /0

0
0

\
es una matriz normal y encontrar una base

4.
B-

Demostrar que A =

i

_ V

c

(

^

.

w

) c

-

_ V

c

( ^

' s f i J -

\0 0 - 1 / ortonorm al en C 3 en la que A tenga una forma diagonal. , n fl 5. Sea "4 = 1 + i j
1

\ j . l e - ^ x 2 OC). Encontrar una descomposición polar de A,

es

decir, una matriz unitaria U y una matriz simétrica conjugada, tal que A = US. \ J Y J Y v \ K )\ ^ [k j
6.

Sea E un espacio euclídeo; en H = E c = {íi + w f u , ~ v e E } definir

C = C IC = l

[u + iv, ~ + iw)c = [(«; T) +(v, w)] + 1[— (v, 7) + (u, vv)] z
donde ( , ) describe el produ cto escalar en E y u -i- iv, z + iw e H . D em ostrar que ( , ) c es un produ cto herm ítico en H.

en donde se ha utilizado repetidamente el hecho de que C ~ 1 = C1 .

CAPITULO 10

B IO G R A F IA Charles Herm ite nació el 24 de diciembre de 1822 en Dieuze (Francia) y murió el 14 de enero de 1901 en París. A pesar de que a los 20 años ya había demostrado su capacidad matemática, sus dificultades con los exámenes le llevaron a dedicar cinco de los años más productivos de su vida a preparar los exámenes para la obtención de la licenciatura, que consiguió en 1848. Enseñó en la Escuela Politécnica de París y después en el C olegio de Francia, en la misma ciudad. N o fue hasta 1869 que fue nombrado profesor en la Escuela N orm al de París, para pasar un año más tarde a ser profesor de Algebra en la Sorbonne. En 1873 Hermite publicó la primera demostración de que el número e es trascen­ dente, es decir, no es raíz de ninguna ecuación algebraica con coeficientes racionales. Contribuyó decisivamente al desarrollo de la teoría de las aplicaciones y de las formas cuadráticas, así com o a la solución de la ecuación general de quinto grado utilizando

MOVIMIENTOS EN UN ESPACIO AFIN EUCLIDEO. MOVIMIENTOS EN Y IK P

w

.M

at

em

at

ic

a1

las funciones elípticas.

.c

10.1. 10.2. 10.3. 10.4. 10.5.

Transformaciones afines. Ejemplos M ovimientos en el plano Estudio analítico de los movimientos en IR2 M ovimientos en el espacio M ovimientos en IR3. Ejemplos

om w w

En este capítulo vam os a estudiar algunos tipos de aplicaciones entre espacios afines cuyo espacio vectorial subyacente es un espacio euclídeo (la definición de espacio afín ha sido dada en la sección 5.5 del capítulo 5). Para nuestros propósitos podemos siempre pensar que el espacio afín es IR" y que está form ado por puntos, los cuales serán designados por letras mayúsculas com o P, Q, R , ... Dados dos puntos P y Q de IR" definimos la distancia de P a Q mediante

d(P,Q)=\\P&\\ =

rZ iX i-y d

424

425

donde ( x u x 2, ..., x n e (y u y2, ) >'„) son las coordenadas de P y Q, respectiva­ mente, con respecto a un sistema de referencia fijado en IR". En este capitulo vamos a estudiar detenidamente aquellos tipos de aplicaciones en IR2 y IR3 que conservan la distancia (las definiciones precisas se darán en la sección primera de este capítulo). El lector habrá podido adivinar que debe existir cierta relación entre las aplicaciones en IR2 y IR3 que conservan las distancias y aquellas aplicaciones que conservan el producto escalar usual en los mismos espacios considerados com o espacios euclídeos. Tales aplicaciones han sido estudiadas en el capítulo 8 , y son las aplicaciones ortogonales. D ebido a esto serán utilizados en este capítulo algunos resultados del capítulo 8 .

E je m p lo A. En el espacio afín IR2 definimos la homotecia de centro A y razón X com o la aplicación H = H Á x tal que si B e IR2, la imagen B' de B mediante H satisface Á É ’ = XA É

La aplicación lineal Jff asociada a H es J ^ {v ) = Xv, ~ e IR2. En efecto, si P, g e IR2, v

H(P)H(Q) = Y q = Y a + AQ' = - Á P'
10.1. T R A N S F O R M A C IO N E S A F IN E S . E J E M P L O S

+ = - XAP + XA$ = Á&

= X ( - A ? + Á § ) = XP$ = j r ( P & )

única com o

w

O X = x 1e 1+ x 2 e*2 H ------1 x„e„ L o s elementos ( x l5 x 2, •••, x„) reciben el nombre de coordenadas del punto X con respecto al sistema de referencia @ = {0 ; e'1, ~ 2, ..., F„}. Ejemplos de cambios de sistema e de referencia se han dado en la sección 5.5 del capítulo 5. U n espacio afín se dice euclídeo si el espacio vectorial V es euclídeo. En este caso definimos d (P ,Q )= \ \ m para cualesquiera par de puntos P, Q e¿?. D e f i n i c ió n 1 _____ _________________________________________________________________ Una aplicación T: A i - * A se dice afín si existe una aplicación lineal ÍF: Vi— V * tal que para todo par de puntos P, Q e é ? T ( P ) T ( Q ) = V (FQ )

.M

at

em

+ QR. U n sistema de referencia 31 en A está form ado por un punto O b SP y una base { e u ~ 2, ..., ~e„) de V. D ado un punto X e S f el vector O X puede escribirse de manera e

at

ic w
Cuando X = 1 se tiene la transformación identidad. Observar que el mismo ejemplo es válido en el espacio afín IR". E je m p lo B. D ado un vector V e IR", la traslación de vector % que designamos por es también una aplicación afín. En este caso: 3¿(P) = F Q'

w

a1
si F P ' = ~ . Es fácil com probar que Tj. es una transformación afín, ya que v W m o ) = p 7 '= p $ $ y, por tanto, basta tomar la aplicación lineal asociada a 7 , com o la identidad en IR2. ^

Recordemos que un espacio afín A está form ado por un conjunto ?? de puntos y un espacio vectorial V de manera que a cada par de puntos P, Q e £ ? le corresponde un vector P & e V y tal que para cualesquiera tres puntos P, Q, R e 3? se verifica P R = P §

Las aplicaciones afines también reciben el nombre de transformaciones afines.

.c

om

Tratam os ahora de encontrar la expresión analítica de una transformación afín en un sistema de referencia. D a d o 01= {O ; ~ ..., e„} un sistema de referencia en un ex, espacio afín A = (0 > V ) y T una aplicación afín en A tenemos que , 0 X ' = 0 T (X ) = 0 T (0 ) + T (Ó jf{ X ) = 0 T (0 ) + F (O X ) para todo X e ^ , d o n d e X ' = T ( X ) . Si (* i , ..., x¡,) son las coordenadas de X 'c o n respecto a á?, ( x l5 ..., x„) son las coordenadas de X con respecto a 01, ( » [ , ..., a„) son las coordenadas de T (O ) con respecto al mismo sistema de referencia y T es la m atriz de con respecto a la base { e ’l , ..., e*„}, la igualdad anterior se escribe en coordenadas de la form a ci \ \+ T\ / El lector puede convencerse de que la expresión (1) sirve para definir una aplicación afín que tiene a ( 1 ) com o expresión analítica en el sistema de referencia fijado. Si T ( 0 ) = 0 se tiene que (au ..., a „)= (0 , ..., 0) y la expresión (1) se reduce a

,

D e f i n i c ió n 2 ________ _________________________________________________ D ado un espacio afín euclídeo A = (??, V) una aplicación afín T en A se llama movimiento si conserva las distancias entre puntos, es decir, d (T(P ), T (Q )) = d(P, Q) para todo P, Q&8P.

( 1)

Nota. Los movimientos en el espacio afín IR" reciben también el nombre de isometrías; la palabra «iso m etría » proviene del griego y significa «igu a l medida».

Sea T un m ovim iento en un espacio afín A, P y Q dos puntos cualesquiera de 3? y P ' = T (P ), Q' = T ( 0 las imágenes de P y Q, respectivamente, mediante T. Entonces m P $)\\ = \\T(P)T(Q)\\=d(P', Q') = d(P, Q)=\\P§\\

om
y ^ 2 = (0> 1) en un sistema de referencia en IR2 con respecto al cual A = (a u a2). Ten e­

0 T = 0 H (X ) = 0 H (0 ) + J ^ ( 0 l ) = 0 A + A H {0 ) + je(dJC )-=Ó A + XÁÓ + l Ó l
P o r tanto,

' W -‘Wíx /i,A n o ^ A í)*: v
-a 2 A

w

w

mos que

w

.M

at

E j e m p l o C. Tratem os de encontrar la expresión analítica de la hom otecia de centro A y razón X del ejemplo A. Supongamos que R = {O; ~ x, e2}, donde O = (0,0), e j = ( l , 0 ) e *

P o r tanto, V es una aplicación lineal del espacio euclídeo V que conserva la longitud de los vectores. Tales aplicaciones son las aplicaciones ortogonales en V que han sido estudiadas en el capítulo 8 . Si T es la matriz de 7 con una cierta base se tiene 0 que |T| = ± 1. Si |T| = 1 el m ovim iento se llama directo y si |T[ = — 1 el m ovim iento se llama inverso. Observar que estos conceptos no dependen de la base elegida para escribir la matriz de Es claro que los resultados del capítulo 8 sobre aplicaciones ortogonales nos pueden ayudar ahora a clasificar los movimientos en IR". Es evidente que, al menos en IR2, puede hacerse un estudio más geom étrico de los movimientos. En lo que resta de este capítulo procederemos de la siguiente manera: comenzare­ mos haciendo un estudio geom étrico de los movimientos en el plano, para realizar a continuación su estudio analítico; en el espacio, el estudio geométrico de los movim ien­ tos resulta más complicado y, por tanto, preferimos utilizar los resultados del capítulo 8 sobre aplicaciones ortogonales, lo cual nos dará directamente su expresión analítica y su clasificación. * * *

em

at

ic

a1

.c

Además de la transformación identidad, damos a continuación varios ejemplos de movimientos. E j e m p l o D. En un plano, un giro o rotación de ángulo a alrededor de un punto O (no necesariamente el origen de coordenadas) es un movimiento, que se denotará por G0 x. Eligiendo un sistema de coordenadas com o en la figura adjunta

P' = G0 ñ J

E je m p lo H. El m ovim iento que se produce en el espacio al subir por una escalera de caracol se denomina un movimiento helicoidal. El efecto de un m ovim iento helicoidal está producido por un giro en un plano n seguido de una traslación con vector perpendicular a n de manera que los puntos del plano (o peldaño) n se transforman en puntos de un plano paralelo a ti (o peldaño superior) (ver figura adjunta).

E j e m p l o E. U na simetría con respecto a una recta r, que denotaremos por Sr, es un movimiento. Recordamos que el simétrico de un punto P con respecto a r es un punto P ' tal que el segmento P P ' es perpendicular a r y r corta a P P ’ en su punto medio. Con la simetría respecto de una recta también se asocia a veces el nombre de reflexión.

ic

a1

.c

om

em

at

*

*

*

w

w

E j e m p l o F.

U na traslación mediante un cierto vector v, que denotaremos por Tj,,

En el estudio de los movim ientos es interesante considerar un tipo de puntos especiales que se denominan puntos fijos: un punto P es un punto fijo de un m ovim ien­ to T si T ( P ) = P. Todos ciones no com o fijo puntos de los puntos son fijos para el m ovim iento identidad, mientras que las trasla­ tienen ningún punto fijo. U n giro de centro O tiene únicamente este punto (en el plano) y una simetría con respecto a una recta r deja a todos los r fijos.

w

es también un movimiento.

.M

at

p En este movim iento se produce un desplazamiento paralelo de todos los puntos. E je m p lo G. En el espacio, una simetría con respecto a un plano n, S „ es un movimiento. El plano n divide al segmento P P ', donde P ’ es la imagen de P, en dos partes iguales, siendo P P ' perpendicular a n.

En el estudio geométrico de los movimientos que haremos en la siguiente sección es conveniente considerar la composición de dos de ellos. La composición de dos aplicaciones afines Ti y T2 es otra aplicación afín; en efecto, si y V 2 son las aplicaciones lineales asociadas a Ti y T2, W2 ° f f 1 es la aplicación lineal asociada con T2° T l , ya que T2 7 i(P )7 i T {(Q) = F 2 (7 i(P )7 i(0 )) =
0 ^ i(P Q )

para todo par de puntos P y Q. Si T2 0 Ti = / se dice que 7i y T2 ¿on inversos una de otra. Si Ti y T2 son movimientos, su composición es también un m ovim iento, ya que d(T2 ° T x(P), T2 l\(Q)) = d(T1 (P), T l (Q)) = d(P , Q) para todo par de puntos P y Q.

Capítulo 10 Movimientos en un espacio afín euclídeo. Movimientos en ¡M y ñ 3 2
E J E R C IC IO S 10.1 1. Dem ostrar que una simetría en el plano con respecto a una recta es una aplicación afín. Encontrar la expresión analítica de la simetría con respecto a la recta x = 1 en un sistema de referencia cartesiano. 2. a) b) c) 3. Encontrar la expresión analítica (en un sistema de referencia cartesiano) de los G iro G de 90° con respecto al eje x = l, y = 1. Traslación T de vector tf = (0, 1, 1). T ° G y G ° T que se obtienen com o composición de los anteriores. Determinar los puntos fijos, si existen, de la aplicación afín en (R3 dada por I x'

433

siguientes movimientos en IR3:

y =/4\ -2
1
\2 /

1

-2

-2

Sea ahora P un punto que no está en r; el mismo razonamiento anterior muestra que P ' = T ( P ) debe pertenecer a la vez a las circunferencias de centro A y radio d(A, P ) y de centro B y radio d{B, P). P o r tanto, P ' = P o P ' = Q (ver figura 2). En el primer caso demostraremos que T es la identidad y en el segundo que T es una simetría con respecto a la recta r.

C o m o ya hemos anunciado en la sección anterior com enzam os haciendo un estudio geométrico de los movimientos en el plano. Algunos de estos movimientos se han dado en los ejemplos D, E y F de la sección anterior: ¿serán todos estos los m ovim ientos posibles en el plano? Para responder a esta pregunta es necesario estudiar la composición de dos movimientos fijados de antemano. Comenzamos con un lema. L em a 1 Si un m ovim iento en un plano tiene más de un punto fijo, debe ser la identidad o una simetría con respecto a una recta que pasa por los puntos fijos.

w

w

w

.M

at

10.2.

M O V I M IE N T O S E N E L P L A N O

em

at

ic

a1

.c

om

en un sistema de referencia cartesiano.

Figura 3

Supongamos que P ' —P y sea P x o tro punto distinto de P con P 1^ r, basta demostrar que P 1= P'1, donde P\ = T ( P ¡ ) . P o r el mismo razonamiento anterior se tendría que P\ = P X o P\ = Q l (ver figura 3). Si fuera P\ = Q } se tendría que d(P, P ^ d { P \ F l ) = d ( P , Q x) de donde se deduciría que P está en la recta r, en contra de lo supuesto. P o r tanto, P\ = P X y T es la identidad. Supongamos ahora que P ' = g y que P\ = P , . Se tendría entonces que d(Q, P 1) = d(P', P\) = d(P, P x)

Demostración. Sea T un m ovim iento con dos puntos fijos distintos A y B. Demostraremos primero que todos los puntos de la recta r que pasa por A y B son puntos fijos de T. Sea P e r y sea P ' = T (P ). C om o T es un m ovim iento d(A, P ) ~ d ( A , P ') y d(B, P ) = d(B, P'). P o r tanto, P y P ’ deben estar en las circunferencias de centro A y radio d(A, P ) y de centro B y radio d(B, P); com o estas circunferencias se cortan únicamente en P se ha de tener P ' = P. Esto prueba que todos los puntos de r son fijos para la aplicación T.

ya que T es un movimiento; de aquí deducimos que P x tiene que estar en la mediatriz de PQ , que es la recta r. C om o esto es una contradicción, ya que P { $r, se tiene que P\ = Q i y T es> Por tanto, una simetría con respecto a la recta r. ■

Sea M un m ovim iento cualquiera en el plano, P un punto del plano y P ' = M (P ) . Si tf = P P ', el m ovim iento T f l a M deja fijo el punto P ( T f 1 es la inversa de la traslación de vector IT, es decir, T f 1 o M ( P ) = T f l ( P ') = T _ ¿ P ' ) = P

Una vez establecida la proposición 2 la determinación de todos los movimientos en el plano requiere el estudio de las posibles composiciones de los movimientos que allí intervienen. Antes de realizar este estudio analizamos las condiciones en que se obtiene la identidad o una simetría en el lema 1. Para ello observamos en la figura 4 que las simetrías cambian la orientación de la figura, mientras que la identidad evidentemente no la cambia.

.c

om

Figura 4

.M

que

at

em

Para cualquier otro punto Q del plano sea Q1= T$ 1 ° M (Q ). C om o T f l o M es un m ovim iento d(P, Q) = d(P, Q') y, por tanto, existe un giro G P l de centro P y ángulo a tal que G F J Q ') = Q. El m ovim iento GP a ° T f 10 M tiene P y Q com o puntos fijos, ya

ic

a1

L e m a 3 ______________________ _______________________________________________ Si un m ovim iento en un plano tiene más de un punto fijo y no cambia la orientación de las figuras es la identidad y si la cambia es una simetría axial.

at

P r o p o s ic ió n 4_ La composición de un giro y una traslación es otro giro del mismo ángulo.

y

G P' X° T f 1° M ( Q ) = GPJ Q ' ) = Q

w

w

G P,a ° T f 1

M ( P ) = Gp J P ) = P

w

Demostración.

Sean GP a y 7^ el giro y la traslación dados (ver figura adjunta). Sea Q = T »(P ) Q' = GPJ Q )

P o r el lema 1, GPa 0 T f 1 ° M es una simetría Sr, donde r es una recta que pasa por P o la identidad; por tanto, M = T$° G P Sr o M = T »°G P

,0" = W )

H em os demostrado el siguiente resultado: P r o p o s ic ió n 2---------- ---------------------------------------------------------------------------- -----------T o d o m ovim iento en un plano es o bien la composición de un giro y una traslación o bien la composición de una simetría con respecto a una recta, un giro y una traslación; el eje de simetría pasa por el centro del giro.

Observación. importante.

El orden de composición en la proposición anterior es muy

Sea O el punto de intersección de las mediatrices de los segmentos P Q y Q Q ". El m ovim ientoG pj , 0 ^
1

° G 0¡a tiene P y Q com o puntos fijos: = G p ,i(P ) = P

De todos los casos posibles que pueden ocurrir en la proposición 2 nos queda por estudiar la composición de una simetría y una traslación. Comenzamos suponiendo que el vector de traslación u es paralelo a la recta de simetría r.

Gp.l ° T f 1 ° G 0J P ) = G P.'JTu ' m

y
Gp,i " T r 1” G 0J Q ) = G p X (T - f x( Q ') ) = GP,i ( Q ') = Q Puesto que este m ovim iento conserva la orientación (ya que las traslaciones y los giros la conservan) se tiene que G p l ° T i 1 ° G0ct = /, de donde deducimos que G 0 < 1 ¡ = Ta 0GP a Esto concluye la demostración de la proposición 4 excepto en el caso en ,. que Q", Q y P están en una misma recta; en este caso se ha de tener necesariamente a = 180° y Q " = P. En esta circunstancia basta tom ar O com o el punto m edio del segmento P Q . ®

Observación. El centro del nuevo giro que se obtiene enJa proposición 4 es el punto de intersección de las mediatrices de los segmentos P Q y Q Q ", donde Q = Tü y Q” = Tü°GpJa ° Tü(P), siempre que a ^ l8 0 ° . Si a = 1 8 0 °, el centro es el punto medio de P Q . P r o p o s ic ió n 5_---------------------------------------------- ----------------------------------------------------La composición de una simetría y un giro de centro perteneciente al eje de simetría es otra simetría. En la figura se observa que este movim iento cambia la orientación y, sin embargo, no es una simetría axial. Estamos ante un nuevo movimiento al cual damos el nombre de simetría deslizante. D e f in ic ió n _________ ______________________________________________________________ A la composición de una simetría de recta r y una traslación de vector u paralelo a r se le denomina simetría deslizante y se representa por Sr.uEl lector puede visualizar una simetría deslizante como las huellas que una persona deja en la nieve al caminar en línea recta.

m ovim iento

s ; l GP\ s l
tiene P y Q como puntos fijos:

w

w

Demostración. Sean Sr y GP¡„ con P e r , la simetría y el giro dados. Sea Q otro punto de r distinto de P y Q' = G P a (Q). Sea / la bisectriz del ángulo Q PQ '. El

w

.M

at

em

at

ic

a1

.c

om

C=>
Supongamos ahora que el vector de traslación ~ es perpendicular a la recta r. En v este caso demostraremos el siguiente resultado: (*) La composición de una simetría Sr y una traslación de vector ~ perpendicular v a r es una simetría con respecto a la recta l trasladada de r mediante el vector 7/2.

s~ 1 ° G p \ ° s ¡( p ) = p

y

5

r i °G p> ° s 1( e ) = s r l ( G p i ( e ' ) ) = s r 1 ( 0 = e i

C om o este movim iento no cambia la orientación (ya que las dos simetrías anulan el cambio de sentido que cada una de ellas produce) del lema 3 se deduce que Sr- 1 0 Gp l °S¡ = I y, por tanto, S¡ = GP x ° S r. Observación. ■

Basta observar que S ' 1 ° T - f 1 ° S¡ es un movimiento que tiene P e r y Q = T$(P) como puntos fijos: S ~ 1 o T i 1 ° St(P ) = S ~ 1 ° T f \ Q ) = s ; l (P ) = P

L a recta de la nueva simetría axial en la proposición anterior

y

es la bisectriz del ángulo QPQ', con Q' = GP x (Q) y Q e r , Q¥=P-

s - 1 ° rF- 1 o 5 ,(2 ) = S - 1 o T i l(P)= S -

\ Q ' ) = Q.

Juntando las proposiciones 4, 5 y 6 junto con la proposición 2 se obtiene el siguiente resultado, que nos dice con exactitud el tipo de movimientos que pueden existir en un plano. ( Descripción de los movimientos en un plano) ________________________

TEOREM A 7

T o d o m ovim iento en un plano es o bien la identidad, o una traslación o una rotación (movimientos directos, es decir, que no cambian la orientación) o bien una simetría o una simetría deslizante (m ovim ientos inversos, es decir, que cambian la orientación).

Puesto que este m ovim iento conserva la orientación, del lema 3 se deduce que S ~ 1 ° T - f 1° S, = I, y, por tanto, S, = T¡t 0 Sr, que es la afirmación (*). Puesto que conocemos el resultado de componer una simetría con una traslación de vector paralelo al eje de simetría y con una traslación de vector perpendicular al eje

El lector puede ahora preguntarse cuál es el resultado de componer dos m ovim ien­ tos cualesquiera que no coinciden con los realizados en las proposiciones anteriores. P o r ejemplo: ¿cuál es el resultado de componer dos giros? Es conveniente «ju g a r» un poco con este tipo de composiciones. Algunos de estos «ju ego s» se proponen com o ejercicios al final de esta sección.

a1 em at ic

de simetría, podemos encontrar el resultado de com poner una simetría con un vector cualquiera u, sin más que descomponer u en sus componentes paralela y normal al eje de simetría. Se obtiene así el siguiente resultado.
P r o p o s ic ió n

.c
1. Demostrar que la composición de dos simetrías en un plano, cuyos ejes se cortan en un punto es una rotación. ¿Cuáles son el centro y el ángulo de esta rotación? 2. Estudiar la composición de dos simetrías de ejes paralelos.

L a composición de una simetría y una traslación es o bien una simetría

.M

at

6 _________________________________________________________________________________________

om w w w

E JE R C IC IO S 10.2

deslizante o bien una simetría.

3. Dem ostrar que la composición de una simetría y un giro en un plano es una simetría o una simetría deslizante. ¿Cuál es el eje y cuál es el vector de la simetría deslizante? 4. a) D em ostrar que la com posición de dos giros de 90° en el mismo sentido alrededor de dos puntos distintos C y B es un giro de 180° alrededor del centro de uno de los cuadrados que tiene C B com o lado. b) Estudiar la composición de dos giros cualesquiera en el mismo sentido.

Demostración. Sea Sr la simetría y la traslación. Sea u = u p + un la descomposi­ ción de u en un vector up paralelo a r y un vector un perpendicular (o norm al) a r. Observar que = Tj¡ ° 7^, de manera que T ~ ° S r = Tu n ° T - n °S V 1u J i 2u ‘-

5. Dem ostrar que la com posición de tres simetrías de ejes concurrentes es otra simetría. ¿Cuál es el eje de esta nueva simetría?
6.

Estudiar la composición de tres simetrías de ejes paralelos.

7. Un giro de 180° alrededor de un punto P se dice también una simetría de centro P. Demostrar que la composición de dos simetrías de centros P l y P 2, respectivamente, es una traslación de vector 2 P i P 2. « N iV r a t s ji M i, D g L a nn }(r......

Si

M = 0, p

TUn° S r

es

una

simetría,

mientras

que

si

T I p o ^ o Sr

es

una simetría deslizante.

10.3.

E S T U D IO A N A L I T I C O D E L O S M O V I M IE N T O S E N IR2

que sustituido en la expresión anterior nos permite obtener: x 'A / p A x 2/ \P2 / /coscp \sencp —sencp coscp al \ a2) /coscp \ sen cp -sencpX/Xi eos cp A x 2

Comenzamos esta sección encontrando las ecuaciones de todos los movim ientos en el plano, cuya descripción se ha dado en el teorema 7 de la sección anterior. E je m p lo A. Traslación de vector Tf = (u l 5 v2)(Tv)\ Cualquier punto A' = ( x 1, x 2) se

transforma en otro punto T-¡j(X) —X ' = {x\, x'2) tal que Xl + Ul X 2 “f" ^2

IK X

E J E M P L O C. Simetría con respecto a una recta r(Sr): Supongamos que r tiene por ecuación y = mx + b; si elegimos el sistema de referencia {5 ; u¡, u2\, donde B = (0, b )e r , ul es un vector director unitario de r y u2 es un vector unitario perpendicular a r, de manera que {iTi, u2} y { e u ~ 2} tengan la misma orientación (1), la imagen de un e punto X de coordenadas (y 1; y2) en este sistema de referencia es X ' de coordenadas (y i, y'2) en este mismo sistema tal que

1 0

o\ fy i (*)

w

w

w

.M

at

em

at

ic
Para pasar al sistema de referencia {O; 'eu ~ 2j realizamos un giro de ángulo ( —cp), e donde tgcp = m, y una traslación de vector ( 0 , — b), de manera que si (x 1; x 2) son las coordenadas de X en este sistema de referencia se tiene xA /coscp \sen cp — sencp\/yA A A eos cp \ y 2) ) \bJ ’

EJEM PLO

B.

G iro o rotación de centro P — Í P P i ) y ángulo (p(Gp lf).

Si elegimos el sistema de referencia ( P ; z¡i, u2} com o muestra la figura adjunta, la imagen de un punto X de coordenadas (y 1; y2) en este sistema de referencia es un punto X ' = (.yi, y'2) tal que

a1

.c

om

x 2J

//A
\y'2J

/coscp \sencp

-sen cp \ / . v A eos cpJ \ y 2J

de la misma manera, si (x i, x'2) son las coordenadas de X ' en el sistema de referencia canónico se tiene x 'A x'2J /coscp ysen cp — s e n c p V / A /O eos cp)\ y '2) \b

Si X = ( x 1, x 2) y X ' = (x\, x 2) en el sistema de referencia canónico {O; é*,, ~ e2} se tiene que

(1) Dos bases de un mismo espacio vectorial tienen la misma orientación si la matriz del cambio de base tiene determinante positivo.

Sustituyendo en (* ) encontramos que A continuación calculamos í xA xW /eos (p — sencp\/l0 \/coscp — l A sencp — sencp coscp movimiento:
1

j imponiendo que P = (l, 2) sea un punto fijo de este

Vsencpcoscp A 0

aA a2J

/coscp \ sen cp

— sencp\/l eos cp A 0

0

coscp -sencp

sencp \ x i coscp A x 2

+

2

2
J Ì ,

—1

\2

v/ 2

2

/

aA a2J

/cos 2 cp ls e n 2 cp

sen 2 cp\/xt — eos 2 cp } \ x 2

E je m p lo D. Simetría deslizante de eje r y vector v ( S r T-): Si r: y = mx + b, utilizan­ do el resultado obtenido en el ejemplo C y el hecho de que Sr V — Tp° Sr se obtiene que

P o r tanto,

a1

c2 /

\x 2 /

\v2 / bA b2)

\a 2 /

\sen 2 < p

—eos 2 c / \ x2 p

.c

s , w[

.x A

/x A

=

ZuA

1 +

/a A

1 +

/cos2cp

7

s e n 2 c p \/* i

om

y

/V 2 +

_v^ \

2

2

ic

/ cos 2 cp \sen 2 cp

sen 2 < p —cos2q>J\x2

w

w

donde IT = ( r 1, v2). Recordar que v es paralelo a la recta r.

.M

at

em

rf f /
EJEMPLO F. Encontrar la expresión analítica de la simetría deslizante de eje y = x — 2 y de vector Tf = (3, 3). C om o cp= n/4 del ejemplo D se deduce que las ecuacio­ nes buscadas son de la forma

A continuación damos algunos ejemplos de casos particulares de los ejemplos anteriores para que el lector se familiarice con la obtención de las ecuaciones de movimientos. Una form a de realizar estos ejercicios es seguir en cada caso el razona­ miento de los ejemplos anteriores; otra posibilidad es escribir la ecuación del m ovi­ miento en su forma general y encontrar los parámetros desconocidos; aquí seguiremos este segundo punto de vista. EJEMPLO E. Encontrar las ecuaciones del giro de centro P = ( 1, 2) y ángulo cp = n/4. P o r tratarse de un giro de ángulo n/4 tendremos:

w

at

En nuestro ejemplo, si P = ( x u x 2), P ' = (x\, x'2), tomamos £ = (0, 2) y observamos > Calcularemos s* conocemos la imagen de un punto P; si tomamos P —(0, 2),
1

que ñ* = ( 1 , 2 ) — >/5

tenemos

•.« -(-H i-o
de manera que M + /o iV °\ . Í ~ 2\ J 5

.íru rv

°A -v
x 'A = /5\ x 'J V I/ * * /° U

w

w
IV x í

V °' V 1

2/

x x

+ 2

x

2—4

5 l2 x ! + 4x2—

P o r tanto, la expresión analítica de esta simetría deslizante es

0

/\x 2

*

problema. La imagen de un punto P es un punto P ' tal que

at

P' = P -X n donde n es un vector unitario normal a r (com o muestra la figura) y A=||P?'|| = 2d(P, r). Para calcular k tomamos un punto cualquiera Q de la recta r y observamos que d(P, r)=\IQP\\ c o s a = ||é?|| J ^ L - = (Q p, n )

em

at

ic

EJEMPLO G. Encontrar la expresión analítica de la simetría con respecto a la recta r de ecuación x + 2y = 4. U na forma de hacer este ejercicio es com o en el ejemplo F, teniendo en cuenta que todos los puntos del eje deben quedar fijos. Dejam os al lector esta tarea. Nosotros mostraremos aquí una forma más geométrica de resolver este

a1

Con los ejemplos anteriores hemos aprendido a encontrar las ecuaciones de los movimientos en el plano. A continuación nos planteamos el problema recíproco, es decir, dadas las ecuaciones de un movim iento en el plano determinar qué tipo de m ovim iento es. Si se resuelve este problema, haciendo uso de los resultados del comienzo de la sección 8 . 8 del capítulo 8 se obtiene la descripción de los movim ientos en el plano, que fue dada en el teorema 7 de la sección anterior. En la sección 10.1 se demostró que las ecuaciones de un m ovim iento M en el plano son de la forma

.c

om

w

w

w

X l ) = M ( Xl W * 2 / Vx 2 / \a

.M

a M + r f Xl

(i)

donde T es una matriz ortogonal de orden 2. D e los cuatro primeros ejemplos de esta sección, que nos dan todos los movimientos en el plano de acuerdo con la descripción dada en la sección anterior, deducimos que T es de la forma j _ í cos < P \sencp — sencp coscp cosa sena sena —cosa

ó

T=

Observar que la traslación está incluida en el primer caso cuando cp = 0. Además, en el segundo caso, T es una matriz ortogonal y simétrica de determinante — 1, y por tanto, la aplicación lineal que tiene a T com o matriz es diagonalizable en una base ortonorm al y su matriz en esta base es
1 0 - 1 0

La ecuación de la simetría es Esto último se deduce de los resultados del capítulo 8 . P ’ = P - 2 { Q p , n)n El lector se habrá dado cuenta que la descripción de T se ha encontrado anterior-

/0 \ y, por tanto, r(I — T )= 0 . Si ,4 = 1 1 r(I — T \ A ) = Q y el m ovim iento es la identidad. Si , mente al comienzo citada sección). de la sección
8. 8

(ver la discusión que precede al teorema 1 de la T son (I) /0 \ A ¥ i \ \ , r [ I — T \ A ) = \ y el m ovim iento es una traslación de vector (al , a2). Observar que todos los movimientos del caso (I) son directos, ya que |r| = l. En el caso (II), y en la base { « i , u2},

En resumen, los casos posibles para
7

= fe o s ^ sen cp

—sen 9 ^ eos (p

o, en una nueva base {u¡, u2} si es necesario, \0 n T -\ o
0 - 1

° )W \

\0

-IJ

° W \0 ° 2 0

(II)

Para seguir adelante en el problema propuesto es necesario estudiar los puntos fijos del movimiento. L os puntos fijos X = ( x L, x 2) de (1) satisfacen el sistema de ecuaciones '* i \
[ x 2J

y, por tanto, r ( I — T ) = 1. Si r ( l — T\ A ) = 1, el sistema (2) tiene una recta de soluciones y, por tanto, el m ovim iento tiene una recta de puntos fijos. Si P es uno de estos puntos fijos, en el sistema de referencia {P ; W,, u2} el m ovim iento tiene com o ecuaciones V A / 1
0 \/>i

/ M + t Í xi
\a2J \x2

y2J

\0

- 1^2

o bien ,2)

a1

.c

om

y se trata, por tanto, de una simetría con respecto a la recta de puntos fijos. Observar que en este caso se ha de tener a x= 0 en la ecuación ( 1 ). Si r ( I — T \ A ) = 2 el sistema (2) no tiene soluciones y, por tanto, el m ovim iento no posee puntos fijos. En este caso podemos escribir el m ovim iento com o x, \ x2 la . . ‘ +

em

at

reduce al estudio del rango de la matriz I — T y de la m atriz ampliada ( I — T |A), donde A = ( a 1 ). Estos rangos se designarán mediante W

ic

D ebid o al teorema de Rouche-Frobenius el estudio de los puntos fijos de (1) se

•'*(: -X;

(3)

En el caso (I):
1

—eo s© — sen cp
1

sencp — eos cp

\ I-T \

, 2 x = ( l - c o s ( p ) + sen 2 (p = 2 ( l - c o s t p )

w

w

r(I —T )

y

r(l-T \ A )

donde necesariamente a¡ / 0, ya que r{I — T\ A ) = 2. La expresión entre corchetes son las ecuaciones de una simetría con respecto a un eje que tiene com o vector director üi. P o r tanto, (3) es la composición de esta simetría con la traslación de vector tf = (au 0), que es paralelo a « ! : se trata de una simetría deslizante. La descomposición de una simetría deslizante com o una simetría y una traslación no es única; únicamente existe unicidad si el vector de traslación es paralelo al eje de simetría y en este caso la descomposición de la simetría deslizante se dice canónica. A continuación resumimos los resultados anteriores en el siguiente cuadro:

w

.M

at

T
P o r tanto, r(/ — T ) = 2 si y sólo si cp /O; en este caso, r ( I — T \ Á ) = 2 y, en consecuencia, el m ovim iento posee un único punto fijo P que es la solución del sistema (2). Tom ando P com o origen del sistema de referencia las ecuaciones del m ovim iento son de la forma '/ A y 'i) /coscp \sencp -s e n tp V y j coscp/\y 2

r(l —T)
0

r(I-T\A)
0

Movimiento P' = A + T(P)

mo >
Simetría respecto a una recta: |T|<0 Giro o rotación:

I

1

y, por tanto, el m ovim iento es un giro de centro P y ángulo (p. Si < = 0, p f\ 0

mo >

2

1 1 2 2

Identidad Traslación Simetría respecto de la recta de puntos fijos. Simetría deslizante: composición de simetría y
traslación paralela al eje de simetría.

Giro en torno al punto fijo.

0N
1

Para finalizar esta sección daremos algunos ejemplos de determinación de m ovi­ mientos en el plano. A la vez aprenderemos a encontrar los elementos geométricos de cada uno de ellos, es decir, el vector de traslación si se trata de una traslación, el centro de giro y su ángulo si se trata de un giro, la recta de simetría si se trata de una simetría, o la descomposición canónica si se trata de una simetría deslizante. Para referencias futuras diremos que una subvariedad lineal L en un espacio afín es invariante mediante una aplicación afín M si M ( A ) c A. En el plano, y dejando a un lado el plano, las subvariedades invariantes pueden ser puntos o rectas. Observar que en el plano hay movim ientos que no tienen puntos fijos, pero que poseen subvarieda­ des invariantes: ¿cuáles? E j e m p l o H. Estudiar el m ovim iento cuya expresión es

EJEMPLO I.

Estudiar el movimiento cuya expresión es

Puesto

que J - T = í

(2

0\

1 r { I - T ) = 1 y puesto ,

que ( I - T \ A ) = l

(2

0

Q

2

.,

K / - T | ^ ) = l ; se trata, entonces, de una simetría. El eje de simetría es el conjunto de los puntos fijos y, por tanto, tiene por ecuación

>(>
EJEMPLO J.

. v .

o

i

\y

x= 1

P' =

+

/ 1 V 3 2 2 / \ Jí 1/
2 2

Estudiar el movimiento cuya expresión es

té. 1 \
2
1

2

om

F - ' , 0 I+

_v/3

ic

2

UM

punto fijo P satisface la ecuación

w

w

w

V 3. El ángulo de giro cp satisface c o s t p = - , sen cp= — — y tenemos entonces cp= —60°. El

.M

at

2

em

l

at

Puesto que \I— T\ =

= - + - = 1 # 0 , r ( l — T ) = 2 y se trata de un giro. 4 4

1 3

a1

1

\/3

.c

2
1

2

-

Puesto que \ — T\ = 1

3 1 = 1 -------- = 0 , r ( I — T ) = l y puesto que 4 4

1

{1 -T \ A ) =
1 2

>/3\
2

\
de manera que

0

/

p -

5 >+ v 73
2

¡1
3 A2 /?\ 2
3^3 5

r ( I — T |A ) = 2. Se trata de un simetría deslizante. Para calcular el eje de simetría procedemos como sigue: si P es un punto del eje de simetría, su imagen P ' pertenece también al eje de simetría y P " , la imagen de P\ pertenece también al eje de simetría

Despejando P se obtiene

p f ' = F f " = A + T ( P ') - A - T ( P ) = T ( P P ' ) / P =
1 1

3 \ -‘

2

2

3

\ 2

2

"

2

/

P o r tanto, F P ' es un autovector de T de autovalor 1 y se tiene que 0 = ( T - I ) ( F P ' ) = ( T - I ) ( A + T ( P ) - P ) = ('T - I ) ( A ) + ('T - I ) 2( P ) que es la ecuación que satisface el eje de simetría. En nuestro ejemplo:

del dibujo deducimos que — > —X 31 7 * (P Q , F § ')= —

La ecuación del giro toma la forma
1 2 0 2 1 2

2 +
1

"

2 _ ^ L i

=

l- ^ = (2 -y / l)x-y

\

.¿L.
2

3-C:)*(-: ¡X:
Si existe un giro satisfaciendo las condiciones dadas se ha de tener

2

2

Las ecuaciones paramétricas del eje de simetría son r:
0^

+ í(l,2 - y 3 )

’X x
om at
Si estas dos ecuaciones producen el mismo valor de ( 1 ) existe el giro buscado; así es W /fl,\ / — 1 \ en este caso y se tiene = . P o r tanto,

El vector de la traslación es V = p P ', donde P es cualquier punto del eje de simetría; si tomamos P = \ - , 0 ),

2

ic

2
p ,= o l+
1

2
y/3

a1

1

\/^ ll\

P o r tanto,

w

w

w

.M

at

\ 2

1Y + W i /

/-

'/ 3

.c

3

em

W

V V

Nota.

Este problema también puede resolverse imponiendo , eos cp P' = A + i v sen cp , /cosrn Q —A + í \sen(p — sen cp\ eos (p

EJEMPLO K .

Encontrar, si existe, un giro que lleve P = (2, 0) en P ' = ( — 1, 1) y Q ^2 \ ( eos * ( P $ , F£>') = r = 0

P

= (4, 1) en Q' = (0, - 1 ) . Puesto que — sen(p\ ]Q eos cp^

y calculando A y (p si las cuatro ecuaciones anteriores son compatibles.

E JE R C IC IO S 10.3. 1. Encontrar la expresión analítica de los siguientes movimientos: a) b) G iro de centro (1, 0) y ángulo 37 t/4 . Simetría deslizante de eje paralelo a la recta 2x + > = 3 y que transforma (2, 1) ■ en ( 1 , 0 ).

c) d) 2.

G iro de ángulo %/3 que lleve (2, 1) en (1, 0). La composición de los movimientos de a) y b).

D e los resultados de la sección 10.1 se deduce que las ecuaciones de los movim ien­ tos M en R 3 son de la forma

Estudiar los siguientes m ovim ientos del plano, hallando su tipo, subespacios M (X ) = X ' =

invariantes y elementos geométricos.

1 x\ \ x'2 \ *3 / =

/ «1 \ a2 \«3 + T

1

Xl \ x 2 \= A + T X

{ *3 /

a)

M l

donde T es una matriz ortogonal de orden 3. D el teorema de clasificación de las aplicaciones ortogonales en espacios euclídeos (teorema 2 de la sección 8. 8 del capítulo 8 ) deducimos que, después de un cambio de base ortonorm al si es necesario, T puede ser de una de las siguientes formas:

(I) ( 1
0

0

0

^

(II) /

- 1
0

0

0

eos c p sen (p

— sen < p eos c p \

eos cp
0

— sen < p eos (p

\0

sen cp

3.

Determinar todos los movimientos que transforman (1, 0) en (2, 1) y (0, 1) en (1, 0),

a1

.c

indicando sus elementos geométricos.

om

(III) / 1
0

0 1 0

0 0 - 1

\

em

eje x — 2y = 1 . 5. Encontrar todos los movimientos del plano que conmutan con: a) b)
6.

at

ic

4.

Averiguar todos los movim ientos del plano que conmutan con la simetría de

\0

1

w

G iro de ángulo % y centro P 0.

w

w

Traslación de vector u0.

Observam os que las matrices anteriores son las matrices de una aplicación ortogonal en una base ortonorm al { u u u2, u3} que puede ser diferente en cada caso. Observamos también que la identidad está incluida en el caso (I) con < = 0 y que la p simetría central de matriz / - 1
0 - 1 0 - 1

Probar que todo m ovim iento del plano es la composición de tres simetrías si |T|

.M

at

0

0 0

< 0 y de dos simetrías si \T\>0. \

0

es un caso particular de (II) con (p = n. 10.4. M O V I M IE N T O S E N E L E S P A C IO En los casos (I) y (IV ) los movimientos son directos, mientras que en los casos (II) y (II I) son inversos. Para determinar todos los movimientos en R 3 es necesario estudiar sus puntos fijos; com o ya se dijo en la sección 10.3 esto equivale a estudiar r ( I — T ) y r(/ — T \A). Estudiamos cada uno de los casos por separado.

En esta sección determinaremos todos los posibles movimientos en el espacio. Para llevar a cabo esta determinación puede realizarse un estudio geom étrico similar al que se hizo en la sección 10.2 con los movimientos en el plano. Es éste un buen tema de trabajo para el lector o estudiante, ya que de esta manera puede ejercitarse en la intuición geométrica espacial. Sin embargo, también puede realizarse esta determina­ ción de un m odo analítico, basado en la clasificación de las aplicaciones ortogonales en espacios euclídeos (teorema 2 de la sección 8. 8 del capítulo 8 ). Este segundo punto de vista será el que seguiremos aquí.

(I) T=

/ i
0

0

0

\

eos < p sen (p

— sen cp eos cp j

y0

En este caso:

La descomposición de un m ovim iento helicoidal com o composición de un giro y una traslación no es única; podríamos haber tom ado
0 0

/ xi , b, c # 0 \

eos < p — sen cp

sen cp cos< y p

1

— eos (p — sen q >
1

sen < p — eos q >

= 2 ( 1 —eos cp)

Sin embargo, existe unicidad si la traslación es paralela al eje de giro y en este caso la descomposición del m ovim iento helicoidal se dice canónica.

Si (p = 0, r(/ — T ) = 0 y T es la matriz identidad. Si r{I - T |A ) = 0, A = (0, 0, 0) y el m ovim iento es la identidad; si r(7 — X |^4) = 1, A = (al , a2, a 3 )# (0 , 0, 0) y el m ovim iento es una traslación de vector a' = (a 1, a2, a 3). Cuando < / 0 tenemos que r ( I - T ) = 2. Si r ( I - T \ A ) = 2 e l m ovim iento M tiene una p recta de puntos fijos; si P es un punto de esta recta, las ecuaciones de M en el sistema de referencia {P; u u u2, u3} son

(IV)
/ - 1 T=
0 0 1 0 - 1 0 0

i

0

0

eos (p sen (p

- sen cp

y2

ic

a1

.c

/ 1

0

0

\ [y i \

Este es un caso particular de (I) que se obtiene permutando los dos primeros elementos de la base y tomando cp = n. Se trata, por tanto, de un giro de 180° alrededor de un eje o de un m ovim iento helicoidal. El giro de 180° alrededor de un eje r recibe el nombre de simetría axial de eje r, ya que todo punto se transforma en su simétrico con respecto a r (ver figura 3).
A'

em

at

y0

eos (p l \ y 3 I

om

y se trata, por tanto, de un giro de ángulo q alrededor de un eje; el eje tiene com o vector > director ü\ y pasa por el punto P y coincide con la recta de puntos fijos del giro. Observar que en este caso r(I — T \ A ) = 2 implica a1= 0. Si r ( I — T \ A ) = 3 el m ovim iento no posee ningún punto fijo; en este caso se ha de tener necesariamente ^ / O y podemos escribir las ecuaciones de M en la forma

1

x i

]

= 0 + \ *3 w
* 2

1

Ü1

\

0

M +
0 \ 0

0

w

w

w

.M

at

B'

a2 xa $ ¡

eos cp sen cp

Figura 1. Giro de ángulo < p alrededor de r (Gv r)

Figura 2. Movimiento helicoidal ( H r 3)

con a = ( a 1; 0, 0 )/ (0 , 0, 0). La expresión entre corchetes son las ecuaciones de un giro, Gy r, de ángulo < con respecto a una recta r que tiene a « i com o vector director; si p escribimos T¿ para denotar la traslación de vector a # 0 las ecuaciones anteriores nos dicen que M = T ^ ° G v>r con la particularidad de que a = a ] u í es un vector paralelo a la recta r. L a com posi­ ción de un giro y una traslación en estas condiciones es lo que hemos llamado un movimiento helicoidal (ver el ejemplo H de la sección 10.1).
Figura 3. Simetría axial de eje

r (Sr)

(II) / - 1 T = \ En este caso tenemos
2 0 1 0

O O
0

o \ — sen q > eos cp j

eos < p sen<p

Observar que a es un vector paralelo a n. Por analogía con el caso del plano, este m ovim iento recibe el nombre de simetría deslizante. La descomposición M = T ¿ ° S es única si a* es paralelo a n y recibe el nombre de descomposición canónica de la simetría deslizante. Cuando <p#0, r ( l — T ) = 3 y, por tanto, r(I — T \A ) = 3. En este caso el movim iento posee un punto fijo P. En el sistema de referencia {P; u x, u2, u las ecuaciones de M *3} son

f y\ y\

^1
=

- 1 0

0

\1-T\ =

0 0

—eos cp — sen cp
1

sen q = 4(1 — eos q>) > — eos

eos cp sen < p

— sen < p

0 \

1yi y2

\ y'* 1

\

0

eos < J \ y 3 p

Si (p = 0, r (I — T ) = 1 y / - 1 T=
\
0 0 0 1 0 0 0 1

Esto es la composición de un giro con respecto al eje ü\ y una simetría con respecto al plano generado por u2 y u3, ya que i
0 0 0

0

1 - 1

0 0 0 1 0

/I °\
0

0

0

eos < p sen cp

— sen < p eos < p

=

I y\ \ y'2
\y3 /
=

.M

0

1

0

\

y 2

at

/- 1 o o
\ 0 0 1

\ ¡ yi \
l\y3 /

em

at

ic

de referencia {P ; u 1 u2, u3} son ,

a1

Si r { I - T \A ) = \, el m ovim iento posee un plano de puntos fijos n cuyo vector característico es u \. Si tomamos P perteneciente a ti , las ecuaciones de M en el sistema

.c

om

\

eos (p sen

— sen ip eos cp

° W lo

P o r tanto, M es la composición de un giro con respecto a un eje r que pasa por P y una simetría con respecto a un plano perpendicular a r que pasa por P. Este m ovim iento no recibe ningún nom bre especial en general; solamente en el caso < = 180°, para el cual p
- 1 0 0 - 1 0 - 1 0

°\
0

w

w

w

por tanto, M es una simetría con respecto a un plano que pasa por un punto fijo de A i y tiene com o vec'or característico u^. este plano es el plano de puntos fijos de M . Observar que en este caso r(I — T \ A ) = l implica a 2 = 0, a3 = 0. Si r ( I - T |A ) = 2 (el lector se convencerá fácilmente de que r(I - T\ A ) # 3 cuando r(I - T ) = 1) se ha de tener a2 -a 3=¿ 0; por tanto, las ecuaciones de M pueden escribirse de la forma
I

/

recibe el nombre de simetría central o simetría con respecto a un punto P ( P recibe el nombre de centro de la simetría) ya que todo punto se transforma en su simétrico con respecto a P (ver figura 6 ). El centro de simetría es el punto fijo del movimiento.

ai \
0

/ - 1
0

0 1 0

o\ o
1

(II I)

\° /

\

0

T=

con Zf = a2U2 + ci3¡T3 ^ 0\ Así pues, M es la composición de una simetría, S con respecto a un plano n de vector característico u 1, y una traslación de vector a ^ 0 ; es decir, M =Tñ °S

Este es un caso particular de (II) que se obtiene permutando los elementos primero y tercero de la base y tom ando cp = 0. P o r tanto, el m ovim iento es una simetría con respecto a un plano o una simetría deslizante. Esto concluye el estudio de todos los movimientos en el espacio. Los resultados obtenidos se enuncian en el siguiente teorema:

TEOREMA 1 (D escripción de todos los movimientos en el e s p a c io )------------------T o d o m ovim iento en IR3 es o bien la identidad, o una traslación o una rotación alrededor de un eje o un movimiento helicoidal (en estos casos |T|> 0 , el m ovim iento no cambia la orientación y se dice directo) o bien una simetría con respecto a un plano, una simetría deslizante o la composición de un giro y una simetría con respecto a un plano perpendicular al eje de giro (en estos casos |T| < 0 , el m ovim iento cambia la orientación y se dice inverso).

Es conveniente resumir los resultados anteriores en el siguiente cuadro.

T I
m > o

K / -T ) 0

r (I-T \ A ) 0
1

Movimiento: P' = A + T(P) Identidad Traslación Simetría respecto de un plano de puntos fijos. Simetría deslizante: composición de simetría y traslación paralela al plano de simetría. Giro en torno a a un eje de puntos fijos. Movimiento helicoidal: composición de giro y traslación paralela al eje de giro. Composición de un giro y una simetría; al eje de giro y el plano de simetría son perpendicu­ lares.

Simetría respecto de un plano:
|7 1 < 0

1

1

2

Giro o rotación:
m > o

2

2 3

Simetría ° Giro: |T|<0

3

3

em

at

ic

a1
10.5.

.c

om
M O V IM IE N T O S E N IR3. E J E M P L O S

.M

at

w

(S«r)

w

Figura 4. Simetría con respecto a un plano n (S„)

El objetivo de esta sección es aprender a encontrar las ecuaciones de los movim ien­ tos en IR3 así com o a determinar los elementos geométricos de un m ovim iento a partir de sus ecuaciones. En lugar de dar una lista exhaustiva de las ecuaciones de los movimientos y de la forma de determinar sus elementos geométricos daremos varios ejemplos, con la esperanza de que resulten instructivos para el lector. EJEMPLO A. Ecuaciones de la simetría respecto de un plano.

Figura 6.

Simetría con respecto al punto

P

w

Sea n un plano de ecuación ax + by + cz = d y n un vector unitario normal a n, es decir, n = — — (a, b, c). y/a2 + b2 + c2 L a imagen, P', de un punto P es de la forma P ' = P —kn, donde k = 2d(P, r). Para calcular d(P, r) tomamos Q un punto cualquiera de n y observamos que

E j e m p l o B. Encontrar las ecuaciones de la simetría con respecto al plano que pasa por ( 0 , 1 , 1 ) y es perpendicular al vector ( 2 , 1 , 1 ). I x \ Si P = , / 2 \
1

/O

y Q \

\
\1

, puesto que P ' = P — 2(Qp, n ) n tenemos:

eos

d(P, n) (g ? , n ) = — —

I x\
- 2

x

\

y- 1
\ 2-1

por tanto,

\z /

/^

,

— ¡=

1

d(P, jt )= ||é? | eos * (QP, W) = (QP, n) |

x —- x —- y —-z+3 3
1 1

4\

3
2

3

Así pues, las ecuaciones de la simetría están dadas por

-\2x + y — 1 + z — 1]
6

v — x — y — z +y 3 3 3 3

2

om

P' = P-2(QP, rf)n
Para escribir esto en coordenadas cartesianas tomamos

z— x — y — z H —
3 3 3

2

1

1

2

a1

.c

3

em

/\ t
+

at

ic

i 2 "3
2

l

i

.M

P=

/ x ' y \ z

at

1x

/x \
y \2 /

w

w

\ Z

w

U n sencillo cálculo permite llegar a la conclusión siguiente:

ll ó.

Ia 2- b 2- c 2 2d a2+ b2+ c2
(i a \\ a 2

>>

\ V

\
*

3
* *

/

ba b2—a2—c2
2

ca cb c2—a2—b2

b
\c l

a2+ b2+ c2

ab ac

E j e m p l o C. Determinar las ecuaciones de un giro de ángulo n/2 con respecto a la recta r que tiene V = ( 1 , 1 , 0 ) com o vector director y pasa por ( 0 , 0 , 0 ). Procedem os de la siguiente manera para resolver este problema: encontramos primero un sistema de referencia {O ; ~vlt t?2, ~ v3}, positivamente orientado y ortonormal, con respecto al cual Gí/2,r tenga una matriz conocida; después se realiza un cambio de sistema de referencia para llevarlo a {O ; e"u ~ 2, e Tom am os Tfj = —-=(1,1,0) y F 3 = (0, 0, 1); elegimos V2 de manera que {i>1( v2, F 3} V 2 sea positivamente orientada:
1

be

que es la expresión en coordenadas cartesianas de la simetría con respecto al plano tí. de la simetría con respecto al plano n.

Similarmente,
1 1

o\
I x\ \ x'2

V 2
1

V 2
1

'7 1
\
0 0

0 U/
l/

Sustituyendo estos resultados en (* ) y realizando el cálculo correspondiente se tiene:

1

-

1 /I 0 0 \ 0 0 -1 \° 1 0/
1 1 2 1 2

7 1 7
\ o

/

1

-fi
1

o\
/x 1 \
*2
\ *3 /

0
1 / 1/

x/ 2 \
0

s í1
0

0 0

l/

.c

om

Con respecto al sistema de referencia {0; v x, V2, ~ v3} las ecuaciones de GF n 2 son </ / 1
0 0 0 - 1 0

\ />>! \

a1

2 1 2

sf2
1

at

y2 o

(*)

ic

Í X1 ^ X2

0

1

em

y's I \

l\y 3 I

“ T 2 \*3 /

.M

at

+ x 2e2 + x 3e3 se tiene
1 1

\ + ^2

/ - 1

w

w

A continuación hacemos un giro de —45° de manera que el sistema de referencia {O ; 7 1, tf2, T 3} se transforme en el sistema de referencia {O ; ~ex, é 2, e*3j : s¡ x = x 1 e1 T T ~

\'75 V 0/ 5
E je m p lo D. H allar las ecuaciones de la composición del giro de ángulo n con respecto a la recta r: (0, 0, 1) + f(0, 1, 1) con la traslación de vector TT = (1, 1, 0) y determinar de qué tipo de m ovim iento se trata.

x 1e l + x 2e2 + x 3'e3= y 1v 1+ y 2v2+ y 3v3 = y 1~ T \ 1

V! 5

o /

yi___( yi ^2 P o r tanto, V i)

ë'i + l — + ^ = ) e 2 +y3ey
W 2 J Ì.

yi

w

Eligiendo {Q; u 1, u2, u3}, donde Q = (0, 0, 1), íT1 = ( l , 0, 0), u2 = —j = (0, 1, 1), u 3 = u l •J2 x u 2= —= (0 , — 1 , 1 ) las ecuaciones del giro de ángulo n en torno a r son

A l hacer la composición con T„, donde 1 = (1, 1,0) se tiene T I xi \ M x, \ x3 / que son las ecuaciones buscadas. Observación. A l mismo resultado se habría llegado si observamos que T e ° G n¡r(P ) = A + T{P), donde = / xi \ I 1 \ + / - 1 0
0 0

7

\/ xt \ x, . M = T 7 ° Gn r (* * )

x', 1=1

0

1

/ y, \

/ - 1
0

0 1 0

0

\ o

I yi

y2
) \y3

\

0

- 1

A continuación pasamos al sistema de referencia {Q ; T¡, ~ e3} haciendo un giro e2, de —45°; si x = x 1 e i - f x 2 g‘2 + x 3 e 3 y x = y 1u l +y2u2 + y3u3 se tiene que

/l
I yi \ i

o

o \
i ya que T(e*1 = — e^, T ( e 2 = ~ 3y, T ( e 3) = e 2 y calculamos A teniendo en cuenta ) ) e que

U/
\

y2

7 7
i ~ f i i

om

f i

/0

0

/ 1\

V2

J2

w

/*1 ^ f ■ = ° *2 1 \Z / 3 0

-fi ~ * 7 \ ~r 71 7 2

w

° \ 1 -1 0 0 0 1 0 i \ 0 0 -1

at

1

1

1

em

h

.M

4~2
1

4~2
1

IZ^ l \Z J
Z2

at

0

o

ic

a1

P o r tanto, en el sistema de referencia { Q ; é*,, e*2, ~ e3} se tiene

\i I Vi/ \i/
2 I-T =
0 - 1 0 1 - 1 1 0

.c

o = r7 o

=

i

Finalmente, hemos de determinar qué tipo de m ovim iento es el obtenido en (**). C om o \

w

/

r ( I — T ) = 2, y como ¡ 2 T\A) = W
0 - 1 0 1 - 1 1 0 1 0 1

/

Para pasar ahora al sistema de referencia {O; e"¡, ~ F3} trasladamos e2, = (x t , x 2, x 3) y X ' = (x\, x'2, x'3) mediante el vector (0, 0, 1) para obtener

X r(J — T \ A ) = 3. D el cuadro resumen de la sección 10.4 deducimos que (* * ) es un movimiento helicoidal. Hem os de determinar el eje de giro, el ángulo de giro y el vector de traslación (paralelo al eje de giro).

Si P es un punto del eje de giro, P ' es la imagen de P y P " es la imagen de P ' se tiene que F P " = M (P )M (F ) = P p ’

Observación. El eje de giro de este m ovim iento es paralelo al eje dado, ya que sus ecuaciones pueden escribirse de la forma

X, = y por tanto: P P ' = A + T ( P ' ) - A - T ( P ) = T ( P P ' ) => ( I — T ) ( P P ' ) = 0 C om o P ' = A + T ( P ) se tiene 0 = ( T - I ) ( P ' —P ) = ( T —I ) { A ) + ( T —I ) 2(P). x-, = t
1

/ !/2 \ o bien
0

/ 0

+ t \ 1

x ,= - + í

\ 1/2 /

Para encontrar el ángulo de giro es necesario utilizar el siguiente resultado: L e m a 1 ________ — __________________________________________________________________

Entonces í°\
/ - 2

0
-1 1

0 \ í'\
1 -1

/ - 2

0
-1 1

7 xi x?
\ *3

0

o

w

° r \
0

+
\

0 0 0
- 2 2 \

=

Si M = A + T ( P ) es un giro o un m ovim iento helicoidal, el ángulo de giro cp satisface 1 + 2 eos q>= traza T ( = suma de los elementos en la diagonal principal de T).

iw
/4 0
2 - 2

/ - 2 1

\

/ *i
1 *2

0 1 0

a1

.c

+

om

Demostración. escribir

Puesto que estamos en el caso (I) de la sección 10.4, podemos

ic

1

- 1/

\ *3

/

/1 C - 1T C =
0 eos

0

0

\

em

o equivalentemente

at

(p

sen cp eos < j p

\0

— sen cp

.M

X j = - , 2x2- 2 x 3= - 1

at

= ( - , 0 , - 1 y puesto que /1 P'0 = M ( P 0) =

Z «^ 1

Estas son las ecuaciones del eje de giro. U n punto P 0 de este eje de giro es P 0

donde C es un cambio de base adecuado. Utilizando el resultado del ejercicio 7 al final de esta sección deducimos la igualdad tra z a (T ) = tra za ( C ~ l TC). D e aquí se obtiene el resultado deseado. ■ Aplicando el lema 1 se tiene que 1 + 2 c o s (p = — 1, y por tanto, 2 co s(¿ > = — 2. De aquí se deduce que cp= 180°.

1 0 0\

¡1/2 \

w

w

w

0
\ lj

+
\

0 0
0 1

1
0

/

0

* E j e m p l o E. Estudiar el movim iento

*

*

/ 1 \ o

I
\

_ 1 /2 \ 1/2
0

/ V2 \

/0

0

— 1\

1/2

\ 1/
C om o / I —T =
1 0 0 2 0 1 0 1

el vector de traslación de este m ovim iento helicoidal es

\

, r (I — T) = 3

l-1

/

y, p or tanto, se trata de la composición de un giro y una simetría coa plano de simetría perpendicular al eje de giro. El punto de intersección del plano de simetría y del eje de giro es el punto fijo de esta transformación. En nuestro caso el punto fijp es I x \
0=

En nuestro caso tenemos:
1 1 l ° \ 0 \ ° l 0 0 0 - 1 0 ! / ¡ 2 2 1 2 / + _

/ 0 0 \1

0 - 1 0

- 1 0

2 \ —

/ I 0 \ 0

0 1 0

0 0

=

0

0 /

! /

y \z lo \
0
-

/ — 2x + 0

donde 10
0 - 1 0 0 1 0

w
r:

0

x~0 z= 2

\ —2z

\ 1 por tanto, = 2—

La ecuaciones paramétricas del eje de giro son
(0 , 0 , 2 )

+

í ( 0 , 1, 0 )

Z ' >

C om o el plano de simetría ha de ser perpendicular al eje de giro y pasar por el punto fijo P 0 = ( 0 , 1 , 2 ), su ecuación es y = l .

= 2 — y

z= 2 + x de donde deducimos que P 0 = ( 0 , 1 , 2 ). Cualquier punto P = ( x , y, z) del eje de giro satisface

Entonces, 0 = (/ + T )(P P ') = (/ + T ) ( A + T ( P ) - P ) = (/ + T ) ( A ) + + ( ! + T ) ( T —I ) ( P ) = ( I + T ) ( A ) + ( T 2 - I)(P ). C on un razonamiento similar al del lema 1 puede obtenerse que el ángulo de giro < p satisface — 1 + 2 eos c = traza ( T ) = — 1 p P o r tanto, < = n¡2 o 2>n/2. En este caso esta condición no es suficiente para determinar p el ángulo de giro. U na form a de determinarlo es tomar un punto Q en el plano de simetría n, y hallar su imagen Q'; si 2 = (0, 1, 0 ) e 7r,

w

p p ' = _ F p " = - A - T (P ') + A + T { P ) = - T ( P P ' )

w

w

.M

donde P " es la imagen de P ' y P ' es la imagen de P. P o r tanto,

at

em

P" = P

at

ic

a1

.c

om

I2
Q' =

lo
+

0 -1 0

-i 0

2 \2

0
l 1

l°\

1

=

I 2

/ +

0 \ -1 0/ =

2

/ 2 \ 1
i 2 /

Ì

0 / \°/

\

2/

y del gráfico se deduce que <p= — .

E j e m p l o F.

Estudiar el m ovim iento de ecuaciones
-2

E j e m p l o G.

Estudiar el m ovim iento M de ecuaciones

\

P' =

0

-2 / C om o /1 I —T =
0 1

/ \
y' \ , / Puesto que r(I-T )= 1 \ 2' /

/i

\
"2
1

0 0
\ 1
0

0
1

1 ~2)

como
1 0 1 —2

\ , r{I-T \ A )= í

{I-T \ A )= \

0 0 0
1 0 1

0
- 2 /

/-r =

/ 2/3 2/3 2/3 \ / 2/3 2/3 2/3 1 2/3 2/3 2/3 y (/-r M ) = 2/3 2/3 2/3 1 V2/3 2/3 2/3 l 2/3 2/3 2/3 0 /

1

om at ic a1 .c

por tanto, es una simetría. El plano de simetria es el conjunto de puntos fijos y, por tanto, satisfacen / ~ 2 \ y W = \ - 2 / + |
- 1

r { l — T ) = 1 y r ( I — T |A ) = 2. El m ovim iento es una simetría deslizante. Los puntos P del plano de simetría satisfacen P p ' = P P ” , donde P ' = M { P ) y P " = M (P ') . P o r tanto,

0 0
0 1 0

-1

\ /x \

I - 2\

I -z

\

.M

at

em

P P ' = A + T ( P ') - A - T ( P ) = T (P p ').

w

Se trata del plano x + z = —2, que ha sido dibujado en la figura adjunta.

D e aquí deducimos que P satisface

0= (/ — T ) ( P p ') = (/ -

T )(A + T ( P ) - P ) -

= ( I - T ) ( A ) - ( I - T ) 2(P )

< tí C Q “5 O , W * < « u: Q P O C. < < Q E► J
C /3

£ E ;* -i O <
ú

w

w

á o

Z i» ÍZ C < o U fe o s < < > cu fc w w « ir Q | §

u < tu T odas las rectas perpendiculares al plano de simetría son rectas invariantes; estas rectas tienen por ecuaciones (c 1; c2, c3) + í(l, 0 , 1 ) , t e U con (c l 5 c2, c3) un punto cualquiera de n. Si P = (x, y, z) esta ecuación se transforma en

o Q

P o r tanto, x + y + z = 1 es la ecuación del plano de simetría n. Para encontrar el vector de traslación tomamos P = (l, 1 , — \ )en, con lo cual tenemos

A
I i \ p =
1

/' \
- i

V/ o

i

~2
1

IW
d) La composición M 3 ° M 2 y M 2 ° M 3. 3. Encontrar los movimientos del espacio que conmutan con la simétrica respecto del plano z = 0 .

-

2 /
1 1 1

El vector de traslación a es

l\ \
a=PP' =
3
2

4.
\

D ado el movim iento helicoidal

-2 /

om a1 em at ic w .M at .c w
el espacio:

- i El plano 7i es una subvariedad invariante de este movimiento. Las subvariedades invariantes de dimensión 1 de este m ovim iento son todas las rectas contenidas en el plano 7i que tienen a" = ^ ( l , 1 , — 2 ) como vector director.

encontrar su descomposición canónica. 5. a) Dados los planos paralelos n 1 y n2 de ecuaciones 7^ : x + y = 1 y n2: x + y = 4, encontrar las ecuaciones del m ovim iento M = S„2° SKi. Dem ostrar que M es una traslación y encontrar su vector de traslación. b) Demostrar que para cualesquiera dos planos paralelos n l y n 2 en IR3, M = SK2° Sni es una traslación; encontrar el vector de traslación.
6.

1. a) b) c) d)

Encontrar la expresión analítica de los siguientes movimientos en Simetría respecto al plano 3 x — y + 2z = l.

w

E J E R C IC IO S (S E C C IO N E S 10.4 Y 10.5)

a) Dados los planos y n 2 de ecuaciones z = 1 y 7r2: x + y — z = 2, encontrar las ecuaciones de M = Snt ° S^2. Dem ostrar que M es un giro con respecto a un eje y encontrar el eje y el ángulo de giro. ¿Qué relación existe entre el eje del giro M y los planos

b) c)

y tt2?

M ovim iento helicoidal respecto al eje {/ (l, — 1, 0)} con un giro de 180° y vector de traslación ¥ = ( 2 , — 2 , 0 ). G iro cuyo eje pasa por (1, 1, 0) y (0, 0, 1) y que envía (0, 1, 0) en Com posición de los movim ientos a) y b). Estudiar los siguientes movim ientos en el espacio, hallando su tipo, subvariedades (1, 1, 1).

¿Qué relación existe entre el ángulo de giro de M y el ángulo que forman ti x y n2?

2.

7. Sean T, C e ^ # 3 x 3 (lK) con |C|/0. Dem ostrar que si J = C ~ 1T C , tra za (J) = tra­ za (T). [ Sugerencia: si P T(X) = — / 3 + a2k2 — a¡Á + a0 es el polinom io característico de T, demostrar que a2 = traza ( T ) ; utilizar a continuación que P T(k) es invariante mediante un cambio de base (capítulo 7)].

invariantes y elementos geométricos:

i /2
(x \ a) Mi y = / - i i \ +

72 2 0
7 2

1 2 72 2 1 2

7 2

El resto de los problemas de esta sección están dedicados a la composición de movimientos en el espacio. Están pensados para que se resuelvan utilizando razona­ mientos geométricos en lugar de razonamientos analíticos. Se da la solución del primero de ellos para que el lector se familiarice con la forma de demostración.

V Ì

\

o j

\

1 2

/

8.

D em ostrar que la com posición de dos simetrías con respecto a dos planos paralelos es una traslación. [Sol.: Sea ~ un vector perpendicular a uno cualquiera de v

los planos n 1 o n 2 que nos da la distancia entre ellos com o muestra la figura adjunta. Basta demostrar que
T

CAPITULO 11

' 1OC OC =1

SECCIONES CONICAS

11.1. 11.2. 11.3. 11.4. Para todo punto P , T ^ 1 ° ° Sní( P ) = T^-H-R), donde P R ± 7^ y \\Fk\\ = ]|P^|| + \\Q k\\

D efin icio n es L a circu nferen cia y algu n a de sus p rop ied a d es L a elipse y la h ip érb o la N u e v a d efin ició n de las secciones cónicas: la elipse, la h ip é rb o la y la p a rá b o la E cu acion es de las cón icas en un sistem a de co o rd en a d a s cartesian o D e te rm in a c ió n de las cónicas D e te rm in a c ió n d el tip o de una có n ica In va ria n tes de las cón icas y redu cción a su cen tro fo rm a ca n ón ica con D e te rm in a c ió n del cen tro y de los ejes prin cip ales de una có n ica

om a1 ic em at .M at w w w .c

= 2\\P0Q\\+2\\QQ0\\=2\\P0Q 0\\=2d(xi , 7t2) = 2||if||. Entonces T% 1 ° S „ 2 ° Sni( P ) = T f l ( R ) = P ~ \ 9. Dem ostrar que la composición de dos simetrías con respecto a planos secantes es un giro alrededor de la recta común de los dos planos y de ángulo doble del que form an los planos. 10. 11. Dem ostrar que la composición de dos simetrías centrales es una traslación. Sea Sr una simetría axial de eje r y T j una traslación de vector <f tal que 1? es

11.5. 11.6. 11.7. 11.8. 11.9.

11.10. D e te rm in a c ió n d el vértice y del eje de una p a rá b o la

perpendicular a r. o) Dem ostrar que 7 j ° S r es una simetría axial de eje l que es la trasladada de r b) 12. mediante el vector a/2. Dem ostrar que Sr ° es una simetría axial de eje l' simétrico de l con respecto a r. a) D em ostrar que la com posición de dos simetrías axiales respecto de ejes

11.1.

D E F IN IC IO N E S

secantes es un giro. b) Dem ostrar que la composición de dos simetrías axiales respecto de ejes que se cruzan puede escribirse com o la composición de un giro y una traslación.

U n doble cono recto es la figura que engendra una recta g al girar alrededor de una recta h que la corta. La recta h se denomina eje del cono y las distintas posiciones de g, generatrices del cono; el punto de intersección del eje con una cualquiera de las generatrices del cono se denomina vértice. T od a figura (plana) que se obtiene com o intersección de un doble cono recto con un plano que le corta se denomina una sección cónica. Según las distintas posiciones del plano de corte las secciones cónicas, o simple­ mente cónicas, reciben nombres diferentes, que se dan a continuación (ver figura 2 ). a) Si el plano es perpendicular al eje del cono, y no pasa por el vértice, la cónica se denomina una circunferencia. En el caso especial de que el plano pase por el vértice se obtiene un punto.

d)

Si el ángulo que forman el plano y el eje de giro es inferior al ángulo que forman el eje y una cualquiera de las generatrices, la cónica se denomina hipérbola, salvo en el caso especial en que el plano pase por el vértice, en cuyo caso se obtienen dos rectas que se cortan.

Los casos especiales que aparecen en los casos anteriores se denominan secciones cónicas degeneradas y son puntos, o rectas o pares de rectas que se cortan. D e ellos no nos ocuparemos aquí por haber sido estudiados anteriormente. La primera persona que estudió las secciones cónicas fue Menaechmus de Grecia, com o consecuencia de su interés en el problema de construir con regla y compás un cubo de volumen doble al de un cierto cubo dado; esto sucedió en el siglo iv antes de Cristo. En el mismo siglo el geóm etra Euclides escribió cuatro libros sobre las secciones cónicas, de los cuales ninguno se conserva actualmente. El primer tratado escrito que se conserva sobre las secciones cónicas es debido a A p o lon io de Perga; en sus ocho libros, de los cuales se conservan sólo los siete primeros, A p o lon io fue el primero en estudiar las propiedades geométricas de las secciones cónicas. Varias de estas propiedades geométricas serán estudiadas en las secciones siguientes.
Figura 1

.c

om ic a1
11.2. L A C IR C U N F E R E N C IA Y A L G U N A D E SUS P R O P IE D A D E S

w

.M

at

En la circunferencia la distancia del vértice V a un punto cualquiera P de la circunferencia es constante; com o V C es fijo, donde C es el punto de intersección del plano y el eje del cono (figura 3), se tiene que

em

at

d) Hipérbola

Figura 2

b)

Si el plano no es perpendicular al eje del cono y forman entre sí un ángulo superior al ángulo que forman el eje del cono y una cualquiera de las generatri­ ces, la cónica resultante se denomina elipse, salvo en el caso especial en que el plano pase por el vértice, en cuyo caso se obtiene un punto.

c)

Si el plano es paralelo a una cualquiera de las generatrices la cónica se denomina parábola, excepto si el plano pasa por el vértice, en cuyo caso se obtiene una recta.

w

w

\\CP\\=y/\\VP\\2-\\VC\\2

Figura 3

es constante para todo P de la circunferencia. Tenemos entonces P r o p o s ic ió n 1---- ----------------------------------- ---------------------------------------------Una circunferencia es el conjunto de puntos P de un plano n que satisfacen que su distancia a uii punto fijo C, llamado centro, es constante. Esta constante se denomina radio de la circunferencia. P r o p o s ic ió n 2-------------------- -------------------------- ----------------------------------------Sean A y B dos puntos de un plano. U n punto P del plano pertenece a la circunferencia en la que A y B son diametralmente opuestos si y sólo si los vectores ÁP y BP son perpendiculares.

Demostración. Sea r el radio de la circunferencia y u un vector unitario en la dirección de ÁP. Para k=\\ÁP\\ se tiene que

r2= ||CP\\2 = ||C l + AP\\2 = ||C A +
= k2 + 2k(CA, iT )+ |CA||2. |

ku ||2

=

Si consideramos la ecuación en k, k2 + 2k(CA, u)+\\CA\\2- r 2 = 0, ésta ha de tener una solución únicamente, ya que ÁP es tangente a la circunferencia, y esta solución es k = ||v4?||. La ecuación de segundo grado tiene solución única si y sólo si

{CA, m = |C A ||2 — r 2 *)2 | Demostración. Sea r el radio de la circunferencia y C su centro. El plano en el que estamos trabajando es «iso m o rfo » a un plano euclídeo y, por tanto, podemos suponer que en él se tiene el producto escalar usual, denotado por ( , ). Entonces tenemos (figura 4): r 2 = lic ? n 2 = ( c ? , c P )= ( c a + a P, c í + b P)= y esta solución es IIA P u = A = - ( C A , u ) Si v es un vector unitario en la dirección de produce

(1)

(2 ) el mismo razonamiento anterior

= ( c a , c É)+(C a , b P)+( a P, c é )+(a P, b P) =

ÁP'

.c

= —r2+ (CA, B p ) - ( C Á , ÁP) + {ÁP, B p ) = = —r2+(CA, b P - á P) + (A?, BP) = = - r 2+(C2, BA) + (ÁP, B p ) =
= - r 2+ 2r2+(ÁP, B p ) = r2+ (ÁP, 5P)

om

at

ic

a1

( C l , v - ) 2=\\CA\\2- r 2

(3 )

y

em

w

.M

Esto es equivalente a (ÁP, B P ) = 0, lo cual demuestra el resultado.

at

\\Á '\\ = P

~ (C A ,

v)

(4)

D e ( 1 ), ( 2 ), (3) y (4) se deduce que ||A?|| = \\ÁP'\\. Además, de ( 1 ) y ( 2 ) obtenemos II II2 = IIC A ||2 — H C ? || 2 y, por tanto, el triángulo C P A satisface el teorem a de Pitágoras. Esto prueba que C P A tiene un ángulo recto en P, lo cualdemuestra la proposición. g

P r o p o s ic ió n 3 _ _ ----------------------------------------------------------------------------------Consideremos una circunferencia de centro C y un punto A exterior a ella. Si P y P ' son los puntos de intersección de las tangentes a la circunferencia que pasan por A se tiene que ||A?|| = |ÁP'\\. Además, C P es perpendicular a ÁP. | 11.3. L A E L IP S E Y L A H IP E R B O L A

w

w

P r o p o s ic ió n l ____________ _______________________________________________ _________ Una elipse es el lugar geom étrico de los puntos A de un plano cuya suma de las distancias de A a dos puntos fijos y distintos, llamados focos, F 1 y F 2, es constante (HÁj^U + \ Á 2\ constante). \P \ =

Demostración. Sea n el plano dado que form a con el eje un ángulo m ayor que a, sin ser 90 , Considerar las dos esferas tangentes al cono y al plano com o muestra la

figura 5. Estas esferas tocan al plano n en los puntos F 1 y F 2. P o r la proposición 3 de la sección 1 1 .2 :

\ áP \ \a\ \ 2\ \ \ = ñ y

lla lli

=

\ \ A M \ \

C om o \\AÑ)\ + \\ÁKí\\ = \\JL\\, que es fija, se tiene que IIÁF'ill + \ A 2\ ||JL|| =constante \P \ = ■

Figura 6 Quizá es conveniente explicar la igualdad a = H ^ F J ; esta igualdad es consecuen­ cia del siguiente lema cuando A = B 1.

om at ic a1 .c .M at em

L ema 2 Para todo punto A de una elipse se tiene que ¡ ¡ A p ^ l + \\Ap2\\-2a.

Demostración. U tilizando la definición de elipse \\APi | + |a P 2II = constante; si en | | lugar de A ponemos A i y A 2, se obtiene l i l i l í + II P o r tanto, l l a l l i + l l a l l i + II^
2 1! =

w

w

w

II = constante = |A ¡ F Í | + \\A¡P2\. | | \

II¿ ¡ ^ 2 II + l l a l l i + l l e u ­

de aquí deducimos 2\\A^P1\\=2\\A^P2\ o equivalentemente, H ^ í i l l = ll'M ^ II- U tili­ \ zando este resultado se tiene

6,

Si dibujamos la elipse en un sistema de coordenadas cartesianas, com o en la figura el eje que contiene a los focos se denomina eje principal y el eje perpendicular al eje m ayor que pasa por el punto m edio del segmento F Í F 2 se denomina eje secundario. Si a, b y c son las distancias indicadas en la figura 6 , 2c se denomina distancia focal, a se denomina semieje principal y b se denomina semieje secundario. A l cociente e = c/a, entre c y a, se le denomina excentricidad y com o a > c, se tiene que 0 < e < 1 en el caso de la elipse. Entre a, b y e existe una relación que puede encontrarse aplicando el teorema de Pitágoras a F ^ B ^ . a2 = \\Bi F í \2 = b2 + c2 => b = J a 2 — c2 = y f — s2a2 + a2 = a^/l — e2 \

IIAF\ II + IIÁ P 2II = constante = |A J x | + |A ^ P 2 1|= | | | II+ 1 1 ^ ) 1 = 11^ * * *
211= 2 a

P r o p o s ic i ó n 3______________________________________ Una hipérbola es el lugar geom étrico de los puntos P de un plano cuya diferencia de distancias a dos puntos fijos y distintos, F ¡ y F 2, llamados focos, es constante en valor absoluto (IIP?-!|] — ||PF2| = ± 2 a , con a constante). |

Demostración. Considerar las dos esferas tangentes al cono y al plano n como muestra la figura; sean F , y f 2 los puntos de contacto del plano y las esferas. P o r la proposición 3 de la sección 11.2 IIP ÍJ H IP ? !

y

||PF2| = ||PP"|| | C om o |P P " | - 1P P ' | = IIP7 | | | | ?"|| = |T l ||= constante, se tiene que | || PP21|— IIP?! | = constante | ■

om

a1

.c

Figura 8

w

.M

at

U na dem ostración análoga a la del lema 2 prueba que ||P?'1| — ||P?,2 ll = ± a | ( + a si P está en la rama de la derecha y — a si P está en la rama de la izquierda). Para una hipérbola la excentricidad es e = c/a con c > a , y, por tanto, e > l . P o r analogía con el caso de la elipse definimos b como b = y/c2 — a2

w

w

em

at

ic

C

es decir, el cateto de un triángulo rectángulo que tiene a c com o la hipotenusa y a a com o el otro cateto. Entonces b = s/ a 2e2 — a2 = a^/e2 — 1 El parámetro b tiene un significado geom étrico que está relacionado con las asíntotas a cada una de las ramas de la hipérbola. Recordamos que se denominan asíntotas a la hipérbola (en general a una curva plana) a las rectas que se acercan a la hipérbola (curva) en los puntos del infinito. Demostraremos que: las rectas que pasan por el centro y tienen (a, b) o (a, — b) como vector director son asíntotas de la hipérbola.

En la figura 8 se ha dibujado una hipérbola en un sistema de coordenadas cartesianas de manera que el eje principal contiene a los focos F u F 2 y el eje secundario es perpendicular al eje principal y divide al segmento F 1 2 en dos partes iguales. Los F demás elementos de la hipérbola reciben los mismos nombres que en el caso de la elipse y están señalados en la figura 8 .

La dem ostración que damos de este hecho es sólo aproxim ada, por cuanto no utilizaremos la «correcta » definición de límite.

Figura 10 Figura 9

D e acuerdo con la proposición 1 podemos decir que una cónica de fo c o F, directriz l y excentricidad e > 0 es el conjunto de todos los puntos P de un plano que verifican Si C' y C " son com o en la figura 9 (derecha) se tiene que cuando P va hacia el infinito,

om

\\FP\\=ed(P, l) Demostración. Sea n el plano cuya sección produce la cónica al cortarse con el doble cono recto y considerar la esfera inscrita en el cono y tangente al plano n como en la figura 1 1 .

IIC'C"|| ~ ||PF1 ||-||PF2 !|=2a

11.4.

N U E V A D E F IN I C IO N D E L A S S E C C IO N E S C A N O N IC A S : L A E L IP S E , L A H IP E R B O L A Y L A P A R A B O L A
1_________________________ ____________________________________________________________

P r o p o s ic ió n

Dada una cónica no degenerada existe siempre un punto F, llam ado foco, una recta l, llam ada directriz (ambos en el plano de la cónica) y un número e > 0 tal que todo punto P de la cónica satisface ||PF|| =ed{P, l) Si e < 1 se tiene una elipse, si £ > 1 se obtiene una hipérbola y si e = 1 se tiene una parábola.

En la figura 10 se representan cónicas con el mismo foco F y la misma directriz l, pero variando la excentricidad.
Figura 11

w

w

w

.M

at

tanto, t g a = ± ^/sec2 a — 1 = ± N e 2— 1 = ±b/a. /

em

y, por tanto, a ~ ||0C'||. En el triángulo rectángulo O C ' F 2 se tiene cosa = l/£ y, por

at

ic

a1

.c

(Observar que en la figura 11 se ha representado el caso y > a (o bien /?<a), que corresponde a una elipse, pero el razonamiento sería el mismo si y = a = fi — parábo­ la— o y < a < p — hipérbola— ). Con los símbolos de la figura 11 se tiene que ||P?|| = ||P2 | |

Basta demostrar que cualquier otro punto P ' de / no puede estar en el interior de la elipse, puesto que entonces sólo toca a la elipse en el punto P y es la tangente. D e la figura 13 deducimos que

\\FJ>\\ + ||P?2| = H^PH + ||PF'| = H F jF J < líF ^ 'H + ||P'F'2|, | | | debido a la proposición 3 de la sección 11.2. Entonces, HPÍ" | | ||P^|| ||?4||||PM||/cosa ||P^||||PM||/cosy cosy_ cosa en donde la última desigualdad es debida a la desigualdad triangular. Entonces |/ 1 P'|| |r + ||P'F2| > 2 a y P ' está siempre fuera de la elipse, que era lo que queríamos demostrar. | La otra bisectriz es precisamente la normal a la elipse en el punto P. ■ La proposición 2 expresa una propiedad de las elipses que puede considerarse com o « e l secreto del salón o v a la d o » (ver Cuentos con cuentas, M . de Guzmán, Editorial Labor). En un salón en forma de elipse, el sonido emitido por una persona colocada en uno de sus focos F t se refleja en sus paredes pasando siempre por el otro foco F 2, de manera que un sonido en F { puede ser perfectamente audible en F 2 e irreconocible en cualquier otra parte del salón.

y, por tanto, \\Pp\\=e\\PQ\\=£d(P, l).

Figura 12

las parábolas.

La tangente y la normal a una elipse en un punto P de ella misma son las bisectrices de las rectas que unen el punto P con los focos. Demostración. Dados los focos F 2 y un punto P de una elipse, sea l la bisectriz P r o p o s ic ió n 3________________________________________________________________________ La tangente y la normal a una hipérbola en un punto P de ella misma son las bisectrices de las rectas que unen P con cada uno de los focos. Para la hipérbola se tiene una proposición semejante a la 2, que se deja como ejercicio.

de las rectas P F X y P F 2 com o indica la figura 13.

w

P r o p o s ic ió n 2________________________________ _______________________________________

w

w

.M

at

D am os a continuación algunas propiedades más de las elipses, las hipérbolas y

em

*

*

*

at

Observar que y y a son constantes.

ic

a1

En el caso de la elipse, y > a y, por tanto, eos y < eos a; se tiene, pues, que e < l . Si y = a, £ = 1 y se tiene una parábola. Si y < a , e = eosy/eosa> 1 y se tiene una hipérbola.

.c
Para la tangnte y la normal a una parábola se tiene la siguiente proposición. P r o p o s ic ió n 4_____________________________________________________________________ La tangente y la normal a una parábola en un punto P son las bisectrices de la normal a la directriz por P y la recta que une el punto con el foco F.

Figura 13

om

Los elementos principales de una parábola se describen en la figura adjunta. Observar que 2d(F, V) — d(F, /) ya que para el punto V se tiene que d(F, V) = d(V, 1 }

Demostración.

Si r es la bisectriz de las rectas d y P F y P ' es cualquier otro punto

de / de la figura 14 se deduce que , \\FF\\ = \\FA\\>d(P',D

a1 at ic
Figura 14

.c
E JE R C IC IO S (S E C C IO N E S 11.2, 11.3 Y 11.4) 1. La figura muestra lo que ocurre si fijamos un vértice Vu un foco contiguo F l de una elipse y variamos e (excentricidad). Hallar, en función de e (0 ^ e < 1), la posición del centro, del otro vértice y la longitud del semieje b.

y, por tanto, P ’ está en el exterior de la parábola.

L a proposición 4 expresa la propiedad de los espejos parabólicos de que todo rayo de luz procedente del infinito se refleja en su superficie interior pasando por el foco. Recíprocamente, cualquier foco de luz situado en el foco de un espejo parabólico (de revolución) produce un haz de rayos paralelos. Los faros de los coches tienen una form a que se aproxima a la de los espejos parabólicos.

w

w

w

.M

at

em

om
2.

<e<oo,

La misma pregunta que en el problema anterior para una familia de hipérbolas, 1 calculando la posición de las asíntotas.

— 1---- •vi I Fi

3. D ada una circunferencia de centro C y radio r y un punto A exterior a ella, se considera cualquier recta s que pase por A y corte a la circunferencia com o en la figura. Demostrar que \\AP\\\\AP'\\ = \\A^\\—r 2.

Poniendo la primera de las raíces en el primer término y elevando el cuadrado se tiene Nota. \ P|¡ \\A P'j| se denom ina potencia del punto A respecto de la \A circunferencia dada. El ejercicio 1 demuestra que MP|| ||A?'|| no depende de la recta s. 4a 2 + x 2 + 2ex + c 2 + y2 — 4 a^/(x + c) 2 -I- y2 = x 2 — 2ex + c 2 + y2 que una vez simplificado nos permite obtener

a2 + ex = as J(x + c)2+ y2

om a1 .c

11.5.

E C U A C IO N E S D E L A S C O N IC A S E N U N S IS T E M A D E C O O R D E N A D A S C A R T E S IA N O

Elevando de nuevo al cuadrado se obtiene
a 4 - I-

2 exa2+ c2x2 = a2x2+2a2ex + a2c2 +a2y2.

at

Es conocido que la ecuación de una circunferencia de centro el origen y radio r es

ic at em
Teniendo en cuenta que b2 = a2—e2 obtenemos

x 2 + y2 = r 2 mientras que si su centro está en el punto C = {c1, c2) su ecuación es ( x - c i ) 2 + ( y - c 2) 2 = r 2

(1)

w

.M

a2b2= b2x2 + a2y2.
que puede escribirse de la forma x2 y2

w

w

a¿

bl

(2 )

Si la elipse tiene su centro en el punto (c 1; c2) y sus ejes son paralelos a los ejes coordenados su ecuación es ( x - C i )2 [ y - c 2) 2

Tratem os de hallar ahora la ecuación de una elipse de semieje principal (o m ayor) a y los focos situados en los puntos (c, 0) y ( —c, 0) con a > c . U tilizando la proposición 1 de la sección 11.3 tenemos 2a=\\PF1\ + \\PF2\\=^/{x + c)2+ y 2 + J { x - c ) 2 + y2 \

Para hallar la ecuación de una hipérbola de semieje m ayor a y focos en los puntos ( — c, 0 ) y (c, 0 ) se procede com o en el caso anterior, mediante la utilización de la proposición 2 de la sección 11.3: ± 2 a = \ \ P F 2\\-\\PF1\ \ = J ( x - c ) 2 + y2 - y/(x + c ) 2 + y 2

y2 x 2 Si la elipse tiene los focos en el eje O Y, su ecuación es — + — = 1 a b y2 x 2 con a > b , y si se trata de una hipérbola su ecuación es — — - = 1 . a b Observación. * * * 0 ) se

La ecuación de una parábola de directriz x = —^ y foco en el punto obtiene de la proposición 1 de la sección 11.4:

11^11= / ( * “

) + y 2= d (P ,d )= x + p

P o r tanto,

a2 + xc= T dy/(x + c)2+ y2.

.M

Elevando de nuevo al cuadrado y teniendo en cuenta que b2= c2—a2 se obtiene

at

em

at

que simplificando nos permite obtener

ic w w w
Elevando al cuadrado y simplificando se obtiene y2 = 2px Algunos casos más, con sus ecuaciones, se dan en las figuras siguientes. (4) (y - c 2) 2 = . b2

Si la elipse tiene su centro en el punto (c l5 c2) y sus ejes son paralelos a los ejes coordenados su ecuación es (x - c O 2 a2

a1

4a 2 ± 4ax/(x + c) 2 + y1 + (x + c) 2 + y2 = (x — c)2 + y2

.c

om

( y - c 2)2= - 2 p ( x - c í)

*

*

*

*

*

Las ecuaciones (1), (2), (3) y (4) reciben el nombre deform a canónica de la cónica correspondiente y es conveniente observar que en la forma canónica el eje principal coincide con el eje O X .

Casos más complicados se presentan cuando los ejes de la cónica no son paralelos a los ejes cartesianos; para familiarizar al lector con las ecuaciones de tales objetos realizamos algunos ejemplos, advirtiéndole que conviene intentar su realización antes de mirar la solución.
Eje m plo

Elevando al cuadrado y simplificando adecuadamente se obtiene + 2x — 4 y + \ + 4 - 4 J 2 J ( x + l ) 2 + (y — 2)2 = —2 y + \ o bien x —y + 6 = 2 v /2 N/ ( x + l ) 2 + ( y - 2 )2. /

x = — y.

Encontrar la ecuación de la parábola de fo c o (y/l, y / l) y directriz Si P = (x, y) es un punto de la parábola se ha de tener
A.

\\PF\\ = v / ( x - V 2 ) 2 + ( y - V 2 ) 2 = d(P, x = - y ) =

\x + y \
Elevando de nuevo al cuadrado se obtiene x 2+ y 2 + 36 — 2x y + 12x— 12y = 8 [ x 2 + 2x + 1 + y 2 — 4_y + 4] que es equivalente a 7x 2 + l y 2 + 2xy + 4x — 20y —4 = 0 * * *

o bien x 2 + y2 — 2xy — 4^f2x — 4^/2y + 8 = 0 *
EJEM PLO

*

*

B.

Encontrar la ecuación de la elipse de focos (0, í ) y ( — 1,2) y semieje Si P = (x, y) es un punto de la elipse se tiene
2v /2

mayor a = y/l.

= v /(x + l ) 2 + (y — 2 ) 2 + y (x — 0 ) 2 + (y — l ) 2

w

x 2- 2 x ^ 2 + 2 + y2- 2 y ^ 2 + 2 = ( x 2 + 2xy + y2)/2

w

w

.M

Elevando al cuadrado se obtiene

at

em

at

ic
es la ecuación pedida. Elevando al cuadrado obtenemos 9

a1

.c

om

E J E M P L O C. Encontrar la ecuación de la hipérbola de directriz 2x — y + 3 = 0, fo co en el punto (3, — 1) y excentricidad £ = 3.

x 2 — 6x + 9 + y2 + 2y + 1 = - [4x2 + y2 + 9 — 4 x y + 12x — 6y]

31x2 + 4y 2 — 3 6 x y + 138x —64y + 31 = 0 * * *

EJEMPLO D. Encontrar la ecuación de la parábola de fo c o (1, 5) y vértice (2, 2). La directriz es una recta perpendicular al eje de la parábola (este eje pasa por

el foco y el vértice) y cuya distancia del vértice coincide con la distancia del vértice al foco. El eje de la parábola tiene por ecuación 5 -2 y -2 = j~ ^ (x -2 ) o bien 3x + y — 8 = 0

Elevando al cuadrado y simplificando se obtiene 10[x2 — 2x + 1 + y 2 — 10y + 25] = x 2 + 9y2 + 36 — 6 x y — 12x + 36y o bien 9x2 + y2 + 6xy — 8x — 136y + 224 = 0 * * *

Observar que cuando el eje de la sección cónica está girado con respecto a los ejes coordenados, en la ecuación de la cónica siempre aparece un término de la forma xy.

E JE R C IC IO S 11.5 1. Considerar la elipse y la circunferencia que se indican en la figura adjunta. Si por cualquier punto S del eje O x se traza una paralela al eje O y que corta a la elipse en el punto P y a la circunferencia en P', demostrar que ||PS|¡ = a b

d: x — 3y = c; determinamos c imponiendo que

d(V, d)=||fy||=v / l2 + 32 = v/K)
por tanto, 2. Escribir las ecuaciones de las parábolas de foco (2, — 1), que pasan por (2, 2) y tienen el eje en la dirección del eje Ox. 3. Escribir la ecuación de la hipérbola con un foco en (2, — 1) — 4y = 0. 4. Las posibles directrices son x — 3y = — 14, x — 3y = 6 ; la primera de estas rectas pasa por el punto (1, 5) y, por tanto, no puede ser la directriz; concluimos que x — 3y = 6 es la directriz de la parábola. L a ecuación de la parábola es, por tanto, 5.
6.

w

w

w

Una recta perpendicular a ésta tendrá por ecuación

.M

at

em

at

ic

a1

.c

om

y asíntotas x = 0, 3x

v 10= 2 ~~3 ' 2 ~ r y io

;

10 = | —4 —c|

;

c= -1 4 , c = 6

Escribir la ecuación de la elipse con vértices ( — 1, 2) y ( — 7, 2), y eje menor 2b = 2. Escribir la ecuación de la hipérbola con asíntotas y = ± 2 x — 1 y un foco en (3, — 1). centro en (3, — 1) y

Escribir la ecuación de la elipse con un vértice en ( — 1, 1), excentricidad 1 /2 .

\ \ P F \ \ = ^ ( x - l ) 2+ ( y - 5 ) 2 = d ( P , d) = '----y io

/---------- ;---------------r-

¡X — 3 V — 6|

11.6.

D E T E R M IN A C IO N D E L A S C O N IC A S

Hem os visto en los ejemplos de la sección precedente que las ecuaciones de las cónicas que allí se obtuvieron vienen dadas mediante polinomios de segundo grado en dos variables. Esto es cierto para cualquier cónica y para demostrarlo utilizaremos el hecho de que toda cónica no degenerada es el lugar geométrico de los puntos P que satisfacen |P F | = sd(P, l), donde F es el foco y /la directriz (ver sección 11.4). Sea F = ( c 1, c2) | | y l: ax + by + c = 0. L a igualdad \\PF\\=ed(P, l) se transforma en ^ / ( x - c 1) 2 + ( y - c 2) 2 = e^aX + by + C J a 2 + b2

I

donde P = ( x , y). Elevando al cuadrado y multiplicando por a2 + b2 se obtiene (a2 + b2)(x — c 1 2 + (a2 + b2)(y — c 2) 2 = e2[a x + by + c ] 2. ) Después de efectuar las operaciones indicadas en la fórmula anterior y de agrupar los términos adecuadamente se obtiene:

a1
D = — 2Ci(a 2 + b2) — 2e2ac, E = — 2c2(a2 + b2) — 2e2bc
x 2+

donde A = a2 + b2 — e2a2, B = a2 + b2 — e2b2, C = — 2s2ab

.c
B'y 2 + C'xy + D ’x + E'y + F ' = 0 1 ________________________________________________________________________________________

L a igualdad (1) será denominada ecuación general de una cónica y muestra que toda cónica es una expresión polinóm ica de segundo grado en dos variables. Para determinar una circunferencia es necesario conocer tres puntos de ella. Para determinar una cónica es necesario conocer más de tres puntos puesto que la ecuación (1) posee seis incógnitas A, B, C, D, E y F. D ividiendo entre A se obtiene una ecuación de la forma

y, por tanto, sólo tenemos cinco incógnitas. En efecto, éste es el número m áxim o de puntos que se necesitan para determ inar una cónica no degenerada. El prim er matemático que probó este resultado fue Blaise Pascal. En 1639, a sus diecisés años, B. Pascal (1623-1662) logró demostrar el siguiente teorema:
T eorema

Sean l l t l2, l3, lA, l 5, l6 los lados de un «h ex á go n o » cualquiera inscrito en una cónica arbitraria (una elipse en la figura 1 o una hipérbola en la figura 2). Entonces, los tres puntos de intersección de cada dos lados opuestos l x/ l2l5y l 3l6 están situados sobre 4, una recta, llamada recta de Pascal.

w

w

w

.M

F = (a2 + b2) [ c l + c 2J — s2c 2

at

em

at

ic

om
El teorem a de Pascal puede utilizarse para dem ostrar que cinco puntos son suficientes para determinar una cónica. En efecto, supongamos que conocemos cinco puntos de un plano com o en la figura 3. Trazamos las rectas que unen estos puntos en orden cíclico, com o en la figura 3.

A x 2 + By2 + Cxy + D x + E y + F = 0

(1)

El punto A de intersección de /j y lA es un punto de la recta de Pascal de esta cónica. Tom ando una recta cualquiera que pase por A se obtienen B y C com o los puntos de intersección de esta recta con l2 y / P o r B se traza una recta que pasa por 5 3. y por C se traza otra recta que pasa por 1; el punto de intersección de estas dos rectas es un punto ( 6 ) de la cónica. N u evos puntos de la cónica se obtienen tom ando diferentes rectas que pasen por A. El teorema de Pascal puede demostrarse utilizando el denominado «prin cipio de dualidad», que para que nos entendamos puede enunciarse en este contexto diciendo que si se intercambian «p u n to s» por «rectas», «cortar dos rectas» por «unir dos puntos» y «puntos de la cónica» por «tangentes a la cónica» todo teorema cierto se convierte en otro teorema cierto. Con la ayuda de este principio, Brianchon (17851864) demostró en 1806 el teorema de Pascal. La demostración de Brianchon se encuentra elegantemente expuesta en el libro M ira r y ver, de M . de Guzmán (Ed. Alhambra).

ortogonales en [R2 son los giros y las simetrías, si imponemos, además, que la nueva base conserve la orientación, C debe ser un giro. Si (x l5 y j son las nuevas coordenadas se tiene

yj
y puesto que C' = C
1

= C

(puesto que C es ortogonal) (2) puede escribirse de la forma

(x , y ) A y \ = ( x l , y J C

» (o

Z X * ) ~ i,x}+Áixi

donde y X2 son los autovalores de A. Hem os logrado, pues, eliminar el término xy mediante un giro de los ejes coordenados. La ecuación (1) se transforma ahora en ^ 1 * 1 + ¿ 2 X 2 + & i*i + b2x 2 + b = 0

(3)

11.7.

D E T E R M IN A C IO N D E L T I P O D E U N A C O N IC A de la sección 11.6, la

.c

om

Antes de realizar ejemplos pasamos a estudiar los posibles casos que pueden presentarse en (3). C a s o I. ¿ = | l| = /l1A2> 0 /

La ecuación general de una cónica, que se obtuvo en (1) escribimos de la forma ú n X 2 + a12xy + a22y2 + at x + a2y + a = 0

ic at
(1 )

a1 em at

En este caso los autovalores Xu X2 tienen el mismo signo y siempre podemos tomarlos positivos en (3) y Puesto que (3) puede escribirse de la forma b2 — ~r~ + fe = 0 , 4X1 4X b\

.M

N o s preguntamos ahora si toda ecuación de la forma (1) representa una cónica y en caso de que la represente de qué tipo de cónica se trata. La observación fundamental se hizo ya en la sección 11.5 y es que las cónicas que tienen sus ejes paralelos alos ejes coordenados no poseen el térm ino xy, y que los términos en x y en ypueden fácilmente eliminarse mediante traslaciones. Los términos a n x 2 + a l2xy + a22y2 se denominan parte principal de (1) y pueden

w

w

w

2X1 la traslación dada por

2X-

=x, +

bi 2X1

escribirse de la forma 2X, a \2 ( flu a 11x 2 + a 12xy + a22y2 = (x, y) al2 \ 2
“ 22

transforma la cónica en (2) l/Xl + ñ -= c l/A

com o puede comprobarse fácilmente. Para eliminar el término xy en (2) procedemos de la siguiente manera: la matriz A es una matriz (real) simétrica; en el capítulo 8 se demostró que A puede diagonalizarse mediante un cambio de base ortonorm al y que sus autovalores son reales. Sea C la m atriz de cambio de base; puesto que C transforma una base ortonorm al (la canónica) en otra base ortonorm al debe ser una matriz ortogonal; com o las únicas matrices

b2 b2 donde c = ——H -— b. Puesto que siempre podemos tom ar X2 ^ A, > 0 (en caso — 4X± 4X2 sean negativos se cambian ambos de signo en (3)) hemos de tener \/Xl ^ l / ' / 2 tanto, la ecuación anterior es la de una elipse con los focos en el eje O x 2 si Si c = 0 se obtiene un punto y si c < 0 no se obtiene nada real puesto igualdad anterior es imposible. En este caso la cónica se dice que es de tipo elíptico.
C aso

de que y, por c> 0. que la

y, p or tanto, la traslación

b x2 —x t +-----bi y*2= y i + b2 2X2

b \
4/1^

II.

d = \A = Xí X2 < 0 \

En este caso Xx y X2 tienen distinto signo y, por tanto, siempre podem os tom ar X¡ > 0, X2 < 0. Mediante una traslación com o en el caso I, la ecuación (3) se transforma en X1x ¡ + X2y i = c Si 0, se tiene una hipérbola; si c = 0, se tiene

nos permite escribir y 2— —~ x 2, que representa a una parábola con el foco en la — á2 dirección de x2.

om at em at ic a1 .c w w .M

y± l i= J~éX
que representa un par de rectas de pendiente ± V /—

Si b t —0, (4) puede escribise de la forma

y, por tanto, la traslación

w

* 2 = *, y i —y\ + ^ r 2k 2

En este caso la cónica se dice que es de tipo hiperbólico.
C aso

H la transforma en y ¡ = ~ - , donde c = b - ^ ~ . Si 4X2

- f

>0,

j 2=

±

I

c
Á2

representa

III.

S = \ \ = X1X2 = 0 A

En este caso siempre podemos tomar Xl = 0, A2/ 0 (observad que los dos autovalores no pueden ser nulos a la vez, ya que entonces A = 0). P o r tanto, mediante un giro adecuado, (3) se transforma en X2y í + b1x 1+ b2y 1+ b = 0 . Si i> j^ 0 , (4) puede escribirse de la forma

dos rectas paralelas, si —— = 0 se obtiene un punto, y s i ----- < 0 X2 conjunto vacío.

se obtiene el

(4)

En este caso la cónica se dice de tipo parabólico.

A continuación realizamos varios ejemplos en los que dada una ecuación polinómica de segundo grado en dos variables, tratamos de identificarla y de encontrar sus elementos geométricos: ejes, focos, vértices, asíntotas, etc. D e ahora en adelante cada vez que pidamos estudiar una sección cónica, nos referiremos a encontrar todos sus elementos geométricos, así com o indicar su tipo y escribirla en form a canónica.
E je m p lo A.

Elegimos estos ejes com o nuevo sistema de coordenadas, de manera que la matriz C del cambio de base es

/— C=

-_ L \ x/ 2

Estudiar la sección cónica 3x2 — 2xy + 3y2 + 2x — 4y +

l =

0. Puesto

1

1

( 3 - 1\ que ^ = ( j^ ) ’ l^l = 8 > 0 y. por tanto, es una sección de tipo elíptico. Los autovalores de A son las soluciones de la ecuación ya que ux = \ —= , j 3 —A
0

^2 = ( ~ / ^ ’

)' ^ s' Pues’ tenemos

-1 3 —A

=

-1

= (3 - A) 2 - 1 = A2 — 6 A + 8 = (A - 4)(A - 2 ) ;

podemos elegir Xx = 2 , A2 = 4 para que tengamos A j^ A j. Tratam os ahora de encontrar los nuevos ejes de manera que el término —2xy desaparezca. ker(,4 — 21):

1

1

\x/2 o bien
1

em

at

ic

a1

.c

72y
1

om

1

.

.

v °;

, o

x = —y

w

1

-iV x \

/o

w

.M

ker {A —41):

x = -^ (x l-y 1 ), V 2

at

y = ^ (x l +y1 )

w

Sustituyendo en la ecuación dada se obtiene
3

~ ( x 1—y i)
1

,

— (Xi —

+J; + -(x1+ y i ) 2 + 1)
1

3

+ 2 — y^(x i ~ .Fi) —

++

que simplificando se transforma en

2x? + 4y2--------------------------- X l -- y 1 + l = 0 .

Puesto que esta igualdad puede escribirse de la forma

la traslación
1

Finalmente,
2 2 l2 3 3 3 c = a —b = --------- = — o 16 32 32

x 2 = x 1■
2 ^ 2

c=

3 /— \ 32

3 y i= y i 4^2

nos permite escribir 2xf + 4 yf = - , o bien

A + A = , 3/16 3/32 7 L que es la ecuación canónica de una elipse; para esta elipse se tiene a = - ^ - , b = /3" —.

*

*

* Puesto que A

Si C es el centro de la elipse, las coordenadas de C en el sistema de referencia {0; m ü *!, *2} son 1 3

om

Ejem plo 1 - 1

B.

Estudiar la cónica x 2 —2xy + y 2 + 4x — 6 y + 1 = 0 .

- 1\ , \A = 1 — 1 = 0 y, por tanto, es una cónica de tipo parabólico. Puesto que \
1

ic

a1

.c

at

em

4^2,

l —A
- 1

- 1

\ -k

=( 1 — A) 2 — 1 = 1 — 2 A + A 2 — 1 = A2 — 2 1

.M

P o r tanto, las coordenadas de C en el sistema de referencia {0; Tu ~ 2) son e

at

/ j __l \

w

w

los autovalores de A son ker (A — 01) = ker (A):

A2 = 2.

Ál

- 1 1

2 ^ 2

4^2 3 4^2/

3

1 \2 ^ 2

'A
5
\ 8/

w

W2 i

1 - l\ / x \ /0 N ,i i\ i i a , < > x = y- i 1 J \ y J \0J

1

Tom ar ^ = —

(1, 1).

ker (A — 21): 1 — l\ / x \ ,ii i /O \n , < > x = - y 1

El eje principal es paralelo a ker (A —21) y, por tanto, es

Tom ar tT — 2=

( - 1 , + 1 ).

- i
y — = x + - <> y = x + = y 8 8 4

- l J\yJ

Vo/

v 2

En este nuevo sistema de coordenadas (que está girado 45° con respecto al sistema canónico) tenemos que

ya que pasa por C. El eje secundario es paralelo a ker (A — 41) y pasa por C; por tanto, su ecuación es x\

/- --\
V 2
-A
/2

f x>

y]
S i

u i

o bien Tenemos que 2p = —— o

V 2

1

1

p = — =.
2 ^ /2

/ Í2

2 5 y jl

5

Sustituyendo estos valores de x e y en la ecuación dada obtenemos 4 6 0 - x i + 2yl + - y = ( x 1- y 1 - y ^ ( x 1+ y 1 + l = 0 ) )

El vértice de la parábola en el sistema ( x u y x) es [ —------- — , — — I; en el sistema v 2 8 272, de referencia canónico su vértice es

om

2

25v /2
8

/ 1

_25_5\
8

/
1

31 \

.c

o bien

em

k )-^ '! -C G

ic

a1

1

~

2 1

4 5
* l

at

5
V 2

25
j +

11

at

/
8

\ r

\ V

w

Com pletando cuadrados obtenemos

.M

El eje principal pasa por el vértice y tiene íT, com o vector director; por tanto, 11 31 yH — = xH — 5 v= x + -

w

w

5 y_±í 2 y‘ 1
con lo cual la traslación 2 ^ l)

_ V2 125v ^ V o 2 » )

8

El eje principal pasa también por el vértice y tiene u2 com o vector director; por tanto, 11 ( 31 y + ^ = - x + ~ y= x 21

*2

y/2 25^/2] = * i— — + 2 8 5 El foco está a distancia — — del vértice, en el eje principal; com o el eje principal está 4^2 inclinado 45° con respecto al eje O X se tiene

y2 = y 1

2\J~2

la transforma en 2y 2 -----^ x 2 = 0. Se trata, pues, de una parábola cuya forma canónica

v/2
es y l= ~ 7 = x 2

11.8.

IN V A R IA N T E S D E L A S C O N IC A S Y R E D U C C IO N A SU F O R M A C A N O N IC A

Una ecuación de segundo grado en las variables x e y puede escribirse de la forma
/ «12 «l\

/ 11 a ^ x 2 + a12xy + a22y2 + a1x + a2y + a = (x, y, 1 )
«1

? a22
«2

(1)

\t

y

“/

como puede comprobarse fácilmente. Una expresión de este tipo igualada a cero será denominada una curva de segundo grado. D e f i n i c ió n 1 ________________________________________________________________________ Puesto que la directriz ha de ser paralela al eje secundario, su ecuación será de la Se denominan invariantes de una curva de segundo grado a cualquier expresión formada por los coeficientes de su ecuación que no varía al cambiar de un sistema de coordenadas a otro mediante un giro o una traslación.

a1

.c at
= d(V, directriz) = 4^2 , + fc

om at em

form a x + y + / = 0 , donde c

V 2
.M
22 11

ic

T eorem a 2 Son invariantes de la curva dada en (1) los siguientes: «12 2 «22 «2 2 «
i

1

21

w

42 --- —+ / c

w

4= " T

- = — -k 4 4

* - ” -5
4

1

.

s = al í + a 2

2.

5=

« ~ 1 «2 11 2 « 2 1 2 2 ir «

w

«11 «12 2 «1 2

2 «2 2 a

3.

A=

La recta x + y + y = 0 e s l a directriz, ya que la recta x + y + 5 = 0 corta al eje principal en Demostración. Comenzamos demostrando que s, ó y A quedan invariantes me­ diante traslaciones; una traslación de la forma x+ y+ 5= 0 | 5 ) *-> , + - = 0 2 I 15 30 x = ------= ------, 4 8 10 y = --------8

transforma ( 1 ) en y, por tanto, pasa por el foco. a 1 1 (x' + a) 2 + a, 2 (x' + a)(y' + fi) + a12(y’ + / ? ) 2 + a j(x ' + a) + a2(y' + P) + a = = a 1 1 I X ] 2 + « 1 2x'y' + « 2 2 [ / ] 2 + ( 2 a 1 1 a + a j + a j )x' + (2a22fi + a12a + a2)y' +

+ (al l a2 + a12tx[3+ a22(!2 + a1a + a2[} + a).

C om o los coeficientes de los términos principales no han cambiado, s y S son invariantes mediante traslaciones. Observar que

la parte principal de la cónica se transforma en

^f 2a11a + a 12/ + ai = — (a, P) ?
CX

(x, y)A(

=

/ )C 'v 4 C ^ , j = (x', y')C

lAC[

t )=

« i i [ x ' ] 2 + a'12x y + a22[ y ' ] 2 ^f 2a22P + a 12o + a2 = — (a, P) c 8y a u a 2 + a12aP + a22p 2 + a1oi + a2P + a = / (a, P) d on d e/(x, y) es la expresión cuadrática dada en ( 1 ); por tanto, mediante la traslación dada, ( 1 ) se transforma en <= 5
ú¡ 12

P o r tanto, s = a n + a 2 2 = traza (A ) = traza(C sección 7.6 del capítulo 7) y

1A C ) = a/ + a22 (ver problema 2 de la 11

íl i i 11

a l2 2

, a 12 a u1 ---1 2 = \A = \C~l AC\ = \
a i2 — —-

-T -

a 22

a22

,

a i i [ x ' ] 2 + a i 2x'y' + a22[ y ' ] 2 +

(a, P)x' + ^ f ( a, P ) y '+ f ( a , P).

(2)

2

2

Para (2) el determinante A es

lo cual prueba que s y < permanecen invariantes mediante un giro. 5 Para demostrar que A es invariante observamos que

om

f l 12

1 2
1

a1

«ii A= ai i ~2 ~
1 5/ z —

2

flu

ic

r.x 3/ / ?)
a 12

IT
a 22

a, ,oH------- pH—
u

. a 12 „

al

.c

5/

«12

/
Ü1A
ai 2 ( x , y ,
1

a 12

\
2 \
I x \ = (x , y ,
1

2

2

2
a-, a2

a i ¡2 \
a2 ¡2 ) 2

tx \

a 22

ir
1 a i 2 ft_L Gl «n a + y - P + y „

em

=

O , a!2 i a2 a 22^ + y ^ a + Y

at

)

~2 ~

a 12

ai i K )

fl 1 2 flj an a + y ~ P + y í31 2 ^2 a2 2 ^ + " y a + y ¿i 7
¿2 2

a l2 «ii
f l12

ai
2

T~ a22 a2
2

w

w

2

a í ,“ ' íf|

2

ex

w

(«.

0)

/ («,

i?)

a 22P + —

<X+ ~ Y

/ ( a , /O

.M

1 8P

f l 12

fl2

a1 “
\

2

2

ü

/

\ 1 /

a/

y

at

u , y )A +

.

| ), (x ,

+ o) •< ««. fe

a2
2

>= «i
2

a22
«2 2

=

~2 ~ «i
2

«
( , , v
m i

a

y 2 + y ^ + fl

■ ?>

+ ( * >>0

1/2

« í (E K ?

§

*

*2/2
a =

y 3 « U 3 1
ftí t.-. Q a Q O < < ai f-; • k-' — $ X) £ u U¡ U,
2/ 2

W

íé cual prueba el resultado deseado. (Nota: el lector no tendrá dificultad en encontrar los factores por los que se han multiplicado las filas y columnas de las matrices ántériores para llegar al resultado final.) , Supongamos ahora que hemos realizado un giro de la forma

w

. * c - ' A

c n

+ ( | . a )

c { * \ + ( A y ’) c - ' ( y

g

S S eág é”!
a jP
*

.

C 'M C
f 2/2

x'

= ( x ', y , i)

y'
i
^

« < w Q

o 9
2;

cu fc rt

se
R *

ñ fH S 5

/

a

P o r tanto, x 2 + 3xy + 2y2 + 2x + 5y — 3 = (x + y + 3)(x + 2y — 1)

la forma canónica de la hipérbola es y j 2 x 2 — \f2y-i — c> donde A

¿

____ i = _ i

P o r tanto, tenemos

-2

2
\ [2 y i
-

*

*

*

EJEMPLO C. Determinar el tipo de la curva x 2 + 4 x y + 4 y2 — 2x —4y — 3 = 0 y reducirla a su forma canónica si es posible.
1

o bien
5

=

1
z

¿
A

2 4 -2

- 1

1

2 0 -2

- 1

= 4 -4 = 0

;

A=
- 1

2

-2 -3

=
- 1

0

0 -3

1 2 ^ 2

1 2 ^ /2

Haciendo x 2 = Y,

— X se tiene = 1 2^2 i j l

Se trata de una curva de tipo parabólico degenerada: dos rectas paralelas, concurrentes o un punto. Procediendo com o en el ejemplo B, se obtiene: x 2 + 4xy + 4y2 — 2x — 4y — 3 = (x + 2y — 3)(x + 2y + 1 ) y se trata, por tanto, de dos rectas paralelas.

y, p o r tanto, se trata de una hipérbola equilátera, es decir, a = b = (^/8 ) *.

em

+ 2x + 5y — 3 = 0

at

ic

EJEMPLO B.

Reducir a su fo rma canónica (si es posible) la cónica x 2 + 3xy + 2y2

a1
11.9.

.c

om
o
0 - j

<= 5 I

A=

= 2 T

- 4

i -4

w

1 2

9

1

Î* i
« S - >

= 0

w

1

i

1

w

3

1

2

.M

at

D E T E R M IN A C IÓ N D E L C E N T R O Y D E L O S EJES P R IN C IP A L E S D E U N A C Ó N IC A C O N C E N T R O

Supongamos que

/(x, y) = a11x2 + a12xy + a 2 2 y2+tfix + a2y + a = 0

(1)

1

Se trata de una cónica de tipo hiperbólico degenerada: dos rectas que se cortan. Para encontrar estas dos rectas consideramos y fija y resolvemos la ecuación anterior para x: x 2 + (3y + 2)x + [2 y 2 + 5 y - 3 ] = 0 _ 3v —2 + ,/ 9 y 2 + 1 2 y + 4 — 8 y 2 —2 0 y + 1 2 _ x= --------------— 3y —2 + ^/y2 — 8 y + 16
2

representa una cónica no degenerada (es decir, A # 0 ) y que tiene centro (es decir, es una elipse o una hipérbola y, por tanto 3 ^ 0 ) . Las definiciones de A y 3 se dieron en el teorema 2 de la sección 1 1 .8 . En la sección 11.8 se ha descrito un m étodo para obtener la form a canónica de una cónica sin necesidad de realizar un giro y una traslación; este m étodo es rápido en cuanto a la obtención de la forma canónica, pero no permite calcular los ejes de la cónica. En esta sección expondremos un m étodo para calculr los ejes de una cónica con centro. U n vector director de los ejes es cualquier autovector de la matriz

-2y —6 — 3y —2 + ( y —4) _ / =
2

— — y —3

2

\ —4y + 2 X---- ----- = — 2 y + 1

y son, por tanto, fácilmente obtenibles. Conocidos los vectores directores, los ejes quedan determinados si encontramos el centro de la cónica, por el cual necesariamente deben pasar los ejes. Supongamos que su centro es (a, ¡i); entonces la traslación

K K
( 2 ) sustituida en ( 1 ) produce

(2 )

debe transformar (1) en una cónica que no posee términos en x' ni en y'. L a traslación

a11íx'V + a12x'y' + a22íy 'y + ^

,

/ ? ) * '+ ^ ( a , fi)y ' + / ( a , [ i ) = 0

U n autovector correspondiente a

2 es:

(ver la demostración del teorema 2 de la sección 11.8). P o r tanto

x~(a» 0 ) = O

dx

,

f(«,jS ) = 0

dy

Un autovector correspondiente a l 2 = — ^ ¡2 es:

Esto quiere decir que (a, fi) son solución del sistema

om

em

at

— = 2 a 11x + a 12y + a 1 = 0 ex = a l2x + 2a22y + a 2 — Q

ic

a1

l+ f
= —1 + y jl. El centro de la hipérbola es la solución del sistema

;

.c
Observar que este sistema tiene una solución única, puesto que

L a pendiente del eje principal es k2 = — 1 — y/2 y la pendiente del eje secundariao es k¡

w

w

.M

dy

at

l d

w

dx

= 2x + 2y — 6 = 0

2

a11

a l2

= 4<5/0 1 D e aquí se deduce que x = - ,

v
5

dy

= 2x —2y + 4 = 0

a 12

2a 2 2
La ecuación del eje principal es, por tanto,

EJEM PLO C. Determinar el centro, los ejes y las asíntotas de la hipérbola del ejemplo A de la sección 11.8: x 2 + 2xy — y2 — 6x + 4y — 3 = 0.

Sabemos que

= v ; 2, k2 = - J l y que la hipérbola puede escribirse de la form a

y - 5= - (l+ ^ 2 ) ( x J

y la ecuación del eje secundario es

2 ^ 2

2 ^ 2

en un sistema de coordenadas en la dirección de los nuevos ejes y que se corten en su centro. Observar que y2 es el eje principal, mientras que x 2 es el eje secundario.

La gráfica de esta hipérbola se representa en la figura adjunta.

P o r tanto, m = 1+^/2, que es el mismo resultado que habíam os obtenido anteriormente. * * *

11.10.

D E T E R M IN A C IO N D E L V E R T IC E Y D E L EJE DE U N A PA R Á B O LA

Supongamos que la ecuación /(x, y) = a11x 2 + al2xy + a22 y2 + a1x + a2y + a = 0 determina una parábola, es decir A # 0, < = 0. El eje 3 director cualquier autovector correspondiente a = sólo es necesario conocer el vértice de la parábola Para determinar el vértice observamos que el eje vértice. La pendiente de la tangente a la parábola

(1)

.c

figura se tiene que

om

Puesto que se trata de una hipérbola equilátera sus asíntotas son las bisectrices de sus ejes y, por tanto, forman un ángulo de 45° con ellos. Si a y ¡3 son los ángulos de la

de la parábola tiene com o vector si es la pendiente de este eje, para determinar su ecuación. y2 es tangente a la parábola en el en un punto viene dada por
0;

a1

8f

df

tg(oe + j3)
1

L a otra asíntota es perpendicular a esta y, por tanto, su ecuación es

y —

O + \ / 2 )fx P o r tanto, el vértice ha de satisfacer

Observación. Las asíntotas de una hipérbola también pueden hallarse median­ te procedimientos de cálculo; basta observar que las asíntotas deben ser de la forma y —^ = m ( x —- j (ya que pasan por el centro de la hipérbola) y que deben satisfacer

w

w

w

.M

que es la pendiente de una de las asíntotas; su ecuación es

at

em

— tg a tg ^

2

+ 7 2

2

at

ic

tg « + tg ¡3 _

~^/2 _ - 2 ^ 2 + 2 _ ^

f a + Tyy - ° '

K
dx (2 ) " S 8y C om o el vértice debe estar en la parábola ha de satisfacer

2x + 4 ± v /4x2+ 16 — 16x + 4 x2—24 x— 12
2 1 1 + . /2

= lím
x~* o o

m 5 tnx —— + -

m

2

2

/(*> )0 = O

(3)

Las ecuaciones (2) y (3) forman un sistema de dos ecuaciones con dos incógnitas que permite determinar el vértice. E je m p lo A. Determinar el vértice y el eje de la parábola x 2 - 2xy + y2 + 4x — 6y + 1

4. 5.
6.

2 x2 + y2 + 2xy + 2 x + l = 0
8x2

+ 1 7 y 2 + 1 2 x y — 8 x — 16y = 8

= 0 (ejem plo B de la sección 11.7). ( Puede comprobarse que < = 0 y A # 0 y los autovalores de I 5
¿2 1

x 2 + 4y 2 + 4 x y — 6 x — 12y + 9 = 0 x 2 — y 2 + 2x + 6 y = 13 x 2 — 2y2— x y + 2x + 5y — 3 = 0 x 2 + y 2 + x — 1= 0 5y 2 + 5x 2 — 1 — 8 xy + 4x — 2y = 0 y 2 —4xy + 4x + 4 x 2 —2y + 3 = 0

_1\ 1 son k x = 0 ,

7.
8.

= 2. U n auto vector correspondiente a /j = 0 es

9.

-! ”!)C ) ~ ) ,’ ■ ir ,1 ) )"(o ‘= ,= ’1
L a pendiente de la tangente a la parábola en el vértice es k l = 1. D erivando implícita­ mente en la ecuación de la parábola obtenemos (2x —2y + 4) + ( —2x + 2 y - 6 ) y ' = 0 por tanto,

10. 11.

12. Reducir la cónica 3x 2 + 3y 2 —2 x y + 18x + 10y+ 19 = 0 a su forma canónica. Hallar los ejes, el centro y los focos de la cónica correspondiente y dibujarla. 13. Indicar el tipo y poner en forma canónica la cónica x 2 + y 2 + 2xy — 7x — 5y + 7 = 0. hipérbolas y encontrar sus

14. Demostrar que las ecuaciones siguientesrepresentan asíntotas:

om

2x — 2y + 5 = 0. 5 El vértice es la intersección de esta recta con la parábola; com o x = y —

(4)

at

ic

a1

—2 x + 2 y —6

.c

_ 2x~ 2j,í 4 = _ _

a) b)

x 2 +4 xy + y2 = 7 l l x 2 —24xy + 4y 2 + 6 x + 8 y = — 15

i

=>2x — 2y + 4 = — 2x + 2y — 6

at

15. Demostrar que las ecuaciones siguientes representan parábolas y encontrar su eje y su vértice: a) b) 16x2 —24xy + 9y 2 —30x —40y = 0 16x2 —24xy + 9y 2 —30x —40y = 5

y -^ j

- 2 ^ y - ^ y + y2+ 4 ^ y - ^ J - 6 y + l= 0 ,

w

w

w

.M

tenemos

em

16. Clasificar, para distintos valores de los parámetros a, /?(oc;/9e IR), las cónicas que admiten por ecuaciones 11 31 . / 31 11\ . J de donde se deduce que y = — —, x = — —. El eje pasa por I — —, — — 1 y tiene de pendiente 1: es la recta dada en (4). oíx2 + 2 /?xy + ay 2 + (a + /?)(x + y ) + 1 = 0

E J E R C IC IO S (S E C C IO N E S 11.7, 11.8, 11.9 y 11.10) En los siguientes ejercicios hacer unestudio lo másdetallado posible (es decir, indicar el tipo, forma canónica, centro,ejes, ..., y hacer un esquema) de lassiguientes cónicas: 1. x 2 + y2 + 2xy — I x — Sy + 7 = 0 2x —2x 2 + y 2 + 4 x y — 1 = 0 x2 + y2 + 4 x -4 y -2 x y = 5

2. 3.

Su genio brilló a gran altura en otros campos; asentó los fundamentos de la m oderna teoría del cálculo de probabilidades, tal com o se conoce actualmente; alrededor de 1646 com enzó a interesarse por los principios de la hidrostática, la presión atmosférica y el vacío, realizando experimentos que confirmaron las teorías de G alileo y Torricelli en estos campos. En 1639 su padre fue nom brado administrador en Roven. Entre 1642 y 1644 B. Pascal pensó y construyó una máquina para ayudar a su padre en el cálculo de los impuestos. Esta máquina fue considerada por los contemporáneos de Pascal com o su m ayor legado para la posteridad; de hecho, esta máquina puede ser considerada com o el primer calculador digital. Sin embargo, Pascal se hizo también famoso com o filósofo de la religión y como escritor, ocupando así un lugar único en la historia del pensamiento. En 1646 Pascal comenzó a interesarse por la religión, com o consecuencia de una larga enfermedad de su padre. En 1654, después de una honda experiencia religiosa, que él llamó su «noche de fu eg o » decidió dedicarse enteramente a una vida de oración. Sus obras más importantes en este aspecto son Las cortes provinciales, de gran influencia en su tiempo, y sobre todo los fragmentos hallados a su muerte de la gran obra que planeaba en forma de una «A p o lo g ía de la Religión Cristiana».

B IO G R A F IA S Apolonio de Perga nació en Perga (actualmente en Turquía) en el año 262 a. de C. y murió en Alejandría (E gipto) alrededor del año 190 a. de C. Entre sus contemporáneos era conocido com o «E l G ran G eóm etra», cuyo tratado Cónicas (sobre las secciones cónicas) es uno de los más impresionantes trabajos científicos de las civilizaciones antiguas. Muchos de sus escritos se han perdido, aunque algunos de sus títulos y un breve resumen de su contenido se conservan debido a otros escritores, especialmente Pappus de Alejandría. En su juventud, A polon io estudió en Alejandría, el centro del saber científico en su época, bajo discípulos de Euclides y más tarde enseñó en la universidad de la misma ciudad. Visitó Pérgamo, capital del reino Heleno en la provincia de Anatolia, con m otivo de la apertura de una universidad y una biblioteca similares a las de Alejan­ dría. Fue en Pérgam o donde escribió la primera edición de las Cónicas. Los cuatro primeros libros de las Cónicas han llegado hasta nosotros en su lengua original (griego) y los tres siguientes traducidos al árabe. El libro octavo se ha perdido. El grado de originalidad de las Cónicas puede juzgarse por el prefacio del tratado. De acuerdo con A polon io los libros del 1 al 4 contienen un desarrollo sistemático de las principales propiedades de las cónicas, muchas de las cuales eran conocidas por Euclides y Maneachmus. El resto de los libros conocidos son originales y se refieren a investigaciones sobre un problema particular. U n o de los trabajos de A polon io, Sobre espejos, cuya existencia es conocida a través de otros escritores de la antigüedad, demuestra que los rayos paralelos que se reflejan en un espejo esférico no pasan por el centro de la esfera, com o se creía antes, y estudia las propiedades de los espejos parabólicos. En otro de sus trabajos, El método rápido, se asegura que A polon io calculó límites más cercanos al valor de n que 3^ y 34?, que eran los calculados por Arquímedes.

Baise Pascal nació el 19 de junio de 1623 en Clermont-Ferrand (Francia) donde su padre era magistrado. Su madre murió en 1626 y desde entonces su padre, que era también bastante conocido com o matemático, se dedicó a la educación de sus hijos, Blaise y Jaqueline. Jaqueline mostró un talento precoz en el terreno literario y Blaise en el de las matemáticas. En 1640 publicó un trabajo sobre las secciones cónicas, Essai pour les coniques que despertó la envidia de personajes tan famosos com o René Descartes (1596-1650), quien nunca pudo creer que aquel trabajo fuera obra de un joven.

524

w

w

w

.M

at

em

at

ic

a1

.c

om

CAPITULO 12

FORMAS BILINEALES Y CUADRATICAS

.c

om

12.1. 12.2. 12.3. 12.4. 12.5.

.M

at

em

at

ic

a1

Definiciones Formas bilineales y cuadráticas en un espacio euclídeo Ley de inercia de las formas cuadráticas Formas cuadráticas definidas. Puntos críticos de funciones de varias variables Diagonalizacón simultánea de formas cuadráticas

w

w

12.1.

D E F IN IC IO N E S

En el capítulo anterior hemos estudiado las curvas de segundo grado; la parte principal de estas cuevas puede escribirse de la forma P(x, y ) = ( x , y)A donde A es una matriz simétrica de orden 2; utilizando el producto escalar usual en IR2, la expresión anterior puede escribirse de la forma P (x,y ) = l Q A{*

w

(1)

con (x, y )e lR 2 La generalización de la expresión (1) a IR" puede escribirse de la forma /

lxA
, a

lxi \\

P(x) =

(2)
\x « H

527

x i\ donde x =

superficies de segundo grado, que serán estudiadas en el próxim o capitulo. Las expresiones (1) y (2) son ejemplos defo rmas cuadráticas; éstas, a su vez, son casos particulares de las formas bilineales.

w

¡

e IR" y A es una matriz simétrica de orden n. Cuando n = 3 se obtienen

Sea A una forma bilineal en un espacio vectorial V y sea ..., e~„} una base de V; n n si x = X x ¡Cj z V e y = £ y^e¡ e V de la definición de forma bilineal se deduce que ¡= i j= i

A ( x , 7 ) = a ( ¿ Xi%, ¿ ^ \ ¡= i j= i

J = Z Z x ¡yjA(e¡, e’j) / ¡=ij=i

D

efinición

1( Forma

bilineal)------------------------------------------------------------------

Los «nú m eros» aij = A ( e i, e’ ) forman una matriz cuadrada j

Sea Kun espacio vectorial sobre un cuerpo IK( = 1R ó C); una aplicación A: V x Vh->K tal que A ( x , y) es lineal en la variable x , dejando y fija, y A ( x , y) es lineal en la segunda variable y, dejando x fija, recibe el nombre de forma bilineal. A= D e la definición 1 se deduce que A es una forma bilineal si y solo si se satisfacen las siguientes propiedades: a) b) c) d) A ( x 1+ i c 2, y ) = A ( x u y ) + A ( x 2, y ) A (a x , y ) = ctA(x, y ) , , x l t x 2, y e V

1 1 a 21

a l2
u 22

a l n\

(3)
■■ ■ a j

Á1 n

un2

at

ic

a1

A ( x , f¡y) = f iA (x , y )

,

fie K ,x ,y e V

.c

A ( x , y l + y 2) = A ( x , y l ) + A { x , y 2)

,

x , y 1 y 2e v ,

om

o ie K , x , y e V

que recibe el nombre de matriz de la forma bilineal A en la base ~e„}. N os preguntamos ahora cóm o varía la matriz de una forma bilineal al cambiar de base. Sea A(aiJ ’’ j = t la matriz de una forma bilineal A con respecto a la base {e\, ) y B = ( f c y ) " i la matriz de A respecto de la base {uu ..., un}; si C = (C ¡J " J= t es la matriz ) del cambio de base de la antigua a la nueva, es decir:

at

{«?!, ..., <?„} es una base de V, la aplicación

em

Ej e m p l o

A.

Si V es un espacio vectorial de dimensión n sobre un cuerpo K y

“ * = C1 Í^*1 H ¡ ------^ cni^n ¿ = 1 , 2 , ..., n, tenemos que bij = A(Ui, M = X (c lie 1 + ••• + c „ ¡e„, c t j e^ + ■ ■ + c „ / „ ) = j) ■
n n n / n

A ( x , y ) = X I aijx tyj i= 1 j= 1
n n

w

w

w

n

n

.M

~ X
n

donde au e K, i, j = l, ..., n, x = £ x / j e F e y = £ y ^ j e V, es una form a bilineal i =i j= i com o puede comprobarse fácilmente. La expresión

1

CkiCl j A ( e k> e l ) =

X
k ,l=

1

Ckia klCl j =

X! Cfi X! a klCl j c( k= 1 \í= 1

E j e m p l o B. En un espacio euclídeo

E

con producto escalar () la aplicación ,

£ aklc¡¡ es el término que ocupa el lugar ( k , j ) de la matriz A C y, por /=i tanto, la última expresión de la derecha es el término que ocupa el lugar ( i , j ) de la matriz C ( A C ) . P o r tanto,

A ( x , y ) = (x, y ) B = C 'A C es una forma bilineal, ya que el producto escalar es lineal en las variables x e y. D e form a más general, si sé es una aplicación lineal de E en E, la aplicación A (x , y ) = (x , séy) es una forma bilineal. que es la expresión del cambio de base buscada. Puesto que C es una matriz no degenerada, es decir, det C # 0, el rango de la matriz B coincide con el rango de la matriz A; a este rango se le denomina el rango de la form a bilineal y queda probado, por tanto, que el rango de una form a bilineal no depende de la base elegida para representar su matriz.

DEFINICIÓN 2 (Forma bilineal simétrica)----------------------------------------------------Una forma bilineal A en un espacio vectorial V se dice simétrica si A ( x , y) = A (y , 3 para todo x , y e V c*)

La demostración se concluye observando que B es una forma bilineal simétrica y C es una forma bilineal antisimétrica. ■

Si A es una forma bilineal simétrica, A(e¡, e}) = A(e¡, ~e¡) y, por tanto, la matriz de A en cualquier base {e i, ..., ?„} es una matriz simétrica. Recíprocamente, si la matriz de una form a bilineal es simétrica en alguna base {e j, ..., e*„}, la forma bilineal es simétrica ya que
n

U na forma cuadrática en un espacio vectorial V es toda aplicación A(x*, x) de V en K (R ó € ) que se obtiene sustituyendo y por x en una forma bilineal A { x , y ) sobre V.

Ejemplo C. aí í x + al2xíx2+ a22x es \ \
n

una forma cuadrática de K 2 (a¡ elR) ya 7

que si tomamos

A (y ,x ) =

£ a uy iXj = £ aiix jyi = A ( x , y). i,j= 1 i,j= 1 -------------------------------------------------se tiene que (^ y J ) = a u X i y i + l.a i 2 X i y 2 + l ai2X2yi + a 2 2x 2y2

DEFINICIÓN 3 (Forma bilineal antisimétrica)

^

U na forma bilineal A en un espacio vectorial V se dice antisimétrica si A ( x , y ) = —A (y , x ) para todo x , y e V

a1

Si A es una forma bilineal antisimétrica, A(e¡, ~ej) = — A(Tj, ~e¡) y, por tanto, la matriz de A en cualquier base {e^ «?„} satisface au = —a-, en particular au— —aü, i = 1, ..., n y, por tanto, los elementos de la diagonal de la matriz de una forma bilineal anti­ simétrica deben ser nulos. P o r tanto, la matriz de A se escribe de la forma
0
*12

A(

(

) )= auX 2+ a 12xlx2+ a22x2 i 2

.c .M at em at
EJEMPLO D. « U x 2 + a 2 2 x 2 + a 3 3 x| + a 1 2 x 1 x 2 + a i 3 x 1 x 3 + a 2 3 x 2x 3 es una forma cuadrática en C 3 (fly elR) ya que basta tomar

a ín\

A=

~a 12

ic

om

^ ^ * 2 ^ , ^ y 2^
X3
y 3

= a \\X \y\ + a22X2 ;2 + a 33:,C 3;3 + 2 a l2Xl>’2 + 2 a l2;,C 3 3 2>'l +

w

w

\ - a ln

—a2n

■■ ■

0

/

w

Las formas bilineales simétricas junto con las antisimétricas originan todas las formas bilineales posibles; el resultado se describe en la siguiente proposición: P r o p o s ic ió n 4 _____________________________________________________________________

1

1

1

1
^ a 2 3 x 3y 2

+ 2 a i3 ^ iy 3 + 2a i3^3>'i + 2 a23x 2y3 +

T oda forma bilineal puede ser representada com o la suma de una forma bilineal simétrica y una forma bilineal antisimétrica.

En general toda expresión de la form a £ £ a¡jXiXj en un espacio vectorial define i= 1 ¡SJ una forma cuadrática ya que basta tomar la forma bilineal

Demostración. Sea A ( x , y ) la forma bilineal; tomar B ( x , y) = A ( x , y ) + A ( y , x ) y C ( x , > T )= / l(x , y ) —A{y, x ) . Sumando ambas expresiones se tiene que B ( x , y ) + C (x , y ) = 2v4(x, y ) y, por tanto,

A {x ,y )=

i1 -

¿

aux ¡y¡+ ¿
j=

1i < j

^ ^ x¡y; + ¿
¿ j = 1 i<j ¿

(4)

donde x = Y, x i^r

7 — Z y ¡er

Para obtener que

£ X ^o'x ¡xj j= i Ísj en una cierta base. En efecto, si A ( x , x ) proviene de la forma bilineal A ( x , y ) de matriz A = { a ij) l j = l en la base {e^, ...,~en} se tiene que

Recíprocamente, toda forma cuadrática tiene una expresión de la form a

deducimos del resultado sobre unicidad anteriormente demostrado que la matriz de la forma cuadrática A ( x , x ) en la base {F l 5 ..., F „} es ai 2 / al2
~ Y a ln

~2
a 2n

x,<?; ¡= i j = i Agrupando los términos x¡xj y XjX¡ se tiene que V
n n

~2~

ü22

2

a ln

a 2n a nn

2

* Z hux ‘xj

*

*

A (x ,x )=

£

I

K

+ < ¡M

= £

i= 1 ¡g j

i = 1 ¿S7

que era lo que queríamos demostrar. T od a forma bilineal determina una forma cuadrática (lo cual se deduce de la misma definición), pero una form a cuadrática puede ser determinada por varias formas bilineales. En efecto, la forma bilineal

12.2.

F O R M A S B IL IN E A L E S Y C U A D R Á T IC A S E N U N E S P A C IO E U C L ID E O

at

ic

^((^), ^yj

= a í í x l > \ + ^ a l2x í y 2 + ~ a 12x 2y l + a22x 2y2

a1

.c

Hem os visto en el ejem plo B de la sección anterior que si sé\ E i-> E es una aplicación lineal en un espacio euclídeo,
A { x , y ) = (x , s é y )

om .M at em w w w

determina la forma cuadrática del ejemplo C, pero es diferente, en general, de la forma bilineal dada en (3). Sin embargo, si la forma bilineal que genera la forma cuadrática se supone que es simétrica, la forma bilineal queda unívocamente determinada. Para probar este resulta­ do observar que A ( x + y , x + Y ) = A { x , x ) + A ( x , y ) + A (y , x ) + A ( y , y )

es una forma bilineal. D e hecho, todas las formas bilineales en un espacio euclídeo son de esta forma, com o se muestra en la siguiente proposición: P r o p o s ic ió n 1__________ ________________________________________________ Sea A: E x E i * IR una forma bilineal en un espacio euclídeo E con producto —escalar ( , ) . Existe una aplicación lineal sé\ £ i- > £ tal que A ( x , y ) = (x , s é j ) . Además, las matrices de A y sé en una misma base ortonorm al coinciden. Demostración. Si A = ( a ij)” J=1 es la matriz de la forma bilineal A en una base ortonorm al {e u ..., e¡J, podemos escribir

por la definición de forma bilineal; si A es simétrica tenemos

n

A(x,y)= X
A(x, y ) = ^ Í A ( x , y ) + A (y , x )] = ^ [ A ( x + y , x + y ) - A { x , x ) - A { y , y ) ]

n I auxiyj

n

n ,

,

x= I
i= 1

y= I
j = 1

yj?}

¡ = 1 7=1

Sea sé la aplicación lineal de £ en £ que tiene com o matriz A en la base { e ’1, ..., <f„}, es ------h anjen. Se tiene que decir, ¿é(e'J = a1 e 1 H ) j que prueba el resultado deseado. Se denomina matriz de una forma cuadrática en una base { e u ..., ~e„} a la matriz de la form a bilineal simétrica que la determina, en la misma base {'e[, ..., ~ n}. C om o la e forma bilineal dada en (4) es simétrica y determina la forma cuadrática n X I dijXtXj j = i ¡é i

( x , s é (y )) = ^ ¿ x,e*¿ ,
n n

s/j(y ¿

y -e jjj = ¿

¿

x¡y/?;, s/(7j))

= 1 1 xiyféi, aijCi + - - - + a ije¡ + - - - + anje„) = i= 1 j= 1
n n

A (x ,x )=

= 1 1 W u /=1 7=1

donde la última igualdad se debe a que { e u ..., F „} es una base ortonormal. P o r tanto, A ( x , f ) = { x , sé (y )) que era lo que queríamos probar. ■

En el teorema 2 que acabamos de demostrar se prueba que si una form a cuadrática está definida en un espacio euclídeo, puede reducirse a su forma canónica en una base ortonormal. Realizamos a continuación algunos ejemplos. EJEMPLO A. Reducir la fo rm a cuadrática A (x , x ) = x\ + x l + x 3 — 4 x 1x 3 a una forma canónica (en IR3) mediante una base ortonormal. La matriz de A(x, x ) es 1 A=
1 0 0 1 0

T e o r e m a 2 (Reducción de una forma cuadrática en un espacio euclídeo a su forma canónica)-------------- ----- ---------------------- ---------------------------------------------------------— D ada una form a cuadrática A ( x , x ) en un espacio euclídeo E existen números reales A1 ..., Xn y una bise ortonorm al { u x, ..., u„} de E tal que para ? todo
n

- 2\
0 1

x = Z x ¡u ¡ e E

\ - 2

/

sus autovalores son: ^ = 1, X2= — 1, A3 = 3. P o r tanto se tiene que A(x, x ) = x j — x 2 + 3xl A(x, x ) = À1 l + X2xl-\------\-Xn l x x en una base {u1, u2, u3} formada por autovectores, donde x = x 1u1+ x 2u2 + x 3u3. Demostración. Según sabemos de la sección anterior A(x, x ) determina unívoca­ mente una forma bilineal simétrica A(x, y); por la proposición 1, A(x, y ) = (x, sé(y)), donde sé es una aplicación lineal que tiene la misma matriz que A(x, y ) en una base ortonormal; por tanto, la matriz de sé es simétrica en esta base. P o r los resultados del capítulo 8 , sección 6 , sabemos que toda matriz simétrica es diagonalizable en una base ortonorm al y, por tanto, existe una base ortonorm al {u^, ..., « „ } tal que * * *

om em at ic a1 .c

La forma de reducir una forma cuadrática a una expresión del tipo a xx f H ------ha„x2 no es única si se permite realizar cambios de basé que no sean ortonormales. C om o ilustración tomar el ejemplo A; completando cuadrados con los términos x \ —4 x 1x 3 se tiene A(x, x ) = (x 1 —2 x3) 2+ x f — 3x 3 y, por tanto, el cambio de base ca del ejemplo A a = X j — 2 x 3, y2 = x 2, y 3 = x 3 reduce la forma cuadráti­

donde Xp j = 1, ..., n son los autovalores de sé. P o r tanto,

w

(

w

Z = Z j =i / j=i
x jü j

n

\

n

x js / & ¿ =

Z M ¡ =i
x

n

j

w

.M

at

yl + y2 - 3 y l 2 Observar que este cambio de base no transforma una base ortonorm al en Qtra base ortonormal.

(
= Z Z xix

n

n

Z x f i i ’ j = ixj1 Z /Ai= i
“}) = Z xfxl= x lx2+ ---+ xi ¡ /.n

i=l j = 1

il =

u

EJEMPLO B. Reducir la forma cuadrática A dada por 2xy — 2xz con respecto a la base canónica de IR3 a una forma canónica. Escribiendo x = x 1 + y 1, y = x 1—y 1, z x= z , lo cual es un cambio de base ya que

Observación.

Los números

son los autovalores de la matriz de A(x, x) y
1 1 0 1 0 1 0 1 0

los Uj son autovectores correspondientes a Xy Supongamos que una form a cuadrática A(x] 5c) puede escribirse de la form a n A(x, x ) = Z ajx J = a 1 f + - - - + a„x% x
j=

= —2 ^ 0

i

(1) tenemos
2 xy

en una cierta base del K-espacio vectorial V en que está definida, donde ü j s K, j ____ = 1 , 2 , ..., n. La expresión (1) recibe el nombre de forma canónica de la form a cuadrática A(x, x ).

— 2 xz = 2 (x j

- y 1 - 2 ( x l + y i )z1= 2 x \ ~ 2 y \ )

— 2 x l z i —2y1z 1.

Com pletando cuadrados se tiene
2 x y - 2 x z = 2 ^ x 1- y J - 2 ^ y 1 + ^

zi \

-I

zi

■ i 2

Z i

con lo cual el cambio de coordenadas x 2 = x j — escribir A = 2 x \ -2 y \

y2 = y i + y > z 2 = z i nos permite

en una cierta base, donde 0 ,-elR, j = 1, 2, ..., n; la expresión (1) recibe el nombre de forma canónica de la forma cuadrática dada. La forma canónica de una forma cuadrática no es única, puestoque depende de la form a deobtenerla,según se ha observado en la sección anterior. Sin embargo, el número de términos positivos üj que aparece en ( 1 ) y el número de términos negativos de la misma expresión permanecen invariantes para una misma forma cuadrática. Este hecho puede observarse en los ejemplos de la sección anterior. El enunciado preciso y la demostración de este resultado la damos a continuación.

T e o r e m a (Ley de inercia de las formas cuadráticas) ________________________________ Si deseamos obtener de A una suma de cuadrados mediante un cambio de base ortogonal no tenemos más que calcular los autovalores de la matriz / A= \ - 1
0 1

Sea A(x, x ) una forma cuadrática en un espacio euclídeo E de dimensión n. Si A(x, x ) se escribe de la forma A(x, x ) = a 1x f + a2x l + - - - + a m 2 x en la base F = { f 1, la forma (2)

1 0 0

-1 \ 0 0/

con a¡e IR, Oy#0,y = 1, 2, ..., m, y también se escribe de

que son / ! = 0 , X1 = s Jf2, Á3= —~J2\ por tanto

om

observaremos que se basa en los siguientes hechos: a) b) Com pletar cuadrados si es posible (ver ejemplo A). Si no existen cuadrados que se puedan completar (ver ejemplo B) es necesario hacer un cam bio de la form a yj = xj + x k, yk= Xj — x k para introducirlos, y a continuación completar cuadrados. A ( x , x ) = a j x f +••• + « kx ¡ - a k+ 1x ¡ + l --------- a2m m en la base F, con Oy>0 , j = 1, 2, ..., m, y (5) (4)

w

Observación. En los ejemplos anteriores se han utilizado dos métodos para reducir una forma cuadrática a una forma canónica; el primero de ellos está basado en el cálculo de autovalores de la m atriz de A; sobre el segundo

w

w

.M

at

em

1 1 j— 1 i~ pueden ser tTj = —t=(0 , 1 , 1 ), u2= - { ^ 2 , 1 , - 1 ), u3 = - ( N/ 2 , - 1 , 1 ). /2 2 ¿

at

ic

en la base ortonormal {w^, u2, tT formada por autovectores de A. Estos autovectores 3}

a1

.c

A ~ ^J2y2 — * j 2 z 2

A(x, x ) = b l y j + b2y j + - - - + bqy¡

(3)

en la base G l ^ , ..., con b j^ O , b j e U , j = \ , 2 , ..., q, se tiene que m = q = rango (A ) y el número de coeficientes positivos y negativos de (2) y (3) coinciden.

Demostración.

Escribamos, más explícitamente,

A ( x , x ) = fi1y2 + --- + / py2- P p+1y2+1--------- Pqy2 1 3 q Se deja para el lector la práctica de este segundo método.

en la base G, con ¡ } j > 0, j = 1, 2, ..., q. Hem os de demostrar que k = p y m = q. Sea E 1 el subespacio vectorial de E generado por los vectores f u J2, Jk y E 2 el subespacio vectorial de E generado por los vectores cfp+1, ..., <f„. Si suponemos que k > p se tiene que

...,

12.3.

L E Y D E IN E R C IA D E L A S F O R M A S C U A D R Á T IC A S dim (£ j) + d im (£ 2) = k + (n — p ) > n = dim (£)

En la sección anterior hemos visto que toda form a cuadrática en un espacio euclideo de dimensión finita puede escribirse de la forma A ( x , x ) = a í xj-\------l-a„ x 2 „ (1 ) Puesto que d im (£ 1 + d im (£ 2) = dim ( £ 1 + £ 2) + d im (£ 1 n £ 2 ) (proposición 2, sección 5.4, ) capítulo 5) hemos de tener £ 1 n £ 2 #</>.

Sea z e E xn E 2 y ~ ^ 0; puesto que ? e E í r\E2 podemos escribir z X = a jf 1+ - - - + a J ’ k , a je U ,j= l,...,k con

Si una forma canónica de la forma cuadrática A(x, 3f ) es x A(x, x ) = a1x 2 + - - - + akx k - a k+1xj¡+ 1 --------am 2 1 2

y
X = bp + igp+1 + --- + bn n g , b jS U , j = p + \ , ..., n

üj€ IR, üj>0,j=l, 2,

m, el cambio de base dado por

Para el vector Y las expresiones (4) y (5) producen A(% X ) = a1aj-\------\-aka ¡ > 0 ya que alguno de los a¡ debe ser no nulo, y A ( X X ) = - f i p+1b2 +1-------- fiqb2 ú 0 p q (observar que la última expresión puede ser cero ya que q puede ser menor que n). En cualquier caso se llega a una contradición, que se ha producido por el hecho de suponer que k > p ; por tanto, k ^ p . Puesto que el papel que juegan las expresiones (4) y (5) en el razonamiento anterior es simétrico, se deduce, de manera similar, la desigualdad p ^ k, con lo cual se tie­

y i = V / " x i> ^

yk = y fñ kx k, yk+ 1= A h 7 ~ i X k+ l , ..., ym= J~am m ym + l = x m+ l , ..., yn= x„ x ,

nos permite escribir A ( x , x ) = y\ + - - - + y l - y l + 1 -------- y 2 que recibe el nombre de forma normal de la forma cuadrática dada. Observar que la forma normal de una forma cuadrática es una suma algebraica de cuadrados.

a1

.c

invariante mediante cambios de base.

om w w w .M at em at ic

ne p = k. La igualdad m = q = rango(/l) se debe a que el rango de una forma cuadrática es

12.4.

F O R M A S C U A D R A T IC A S D E F IN ID A S . P U N T O S C R IT IC O S D E F U N C IO N E S D E V A R IA S V A R IA B L E S

El número de términos que aparecen en la form a canónica de una form a cuadrática A(x, x ) recibe el nombre de índice de inercia de la forma cuadrática; el número de términos positivos se llama índice de inercia positivo de la form a cuadrática y el número de términos negativos recibe el nombre de índice de inercia negativo de la form a cuadrática.

L a teoría de las formas cuadráticas será de gran ayuda para el estudio de las superficies de segundo grado; sin embargo, también posee otras aplicaciones, entre las que se cuentan la determinación de puntos críticos de funciones de varias variables. Para facilitar el razonamiento utilizaremos una función de dos variables z = f ( x , v), que representa una superficie en IR3. Recordamos al lector que para una función / suficientemente regular, ésta posee un punto crítico en (x0, yQ si y sólo si ) 8f 6x yo) = 0 , 8f — ( x 0, }>o) = 0 dy

E j e m p l o A.
dada por

Tratamos de encontrar los índices de inercia de la form a cuadrática

(1 )

A(x, x ) = x l x 2 + x 1 x 3 + x tx 4 + x 2x 3 + x 2x 4 + x 3 x 4 El cambio de variable x l = y x + y2, x 2= y 1—y 2, x 3= y 3+ y4, x 4 = y 3~ y 4 (¡com probar que es un cambio de base!) transforma la expresión anterior en

Ejemplos conocidos de puntos críticos son los máximos, mínimos y los puntos de ensilladura que se muestran geométricamente en los dibujos siguientes:

y-y¡ + (yi+2)(y3y)+ 1y2)(y3-y)+ 1y)(y+4 (y-y)(y-y)+ 1 y +4 (y+ 4 (y- a 3y)+ 1 2 3 4
+ y3 -

yl = y i ~ y | + 4y ^

3

+ y2 - y ¡ = (y , + 2y 3) 2 - y\ - 3y¡ - y\ 3

Escribiendo z 1= y 1+ 2 y 3, z 2= y 2, z3~ y 3, z4 = y4, que es de nuevo un cambio de base, se tiene: A = z\ — z\ — 3z 3 — z\ P o r tanto, el índice de inercia positivo de A es 1 y su índice de inercia negativo es 3.
M AX IM O M IN IM O P U N T O DE ENSILLADURA

Deseamos encontrar una condición que nos permita decidir entre todos los casos posibles de puntos críticos. Para ello escribimos la fórmula de T a ylo r d e / alrededor del punto (x 0, y 0) hasta el término de orden 2 — estamos suponiendo que / es lo suficientemente regular para que esto sea posible— :

Si/posee un mínimo en (x 0, j>0) se ha de tener/(x, y ) - f ( x 0, y0) ^ 0 para todo (x, y) en un entorno de (x 0, y 0); esto puede conseguirse en la igualdad (2) si se tiene H ( X , X ) > 0 para todo X ^ O . Esto sugiere la siguiente definición: D e f i n i c ió n 2 ______________________________________________________________ _________

f ( x , y ) = f ( x o, y 0) +

rr—(x 0, }> o)(x -X o ) + ^ ( x o , J'oXJ’ -J 'o ) óx cy

+

U na forma cuadrática A(x, x ) se llama definida positiva si A{x, x ) > 0 para todo x # 0 . Si A(x, x ) ^ 0 para todo x , A se dice semidefinida positiva.

82 , f 82 f S2 f — t ( x 0, y0) ( x - x 0) 2 + ^ i r { x 0 , y o ) ( x - x 0) ( y - y 0) + ^ j ( x o , y0) ( y - y 0) 5y2 dxóy 2 ! OX + R 3( x , y) donde R 3(x, y) es el término de error. Si (x 0, y 0) es un P u n t 0 crítico de / la fórmula anterior puede escribirse de la forma

Estos resultados quedan resumidos en el siguiente teorema:
T E O R E M A l ( Condición suficiente para la existencia de máximos y mínimos) ____

Sea/: IR2 1—•R una función suficientemente regular que posee un punto crítico » en (x 0, y 0) y sea H la forma cuadrática en C 2 que tiene a

f ( x , y ) - f { x 0, y0) = y H (X ’ X ) + R 3(x, y)

(2 )

/
om a1 .c

82 \ f ÔX2 s2 f dxdy

donde x —x 0 H (X ,X ) = H [('~ "° )> (* X° J j = ^ y y - y 0f \ y - y ,

\ ôxôy

8y2)

at

ic

x o, y o ) ( x - x o) 2

d2 f
+ 2——oxcy

.M

(x,y0)(x-xo)(y-y0) + ^ ( xo,y0)(y-y0)2 0
cy

s2 f

em

com o matriz. Entonces, a) b) si H es definida negativa, f posee un máximo (relativo) en (x 0, y 0), y si H es definida positiva, f posee un mínimo (relativo) en (x 0, _y0).

w

es una forma cuadrática que posee com o matriz ,2f ñ .2{x0, y 0) ÔX 02 f s2 f . ^ ~ ( x o. y 0) dxóy d22 /

w

w

at

/ I H =

Notas. 1) En libros de cálculo se demuestra que si H no es ni semidefinida positiva ni semidefinida negativa, (x 0, y 0) es un punto de ensilladura de / ' 2) Un criterio análogo al contenido en el teorema 1 se tiene para funciones de n variables. Observaciones. 1) Si A (x, x ) = (x, 5T), donde ( , ) representa el producto escalar en E, A es una form a cuadrática definida positiva, ya que (x^ x ) ^ 0 para todo x # 0 . 2) Si una forma cuadrática A (X x ) se escribe de la forma A (x ,x ') = al x j - — \ + a„x2 en una cierta base, A es definida positiva si y sólo si todos los a¡ son positivos y es definida negativa si y sólo si todos los ay son negativos. -

que se denomina la matriz hessiana de / en el punto (x 0, y 0). La fu n ción / posee un máximo en (x 0, y 0) si y s° lo si f ( x , y ) —f { x 0, ,yo) = 0 para tod o (x, y) en un entorno de (x 0, y 0); de la igualdad (2) deducimos que si H ( X , X ) < 0 , ( x 0, y 0) es un máximo ya que R 3(x, y) puede hacerse tan pequeño com o se quiera reduciendo el entorno alrededor de (x 0, y 0). Esto sugiere la siguiente definición:

D e f i n i c ió n 1 ------------------------------ -------------------------------------------------------U na forma cuadrática A(x, x ) se llama definida negativa si A(x, x ) < 0 para todo x V O . Si A(x, x ) ^ 0 para todo x , A se dice semidefinida negativa.

Para poder aplicar el teorema 1 es necesario poseer un criterio fácilmente aplicable que permita determinar si H es definida positiva o es definida negativa; una posibilidad es hallar una forma canónica de H y aplicar la observación 2); otra lo proporcionan los criterios de Sylvester que exponemos a continuación.

P R O PO SIC IÓ N 2 (C rite rio de Sylvester para formas definidas positivas) _________

Realizando el cambio de base:
y = v' _ i___ v' i) _____ v'

Sea A(x, x ) una form a cuadrática en un espacio euclideo con m atriz A = (a ¡j)"j= i en una cierta base. Si los menores angulares de la matriz A son positivos, es decir:
«u a¡¡ a 12 a l2 a 22
a 23 ü 13

S1

2Â 1

1

_

1

T 3-----2 /ím_ j

vm >

ym xm —

(observar que el determinante de esta transformación es 1 ) tenemos A(x, x ’) = X 1 j h y ------hÁm- 1 „ ~ 1+ by2 y Puesto que todos los son positivos sólo falta demostrar que b > 0; para esto observar que si C es la matriz del cambio de base de las coordenadas Xj a las y¡ se tiene:
0

~ an

^2

> 0, a 3 =
a 12 a 22

ü \2 ú 13

a 23 a 33

la forma cuadrática A(x, x ) es definida positiva.

\ = a bj

I an

«i* \

a1

.c

Demostración. Realizamos la demostración por inducción en la dimensión del espacio euclideo E. Si E tiene dimensión uno, la forma cuadrática puede escribirse de la forma A(x, x ) = a 11x 2 un f l n > 0 y, por tanto, la proposición queda demostrada. Supongamos ahora que el resultado es cierto para cualquier forma cuadrática con todos sus menores angulares positivos en todo espacio euclideo de dimensión inferior a m y sea A ( x , x ) una forma cuadrática en un espacio euclideo E de dimensión m con todos sus menores angulares positivos. P o r ser los m — 1 primeros menores angulares positivos, la hipótesis de inducción nos permite deducir que la form a cuadrática m- 1 m- 1 B (x ',x ')= X I “ ¡jXíXj

o
om
E j e m p l o A.

km- 1

\ ^lm

"

^m m

/

(sección 1) y, por tanto, Xi x - - - x k m_ í x 6 = |C'|Am | = |C|2 A m> 0 , de donde se deduce |C que b > 0 . ■ * * *

D em ostrar que la form a cuadrática en R 3 A = 2 x 2 — 2xy + y 2 + 4xz —6yz + l l z 2

em

¡=i j=

i

ic

at

es definida positiva. La matriz de A es I A= \ puesto que
0 1 1 1 0 - 1 - 1

w

en el espacio euclideo E' generado por los m — 1 primeros vectores de una base de E, es definida positiva; con un cambio .de base adecuado en F , B(x ', x ' ) puede escribirse en form a canónica (teorema 2 , sección 2 ) con coeficientes positivos: B(x \ x ') = / 1 x '12 + - - - + 4 _ 1 x ^2 _ 1 (/,->())

.M

at

w

2

- i
1 - 3

2

\

w

2

—3

11 /

R ealizando este cam bio de base en E y x'm= x m la form a cuadrática A(x", 3T) se transforma en A{x, x ) = / j x ; 2 + ••• + Xm_ ! x^2_ ! + (b j m x'm+ ••■+ bm_ !, m _ j x'm + am x ' 2 x'i x'm ) m Com pletando cuadrados se obtiene: la forma cudrática dada es definida positiva. * A ( X x ) = ).i ( x \ + - ~ x ' ^ j H [ ------+ b x ' 2 * * A1 = 2>0 A2 =
- 1 2 - 1

-4 -3 5 = 1> 0

= 1>0

y

A 3 = \A = \

- 1

El recíproco de la proposición anterior también es cierto.
P
r o p o s ic ió n

3_______________________________________________________________________________

donde En las mismas condiciones que en la proposición 2, si A(x, x ) es una forma cudrática definida positiva, todos los menores angulares de la matriz A =(a¡j) son positivos.

n

Demostración.

Sea A ( X x ) =

X

aux ¡x j la expresión de la form a cuadrática A, de E. P ara tod o k
a¡jX¡Xj

definida positiva, en una base {e "i, ..., cuadrática
A k(x,

1 ^ k ^ n la form a

x)

X

Nota. La demostración que se ha dado de los criterios de Sylvester es válida para espacios euclídeos puesto que se ha utilizado el teorema de reducción a su forma canónica (teorema 2, sección 2). Sin embargo, puede demostrarse que los criterios siguen siendo válidos para formas cuadráticas definidas en espacios vectoriales reales puesto que hemos comentado que podemos encontrar una forma canónica completando cuadrados.

¡,j= i definida en el subespacio vectorial E k = L { T 1, ek} de E, es definida positiva. U n

cambio de base adecuado, de matriz C k, reduce A k a A k = a í y2 + - - - + a kyl l y se tiene I a1
0

E j e m p l o B. Estudiar los puntos críticos de la función z = f ( x , y) = 2 x 2 + y 2 + xy - 6 x — 5y. Puesto que la solución del sistema
S¿ dx = 4x + y — 6 = 0

,

(o ,> 0)

\

/ fl, C k,

Sf / = 2y + .x - 5 = 0 dy es x = 1 , y = 2, el punto ( 1 , 2 ) es un punto crítico de /; en este punto la matriz hessiana de / es

\ 0 por tanto, O c flj x

\ a kl

akkI

x a„ = \Ck\Ak\Ck\= \Ck\ k, 2A H

om

.c

de donde se deduce que A k> 0 , que era lo que queríamos demostrar.

a1

H =

4
1

1
2

-a . = —fln > 0 ; A2 = -a i 2

-*12

w

w

w

la matriz de A(x, x ) (en la misma base) y, por tanto, ; ••• ; „ = |Â| > 0

.M

Para formas definidas negativas el criterio de Sylvester puede d e d u c ír s e le las proposiciones que acabamos de demostrar. Si A( x , x ) es definida negativa, A ( x , x ) = — A( x , x ) es definida positiva; si A =(a,j)"j= i es la matriz de A ( x , x), K = ( — a ¡ j ) " j = í es

at

ic

at

que es la matriz de una forma cuadrática definida positiva ya que 4 > 0 y \H = 1 > 0 . f \ posee un mínimo en ( 1 , 2 ).

em

> 0

— «22

Puesto que — a1 1 — a l2 —a12 —a22 —a l k ~ a2k

En la sección primera del capítulo 8 se dio la definición de producto escalar en un espacio vectorial y se demostró que su matriz en cualquier base es simétrica con todos los elementos de la diagonal principal positivos. N o toda matriz que satisface estas condiciones define un producto escalar, com o ya se observó en la citada sección. U na condición necesaria y suficiente para que una matriz simétrica determine un producto escalar es que la forma cuadrática asociada a la matriz sea definida positiva. Este resultado resulta evidente a la luz de las definiciones de producto escalar y de forma cuadrática definida positiva.

-a,L se tiene el siguiente resultado:

— a2 k

— a■k k

E j e m p l o C. Queremos encontrar los valores de cuadrática en IR3 dada por
la Q(x,

a

para los cuales la forma

PROPOSICIÓN 4 (Criterio de Sylvester para formas cuadráticas definidas negativas) Sea A( x, x ) una form a cuadrática en un espacio euclídeo con m atriz A = (aijfij= i en una cierta base- A (*> x ) es definida negativa si y sólo si los menores angulares de la matriz A se alternan en signo y f l n < 0 . define un producto escalar en IR3.

x) = (xj, x2, x3) 1 1°

a
1

1 0\ 1
ll

I x i\ x2

w

Puesto que Q ha de ser definida positiva hemos de tener a a a> 0
1 1 > 0 1 0 1 1

en Un a partir de la base E. Puesto que B(uh uj) = (u h Uj)B = Sip i , j = 1, 2, ..., n, la matriz B de B en la base U es la identidad y si C es la matriz del cambio de base de E a U se tiene que / = C'BC. En esta nueva base U la matriz de A es A = C ‘AC. (2 ) (1 )

y

1 0

a
1

>0

a

D e estas tres condiciones deducimos a> 0 , a2 — 1 > 0 y a2- a - 1 > 0

l± x / 5 hemos de tener Puesto que a2 —a — 1 = 0 tiene com o soluciones a = -

Puesto que A(x, x ) es una forma cuadrática en el espaco euclídeo IRJ, el teorema 2 de la sección 12.4 nos asegura la existencia de una base ortonorm al K = {íT i, v2, ..., F„) n en UB tal que si x = £ x¡v¡ se tiene que ¡= i

a> 0

,

a> 1

,

a< —1

,

1+V5 a> — 2

1 -7 5 y a<-

om

D e todas estas condiciones deducimos a >

1+75 A(x, x ) = A1x 2 + Á2x 2- — | +Á„x2 (3 )

a1 em at ic

.c
con /y -elR, j = l , 2, ..., n. Puesto que V es una base ortonormal en IR¿ se tiene que B (x ,x ) = x j + x l + - - - + x 2
n

(4)

.M

12.5.

D I A G O N A L I Z A C I O N S IM U L T A N E A D E F O R M A S C U A D R Á T IC A S

at

En algunos problemas físicos se presenta de manera natural el siguiente problema: dadas dos formas cuadráticas A(x, x ) y B{x, x ) en IR" encontrar una base en la cual ambas formas pueden reducirse a una suma de cuadrados. Dadas dos formas cuadráti­ cas cualesquiera es posible que el problema no tenga solución; sin embargo, si una de ellas es definida positiva siempre puede encontrarse una base que diagonaliza a ambas formas cuadráticas. La elegante solución de este problema se expone a continuación. Supongamos que A = (aiJ) l J=í y B = (biJ l J=1 son las matrices de las formas cuadrá­ ) ticas A(x, x ) y B(x, x ) , respectivamente, con respecto a la base F ^ e ^ , ..., ~ nj de IR" y e que B(x, x ) es definida positiva. En la sección 12.4 se ha observado que la aplicación ( , )B de IR" x IR" en IR dada por

w

donde x = X Las igualdades (3) y (4) resuelven el problema de la diagonalii~ 1 zación simultánea de A(x, x ) y B(x, x ). A continuación mostramos con un ejemplo com o se realiza este proceso en un caso particular.

w

w

E j e m p l o A. IR2 dadas por

Deseamos diagonalizar simultáneamente las formas cuadráticas en

A ( x , x ) = — 4x^x2 donde x = x { e x + x 2 if2.

y

B ( x , x ) = x f — 2 x 1x 2+ 4 x 2

(x, y)B = B(x, f)

X, y e IR"

L a matriz de B(x, x ) en la base f á , ~ e2j es

define un producto escalar en IR". Sea UB el espacio euclídeo IR" con el producto escalar ( , )B. U tilizando el proceso de ortogonalización de Gram-Smith (ver capítulo 8 ) puede encontrarse una base ortonorm al y una sencilla aplicación del criterio de Sylvester (sección 12.3) nos permite deducir que B(x, x ) es definida positiva. Comenzamos encontrando una base U = { u l , u2} de IR2

que sea ortonorm al con respecto al producto escalar (x, y ) B = B(x, y ) determinado por B. Conviene observar que B(x, J ) = x l y 1— x xy2 — x 2y x + 4x2y2, donde x = x ^ e ’l + x 2e2 Puesto que (e¡, e , ) B= B(e¡, ? 1 = 1 ) podemos tomar if1= e ‘1 además, v'2 = e'2 + txe1, donde (v2, u1 = 0 ; por tanto, ; )B
0

La forma cuadrática A(x, x ) puede diagonalizarse por el procedimiento utilizado en la sección 12.2. Puesto que

e

y = y { e x + y 2é’ . 2 4 4 1 = X2+ - X - ~ = ^ 3X2 + 4 X - 4 )

2

4

= (F2, u 1 = ( e 2 , T 1)B+ a(é'1 )B ,

= - 1 +a;

y la ecuación 3A2 + 4A — 4 = 0 tiene com o soluciones

de aquí deducimos que V2=~e2+~el . Puesto que Xx = — 2 (v2, T2) b = B ( v2, v2) = B ( ^ j , tomamos My, y ) = - 2 y l + - y l « 2 = — F (e i+ ë * 2) 1 1 = 1 -2 + 4 = 3 se tiene que , X2

\ '7 5 ya que A {Ui, u1) = A [ ( M , ^ 1 1= 0

w

w

2

4

w

.M

at

/ « 4\

em

at

ic

La matriz À de A(x, x ) en la base U = {«*!, u2} es

a1

.c

V 3

om

B(y, y) = y\+y\
donde y = y l ~v1+ y 2~ y V = { v u ~ v2 v2} es una base ortonormal con respecto a ( , )B. Los vectores tTj y ~ se encuentran calculando los subespacios invariantes corres­ v2 pondientes a Aj y X2. Para Xt = — 2 tenemos

/

2
2

4 -3 + 2

2y \ —

\
Tom ar
2

v 73

/

V 3
^ 2

= 0

T1= l - Ï Ï 1+ y ï u 2 = e'1+ C ê 1+ T 2). / Puesto que (di, ÏÏ i ) b = B[ ( j \ P tomamos

1 1= 4 — 4 + 4 = 4

Para A , = - tenemos

2

2 \ ~ 7 r

El lector habrá observado que el proceso de diagonalización simultánea seguido en el ejemplo anterior resulta bastante complicado. Los comentarios que siguen están encaminados a simplificar este proceso. Es claro que si B(x, x ) es la forma cuadrática definida positiva, tenemos 2 —- ^ í 2 => y i = > / 3 » ^ 2 = — iB (y ,y )= y i+ y l + ---+y2 en la base que diagonaliza a ambas formas cuadráticas a la vez. En esta misma base A(y, y ) = A1 + A2y ¡ + - - - + A „ y 2 yf „

2 'T ft Tom ar

4 ~ r

2 ì l

;;K
32

> = n / 3 « i «2 = \/3ei - ^ ( * 1 + ' 2 -

donde Au A2, ..., An son los autovalores de A. U tilizan do las igualdades ( 1 ) y (2) tenemos \ A - AI\ = | ' A C - AC‘BC\ = \C‘( A - AB)C\ = \C\\A - AB\\C\ C

Puesto que

/v ^ \ / ^ \ \

V3

1

at

tomamos

ic

a1

\ ~^/ 7
7L
- y

7/ ^
.M at
77

.c

om

id 2, 0 2 )fl = B

4 4 4 = -+ -+ -= 4 3 3 3

de donde se deduce que las soluciones de \Á—AI\=0 coinciden con las soluciones de \A — AB\=0, ya que |C|#0. Así pues, la resolución de la ecuación \A — AB\=0 nos da la diagonalización simultánea. Si queremos encontrar la base en la cual ambas formas cuadráticas se diagonalizan, observamos que de A — AI = C' ( A — AB)C se obtiene que las soluciones de

e i — f ( e i + e2] — r e ' — 6 - 1

em

( Á - A j I ) C ' 1^

j = 1 , 2 , ..., n

coinciden con las soluciones de

w

Observar que la matriz del cambio de base que permite diagonalizar A(x, x ) y B(x, x ) simultáneamente es

w

w

(A -A jB )^ ¿

y k e^ j= 0

7 = 1, 2, ..., n

(5)

/.
1

3 J3 - i r l

ya que \C\ = | | # 0 . P o r tanto basta con ortonormalizar los vectores que se encuentran C al resolver (5). En el ejemplo A tenemos
0 1 0 - 1

2

0 = \ A -A B \ = y, por tanto, la transformación lineal que permite diagonalizar ambas formas cuadráti­ cas es

—A —2 + A

—2 + A -4/1

-2

= 4A2- ( A - 2 ) 2 =

-

- 1

= 3A2 —4A + 4,

que produce las soluciones A1= — 2, A2= ~ Para At = — 2,
1

\2 * *

6 *

/

2 -4

-4

2 y i ~ 4 y 2= 0

yi=2, y2 = 1

Puesto que

Además

í)C)MG)(í)'-4- 4+4- 4
tomamos \A-kB\ =

1

1 2 - 1

0
2 1
_

/í ° ° °\
0 1 0 1

0

2 1 - 1 2 0 1 0

=( / - l ) 3(A + 3)

0 0 10
y

Para Á2 = - ,

\o

0 10

2/

I

_ 2

- 4\

P o r tanto,

3 4 \ Puesto que 3 3/

:;K
^ Ì \- 1 = B( (

-2y¡ — 4y 2 = 0

=>

y l = 2 , y2= — 1 .

A(y, y)=y\ + y l + y \ - 3 y l
Se deja com o ejercicio encontrar el cambio de base que diagonaliza simultáneamente ambas formas cuadráticas. El resultado es

om

2\ f
- 1A V-1

2^ |= 4 + 4 + 4 = 12 |

a1

II

.c

1 1 1 ~2 1 "2

1 0 1 2 1 ~2

at

1

ic

‘\

¡y,\ y2
y3i \>v

tomamos
1 1

Observar que éstos son los mismos resultados que los obtenidos en el ejemplo A.

w

w

s j í

2^/3/

w

.M

at

em

Ej e m p l o
dadas por

B.

Deseamos diagonalizar simultáneamente las formas cuadráticas en

Observación. T o d o s los resultados de esta sección se extienden fácilmente a espacios vectoriales de dimensión finita y formas cuadráticas definidas sobre ellos.

A(x, x ) = 2 x l + x 1 2 + x 1 3 — 2x2x 3+ 2 x 2x 4 x x

E JE R C IC IO S (C A P I T U L O 12)

Se c c i ó n
B(x, x ) = -x \ + x\ + x 3 + x\ + 2 * 2 * 4 donde x = x 1e1+ x 2e2 + x 3 e’3 + x 4 e“ 4 b) Puesto que B(x, x ) es definida positiva tenemos c)

12.1

1. Encontrar la matriz de las siguientes formas cuadráticas en IR" dadas con respecto a la base canónica: a) /l(x, x ) = 2xf — 3 x 1 x 2 + 4 x 2 + 6 x 1 x 3 3 A(x, x ) = £ ( x ¡ - s ) 2 ¿= 1
n
1

, ,

n= 3 n= 3

,s = - ( x ! + x 2 + x 3) 3

A(x, x ) = £ ( i - j ) 2xrxj
i< j

B(y, y) = y\+yl + yl+yl-

2.

Sea A ( x , y ) una form a bilineal que tiene co m o expresión A(x, Y ) = 2 x l y l + ' i x l y2- x 2y l + x 3yi

b) c)

x 2 + 5y2— 2 x y + 2xz 4 x 2+ y 2 + z2 — 4xy + 4xz — 3yz

con respecto a la base u 1= {\, 0, 1), u2 = (0, 1, 0), ü" = (0, 1, — 1) en IR3, donde x = x 1u 1 3 + x 2u2+ x 3u3, y = y 1u1+ y 2u 2 + y3u3a) Encontrar la expresión de A{x, y") con respecto a la base canónica.

En el caso b) indicar también la transformación que lleva la form a cuadrática dada en la forma normal encontrada.

b) Encontrar una forma bilineal simétrica B y una forma bilineal antisimétrica C tal que A = B + C, dando las expresiones de B y C con respecto a la base canónica de IR3. 3. Sea A una form a bilineal cuyo rango coincide con la dimensión del espacio vectorial V en el cual está definida. Demostrar que para todo x 0 e V, x 0 =£ 0 existe y 0 £ V tal que A ( x 0, j 0) / 0.

Se c c i ó n
8.

12.4

Determinar los valores de a para los cuales la forma cuadrática en IR3 dada por x 2 + 4y2 4- 2axy + 2ayz

Se c c ió n 12.2

es definida positiva 9. Determinar los valores de / para los cuales la forma cuadrática en IR4 dada por ? /?x2 + 2xy + fiy2 + fiz2 + 2 zt + fit2 es definida negativa.

4.
a) b) c) 5.

Encontrar una forma canónica de las siguientes formas cuadráticas: 3x2+ 2y2+ z 2— 6xy + 4xz

om at ic a1 .M at em .c w
n= 3 , n= 3 , ,

xy + 2xz 9 x 2— 3y2+ 6 x y + l S x z + I 2 y z D ar una forma canónica en una base ortonorm al de las siguientes formas cuadráti­

10. Determinar la región tridimensional en la cual la matriz de las derivadas parciales segundas de la función F(x, y, z) = x 2 + 3y2 + y2z2 determina una form a cuadrática definida positiva. 11. Encontrar los puntos de las superficies dadas en los cuales se alcanzan máximos o mínimos:
a) b) c) f ( x , y) = x 2+ y2 + 2x + 4 g(x, y ) = - x A+ 8x2- y 2- 4 y h(x, y) = x 3 —y3 + 3xy Sea A = a11x 1 + al2xy + a22y2 una forma cuadrática en IR2 tal que

cas en IR": a) b) c) d) —2x2+ y 2 + 4xy

2 x 2 — 6yz — 2z2 — 2xz x 2 — 2xy — 2xz — 2yz x xx 2 + x 2x 2 + x 3x A ,

w

n= 3 n= 4

w

12.

6.

P a ra cada una de las form as cuadráticas siguientes encontrar una base ortonorm al que la reduzca a su form a canónica y escribir esta form a canónica: a) b) c) 6 x 2 + 5y 2 + 7z 2 — 4x y + 4xz 3y 2 + 3z 2 + 4xy + x2 + 4x z + 2yz

a l!

a l2 ~ Y

a 12

~ Y

a 22

y 2 — 2xz + 2yz

Demostrar que A no es ni semidefinida positiva ni semidefinida negativa. 13. D eterm inar los valores de los parám etros a y b para los cuales la form a cuadrática cuya matriz se da a continuación define un producto escalar en IR3:
0

Se c c i ó n
7.
a)

12.3

Encontrar la form a normal y los índices de inercia de las siguientes formas a) u

a\ b) °
1

cuadráticas en IR3: x 2 + y2+ z 2+ 4 x y + 2xz + 2yz

2
0

a
0

1 ü h \ a

2b 5 0

1 0 1

Se c c ió n

12.5

14.

D iagonalizar simultáneamente las formas cuadráticas A{x, x ) = x f + 26xj + 1 0 x ^ 2

y
B(x, x ) = x f + 56x1 + 16x^2

B IO G R A F ÍA James Joseph Sylvester (1814-1897) fue un matemático inglés que junto con Arthur Cayley fundó la teoría de los invariantes algebraicos, es decir, expresiones de los coeficientes de una expresión algebraica que quedan invariantes mediante rotaciones y traslaciones de los ejes coordenados. En 1838 Sylvester consiguió un puesto com o profesor de filosofía en University C ollege (Londres). En 1841 aceptó un cargo de profesor de matemáticas en la Universidad de Virginia, Charlottesville (EE.UU .), en el que sólo estuvo tres meses. Cuatro años más tarde volvió a Londres com o contable de una compañía asegurado­ ra, manteniendo su interés en matemáticas a través de las clases privadas que impartía. Más tarde trabajó con abogado, comenzando en este período su relación matemática con Cayley. Desde 1855 hasta 1870 Sylvester fue profesor de matemáticas en la Academia Real M ilitar en W oolw ich (Inglaterra). V o lv ió a los Estados U nidos en 1876 para ser profesor de matemáticas en la Universidad Johns Hopkins en Baltimore (Maryland). Trabajando en esta Universidad fundó la revista matemática American Journal o f Mathematics, introdujo los estudios de D octorado en las Universidades de los Estados Unidos y contribuyó enormemente al desarrollo de las matemáticas en este país. En 1883 volvió a Inglaterra com o profesor de geometría en la Universidad de Oxford. Sylvester fue principalmente un algebrista. Realizó trabajos brillantes en teoría de números, principalmente en particiones (formas en que un número puede expresarse com o suma de enteros positivos) y análisis diofántico (m étodos para encontrar soluciones enteras de ecuaciones algebraicas con coefientes enteros). Sylvester trabajaba por inspiración y es difícil encontrar en sus trabajos una prueba correcta para los moldes actuales. A pesar de que publicó cientos de artículos, solamente escribió un libro de matemáticas titulado Treatise on Elliptic Functions (1876). Sylvester publicó en 1870 un libro de versos.

w

w

w

.M

at

em

at

ic

a1

.c

om

557

CAPITULO 13

SUPERFICIES DE SEGUNDO GRADO

13.1. 13.2. 13.3. 13.4.

.M

at

em

at

ic

a1

.c

Clasificación de las superficies de segundo grado Invariantes de las superficies de segundo grado en IR3 Determinación de los elementos geométricos de algunas cuádricas Notas adicionales 1. El hiperboloide de una hoja como superficie reglada 2. Clasificación de las cuádricas cuando A = 0 y < = 0 5

om w w w

La expresión general de las cónicas es un polinom io de segundo grado en dos variables. La generalización a tres variables produce una expresión de la forma

axj x 2 + a22y2 + «33Z2+ « 1 2 x y + a i 3x z + a23yz + ° i x + aí y + a3z + a —o
que recibe el nombre de superficie de segundo grado en IR3 o cuádrica. A la luz de los resultados obtenidos en el capítulo anterior sobre formas cuadráticas clasificaremos las superficies de segundo grado, de manera análoga a com o se hizo con las cónicas. En este capítulo trabajaremos en el espacio euclídeo IR3 con el producto escalar usual y toda expresión estará dada con respecto a la base canónica si no se menciona explícitamente otra base.

559

561 13.1. C L A S IF IC A C IO N D E L A S S U P E R F IC IE S D E S E G U N D O G R A D O E N R 3 con lo cual la traslación X — Xi + ->
2

U na superficie de segundo grado en IR3 es una expresión de la forma f ( x , y, z) = al l x 2 + a22y2 + a33z2+ a i2xy + a13xz + a23yz + aí x + a2y + a3z + a = 0

kx

K_ (1) ik 2 Z2 = Zl + fr3
2

Los términos de orden dos determinan una forma cuadrática A, en IR3, cuya matriz es a i2
a l 1 a 13

/L

permite escribir (3) de la forma k ¡ x j + k2y j + k3z2 = C (4)

~2
a 22

~2
a 23

A=

a í2 IT
a l3

a 23

r r

~2

«3 3

que recibe el nombre de forma canónica de una superficie con centro. La razón de esta term inología es la siguiente: se denom ina centro de una superficie al punto C 0 = ( x 0, y0, z0) tal que si { x 0 + a0, y0 + b0, z 0 + c0) es un punto de la superficie, su simétrico respecto a C 0, esto es {x0 — a0, yo~ b o , z0 — c0) está también en la superficie. Claramente, la superficie (4) tiene C 0 = (0 ,0 ,0 ) como centro. * * *

Si escribimos X = {x, y, z) y llamamos L ( X ) = a l x + a2y + a3z a la parte lineal, (1) puede

de cuadrados

.M

at

Nuestro objetivo inmediato es reconocer todas las superficies que puedan aparecer en (1) al variar sus coeficientes. Puesto que A (X , X ) es una form a cuadrática en el espacio euclídeo IR3, puede reducirse, en una base ortonorm aí { u lt u2, « 3} a una suma

em

at

ic

a1

A(X , X ) + L (X ) + a = 0

(2 )

.c

om

escribirse de la forma

Si C¥= 0, dividiendo por C, (4) se transforma en

w

k 1x 2 + k2yf + k3z \ donde k y, k2, k3 son los autovalores de la matriz A ( k j e R ) . Observar que la matriz del cambio de base es ortogonal ya que transforma la base canónica de IR3 en una base ortonormaí. En esta nueva base (1) se reduce a k í x f + k2y l + k3zf + b 1 í + b2y 1+ b 3z 1+ b = 0 x Pueden presentarse los siguientes casos I) II) III) Todos los k¡ son diferentes de cero. U no de los k¡ es igual a cero. D os de los A¡ son iguales a cero. C om o todos los k¡ son distintos de cero, completando cuadrados en (3) (3)

w

±—±—±4=1
a-, b c donde

x\

y\

z\

w

(5)

a=

se denominan semiejes de la superficie. Excluyendo el caso en que todos los términos son negativos en (5), ya que en este caso (5) no tiene ninguna solución y reordenando, si es necesario, se tiene los siguientes casos

CASO I. obtenemos

I.a)

A l cortar por planos paralelos al plano x 20 y 2, es decir z2 = d se obtienen
■^2

I.c) Al cortar por planos de la forma z2 = d se obtienen las hipérbolas de ecuación
x l y\ d2 — ~ — = i+ — a2 b2 c2 Cuando ^ 2 = 0 se obtiene la hipérbola X2_4= \ a2 Finalmente, si x 2 = d se obtiene y\
z2

elipses — + — = 1 — - siempre que c 2 — d2> 0 (i.e. |d|<|c|). a b c D e manera similar al cortar por planos de la forma y2 = d (ó x 2 = d) se obtienen elipses siempre que |á|<|2?|(|d|<|a|). La superficie recibe el nombre de elipsoide y su gráfica se muestra en la figura 1 .

c2

+ b2 V

d2 - I - ! ---a2

Figura 1.

Elipsoide

que representa una elipse siempre que —a2+ d 2> 0, es decir, |d|>|a|. Esta superficie recibe el nombre de hiperboloide de dos hojas.

a2

c2

\ - z=\ y ± de semiejes b y c. Esta superficie recibe el nombre de hiperboloide de una hoja. Si C = 0, (4) se escribe de la form a Á1x2 + A2yj + Á3z 2= 0 ; si todos los Aj son positivos o todos son negativos, esta ecuación solamente tiene com o solución el punto x 2 = 0, y2 = 0, z 2 = 0 . En el resto de los casos siempre podemos suponer que dos de ellos son positivos y uno es negativo (si uno es positivo y el resto son negativos se cambia de signo a la ecuación). Suponiendo que ^ ^ > 0 , A2> 0 y 13< 0 y dividiendo por |A3| se obtiene —“ x \ --- —y \=z\ ia 3i i¿3r En los planos de ecuación z2 = d esta expresión produce elipses, salvo si d = 0, en cuyo caso se obtiene el punto x 2 = 0, y2 = 0. Si y2 = 0 la ecuación se transforma en

^2 a1 b2 c 2~

Figura 2.

Hiperboloide d una hoja e

w

de semiejes a y c y si x 2 = 0 se obtiene la hipérbola

w

w

.M

1

at

Y2

72

em

ecuación que posee soluciones para todo d e IR Si y2 = 0 se obtiene la hipérbola .

at

ic

x\ y\ d2 — + — = 1 +— ’ a2 b2 c2

a1

.c

om

I.fe)

A l cortar por planos de la forma z2 = d se obtienen elipses de ecuaciones

transforma la superficie anterior en que representa dos rectas de pendiente ± obtienen dos rectas de pendiente Pueden presentarse los siguientes casos: Il.a) II .b) La superficie que se obtiene en este caso se denomina cono elíptico (Fig. 4). D ebid o a que cuando C = 0, (4) produce superficies cónicas, en los casos no triviales, cuando C = 0 en (4) la superficie recibe el nombre de superficie cónica. Il.a) fr3# 0 b3 = 0 D e manera similar, si x 2 = 0 se kxX2 H k2y2 "f" ^ 3 ^ 2 = G. " (6 )

C C om o b 3 # 0 , la traslación x 3 = x 2, y3 = y2, z 3 — —z2+ — transforma ( 6 ) en

¿ i x\ + k2y\ = b3z3 o bien x 3 y3 ± 4 ± g = z 3 a b

om

a2

b2 ~

a1

.c

una vez que se ha dividido por b3, donde a = ecuación anterior tiene sólo los siguientes casos:

/ = , y b= Uil

Esencialmente la

em

at

ic

w

.M

at

«)

^ + ^ 2 =z3

;

b)

y? -= z .

C a s o II.

Podem os suponer, por ejemplo, que A3 = 0; podemos entonces completar x 3 yl 4 + ~ = d.

cuadrados en x , e y x en la expresión (3) para obtener

Ai[

+ ^ [ Ï1 +

h
2 /1

X2

“í- b3z i — C.

w

Figura 4.

Cono elíptico.

(el caso en que ambos signos sean negativos es «equivalente» al caso a) si hacemos la simetría z 3= — z 3 y el caso en que el primero sea negativo y el segundo positivo es «equivalente» al caso b) realizando la misma simetría). En el caso a) los planos z3 = d producen una elipse siempre que d > 0 y un punto si d = 0; si d < 0 no se produce ninguna intersección. Las elipses tienen por ecuación

w

Si y 3 = 0 se obtiene la parábola x 3= a z 3 (con su eje en el eje 0 z 3) y si x 3 = 0 se obtiene otra parábola con eje en 0 z 3, de ecuación y3= b 2z3 La superficie que se obtiene se denomina paraboloide elíptico y puede apreciarse en la figura 5.

La traslación

I I .b)

Si b3= 0, la ecuación ( 6 ) se escribe de la forma A1x i + Á2yi = C.

7 + ¥ =Zi

Puesto que le falta una de las variables, z 3, decimos que la ecuación representa una superficie degenerada; de hecho con cualquier plano z 3= d posee com o intersección la cónica AjXj + l 2 y| = C y, por tanto, la superficie es una superficie cilindrica que tiene a esta cónica com o base: se tiene entonces un cilindro elíptico, un cilindro hiperbólico, dos planos que se cortan o una recta (que corresponden a las siguientes cónicas: elipse, hipérbola, dos rectas que se cortan y un punto). Ver figuras 7 y 8 . * * *

Figura 5.

Paraboloide elíptico.

En el caso b), el plano z 3 = 0 produce las rectas x 3 = con d > 0 , se obtienen las hipérbolas

a

a • j de pendiente —; si z 3 — a,

X¡xl + Á2 = C yl

Í - y= d i

om

con eje principal en la dirección de x 3; finalmente, si z3 —d con d < 0 , se obtienen las hipérbolas

.c

j C IL I N D R O
^ P A R A B O L IC O

el sentido negativo de z 3. La superficie que se obtiene se denomina paraboloide hiperbólico y se representa en la figura 6 .

y \

w

w

w

cuyo eje principal está en la dirección de y3. El plano y 3= 0 produce la parábola x 3 = a 2 z 3 que está dirigida en el sentido positivo de z 3. mientras que el plano x 3 = 0 produce la parábola y\ = —b2z3 que está dirigida en

.M

Figura 6.

Paraboloide hiperbólico.

at

em

i

at

ic

xí yí — í + tt=

, ~d

a1

( - d > 0)

Á íxl = B y A

CASO III. en

Supongamos, por ejemplo, que k2 = k3 = 0 , con lo cual (3) se transforma

EJEMPLO A. R 3 dada por

Encontrar la forma canónica de la superficie de segundo grado en

k 1 + b l x l + b 2y i + b3z 1+ b = 0 x^ b1 La traslación x 2 = x l -\ ------, y 2 = yi, z 2 = z l la reduce a 2¿i k 1x 2 + b2y2 + b3z2 + b' = 0 (7)

3x 2 + 2y1 + 3z2 — 2xz — 2x — 4y — 2z — 5 = 0 indicando la correspondiente transformación geométrica. SOLUCIÓN. L a form a cuadrática 3x 2 + 2 y 2 + 3z 2 —2xz tiene com o matriz

A= Si b2 = b3= 0 se obtienen dos planos paralelos distintos o un solo plano, o el conjunto vacío dependiendo de los valores y los signos de ^ y b'. Si al menos uno de los coeficientes b2 ó b3 es no nulo realizamos la transformación x2 = x3 _ b2y3 + b3z3
0

I 30
0 2 \ -1 0 -1

0 3/

*

L os autovalores de A son las soluciones de 3 —A = 1
- 1 0

0 2- k
03- k

= (3 - k)(2 - k)( 3 -0 k) ~ (2 - k) = (2 - A)[(3 - A)(3- k ) — 1]

ic

a1

22

v ^ F + fc !

.c

om

b3y 3 ~ b 2z 3

= ( 2 - k ) [k 2 - 6 / 1 + 8 ] = ( 2 - k)(k - 2)(k - 4 ) y, por tanto, tenemos Ax = 4, A2 = 2, A3 = 2. Para Aj = 4 un autovector satisface las ecuaciones / ->
0

forma: ¿ i x l + y/bl + b l y i + b ^ Q

w

Con la traslación x 4 —x 3 , y4 —y3-\ b' r= = = =
J b \ + b\

w

w

.M

at

em

at

que es una transformación ortogonal (¿por qué?) de manera que (7) se escribe de la

-> \ / *

,

z 4 —z 3

o

x= z

=>

U2 = (0, 1 , 0 ) “ 3 = - t = (1 , 0 , 1 ) V 2

tenemos k 1 i = ByA x ’ B = J b \ + b\

Con la transformación

/. que representa una parábola con su eje en la dirección de >4; com o estamos en IR3 la superficie es un cilindro parabólico. (V er figura 7). Notas: 1. Las ecuaciones que aparecen al lado de las figuras reciben el nombre de forma canónica de la superficie que representan 2. Los paraboloides (Figs. 5 y 6 ) no poseen centro, pero poseen un vértice en el origen cuando su ecuación está dada en la forma canónica. 3. Aparte de los elementos geométricos que se citan en 2, las superficies no degeneradas poseen ejes que se han dibujado convenientemente en las figuras.

1
7*

0 -L \
V5

0 1 1
72
la forma cuadrática se reduce a

0 ( yi
1 \ ZJ

0

V 2/

o bien 4x\ + 2y\ + 2 z ^ - 4 y i - 4 —* = - 5 = 0.

Com pletando cuadrados se obtiene 4x¡ + 2(yi - l )2 + 2( -8 -0

Haciendo la traslación

y2= y i ~ l
z ,= z , 13.2. se obtiene 4 x j + 2yi + 2zi = 8 o bien
rí v2 72 x 2 y\ z\ *± + yl + zA = í 2 4 4

IN V A R IA N T E S D E L A S S U P E R F IC IE S D E S E G U N D O G R A D O E N IR3

superficie dada es un elipsoide con semiejes2, 2 y 2. Sus ejes se encuentran en las

.M

at

que es la forma canónica de la superficie dada. Deducimos de esta expresión que la direcciones de t?i, u2 y íf3, respectivamente. La transformación que transforma la superficie dada en su forma canónica es

El m étodo descrito en la sección anterior para determinar las superficies de segundo grado puede resultar engorroso si los autovalores y autovectores no son sencillos. A l igual que en las cónicas, otra forma de estudiar las superficies de segundo grado es mediante la obtención de sus invariantes, permitiéndonos obtener su forma canónica sin necesidad de conocer la transformación que nos permite llegar a ella. Para tratar de averiguar los invariantes de las superficies de segundo grado recordamos que los invariantes de la cónica a 11x + a 12xy + a 2 2 y 2 + a 1 + a2y + a = 0 x son

em

at

ic

a1

.c

om

w

w

a jí /x \

«12

al 1
a\ 2 2

al 2
~2

a i
2

w

/J 2 ~7
0 1

°
1 0

4 2A \ l/ J
0 1

x2 \
y2 + 1
i z2 +

s = a 1, ,1 + a ' u22

> 0=

~2

a 12 T
a 22

a 22

°2l
2

II <

\ zI
centro del elipsoide es

y

Û1 --2

a2 --2

a

\

y que los números s y d son, salvo el signo, los coeficientes del polinom io característico de la matriz U12 \ A =

En el sistema de coordenadas { x 2, y2, z 2} el centro es el punto (0, 0, 0); por tanto, el

T
“ 12 \ T

/X \ y \’ i -

R r sft 0 =

»
1

-T -fi 0

l°\ /I\
2 1

a22i = A2- ( a 11+ a 22)Á + ¡A\.) *

C
1

(En efecto, 0 = \ A - U \ = ( a l l - A ) ( a 22- A ) — * *

\ n/2

72/

w

Sea / = A ( X , X ) + L ( X ) + a = O una superficie de segundo grado en R 3, donde X = (x, y, z), L ( X ) = a {x + a2y + a3z, IR y A ( X , X ) es la forma cuadrática que tiene como matriz

ae

Tenem os ahora que determinar los coeficientes del polinom io característico de la matriz A; un cálculo largo pero sencillo permite obtener

«„-a
a 12 a 13

a 13
f ‘

~ Y

flll
~2~ °12 a 22

~ T
a 23

¡ A - A I |=

*12
*13

a22
a 23

X

a 23

T

— X3 + ( a i 1 + a 22 + a33)X2

2
a l3 a 23

«33 —
«1 3 «1 1 2

x
«2 3 «2 2
~2

~2~

~2~

a 33

l 12
+

Direm os que una expresión de los coeficientes de / es un invariante si permanece fija mediante traslaciones y transformaciones ortogonales. (O bservar que si/ está dada con respecto al sistema de referencia canónico, solamente se han utilizado transformaciones ortogonales y traslaciones en la sección 1 para reducirla a su forma canónica.) P r o p o s ic ió n 1________________________________________________________________________

l1 2 22

+ «1 3

\X+ \A \.
«2 3
~ Y

T

«3 3

«3 3

P o r tanto, son invariantes de / (x, y, z) = 0 los siguientes:
S l = a U + a 22 + a 23

om

«1 2

«1 3
«1 1 ~ Y «2 2

a1

Son invariantes de una superficie de segundo grado en R 3 los coeficientes del polinom io característico de la matriz A.

«1 1 ~2~
S ,=

«2 3
~2

.c

+ «1 2
~ Y «2 2 ~ r

+ «1 3
«3 3 ~ Y «2 3 «3 3

Demostración. A l realizar una transformación ortogonal de matriz C, la matriz de la form a cuadrática que aparece en f { x , y, z) = 0 se transforma en C ‘A C (sección 1); com o C es ortogonal, C' = C - 1 y, por tanto, A se transforma en C ~ Í AC ; por tanto, podem os decir que se ha realizado un cambio de base en la aplicación que tiene a A com o matriz en IR3. Puesto que el polinom io característico de una matriz nd depende de la base (capítulo 7, sección 2) deducimos que sus coeficientes quedan invariantes mediante transformaciones ortogonales. Finalmente, cualquier expresión de los coeficientes de A ( X , X ), y en particular los coeficientes de \A — XI\=0, quedan invariantes mediante traslaciones. Para demostrarlo basta observar que la traslación

em

at

ic

S = IA¡ * * *

w

.M

at

w

Para determinar un invariante más de las superficies de segundo grado en IR3 escribimos F(x, y, z, f) = a n x 2 + a22y2 + a33z 3 + a12xy + a13xz + a23yz = atx t + a2yt + a3zt + at2 y observamos que f ( x , y, z) = F(x, y, z, 1); por otro lado, F es una form a cuadrática en IR4 que tiene com o matriz
«1 2 / «1 1

w

2
«2 2

«1 3
~ Y

2\
«2

«1 2

«2 3
~2

transforma la superficie ( 1 ) de la sección 1 en

A=
«1 3
~ Y

2
«3

«2 3

2
«2

«3 3

2 7

f = A ( X u X j + J^oc, P, y)x1+ ~ ( x , P, y)y1+ ~ ( ( n , P, y)zl +f(cc, P, y) = 0 ex oy oz donde X x = ( x u y 1 z j , que deja invariante la forma cuadrática A. ?

Ui \2

«3

2

2

a la cual se le denomina matriz ampliada de f.

P

r o p o s i c i ó n

2-

R E S U M E N

(Invariantes de las superficies de segundo g r a d o )_________

A = | 4 es un invariante de las superficies de segundo grado en /|

Son invariantes de la superficie de segundo grado f ( x , y, z) = a n x + a22y2 -\-a33z2 + a x2xy a 13xz + a\2yz + (1)

Demostración. matriz

Sea C una transformación ortogonal en IR3; la transformación de los siguientes:

+ a 1x + a2y + a3z + a = 0

c
C1 =
0

o
1
¿71 1 n S 1 — «1 1 + « 2 2 + «3 3 > ^2 «1 2 - y «2 2 «1 2 2 + «1 3 y «3 3 fl I I 11 «1 3 2 + «2 3 y
«3 3 «2 2

«2 3 y

es ortogonal en R 4 y transforma A en C \ A C 1= C 1 1A C ; puesto que \Á-AI\ = \ C ; i A C l -A I\

«1 2

«1 3

«1

ui i
«1 2 «1 3 2 «2 3 «2 2
T T

~iT ~ dj 1

T
«2 3 «;

los coeficientes de \Á — AI\ permanecen invariantes mediante C 1. El término indepen­ diente de \A-AI\ es \A y, por tanto, éste es un invariante mediante transformaciones \

«1 1

~ Y

ai 2 y A = \A = \
T

om

ortogonales de IR3. Si tenemos ahora la traslación

8 = \A = \

«1 2

2
«1 3

22
«2 3 ~2

.c

a1

«1 3 2

«2 3 «3 3
~ T

at

\ zi

em

y

=

yi

+

at

ic

/

di

dj

w

.M

*

*

*

la proposición 1 ):
«1 2 / «1 1 T ~ «1 3 \

IT
«2 3

23x

'

w

w

la matriz ampliada de / en este nuevo sistema de referencia es (ver la demostración de

A continuación clasificamos las superficies de segundo grado en IR3, también llamadas cuádricas, atendiendo a sus invariantes. Estudiamos por separado cada uno de los casos que aparecían en la sección 1 . En el Caso I la forma canónica es A1x 2 + A2y2 + A3z j = C Puesto que en esta ecuación (A1A2A3^0). ^ <

«1 2

15/
2dy 2<3z

T
«1 3

«2 2

IT
«3 3

«2 3

*1

0
a2

§ á
— A1 A2A3C

a a

p >

o<

~Y

IT

15/ /(a, A y)/ \ 2dx 2dy 2dz
; doüde;las derivadas parciales están evaluadas en (a, / , y). Un procedimiento análogo al ? utilizado en la demostración sobre los invariantes de las cónicas permite demostrar ■ lo cual prueba que \Á es un invariante d e / \ ■

A=
0

^3 ■

II
¡Jí ^

C

(0 tí.

C

í t •tq u

P K

c

además % < >
0

S= O

^2

~-A\A2A3

1 < i*
z *** i ° O

y, por tanto, la forma canónica de las cuádricas del caso I es

por tanto,

-T

O

A ¡x j + Á2y i + A3z j + — = 0. 6= Si A # 0 se obtienen elipsoides, hiperboloides de una hoja o hiperboloides de dos hojas dependiendo de los signos de A1; A2, A3, A y ó. Si A = 0 se obtiene una superficie cónica o un punto. * * *

A, A,
O

0

= 0

y

A=

•'Z
O

(
= 0

En el Caso I I la forma canónica es de la forma A¡^xj + A2y j + b3z2 = C Si b3/ 0 esta puede escribirse de la forma A i * 3 + A2y\ + b3z3 = 0 . Puesto que {Al A2 ¥=0)

En este caso se obtienen cilindros elípticos, hiperbólicos, dos planos que se cortan o una recta. Su form a canónica no puede ser determinada con los invariantes de que disponemos. * En el Caso I I I la forma canónica es Axx\ + b2y2 + b3z2 + b' = Q ; si b2 = b3= 0 se deduce fácilmente que s2= 0, < = 0 y A = 0 (en este caso se tienen dos 5 planos paralelos distintos o un solo plano). Si al menos uno de b2 ó b3 es no nulo, la forma canónica es
A1x l ~ B y 4 = 0 .

4 O
*

O c

*

ic
A= Ai A 'y

a1 em at

.c

om

y también se tiene s2 = 0, < = 0 y A = 0 (en este caso se tiene un cilindro parabólico). 5 * * *

.M

at

A l final de este capítulo puede encontrarse un resumen de los resultados obtenidos sobre la clasificación de las cuádricas. Observar que la clasificación arriba realizada no es completa ya que no permite distinguir entre las superficies cilindricas y los planos (ver notas adicionales en la última sección de este capítulo).
EJEM PLO A.

w

w

w

Sr =

+
0

A,
0

0 0

+

A2
0

0 0

Reducir la superficie de segundo grado x 2+ y 2 + z2— 4xz — 4y + 2 = 0 a

O a2

= AjA-

su forma canónica y decir qué tipo de superficie representa. Tenemos

su form a canónica es
1 0 1 0 0 - 2 - 2 0 1 0 - 2 0 - 2 0 - 2 0 2 - 2 0 2 2 1 0 - 2 1 0 - 2 0 1 0 - 2 0 - 2 0

Al x\ + A2y \ ± V

/—4
S2

z 3 = 0.

A=

0

>A í >2 Puesto que ¿ 3 # 0 , A ^ O ; com o — = - < 0 se obtienen paraboloides elípticos o hiper> s2 4 bólicos dependiendo de los signos de A1 y A2. Si b3 = 0 la forma canónica es

— 2 — 4[2 — 4 ] = 6 ^ 0

1 0 -2
<= 5
0 1 = 1—4 = — 3#0.

A 1x| + A2yl = C;

-2

0

Puesto que los autovalores de la matriz I A=
1 0 0 1 0

o bien
2 y2 z2 — x -------- 1----- = 1

- 2\
0 1

1/2 1/2

\ - 2

/

y se trata, por tanto, de un hiperboloide de dos hojas.

son Aj = 1, A2 = - 1, A3 = 3 la forma canónica es x 2 — y 2 + 3z 2 — 2 = 0

2

2 - 2
y se trata, por tanto, de un hiperboloide de una hoja.

O b i e n ____ - _ h___ = 1 _ 2 2 2/3

w

Ej e m p l o
Tenemos

B.

Reducir la cuádrica y2+ 4 x z + 1 = 0 a su forma canónica

y

decir qué

.M

at

em

at

ic
13.3.

a1

.c

om w
tipo de superficie representa. D E T E R M IN A C IO N D E L O S E L E M E N T O S G E O M E T R IC O S D E A L G U N A S C U A D R IC A S

w

0 0

0 1 0 0

2 0 0 0

0 0 0 1

0

0 1 0

2 0 0

A=
2 0

= -4 / 0

0=

0 2

= -4 / 0

y los autovalores de 0 A=
0

Para las superficies de segundo grado en las que al menos uno de los números A ó 5 es no nulo se ha dado un procedimiento para obtener su form a canónica en la sección anterior. A continuación describimos procedimientos para encontrar algunos elementos geométricos de estas superficies. Si < / 0 se trata de una cónica con centro y 5 se dará un procedimiento para calcular éste; si < = 0 se tienen los paraboloides (o 5 cuádricas sin centro) y entonces se dará un procedimiento para calcular su vértice. Sea f(x ,y ,z ) = A (X ,X ) + L (X ) + a = 0 (1)

0
1

2
0

son

= 1 , A2 = 2 , x 3 — — 2 .

2

0

0

L a forma canónica de esta superficie es

una superficie de segundo grado con A / 0 ó <5/0. La dirección de sus ejes está dada por los autovectores de la matriz de A. Sea (a, / , y) el centro de una superficie de segundo grado con centro (¿ # 0); la ? > traslación x = x !+ a , y = y x+ P , z = z 1+ y

transforma (a, / ?,

y) en

(0 , 0 , 0 ); por tanto (0 , 0 , 0 ) es el centro de la superficie

Los auto valores de A son dadas por u1, u2, u3 donde

= 1, A2 = — 1, Á3 = 3 y las direcciones de sus ejes vienen

/(*i> y i, 2 1) = / l(X 1,

+

ex

P, y)x1+ ^ ( a, / , y)yx ? dy

x= 0 A1= 1 (2 ) 2 A2 = - l
0 - 2

^ = (0 , 1 , 0 )

z= 0 0
2 0 0

+

dz

P> y)z i +/(<*>

7) = °

—2\

x= z y= 0

m = (1 , 0, 1) 2

que

esla ecuación transformada de ( 1 ) mediante la traslación considerada; por tanto, I - 2

2/ \ z/ — 2 \ / x\

J^(a, 0, y)= 0 , ~(a, 0, y) = 0 , ~ (a,P,y) = 0
dx oy dz

X =

—z

¿3 = 3

0

-2

\- 2
el

0

- 2/

y= 0

;

«3

= (1 ,0 , - i )

ya que en caso contrario (0, 0,0)no sería el centro centro de ( 1 ) satisface el sistema

de (2) (¿por qué?). Así pues,

C om o los ejes pasan por el punto C = (0, 2, 0) sus ecuaciones son fx = 0 l

que posee una única solución ya que su matriz es 2A y | 4 = ¿ # 0 . v|
E JE M P L O A . Determinar el centro y los ejes del hiperboloide de una hoja del ejemplo A de la sección 13.2: x 2 + y2 + z2 — 4xz — 4y + 2 = 0 Su centro satisface

w

w

w

Sf — = a l3x + a23y + 2a33z + a3= 0 dz

.M

at

em

Sf — = a12x + 2a22y + a23z + a2 = 0 dy

at

ic

a1

</ 3 — = 2a11x + a 12y + a 13z + a1= 0 dx

.c

om

z= 0

U

' -2 } ; x = z\,

-u

I x = —z

7 = 2

E J E M P L O B. Determinar el centro y los ejes del hiperboloide de dos hojas del ejemplo B de la sección 13.2: y2 + 4xz + 1 = 0 , Su centro satisface 4z = 0, 2y = 0, 4x = 0 y, por tanto, es el punto C = (0, 0, 0). Los autovalores de su parte cuadrática son = 1, A2 = 2, X3 = — 2; las direcciones de sus ejes vienen dadas por ut , u2, u3 donde

K
dx

x\ Ax = 1 y zl x\ l°\ y zi x\ U / l°\ 0 0

= 2x — 4z = 0

=

I°\ ° U /

x = 2z z = 2x « i = ( 0 , 1 ,0 )

</ 3 ^ = 2 y -4 = 0 dy Sf — = 2 z —4x = 0 dz

x= z

y =0
X = — z

u2 = ( l , 0 , 1 )

A7= —2
de donde deducimos y = 2, x = 0, z = 0. P o r tanto, C = (0, 2, 0).

y zl

u3 = (l,0, -1)

y= 0

\°l

L a ecuación de su eje principal (el eje z en la forma canónica) es { x = —z, y = 0 } y los otros ejes son {x = 0 , z = 0 }, {x = z, y = 0 }.

Tenemos
1 2 2 0 0 1 0 0 0 0 2 0 1 2 2 0 0

Supongamos ahora que la superficie dada en (1) es un paraboloide (A # 0 , 6 = 0 ); el plano tangente al vértice del paraboloide tiene las direcciones de los autovectores correspondientes a los autovalores no nulos ( 1 1 ,A 2) y el eje perpendicular a este plano tangente (que denominaremos eje principal) tiene la dirección de un autovector correspondiente a 1 3 = 0. Sea (co^co2, co3) un autovector correspondiente a Á3 = 0. Si (a, ¡i, y) es el vértice del paraboloide un vector perpendicular a / en este punto viene dado por

A=

2 0 0

1 = -4
1 2 2

2 2 0

0 0 = 0 0

= - 2
2

2 0

= 8#0
2

;

5 = \A = \

2 0

3
2 2 - 1 0

- 1
2 0

0 0

= - A[(2 - /)(1 - /) - 4] = - Â(À2 - 3/ - 2) = 0=

-- 1

Eje principal

Puesto que N Í7 > 3 , / Puesto que

> 0 y Á2< 0 con lo cual se trata de un paraboloide hiperbólico.

om

1

2

1

s ,=
2 2

0

+
0 0

+

2 0

0 0

= - 2

em

at

ic

Vértice

P lano tangente

a1

.c
su forma canónica es

w

w

.M

JV= “ (oí, P, y),
\ex

cy

P, 7), /(a, P, 7)
cz

at

-

,'Bf

8 f

df

3 + y n
2

2 3 -y n -x2 + y 2 + 4z = 0. 2

P o r tanto existe l e IR tal que N = A(co1, co2, co3); si dejamos variable a, / y y en N se ? obtienen las ecuaciones lineales df df CÜ,— = co, — 1dy ÔX df (O-i-— = 0) dx l ôz

w

El eje principal tiene com o dirección: /I 2 \o
2 0

\ /x \

/0 \ x + 2y= 0 )
0

2
0

0
0

df cu,— = co, l dz dy

ë l l e

/ W

\ o/

(2 )

Por tanto Sf d f d f - , , , , = 1(0,0, 1)<=>(2x + 4_v, 4y + 4x, 4) = 1(0, 0, 1). ,c x oy cz Por tanto 1 = 4 y 2x + 4y = 0, 4y + 4x = 0; así pues x = 0, y = 0 y el eje principal es el eje z. Sustituyendo x = 0, y = 0 en la superficie dada se obtiene el vértice:

que determinan planos que pasan por el vértice y tienen (co1 co2, a>3) com o dirección ; común; el sistema ( 2 ) representa, por tanto, la ecuación del eje principal. El vértice del paraboloide se determina hallando la intersección del eje principal (2) con la superficie. E je m p lo C. Determinar el vértice, el eje principal y el plano tangente en el vértice del paraboloide x 2 + 2y2 + 4xy + 4z + 3 = 0, así como su forma canónica.

3

P o r tanto,

eje Oz y que la generatriz pasa por el punto (a, 0, 0) y tiene com o vector director (0 , / , 1 ) con P ^ O . ? Las ecuaciones paramétricas de la generatriz son

( X\
El plano tangente al paraboloide hiperbólico en V tiene por ecuación 3 \ y

=

zl

/ a\ 0 \°/

/o\
+ 1 p w

y las ecuaciones del giro alrededor del eje Oz vienen dadas por / x'\ y' 13.4. N O T A S A D IC IO N A L E S P or tanto, h i p e r b o l o i d e d e u n a h o j a c o m o superficie r e g l a d a / eos q > U na superficie se denomina superficie reglada si por cada uno de sus puntos pasa al menos una recta totalmente contenida en la superficie. Ejemplos sencillos de superficies regladas son los «cilin d ros» estudiados en la sección 13.1. Otros ejemplos se obtienen girando una recta, llamada generatriz, alrededor de otra fija, llam ada eje. Si la generatriz es perpendicular al eje se obtiene un plano, si es paralela se obtiene un cilindro y si le corta se obtiene un doble cono recto con vértice en el punto de intersección (ver las figuras adjuntas). l
ÿ

/ eos < p = \ sén q> o

— sen (p eos cp 0

°\ ° 1

/ X\

y \ zl

W /

1 El .

— sen < p
COS

I a\
0 1 0

/ a eos cp \

= \

sen cp
0

(p
0

+ t\ p
w

l° \

( ~ P sen

= , a sen (p \ o /

■ t h \

P eos
1

om

\ z' ¡

\ °/

.c

a1

como

z' = t

deducimos que

at

ic

w

w

w

.M

at

em

(x ')2 + (y')2 = (a eos q — z'P sen cp)2 + (a sen cp + z'P eos cp)2 = a2 + P 2(z')2 >

P o r tanto, su ecuación es (x ')2 + (y ')2 — p 2(z’) 2 = a2, que representa un hiperboloide de ■ a una hoja de semiejes a, a y — y de centro el origen de coordenadas. Este resultado no es debido a una casualidad, sino que es cierto para todo hiperboloide reglado; en efecto, para demostrarlo observemos que es suficiente probar­ lo para un hiperboloide de ecuación Podríam os ahora preguntaros cuál es la superficie que se obtiene cuando la generatriz no es paralela ni corta al eje; para tratar de identificar esta superficie encontremos sus ecuaciones en un caso sencillo. Supongamos que el eje coincide con el

ya que cualquier otro se reduce a éste mediante un m ovim iento y una traslación. Para b el hiperboloide dado en ( 1 ) basta tomar la recta (x, y, z) = (a, 0 , 0 ) + í( 0 , 1 ), como c puede comprobarse. (Sugerencia: hacer un giro elíptico.) b Observar que la recta (x, y, z) = (a, 0, 0) + í(0, — , 1) es también una generatriz del c hiperboloide dado en (1) y que no es paralela a la anterior. P o r tanto, un hiperboloide de una hoja tiene dos generatrices no paralelas. * * *

Si estamos en el caso en que dos autovalores son cero, A2 = A3 = 0, por ejemplo, tenemos A = < = s2 = 0; si la forma canónica es 5 AjX 2 — By = 0 se tiene que At s = 0+ 0+ ->
0

0
0

B2 — B/2 = ~ A X— # 0 0

0

0

-B / 2

y entonces tenemos un cilindro parabólico; por el contrario, si la forma canónica es 2. C L A S IF IC A C IÓ N D E L A S C U Á D R IC A S C U A N D O A = 0 y á = 0 AiX 2 + C = 0 En la sección 2 se han utilizado algunos invariantes de las superficies de segundo grado para obtener una fácil clasificación de ellas. El lector recordará que tal clasificación no era completa ya que era imposible encontrar la forma canónica cuando A = 0 y < = 0 a partir de los invariantes encontrados en aquella sección. 5 El problem a se resuelve dem ostrando que cuando A = (5= 0 existe un nuevo invariante, a saber
a 23
« 2 2

se tiene que s3 = 0 y entonces si tienen dos planos paralelos o un solo plano. *
E JE M P L O A .

*

*

Estudiar (o clasificar) la superficie de segundo grado x + 3y + 3 z - 2 = 0

ic

a 23
« 3 =

~ Y a2 2

2

~ Y
« i

2

~2

at

a 33

«3
+

a 13
« 3 3

«3
+ « 3 2

«12 «1
2

«22 «2
2

«2
2

em

at

~2

2

«11

« 1 3

~2

2

«11

a1
Encontramos sus invariantes: 1
1 0 - 1 - 1 0 - 1 - 1 - 1 - 1 0

a2

«1

«12
~2

«1
2

.c

om

- 1/2 3/2 3/2
- 2

.M

w

2

2

w

a

a

a

w

«3

<= 5

0 0

= 0

A=

0 0

= 0

-1/2
0 1 0 - 1 - 1 - 1 0

3/2
1 — 1

3/2

Si estamos en el caso en que un autovalor es cero, A3 = 0,por ejemplo, teníamos AiX 2 + A2 y2+ c = 0 com o form a canónica y, se obtenían cilindros elípticos o hiper­ bólicos (c # 0 ) o dos planos que se cortan o una recta (c = 0). En estos casos

1

s ,=
0 1 0 - 1

+
0 - 1

+
- 1 1

H —

+ 1 — 1 = —2 ^ 0 -1 -1 3/2 3/2 3/2 = 0 + 0 + 0 = 0 . -2

s? =

Ai 0 0 0 0 0 _ + + 0 A2 0 0 0 0

- 1/2 3/2 + -2

- 1/2 3/2 + -2

-1 -1 1/2

-I- _ -I-

_ = AiA 2 / 0

0 - 1 -1 / 2 3/2

0 - 1 -1 / 2 3/2

Aj
=0 + 0 +
0
0
£

0
A2
0

0
0

Se trata entonces de dos planos que se cortan o una recta; com o sus autovalores son — AjA2c — s2 c. ya que
1—A A i = 1, A 2 = — 2, A3 = 0

c

P o r tanto c = — y si s3# 0 se obtienen cilindros elípticos o hiperbólicos y si s3 = 0 se s2 obtienen dos planos que se cortan o una recta.

0 — 1— A
- 1

0 - 1

0
0

= (1 — A)[( — 1 — A) 2 — 1 ] = (1 — A)(2A + A ) = (1 — A)A(2 + A ) ,

■1 — A

la forma canónica de esta cuádrica es x 2 — 2y2 = 0 y, por tanto, se trata de dos planos que se cortan. Para encontrar las ecuaciones de estos planos despejamos x en la superficie dada considerando y, z com o fijas: 1 ± y j l — 4 [ — y1 — z1 — 2yz + 3y + 3z — 2] 1 ( 3 <5^0

Resumen
Foma canónica Elipsoide H iperboloide de una hoja H iperboloide de dos hojas

x=

-------------------------- 2 -------------------------- = 2 ± [ y + Z - 2 P o r tanto las ecuaciones de los planos son x = y + z —1 ; x = —y —z + 2 A#0-

2 xX 2 + k2 Y 2 + X3Z 2 H = 0 —

y la superficie dada puede escribirse de la forma (x + y + z — 2 )(x — y — z + 1 )

0= 0

f Paraboloide elíptico ^Para b oloid e hiperbólico

à,X

/ 4A 2 + à 2Y 2+ /-------- Z = 0 “ V AiA 2

U n punto Un cono C L A S IF IC A C IÓ N D E L A S C U A D R IC A S

A 1 A ' 2 + A2 y 2 + A3 Z 2 = 0

om

a lxx 2 + a22y2 + « 3 3 ¿ 2 + a12xy + a13xz + a23yz + a1 + a2y + a3z + a = 0 x

ícilindro elíptico o hiperbólico s3 # 0 A = 0.S ,= 0 ' Dos planos que se cortan s3 = 0 5= 0 ' o una recta ,A !A : 2 + A 2 y 2= o ÍC ilindro parabólico \/.l X 2- B Y = 0 52 # 0 . s3 = 0 ■ ) D os planos paralelos o un plano k l X 2+ C = 0 X 2 + X2Y 2+ — = 0

«2 2

~ ~ 2 T
In v a r i a n t e s : A =

«33 /
«2 2

«3
2

ü )

\A ó = \A sí = a l l + a22 + a33 \, \,
«12 «11

«u s ,=
«12

«13 + ~2 «33 «13 ~2~ «33 «3 --2 «22

+

ir
«33 Aj, A2, Aj son los autovalores de la matriz A. «i i
«12 «12

«23

~2 ~

a 22 «23

«13
2 «2 2

T
«i
2

«23

«22

T «33 «3 --2

«i i «13
2

«i
2 «2

~2
«22 «2 2

s ,=

«23

«3
2

+

«3
2

+

~2 «i --2

2

«2 --2

a

«i --2

a

---

a

w

a 13

a23

w

1

«33

2

w

«23

«3

.M

A=

~ a2 ~ Y 2 2

at

al2

a23 ,

«22

em

~~ T\ 2

«23

at

«11

a 13\

ic

ai 2

ni

2

~ Y

2

\

a1

«12

«13

.c

H IP E R B O L O I D E R E G L A D O O D E U N A H O JA

w

w

w

.M

at

em

at

ic

a1

.c

om

C IL I N D R O

H IP E R B Ó L IC O

DOS PLANOS Q U E

SE C O R T A N

E J E R C IC IO S (C A P I T U L O 13) 1. H acer un estudio lo más detallado posible de las superficies de segundo grado que se indican (encontrar tipo, forma canónica, ejes, centro, ...): a) b) c) d) 2. 2x2 + 2y2 + 2z2 + 2xz — 2xy — 2yz = 1 2 x 2 —6y2 —2z2 — 2xz + lOx — 6 y — 1 = 0 — 2y2 + xz — 4y + 6z + 5 = 0 2 x 2 + 2y 2 —4z 2 — 5xy — 2xz — 2yz — 2x — 2y + z = 0 Clasificar la cuádrica 3x 2 + 2_y2 + 2z 2 + 2yz + 4x + 2y — 5z + 7 = 0 encontrando sus

EJERCICIOS DE REPASO CAPITULOS 8 A 13

ejes, si los tiene. 3. Considerar las cuádricas que admiten por ecuaciones x 2 — 2 y 2 + az2 — 2xz + 2 yz + 2 x + 1 = 0 para a real. Estudiar para que valores de a la cuádrica anterior es un paraboloide (elíptico o hiperbólico) y encontrar la ecuación del eje principal. 4. Indicar el tipo y la forma canónica de las cuádricas dadas por las siguientes matrices: A continuación presentamos varios ejercicios, que pueden servir para repasar los conceptos introducidos en los capítulos 8 a 13. Los ejercicios del 1 al 24 están ordenados de acuerdo con el orden de los capítulos de este libro. D el 25 al 36 el grado de dificultad esm ayor que en los anteriores. El resto son problemas que se han propuesto en varias convocatorias a los alumnos de prim er curso de las licenciatu­ ras de M atem áticas y Físicas de la U niversidad A u tón om a de M adrid. 1. Diagonalizar las matrices dadas mediante un cambio de base ortonorm al e indicar el cambio de base. I 7 a) A= 2 \ 0 2
6

a)
- 2 - 1 -2

at

5 3

3

b)

- 1

- 2 2 1 2 1 - 1 0 - 1

2

1 - 1

1

- 1

2. Demostrar que todos los autovalores de una aplicación antisimétrica no singular son imaginarios puros. (Nota: E t - + E es antisimétrica si (¿rfx, y ) = —

c)

3

d)

- 1 - 1

4 3

w

-2

- 1

2

■ \

i

0

- 1

-

w

w

2/

\

-3
- 1

em

1

2

-2

-1

2

at

ic

2

1

- 2

- l\

2 -1 1 0 2 2
1

2

a1

.c

om

0\ 2 5/ b) B=

/ 8 -3 \ -3

— 3 — 3\ 8 - 3 -3
8

.M

2

1

(x^ ¿/y)-)

0/ -1
4

I

1
0

-1
3 y />

e)

-1

-1

\-i
/ 0
1 1 1 0

-i
0

l\
0

9)

0

0

0

1

it) ■

\ 1 0 1 o/

0 0 0\ 0 1 0 0 0 0 1 1 \o 0 1 V 1 2 1\ 2 2 1 2 - -2 -4 1 --2 - 1/
/I

3.

Aplicar el proceso de ortogonalización en IR4 con el producto escalar usual a los vectores u 1 = (l, 2, 2, - 1 ) , u2 = (l, 1, - 5 , 3) , m = (3, 2, 8 , - 7 ) 3

4.

Encontrar el coseno del ángulo que forman los planos
7r j

= plano generado por ( 1 , 0 , 0 ) y ( 0 , 1 , 1 )

7i2= plano generado por (1, 1, 0) y (1, — 1, 1)

5. Demostrar que la suma de los cuadrados de las diagonales de un paralelogramo coincide con la suma de los cuadrados de todos sus lados.
593

6 .

Si x = ( x l5 y u z j , Y = ( x 2,

y 2,

z 2 )e lR 3 demostrar que

12.

Clasificar el m ovim iento

(x, y’) = 2 x l x 2 + x 2y 1 + x ljy 2 + 2 y 1 _y2 + z 1 z 2 es un producto escalar en IR3; calcular la norma del vector tf = (l, — 1, — 1) con este producto escalar y el subespacio ortogonal el subespacio generado por TT. 7. Sea/: IR3 1— IR3 la transformación ortogonal que respecto de la base canónica viene > dada por la matriz. / -1
- 2 - 2 - 1 - 2 2

L \
5
2

(■ ) P 5

y encontrar sus elementos geométricos. 13. Dem ostrar que el ángulo / es la mitad del arco que abarcan sus lados, es decir / ? ? q > = —. (Ver figura adjunta.) [ Sugerencia. La composición Ss o Sr es un giro de ángulo doble del que forman r y s,

1

A =3

-2
- 1

1

2

D ecir qué tipo de transformación ortogonal es.
8.

donde r y s son las mediatrices de A B y B C , respectivamente.]

Encontrar dos subespacio invariantes W1 y W2 de la aplicación T: IR3 1— IR3 con > matriz

/ r

y tal que dim Wx = 1, dim W2 = 2.

.M

9.

Sea la aplicación T: IR2 1 > IR2 que tiene com o matriz —
1

at

em

at

ic

a1
14. 15.

.c

om
l\ /1 \ I con respecto a la base uí = 1 I

w

w

H allar las ecuaciones de la simetría en el plano con respecto a la recta x + y = 3. Encontrar las ecuaciones de la simetría con respecto al plano x + y +
z =

,

u2 =

w

1.

Encontrar la matriz de la aplicación adjunta , T *, de T con respecto a la base {íTj, u2} cuando en IR3 se considera el producto escalar usual. Sea (x ,y ') = ( x 1 + x 2)(y 1+ y 2) + x 2y2 + x 3y3 un producto escalar IR3, donde x = X j ^ + x 2 ie2 + x 3e3, jf = y^e^ + y¿e2 + y3e3 y {e\, ~ 2, ~ e e3} es la base canónica en IR3. Encontrar la proyección del vector 7 = ~ex +~e2 + e'3 sobre el plano n: x 2 + x 3 = 0 con el producto escalar dado.
11

16. a) Encontrar las ecuaciones del m ovim iento M que se obtiene com o com po­ sición de la simetría con respecto al plano 2x — y — = 3 y la traslación de vector v = ( - 2 , 1, 3).

z

10.

b)

Decir qué tipo de m ovim iento es M y encontrar sus elementos geométricos.

17. Determinar los valores de X para los que las formas cuadráticas dadas son definidas positivas:
a) b) 5x2 + x | + Ax| + 4x ^ 2 —2 x ^ 3 —2x2x 3 x 2 + 4 x f + x j + 2 /X!X2 + 1 0 x ^ 3 + 6x 2x 3

.

S e a tf^ l

| ,

u2 = (

) una base de IR2; decir si la aplicación lineal T :

V
tal que T tiene com o matriz

18.

Encontrar una base ortonorm al en la cual la forma cuadrática 3x| + 3 x 3 + 4 x !x 2 + 4x ^ 3 —2 x 2x 3 se reduce a su forma canónica y encontrar esta form a canónica.

T = 2

lo

'

1

19. Clasificar la cónica 16x2 —24x_y + 9y2 — 30x + 40^ = 5 y determ inar su form a canónica. 20. Demostrar que la cónica l l x 2— 24xy + 4y2 + 6x + S y = — 15 es una hipérbola y determinar su centro y su eje principal.

con respecto a la base { u í , u2} es autoadjunta. ¿Es T una matriz ortogonal?

Clasificar la cuádrica — 3z 2 — 2xy + 4xz + 4yz + 2x + 2y — 2z = 0 indicando su for­ ma canónica.

21.

30. a) Sea / el lugar geom étrico de los puntos medios de todas las cuerdas paralelas al eje O X de la cónica de ecuación

22.

Clasificar la cónica x 2 — 2xy + 2y — 2 = 0 indicando su forma canónica. a iiX ~ ax2xy i~ a22y 2 -j- axx ~ a2y h a —0 (1 )

23. Reducir a una suma de cuadrados la forma cuadrática 2xy + 2z2 mediante una transformación ortogonal e indicar la transformación. 24.
Determinar los valores de a y b para los cuales la aplicación bilineal siguiente define un producto escalar en [R2 que hace de este espacio un espacio euclideo:

donde a u # 0 . Demostrar que l está contenido en una recta y encontrar la ecuación de esta recta (Sol.: 2a11x + a l2y + a1=0). b) Demostrar que si (1) es una cónica con centro, la recta encontrada en a) pasa por el centro de la cónica. (Esta recta se llama recta diametral.) c) encontrar la recta diametral de 1) 2) 3x2 — 2xy + 3y2 + 2x — 4 y + 1 = 0 x 2 — 2xy + y2 + 4x — 6y + 1 = 0

/ F ( ( X l \ í ^ 1 ) ] = x l y l + a x 1 l + ( b - 2 ) x 2y 1+ ( a 2 + b)x2y2 y

Los ejercicios siguientes son de m ayor dificultad que los anteriores. 25. Dem ostrar algebraicamente que si M es un m ovim iento directo en el espacio con tres puntos fijos distintos y no alineados, M es la identidad. 26. Sea A = (aij)"J=l una matriz real tal que ai j > 0 y an + a i2-1------ \-ain= l para todo i , j = 1, ..., n. Demostrar que todos los autovalores de A son en módulo menor o igual que 1 . 27. U tilizar el problema 2 para demostrar que si S es una m atriz antisimétrica ( I + S) es invertible; demostrar, además, que ( I + S ) ~ l ( I — S) es una matriz ortogonal con determinante + 1 . U tilizar esta construcción para obtener una matriz ortogonal a partir de la matriz

31. H allar el ángulo que forma la diagonal de un cubo con una de sus aristas. Demostrar que la proyección ortogonal de una arista del cubo sobre una diagonal

a1 .M at em at ic w w w

.c
32. En J f 2(U), el conjunto de las matrices cuadradas de orden 2 con elementos reales, demostrar que (A, B ) = traza ( A B ‘) es un producto escalar. Encontrar una base ortonorm al para el subespacio M = {A e J í 2{W)/traza (/1) = 0 } . 33. Determinar todos los movimientos planos que transforman A = ( 2 ,0 ) en A '( l , 2) y B = ( 0, 0 ) en B' = { 1, 0), precisando tipo, subespacios invariantes y elementos geom étri­ cos. 34. Sea V un espacio vectorial euclideo de dimensión finita y V y W dos subespacios suplementarios de V. P rob a r que la proyección sobre W paralelam ente a U es autoadjunta si y sólo si U y V son ortogonales. 35. Com probar que todo m ovim iento del plano puede obtenerse com o composición de tres simetrías, y que 2 son suficientes para los movimientos directos. 36. En un espacio vectorial euclideo E cuyo producto escalar tiene com o matriz

1

\

s=
-tg -a

,g 2 “

28. a) Hallar la ecuación de la superficie que se obtiene al girar alrededor del eje z la recta que pasa por el punto (a, 0 , 0 ) y que tiene com o vector director (a, / 1 ). ?, b) Dem ostrar que si /?#0 la superficie anterior es un hiperboloide de una hoja; encontrar su centro y sus ejes. Nota. U na superficie con la propiedad de que por cada uno de sus puntos pasa al menos una recta contenida en la superficie se denomina una superficie reglada. ¿Qué superficies regladas conoces? 29. D em ostrar que todos los autovalores de una matriz real simétrica A están en el intervalo [a, />] si y sólo si la forma cuadrática con matriz A — l 0I es definida positiva para todo k0< a y definida negativa para todo A0 > b .

om

coincide, en valor absoluto, con - de la longitud de la diagonal.

( 1
0

0 2 - 1 - 1

0

lo

2

en la base {u 1( u2, ü *3}, hallar la proyección ortogonal u de u3 sobre L{S\, u2}.

37. Determinar de las siguientes formas cuadráticas de IR3 si son definidas positivas, definidas negativas, semidefinidas positivas, semidefinidas negativas o indefinidas: a) b) c) 38. x 2 + y2 + z2 + 2xy + Ay2 x 2 + 6y + z 2 + 2xy + 4y2 x 2 + y2 + z2 + 2xy Clasificar el m ovim iento M de ecuación / M
1

44.

Clasificar la cónica de ecuación x 2 + 2 xy + y 2 — 6 ^ 2 x + 6 ^ / 2 y = 0

y encontrar su forma canónica, ejes, focos, vértices, ... 45. Dada la cónica de ecuación a x 2 + 2 axy + y 2 — 2 x — 2 y + a = 0 \ /0
1 0

\ I x\

- 1 + 1

0 0

y

\
39.
focal.

1/

\0 0 1 l\z,

determinar los valores del parámetro a para los cuales representa un par de rectas, y hallar dichas rectas.

y escribirlo en forma canónica si es posible. Clasificar la cónica l l x 2 — 16xy — y2 + 2y = 0; hallar su forma canónica y su eje

40.

at

Se consideran las formas cuadráticas de IR2, P y Q, dadas en el sistema canónico de coordenadas (x, y) por 5x 2 + 2y 2 + 2xy e y 2 —2 x 2 — 8 xy, respectivamente. D eterm i­ nar un sistema de coordenadas (x', y') de la forma x' = ax + by, y' = ex + dy, a, b, c, d e U , en el que se tenga P = x ' 2+ y ' 2, Q = Xx'2 + ny'2 para algunos A, /ielR que también se determinarán (la solución estará completa cuando se determinen a, b, c, d. A.ye.íR para, los que se cumpla lo pedido).

ic

a1

.c

om

U NIVERSIDAD D B L A Ü E M S » !

transforme (.1, 1, 1) en ( N 3. 0 0) y al mismo tiempo (2, — 1, — 1) en ( 7 5 , i, 0)?

42. D ada la forma cuadrática Q(x, y, z) = 35x 2 + 5 5 y 2+ 4 z 2—42xy + 12xz—4yz encon­ trar una base tal que Q tenga la expresión
Q(x', y', z') = Ax ' 2 + /¿y' 2 + vz' 2

y decir si es definida.

43.

Sea M el m ovim iento de

IR3

dado por

/ x\ M

5 3 ~5

/ x\

\ z !

y

y
\ zi

o/
a) b) Determinar el tipo de movimiento. H allar los subespacios invariantes y determinar los elementos geométricos.

w

w

w

.M

at

41.

¿Existe una transformación ortogonal o una autoadjunta de

IR3

en

IR3

que

em

PACULTAD DE r?TGEÍJTEBHL
DEPAR'rA.?.'KNTO DS DOCUMENTACION Y BIBLIOTECA MONTEVIDEO - U RU G U AY

SOLUCIONES

w

w

w

.M

at

em

En las páginas siguientes se encuentran los resultados finales de muchos de los problemas propuestos en este libro. Esperamos que sirvan al lector com o com proba­ ción de su trabajo diario. Es necesario observar que aquellos problemas en los que se pide la demostración de algún resultado no están, por su naturaleza, incluidos en estas soluciones. C om o ya se dijo en el prólogo, la matemática no es un deporte para espectadores. El intento repetido de solucionar un problema produce mayores beneficios que la memorización de la teoría. Esperamos que los numerosos ejercicios acumulados al final de casi todas las secciones de este libro sirvan para que el lector no sea un mero espectador.

at

ic

a1

.c

om

CONSEJO: Mirar las páginas siguientes sólo después de intentar solucionar los problemas propuestos.

5.

a)

C A P IT U L O 1 1.1
1 6.

a)

.

a ) x ! = 0, x2 = l. / 1 0 32/23

fe) Xj = — 1 , x 2 = 2 . 0 \
1 0 0

\ 7.
1 0 0

2

.

a)

c)

\0 /I 0 0
\ fl

0 \ o ll o ]_ o Ll / 0 11 0 -1 0 ü 1 °\ d) 0 1 1 0 ~4 \ 4 0 1 0 0 1 1 / /2 1 °

\0
10

0

1/

.

c)
1 1 1

11.

a) (4 x l5 — 3 x i + x 2, 5x! + 3x2). fe) (7 x j — 3x2, — 6 x j + 2 x 2, — l l x j —9x2). l l fe)
1 0 2

14.

a)
1

/X \ /h\ y = 1 1 . \zj 3\ I x \ ^ '

\ / *\

/4 \
1

3 -7

2 i

-3

2

.c

om

3.

ic

a) c) é) f)

em

x x = l, x 2 — 1, x 3 = 0 . b) x 3 = c, x 2 = —(1 + c ), x 1 = 3 — 2c. Incompatible, d) x 1= 2 l, x 2 = 24, x 3 = 4, x 4 = 3. Xj = (1 5 + 3c)/8, x 2 = ( l l — 25c)/8, x 3 = 0, x 4 = c. x i = x 2 = x 3 = l . g) x t = — 1 , x 2 = 0 , x 3 = l . 2 4 h) X j = - c , x 2 = - c , x 3 = c. i) Incompatible.

yo I a 2\ 3

W \3 /

a1

I a c)
1

-a
1 - 1

2

a

/ W
x+ 2 ; f~ l ° f e) 4. / fe) N o. c)
1 0 0

at

4.

w

a) Com patible indeterminado, c) Incompatible.

fe) Com patible indeterminado.

w

.M

7)

Xj = 3 , x 2 = 2 , x 3 = l .

1.4
2

at

w

.

g ° f ~ :(x) = eos a) 2. fe) 2. c) 2. d) 1.

l o g ( x ) = - ( co sx ) + :

3.

1.2

2. 3. 4. 5.

a) L.D . (2, 4) = 2(1, 2). fe) L.I. c) L.D . d) L.D . (2, 2, 4,2) = (2, 1, 3, l ) + (0, 1, 1, a) 2. a) 3. fe) 1. fe) 4. c) 2. d) 3. e) 3.

(1, 2, 3) = (1, 3, 2) + (0, - 1 , 1). 1).

1/3 4. a) 1/3

-2 /3 1/3

\ .

-11/5 \— 1/5
1

4/5 -1 /5
0

1/5 1/5

j
/ . d)
0 0 0 1 ¡a

—a\
0

l/a\
0

a) Compatible, x 1 = x 2 = x 3 = l. fe) Com patible indeterminado, x 1 = 5 — d1 — d2, x 2 = 2 í/j d2, x 3 —d j , x 4 — í¿2<
6.

0

0

1

/

\ 1 /a

,0

0/

1.3 1. 2. 4. a) Nada, H ay seis. a) sen [3 x 2 + 16], fe) 3 [ s e n ( 3 x - 5 ) ] - 5 . c) 3 [sen (x 2 + 7 ) ] - 5 . fe) Inyectiva. c) Biyectiva.

a ) / _ 1 (x i, x 2, x 3) = ((x 1 + x 2 - x 3 )/2 , ( 3 x j - x 2 - x 3 )/2 , - x ! + x 2). fe) / - 1 ( x j , x 2) = ((x j + x 2 )/2 , ( x ! - x 2 )/2 c).
1

—a
1

7.

a)

¿ _1

=
0

x = 1/4 -13/4

1

—2 a

/ 602 fe) X _1 =

1/4 -37/4 11

-1 / 4 \ 17/4

/0
40

\ .

4 - 5 /

\ — 48/

/ 1/2 c) A
1

- 1/6 1/3
0

7/3\ 1/3 , x = - 1/

/ 5/36 \

= \

0 0

\

-2/18 o
0 0 \0 0 0 0 1 1

\ /I
. 1

0 1 0

\
/ 4 =

/1
0 1

o \

0 C A P IT U L O 2 2.1
0

1/3

0

1 0

—1

l / \ 0 o \

/

\o

0

/

1

- 1

1.

a) 3.

b) 12.

c) a ( b - 1).

d) 1.

e )- l.

2.

/ _ * __________ L _ \ ab —a ab —a - i \ b1 1

eos a — sen a

sen a eos a
- 1 0

/ b) x 1= k /2, x 2= 0 . c ) x 1 = x 2 = 0.

/ \ - 1

0

1

3. 4. 7. 2.2
1 2

a) * ! = — 1, x 2 = 1. a) 11. eos a. b) 0.

c) (x — y)(x — z)(z —y).

d) 1.

.c

om

a1

/O
0

0 1 0 1

1 0 0 0 1

at

. .

a) 8 .

b) 2 .

c) - 5 6 . c) - 1 4 . d) —90.

ic

U =| /
0

0

1

a) - 1 6 . a) 0.

b) 0.

at

em

\ 1

\o \/ 1

o o -7 o O
1 - 1

.M

3. 4.

b) 4.

c) 1.

d) - 6 0 .

e) -1 6 2 .

f ) — A3 + 5A2 — 3A— 1. ff) ( x - l ) C v - l ) . a) F , = - F 2. b) C 3 = 2 C 1 + 3 C 2. c) d) F i = 2 F 2—F 3. e) F 4 - F 1 = 3(F 3 - F 2). 0 «12 0
— «2 3 — «2 4 «1 3 «2 3 «1 4 \ «2 4

w

w

2.

b) A = \ - 1 / 1

0

o
1

w

O
2 1

/\ O O
1

0

/ \

O\ / 1 o O

i.

a)

— al2
-«1 3

O ft) | X | = M '| = (- 1 )V Ic) N o. 3. 5.

O

0
— «3 4

\ O O

1I \ O O

1I

«3 4

— a 14 13.
1 0

0

/

A A - ' = I => l = \ A A - l \= \A\\A-l \ . A A ‘ = (a2 + b2 + c2 + d2) I => \ \ = (a2 + b2 + c2 + d 2)2. A / 1 xj O\/ 1 O ■ yi O
1 1

n
1

\ |A|=0.

6. 2.3
1

A =

I1
1

1

y3 O I

OI \ O

.

a)

■ -2

O 1/

W

i \0

» 1
-2

2

7. 9. \ /1 0
0 11

a) 2( — x)" D„ —D „ - 1

b) (x — l)(x — 2 )- •-(x — n + 1 ). D n_ 2.

c) ( n - l ) " “ H2 « - l ) .

-3
0 0

. .

(x + 2 ) ( x — 2 ) 3. ( - 1 )" —2 ( x 2n~ 2(n l ) 3.
1

*>)

1

1

5/7
1

12

).

0

1/ l o o

/ \0

0

1/8

13.

2.4
I 1. a) c o f ( A ) = 5 3 1 —3 b) c o f ( A ) = 2 -1 / 15 c) c o f(^ ) = -3 \ —3 / " I -3
0

8.

T

1 (x, y, z) = ( — 2x — 2y + 3z, —y + z, 3x + 4y — 5z).

— 11 -5 ? -3 2
- 1

—1 \ -1
1

10.

; A-'=-lco((A)y.
/ 2 -1 2
11

;
- 6 6

A \

1

= [c o f (/ !)]' =

-3

.

a) x ¡ = 5/3, x 2 = 8/3, x 3 = 0 . b) X j = — 1/5, x 2 = 14/5, x 3 = 6/5. 332 -2 3 9 55 1 - x Y. = — c) * i = :- 7 ,> X-,2 == ---- > x 3= ~ — , x 4 = ~ — . 77 ~i .c 145 58 58 m = - 5. a) cos a - sen a sen a cos a b) /I
0 \ 0 0 0

\ cos a c) sena sen a —cosa

12.

cos a — sen a

sen a cos a /

5 -3
0 0

; /
0 0 0

a

~

24' 13. / (x ) = 2x 2 —x + 1. 16.

6

d) cof(,4) =

~ 2 \ i 19 -1 9 / *■
0 1 0

\A\ = a(a — l ) " ^ 1 ; A es invertible si a j= 0 y a # 1.

-5
20

;

¿ ■ 1= - - [ c o f ( X ) ] ‘.

2.5 1. a) r = 2. 2. 4. b) r = 3. c) r = 2. d) r = 2.

-5

1

r = 3 para toda a # 3 ; r = 2 si a = 3. 5) x : = 8/9, x 2 = — 5/9, x 3 = x 4 = 0. c) X [= 3 ¿ , x 2 = /, x 3 = l — 4 L a) Incompatible, b) x t = 11/4, x 2 = 3/2, x 3 = - 11/2. 4 + 5r — 2 — 1Oí 4 -1 0 t c) x = — -— , y = ----- ----- , z = — - — , í = t (indeterminado). 23 + 6 6 r 27 + 21 7 -1 9 1 d) x = — —— , y = — t t — , z = — ----- , t = t (indeterminado). 62 62 31

4.

A

l = — C=> MI

C = C ‘ = > in / l- 1 = W
.

/l
0

o
0

om at em at ic a1 .c w w .M w

:\
a2 + b2

5.

a 5. a) y ó) son inversas entre sí. c)
0

a2 + b2


- 2 0 6. 1 0 0 - 2 1 0 0 - 2

°

~ ^ + b 2 ~ 2+ p ! ü

6.

Todas las soluciones son (33Á + I7 fi, 7A + 4/i, Á, 0, fi).

••• •••

0 0 0 0

C A P IT U L O 3 3.1
1.

a)

0

0 0

0 0

0 0

0 0 1

•••

1 0 1

[y= — J' x+^ 1= 0 í» |y_ _ 3 }• ^ +^ - 3 = 0 2í . r .
fx = — 5 t — 1) C { , = 3I + 2 | f + c) Coinciden. fx = 3 ) '> {, . , }• (x = t
« { , . 0

fx = l + 2 1)

C x = l + 4 ti

X + (n — 1 ) x(n + x)
1

x(n + x) x + (« — 1 ) x (n + x )

x ( n + x)
1

3.

a) Coinciden, b) Se cortan en (1, 0). d) Se cortan en (3/7, —6/7). (x = l + 2 f ] fx = 2 + r )
1

b)

x (n + x )

x ( n + x)
4

< * { , - , + ,}■ y + x + t = 0, t £ R.

+ 2 í|

1

1

x + (n + 1 ) x(n + x)

5.

\ c) 7.

x (n + x)
0,

x (n + x ) a =£ 1 , b # 1 , a / b. b) a / 1 ± y/3.

x = 1+ 2 t)

x = 2+ í

a / 0, b

a) a # — 1,

■ i± V ñ

9.

a) x + y — 2 = 0. b) t(4x — y) + s(x + y — 5) = 0, í, s e [ c) tx + sy = 0, t, s e IR .
2

3

1

2’ _ 2

, í) (

3 1 5

h) y ío y io

3.2
x = 1 —2 í
1

.

a) 1 , y Í 9 . /5 1 0

fe) 0 . 5\ ~3y / y

c) z + 2 = 0 . 2 1

d) ( 1 , 0 , 0 ). 4\ fx + 3 y - l l = 0

x = 1 +f
b) y= 1 [ z = — 1— 3í b) Se cortan en (1, 4, 3).

íx= í
■ c) | y = l - t . [ z = 2 —í c) Se cruzan.
3)

.

a)

y = 1 + 3í z = — 1+ í

3’ ~ 3 ’ ~

y

’ f + {z y - l = 0 )
i) (1, 0, 0).

2.

a) Se cruzan, x = 1 + 1/2

- x + 4)> + 7z — 6 = 0.

2 / — =, 0. ?) y¿
X = 2í

3.

ó)

2x + z — 1 = 0 .

c) < y = 0 ¡ z — —2 + t

y= 0 z = —2 + x / 2

4.
x= t 5x — _ + z = 0. y d) ^ y = f/ y n Z = 2~h t í —— ys yn . .y s y ^ y n
1

yrr

x = t| — = + .y s yn .
1

2

1

y= t yn .

3x —5^ — 5z = 0.

.M

at

em

at

ic

a1

.c

3x + 17y — 5z — 22 = 0.

om

h) x — 5y — 2z — 4 = 0.

i) x — 5_y —2z + 4 = 0. x = 1 +t 1 y i4

7)

8/y30 3 yn .

w

6.

a)

w

w

6.

Punto de corte (1, 1, 1)

y =

1+ t

9.

a) i 3x - z + 1 = 0 [ 2 x + y — 2z = 0

( - 2
3

v y s

yn .
1

z = l + t \ —7= + v y i4 yn . a e IR x = l+ tl — y i4 d) x + y — 3 = 0. e) —1 + f (
2

yrr.
1

F= + V y l4 V a! !

3.3
1

:= 1 + t 7. 9.

(J.___L
v y i4 yn . 3x + 2y + 6 z — 6 = 0. 10. 2x + 4y — 3 z + 18 = 0.

.

a) y 5.

fe) y ió '

c) 5^2

d) x — 3y — 1 = 0.

e) — 2x — y + 5 = 0.

x —2j/ + z — 6 = 0. 2x — 3>’ — 6 z + 35 = 0.

3.4

*,• d )2 / , 2 > e)
2 1

f* +A
2j

, 2>

J ,2>

^

3i, —3i.
g2ni/6 g4-ni¡6
^8 rci/6 ^10rci/6

4 jt

3.

—j a >0 = l, (o1= e2’zl/ , co2 = e^ . 3

3 3/ d) (0, 3). ( x = 1 —t 11. j y= l + í ( z = 1 —4t

\

2 2 1 \

2)

\

2/

2

4.4
1. a) 1, 2, 3, d) - , - 1 .

4.

b) - 1 , 1,

<0 - 2 ,

e) 3, - 3 , 4i, - 4 i .

3.5
8x

2. „

Las soluciones son e2n'1 , e4,li/5, e6ni/5, eSni/5. 5 N o lo contradice.

—3z — 36 = 0

a1

c)

— x + 2 y —5 = 0 .

.c

om

, 1.

8.

„ 2.

a) x + 3y + z —8 = 0 .

b)

25x — 3 y — 144 = 0

4.

C A P IT U L O

5

1. 2. 3. 4.2 1. a)

a) 2.016 + 92¡. a) - i . b)

ft) — 1.

c) 25.

at

em

C A P IT U L O 4

at

ic

5.1, 5.2 y 5.3
1. a) Sí. 2. b) Sí. b) Linealmente dependientes, d) Linealmente independientes.

.M

a2 — b2, (a2 — b2)/(a2 + b2) 2, {a2 — 1 + b 2)/(a2 + b2 — 2a + 1).

w

w

c) (7 — 1') 2 /1 0 0 .

a) Linealmente independientes, c) Linealmente dependientes. e) Linealmente independientes.

w

3. z = 0, ± s¡ 2 .
5. Solamente escribimos m ódulo y argumento.
y/2,

a) Sí.

b) Sí.

c) N o.

6. 7. 9.
10.
11.

{(0, 0, 1, 1), (1, 1, 0, 0), (1, 0, 0,0), (0, 0, 0, 1)}. N o. dim T = n2 — 1. b) ~ = 4Ü*! + 2u2 — u3 — 6 u4. v
b) x = — (tr1 + 2 t f 2 +

n/4. 1

b) 1, —tí/3. 1 1

c)

1, ln/6.

d) ,^ 8 , 57r/4.

1

_ 1 ’ 1, 7 2 + I7 2 ’ 7 i _ ! 7 ia) 2, 0. b) 1, 0. c) ^ 1 8 , 3 t t - ^ .

3 i r 3 H --l - ( n —

1)

+mf„).

4.

12.

Si = { x +

1,

x — 1 ,x 2 — 1 }.

4.3
2tt---- i )

15.
—i
5ti — í

a i=- 1 y a =£ — 2

5.4
1. 2. 3. a) N o. a) N o. a) 2. b) Sí, no. b) Sí. b) 1. c) Sí, no.

1

.

a) 7 2 eV
7 tt .

* J \ y/ 2 e r " 8V.
1 l;r

b) 2e \ - 2 , 2 e 3 ’.

c)

i, e 6 , e 6 .

4. „ ) C o m Ç

‘+ C o m ( ^ )

(“ “ )}
4.

eos a

— sen a 0 0 .

0 b) 1/

'

-1 0

0 \

a) I sen aeos a 0

0 - 1 0 o0 \ I - 1/3 . e) I \ 2/3 2/3 1/
2/3

Com i ) nCom (o (í

2 ) =^{(Ó

“)}'
d) i

2/3 1/3 -1 / 3 1/3 2/3 ■1/3 1/3 6. 2/3 1/3

b) K1 + K2 = Pfc3,[ x ] y Vl n V 2 = L { x 2- l , x ( x 2- l ) } . c) L(sen í, eos f) + L(e", e ~ " ) = Lisent, e", e - “ ), L(sen t, eos t) n L (e ,(, e ~ “ ) = L(eos í). 5. a) Sí, y , ® ^ = ^ 2x2(C). fe) Sí, P © / = {/ : [ - 1 , 1] 1— IR}. c) Sí, n © V2 = {/ : [ - 1 , l ] ^ R / / ( 0 ) = 0}.

-1 / 3 2/3

2/3 -1 / 3 /

.

y40 ^ ( x 1; x 2, x 3) = (x 3, 0, 0) y A n= A 0 A B ° A ( x u x 2, x 3) = (x l5 x 3). 12 1 u 1 0 0 1 1/ b) 1 I 1 -1 2 2 -1 2
2

° / l= 0 si n ^ 3

7.

a)

4 \ - 1 ■ 3/
1 1

5.5
1. 2. 3. 4 a) ( - 4/3, 5/3). b) x\ + 2x\ + 1 = 0. (x'j — eos a)2 + (x 2 + sen a)2 = 4. P = (3, 0, 0), ^ = ( 1 , 1,0), tf2 = (l, - 1 , 1), « 3 = (0, 1, 1).

1 2 2 a) * ' = - ^ x + ~ y + ~ z 3 3 3 2 1 2 v' = - x — yH— z J 3 3J 3

b) x '= —x + - v — z ’ 3 3 3 1 1

om

(x ’i + 2^/2)2 9

x2 _ t 2 9/4

a1

2 2 1 z' = - x + - y — z 3 3 3 1 1 1 c) x ' = - x — y + - z ; 2 2 2 1 1 1 i-

.c

> 1 2 z = - ~ x +~y+~z
3 3 3

w

.M

6.1, 6.2 y 6.3
a) Lineal, b) N o lineal, e) N o lineal. / ) Lineal, / 1 0 10 01 . c) Lineal, d) Lineal. g) N o lineal.

at

em

C A P IT U L O 6

at

ic

w

z = —x — y

9. a) L{{\, - 1 , 0), (1, - 1 , - 1 ) } , d im (F 1 = 2, dim (i4(K1)) = 2. )

T (x 2 + 2x + 1) = 1 — 2x + x 2 + x 3 T ((x — 2)2 + x 3) = 3 + 5x + 5x2 + x 3

\1

01/

0 0 -1\ -1 0 1 1 1 0 0 \ o 0 1 0/ /I 0 0 “
la matriz de A\v

b) L {(1 , 0, 1), (1, 0, 0)}, dim (K2) = 2, dim (A (V 2)) = 2. c) L { ( 0, 1, 2)}, d im (K3) = 1, d im (A (K 3) ) = l . 0 3. a) M b = 0 -1 0 0 1 C B= I o 1 0 \o 0 0 0 -1 0 0 1 °\ -1 0 0/ • b) \1 [1 1 1 0 1 2 3 °\ 1 4 9/ 11. B = {(i, 1)} ;

w

base canónica de IR2. b) Observación: C 2 y C 3 son espacios vectoriales sobre C; la base canónica de C 2 es {(1, 0), (0, 1)} y la base canónica de C 3 es {(1, 0, 0), (0, 1, 0), (0, 0, 1)}. / l + i \ i i

/1

1 1 0

1 2 1

i\
3 3

c )

0 0

\0 0

0

1/
12.

\ -1 ) a) {(0 ,1 ,0 )}. b) A = 2, {(0, 0, 0, 0)}. n. c) E(eV ) = {(0, 0, 0)}. 1.

{(0 ,0 , 3 ,1 )};

A = l,

{(1 ,0 , 0,0), (0, 1 ,0 ,0 )};

A=0,

6.4 1. a) k e r (A ) = { í ( l , O, — l)/ íe R }, im g (,4 )= { í ( l , O, l ) + s(0, 1, O)/t, seIR }. N o inyectiva, no suprayectiva. b) C 2 se considera com o espacio vectorial sobre C. ker (B) = {(0, 0)}, im g (B ) = C 2; in yectiva y suprayectiva. c) k e r (C )= {(0 , 0 )}, i m g (C )= { í ( l , 1, 2, 1) + s(0, 1, 0, 2)/t, s e IR}. Inyectiva, no suprayectiva. d) k er(D ) = {a(2¿, —2, l)/ a e € }, im g ( D ) = {a (l, 0, i) + P(0, 1, 0)/a, P e C } ; no inyecti­ va, no suprayectiva. a) k e r M B= if<^l yectiva. b) ker C B= i ? .. , img C B= < ¿ ; no inyectiva, '\ 0 0 0 1M o 0 no suprayectiva. c) k e r (4 ) = {0 }, im g (A ) = P j f 1 x ]; inyectiva, suprayectiva y biyectiva. [ d) k er(D ) = i ? { l } , im g (D ) = Pf$!_ 1 )[ x ] ; no inyectiva, suprayectiva. 3. k e i { T ) = {{aiJ ij e J f nxn/ f j a;i = ) im g (T )= IK ; d im (im g (r )) = 1. 5. a) f : C 5 i > IR10/ / ( a 1 + i b 1, a 2 + i b 2, a 3 + i b 3, a 4 + i ¿ 4, a 5 + i b 5) = —■ = («i> b i, a2, b2, a3, b3, íj4, ¿4, a¡, b¡). b )f: t a c ) f : J Í , x2( U ) ^ U 6/ f \ c b \ = au ..., an ). 1 0\ /0 „ . i/V o 1 '- Í 0\ /0 1

4.

a) Aj = A2 = /l3 = — 1; c(l, — 1, — 1) con c=£0. b) Aj = l, A2 = A3 = 0; c(1, 1, 1), c(l, 2, 3), con c / 0 c) Aj = A2 = 1; c(0, 0, 0, 1), c # 0; A3 = A4 = 0; Cl(0, 1, 0, 0) + c2(0, 0, 1, 0), c, -c 2 #0.

/I
5. a)

0 2 0 0

0 0

\

/

0 \ 0 3 /

/1

2.

, ,

í/i

0J ,L

/o

o\l

l>, Im g M B= JS?-jl

f/l\

L I

/ 0\ i

° \ o / 1
0 0

yp=
0 0

2 /
o\
0 0
- i\ o o
1/

Ik no inyectiva, suprac)

1
0 0

-1
0

\ °
6. 7. 8. a # — 1.

-1

A = 0 y polinomios de grado cero. Si b = 0, la matriz ya es diagonal; si b # 0 , la matriz es diagonalizable si y sólo si N o es diagonalizable en ningún caso.

.c

om a1 at ic at em .M

o|;

dim (ker T ) = n2- 1 ;

10. Autovalores Á = b, ). = ± - J a ; a = 0 no diagonalizable; a > 0 diagonalizable; a < 0: autovalores complejos y, por tanto, no diagonalizable en forma real. 11. 12. 13. 7.3 ^ = 5, /l2 = 0; Cj(2, 1), c2( - l , 2), C l# 0, c2/ 0 . <^ = 1, Á2= - l ; (P, 1 — a), Q?, - 1 - a ) . Simetría: S2 = /. Ai = 1, Á2 = 0; (a, / )> (P, —a). Proyección: P 2 = P. ?

fj

w

d

--(a, b, c, d, e , f ) .

w

/1 ^ +
1. J=

o l- x / 5

\
/ 5 •2 lo\/0

w

8 5

5 3

6.5 1. 2. £ i ( x 1; x 2, x 3) = x 2- x 3, £ 2(x 1; x 2, x 3) = x 3- x 1, £ 3( x 1; x 2, x 3) = x j - x 2 + x 3. E l (a0 + E 2(a0 + E 3(a0 + £ 4(a0 + a1 + x ajX + ajX + a 1x + a2x 2 + a2x 2 + a2x 2 + a 2x 2 + a3x 3 = ) a3x 3) = a3x 3) = a3x 3) = a0 — a1+ 2a2 + 2a3 a2 a2 + a3 a3 2.

\
^ 10 = 0 3. 7.4 £ (¿ ) = 0

1 l\ / 2 10 1 0/1 0
0'n 0j

1 1

5 -4

4 -3

21 Al 0

C A P IT U L O 7 7.2 /l 0 2 0 0 2 0
0 1

i\
0

jo ; B: J = 0 \0 I 3 ; D: J = 1 ° \0

0 -1 0 0 3 0

0 0 3 0 \ 1 3 / , P =

1

1 1

1 -3 4 0\ 1 ° l

1\ 1 0 /

1.
-2 . 2. a) '1 0 i) 2. 0 -2 -1 0 0 -1 /)

e)

± 1. /) 0, ^5, - ->/5.
0 / - 1 0
-1

A: J = 9) 1. h)

0

0 2 0 0

/o
0 \0

0

0 0
-2

'
C: J =

1
1 0 lo

0

’H 1
, p=

1 11 / 1 1

1 0 1 0 1

11
n
1 0

\ 3 11 0 \° 2 1 1

1 0 0

■ *) \

o
0

0

i

3/

\i

/

i 2 J= 0 \0 ( 0 p = 1 \o

1 2 0

0 1

\ • p=

/

1 0

-2 1 1 0

1\ 0 0/ 0 \ 1 P=
\!

-1 F: J= O O / 1 1 4 3 1

O -1 O

0 \ 1 -1

b) J = (

1
■y/6 0 1 1 0 0 0

y/6

O P = V6

2 0.

1
0 0 0 -1

2 / - 1 1 - 1 o ;

\ - 1 2 G: J = | 0

°\
0 1 0/ , p=

Io
0 1 \0

1

-1 1 0 0

°\
0 0 -1/

0

2

c) J =

1 0 /

0 0

0 0

/o o o\
H: J = O \0 1 O O , P = l) 7.9. 2.

L a m atriz nula y todas aquellas equivalentes a la m atriz

O O

1 O

I

i
1

i
O 1 1 O

i \ / i
O \0 26 O

o
O 3. Tod a s las de la form a ^ P 1 con |P| # 0.

c 6=
3.

\O

F1= ¿?{(2, 2, - 1 ) } ; K2 = jS?{(1, 1, 0)}; V3 = J?{(0, 1, 1)} K4 = ¿?{(1, 1, 0), (O, 1, 1)}; F5 = JS?{(2, 2, - 1 ) , (O, 1, 1)} V6 = X { ( 2 , 2 , — 1), (1, 1 ,0 )}; K7 = {Ü }; V8 = U 3. k l = 0 doble; ( — A, a, 0), ( — ju, O, a); /2 = 1; (n, v, y).

Soluciones a algunos ejercicios de repaso de los capítulos 1 a 7

4. 7.6 4. 7.7

om

at

= 0,1; X

±1;

k = 0 ,1 ,.. , n - -1

ic

a1

.c

1. 2. 4.

( x 1; x 2, x 3) x 4) = ^ - ^ , r = 2. 3.

O, O^j + c ^ , 1,o j , c e IR .

(x j, x 2, x 3, x 4, x 5) = (7, — 1, —2, —3, 0). este caso: 1 —a1 —b (a + b) — 2ab ’ (a + b) — 2ab

w

0 \0 /2 0 0 \0

0 0 1 2 0 0

2 0 0

0 1/ °\ 0 1 2/

- i \ Z 1 0 0 1 0 0 0 \

0 0 -1 1 0 0 ¡ P = \

0 - 1 °\ 0 0

7 1/

w

1.

/ =

I 2 0

1 2

0

0

w

n _ , r —

- i

1

0

3\ 6

.M

0

°\

/ -i

2

1

at

em

Si a + b — 2ab=¿0, sistema compatible determinado. En (1 — a)(b— 1) (a + b) — 2ab ’ ^

2.

J=

0 2 0 1

, p=

Si a + b — 2ab = 0, a^= 1 y b¥= 1 Incompatible. Si a + b — 2ab = 0, a = l , b = 1 Com patible indeterminado. x = 0, y = l —t, z = t, teIR Si a = O y b = O 5. 6. Si x = a, r = 2; Si x / 0 existe
x 3 0 0 0 - X 2 X3 0 0

Incompatible.

1 \o

Si x # a y x # — a + 2¿, r = 4. [Sug.: U tilizar transformaciones elementales.) si x = —a ± 2 b , r = 2. inversa y es x -x 2
x3 0

1/ 0 3 —i 1 -2 i 0 1+ i 1 — 5/ 0 1 3+ i 1 + 2i O l-i\ 1 + 5/ 0 1

/ 1+ i 3. J= O O

0 o 1- i o

1+ i O O

0 0 1

—1
X
— X2 x 3

\ o
7.8 / 1 1. a) J = O \O

l-'7
/O , P = 1 \ 1

1 o O

o o -7 3 / 7. 8.

[Sug.: Utilizar transformaciones elementales.) ( x „ x 2, x 3) = c(l, O l) + d(0, 1, 0). , a) a # 2 . £ ) 5x1+2x2 + 1 0 x 3 = 1 . >

9. 12. 13.

axa2- -a„. a) ( x , y ) = (3, 1) + t(a, 1), t e U , a e U . a) (2, - 1 , 8 ) . x —2 y + 1 z 8 i, )_ - = ^ - =— . b) 3 x - 4 y - 5 = 0 .

/I

1 1 1

0

—J B

14.

x— y — z— 1 1 1
^ T = _1 T = ^ 2 ~ ' 35. 7 T | / [ f 17 9 ’ + « ( 5, 3, - 4 , 36. /13 4 2. 5 8 4\ 1 10 9\ /9 6 11 7’ 7’ ~ 7 J 2 -1 1 1 20. 1 -1 2 T ’ 7) ’ \7’ _ 7’

\ 0 V
a) — Á3 + 4Á2 — 5A + 2. 0 b) | 0 0 0 0 0 0 \ 0 0 / / 1 c) —3 ( 0 0 o 1 0 o \ 0 1/

15.
,,

A

(2 1 —5 . = ( 3 * 3 ’ - 3- ^ 2 = 15 6 ( - ¿ , ^

>/v^

.

».

a) Autovalores k 1= ( n — 1) doble, ?.2 = n + 2; d im (k e r(A „ —(n — 1)/)) = 2. { b) n # l , n # - 2 ; A ~ l = - -----— ( n - l ) ( n + 2) ln + l -1 \ -1 -1 n+ 1 -1 -1 -1 n+1

T --7 '7 > 2 1 Vol = 49 19. 13 .-5

a1

.c

— 4x + y + 3z = — 4.

(0,2 , - 2 ) + í(0, 1, 1).

om em at ic

-1 8

c) n = 1, k e r /li = {(x, y, z)/x + _y+ z = 0}, img ( A l ) = { ( u , w , t ) / u = (o = t} n = —2, k e r ^ _ 2 = {(x, y, z)/x = y = z }, img (A _ 2) = {(u, w, í)/u + w + t = 0}. 37. 38. 0, 1, 310. a # l y a / 2 Com patible determinado a = 1, b / — 1 Incompatible a = 1, b = — 1 Com patible indeterminado: X! = 10x3— 1 x , = — 1 + 6x, a = 2, b ^ - a = 2, b = —-~ 5
x —

22. a)

x = l , x = 2 + i, x = 2 — i. (' ’O 1 1 -2 0 O O 1 '\ 3 - 4 b) 7 + 8(x - 1) + 3(x - 1)2 + 2(x - l ) 3 + (x - 1)4

w

23.

a)

A--

0 ,0 \0

1 - 3 6 O O O 1 -4 1/

.M

at

w

w

Incompatible Com patible indeterminado: < ^ | x 2= — 1/5 + 2x 3 z+1

24. 25.

Dimensión = 3; {(1, O, O, - 1 ) , (2, 1, 1, 0), (1, 2, 3, 4 )} es una base; x - y - z + t = 0. 39. Está generado por dos vectores: u x y u2 (por ejemplo). /0 o \0 0
1

1

y —2

-

1 - 1

2
núcleo.

0 \ o 1/ con

40. 41. 42. 43.

a) C l= (2 , 1, 3), c2 = ( - 2 , 1, - 1 ) . ¿> Z>x = ( l , 2, 1),Z?2 = (l, 0, 1). ) { x 3 + 2x2 + x, —2x3—4x 2+ l } esbase del { x 2 —2x, x + 1 } es base de la imagen. Sí.

o

b) Recta t(2, 5, — 1) y todas las rectas contenidas en el plano t (—2, 1, 0)

+ s(0, 0, 1).
1 1\

5, 3 y 2. (1

[0
32. J A= | 0 \0 33. 2 0 0 | —1/ ; A 3= 1

í 0\
0 0 . \O 0 8 /

44 45. 46.

“» ( y « ' - « ) a) » = (0, I. 1). a) N o hay.

Í’, ( M ’ 0)' b) E - ( ^ , í , 4 J y = í, - 2 ).

N o . Sus autovalores son 0 y 2 con dim (ker {A)) = 1 y d im (k er(/ l —2/)) = 1.

b) L({(2 , 1, 1)}).

c) IR3.

(2
47. \2 48. 49. 50. 51. 1

-11 -7 -1

6 4 O
X.

a = l ; — irr — tT2+ i?3 = 0. 2x — 3y + z = 2 (O, - 1 , — l ) + í(l, 2, 4) ; J 2x + y — z = 0 3x —4y = 10 ó 3x — 4 y = — 10. a) , 1 5 — í— 4 + i 1 — 5i i—V 1+ i 8.4 1. 2.

l+4i

/1 0 0 ^ lo 1 0 0 0 0 , 0 0 0 \0 0 0 1° 0 (0 0 0 0 ° \ í0 0 1 0 , 0 0 1 lo 0 0 \0 0 -1
a) Vy1 = L { ( l , 1, — 1)}.

/o
1

o o o o 0

o \ o o / o 0

\o /o 0

\o

1

0/

b) k e r (4 ) = L { ( 4 - i , 5 - i , 0), ( i - i , O, 5 - i ) } ; im g (A ) = L {(c , 1)}. 52. La matriz es diagonalizable para todo a / — 1.

b ) W x = L { { 1, 1, 1, 1), (3, 0, 1, 1)}.

1 a) P ^ ( r ) = — [ ( 2 x ! + 4 x 2 - 3 x 3 - 3 x 4)(1, 2, 0, - l ) + ( - 3 x 1- 6 x 2 + 1 4 x 3

C A P IT U L O 8

— 5x 4)(0, 0, 1, - 1 ). b) 2 (x ) = — (17, —4, 3, SJ + P ^ x ) . >

at

„ 2.
3.

at

7t/2.

4. are eos (1 /^fñ).

em

rrt----------^ ----- 2 v / __________________________________________ _______ 2x 1 1 3x2y2+ 2 x l y2+ 2 x 2y 1 y + x \ \ = j 2 ( x i + x 2) 2 + x i , eos * ( x , y ) = — ^ ( x . + x ^ + x 2 ^ 2 ( y i + y 2) 2 + y2

a1

1.

a) N o. 6) N o.

c N o. )

d)

N o.

e) Sí.

.c

om
4. 5. 9 = ( 3, 1, - 1 , — 2 ) e L (F 1 V2), /T=(2,1, - 1 , 4 ) 1 L ( F „ F2). , [Ejercicio 10, sección 8.3: a) VF1 = Í>(1, 1, — 1). í/ 1 c) W 1 = L < 0 0 0 \j 10 .] b) W = L { x 3, x 2, 1}. /i

8.1 y 8.2

.M

ic

w

w

8.3
/2 1. La matriz delproducto escalar es 1 \5 2. 4. 5. 1 1 3 5'
3

,\0 0 l / j
a) H,1 = { i4 e J 3)<3(R)/í¡11= a J2= a 3 3 = 0 }. / xn 0 X22 0
x

w

0 0

\

14 y

6) P „ p f ) =

0 \ 0

; m ín ^ X ,

W )= £

£

x2- ^

+ x | 2+

x §3).

y ,= (1 , o, 0), >r2 =(0,
/10 {(1, 2, 1, 3), s3 ’ -1

-2 , 1
, -,

0),

y 3 = ( o,

o, 5).
61- 7 2 185 8.
6.

x 33 /

¡= 1 j = 1

3 ’ 3’

\ / — 19 87 - l ' / V 185 ’ 185’ 185’

P ^ ( x ) = — [(5 x j + 5

2 — x 3 + 2 x 4)(1 , 1, - 1, 0) + (2 x j + 2 x 2 + 4 x 3 + 3 x 4)(0 , 0, 2, 1)].

a) {(1, 1, 1 )}.' b) {(2, - 1 , 0 ) , ( - 4 , 11, - 6 ) } .

uf = (2 , 1, - 1).

6
7.

{ fe - *

j ?

°' ° ) ( * 7

* 7

°

)

( 7

°' ^

“■ I

8.5 y 8.6 1. 2. Todas las aplicaciones dadas son autoadjuntas. a) N o es autoadjunta, ya que su matriz en la base canónica de IR3 es 1 1 0 1 /1 2 1 1 2 0 3 0 2 1 1 3 1

i ---- (1 8 7 ,5 5 ,3 3 ,-9 9 ). 202 7 8 ^ 1 c = ----- a* H ----- b H ----- (7, 6, 25, 19, 1).

8.

10 {fe' ° 71)’(“7' 7’7?)í '

b)

Sí es autoadjunta, ya que su matriz en la base canónica de R 3 es

2 \ 1

/0

0

0

49. 50. 51.

(O, - 1 , - l ) + r(l, 2 ,4 ) ;

2x — 3y + z = 2 2x + y — z = O

1

o o o 0
1

o o o 0 o

\o /o 0 \0 8.4 1.
2.

3x —4_y=10 ó 3x — 4_y= — 10. a) 5- i -1 — 5f —4 + í 1+4/ i-l' 1+i, 5 - i , 0), ( 1 - i , O, 5 — i')}; im g (A ) = L {(c, 1)}.

fe) k e r(X ) = L {(4 — 52.

La matriz es diagonalizable para todo a # — 1.

a) W 1 = L { ( 1, 1, - 1 ) } .
a)

fe) W l = L { ( 1, 1, 1, 1), (3, 0, 1, 1)}.

1 P ir( r ) = — [ ( 2 x 1 + 4 x 2 - 3 x 3 - 3 x 4) (1 , 2, 0, — 1) + ( — 3 x , — 6 x 2 + 1 4 x 3

C A P IT U L O 8

— 5x 4)(0, 0, 1 , - 1 ) .

8.1 y 8.2

b) Pw{3,2)(x ) = J g ( l^ ’ —

3) + í V ( * ) -

a1

.c

1. 1

a) N o. ii* i n/2.

fe) N o .

c) N o.

d) N o .

e) Sí.

om

4. 5.

f f= (3 , 1, - 1 , — 2)eL(fe\, F2), T¡ = (2, 1, - 1 , 4) Í L ^ , F2). [Ejercicio 10, sección 8.3: a) W l = L{ 1, 1, — 1).
1

at

v /2(x1 + x 2)2 + x| J 2 ( y l + y 2) 2 + y2 1

ic

+ * , ) > + * ! ; eos * (x, y ) =

fe) W = L { x 3, x 2, 1}. /1

3. 8.3

4.

arccos(l/ ,/ ñ ).

em

0 1 0

0 0 H •] 1

.M

at

c) W ± = L

0 0

w

1 . 2.

La matriz del producto escalar es

3 14y

w

1 2

1 1 1 \ 3 5 5).

5'

w

a) lT i = { / l e J 3x 3 (R)/fl11 = fl22 = fl3 3 = 0}. Xn fe) P W( X ) = 0 \ 0 0 x 22 0 o 0 x 33 I \ ; min d(X, W ) = £ £ x f j - ( x u + x 22 + * 3 3 ) ;=i j= i

y"i

=(1, 0,

0),y 2 = (0, -

2,
l

0),y 3 = (0, 0,

4. {(1,2,1,3),
3’ 5.

3 ’ 3’

- l \ /_19 87 / \ 185 ’ 185’ 185’

61~
185 /

12

6.

P H (x ) = j y [ ( 5 x 1+ 5x2 — x 3 + 2 x 4)(1 , 1, — 1, 0) + ( 2 x ! + 2 x 2 + 4 x 3 + 3x4)(0, 0, 2, 1 )]. , ü } = (2, 1, - 1 ).

a) {(1, 1, 1)}.' fe) {(2, - 1 , 0 ) , ( - 4 , 11, - 6 ) } .

8.

6 {fe “ * °) (ft^ “ °>fe’* ^ * i • •
til 2Ó2(187, 55, 33, “ 99)8c = - ~ a + ^ b + ^ ( 7, 6, 25, 19, 1).

8.5 y 8.6 1. 2. Todas las aplicaciones dadas son autoadjuntas. a) N o es autoadjunta, ya que su matriz en la base canónica de IR3 es V / 1 fe) Sí es autoadjunta, ya que su matriz en la base canónica de R 3 es 2 \1 / 1 0 i 2 1 l 2 0 3 0 \ 2 1/ 1 \ 3 1 /

1
l 0 '

_ 1W
' ° ’ 72/V

1

2

1 Y)

aM U

3.

a)

A =

/ 1 J = 0 72 \ 1

0

1

1 1

1 1

a b

b c

1 0 I . [ Sugerencia: Calcular a, b y c en la igualdad 0 1

1 A 0 1 ; J= 1 °) 0 0 1 0 0 1 0 0 o\ 0 0
1/
/l
5

1/76 l/73\
-2 / 7 6 1/73 . C A P IT U L O 9 1. 2. {(z 1 ¿2> z 3) e C 3/z3 = iz 1}. > N o, sí, no. I 1+ 7 3 ; 3. b) J = \ 0 . c) J = /í+ ^ z y z j íí

1/76
o
1 / 7 2

1/73/

o O O -1

c)

T =

J = \o O O - 1/

O O \0

1/^2 O

0 \ 1/72 -1/72
O /

2
0

2
¡_ 7 Z "jV Í2 ¿

8.7 y 8.8 1. a) Ortogonal, b) N o es ortogonal, c) N o (observar que el determinante de la matriz es —2.) f 1 Base ortonorm al = <— —(1, 1, 1 ) , - ^ ( 1 , 1 , 2 ) , - ^ ( 7 3 , - 7 3 , 0)|.

1-73 i
2

//

\

0

2

4.

.4 tiene en la base ^ = ( 0 , 0, 1), tT2 = (1, 1, 0), rf3 = (l, — 1, 0) la forma diagonal I - 1 0 0 \ i 0

om

I73

0 \ / 1+ / 5. 1 1 l- i l+ ¿ 0 0 1 -1 1 0

w

w

3. 8.

a = y = 2, ( i = 1. b) x + 2y = 0. c) T =

.M

'2 / 1 0 9. 11. 8.9 2. a) S = 72 0 > c) 3x + y = 0. a) Sí. b) N o. d) P = c) Sí. 1 0 0 o

at

0

-

73

em

at

J=

ic

0

2

n/

3'

a1

/'

0\

.c

0 - / /

'-i.\

1/
/ . 1+/

w

1 /l + ¡ _72\
0

o

V
(L a primera es unitaria y la segunda simétrica-conjugada.)

Observaciones sobre el problema 5 1 1 ( l/ = í a b\ . ir _ j con | | +|¿>| = 1 y S = l a c\ (\ + i j con r, s e IR Escribiendo I ^ . 1 ^

0=

0
/ 1

72)
o 1 o o
1

72
0=

Vo

1
o
1

1
o \ o

j - Ì

b) S =

0
1

o

0 0

1
1

/
0/ ; hallar una raíz cuadrada Ve ) de dt

a b\/ r c\ . e igualando, se obtienen vanas ecuaciones, que se van resolviendo — b aJ\c sJ hasta obtener el resultado. 6. a) b) c) d) (z’ + ivv u + i~ v ) = (z, S*) + (m tf) + i'[ — (?, 7 ) + Oí S*)] = (tT + ítT, T + iw). 5 Se deduce de la propiedad distributiva del producto euclideo. Se deduce de la propiedad distributiva del producto euclideo. ( u + i v , u + tv ) = (u, tf) + (t^ ~v) + i[_ —(u, tf) + C¡f,ü*)] = = IIu *||2 4- | T II2 > 0 salvo si u = F = 0. |T

. [Sugerencia: trabajar con B = (

C A P I T U L O 10

12 + x / 2 \ d) X ' = \5 5 ' 1 10 " + 7^2 10 /

/

V2 10

V 2 \ 10 X.

10.1

\

V2 io

V^2

io /
- v 3+
4 4 2

I x \ 2. a) T y

/
w

2

\
+

/0

-1 o

0 o

/x \ b) T
z

lX \
y ■
\z /

/o \

2.

a) G iro de ángulo n/3 y centro P = l — 1 —

\ 2I
c) T o G

\o

0

r /\ -1 0 0

\i /

b) Simetría deslizante: Eje ( 2 - ^/2)x1— J 2 x 2 + ~ ^ = 0. Vector: 3. a) G iro de ángulo n¡2 y centro (1, 1). b) La simetría deslizante de eje x 2 = l/2 y vector (1, 0). 4. a) Traslaciones de vector V paralelo al eje de simetría. b) Giros de ángulo n y centro perpendicular al eje. c) Simetrías respecto a rectas perpendiculares al eje. 5. a) Traslaciones; simetrías respecto de rectas con vector director ü *0; simetrías deslizantes respecto de rectas con vector director u0. b) Giros de centro P 0; simetrías respecto de rectas que pasan por P 0.

X ^

y

= /

i

1 \
i / +

(0
1 \0

° \

ix
y

( X \

z

0

\ i

/1 O

\

/O 1 \0

1/ \ -1 o\ o O o 1

2

{G ° T )

y \ z /

\ ‘ /

om .c

3.

Todos los puntos del plano 2x + + simetría con respecto a este plano.

y z= 2

son puntos fijos. La aplicación es

una

10.4 y 10.5
—6 \ I x \ 1. a) S„

.M

2. 3.

El eje de la simetría deslizante es paralelo a la recta w.

----------------------------- r X

w

w

w

La composición de dos simetrías de ejes paralelos es una traslación de vector donde ~ es un vector perpendicular a las rectas y ||tf||=d(r, 0v

2~v,

at

em

1.

El centro de giro es el punto de intersección de los ejes. El ángulo de giro es el doble del ángulo que forman las rectas.

at

ic

10.2

a1

b) M

c) G 5. S , 0 Ss ° Sr es una simetría con respecto a la recta / que es bisectriz del ángulo , 2 (s, í) y uno de cuyos lados es r. 1 10.3 42 1. a) X ' = 2 / l 2 2 72 \ ~ l 2 f A 2 1 - '- ■ f i ! \ 2 2 1 l 2 X. b) X ’ = \ 1 1 + 15 \ -1 7 \ -2 / al plano con vector de d) M ° Sn Í M \ z / X. 2. a) Simetría respecto 1

IJ
5 4

\

5

deslizamiento - (3 — ^/2, ^ [2 — 2, J 2 + 1). b) M ovim iento helicoidal: r: (x, y, z) = - ( 1,0, 1) + /(1, 1, — 1); giro a =120° en el sentido del sacacorchos para que avance en la dirección (1, 1, — 1); vector de 1 deslizamiento - (2, 2, — 2).

c) X ' =

(^ Ì 2

c) M ovim iento helicoidal: r: { x = 1, z = 1}; giro <x= - 9 0 ° (el sentido de giro positi­ vo es el del sacacorchos para que avance en la dirección (0, 1, 0)); vector de deslizamiento (0, 1, 0). d) M 3° M 2 es un m ovim iento heicoidal: r: { y = 1/2, z = 3/2}, giro a = 90° en el sentido del sacarcorchos para que avance en la dirección de (1, 0, 0); vector de deslizamiento: (2,0,0). M 2 ° M 3 es un m ovim iento helicoidal: r: {x = 3/2, y = — 1/2}, giro a = —90° (el sentido de giro positivo es el del sacacorchos para que avance en la dirección de (0,0, 1); vector de deslizamiento: (0,0, —2). Todos los movimientos que afectan sólo al plano xy y la composición de estos movim ientos con una simetría respecto a este mismo plano xy.

4. 5. 6.

x 2 + 9y2 + 8x — 36^ + 43 = 0. 20x2 —5y2 — 10^ — 4 1 = 0 . 64x2 + 16xy + 76y2 — 393x — 87y + 596 = 0.

11.7, 11.8, 11.9 y 11.10
1. 1 Parábola; V = ~ ( l , 5); 2 2. x forma canónica y2= —F ; eje: x + y = 3 .

3.

1 12x2 18y2 2 „ Hipérbola; C = - ( l , —2); forma ca n ó n ica ----------------- = 1 ; ejes;y = 2 x —- , 2y + x 6 5 5 3 1 + - = 0.

V 2

4.

M

\y

l x\ 1
= \ w

1 \ 1 +

/ 1 \ 0 +

/

0 0

1 0 0

0

\

I x \

\

-1 /

\
0 \o

w 1 o

/ 1 0

I - * 0 \ f X \ 0 1/

0

I'
W J

3. 4. 5. 6. 7. 8. 9.

D os rectas paralelas; x — y — 1 = 0 , x — y + 5 = 0. Un punto ( — 1, 1). 3 5x2 20y2 3 1 Elipse; C = — =; — + —— = 1 ; e = — -=\ C = - ( l , 2); ejes: >/5 12 12 2^5 5 T ip o parabólico: dos Hipérbola equilátera; T ip o hiperbólico; dos Hipérbola equilátera; 4 x2 x + 2 y - \ = 0 , y = 2.

5.

a) M

vector de traslación (3, 3, 0).

om

/

rectas coincidentes (x + 2y — 3)2 = 0. x 2 v2 C = ( — 1, 3); —--- — =1 . rectas x — 2y + 3 = 0, x + y — 1=0. 4y2 1 1 — -------- — = 1; asíntotas x - y + - = 0,x + y + - = 0

6.

a) M

.M

w

G iro a = are eos ( — 1/3) en el sentido del sacacorchos para que avance en la dirección ( — 1, 1, 0). b) El eje es la intersección de los dos planos. c) El ángulo de giro es el doble del ángulo que forman los planos.

u /

4/3

+

-2/ 3 \ -2 ß

1/3 -2/ 3

y

1 10/3

-1 / 3

\

at

x + y= 3

em

ly = / x\ 1

z= 1

2/3

at

4/3 \

(

I/ 3

-2/ 3

2/3 ' ‘ x \

ic

a1

uno de los planos al otro.

.c

b) Vector de traslación: 2v, donde V es un vector normal a los planos, que va de

w

w

10. 11. 12.

9y2 1 1 Elipse: — + — = 1 ; c = - ( - 3 , 1); ejes: y = x + - , y = - x - - . 2 2 8 2 4 N o tiene soluciones reales. x 2 y2 Elipse; — + — = 1; ejes: x — y = — 1, x + y = — 7; C = ( - 4 , - 3 ) ; focos: ( — 5 + ^/3, o 16 - 4 + 7 3 ) y ( - 5 - ^ 3 , - 4 - 7 3 ).

C A P I T U L O 11 11.2, 11.3 y 11.4

13. 1 IIFiCH 1 —£ | F 1II, C = centro; Vl 14. 15. las rectas de pendiente

Parábola; 2y2 — ^/lx. a) a) y = ± (l+ ^ 2 )x m í» b) n , \ 4 1/ 3 ~ "2 " " ^ 5 v + 5 = 2( V— 5 5 5' V = ( ) , eje: 4x = 3y. -*
5

, 4

11 ^ 1

^ 11 = ^ - 11 ^ ^ 11, V2 = vértice, b =
1 — £

-y 1 — £

V = (0, 0), eje: 4x = 3y

2.

||C|| = ------ C = centro;
£ — 1

las

asíntotas

son

± y j e 2 — 1 que pasan por C.

11.5
1 2. 3. y 2 — 6x + 2y + 4 = 0; y2+ 2y + 6 x - 2 0 = 0. 3x2 — 4xy — 4 = 0. b)

I

6 -3

—3 6 -3

—3 \ -3
C

an = 0, i = l , 2, ..., n
a ij

\ -3

6/

—( i —j ) 2/2, i¥=j

12.2
4. 5. a) - y x f + 2y j + zl. a) 2 x 1 - 3 yj. b) x \ - y \ . c) x \ - 4 y \ - z \ . c) x\ + ^ f i y 2- J 3 z \ .

CAPITULO 13
1. a) Elipsoide; x 2 + y 2+ 4 z = 1 ; centro = (0, 0, 0). la dirección de O Y;

b) - e x l + ^ y j - ^ / S z l

b) H iperboloide de dos hojas con eje en í 1 centro = 1 —2, — 1

* 1 2 1 2 1 2 1 2 d) 2 } ' l ~ 2 } ’2 + 2 y * + 2 U 6. a) 2 2 3’ 3’ 1 b)
7 6 (2 , 15

12 T

2

A ?
'3’ 3 1

3’ 3 1
( 1 ,

2 , 3.x2 + 6y\ + 9z¡.

, 1 , 1 , c) H iperboloide de una hoja con eje O Y; — 2x2+ - y — - z = — 7; centro = ( - 6 , — 1,0); ejes { x = - 6 , z = 0 }, {y = - 1, x = z - 6 } , {y = — 1, z = —x —6}.

2 ,

0 ),

(2, — 1, 5) > , — 2 x 2 + 4y j + 4 z2. 29 4.

1)5

9 9 4 f— d) Paraboloide hiperbólico; - x 2—- y 2+ - N A z = 0. / a) N o tiene soluciones reales.

c)

b) H iperboloide de dos hojas; — x 2+ ( 3 + N/6)y2 —(3 —v /6)z2= y /

12.3
7. a) b) c) x 2— y2 + z2; índice de inercia positivo = 2. x 2 + y 2—z 2; índice de inercia positivo = 1 . x \ —y 2 + z 2; índice de inercia positivo = 2.

a1

.c

om

c) H iperboloide de una hoja; — x 2 — v / l7 y 2 + v / l7 z2 = —— .

em

at

ic

d) Elipsoide; x 2 + ^ + : ^

^

2 + ^ - ^ Z ^ z 2= l .

w

y x = ( y + z)l2

.M

x ¡ = 2 x —y + z

at

e) H iperboloide de una hoja. / ) El punto (0, 0, — 1). 1+V5 , 1-75 , g) Paraboloide hiperbólico; — -— x H ----- -— y = — 2z.

12.4
8. 10. 11. Ningún valor. 9. /?e( — 00, — 1).

w

z i= {y -z )l2

w

Soluciones a los ejercicios de repaso de los capítulos 8 a 13
I 3 1. 0 \0 ( c =~ r 7* 0 6 0
¡ 4 2

0 \ 0 9 / -V 3 1 con C=

1

- 2 2 1 2 Ì ; J B = \ 1

{(x , y, z ) e R 3/|z|<l, y / O } . a) x = - l , y = 0 es un mínimo. b) (2, —2) y ( — 2, —2) son máximos. c) (1, — 1) es un mínimo. a) 0 < a < x/2. / b) Nunca.

2
2

2
0

0 1 1 0

0 0 con

2

l

i

\ 0

1 / 1

Í2

0

-2

13.

\\/2 T 3 1 2. 0^(si/x, séx ) = —(x, .9Í.9ÍX ) = — (3 *, s/(kx ) ) = — Á2(x, X ) => —A2S:0 (las igualdac des anteriores son ciertas si / es un autovalor real de x ^ 0 ). 3. ~ = (1 ,2 ,2 , — 1), e’ = (2, 3, - 3 , 2 ) , ex 2 -1 / 2 7 3 . e3 = (2, - 1 , - 1 , - 2 ).

12.5

4
14. A (x, x ) = x j + x 2 ; B(x, x ) = 4 x 2 ■- 2 x 1 C=

4.

-1

6. 11711=^/3 ; X j - y j - z ^ O .

7. 8. 9. 10. 11. 12.

Simetría con respecto a la recta x = —y = z. W, = { { x , y , z ) e U i l x = y = z} ; W2 = {(x, y, z ) e U i ly = 0}. 1 /4 T* = -( 3\1

1
31. are e o s —F . 73

2

P (F ) = (2, 0,0). Sí es autoadjunta. N o es ortogonal

3' (/)= )+ o ):god90aeeodipn Gí 3 (o (i )C ir e0 irddr e ut ’ o
6c'\
\ y )

/1\ /0 = 1 +
\ °J

l\ / x \
/1

V1

: simetría deslizante respecto a la recta x —y =1/2, con
°J \ y J

N

1 /5-v/5 . y de ángulo de giro (p con eos q = — =, sen (p > G iro de centro -------- . 1 0 - 4 7 5 x5 - 3 7 5 / 7 5 = -1 / 7 5 . 0 — l\/x

vector de traslación 36. 37. P ( u 3) = - u 2/2. I) N o es definida.

-, \2

r 2y II I) Semidefmida positiva. /0 \

II) Definida positiva.

14. 38. 2/3 \ 15. | y | = | 2/3 z' / \ 2/3 I I 1/3 -2 / 3 -2/ 3 \ / x \ -2 / 3 | y 39. + -2 / 3 1/3 \ -2 / 3 -2 / 3 2 4 + 3 \ 2 -1 Simetría deslizante; plano de simetría x —y = l ; vector de traslación V =

0 \1 /

1/3 / \ z /

x2 y2 Hipérbola; / y " Ñ ~ / ^ \ = 375J x\ , ¡2 , V 1-125,

eJe ^ oca* 2x —y=l /1 5.

16.

a)

o

.c

-1

y

.

b) Simetría deslizante.

om

I x' \ I °\

! ~1

2 \/x \

l\ / x \

18.

Form a canónica 4y\ + 4y\ — 2y\ en la base 1^ = — -^=(1, 0, 2), u 2 = ~j = { 2 , 5, — 1),

19.

Parábola; form a canónica 2 5 X 1 ——

20. 21.

Centro

eje principal 4x = 3y.

H iperboloide de dos hojas; 25z2- 5 x 2- 5 y 2 = 1 . J _
h

\

4

/x '
23. 2X 2 + Y 2~ Z 2 ; y
\ z 1

=

0 -J f
\l
0

1
-7 2 0 /

24. 28. 30.

a = b — 2, a > —2. a) x 2 + y 2 — (a2 + / ?2)z 2 — 2atx7 = a2. c) 1. 3x —y + 1 = 0. 2. x - y + 2 = 0.

w

«3 = - U - 2 ,

1, 1).

w

w

.M

at

em

17.

a) Para todo A > 2 .

6) Para ningún X.

at

\2/

ic

4/\z/

a1

es la matriz del cambio; esto es,

y'V1

- v w

x' = 2x + y i >. y '= x - y I

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->