Documentos de Académico
Documentos de Profesional
Documentos de Cultura
09 Anexo-1 09-10 PDF
09 Anexo-1 09-10 PDF
Anexo 1: Demostraciones
Espacios vectoriales
Demostración de: Propiedades 89 de la página 41
Lema 97.- Sean V un espacio vectorial y B una base de V formada por n vectores. Entonces cualquier
conjunto {v1 , v2 , . . . , vm } de vectores de V , con m > n , es linealmente dependiente.
Demostración:
Sea B = {w1 , w2 , . . . , wn } la base de V . Cada vector vk del conjunto {v1 , v2 , . . . , vm } puede expresarse
como combinación lineal de los vectores de B , en la forma
vk = ak1 w1 + ak2 w2 + · · · + akn wn , para cada k = 1, . . . , m
El conjunto es linealmente dependiente si la ecuación λ1 v1 + λ2 v2 + · · · + λm vm = 0 tiene múltiples
soluciones. Sustituyendo:
0 = λ1 (a11 w1 + a12 w2 + · · · + a1n wn ) + λ2 (a21 w1 + a22 w2 + · · · + a2n wn )
+ · · · + λm (am1 w1 + am2 w2 + · · · + amn wn )
= (λ1 a11 + λ2 a21 + · · · + λm am1 )w1 + (λ1 a12 + λ2 a22 + · · · + λm am2 )w2
+ · · · + (λ1 a1n + λ2 a2n + · · · + λm amn )wn
que tiene m incógnitas (los λk ) y n ecuaciones, con m > n , por lo que no tiene solución única.
Demostración:
Sea S el conjunto de n vectores.
Si S es linealmente independiente, tiene que generar V , pues si no: podrı́an añadirse vectores linealmente
independientes con lo anteriores hasta formar una base de V (existirı́a al menos un vector vn+1 ∈ V − lin S ,
tal que S ∪ { vn+1 } es linealmente independiente, ver comentarios previos al Lema 97 anterior) que tendrı́a al
menos n + 1 vectores, lo que es absurdo.
Análogamente si S genera V , tiene que ser linealmente independiente, pues si no: podrı́an eliminarse
vectores dependientes de S hasta conseguir una base que tendrı́a menos de n vectores (Lema 94), lo que
también es absurdo.
Desigualdad de Cauchy-Schwarz 111.- Para todo u , v ∈ V, espacio con producto interior, se tiene
2 2
h u , v i2 ≤ k u k kv k o en la forma |hu , v i| ≤ ku k k v k .
Demostración:
2 2
Si v = 0 , es claro que 0 = h u , 0i2 ≤ k u k k 0k = 0, ∀ u ∈ V .
Si v 6= 0 , para todo k ∈ IR , se verifica que
2
0 ≤ ku − k v k = hu − k v , u − k v i = h u , u i − 2kh u , v i + k 2 h v , v i
hu, vi
en particular, para k = hv, vi . Luego
hu, vi2 2 2 2
de donde kvk2
≤ kuk y por consiguiente hu, vi2 ≤ ku k kvk .
Teorema 119.- Si S = { v1 , v2 , . . . , vk } un conjunto finito de vectores no nulos, ortogonales dos a dos, entonces
S es linealmente independiente.
Demostración:
Veamos que en la igualdad λ1 v1 + · · · + λi vi + · · · + λk vk = 0 , cada λi tiene que ser cero:
0 = hvi , 0i = hvi , λ1 v1 + · · · + λi vi + · · · + λk vk i = λ1 hvi , v1 i + · · · + λi hvi , vi i + · · · + λk hvi , vk i
2
= 0 + · · · + λi hvi , vi i + · · · + 0 = λi kvi k
como vi 6= 0 , su norma no es cero por lo que tiene que ser λi = 0 .
Lema 124.- Sean V un espacio vectorial con producto interior, W un subespacio de V y B una base ortonormal
de W . Entonces para cada v ∈ V , el vector v −ProyW ( v ) es ortogonal a cada vector de W .
Demostración:
Por la Proposición 118, para probar que un vector es ortogonal a todos los vectores de un subespacio, basta
probarlo para los vectores de una base. Sea B = {w1 , w2 , . . . , wk } , para cada wi de B , por ser B ortonormal,
h wi , wi i = 1 y h wi , wj i = 0 , si i 6= j , entonces
hv−ProyW (v), wi i = hv − hv, w1 iw1 − · · · − hv, wi iwi − · · · − hv, wk iwk , wi i
= hv, wi i − hv, w1 ihw1 , wi i − · · · − hv, wi ihwi , wi i − · · · − hv, wk ihwk , wi i
= hv, wi i − 0 − · · · − hv, wi i · 1 − · · · − 0 = hv, wi i − hv, wi i = 0
Luego es ortogonal a los vectores de B y, por consiguiente, a todos los vectores de W .
Unicidad de la proyección ortogonal.- Sea V un espacio con producto interior y W un subespacio de V . Para
cada v ∈ V , la proyección ortogonal de v en W no depende de la base ortonormal elegida.
Es decir, si B1 = {u1 , u2 , . . . , uk } y B2 = {v1 , v2 , . . . , vk } son dos bases ortonormales de W , entonces,
para cada v ∈ V , los vectores
(1)
ProyW (v) = w1 = hv, u1 iu1 + hv, u2 iu2 + · · · + hv, uk iuk
(2)
ProyW (v) = w2 = hv, v1 iv1 + hv, v2 iv2 + · · · + hv, vk ivk
son el mismo.
Demostración:
Como w1 es una proyección ortogonal de v sobre W , el vector w1 ∈ W y el vector v − w1 es ortogonal a
W y, por la misma razón, el vector w2 ∈ W y el vector v − w2 es ortogonal a W .
Entonces, el vector ( v − w1 ) − (v − w2 ) = w2 − w1 cumple que: es ortogonal a todos los vectores de
W por ser diferencia de dos vectores ortogonales a W ; y también es un vector de W por ser diferencia de dos
vectores de W . En consecuencia, es ortogonal a si mismo y h w2 − w1 , w2 − w1 i = 0 , luego es el vector 0 ;
por lo que w1 = w2 y la proyección ortogonal no depende de la base.
Aplicaciones lineales
Justificación del método descrito en la Observación 136, de la página 56
Usaremos en la justificación el mismo ejercicio del ejemplo, pero la prueba es válida en cualquier caso.
t
Haciendo las operaciones elementales sobre la matriz A , que tiene por filas las [f (vi )]B2 , hemos obtenido la
[f (v1 )]B2
[f (v6 − v1 )]B2
[f (v5 − v6 + v1 )]B2
matriz que tiene por filas
[f (v + 1
v − 3
v − 3
v )] . Luego si repetimos las mismas operaciones
4 2 1 2 6 2 5 B2
[f (v3 + v6 + 2v5 )]B2
[f (v2 − 2v6 − v5 )]B2
[v1 ]B1 [v1 ]B1
[v2 ]B1 [v − v1 ]B1
6
[v3 ]B1 [v − v + v1 ]B1
sobre la matriz J que tiene por filas
obtendrı́amos K =
5 6
[v4 + 1 v1 − 3 v6 − 3 v5 ]B1
.
[v4 ]B1 2 2 2
[v5 ]B1 [v3 + v6 + 2v5 ]B1
[v6 ]B1 [v2 − 2v6 − v5 ]B1
Ahora bien, como la matriz J es la identidad, que tiene rango 6, la matriz K también tiene rango 6, por lo
que sus filas son linealmente independientes y en consecuencia los tres últimos vectores (los vectores de ker(f ))
también son linealmente independientes.
Diagonalización
Justificación de la observación en Antes de seguir de la página 62
Definición.- Sea f : V −→ V un operador lineal, diremos que un escalar λ es un valor propio de f si existe
un vector v ∈ V , diferente de cero, tal que f (v) = λv .
Al vector v se le denomina vector propio de f correspondiente a λ .
Teorema.- Los vectores propios de f correspondientes al valor propio λ , son los vectores distintos de cero del
núcleo de la aplicación λId − f (denotamos por Id la aplicación identidad, Id ( v ) = v ).
Llamaremos a dicho núcleo, espacio caracterı́stico de f correspondiente al valor propio λ.
Demostración:
v un vector propio correspondiente a λ ⇐⇒ f (v) = λv ⇐⇒ f (v) = λId (v) ⇐⇒ λId (v) − f (v) = 0 ⇐⇒
(λId − f )(v) = 0 ⇐⇒ v ∈ ker(λId − f ).
Teorema 152.- Sean v1 , v2 , . . . , vk vectores propios de una matriz A asociados a los valores propios λ1 ,
λ2 , . . . , λk respectivamente, siendo λi 6= λj , ∀ i 6= j . Entonces el conjunto de vectores {v1 , v2 , . . . , vk } es
linealmente independiente.
Demostración:
Supongamos que v1 , v2 , . . . , vk son linealmente dependientes.
Por definición, un vector propio es distinto de cero, luego el conjunto { v1 } es linealmente independiente.
Sea r el máximo entero tal que {v1 , v2 , . . . , vr } es linealmente independiente. Puesto que hemos supuesto
que {v1 , v2 , . . . , vk } es linealmente dependiente, r satisface que 1 ≤ r < k . Además, por la manera en que
se definió r , { v1 , v2 , . . . , vr , vr+1 } es linealmente dependiente. Por tanto, existen escalares c1 , c2 , . . . , cr+1 ,
al menos uno diferente de cero, tales que
1 ≤ dim V (λk ) ≤ mk .
Demostración:
Como ya observamos anteriormente, dim V (λi ) ≥ 1.
Supongamos que dim V (λk ) = d, y consideremos el operador lineal f : IRn −→ IRn definido por f ( v ) = A v .
Sea { v1 , . . . , vd } una base del espacio caracterı́stico V (λk ) , que podemos completar hasta obtener una base
de IRn , B = { v1 , . . . , vd , vd+1 , . . . , vn } . La matriz A0 , del operador en la base B , será de la forma
µ ¶
A0 = [f (v1 )]B ··· [f (vd )]B [f (vd+1 )]B ··· [f (vn )]B
λk ··· 0
.. .. .
µ ¶ . . .. A012
λk [v1 ]B ··· λk [v2 ]B [f (vd+1 )]B ··· [f (vn )]B
0 · · · λk
= =
0 ··· 0
.. .
. · · · .. A022
0 ··· 0
de donde |λI −A0 | = (λ−λk )d |λI −A022 |. Pero como A y A0 son matrices semejantes, tienen el mismo polinomio
caracterı́stico, y (λ − λk )d |λI − A022 | = |λI − A0 | = |λI − A| = (λ − λk )mk Q(λ) , de donde se obtiene que d ≤ mk ,
pues mk es la multiplicidad de la raı́z.
Teorema fundamental de la diagonalización 155.- Sea A una matriz de orden n . Entonces A es diagonali-
zable si y sólo si se cumplen las condiciones:
1.- El polinomio caracterı́stico tiene n raices reales. Es decir, |λI − A| = (λ − λ1 )m1 · · · (λ − λk )mk con
m1 + m2 + · · · + mk = n .
2.- Para cada espacio caracterı́stico V (λi ) , se cumple que dim V (λi ) = mi .
Demostración:
=⇒ Si A es diagonalizable, la matriz diagonal D y A son semejantes ( D = P −1 AP ) y por tanto poseen
el mismo polinomio caracterı́stico, luego P (λ) = |λI − A| = |λI − D| = (λ − λ1 )m1 · · · (λ − λk )mk , donde los
λi ∈ IR son los valores de la diagonal de D y mi el número de veces que se repite. Por tanto, P (λ) tiene todas
sus raices reales y, por ser de grado n , m1 + m2 + · · · + mk = n.
Además, por ser A y D matrices semejantes, también lo son λI − A y λI − D , para todo λ ∈ IR , pues
P −1 (λI − A)P = λP −1 IP − P −1 AP = λI − D , de donde rg(λI−A) = rg(λI−D) , para todo λ. Entonces, para
cada autovalor λi se tiene que rg(λi I − A) = rg(λi I − D) = n − mi y, en consecuencia, que dim V (λi ) = mi .
⇐= Si |λI − A| = (λ − λ1 )m1 · · · (λ − λk )mk , con m1 + m2 + · · · + mk = n, y dim V (λi ) = mi para cada
i = 1, . . . , k , consideremos en cada V (λi ) una base Bi , de la forma
n o n o n o
B1 = p , . . . , pm , B2 = p , . . . , pm , . . . , Bk = pk , . . . , pkmk
Tomemos entonces B = B1 ∪B2 ∪· · ·∪Bk , un conjunto de n vectores propios de A, si vemos que son linealmente
independientes, tendremos que A es diagonalizable.
Planteemos una combinación lineal igualada a cero:
0 = β11 p + · · · + β1m1 pm + β21 p + · · · + β2m2 pm + · · · + βk1 pk + · · · + βkmk pkmk
= (β11 p + · · · + β1m1 pm ) + (β21 p + · · · + β2m2 pm ) + · · · + (βk1 pk + · · · + βkmk pkmk )
= v1 + v2 + · · · + vk
siendo vj = βj1 pj + · · · + βjmj pjmj ∈ V (λj ), para cada j = 1, . . . , k .
Los vectores v1 , v2 , . . . , vk son vectores de espacios caracterı́sticos correspondientes, respectivamente, a
los valores propios distintos λ1 , λ2 , . . . , λk y por tanto, si no son cero, son linealmente independientes. Pero
la combinación lineal v1 + v2 + · · · + vk = 0 nos indicarı́a que son dependientes, luego la única forma de
eliminar esa contradicción es que vj = 0 , ∀j = 1, 2, . . . , k ; de donde, si 0 = vj = βj1 pj + · · · + βjmj pjmj ,
han de ser todos βj1 = βj2 = · · · = βjmj = 0 por ser Bj una base. Como es cierto para cada j , se tiene que
βji = 0, ∀ i, j , con lo que B es linealmente independiente.
Teorema fundamental de la diagonalización ortogonal 159.- Una matriz A de orden n es diagonalizable or-
togonalmente si y sólo si A es simétrica. .
Demostración:
=⇒ A es diagonalizable ortogonalmente =⇒ ∃P ortogonal y D diagonal tal que P t AP = D =⇒ ∃P
ortogonal y D diagonal tal que A = P DP t =⇒ At = (P DP t )t = P DP t = A =⇒ A es simétrica.
⇐= Sea A simétrica, veamos que es diagonalizable. Primero, que todos los valores propios de A son reales:
Sea λ ∈ C un valor propio de A, entonces existe x = (x1 , . . . , xn ) 6= 0 ( xj ∈ C ) tal que A x = λ x . Por
ser A real, su polinomio caracterı́stico es real y el conjugado de λ , λ, es también autovalor de A ; además,
tomando conjugados en la igualdad anterior, se tiene que Ax = A x = λx . Entonces, son iguales los valores
n
X n
X 2
xt Ax = xt (Ax) = xt (λx) = λxt x = λ xj xj = λ |xj |
j=1 j=1
n
X 2
xt Ax = (xt A)x = (xt At )x = (Ax)t x = (λx)t x) = λxt x = λ |xj |
j=1
P
n
2
y, al ser x 6= 0 , |xj | 6= 0 por lo que λ = λ y λ ∈ IR . En consecuencia, si todos los autovalores de A son
j=1
reales, el polinomio caracterı́stico de A tiene las n raices reales.
Veamos ahora que para cada λj se verifica que dim V (λj ) = mj .
Sean dim V (λj ) = d y Bj = {x1 , . . . , xd } una base ortonormal de V (λj ) que ampliamos hasta una base
ortonormal de IRn , B = { x1 , . . . , xd , xd+1 , . . . , xn }.
Consideremos el operador lineal f : IRn −→ IRn dado por f ( x ) = A x , luego A es la matriz de f en la base
canónica que es ortonormal y si A0 es la matriz de f en la base B y P la matriz de paso de B a la canónica,
P es ortogonal y A0 = P t AP . Como A es simétrica, A0 tambien lo será pues (A0 )t = (P t AP )t = P t At (P t )t =
P t AP = A0 .
µ ¶
0
A = [f (x )]
1 B · · · [f (x )]
d B [f (xd+1 B)] · · · [f (x )]
n B
λj · · · 0
.. . . ..
. . A012
µ ¶ .
0 · · · λj
= λj [x1 ]B · · · λj [x2 ]B [f (xd+1 )]B · · · [f (xn )]B = 0 ··· 0
. .
.. · · · .. A0
22
0 ··· 0
donde A012 = 0 , puesto que A0 es simétrica y A022 cuadrada de orden n − d. Luego la matriz λj I − A0 nos
queda
λj − λj · · · 0 0 ··· 0
.. .. .. .. . . ..
. . . 0 . . . 0
0 · · · λ − λ 0 · · · 0
0
λj I − A = j j
0 · · · 0 = 0 ··· 0
.. .. . .
. ··· . 0
λj I − A22 . . 0
. · · · . λj I − A22
0 ··· 0 0 ··· 0
por lo que rg(λj I −A0 ) = rg(λj I −A022 ) . Por ser A y A0 semejantes rg(λj I −A) = rg(λj I −A0 ) (ver demostración
del Teorema 155), y se tiene que rg(λj I −A022 ) = rg(λj I −A) = n−dim V (λj ) = n−d por lo que |λj I − A022 | 6= 0.
Entonces, |λI − A| = |λI − A0 | = (λ − λj )d |λI − A022 | , con |λj I − A022 | 6= 0 , luego d = mj .
En resumen, A diagonaliza, y tomando una base ortonormal de cada uno de los espacios caracterı́sticos,
tendremos n vectores propios de norma 1 y, que por el Lema 158, son ortogonales entre sı́.
Formas cuadráticas
Demostración de: Teorema de Sylvester o Ley de inercia 169 de la página 71
Teorema de Sylvester o Ley de inercia 169.- Si una forma cuadrática se reduce a la suma de cuadrados en
dos bases diferentes, el número de términos que aparecen con coeficientes positivos, ası́ como el número de
términos con coeficientes negativos es el mismo en ambos casos.
Demostración:
Supongamos que respecto a una base B1 = { b1 , b2 , . . . , bn } la matriz de la forma cuadrática Q es una matriz
diagonal y tiene p elementos positivos y s elementos negativos en su diagonal principal, luego la expresión de
la forma cuadrática será
con ai > 0 para todo i , y (x1 , . . . , xp , xp+1 , . . . , xp+s , xp+s+1 , . . . , xn ) = [ x ]tB1 ; y que respecto a otra base
B2 = {d1 , d2 , . . . , dn } la matriz de la forma cuadrática es también diagonal con q elementos positivos y r
negativos, por lo que Q se expresará en la forma
Por el teorema 167 anterior, sabemos que las matrices congruentes tienen el mismo rango, luego tienen que
ser p + s = q + r . Veamos que p = q , con lo que tendremos también que s = r .
Si p 6= q , uno de ellos es mayor que el otro, supongamos que es p > q y consideremos los conjuntos de
vectores { b1 , . . . , bp } y {dq+1 , . . . , dn }. Si p > q , el conjunto { b1 , . . . , bp , dq+1 , . . . , dn } tiene p+(n−q) =
n + (p − q) > n vectores y, por lo tanto, es un conjunto linealmente dependiente y en la igualdad
λ1 b1 + · · · + λp bp + µq+1 dq+1 + · · · + µn dn = 0
alguno de los coeficientes no es cero. Entonces, el vector
λ1 b1 + · · · + λp bp = −µq+1 dq+1 − · · · − µn dn = x
no es el cero (si es cero, todos los λi son cero por ser los bi de B1 , y todos los µj = 0 por ser los dj ∈ B2 ),
con algún λi y algún µj distintos de cero. Tenemos ası́ que
[x ]tB1 = (λ1 , . . . , λp , 0, . . . , 0) y [ x ]tB2 = (0, . . . , 0, −µq+1 , . . . , −µn )
pero calculando Q( x ) respecto a las dos bases obtenemos
Q(x) = a1 λ21 + · · · + ap λ2p − ap+1 0 − · · · − ap+s 0 = a1 λ21 + · · · + ap λ2p > 0
Q(x) = c1 0 + · · · + cq 0 − cq+1 (−µq+1 )2 − · · · − cq+r (−µq+r )2 + 0(−µq+r+1 )2 + · · · + 0(−µn )2
= −cq+1 (−µq+1 )2 − · · · − cq+r (−µq+r )2 ≤ 0
lo que no puede ser. Por tanto deben ser p = q y s = r , es decir, las dos matrices diagonales tienen el mismo
número de elementos positivos y negativos.
Teorema de clasificación 172.- Sea Q una forma cuadrática en un espacio de dimensión n. Se verifica:
a) Q es nula ⇐⇒ Sig(Q) = (0, 0)
b) Q es definida positiva ⇐⇒ Sig(Q) = (n, 0).
c) Q es semidefinida positiva ⇐⇒ Sig(Q) = (p, 0) con 0 < p < n .
d) Q es definida negativa ⇐⇒ Sig(Q) = (0, n).
e) Q es semidefinida negativa ⇐⇒ Sig(Q) = (0, q) con 0 < q < n .
f) Q es indefinida ⇐⇒ Sig(Q) = (p, q) con 0 < p, q .
Demostración:
Sea B = { v1 , . . . , vn } una base en la cual, la expresión de Q es Q( x ) = d1 x21 + d2 x22 + · · · + dn x2n
donde (x1 , . . . , xn ) = [ x ]tB . Luego, Q( vi ) = di , para todo i = 1, . . . , n , ya que los vectores de B tiene por
coordenadas [ v1 ]tB = (1, 0, 0, . . . , 0) , [ v2 ]tB = (0, 1, 0, . . . , 0), . . . , [ vn ]tB = (0, 0, 0, . . . , 1). Entonces:
a) Si Q( x ) = 0 , para todo x , se tiene que di = Q( vi ) = 0, para todo i , luego Sig(Q) = (0, 0) .
Reciprocamente, si di = 0 para todo i , entonces Q( x ) = 0 para todo x .
b) Si Q( x ) > 0 para todo x 6= 0 , se tiene que di = Q( vi ) > 0, para todo i, luego Sig(Q) = (n, 0) .
Recı́procamente, si di > 0 para todo i , entonces Q( x ) > 0 para todo x 6= 0 .
c) Si Q( x ) ≥ 0 para todo x 6= 0 , es di = Q(vi ) ≥ 0 para todo i. Como no es nula existe algún dj > 0 y
como no es definida positiva existe algún dk = 0 , luego Sig(Q) = (p, 0) con 0 < p < n .
Recı́procamente, si di ≥ 0 para todo i , con algún dj > 0 y algún dk = 0 , se tiene que Q( x ) ≥ 0 para
todo x , que Q( vj ) = dj > 0, por lo que no es nula, y que Q( vk ) = dk = 0 , por lo que no es definida
positiva.
d) y e) Análogos a los casos de definida y semidefinida positiva.
f) Por ser indefinida, Q( x ) 6≥ 0 para todo x , luego di 6≥ 0 para todo i , por lo que existirá un dj < 0
y Q( x ) 6≤ 0 para todo x , luego di 6≤ 0 para todo i por lo que existirá un dk > 0. En consecuencia,
Sig(Q) = (p, q) con p, q > 0 .
Recı́procamente, si existe dj < 0 y dk > 0, serán Q( vj ) = dj < 0 y Q( vk ) = dk > 0 , luego es indefinida.