Está en la página 1de 77

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Captulo

AUTOVALORES Y AUTOVECTORES

2 0 2 1 6 1 AX 3 = 0 6 0 5 = 10 = 6 5 = 3X 3 ; siendo 3 = 6 3 3 1 3 3 2 12 2 Es decir, 1 = 1, 2 = 4 y 3 = 6 son autovalores de A con autovectores 1 2 1 asociados X1 = 0 , X 2 = 0 y X 3 = 5 , respectivamente. 3 1 1 2 Ntese que AM3x3(K) y tiene exactamente 3 autovalores.
Definicin 7.2.

7.1. INTRODUCCIN. En este captulo se presentan dos de los ms importantes conceptos del lgebra Lineal que son claves en el Anlisis de Datos Multivariante como lo son los conceptos de Autovalor y Autovector. Se exponen todos sus temas asociados como lo son la relacin entre los autovalores y autovectores de una matriz y su matriz transpuesta, la semejanza de matrices y los autovalores y autovectores de matrices simtricas. 7.2. DEFINICIONES, PROPIEDADES Y EJEMPLOS. Definicin 7.1. Sean AMnxn(K) y K. Se dice que es autovalor, valor propio, valor caracterstico o eigenvalor de A si:
X K (X nx1 ) : AX = X
n

Sea AMnxn(K). Se define como espectro de A y se denota por E(A) al conjunto formado por todos los autovalores de A.
Ejemplo 7.2.

En el ejemplo 7.1, E(A) = {1, 4, 6}


Definicin 7.3.

Sean AMnxn(K) y K, tales que es autovalor de A. Se define como autoespacio, espacio propio, espacio caracterstico o eigenespacio de A y se denota por V(A) al conjunto:
V (A) = X K n (X nx1 ) : AX = X
Ejemplo 7.3.

En ese caso, se dice que el vector X es autovector, vector propio, vector caracterstico o eigenvector, respectivamente de A asociado al autovalor . Ejemplo 7.1. Sean AM3x3() y X1, X2, X33 definidas por:

En el ejemplo 7.1., 2 1 V1 (A) = X 3 : X = a 0; a * , V4 (A) = X 3 : X = b 0; b * 1 1 1 y V6 (A) = X 3 : X = c 5 ; c * 3 2 Observacin: Ntese que para cada autovalor existen infinitos autovectores, los cuales se generan por un conjunto finito de vectores. En el ejemplo 7.3., los autovectores de cada autovalor se generan cada uno por un solo vector.

2 0 2 1 1 2 A = 0 6 0 ; X1 = 0 ; X 2 = 0 ; X 3 = 5 3 1 3 3 2 1 1 Luego, se verifica que: 2 0 2 2 2 2 AX1 = 0 6 0 0 = 0 = 1 0 = 1X1 ; siendo 1 = 1 1 1 1 1 3 3

2 0 2 1 4 1 AX = 0 6 0 0 = 0 = 40 = 2 X 2 ; siendo 2 = 4 1 3 3 1 4 1
2

238

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Teorema 7.1.

CS (): Si Det(A-In) = 0 entonces es autovalor de A.


n

Sean AMnxn(K) y XK -{nx1}. Si X es autovector de A entonces X esta asociado a un nico autovalor de A.


Demostracin

Si Det(A-In) = 0, por el teorema 3.1., apartado 13 se tiene que A I n es singular. Luego, por el teorema 4.19., n( A I n ) 0, es decir, nx1 N ( A I n ) . Por consiguiente, X K n (X nx1 ) : (A I n )X = nx1 , lo cual significa que X K n (X nx1 ) : AX = X , es decir, es autovalor de A.
Definicin 7.4.

Supongamos que X es autovector de A asociado a los autovalores y . Luego, AX = X AX AX = X X nx1 = ( )X AX = X Como XK -{nx1} entonces para que ( )X = nx1 debe cumplirse que = 0 , es decir, = . Por consiguiente, X esta asociado a un nico autovalor.
n

Sea AMnxn(K). Se define como autopolinomio, polinomio propio, polinomio caracterstico o eigenpolinomio de A y se denota por PA() a: PA() = Det (A I n ) La igualdad PA() = 0 recibe el nombre de autoecuacin, ecuacin propia, ecuacin caracterstica o eigenecuacin de A.

Teorema 7.2.

Sean AMnxn(K) y K. Si es autovalor * V (A) = X K n : AX = X es un subespacio de Kn.

de

entonces

Observacin: Del teorema 7.3., se obtiene que es autovalor de A si y slo si es solucin de la autoecuacin de A, es decir, es raz del autopolinomio de A, PA(). El prximo teorema nos indicar las caractersticas de PA().
Teorema 7.4.

Demostracin

Si AX = X entonces AX X = nx1, es decir, (A In)X = nx1. Por * * consiguiente, V (A) = N ( A In ) y por el teorema 4.18, V (A) es un

subespacio de K . Observacin:
* V (A) = V (A) { nx1}

Sea AMnxn(K). Entonces se cumple que PA ( ) =

(1)
j= 0

n j

SDMPAO( j)n j ;

con SDMPAO(0) = 1, donde SDMPAO(j) significa Suma de los determinantes de los menores principales de A de orden j.
Demostracin

Teorema 7.3.

Sean AMnxn(K) y K. es autovalor de A si y slo si Det(A-In) = 0.


Demostracin

Expresemos la matriz AMnxn(K) particionada 1xn por columnas, es decir, A = [ A1 A 2 L A n ]. De la misma forma expresemos la matriz In particionada 1xn por columnas, es decir, In = e1 e 2 L e n . Luego, PA() = Det (A I n ) = Det([ A1 e1
A 2 e 2 L A n e n ]).

CN (): Si es autovalor de A entonces Det(A-In) = 0. Utilicemos reduccin al absurdo. Supongamos que es autovalor de A y que Det(A-In) 0. Luego, por el teorema 3.1, apartado 13 se tiene que A I n es no singular. Por lo tanto, por el teorema 4.19., n( A I n ) = 0, es decir,

Por el teorema 3.1., apartados 5 y 8 se tiene que:

Det (A I n ) = Det([ A1 A 2 e 2 L A n e n ]) +
+ Det([ e1 = Det([ A1 = Det([ A1
A 2 e 2 L A n e n ]) A 2 e 2 L A n e n ])

N ( A I n )

= {X K n : (A I n )X = nx1}

= {nx1}. Esto significa que

(A I n )X = nx1 X = nx1 , es decir, AX X = nx1 X = nx1 , lo cual a su vez indica que AX = X X = nx1 . Por consiguiente, X es autovector de A asociado al autovalor y X = nx1 , lo cual es una contradiccin.
239

A 2 e 2 L A n e n ]) + A 2 L A n e n ]) +

+ ( )Det([ e1

240

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

+ Det([ A1

e 2 L A n e n ]) +

+ ( )Det([ e1 + ( )Det([ e1 = Det([ A1

A 2 L A n e n ])
e 2 L A n e n ])

Det (A I n ) =

(1)
j=0

n j

SDMPAO( j)n j

A 2 L A n e n ]) + A 2 L A n e n ])
e 2 L A n e n ])

Observaciones: 1. 2. PA() es un polinomio de grado n en . Como todo autovalor de A es raz de PA() demuestra que A tiene exactamente n autovalores. El trmino independiente de PA() es Det(A). Esto implica que: 2.1. A tiene al menos 1 autovalor nulo si y slo si Det(A) = 0. 2.2. A tiene al menos 1 autovalor nulo si y slo si Rango(A) < n. 2.3. A tiene al menos 1 autovalor nulo si y slo si A es singular. 2.4. A tiene todos sus autovalores no nulos si y slo si A es no singular. 2.5. Si Rango(A) = r entonces A tiene exactamente nr autovalores nulos y r autovalores no nulos. Al resolver la ecuacin PA()= 0 se obtienen los n autovalores de A. Para cada autovalor calculado se obtiene el conjunto V(A) resolviendo el SEL homogneo (A I n )X = nx1 .

+ ( )Det([ A1 e 2 L A n e n ]) + + ( )Det([ e1 + ( ) Det([ e


2
1

Aplicando estas 2 propiedades n2 veces cada una sobre cada matriz se obtiene:

Det (A I n ) = ( ) n Det([ e1 e 2 L e n ]) +
+ ( ) n 1 Det([ A1 e 2 L e n ]) + ( ) n 1 Det([ e1 + ( ) n 1 Det([ e1 e 2 L A n ]) + () n 2 Det([ A1 + ( ) n 2 Det([ A1 e 2 + ( ) Det([ e
1 1

A 2 L e n ]) +

A 2 L e n ]) +

3. 4.

A 3 L A n ]) + +

+ () n 2 Det([ e1 e 2 L A n 1
A
2 n

A n ])+ + A 2 L A n ]) Det(M(A)23n) + Det(M(A)12n-1) +

L A ]) + ( )1 Det([ A1 e 2 L A n ]) + +
n n n 1 n 1

Definicin 7.5.

+ ( )1 Det([ A1 A 2 L e n ]) + Det([ A1
Det (A I n ) = (1) Det(In) + (1)

Sean AMnxn(K) y iK, tales que i es autovalor de A, i = 1, 2, , m. Se define como multiplicidad algebraica del autovalor i y se denota por ri a la multiplicidad de la raz i de PA(). Observaciones: 1. Si 1, 2, , m son los autovalores de A entonces

+ (1)

n 1 n 1

Det(M(A)13n) + + (1)

n 1 n 1

+ (1) n 2 n 2 Det(M(A)34n) + (1) n 2 n 2 Det(M(A)24n) + + + (1) n 2 n 2 Det(M(A)12n-2) + + (1)1 1 Det(M(A)1) + + (1) Det(M(A)2) + + (1) Det(M(A)n) + Det(A)
Det (A I n ) = (1) n n .1 + (1) n 1 n 1 (Det(M(A)23n) + + Det(M(A)13n) + + Det(M(A)12n-1)) + + (1) n 2 n 2 (Det(M(A)34n) + Det(M(A)24n)+ +Det(M(A)12n-2))
1 1 1 1

r = n .
i i =1

2.

Si 1, 2, , m son los autovalores de A entonces PA() se puede factorizar de la siguiente forma: PA() = ( 1 ) r1 ( 2 ) r2 ...( m ) rm Si i es autovalor de A entonces Det (A i I n ) = 0 y por tanto A i I n es singular. Esto implica que n( A i I n ) 0, es decir, n( A i I n ) 1. Por el teorema 4.24., r( A i I n )+ n( A i I n ) = n y como Rango( A i I n ) = r( A i I n ) entonces

3.

+ + (1) (Det(M(A)1) + Det(M(A)2) + + Det(M(A)n)) + Det(A)


1 1

Det (A I n ) = (1) n n SDMPAO(0) + (1) n 1 n 1 (SDMPAO(1)) +

+ (1) n 2 n 2 (SDMPAO(2)) + + (1)1 1 (SDMPAO(n-1)) + + (1) 0 0 DMPAO(n)


Det (A I n ) = (1) n SDMPAO(0)n + (1) n 1 (SDMPAO(1)) n-1 +

n( A i I n ) = nRango( A i I n ), es decir, nRango( A i I n )1. Esto a su vez implica que n 1 Rango( A i I n ), es decir, Rango( A i I n ) n 1. Esto asegura que existe al menos un autovector asociado al autovalor i. Si Rango( A i I n ) = r < n entonces se cumple que n( A i I n ) = n Rango( A i I n ), lo que es lo mismo que decir que n( A i I n ) = n r. Esto significa que N ( A i I n ) se genera por n r vectores L.I., es decir, existen exactamente n r autovectores L.I. asociados con el autovalor i.

+ (1) n 2 (SDMPAO(2))n-2 + + (1)1 (SDMPAO(n-1))1 + + (1) DMPAO(n)


0

4.

241

242

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Ejemplo 7.4.

En el ejemplo 7.1.:
PA ( ) = (1)3 3 + (1) 2 (Det ([2]) + Det ([6] + Det ([3])2 +

2 x1 2 x 3 X = x 2 = 0 = x 3 0 1 x3 x3 Por consiguiente, 2 V1 (A) = X 3 : X = a 0; a * 1 V4(A): 2 0 2 1 0 0 x1 0 ( A 4 I 3 ) X = 3 x1 ( 0 6 0 4 0 1 0 ) x 2 = 0 1 3 3 0 0 1 x3 0 2 0 0 2 1 3 Luego, x1 x 3 1 X = x 2 = 0 = x 3 0 x 3 x 3 1 Por consiguiente, 2 x1 0 2x1 + 2x 3 = 0 x x 3 = 0 x1 = x 3 0 x 2 = 0 2x 2 = 0 1 x2 = 0 x + 3x x = 0 x2 = 0 1 x 0 2 3 3 1

2 0 2 2 0 2 2 6 0 1 (1) (Det ( ) + Det ( ) + Det ( )) + Det ( 0 6 0 ) 0 6 1 3 3 3 1 3 3


1

= 3 + (2 + 6 + 3)2 (12 + 4 + 18) + 24 = = 3 + 112 34 + 24 Para determinar los autovalores de A hallamos las races de PA(). Como este es un polinomio de grado 3 utilizamos la regla de Ruffini: Posibles races: 1, 2, 3, 4, 6, 8, 12, 24

1 11 34 1 1 1 10 4 1 6 1 Luego, E(A) = {1, 4, 6} 4 6 6 0 10 24 24 0

24 24 0

Determinemos ahora el autoespacio asociado a cada autovalor: V1(A): 2 0 2 1 0 0 x1 0 (A 1I3 )X = 3 x1 ( 0 6 0 10 1 0 ) x 2 = 0 1 3 3 0 0 1 x3 0 1 0 2 x1 0 x1 + 2x 3 = 0 x + 2x 3 = 0 x1 = 2x 3 0 5 0 x 2 = 0 5x 2 = 0 1 x2 = 0 x2 = 0 1 3 2 x 0 x 3 x 2 x 0 + + = 2 3 3 1 Luego,

1 3 * V4 (A) = X : X = b 0; b 1 V6(A): 2 0 2 1 0 0 x1 0 ( A 6 I 3 ) X = 3 x1 ( 0 6 0 6 0 1 0 ) x 2 = 0 1 3 3 0 0 1 x3 0
2 x1 0 4 0 x 3 = 2 x1 2 x 3 = 4 x1 4 x1 + 2 x 3 = 0 0 x 2 = 0 0 0 x1 + 3x 2 3x 3 = 0 3x 2 = 3x 3 x1 3x 2 = 3x 3 x1 1 3 3 x 3 0

x 3 = 2 x1 x 3 = 2 x1 x 3 = 2 x1 x = 2 x1 3 x = 5 x1 3x 2 = 3(2x1 ) x1 3x 2 = 6 x1 x1 3x 2 = 5x1 3 2

243

244

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Luego, x1 x1 1 X = x 2 = 5 x1 = x 3 5 3 3 x 3 2 x1 2 Por consiguiente, 1 V6 (A) = X 3 : X = c 5 ; c * 3 2


Ejemplo 7.5.

1 18 7 0 x 18x 2 7 x 3 = 0 x1 = 18x 2 + 7 x 3 3 r3 r2 r 0 7 3 0 1 x = 3 x3 + = 7 x 3 x 0 2 3 7 2 0 0 0 0

x1 = 18( 3 x 3 ) + 7 x 3 x1 = 54 x 3 + 7 x 3 x1 = 5 x 3 7 7 7 x2 = 3 x3 x2 = 3 x3 x2 = 3 x3 7 7 7 Luego,

5 5 x3 x1 7 7 3 X = x 2 = x 3 = x 3 3 7 7 x3 x3 1 Por consiguiente, 5 7 V1 (A) = X 3 : X = a 3 ; a * 7 1


18 7 12 4 ) 25 9

Sea AM3x3() definida por: 0 18 7 A = 1 12 4 25 9 1


PA ( ) = (1)3 3 + (1) 2 (Det ([0]) + Det ([12] + Det ([9])2 +
0 12 4 1 0 7 0 18 (1) ( Det ( )) + Det( 1 ) + Det ( ) + Det ( 9 9 25 1 1 12 1
1

Ejemplo 7.6.

Sea AMnxn() una matriz diagonal definida por:


0 L 0 A11 0 A L 0 22 A= M M M 0 0 A L nn Determinemos los autovalores de A.

= 3 + (0 12 + 9)2 (18 7 8) 1 = 3 32 3 1

Para determinar los autovalores de A hallamos las races de PA(). Pero, PA() es el cubo perfecto (3 + 32 + 3 + 1) = ( + 1)3 . Luego, 1 = 1 es autovalor de A con r1 = 3, es decir, E(A) = {1} Determinemos ahora el autoespacio asociado a este nico autovalor: V-1(A):
0 (A (1)I 3 )X = 3x1 (A + I 3 )X = 3 x1 ( 1 1 18 7 1 0 0 x1 0 12 4 + 0 1 0 ) x 2 = 0 25 9 0 0 1 x3 0

A11 0 PA() = Det (A I n ) = Det ( M 0

0 L 0 1 A 22 L 0 0 M M M 0 L A nn 0

0 L 0 1 L 0 ) M M 0 L 1

1 18 7 x1 0 1 18 7 0 r r r 1 18 7 0 2 2 1 1 11 4 x 2 = 0 1 11 4 0 r r + r 0 7 3 0 3 3 1 0 25 10 25 10 0 7 3 0 1 x 3 0 1

L 0 0 A11 L 0 A 0 22 ) = Det ( M M M L A nn 0 0
Por el teorema 3.1., apartado 18 se tiene que: PA () = (A11 )(A 22 )...(A nn )

245

246

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Por lo tanto,

Luego, al hacer PA() = 0 se obtiene que los autovalores de A son 1 = A11, 2 = A22, , n = Ann, es decir, los autovalores de una matriz diagonal son los elementos de la diagonal principal. Determinemos el autoespacio asociado al i-simo autovalor de A: (A i I n )X = nx1 (A A ii I n )X = nx1 A11 L 0 L 0 1 L 0 L 0 M M M M M M ( 0 L A ii L 0 A ii 0 L 1 L 0 )X = nx1 M M M M M M 0 L 0 L A 0 L 0 L 1 nn
A11 L 0 L 0 A ii L 0 L 0 M M M M M M ( 0 L A ii L 0 0 L A ii L 0 )X = nx1 M M M M M M 0 L 0 L A 0 L 0 L A nn ii 0 0 L A11 A ii L M M M )X = nx1 ( 0 0 L A ii A ii L M M M 0 L 0 L A nn A ii 0 A11 A ii L 0 L x 1 0 M M M M M ) x i = 0 ( L 0 L 0 0 M M M M M L 0 L A nn A ii 0 x n 0 (A11 A ii ) x1 0 M M = 0 x i = 0; i = 1, 2, ..., i - 1, i + 1, ..., n. ) 0 M M ( A A ) x 0 ii n nn Luego,
0 0 M M X = x i = x i 1 = x i e i M M 0 0

0 M n VAii (A) = {X : X = a 1; a *} = {X n : X = aei ; a *} M 0 Esto indica que los autoespacios asociados a los autovalores de A son generados por los vectores de la base cannica de n.

Ejemplo 7.7.

Sea AMnxn() una matriz triangular superior definida por: A11 A12 L A1n 0 A 22 L A 2 n A= M M M 0 L A nn 0 Determinemos los autovalores de A. A11 0 PA() = Det (A I n ) = Det ( M 0 A12 L A1n 1 0 L 0 A 22 L A 2 n 0 1 L 0 ) M M M M M 0 L A nn 0 0 L 1

L A12 A1n A11 L 0 A A 22 2n = Det ( ) M M M L A nn 0 0 Por el teorema 3.1., apartado 19 se tiene que: PA () = (A11 )(A 22 )...(A nn ) Luego, al hacer PA() = 0 se obtiene que los autovalores de A son 1 = A11, 2 = A22, , n = Ann, es decir, los autovalores de una matriz triangular superior son los elementos de la diagonal principal. Anlogamente se demuestra que los autovalores de una matriz triangular inferior son los elementos de la diagonal principal.

247

248

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Teorema 7.5.

Consideremos la igualdad: c1X1 + c2X2 + + cpXp + cp+1Xp+1 = nx1 (5) Premultiplicando a ambos lados de (5) por A se obtiene que: A(c1X1 + c2X2 + + cpXp + cp+1Xp+1) = A(nx1) c1AX1 + c2AX2 + + cpAXp + cp+1AXp+1 = nx1 (6) Como 1, 2, , p+1 son autovalores de A con autovectores asociados X1, X2, , Xp+1 respectivamente se tiene que AX1 = 1X1, AX2 = 2X2, , AXp+1 = p+1Xp+1. Sustituyendo en (6) se obtiene que: c11X1 + c22X2 + + cppXp + cp+1p+1Xp+1 = nx1 (7) Ahora, multipliquemos a ambos lados de (5) por p+1. Luego, p+1(c1X1 + c2X2 + + cpXp + cp+1Xp+1) = p+1(nx1) c1p+1X1 + c2p+1X2 + + cpp+1Xp + cp+1p+1Xp+1 = nx1 (8) Restando a ambos lados (8) menos (7) se obtiene que : (c1p+1X1 + c2p+1X2 + + cpp+1Xp + cp+1p+1Xp+1) (c11X1 + c22X2 + + cppXp + cp+1p+1Xp+1) = nx1 nx1 (c1p+1 c11)X1 + (c2p+1 c22)X2 + + (cpp+1 cpp)Xp + (cp+1p+1 cp+1p+1)Xp+1 = nx1 c1(p+1 1)X1 + c2(p+1 2)X2 + + cp(p+1 p)Xp = nx1 Como por hiptesis de induccin X1, X2, , Xp son L.I. se tiene que: c1(p+1 1) = c2(p+1 2) = = cp(p+1 p) = 0 Como i j, i j; i = 1, 2, , m; j = 1, 2, , m, se concluye que c1 = c2 = = cp = 0. Sustituyendo este resultado en (5) se obtiene que: 0X1 + 0X2 + + 0 Xp + cp+1Xp+1 = nx1 cp+1Xp+1 = nx1 Como Xp+1 es autovector de A entonces Xp+1 nx1. Luego, cp+1 = 0. Por consiguiente, c1 = c2 = = cp = cp+1 = 0 y de esta forma X1, X2, , Xp, Xp+1 son L.I.
Teorema 7.6.

Sean AMnxn(K), 1, 2, , mK y X1, X2, , XmKn-{nx1}, tales que 1, 2, , m son autovalores de A, con i j, i j; i = 1, 2, , m; j = 1, 2, , m. Si X1, X2, , Xm son autovectores de A asociados a los autovalores 1, 2, , m de A entonces X1, X2, , Xm son L.I.
Demostracin

Utilicemos induccin matemtica. Demostremos que la proposicin es cierta para m = 2. En efecto, Consideremos la igualdad c1X1 + c2X2 = nx1 (1). Premultiplicando a ambos lados de (1) por A se obtiene que: A(c1X1 + c2X2) = A(nx1) c1AX1 + c2AX2 = nx1 (2) Como 1, 2 son autovalores de A con autovectores asociados X1, X2, respectivamente se tiene que AX1 = 1X1 y AX2 = 2X2. Sustituyendo en (2) se obtiene que: c11X1 + c22X2 = nx1 (3) Ahora, multipliquemos a ambos lados de (1) por 1. Luego, 1(c1X1 + c2X2) = 1(nx1) c11X1 + c21X2 = nx1 (4) Restando a ambos lados (4) menos (3) se obtiene que: (c11X1 + c21X2) (c11X1 + c22X2) = nx1 nx1 (c11X1 c11X1) + (c21X2 c22X2) = nx1 nx1 + (c21 c22)X2 = nx1 c2(1 2)X2 = nx1 Como X2 es autovector de A entonces X2 nx1. Adems, 1 2. Luego, c2 = 0. Sustituyendo en (1) se obtiene que: c1X1 + c2X2 = nx1 c1X1 + 0X2 = nx1 c1X1 = nx1 Como X1 nx1 se obtiene que c1 = 0. Por consiguiente, c1 = c2 = 0 y en consecuencia X1 y X2 son L.I. Supongamos que la proposicin se cumple para m = p, es decir, si X1, X2, , Xp son autovectores de A asociados a los autovalores 1, 2, , p de A entonces X1, X2, , Xp son L.I. Demostremos que la proposicin se cumple para m = p+1. En efecto,

Sean AMnxn(K), K y XKn-{nx1}. Si es autovalor de A con autovector asociado X entonces m es autovalor de Am con autovector asociado X; m-{0, 1}.

249

250

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Demostracin

7.3. RELACIN ENTRE LOS AUTOVALORES Y AUTOVECTORES DE UNA MATRIZ Y SU MATRIZ TRANSPUESTA. Teorema 7.7.

Utilicemos induccin matemtica. Demostremos que la proposicin es cierta para m = 2. En efecto, Si es autovalor de A con autovector X entonces: AX = X A(AX) = A(X) A2X = (AX) A2X = (X) A2X = 2X 2 es autovalor de A2 con autovector asociado X. Supongamos que la proposicin es cierta para m = p, es decir: Si es autovalor de A con autovector asociado X entonces p es autovalor de Ap con autovector asociado X; m-{0, 1}. Demostremos que la proposicin se cumple para m = p+1. En efecto, Por hiptesis de induccin, ApX = pX A(ApX) = A(pX) Ap+1X = p(AX) Ap+1X = p(X) Ap+1X = p+1X p+1 es autovalor de Ap+1 con autovector asociado X.
Ejemplo 7.8.

Sean AMnxn(K) y K. es autovalor de A si y slo si es autovalor de At.


Demostracin

CN(): Si es autovalor de A entonces es autovalor de At. Como es autovalor de A entonces por el teorema 7.3., Det(AIn)= 0. Luego, por el teorema 3.1., apartado 2 se tiene que: Det((AIn)t) = 0 Det(At (In)t) = 0 Det(At(In)t) = 0 Det(AtIn) = 0 es autovalor de At CS():Si es autovalor de At entonces es autovalor de A. Como es autovalor de At entonces por el teorema 7.3., Det(AtIn) = 0. Luego, por el teorema 3.1., apartado 2 se tiene que: Det((AtIn)t) = 0 Det((At)t (In)t) = 0 Det(A(In)t) = 0 Det(AIn) = 0 es autovalor de A
Definicin 7.6.

Sea AMnxn(K) tal que A es idempotente. Determinemos los valores posibles que pueden tomar los autovalores de A. Sea autovalor de A con autovector asociado X. Luego, AX = X A(AX) = A(X) A2X = (AX) AX = (X) (Por ser A idempotente) X = 2X X 2X = nx1 ( 2)X = nx1 ( 2) = 0 (Por ser X autovector, es decir, X nx1) (1 ) = 0 =01=0=0=1

Sean AMnxn(K) y 1, 2, , nK, tales que 1, 2, , n son los n autovalores de A. Se define como matriz de autovalores de A y se denota por D(A) a la matriz diagonal D(A)Mnxn(K) definida por: 1 0 L 0 0 2 L 0 D (A) = M M M 0 0 L n Observacin: Los valores 1, 2, , n de la diagonal principal de D(A) no necesariamente llevan un orden determinado, aunque es usual colocar primero los autovalores positivos ordenados, luego los negativos ordenados y por ltimo los nulos.
Ejemplo 7.9.

En el ejemplo 7.1., 251 252

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

1 0 0 D ( A ) = 0 4 0 0 0 6
Teorema 7.8.

[ X1 X 2

1 0 L 0 0 2 L 0 L Xn ] = XD(A) M M M 0 0 L n

Sean AMnxn(K), , K y X, YKn-{nx1}. Si es autovalor de A con autovector asociado X y es autovalor de At con autovector asociado Y con entonces X Y.
Demostracin

Luego, X-1AX = D(A)


7.4. SEMEJANZA DE MATRICES.

Por hiptesis,
t t t t t t Y t AX = Y t (X) AX = X Y AX = Y X (Y AX) = (Y X) t t t t t t t t t t A Y = Y X A Y = X (Y) X A Y = X Y X A Y = X Y t t t X A Y = X Y t t t X A Y X Y =

Definicin 7.7.

Sean A, BMnxn(K). Se dice que A es semejante a B si y slo si:


P M nxn (K ) (P no singular) : P -1AP = B

Ejemplo 7.10.

En el ejemplo 7.4., PM3x3() (P no singular) definida por: 2 1 1 P= 0 0 5 3 1 1 2 tal que P-1AP = D(A). Es decir, A es semejante a D(A).
Ejemplo 7.11.

Restando a ambos lados en las ecuaciones anteriores: XtAtY XtAtY = XtY XtY 0 = ( )XtY Como se tiene que XtY = 0, es decir, <X, Y> = 0. Luego, X Y. Observacin: Sean AMnxn(K), 1, 2, , nK y X1, X2, , XnKn-{nx1}, tales que 1, 2, , n son los n autovalores de A, con i j, i j; i = 1, 2, , n; j = 1, 2, , n, con autovectores asociados X1, X2, , Xn, respectivamente. Consideremos la matriz particionada por columnas 1xn siguiente: X = [ X1
X2 L Xn ]

Sea AM3x3() definida por: 1 0 1 A = 2 2 0 3 1 3 Hallaremos una matriz B semejante a la matriz A as como tambin la matriz P que define la semejanza entre dichas matrices. Apliquemos sobre A y sobre I3 una operacin elemental de filas. Digamos r2r2 2r1:

Como i j, i j; i = 1, 2, , n; j = 1, 2, , n entonces por el teorema 7.5. X1, X2, , Xn son L.I. Por lo tanto, por el teorema 4.10., la matriz X es no singular. Ahora bien, AX = A[ X1 X 2 L X n ] = [ AX1 AX 2 L AX n ] = [ 1 X1 2 X 2 L n X n ]

[A I ] = 2
3

1 0 1 0 1 1 0 0 1 1 0 0 2 r2 2 r1 2 0 0 1 0 r 0 2 2 2 1 0 = C E 3 1 3 1 3 0 0 1 3 0 0 1

[ ]

La matriz E es una matriz elemental y se cumple que EA = C. Hallemos E-1 aplicando la operacin elemental de filas inversa de r2r2 2r1 sobre I3:

253

254

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

[E I ] = 2
3

1 0 0 1 0 0 1 0 0 1 0 0 2 r2 +2 r1 1 0 0 1 0 r 0 1 0 2 1 0 = I3 E 1 0 0 1 0 0 1 0 0 1 0 0 1

= Det(A In) = PA() 2. 3. 4. 5. Traza(B) = Traza(P AP) = Traza(APP-1) = Traza(AIn) = Traza(A). Det(B) = Det(P-1AP) = Det(APP-1) = Det(AIn) = Det(A). Rango(B) = Rango(P-1AP) = Rango(AP) = Rango(A). P-1AP = B AP = PB. Si XV(B) entonces BX = X. Luego, PBX = P(X) APX = PX AY = Y; Y = PX Por consiguiente, V(A) = {YKn: Y = PX; XV(B)}.
Ejemplo 7.12.
-1

Luego, 1 1 0 0 1 0 1 1 0 EA = C EAE-1 = CE-1 = 0 2 2 2 1 0 = 4 2 2 = B 3 3 5 1 0 0 1 3 1 Por consiguiente, EAE-1 = B (E-1)-1AE-1 = B (P)-1AP = B; P = E-1 En consecuencia, PM3x3() (P no singular): P AP = B, es decir, A es semejante a B.
-1

Sean A, BM3x3() definidas por: 1 4 1 2 0 1 A = 2 4 0 y B = 0 2 1 3 1 3 3 1 3 Determinemos si A y B son semejantes. El teorema 7.9., plantea 5 condiciones necesarias para que A y B sean semejantes. Aplicando la equivalencia contrarecproca en cada una de ellas se obtiene que si alguna de estas 5 condiciones no se cumple entonces eso es suficiente para decir que A y B no son semejantes. En este caso se aprecia fcilmente que Traza(A) = 1 + 4 + 3 = 8 y Traza(B) = 2 + 2 + 3 = 7. Luego, Traza(A) Traza(B) y por consiguiente A no es semejante a B.
Definicin 7.8.

Para resolver este mismo problema de una forma ms fcil slo basta definir arbitrariamente una matriz PM3x3() no singular y al hacer P-1AP se obtiene la matriz B. En este caso, dicha matriz B se obtendra definiendo la matriz P = E-1. Si sobre B se aplica un procedimiento anlogo al aplicado sobre A se obtendr una matriz D semejante a B con la correspondiente matriz Q que define la semejanza entre dichas matrices. El lector podr comprobar fcilmente que la matriz A tambin es semejante a D.
Teorema 7.9.

Sean A, BMnxn(K). Si A es semejante a B entonces: 1. 2. 3. 4. 5. PA() = PB(). Traza(A) = Traza(B). Det(A) = Det(B). Rango(A) = Rango(B). V(A) = {YKn: Y = PX; XV(B)}.

Demostracin

Sea AMnxn(K). Se dice que A es diagonalizable si y slo si A es semejante a su respectiva matriz de autovalores D(A). En ese caso se dice que dicha matriz de autovalores es la forma cannica de Jordan de A. Si A no es diagonalizable entonces se dice que es una matriz defectuosa.
Teorema 7.10.

Por definicin, PB() = Det(B In). Por hiptesis, PMnxn(K) (P no singular): P-1AP = B. Luego, 1. PB() = Det(B In) = Det(P-1AP In) = Det(P-1AP P-1P) = Det(P-1(A In)P) = Det(P-1)Det(A In)Det(P) = Det(A In)Det(P)Det(P-1) = Det(A In)Det(PP-1) = Det(A In)Det(In) 255

Sea AMnxn(K). A es diagonalizable si y slo si tiene n autovectores L.I.


Demostracin

CN(): Si A es diagonalizable entonces tiene n autovectores L.I. Si A es diagonalizable entonces es semejante a su correspondiente forma cannica de Jordan D(A), es decir, 256

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

PMnxn(K) (P no singular): P-1AP = D(A) Ahora bien, D(A) es una matriz diagonal y como se demostr en el ejemplo 7.6., los vectores de la base cannica en n e1, e2, , en son los autovectores de D(A). Por otra parte, por el teorema 7.9., apartado 5, si Y1, Y2, , Yn son los autovectores de A entonces se cumple que Yi = Pei; i = 1, 2, , n. Veamos si los vectores Y1, Y2, , Yn son L.I. Sean ci; = 1, 2, , n, tales que: c1Y + c2Y + + cnY = nx1
1 2 n

2 1 1 P= 0 0 5 3 1 1 2
Definicin 7.9.

Sean AMnxn(K) y iK, tales que i es autovalor de A, i = 1, 2, , m. Se define como multiplicidad geomtrica del autovalor i y se denota por ki a la dimensin del autoespacio correspondiente al autovalor i, es decir: k i = Dim(V i (A))

Luego, c1Pe1 + c2Pe2 + + cnPen = nx1 P(c1e1 + c2e2 + + cnen) = nx1 P-1P(c1e1 + c2e2 + + cnen) = P-1nx1 c1e1 + c2e2 + + cnen = nx1 Como e1, e2, , en es una base de n entonces es un conjunto L.I. Por consiguiente, c1 = c2 = = cn = 0, es decir, los vectores Y1, Y2, , Yn son L.I. Por lo tanto, A tiene n autovectores L.I. CS(): Si A tiene n autovectores L.I. entonces es diagonalizable. Sean X1, X2, , Xn los n autovectores L.I. de A correspondientes a los n autovalores 1, 2, , n. Luego, AXi = iXi; i = 1, 2, , n. Sea PMnxn(K) la matriz particionada por columnas 1xn definida por P = [X1 X2 Xn]. Luego, AP = [AX1 AX2 AXn] = [1X1 2X2 nXn] Observaciones: 1.

Notemos que: V i (A) = {X K n (X nx1 ) : AX = i X}


= {X K n (X nx1 ) : (A i I n )X = nx1}

Luego, k i = Dim(Vi (A)) = Dim( N A i I n ) = n (A i I n ) Adems como n (A i I n ) + r (A i I n ) = n entonces se cumple que n (A i I n ) = n r (A i I n ) Por lo tanto, k i = n (A i I n ) = n r (A i I n ) = n Rango(A i I n ) . Notemos tambin que por definicin de autovalor ki 1. 2. ki ri, i = 1, 2, , m.

= X

1 0 L 0 0 2 L 0 L X = PD(A) M M M 0 0 L n
n

Teorema 7.11.

Como X1, X2, , Xn son L.I. entonces P es no singular. Por consiguiente, AP = PD(A) P-1AP = D(A) Esto indica que A es semejante a D(A), es decir, A es diagonalizable.
Ejemplo 7.13.

Sean AMnxn(K) y iK; i = 1, 2, , m tales que son autovalores de A. A es diagonalizable si y slo si ri = ki, i = 1, 2, , m.
Demostracin

CN(): Si A es diagonalizable entonces ri = ki, i = 1, 2, , m. Por hiptesis, A es diagonalizable, es decir, A es semejante a su correspondiente forma cannica de Jordan D(A). Por consiguiente, PMnxn(K) (P no singular): P-1AP = D(A) PMnxn(K) (P no singular): P-1AP iIn = D(A) iIn PMnxn(K) (P no singular): P-1AP iP-1P = D(A) iIn 258

En el ejemplo 7.10., se observ como la matriz A del ejemplo 7.4., result ser semejante a su correspondiente matriz de autovalores D(A), es decir, result ser diagonalizable. Veamos ahora otra forma de apreciar esta situacin. En ese caso, E(A) = {1, 4, 6}. Como AM3x3() y tiene 3 autovalores distintos entonces por el teorema 7.5., A tiene 3 autovectores L.I. Por ello, A es diagonalizable y adems la matriz P que la diagonaliza es: 257

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

PMnxn(K) (P no singular): P-1(A iIn)P = D(A) iIn Rango(P-1(A iIn)P) = Rango(D(A) iIn) Ahora bien, El autovalor i aparece ri veces en la diagonal principal de D(A) por lo cual la matriz diagonal D(A) iIn tiene n ri filas no nulas. Luego, Rango(D(A) iIn) = n ri Por consiguiente, Rango(P-1(A iIn)P) = n ri Rango((A iIn)P) = n ri Rango(A iIn) = n ri ri = n Rango(A iIn) ri = ki CS () : Si ri = ki, i = 1, 2, , m, entonces A es diagonalizable. Si ri = ki, i = 1, 2, , m, entonces el autovalor i de A tiene asociados exactamente ki autovectores L.I., con dichos autovectores son los siguientes: Para 1: X11 , X12 , ..., X1k1
2 21

seran L.I., lo cual es imposible debido a que Y1 + Y2 + Ym = nx1. En consecuencia, Yi = nx1, i = 1, 2, , m, es decir: Yi =

c
j=1

ki

ij

X ij = nx1 ; i = 1, 2, , m.

Como

{X

los
m2

conjuntos
mk m

m1

, X , ..., X

} son L.I. entonces se cumple que:


c11 = c12 = ... = c1k1 = 0 c 21 = c 22 = ... = c 2 k 2 = 0
M c m1 = c m 2 = ... = c mk m = 0

{X

11

, X12 , ..., X1k1 ,

{X

21

, X 22 , ..., X 2k 2 ,

Por consiguiente, los n autovectores de A son L.I. y por el teorema 7.10., A es diagonalizable.
Ejemplo 7.14.

k = r = n .
i i i =1 i =1

Supongamos que

En el ejemplo 7.5., 0 18 7 A = 1 12 4 25 9 1 1 = -1 es autovalor de A con r1 = 3, es decir, E(A) = {-1} Determinemos la multiplicidad geomtrica de 1 = -1. Esto se puede hacer de 2 maneras. Veamos la primera: k1 = 3 Rango(A (-1)I3) = 3 Rango(A + I3). Hallemos ahora la matriz escalonada reducida por filas de A + I3 para determinar su Rango: 0 18 7 1 0 0 1 18 A + I3 = 1 12 4 + 0 1 0 = 1 11 25 9 25 1 0 0 1 1 1 18 1 11 25 1 7 4 10 7 3 7 3

{ Para : {X
{

, X 22 , ..., X 2k 2

} }
}

Para m: X m1 , X m2 , ..., X mk m

Veamos si estos n vectores son L.I. Sean cijK; i = 1, 2, , m; j = 1, 2, , ki tales que:

c
j=1

k1

1j

X +

1j

c
j=1

k2

2j

X + ... +

2j

c
j=1

km

mj

mj

= nx1 (9)

Sea Y i =

c
j=1

ki

ij

X ij ; i = 1, 2, , m. (10)

Sustituyendo (10) en (9) se obtiene que: Y1 + Y2 + Ym = nx1 Ahora bien, Yi es una combinacin lineal de autovectores asociados al autovalor i. En consecuencia, Yi es tambin un autovector asociado al autovalor i o en su defecto Yi = nx1. Pero Yi no puede ser considerado autovector asociado al autovalor i ya que de serlo entonces los vectores Y1, Y2, , Ym seran autovectores asociados a autovalores diferentes, es decir, 259

7 r2 r2 r1 1 18 7 1 18 1 r2 7 r2 3 r3 + r1 7 3 1 0 4 r 0 10 0 7 3 0 7 7 1 0 1 r1 +18 r2 3 r 0 1 7 0 0 0 7 5 =R 7 0

1 18 3 r3 7 r2 r 0 1 0 0

Luego, Rango(A + I3) = 2. Por lo tanto, k1 = 3 2 = 1. 260

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Pero, r1 = 3 k1 = 1. Por consiguiente, A no es diagonalizable. La otra forma de hallar k1 es con la dimensin de V-1(A). Como: 5 7 V1 (A) = X 3 : X = a 3 ; a * 7 1 Entonces k1 = Dim(V-1(A)) = 1 y como r1 = 3 k1 = 1 entonces A no es diagonalizable, es decir, A es una matriz defectuosa. En este caso resulta ms fcil hallar k1 con la dimensin de V-1(A) porque ya se tiene calculado dicho autoespacio. Si no se tuviese calculado este conjunto resulta ms expedito hallar k1 con n Rango(A 1I3), para luego determinar si A es diagonalizable.
Ejemplo 7.15.

tienen los mismos autovalores por lo cual tienen idnticas formas cannicas de Jordan. Luego, P, QMnxn() (P, Q no singulares): P-1AP = D(A), Q-1BQ = D(B) y D(A) = D(B) Por consiguiente, P-1AP = Q-1BQ QP APQ-1 = QQ-1BQQ-1 (PQ-1)-1A(PQ-1) = B RMnxn() (R no singular): R-1AR = B; R = PQ-1 A es semejante a B
-1

Hallemos ahora las matrices P y Q para luego hallar la matriz R. Las matrices P y Q son aquellas cuyas columnas son los autovectores asociados a los autovalores de A y B, respectivamente. Se puede verificar que los autoespacios asociados a los autovalores de A son: 0 1 V3 (A) = X 3 : X = a 0; a * ; V5 (A) = X 3 : X = b 1; a * 0 0 1 V6 (A) = X 3 : X = c 0; a * 1 Luego, 1 0 1 P = 0 1 0 0 0 1 Igualmente se puede verificar que los autoespacios asociados a los autovalores de B son: 0 0 V3 (B) = X 3 : X = a 0; a * ; V5 (B) = X 3 : X = b 1; a * 1 1 1 V6 (B) = X 3 : X = c 1; a * 1 Por lo tanto,

Sean A, BM3x3() definidas por: 3 0 3 3 0 0 A = 0 5 0 y B = 2 5 0 0 0 6 4 1 6 Determinemos si A y B son semejantes. Al igual que en el ejemplo 7.12., veamos si alguna de las 5 condiciones necesarias no se cumple para poder concluir que A y B no son semejantes: 1. Como A es triangular superior entonces sus autovalores son los elementos de la diagonal principal, es decir, 1 = 3, 2 = 5 y 3 = 6. Como B es triangular inferior entonces sus autovalores son los elementos de la diagonal principal, es decir, 1 = 3, 2 = 5 y 3 = 6. Luego A y B tienen los mismos autovalores y por lo tanto PA() = PB(). Traza(A) = 3 + 5 + 6 = 14 y Traza(B) = 3 + 5 + 6 = 14. Por consiguiente, Traza(A) = Traza(B). Det(A) = 3.5.6 = 90 y Det(B) = 3.5.6 = 90. En consecuencia, Det(A) = Det(B). Como A y B tienen todos sus autovalores no nulos Rango(A) = Rango(B) = 3.

2. 3. 4.

La quinta condicin relaciona los autovectores, cuyo clculo es muy laborioso pero con verificar que las 4 primeras se cumplen pareciera que la quinta tambin se cumple. No obstante, estas 5 condiciones son necesarias y no suficientes para decir que A y B son semejantes. Ahora bien, A y B tienen 3 autovalores distintos. Luego, tienen 3 autovectores L.I. y por el teorema 4.10., ambas son diagonalizables. Por otra parte, A y B 261

262

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

0 Q = 0 1 Se puede verificar que:

0 1 1 1 1 1

semejante a B. Como alternativa utilizaremos un procedimiento similar al del ejemplo 7.11., slo que en este caso no tenemos que hallar una matriz B semejante a la matriz A porque la tenemos sino que debemos deducir las operaciones elementales de filas apropiadas para obtener la matriz P que define la semejanza entre A y B.

2 1 1 Q 1 = 1 1 0 1 0 0 En consecuencia: 1 0 1 2 1 1 3 1 1 PQ-1 = 0 1 0 1 1 0 = 1 1 0 = R 0 0 1 1 0 0 1 0 0
Ejemplo 7.16.

[ ]

2 6 4 2 0 0 1 3 2 1 0 0 r1 2 r1 A I 3 = 0 1 3 0 1 0 0 1 3 0 1 0 0 0 1 0 0 1 0 0 1 0 0 1 2 0 14 2 6 0 1 r1 6 r2 r 0 1 3 0 1 0 = C E 0 0 1 0 0 1

[ ]

Luego, EA = C Se puede verificar que:

Sean A, BM3x3() definidas por: 1 3 2 1 6 14 A = 0 1 3 y B = 0 1 3 1 0 0 1 0 0 Determinemos si A y B son semejantes. Se puede verificar fcilmente que al igual que en el ejemplo anterior se cumplen las 5 condiciones necesarias pero no suficientes para que A y B sean semejantes. Siguiendo el mismo procedimiento, observamos que A y B tienen los mismos autovalores (1 = 1 con r1 = 3) lo que indica que slo basta saber si son diagonalizables. Analicemos en este contexto a la matriz A: k1 = 3 Rango(A 1.I3) = 3 Rango(A I3). Hallemos la matriz escalonada reducida por filas de A I3 para determinar su Rango: 0 1 2 1 3 2 1 0 0 0 3 2 1 3 r1 3 r1 A I3 = 0 1 3 0 1 0 = 0 0 3 0 0 3 0 0 0 0 0 0 0 0 1 0 0 1
0 1 2 0 1 0 3 r1 r1 2 r2 0 0 1 3 0 0 1 0 0 0 0 0 0
1 r2 r2 3

1 3 0 2 E 1 = 0 1 0 0 0 1 Por consiguiente, 2 0 14 1 2 3 0 1 6 14 EA = C EAE-1 = CE-1 = 0 1 3 0 1 0 = 0 1 3 =B 0 0 1 1 0 0 0 0 1 Por lo tanto, EAE-1 = B (E-1)-1A(E-1) = B P-1AP = B; P = E-1 En consecuencia, A es semejante a B y la matriz que define la semejanza entre A y B es: 1 3 0 2 P = 0 1 0 0 0 1
Teorema 7.12.

Luego, Rango(A I3) = 2 y k1 = 3 Rango(A I3) = 3 2 = 1 r1 = 3. Por consiguiente, A no es diagonalizable, lo cual significa que no se puede utilizar el procedimiento seguido en el ejemplo anterior para determinar si A es

Sea V un espacio vectorial finito dimensional sobre K con Dim(V) = n y B1 = {1, 2, , n} y B2 = {1, 2, , n} bases de V. Sea T: VV una T.L. B B Entonces se cumple que [T ]B1 y [T ]B2 son semejantes. 1 2 264

263

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Demostracin

Ejemplo 7.17.

Por hiptesis:

[T()]B = [T] []B [T()]B = [T]B B [ ]B


1

Sean (11) (12)

T:

22

una

T.L.

definida

por

B1 B1

x x 2 y T( ) = , y 2x + y

2 2

1 2 2 0 B1 = { 1 = , 2 = } y B2 = { 1 = , 2 = }. Determinemos las 1 1 0 3 matrices [T ]B1 y [T ]B2 as como tambin la matriz de transicin de B1 a B2 1 2


B B

Sea [ ]B12 la matriz de transicin de B1 a B2. Luego, por el teorema 6.11., se


B

tiene que:

[]B B [T ]B B

que define la semejanza entre [T ]B1 y [T ]B2 . 1 2


B B

[]B = []B B [ ]B
2 2 1

1 1

(13)

Por otra parte, tambin por el teorema 6.11., se tiene que:

[T()]B = []B B [T ( ) ]B
2 2 1

a 1 2 c1 2c 2 c1 + 2c 2 + = = c1 1 + c 2 2 = c1 + c 2 = b 1 1 c1 c 2 c1 + c 2 a = c1 + 2c2 c1 = a 2c2. b = c1 + c2 b = (a 2c2) + c2 b = a + 2c2 + c2 b = a + 3c2 b + a = 3c2 c2 = (a + b)/3 c1 = a 2(a + b)/3 c1 = (3a 2a 2b)/3 c1 = (a 2b)/3 ( a 2 b ) a 3 = (a + b ) B1 b 3 1 1 2.(1) 3 T(1 ) = T( ) = = 1 2.1 + (1) 1 2 2 2.(1) 0 T ( 2 ) = T ( ) = = 1 2.2 + (1) 5 (3 2.1) / 3 1 3 [T(1 )]B1 = = 4 (3 + 1) / 3 3

(14)

Sustituyendo (13) y (14) en (12) se obtiene que:

[]B B [T ( ) ]B
2 1

= [T ]B2 []B12 [ ]B1 2


B B B

Ahora bien, por el teorema 6.12., la matriz [ ]B12 es no singular. Por lo tanto, ( [ ]B12 )-1 [ ]B12 [T ()]B1 = ( [ ]B12 )-1 [T ]B2 []B12 [ ]B1 2
B B B B B

[T ()]B1 = ( [ ]

B 2 -1 B1 )

[T] [] [ ]B
B2 B2 B2 B1

(15)

Igualando (11) y (15) se obtiene que:


B -1 B B [T]B B [ ]B = ( [ ]B ) [T ]B [ ]B [ ]B B B B B [T ]B [ ]B ( [ ]B )-1 [T ]B [ ]B [ ]B = nx1 B B B B ( [T ]B ( [ ]B )-1 [T ]B [ ]B ) [ ]B = nx1 B -1 B B []B nx1 entonces ( [T ]B B ( [ ]B ) [T ]B [ ]B ) = nxn. Luego,
1 1 2 2 2 2 1 1 1 1

1 1

2 2

1 1

2 2

[T( 2 )]B
Luego,

Como

1 1

2 2

(0 2.5) / 3 10 3 = = 5 (0 + 5) / 3 3

[T ]B B

1 1

= ( [ ]B12 )-1 [T ]B2 []B12 2


B B B B B B

P = [T ]B1 PMnxn(K) (P no singular) (P = [ ]B12 ): P-1 [T ]B2 2 1 y [T ]B2 son semejantes. En consecuencia, [T ]B1 1 2
B B

[T ]B B

1 1

1 10 3 = 3 5 4 3 3 :

[T]B B

2 2

a 2 0 2c1 0 2c1 = c1 1 + c 2 2 = c1 + c 2 = + = b 0 3 0 3c 2 3c 2
265 266

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

a = 2c1 c1 = a/2 b = 3c2 c2 = b/3 a B2 b 2 2 2.(0) 2 T (1 ) = T ( ) = = 0 2.2 + (0) 4 0 0 2.(3) 6 T ( 2 ) = T( ) = = 3 2.0 + (3) 3 a = 2 b 3

Teorema 7.13. (Lema de Issai Schur)

Sea AMnxn(K). Entonces se cumple que A es semejante a una matriz triangular T(A)Mnxn(K) que tiene en la diagonal principal los autovalores de A.
Demostracin

Sean 1, 2, , n los autovalores de A y sea X1 el autovector correspondiente al autovalor 1. Luego, se cumple que AX1 = 1X1. Procederemos ahora a construir una matriz P1Mnxn(K) no singular tal que: P1 = [ X1 Donde B1Mnx(n-1)(K). Luego, P11P1 = [ P11X1 P11B1 ] = In = [e1 e2 en] (16)
b 2 L b n ] = [ X1 B1 ]

[T(1 )]B

(2) / 2 1 = = 4 3 (4) / 3 (6) / 2 3 = = (3) / 3 1

[T(2 )]B
Luego,

P11X1 = e1

[T]

B2 B2

1 = 4 3

3 1

Pero, AP1 = [ AX1 AB1 ] = [ 1X1 AB1 ]

La matriz de transicin de B1 a B2 se determina de la siguiente forma: 0 2c 0 2c11 2 1 1 = c11 1 + c 21 2 = c11 + c 21 = 11 + = 3 0 3c 21 3c 21 0 1 1 = 2c11 c11 = 1/2 1 = 3c21 c21 = 1/3 0 2c 0 2c12 2 2 2 = c12 1 + c 22 2 = c12 + c 22 = 12 + = 1 0 3 0 3c 22 3c 22 2 = 2c12 c12 = 1 1 = 3c22 c22 = 1/3 Luego,

Premultiplicando por P11 se obtiene que: P11AP1 = [ 1P11X1 P11AB1 ]

En consecuencia, por (16) se tiene que:


P11AP1 = [ 1e1 P11AB1 ]

Es decir, 1 C1 0 ; donde C M P11AP1 = 1 1x(n-1)(K), A1M(n-1)x(n-1)(K) M A1 0 Luego, A es semejante a P11AP1 . Por lo tanto, tienen los mismos autovalores y en consecuencia A1 tiene como autovalores 2, , n, es decir, los restantes autovalores de A. De forma anloga a la matriz P1 procederemos ahora a construir una matriz P2M(n-1)x(n-1)(K) no singular tal que: P2 = [ X 2 268
B2 ]

[]B B

1 = 2 1 3
B

1 1 3
B

y [T ]B2 son semejantes y que la Se puede verificar fcilmente que [T ]B1 1 2 matriz no singular que define la semejanza entre dichas matrices es [ ]B12 , es
B

decir, se cumple que: ( [ ]B12 )-1 [T ]B2 []B12 = [T]B11 2


B B B B

267

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Donde B2M(n-1)x(n-2)(K) y X2 es el autovector de A1 asociado al autovalor 2. Anlogamente al caso anterior, A1 es semejante a la matriz: 2 C 2 0 ; donde C M P21A1P2 = 2 1x(n-2)(K), A2M(n-2)x(n-2)(K) M A2 0 Sea Q2Mnxn(K) una matriz no singular definida por: 1x ( n 1) 1 Q2 = P2 ( n 1) x1 Luego, 1 0 C3 1 Q2 (P11AP1 )Q 2 = 0 2 ; donde C3M2x(n-2)(K), A2M(n-2)x(n-2)(K) ( n 2 ) x 2 A 2 Al repetir este proceso n1 veces se obtiene una matriz no singular PMnxn(K) definida por: 1 P = P1 ( n 1) x1 1x ( n 1) I 2 P2 ( n 2 ) x 2 2 x ( n 2) I n 2 L P3 2 x ( n 2 ) (n 2) x 2 Pn 1

1. 2.

Traza (A) =
Det (A) =
n

i =1 i

i =1

Demostracin

Por el teorema 7.13., A es semejante a la matriz T(A). Luego, por el teorema 7.9., apartados 2 y 3, la definicin 1.19., y el teorema 3.1., apartado 19 se tiene que: 1. 2. Traza (A) = Traza (T (A)) =
Det (A ) = Det (T (A )) =
n

i =1 i

i =1

7.5. AUTOVALORES SIMTRICAS. Teorema 7.15.

AUTOVECTORES

DE

MATRICES

Sea AMnxn(). Si A es simtrica entonces todos sus autovalores son nmeros reales y sus autoespacios correspondientes estn definidos por vectores reales.
Demostracin

Donde Pn-1M2x2(K) es la matriz no singular obtenida en la (n1)-sima etapa, tal que: n 1 C n 1 1 Pn ; donde Cn-1M1x1(K) 1A n 2 Pn 1 = 0 n Esta matriz P construida anteriormente es tal que: 1 C12 L C1n 0 2 L C2n = T(A) P 1AP = M M M 0 L n 0 En consecuencia, A es semejante a la matriz triangular T(A) que tiene en la diagonal principal los autovalores de A.
Teorema 7.14.

Sea autovalor de A con autovector asociado X. Luego, AX = X (17) Tomando conjugada a ambos lados de (17) se obtiene que:
AX = X

La conjugada del producto de 2 matrices es el producto de las conjugadas de las matrices. Por lo tanto,
AX=X

Por otra parte, como AMnxn() entonces: AX = X


t

(18)

Premultiplicando a ambos lados de (17) por X y a ambos lados de (18) por Xt se obtiene que:

Sean AMnxn(K) y 1, 2, , nK. Si 1, 2, , n son los autovalores de A entonces: 269

X AX = X (X) = X X
270

(19)

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

X t A X = X t ( X) = X t X

(20)

Restando a ambos lados en las ecuaciones anteriores: XtAY XtAY = XtY XtY 0 = ( )XtY Como se tiene que XtY = 0, es decir, <X, Y> = 0. Luego, X Y.
Teorema 7.17.

Tomando transpuesta a ambos lados de (19) se obtiene que: (X AX) t = ( X X) t X t A t X = X t X Como A es simtrica entonces: X t A X = X t X Igualando (20) y (21) se obtiene que:
X t X = X t X
t t

(21)

Sea AMnxn(K). Si A es simtrica entonces A es diagonalizable.


Demostracin

Por el teorema 7.13., A es semejante a una matriz triangular T(A) que tiene en la diagonal principal los autovalores de A, es decir: PMnxn() (P no singular): P-1AP = T(A) De forma anloga a como se construy esta matriz P no singular se puede construir una matriz Q ortogonal tal que Q-1AQ = T(A). Como Q es ortogonal entonces Q-1 = Qt de manera que QtAQ = T(A). Supongamos que T(A) es una matriz triangular superior. Denotemos dicha matriz por TS(A). Luego, QtAQ = TS(A) (QtAQ)t = (TS(A))t QtAtQ = (TS(A))t (22)

X t X X t X = 0 ( ) X t X = 0 Como X es autovector entonces Xnx1 y X nx1 . Por consiguiente, ( ) = 0 = Ahora bien, AMnxn() y . Luego, (AIn)Mnxn(). Por lo tanto, las soluciones del SEL homogneo (AIn)X = nx1 sern vectores XMnx1(). En consecuencia, V(A) est definido por vectores reales.
Teorema 7.16.

Como TS(A) es una matriz triangular superior que tiene en la diagonal principal los autovalores de A entonces (TS(A))t es una matriz triangular inferior que tiene en la diagonal principal los autovalores de A. Denotemos dicha matriz por TI(A), es decir, TI(A) = (TS(A))t. Adems A es simtrica, es decir, At = A. Luego, QtAQ = TI(A) (23)

Sean AMnxn(), , K y X, YKn-{nx1}. Si es autovalor de A con autovector asociado X, es autovalor de A con autovector asociado Y con y A es simtrica entonces X Y.
Demostracin

Por (22) y (23) se tiene que TS(A) = TI(A). La nica forma de que esto pueda ocurrir es que TS(A) = TI(A) = D(A). Por lo tanto, QtAQ = D(A) Es decir, A es diagonalizable. Observaciones: 1. Como la matriz Q adems de ser no singular es ortogonal se dice que toda matriz simtrica es diagonalizable ortogonalmente. Adems se cumple que si una matriz A es diagonalizable ortogonalmente entonces A es simtrica. Toda matriz simtrica por ser diagonalizable tiene n autovectores L.I.

Por hiptesis,
t t t t t t t t AX = X Y AX = Y (X) Y AX = Y X (Y AX) = (Y X) t t t t t t AY = Y X AY = X (Y) X AY = X Y X AY = X Y t t t X A Y = X Y t t X AY = X Y

Como A es simtrica se tiene que:


t t X AY = X Y t t X AY = X Y

2.

271

272

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Ejemplo 7.18.

Sea AM3x3() definida por: 7 1 A= 1 7 1 1 1 1 7

1 1 1 = 1 , 1 , = = 1 2 3 0 1 0 1 Aplicamos Gram-Schmidt: 1 1 = 1 = 1 1 2 = 2
1 1 1 1 1 < 2 , 1 > (1.1 + 1.( 1) + 0.1) 1 = 1 0 1 = 1 1 = 1 2 2 2 2 1 + (1) + 1 || 1 || 0 1 0 1 0 < 3 , 1 > < 3 ,2 > 1 2 = || 1 ||2 || 2 ||2

Como A es simtrica entonces es diagonalizable. Encontremos la matriz P que diagonaliza a A. Hallemos primero el espectro de A. Se puede verificar que el autopolinomio de A es: PA () = 3 + 212 144 + 320 Los autovalores de A son 1 = 5 con r1 = 1 y 2 = 8 con r2 = 2, es decir, E(A) = {5, 8}. Se puede verificar que los autoespacios correspondientes son: 1 V5 (A) = {X 3 : X = a 1; a *} 1 1 1 V8 (A) = {X 3 : X = a 1 + b 0; a * b *} 0 1 Como A es simtrica es diagonalizable y tiene 3 autovectores L.I. Por consiguiente, la matriz P que diagonaliza a A es: 1 P = 1 1 1 1 0 1 0 1

3 = 3

1 1 1 (1).1 + 0.(1) + 1.1 (1).1 + 0.1 + 1.0 1 1 0 12 + (1) 2 + 12 (1) 2 + (1) 2 + 0 2 0 1 1

1 1 2 1 2 1 1 1 1 = 0 0 1 1 = 0 + 1 = 1 2 2 2 0 1 1 0 1 1 Luego, 1 = 12 + (1) 2 + 12 = 3

2 =
3 =

(1)2 + (1)2 + 0 2
2 2

= 2
2

Se verifica que P es no singular y cumple que: 5 0 0 P AP = D(A) = 0 8 0 0 0 8


-1

( 1 2 ) + (1 2 ) + (1)

= 6

= 6

Por consiguente, 3 3 1 1 1 1 3 3 1 = 1 = 1 = 3 1 = 3 1 3 1 1 3 3 2 1 1 2 1 1 2 2 2 = 2 = 1 = 2 1 = 2 2 2 0 0 0
274

Ahora bien, si se desea hallar la matriz ortogonal Q que diagonaliza ortogonalmente a A se procede a buscar una base ortonormal con los 3 autovectores L.I. de A. Dichos vectores seguirn siendo L.I. y autovectores de A. Comenzamos con la base de :
3

273

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

3 =

1 3 = 3

1 6 2

1 2 1 = 2 2 6 1

1 2 1 = 6 2 3 1

6 1 6 2 1 = 6 2 6 1 6 3

Rango(A) = Rango(D(A)) Traza(A) = Traza(D(A)) Ahora bien, por el ejemplo 7.8., los valores posibles de los autovalores de una matriz idempotente son 0 1. En ese caso, D(A) tiene tantas filas no nulas como Traza tiene dicha matriz D(A), es decir, Rango(D(A)) = Traza(D(A)). Por con siguiente, Rango(A) = Rango(D(A)) = Traza(D(A)) = Traza(A)
Ejemplo 7.19.

En consecuencia, el conjunto {1 , 2 , 3 } es una base ortonormal de 3. Luego, la matriz Q ortogonal que diagonaliza ortogonalmente a A es: 3 3 Q = 3 3 3 3 2 2 0 6 6 6 6 6 3

2 2

Consideremos la Matriz de Centraje PMnxn(), es decir, 1 P = In (1n )(1n ) t . Veamos que dicha matriz es simtrica e idempotente: n
1 1 1 (1n )(1n ) t )t = (In)t ( (1n )(1n ) t )t = In (1n )(1n ) t = P n n n 1 1 P2 = PP = (In (1n )(1n ) t )(In (1n )(1n ) t ) n n 1 1 1 1 = In (1n )(1n ) t (1n )(1n ) t + ( (1n )(1n ) t )( (1n )(1n ) t ) n n n n 1 1 1 = In (1n )(1n ) t (1n )(1n ) t + 2 (1n )(1n ) t (1n )(1n ) t n n n 1 1 1 = In (1n )(1n ) t (1n )(1n ) t + 2 (1n )n(1n ) t n n n 1 1 n = In (1n )(1n ) t (1n )(1n ) t + 2 (1n )(1n ) t n n n 1 1 1 = In (1n )(1n ) t (1n )(1n ) t + (1n )(1n ) t n n n 1 = In (1n )(1n ) t = P n

Pt = (In

5 0 0 Se puede verificar fcilmente que QtAQ = D(A) = 0 8 0 . 0 0 8 Observaciones: 1. 2. Es sencillo verificar que los vectores 1 y 2, 3 son autovectores de A asociados a los autovalores 1 = 5 y 2 = 8, respectivamente. En el ejemplo anterior se aplic el proceso de ortogonalizacin de Gram-Schmidt sobre los autovectores de A. En particular, esto obedece a que los autovectores asociados al autovalor de multiplicidad 2, es decir, el autovalor 2 = 8 no son ortogonales. Puede ocurrir que aunque siendo autovectores asociados a un mismo autovalor, es decir, autovectores de un mismo autoespacio sean por casualidad ortogonales. En ese caso, la aplicacin de dicho proceso sobre los autovectores de A no es necesaria; slo hara falta hacer vectores unitarios a todos los autovectores. Sin embargo, utilizar Gram-Schmidt sobre los autovectores de A; sin observar previamente si los autovectores asociados a un mismo autovalor son ortogonales o no, es el procedimiento recomendado para hallar la matriz Q ortogonal que diagonaliza ortogonalmente a A, claro est siempre que dicha matriz A sea simtrica.

Como P es idempotente entonces por el ejemplo 7.8., los valores posibles de sus autovalores son 0 y 1. Como adems de idempotente P es simtrica entonces Rango(P) = Traza(P). Como P es simtrica entonces P es diagonalizable. Luego, por el teorema 7.11., las multiplicidades algebraicas de los autovalores 0 y 1 de P son:

Teorema 7.18.

Sea AMnxn(K). Si Rango(A) = Traza(A).


Demostracin

es

simtrica

idempotente

entonces

1 = 0 r1 = n Rango(P 0.In) r1 = n Rango(P) r1 = n Traza(P)


1 (1n )(1n ) t ) n 1 r1 = n Traza(In) + Traza( (1n )(1n ) t ) n 1 r1 = n n + Traza( (1n )(1n ) t ) n

r1 = n Traza(In

Como A es simtrica entonces por el teorema 7.17., A es diagonalizable. Luego, por el teorema 7.9., apartados 2 y 4, se cumple que:

275

276

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

1 Traza( (1n ) t (1n ) ) n 1 r1 = Traza(n) n 1 n r1 = n r1 = 1

r1 =

Teorema 7.20.

Sea AMnxn(). Si A es simtrica y no singular entonces:

PMnxn() (P ortogonal): A-1 = P(D(A))-1Pt


Demostracin

Como A es simtrica entonces A es diagonalizable ortogonalmente, es decir:

Luego, para 2 = 1 r2 = n r1 r2 = n 1. Finalmente, el autopolinomio de P es PP ( ) = ( 1) n 1 .


Teorema 7.19. (Teorema Espectral)

PMnxn() (P ortogonal): PtAP = D(A) PMnxn() (P ortogonal): PPtAPPt = PD(A)Pt PMnxn() (P ortogonal): A = PD(A)Pt
Como A es no singular entonces:

Sean AMnxn(), 1, 2, , n y X1, X2, , Xnn-{nx1}, tales que 1, 2, , n son los n autovalores de A con autovectores ortonormalizados asociados X1, X2, , Xn, respectivamente. Si A es simtrica entonces: A=

X (X )
i i i =1

PMnxn() (P ortogonal): A-1 = (PD(A)Pt)-1 PMnxn() (P ortogonal): A-1 = (Pt)-1(D(A))-1(P)-1 PMnxn() (P ortogonal): A-1 = P(D(A))-1Pt
Teorema 7.21.

i t

Demostracin

Sea XMnxp() tal que Rango(X) = r. Entonces las matrices XtX y XXt tienen los mismos autovalores no nulos.
Demostracin

Como A es simtrica entonces A es diagonalizable ortogonalmente, es decir:

PMnxn() (P ortogonal): P AP = D(A) PMnxn() (P ortogonal): PPtAPPt = PD(A)Pt PMnxn() (P ortogonal): A = PD(A)Pt
t

Ahora bien, la matriz P se puede expresar particionada por columnas 1xn de la siguiente forma: P = [ X1 Luego,
X2 L Xn ]

Las matrices XtX y XXt son matrices simtricas y tales que Rango(XtX) = Rango(XXt) = Rango(X) = r. Por lo tanto, dichas matrices tienen exactamente r autovalores no nulos. Sea un autovalor no nulo de XtX con autovector asociado V. Luego, XtXV = V (24) X(XtXV) = X(V) (XXt)(XV) = (XV) Slo basta probar que el vector XVnx1 para probar que es tambin autovalor de XXt. Utilicemos reduccin al absurdo. Supongamos que XV=nx1. Sustituyendo en (24) se tiene que: Xt(nx1) = V px1 = V Por hiptesis 0. Por lo tanto, V = px1, lo cual es una contradiccin ya que V es autovector de XtX. De esta forma se termina de demostrar que XtX y XXt tienen los mismos autovalores no nulos.
Teorema 7.22.

A = [ X1

X2

1 0 L 0 0 2 L 0 L Xn ] M M M 0 0 L n

(X1 ) t 2 t ( X ) M n t ( X )

A = [ 1 X1 2 X 2

(X1 ) t 2 t (X ) L nXn ] M n t ( X )
i i t

A = 1X1(X1)t + 2X2(X2)t + + nXn(Xn)t A=

X (X )
i i =1

Sean XMnxp() tal que Rango(X) = r, VMpxr() y UMnxr(). Si V y U son las matrices cuyas columnas son los autovectores ortonormalizados de las

277

278

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

matrices XtX y XXt, respectivamente, asociados con los autovalores comunes no nulos entonces: Vi = Ui =
Demostracin

Ui =

i i

XV i ; i = 1, 2, , r i i X t U i ; i = 1, 2, , r

i i i i

X t Ui

De forma anloga se demuestra que V i =

i = 1, 2, , r
XV i

Teorema 7.23. (Reconstruccin de Eckart y Young)

En el teorema 7.21., se dedujo que: Si es un autovalor no nulo de XtX con autovector asociado V, es decir, XtXV = V entonces (XXt)(XV) = (XV). Luego, para un autovalor i se cumple que XV i Vi (XX t ) (25). Por otra parte si es un autovalor no nulo de XXt con autovector asociado U entonces XXtU = U. Luego, U i Vi (XX t ) (26). Por (25) y (26) se tiene que: U i = cXV i ; i = 1, 2, , r (27)

Sean XMnxp() tal que Rango(X) = r, VMpxr() y UMnxr(). Si V y U son las matrices cuyas columnas son los autovectores ortonormalizados de las matrices XtX y XXt, respectivamente, asociados con los autovalores comunes no nulos entonces: X=

i =1

i U i (V i ) t

Demostracin

Por el teorema 7.22.: Ui = U i ( i (V i ) t ) = i U i (V i ) t = i i i XV i ; i = 1, 2, , r XV i ( i (V i ) t ) ; i = 1, 2, , r XV i (V i ) t ; i = 1, 2, , r

Calculando la norma al cuadrado a ambos lados de (27) se obtiene que:


( U i ) t U i = (cXV i ) t (cXV i ) ; i = 1, 2, , r

1 = c(V ) X (cXV ) ; i = 1, 2, , r
i t t i

1 = c 2 (V i ) t X t XV i ; i = 1, 2, , r
Como XtXVi = iVi; i = 1, 2, , r entonces: 1 = c 2 (V i ) t i V i ; i = 1, 2, , r

( i )2 i

i U i (V i ) t =

i XV i (V i ) t ; i = 1, 2, , r i
p

1 = c i (V ) V ; i = 1, 2, , r
2 i t i

i U i (V i ) t = XV i (V i ) t ; i = 1, 2, , r

1 = c 2 i .1 ; i = 1, 2, , r 1 = c 2 i ; i = 1, 2, , r c2 =
c= c= 1 ; i = 1, 2, , r i 1 ; i = 1, 2, , r i 1 i i i ; i = 1, 2, , r

i =1

i U i (V i ) t =
p i i t

XV (V )
i i =1 p i =1

i t

V (V ) =
i =1

i U i (V i ) t

Ahora bien, como V es ortogonal entonces:

V (V )
i i =1

i t

= VV t = I p

Adems, r+1 = r+2 = = p = 0. Luego, ; i = 1, 2, , r XI p =

c=

i =1

i U i (V i ) t

X=

i =1

i U i (V i ) t

Sustituyendo el valor de c en (27) se obtiene que:


279

280

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

EJERCICIOS PROPUESTOS. 1.

8.

Determine los autovalores y los correspondientes autoespacios de las siguientes matrices:


9.

Sea AMnxn() una matriz involutiva. Demuestre que (I+A)Y e (IA)Y son autovectores de A asociados respectivamente a los autovalores 1 = 1 y 2 = 1, siendo Y un vector arbitrario de n. Sea AMmxn(). Se dice que A es una matriz estocstica, aleatoria o de probabilidad si y slo si (i,j)JmxJn 0 Aij 1 y i=1, 2, , m se cumple que

3 0 0 A = 0 1 1 2 0 1 3 D= 2 2
2.

3 0 1 B = 0 1 1 1 0 1 2 2 3 1 0 1 2 1 5 2 1 E= 1 2 5 1 2 1 1 6

7 C = 1 1 1 1 F= 0 2 0 2 0 0

1 7 1

2 0 6 0 1 2 0 1 1 1 1

A
j=1

ij

= 1 . Demuestre que si m = n y A es una matriz

estocstica entonces A tiene un autovalor igual a 1. Encuentre el autovector correspondiente.


10.

2 3 2

Sea AMnxn(). Demuestre que:


10.1. 10.2.

Determine los valores posibles que pueden tomar los autovalores de una matriz involutiva. Determine los valores posibles que pueden tomar los autovalores de una matriz ortogonal. Sean AMnxn() una matriz simtrica, , ; con autovalores de A y X, Y, Zn. Demuestre que si X e Y son autovectores de A asociados a y Z es un autovector de A asociado a entonces:
4.1. 4.2.

A es no singular si y slo si tiene todos sus autovalores no nulos. A es singular si y slo si tiene por lo menos un autovalor nulo.

11.

3.

Sea AMnxn(). Demuestre que si A es no singular entonces los autovalores de A-1 son los inversos de los autovalores de A y tienen asociados los mismos autovectores. Sea la matriz AMnxn() definida de la siguiente manera: A= ab (u v)(u v) t c2 con a, b, c *, u, v n y u v.

4.

12.

(cX + dY) es autovector de A asociado a , con c,d y no nulos simultneamente. (cX + dY) y Z son ortogonales.

Demuestre que si la matriz DMnxn() es no singular, entonces el vector Z = D-1(u-v) es autovector de la matriz D-1A. Determine adems el autovalor de D-1A al cual est asociado Z.
13.

5.

Sean AM2x2() una matriz simtrica, , ; con autovalores de A y X, Y2. Demuestre que si X es autovector de A asociado a e Y es autovector de A asociado a con XtX = 1 y YtY = 1 entonces la matriz P = [X Y] es ortogonal y adems se cumple que: 0 P t AP = 0

Sean AMmxn(), BMnxm(), tales que rango(A) = m, AB es simtrica y ABA=A. Demuestre que si es un autovalor de la matriz D = cAB entonces = c, con c*. Sea AMnxn(). Demuestre que si (Xn)(X), XtAX>0 entonces la matriz A tiene todos sus autovalores positivos. En el conjunto Mnxn() se define la relacin R por ( A, B Mnxn()) A R B si y slo si A es semejante a B. Demuestre que R es una relacin de equivalencia en Mnxn(). Sean A, BMnxn(). Demuestre que si A y B son semejantes entonces:
16.1. 16.2. 16.3.

14.

6.

Sean A, B, CMnxn() tales que B = CtC y rango(C) = n. Sea adems Un autovector de B-1A asociado al autovalor . Demuestre que:
6.1. 6.2.

15.

Las matrices B-1A y (Ct)-1AC-1 tienen los mismos autovalores. Los autovectores V de la matriz (Ct)-1AC-1 tienen la forma V = CU.

16.

7.

Sean AMnxp() y BMpxn(). Demuestre que:


7.1. 7.2.

AB y BA tienen los mismos autovalores no nulos y adems se cumple que nPBA() = pPAB(). Si n = p y B es no singular entonces los autovalores de AB son los mismos autovalores de BA. 281

At y Bt son semejantes. Am y Bm son semejantes, con m*. Si A y B son no singulares entonces A-1 y B-1 son semejantes.

282

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

17.

Sean A, B, CM3x3() definidas por:


2 0 1 A = 0 6 0 1 3 2 1 0 B = 0 3 0 0 1 6 3 1 0 C = 0 3 0 0 1 2 6

20.

Sea AM3x3() definida por: 0 1 A = a 2 1 1


20.1. 20.2.

0 3 2

Determine si A y B son semejantes y si A y C son semejantes y en cada caso de ser afirmativo encuentre la respectiva matriz P que define la semejanza entre esas matrices.
18.

Determine los autovalores de A. Qu condicin debe verificar el valor de a para que la matriz A sea diagonalizable?

Para las siguientes T.L. determine las matrices [T ]B1 y [T ]B2 as 1 2


B B

21.

como tambin la matriz de transicin de B1 a B2 [ ] semejanza entre [T ]


B1 B1

B2 B1

que define la
22.

Determine si cada una de las matrices dadas en el ejercicio 1 son diagonalizables. En caso afirmativo, encuentre la matriz diagonal y la matriz que la diagonaliza. Sea AM2x2() definida por:
a b A= c d

y [T ] :
B2 B2

18.1.

T:

22

definida

2 3 B1 = { 1 = , 2 = 3 0
18.2.

x 3x + 4 y T( ) = , y x 5y 1 0 } y B2 = { 1 = , 2 = }. 1 2

por

Demuestre que si (ad)2+4bc > 0 entonces A es diagonalizable. Determine que ocurre si (ad)2+4bc < 0 y si (ad)2+4bc = 0.
23.

T:

33

definida

por

x x + y + z T( y ) = x 2 y + 3z , z 2x y z

Sea AM2x2() definida por:


b 4a A= a b

1 2 1 1 B1 = { 1 = 0 , 2 = 1 , 3 = 3 } y B2 = { 1 = 0 , 1 1 0 0 0 1 2 = 1 , 3 = 1 }. 1 0 T: P1P1 definida

Demuestre que si la ecuacin ax2 + bx + a = 0 tiene races imaginarias entonces A es diagonalizable. Determine que ocurre si dicha ecuacin tiene races reales iguales y si tiene races reales distintas.
24.

Sean XMnxp() y AMnxn() con rango(X) = p, tales que A = In X(XtX)-1Xt. Estudie para esta matriz:
24.1. 24.2. 24.3. 24.4. 24.5. 24.6.

18.3.

por

T(a + bx ) = (a + b) + (a b) x ,

B1 = { 1 = 1 , 2 = x }, B2 = { 1 = 2 + 3x , 2 = 4 + 5x }.
19.

Sea AM3x3() definida por:


a b b A = b a b b b a
19.1. 19.2.

Simetra. Idempotencia. Rango. Autovalores. Traza. Autopolinomio.

25.

Sea AMnxn() una matriz simtrica de rango r con autovalores


1, 2, , n. Demuestre que

Demuestre que (a-b) y (a+2b) son autovalores de A. Determine el tercer autovalor.

= (A )
2 i ij i =1 i =1 i =1

26.

Sean A, B Mnxn() tales que A y B son simtricas e idempotentes con AB = nxn y rango(A) + rango(B) = p, 0 < p < n. Determine la multiplicidad algebraica de cada uno de los autovalores de la matriz C = In (A + B). 284

283

CAPTULO 7: AUTOVALORES Y AUTOVECTORES

27.

Sea AMnxn(). Demuestre que si A es simtrica e idempotente entonces Traza(AAt) = n , siendo la media aritmtica de los autovalores de A.

28.

Sea AMnxn() una matriz simtrica con autovalores 1, 2, , n tales que i j para i j, i = 1, 2, , n; j = 1, 2, , n. Sean X1, X2, , Xnn los autovectores de A normalizados asociados a los autovalores 1, 2, , n, respectivamente. Demuestre que la matriz B = A 1X1(X1)t tiene como autovalores 0, 2, 3, , n y autovectores asociados X1, X2, , Xn, respectivamente. Sea AM2x2() definida por:
1 a A= 2 b
29.1.
2 Determine los valores de a y b para que el vector sea 1 autovector de A asociado al autovalor = 5. Determine el otro autovalor de A.

29.

29.2. 30.

Sea AM3x3() definida por:


a 1 0 A = 1 a 0 0 0 1

Determine los valores de a para los cuales la matriz A tiene autovalores con multiplicidades algebraicas mayores que 1.
31.

Sean X1, X2, X33 definidos por:


1 1 1 X1 = 1 , X 2 = 1 , X 3 = 1 1 0 0

Si X1, X2, X3 son autovectores de una matriz AM3x3() asociados con los autovalores 1, 1 y 0, respectivamente determine la matriz A.
32.

Sean X4 y AM4x4() definida por:


0 0 A= 1 0 0 0 0 1 1 0 0 0 0 1 0 0

Demuestre que (I4 +A)X e (I4 A)X son autovectores L.I. de A.


33.

Sean Xn{nx1} y AMnxn() definida por A = XXt. Demuestre que = 0 es autovalor de A con multiplicidad algebraica r = n 1 y determine tambin el nico autovalor no nulo de A.

285

CAPTULO 8: FORMAS CUADRTICAS

Captulo

FORMAS CUADRTICAS

1 B = 0 0

2 2 0

0 2 1

es una matriz asociada a la forma cuadrtica f. Pero f tambin puede escribirse de la siguiente forma:
8.1. INTRODUCCIN. En este captulo se presenta un concepto fundamental para la teora de la probabilidad, especficamente para el estudio de la distribucin normal multivariante, como lo es el concepto de Forma Cuadrtica. Se exponen sus principales temas asociados como lo son las Representaciones Normal y Cannica, la Clasificacin y la Derivada de Formas Cuadrticas. 8.2. DEFINICIONES, PROPIEDADES Y EJEMPLOS. Definicin 8.1. Sean BMnxn() y f: n. Se dice que f es una forma cuadrtica con matriz asociada B si y slo si: f(X) = XtBX Observacin: Desarrollando se obtiene que:
2 2 f (X1 , X 2 , X 3 ) = X1 + 2X 2 2 + X 3 X1X 2 X 2 X1 + 2X 2 X 3

En ese caso, B11 = 1, B12 = -1, B13 = 0, B21 = -1, B22 = 2, B23 = 2, B31 = 0, B32 = 0 y B33 = 1 y la matriz:

1 B = 1 0

1 2 0

0 2 1

es tambin una matriz asociada a la forma cuadrtica f. Observacin: El ejemplo anterior evidenci que una forma cuadrtica puede tener ms de una matriz asociada. Para identificar a una forma cuadrtica con una nica matriz, se obtiene una matriz B asociada a la funcin y luego se calcula la siguiente matriz:
A= 1 (B + B t ) 2

f(X) = f(X1, X2, , Xn) = [X1

X2

B11 B12 L B1n X1 B B22 L B2 n X 2 L X n ] 21 M M M M Bn1 Bn 2 L Bnn X n


i j

B X X
ij i =1 j=1

La matriz A es simtrica y de hecho es la nica matriz simtrica asociada a la forma cuadrtica f. Con dicha matriz es que se identifica de forma nica una forma cuadrtica.
Ejemplo 8.2.

Ejemplo 8.1.

La nica matriz simtrica asociada a la forma cuadrtica del ejemplo 8.1., es: 1 1 ( 0 2 0 2 2 0 0 1 2 + 2 1 0 0 2 2 0 1 0 ) = 1 1 0 1 2 1 0 1 1

Sea f: 3 definida por:


2 2 f (X1 , X 2 , X 3 ) = X1 + 2X 2 2 + X 3 2X1X 2 + 2X 2 X 3

A=

Esta funcin es una forma cuadrtica, ya que su regla de correspondencia es de la forma

Definicin 8.2.

B X X
ij i i =1 j=1

. Luego, B11 = 1, B12 = -2, B13 = 0, B21 = 0, B22 = 2,

Sean A, BMnxn(). Se dice que A es congruente con B si y slo si: PMnxn() (P no singular): PtAP = B

B23 = 2, B31 = 0, B32 = 0 y B33 = 1 y la matriz:

287

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

Si adems A y B son las matrices simtricas asociadas a las formas cuadrticas f: n y g: n, respectivamente, entonces se dice que las formas cuadrticas f y g son congruentes. Si adems P es ortogonal entonces se dice que tanto A y B como f y g son ortogonalmente congruentes. Observaciones: Si A es congruente con B entonces: 1. 2. Rango(B) = Rango(P AP) = Rango(A). Como P es no singular entonces P se puede escribir como un producto de matrices elementales, en este caso como P aparece postmultiplicando a A dichas matrices elementales son obtenidas con operaciones elementales de columnas, es decir, P = FsFs-1F1. Luego, Pt = (FsFs-1F1)t = (F1)t(F2)t(Fs)t = E1E2Es. Luego, E1E2EsAFsFs-1F1 = B 3. Las matrices elementales E1, E2, , Es se pueden elegir de forma tal que E1E2EsA sea una matriz triangular, digamos triangular superior. Luego, E1E2EsA = T; siendo Pt = E1E2Es Tomando transpuesta a ambos lados se obtiene que: (E1E2EsA)t = Tt At(E1E2Es)t = Tt AtFsFs-1F1 = Tt Si A es simtrica entonces se tiene que: AFsFs-1F1 = Tt E1E2EsAFsFs-1F1 = E1E2EsTt Es decir, A es congruente con la matriz E1E2EsTt. Pero T es triangular superior, en consecuencia, Tt es triangular inferior y como E1E2Es logran una matriz triangular superior entonces la matriz E1E2EsTt es una matriz diagonal. Por lo tanto, si A es simtrica entonces A es congruente con una matriz diagonal, no necesariamente igual a la matriz de autovalores de A.
Ejemplo 8.3.
t

Apliquemos operaciones elementales de fila sobre A para obtener una matriz triangular superior equivalente por filas a A. Dichas operaciones sern aplicadas simultneamente sobre la matriz I3 para obtener a la vez la matriz Pt: 1 [A| I3] = 1 0 1 1 0 1 0 1
Por lo tanto, 1 T = PtA = 0 0 1 1 0 0 1 0 0 0 )t = 1 1 0 0 1 1 1 1 0 1

1 2 1

0 1 1

1 0 0 0 1 0 0 0 1

2 r2 + r1 r

0 1 0 0 1 1 1 0 1 0 0 1

3 r3 r2 r

1 1 0 1 0 0

0 1

1 1

0 1

0 1 1

0 0 = [T | Pt] 1

0 1 P = (Pt)t = ( 1 1 1 1 Luego,

1 D = PtAP = 0 0

1 1 0

0 1 0

1 0 0

1 1 1 1 1 = 0 0 1 0

0 1 0

0 0 0

Por consiguiente, A es congruente con la matriz diagonal D.


Teorema 8.1.

Sean AMnxn(). A es simtrica si y slo si A es ortogonalmente congruente con su matriz de autovalores D(A).
Demostracin

CN (): Si A es simtrica entonces A es ortogonalmente congruente con su matriz de autovalores D(A). Si A es simtrica entonces por el teorema 7.17. A es diagonalizable ortogonalmente, es decir: PMnxn() (P ortogonal): PtAP = D(A) Luego, A es congruente con D(A).

Consideremos la forma cuadrtica del ejemplo 8.1. La matriz simtrica asociada es: 1 A = 1 0 1 2 1 0 1 1

288

289

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

CS (): Si A es ortogonalmente congruente con su matriz de autovalores D(A) entonces A es simtrica. Si A es ortogonalmente congruente con su matriz de autovalores D(A) entonces: PMnxn() (P ortogonal): PtAP = D(A) PMnxn() (P ortogonal): PPtAPPt = PD(A)Pt PMnxn() (P ortogonal): A = PD(A)Pt PMnxn() (P ortogonal): At = (PD(A)Pt)t PMnxn() (P ortogonal): At = (Pt)t(D(A))tPt PMnxn() (P ortogonal): At = P(D(A))tPt Como D(A) es una matriz diagonal entonces es simtrica, luego: PMnxn() (P ortogonal): At = PD(A)Pt Por lo tanto, A = A , es decir, A es simtrica.
Definicin 8.3.
t

nS2 =

(X
i =1

X) 2

Veamos que nS2 es una forma cuadrtica. Se puede demostrar que:

(X
i =1

X) 2 =

X
i =1

2 i

nX

Luego,

X
i =1

2 i

nX =

X
i =1

2 i

n XX =

X
i =1

2 i

n
n

X X
i i =1 i =1

n
n i i

n = XtX 1 t X (1n )(1n ) t X n

1 = X i2 n i =1

X X
i =1 i =1

1 = X (I n (1n )(1n ) t )X n
X1 X = X PX; con X = 2 M X n
t

Sea AMnxn() una matriz simtrica. Se define como ndice de A y se denota por Indice(A) al nmero de autovalores positivos de A.
Ejemplo 8.4.

Consideremos la forma cuadrtica del ejemplo 8.1. La matriz simtrica asociada es: 1 A = 1 0 1 2 1 0 1 1

Por lo tanto, nS2 es una forma cuadrtica con matriz simtrica asociada la matriz de centraje. Por el ejemplo 7.19., dicha matriz tiene como autovalores 1 = 0 con r1 = 1 y 2 = 1 con r2 = n 1. En consecuencia, Indice(P) = n 1.
Teorema 8.2.

Hallemos sus autovalores. Se puede demostrar que su autopolinomio es:


PA ( ) = 3 + 42 3

Sea AMnxn() una matriz simtrica. Si Rango(A) = r e Indice(A) = p entonces A es congruente con la matriz diagonal D(A) definida por: Ip D(A) = ( r p ) xp ( n r ) xp
Demostracin

Los autovalores de A son 1 = 1, 2 = 3 y 3 = 0. Por lo tanto, Indice(A) = 2.


Ejemplo 8.5.

px ( r p ) I r p ( n r ) x ( r p)

px ( n r ) ( r p) x ( n r ) ( n r ) x ( n r )

Consideremos la Varianza de un grupo de n datos cuantitativos X1, X2, , Xn:

S =

(X
i =1

Como A es simtrica entonces por el teorema 8.1., A es ortogonalmente congruente con su matriz de autovalores o forma cannica de Jordan de A, es decir, PMnxn() (P ortogonal): PtAP = D(A) (1)

X) 2

290

291

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

Supongamos, sin prdida de generalidad, que en la matriz D(A) los primeros p autovalores son los positivos de A, los siguientes r p autovalores son los negativos de A y los ltimos n r autovalores son los nulos de A. Sea CMnxn() la matriz definida por: Cij = 1 i c 0 si i = j; i = 1, 2, ..., r si i = j; i = r + 1, ..., n ; c si i j
*

i + i = i i 0 0

si i = j; i = 1, 2, ..., p si i = j; i = p + 1, ..., r si i = j; i = r + 1, ..., n si i j

1 1 = 0 0

si i = j; i = 1, 2, ..., p si i = j; i = p + 1, ..., r si i = j; i = r + 1, ..., n si i j

Es claro que C es una matriz diagonal y no singular. Premultiplicando y postmultiplicando a ambos lados de (1) por Ct y C, respectivamente se tiene que: CtPtAPC = CtD(A)C (PC)tA(PC) = CtD(A)C Como P y C son no singulares entonces la matriz QMnxn(); Q = PC es tambin no singular. Luego, QMnxn() (Q no singular): QtAQ = CtD(A)C Por lo tanto, A es congruente con la matriz CtD(A)C, cuyo elemento genrico es:
2 1 i i 2 t (C D (A)C)ij = 1 i i 2 c .0 0

Es decir, CtD(A)C = D(A). Se concluye que A es congruente con la matriz D(A).


Ejemplo 8.6.

Consideremos la forma cuadrtica del ejemplo 8.1. La matriz simtrica asociada es: 1 A = 1 0 1 2 1 0 1 1

Sus autovalores son 1 = 1, 2 = 3 y 3 = 0. La matriz D(A) es: 1 0 0 D ( A ) = 0 3 0 0 0 0 Se puede verificar que los autoespacios asociados a dichos autovalores son:

si i = j; i = 1, 2, ..., p

si i = j; i = p + 1, ..., r si i = j; i = r + 1, ..., n si i j

i i = i i 0 0

si i = j; i = 1, 2, ..., p si i = j; i = p + 1, ..., r si i = j; i = r + 1, ..., n si i j

2 2 V1 (A) = X 3 : X = a 0 ; a * 2 2

6 6 3 * 6 ; b V3 (A) = X : X = b 3 6 6

292

293

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

3 3 3 * 3 ; c V0 (A) = X : X = c 3 3 3 La matriz P ortogonal que hace a A ortogonalmente congruente con D(A) es: 2 2 P= 0 2 2 6 6 6 3 3 3 3 3 3

8.3. REPRESENTACIONES NORMAL Y CANNICA DE UNA FORMA CUADRTICA. Teorema 8.3. (Representacin Normal de una Forma Cuadrtica)

Sean AMnxn() una matriz simtrica de rango r y f: n una forma cuadrtica con matriz simtrica asociada A. Si i*, i = 1, 2, , r, tal que i es autovalor no nulo de A entonces existe una forma cuadrtica Nf: n definida por Nf(Y1, Y2, , Yn) =

Y
i i =1

2 i

ortogonalmente congruente con f y

6 3 6

tal que f = Nf (la forma cuadrtica Nf se dice que es la representacin normal de la forma cuadrtica f).
Demostracin

Se sabe que Indice(A) = 2 y Rango(A) = 2. Luego, la matriz C es:


1 C = 0 0 La matriz Q es: 0 1 0 0 0 ; c* c

Como A es simtrica, por el teorema 8.1., es ortogonalmente congruente con su matriz de autovalores D(A), es decir: PMnxn() (P ortogonal): PtAP = D(A) En consecuencia, la forma cuadrtica f es ortogonalmente congruente con la forma cuadrtica Nf cuya matriz simtrica asociada es D(A), es decir, Nf(Y) = YtD(A)Y. Desarrollando se obtiene que: Nf(Y1, Y2, , Yn) =

2 2 Q= 0 2 2

6 6 6

6 3 6

3 3 3 3 3 3

Y
i i =1

2 i

1 0 0

0 1 0

0 0 c

Por otro lado, si X = PY entonces: f(X) = XtAX = (PY)tA(PY) = YtPtAPY = YtD(A)Y = Nf(Y)
Ejemplo 8.7.

2 2 = 0 2 2

2 2 2

6 3

3 3c 3 3c 3 3c

La representacin normal de la forma cuadrtica f del ejemplo 8.1., es: Nf (Y1 , Y2 , Y3 ) = Y12 + 3Y22
Teorema 8.4. (Representacin Cannica de una Forma Cuadrtica)

La matriz D(A) es: 1 0 0 D(A) = 0 1 0 0 0 0 A es congruente con D(A) y se verifica que QtAQ = D(A).

Sean AMnxn() una matriz simtrica y f: n una forma cuadrtica con matriz simtrica asociada A. Si Indice(A) = p y Rango(A) = r entonces existe una forma cuadrtica Cf: n definida por Cf(Y1, Y2, , Yn) =

Y
i =1

2 i

i = p +1

2 i

congruente con f y tal que f = Cf

(la forma cuadrtica Cf se dice que es la representacin cannica de la forma cuadrtica f).

294

295

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

Demostracin

Como A es simtrica, Indice(A) = p y Rango(A) = r por el teorema 8.2., es congruente con la matriz D(A), es decir: PMnxn() (P no singular): PtAP = D(A) En consecuencia, la forma cuadrtica f es congruente con la forma cuadrtica Cf cuya matriz simtrica asociada es D(A), es decir, Cf(Y) = YtD(A)Y. Desarrollando se obtiene que: Cf(Y1, Y2, , Yn) = Por otro lado, si X = PY entonces: f(X) = XtAX = (PY)tA(PY) = YtPtAPY = YtD(A)Y = Cf(Y)
Ejemplo 8.8.

Luego, A es congruente con D(B) y en consecuencia la forma cuadrtica f es congruente con la forma cuadrtica Cg. Anlogamente se demuestra que la forma cuadrtica g es congruente con la forma cuadrtica Cf. Por lo tanto, la representacin cannica de f es Cg y la representacin cannica de g es Cf. En consecuencia, Cf = Cg. CS(): Si f y g tienen la misma representacin cannica entonces f es congruente con g. Si f y g tienen la misma representacin cannica entonces A y B son congruentes con una comn matriz D, es decir: P, QMnxn() (P, Q no singulares): PtAP = D y QtBQ = D P, QMnxn() (P, Q no singulares): PtAP = QtBQ P, QMnxn() (P, Q no singulares): (Qt)-1PtAPQ-1 = B P, QMnxn() (P, Q no singulares): (Q-1)tPtAPQ-1 = B P, QMnxn() (P, Q no singulares): (PQ-1)tA(PQ-1) = B RMnxn() (R no singular) (R = PQ-1): RtAR = B Luego, A es congruente con B y por lo tanto f es congruente con g.
8.4. CLASIFICACIN DE LAS FORMAS CUADRTICAS. Definicin 8.4.

Y
i =1

2 i

i = p +1

2 i

La representacin cannica de la forma cuadrtica f del ejemplo 8.1., es: Cf (Y1 , Y2 , Y3 ) =


Teorema 8.5.

Y12

+ Y22

Sean AMnxn() una matriz simtrica y f: n una forma cuadrtica con matriz simtrica asociada A. Se dice que f es: 1. 2. 3. 4. 5. Definida Positiva si y slo si Xn (X nx1): f(X) > 0. Semidefinida Positiva si y slo si Xn: f(X) 0 y Xn(X nx1): f(X) = 0. Definida Negativa si y slo si Xn (X nx1): f(X) < 0. Semidefinida Negativa si y slo si Xn: f(X) 0 y Xn(X nx1): f(X) = 0. Indefinida si y slo si X1, X2n (X1 nx1, X2 nx1): f(X1) > 0 y f(X2) < 0.

Sean A, BMnxn() matrices simtricas y f, g: n formas cuadrticas con matrices simtricas asociadas A y B, respectivamente. La forma cuadrtica f es congruente con g si y slo si f y g tienen la misma representacin cannica.
Demostracin

CN(): Si f es congruente con g entonces f y g tienen la misma representacin cannica. Si f es congruente con g entonces A es congruente con B. Luego: PMnxn() (P no singular): PtAP = B (2)

Igualmente se dice que la matriz simtrica A adopta la clasificacin de su forma cuadrtica f.


Ejemplo 8.9.

Como B es simtrica entonces por el teorema 8.2., es congruente con la matriz D(B), es decir: QMnxn() (Q no singular): QtBQ = D(B) QMnxn() (Q no singular): B = (Qt)-1D(B)Q-1 (3) Sustituyendo (3) en (2) se tiene que: P, QMnxn() (P, Q no singulares): PtAP = (Qt)-1D(B)Q-1 P, QMnxn() (P, Q no singulares): QtPtAPQ = D(B) P, QMnxn() (P, Q no singulares): (PQ)tA(PQ) = D(B) RMnxn() (R no singular) (R = PQ): RtAR = D(B) 296

Sean f1, f2, f3, f4, f5: 3 definidas por:


2 2 f1 (X1 , X 2 , X 3 ) = 2X1 + 2X1X 2 + 2X 2 2 2X 2 X 3 + 2X 3 2X1X 3 2 2 f 2 (X1 , X 2 , X 3 ) = X1 + 4X1X 2 + 4X 2 2 + 3X 3 2 2 f 3 (X1 , X 2 , X 3 ) = 2X1 2X1X 2 2X 2 2 + 2X 2 X 3 2X 3 + 2X1X 3 2 2 f 4 (X1 , X 2 , X 3 ) = X1 4X1X 2 4X 2 2 3X 3 2 2 f 5 (X1 , X 2 , X 3 ) = X1 + X2 2 X3

297

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

1.

f1 es definida positiva ya que:


2 2 f1 (X1 , X 2 , X 3 ) = 2X1 + 2X1X 2 + 2X 2 2 2X 2 X 3 + 2X 3 2X1X 3 2 2 2 2 2 = X1 + X1 + 2X1X 2 + X 2 2 + X 2 2X 2 X 3 + X 3 + X 3 2X1X 3

Como X3: f2(X) 0 y X3(X 3x1): f2(X) = 0 entonces X3: f2(X) 0 y X3(X 3x1): f2(X) = 0, es decir, X3: f4(X) 0 y X3(X 3x1): f4(X) = 0. 5. f5 es indefinida ya que: Para X1 = 1, X2 = 1 y X3 = 1, f 5 (X1 , X 2 , X 3 ) = 1 > 0 y para X1 = 0, X2 = 0 y X3 = 1, f 5 (X1 , X 2 , X 3 ) = 1 < 0. As, X1, X23 (X1 3x1, X2 3x1): f5(X1) > 0 y f5(X2) < 0.
Teorema 8.6.

2 (X1

2 2 2 2 + 2X1X 2 + X 2 2 ) + ( X 2 2X 2 X 3 + X 3 ) + ( X1 2X1X 3 + X 3 )

= (X1 + X 2 ) 2 + (X 2 X 3 ) 2 + (X1 X 3 ) 2 A su vez, f1(X1, X2, X3) = 0 si y slo si X1+X2= X2X3 = X1X3 = 0, es decir, si y slo si: X1 = X2, X2 = X3 y X1 = X3 X1 = X3 y X1 = X3 X3 = X3 2X3 = 0 X3 = 0 X1 = 0 X2 = 0 Luego, f1(X1, X2, X3) = 0 si y slo si X1 = X2 = X3 = 0. Por lo tanto, X3 (X 3x1): f1(X) > 0. 2. f2 es semidefinida positiva ya que: f 2 (X1 , X 2 , X 3 ) =
2 X1

Sean AMnxn() una matriz simtrica y f: n una forma cuadrtica con matriz simtrica asociada A. f es: 1. 2. 3. 4. Definida Positiva si y slo si A tiene todos sus autovalores positivos, es decir, Indice(A) = Rango(A) = n. Semidefinida Positiva si y slo si A tiene al menos un autovalor nulo, al menos un autovalor positivo y ningn autovalor negativo, es decir, Indice(A) = Rango(A) < n. Definida Negativa si y slo si A tiene todos sus autovalores negativos, es decir, Indice (A) = 0 y Rango(A) = n. Semidefinida Negativa si y slo si A tiene al menos un autovalor nulo, al menos un autovalor negativo y ningn autovalor positivo, es decir, Indice(A) = 0 y Rango(A) < n. Indefinida si y slo si A tiene al menos un autovalor positivo y al menos un autovalor negativo, es decir, 0 < Indice(A) < Rango(A) n.

+ 4X1X 2 + 4X 2 2

2 + 3X 3

2 = (X1 + 2X 2 ) 2 + 3X 3 > 0.

5.

A su vez, f3(X1, X2, X3) = 0 si y slo si X1 + 2X2 = 0 y X3 = 0, es decir, X1 = 2X2 y X3 = 0. Luego, existen X1 = 2, X2 = 1 y X3 = 0 para los cuales f2(X1, X2, X3) = 0. En consecuencia, X3: f2(X) 0 y X3(X 3x1): f2(X) = 0. 3. f3 es definida negativa ya que:
2 2 f 3 (X1 , X 2 , X 3 ) = 2X1 2X1X 2 2X 2 2 + 2X 2 X 3 2X 3 + 2X1X 3 2 2 = (2X1 + 2X1X 2 + 2X 2 2 2X 2 X 3 + 2X 3 2X1X 3 )

Demostracin

1.

CN(): Si A es definida positiva entonces A tiene todos sus autovalores positivos, es decir, Indice(A) = Rango(A) = n. Sea autovalor de A con autovector asociado X. Luego, AX = X XtAX = Xt(X) XtAX = XtX Ahora bien, X es autovector de A, es decir, X nx1. Por lo tanto, XtX =

= f1 (X1 , X 2 , X 3 )

Como X3 (X 3x1): f1(X) > 0 entonces X3 (X 3x1): f1(X) < 0, es decir, X3 (X 3x1): f3(X) < 0. 4. f4 es semidefinida negativa ya que:
2 2 f 4 (X1 , X 2 , X 3 ) = X1 4X1X 2 4X 2 2 3X 3 2 2 = (X1 + 4X1X 2 + 4X 2 2 + 3X 3 )

X
i =1

2 i

> 0. = X t AX XtX

Por hiptesis, A es definida positiva, es decir, Xn (X nx1): f(X) = XtAX > 0. En consecuencia. >0 299

= f 2 (X1 , X 2 , X 3 )

298

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

Luego, A tiene todos sus autovalores positivos, es decir, Indice(A) = Rango(A) = n. CS(): Si A tiene todos sus autovalores positivos, es decir, Indice(A) = Rango(A) = n, entonces A es definida positiva. Consideremos la representacin normal de la forma cuadrtica f, es decir, Nf(Y1, Y2, , Yn) =

Luego, A tiene A tiene al menos un autovalor nulo, al menos un autovalor positivo y ningn autovalor negativo, es decir, Indice(A) = Rango(A) < n. CS(): Si A tiene al menos un autovalor nulo, al menos un autovalor positivo y ningn autovalor negativo, es decir, Indice(A) = Rango(A) < n, entonces A es semidefinida positiva. Consideremos la representacin normal de la forma cuadrtica f, es decir, Nf(Y1, Y2, , Yn) =

Y
i i =1

2 i

: siendo r = Rango(A)

Como A tiene todos sus autovalores positivos, es decir, Indice(A) = Rango(A) = n, entonces: Nf(Y1, Y2, , Yn) = Nf(Y1, Y2, , Yn) =

Y
i i =1

2 i

; siendo r = Rango(A)

Y
i i =1

2 i

>0y

Y
i i =1

2 i

= 0 si y slo si Y1 =Y2 = = Yn = 0.

Por lo tanto, Yn (Y nx1): Nf(Y) > 0. Adems, por el teorema 8.3., Nf(Y) = f(X) para X = PY, es decir, Y = P-1X. Luego, P-1X n (P-1X nx1): f(X) > 0 y en virtud de que P es no singular entonces X n (X nx1): f(X) > 0, es decir, A es definida positiva. 2. CN(): Si A es semidefinida positiva entonces A tiene al menos un autovalor nulo, al menos un autovalor positivo y ningn autovalor negativo, es decir, Indice(A) = Rango(A) < n. Sea autovalor de A con autovector asociado X. Luego, AX = X XtAX = Xt(X) XtAX = XtX Ahora bien, X es autovector de A, es decir, X nx1. Por lo tanto, XX =
t

Como Indice(A) = Rango(A), es decir, los r primeros autovalores de A son positivos entonces Nf(Y1, Y2, , Yn) 0, Y1, Y2, , Yr, mientras que Nf(Y1, Y2, , Yn) = 0 si y slo si Yi = 0, i = 1, 2, , r y Yi 0, para algn i = r+1, r+2, , n. Por lo tanto, Yn: Nf(Y) 0 y Yn(Y nx1): Nf(Y) = 0. Adems, por el teorema 8.3., Nf(Y) = f(X) para X = PY, es decir, Y = P-1X. Luego, P-1Xn: f(X) 0 y P-1Xn(P-1X nx1): f(X) = 0 y en virtud de que P es no singular entonces Xn: f(X) 0 y Xn(X nx1): f(X) = 0, es decir, A es semidefinida positiva. 3. CN(): Si A es definida negativa entonces A tiene todos sus autovalores negativos, es decir, Indice(A) = 0 y Rango(A) = n. Sea autovalor de A con autovector asociado X. Luego, AX = X XtAX = Xt(X) XtAX = XtX Ahora bien, X es autovector de A, es decir, X nx1. Por lo tanto, XtX =

X
i =1

2 i

> 0.

i =1

X i2

> 0. = X t AX XtX

X t AX XtX

Por hiptesis, A es definida negativa, es decir, Xn (X nx1): f(X) = XtAX < 0. En consecuencia. <0 Luego, A tiene todos sus autovalores negativos, es decir, Indice(A) = 0 y Rango(A) = n. CS(): Si A tiene todos sus autovalores negativos, es decir, Indice(A) = 0 y Rango(A) = n, entonces A es definida negativa. 301

Por hiptesis, A es semidefinida positiva, es decir, Xn: f(X) = XtAX 0 y Xn(X nx1): f(X) = XtAX = 0. En consecuencia. =0>0

300

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

Consideremos la representacin normal de la forma cuadrtica f, es decir, Nf(Y1, Y2, , Yn) =

Consideremos la representacin normal de la forma cuadrtica f, es decir, Nf(Y1, Y2, , Yn) =

Y
i i =1

2 i

: siendo r = Rango(A)

Y
i i =1

2 i

; siendo r = Rango(A)

Como A tiene todos sus autovalores negativos, es decir, Indice(A) = 0 y Rango(A) = n, entonces: Nf(Y1, Y2, , Yn) =

Y
i i =1

2 i

<0y

Nf(Y1, Y2, , Yn) =

Y
i i =1

2 i

= 0 si y slo si Y1= Y2 = = Yn = 0.

Por lo tanto, Yn (Y nx1): Nf(Y) < 0. Adems, por el teorema 8.3., Nf(Y) = f(X) para X = PY, es decir, Y = P-1X. Luego, P-1X n (P-1X nx1): f(X) < 0 y en virtud de que P es no singular entonces X n (X nx1): f(X) < 0, es decir, A es definida negativa. 4. CN(): Si A es semidefinida negativa entonces A tiene al menos un autovalor nulo, al menos un autovalor negativo y ningn autovalor positivo, es decir, Indice(A) = 0 y Rango(A) < n. Sea autovalor de A con autovector asociado X. Luego, AX = X XtAX = Xt(X) XtAX = XtX Ahora bien, X es autovector de A, es decir, X nx1. Por lo tanto, XX =
t

Como Indice(A) = 0 y Rango(A) < n, es decir, los r primeros autovalores de A son negativos entonces Nf(Y1, Y2, , Yn) 0, Y1, Y2, , Yr, mientras que Nf(Y1, Y2, , Yn) = 0 si y slo si Yi = 0, i = 1, 2, , r y Yi 0, para algn i = r+1, r+2, , n. Por lo tanto, Yn: Nf(Y) 0 y Yn(Y nx1): Nf(Y) = 0. Adems, por el teorema 8.3., Nf(Y) = f(X) para X = PY, es decir, Y = P-1X. Luego, P-1Xn: f(X) 0 y P-1Xn(P-1X nx1): f(X) = 0 y en virtud de que P es no singular entonces Xn: f(X) 0 y Xn(X nx1): f(X) = 0, es decir, A es semidefinida negativa. 5. CN(): Si A es indefinida entonces A tiene al menos un autovalor positivo y al menos un autovalor negativo, es decir, 0 < Indice(A) < Rango(A) n. Sea autovalor de A con autovector asociado X. Luego, AX = X XtAX = Xt(X) XtAX = XtX Ahora bien, X es autovector de A, es decir, X nx1. Por lo tanto, XtX =

X
i =1

2 i

> 0. = X t AX XtX

i =1

X i2

> 0. = X t AX XtX

Por hiptesis, A es indefinida, es decir, X1, X2n (X1 nx1, X2 nx1): f(X1) = (X1)tAX1 > 0 y f(X2) = (X2)tAX2 < 0. En consecuencia, existen 1 y 2 tales que: 1 > 0 y 2 < 0 Luego, A tiene A tiene al menos un autovalor positivo y al menos un autovalor negativo, es decir, 0 < Indice(A) < Rango(A) n. CS(): Si A tiene al menos un autovalor positivo y al menos un autovalor negativo, es decir, 0 < Indice(A) < Rango(A) n, entonces A es indefinida. Consideremos la representacin normal de la forma cuadrtica f, es decir, Nf(Y1, Y2, , Yn) =

Por hiptesis, A es semidefinida negativa, es decir, Xn: f(X) = XtAX 0 y Xn(X nx1): f(X) = XtAX = 0. En consecuencia. =0<0 Luego, A tiene A tiene al menos un autovalor nulo, al menos un autovalor negativo y ningn autovalor positivo, es decir, Indice(A) =0 y Rango(A) < n. CS(): Si A tiene al menos un autovalor nulo, al menos un autovalor negativo y ningn autovalor positivo, es decir, Indice(A) = 0 y Rango(A) < n, entonces A es semidefinida negativa. 302

Y
i i =1

2 i

; siendo r = Rango(A)

303

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

Supongamos que Indice(A) = p. Como 0 <Indice(A)<Rango(A) n, es decir, los p primeros autovalores de A son positivos, los r p subsiguientes son negativos y los n r restantes son nulos entonces Nf(Y1, Y2, , Yn) > 0 si y slo si Yi = 0, i = p+1, p+2, , r y Yi 0, para algn i = 1, 2, , p, mientras que Nf(Y1, Y2, , Yn)< 0 si y slo si Yi = 0, i = 1, 2, , p y Yi 0, para algn i = p+1, p+2, , r. Por lo tanto, Y1, Y2n (Y1 nx1, Y2 nx1): Nf(Y1) > 0 y Nf(Y2) < 0. Adems, por el teorema 8.3., Nf(Y) = f(X) para X = PY, es decir, Y = P-1X. Luego, P-1X1, P-1X2n (P-1X1 nx1, P-2X2 nx1): f(X1) > 0 y f(X2) < 0 y en virtud de que P es no singular entonces X1, X2n (X1 nx1, X2 nx1): f(X1) > 0 y f(X2) < 0, es decir, A es indefinida. Observacin: Sean A, BMnxn() matrices simtricas y f, g: n formas cuadrticas con matrices simtricas asociadas A y B, respectivamente. La forma cuadrtica f es congruente con g si y slo si f y g tienen la misma clasificacin.
Ejemplo 8.10.

2.

Si A es definida negativa entonces A tiene todos sus autovalores negativos. Por otra parte, por el teorema 7.13. (lema de Issai Schur), si 1, 2, , n son los autovalores de A entonces Traza(A) =

i =1

. Como i < 0, i = 1, 2, , n entonces

3.

Traza(A) < 0. Si A es semidefinida positiva entonces A tiene al menos un autovalor nulo, al menos un autovalor positivo y ningn autovalor negativo. Por otra parte, por el teorema 7.13. (lema de Issai Schur), si 1, 2, , n son los autovalores de A entonces Det(A) =

i =1

4.

Como i = 0 para algn i = 1, 2, , n y i > 0 para el resto de los autovalores entonces Det(A) = 0 y Traza(A) > 0. Si A es semidefinida negativa entonces A tiene al menos un autovalor nulo, al menos un autovalor negativo y ningn autovalor positivo. Por otra parte, por el teorema 7.13. (lema de Issai Schur), si 1, 2, , n son los autovalores de A entonces Det(A) =

i =1

Los autovalores de la matriz A del ejemplo 8.1., son 1 = 1, 2 = 3 y 3 = 0. Luego, A es semidefinida positiva.
Ejemplo 8.11.

Como i = 0 para algn i = 1, 2, , n y i < 0 para el resto de los autovalores entonces Det(A) = 0 y Traza(A) < 0.
Teorema 8.8.

En relacin al ejemplo 8.5., la matriz de centraje P es la matriz simtrica asociada a la forma cuadrtica nS2. Dicha matriz tiene como autovalores 1 = 0 con r1 = 1 y 2 = 1 con r2 = n 1. En consecuencia, P es semidefinida positiva.
Teorema 8.7.

Sean AMnxn() una matriz simtrica y f: n una forma cuadrtica con matriz simtrica asociada A. f es: 1. 2. Definida Positiva si y slo si A es congruente con In. Definida Negativa si y slo si A es congruente con In.

Demostracin

Sean AMnxn() una matriz simtrica y f: n una forma cuadrtica con matriz simtrica asociada A. Si A es: 1. 2. 3. 4. Definida Positiva entonces Det(A) > 0 y Traza(A) > 0. Definida Negativa entonces Traza(A) < 0. Semidefinida Positiva entonces Det(A) = 0 y Traza(A) > 0. Semidefinida Negativa entonces Det(A) = 0 y Traza(A) < 0.

1.

CN(): Si f es definida positiva entonces A es congruente con In. Si f es definida positiva entonces A tiene todos sus autovalores positivos, es decir, Indice(A) = Rango(A) = n. En consecuencia, por el teorema 8.2., A es congruente con In. CS(): Si A es congruente con In entonces A es definida positiva. Si A es congruente con In entonces por el teorema 8.5., las formas cuadrticas asociadas a A y In, respectivamente tienen la misma representacin cannica. Es claro que la representacin cannica de la forma cuadrtica asociada a In, digamos g(Y) = YtY es Cg(Y1, Y2, , Yn) =

Demostracin

1.

Si A es definida positiva entonces A tiene todos sus autovalores positivos. Por otra parte, por el teorema 7.13. (lema de Issai Schur), si 1, 2, , n son los autovalores de A entonces Det(A) = y Traza(A) =

i =1

i =1

Y
i =1

2 i

. Por lo tanto, esta funcin es tambin la

. Como i > 0, i = 1, 2, , n entonces 2.

Det(A) > 0 y Traza(A) > 0.

representacin cannica de A. En consecuencia, A tiene todos sus autovalores positivos, es decir, A es definida positiva. CN(): Si f es definida negativa entonces A es congruente con In.

304

305

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

Si f es definida negativa entonces A tiene todos sus autovalores negativos, es decir, Indice(A) = 0 y Rango(A) = n. En consecuencia, por el teorema 8.2., A es congruente con In. CS(): Si A es congruente con In entonces A es definida negativa. Si A es congruente con In entonces por el teorema 8.5., las formas cuadrticas asociadas a A y In, respectivamente tienen la misma representacin cannica. Es claro que la representacin cannica de la forma cuadrtica asociada a In, digamos g(Y) = YtY es Cg(Y1, Y2, , Yn) =

Demostracin

Es claro que Rango(A) min{m, n}, es decir, n min{m, n}. Luego, n < m. 1. Sea f: m la forma cuadrtica cuya matriz simtrica asociada es AtA. Luego, f(X) = XtAtAX = (AX)t(AX) = YtY =

i =1

(1)Y . Por lo tanto, esta funcin es

2 i

Y
i =1

2 i

; con Y = AX

tambin la representacin cannica de A. En consecuencia, A tiene todos sus autovalores negativos, es decir, A es definida negativa.
Teorema 8.9.

Sean AMnxn() una matriz simtrica y f: n una forma cuadrtica con matriz simtrica asociada A. A es definida positiva si y slo si existe una matriz BMnxn() no singular tal que A es una matriz Grammian de la forma A = BtB.
Demostracin

Por lo tanto, f(X) 0 y es tal que f(X) = 0 si y slo si Y = mx1. Pero, Y = mx1 implica que AX = mx1, lo cual es un SEL homogneo y por la Eliminacin de Gauss-Jordan, como Rango(A) = n entonces el SEL AX = mx1 tiene una nica solucin, la cual es la solucin trivial X = nx1. Luego, f(X) = mx1 si y slo si X = nx1. Por consiguiente, Xn (X nx1): f(X) > 0, es decir, f es definida positiva y en consecuencia AtA es definida positiva. 2. Sea f: n la forma cuadrtica cuya matriz simtrica asociada es AAt. Luego, f(X) = XtAAtX = (AtX)t(AtX) = YtY =

CN(): Si A es definida positiva entonces existe una matriz BMnxn() no singular tal que A es una matriz Grammian de la forma A = BtB. Como A es definida positiva entonces por el teorema 8.8., A es congruente con la matriz In, es decir: PMnxn() (P no singular): PtAP = In PMnxn() (P no singular): A = (Pt)-1InP-1 PMnxn() (P no singular): A = (P-1)tP-1 P, BMnxn() (P, B no singulares) (B = P-1): A = BtB CS(): Si existe una matriz BMnxn() no singular tal que A es una matriz Grammian de la forma A = BtB entonces A es definida positiva. Por hiptesis: BMnxn() (B no singular): A = BtB BMnxn() (B no singular): (Bt)-1AB-1 = In BMnxn() (P no singular): (B-1)tAB-1 = In P, BMnxn() (P, B no singulares) (P = B-1): PtAP = In Luego, A es congruente con In y por el teorema 8.8., A es definida positiva.
Teorema 8.10.

Y
i =1

2 i

; con Y = AtX

Por lo tanto, f(X) 0 y es tal que f(X) = 0 si y slo si Y = nx1. Pero, Y = nx1 implica que AtX = nx1, lo cual es un SEL homogneo y por la Eliminacin de Gauss-Jordan, como Rango(At) = Rango(A) = n < m entonces el SEL AtX = nx1 no tiene una nica solucin, es decir, existen soluciones distintas de la solucin trivial X = mx1. Luego, f(X) 0 y Xn (X mx1): f(X) = 0. Por consiguiente, Xn: f(X) 0 y Xn (X mx1): f(X) = 0, es decir, f es semidefinida positiva y en consecuencia AAt es semidefinida positiva.
8.5. VECTOR DERIVADA O GRADIENTE DE UNA FORMA CUADRTICA. Definicin 8.5.

Sea f: n. Se define como vector derivada o vector gradiente de f respecto de X y se denota por f (X) al vector f (X ) n cuyo elemento genrico es

(f (X))i =

f . X i

Sean AMmxn(). Si Rango(A) = n entonces: 1. 2. AtA es definida positiva. AAt es semidefinida positiva. 306

Ejemplo 8.12.
2 2 2 Sea f: 3 definida por f(X1, X2, X3) = 2X1 + 3X1X 2 2 5X1X 3 + 3X 2 5X 3 .

Luego,
307

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

4X1 + 3X 5X 3 f (X1 , X 2 , X 3 ) = 6X1X 2 + 6X 2 2 5X 10X 1 3


2 2

(f (X1 , X 2 ,..., X n ))i = En consecuencia,

n n f = 2A ii X i + 2 A ijX j = 2 A ijX j X i j=1 ( i j) j=1

Teorema 8.11. (Gradiente de una Funcin Lineal)

Sea f: definida por f (X ) = X Y = Y X ; Y . Entonces se cumple que:


n
t t

f ( X ) = Y
Demostracin

n 2 A1 jX j j=1 A11 A12 L A1n X1 n 2 A 2 jX j A 21 A 22 L A 2 n X 2 = 2AX f ( X ) = = 2 M j=1 M M M M n A n1 A n 2 L A nn X n 2 A njX j j=1

Por hiptesis, f (X) = X t Y = Y t X , es decir: f(X1, X2, , Xn) =


Luego, f (f (X1 , X 2 ,..., X n ))i = = Yi X i Por consiguiente, f ( X ) = Y
Teorema 8.12. (Gradiente de una Forma Cuadrtica)

Ejemplo 8.13.

La derivada de la forma cuadrtica del ejemplo 8.1., es:

Yi Xi
i =1

X1 X 2 1 2X1 2X 2 f (X1 , X 2 , X 3 ) = 4X 2 2X1 + 2X 3 = 2 X1 + 2X 2 + X 3 = 2 1 X 2 + X3 0 2X 3 + 2X 2

1 2 1

0 X1 1 X 2 = 2AX 1 X3

Ejemplo 8.14.

En relacin al ejemplo 8.5., el vector gradiente de la forma cuadrtica nS2 = f(X) = XtPX es: f (X) = 2PX = 2X

Sean AMnxn() una matriz simtrica y f: n una forma cuadrtica con matriz simtrica asociada A. Entonces se cumple que: f (X) = 2AX
Demostracin

Por hiptesis: f(X) = XtAX, es decir, f(X1, X2, , Xn) =

A X X
ij i i =1 j=1
ii 2 i

Como A es simtrica entonces f(X1, X2, , Xn) = Luego,

A X
i =1

+2

A X X
ij i i =1 j=1 (i < j)

308

309

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

EJERCICIOS PROPUESTOS. 1.

7.

Sean f1, f2, f3, f4 funciones fi: 3; i = 1, 2, 3, 4 y f5, f6 funciones fi: 4; i = 5, 6 definidas por:
1.1. 1.2. 1.3. 1.4. 1.5. 1.6.

La ecuacin aY2+bY+a = 0, con a, b * puede tener dos races reales iguales, dos races reales distintas o dos races imaginarias. Clasifique en cada caso la forma cuadrtica f: 2 definida por: f(X1, X2) = bX12 + 4aX1X2 + bX22

f1(X1, X2, X3)= X12 + X22 + 4X32 2X1X2 + 2X1X3 2X2X3. f2(X1, X2, X3)= X12 + 3X22 + 4X32 + 4X1X3. f3(X1, X2, X3)= (X1 + X2)2 + (2X1 X3)2 X12 2X22 + 6X2X3. f4(X1, X2, X3)= 2X12 + 9X22 X32 4X1X3. f5(X1, X2, X3, X4)= X12+2X22+X32+2X422X1X3+2X1X4+ 4X2X3 2X2X4. f6(X1, X2, X3, X4)= 2X12+2X22+3X32+X42+2X1X22X1X3+ 2X2X3+2X3X4.

8.

Sean f: n y g: n formas cuadrticas con matrices simtricas asociadas A y B, respectivamente. Determine si las siguientes proposiciones son verdaderas o falsas, justificando con una demostracin en el caso que las considere verdaderas y con un contraejemplo en el caso que las considere falsas:
8.1. 8.2. 8.3. 8.4. 8.5. 8.6.

Demuestre que cada una de estas funciones son formas cuadrticas y determine en cada caso la respectiva matriz simtrica asociada.
2.

En el conjunto Mnxn() se define la relacin R por ( A, B Mnxn()) A R B si y slo si A es congruente a B. Demuestre que R es una relacin de equivalencia en Mnxn(). Demuestre que la forma cuadrtica f1 del ejercicio 1 es congruente con las formas cuadrticas gi: 3; i = 1, 2 definidas por g1(X1, X2, X3) = X12 + 3X32 y g2(X1, X2, X3) = X12 + X32. Demuestre que la forma cuadrtica f4 del ejercicio 1 es ortogonalmente congruente con la forma cuadrtica g1: 3 y congruente con la forma cuadrtica g2: 3 definidas por 1 g1(X1, X2, X3)= 2X12+3X22+9X22 y g2(X1, X2, X3)= X12+9X22 2 1 2 X3 . 3
10. 9.

Si Traza(A) > 0 entonces A es definida positiva. Si Traza(A) < 0 entonces A es definida negativa. Si A es definida negativa entonces Traza(A)Det(A) > 0. Si A tiene n autovectores linealmente independientes entonces A es definida negativa. Si A es indefinida y n = 2 entonces A tiene n autovectores L.I. Si A es definida positiva y B es indefinida entonces Rango(AB) = Rango(A).

3.

Sea la forma cuadrtica f: 2 definida por: f(X1, X2) = aX12 + 2bX1X2 + cX22; a, b, c tal que f es definida negativa. Demuestre que:
9.1. 9.2. 9.3. 9.4.

4.

a < 0. ac > 0. a + c < 0. ac b2 > 0.

5.

Clasifique cada una de las formas cuadrticas del ejercicio 1 y determine adems representacin normal y cannica de cada una de ellas. Sean X1, X2, , Xn un conjunto de datos cuantitativos con media X y desviacin estndar S. Sean f1, f2, f3 funciones fi: n; i = 1, 2, 3 definidas por:
6.1. 6.2. 6.3.

Sea XMnxp() una matriz de rango columna completo. Demuestre que:


10.1. 10.2.

6.

La matriz XtX es no singular. La matriz A = k2(In X(XtX)-1Xt) es semidefinida positiva, con k 0.

11.

Sea la forma cuadrtica f: n con matriz simtrica asociada A de rango q, q < n. Demuestre que:
11.1. 11.2.

() f (X , X , , X ) = n (X ) .
f1(X1, X2, , Xn) = X .
2 1 2 n 2 2

f3(X1, X2, , Xn) = S2.

Si f es semidefinida positiva entonces existe una matriz PMqxn() de rango q tal que A = PtP. Si f es semidefinida negativa entonces existe una matriz QMqxn() de rango q tal que A = QtQ.

Demuestre que cada una de estas funciones son formas cuadrticas. Clasifquelas y determine adems representacin normal y cannica en cada caso.

12.

Sean AMnxn() y BMnxp() tales que A es definida positiva y Rango(B) = p. Demuestre que la forma cuadrtica f: p con matriz simtrica asociada BtA-1B es definida positiva.

310

311

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

CAPTULO 8: FORMAS CUADRTICAS

13.

Sea la forma cuadrtica f: n, tal que f(X) = XtA1X + XtA2X, donde A2A1 = nxn para i = 1,2 Ai es idempotente y rango(Ai) = ki. Clasifique la forma cuadrtica f si se sabe que:
13.1. 13.2.

k1 + k2 < n. k1 + k2 = n.

S12 S12 V= M S1n Es definida positiva.


20.

S12 L S1n 2 S2 L S2 n M M 2 S2 n L Sn

14.

Sean AMmxn() y BMnxm(), tales que Rango(A) = n, ABA = A y BA es simtrica. Demuestre que si PMnxn() es no singular entonces la matriz Pt(BA)P es definida positiva. Sean AMpxq() y BMqxq() tales que Rango(A) = q, B es simtrica y B AtA es definida positiva. Demuestre que la matriz B es definida positiva. Sea f la forma cuadrtica f: n con matriz simtrica asociada A. Demuestre que:
16.1. 16.2.

Determine el vector gradiente de todas las formas cuadrticas del ejercicio 1. Sean XMnxp() una matriz de rango columna completo, Yn y h: p definida por h(Z) = (YXZ)t(YXZ). Determine el vector Z tal que h ( Z) = px1 .

15.

21.

16.

A es definida positiva si y slo si los determinantes de todos sus menores principales son positivos. A es definida negativa si y slo si los determinantes de todos sus menores principales de orden par son positivos y los determinantes de todos sus menores principales de orden impar son negativos.

17.

Sea f la forma cuadrtica f: 2 definida por: f(X1, X2) =


2 2 2rX1X 2 X 2 1 X1 + 2 2 2 S1S2 (1 r ) S2 S1

con |r| < 1 y S1S2 > 0. Demuestre que f es definida positiva.


18.

Sean X1 y X2 variables aleatorias con varianzas S12 y S22, respectivamente y S12 la covarianza entre X1 y X2. Demuestre que si Y1, Y2 no nulos simultneamente, VAR(Y1X1 + Y2X2) > 0 entonces la matriz V definida por:
S V= 1 S12 Es definida positiva.
2

S12 2 S2

19.

Sean X1, X2, , Xn variables aleatorias con varianzas S12, S22, , Sn2, respectivamente y Sij la covarianza entre Xi y Xj,i = 1, 2, .., n; j = 1, 2, , n. Demuestre que si Y1, Y2, , Yn no nulos simultneamente, VAR(Y1X1 + Y2X2 + + YnXn) > 0 entonces la matriz V definida por:

312

313

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Captulo

INTERPRETACIONES GEOMTRICAS

9.1. INTRODUCCIN. En este captulo se presenta el tema del lgebra Lineal que mayor contribucin tiene en el Anlisis de Datos Multivariante como lo son las Interpretaciones Geomtricas. Se exponen sus principales tpicos asociados como lo son la Representacin Grfica de los Vectores Filas y Columnas de una Matriz de Datos, ngulo entre 2 vectores y Rectas y Planos en n, y los Subespacios de Mejor Ajuste Mnimo Cuadrtico, herramienta que justamente es la que permite la reduccin de datos. 9.2. REPRESENTACIN GRFICA DE LOS VECTORES FILAS Y VECTORES COLUMNAS DE UNA MATRIZ DE DATOS. Sea XMnxp() una matriz de datos. Dicha matriz tiene n vectores filas que puede representarse grficamente como puntos en p; estos puntos representan a los elementos. Igualmente tiene p vectores columnas que pueden representarse grficamente como puntos en n; estos puntos representan a las variables. Si p = 1, 2, 3 es posible representar grficamente a los elementos pero si p 4 esto resulta imposible. De la misma forma, si n = 1, 2, 3 es posible representar grficamente a las variables pero si n 4 esto resulta imposible. De all que es ms factible representar grficamente a los elementos de una matriz de datos que a las variables siempre y cuando se midan a lo sumo 3 variables. Ejemplo Aplicado 9.1. Consideremos la matriz de datos cuyas columnas son las 2 primeras columnas de la matriz de datos del ejemplo aplicado 1.3.:

Figura 9.1.

El grfico obtenido es un grfico de dispersin. A primera vista se observan 3 grupos de elementos: {C, B}, {A, F, G} y {E, D}. Sin embargo, no se dispone de mayor informacin para caracterizar esos grupos. Para ello, consideremos la matriz de datos centrada: 0,43 1,57 2,43 0,57 4,43 1,43 X = 4,57 6,43 2,57 0,43 0,43 2,57 0,57 3,57 La representacin grfica de los 7 vectores filas (elementos) sobre 2 se puede apreciar en la figura 9.2.:

12 10 08 X = 17 15 12 13

11 12 14 19 13 10 09

Figura 9.2.

En este caso se pueden representar grficamente los 7 vectores filas (elementos) sobre 2 (Figura 9.1.).

En este caso el punto (0,0) representa el punto de medias de las 2 columnas de , de manera que los 4 cuadrantes del grfico anterior tienen caractersticas X particulares: 315

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Primer Cuadrante: Son los alumnos cuyas notas en el 1er y 2do parcial estn por encima de la media. En este caso, estn los alumnos E y D. Segundo Cuadrante: Son los alumnos cuya nota en el primer parcial est por debajo de la media pero cuya nota en el segundo parcial est por encima de la media. En este caso, est solamente el alumno C. Tercer Cuadrante:

cercanos a D son E y A (aunque lejos), los ms cercanos a E son A y F, los ms cercanos a F son A y B y los ms cercanos a G son F y A. Esto tambin permite construir grupos internamente homogneos y externamente heterogneos. Sin embargo, en la prctica no es comn encontrar matrices de datos con slo 2 columnas. Si tuviesen 3 columnas an es posible representar grficamente los elementos pero todava se torna complicado analizar los grupos de elementos que se originan. Si tuviesen 4 o ms columnas entonces es imposible representar grficamente los elementos. El objetivo fundamental de este captulo es justamente resolver este problema a travs del lgebra Lineal.
9.3. NGULO ENTRE 2 VECTORES, RECTAS Y PLANOS EN n.

Son los alumnos cuyas notas en el 1er y 2do parcial estn por debajo de la media. En este caso, estn los alumnos B, A y F. Cuarto Cuadrante: Son los alumnos cuya nota en el primer parcial est por encima de la media pero cuya nota en el segundo parcial est por debajo de la media. En este caso, est solamente el alumno G. De esta manera se aprecian 4 grupos de elementos plenamente caracterizados. Otra forma de hacer este anlisis es considerando la distancia eucldea entre elementos, digamos los elementos i-simo y s-simo: d((Xi)t, (Xs)t) = ||(Xi)t (Xs)t|| De hecho, es la forma ms til cuando se trata de matrices con 3 o ms columnas. Por ejemplo, la distancia entre los elementos B y D es:
d ((X 2 ) , (X 4 ) ) = (10 17) + (12 19) = 9,90
t t 2 2

Teorema 9.1.

Sean X, Yn. Entonces el ngulo entre los vectores X e Y es tal que:

Cos() =

XtY X Y

Demostracin

Por el teorema 5.2., d 2 (X, Y) = X + Y 2 < X, Y > . Si X, Yn entonces: d 2 ( X , Y ) = X + Y 2X t Y Grficamente se puede apreciar en la figura 9.3.:
2 2

(1)

Se puede determinar la matriz simtrica de distancias entre elementos cuyo elemento genrico es: Dij = d((Xi)t, (Xj)t) En este caso: 0,00 2,24 5,00 D = 9,43 3,61 1,00 2,24 2,24 0,00 2,83 5,10 2,83 4,24 5,00 2,83 0,00 7,07 5,66 7,07 9,43 9,90 0,00 6,32 3,61 5,10 6,32 0,00 2,24 2,83 4,24 5,66 7,07 10,30 10,77 4,24 4,47 0,00 1,41 1,41 0,00 1,00

||X||

d(X, Y)

||Y||

10,30 7,07

9,90 10,30

Figura 9.3.

10,30 4,24 10,77 4,47

Por la ley del coseno se tiene que: d 2 (X, Y) = X + Y 2 X Y Cos()


2 2

Se puede observar claramente que los elementos ms cercanos a A son F y B, los ms cercanos a B son A y F, los ms cercanos a C son B y A, los ms

(2)

316

317

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Igualando (1) y (2) se tiene que: X + Y 2X t Y = X + Y 2 X Y Cos() 2 X Y Cos() = 2X t Y


2 2 2 2

El vector (X Y) se dice que es el vector director de la recta LYX. Si Y = nx1 entonces la recta LX es una recta en n que pasa por el origen nx1. La figura 9.4., muestra una recta LX en 3.

X Y Cos() = X t Y Cos() = XtY X Y


LX

Teorema 9.2.

Sea XMnxp() una matriz de datos. Entonces el coseno del ngulo entre los j es: h y X vectores X Cos() = rhj
Figura 9.4.

Siendo rhj el coeficiente de correlacin lineal de Pearson entre las variables h-sima y j-sima.
Demostracin

Ejemplo 9.1.

Sean X, Y3 los vectores:


X
i =1 n

1.

h )t X j= (X

ih

= X ij

(X
i =1

ih

X h )(X ij X j ) = nShj

2.

h = (X h )t X h = X

(X
i =1

ih

)2 =

(X
i =1

ih

X h ) 2 = nS2 h = n Sh

1 X = 2 , Y = 2 En este caso,

1 0 3

3.

j = (X j )t X j = X

) (X
ij i =1

(X
i =1

ij

X j ) 2 = nS2 j = nSj

Luego,

2 X Y = 2 5 Luego,

Cos() =

nShj n Sh n S j

Shj Sh S j

= rhj

h y X j coincide con el Es decir, el coseno del ngulo entre los vectores X coeficiente de correlacin lineal de Pearson entre las variables h-sima y j-sima.
Definicin 9.1.

2 1 LYX = {Z3: Z = 0 + c 2 ; c} 3 5
Ejemplo 9.2.

Sea X3 el vector: 1 X = 2 3

Sean X, Y tales que X Y. Se define como recta que pasa por X e Y, y se denota por LYX al conjunto:
n

LYX = {Zn: Z = Y + c(X Y); c}

318

319

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

La recta que pasa por el origen 3x1 y el vector X es: 1 LX = {Z3: Z = c 2 ; c} 3


Teorema 9.3.

En este caso, W = LX. Es claro que una base de LX esta formada por un solo vector y es {X}. Por lo tanto, una base ortonormal de LX es {V}, siendo X X . Luego, V= = X XtX
Y = < Y, V > V Pr oy L X Y Pr oy L = (Y t V)V X

Sea X . Entonces la Recta LX es un subespacio de .


n n

Y = (Y t ( Pr oy L X

X XtX YtX

))

X XtX

Demostracin

Por definicin: LX = {Zn: Z = cX; c} Veamos que LX es un subespacio de n. 1. 2. Es claro que si c = 0 entonces Z = 0X = nx1. Luego, nx1LX. Sean Z1, Z2LX. Luego, existen c1, c2 tales que Z1 = c1X y Z2 = c2X. Luego, dZ1 + Z2 = d(c1X) + c2X, es decir, dZ1 + Z2 = (dc1 + c2)X; d. Por lo tanto, (dZ1 + Z2)LX.

Y = Pr oy L X

XtX

Y = Pr oy L X

Y Pr oy Y L X = L X X

YtX X XtX

En la figura 9.5., se puede apreciar grficamente la proyeccin ortogonal de un vector Y sobre una recta LX en 3.

Por consiguiente, LX es un subespacio de n.


Teorema 9.4.

Sean X, Yn. Entonces la Proyeccin Ortogonal de Y sobre la Recta LX es:


Y Pr oy Y L X = L X X

Y Y Pr oy L X

LX

Siendo

Y L X

YtX = t la componente de proyeccin. XX

Y Pr oy L X

Demostracin

Por el teorema 9.3., LX es un subespacio de n. Es claro que V = n es un espacio eucldeo con el producto interno usual < X, Y > = X t Y , X, Yn.
Por definicin de proyeccin ortogonal (definicin 5.6.):

Figura 9.5.
Y Se aprecia claramente que (Y Pr oy Y L X ) Pr oy L X .

Observaciones: Pr oy Y W =

< Y, V
j=1

> Vj

1.

Y Por el teorema 5.11., d2(Y, LX) = d2(Y, Pr oy L ), es decir: X

Siendo {V1, V2, , Vp} una base ortonormal de W.

d2(Y, LX) = d2(Y, = (Y

YtX X) XtX

YtX YtX X )t(Y t X ) t XX XX

320

321

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

= (Yt ( = (Yt ( = YtY Yt ( = YtY (

YtX YtX X )t)(Y t X ) t XX XX YtX t YtX )X )(Y t X ) t XX XX

YtX YtX YtX YtX )X ( t )X t Y + ( t )X t t X t XX XX XX XX

1 2 1] 2 YtX 3 = 2 Y ( L )= t = X 1 14 XX [1 2 3] 2 3

[3

YtX t YtX YtX YtX )Y X ( t ) Y t X + ( t ) t ) X t X t XX XX XX XX YtX YtX = YtY 2 ( t )Y t X + ( t )Y t X XX XX = YtY ( = YtY ( YX t )Y X XtX
t

Luego,

Pr oy

Y L X

= (

Y L X

YtX t XtX )Y X( t ) XtX XX

1 1 7 2 2 )X = 2 = 7 14 3 3 7

Adems, d2(Y, LX) = YtY ( LY )2 X t X X


Y L X t Y L X

YtX = YtY ( t ) 2 X t X XX = Y Y (
t Y 2 L X 2

) XX ) Pr oy
t

2.

d ( Pr oy

Y L X

, nx1) = || Pr oy

Y L X

|| = ( Pr oy

Y = Y L X X L X X 2 Y L X t

(( ) ) ( ) = ( ) X X

3 1 2 2 = [3 2 1]2 [1 2 3] 2 14 1 3 4 = 14 14 196
= 14 =
96 7

Ejemplo 9.3.

2 7

Consideremos la recta LX del ejemplo 9.2.: 1 LX = {Z3: Z = c 2 ; c} 3 3 Calculemos la proyeccin ortogonal del vector Y = 2 sobre la recta LX: 1
Y Y Pr oy L = ( L )X X X

Finalmente, 2 2 Y Y d 2 (Pr oy L , 3 x1 ) = ( L ) 2 X t X = .14 = X X 7 14


Definicin 9.2.
2

Sean X0, X1, X2, , Xpn vectores L.I. Se define como plano de dimensin p+1 en n generado por los vectores X0, X1, X2, , Xp y se denota por Ppn+1 al conjunto:

La componente de proyeccin es:

Ppn+1 = {Z n : Z = X 0 +

B X ; B , j = 1, 2, ..., p}
j j j j=1

322

323

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Si X0 = nx1 entonces se dice que el plano pasa por el origen, es generado por los vectores L.I. X1, X2, , Xp y se denota por Ppn . Es claro que si Z Ppn+1 entonces Z es combinacin lineal de los vectores X0, X1, X2, , Xp. Por otro lado, Si Z P
n p +1

entonces Z = X +
0

B X
j j=1

, es decir:
X
p

X2 X1

3 Pp

Z = X0

X1

X2

1 B1 p L X B2 = XB M B p

Figura 9.6. Ejemplo 9.4.

Siendo XMnx(p+1)() = [X0

1 B1 1 2 p p+1 X X . X ] y B = B 2 M B p

Sean X1, X23 los vectores: 1 X1 = 2 , X2 = 2 1 0 3

De modo que: Ppn+1 = {Z n : Z = XB; X M nx(p +1) (), B p +1} En particular, si p = 1 entonces:
n 0 1 P1n +1 = {Z : Z = X + B1X ; B1 } = L X 0 X1

El plano de dimensin 2 en 3 que pasa por el origen y es generado por los vectores X1 y X2 es: 1 1 3 P2 = {Z 3 : Z = B1 2 + B2 0; B1 , B2 } = {Z 3 : Z = XB; B 2 } 3 2 Siendo: 1 1 B X = 2 0 y B = 1 B 2 2 3
Teorema 9.5.

Si adems X0 = nx1 entonces:

Ppn = {Z n : Z = XB; X M nxp (), B p }


Para p = 1 entonces: P1n = {Z n : Z = B1X1 ; B1 } = L X1
3 . En la figura 9.6., se puede apreciar un plano Pp

Sean X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I. Entonces el plano Ppn que pasa por el origen y es generado por los vectores X1, X2, , Xp es un subespacio de n.
Demostracin

Por definicin:

324

325

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Ppn = {Z n : Z =

B X ; B , j = 1, 2, ..., p}
j j j j=1

En este caso, W = Ppn . Es claro que como {X1, X2, , Xp} es L.I., entonces es una base de Ppn . Por consiguiente, para determinar una base ortonormal aplicamos el proceso de ortonormalizacin de Gram-Schmidt sobre {X1, X2, , Xp}. As se obtienen los vectores V1, V2, , Vp de modo que existen escalares Cji; i = 1, 2, , p; j = 1, 2, , p tales que: Vj =

Veamos que Ppn es un subespacio de n. 1. Es claro que si B1 = B2 = = Bp = 0 entonces Z = nx1. Luego, nx1 Ppn . Sean Z , Z
1 2

C
i =1

ji X

2.

Ppn

. Luego, existen Bij; i = 1, 2; j = 1, 2, , p tales

que dZ
1

Z1 = +
p

B
j=1

1 jX

y d

Z2 =

B
j=1

2 jX

. es

Luego, decir,

Por lo tanto, Pr oy Y = Pn
p

j=1

B1 jX +
j

j=1

B2 jX ,

(< Y, C
j=1 i =1

ji X

>(

C
i =1

ji X

))

dZ1 + Z2 =

(dB
j=1

1j

+ B 2 j )X j ; d. Por lo tanto, (dZ1 + Z2) Ppn .

Ahora bien, < Y,

Por consiguiente,
Teorema 9.6.

Ppn

es un subespacio de .
n

C
i =1

ji X

>=

C
i =1

ji

< Y, X i > =

C
i =1

ji ( Y

Xi ) =

C
i =1

ji ( X

i t

) Y = Dj

Luego, Pr oy Y = Pn
p

Sean Y, X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I. Entonces la Proyeccin Ortogonal de Y sobre el plano Ppn generado por los vectores X1, X2, , Xp es: Pr oy Y = HY Pn
p

( D ( C
j j=1 i =1 p p j j=1 i =1 p p

ji X

))
i

= Pr oy Y Pn
p

D C D C
j i =1 j=1

ji X

= Pr oy Y Pn
p

ji X

Siendo: 1. 2. X = [ X1 X2 L Xp ] Pr oy Y = [ X1 Pn
p

H = X (X t X) 1 X t . Esta matriz se denomina Matriz de Proyeccin. X2

Demostracin

Por el teorema 9.5., Ppn es un subespacio de n. Es claro que V = n es un espacio eucldeo con el producto interno usual < X, Y > = X Y , X, Y . Por definicin de proyeccin ortogonal (definicin 5.6.):
t

p D jC j1 j=1 p D jC j2 L Xp ] j=1 M p D jC jp j=1

Pr oy Y W

< Y, V
j=1

= [ X1 Pr oy Y Pn
j

X2

>V

C11 C12 L Xp ] M C1p

C 21 L C p1 D1 C 22 L C p 2 D 2 M M M C 2 p L C pp D p

Siendo {V1, V2, , Vp} una base ortonormal de W.

326

327

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Pr oy Y = [ X1 Pn
p

X2

C11 C p 12 L X ] M C1p

C 21 C 22 M C2p

p i t C1i (X ) Y L C p1 i =1 p L C p 2 C (X i ) t Y 2i M i =1 M L C pp p i t C pi (X ) Y i =1

3 Pp

X2 Xp

(Y Pr oy Y ) P3
p

Pr oy Y n Pp

=[X

C11 C12 L X ] M C1p


p

C 21 C 22 M C2p

p i t C1i (X ) L C p1 i =1 p L C p 2 C (X i ) t Y 2i M i =1 M L C pp p i t C pi (X ) i =1

Pr oy

Y 3 Pp

X1

Figura 9.7.

C11 C12 L X ] M C1p


p

Pr oy Y n Pp

=
1 t

Luego, (Y Pr oy Y )tXj = 0 Pn
p

[X

C 21 L C p1 C11 C12 L C1p (X ) C 22 L C p 2 C 21 C 22 L C 2 p (X 2 ) t Y M M M M M M p t C 2 p L C pp ( X ) C p1 C p 2 L C pp

)tXj = 0 (Y Pr oy Y Pn
p

= [ X1 X 2 Pr oy Y Pn
p

p 2 C r1 r =1 p p L X ] C r 2 C r1 r =1 M p C rp C r1 r =1

C
r =1 p

r1C r 2

L L

r =1

C2 r2 M
rp C r 2

C
r =1

C r1C rp r =1 ( X1 ) t p 2 t C r 2 C rp (X ) Y r =1 M M p t p ( X ) C2 rp r =1
p

)tXj = 0 Y X ( Pr oy Y Pn
t j
p

)tXj YtXj = ( Pr oy Y Pn
p

Por lo tanto,
t 1 t 2 t p [ Y t X1 Y t X 2 L Y t X p ] = [ (Pr oy PY (Pr oy PY L (Pr oy PY n ) X n ) X n ) X ]
p p p

Pr oy Y = XCXtY; siendo: Pn
p

Yt[ X1

t 1 X 2 L X p ] = (Pr oy PY n ) [ X
p

X2 L Xp ]

Y X = (Pr oy ) X
t Y t n Pp t t (YtX)t = ( (Pr oy PY n ) X)
p

C2 r1 r =1 p C r 2 C r1 C= r =1 M p C rp C r1 r =1

C
r =1 p

r1

Cr2 L L

r =1

C2 r2 M
rp

C
r =1

Cr2 L

C rp r =1 p C r 2 C rp una matriz de orden pxp r =1 M p C2 rp r =1


p r1

X Y = X Pr oy Y Pn
t t
p

XtY = XtXCXtY Como X tiene sus p columnas L.I. entonces Rango(X) = p. En consecuencia, por el teorema 8.10., la matriz XtX es definida positiva y por lo tanto no singular. Luego, (XtX)-1XtY = CXtY ((XtX)-1 C)XtY = px1

Por otra parte, Pr oy Y Ppn (Y Pr oy Y ) Ppn Pn Pn


p p

(Y Pr oy Y ) Xj; j = 1, 2, , p (Ver figura 9.7. en 3) Pn


p

Como XtY px1 entonces (XtX)-1 C = pxp. Por consiguiente, C = (XtX)-1. De esta forma:

328

329

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Pr oy Y = XCXtY = X(XtX)-1XtY = HY Pn
p

= YtY = YtY

(Y X )
t j=1 n j=1 Y L j X

j 2

Observaciones: 1. Por el teorema 5.11., d2(Y, Ppn ) = d2(Y, Pr oy Y ), es decir: Pn


p

2. d2(Y, Ppn ) = d2(Y, HY) = (Y HY)t(Y HY) = ((In H)Y)t(In H)Y = Yt(In H)t(In H)Y = YtQtQY Siendo Q = In H. Las matrices Q y H son simtricas e idempotentes (ver Ejercicio 23, Captulo 1). Por lo tanto: 3.

d2( Pr oy Y , nx1) = ( Pr oy Y )t Pr oy Y = (HY)t(HY) = YtHtHY = Pn Pn Pn


p p p

YtHY. Es decir, el cuadrado de la longitud de la proyeccin ortogonal de Y sobre el plano Ppn es una forma cuadrtica con matriz simtrica asociada H, la cual por ser simtrica e idempotente de orden nxn y de rango p es semidefinida positiva. Si los vectores X1, X2, , Xp forman una base ortonormal de n entonces XtX = Ip. Luego, H = XXt y Q = Ip XXt. En consecuencia: 3.1. Pr oy Y = HY = XXtY. Pn
p

d2(Y, Ppn ) = YtQY 3.2. Es decir, el cuadrado de la distancia de un vector Y al plano Ppn es una forma cuadrtica con matriz simtrica asociada Q, la cual por ser simtrica e idempotente de orden nxn y de rango n p es semidefinida positiva. En particular, si los p vectores columnas que generan el plano Ppn forman una base ortonormal de n entonces X j X j = 1 , j = 1, 2, , p y XtX = Ip. Luego, Q = In H = In XXt y YtX j LY j = = Y t X j . En consecuencia: t X Xj Xj 3.3.
Ejemplo 9.5.

d (Y, Ppn ) = Yt(Ip XXt)Y.


2

d2( Pr oy Y , nx1) = YtXXtY. Pn


p

3 Consideremos el plano P2 del ejemplo 9.3.:

( )

( )

1 1 3 P2 = {Z 3 : Z = B1 2 + B2 0; B1 , B2 } 2 3 3 3 Calculemos la proyeccin ortogonal del vector Y = 2 sobre el plano P2 : 1 En este caso, 1 1 X = 2 0 2 3 Luego, 1 1 1 2 2 9 7 XtX = 2 0 = 1 0 3 2 3 7 10

d2(Y, Ppn ) = YtQY = Yt(In XXt)Y = YtY YtXXtY = YtY Yt = YtY Yt = Y Y


t n

X (X ) Y
t i i i =1 n

X (X ) Y
j j t j=1 t j j t

Y X (X ) Y
j=1 t j j t

= YtY

(Y X )((X ) Y)
j=1

= YtY

(Y X )(Y X )
t j t j j=1

330

331

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Se puede determinar que:


7 10 41 (X t X) 1 = 41 9 7 41 41 La matriz de proyeccin es:

9.4. SUBESPACIOS DE MEJOR AJUSTE MNIMO CUADRTICO. Definicin 9.3.

Sea XMnxp() tal que Rango(X) = p. Se define como subespacio de mejor ajuste mnimo cuadrtico de dimensin q (q < p) al conjunto de vectores filas de X y se denota por SMA(X) q al plano generado por vectores ortonormales V1, V2, , Vq que verifica que

H = X (X X) X
t

d
i =1

(X i , SMA(X) q ) es mnima.

12 5 6 1 1 10 41 41 41 7 1 2 2 41 41 6 40 2 H = 2 0 = 41 41 41 7 9 3 1 0 41 37 12 2 2 3 41 41 41 41 Por lo tanto,

Observaciones: 1. Como
Xi d 2 (X i , SMA (X) q ) = d 2 (X i , Pr oySMA ( X )q )

entonces

el

subespacio de mejor ajuste mnimo cuadrtico SMA(X) q es aquel que verifica que

Pr ow

Y 3 P2

5 41 = HY = 6 41 12 41

12 3 15 6 41 41 41 40 2 2 = 64 41 41 41 37 2 1 77 41 41 41

d
i =1

i (X i , Pr oy SMAX ( X ) q ) es mnima.

2.

Si X es una matriz de datos entonces independientemente del valor de p es posible representar los vectores filas (elementos) de X sobre un plano de dimensin q (q = 1, 2, 3).

Por otra parte, 5 1 0 0 41 Q = I 3 H = 0 1 0 6 41 12 0 0 1 41 En consecuencia, 6 36 12 3 41 41 41 324 3 1 2 2 = d2(Y, P2 ) = [3 2 1] 6 41 41 41 41 4 1 12 2 41 41 41 Finalmente, 15 41 250 d ( Pr oy , 3x1) = Y HY = [3 2 1]64 = 41 41 77 41
2 Y 3 P2 t

Teorema 9.7.

6 12 36 6 12 41 41 41 41 41 40 6 2 = 1 2 41 41 41 41 41 37 12 4 2 2 41 41 41 41 41

Sea XMnxp() tal que Rango(X) = p. Entonces se cumple que: SMA (X)1 = L V1 Siendo V1 el autovector normalizado de la matriz XtX asociado con su mayor autovalor.
Demostracin

Por definicin, el subespacio de mejor ajuste mnimo cuadrtico SMA(X)1 es el plano de dimensin 1 generado por un vector normalizado V1 con la condicin (V1)tV1 = 1 que verifica que

d
i =1

(X i , SMA(X)1 ) es mnima. Es

claro que SMA(X)1 es la recta L V1 (ver figura 9.8., en 3).

332

333

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

((V ) X )((X ) V )
n 1 t t 1 i i i =1

n t 1 = (V1 ) t X i (X i ) V i =1

Xn
Pr oy LX n1
V

X1
Pr oy LX 21
V

d(X1 , L V1 )
Pr oy LX11
V

L V1

d(X 2 , L V1 )

X2 d (X n , L V1 )

(X1 )t (X 2 )t 1 = (V1 ) t [X1 X 2 L X n ] M V t (X n ) = (V1 ) t X t XV1


i =1 n Xi L

Figura 9.8.

Es decir,

V1

Ahora bien,
d 2 (X i , SMA(X)1 ) = d 2 (X i , LV1 ) = d 2 (X i , Pr oy LXi 1 )
V

es una forma cuadrtica con matriz simtrica asociada

XtX. Por lo tanto, el subespacio de mejor ajuste mnimo cuadrtico de dimensin 1 es la recta L V1 que maximiza la forma cuadrtica (V1)tXtXV1 con la restriccin (V1)tV1 = 1. Para hallar el vector V1 utilizaremos el mtodo de los multiplicadores de Lagrange: Definimos las funciones: f(V1) = (V1)tXtXV1 y g(V1) = (V1)tV1 1 La expresin (V1)tV1 es una forma cuadrtica con matriz simtrica asociada Ip. Luego,

Por la observacin 1 del teorema 9.4.:


X 1 t 1 d 2 (X i , Pr oy L Xi1 ) = (X i ) t X i L i1 V V V V 2

( )

Pero V1 V1 = 1 . Luego,
X d 2 (X i , Pr oy L Xi1 ) = (X i ) t X i L i1 V V 2

( )

f ( V1 ) = g ( V1 )
Xi L
V1

d
i =1

Xi (X i , Pr oy L ) = 1
V

(X ) X
t i i =1


i =1

2X t XV1 = (2I p V1 ) 2X t XV1 = 2V1 X t XV1 = V1


minimizar

El
n

trmino
2

i =1 Xi L
V1

(X i ) t X i

es

constante.
n

Por
Xi L

lo
2

tanto,

X t XV1 = V1 Por lo tanto, el multiplicador de Lagrange es autovalor de la matriz XtX con autovector asociado V1. Adems, si premultiplicamos a ambos lados de la igualdad anterior por (V1)t se obtiene que:
(V1 ) t X t XV1 = (V1 ) t (V1 ) = (V1 ) t V1 = f(V1) =

d (X , Pr oy
i i =1

) equivale a maximizar


i =1

V1

, expresin que puede

escribirse de la siguiente manera:

X L i 1 V i =1

(X i )t V1 = 1 t i =1 ( V ) V

t i

=
n

((X ) V )
n i =1 t 1 i i

1 2

((X ) V )((X ) V )
t 1 i =1

Es decir, maximizar f(V1) sujeto a (V1)tV1 = 1 equivale a maximizar , siendo ste ltimo autovalor de XtX con autovector asociado V1. En consecuencia, el vector V1 es el autovector normalizado asociado al mayor autovalor de la matriz XtX.

334

335

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Observacin: Las filas de X en lugar de representarse en se pueden representar en el subespacio de ajuste mnimo cuadrtico P1p (X ) = L V1 a travs de su
p

Alumno A B C D E F G H I J K

proyeccin ortogonal sobre dicha recta, especficamente a travs de su componente de proyeccin, la cual toma la siguiente forma:
Xi L = 1
V

(V1 ) t V1

(Xi )t V1 = (Xi )t V1 = (X )t V1
V1 1 1 V 2 L X ip M = 1 V p

= X i1 X i 2

( ) ( ] ) ( )

X (V )
p 1 ij j=1

Algebra Lineal II 1 1 1 1 0 1 1 1 1 1 1

Matemtica IV -1 0 0 -1 0 0 0 0 1 -1 0

Introduccin a la Economa -1 -1 -1 -1 -1 0 -1 -1 -1 0 0

Teora de la Probabilidad II 1 0 1 1 1 0 1 1 1 0 1

Determinemos SMA (X)1 . En este caso, la matriz de datos es:


1 1 1 1 0 X = 1 1 1 1 1 1 Se puede verificar que: 1 0 0 1 0 0 0 0 1 1 0 1 1 1 1 1 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1 0 1

Es decir, la componente de proyeccin de la i-sima fila de X sobre la recta de mejor ajuste mnimo cuadrtico es una combinacin lineal de las mediciones de las p variables sobre el i-simo elemento. De tal forma que el coeficiente V1 j mide la contribucin de la j-sima variable en la componente. Esto

( )

permite caracterizar intervalos de la recta de mejor ajuste mnimo cuadrtico para as caracterizar los grupos de elementos de X cuyas componentes de proyeccin se encuentran en dichos intervalos. Para obtener el vector de componentes de proyeccin se hace lo siguiente:
LX1 (X1 ) t V1 (X1 ) t V1 X 2 L (X ) t V1 (X 2 ) t 1 = V1 = 2 = V = XV1 M M M X n (X ) t V1 (X ) t n LV1 n

LX1
V

Ejemplo Aplicado 9.2.

En el perodo II-2004 se le consult a un grupo de once (11) alumnos del curso de Algebra Lineal II su apreciacin acerca del nivel de dificultad de las cuatro (4) materias del 4 semestre de la EECA, es decir, Algebra Lineal II, Matemtica IV, Introduccin a la Economa y Teora de la Probabilidad II. Para cada respuesta se adopt la siguiente escala: 1: Nivel de dificultad alto. 0: Nivel de dificultad medio. -1: Nivel de dificultad bajo. Los resultados de la consulta se muestran a continuacin:

10 2 XtX = 7 7

7 1 1 8 7 1 7 8 4 1

Igualmente se puede constatar que los autovalores y autovectores ortonormalizados de la matriz XtX son:

1 = 23 , 2 = 4 , 3 = 2 y 4 = 1
0,2294 0,7559 0 0,6131 0 , 9177 0 , 3780 0 , 1226 2 3 4 , V = y V = 0 , V = V = 0,2294 0,3780 0,7071 0,5518 0,3780 0,7071 0,5518 0,2294
1

336

337

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Luego, 0,6131 0,1226 = {Z : Z = c ; c} 0,5518 0,5518


4

SMA(X)1 = L V1

Por lo tanto,
Xi L = 0,6131Xi1 0,1226Xi2 0,5518Xi3 + 0,5518Xi4 1
V

LX 1
V

Analicemos la estructura de esta componente: 1.


Xi Las mayores contribuciones a L son 0,6131 y 0,5518, las 1
V

1 1 1 1 0 1 = XV = 1 1 1 1 1 1

1 0 0 1 0 0 0 0 1 1 0

1 1 1 1 1 0 1 1 1 0 0

1 0 1 1 1 0 1 1 1 0 1

1,8393 1,1649 1,7167 1,8393 0,6131 1,1036 0,1226 = 0,6131 0,5518 1,7167 0,5518 1,7167 1,5941 0,7357 1,1649

2.

cuales se corresponden con las materias lgebra Lineal II y Teora de la Probabilidad II. Xi Se puede apreciar que L es mxima cuando Xi1 = 1, Xi2 = 1, 1
V

El grfico de dichas componentes sobre la recta de mejor ajuste mnimo cuadrtico se puede apreciar en la figura 9.9.

3. 4.

5.

6.

7.

8.

Xi3 = 1 y Xi4 = 1, mientras que es mnima cuando Xi1 = 1, Xi2 = 1, Xi3 = 1 y Xi4 = 1. Los valores mximo y mnimo son 1,8893 y 1,8893, respectivamente. El valor intermedio es 0, el cual se obtiene cuando Xij = 0, j = 1, 2, 3, 4. Componentes de proyeccin tendientes a 1,8893 indicarn que son alumnos que perciben que lgebra Lineal II y Teora de la Probabilidad II tienen un alto nivel de dificultad (principalmente lgebra Lineal II) y Matemtica IV e Introduccin a la Economa tienen un nivel de dificultad bajo (principalmente Introduccin a la Economa). Componentes de proyeccin tendientes a 1,8893 indicarn que son alumnos que perciben que lgebra Lineal II y Teora de la Probabilidad II tienen un bajo nivel de dificultad (principalmente lgebra Lineal II) y Matemtica IV e Introduccin a la Economa tienen un nivel de dificultad alto (principalmente Introduccin a la Economa). Componentes de proyeccin tendientes a 0 indicarn que son alumnos que perciben que todas las materias tienen un nivel de dificultad medio. Si un alumno percibe a las 4 materias con alto nivel de dificultad, es decir, Xij = 1, j = 1, 2, 3, 4 entonces su componente de proyeccin es de 0,4905, Si un alumno percibe a las 4 materias con bajo nivel de dificultad, es decir, Xij = 1, j = 1, 2, 3, 4 entonces su componente de proyeccin es de 0,4905.

Figura 9.9.

Se puede apreciar que todas las componentes son positivas. El mnimo valor encontrado es de 0,6131. Esto indica que prcticamente todos los alumnos consideran que la materia lgebra Lineal II tiene un nivel de dificultad alto. Asimismo se aprecia que 2 alumnos (A y D) tienen los valores mximos de las componentes; esto es porque consideran que lgebra Lineal II y Teora de la Probabilidad II tienen un alto nivel de dificultad y Matemtica IV e Introduccin a la Economa tienen un nivel de dificultad bajo. Pero tambin se observan a los alumnos E, B y K los cuales se encuentran hacia el centro de las componentes de todos los alumnos. Estos 3 alumnos tienden a considerar a lgebra Lineal II como de alto nivel de dificultad y combinaciones de los 3 niveles con respecto a las otras 3 materias. Finalmente, en la figura 9.10., se pueden distinguir 3 grupos de alumnos internamente homogneos y externamente heterogneos.

Figura 9.10. Teorema 9.8.

Calculemos las componentes para cada uno de los alumnos:

Sea XMnxp() tal que Rango(X) = p. Entonces se cumple que:

SMA(X) 2 = P2p

338

339

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Siendo P2p el plano de dimensin 2 en p generado por los vectores V1 y V2, autovectores ortonormalizados de la matriz XtX asociados con sus 2 mayores autovalores.
Demostracin

d
i =1

Xi (X i , Pr oy L ) = 1
V

(X ) X
t i i =1 n

V1 X t XV1 V 2 X t XV 2
t

( )
i

( )

d (X , Pr oy
2 i i =1

Xi L

V1

) =

(X ) X
i i =1

1 V 2 X t XV 2

( )
n

Por definicin el subespacio de mejor ajuste mnimo cuadrtico SMA (X) 2 es el plano de dimensin 2 generado por 2 vectores ortonormalizados V1 y V2 ((V1)tV1 = 1, (V2)tV2 = 1 y (V1)tV2 = 0) que verifica que

Donde 1 es el mayor autovalor de XtX y el trmino Por lo tanto, minimizar


2 t t 2

(X ) X
t i i =1

es constante.

i =1

Xi p d 2 (X i , Pr oy SMA ( X ) 2 ) es mnima, es decir, es el plano P2 generado por los

d
i =1

Xi (X i , Pr oy L ) equivale a maximizar la forma 1


V

vectores V y V que verifica que 9.11., en 3).

d
i =1

(X i , Pr oy P p ) es mnima (ver figura


2

Xi

cuadrtica (V ) X XV con las restricciones (V2)tV2 = 1 y (V2)tV1 = 0. Para hallar el vector V2 utilizaremos el mtodo de los multiplicadores de Lagrange: Definimos las funciones: f(V2) = (V2)tXtXV2, g(V2) = (V2)tV2 1 y h(V2) = (V2)tV1 La expresin (V2)tV2 es una forma cuadrtica con matriz simtrica asociada Ip y (V2)tV1 es una funcin lineal en V2.

3 P2

Luego,
f (V 2 ) = 2g (V 2 ) + 1h (V 2 )

Xn
2 Pr oy X P3 n Pr oy X P3 2 2

X1

3 d(X1 , P2 )

1 Pr oy X P3 2

2X t XV 2 = 2 (2I p V 2 ) + 1V1

3 d (X 2 , P2 )

X2

3 d (X n , P2 )

Figura 9.11.

El vector V1 necesariamente debe ser el vector director de la recta de mejor ajuste mnimo cuadrtico SMA(X)1, ya que de lo contrario existira otro plano de dimensin 2 mejor. El objetivo es determinar el vector V2. Ahora bien,
d (X i , SMA(X) 2 ) = d
2 2

(X i , P2p )

= d (X i , Pr oyP p )
2 Xi
2

(V ) 2X XV = (V ) 2 V + (V ) V (V ) 2X XV = (V ) 2 V + (V ) V 2(V ) X XV = 2 (V ) V + (V ) V 2(V ) X XV = 2 (V ) V + (V ) V 2(V ) X XV = 2 .0 + .1 2(V ) X XV = 2 .1 + .0 2(V ) X XV = (V ) X XV =

1 t t 2 1 t 2 1 t 2 1 2 t t 2 2 t 2 2 t 2 1

2X t XV 2 = 2 2 V 2 + 1V1

1 1

1 t

1 t

1 t

2 t

2 t

2 t

1 t

2 t

1 t

2 t

Como V1 y V2 forman una base ortonormal de p entonces por la observacin 1 del teorema 9.6., se tiene que:
t Xi Xi i d 2 (X i , Pr oyX p ) = (X i ) X i L 1 L 2 P2 V V 2 2

Ahora bien, V1 es autovector de XtX con autovalor asociado 1, es decir, XtXV1 = 1V1. Por lo tanto: (XtXV1)t = (1V1)t (V1)tXtX = 1(V1)t En consecuencia,

i =1

Xi d 2 (X i , Pr oy L ) = 1
V

i =1

(X i ) t X i

X L i 1 V i =1

X L i 2 V i =1

De forma anloga al teorema anterior se deduce que: 340

(V ) X XV
2 t t

21 (V1 ) t V 2 = 1
2

= 2

(V ) X XV
2 t t

21.0 = 1
2

= 2

(V ) X XV
2 t t

1 = 0
2

= 2

341

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Por consiguiente, 2X XV = 2 2 V + 1V 2X XV = 2 2 V + 0.V


t 2 2 1 t 2 2 1

1. 2.

Xi La mayor contribucin a L es 0,9177, la cual corresponde con 2


V

2X t XV 2 = 2 2 V 2 + px1 2X XV = 2 2 V
t 2 2

la materia Matemtica IV. Xi Se puede apreciar que L es mxima cuando Xi1 = 1, Xi2 = 1, 2
V

X t XV 2 = 2 V 2 Es decir, maximizar f(V2) = (V2)tXtXV2 sujeto a (V2)tV2 = 1 y (V2)tV1 = 0 equivale a maximizar 2 que a su vez es autovalor de XtX con autovector asociado V2. En consecuencia, el vector V2 es el autovector normalizado asociado al segundo mayor autovalor de la matriz XtX.
Teorema 9.9.

3. 4.

5.

Sea XMnxp() tal que Rango(X) = p. Entonces se cumple que: SMA(X) q = Pqp 6. Siendo Pqp el plano de dimensin q en generado por los vectores
p

V1, V2, , Vq autovectores ortonormalizados de la matriz XtX asociados con sus q mayores autovalores.
Demostracin

7.

8.

Este teorema es una extensin de los teoremas 9.7., y 9.8., de forma tal que su demostracin es anloga a las demostraciones de estos teoremas.
Ejemplo Aplicado 9.3.

Xi3 = 1 y Xi4 = 1, mientras que es mnima cuando Xi1 = 1, Xi2 = 1, Xi3 = 1 y Xi4 = 1. Los valores mximo y mnimo son 1,6059 y 1,6059, respectivamente. El valor intermedio es 0, el cual se obtiene cuando Xij = 0, j = 1, 2, 3, 4. Componentes de proyeccin tendientes a 1,6059 indicarn que son alumnos que perciben que lgebra Lineal II e Introduccin a la Economa tienen un bajo nivel de dificultad y Matemtica IV y Teora de la Probabilidad II tienen un nivel de dificultad alto (principalmente Matemtica IV). Componentes de proyeccin tendientes a 1,6059 indicarn que son alumnos que perciben que lgebra Lineal II e Introduccin a la Economa tienen un alto nivel de dificultad y Matemtica IV y Teora de la Probabilidad II tienen un nivel de dificultad bajo (principalmente Matemtica IV). Componentes de proyeccin tendientes a 0 indicarn que son alumnos que perciben que todas las materias tienen un nivel de dificultad medio. Si un alumno percibe a las 4 materias con alto nivel de dificultad, es decir, Xij = 1, j = 1, 2, 3, 4 entonces su componente de proyeccin es de 0,6883, Si un alumno percibe a las 4 materias con bajo nivel de dificultad, es decir, Xij = 1, j = 1, 2, 3, 4 entonces su componente de proyeccin es de 0,6883.

Calculemos las componentes para cada uno de los alumnos: 1 1 1 1 0 2 = XV = 1 1 1 1 1 1 1 0 0 1 0 0 0 0 1 1 0 1 1 1 1 1 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1 0 1 1,6883 0,0000 0,2294 0,6883 0,2294 0,4588 0,9177 = 0,2294 0,2294 0,2294 0,2294 0,2294 1,1471 1,1471 0,0000

En relacin al ejemplo aplicado 9.2., determinemos SMA(X) 2 . Como 1 = 23 y 2 = 4 entonces: 0,6131 0,2294 0 , 1226 +B 0,9177 ; B1, B2} = {Z : Z = B1 0,5518 2 0,2294 0,5518 0,2294
4

SMA(X) 2 =

P24

LX 2
V

Xi . Veamos ahora la forma de Anteriormente observamos la forma de L 1


V

Xi L : 2
V

Xi L

V 2

= 0,2294Xi1 + 0,9177Xi2 0,2294Xi3 + 0,2294Xi4

El grfico de las componentes sobre el subespacio de mejor ajuste mnimo cuadrtico de dimensin 2 se puede apreciar en la figura 9.12.

Analicemos la estructura de esta componente:

342

343

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Siendo D

(A) Mrxr() la matriz diagonal definida por:

(D
Demostracin

si i = j (A) = i ij si i j 0

Donde 1, 2, , r son los autovalores comunes no nulos de XtX y XXt.

Por el teorema 7.23., se sabe que:


Figura 9.12.
X=

Se puede observar que el grfico se divide en 2 cuadrantes; el I y el IV. En el I cuadrante se encuentran los alumnos cuyas componentes son positivas con respecto a V1 y V2, es decir, los alumnos que en general opinan que lgebra Lineal II, Matemtica IV y Teora de la Probabilidad II son materias con alto nivel de dificultad. En el IV cuadrante se encuentran los alumnos cuyas componentes son positivas con respecto a V1 y negativas con respecto a V2, es decir, los alumnos que en general opinan que lgebra Lineal II y Teora de la Probabilidad II son materias con alto nivel de dificultad pero Matemtica IV tiene bajo nivel de dificultad. De esta forma se pueden obtener con mayor precisin grupos de alumnos internamente homogneos y externamente heterogneos (figura 9.13.).

i =1

i U i (V i ) t

X=

[U
1

2 U2 L

V1 2 V r Ur M r V
0 2 M 0 L L L
t

( ) ( ] )
t t

( )

X = U1

U2

L Ur

1 0 M 0

0 V1 0 V2 M M r r V

( ) ( )
t t

( )

X = UD
Definicin 9.4.

(A)V

Sea XMnxp() tal que Rango(X) = p. Se define como matriz aproximada de X por el subespacio de mejor ajuste mnimo cuadrtico de dimensin q ~ ~ SMA(X) q y se denota por X q a la matriz X q M nxp () definida por: ~ X q = UD (A )V t

Figura 9.13. Teorema 9.10.

Siendo VMpxq() y UMnxq() las matrices cuyas columnas son los autovectores ortonormalizados de las matrices XtX y XXt, respectivamente, asociados con los q mayores autovalores comunes de ambas matrices.
Definicin 9.5.

Sean XMnxp() tal que Rango(X) = r, VMpxr() y UMnxr(). Si V y U son las matrices cuyas columnas son los autovectores ortonormalizados de las matrices XtX y XXt, respectivamente, asociados con los autovalores comunes no nulos entonces:
X = UD

Sea XMnxp(). Se define como Norma de Frobenius de X y se denota por X F al escalar siguiente: X = Traza (X t X)

(A)V t

344

345

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Observacin: Por el teorema 7.13. (lema de Schur), si 1, 2, , p son los autovalores comunes no nulos de XtX entonces Traza(XtX) =
BSMA(X) q =


i =1 i =1 p

.100% i

i =1

. Luego,
Ejemplo Aplicado 9.4.

X
Definicin 9.6.

i =1

En relacin a los ejemplos aplicados 9.2., y 9.3., se tiene que:


BSMA (X )1 = 23 .100% = 76,67% 23 + 4 + 2 + 1

Sea XMnxp(). Se define como Medida de la Bondad del Ajuste del Subespacio de Mejor Ajuste Mnimo Cuadrtico de dimensin q a las filas de X y se denota por BSMA(X)q a:
2 ~ Xq F BSMA(X) q = .100% 2 XF

y BSMA(X) 2 = 23 + 4 .100% = 90,00% 23 + 4 + 2 + 1

Teorema 9.11.

Sean XMnxp() y 1, 2, , p. Si 1, 2, , p son los autovalores de la matriz XtX tales que 1 2 p entonces:

Se aprecia que el subespacio de mejor ajuste mnimo cuadrtico de dimensin 1 tiene una bondad de la aproximacin del 76,67%, medida que es relativamente alta y bastante buena para ser 1 dimensin. Sin embargo, el subespacio de mejor ajuste mnimo cuadrtico de dimensin 2 tiene una bondad de la aproximacin del 90%, medida que es excelente por lo cual resulta el subespacio de mejor ajuste mnimo cuadrtico idneo para analizar el comportamiento de los vectores filas de X (elementos).

BSMA(X) q =


i =1 i =1 p

.100%
i

Demostracin

Por definicin:
2 ~ Xq F BSMA(X) q = .100% 2 XF

Tambin por definicin: 1. 2. ~ Xq


F 2 ~ t~ ~ t~ = Traza ((X q ) X q ) = Traza ((X q ) X q ) = F 2 t t = Traza (X X) = Traza (X X) = 2 2

i =1

(X )

i =1

En consecuencia,

346

347

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

EJERCICIOS PROPUESTOS. 1.

3.

Para la matriz X del ejercicio 1, halle la correspondiente matriz R e interprete sus componentes. Sea XMnxp() una matriz de datos. Consideremos 2 puntos filas de dicha matriz, digamos el i-simo y el h-simo, es decir: (Xi)t = [ Xi1 Xi2 Xip] y (Xh)t = [Xh1 Xh2 Xhp]. Justifique la distancia eucldea para dar una medida del parecido entre estos 2 puntos. Luego seleccione aleatoriamente 3 pares distintos de puntos filas; manteniendo siempre 1 punto fila comn en cada par, de la matriz de datos del ejercicio 1 y analice el parecido entre los puntos de cada par y compare los anlisis realizados con los 3 pares de puntos. Sean X, Yn tales que (1n)tX = (1n)tY = 0 y adems X = Y = 1 . Demuestre que:
5.1. 5.2. 5.3.

A continuacin se muestra una matriz de datos XM10x3() que contiene informacin de las notas definitivas obtenidas por diez (10) alumnos de primer semestre de la escuela en Matemtica I, Estadstica I y Computacin I en un determinado semestre:
Alumno Matemtica I Estadstica I Computacin I

4.

A B C D E F G H I J
1.1.

10 12 6 6 8 7 12 11 13 5

12 14 10 8 10 5 10 14 18 9

14 15 12 10 12 10 12 16 19 10
6. 5.

Si 1 es el ngulo entre X e Y entonces Cos(1) = rXY. Si se define el vector Z = X Cos(1)Y y 2 es el ngulo entre Z e Y entonces Cos(2) = 0. A partir de lo obtenido en el apartado anterior, podra asegurarse que las variables Z e Y estn incorrelacionadas?

Sean Yn, XMnxp() una matriz de rango columna completo cuyas columnas generan el plano Ppn . La proyeccin ortogonal de Y sobre Ppn induce la siguiente particin del vector Y: Y = Pr oy Y + E, Pn
p

1.2.

1.3.

Represente grficamente los puntos fila de la matriz de datos anterior sobre 3. Ubique tambin el punto fila de las medias aritmticas de las 3 materias. Construya la matriz de datos centrada asociada a la matriz de datos. Represente grficamente sobre 3 los nuevos puntos obtenidos. Compare las representaciones grficas de los 2 apartados anteriores.

siendo E = Y Pr oy
7.

Y n Pp

. Demuestre que Y

= E + Y Pr oy Y . Pn
t
p

Sean Yn y L 1n la recta en n definida por: L 1n = {Zn: Z = c 1n , c} Demuestre que:


7.1. 7.2.
Pr oy Y L1 = Y1n .
n

2.

Sean XMnxp() una matriz de datos. Demuestre que:


2.1.

2.2.

tX tiene la siguiente forma: La matriz V = X j 2 si i = j X Vij = i j X X Cos ( ) si i j ij t La matriz R = D VD es la matriz de correlaciones asociada a la matriz de datos X, siendo la matriz DMpxp la matriz diagonal definida por:
1 1 X 0 M 0 0 1 2 X M 0 L L L 0 0 M 1 p X

Si es el ngulo entre Y e Pr oy Y L1 entonces:


n

Cos() =

nY
n i =1

.
2

7.3. 8.

d2(Y, L 1n ) = nS 2 Y.

D=

En relacin al ejercicio 1 tome las notas de 3 alumnos en las materias Matemtica I y Estadstica I. Llame a estos 2 vectores columnas X e Y.

348

349

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

8.1.

Determine la mejor representacin en el sentido de mnima distancia del vector X sobre la recta L 13 en 3. y Y . Determine el coseno del ngulo entre los vectores X

11.2.

8.2. 9.

Sean X, Yn y P2n el plano de dimensin 2 en n que contiene al origen definido por:


12.

11.3.

1 Determine la Proyeccin Ortogonal del vector Y = 2 sobre 3 el plano anterior. Determine la distancia del vector Y al plano anterior.

Sean Yn y XMnx2() tal que X1 y X2 son ortogonales.


12.1. 12.2.

P = {Z : Z = B1 1n + B2X, B1, B2 }
n 2 n

Demuestre que: = a 1n +bX Pr oy Y Pn


2

Siendo:

12.3.
n n n

Describa el plano P2n que contiene el origen y est generado por X1 y X2. Demuestre que: (X1 ) t Y 1 (X 2 ) t Y 2 Pr oy Y X + 2 t 2X n = P2 (X1 ) t X1 (X ) X Demuestre que: d(Y, P2n ) = YtY ((X1 ) t Y) 2 ((X 2 ) t Y) 2 (X1 ) t X1 (X 2 ) t X 2

a=

Yi X i 2 Xi X i Yi
i =1 i =1 n i =1 i =1

n n Xi Xi i =1 i =1
2

y b=

n X i Yi X i Yi
i =1 i =1 i =1

n n Xi Xi i =1 i =1
n 2

13.

Observacin: Note que Pr oy Y define la ecuacin de regresin lineal estimada por Pn


2

Se le consult a un grupo de once (11) personas su apreciacin acerca de tres (3) programas de televisin del canal Venevisin: Csate y Vers, Que Locura y Sbado Sensacional. Para cada respuesta se adopt la siguiente escala: 1: Le gusta el programa y lo ve con regularidad. 0: Es indiferente al programa y lo ve casualmente. -1: No le gusta el programa y nunca lo ve. Los resultados de la consulta se muestran a continuacin: Individuo I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11
13.1.

el mtodo de los mnimos cuadrados de Y en funcin de X.


10.

En relacin al ejercicio 1 tome las notas de los alumnos en las materias Matemtica I y Estadstica I. Llame a estos 2 vectores columnas X e Y.
10.1. 10.2. 10.3.

Describa el plano P

10 2

que contiene el origen y est generado

por 110 y X. Determine la Proyeccin Ortogonal del vector Y sobre el plano anterior. Qu representa este vector? Determine la distancia del vector Y al plano dado.

11.

3 Sean XM3x2(), Y3 y P2 el plano de dimensin 2 en 3 que contiene al origen definido por las columnas de X, siendo X:

1 0 X = 0 2 0 1
11.1.
3 Describa la ecuacin del plano P2 .

Csate y Vers 1 0 1 0 1 0 0 0 0 1 0

Que Locura 0 1 0 1 0 1 1 0 0 0 1

Sbado Sensacional 0 0 -1 0 0 1 0 0 1 1 1

13.2.

Si se desea tener una medida de la bondad de la aproximacin de por lo menos 60%, determine el subespacio de mejor ajuste a las filas de la matriz de datos anterior. Interprete la estructura general de la(s) componente(s) de proyeccin.

350

351

CAPTULO 9: INTERPRETACIONES GEOMTRICAS

13.3.

Calcule y grafique las componentes de proyeccin ortogonal de las filas de la matriz de datos sobre el subespacio de 3 generado en el apartado 13.1. Realice e interprete el grfico.

14.

Se le consult a un grupo de diez (10) personas si les gusta o no hacer las siguientes actividades: Ir al Cine, Ir a la Playa, Pasear en Centros Comerciales. y Rumbear. Para ello se utiliz la siguiente escala: 1: Si les gusta y 0: No les gusta. A continuacin se muestran los resultados: Persona A B C D E F G H I J
14.1.

Ir al Cine 1 0 1 1 0 0 0 1 0 1

Ir a la Playa 1 0 1 1 1 0 1 1 1 0

Pasear en C.C. 0 1 0 0 0 0 0 1 0 1

Rumbear 0 1 1 0 0 1 0 1 0 0

14.2. 14.3.

Determine el sub-espacio de ajuste mnimo cuadrtico a las filas de la matriz de datos anterior que Ud. mejor considere para este caso. Justifique su respuesta. Interprete la estructura general de la(s) componente(s) de proyeccin. Calcule y grafique las componentes de proyeccin de las filas de la matriz de datos sobre el sub-espacio de 4 generado en el apartado 16.1. Interprete el grfico.

352

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Captulo

10

Ir A = P 1 ( mr ) xr

rx ( n r ) 1 Q ( m r ) x ( n r )

PSEUDOS INVERSAS

PMmxm(), QMnxn() (P, Q no singulares):

10.1. INTRODUCCIN. En este captulo se presenta el concepto de las Pseudos Inversas, el cual permite disponer de una matriz que tiene propiedades muy similares a la de la matriz inversa pero en el caso de una matriz cuadrada que no es invertible o de una matriz rectangular. Se exponen las 3 pseudos inversas; Inversa Generalizada, Inversa Condicional y Inversa Mnimo Cuadrtica, as como tambin sus aplicaciones para la resolucin de Sistemas de Ecuaciones Lineales Consistentes. 10.2. INVERSA GENERALIZADA. DEFINICIN, PROPIEDADES Y EJEMPLOS. Definicin 10.1. Sean AMmxn() y BMnxm(). Se dice que B es inversa generalizada de A si: 1. 2. 3. 4. AB es simtrica. BA es simtrica. ABA = A. BAB = B.

Ir A = P 1 Ir ( m r ) xr

rx ( n r ) Q 1

PMmxm(), QMnxn() (P, Q no singulares): A = BC, siendo: BMmxr() y QMrxn() definidas por: Ir B = P 1 y C = Ir ( mr ) xr

rx ( n r ) Q 1

Ir Ir Por el teorema 1.28., Rango(B)= Rango( P 1 )= Rango( )= r ( m r ) xr ( m r ) xr y Rango( I r

rx ( n r ) Q 1 ) = Rango( I r

rx ( n r ) ) = r. Por lo tanto, por el

teorema 8.10., las matrices BtB y CCt son definidas positivas y no singulares. Sea Ag definida de la siguiente manera: Ag = Ct(CCt)-1(BtB)-1Bt Veamos que Ag es inversa generalizada de A: 1. 2. AAg = BCCt(CCt)-1(BtB)-1Bt = B(BtB)-1Bt. Luego, AAg es una matriz de proyeccin, la cual es simtrica. AgA = Ct(CCt)-1(BtB)-1BtBC = Ct(CCt)-1C = D(DtD)-1Dt, con D = Ct. Luego, AgA es una matriz de proyeccin, la cual es simtrica. AAgA = B(BtB)-1BtBC = BC = A. AgAAg = Ct(CCt)-1CCt(CCt)-1(BtB)-1Bt = Ct(CCt)-1(BtB)-1Bt = Ag.

Es claro que si m = n y A es no singular entonces A-1 es inversa generalizada de A. Teorema 10.1. Sean AMmxn(). Siempre existe una inversa generalizada de A y adems es nica. Se denota por Ag. Demostracin Supongamos que Rango(A) = r. Por el teorema 1.30.: PMmxm(), QMnxn() (P, Q no singulares):

3. 4.

En consecuencia, Ag es inversa generalizada de A. Veamos ahora que es nica. Supongamos que BMnxm() es tambin inversa generalizada de A. Luego, AB y BA son simtricas, ABA = A y BAB = B. Por lo tanto, 1. 2. 3. AAg = ABAAg = (AB)t(AAg)t = (AAgAB)t = (AB)t = AB. AgA = AgABA = (AgA)t(BA)t = (BAAgA)t = (BA)t = BA. Ag = AgAAg = BAAg = BAB = B.

Ir PAQ = R(A) = ( m r ) xr

rx ( n r ) ( mr ) x ( n r )

Por consiguiente, la inversa generalizada Ag de A es nica.


Ejemplo 10.1.

PMmxm(), QMnxn() (P, Q no singulares):

Para la matriz A del ejemplo 1.37., se obtuvo que:

354

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

1 0 0 0 1 0 2 3 A = 3 2 1 1 , R (A) = 0 1 0 0 ; 0 0 1 0 5 4 2 6
0 2 P = 1 2 4 1 1 2 Se puede verificar que:
1 1 0 2 0 P 1 = 3 2 1 , Q 1 = 0 5 4 2 0 0 1 0 0 0 0 1 0 4 19 4 7 2 1

= 0

1 1 0 5 , Q= 4 0 1 2 0

0 0 4 1 0 19 4 0 1 7 2 0 0 1

0 573 304 224 829 829 829 0 304 468 266 829 829 829 0 0 1 633 224 266 19 7 4 829 829 829 4 2 1 0 1

5 21 4 5 2

21 4 45 8 5 2

5 2 5 2 3 2

1 3 5 0 2 4 2 1 2

314 36 81 829 829 829 148 250 62 829 829 829 = 383 347 240 829 829 9 829 336 187 829 829 829
Teorema 10.2.

Sea AMmxn(). 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. (At)g = (Ag)t. (Ag)g = A. Rango(A) = Rango(Ag) = Rango(AAg) = Rango(AgA). (AtA)g = Ag(At)g. Si m = n y A es simtrica entonces Ag es simtrica. Si m = n y A es simtrica entonces AAg = AgA. Si m = n y A es simtrica e idempotente entonces Ag = A. AAg, AgA, Im AAg y In AgA son simtricas e idempotentes. Si Rango(A) = r entonces Rango(Im AAg) = m r y Rango(In AgA) = n r. (AAg)g = AAg. (AgA)g = AgA. Si PMmxm() y QMnxn() son ortogonales entonces (PAQ)g = QtAgPt. Si Rango(A) = n entonces Ag = (AtA)-1At. Si Rango(A) = m entonces Ag = At(AAt)-1. Si BMmxr() y CMrxn(), con Rango(B) = Rango(C) = r entonces (BC)g = CgBg.

Asimismo,
1 0 0 4 1 0 0 1 0 2 1 0 0 0 1 B = P 0 1 0 = 3 2 1 , C = 0 1 0 0 Q = 0 1 0 19 4 0 0 1 7 5 4 2 0 0 1 0 0 1 0 2
1

Luego, 17 35 26 15 t B B = 26 20 10 , CC = 19 14 15 10 9
t

19 377 16 133 8

14 133 8 53 4

13. 14. 15.

Se puede verificar que:


5 2 5 , 2 3 2 304 224 573 829 829 829 t 1 304 468 266 CC = 829 829 829 266 633 224 829 829 829 5 1 B t B = 21 4 5 2 21 4 45 8 5 2

Demostracin

1.

( )

Sean B = At y Bg = (Ag)t. Verifiquemos que Bg cumple las 4 propiedades: 1.1. 1.2. 1.3. 1.4. BBg = At(Ag)t = (AgA)t = AgA. Como AgA es simtrica entonces BBg es simtrica. BgB = (Ag)tAt = (AAg)t = AAg. Como AAg es simtrica entonces BgB es simtrica. BBgB = AgAAt = (AgA)tAt = (AAgA)t = At = B. BgBBg = AAg(Ag)t = (AAg)t(Ag)t = (AgAAg)t = (Ag)t = Bg.

( )
Por lo tanto,

Por lo tanto, (Ag)t es la inversa generalizada de At. Ag = Ct(CCt)-1(BtB)-1Bt 2. Sean B = Ag y Bg = A. Verifiquemos que Bg cumple las 4 propiedades:

355

356

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

2.1. 2.2. 2.3. 2.4.

BBg = AgA. Como AgA es simtrica entonces BBg es simtrica. BgB = AAg. Como AAg es simtrica entonces BgB es simtrica. BBgB = AgAAg = Ag = B. BgBBg = AAgA = A = Bg.

AAg = A y AgAAg = AgA AAg = A y Ag = AgA Como AAg = AgA entonces Ag = A. 8. Es evidente que AAg, AgA, Im AAg y In AgA son simtricas. Veamos ahora que son idempotentes. 8.1. 8.2. 8.3. (AAg)2 = AAgAAg = (AAgA)Ag = AAg. (AgA)2 = AgAAgA = (AgAAg)A = AgA. (Im AAg)2 = (Im AAg)(Im AAg) = Im AAg AAg + (AAg)2. Como AAg es idempotente entonces (Im AAg)2 = Im 2AAg + (AAg) = Im AAg. (In AgA)2 = (In AgA)(In AgA) = In AgA AgA + (AgA)2. Como AgA es idempotente entonces (In AgA)2 = In 2AgA + (AgA) = In AgA.

Por consiguiente, A es la inversa generalizada de Ag. 3. AAgA = A y AgAAg = Ag. Luego: 3.1. 3.2. 3.3. 3.4. Rango(A) = Rango(AAgA) Rango(AAg) Rango(A). Luego, Rango(AAg) = Rango(A). Rango(A) = Rango(AAgA) Rango(AgA) Rango(A). Luego, Rango(AgA) = Rango(A). Rango(Ag)=Rango(AgAAg) Rango(AAg) Rango(Ag). Luego, Rango(AAg) = Rango(Ag). Rango(Ag)=Rango(AgAAg) Rango(AgA) Rango(Ag). Luego, Rango(AgA) = Rango(Ag). 9.

8.4.

En consecuencia, AAg, AgA, Im AAg y In AgA son idempotentes. Por la propiedad 8, AAg, AgA, Im AAg y In AgA son simtricas e idempotentes. Luego, por el teorema 7.18., Rango(Im AAg) = Traza(Im AAg), Rango(In AgA) = Traza(In AgA), Rango(AgA) = Traza(AgA) y Rango(AAg) = Traza(AAg). En consecuencia: 1. Rango(Im AAg) = Traza(Im AAg) Rango(Im AAg) = Traza(Im) Traza(AAg) Rango(Im AAg) = m Rango(AAg) Rango(Im AAg) = m Rango(A) Rango(Im AAg) = m r Rango(In AgA) = Traza(In AgA) Rango(In AgA) = Traza(In) Traza(AgA) Rango(In AgA) = n Rango(AgA) Rango(In AgA) = n Rango(A) Rango(In AgA) = n r

Por lo tanto, Rango(A) = Rango(Ag) = Rango(AAg) = Rango(AgA). 4. Sean B = AtA y Bg = Ag(At)g. Verifiquemos que Bg cumple las 4 propiedades: 4.1. BBg = (AtA)(Ag(At)g) = At(AAg)(At)g = At(AAg)t(At)g. Por la propiedad 1, (At)g = (Ag)t. Luego, BBg = At(AAg)t(Ag)t = (AAgA)t(Ag)t = At(Ag)t = (AgA)t = AgA. Como AgA es simtrica entonces BBg es simtrica. BgB = (Ag(At)g)(AtA). Por la propiedad 1, (At)g = (Ag)t. Luego, BgB = (Ag(Ag)t)(AtA) = Ag(Ag)tAtA = Ag(AAg)tA = AgAAgA = AgA. Como AgA es simtrica entonces BgB es simtrica. BBgB = AgA(AtA) = (AgA)tAtA = (AAgA)tA = AtA = B. BgBBg = (AgA)(Ag(At)g) = AgAAg(At)g = Ag(At)g = Bg.

4.2.

2.

4.3. 4.4.

Por consiguiente, Ag(At)g es la inversa generalizada de AtA. 5. Por la propiedad 1, se tiene que (Ag)t = (At)g. Como A es simtrica entonces (Ag)t = Ag, es decir, Ag es simtrica. AAg = (AAg)t = (Ag)tAt. Por la propiedad 1, se tiene que AAg = (At)gAt y como A es simtrica entonces AAg = AgA. Como A es simtrica, entonces por la propiedad 6 se tiene que AAg = AgA. Luego, (A)(AAg) = (A)(AgA) y (AgA)(AAg) = (AgA)(AgA) AAAg = AAgA y AgAAAg = AgAAgA A2Ag = A y AgA2Ag = AgA Como A es idempotente, entonces: 357 10.

Es claro que (AAg)Mmxm(). Por la propiedad 8, se tiene que AAg es simtrica e idempotente. Luego, por la propiedad 7, (AAg)g = AAg. Es claro que (AgA)Mnxn(). Por la propiedad 8, se tiene que AgA es simtrica e idempotente. Luego, por la propiedad 7, (AgA)g = AgA. Sean B = PAQ y Bg = QtAgPt. Verifiquemos que Bg cumple las 4 propiedades: 12.1. BBg = (PAQ)(QtAgPt) = PAQQtAgPt = PAAgPt. Luego, (BBg)t = (PAAgPt)t = (Pt)t(AAg)tPt = PAAgPt = BBg. Por lo tanto, BBg es simtrica.

6.

11.

7.

12.

358

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

12.2.

12.3. 12.4.

BgB = (QtAgPt)(PAQ) = QtAgPtPAQ = QtAgAQ. Luego, (BgB)t = (QtAgAQ)t = Qt(AgA)t(Qt)t = QtAgAQ = BgB. Por lo tanto, BgB es simtrica. BBgB = (PAAgPt)(PAQ) = PAAgPtPAQ = PAAgAQ = PAQ = B. BgBBg = (QtAgAQ)(QtAgPt) = QtAgAQQtAgPt = QtAgAAgPt = QtAgPt = Bg.

Es decir, A = BC, siendo B = Im y C = A. En consecuencia, Ag = Ct(CCt)-1(BtB)-1Bt = At(AAt)-1((Im)tIm)-1(Im)t = At(AAt)-1 15. Se sabe que la matriz A se puede expresar de la forma A = BC, con BMmxr(), CMrxn() y Rango(B) = Rango(C) = r. Por lo tanto, Ag = (BC)g = Ct(CCt)-1(BtB)-1Bt Como BMmxr() y Rango(B) = r entonces por la propiedad 13 se tiene que Bg = (BtB)-1Bt. Asimismo, como CMrxn() y Rango(C) = r entonces por la propiedad 14 se tiene que Cg = Ct(CCt)-1. En consecuencia, (BC)g = CgBg Observaciones:

Por consiguiente, QtAgPt es la inversa generalizada de PAQ. 13. Por el teorema 1.30.: PMmxm(), QMnxn() (P, Q no singulares): Ir PAQ = ( m r ) xr rx ( n r ) ( m r ) x ( n r )

Como Rango(A) = r = n entonces no es necesario aplicar operaciones elementales de columnas sobre A para obtener su matriz normal R(A), es decir, Q = In. Adems, In R(A) = ( m n ) xn Por consiguiente,

1. 2.

Toda matriz de proyeccin H = X(XtX)-1Xt puede ser escrita de la forma H = XXg, ya que X es de rango columna completo. Pr oy Y = HY = XXgY. Pn
p

10.3. INVERSA CONDICIONAL. DEFINICIN, PROPIEDADES Y EJEMPLOS. Definicin 10.2.

In A = P-1 ( m n ) xn Es decir, A = BC, siendo B = A y C = In. En consecuencia, Ag = Ct(CCt)-1(BtB)-1Bt = (In)t(In(In)t)-1(AtA)-1At = (AtA)-1At

Sean AMmxn() y BMnxm(). Se dice que B es inversa condicional de A si ABA = A. Es claro que Ag es tambin inversa condicional de A. Esto garantiza que siempre existe al menos una inversa condicional de A.
Teorema 10.3.

14.

Por el teorema 1.30.: PMmxm(), QMnxn() (P, Q no singulares): Ir PAQ = ( m r ) xr rx ( n r ) ( m r ) x ( n r ) Sea AMmxn(). No siempre existe una nica inversa condicional de A.
Demostracin

Supongamos que Rango(A) = r. Por el teorema 1.31.: PMmxm(), QMnxn() (P, Q no singulares):

Como Rango(A) = r = m entonces no es necesario aplicar operaciones elementales de filas sobre A para obtener su matriz normal R(A), es decir, P = Im. Adems, R(A) = [ I m Por consiguiente, A = [ Im 359 mx ( n m ) ]Q-1 mx ( n m ) ]

Dr PAQ = (A) = ( m r ) xr

rx ( n r ) ( m r ) x ( n r )

Siendo DrMrxr() una matriz diagonal y no singular. PMmxm(), QMnxn() (P, Q no singulares): A = P-1(A)Q-1

360

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Es claro que Rango((A)) = r. Adems:


Dr (A) = ( mr ) xr rx ( n r ) I r = Dr ( m r ) x ( n r ) ( mr ) xr

(A)((A))g(A) = (A)

Ir rx ( n r ) = Dr Ir ( mr ) xr

rx ( n r )

Sea B = Q((A))gP Es claro que A = P-1(A)Q-1. En consecuencia, ABA = (P-1(A)Q-1)(Q((A))gP)(P-1(A)Q-1) ABA = P-1(A)Q-1Q((A))gPP-1(A)Q-1 ABA = P-1(A)((A))g(A)Q-1 ABA = P-1(A)Q-1 ABA = A Por lo tanto, B = Q((A))gP es inversa condicional de A. Como las matrices P y Q no son nicas para generar a (A) entonces la inversa condicional no es nica. Observacin:

Luego, Ir (A) = BC, siendo BMmxr(), CMrxn() definidas por B = y ( m r ) xr C = Dr[ I r rx ( n r ) ] con Rango(B) = Rango(C) = r. En consecuencia, ((A))g = Ct(CCt)-1(BtB)-1Bt Ahora bien, CCt = Dr[ I r = Dr[ I r rx ( n r ) ](Dr[ I r rx ( n r ) ])t

Ir t 2 rx ( n r ) ] (Dr) = DrIrDr = (Dr) ( n r ) xr ( m r ) xr

El clculo de una inversa condicional de A depende de la matriz (A) que se elija. Sin embargo, un algoritmo sencillo para el clculo de una inversa condicional de A es el siguiente: 1. 2. 3. 4. 5. ( m r ) xr ] Calcular Rango(A) = r. Elegir una submatriz M de A de orden rxr. Hallar (M-1)t. Reemplazar en A la submatriz M por (M-1)t y los restantes elementos por ceros. Denotar esta matriz por N. Nt es una inversa condicional de A.

B B = Ir

Ir = Ir. rx ( m r )

Por consiguiente, Ir t 2 -1 -1 ((A))g = (Dr) ((Dr) ) (Ir) [ I r ( n r ) xr Ir -1 = Dr(DrDr) [ I r ( n r ) xr Ir -1 -1 = Dr(Dr) (Dr) [ I r ( n r ) xr Ir -1 = (Dr) [ I r ( n r ) r (D )1 = r [ Ir ( n r ) xr (D )1 = r [ Ir ( n r ) xr (D )1 = r ( n r ) xr Ahora bien, 361

Ejemplo 10.2.

En relacin a la matriz A del ejemplo 10.1.:

( m r ) xr ] ( m r ) xr ]

1 0 2 3 A = 3 2 1 1 5 4 2 6 1. 2. Rango(A) = 3 1 0 2 Sea M = 3 2 1 . 5 4 2 0 2 Se puede verificar que M = 1 2 4 1 1 2


1

( m r ) xr ] ( m r ) xr ] ( m r ) xr ]

3.

rx ( m r ) ( n r ) x ( m r )

1 5 . Por lo tanto, 4 1 2

(M ) =
1 t

0 1 2

1 4 2 5 4

1 2 1 . 1 2

362

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

4.

0 N= 2 1

2 5 4

2 1 1 2

0 0 . 0

Demostracin

Sea (AtA)c una inversa condicional de AtA. Por lo tanto: 1 5 4 . 1 2 0 (AtA)(AtA)c(AtA) = AtA Premultiplicando a ambos lados de la igualdad anterior por (Ag)t se tiene que: (Ag)t(AtA)(AtA)c(AtA) = (Ag)tAtA (Ag)tAtA(AtA)cAtA = (Ag)tAtA (AAg)tA(AtA)cAtA = (AAg)tA AAgA(AtA)cAtA = AAgA A(AtA)cAtA = A (ABA = A) Postmultiplicando a ambos lados de la igualdad anterior por Ag se tiene que: A(AtA)cAtAAg = AAg A(AtA)cAt(AAg)t = AAg A(AtA)c(AAgA)t = AAg A(AtA)cAt = AAg (AB = AAg) Como AAg es simtrica entonces AB es simtrica. Luego, como ABA = A y AB es simtrica entonces B es inversa mnimo cuadrtica de A. Observacin: Por el teorema anterior, como toda inversa mnimo cuadrtica depende de una inversa condicional de AtA entonces la inversa mnimo cuadrtica no siempre es nica.
Ejemplo 10.3.

5.

Una inversa condicional de A es B = Nt =

0 2 1 2 4 1 1 2 0 0

Teorema 10.4.

Sean AMmxn() y BMnxm(). Si B es inversa condicional de A entonces: Rango(A) = Rango(AB) = Rango(BA) Rango(B).
Demostracin

Por hiptesis, ABA = A. Luego: 1. 2. 3. Rango(A) = Rango(ABA) Rango(AB) Rango(A). Luego, Rango(AB) = Rango(A). Rango(A) = Rango(ABA) Rango(BA) Rango(A). Luego, Rango(BA) = Rango(A). Rango(A) = Rango(ABA) Rango(BA) Rango(B). Luego, Rango(BA) Rango(B).

Por lo tanto, Rango(A) = Rango(AB) = Rango(BA) Rango(B).


10.4. INVERSA MNIMO PROPIEDADES Y EJEMPLOS. Definicin 10.3. CUADRTICA. DEFINICIN,

En relacin a la matriz A del ejemplo 10.1.: 1 0 2 3 A = 3 2 1 1 5 4 2 6 Se puede verificar que:


35 26 AtA = 15 36 26 15 36 20 10 26 10 9 19 26 19 46

Sean AMmxn() y BMnxm(). Se dice que B es inversa mnimo cuadrtica de A si: 1. 2. ABA = A. AB es simtrica.

Es claro que Ag es tambin inversa mnimo cuadrtica de A y que toda inversa mnimo cuadrtica es tambin inversa condicional. Esto garantiza que siempre existe al menos una inversa mnimo cuadrtica de A.
Teorema 10.5.

Sean AMmxn() y BMnxm(). Si (AtA)c es una inversa condicional de AtA entonces la matriz B definida por: B = (AtA)cAt Es inversa mnimo cuadrtica de A.
363

Seguimos los pasos para hallar una inversa condicional de AtA: 1. Rango(A) = 3 Rango(AtA) = 3.

364

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

2.

20 10 26 Sea M = 10 9 19 . 26 19 46 34 53 44 256 256 256 1 34 120 244 y Se puede verificar que M = 256 256 256 120 80 44 256 256 256 53 34 44 256 256 256 t 244 . M 1 = 34 120 256 256 256 120 80 44 256 256 256 0 0 0 0 53 34 44 0 256 256 256 N= . 34 244 0 120 256 256 256 80 0 44 120 256 256 256 Una inversa condicional de AtA es 0 0 0 0 53 34 44 0 c 256 256 256 AtA = . 34 244 0 120 256 256 256 80 0 44 120 256 256 256

Amc = (AtA)cAt Es inversa mnimo cuadrtica de A. Es claro que (AtA)Mnxn(). Como Rango(A) = n entonces Rango(AtA) = n. Por consiguiente, AtA es invertible y en consecuencia Amc = (AtA)-1At. Como (AtA)-1 es nica entonces Amc es nica.
Teorema 10.7.

3.

( )

Sean AMmxn() y Ac, AmcMnxm() tales que Ac y Amc son una inversa condicional y una inversa mnimo cuadrtica de A, respectivamente. 1. 2. 3. AcA = In si y slo si AgA = In. AmcA = In si y slo si AgA = In. AcA = In si y slo si AmcA = In.

4.

Demostracin

1.

5.

CN (): Si AcA = In entonces AgA = In. Por definicin de inversa generalizada: AAgA = A Ac(AAgA) = Ac(A) (AcA)(AgA) = AcA (In)(AgA) = In AgA = In CS (): Si AgA = In entonces AcA = In. Por definicin de inversa condicional: AAcA = A A (AAcA) = Ag(A) (AgA)(AcA) = AgA (In)(AcA) = In AcA = In
g

( )

Luego, una inversa mnimo cuadrtica de A es la siguiente matriz B: 0 0 0 0 53 34 44 0 256 256 256 B = (AtA)cAt = 34 244 0 120 256 256 256 80 0 44 120 256 256 256
=
Teorema 10.6.

1 0 2 3

3 5 2 4 1 2 1 6

0 0 3 1 4 8 3 1 2 4 0 1 2

0 1 16 3 8 1 4

2. 3.

La demostracin es anloga a la demostracin del apartado 1. La demostracin es anloga a la demostracin del apartado 1.

Teorema 10.8.

Sea AMmxn(). Si Rango(A) = n entonces existe una nica inversa mnimo cuadrtica de A.
Demostracin

Sean AMmxn(), B, C, DMnxm() e Ym. La expresin: ABY = Y Es invariante para cualquier inversa condicional B de A.

Por el teorema 10.5., si (A A) es una inversa condicional de A A entonces la siguiente matriz:

365

366

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Demostracin

1. 2.

Sean C, DMnxm() inversas condicionales de A tales que ACY = Y. Luego, ACA = A y ADA = A. Por lo tanto, ACY = Y AD(ACY) = (AD)Y (ADA)CY = ADY ACY = ADY ADY = ACY ADY = Y Es decir, la expresin ABY = Y es invariante para cualquier inversa condicional B de A. Observacin: Como la inversa generalizada de A (Ag) y cualquier inversa mnimo cuadrtica de A, digamos Amc son inversas condicionales de A entonces la expresin ABY = Y es invariante para cualquier pseudo inversa B (generalizada, condicional o mnimo cuadrtica) de A.
10.5. APLICACIONES LINEALES. Teorema 10.9. SOBRE SISTEMAS DE ECUACIONES

El SEL AX = Y es consistente si y slo si existe una inversa mnimo cuadrtica Amc de A tal que AAmcY = Y. El SEL AX = Y es consistente si y slo si AAgY = Y.

Teorema 10.10.

Sean AMmxn(), Xn e Ym. Si Rango(A) = m entonces el SEL AX = Y es consistente.


Demostracin

Como Rango(A) = m entonces por el teorema 10.2., apartado 12 se tiene que Ag = At(AAt)-1. Luego, AAgY = A(At(AAt)-1)Y = AAt(AAt)-1Y = ImY = Y. Por el teorema anterior, el SEL AX = Y es consistente.
Teorema 10.11. (Solucin General de un SEL)

Sean AMmxn(), Xn e Ym. Si el SEL AX = Y es consistente entonces su solucin general denotada por Xsg es: Xsg = AcY + (In AcA)Z Siendo Ac una inversa condicional de A y Zn.
Demostracin

Sean AMmxn(), Xn e Ym. El SEL AX = Y es consistente si y slo si existe una inversa condicional Ac de A tal que AAcY = Y.
Demostracin

Para demostrar que el vector Xsg es la solucin general del SEL AX = Y debemos probar que es solucin del SEL AX = Y y que toda solucin de dicho sistema tiene la forma de Xsg. 1. 2. AXsg = A(AcY + (In AcA)Z) = AAcY + AZ AAcAZ = Y + AZ AZ = Y. Por lo tanto, Xsg es solucin del SEL AX = Y Si X0 es solucin del SEL AX = Y entonces:

CN(): Si el SEL AX = Y es consistente entonces existe una inversa condicional Ac de A tal que AAcY = Y. Por hiptesis, el SEL AX = Y es consistente, es decir: X0: AX0 = Y Sea AcMnxm() tal que Ac es una inversa condicional de A. Luego, AAcY = AAcAX0 = AX0 = Y CS(): Si existe una inversa condicional Ac de A tal que AAcY = Y entonces el SEL AX = Y es consistente. Si existe una inversa condicional Ac de A tal que AAcY = Y entonces existe X0n con X0 = AcY tal que AX0 = Y. Luego, el SEL AX = Y es consistente. Observacin: Por el teorema 10.8., como la expresin ABY = Y es invariante para cualquier inversa condicional B de A entonces:

AX0 = Y AcAX0 = AcY nx1 = AcY AcAX0 X0 + nx1 = AcY AcAX0 + X0 X0 = AcY + (In AcA)X0 X0 = AcY + (In AcA)Z; Z = X0 X0 = Xsg Por consiguiente, X0 es de la misma forma que Xsg. Observacin: Como cualquier inversa mnimo cuadrtica y la inversa generalizada de A son tambin inversas condicionales de A entonces la solucin general tambin se puede escribir de la forma Xsg = AmcY + (In AmcA)Z o de la forma Xsg = AgY + (In AgA)Z, siendo Amc una inversa mnimo cuadrtica de A. Adems, si Z = nx1 entonces AgY es solucin del SEL AX = Y y existen una inversa condicional Ac y una inversa mnimo cuadrtica Amc de A tales que AcY y AmcY son soluciones del SEL AX = Y.

367

368

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Teorema 10.12.

Xsg = AgY + (In AgA)Z; Zn. Sea BMnxn() la matriz definida por B = In AgA. La matriz B se puede expresar particionada por columnas 1xn de la siguiente forma: B = [B1 B2 Bn] Luego, para Z0 = nx1, Z1 = e1, Z2 = e2, , Zn = en se obtienen n + 1 soluciones del SEL AX = Y: X0 = AgY + [B1 B2 Bn]nx1 = AgY 1 0 X1 = AgY + [B1 B2 Bn] = AgY + B1. M 0 0 1 X2 = AgY + [B1 B2 Bn] = AgY + B2. M 0 0 0 Xn = AgY + [B1 B2 Bn] = AgY + Bn. M 1 Sea XMnx(n+1)() la matriz definida por X = [X0 X1 X2 Xn]. Luego, AgY + B2 AgY + Bn] X = [AgY AgY + B1 1 1 1 L 1 0 1 0 L 0 g 1 2 n B B ] 0 0 1 L 0 = [A Y B M M M M 0 0 0 L 1

Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es consistente. El vector X0 = AgY es la nica solucin del SEL AX = Y si y slo si AgA = In.
Demostracin

CN(): Si el vector X0 = AgY es la nica solucin del SEL AX = Y entonces AgA = In. Por el teorema 10.11., la solucin general del SEL AX = Y es: Xsg = AgY + (In AgA)Z; Zn. Si X0 = AgY es la nica solucin del SEL AX = Y entonces X0 = Xsg. Luego, AgY = AgY + (In AgA)Z; Zn. AgY AgY = (In AgA)Z; Zn. (In AgA)Z = nx1; Zn. In AgA = nx1 AgA = In CS(): Si AgA = In entonces el vector X0 = AgY es la nica solucin del SEL AX = Y Por el teorema 10.11., la solucin general del SEL AX = Y es: Xsg = AgY + (In AgA)Z; Zn. Si AgA = In entonces Xsg = AgY + (In In)Z = AgY. Luego, el vector X0 = AgY es la nica solucin del SEL AX = Y. Observaciones: 1. Por el teorema 10.2., apartado 3, Rango(A) = Rango(AgA). Si AgA = In entonces Rango(A) = Rango(In) = n. Luego, por el teorema anterior el vector X0 = AgY es la nica solucin del SEL AX = Y si y slo si Rango(A) = n. Si Rango(A) = n entonces el SEL AX = Y tiene una nica solucin X0 = AgY = (AtA)-1AtY. Si adems m = n entonces la nica solucin es X0 = (AtA)-1AtY = (A)-1(At)-1AtY = A-1InY = A-1Y.

2.

1 = [AgY B] nxn = [AgY

(1n )t
In

Teorema 10.13.

Sean AMmxn(), Xn e Ym{mx1} y tales que el SEL AX = Y es consistente. Si Rango(A) = r entonces el SEL AX = Y tiene exactamente n r + 1 soluciones L.I.
Demostracin

1 In AgA] nxn

(1n )t
In

1 (1n )t es no singular. Luego, por el teorema 1.28., Es claro que In nxn g Rango(X) = Rango([A Y In AgA]). Ahora bien, por el teorema 10.2., apartado 14, Rango(B) = Rango(In AgA) = n r.
370

Por hiptesis, el SEL AX = Y es consistente. Luego, por el teorema 10.11., la solucin general de dicho SEL es:

369

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Demostremos que Rango(X) = n r + 1. Utilicemos reduccin al absurdo, es decir, supongamos que Rango(X) n r + 1. Especficamente, supongamos que Rango(X) = n r. Como Rango(B) = n r entonces los vectores AgY, B1, B2, , Bn son L.D., luego por el teorema 4.9., AgY[B1, B2, , Bn]. Por lo tanto, existen escalares c1, c2, , cn tales que:
AgY =

Luego, tnr+1 En consecuencia, el SEL AX = Y tiene exactamente n r + 1 soluciones L.I. Observaciones: 1. El vector X = nx1 no es solucin del SEL AX = Y, ya que Y mx1. En consecuencia, el conjunto de soluciones del SEL AX = Y no es un subespacio de n. Si Y = mx1 entonces el SEL AX = mx1 tiene exactamente n r soluciones distintas de la trivial y adems dicho conjunto de soluciones que coincide con el espacio nulo de A NA, forma un subespacio de n.

c B
j i =1

Luego, c1 c B B ] 2 = (In AgA)C; C = M c n


2 n

A Y=
g

c B
j i =1

= [B

c1 c 2 M c n

2.

Ejemplo 10.4.

En consecuencia, Xsg = AgY + (In AgA)Z = (In AgA)C + (In AgA)Z; C, Zn. Xsg = (In AgA)(C + Z) Por lo tanto, AXsg = A(In AgA)(C + Z) AXsg = (A AAgA)(C + Z) AXsg = (A A)(C + Z) AXsg = (mxn)(C + Z) AXsg = mx1 Lo cual es una contradiccin ya que Y mx1. En consecuencia, Rango(X) = n r + 1 y como X es una matriz de soluciones del SEL AX = Y entonces el SEL AX = Y tiene n r + 1 soluciones L.I. Para demostrar que el SEL AX = Y tiene exactamente n r + 1 soluciones L.I., supongamos que t es el nmero mximo de soluciones L.I. del SEL AX = Y. Luego, existen H1, H2, , Htn tales que: X = A Y + (In A A)H es solucin del SEL AX = Y. Luego, W = [X1 X2 Xt] = [AgY 1 In AgA] 1 H 1 L 1 H2 L Ht
j g g j

Consideremos el SEL del ejemplo 3.6.: X1 + 2X 2 + X 3 = 1 2X1 X 2 + 3X 3 = 2 2 X + 4 X + 2 X = 2 2 3 1 En este caso: 1 A = 2 2 2 1 1 3 , Y = 4 2 1 2 2

Se puede verificar que Rango(A) = 2. Igualmente, se puede verificar que una inversa condicional de A es: 1 5 A = 2 5 0
c

2 1

5 0

0 0 0

Tambin se puede verificar que AAcY = Y. Luego, por el teorema 10.9., el SEL es consistente. Determinemos ahora su solucin general: Xsg = AcY + (In AcA)Z; Zn 1 5 A Y = 2 5 0
c

Como X1, X2, , Xt son L.I., entonces Rango(W) = t. Por el teorema 1.32., Rango(W) es igual a:
1 Rango([AgY In AgA] 1 H 1 L 1 g ) Rango([A Y H2 L Ht

2 1

5 0

In AgA])

0 0 0

1 1 2 = 0 2 0

371

372

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

1 1 0 0 5 2 I3 A A = 0 1 0 5 0 0 1 0
c

2 1

5 0

0 0 0

1 2 2

0 0 7 2 1 5 1 1 3 = 0 0 5 0 0 1 4 2

EJERCICIOS PROPUESTOS. 1.

Determine la inversa generalizada de cada una de las siguientes matrices: 2 0 A= 3 0 1 0 1 1 ; B = 3 2 0 2 0 5 1 2 0 4 1 1 2 1 0 1 0 4 ; C = 1 1 ; 3 2 3 1 2 3 5 ; 2 2 2 9

Luego, 0 0 7 1 5 1 Z; Z3 X = 0 + 0 0 5 0 0 1 0
sg

Como Rango(A) = 2 el SEL AX = Y tiene exactamente 3 2 + 1 = 2 soluciones L.I. Fijando Z1 = 3x1 y Z2 = e3 se obtienen las 2 soluciones X1 y X2 L.I. de dicho SEL: 1 X1 = 0 y X2 = 0 7 2 1 5 5 1 = 1 0 + 5 5 1 1 0

1 D= 0 2

1 2 2 0 2 2 3 ; E = 1 3 2 4 2 5 2 1 5 3 7 12 2 4 2

1 F = 3 0
2.

Sea AMmxn(), BMnxn(). Demuestre que si BtAtA + AtAB = ((AB)tA)t entonces AB = mxn. Sea AMmxn(), tal que Rango(A) = r, con 0 < r < m. Demuestre que A(AtA)gAt es semidefinida positiva. Sea AMmxn(). Demuestre que Ag = At si y slo si AtA es idempotente. Sea AMmxm(). Demuestre que si A es simtrica entonces Ag es diagonalizable. Sean AMmxm(), BM(m-n)xm() tales que BA = (m-n)xm con Rango(A) = r y Rango(B) = m r. Demuestre que la matriz AAg + BgB es no singular. Sean AMmxm(), BM(m-n)xm() tales que A es simtrica, BA = (m-n)xm, Rango(A) = r y Rango(B) = m r. Demuestre que la matriz A + BtB es no singular. Sean AMmxm(), BM(m-n)xm() tales que A es simtrica y BA = (m-n)xm. Demuestre que: BtBAg = ABg(Bg)t = mxm

Esta operacin equivale a desarrollar la solucin general: 0 0 7 Z 1 1 5 1 Z X = 0 + 0 0 5 2 Z3 0 0 0 1


sg

3.

4.

7 Z3 1 5 = 0 + 1 Z 3 5 Z3 0 7 1 5 = 0 + Z3 1 ; Z3 5 1 0 Para luego fijar Z3 = 0 y Z3 = 1 y as obtener las 2 soluciones L.I. del SEL AX = Y: 1 X1 = 0 y X2 = 0 7 2 1 5 5 1 1 0 + 5 = 5 1 1 0

5.

6.

7.

8.

9.

Sean A, BMnxn() matrices simtricas, tales que Rango(A) = m, Rango(B) = r y BA = nxn, con 0 < m < n, 0 < r < n y m + r = n. Demuestre que si C y D son las inversas generalizadas de A y B, respectivamente, entonces A + B es no singular. Determine una inversa condicional de cada una de las matrices del ejercicio 1. 374

10.

373

CAPTULO 10: PSEUDOS INVERSAS

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

11.

Sean A, BMnxn() tales que Rango(A) = r < n, B es no singular y la matriz BA es idempotente. Demuestre que B es una inversa condicional de A. Sean AMmxn() y BMnxm(). Demuestre que si B es una inversa condicional de A entonces Rango(A) = Rango(BAB). Sean GMpxp() y XMnxp() tal que Rango(X) = r con 0 < r < p. Demuestre que si G es una inversa condicional de XtX entonces:
13.1. 13.2. 13.3. 13.4. 13.5. 13.6. 13.7.

18.4.

X1 + 3X 2 X 4 = 0 X1 X 3 + X 4 = 0 X + X = 0 2 1

12.

19.

13.

Sean AMmxn(), Xn e Ym. Considere el SEL AX = Y. Sea Ac una inversa condicional de A. Sean Hjn; j = 1, 2, , t y cj; j = 1, 2, , t. Demuestre que si el SEL AX = Y es consistente entonces el vector Z = AcY + AX = Y.

G es inversa condicional de X X. XGXtX = X. XGXt es invariante respecto de cualquier inversa condicional G de XtX. XGXt es simtrica. XGXt es semidefinida positiva. Rango(In XGXt) = n r. CtXGXtXB = UtB; Bp donde U = XtC y Cn.

c (I
j j=1

A c A)H j es solucin del SEL

20.

Sean AMmxn(), BMpxq(), CMmxq() y XMnxp(). Demuestre que una condicin necesaria y suficiente para que la ecuacin AXB = C tenga una solucin es que AAgCBgB = C y en tal caso su solucin general es de la forma Xsg = AgCBg + Z AgAZBBg; donde ZMnxp(). Sean AMmxn(), Xn e Ym. Sea X0 = AgY una solucin del sistema de ecuaciones AX = Y. Demuestre que el vector Z = X0 + W es una solucin del SEL AX = Y, WS, siendo S = {(A1)t, (A2)t, , (An)t}.

14.

Determine una inversa mnimo cuadrtica para cada una de las matrices dadas en el ejercicio 1. Sean AMmxn() y AmcMnxm() tales que Amc es una inversa mnimo cuadrtica de A. Demuestre que AAg = Im si y slo si AAmc = Im.
mc Sea AMmxn(). Demuestre que si A1 y A mc son inversas mnimo 2
mc cuadrticas de A entonces A (A1 A mc 2 ) = mxm .

21.

15.

16.

17.

Sean AMmxn() y BMnxm(). Demuestre que si B es una inversa condicional de AtA entonces BAt es una inversa mnimo cuadrtica de A. Demuestre que los siguientes SEL son consistentes y determine para cada uno de ellos su solucin general as como el conjunto de soluciones L.I.: 2X1 2X 2 + 4X 3 2X 4 = 4 X1 + 5X 3 2X 4 = 3 3X + 3X 6X + 3X = 6 1 2 3 4 X1 + X 2 + X 3 = 3 X1 X 2 + 2X 3 = 3 3X X + 5X = 2 2 3 1 4X1 + 2X 2 + 2X 3 = 3 2X1 + 2X 2 = 0 2 X + 2 X = 3 3 1

18.

18.1.

18.2.

18.3.

375

376

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Captulo

11

(X ) = ( Y AA mc Y) + (AX AA mc Y) 2 (Y AA mc Y) t (AX AA mc Y)
2

SISTEMAS DE ECUACIONES LINEALES INCONSISTENTES

= (Y AX smc ) + (AX AX smc ) 2 (Y AA mc Y ) t (AX AA mc Y ) = (X smc ) Ahora bien,


2

+ (AX AX smc )

2 (Y AA mc Y) t (AX AA mc Y)

11.1. INTRODUCCIN. En este captulo se presentan los Sistemas de Ecuaciones Lineales Inconsistentes. Se exponen sus tpicos bsicos como lo son la Solucin Mnimo Cuadrtica y la Mejor Solucin Aproximada. De esta forma, aunque un Sistema de Ecuaciones Lineales sea inconsistente siempre ser posible obtener un vector que es lo ms parecido a la solucin del sistema. 11.2. SOLUCIN MNIMO CUADRTICA. PROPIEDADES. Observacin: Sean AMmxn(), Xn e Ym. Si Xn se verifica que AX Y entonces el SEL AX = Y es inconsistente (SELI) y se expresa de la forma Y AX = (X), siendo (X) un vector de desviaciones Xn. Definicin 11.1

(Y AA mc Y ) t (AX AA mc Y ) = ((I n AA mc )Y) t (A(X A mc Y))

= Y t (I n AA mc ) t (A(X A mc Y)) = Y t ((I n ) t (AA mc ) t )(A (X A mc Y )) = Y t (I n AA mc )(A(X A mc Y)) = Y t (A AA mc A )(X A mc Y ) = Y t (A A)(X A mc Y) = Y t ( mxn )(X A mc Y ) =0 Por lo tanto,
( X )
2

= (X smc )

+ (AX AX smc )

En consecuencia,
Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es inconsistente. Se dice que un vector Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X) si y slo si (X Teorema 11.1. Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es inconsistente. El vector Xsmc = AmcY es una solucin mnimo cuadrtica del SELI Y AX = (X), siendo Amc una inversa mnimo cuadrtica de A. Demostracin
smc

) = Mnimo ( X ) . n
X

( X )

(X smc ) , es decir, (X smc )

( X ) .

Luego, (X smc ) (X) y (X smc ) = Mnimo ( X ) . n


X

Por consiguiente, Xsmc = AmcY es una solucin mnimo cuadrtica del SELI Y AX = (X). Observaciones: 1. Como la inversa mnimo cuadrtica de A no es nica entonces no existe una nica solucin mnimo cuadrtica del SELI Y AX = (X). Por el teorema 10.6., si Rango(A) = n entonces existe una nica inversa mnimo cuadrtica de A igual a la inversa generalizada y por lo tanto el SELI Y AX = (X) tiene una nica solucin mnimo cuadrtica.

Minimizar (X) equivale a minimizar (X) .


(X ) = Y AX = Y AA mc Y + AA mc Y AX
mc mc
2 2 2

2.

= (Y AA Y) + (AA Y AX)

3.

Mnimo (X) = Y AA mc Y . n
X

4.
2

= (Y AA mc Y) (AX AA mc Y) Por el teorema 5.2., se tiene que:

Como la inversa generalizada de A (Ag) es una inversa mnimo cuadrtica de A entonces una solucin mnimo cuadrtica del SELI Y AX = (X) es Xsmc = AgY.

378

CAPTULO 11: SISTEMAS DE ECUACIONES LINEALES INCONSISTENTES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Teorema 11.2.

=
n m

((I m AA g )Y) t (I m AAg )Y


(Y AA g Y ) t (Y AA g Y )

Sean AMmxn(), X e Y tales que el SEL AX = Y es inconsistente. El vector Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X) si y slo si (X smc ) = Y t (I m AA g )Y .
Demostracin

= =

(Y AA mc Y) t (Y AA mc Y)

= Y AA mc Y (X ) = Mnimo n
smc X

CN(): Si el vector X
smc

es una solucin mnimo cuadrtica del SELI Y


n

AX = (X) entonces (X smc ) = Y t (I m AA g )Y . Por hiptesis, X Luego, = A Y, siendo A


mc mc

Por consiguiente, Xsmc es una solucin mnimo cuadrtica del SELI Y AX = (X).
Teorema 11.3.

una inversa mnimo cuadrtica de A.

(X smc ) = Y AX smc = Y AA mc Y Ahora bien, AAmcA = A AAmcAAg = AAg AAmcAAg = AAg (AAmc)t(AAg)t = AAg (AAgAAmc)t = AAg (AAmc)t = AAg AAmc = AAg Luego, (X smc ) = Y AA g Y = = =
(Y AA g Y ) t (Y AA g Y )

Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es inconsistente. El vector Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X) si y slo si Xsmc es solucin del SEL AX = AAgY.
Demostracin

CN(): Si Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X) entonces Xsmc es solucin del SEL AX = AAgY. Por el teorema 11.2., se tiene que: (X smc ) = Y t (I m AA g )Y , es decir, (X smc ) = Y t (I m AA g )Y . Sea Z = Xsmc AgY. Luego, Xsmc = Z + AgY. En consecuencia, ( Z + A g Y) = Y t (I m AA g )Y . (Y A(Z+AgY))t(Y A(Z+AgY)) = Yt(Im AAg)Y (Y AZ AAgY))t(Y AZ AAgY) = Yt(Im AAg)Y (Y AAgY AZ))t(Y AAgY AZ) = Yt(Im AAg)Y ((Im AAg)Y AZ))t((Im AAg)Y AZ) = Yt(Im AAg)Y (((Im AAg)Y)t (AZ)t)((Im AAg)Y AZ) = Yt(Im AAg)Y (Yt(Im AAg)t ZtAt)((Im AAg)Y AZ) = Yt(Im AAg)Y Yt(Im AAg)t(Im AAg)Y Yt(Im AAg)tAZ ZtAt(Im AAg)Y + ZtAtAZ = Yt(Im AAg)Y Por el teorema 10.2., apartado 8 se tiene que Im AAg es simtrica e idempotente. Por consiguiente: Yt(Im AAg)Y Yt(Im AAg)AZ ZtAt(Im AAg)tY + ZtAtAZ = Yt(Im AAg)Y Yt(Im AAg)Y Yt(A AAgA)Z Zt((Im AAg)A)tY + ZtAtAZ = Yt(Im AAg)Y Yt(Im AAg)Y Yt(A AAgA)Z Zt((A AAgA)tY + ZtAtAZ = Yt(Im AAg)Y Yt(Im AAg)Y Yt(A A)Z Zt((A A)tY + ZtAtAZ = Yt(Im AAg)Y 380
2 2

((I m AA )Y) (I m AA )Y
g t g

(Y t (I m AAg ) t (I m AAg )Y

Por el teorema 10.2., apartado 8 se tiene que Im AAg es simtrica e idempotente. Por consiguiente: (X smc ) = Y t (I m AA g )Y CS(): Si (X smc ) = Y t (I m AA g )Y entonces el vector Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X). Por hiptesis (X smc ) = Y t (I m AA g )Y . Adems, si Amc es una inversa mnimo cuadrtica de A entonces AAmc = AAg. Luego, (X smc ) = Y t (I m AA g )Y =
(Y t (I m AA g ) t (I m AA g )Y

379

CAPTULO 11: SISTEMAS DE ECUACIONES LINEALES INCONSISTENTES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Yt(Im AAg)Y Yt(mxn)Z Zt((mxn)tY + ZtAtAZ = Yt(Im AAg)Y Yt(Im AAg)Y + ZtAtAZ = Yt(Im AAg)Y ZtAtAZ = Yt(Im AAg)Y Yt(Im AAg)Y (AZ)tAZ = 0 AZ = mx1 En consecuencia: AXsmc = A(Z + AgY) = AZ + AAgY = mx1 + AAgY = AAgY. Es decir, Xsmc es solucin del SEL AX = AAgY. CS(): Si Xsmcn es solucin del SEL AX = AAgY entonces Xsmc es una solucin mnimo cuadrtica del SELI Y AX = (X). Por hiptesis: AX
smc

Demostracin

Por definicin, el SELN del SELI Y AX = (X) es AtAX = AtY. Utilicemos el teorema 10.9., para demostrar que el SELN es siempre consistente: (AtA)(AtA)gAtY = AtAAg(At)gAtY = AtAAg(Ag)tAtY = AtAAg(AAg)tY = AtAAgAAgY = AtAAgY = At(AAg)tY = (AAgA)tY = AtY En consecuencia, el SELN es consistente y su solucin general es:
X sg = (A t A ) g A t Y + (I n (A t A ) g (A t A )) Z; Z n

= AA Y.

= A g (A t ) g A t Y + (I n A g (A t ) g A t A) Z; Z n = A g (A g ) t A t Y + (I n A g (A g ) t A t A ) Z; Z n
(Y AA g Y ) t (Y AA g Y )

Luego, (X smc ) = Y AX smc = Y AA g Y = = =

= A g (AA g ) t Y + (I n A g (AA g ) t A) Z; Z n = A g AA g Y + (I n A g AA g A ) Z; Z n = A g Y + (I n A g A) Z; Z n
Teorema 11.5.

((I m AA g )Y) t (I m AAg )Y (Y t (I m AAg ) t (I m AAg )Y

Por el teorema 10.2., apartado 8 se tiene que Im AAg es simtrica e idempotente. Por consiguiente: (X smc ) = Y t (I m AA g )Y Por el teorema 11.2., Xsmc es una solucin mnimo cuadrtica del SELI Y AX = (X).
Definicin 11.2.

Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es inconsistente. El vector Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X) si y slo si Xsmc es solucin del SELN de dicho SELI.
Demostracin

CN(): Si Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X) entonces Xsmc es solucin del SELN de dicho SELI. Por hiptesis, Xsmcn es una solucin mnimo cuadrtica del SELI Y AX = (X). Luego, por el teorema 11.3., Xsmc es solucin del SEL AX = AAgY. Por lo tanto, AXsmc = AAgY AtAXsmc = AtAAgY AtAXsmc = At(AAg)tY AtAXsmc = (AAgA)tY AtAXsmc = AtY Es decir, Xsmc es solucin del SELN del SELI Y AX = (X). CS(): Si Xsmcn es solucin del SELN de dicho SELI entonces Xsmc es una solucin mnimo cuadrtica del SELI Y AX = (X). Por hiptesis, Xsmcn es solucin del SELN del SELI Y AX = (X). Luego,

Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es inconsistente. Se define como sistema de ecuaciones lineales normales (SELN) del SELI Y AX = (X) al SEL AtAX = AtY.
Teorema 11.4.

Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es inconsistente. Entonces el SELN del SELI Y AX = (X) es consistente y adems su solucin general es: X sg = A g Y + (I n A g A) Z; Z n

381

382

CAPTULO 11: SISTEMAS DE ECUACIONES LINEALES INCONSISTENTES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

AtAXsmc = AtY (Ag)tAtAXsmc = (Ag)tAtY (AAg)tAXsmc = (AAg)tY AAgAXsmc = AAgY AXsmc = AAgY Es decir, Xsmc es solucin del SEL AX = AAgY. Por consiguiente, por el teorema 11.3., Xsmc es solucin mnimo cuadrtica del SELI Y AX = (X).
11.3. MEJOR EJEMPLOS. Definicin 11.3 SOLUCIN APROXIMADA. PROPIEDADES Y

(Xsmc)tXsmc = (AgY)t(AgY) + Yt((Ag)t (Ag)t(AgA)t)Xsmc + + (Xsmc)t(In AgA)AgY + ((In AgA)Xsmc)t((In AgA)Xsmc) = (Xmsa)t(Xmsa) + Yt((Ag)t (AgAAg)t)Xsmc + + (Xsmc)t(Ag AgAAg)Y + (Xsmc AgAXsmc)t(Xsmc AgAXsmc) = (Xmsa)t(Xmsa) + Yt((Ag)t (Ag)t)Xsmc + (Xsmc)t(Ag Ag)Y + + (Xsmc AgAAgY)t(Xsmc AgAAgY) msa t = (X ) (Xmsa) + Yt(mxn)Xsmc + (Xsmc)t(nxm)Y + + (Xsmc AgY)t(Xsmc AgY) = (Xmsa)t(Xmsa) + (Xsmc Xmsa)t(Xsmc Xmsa) Luego,
X smc
2

Sean AMmxn(), Xn e Ym tales que el SEL AX = Y es inconsistente. Se dice que el vector Xmsan es la mejor solucin aproximada del SELI Y AX = (X) si y slo si: 1. 2. X es una solucin mnimo cuadrtica. Xsmcn solucin mnimo cuadrtica del SELI Y AX = (X) con Xsmc Xmsa se cumple que X msa < X smc .
Teorema 11.6.
msa

= X msa

+ X smc X msa

Como Xsmc Xmsa entonces: X smc X msa


2

> X msa < X smc

X msa < X smc


n m

Sean AMmxn(), X e Y tales que el SEL AX = Y es inconsistente. El vector Xmsa = AgY es la mejor solucin aproximada del SELI Y AX = (X).
Demostracin

Por lo tanto, el vector Xmsa es la mejor solucin aproximada del SELI Y AX = (X). Observaciones: 1. 2. Como Ag es nica entonces existe una nica mejor solucin aproximada Xmsa = AgY del SELI Y AX = (X). Si Rango(A) = n entonces por el teorema 10.6., existe una nica inversa mnimo cuadrtica igual a la inversa generalizada. En ese caso, existe una nica solucin mnimo cuadrtica igual a la mejor solucin aproximada del SELI Y AX = (X).

1. 2.

Es claro que Xmsa = AgY es una solucin mnimo cuadrtica del SELI Y AX = (X). Sea Xsmc una solucin mnimo cuadrtica del SELI Y AX = (X) con Xsmc Xmsa. Luego, (X smc ) = (X msa ) y adems por el teorema 11.3., Xsmc es solucin del SEL AX = AAgY, es decir, AXsmc = AAgY. Por lo tanto, AXsmc = AAgY AgAXsmc = AgAAgY AgAXsmc = AgY AgAXsmc + Xsmc = AgY + Xsmc Xsmc = AgY + Xsmc AgAXsmc Xsmc = AgY + (In AgA)Xsmc En consecuencia, (Xsmc)tXsmc = (AgY + (In AgA)Xsmc)t(AgY + (In AgA)Xsmc) = (Yt(Ag)t + (Xsmc)t(In AgA)t)(AgY + (In AgA)Xsmc) = Yt(Ag)tAgY + Yt(Ag)t(In AgA)Xsmc + (Xsmc)t(In AgA)tAgY + + (Xsmc)t(In AgA)t(In AgA)Xsmc Por el teorema 10.2., apartado 8 se tiene que In AgA es simtrica. Por consiguiente: 383

Ejemplo 11.1.

Consideremos el SEL del Ejemplo 3.4.:


X1 + 2X 2 + X 3 = 1 2X1 X 2 + 3X 3 = 2 2 X + 4X + 2 X = 4 2 3 1 En este caso:

1 A = 2 2

2 1 4

1 3 , Y = 2

1 2 4
384

CAPTULO 11: SISTEMAS DE ECUACIONES LINEALES INCONSISTENTES

ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

Se puede verificar que Rango(A) = 2. Igualmente, se puede verificar que una inversa condicional de A es:
2 1 5 5 c 2 A = 1 5 5 0 0 Tambin se puede verificar que: 1 AAcY = 2 Y. Por lo tanto el SEL es inconsistente. 2 Determinemos una solucin mnimo cuadrtica y la mejor solucin aproximada. Se puede verificar que una inversa mnimo cuadrtica de A es: 2 1 5 25 = 2 1 25 5 0 0 25 4 25 0 2 0 0 0

Ejemplo 11.2.

Consideremos el SEL del ejemplo 3.7.:


X1 2X 2 + 3X 3 = 2 2X1 + X 2 + X 3 = 4 X1 2X 2 + X 3 = 1 2X 2 + 3X 3 = 6 En este caso:
1 2 2 1 A= 1 2 2 0 3 1 , Y= 1 3 2 4 1 6

Se puede verificar que Rango(A) = 3. Por lo tanto, la inversa mnimo cuadrtica es nica y coincide con la inversa generalizada Ag = (AtA)-1At: 37 1030 A = (A A) A = 152 1030 158 1030
g t

476 146 84

mc

1030

115 140 10

1030 1030

1030

1030

1030

160 1030 150 1030 210 1030

En consecuencia, una solucin mnimo cuadrtica del SEL es: 2 1 5 25 1 Xsmc = AmcY = 2 25 5 0 0 29 25 1 25 4 2 = 8 25 25 4 0 0 2

Tambin se puede verificar que: 531 206 852 206 Y. Por lo tanto el SEL es inconsistente. AAgY = 31 206 1166 206 En este caso existe una nica solucin mnimo cuadrtica que adems es la mejor solucin aproximada. Dicha solucin es:
37 1030 = A Y = 152 1030 158 1030
g

Se puede verificar que la inversa generalizada de A es:

45 8 375 375 31 60 A = 375 375 75 5 375 375


g

16

375 375 10 375 62

msa

Por lo tanto, la mejor solucin aproximada del SEL es: 45 8 375 375 60 = A Y = 31 375 375 5 75 375 375
g

160 1030 150 146 140 1030 1030 1030 10 210 84 1030 1030 1030 476 1030 115 1030

2 197 205 4 = 208 205 1 250 205 6

16

msa

375 62 375 10 375

162 1 375 159 2 = 375 195 4 375

385

386

CAPTULO 11: SISTEMAS DE ECUACIONES LINEALES INCONSISTENTES

EJERCICIOS PROPUESTOS. 1.

Demuestre que los siguientes SEL son inconsistentes y determine para cada uno de ellos una solucin mnimo cuadrtica, su mejor solucin aproximada y su sistema de ecuaciones lineales normales con su respectiva solucin general: 3X1 + 2X 2 = 12 X1 X 2 = 1 2 X + X = 5 2 1 X1 + X 2 + X 3 = 6 2X1 X 2 = 0 3X + X = 7 3 1 X1 + 2X 2 + 3X 3 = 1 2X1 X 3 = 5 4X 7X = 21 2 3 3X1 + X 2 X 3 = 9 X1 + 3X 2 X 3 = 7 2X1 X 2 X 3 = 5 7 X1 11X 2 + X 3 = 2

1.1.

1.2.

1.3.

1.4.

2.

Sean AMmxn(), Xn, Ym tales que el SEL Y = AX es inconsistente. Demuestre que el SEL AX = AAgY es consistente y que si X smc es una solucin mnimo cuadrtica del SELI Y AX = (X) entonces X smc = AgY + (In AgA)Z; Zn es la solucin general del SEL AX = AAgY.

3.

Sean AMmxn(), Xn, Ym tales que el SEL Y = AX es inconsistente. Demuestre que AX smc es invariante para cualquier vector X smc solucin del SELN del SELI Y AX = (X).

4.

Sean AMmxn(), Xn, Ym tales que el SEL Y = AX es inconsistente. Demuestre que la forma cuadrtica f (Y) = (Y AXsmc ) t (Y AX smc ) es invariante y semidefinida positiva para cualquier solucin mnimo cuadrtica X smc del SELI Y AX = (X), con 0 < Rango(A) < n.

5.

Sean AMmxn(), X, Wn, Y, Cm tales que el SEL Y = AX es inconsistente, con 0 < Rango(A) < n. Sea X msa la mejor solucin aproximada del SELI Y AX = (X). Demuestre que si CtAX = WtX; Xn entonces V0n tal que V0 es solucin del SEL AtAV = W y adems W t X msa = (V 0 ) t A t Y .

387

También podría gustarte