Está en la página 1de 221

Introducción al

ÁLGEBRA LINEAL

Ignacio Aemilius, Marcelo Cerminara,

Andrea Mesa, Fernando Peláez

2013
Aemilius, Ignacio - Cerminara, Marcelo - Mesa, Andrea - Peláez, Fernando.
Introducción al álgebra lineal.

c I. Aemilius, M. Cerminara, A. Mesa, F. Peláez


De esta edición:
Grupo Armónico Ediciones Montevideo, Julio 2013.

Diseño de carátula: Fernando Peláez.


Impreso en Uruguay.
Edición amparada por el Art. 79 de la ley 13.349

I.S.B.N. 978-9974-98-735-7

Queda prohibida cualquier forma de reproducción, transmisión o archivo en sistemas recuperables


del presente ejemplar, ya sea para uso privado o público, por medios mecánicos, electrónicos, elec-
trostáticos, magnéticos o cualquier otro, total o parcialmente, con o sin finalidad de lucro, salvo
expresa autorización de los autores.
Índice general

1. Álgebra de Matrices 5
1.1. Matrices y operaciones con matrices . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Matrices invertibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3. Apéndice de esta sección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. Sistemas de ecuaciones lineales 19


2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2. Matriz asociada a un sistema de ecuaciones lineales . . . . . . . . . . . . . . 22
2.3. El método de escalerización . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4. Teorema de Rouche - Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5. Sistemas cuadrados, determinantes y Cramer . . . . . . . . . . . . . . . . . 31
2.6. Cálculo de la inversa de una matriz invertible . . . . . . . . . . . . . . . . . 38
2.7. Apéndice de esta sección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3. El espacio vectorial Rn 49
3.1. El espacio vectorial R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.1. Suma de vectores y producto de un número por un vector . . . . . . 50
3.1.2. Rectas en R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.2. El espacio vectorial R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.2.1. Suma de vectores y producto de un número por un vector . . . . . . 59
3.2.2. Rectas en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.3. Planos en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3. El espacio vectorial Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.3.1. Suma de vectores y producto de un número por un vector . . . . . . 72
3.3.2. Combinaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4. Dependencia e independencia lineal . . . . . . . . . . . . . . . . . . . . . . . 83

4. Subespacios vectoriales de Rn 91
4.1. Espacios vectoriales reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.2. Subespacios vectoriales de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.3. Generador de un subespacio vectorial de Rn . . . . . . . . . . . . . . . . . . 102
4.4. Base y dimensión de un subespacio vectorial de Rn . . . . . . . . . . . . . . 108
4.5. Rango de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.6. Apéndice de este capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

3
5. Rn como espacio euclidiano 125
5.1. Producto interno, norma y ángulos . . . . . . . . . . . . . . . . . . . . . . . 125
5.2. Conjuntos ortogonales y proyecciones ortogonales . . . . . . . . . . . . . . . 134
5.3. Cálculo de distancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5.3.1. Vector perpendicular a un plano. . . . . . . . . . . . . . . . . . . . . 150
5.3.2. Distancia de un punto a un plano. . . . . . . . . . . . . . . . . . . . 151
5.3.3. Distancia de un punto a una recta. . . . . . . . . . . . . . . . . . . . 152
5.4. Aproximación por el método de mı́nimos cuadrados . . . . . . . . . . . . . . 155
5.4.1. Descripción del método. . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.4.2. Una fórmula para la proyección ortogonal . . . . . . . . . . . . . . . 158

6. Diagonalización 161
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
6.2. Valores y vectores propios de una matriz . . . . . . . . . . . . . . . . . . . . 163
6.3. Matrices diagonalizables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.4. Apéndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

7. Transformaciones lineales 179


7.1. Definición, propiedades básicas y ejemplos . . . . . . . . . . . . . . . . . . . 179
7.2. Matriz asociada a una transformación lineal . . . . . . . . . . . . . . . . . . 184
7.3. Operaciones con transformaciones lineales . . . . . . . . . . . . . . . . . . . 188
7.4. Inversa de una transformación lineal . . . . . . . . . . . . . . . . . . . . . . 190
7.5. Núcleo e imagen de una transformación lineal . . . . . . . . . . . . . . . . . 192
7.6. Transformaciones lineales inyectivas, sobreyectivas y biyectivas . . . . . . . 195
7.7. Valores y vectores propios de una transformación lineal . . . . . . . . . . . 199
7.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7.9. Ejercicios variados de opción múltiple . . . . . . . . . . . . . . . . . . . . . 205

8. Respuestas a los ejercicios 211


Capı́tulo 1

Álgebra de Matrices

Es probable que el lector ya tenga experiencia con la utilización de “planillas bidimensio-


nales” que resultan de utilidad para organizar y procesar datos. Por ejemplo, consideremos
el caso de una empresa uruguaya que vende cuatro tipo de artı́culos (de tipo A, B, C y
D), de las cuales se conocen las cantidades vendidas en los meses de setiembre, octubre,
noviembre, diciembre y enero. Esta información figura en la siguiente matriz:
 
60 130 70 150
 100 200 120 330 
 
A=  150 240 130 510 

 129 223 148 947 
88 147 105 430

En la primera fila aparecen las cantidades vendidas en setiembre de los cuatro tipos de
artı́culos, en la segunda las cantidades vendidas en octubre, y ası́ sucesivamente. Esta es
una matriz de 5 filas y 4 columnas.
Ahora bien, esos datos correspondı́an solo a Montevideo. La información adicional sobre
las cantidades vendidas en la ciudad de Tacuarembó viene dada por esta otra matriz:
 
10 13 12 15
 10 24 9 30 
 
B=  16 25 10 48 

 11 21 15 88 
9 15 10 40

Como se sigue el mismo criterio para dar la información, esta matriz también tiene 5 filas
y 4 columnas. ¿Cómo obtenemos el total de ventas en los dos departamentos de cada
artı́culo en cada mes? Resulta claro que debemos sumar cada elemento de la matriz A con
su correspondiente en la matriz B:
 
70 143 82 165
 110 224 129 360 
 
 166 265 140 558 
 
 140 244 163 1035 
97 162 115 470
6 Capı́tulo 1. Álgebra de Matrices

O sea, hemos calculado una nueva matriz (también de 5 filas y 4 columnas) que se obtuvo
realizando ciertas operaciones con los elementos de las matrices originales.
Supongamos ahora que durante esos meses la empresa no ha cambiado el precio de sus
artı́culos: los de tipo A se venden a a pesos, los de tipo B a b pesos, .... La matriz de
precios de los artı́culos es entonces:  
a
 b 
 
 c 
d
Una de las preguntas que nos podemos plantear es: en cada uno de los cinco meses ¿cual
es el ingreso total de la empresa por concepto de ventas en Montevideo? La respuesta es
muy simple: en setiembre fue de 60a + 130b + 70c + 150d; en octubre fue de 100a + 200b +
120c + 330d; y ası́ sucesivamente. La información global sobre los ingresos a cada uno de
los cinco meses podrı́a estar presentada en la siguiente matriz:
 
60a + 130b + 70c + 150d
 100a + 200b + 120c + 330d 
 
 150a + 240b + 130c + 510d 
 
 129a + 223b + 148c + 947d 
88a + 147b + 105c + 430d

que también puede pensarse como el resultado de cierto tipo de operación entre las matrices
 
60 130 70 150  
 100 200 120 330  a
   b 
 150 240 130 510  y  
   c 
 129 223 148 947 
d
88 147 105 430

Este breve ejemplo introductorio pretende poner de relieve que, más allá de las matrices
como objetos estáticos para organizar datos, puede resultar de mucha utilidad estudiar
operaciones (y las propiedades de las mismas) entre estos objetos.

1.1. Matrices y operaciones con matrices


Definición 1.1.1. Llamaremos matriz A de m filas por n columnas (de tamaño m × n)
con entradas aij a un ordenamiento rectangular de números
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
 
A= . .. .. .. 
 .. . . . 
am1 am2 . . . amn

Notación: En general, la matriz A con entradas aij la indicaremos por A = ((aij ))i=1,...,m
j=1,...,n
o más brevemente A = ((aij )) cuando las dimensiones estén claras. El primer ı́ndice, i,
indica la fila y el segundo, j, la columna a la que pertenece la entrada aij . Ası́, se dirá que
1.1. Matrices y operaciones con matrices 7

la entrada aij ocupa la posición ij dentro de la matriz.


El conjunto de todas las matrices m × n lo indicaremos como Mm×n .
Si A es una matriz de m filas por n columnas entonces sus filas serán representadas por
los sı́mbolos F1 (A), F2 (A), ... , Fm (A) respectivamente (es decir, Fi (A) es la i-ésima fila
de A). De modo análogo sus columnas serán representadas mediante C1 (A), C2 (A), ... ,
Cn (A) respectivamente (es decir, Cj (A) es la j-ésima columna de A).
Llamaremos matriz columna (fila) a una matriz de tamaño m × 1 (1 × n).
Definición 1.1.2. Igualdad de matrices.
Diremos que dos matrices son iguales si tienen el mismo tamaño y los mismas entradas
en las mismas posiciones. Dicho de otro modo, si A y B son dos matrices m × n, entonces
A = B ⇐⇒ aij = bij ∀i = 1, . . . , m, j = 1, . . . , n.
   
1 2 4 2
Ejemplo 1.1.1. Sean A = yB= .
−3 1 −3 1
Entonces A 6= B pues a11 = 1 6= b11 = 4
Definición 1.1.3. Suma de matrices.
Si A = ((aij )) y B = ((bij )) son dos matrices m × n entonces la suma A + B es la matriz
C = ((cij )) también m × n en donde cij = aij + bij .
   
1 5 0 0 −8 −1
Ejemplo 1.1.2. Sean A =  1 2 −1  y B =  2 2 0 , entonces
0 −1 3 1 −2 2
     
1 5 0 0 −8 −1 1+0 5−8 0−1
A+B = 1 2 −1  +  2 2 0  =  1+2 2 + 2 −1 + 0 
0 −1 3 1 −2 2 0 + 1 −1 − 2 3+2
 
1 −3 −1
=  3 4 −1 
1 −3 5
Proposición 1.1.1. Propiedades de la suma de matrices.
 
(S1) Asociativa: A + B + C = A + B + C , ∀ A, B, C ∈ Mm×n .
(S2) Conmutativa: A + B = B + A, ∀ A, B ∈ Mm×n .
(S3) Existencia de neutro: Existe O ∈ Mm×n tal que A+O = O +A = A, ∀ A ∈ Mm×n .
(S4) Existencia de opuesto: Para cada A ∈ Mm×n existe B ∈ Mm×n tal que A+B = O.
(Notación: B = −A).
La prueba queda a cargo del lector y consiste simplemente en aplicar las propiedades
conocidas de la suma de números reales. Indicamos, no obstante, que la matriz O de la
propiedad (S3) se denomina matriz nula y tiene ceros en todas sus entradas. Por su
parte, la matriz −A (opuesta de A) es la que tiene en sus entradas los opuestos de las
correspondientes entradas de A.
Como toda matriz tiene una matriz opuesta es posible definir la resta de matrices de
manera análoga a lo que se hace con números reales.
8 Capı́tulo 1. Álgebra de Matrices

Definición 1.1.4. Resta de matrices.


Si A y B son dos matrices m × n entonces la resta A − B es la suma de la matriz A mas
la opuesta de la B.

Definición 1.1.5. Producto de un número por una matriz.


Si λ es un número real y A es una matriz m × n entonces el producto λA es la matriz
B = ((bij )) también m × n en donde bij = λaij
En otras palabras, cada entrada de λA se obtiene multiplicando por λ a la correspondiente
entrada de A.
 
3 1
Ejemplo 1.1.3. Sean λ = 5 y A = entonces
0 −2
   
3 1 15 5
λA = 5 =
0 −2 0 −10
Proposición 1.1.2. Propiedades del producto de un número por una matriz.

(P1) Asociativa: αβ A = α(βA), ∀ α, β ∈ R y A ∈ Mm×n .
(P2) Existencia de neutro real: 1.A = A, ∀ A ∈ Mm×n

(P3) Distributiva respecto de la suma de números: (α + β)A = αA + βA, ∀ α, β ∈ R y


∀ A ∈ Mm×n .
(P4) Distributiva respecto de la suma de matrices: α(A + B) = αA + αB, ∀ α ∈ R y
∀ A, B ∈ Mm×n .
Definición 1.1.6. Producto de matrices.
Si A es una matriz m × p y B es una matriz p × n entonces el producto de matrices
A.B es la matriz C = ((cij )) m × n donde
p
X
cij = aih bhj
h=1

El siguiente esquema ayuda a recordar la forma de realizar la operación:


 
b11 . . . b1j . . . b1n
 b21 . . . b2j . . . b2n 
 
 .. .. 
 . ... . ... ... 
bp1 . . . bpj . . . bpn
   
a11 a12 ... a1p
 .. .. ..   
 . . ... .   .. .. .. .. 
   
 .. .. ..   . . ↓ . . 
 . . ... .   .. .. 
   
 ai1 ai2 ... aip   −→ cij . . 

 .. .. ..



 .. .. .. .. .. 

 . . ... .   . . . . . 
.. .. .. .. ..
am1 am2 . . . amp . . . . .
1.1. Matrices y operaciones con matrices 9

   
2 −1 1 2
Ejemplo 1.1.4. Si A = yB= entonces:
0 2 −1 3
    
2 −1 1 2 2·1 + (−1)(−1) 2·2 + (−1)3
A.B = = =
0 2 −1 3 0·1 + 2(−1) 0·2 + 2·3
 
3 1
=
−2 6
 
  1 2
2 1 −1 0  2 1 
Ejemplo 1.1.5. Sean A = yB=
 1 1 . El producto de A por

2 1 2 −1
1 0
B es:
 
  1 2  
2 1 −1 0  2 1 = 3 4

2 1 2 −1  1 1  5 7
1 0
pues

2·1 + 1·2 + (−1)1 + 0·1 = 3


2·2 + 1·1 + (−1)1 + 0·0 = 4
2·1 + 1·2 + 2·1 + (−1)1 = 5
2·2 + 1·1 + 2·1 + (−1)0 = 7

Vale la pena observar que las matrices no deben ser necesariamente del mismo tamaño
para poder multiplicarlas. De hecho, si se mira con cuidado la definición, se observa que
para poder hacerlo la cantidad de columnas de la primera debe coincidir con la cantidad
de filas de la segunda. Cuando esto ocurre se dice que la primera matriz es conformable
con la segunda.
   
1 2 1 x
Ejemplo 1.1.6. Sean A =  2 1 1  y X =  y  entonces
1 1 2 z
    
1 2 1 x x + 2y + z
A.X =  2 1 1  y  =  2x + y + z 
1 1 2 z x + y + 2z
 
1 2 1 
Ejemplo 1.1.7. Sean A =  2 1 1  y Y = x y z entonces
1 1 2
 
 1 2 1 
Y.A = x y z  2 1 1 = x + 2y + z 2x + y + z x + y + 2z
1 1 2
10 Capı́tulo 1. Álgebra de Matrices

Observación 1.1.1. Si volvemos a mirar el ejemplo introductorio de comienzo de capı́tulo


observamos que la matriz
 
60a + 130b + 70c + 150d
 100a + 200b + 120c + 330d 
 
 150a + 240b + 130c + 510d 
 
 129a + 223b + 148c + 947d 
88a + 147b + 105c + 430d
que daba la información global sobre los ingresos a cada uno de los cinco meses, coincide
con el producto matricial:
 
60 130 70 150  
 100 200 120 330  a
   b 
 150 240 130 510  .  
   c 
 129 223 148 947 
d
88 147 105 430
Observación 1.1.2. Las columnas de la matriz 
producto.

  1 1
2 1 0
Consideremos las matrices A = y B =  2 1 . Su producto A.B resulta
1 2 1
1 1
ser:
 
  1 1  
2 1 0  4 3
A.B = 2 1 =
1 2 1 6 4
1 1
Podemos observar que la primera columna de A.B coincide con el producto de la matriz
A por la primera columna de B, mientras la segunda columna de A.B coincide con el
producto de la matriz A por la segunda columna de B:
   
  1     1  
2 1 0   4 2 1 0   3
2 = , 1 =
1 2 1 6 1 2 1 4
1 1
Este resultado es general y surge de la propia definición de producto de matrices. Si A es
una matriz m × n, B una matriz n × p y A.B su producto entonces la columna j-ésima
de A.B coincidirá con el producto de la matriz A por la columna j-ésima de B (para
j = 1, 2, ... , p). En sı́mbolos:
Cj (A.B) = A . Cj (B)
Por otra parte, con las filas sucede algo similar:
   
 1 1   1 1 
2 1 0  2 1 = 4 3 y 1 2 1  2 1 = 6 4
1 1 1 1
la i-ésima fila de A.B coincide con el producto de la i-ésima fila de A por la matriz B
(i = 1, 2, ... , m). En sı́mbolos:
Fi (A.B) = Fi (A) . B
1.1. Matrices y operaciones con matrices 11

Definición 1.1.7. La matriz identidad.


Llamaremos matriz identidad In a la matriz n × n dada por
 
1 0 ... 0
 0 1 ... 0 
 
In =  . . . .. 
.
 . .. . . . 
0 0 ... 1

Se trata entonces de la matriz que tiene al número 1 en todas las entradas de la diagonal
principal y al número 0 en el resto de las entradas.
 
1 0 0
Por ejemplo: I3 =  0 1 0 
0 0 1
La matriz identidad juega un papel especial en el producto de matrices pues es inmediato
verificar que cumple:

In .A = A, ∀ A ∈ Mn×p , B.In = B, ∀ B ∈ Mm×n

Observación 1.1.3. Sobre las propiedades del producto de matrices.


En la operación de producto de matrices no se cumplen algunas de las propiedades usuales
del producto de números reales.
No conmutatividad. En el ejemplo 1.1.6 se observa que dos matrices pueden ser confor-
mables en un orden y no en otro. De hecho, en ese ejemplo A.X tiene sentido pero X.A no.
Ahora bien, aunque las matrices sean cuadradas, no tiene por qué
 coincidir
 el resultado
 al

2 1 1 0
multiplicarlas en un orden o en el inverso. En efecto sean A = yB=
1 1 0 0
entonces     
2 1 1 0 2 0
A.B = =
1 1 0 0 1 0
    
1 0 2 1 2 1
B.A = =
0 0 1 1 0 0
Naturalmente el contraejemplo solo indica que en general A.B 6= B.A lo cual no significa
que no existan matrices que conmuten.
No Hankel. El producto de dos matrices puede dar como  resultado la matriz nula sin

1 0 0 0
que ninguna de las matrices sea la nula. En efecto, si A = y B =
0 0 1 3
entonces ninguna de las dos matrices es nula y sin embargo:
    
1 0 0 0 0 0
A.B = . =
0 0 1 3 0 0

Proposición 1.1.3. Propiedades del producto de matrices.

Asociativa Si A ∈ Mm×n , B ∈ Mn×p y C ∈ Mp×q , entonces (A.B).C = A.(B.C)

Distributiva Si A, B ∈ Mm×n , C ∈ Mp×m y D ∈ Mn×q entonces


C.(A + B) = C.A + C.B y (A + B).D = A.D + B.D
12 Capı́tulo 1. Álgebra de Matrices

Existencia de Neutro Si In es la matriz identidad n × n entonces


In .A = A, ∀ A ∈ Mn×p , B.In = B, ∀ B ∈ Mm×n

La demostración se puede encontrar en el apéndice del final de este capı́tulo.

Definición 1.1.8. Potencias de una matriz.


Sea A una matriz n × n. Definimos:

A0 = In , Ak+1 = A.Ak , ∀ k ∈ N.
   
1 2 2 3 0
Ejemplo 1.1.8. Si A = entonces A = A.A =
1 −1 0 3
Definición 1.1.9. Traspuesta de una matriz.
Si A = ((aij )) es una matriz m × n, definimos la matriz traspuesta de A como la matriz
B = ((bij )) de dimensión n × m en donde bij = aji . Notación: la traspuesta de A se
simbolizará At .
 
  1 2
1 2 3
Ejemplo 1.1.9. Sea A = entonces At =  2 1 
2 1 1
3 1
   
1 2 1 2
Sea B = entonces B t = . En este caso resultó B = B t , cuando esto
2 3 2 3
ocurra diremos
 que la matriz
 B es simétrica 
0 2 −1 0 −2 1
Sea C =  −2 0 1  entonces C t =  2 0 −1  por lo tanto C t = −C,
1 −1 0 −1 1 0
cuando esto
 ocurra
 diremos que la matriz C es antisimétrica.
1
 −2  t

Sea D =   2  entonces D = 1 −2 2 0 . Obsérvese que la traspuesta de una

0
matriz columna resulta ser un matriz fila.

Proposición 1.1.4. Propiedades de la matriz traspuesta.

1. (A + B)t = At + B t , ∀ A, B ∈ Mm×n .

2. (λ A)t = λ At , ∀ A ∈ Mm×n , ∀λ ∈ R.

3. (A.B)t = B t .At , para toda pareja de matrices A y B conformables.

4. (At )t = A, ∀ A ∈ Mm×n .

La demostración queda cargo del lector.

Ejercicio 1.1.1. Construya la matriz A = ((aij )) 3 × 2 que cumple aij = 2i − j,


(i = 1, 2, 3 , j = 1, 2).
   
a + b −2 2 −2
Ejercicio 1.1.2. Calcule a y b para que =
3 a−b 3 4
1.1. Matrices y operaciones con matrices 13

Ejercicio 1.1.3. Se consideran las siguientes matrices:


   
    1 0 −1 1 0 −1 2
5 −2 2 3 −1
A= ,B= , C =  0 2 −3  , D =  3 −2 1 6 
1 0 1 −2 5
2 1 0 0 −5 4 3

1. Encuentre las siguientes matrices: A + At , 2C − 7I3 , B t .B , B.B t .


2. Calcule todos los productos (que se puedan realizar) de dos factores utilizando las
matrices A, B, C y D. (Por ejemplo A.B tiene sentido pero A.D no.)
 
1 3
3. Encuentre todas las matrices X que verifiquen la igualdad 2A − 4X =
2 1
Ejercicio 1.1.4. Investigue si las siguientes igualdades se cumplen para toda pareja de
matrices A, B ∈ Mn×n . En caso de que no se cumplan siempre, halle la condición que
deben verificar A y B para que la igualdad sea verdadera.
1. (A + B)2 = A2 + 2A.B + B 2
2. (A + B)(A − B) = A2 − B 2
3. Ap .Aq = Ap+q , p y q naturales.
4. Ap .B p = (A.B)p , p natural.

Ejercicio 1.1.5.
1. Una matriz A se dice simétrica si At = A. Pruebe que B + B t es simétrica para
toda matriz B n × n.
2. Una matriz A se dice antisimétrica si At = −A. Pruebe que B −B t es antisimétrica
para toda matriz B n × n.
 
a a2 + 2 5
3. Halle todos los valores de a para que la matriz  −3a 1 −1  sea simétrica.
5 −1 0
Ejercicio 1.1.6.
1. Halle todas las matrices A 2 × 2 tales que A2 = I2 .
2. Halle todas las matrices A 2 × 2 tales que A2 = −I2 .
3. Halle todas las matrices A 2 × 2 tales que A2 = O.

Ejercicio 1.1.7. Traza de una matriz cuadrada.


i=n
X
Si A es una matriz se define la traza de A como el número tr(A) = aii .
i=1
Pruebe que:
1. tr(A + B) = tr(A) + tr(B), ∀ A, B ∈ Mn×n .
2. tr(cA) = c tr(A), ∀ A ∈ Mn×n , ∀ c ∈ R.

3. tr(A) = tr At , ∀ A ∈ Mn×n .
4. tr(A.B) = tr(B.A), ∀ A, B ∈ Mn×n .
5. No existen matrices A, B ∈ Mn×n tales que A.B − B.A = In .
 
1 1 1
Ejercicio 1.1.8. Se considera la matriz A =
1 1 −1
14 Capı́tulo 1. Álgebra de Matrices

1. Demuestre que existen infinitas matrices B tales que A.B = I2 .


2. Demuestre que no existe ninguna matriz C tal que C.A = I3 .

Ejercicio 1.1.9. Una empresa comercializa cuatro artı́culos. A continuación se dan las
matrices columna correspondientes al stock al comienzo de la semana (S), a las compras
(C) y las ventas (V ) realizadas por la empresa en esa semana y la matriz de precios de
venta de cada artı́culo (vigente en la semana y sin IVA).
       
20 2 7 3000
 17   4   16   2000 
S=
 15  , C =  0
   , V =
  8  , P =  1000
  

4 3 2 9000

1. Exprese las operaciones matriciales que permiten obtener la matriz correspondiente


al stock al final de la semana y la matriz de precios de venta con el IVA.
2. Exprese las operaciones matriciales que permiten obtener el ingreso obtenido por la
empresa durante la semana.

Ejercicio 1.1.10. Una fábrica produce tres artı́culos y en esa producción se necesita una
materia prima y mano de obra de acuerdo con lo que se indica a continuación:
Artı́culo 1: Cada unidad requiere 3 kilos de materia prima y 4 horas hombre.
Artı́culo 2: Cada unidad requiere 2 kilos de materia prima y 5 horas hombre.
Artı́culo 3: Cada unidad requiere 4 kilos de materia prima y 6 horas hombre.
1. Sean: p1 el precio por kilo de la materia prima y p2 la remuneración por hora de
trabajo. Defina dos matrices u y v de modo que el producto ut v sea el costo variable
por producir x unidades del artı́culo 1, y unidades del artı́culo 2 y z unidades del
artı́culo 3.
2. Sea k el costo fijo de producción y a, b, c los precios de venta de cada unidad de
los artı́culos 1, 2 y 3 respectivamente. Exprese mediante operaciones matriciales la
utilidad que obtiene la fábrica al vender x unidades del artı́culo 1, y unidades del
artı́culo 2 y z unidades del artı́culo 3.

Ejercicio 1.1.11. Una empresa vende cinco clases de artı́culos (de tipo A, de tipo B, de
tipo C, de tipo D y tipo E). Se conocen las cantidades vendidas en los años 2007 al 2010.
Esta información viene dada por la matriz M mientras que los precios de los artı́culos por
la matriz P :    
100 120 130 150 5
 50 60 60 80   9 
   
M =  150 240 200 260 
  P =   10 

 129 223 240 300   7 
111 122 144 157 8
(Esto quiere decir que cada artı́culo de tipo A cuesta 5 pesos, y ası́ sucesivamente). Me-
diante operaciones matriciales ¿es posible calcular el ingreso total de la empresa durante
estos cuatro años?

Ejercicio 1.1.12. Una empresa fabrica tres productos (A, B y C) cada uno de los cuales
requiere de ciertas cantidades de tres tipos de materia prima y de mano de obra. La matriz
1.2. Matrices invertibles 15

R resume los requerimientos por unidad de cada producto:


 
2 4 5 5
R =  3 2 3 8 
1 3 5 4

Las necesidades de materias primas se dan en kg por unidad y las de mano de obra en
horas por unidad. Las tres materias primas cuestan $2, $3 y $1,50 por kg respectivamente.
Los costos de mano de obra son de $5 por hora. Suponga que se deben fabricar 500, 1000
y 400 productos de tipo A, B y C respectivamente. Plantee las operaciones matriciales que
deben realizarse para calcular el costo total de la producción.
Ejercicio 1.1.13. Un experto en sondeos de opinión está observando una elección para
elegir al Intendente de una ciudad. A partir de la última encuesta se obtuvieron los por-
centajes de preferencias de seis zonas diferentes con respecto a los tres candidatos. Dichos
valores se muestran en la siguiente matriz:
 
0, 40 0, 35 0, 30 0, 50 0, 30 0, 36
M =  0, 42 0, 40 0, 25 0, 30 0, 30 0, 32 
0, 18 0, 25 0, 45 0, 20 0, 40 0, 32

El número de ciudadanos que se espera voten en cada zona es 30000, 60000, 70000, 45000,
55000, 40000 respectivamente. En base a esta información ¿cuál es la proyección de resul-
tados que se puede hacer?

1.2. Matrices invertibles


Como toda matriz tiene una matriz opuesta hemos podido definir la resta de matrices de
modo análogo a como se hace con números reales. Sin embargo, el lector habrá notado
que no hemos hablado de “división” de matrices. ¿Cómo se definı́a la división de números
reales? Basándonos en el hecho de que todo real diferente de 0 tiene inverso, si a, b ∈ R y
b 6= 0 la división a/b se define como el producto de a por b−1 en donde b−1 es el inverso
de b, que está caracterizado por b b−1 = 1 (el inverso de un número b es otro número que
multiplicado por b da como resultado el neutro del producto). Estas consideraciones nos
llevan a la siguiente definición.

Definición 1.2.1. Matriz invertible.


Sea A una matriz n × n. Diremos que la matriz A es invertible si, y solo si, existe B
matriz n × n tal que
A.B = In y B.A = In (1.1)
donde In es la matriz identidad n × n
Observación 1.2.1. Nuevamente, como consecuencia de la no conmutatividad del pro-
ducto de matrices debemos, en la definición anterior, exigir que A.B y B.A sean ambos
iguales a la identidad. A priori podrı́a ocurrir que A.B = In 6= B.A. Veremos más adelante
que esto realmente no es posible. De hecho, probaremos que si existe B tal que A.B = In
entonces B.A = In . Observemos además que las matrices invertibles son por definición
matrices cuadradas.
16 Capı́tulo 1. Álgebra de Matrices

A continuación veremos que la matriz B que cumple (1.1), cuando existe, es única. Por
tal motivo se le llama inversa de A y se utiliza la notación B = A−1

Proposición 1.2.1. Sean B1 y B2 matrices n × n que cumplen (1.1) entonces B1 = B2

Demostración. Se tiene:

B1 = B1 I = B1 (A B2 ) = (B1 A) B2 = I B2 = B2 ♠
   
2 1 1 −1
Ejemplo 1.2.1. La matriz A = es invertible, pues existe B =
1 1 −1 2
tal que A.B = I y B.A = I (verificarlo).
 
1 1 0
Ejemplo 1.2.2. La matriz A =  1 0 −1  no es invertible, pues para cualquier
0 0 0
 
a b c
matriz B =  d e f  se cumple que
g h i
    
1 1 0 a b c a+d b+e c+f
A.B =  1 0 −1   d e f  =  a − g b − h c − i  6=
0 0 0 g h i 0 0 0
 
1 0 0
6=  0 1 0 =I
0 0 1

Proposición
  El caso de matrices 2 × 2
1.2.2.  
a b d −b
Sea A = . Si ad − bc 6= 0 entonces A es invertible y A−1 = 1
ad−bc
c d −c a

Demostración. Si no  conociéramos
 un candidato para A−1 tendrı́amos que plantearnos
e f
una matriz genérica multiplicarla por A, imponer que dicho producto sea la
g h
 
1 0
identidad y, de ese modo, intentar hallar las entradas e, f, g y h. No nos interesa
0 1
hacer eso en este momento ya que dicho planteo será discutido más adelante. Ahora, el
lector puede simplemente verificar que los productos
   d −b   d −b   
a b ad−bc ad−bc ad−bc ad−bc a b
. −c a y −c a .
c d ad−bc ad−bc ad−bc ad−bc c d
 
1 0
dan como resultado la matriz identidad . ♠
0 1
Para hallar la inversa (en caso que exista) de una matriz 2×2 alcanza con aplicar la fórmula
que se dio en el teorema anterior. Para matrices cuadradas de dimensiones mayores a 2 la
situación es completamente diferente pues no existen “fórmulas sencillas” para aplicar. En
el próximo capı́tulo veremos una condición necesaria y suficiente para que una matriz sea
1.2. Matrices invertibles 17

invertible ası́ como también un algoritmo que nos permitirá hallar la inversa. Aunque no
sepamos eso todavı́a, podemos continuar estudiando algunas propiedades de las matrices
invertibles.

Proposición 1.2.3. La inversa de un producto de matrices.


Si A y B son dos matrices n × n invertibles entonces A.B es invertible y
(A.B)−1 = B −1 .A−1

Demostración. Para demostrarlo basta con multiplicar A.B por su “candidata” a inversa
y verificar que da la identidad:
= In
 z }| {
(A.B) B −1 .A−1 = A (B.B −1 ) A−1 = A.In .A−1 = A.A−1 = In
= In
z }| {
(B −1 .A−1 )(A.B) = B −1 (A−1 .A) B = B −1 .In .B = B −1 .B = In

Ejercicio 1.2.1. Halle la inversa de las siguientes matrices y verifique:


   
2 1 4 1
A= , B=
1 1 2 1

Ejercicio 1.2.2. Investigue si las siguientes afirmaciones son verdaderas o falsas justi-
ficando la respuesta (en caso de ser verdadera deberá demostrar y, en caso de ser falsa
deberá dar un contraejemplo).
−1
1. Si A es una matriz invertible entonces A−1 =A
2. Si A es una matriz invertible y k 6= 0 entonces kA es invertible y (kA)−1 = k1 A−1
−1 t
3. Si A es una matriz invertible entonces At también lo es y At = A−1
4. Si A y B son dos matrices invertibles n × n entonces A + B es invertible.
5. Si A y B son dos matrices invertibles n × n y A + B es invertible entonces
(A + B)−1 = A−1 + B −1

Ejercicio 1.2.3. Sea A una matriz n × n. Pruebe que:


1. se cumple la igualdad: (In − A)(In + A + A2 + . . . + Ak ) = In − Ak+1 (k natural).
2. si A2 = O entonces In − A es invertible.
3. si A3 = O entonces In − A es invertible.
4. si existe k ∈ N tal que Ak = O entonces In − A es invertible.
5. Si A2 + 2A + In = O entonces A es invertible.
6. Si A3 − A + In = O entonces A es invertible.

Ejercicio 1.2.4. Matrices semejantes.


Se dice que dos matrices A y B, ambas n × n, son semejantes si existe una matriz P
n × n e invertible tal que B = P −1 .A.P . Supongamos que A y B sean semejantes. Pruebe
que:
1. At y B t son semejantes.
18 Capı́tulo 1. Álgebra de Matrices

2. A es invertible si, y solo si, B es invertible.


3. tr(A) = tr(B) (recuerde la propiedad (4) en el ejercicio 1.1.7).
4. B k = P −1 .Ak .P , ∀ k ∈ N.
5. si Ak = O entonces B k = O.

1.3. Apéndice de esta sección


Demostración de las propiedades del producto de matrices.

Asociativa Si A ∈ Mm×n , B ∈ Mn×p y C ∈ Mp×q , entonces (A.B).C = A.(B.C)


En efecto pongamos (A.B).C = D = ((dij )) y A.(B.C) = D ′ = ((d′ij )). Observemos,
en primer lugar, que ambas matrices D y D ′ tienen tamaño m × q. Debemos probar
que dij = d′ij ∀ i = 1, 2, ... , m ; ∀ j = 1, 2, ... , q.
!! ! !
X X X X
d′ij = aih bhs csj = aih bhs csj = dij
h s s h

Distributiva Si Si A, B ∈ Mm×n , C ∈ Mp×m y D ∈ Mn×q entonces


C.(A + B) = C.A + C.B y (A + B).D = A.D + B.D
Demostremos solamente la primera parte (la otra es totalmente análoga). Pongamos

C.(A + B) = G = ((gij )),


C.A = E = ((eij )) y C.B = F = ((fij )).

Debemos probar entonces que gij = eij + fij ∀ i, j.


X  X
gij = cih ahj + bhj = cih ahj + cih bhj =
h h
X X
= cih ahj + cih bhj = eij + fij
h h


Capı́tulo 2

Sistemas de ecuaciones lineales

2.1. Introducción
Gran parte de lo que estudiaremos en este curso se vincula con los sistemas de ecuacio-
nes lineales y, por lo tanto, vale la pena dedicar algún tiempo a presentarlos, discutir sus
propiedades y ciertas estrategias para resolverlos. El lector que ya conozca estos temas
tendrá, en todo caso, una oportunidad para repasarlos.

Algunos ejemplos de sistemas de ecuaciones lineales son los siguientes:



2x − 3y = 4
(sistema de 2 ecuaciones con 2 incógnitas)
3x + 4y = 1

 x + y + 2z = 8
x − y + z = 0 (sistema de 3 ecuaciones con 3 incógnitas)

x+y+z =6

x − 3y + z = 1
(sistema de 2 ecuaciones con 3 incógnitas)
x + 4y − z = 2

 x − 2y = 1
x + 3y = 2 (sistema de 3 ecuaciones con 2 incógnitas)

−x + 2y = 3
Cuando tengamos varias incógnitas podemos elegir una misma letra para representarlas y
distinguirlas mediante el uso de subı́ndices diferentes:


 x1 + 2x2 + x3 − x4 + x5 + x6 = 1

x1 − 2x2 + x3 + x4 + x5 − x6 = 0
(sistema de 5 ecuaciones con 6 incógnitas)

 x1 + 2x2 + x3 + 9x4 + 5x5 + 3x6 = 3

x1 + 2x2 + x3 + 2x4 − x5 + 3x6 = 2
20 Capı́tulo 2. Sistemas de ecuaciones lineales

Un sistema de m ecuaciones lineales con n incógnitas x1 , x2 , . . . , xn es un problema


del tipo:


 a11 x1 + a12 x2 + . . . + a1n xn = b1

 a21 x1 + a22 x2 + . . . + a2n xn = b2
(S) .. ..


 . .

am1 x1 + am2 x2 + . . . + amn xn = bm

donde aij con i = 1, . . . , m y j = 1, . . . , n (los coeficientes del sistema) y bj con j = 1, . . . , m


(los términos independientes) son números.1 Diremos que el sistema es m × n, indicando
siempre con el primer número la cantidad de ecuaciones y con el segundo la de incógnitas.
Una solución del sistema (S) es una lista ordenada de n números (α1 , α2 , . . . , αn ) tales
que si se sustituye x1 = α1 , x2 = α2 , . . . , xn = αn se verifican simultáneamente las m
ecuaciones.
Llamaremos conjunto solución del sistema (S) y lo notaremos Sol(S) al conjunto de
todas las soluciones de (S). Resolver un sistema es determinar su conjunto solución.2
Clasificaremos los sistemas de acuerdo al número de soluciones que tenga. Diremos enton-
ces que un sistema es compatible determinado si tiene una única solución, compatible
indeterminado si tiene más de una solución3 e incompatible si no tiene ninguna solu-
ción.

Ejemplo 2.1.1. El ejemplo más sencillo de un sistema lineal es el 1 × 1:

ax = b

En pocos renglones podemos discutir completamente como es el conjunto solución. Si a 6= 0


entonces el sistema es compatible determinado y su única solución es x = ab = a−1 b. Si
en cambio a = 0 hay dos posibilidades: si b 6= 0 el sistema es incompatible y si b = 0
trivialmente el sistema es compatible indeterminado y cualquier número es solución del
mismo.
Naturalmente este problema es extremadamente sencillo, pero como acontece muchas veces
las ideas que aquı́ se utilizan, convenientemente adaptadas, resultaran útiles en casos más
generales y complicados.

Ejemplo 2.1.2.

 x=1
(S) y=3

z=2

es un sistema 3 × 3. Se observa de manera inmediata que Sol(S) = {(1, 3, 2)}.

1
En nuestro cursos los números que consideraremos pertenecen al cuerpo de los reales.
2
En general, salvo que se indique lo contrario, las soluciones se consideraran en el mismo conjunto de
números que los coeficientes, o sea los números reales.
3
Veremos más adelante que si un sistema lineal admite más de una solución entonces necesariamente
debe admitir infinitas.
2.1. Introducción 21

Ejemplo 2.1.3. 
 x + y + 2z = 8
(S) 2y + z = 8

z=2
es también un sistema 3 × 3. Aquı́ con algo más de trabajo también se puede deducir
fácilmente el conjunto solución. Para esto basta observar que de abajo hacia arriba cada
ecuación tiene exactamente una incógnita más que la siguiente, por este motivo se dice que
el sistema está “escalerizado”. De la última ecuación se despeja z = 2. Con este valor de z
sustituimos en la segunda ecuación y tenemos 2y+2 = 8 =⇒ 2y = 6 =⇒ y = 3. Finalmente
con los valores de y y z hallados “subimos” a la primera ecuación y sustituyendo se tiene
que x + 3 + 2(2) = 8 =⇒ x = 1. En consecuencia Sol(S) = {(1, 3, 2)}.
Este procedimiento de despejar una incógnita en una ecuación y sustituirla en otra de
arriba se denomina sustitución hacia atrás.

Definición 2.1.1. Sistemas equivalentes.


Diremos que dos sistemas (S) y (S ′ ) son equivalentes cuando sol(S) = sol(S ′ ), es decir,
cuando tienen el mismo conjunto solución.

Observemos que en los ejemplos 2.1.2 y 2.1.3 los conjuntos solución son iguales, por lo que
los sistemas son equivalentes.

Ejemplo 2.1.4. 
 x + y + 2z = 8
(S) x−y+z =0

x+y+z =6
Una estrategia para resolver este sistema, inspirada en los ejemplos anteriores, podrı́a ser
la de sustituir el sistema (S) por otro (S ′ ), equivalente y “escalerizado”, de modo de poder
resolver (S ′ ) (y por ende (S) ya que al ser equivalentes los conjuntos solución de ambos
sistemas coinciden) con el procedimiento utilizado en el ejemplo 2.1.3. Analicemos un poco
estas ideas antes de retomar la resolución concreta del ejemplo.

La pregunta que naturalmente surge es ¿cómo hacer para sustituir un sistema por otro
que resulte equivalente? Para responderla introducimos la siguiente definición.

Definición 2.1.2. Transformaciones elementales.


Llamaremos transformaciones elementales a cualquiera de las siguientes operaciones
efectuadas a las ecuaciones de un sistema lineal:

1. Intercambiar de lugar dos ecuaciones. (Fi ↔ Fj )

2. Multiplicar una ecuación por un número α 6= 0. (αFi )

3. Sumar a una ecuación un múltiplo de otra. (Fi + βFj )

Entre paréntesis se indica la notación que utilizaremos para especificar cada operación en
los ejemplos. La ecuación i-ésima será notada con Fi .

La siguiente proposición responde la pregunta formulada arriba.


22 Capı́tulo 2. Sistemas de ecuaciones lineales

Proposición 2.1.1. Si en un sistema lineal de ecuaciones se efectúa una transformación


elemental entonces el sistema resultante es equivalente al original.
La demostración se puede encontrar en el apéndice de este capı́tulo.

Las cuestiones que se imponen ahora son las de saber si cualquier sistema puede ser
“escalerizado” mediante transformaciones elementales y en caso afirmativo determinar un
método o algoritmo que permita hacerlo. Volvamos a analizar el ejemplo 2.1.4.
Ejemplo 2.1.4 (continuación). Para que el sistema quede “escalerizado”, en la segunda y
tercera ecuación no debe aparecer la incógnita x entonces dejemos la primera ecuación igual
y realicemos transformaciones elementales en la segunda y tercera. La idea es combinar
ambas con la primera de modo que los coeficientes de la incógnita x se anulen. Como el
coeficiente de x en las tres ecuaciones es 1 basta en ambos casos restar la primera.
 
 x + y + 2z = 8  x + y + 2z = 8
x−y+z =0 ∼ −2y − z = −8 ←− F2 − F1
 
x+y+z =6 −z = −2 ←− F3 − F1

El sistema está ya “escalerizado”, si multiplicamos las dos últimas ecuaciones por −1 se


obtiene el sistema del ejemplo 2.1.3 por lo cual Sol(S) = {(1, 3, 2)}

2.2. Matriz asociada a un sistema de ecuaciones lineales


Definición 2.2.1. Dado un sistema de ecuaciones lineales

 a11 x1 + a12 x2 + . . . + a1n xn


= b1
 a21 x1 + a22 x2 + . . . + a2n xn = b2
(S) .. ..


 . .

am1 x1 + am2 x2 + . . . + amn xn = bm

llamaremos matriz asociada al sistema a la matriz A, de tamaño m×n, cuyas entradas


son los coeficientes del mismo:
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
 
A= . .. . .. 
 .. . . . . 
am1 am2 . . . amn

Llamaremos matriz ampliada asociada al sistema a la matriz A | b, de tamaño m ×


(n + 1) definida por:
 
a11 a12 ... a1n b1
 a21 a22 ... a2n b2 
 
A|b= . .. .. .. .. 
 .. . . . . 
am1 am2 . . . amn bm

Diremos que dos matrices ampliadas son equivalentes si los respectivos sistemas lo son.
2.3. El método de escalerización 23

Observación 2.2.1. Sistemas de ecuaciones en notación matricial.


Manteniendo la notación de la definición anterior, designemos con X y b a las matrices
columna de las incógnitas y de los términos independientes respectivamente
   
x1 b1

 x2 


 b2 

X= ..  , b= .. 
 .   . 
xn bm

Entonces el sistema se puede escribir: (M ) A.X = b

El sistema (S) y la ecuación matricial (M ) son equivalentes en el siguiente sentido:


 
x1

 x2 

(x1 , x2 , . . . , xn ) es solución de (S) ⇐⇒ X= ..  es solución de (M )
 . 
xn

La ecuación (M ) da lugar a una notación más compacta (matricial) para un sistema de


ecuaciones.

Ejemplo 2.2.1. Consideremos el sistema



 x + y + 2z = 9
(S) 3x + 6y − 5z = 0

2x + 4y − 3z = 1

entonces la matriz del sistema, la matriz de los términos independientes y la matriz am-
pliada son:
     
1 1 2 9 1 1 2 9
A = 3 6 −5 , b =  0  y A|b =  3 6 −5 0 
2 4 −3 1 2 4 −3 1
 
x
El sistema en notación matricial se escribe: A.  y  = b
z

2.3. El método de escalerización


Para aplicar el procedimiento de escalerización del ejemplo 2.1.4 a la matriz ampliada de
un sistema simplemente aplicamos las mismas transformaciones elementales sobre las filas
de esta matriz.
24 Capı́tulo 2. Sistemas de ecuaciones lineales

Ejemplo 2.3.1. Intentemos escalerizar el sistema del ejemplo 2.2.1


   
1 1 2 9 1 1 2 9
 3 6 −5 0  ∼  0 3 −11 −27  ←− F2 − 3F1
2 4 −3 1 0 2 −7 −17 ←− F3 − 2F1
 
1 1 2 9
∼  0 3 −11 −27 
1
0 0 3 1 ←− F3 − 23 F2
 
1 1 2 9
∼  0 3 −11 −27 
0 0 1 3 ←− 3F3
Por lo tanto el sistema (S) es equivalente al sistema

 x + y + 2z = 9
3y − 11z = −27

z =3
Ahora podemos proceder a realizar sustitución hacia atrás. De la última ecuación se tiene
z = 3. Con este valor sustituimos en la segunda y tenemos 3y − 33 = −27 =⇒ 3y = 6 =⇒
y = 2. Finalmente sustituyendo en la primera x + 2 + 6 = 9 =⇒ x = 1. En consecuencia
el sistema es compatible determinado y Sol(S) = {(1, 2, 3)}.
Hasta ahora no hemos sido precisos para definir a que le llamamos un sistema o matriz
escalerizada.
Definición 2.3.1. Matriz escalerizada y escalerizada reducida.
Llamaremos matriz escalerizada a una matriz que cumpla las siguientes condiciones
1. Todas las filas, salvo quizás la primera, comienzan con una sucesión de ceros.
2. Cada fila tiene al principio por lo menos un cero más que la fila inmediata superior.
Llamaremos matriz escalerizada reducida a una matriz escalerizada que además cum-
ple las siguientes condiciones:
1. La primera entrada no nula de una fila es 1.
2. La columna correspondiente a la primera entrada no nula de una fila tiene el resto
de las entradas todas nulas.
Diremos que un sistema está escalerizado si su matriz ampliada lo está.
Escalerizar un sistema (o matriz) consiste en encontrar un sistema (matriz) esca-
lerizado equivalente. Si A es una matriz y E es una matriz escalerizada equivalente a A
diremos que E es una forma escalerizada de A.
Ejemplo 2.3.2.
   
2 1 0 1 2 1 0 1
 0 3 2 1   0 0 3 1 
A=
 0
 B= 
0 2 1   0 0 0 2 
0 0 0 4 0 0 0 0
2.3. El método de escalerización 25

   
1 0 4 0 1 1 0 1 0
 0 1 2 0   0 0 1 2 0 
C=
 0
 D= 
0 0 1   0 0 0 0 1 
0 0 0 0 0 0 0 0 0
Las matrices A y B son escalerizadas mientras que C y D son escalerizadas reducidas.
En el ejemplo 2.2.1 se aprecia que, una vez obtenida la forma escalerizada, el método de
sustitución hacia atrás permite resolver el sistema. Cabe entonces preguntarse el motivo
para introducir la definición de matriz escalerizada reducida. Veamos el siguiente ejemplo.

 2x + 4y + 2z = −2
Ejemplo 2.3.3. Queremos resolver el sistema: (S) x + y + 2z = 0

−x + y − 2z = 2
La matriz ampliada del sistema es:
 
2 4 2 −2
 1 1 2 0 
−1 1 −2 2
Procedamos a escalerizarla, para lo cual, en primer lugar, obtenemos una matriz equiva-
lente, pero con ceros en la segunda y tercera posición de la primera columna. Dejamos la
primera fila fija y la utilizamos como “pivot” para combinar con las otras dos.
   
2 4 2 −2 2 4 2 −2
 1 1 2 0  ∼  0 −1 1 1  ←− F2 − 12 F1
−1 1 −2 2 0 3 −1 1 ←− F3 + 12 F1
Ahora la primera y segunda fila tienen el aspecto adecuado. El segundo paso consiste en
sustituir la tercera fila por otra con dos ceros en los primeros lugares. Para esto combinamos
convenientemente la tercera con la segunda fila.
   
2 4 2 −2 2 4 2 −2
 0 −1 1 1  ∼  0 −1 1 1  (2.1)
0 3 −1 1 0 0 2 4 ←− F3 + 3F2
Nótese que al dar el segundo paso, la primera fila ya no interviene y se procede de manera
análoga al primer paso, pero utilizado la segunda fila como fila “pivot”.

Ahora que obtuvimos una forma escalerizada de la matriz original podrı́amos proceder
con la sustitución hacia atrás, pero en lugar de esto intentemos obtener la forma reducida.
Fijamos la tercera fila como “pivot” y la combinamos con la primera y segunda de modo
que se anulen las entradas de la tercera columna correspondientes a la primera y segunda
fila    
2 4 2 −2 2 4 0 −6 ←− F1 − F3
 0 −1 1 1  ∼  0 −1 0 −1  ←− F2 − 12 F3
0 0 2 4 0 0 2 4
Combinando la segunda fila con la primera obtenemos un cero en la entrada de primera
fila y segunda columna
   
2 4 0 −6 2 0 0 −10 ←− F1 + 4F2
 0 −1 0 −1  ∼  0 −1 0 −1 
0 0 2 4 0 0 2 4
26 Capı́tulo 2. Sistemas de ecuaciones lineales

Para llegar a la forma reducida solo resta obtener unos en las entradas no nulas de cada
fila    
2 0 0 −10 1 0 0 −5 ←− 12 F1
 0 −1 0 −1  ∼  0 1 0 1  ←− −F2
0 0 2 4 0 0 1 2 ←− 12 F3
El sistema resultante, equivalente a (S), es entonces

 x = −5

(S ) y=1

z=2

Luego, es compatible determinado y Sol(S) = {(−5, 1, 2)}.

Obsérvese que en 2.1 la escalera que se obtuvo tiene todos sus “escalones” de ancho una
columna. Esto implica que en el correspondiente sistema cada ecuación tenga exactamente
una incógnita más que la inmediata inferior.

El proceso de obtener la forma reducida sustituye entonces al algoritmo de sustitución


hacia atrás. Además, el lector puede observar que la forma escalerizada de una matriz no
es única (para obtener otra basta sustituir una fila por una combinación de ella con una
fila inferior), pero la reducida sı́ lo es.

 2x + 4y + 2z = −2
Ejemplo 2.3.4. Queremos resolver el sistema: (S) x + y + 2z = 0 La matriz

−x + y − 4z = 2
ampliada del sistema es:  
2 4 2 −2
 1 1 2 0 
−1 1 −4 2
Procedamos como en el ejemplo anterior
   
2 4 2 −2 2 4 2 −2
 1 1 2 0  ∼  0 −1 1 1  ←− F2 − 12 F1
−1 1 −4 2 0 3 −3 1 ←− F3 + 12 F1
 
2 4 2 −2
∼  0 −1 1 1 
0 0 0 4 ←− F3 + 3F2

A diferencia del ejemplo precedente, la forma escalerizada de la matriz ampliada tiene tres
escalones, esto es, un escalón más que la de la matriz del sistema. La última ecuación del
sistema escalerizado es 0 = 4 y, consecuentemente, el sistema resulta incompatible.

Ejemplo 2.3.5. Procedamos a resolver el sistema:



 x + 2y + 3z = 4
(S) x + 3y + 4z = 5

2x + 5y + 7z = 9
2.3. El método de escalerización 27

La matriz ampliada del sistema es:


 
1 2 3 4
 1 3 4 5 
2 5 7 9

Se tiene:
   
1 2 3 4 1 2 3 4
 1 3 4 5  ∼  0 1 1 1  ←− F2 − F1
2 5 7 9 0 1 1 1 ←− F3 − 2F1
 
1 2 3 4
∼  0 1 1 1 
0 0 0 0 ←− F3 − F2

Vale la pena observar que, al igual que en el ejemplo 2.3.3, el número de escalones de la
matriz ampliada y el de la matriz del sistema coinciden. Por esta razón el sistema resulta
compatible. Sin embargo, aquı́ la “escalera” presenta “descansos” o escalones largos (el
primero y el segundo). El sistema de ecuaciones asociado es

 x + 2y + 3z = 4

(S ) y+z =1

0=0

Despejando y en función de z de la segunda ecuación se obtiene y = 1 − z. Sustituyendo en


la primera y operando resulta x = 2 − z. Cada valor real de z elegido libremente determina
una solución del sistema (S). Por ejemplo, si z = 1, se obtiene la solución (1, 0, 1). Si z = 0
se tiene la solución (2, 1, 0). El sistema es entonces compatible indeterminado y en virtud
de que una de sus incógnitas puede elegirse libremente diremos que tiene un grado de
libertad. El conjunto solución es

Sol(S) = { (2 − z, 1 − z, z) / z ∈ R }

Ejemplo 2.3.6. Hasta ahora hemos visto solamente sistemas de 3 ecuaciones con 3
incógnitas, pero las ideas utilizadas funcionan para cualquier sistema m × n. Veamos
un ejemplo de un sistema de 4 ecuaciones con 3 incógnitas.
  

 x + y − 2z = 3 1 1 −2 3

x + 2y + z = 1  1 2 1 1 
(S) cuya matriz ampliada es:  

 x + y + 3z = 2  1 1 3 2 

x + 2y − 4z = 2 1 2 −4 2

Escalerizando tenemos que la matriz es equivalente a las siguientes:


 
1 1 −2 3
 0
 1 3 −2 
 ←− F2 − F1 intercambiando la tercera fila con la cuarta se obtiene
 0 0 5 −1  ←− F3 − F1
0 1 −2 −1 ←− F4 − F1
28 Capı́tulo 2. Sistemas de ecuaciones lineales

   
1 1 −2 3 1 1 −2 3
 0 1 3 −2   0 1 3 −2 
∼  ∼  
 0 1 −2 −1   0 0 −5 1  ←− F3 − F2
0 0 5 −1 0 0 5 −1
 
1 1 −2 3
 0 1 3 −2 
llegando finalmente a  
 0 0 −5 1 
0 0 0 0 ←− F4 + F3
El número de escalones de la matriz ampliada y el de la matriz del sistema coinciden.
Por esta razón el sistema resulta compatible. Mas aún, como el número de escalones
coincide con el número de incógnitas, el sistema es compatible determinado. El sistema de
ecuaciones asociado es entonces


 x + y − 2z = 3

y + 3z = −2
(S ′ )

 −5z = 1

0=0

El valor de z queda determinado z = −1/5 y por sustitución hacia atrás se determinan


los únicos valores de y y x que son: y = −7/5 , x = 4. El conjunto solución del sistema
contiene una sola terna: Sol(S) = {(4, −7/5, −1/5)}.
Otro ejemplo (en este caso de un sistema de cinco ecuaciones con seis incógnitas) puede
encontrarse en el apéndice a este capı́tulo.

Los ejemplos anteriores parecen indicar que cualquier matriz y por ende cualquier sistema
puede ser escalerizado. Establezcamos este hecho en el siguiente resultado (cuya demos-
tración se puede encontrar en el apéndice a este capı́tulo):

Proposición 2.3.1. Toda matriz puede ser transformada en una matriz escalerizada (o
escalerizada reducida) mediante una cantidad finita de transformaciones elementales.

Corolario 2.3.1. Todo sistema lineal es equivalente a uno escalerizado.

2.4. Teorema de Rouche - Frobenius


En las discusiones realizadas de los ejemplos de la sección anterior se aprecia cierta rela-
ción entre el número de escalones de la forma escalerizada y la cantidad de soluciones del
sistema. En esta sección establecemos con precisión esta relación describiendo completa-
mente el conjunto solución de un sistema lineal de ecuaciones en termino de la cantidad
de “escalones” del mismo.

Definición 2.4.1. Número de escalones de una matriz escalerizada.


Si E es una matriz escalerizada el número de escalones de E es la cantidad de filas
no nulas.

Observación 2.4.1. Si E es una matriz escalerizada y E ′ es una matriz reducida equi-


valente entonces el número de escalones de ambas es el mismo.
2.4. Teorema de Rouche - Frobenius 29

Observación 2.4.2. Ya hemos observado que la forma escalonada de una matriz no es


única. Sin embargo, y aunque no lo hemos probado todavı́a, la forma reducida sı́ lo es. De
este hecho y de la observación precedente se deduce que la cantidad de escalones de todas
las formas escalerizadas de una misma matriz coinciden.

Definición 2.4.2. Rango por filas o número de escalones de una matriz.


Si A es una matriz llamaremos número de escalones de A al número de escalones
de cualquiera de sus formas escalerizadas. Este número también se denomina rango por
filas de la matriz y se simboliza rgf (A).

Teorema 2.4.1 (Rouche - Frobenius). Sea (S) un sistema de m ecuaciones lineales con
n incógnitas con matriz ampliada A|b. Si p es el número de escalones de A y p′ el número
de escalones de A|b entonces

1. (S) es compatible si, y solo si, p = p′ .

2. Si (S) es compatible entonces

a) (S) es determinado si, y solo si, p = n.


b) (S) es indeterminado si, y solo si, p < n.

Dicho de otro modo:

1. (S) es compatible si, y solo si, rgf (A) = rgf (A|b) (el rango por filas de A coincide
con el rango por filas de la matriz ampliada).

2. Si (S) es compatible entonces

a) (S) es determinado si, y solo si, rgf (A) = n (el rango por filas de A coincide
con el rango por filas de la matriz ampliada y con el número de columnas de
A).
b) (S) es indeterminado si, y solo si, rgf (A) < n (el rango por filas de A coincide
con el rango por filas de la matriz ampliada pero es menor que el número de
columnas de A).

Observación 2.4.3. Un sistema con más incógnitas que ecuaciones.


Supongamos que tenemos un sistema de m ecuaciones con n incógnitas. Tanto su matriz
asociada como su forma escalerizada serán matrices m × n, es decir, tendrán m filas y
n columnas. Por lo tanto, la cantidad de escalones p de la matriz escalerizada siempre
será menor o igual que m. Supongamos que hay más incógnitas que ecuaciones, o sea
m < n. En este caso resulta que p < n y, por lo tanto, según el teorema de Rouche -
Frobenius, el sistema no puede ser determinado. Conclusión: un sistema lineal con más
incógnitas que ecuaciones solo puede ser incompatible o compatible indeterminado, nunca
compatible determinado.
30 Capı́tulo 2. Sistemas de ecuaciones lineales

Ejemplo 2.4.1. Veamos algunos ejemplos en donde se muestra la forma escalerizada de


la matriz ampliada de un sistema y el comportamiento del sistema correspondiente según
el teorema de Rouche-Frobenius.

 
2 1 2 −2 5
 0 −1 1 1 2  rgf (A) = rgf (A|b) = n = 4 =⇒
 
 0 0 2 4 3  sistema compatible determinado.
0 0 0 2 −1

 
1 2 2 −3 1
 0
 1 −1 1 3 
 rgf (A) = rgf (A|b) = 3 < n = 4 =⇒
 0 0 2 1 2  sistema compatible indeterminado.
0 0 0 0 0

 
1 2 2 −3 1
 0
 1 −1 1 3 
 rgf (A) = rgf (A|b) = 2 < n = 4 =⇒
 0 0 0 0 0  sistema compatible indeterminado.
0 0 0 0 0

 
1 2 2 −3 1
 0
 1 −1 1 3 
 rgf (A) = 2 6= rgf (A|b) = 3 =⇒
 0 0 0 0 7  sistema incompatible.
0 0 0 0 0

 
1 2 2 −3 1 7
 0 1 −1 rgf (A) = rgf (A|b) = 3 < n = 5 =⇒
1 3 2 
sistema compatible indeterminado.
0 0 2 1 2 5

Observación 2.4.4. Un sistema homogéneo no es incompatible.


Un sistema con todas las entradas del término independiente nulas se denomina sistema
homogéneo. 

 a11 x1 + a12 x2 + . . . + a1n xn = 0

 a21 x1 + a22 x2 + . . . + a2n xn = 0
(H) .. ..


 . .

am1 x1 + am2 x2 + . . . + amn xn = 0
Se observa que si sustituimos todas las incógnitas por 0 (x1 = 0, . . . , xn = 0) entonces se
verifican todas las ecuaciones. Es decir, (0, 0, . . . , 0) es solución del sistema (H). A esta
solución la llamaremos solución trivial. Tenemos entonces que un sistema homogéneo
nunca es incompatible. Será compatible determinado si solo admite la solución trivial, y
compatible indeterminado si admite soluciones distintas de la trivial (además de la trivial,
claro).
2.5. Sistemas cuadrados, determinantes y Cramer 31

Observación 2.4.5. Más incógnitas que ecuaciones en un sistema homogéneo.


Según la observación 2.4.3 si un sistema tiene más incógnitas que ecuaciones no puede
ser determinado. Luego, todo sistema homogéneo con más incógnitas que ecuaciones es
indeterminado y, por lo tanto, admite soluciones distintas de la trivial.

Ejercicio 2.4.1. Resuelva los siguientes sistemas de ecuaciones:


  
 2x − 2y + z = 1  2x − 2y + z = 1  −x + 5y + 3z = 1
(a) x + y − 4z = 1 (b) x + y − 4z = 1 (c) 2x + y + 5z = 0
  
3x − y − 3z = 2 3x − y − 3z = 4 3x − 2y + 4z = −1

 x + y − 3z = −1
 
 x1 − x2 − x3 + 4x4 = 5 
2x + y − 2z = 1
(d) 2x1 − 3x2 − 4x3 + 9x4 = 13 (e)
  x +y+z =3
2x1 + x2 + 4x3 + 5x4 = 1 

x + 2y − 3z = 1
Ejercicio 2.4.2. En cada uno de los siguientes casos calcule el rango por filas de la matriz
A y concluya el comportamiento del sistema homogéneo A.X = O.
 
    1 1 1
1 1 −2 0 1 −2  1 −2 4 
(a) A =  1 1 −2  (b) A =  1 0 5  (c) A =   2 −1 2 

−3 −3 6 1 −2 3
4 −2 7
Ejercicio 2.4.3. Resuelva los siguientes sistemas discutiendo según el parámetro m ∈ R.
  
 x + y + mz = 1  x + my − z = 2m + 1  mx + y − z = m − 3
(a) x + my + z = 1 (b) x − m2 y − z = m (c) (m + 1)x + (m + 1)z = 3m
  
mx + y + z = −2 mx + my + mz = 1 x + my + z = 0
Ejercicio 2.4.4. Resuelva los siguientes sistemas de ecuaciones:

  x1 + x2 + x3 + 2x4 = 4
 3x1 − x2 − 3x3 − x4 = −2 


  2x1 + x2 + 2x3 + 2x4 = 7

2x1 − 2x2 − 6x3 − 6x4 = −4
(a) (b) x1 + 2x2 + x3 + 4x4 = 5
 2x1 − x2 − 3x3 − 2x4 = −3



 3x1 − 2x2 + 3x3 − 4x4 = 7

3x1 + x2 + 3x3 + 7x4 = 2 

4x1 − 3x2 + 4x3 − 5x4 = 10

2.5. Sistemas cuadrados, determinantes y Cramer


Para los sistemas que tienen la misma cantidad de incógnitas que de ecuaciones (cuadrados)
existen algunos resultados especiales que mencionaremos en esta sección. Comencemos
considerando el caso de un sistema 2 × 2:
  
ax + by = e a b
con matriz asociada A =
cx + dy = f c d
Si suponemos, para fijar ideas, que a 6= 0, una matriz escalerizada correspondiente a A es:
 
a b
0 ad − bc ←− (−c)F1 + aF2
32 Capı́tulo 2. Sistemas de ecuaciones lineales

Resulta entonces que el sistema es determinado si, y solo si, el número ad − bc es distinto
de cero. Este número se denomina determinante de la matriz A y se simboliza:

a b
det(A) = = ad − bc
c d
Como el lector conoce de cursos anteriores, es posible definir el determinante de una
matriz cuadrada (n × n). Recordemos algunos procedimientos de cálculo. Por ejemplo,
una de las maneras de calcular el determinante de una matriz 3 × 3 es a partir de la regla
de Sarrus:

a11 a12 a13

a21 a22 a23 = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a31 a22 a13 − a21 a12 a33 − a11 a32 a23

a31 a32 a33

Debemos tener presente que la regla de Sarrus es válida solamente para determinantes de
matrices 3 × 3. Otra forma de calcularlo es mediante el “desarrollo por la primera fila”:

a11 a12 a13
a22 a23 a21 a23 a21 a22
a21 a22 a23 = a11 − a12
a31 a33 + a13 a31 a32


a31 a32 a33
a32 a33

También es posible “desarrollarlo” por otras filas o columnas haciendo los cambios corres-
pondientes en cada caso.4 Por ejemplo, el desarrollo del determinante por la segunda fila
es:
a11 a12 a13
a21 a22 a23 = −a21 a12 a13 + a22 a11 a13 − a23 a11 a12

a32 a33 a31 a33 a31 a32
a31 a32 a33
En el caso particular de una matriz triangular (todas las entradas por encima o por debajo
de la diagonal principal son ceros) el resultado es muy simple. En efecto, desarrollándolo
por la primera columna se obtiene:

a11 a12 a13

0 a22 a23 = a11 a22 a33

0 0 a33
Es ası́ que el determinante de una matriz triangular es simplemente el producto de los
elementos que están en la diagonal principal.
Con excepción de la regla de Sarrus, el resto de las consideraciones mencionadas son válidas
también para el determinante de cualquier matriz n × n. Observemos que, por ejemplo,
el cálculo a partir del desarrollo por una fila (o columna) de un determinante 4 × 4 nos
llevarı́a a calcular cuatro determinantes 3 × 3, mientras que el un determinante 5 × 5 a
cinco determinantes 4 × 4. Por suerte, los determinantes tienen una serie de propiedades
que permiten un cálculo más simple y eficiente vinculado nuevamente con un proceso de
escalerización. Repasemos algunas de ellas (en todos los casos nos referiremos a matrices
cuadradas).
4
Recordemos que el desarrollo por una lı́nea (fila o columna) es la suma de los productos de los elementos
de la lı́nea por sus respectivos adjuntos. A su vez, el adjunto asociado a aij es el producto de (−1)i+j por
el subdeterminante de un orden menor que se obtiene al quitar de la matriz original la fila i y la columna
j (que se denomina menor complementario de aij ).
2.5. Sistemas cuadrados, determinantes y Cramer 33

Algunas propiedades de los determinantes.

(1) Si B es una matriz que se obtiene permutando dos filas (o dos columnas) de la matriz
A entonces det(B) = −det(A).
(2) Si B es una matriz que se obtiene multiplicando cada uno de los elementos de una
fila (o columna) de la matriz A por un número k entonces det(B) = k det(A).
(3) Si a una fila (o columna) de una matriz se le suma un múltiplo de otra fila (columna)
entonces su determinante no cambia.
(4) El determinante de una matriz triangular es el producto de los elementos que están
en su diagonal principal.
(5) El determinante de una matriz A y el de su traspuesta At coinciden.
(6) Si una columna (fila) de una matriz A es combinación lineal de otras columnas (filas)
de A entonces det(A) = 0. En particular, si dos filas (o dos columnas) de una matriz
son proporcionales entonces el determinante vale 0.
(7) Si A y B son matrices n × n entonces det(A.B) = det(A) det(B).
Observemos que las transformaciones aplicadas sobre las filas que se mencionan en las tres
primeras propiedades, coinciden con las transformaciones elementales sobre las filas
de una matriz (o sobre las ecuaciones de un sistema) que fueron definidas en 2.1.2. Dichas
transformaciones eran la base del proceso de escalerización de matrices (o sistemas) y
ahora serán utilizadas (conjuntamente con la propiedad (4)), para desarrollar un método
eficiente de cálculo de determinantes por escalerización. Veamos un par de ejemplos.

1 1 1

Ejemplo 2.5.1. Queremos calcular 1 2 −2 . Para ello aplicamos convenientemente
2 1 7
la propiedad (3):

1 1 1 1 1 1

1 2 −2 = 0 1 −3 ←− F2 − F1

2 1 7 0 −1 5 ←− F3 − 2F1

1 1 1

= 0 1 −3 =2
0 0 2 ←− F3 + F2

Al haber llegado al determinante de una matriz triangular, en el último simplemente
multiplicamos los elementos de la diagonal.

4 2 9 1

7 4 5 1
Ejemplo 2.5.2. Queremos calcular . En primer lugar permutamos la
2 5 −3 1
−3 4 2 1
primera columna con la cuarta (utilizando la propiedad (1)), para luego comenzar la
escalerización del determinante obtenido:

4 2 9 1 1 2 9 4 1 2 9 4

0 2 −4 3 ←− F2 − F1
7 4 5 1 1 4 5 7


2 5 −3 1 = − 1 5 −3 = − 0 3 −12 −2 ←− F3 − F1
2
−3 4 2 1 1 4 2 −3 0 2 −7 −7 ←− F4 − F1
34 Capı́tulo 2. Sistemas de ecuaciones lineales



1 2 9 4

0 2 −4 3
= −
0 3 −12 −2

0 0 −3 −10 ←− F4 − F2

Ahora, para eliminar el 3 de la segunda columna podrı́amos sumarle a la tercera fila la


segunda multiplicada por −3 2 . En caso de no querer trabajar con fracciones podemos, en
primera instancia, multiplicar la tercera fila por 2. Al hacer esto debemos estar atentos
pues, según la propiedad (2), el nuevo determinante valdrá 2 veces el anterior:


1 2 9 4

1
2 9 4

0 2 −4 3 1 0 2 −4 3
= − = −
0 3 −12 −2
2 0 6 −24 −4 ←− 2F3

0 0 −3 −10 0 0 −3 −10

Continuando la escalerización y luego permutando las dos últimas filas:



1 2 9 4 1 2 9 4

1 0 2 −4
3
1 0 2 −4
3
= − =
2 0 0 −12 −13 ←− F3 − 3F2 2 0 0 −3 −10
0 0 −3 −10 0 0 −12 −13

Finalmente llegamos a:

1 2 9 4

1 0 2 −4 3 1
= = 2 (−3) 27 = −81
2 0 0 −3 −10 2
0 0 0 27 ←− F4 − 4F3

Observación 2.5.1. Determinantes de una matriz y de sus formas  escalerizadas.



4 2 9 1
 7 4 5 1 
Retomemos el ejemplo anterior simbolizando con A a la matriz A =   2 5 −3 1 .

−3 4 2 1
Para obtener una forma escalerizada de A podemos aplicar sobre sus filas las mismas
transformaciones que se realizaron en el ejemplo. Una forma escalerizada de A es enton-
1 2 9 4
 0 2 −4 3 
ces la matriz B =   0 0 −3 −10 . Si bien los determinantes de estas matrices no

0 0 0 27
coinciden, uno es múltiplo no nulo del otro. Según las propiedades (1), (2) y (3), eso ocu-
rrirá siempre que apliquemos sobre las filas de la matriz los tres tipos de transformaciones
elementales. Resulta entonces que si A es una matriz cualquiera n × n, y B es una de sus
formas escalerizadas, entonces existirá m ∈ R, m 6= 0 tal que det(A) = m det(B).
En particular, podemos afirmar que si el determinante de una matriz A vale 0, entonces
también será nulo el determinante de cualquiera de sus formas escalerizadas. Y recı́proca-
mente, si el determinante de alguna de sus formas escalerizadas vale 0, también valdrá 0
el determinante de A.
2.5. Sistemas cuadrados, determinantes y Cramer 35

Lo que ocurrió con el sistema 2 × 2 planteado al comienzo de esta sección admite una
generalización para sistemas cuadrados cualesquiera.

Teorema 2.5.1. Teorema de Cramer.


Sea A una matriz n×n y (S) el sistema de n ecuaciones con n incógnitas dado por A.X = b
(A es la matriz asociada al sistema, X es la matriz columna de las incógnitas y b es la
matriz columna de los términos independientes). Entonces las siguientes afirmaciones son
equivalentes:

1. A es invertible.

2. det(A) 6= 0.

3. (S) es compatible determinado independientemente de b.

Demostración.

(1) =⇒ (2)
Por hipótesis existe A−1 tal que A.A−1 = In . Entonces, aplicando la propiedad (7)
de los determinantes llegamos a

det(A) det A−1 = det (In )

Como det (In ) = 1 obtenemos la siguiente igualdad:



det(A) det A−1 = 1.

Esto implica que det(A) 6= 0. Más aún, podemos despejar y obtener:


 1
det A−1 =
det(A)

(2) =⇒ (3)
Para estudiar el comportamiento del sistema (S) consideramos una forma escaleri-
zada de la matriz A. Como A es n × n toda forma escalerizada B de A también
será n × n y tendrá nulas todas sus entradas por debajo de la diagonal principal:
 ′ 
a11 a′12 a′13 . . . . . . a′1n
 0
 a′22 a′23 . . . . . . a′2n 

 ′ .. ′

B= 0  0 a33 . a3n 
 .. .. .. . . . . .. 
 . . . . . . 
0 0 ... ... 0 ′
ann

En principio, B podrı́a tener filas nulas, pues no conocemos su rango por filas. Pero
eso no puede ocurrir. En efecto, como por hipótesis det(A) 6= 0, la observación previa
nos permite asegurar que det(B) 6= 0. Como el determinante de B es el producto de
36 Capı́tulo 2. Sistemas de ecuaciones lineales

los elementos de su diagonal principal deducimos que ninguno de ellos puede valer
0 (a′ii 6= 0, ∀ i):  ′ 
a11 a′12 a′13 . . . . . . a′1n
 0
 a′22 a′23 . . . . . . a′2n 

 . 
B=  0 0 a′33 . . ′
a3n 
 .. .. .. .. . . .. 
 . . . . . . 
0 0 ... ... 0 ′
ann
Resulta entonces que el rango por filas de A es n y, por lo tanto, el rango por filas de
A coincide con el rango por filas de la matriz ampliada y con el número de columnas
de A (que es n). Del teorema de Rouche-Frobenius podemos concluir que el sistema
(S) es compatible determinado.
(3) =⇒ (1)
Paso 1: Se demostrará que existe B tal que A.B = In .
Para cada j entre 1 y n designemos con ej a la columna j-ésima de la matriz identidad
In :      
1 0 0
 0   1   0 
     
e1 =  0  , e2 =  0  , . . . , en =  0 
     
 ..   ..   .. 
 .   .   . 
0 0 1
Por hipótesis, los sistemas A.X = e1 , A.X = e2 , . . . , A.X = en son compatibles
determinados. Sean entonces X1 , X2 , . . . , Xn las matrices n × 1 que verifican:
A.X1 = e1 , A.X2 = e2 , . . . . . . , A.Xn = en
Si B es la matriz n × n que tiene como columnas a X1 , X2 , . . . , Xn entonces, de
la definición de producto de matrices (ver Observación 1.1.2), resulta que A.B = In .
Paso 2: Se demostrará que B también cumple B.A = In .
Para ello comenzamos observando que, como 1 = det(In ) = det(A) det(B), el deter-
minante de B no puede ser 0. Aplicando a la matriz B la implicación ( (2) =⇒ (3) )
(ya demostrada) concluimos que el sistema B.X = b es compatible determinado pa-
ra cualquier b. Repitiendo para la matriz B el razonamiento realizado en el Paso 1
para la matriz A, podemos asegurar que existe una matriz C tal que B.C = In . Se
tiene:
C = In .C = (A.B).C = A.(B.C) = A.In = A =⇒ C = A


Observación 2.5.2. Sea A una matriz n × n y (S) el sistema de n ecuaciones con n
incógnitas dado por A.X = b. Del teorema anterior resultan las siguientes observaciones:
1. Si det(A) = 0 entonces el sistema es compatible indeterminado o incompatible (esto
dependerá de b). Ahora bien, si det(A) = 0 y además el sistema es homogéneo,
entonces éste resulta compatible indeterminado.
2.5. Sistemas cuadrados, determinantes y Cramer 37

2. Si det(A) 6= 0 entonces el sistema es compatible determinado independientemente


de b.

3. En el caso en que (S) sea compatible determinado (lo cual, según el teorema de
Cramer, equivale a A invertible) podemos encontrar una fórmula matricial para su
única solución. En efecto:

X̃ es solución de (S) ⇐⇒ A.X̃ = b ⇐⇒ A−1 A.X̃ = A−1 .b ⇐⇒

A−1 .A X̃ = A−1 .b ⇐⇒ In .X̃ = A−1 .b ⇐⇒ X̃ = A−1 .b

Ejemplo 2.5.3. Si bien los sistemas 2 × 2 se resuelven fácilmente por escalerización,


veamos como aplicar la fórmula anterior en esos casos. Supongamos que queremos resolver
el sistema 
2x + y = 3
(S)
x + y = −1
 
2 1
La matriz asociada es A = . Como det(A) = 1 6= 0 el sistema es compatible
1 1
 
−1 1 −1
determinado y A es invertible. La inversa de A es A = . Luego, la única
−1 2
solución del sistema es:
    
−1 1 −1 3 4
A .b = =
−1 2 −1 −5

Ejercicio 2.5.1. Calcule los siguientes determinantes:



7 −2 π 1 −2 4
4 5
(a) (b) 2 3 −2 (c) −3 5 2
3 −2
4 6 −4 3 6 −1


2 1
1 1 1 0 1 2 −3 4
1
1 1 −1 1 3 −1 2 4
(d) −1 5 −17 (e) (f )
−8 7 −37 1 0 −1 1 −2 −3 6 −7
−1 1 1 1 1 3 −1 2

Ejercicio 2.5.2. Si A es una matriz n × n tal que A3 = A, ¿cuáles son los posibles valores
para el det(A)?

Ejercicio 2.5.3. Se sabe que A es una matriz 3 × 3 y que det(A) = 5. calcule el determi-
nante de B = 2A2 A−1 .

Ejercicio 2.5.4. Sean A y B dos matrices n × n y k un número real. Investigue si las


siguientes afirmaciones son verdaderas o falsas.
1. det(A + B) = det(A) + det(B)
2. det(kA) = k det(A)
3. det(kA) = kn det(A)
38 Capı́tulo 2. Sistemas de ecuaciones lineales

Ejercicio 2.5.5.
1. Sea A una matriz n × n antisimétrica (esto quiere decir que At = −A). Pruebe que
si n es impar entonces det(A) = 0.
2. Una matriz A n×n se dice nilpotente cuando existe algún natural k tal que Ak = O
(matriz nula). Pruebe que el determinante de una matriz nilpotente vale 0.
3. Una matriz A n × n se dice idempotente cuando A2 = A. ¿Qué valores puede tener
el determinante de una matriz idempotente? Construya ejemplos en los que ocurra
los distintos casos.

Ejercicio 2.5.6. Analice (sin resolverlos) si los siguientes sistemas homogéneos son de-
terminados o indeterminados.
  
 x+y−z =0  x + 2y = 0  x + y + kz = 0
(a) x + y + 3z = 0 (b) kx + ky + kz = 0 (c) x − ky + z = 0
  
x + y − 5z = 0 x + 2y + kz = 0 kx + y + z = 0

En los dos últimos se deberá discutir según k ∈ R.

Ejercicio 2.5.7. Sean f y g dos funciones con derivada segunda en un intervalo I. Se


define:

f (t) g(t)
ϕ : I −→ R / ϕ(t) = ′

f (t) g′ (t)


f (t) g(t)
Compruebe que ϕ′ (t) = ′′ , ∀ t ∈ I.
f (t) g′′ (t)

2.6. Cálculo de la inversa de una matriz invertible

La idea utilizada al principio del capı́tulo para resolver un sistema lineal 1×1, funcionó tam-
bién para resolver un sistema lineal n × n con n > 1. La fórmula X = A−1 .b no solo es
análoga a la obtenida en el ejemplo 2.1.1, sino que parece indicar un nuevo procedimiento
para resolver sistemas lineales. Sin embargo hay varios asuntos para aclarar. En primer
lugar todo lo hecho aquı́ se aplica solamente a sistemas cuadrados. En segundo lugar dicha
fórmula es válida solamente bajo la hipótesis de que A sea invertible. Finalmente, cuando
A es invertible, para poder aplicar la fórmula necesitamos saber cómo obtener la matriz
A−1 , inversa de A. A continuación veremos un algoritmo para calcular la matriz inversa.
Como se demostró en el teorema 2.5.1, si A es una matriz n × n y existe B ∈ Mn×n tal que
A.B = In entonces B.A = In y, por lo tanto, B es la inversa de A. Para hallar la inversa
de una matriz A invertible nos bastará entonces con hallar B tal que A.B = In . Esto
es equivalente a resolver n sistemas de ecuaciones con igual matriz asociada y diferentes
términos independientes. En efecto, si indicamos por Cj (B) la columna j-ésima de B y por
2.6. Cálculo de la inversa de una matriz invertible 39

ej la columna j-ésima de In tenemos que

  = I⇐⇒
A.B 
C1 (B) C2 (B) . . . Cn (B) AC1 (B) AC2 (B) . . . ACn (B)
   
   
A.B = A  =  =
   
... ...
 
e1 e2 . . . en
 
 
  = In ⇐⇒
 
...
    ..
b1j 0 .
 ..   ..  ..
 .   .  .
    j
⇐⇒ (Sj ) A b
 jj 
 =  1
 
 = e ←− lugar j (j = 1, 2, ..., n)
 ..   ..  ..
 .   .  .
bnj 0 ..
.
Como los n sistemas S1 , S2 , . . . , Sn tienen la misma matriz A de coeficientes (con diferen-
tes términos independientes), se pueden resolver simultáneamente escalerizando la matriz
( A| I ).
 
2 1
Ejemplo 2.6.1. Consideremos la matriz A = . Como det(A) = 2 6= 0 resulta
4 3
 
x11 x12
que A es invertible. Su inversa será la matriz C = tal que A.C = I. Se
x21 x22
tiene:

      
2 1 x11 x12 2x11 + x21 2x12 + x22 1 0
= =
4 3 x21 x22 4x11 + 3x21 4x12 + 3x22 0 1
Igualando (por columna) se tienen los siguientes sistemas de ecuaciones:
     
2x11 + x21 = 1 2 1 x11 1
(S1 ) ⇐⇒ =
4x11 + 3x21 = 0 4 3 x21 0
     
2x12 + x22 = 0 2 1 x12 0
(S2 ) ⇐⇒ =
4x12 + 3x22 = 1 4 3 x22 1
Como para ambos sistemas la matriz A es la matriz de coeficientes, los podemos resolver
simultáneamente
   
2 1 1 0 2 1 1 0

4 3 0 1 0 1 −2 1 ←− F2 + (−2)F1
 
2 0 3 −1 ←− F1 − F2

0 1 −2 1
 
1 0 32 − 12 ←− 12 F1

0 1 −2 1
40 Capı́tulo 2. Sistemas de ecuaciones lineales

   3
   
x11 2 x12 − 12
Por lo tanto = y = . Es decir que la inversa de A es
x21 −2 x22 1
 3

− 12
A−1 = 2 .
−2 1

Luego de las explicaciones anteriores podemos describir el método de la siguiente forma.


Para calcular la inversa de la matriz A de tamaño n × n, escalerizamos hasta llegar a
la forma escalerizada reducida de A realizando las mismas operaciones en todas las filas
de ( A| I ). Cuando finalmente lleguemos a ( I| B ) tendremos que A−1 = B. Veamos un
ejemplo en donde aplicamos directamente este método.
 
−1 1 1
Ejemplo 2.6.2. Hallemos la inversa de A =  1 −1 1  (verifique que su deter-
1 1 −1
minante es 6= 0). Se tiene:
   
−1 1 1 1 0 0 −1 1 1 1 0 0
 1 −1 1 0 1 0  ∼  0 0 2 1 1 0  ←− F2 + F1
1 1 −1 0 0 1 0 2 0 1 0 1 ←− F3 + F1
 
−1 1 1 1 0 0
∼  0 2 0 1 0 1 
0 0 2 1 1 0
 
2 −2 0 −1 0 0 ←− F3 − 2F1
∼  0 2 0 1 0 1 
0 0 2 1 1 0
 
2 0 0 0 1 1 ←− F1 + F2
∼  0 2 0 1 0 1

0 0 2 1 1 0
 
1 0 0 0 12 12
∼  0 1 0 12 0 12 
0 0 1 12 12 0
Resulta entonces que  
1 1
0 2 2
A−1 =  1
2 0 1
2

1 1
2 2 0
Ejercicio 2.6.1. Investigue si las siguientes matrices son invertibles y, en caso afirmativo,
encuentre la matriz inversa.
     
1 1 1 1 −2 4 1 0 1
A= 1 1 −1  B =  −1 3 −7  C = 2 1 0 
1 −1 1 2 1 −7 1 0 0
 
  1 1 1 0
2 3 3  1 1 −1 1 
D= 1 2 0  E=  1 0 −1 1 

0 1 3
−1 1 1 1
2.7. Apéndice de esta sección 41

2.7. Apéndice de esta sección


Ejemplo 2.7.1. Otro ejemplo de resolución de un sistema de ecuaciones lineales


 x1 + 2x2 + x3 + x5 + x6 = 1

 −x1 − 2x2 + x3 + x4 − x6 = 0

(S) x1 + 2x2 + 3x3 − x4 − 2x5 − x6 = 2

 x + 2x2 + 3x3 + x4 + 2x5 − x6 = 0
 1


x1 + 2x2 + x3 + 4x4 + 9x5 + 3x6 = 1
La matriz del sistema ampliada es:
 
1 2 1 0 1 1 1
 −1 −2 1 1 0 −1 0 
 
 1
 2 3 −1 −2 −1 2 

 1 2 3 1 2 −1 0 
1 2 1 4 9 3 1
Como antes, el proceso comienza fijando la primera fila como “pivot” y utilizando su
primera entrada para lograr anular el resto de la primera columna.
 
1 2 1 0 1 1 1
 −1 −2 1 1 0 −1 0 
 
 1
 2 3 −1 −2 −1 2  ∼
 1 2 3 1 2 −1 0 
1 2 1 4 9 3 1
 
1 2 1 0 1 1 1
 0 0 2
 1 1 0 1 
 ←− F2 + F1
∼  0 0 2 −1 −3 −2
 1 
 ←− F3 − F1
 0 0 2 1 1 −2 −1  ←− F4 − F1
0 0 0 4 8 2 0 ←− F5 − F1
En los ejemplos anteriores, en el segundo paso se utilizaba la entrada ubicada en la segunda
fila y segunda columna para conseguir ceros en el resto de la columna. Aquı́ esto no es
posible pues la segunda columna ya tiene todas sus entradas (salvo la primera) nulas.
Utilizamos entonces la entrada ubicada en la segunda fila y tercera columna para generar
ceros en el resto de la columna tres.

 
1 2 1 0 1 1 1

 0 0 2 1 1 0 1 


 0 0 2 −1 −3 −2 1 ∼

 0 0 2 1 1 −2 −1 
0 0 0 4 8 2 0
 
1 2 1 0 1 1 1

 0 0 2 1 1 0 1 

∼
 0 0 0 −2 −4 −2 0  ←− F3 − F2
 (2.2)
 0 0 0 0 0 −2 −2  ←− F4 − F2
0 0 0 4 8 2 0 ←− F5
42 Capı́tulo 2. Sistemas de ecuaciones lineales

En el tercer paso escalerizaremos la columna siguiente (la cuarta)


   
1 2 1 0 1 1 1 1 2 1 0 1 1 1

 0 0 2 1 1 0 1  
  0 0 2 1 1 0 1 


 0 0 0 −2 −4 −2 0 ∼
  0 0 0 −2 −4 −2 0 

 0 0 0 0 0 −2 −2   0 0 0 0 0 −2 −2 
0 0 0 4 8 2 0 0 0 0 0 0 0 0 ←− F5 + 2F3

Ya tenemos la forma escalerizada, pero como en el ejemplo 2.3.3 continuemos hasta obtener
la forma reducida
 
1 2 1 0 1 1 1

 0 0 2 1 1 0 1 


 0 0 0 −2 −4 −2 0 ∼

 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0
 
1 2 1 0 1 0 0 ←− F1 + 12 F4
 0 0 2 1 1 0 1 


∼
 0 0 0 −2 −4 0  ←− F3 − F4 ∼
2 
 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0
 
1 2 1 0 1 0 0
1
 0 0 2
 0 −1 0 2   ←− F2 + 2 F3
 0 0 0 −2 −4
∼ 0 2   ∼
 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0

 3 
1 2 0 0 2 0 −1 ←− F1 − 12 F2

 0 0 2 0 −1 0 2 

∼
 0 0 0 −2 −4 0 2 
 ∼
 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0
 3 
1 2 0 0 2 0 −1
 0 0 1 0 −1 1
 2 0  ←− 2 F12
1 
∼
 0 0 0 1 2 0 −1 
 ←− − 21 F3 (2.3)
 0 0 0 0 0 1 1  ←− − 2 F4
0 0 0 0 0 0 0

El sistema de ecuaciones asociado queda entonces




 x1 + 2x2 + 32 x5 = −1
x3 − 12 x5 = 1

(S ′ )

 x4 + 2x5 = −1

x6 = 1
2.7. Apéndice de esta sección 43

Despejando se tiene 

 x1 = −2x2 − 32 x5 − 1
= 12 x5 + 1

x3
x = −2x5 − 1
 4


x6 =1
Las incógnitas x2 y x5 no pueden determinarse, las otras se obtienen como función de ellas.
Cada valor real de x2 y x5 (elegidos libremente) determina una solución del sistema (S). Por
ejemplo, si x2 = 1 y x5 = 0 se obtiene la solución (−3, 1, 1, −1, 0, 1). Si x2 = −1 y x5 = 2
se tiene la solución (−2, −1, 2, −5, 2, 1). El sistema es entonces compatible indeterminado
y en virtud de que dos de sus incógnitas pueden elegirse libremente diremos que tiene dos
grados de libertad. El conjunto solución es
  
3 1
Sol(S) = −2x2 − x5 − 1, x2 , x5 + 1, −2x5 − 1, x5 , 1 , x2 ∈ R, x5 ∈ R
2 2

Demostración de la Proposición 2.1.1:


Si en un sistema lineal de ecuaciones se efectúan una transformación elemental el sistema
resultante es equivalente al original.

Demostración. La demostración es muy sencilla y la haremos solamente en el caso que


la transformación elemental sea del tipo 3. El resto queda a cargo del lector.
Supongamos que el sistema original sea


 a11 x1 + a12 x2 + · · · + a1n xn = b1


 ..


 .

 ai1 x1 + ai2 x2 + · · · + ain xn = bi


(S) ..
 .



 aj1 x1 + aj2 x2 + · · · + ajn xn = bj


 ..


 .

am1 x1 + am2 x2 + · · · + amn xn = bm

Supongamos que sumamos a la ecuación i un múltiplo de la ecuación j. El sistema resul-


tante es


 a11 x1 + a12 x2 + · · · + a1n xn = b1


 ..


 .

 (ai1 x1 + ai2 x2 + · · · + ain xn ) + β(aj1 x1 + aj2 x2 + · · · + ajn xn ) = bi + βbj


(S ′ ) ..
 .



 a x
j1 1 + a x
j2 2 + · · · + ajn xn = bj


 .
..




am1 x1 + am2 x2 + · · · + amn xn = bm

Para probar que ambos son equivalentes deberemos ver que Sol(S) = Sol(S ′ ). Como se
trata de mostrar la igualdad de dos conjuntos tendremos que demostrar que están mutua-
mente incluidos.
44 Capı́tulo 2. Sistemas de ecuaciones lineales

Veamos primero que Sol(S) ⊂ Sol(S ′ ). Sea (α1 , α2 , · · · , αn ) ∈ Sol(S) es claro que (α1 , α2 , · · · , αn )
satisface todas las ecuaciones de (S ′ ) (pues son las mismas que las de (S)) salvo tal vez
la i-esima. Como (α1 , α2 , · · · , αn ) debe verificar la i-esima y j-esima ecuación de (S) se
tiene que

ai1 α1 + ai2 α2 + · · · + αin xn = bi y aj1 α1 + aj2 α2 + · · · + ajn αn = bj

por lo tanto

(ai1 α1 + ai2 α2 + · · · + ain αn ) + β(aj1 α1 + aj2 α2 + · · · + ajn αn ) = bi + βbj

de donde (α1 , α2 , . . . , αn ) ∈ Sol(S ′ ).


Finalmente probemos que Sol(S ′ ) ⊂ Sol(S). Consideremos ahora

(α1 , α2 , . . . , αn ) ∈ Sol(S ′ ).

Igual que antes es claro (α1 , α2 , . . . , αn ) debe verificar todas las ecuaciones de (S) salvo
tal vez la i-esima pero como

(ai1 α1 + ai2 α2 + · · · + ain αn ) + β(aj1 α1 + aj2 α2 + · · · + ajn αn ) = bi + βbj

y
aj1 α1 + aj2 α2 + · · · + ajn αn = bj
se deduce que
ai1 α1 + ai2 α2 + · · · + ain αn = bi
con lo cual (α1 , α2 , . . . , αn ) ∈ Sol(S) y la prueba esta concluida. ♠

Demostración de la Proposición 2.3.1:


Toda matriz puede ser transformada en una matriz escalerizada (o escalerizada reducida)
mediante una cantidad finita de transformaciones elementales.

Demostración. La prueba es algorı́tmica.5 Indicaremos esquemáticamente el procedi-


miento, los detalles quedan a cargo del lector.
Sea A = ((aij )) una matriz m × n cualquiera. En el desarrollo que sigue a continuación
cambiaremos la notación habitual pasando a simbolizar con Ai = (ai1 , ai2 , . . . , ain ) a la
fila i-ésima de la matriz A.
El objetivo del primer paso es obtener una matriz con una primera columna que tenga
nulas todas sus entradas excepto la primera. Si toda la primera columna es nula se pasa
a la segunda y ası́ sucesivamente hasta tener una primera columna con alguna entrada
distinta de cero. La idea para anular el resto de las entradas de la columna es ubicar la
entrada no nula (a la que llamaremos pivot) en la primera fila y utilizar esta para com-
binar convenientemente con cada fila a los efectos de lograr ceros en todas las posiciones.
Para simplificar la notación aquı́ supondremos que ya la primera columna tiene alguna en-
trada no nula. Con la suposición indicada comenzamos reconociendo si a11 6= 0. Si a11 = 0
5
Un algoritmo es, groseramente hablando, un conjunto de acciones expresadas en un lenguaje formal y
sin ambigüedades que pueden ser comprendidos y ejecutados por una persona o una máquina.
Este algoritmo es conocido con el nombre de Método de Gauss.
2.7. Apéndice de esta sección 45

cambiamos la primera fila por otra cuya primera entrada sea no nula.6 Una vez que el
pivot esta ubicado realizamos el primer paso de la escalerización:
   
A1 A1
 A2   A′  ←− A2 − a21 A1
   2  a11
 .. ..   .. ..  ..
 .
 . ∼ .
  . 
 .
 Ai   A′  ←− Ai − ai1 A1
   i  a11
 .. ..   .. ..  ..
 . .   . .  .
Am A′m ←− Am − aam111
A1

La matriz que obtuvimos tiene el siguiente aspecto:


 
a11 a12 . . . a1n
 0
 a′22 . . . a′2n 

 .. .. . . .. 
 . . . . 
0 a′m2 . . . a′mn

En el segundo paso el objetivo es obtener una nueva matriz que tenga las entradas de
la segunda columna todas nulas salvo tal vez las dos primeras. Para eso repetimos el
procedimiento del paso uno a la sub-matriz que aparece recuadrada.
De nuevo el primer paso es determinar el segundo pivot para esto chequeamos que a′22 6= 0
de lo contrario cambiamos la segunda fila por otra (de abajo) con segunda entrada no
nula. Podrı́a ocurrir que todas las entradas de la segunda fila fuesen nulas en ese caso la
segunda columna ya tiene el aspecto adecuado por lo cual el procedimiento se continúa
ubicando un pivot en al posición 2, 3 (ver (2.2) en el ejemplo 2.7.1). Supongamos, para
fijar ideas, que a′22 6= 0 entonces el segundo paso de la escalerización es:
   
A1 A1

 A′2  
  A′2 

 A′3   A′′3  ←− A′3 − a32 A′2
    a22
 .. ..   .. ..  ..

 . . ∼
  . . 
 .
 A′i   A′′i  ←− A′ − ai2 A′
    i a22 2
 .. ..   .. ..  ..
 . .   . .  .
A′m A′′m ←− A′m − aam222
A′2

La matriz obtenida en el paso dos tiene entonces el aspecto:


 
a11 a12 a13 . . . a1n
 0
 a′22 a′23 . . . a′2n 
 0
 0 a′′33 . . . a′′3n 

 .. .. .. .. .. 
 . . . . . 
0 0 a′′m3 . . . a′′mn
6
Por razones numéricas y para evitar errores de redondeo al resolver sistemas con ayuda de la compu-
tadora resulta muchas veces importante, aún cuando a11 6= 0 cambiar la primera fila por la fila que tenga
la primera entrada mayor, este procedimiento se conoce como pivoteo.
46 Capı́tulo 2. Sistemas de ecuaciones lineales

Repetimos nuevamente los pasos previos aplicados a la sub-matriz del recuadro. El proce-
dimiento culmina cuando se llega a la última fila o columna.
Para obtener la matriz escalerizada reducida a partir de la escalerizada, basta con repetir
el procedimiento pero tomando como pivots la entrada que ocupa el lugar inferior derecho
de la matriz y yendo hacia arriba. ♠

Demostración del teorema de Rouche - Frobenius.


Sea (S) un sistema lineal de m ecuaciones con n incógnitas con matriz ampliada A|b. Sea
p el número de escalones de A y p′ el número de escalones de A|b entonces
1. (S) es compatible si y solo si p = p′

2. Si (S) es compatible entonces

a) (S) es determinado si y solo si p = n.


b) (S) es indeterminado si y solo si p < n.

Demostración. Comencemos probando los recı́procos de las tres afirmaciones. Observe-


mos en primer lugar que como A tiene n columnas y cada escalón ocupa por lo menos una
columna deducimos que para cualquier sistemas se cumple que

p≤n (2.4)

Supongamos que p = p′ . De (2.4) se deduce que hay dos posibilidades p′ = p = n o


p′ = p < n. Analicemos el primer caso. La forma reducida debe tener tantos escalones
como columnas por lo tanto debe ser:
 
1 0 0 ... ... 0 c1
 0 1 0 ... ... 0 c2 
 
 .. .. .. 
 0 0 1
 . . . 

 .. .. . . . . . . .. .. 
 . .
 . . . . . 

 .. .. . .. 1 .
0 ..

 . . 
 
 0 0 ... ... 0 1 cn 
0 0 ... ... 0 0 0

Donde la columna de entradas ci representa el termino independiente luego de efectuado


el proceso de escalerización. El sistema correspondiente es


 x1 = c1

 x2 = c2
.. ..


 . .

xn = cn

el cual es compatible determinado.

Veamos ahora el segundo caso, p′ = p < n. Como la forma escalerizada tiene más columnas
que escalones necesariamente algún escalón debe tener “descanso” y por lo tanto la forma
reducida debe ser
2.7. Apéndice de esta sección 47

 
1 0 ⋆ ... ⋆ 0 ... 0 0⋆ ... ⋆ 0 . . . 0 c1

 0 1 ⋆ ... ⋆ 0 ... 0 0⋆ ... ⋆ 0 . . . 0 c2 

.. . .. .. . . . .
. . . .. . . . .. ... . . .. ..
 

 . 0 ... ... 0 1 . . 

.. .. . .. .. .. .. . . . .
. . . .. . . . .. ... . . .. ..
 
 . . ... . . 0 . . 
 
.. .. .. .. . . . . .
0 .. . . . .. ... . . .. ..
 
 . . ... ... . ... . 1 
 .. .. .. . 
1 ⋆ . . . ⋆ 0 . . . .. cs
 
 . . ... ... . ... ... 0 
 . . . 
. . . .. . . . . . . .. 0 0 . . . 0 1 . . . .. cs+1
 
 0 0 ... 
 .. .. . . .. .. . . .. . 
. . . .. . . . . . . .. . . . . . .. .. . 0 ..
 
 . . ... 
 . 

 0 0 ... ... 0 ... . . . . . . .. 0 . . . 0 0 . . . 1 cp 

 . 

 0 0 ... ... 0 ... . . . . . . .. 0 . . . 0 0 . . . 0 0 

 .. .. .. .. .. . .. .. . . . . 

 . . . . . ... . . . .. . . . . . .. .. . . . .. .. 

.
0 0 ... ... 0 ... . . . . . . .. 0 . . . 0 0 . . . 0 0
donde las zonas de estrellas representan submatrices con entradas arbitrarias.
Para analizar la solución de este sistema intentemos aplicar el algoritmo de sustitución
hacia atrás. Supongamos que s es la primera fila (comenzando desde abajo) con descanso
(escalón de ancho mayor que una columna). Las ecuaciones s + 1, s + 2, . . . , p son entonces

xs+1 = cs+1
xs+2 = cs+2
..
.
xp = cp

la ecuación s es
xh + as h+1 xh+1 + . . . + ass xs = cs

despejando se tiene
xh = cs − (as h+1 xh+1 + . . . + ass xs )

La incógnita xh no puede entonces determinarse sino en función de los valores de xh+1 , . . . , xs .


Fijemos valores arbitrarios para estas últimas s − h incógnitas, xh quedará determinado y
con estos valores podemos ahora sustituir en las ecuación s−1, . . . , 1 y continuar el proceso
de sustitución hacia atrás. Esto demuestra que el sistema es compatible, pues hay solucio-
nes pero si cambiamos la elección hecha para los valores de xh+1 , . . . , xs se obtiene otro
valor para xh y consecuentemente otra solución con lo cual el sistema resulta compatible
indeterminado. De hecho como las variables xh+1 , . . . , xs se pueden elegir arbitrariamente
se obtienen infinitas soluciones. Obsérvese que estas elecciones arbitrarias se pueden ha-
cer sólo en los descansos y que el número de variables que pueden elegirse libremente es
n − p (la suma de los anchos de los descansos es igual al número de columnas menos el de
escalones).
Demostremos ahora que si (S) compatible entonces p′ = p. Para probarlo demostraremos
48 Capı́tulo 2. Sistemas de ecuaciones lineales

su contra recı́proco7 y para esto basta con ver que p < p′ implica (S) incompatible pues
en cualquier sistema A|b tiene una columna más que A y por lo tanto se cumple que p ≤ p′
Si p < p′ , la última columna de la forma reducida de la matriz ampliada debe tener un
escalón por lo tanto la forma es:
 
1 0 ⋆ ... ⋆ 0 ... 0 ⋆ ⋆ 0
 0 1 ⋆ ... ⋆ 0 ... 0 ⋆ ⋆ 0 
 
 0 0 0 ... 0 1 ... 0 ⋆ ⋆ 0 
 
 .. .. .. . . . .. .. .. .. 
 . . . . . . .. . . . . . 
 
 0 0 0 ... 0 0 ... 1 ⋆ ⋆ 0 
 
 0 0 0 ... 0 0 ... 0 0 0 1 
0 0 0 ... 0 0 ... 0 0 0 0

En consecuencia la ultima ecuación del sistema es

0=1

de donde resulta que (S) debe ser incompatible.


Si S es compatible determinado debe ser p = n pues si p < n ya hemos visto que (S)
resultarı́a indeterminado.
De manera análoga se razona para probar que S compatible indeterminado implica p < n.

7
Recordemos que un resultado de lógica elemental establece que (A ⇒ B) si, y solo si, (negación de B ⇒
negación de A).
Capı́tulo 3

El espacio vectorial Rn

En diversos problemas de Economı́a, Administración y Ciencias Sociales (además, claro


está, de otras áreas cientı́ficas), aparecen relaciones que expresan la variación de ciertas
magnitudes en función de otras. Consideremos, por ejemplo, el caso de una empresa que
produce y vende un solo tipo de artı́culo. En este contexto se denomina demanda a la
cantidad de artı́culos que los consumidores están dispuestos a comprar. Es claro que di-
cha demanda dependerá del precio p que se le fije al artı́culo y, por lo tanto, puede ser
considerada como una función D : [0, +∞) −→ R / p 7−→ D(p). Para comprender el com-
portamiento de este tipo de funciones el lector a estudiado (desde educación secundaria)
diversos conceptos y técnicas de cálculo, ası́ como también las propiedades fundamentales
del conjunto R de los números reales.

Si bien en este modelo simplificado se supone que la función depende de una sola variable,
parece bastante razonable pensar que pueda depender de varias. De hecho, en microeco-
nomı́a se supone que la demanda de un bien depende, no solamente del precio del mismo
bien, sino también de los precios de los bienes sustitutos y del ingreso del consumidor.
En este caso la demanda serı́a una función de tres variables y, aparentemente, el nue-
vo modelo permitirı́a una descripción más adecuada de la realidad. No debe sorprender
entonces que uno de nuestros próximos objetivos sea el de estudiar funciones de varias
variables. La usual notación f (x) será cambiada por f (x, y) y f (x, y, z) para funciones de
dos y tres variables respectivamente. Como la cantidad de estas no es siempre la misma
(dependerá del problema a considerar), conviene realizar una teorı́a general, en donde la
función dependa de una cantidad arbitraria, digamos n, de variables. En ese caso escribi-
remos f (x1 , x2 , . . . , xn ). Observemos que cada punto del dominio de esta función ya no
es un número real sino una lista ordenada de n números reales: (x1 , x2 , . . . , xn ).

Si bien cada lista (x1 , x2 , . . . , xn ) es simplemente una matriz, un estudio más profundo
del conjunto de tales listas permitirá desarrollar una teorı́a de enorme riqueza dentro de
la Matemática y de suma importancia por sus diversas aplicaciones.
50 Capı́tulo 3. El espacio vectorial Rn

3.1. El espacio vectorial R2


Definición 3.1.1. El conjunto R2 .
Designaremos con R2 al conjunto de todos los pares ordenados de números reales o, de
manera equivalente, a todas las matrices columna de tamaño 2 × 1:
  
2 x1
R = / x1 , x2 ∈ R
x2

La interpretación geométrica de este conjunto es por demás conocida. En efecto, una vez
fijado un sistema de coordenadas cartesianas en el plano, queda establecida una corres-
pondencia biunı́voca entre los puntos del plano
 y los pares ordenados de números reales.
x1
A cada par ordenado de números le corresponde un único punto p del plano
x2
y, recı́procamente, cada punto del plano es correspondiente de un único par de números
reales.

y y

 
x1  
p= x1
x2 p=
x2 x2 x2

o x1 x o x1 x

 
0
También podemos considerar el “vector” con origen en o = y extremo en p e ima-
0
 
x1
ginar el par como el vector −
→ Es ası́ que, de manera dual, podemos interpretar
op.
x2
R2 como el conjunto de puntos del plano, o como el conjunto de vectores del plano que
tienen origen en o.

Por este motivo a los elementos de R2 los denominaremos (indistintamente) puntos o


vectores, mientras que a los números reales los llamaremos escalares.

3.1.1. Suma de vectores y producto de un número por un vector


Definición
 3.1.2.
 Suma de  vectores.

x1 2 y1
Si x = ∈R ey= ∈ R2 entonces la suma x + y es el vector definido por
x2 y2
 
x1 + y 1
x+y = ∈ R2 .
x2 + y 2
3.1. El espacio vectorial R2 51

Dicho de otro modo, el vector x + y se obtiene sumando componente a componente. Ob-


servemos que esta definición coincide con la de suma de matrices (en este caso, de matrices
2 × 1) y, por lo tanto, esta operación tendrá las mismas propiedades que las conocidas para
la suma de matrices.
 
0
Al vector o = lo llamaremos vector nulo. Asimismo, dado un vector cualquiera
0
 
x1
x= designaremos con −x al vector cuyas componentes son, respectivamente, las
x2
 
−x1
opuestas de las de x, es decir: −x =
−x2
Proposición 3.1.1. Propiedades básicas de la suma de vectores.
(S1) Asociativa: (u + v) + w = u + (v + w) , ∀ u, v, w ∈ R2 .
(S2) Conmutativa: u + v = v + u , ∀ u, v ∈ R2 .
(S3) Existencia de neutro: Existe o ∈ R2 tal que o + u = u , ∀ u ∈ R2 .
(S4) Existencia de opuesto: Para cada u ∈ R2 existe −u ∈ R2 tal que u + (−u) = o.

Observación 3.1.1.
(1) Como mencionamos anteriormente, se trata de las propiedades de la suma de matrices
y, por lo tanto, no es necesario demostrarlas. De todos modos, en caso de querer hacerlo, la
prueba es muy simple ya que alcanza con utilizar las propiedades de la suma de números
reales.
(2) Como ya lo sabemos para matrices, el neutro de la suma es único y el opuesto de cada
vector también es único.
(3) Dados dos vectores u, v ∈ R2 , la resta u − v se define como la suma de u mas el
opuesto de v: u − v = u + (−v).

Definición 3.1.3.
 Producto
 de un número por un vector.
x1
Si λ ∈ R y x = ∈ R2 entonces el producto λx del número λ por x es el vector
x2
 
λx1
definido por λx = ∈ R2 .
λx2
Dicho de otro modo, el vector λx se obtiene multiplicando por λ a cada componente de
x. Observemos que esta definición coincide con la de producto de un número por una
matriz (en este caso, de matrices 2 × 1) y, por lo tanto, esta operación tendrá las mismas
propiedades que las conocidas para matrices.

Proposición 3.1.2. Propiedades básicas del producto de un número por un


vector.
(P1) Asociativa: (αβ)u = α(βu) , ∀ u ∈ R2 , ∀ α, β ∈ R.
(P2) Existencia de neutro real: 1 u = u , ∀ u ∈ R2 .
(P3) Distributiva respecto de la suma de números: (α + β)u = αu + βu ,
∀ u ∈ R2 , ∀ α, β ∈ R.
(P4) Distributiva respecto de la suma de vectores: α(u + v) = αu + αv ,
∀ u, v ∈ R2 , ∀ α ∈ R.
52 Capı́tulo 3. El espacio vectorial Rn

Definición 3.1.4. Vectores colineales.


Sean u, v ∈ R2 . Diremos que u y v son colineales cuando uno es múltiplo del otro, es
decir, si existe α ∈ R tal que v = αu, o si existe β ∈ R tal que u = βv.
     
3 6 3
Por ejemplo, los vectores y son colineales, mientras que y
−1 −2 −1
 
6
no lo son.
7
Sea z un vector cualquiera de R2 y o el vector nulo de R2 . Como o = 0 z, podemos decir
que o es colineal con cualquier otro vector z ∈ R2 .
Observación 3.1.2. Interpretación geométrica del producto de un número por
un vector.
   
a λa
Si u = y λ ∈ R entonces λu = . El hecho de que las componentes de λu
b λb
son proporcionales a las de u implica que los puntos o, u y λu están alineados (o sea,
están sobre una misma recta).

λu
λb

u
b

o a λa

Vale la pena observar, además, que:


Si λ > 0 entonces el punto λu está en la semirrecta de origen o que contiene a
u. En particular, si λ > 1 entonces λu no pertenece al segmento de extremos o,
u (el vector λu tiene el mismo sentido u pero “longitud” mayor), mientras que si
0 < λ < 1 entonces λu pertenece al segmento de extremos o, u (el vector λu tiene
el mismo sentido u pero “longitud” menor).
Si λ < 0 entonces λu está en la semirrecta de origen o que no contiene a u.

u
0<λ<1 u
λ<0
λu o
λu
o
3.1. El espacio vectorial R2 53

Observación 3.1.3. Interpretación geométrica de la suma y la resta de vectores.


   
2 a c
Consideremos dos vectores no nulos de R : u = , v = . El vector suma
b d
 
a+c
resulta ser u + v = . Veamos cómo podemos obtener geométricamente dicho
b+d
vector u + v (ver próxima figura). A partir de consideraciones geométricas relativamente
sencillas se deduce que el cuadrilátero cuyos vértices son los puntos o, u, v y u + v es un
paralelogramo, y que el vector u + v es una de las diagonales del mismo.

u+v
b+d

b
u

d
v

o a c a+c

Para hallar geométricamente la suma de u mas v procedemos entonces de la siguiente


manera: construimos el paralelogramo con esos vectores como lados y el vector u + v
resultará ser la diagonal (con origen en o) del paralelogramo. A este procedimiento le
llamaremos regla del paralelogramo. De hecho, la interpretación la hemos realizado
en el caso en que u y v no son colineales. Queda como ejercicio para el lector realizar la
correspondiente interpretación geométrica en el caso en que los dos vectores sean colineales.
Ahora bien, la resta u−v coincide con la suma de u más el opuesto de v. La interpretación
geométrica de la resta de vectores se visualiza en la siguiente figura.

u+v u+v

u−v u−v
u u

v v
o o
−v −v
54 Capı́tulo 3. El espacio vectorial Rn

3.1.2. Rectas en R2
Recta que pasa por un punto y es paralela a un vector.

Como el lector conoce de cursos anteriores, existen varias maneras de determinar una recta
en el plano. Por ejemplo, si damos un punto p y un vector no nulo v, entonces hay una
única recta L que pasa por p y es paralela al vector v.

L
p

¿Cómo podemos describir analı́ticamente los puntos de dicha recta L?


En la siguiente figura se observa (a partir de la regla del paralelogramo) que para cada
real λ el punto p + λv pertenece a L.

p + λv
L

λv
v

Recı́procamente, para cada punto x ∈ L existirá algún λ ∈ R tal que x = p + λv. Tenemos
entonces que la recta L coincide con el siguiente conjunto de puntos:

L = { p + λv / λ ∈ R }

Llamaremos ecuación paramétrica vectorial de la recta que pasa por p y es paralela


a v a la ecuación:

x = p + λv , λ ∈ R.
3.1. El espacio vectorial R2 55

Para cada valor del parámetro λ obtenemos un punto de la recta y, recı́procamente, todo
punto de la recta se obtiene de esa forma para algún valor de λ. Observemos, en particular,
que para λ = 0 se obtiene el punto p.
     
p1 v1 x
Si p = , v= y x= entonces, igualando componente a compo-
p2 v2 y
nente en la ecuación paramétrica vectorial de la recta obtenemos:


x = p1 + λv1
, λ ∈ R.
y = p2 + λv2

que se denominan ecuaciones paramétricas de la recta.


Ejemplo
  3.1.1. Busquemos las ecuaciones
  paramétricas de la recta L que pasa por p =
2 1
y es paralela al vector v = . Simplemente hay que sustituir en la ecuación
1 1
anterior obteniendo: 
x = 2+λ
(L) , λ ∈ R.
y = 1+λ

v
1 p

o 1 2

Está claro que se trata de la recta que pasa por p y tiene coeficiente angular 1. Si despe-
jamos λ en la primera ecuación obtenemos λ = x − 2. Sustituyendo en la segunda queda
y = x− 1, que es la ecuación reducida de esta recta. Esto quiere decir que un punto
x
pertenece a la recta L si, y solo si, sus componentes verifican la ecuación y = x − 1.
y

Recta que pasa por dos puntos


Sean p y q dos puntos diferentes. Hay una única recta que pasa por ambos puntos. Ob-
servemos que dicha recta es la misma que pasa por p y es paralela al vector q − p.
La ecuación paramétrica vectorial de la recta S que pasa por p y q es entonces:

x = p + λ(q − p) , λ ∈ R.
56 Capı́tulo 3. El espacio vectorial Rn

q−p

Observemos, en particular, que para λ = 0 se obtiene el punto p y que para λ = 1 se


obtiene el punto q.

Las ecuaciones paramétricas permiten describir con cierta comodidad algunos subconjun-
tos particulares de la recta. Por ejemplo, si permitimos que el parámetro λ varı́e solamente
en los reales positivos entonces la expresión:

x = p + λ(q − p) , λ > 0.

representa la semirrecta (abierta) con origen en p que contiene a q

λ(q − p)

q−p

Por otra parte, si restringimos el parámetro al intervalo [0, 1] obtenemos el segmento


cerrado de extremos p y q:

x = p + λ(q − p) , 0 ≤ λ ≤ 1.
3.1. El espacio vectorial R2 57

q−p

λ(q − p)
o

p+q
En particular, para λ = 1/2 obtenemos el punto medio del segmento: m =
2
     
p1 q1 x
Si p = , q= y x= entonces las ecuaciones paramétricas de
p2 q2 y
esta recta son:


x = p1 + λ(q1 − p1 )
, λ ∈ R.
y = p2 + λ(q2 − p2 )

En la descripción anterior hemos tenido en cuenta que la recta que pasa por p y q coincide
con la que pasa por p y es paralela al vector q − p. Obviamente, también coincide con la
que pasa por q y es paralela al vector p − q:

x = q + µ(p − q) , µ ∈ R.

Ejemplo 3.1.2. Busquemos lasecuaciones


 paramétricas
  y la ecuación reducida de la recta
−1 2
S que pasa por los puntos p = yq= . La ecuación paramétrica vectorial
4 −2
es:
x = p + α(q − p) , α ∈ R.
Igualando componente a componente resulta:

x = −1 + 3α
(S) , α ∈ R.
y = 4 − 6α

Si despejamos α en la primera ecuación obtenemos α = x+1


3 . Sustituyendo en la segunda
resulta y = 4−6 x+13 , que luego de operar queda y = −2x+2 que es la ecuación reducida
de esta recta. Observemos que, efectivamente, las coordenadas de ambos puntos verifican
esta ecuación.
58 Capı́tulo 3. El espacio vectorial Rn

Ejemplo 3.1.3. Intersección de dos rectas en R2 .


Cuando buscamos la intersección de dos rectas L y S en R2 las posibilidades que se
presentan son las siguientes:
T
L S = {p0 } : las rectas son secantes (se cortan en un solo punto).
T
L S = L = S : las rectas son coincidentes.
T
L S = ∅ : las rectas son paralelas y no coincidentes.

L L
S

p0 L=S S

Busquemos, a modo de ejemplo, la intersección de las rectas L y S de los ejemplos anterio-


res. Para ello podemos trabajar tanto con las ecuaciones reducidas
 como
 con las ecuaciones
x
paramétricas. Debe quedar claro que estamos buscando puntos que pertenezcan a
y
ambas rectas.

Si trabajamos con las reducidas el problema se reduce a resolver el siguiente sistema de


y =x−1
dos ecuaciones con dos incógnitas: La única solución de este sistema es
y = −2x + 2
x =1, y= 0. Resulta entonces que las rectas son secantes y su único punto de intersección
1
es .
0
Si trabajamos con las paramétricas
 deberemos resolver el siguiente sistema
 de cuatro ecua-

 x = 2 + λ  x = 2+λ

 
y = 1+λ y = 1+λ
ciones con cuatro incógnitas: que es equivalente a

 x = −1 + 3α 
 2 + λ = −1 + 3α
 
y = 4 − 6α 1 + λ = 4 − 6α
Las últimas dos ecuaciones dan lugar a un subsistema compatible determinado cuya única
solución es λ = −1, α = 2/3. Sustituyendo en las dos primeras resulta x = 1, y = 0.
Ejercicio 3.1.1. Consideremos
  las siguientes rectas:  
1 −1
L1 que pasa por p1 = y es paralela al vector u1 = .
2 1
   
−2 1
L2 que pasa por p2 = y por p3 = .
2 −1
   
2 1
L3 que pasa por p4 = y por p5 = .
1 −3
1. Halle las ecuaciones paramétricas y reducidas de L1 , L2 y L3 .
T T T
2. Encuentre las siguientes intersecciones: L1 L2 , L1 L3 , L2 L3 .
3. Interprete geométricamente los resultados obtenidos en (b).
3.2. El espacio vectorial R3 59

3.2. El espacio vectorial R3


Definición 3.2.1. El conjunto R3 .
Designaremos con R3 al conjunto de todos las ternas ordenadas de números reales o, de
manera equivalente, a todas las matrices columna de dimensión 3 × 1:
  
 x1 
R3 =  x2  / x1 , x2 , x3 ∈ R
 
x3
Para interpretar geométricamente este conjunto, ya no nos alcanza con un plano, sino
que necesitamos recurrir al espacio. En efecto, una vez fijado un sistema de coordenadas
cartesianas en el espacio, queda establecida una correspondencia biunı́voca entre los puntos
del
 espacio
 y las ternas ordenadas de números reales. A cada terna ordenada de números
x1
 x2  le corresponde un único punto p del espacio (de abscisa x1 , ordenada x2 y cota
x3
x3 ), y recı́procamente, cada punto del espacio es correspondiente de una única terna de
números reales.

x3
 
x1
p =  x2 
x3

x2
o
y
x1

De manera similar a lo que habı́amos hecho en R2 , podemos interpretar R3 como el con-


junto de puntos del espacio, o como el conjunto de vectores del espacio que tienen origen
en o. Es ası́ que, a los elementos de R3 los denominaremos (indistintamente) puntos o
vectores.

3.2.1. Suma de vectores y producto de un número por un vector


En R3 , la suma de vectores y el producto de un número por un vector se definen de manera
análoga a como se hizo en R2 y, de hecho, estas operaciones coinciden con las de suma y
60 Capı́tulo 3. El espacio vectorial Rn

producto por un número de matrices 3 × 1:


         
x1 y1 x1 + y 1 x1 λx1
 x2  +  y 2  =  x2 + y 2  , λ  x2  =  λx2 
x3 y3 x3 + y 3 x3 λx3

Estas operaciones tienen exactamente las mismas propiedades que establecimos en las
proposiciones 3.1.1 y 3.1.2 Por ese motivo no volveremos a escribirlas nuevamente. Por
otra parte, la interpretación geométrica de estas operaciones (ası́ como el concepto de
vectores colineales), es también totalmente análoga a la realizada en R2 . En particular, si
u, v ∈ R3 son dos vectores no colineales, los puntos o, u y v determinan un plano, y la
suma u + v se visualiza a partir de la regla del paralelogramo en dicho plano:

v−u u+v
v

o u

Ejemplo 3.2.1. Consideremos los siguientes vectores en R3 :


     
1 1 −1
u =  −1  , v =  2  , w =  −5 . Entonces:
4 1 2
 

4 0
2u + v − w =  5  y u − 2v − w =  0  = o
7 0

3.2.2. Rectas en R3
Las mismas consideraciones geométricas realizadas en R2 nos permiten llegar a las siguien-
tes caracterizaciones analı́ticas de las rectas en R3 .

Recta que pasa por un punto y es paralela a un vector.


Si p es un punto de R3 y v es un vector no nulo de R3 , entonces la recta L que pasa por
p y es paralela al vector v coincide con el siguiente conjunto de puntos:

L = { p + λv / λ ∈ R }
3.2. El espacio vectorial R3 61

La ecuación paramétrica vectorial de dicha recta es entonces:

x = p + λv , λ ∈ R.

Para cada valor del parámetro λ obtenemos un punto de la recta y, recı́procamente, todo
punto de la recta se obtiene de esa forma para algún valor de λ. Observemos, en particular,
que para λ = 0 se obtiene el punto p.
     
p1 v1 x
Si p =  p2  , v =  v2  y x =  y  entonces, igualando componente a
p3 v3 z
componente en la ecuación paramétrica vectorial obtenemos:


 x = p1 + λv1
y = p2 + λv2 , λ ∈ R.

z = p3 + λv3

que se denominan ecuaciones paramétricas de la recta.

Ejemplo
  3.2.2. Busquemos las ecuaciones
  paramétricas de la recta L que pasa por p =
2 1
 −3  y es paralela al vector v =  2 . Simplemente hay que sustituir en la ecuación
5 1
anterior obteniendo: 
 x = 2+λ
(L) y = −3 + 2λ , λ ∈ R

z = 5+λ
Si despejamos λ en la primera ecuación obtenemos λ = x − 2. Sustituyendo
 en la segunda
 x = 2+λ
y la tercera obtenemos el siguiente sistema equivalente al anterior: 2x − y − 7 = 0

x−z+3=0

2x − y − 7 = 0
A las dos últimas ecuaciones las llamaremos “ecuaciones reducidas”
x−z+3=0
 
x
de la recta L. Esto quiere decir que un punto  y  pertenece a la recta L si, y solo si,
z

2x − y − 7 = 0
sus componentes verifican el sistema
x−z+3 = 0
Observemos que en R3 una recta tiene dos ecuaciones reducidas.

Recta que pasa por dos puntos


Si p y q son dos puntos diferentes de R3 entonces la recta S que pasa por p y q coincide
con el siguiente conjunto de puntos:
62 Capı́tulo 3. El espacio vectorial Rn

S = { p + λ(q − p) / λ ∈ R }

La ecuación paramétrica vectorial de dicha recta es entonces:

x = p + λ(q − p) , λ ∈ R.

Observemos, en particular, que para λ = 0 se obtiene el punto p y que para λ = 1 se


obtiene el punto q. Por otra parte, si permitimos que el parámetro λ varı́e solamente en
los reales positivos entonces obtenemos la semirecta (abierta) con origen en p que contiene
a q, y si restringimos el parámetro al intervalo [0, 1], obtenemos el segmento cerrado de
extremos p y q.
     
p1 q1 x
Si p =  p2  , q =  q2  y x =  y  entonces las ecuaciones paramétricas de
p3 q3 z
esta recta son:

 x = p1 + λ(q1 − p1 )
y = p2 + λ(q2 − p2 ) , λ ∈ R.

z = p3 + λ(q3 − p3 )

Ejemplo 3.2.3. Busquemos las ecuaciones


 paramétricas
  y la ecuación reducida de la recta
1 2
S que pasa por los puntos p =  3  y q =  1 . La ecuación paramétrica vectorial
2 4
es:
x = p + α(q − p) , α ∈ R.

Igualando componente a componente resulta:



 x = 1+α
(S) y = 3 − 2α , α ∈ R.

z = 2 + 2α

Si despejamos α en la primera ecuación obtenemos α = x − 1. Sustituyendo


 en la segunda
 x = 1+α
y la tercera obtenemos el siguiente sistema equivalente al anterior: 2x + y − 5 = 0

2x − z = 0

2x + y − 5 = 0
Entonces, las ecuaciones reducidas de la recta S son
2x − z = 0

Ejemplo 3.2.4. Intersección de dos rectas en R3 .


Busquemos, a modo de ejemplo, la intersección de las rectas L y S de los ejemplos anterio-
res. Para ello podemos trabajar tanto con las ecuaciones reducidas como con las ecuaciones
3.2. El espacio vectorial R3 63



x
paramétricas. Debe quedar claro que estamos buscando puntos  y  que pertenezcan a
z
ambas rectas.
Si trabajamos con las reducidas el problemase reduce a resolver el siguiente sistema de

 2x − y − 7 = 0

x−z+3 = 0
cuatro ecuaciones con tres incógnitas: (R)

 2x + y − 5 = 0

2x − z = 0
Si trabajamos con las paramétricas deberemos resolver el siguiente sistema:
 

 x = 2+λ 
 x = 2+λ

 y = −3 + 2λ 
 y = −3 + 2λ

 

 
z = 5+λ z = 5+λ
(P ) que es equivalente a

 x = 1 + α 
 2+λ = 1+α
 


 y = 3 − 2α 

 −3 + 2λ = 3 − 2α
 
z = 2 + 2α 5 + λ = 2 + 2α

A diferencia de lo que ocurrı́a en R2 , y a pesar de que estamos en presencia de seis


ecuaciones con cinco incógnitas, la resolución de este último no presenta mayores dificul-
tades.En efecto, el carácter (determinado, indeterminado o incompatible) del subsistema
 2+λ = 1+α
(P ′ ) −3 + 2λ = 3 − 2α es el mismo que el de (P ). Al resolverlo en este caso particu-

5 + λ = 2 + 2α
lar obtenemos que (P ′ ) es compatible determinado con única solución: λ = 1, α = 2. Esto
implica que (P ) es determinado y que, por lo tanto, las rectas L y S se cortan en un solo
punto. Para hallar dicho punto sustituimos
 en  (P) el valor λ = 1 (o α = 2) obteniendo:
T  3 
x = 3, y = −1, z = 6 =⇒ L S =  −1 
 
6

Observación 3.2.1. Rectas que se cruzan.


En R3 dos rectas pueden tener intersección vacı́a sin ser paralelas.

 
0 B
 0 
1
 
  0
1  1 
 0  0
o
0

A
64 Capı́tulo 3. El espacio vectorial Rn

Entretantos ejemplos posibles


 tomemos las rectas A y B de ecuaciones paramétricas
 x = λ  x = 0
(A) y = 0 , (B) y = 1 Obviamente su intersección es vacı́a. Sin embargo
 
z = 0 z = α
   
1 0
(A) es paralela al vector  0  y (B) al vector  0  que no son colineales. Vale la
0 1
pena observar que la recta A coincide
  con el eje Ox mientras que B es una recta paralela
0
al eje Oz que pasa por el punto  1 
0

Cuando buscamos la intersección de dos rectas L y S en R3 tenemos entonces las siguientes


posibilidades:
T
L S = {p0 } : las rectas son secantes (se cortan en un solo punto).
T
L S = L = S : las rectas son coincidentes.
T
L S = ∅ : las rectas pueden ser paralelas (y no coincidentes) o pueden cruzarse.
Para decidirlo consideramos vectores vL paralelo a L y vS paralelo a S.
• Si vL y vS son colineales entonces L y S son paralelas.
• Si vL y vS no son colineales entonces L y S se cruzan.
     
1 −1 3
Ejercicio 3.2.1. Se consideran: p1 =  2  , p2 =  1  , p3 =  1 
−1 3 1
     
5 2 4
p4 =  0  , u1 =  −1  , u2 =  0  y las rectas L1 que pasa por p1 y es
4 3 −2
paralela a u1 , L2 que pasa por p2 y es paralela a u2 y L3 que pasa por p3 y p4 .
1. Halle las ecuaciones paramétricas y reducidas de L1 , L2 y L3 .
T T T
2. Encuentre las siguientes intersecciones: L1 L2 , L1 L3 , L2 L3 .
3. Interprete geométricamente los resultados obtenidos en la parte anterior.

Ejercicio 3.2.2. Pruebe que las siguientes rectas (dadas por sus ecuaciones reducidas)
son paralelas:
 
x + 2y − 1 = 0 x + 2z + 1 = 0
(L) (S)
z−y−3 = 0 x+y+z−1=0

Ejercicio 3.2.3. Se consideran las rectas L y S dadas por sus ecuaciones paramétricas:
 
 x = 1 + 2λ  x = 5 + 4α
(L) y = −2 + aλ , (S) y = 4 + 6α
 
z =1−λ z = −1 − bα

Encuentre a, b ∈ R para que las rectas sean


T paralelas (eventualmente coincidentes). Para
los valores de a y b hallados encuentre L S.
3.2. El espacio vectorial R3 65

3.2.3. Planos en R3
Como habı́amos mencionado, si u y v son dos vectores no colineales de R3 entonces
determinan un plano. Nos estamos refiriendo al plano Πo que pasa por o y que es paralelo
a dichos vectores. A partir de la regla del paralelogramo deducimos que, cualesquiera que
sean los escalares α, β, los puntos de la forma αu + βv siempre pertenecen al plano Πo .
Más aún, todo punto de dicho plano se obtiene de esa forma.

βv αu + βv
v

o u αu

Ahora bien, dado un punto p ∈ R3 (que no tiene por qué ser o) también queda determinado
un plano Π que pasa por p y que es paralelo a u y v. Los puntos de este plano son de la
forma p + αu + βv, en donde los escalares α y β pueden variar en los reales de todas las
maneras posibles.

p + αu + βv

Plano que pasa por un punto y es paralelo a dos vectores no colineales.

Consideremos un punto p ∈ R3 y dos vectores u y v de R3 no colineales. La ecuación


paramétrica del plano Π que pasa por p y es paralelo a los vectores u y v es:

x = p + αu + βv α, β ∈ R.
66 Capı́tulo 3. El espacio vectorial Rn

       
x x0 u1 v1
Si x =  y  , p =  y0 , u =  u2 , v =  v2  entonces las ecuaciones
z z0 u3 v3
paramétricas del plano mencionado son:


 x = x0 + αu1 + βv1
y = y0 + αu2 + βv2 α , β ∈ R.

z = z0 + αu3 + βv3

 
x
Esto quiere decir que un punto x =  y  pertenece a Π si, y solo si, sus coordenadas
z
verifican las tres ecuaciones mencionadas. Observemos también que las tres igualdades
pueden escribirse de la siguiente manera:
     
x − x0 u1 v1
 y − y0  = α  u2  + β  v2 
z − z0 u3 v3

x − x0 u1 v1

lo cual implica que el determinante y − y0 u2 v2 tiene que valer 0 (pues su primera
z − z0 u3 v3
columna es una combinación lineal de las otras dos). Podemos observar también que si
desarrolláramos este determinante por la primera columna y luego ordenáramos en x, y, z,
obtendrı́amos una expresión del tipo ax + by + cz − d, en donde a, b, c y d son constantes
con a,
 b yc no son simultáneamente nulos. Podemos concluir entonces que un un punto
x
x =  y  pertenece a Π si, y solo si, sus coordenadas verifican una ecuación de la forma
z

ax + by + cz − d = 0 que se suele denominar ecuación reducida del plano.

Observación 3.2.2. Ecuación reducida de un plano en R3


Es posible demostrar el recı́proco de la afirmación previa, esto es, toda ecuación de la
forma: ax + by + cz = d, en donde a, b, c son constantes no simultáneamente nulas, es la
ecuación de un plano en R3 . Esto será estudiado utilizando otros elementos en el capı́tulo
6. Vale la pena observar que, como dos ecuaciones equivalentes tienen el mismo conjunto
solución, la ecuación reducida de un plano no es única. Si m 6= 0 las ecuaciones
ax + by + cz = d y max + mby + mcz = md

son equivalentes y, por lo tanto, respresentan el mismo plano.


Con respecto a las rectas en R3 habı́amos observado que tenı́an dos ecuaciones reducidas
de la forma ax + by + cz = d. Ahora podemos interpretar ese resultado. En efecto, al dar
una recta mediante dos ecuaciones de este tipo, estamos determinando dicha recta como
la intersección de dos planos.
3.2. El espacio vectorial R3 67

     
1 3 −3
Ejemplo 3.2.5. Consideremos p =  0 , u =  1 , v =  1  y sea Π el
2 −1 5
plano que pasa por p y es paralelo a los vectores u y v .

Las ecuaciones paramétricas de Π son:



 x = 1 + 3α − 3β
y =α+β α , β ∈ R.

z = 2 − α + 5β

Ahora bien, despejando α y β (en función de x e y) de las dos primeras ecuaciones obte-
nemos:
x + 3y − 1 −x + 3y + 1
α= β=
6 6

Sustituyendo en la tercera ecuación y ordenando llegamos a: x − 2y + z = 3 , que


 
x
es la ecuación reducida del plano Π. Esto quiere decir que un punto  y  pertenece al
z
plano si, y solo si, sus componentes verifican la ecuación x − 2y + z = 3.

Plano que pasa por tres puntos no alineados.


Sean p1 , p2 , p3 tres puntos no alineados. Sabemos que determinan un plano Π al cual
pertenecen. Como los tres puntos no están alineados entonces los vectores p3 − p1 y
p2 − p1 no son colineales y son paralelos a Π.
Luego, la ecuación paramétrica vectorial del plano Π que pasa por esos puntos es:

x = p1 + α(p3 − p1 ) + β(p2 − p1 ) α , β ∈ R.

p2
Π

p3

p1
p2 − p1

p3 − p1
o
68 Capı́tulo 3. El espacio vectorial Rn

     
1 1 −1
Ejemplo 3.2.6. Consideremos los puntos p1 =  1 , p2 =  −1  y p3 =  −1 .
1 2 3
   
0 −2
Como los vectores p2 − p1 =  −2  y p3 − p1 =  −2  no son colineales los tres
1 2
puntos p1 , p2 y p3 determinan un plano Π al cual pertenecen. Las ecuaciones paramétricas
de dicho plano son:

 x = 1 + −2β
y = 1 − 2α − 2β α , β ∈ R.

z = 1 + α + 2β
El lector podrá verificar que, eliminando α y β entre las tres ecuaciones, la ecuación
reducida de este plano resulta ser:

(Π) x + y + 2z = 4

Como se observa fácilmente, las coordenadas de cada uno de los tres puntos dados verifican
esta última ecuación.

Veamos ahora otra manera de obtener la ecuación reducida de este plano Π sin hallar las
ecuaciones paramétricas. En efecto, sabemos que la ecuación reducida de Π es de la forma
ax + by + cz = d. Como las coordenadas de cada uno de los tres puntos deben verificar
esta ecuación obtenemos: 
 a+b+c=d
a − b + 2c = d

−a − b + 3c = d

Resolviendo este sistema (S) se obtiene que es compatible indeterminado con un grado de
libertad y una forma de expresar su conjunto solucuón es:

sol(S) = { (−b, b,2b, 4b) / b ∈ R }

Por ejemplo, si tomamos b = 1, obtenemos a = 1, b = 1, c = 2 y d = 4, que da lugar a la


ecuación hallada anteriormente x + y + 2z = 4.
Si tomamos otro valor de b, los coeficientes cambian, pero la ecuación final es equivalente
a x + y + 2z = 4, y por lo tanto, representa el mismo plano. Por ejemplo, si tomamos
b = 2, obtenemos a = 2, b = 2, c = 4 y d = 8, que da lugar a la ecuación 2x + 2y + 4z = 8.

Observación 3.2.3. Intersección de recta y plano.


Consideremos el problema de intersecar una recta L con un plano Π en R3 . Supongamos
que conocemos las ecuaciones paramétricas de L y la ecuación reducida de Π:

 x = p1 + λv1
(L) y = p2 + λv2 (Π) ax + by + cz = d

z = p3 + λv3
3.2. El espacio vectorial R3 69



 x = p1 + λv1

y = p2 + λv2
El problema planteado nos lleva a estudiar el sistema (S) que, a

 z = p3 + λv3

ax + by + cz = d


 x = p 1 + λv1

y = p2 + λv2
su vez, es equivalente a este otro:

 z = p3 + λv3

a(p1 + λv1 ) + b(p2 + λv2 ) + c(p3 + λv3 ) = d
Ordenando la cuarta ecuación, esta resultará de la forma Aλ = B (en donde A y B
son constantes), es decir, una ecuación lineal de primer grado con una sola incógnita. El
comportamiento de esta ecuación (determinada, indeterminada o incompatible) será el
mismo que el del sistema (S). Tenemos entonces que las únicas posibilidades son:
T
Si (S) es compatible determinado entonces L Π = {q} (la recta corta al plano en
un solo punto).
T
Si (S) es compatible indeterminado entonces L Π = L (la recta está contenida en
el plano).
T
Si (S) es incompatible entonces L Π = ∅ (la recta es paralela al plano).

q Π
L Π

     
0 1 1
Ejercicio 3.2.4. Se consideran los puntos p1 =  1  , p2 =  2  , p3 =  1 .
1 0 −1
Encuentre las ecuaciones paramétricas y la ecuación reducida del plano Π que pasa por
esos tres puntos. Verifique que Π pasa por el origen.
 
1
Ejercicio 3.2.5. Consideremos la recta L que pasa por los puntos q1 =  −1  y
1
 
2
q2 =  1 .
0
1. Encuentre la intersección de L con el plano Π1 de ecuación 2x + 3y + 3z = 6.
70 Capı́tulo 3. El espacio vectorial Rn

2. Encuentre la intersección de L con el plano Π2 de ecuación x − y − z = 3.


3. Encuentre la intersección de L con el plano Π3 de ecuación x − y − z = 1.
(En todos los casos realice la interpretación geométrica correspondiente).
     
1 0 1
Ejercicio 3.2.6. Se consideran los puntos p1 =  0  , p2 =  3  , p3 =  1 
2 −3 0
 
3
y q =  −2 
k
1. Verifique que los puntos p1 , p2 y p3 no están alineados y encuentre la ecuación
reducida del plano Π que determinan.
2. Sea L la recta que pasa por p1 y q. Determine el número k sabiendo que L está con-
tenida en Π.

Ejercicio 3.2.7.Se consideran


 las siguientes
 rectas:

1 1
L1 que pasa por  3  y es paralela a  −1 
−2 1
   
0 2
L2 que pasa por  1  y por  −1 
−1 1

y = −x
L3 de ecuaciones reducidas
z = −2x

 x = −1 + λ
L4 de ecuaciones paramétricas y = 2 − 3λ

z=1
1. Verifique que L1 y L2 son paralelas y halle la ecuación del plano Π1 que las contiene.
2. Verifique que L3 y L4 son secantes y halle la ecuación del plano Π2 que las contiene.
3. Halle las ecuaciones paramétricas de la recta intersección de los planos Π1 y Π2 .

Ejercicio 3.2.8.Se consideran


 las siguientes 
rectas:
1 1
L1 que pasa por  2  y es paralela a v1 =  −1 
0 2
   
0 3
L2 que pasa por  1  y es paralela a v2 =  −1 
2 2
1. Verifique que L1 y L2 son coplanares y halle la ecuación del plano Π determinado
por ellas.
 
−3
2. Verifique que q =  2  pertenece a L2 y que la recta que pasa por q y es paralela
0
a v1 está contenida en el plano Π.
3.2. El espacio vectorial R3 71

Ejercicio 3.2.9. En cada uno de los siguientes casos reconozca geométricamente el sub-
conjunto de R3 definido por las relaciones dadas:

(1) x = 0 (2) y = 0 (3) z = 0 (4) x = 2 (5) y = 3 (6) z = −2

(7) y = x (8) x ≥ 0 (9) y ≥ 0 (10) z ≥ 0 (11) x ≥ 2 (12) y ≤ 3


   
x=0 x=0 y=0 y=0
(13) (14) (15) (16)
y=0 z=0 z=0 z≥0

x≥0
(17) (18) x2 + y 2 + z 2 = 0 (19) x + y + z = 1
y≥0
(20) x ≥ 0 , y ≥ 0 , z ≥ 0 , x + y + z ≤ 1
Ejercicio 3.2.10.
1. Encuentre las ecuaciones
 paramétricas
 y la
ecuación reducida
 del plano Π1 que pasa

0 1 1
por los puntos: o =  0  , p2 =  1  , p3 =  −1 
0 1 0
   
2 1
2. Se considera la recta L que pasa por  2  y es paralela al vector  −1  , y la
2 1
   
1 3 T
recta S que pasa por los puntos  0  y  4 . Encuentre L S.
3 1
3. Sea T
Π2 el plano determinado por L y S (que resultaron secantes). Demuestre que
Π1 Π2 es una recta y encuentre un vector paralelo a la misma.
Ejercicio 3.2.11.
1. Encuentre las ecuaciones
 paramétricas
 y la   del plano Π1 que pasa
ecuación reducida
1 0 0
por los puntos: e1 =  0  , e2 =  1  , e3 =  0 
0 0 1
 
2
2. Se considera la recta L que pasa por o y es paralela al vector  1  , y la recta S
1
   
0 2
que pasa por los puntos  0  y  1 . Demuestra que L y S son paralelas y no
1 2
coincidentes.
T
3. Sea Π2 el plano determinado por L y S. Demuestre que Π1 Π2 es una recta y
encuentre un vector paralelo a la misma.
Ejercicio 3.2.12. Encuentre la intersección de los tres planos dados por las siguientes
ecuaciones reducidas:

(Π1 ) x + y + z = 2 , (Π2 ) 2x + 3y + z = 5 , (Π3 ) − x − 2y + z = −1

¿Qué otras posibilidades se pueden dar para la intersección de tres planos en R3 ?


72 Capı́tulo 3. El espacio vectorial Rn

3.3. El espacio vectorial Rn


Con excepción de la visualización geométrica, todos los conceptos que hemos introducido
(o repasado) en R2 y R3 se extienden de manera natural a Rn , es decir, al conjunto de
las n-uplas ordenadas de números reales. Muy en particular, las propiedades de la suma
de vectores y producto de un número por un vector continuarán siendo válidas. De todos
modos, repetiremos las definiciones y los teoremas desarrollados en las secciones anteriores,
no solo para insistir con la analogı́a, sino para observar su validez dentro de un contexto
más general.

Definición 3.3.1. El conjunto Rn .


Designaremos con Rn al conjunto de todas las matrices columna de tamaño n × 1:
  

 x1 


  x2  

n  
R =  ..  / xi ∈ R, i = 1, 2, ... , n

  .  


 

xn

A los elementos de Rn los denominaremos (indistintamente) puntos o vectores, mientras


que a los números reales los llamaremos escalares.

3.3.1. Suma de vectores y producto de un número por un vector


Definición 3.3.2. Suma de vectores.
   
x1 y1
 x2   y2 
Si x =  .  ∈ R e y =  .  ∈ Rn entonces la suma x + y es el vector definido
n
   
 ..   .. 
xn yn
 
x1 + y 1
 x2 + y 2 
 ∈ Rn
 
por x + y =  ..
 . 
xn + y n

Dicho de otro modo, el vector x + y se obtiene sumando componente a componente. Ob-


servemos que esta definición coincide con la de suma de matrices (en este caso de matrices
n × 1) y, por lo tanto, esta operación tendrá las mismas propiedades que las conocidas
para la suma de matrices.

En este contexto, a la matriz nula n × 1 (que tiene ceros en todas sus componentes) la
llamaremos vector nulo y la simbolizaremos o. Asimismo, dado un vector cualquiera x
designaremos con −x al vector cuyas componentes son, respectivamente, las opuestas de
las de x.1

1
Como habrán observado hemos introducido un cambio de notación. De aquı́ en adelante los vectores
los designaremos con tipografı́a normal, por ejemplo u, y no en “negrita” u, como lo hicimos antes.
3.3. El espacio vectorial Rn 73

Proposición 3.3.1. Propiedades básicas de la suma de vectores.


(S1) Asociativa: (u + v) + w = u + (v + w) , ∀ u, v, w ∈ Rn .
(S2) Conmutativa: u + v = v + u , ∀ u, v ∈ Rn .
(S3) Existencia de neutro: Existe o ∈ Rn tal que o + u = u , ∀ u ∈ Rn .
(S4) Existencia de opuesto: Para cada u ∈ Rn existe −u ∈ R2 tal que u + (−u) = o.

Observación 3.3.1.
(1) Como mencionamos anteriormente, se trata de las conocidas propiedades de la suma
de matrices y, por lo tanto, no es necesario demostrarlas. De todos modos, en caso de
querer hacerlo, la prueba es muy simple ya que alcanza con utilizar las propiedades de la
suma de números reales.
(2) Como ya lo sabemos para matrices, el neutro de la suma es único y el opuesto de cada
vector también es único.
(3) Dados dos vectores u, v ∈ Rn , la resta u − v se define como la suma de u mas el opuesto
de v: u − v = u + (−v).

Definición 3.3.3.
 Producto
 de un número por un vector.
x1
 x2 
Si λ ∈ R y x =  .  ∈ Rn entonces el producto λx del número λ por x es el vector
 
 .. 
x
n 
λx1
 λx2 
 ∈ Rn
 
definido por λx =  ..
 . 
λxn

Dicho de otro modo, el vector λx se obtiene multiplicando por λ a cada componente de


x. Observemos que esta definición coincide con la de producto de un número por una
matriz (en este caso de matrices n × 1) y, por lo tanto, esta operación tendrá las mismas
propiedades que las conocidas para matrices.

Proposición 3.3.2. Propiedades básicas del producto de un número por un


vector.
(P1) Asociativa: (αβ)u = α(βu) , ∀ u ∈ Rn , ∀ α, β ∈ R.
(P2) Existencia de neutro real: 1 u = u , ∀ u ∈ Rn .
(P3) Distributiva respecto de la suma de números: (α + β)u = αu + βu ,
∀ u ∈ Rn , ∀ α, β ∈ R.
(P4) Distributiva respecto de la suma de vectores: α(u + v) = αu + αv ,
∀ u, v ∈ Rn , ∀ α ∈ R.
   
2 3
 −1 
 , v =  −3/2 .
 
Ejemplo 3.3.1. Consideremos los siguientes vectores en R4 : u = 
 1   3/2 
4 6
74 Capı́tulo 3. El espacio vectorial Rn

Entonces:    
5 6
 −5/2   −3 
u+v =
 5/2 
 , 2v = 
 3  ,
 3u − 2v = o
10 12
Definición 3.3.4. Vectores colineales.
Sean u, v ∈ Rn . Diremos que u y v son colineales cuando uno es múltiplo del otro, es
decir, si existe α ∈ R tal que v = αu, o si existe β ∈ R tal que u = βv.

     
2 4 2
 −1 
 y  −2  son colineales, mientras que  −1 
   
Por ejemplo, los vectores  2   4   2 
1 2 1
 
4
 −2 
 5  no lo son.
y  

π
Sea z un vector cualquiera de Rn y o el vector nulo de Rn . Como o = 0 z, podemos decir
que o es colineal con cualquier otro vector z ∈ Rn .

3.3.2. Combinaciones lineales


Definición 3.3.5. Combinación lineal.
Sean U = {u1 , u2 , . . . , ur } ⊂ Rn y z ∈ Rn . Diremos que z es combinación lineal de U
si, y solo si, existen escalares α1 , α2 , . . . , αr ∈ R tales que z = α1 u1 + α2 u2 + · · · + αr ur .
Cuando z sea combinación lineal de U abreviaremos: “z es C.L. de U ”.

Ejemplo 3.3.2. Consideremos el caso en que U contiene un solo vector no nulo: U = {u}
con u 6= o. En este caso los vectores que son combinación lineal de U son aquellos de la
forma λu con λ ∈ R. Es decir, son todos los vectores colineales con u. ¿Qué ocurre si u
fuese el vector nulo?

Observación 3.3.2. Interpretación geométrica en R2 de las C.L. de dos vectores.


Sea U = {u1 , u2 } ⊂ R2 un conjunto formado por dos vectores no colineales. Si α1 , α2 ∈ R
la regla del paralelogramo nos permite visualizar el vector α1 u1 + α2 u2

α2 u2

u2

u1 α1 u1

Observemos que, al variar α1 y α2 de todas las maneras posibles en R, recorremos todos


los vectores de R2 . Dicho de otro modo, todo vector de R2 se podrá expresar como C.L.
de {u1 , u2 }. ¿Qué hubiese sucedido si u1 y u2 fuesen colineales?
3.3. El espacio vectorial Rn 75

Ejemplo
 3.3.3.
 Veamos ejemplo en R3 . Consideremos U = {u1 , u2 } ⊂ R3 en donde
 un 
1 −1
u1 =  −1  y u2 =  3 .
1 2
(1) ¿Cómo obtenemos combinaciones lineales de U ? Simplemente multiplicando u1 por un
número, u2 por otro número
 y sumando
 los resultados.
−1
Por ejemplo 2u1 + 3u2 =  7  es una C.L. de U . ¿Es posible obtener otras?
8
 
4
Sı́, otro ejemplo es 3u1 − u2 =  −6 . ¿Cuántas C.L. de U podemos formar?
1
(2) Algunas C.L. particulares de U se obtienen cuando  multiplicamos
 uno de los vectores
α1
por 0. Por ejemplo las C.L. de la forma α1 u1 + 0u2 =  −α1  nos dan vectores que son
α1
todos colineales con u1 . Resulta claro que hay infinitas C.L. diferentes de U .

(3) Un caso particular (trivial, pero fundamental a tener en cuenta) es cuando tomamos
todos los escalares nulos. Esta se denomina la C.L. trivial de U y da como resultado el
vector nulo: 0u1 + 0u2 = o.

(4) Ahora bien, un problema más interesante consiste en preguntarnos


 si cierto vector
1
dado es (o no) C.L. de U . Consideremos por ejemplo el vector z =  1  y tratemos de
4
averiguar si es C.L. de U . Tenemos:

z es C.L. de U ⇐⇒ ∃ α1 , α2 ∈ R / α1 u1 + α2 u2 = z

    
1 −1 1
⇐⇒ ∃ α1 , α2 ∈ R / α1  −1  + α2  3  =  1 
1 2 4

Ordenando componente a componente


 resulta que z será C.L. de U si, y solo si, existen
 α1 − α2 =1
α1 , α2 ∈ R que verifiquen: −α1 + 3α2 = 1 .

α1 + 2α2 = 4
El problema se reduce entonces a estudiar un sistema de ecuaciones lineales. Escalerizando
 α1 − α2 = 1
llegamos a 2α2 = 2 . Este sistema es compatible (de hecho compatible determi-

0=0
nado) con única solución α1 = 2 , α2 = 1. La respuesta es entonces afirmativa. El vector
z es C.L. de U . Mas aún, la única manera de expresar z como C.L. de U es: z = 2u1 + u2 .
76 Capı́tulo 3. El espacio vectorial Rn

 
1
Consideremos ahora el vector w =  1  y tratemos de averiguar si es C.L. de U . Repi-
2

 α1 − α2 = 1
tiendo el mismo razonamiento que en el caso anterior llegamos al sistema −α1 + 3α2 = 1

α1 + 2α2 = 2
que (luego de efectuar 
las mismas operaciones en la escalerización que en el caso anterior)
 α1 − α2 = 1
resulta equivalente a 2α2 = 2 . Este sistema es incompatible y, por lo tanto, la

0=4
respuesta es negativa: w NO es C.L. de U .

(5) Como acabamos de ver, hay vectores de R3 que son C.L. de U y otros que no lo
3
son. ¿Podremos caracterizar todos  losvectores de R que sean C.L. de U ? Para ello nos
a
planteamos un vector genérico  b  y efectuamos el mismo procedimiento que antes.
c

 α1 − α2 = a
Este vector será C.L. de U si, y solo si, el sistema −α1 + 3α2 = b (de incógnitas

α1 + 2α2 = c
α1 , α2 ) es compatible.
 Efectuando la misma escalerización que en los ejemplos anteriores
 α1 − α2 = a
llegamos a 2α2 = a + b

0 = 5a + 3b − 2c
Una discusión muy simple que nos lleva a la siguiente concusión: el vector será C.L. de U
si, y solo si, 5a + 3b −  0. Tenemos entonces que los vectores de R3 que son C.L. de U
2c = 
a
son aquellos vectores  b  cuyas componentes verifiquen la relación 5a + 3b − 2c = 0,
c
es decir, son los vectores del conjunto:
  
 a 
 b  ∈ R3 / 5a + 3b − 2c = 0
 
c

 α1 − α2 = a
Una última observación: cuando 5a + 3b − 2c = 0 el sistema 2α2 = a + b

0 = 5a + 3b − 2c
no solamente queda compatible, sino también compatible determinado. Esto quiere decir
que cada vector que sea C.L. de U se podrá escribir de una única manera como C.L. de
U.
     
1 0 2
Ejemplo 3.3.4. Consideremos los vectores u1 =  0  , u2 =  1  , u3 =  −1 
2 1 3
3
y el conjunto V = {u1 , u2 , u3 }. Queremos caracterizar los vectores de R que sean C.L. de
V , es decir, queremos encontrar la condición que debe cumplir un vector de R3 para ser
3.3. El espacio vectorial Rn 77

 
a
C.L. de V . Para ello consideramos un vector genérico z =  b  y planteamos que
c

z es C.L. de V ⇐⇒ ∃ α1 , α2 , α3 ∈ R / α1 u1 + α2 u2 + α3 u3 = z

 α1 + 0α2 + 2α3 = a
Esto nos lleva al sistema de ecuaciones (de incógnitas α1 , α2 , α3 ) 0α1 + α2 − α3 = b

2α1 + α2 + 3α3 = c
 
1 0 2 a
La matriz ampliada asociada a dicho sistema es  0 1 −1 b .
2 1 3 c
Escalerizando tenemos:
   
1 0 2 a 1 0 2 a
 0 1 −1 b  ∼  0 1 −1 b 
0 1 −1 −2a + c ←− F3 − 2F1 0 0 0 2a + b − c ←− F2 − F3

El rango por filas (o sea, el número de escalones) de la matriz del sistema es 2. Según el
teorema de Rouche-Frobenius, el sistema será compatible si, y solo si, el rango por filas
de la matriz ampliada también vale 2. Se deduce entonces que la condición para que z sea
C.L. de V es 2a + b − c = 0.  
a
Conclusión: los vectores de R3 que son C.L. de V son aquellos vectores  b  cuyas
c
componentes verifiquen la relación 2a + b − c = 0, es decir, son los vectores del conjunto:
  
 a 
 b  ∈ R3 / 2a + b − c = 0
 
c

El sistema escalerizado correspondiente es



 α1 + 0α2 + 2α3 = a
(S) α2 − α3 = b

0 = 2a + b − c

Observemos que, a diferencia del ejemplo anterior, cuando 2a + b − c = 0 el sistema (S)


queda compatible, pero no determinado, sino indeterminado con un grado de libertad (α1
y α2 se pueden poner en función de α3 ). Esto quiere decir que cada vector que sea C.L. de
V se podrá escribir
 de infinitas maneras como C.L. de V . Para visualizar
 esto tomemos un
a 1
vector particular  b  que cumpla 2a+b−c = 0. Por ejemplo v =  2  (el lector pue-
c 4

 α1 + 0α2 + 2α3 = 1
de elegir cualquier otro). Para este vector el sistema (S) queda: α2 − α3 = 2

0 =0
Como decı́amos, resulta ser un sistema compatible indeterminado cuyas soluciones vienen
dadas por: α1 = 1 − 2α3 , α2 = 2 + α3 , α3 cualquiera.
78 Capı́tulo 3. El espacio vectorial Rn

Para diferentes elecciones de α3 resultarán los valores de α1 y α2 para los cuales v se


pueda escribir como α1 u1 + α2 u2 + α3 u3 . Tomaremos entonces algunos valores de α3 y
verificaremos que, para todos ellos, se cumple la igualdad v = α1 u1 + α2 u2 + α3 u3
       
1 1 0 2
Si α3 = 1 =⇒ α1 = −1 , α2 = 3 y  2  = −1  0  + 3  1  + 1  −1 
4 2 1 3
       
1 1 0 2
Si α3 = −1 =⇒ α1 = 3 , α2 = 1 y  2  = 3  0  + 1  1  − 1  −1 
4 2 1 3
       
1 1 0 2
Si α3 = 2 =⇒ α1 = −3 , α2 = 4 y  2  = −3  0  + 4  1  + 2  −1 
4 2 1 3

Observación 3.3.3. Combinación lineal en notación matricial.


     
1 1 2
 2   4   1 
Consideremos los vectores u1 =   3  , u2 =  1  , u3 =
     y el conjunto
 3 
5 2 4
4
U = {u1 , u2 , u3 } ⊂ R . La combinación lineal α1 u1 + α2 u2 + α3 u3 se puede escribir:
       
1 1 2 α1 + α2 + 2α3
 2   4   1   2α1 + 4α2 + α3 
α1 
 3  + α2
   + α3
 1 
  = 
 3   3α1 + α2 + 3α3


5 2 4 5α1 + 2α2 + 4α3
 
1 1 2
 2 4 1 
Observemos que el último vector coincide con el producto de la matriz  3
 por
1 3 
5 2 4
 
α1
el vector de coeficientes  α2  . Es ası́ que vale la siguiente igualdad:
α3
       
1 1 2 1 1 2  
 2   4   1   2 α1
4 1  

α1 
 3  + α2
   + α3
 1 
  = 
 3   3 α2 
1 3 
α3
5 2 4 5 2 4

Con respecto a esta matriz observemos que su primera columna está formada por las
componentes de u1 , su segunda columna por las componentes de u2 , y su tercera columna
por las componentes de u3 . Esta matriz se designará MU . Observemos también que, como
en este ejemplo U está formado por tres vectores de R4 , la matriz MU resulta tener 4 filas
y 3 columnas (es decir, es 4 × 3). Tenemos entonces que la C.L. α1 u1 + α2 u2 + α3 u3 se
puede escribir como el producto de la matriz MU por el vector de los coeficientes de la
3.3. El espacio vectorial Rn 79

C.L. :
 
α1
α1 u1 + α2 u2 + α3 u3 = MU .  α2 
α3

Esta observación, que hemos introducido con un ejemplo particular, es totalmente general.
Dado un conjunto U = {u1 , u2 , . . . , ur } ⊂ Rn designaremos con MU a la matriz n × r tal
que su primera columna está formada por las componentes de u1 , su segunda columna por
las componentes de u2 , y ası́ sucesivamente. La C.L. α1 u1 + α2 u2 + . . . + αr ur se puede
escribir como el producto de la matriz MU por el vector de los coeficientes de la C.L. :

 
α1

 α2 

α1 u1 + α2 u2 . . . + αr ur = MU .  .. 
 . 
αr

Como sabemos, un vector z ∈ Rn será C.L. de U si, y solo si, existen escalares α1 , α2 , . . . , αr ∈
R tales que α1 u1 + α2 u2 . . . + αr  ur = z. O, de manera equivalente, si, existen escalares
α1
 α2 
 
α1 , α2 , . . . , αr ∈ R tales que MU .  .  = z. Esta última es la notación matricial para
.
 . 
αr
un sistema de ecuaciones lineales de incógnitas α1 , α2 , . . . , αr . Podemos resumir entonces
lo siguiente:
 
α1
 α2 
 
Si el sistema MU  .  = z
.
 . 
αr

es incompatible entonces z NO es C.L. de U .

es compatible entonces z es C.L. de U .

es compatible determinado entonces hay una sola C.L. de U que da como resultado
z.

es compatible indeterminado entonces hay infinitas C.L. de U que dan como resultado
z.
     
1 1 2
 1   2   3 
Ejemplo 3.3.5. Consideremos los vectores u1 =   −1  , u2 =  1  , u3 =  4 
    

−1 2 1
y el conjunto U = {u1 , u2 , u3 } ⊂ R4 . Queremos caracterizar todos los vectores de R4 que
80 Capı́tulo 3. El espacio vectorial Rn

son C.L. de U , es decir, queremoshallar


 la condición (o condiciones) que deben verificar
a
 b 
a, b, c y d para que el vector z = 
 c  sea C.L. de U . En este caso la matriz ampliada

d
   
α1 1 1 2 a
 α2   1 2 3 b 
del sistema MU .   α3  = z es  −1 1 4 c .
  

α4 −1 2 1 d
Escalerizando tenemos que la matriz es equivalente a las siguientes:
   
1 1 2 a 1 1 2 a
 0 1 1 b−a   ←− F2 − F1
 0 1 1 b−a 
 ∼  
 0 2 6 a + c  ←− F3 + F1  0 0 4 3a − 2b + c  ←− F3 − 2F2
0 3 3 a+d ←− F4 + F1 0 0 0 4a − 3b + d ←− F4 − 3F2

El rango por filas (o sea, el número de escalones) de MU es rgf (MU ) = 3. Según el teorema
de Rouche-Frobenius, el sistema será compatible si, y solo si, el rango por filas de la matriz
ampliada también es 3. Se deduce entonces que la condición para que z sea C.L. de U es
4a − 3b + d = 0.

Observación 3.3.4. Los vectores canónicos de Rn .


Para cada j entre 1 y n designaremos con ej al vector de Rn cuyas componentes son todas
nulas, salvo la j-ésima que vale 1:
     
1 0 0

 0 


 1 


 0 


e1 =  0  
 , e2 =  0  
 , . . . , en =  0 

 ..   ..   .. 
 .   .   . 
0 0 1
 
x1

 x2 


Si x =  x3  es un vector cualquiera de Rn entonces vale la igualdad:

 .. 
 . 
xn

x = x1 e1 + x2 e2 + x3 e3 + . . . + xn en

Resulta entonces que cualquier vector es C.L. del conjunto de vectores canónicos. Mas
aún, los coeficientes de la C.L. son las propias componentes del vector x. Además, es claro
que no hay otra manera de escribir x como C.L. de estos vectores canónicos. De aquı́ en
adelante designaremos con la letra C al conjunto de vectores canónicos de Rn , es decir:
C = {e1 , e2 , . . . , en }. Observemos también que la matriz MC no es otra que la matriz
3.3. El espacio vectorial Rn 81

identidad In :  
1 0 ... 0

 0 1 ... 0 

MC =  .... . . ..  = In
 . . . . 
0 0 ... 1

Ejercicio 3.3.1. Sean λ ∈ R y v ∈ Rn . Demuestre que λ v = o si, y solo si, λ = 0 o v = o.

Ejercicio 3.3.2. Se consideran los vectores:


    
1 2 1
u= 1  , v= 1  , w= 2 
2 3 a

Encuentre todos los valores de a para los cuales w es C.L. de {u, v}.

Ejercicio 3.3.3. En cada uno de los siguientes casos se pide:


Halle la matriz MU .
Halle todos los vectores que son C.L. de U .
Decida
 si el 
vector
 z dado  es C.L. deU . 
 1 −1  1
1. U =  0  ,  2  , z= 2 .
 
2 1 3
       
 1 2 1  1
2. U =  0  ,  −1  ,  0  , z= 1 .
 
−1 1 1 −1
         
 1 0 2 1  1
3. U =  1  ,  −1  ,  1  ,  1  , z =  −2  .
 
1 1 −1 0 3
       

 1 2   1 3
  
1 , 0 
 1 
  , z2 =  3  .
 
4. U =   −1   1  , z1 =  1   −3 

 
 
−1 3 1 −3
         
1 1 2 2 3
5. U = , , , , z= .
2 1 3 2 5

Ejercicio 3.3.4. Determine si las siguientes afirmaciones son verdaderas o falsas justifi-
cando la respuesta.
1. Sean U = {u1 , u2 } ⊂ Rn y z1 , z2 dos vectores que son C.L. de U . Si v = 2z1 + 3z2
entonces v es C.L. de U .
2. Sean u1 , u2 , u3 ∈ Rn tales que u1 es C.L. de {u2 , u3 } y u2 es C.L. de {u3 }. Entonces
u1 es C.L. de {u3 }.
3. Sean u1 , u2 , u3 ∈ Rn tales que u1 es C.L. de {u2 , u3 } y u2 no es C.L. de {u3 }. Entonces
u1 no es C.L. de {u3 }.
82 Capı́tulo 3. El espacio vectorial Rn

Ejercicio 3.3.5. Se considera el conjunto:


     

 1 2 2 

   −1  
−1   1 4
U=   0  ,  1   1  ⊂R
   ,  

 
 
1 0 1
 
−2
 −5 
1. Investigue si z = 
 −2  es combinación lineal de U .

6
2. Encuentre todos los vectores de R4 que son C.L. de U .

Ejercicio 3.3.6. Se consideran:


       
 1 −1 1  1
U =  1 , a , b  , z =  −a 
 
1 −1 −1 −3

Investigue si z es C.L. de U . (Se deberá discutir según a, b ∈ R).

Ejercicio 3.3.7. Rectas en Rn .


Sean p y q dos puntos distintos de Rn y v un vector no nulo de Rn . Análogamente a lo
que ocurre en R2 y R3 damos las siguientes definiciones:
La recta que pasa por p y es paralela al vector v es el conjunto: { p + λv / λ ∈ R }
La recta que pasa por p y q es el conjunto : { p + λ(q − p) / λ ∈ R }
El segmento de extremos p y q es el conjunto : { p + λ(q − p) / λ ∈ [0, 1] } que también
puede expresarse como { (1 − t)p + tq / t ∈ [0, 1] }
1. 
Encuentre
 lasecuaciones
 paramétricas de la recta en R4 que pasa por los puntos
1 3
 −1   2 
 1  y  3 . Encuentre una recta que pase por el origen y que sea paralela
   

2 1
a la recta anterior.
2. Diremos que tres puntos p1 , p2 , p3 ∈ Rn están alineados cuando pertenecen a una
misma recta. Demuestre que p1 , p2 , p3 están alineados si, y solo si, los vectores p2 −p1
y p3 − p1 son colineales.

Ejercicio 3.3.8. Conjuntos convexos.


Un subconjunto C de Rn se dice convexo cuando para toda pareja de puntos p, q ∈ C se
cumple que el segmento con extremos en p y en q está contenido en C. (Dicho de manera
más coloquial, es un conjunto donde no se puede jugar a la escondida). En sı́mbolos:

C ⊂ Rn es convexo ⇐⇒ ∀ p, q ∈ C se cumple (1 − t)p + tq ∈ C, ∀ t ∈ [0, 1]

1. Encuentre ejemplos de conjuntos convexos en R2 .


2. Demuestre que la intersección de dos conjuntos convexos es un conjunto convexo.
3. ¿Es la unión de conjuntos convexos un conjunto convexo?
3.4. Dependencia e independencia lineal 83

3.4. Dependencia e independencia lineal


Definición 3.4.1. Conjuntos linealmente dependientes y linealmente indepen-
dientes.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto con al menos dos vectores (r ≥ 2).
Diremos que U es linealmente dependiente (L.D.) cuando alguno de sus vectores es
C.L. de los restantes vectores de U .
Cuando U no sea linealmente dependiente diremos que es linealmente independiente
(L.I.).
     
1 2 3
 0   1   1 
Ejemplo 3.4.1. Sean u1 =   1  , u2 =  2  , u3 =  3 
    

−1 1 0
y el conjunto U = {u1 , u2 , u3 }. Es inmediato observar que u3 = u1 +u2 . Se deduce entonces
que U es L.D.
Observemos también que u3 = u1 + u2 implica u1 + u2 − u3 = o y esto quiere decir que
hemos encontrado una C.L. no trivial de U que da como resultado o.
      
 1 0 0 
Ejemplo 3.4.2. Sea C = {e1 , e2 , e3 } =  0  ,  1  ,  0  . Observemos que
 
0 0 1
cualquier C.L. entre e1 y e2 tendrá un 0 en la tercera componente, de donde resulta que
e3 no es C.L. de {e1 , e2 }. Con un razonamiento similar se concluye que e1 no es C.L. de
{e2 , e3 } y que e2 no es C.L. de {e1 , e3 }. Ninguno de los vectores de C se puede expresar
como C.L. de los restantes y, por lo tanto, C es L.I.
Observación 3.4.1. Dos situaciones muy simples.
(a) Si un conjunto (con más de un vector) contiene al vector nulo entonces es L.D. En
efecto, sea U = {o, u2 , . . . , ur }. Como, obviamente, o = 0u2 + . . . 0ur , el vector
nulo es C.L. de los restantes y, por lo tanto, U es L.D.
(b) Cuando el conjunto en cuestión contiene exactamente dos vectores entonces es inme-
diato estudiar si es L.I. o L.D. Sea U = {u, v} ⊂ Rn . U es L.D. si, y solo si, algunos
de sus vectores es C.L. del otro, es decir, si y solo si, son colineales. Resulta entonces
que cuando tenemos solamente dos vectores alcanza con mirarlos para poder decidir:
si son proporcionales entonces U es L.D. y, si no lo son, entonces U es L.I.
En la observación anterior se vio que cuando el conjunto contiene solamente dos vectores
entonces es trivial estudiar si es L.I. o L.D. Ahora bien, cuando el conjunto contiene más
de dos vectores, dicho estudio no es (en general) inmediato. Consideremos el siguiente
ejemplo:      

 1 −5 2  
  10   −1 
2 
U=  
 ,  −7  ,  1 
    
 −1

 

3 −19 7
¿Alguno de sus vectores es C.L. de los restantes? A “simple vista” (y sin hacer operaciones)
parecerı́a que no podemos adelantarnos a responder la pregunta. El próximo teorema nos
dará una caracterización diferente de los conjuntos L.D.
84 Capı́tulo 3. El espacio vectorial Rn

Teorema 3.4.1. Condición necesaria y suficiente para que un conjunto sea L.D.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto con al menos dos vectores (r ≥ 2).
Entonces U es L.D. si, y solo si, existe una C.L. no trivial de U que da como resultado el
vector nulo o.
Demostración. Como mencionamos anteriormente, el vector nulo siempre es C.L. de
cualquier conjunto, pues se obtiene trivialmente multiplicando por ceros los vectores de
dicho conjunto. A dicha C.L. la denominábamos C.L. trivial. Pero, como ya hemos visto
en algunos ejemplos, puede suceder que existan C.L. no triviales de U que también den
como resultado o.

( =⇒ ) Por hipótesis U es L.D. Esto quiere decir que alguno de sus vectores es C.L.
de los restantes. Supongamos (para fijar ideas) que u1 es C.L. de los demás. Tenemos
entonces que existen escalares α2 , . . . , αr ∈ R tales que u1 = α2 u2 + . . . + αr ur .
Lo anterior implica que o = −u1 + α2 u2 + . . . + αr ur . Hemos encontrado entonces
una C.L. no trivial (con al menos uno de los coeficientes diferente de cero) de U que
da o.

( ⇐= ) Ahora nuestra hipótesis es que existe una C.L. no trivial de U que da como
resultado o. O sea, existe alguna C.L. de U con al menos un coeficiente diferente
de 0 que da o. Tenemos entonces que existen escalares λ1 , λ2 , . . . , λr ∈ R, no
todos nulos, tales que o = λ1 u1 + λ2 u2 + . . . + λr ur . Supongamos (sin pérdida de
generalidad)
  que es λ1 6=0. De la igualdad anterior podemos despejar u1 obteniendo:
−λ2
u1 = λ1 u2 + . . . + −λ λ1
r
ur . Hemos encontado entonces un vector de U que es
C.L. de los restantes, y eso es precisamente lo que querı́amos probar. ♠

Corolario 3.4.2. Condición necesaria y suficiente para que un conjunto sea L.I.
Del teorema anterior surge inmediatamente lo siguiente:
Un conjunto U es L.I. si, y solo si, la única C.L. de U que da como resultado o es la
trivial.

Observación 3.4.2. Una convención para un conjunto con un solo vector. Si


u ∈ Rn es un vector no nulo entonces λu = o si, y solo si, λ = 0. Dicho de otro modo,
la única C.L. de {u} que da o es la trivial. Debido a esto convenimos en que un conjunto
con un solo vector no nulo es L.I.
Por otra parte, el producto de cualquier real por o da como resultado o. Consideraremos
entonces que {o} es L.D.

Según los resultados anteriores, para averiguar si el conjunto U = {u1 , u2 , . . . , ur } ⊂ Rn


es L.I. o L.D. podemos considerar el sistema lineal homogéneo
 
α1
 α2 
 
MU .  .  = o
 . .
αr

y decidir de la siguiente manera:


3.4. Dependencia e independencia lineal 85

Si el sistema es compatible determinado (solo admite la solución trivial) entonces U


es L.I.

Si el sistema es compatible indeterminado (admite soluciones distintas de la trivial)


entonces U es L.D.

Ejemplo 3.4.3. Consideremos el conjunto


     

 1 −5 2 
     3 
U = {u1 , u2 , u3 } = 
2  ,  −6 , 


 1   −1   1 

 
4 −12 6

Para investigar si es L.I. o L.D. trabajamos con la matriz ampliada:


   
1 −5 2 0 1 −5 2 0
 2 −6 3 0   0 4 −1 0 

 1 −1
 que escalerizando queda  
1 0   0 0 0 0 
4 −12 6 0 0 0 0 0

El sistema es entonces compatible indeterminado y, por lo tanto, U es L.D.

Ahora bien, como U es L.D., alguno de sus vectores tiene que ser C.L. de los restantes.
¿Cómo deberı́amos proceder para hallar tal vector? Si volvemos al sistema escalerizado
(colocando ahora las incógnitas) tenemos:


 α1 − 5α2 + 2α3 = 0

4α2 − α3 = 0

 0=0

0=0

Hay infinitas soluciones que vienen dadas (por ejemplo) mediante: α1 = −3α2 , α3 = 4α2 ,
α2 cualquiera. Para todas las ternas (α1 , α2 , α3 ) que verifiquen esas relaciones se cumplirá:
α1 u1 + α2 u2 + α3 u3 = o. Por ejemplo, si tomamos α2 = 1 resultan α1 = −3 y α3 = 4 con
lo que −3u1 + u2 + 4u3 = o. De esta última igualdad podemos despejar cualquiera de los
tres vectores en función de los otros dos. En este caso, cualquiera de los tres vectores es
C.L. de los restantes.

Observación 3.4.3. No siempre tiene que ocurrir lo que sucedió en el ejemplo anterior.
Es decir, si un conjunto U es L.D. eso no implica que cualquiera de sus vectores sea
C.L.
 delosrestantes.
  Para  ello consideremos el siguiente ejemplo: U = {u1 , u2 , u3 } =

 1 2 0 
       
  ,   ,  0  . Este conjunto es L.D. (pues u2 = 2u1 + 0u3 ) y sin embargo
1 2
  1   2   0 

 

1 2 7
u3 no es C.L. de {u1 , u2 }.
86 Capı́tulo 3. El espacio vectorial Rn

Observación 3.4.4. En Rn no hay conjuntos L.I. con más de n vectores.


Supongamos que U = {u1 , u2 , . . . , ur } ⊂ Rn  subconjunto de Rn con más de n vec-
es un 
α1
 α2 
 
tores (r > n). En este caso el sistema MU  .  = o es un sistema homogéneo con
 .. 
αr
más incógnitas que ecuaciones y, por lo tanto (recordar la observación 2.4.5), es compati-
ble indeterminado (tiene soluciones distintas de la trivial). Se deduce entonces que todo
subconjunto de Rn con más de n vectores es necesariamente L.D.

Observación 3.4.5. Interpretación geométrica en R2 y R3 .

Según la observación previa, en R2 no puede haber un conjunto L.I. con más de dos
vectores. Esto tiene una interpretación geométrica bastante simple. En efecto, sea
{u, v} ⊂ R2 un conjunto L.I. Sabemos que esto es equivalente a decir que u y v no
son colineales. Sea w otro vector de R2 . Si w es colineal con u o con v entonces es
claro que {u, v, w} es L.D. Supongamos entonces que w no es colineal con u ni con
v. Designemos con S a la recta que pasa por o y u, y con T a la que pasa por o y
v. La paralela por w a T intersecta a S en u1 , mientras que la paralela por w a S
intersecta a T en v2 . La regla del paralelogramo nos permite afirmar que w = u1 + v2
y, por lo tanto, w es C.L. de {u, v}.

v2 w
v

o u u1 S

En definitiva, se observa geométricamente que si {u, v} ⊂ R2 es L.I., entonces cual-


quier otro vector w de R2 se puede escribir como C.L. de {u, v} y, consecuentemente,
{u, v, w} es L.D.

Consideremos ahora un conjunto {u, v} ⊂ R3 L.I. Como estos dos vectores no son
colineales determinan un plano Π que pasa por o y que es paralelo a ambos. Sea
ahora un tercer vector w no colineal con u ni con v.
Tenemos que {u, v, w} es L.D. si, y solo si, w es C.L. de {u, v}. Esto es equivalente
a decir que w pertenece al plano Π.
3.4. Dependencia e independencia lineal 87

Π
u
o
y

Ahora bien, si {u, v, w} es L.I. entonces w no puede ser C.L. de {u, v}. Esto significa
que w no pertenece al plano Π.

z
w

v Π

u
o
y

Observación 3.4.6. Reducción y ampliación de un conjunto L.I.


Es bastante sencillo probar que si a un conjunto L.I. (con más de un vector) le qui-
tamos uno de sus vectores, entonces el conjunto resultante también es L.I. En efecto,
sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto L.I. y V = U − {u1 } = {u2 , . . . , ur }. Si
V no fuese L.I. entonces alguno de sus vectores deberı́a ser C.L. de los restantes.
Supongamos (para fijar ideas) que u2 = α3 u3 + . . . + αr ur . Pero entonces también
tendrı́amos la igualdad u2 = 0u1 + α3 u3 + . . . + αr ur , de donde resultarı́a que U
no serı́a L.I.
88 Capı́tulo 3. El espacio vectorial Rn

Ahora bien, ¿qué ocurre si a un conjunto U L.I. le agregamos un vector? Es claro


que si ese vector es C.L. de U entonces el nuevo conjunto (ampliado con ese vector)
ya no será L.I. Sin embargo, si el vector que agregamos no es C.L. de U , el conjunto
ampliado seguirá siendo L.I. Esta importante propiedad es demostrada en el próximo
teorema.
Teorema 3.4.3. Ampliación de un conjunto L.I.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto L.I. Si v ∈ Rn no es C.L. de U entonces
V = {u1 , u2 , . . . , ur , v} también es L.I.
Demostración. Para probar que V es L.I. podemos intentar probar que la única C.L. de
V que da o es la trivial. Supongamos entonces que

o = λ1 u1 + λ2 u2 + . . . + λr ur + βv (3.1)

Queremos demostrar que necesariamente λ1 = λ2 = . . . = λr = β = 0. Ahora bien,


¿qué ocurre si β no fuese 0? Si β 6= 0 entonces de 3.1 podrı́amos despejar el vector v
obteniendo:      
−λ1 −λ2 −λr
v= u1 + u2 + . . . + ur
β β β
Pero esto es absurdo, ya que por hipótesis v no es C.L. de U . Hemos llegado a probar que
β = 0. Como β = 0 la igualdad 3.1 queda:

o = λ1 u1 + λ2 u2 + . . . + λr ur

Esta es una C.L. de U que da como resultado o. Como por hipótesis U es L.I. sabemos que
la única C.L. de U que da o es la trivial, de donde se deduce que λ1 = λ2 = . . . = λr = 0.

El próximo resultado muestra que también se mantiene la independencia lineal de un


conjunto si cambiamos uno de sus vectores por una “adecuada” C.L. de todos los vectores
del conjunto.

Teorema 3.4.4. Modificación de un conjunto L.I.


Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto L.I. Si u′1 = α1 u1 + α2 u2 + . . . + αr ur con
α1 6= 0 entonces el conjunto V = {u′1 , u2 , . . . , ur } también es L.I. (El conjunto V coincide
con U en todos los vectores salvo en el primero de ellos en donde se ha sustituido u1 por
u′1 ).
Demostración. Vamos a probar que la única C.L. de V que da o es la trivial. Supongamos
entonces que
λ1 u′1 + λ2 u2 + . . . + λr ur = o (3.2)
Queremos demostrar que necesariamente λ1 = λ2 = . . . = λr = 0. En primer lugar
sustituimos en 3.2 la expresión u′1 = α1 u1 + α2 u2 + . . . + αr ur obteniendo:

λ1 (α1 u1 + α2 u2 + . . . + αr ur ) + λ2 u2 + . . . + λr ur = o

Ordenando resulta:

λ1 α1 u1 + (λ1 α2 + λ2 )u2 + . . . + (λ1 αr + λr )ur = o (3.3)


3.4. Dependencia e independencia lineal 89

Como por hipótesis U es L.I. todos los coeficientes de esta última C.L. deben valer 0:


 λ1 α1 = 0



 λ1 α2 + λ2 = 0


..


 .





λ1 αr + λr = 0

Como α1 6= 0, de la igualdad λ1 α1 = 0 resulta λ1 = 0. Luego, el resto de la igualdades


quedan:
λ2 = 0 , . . . . . . , λr = 0
y eso es lo que querı́amos demostrar. ♠

Ejemplo 3.4.4. Sea U = {u, v} ⊂ Rn un conjunto L.I. Vamos a probar de dos formas
diferentes que V = {2u − v, u + 3v} también es L.I.
(1) Para intentar probar que V es L.I. consideramos una C.L. de V igualada al vector
nulo:
λ1 (2u − v) + λ2 (u + 3v) = o
Tenemos que demostrar que necesariamente λ1 = λ2 = 0. Ordenando queda:

(2λ1 + λ2 )u + (−λ1 + 3λ2 )v = o

Como U = {u, v} es L.I. ambos coeficientes de la última C.L. deben ser nulos. Tenemos
entonces que: 2λ1 + λ2 = 0 y −λ1 + 3λ2 = 0. Resolviendo este sistema de dos ecuaciones
con dos incógnitas se obtiene λ1 = λ2 = 0 y eso prueba que V es L.I.
(2) Una manera alternativa de probar la afirmación consiste en utilizar (con cuidado) el
teorema anterior de “modificación”. Partimos de U = {u, v} L.I. En un primer paso modi-
ficamos el vector u por 2u−v. Como en esta C.L. el coeficiente de u (vector modificado) no
es 0, el teorema anterior nos permite asegurar que U ′ = {2u−v, v} es L.I.. Ahora volvemos
a aplicar el teorema, pero en este caso al conjunto U ′ . Ahora, en U ′ , vamos a modificar
el vector v por una C.L. de los dos vectores de U ′ . Como queremos llegar a u + 3v, en
lugar de v ponemos 12 (2u − v) + 72 v. De esta manera llegamos a que V = {2u − v, u + 3v}
también es L.I.

Ejercicio 3.4.1. En los siguientes casos investigue si el conjunto U es L.I. En el caso en


que no lo sea, exprese uno de sus vectores como combinación lineal de los restantes.
            
 1 0 0   −1 1 1 
(1) U =  2  ,  5  ,  0  (2) U =  1  ,  −1  ,  1 
   
3 6 7 1 1 −1
             
 1 1 2   1 1 1 
(3) U =  2  ,  1  ,  3  (4) U =  1  ,  2  ,  1 
   
3 1 4 1 1 3
90 Capı́tulo 3. El espacio vectorial Rn

  
        

 1 1 3 
 
 1 2 2 

   
0   2   2 −1   1   −1
(5) U =   ,   ,   (6) U =   0  ,  1  ,  1
    


 0   1   1 
 



   
1 1 3 1 0 1
     
     a −1 0 
a 8
(7) U = , (8) U =  a2  ,  a  ,  2a2 
2 a  
1 a a2 + 1
(En las dos últimas partes se deberá discutir según a ∈ R).
     

 1 2 1  
   0   −3 
1
Ejercicio 3.4.2. Se considera el conjunto U =   −1  ,  1  ,  5 .
    

 
 
−1 3 9
1. Pruebe que U es L.D.
2. Encuentre todos los subconjuntos de U que son L.I.
3. ¿Es cierto que para todo conjunto L.D. en R4 todos sus subconjuntos, con excepción
del propio conjunto y del vacı́o, son L.I.?
Ejercicio 3.4.3. Investigue si las siguientes afirmaciones son verdaderas o falsas.
1. Si U es un conjunto de R4 con cinco o más vectores entonces U es L.D.
2. Si U es un conjunto L.D. de R4 entonces contiene cinco o más vectores.
3. Sea U un subconjunto L.I. de Rn que contiene cinco vectores. Entonces n ≥ 5.
4. Sea U un subconjunto L.D. de Rn que contiene cuatro vectores. Entonces n ≥ 4.
Ejercicio 3.4.4. Sean U = {u1 , u2 , . . . , up } ⊂ Rn , A una matriz n × n y V el conjunto
definido por: V = {A.u1 , A.u2 , . . . , A.up }. Investigue si la siguientes afirmaciones son
verdaderas o falsas. (En caso de ser verdaderas demuestre y, en caso contrario, encuentre
un contraejemplo).
1. Si U es L.D. entonces V es L.D.
2. Si V es L.D. entonces U es L.D.
3. Si U es L.I. entonces V es L.I.
4. Si V es L.I. entonces U es L.I.
¿Cambian las respuestas si se supone que A es invertible?
Ejercicio 3.4.5. Sea U = {u, v, w} ⊂ Rn un conjunto L.I.
Demuestre que V = {u + v, u − v, u + v + w} también es L.I.
Ejercicio 3.4.6. Sea {u, v, w} ⊂ Rn un conjunto L.I. Indique si los siguientes conjuntos
son L.I. o L.D. justificando la respuesta.

A = {u, u + v} , B = {u, u + v, u + v + w} , C = {u, v + w, u + v + w}

Ejercicio 3.4.7. Se consideran u, w ∈ R3 . Analice, justificando, si son verdaderas o falsas


las siguientes afirmaciones:
1. Si V = {u, w} es L.I. entonces T = {2u, u + w} es L.I.
2. Si T = {2u, u + w} es L.I. entonces V = {u, w} es L.I.
Capı́tulo 4

Subespacios vectoriales de Rn

En los capı́tulos anteriores se trabajó con operaciones y propiedades de los elementos de


R2 , R3 y más en general de Rn , elementos a los que llamamos vectores. El espacio Rn
con las operaciones definidas con anterioridad, forma una estructura que recibe el nombre
de espacio vectorial real y es el estudio de ésta el centro de este capı́tulo. Ahora, la
estructura de espacio vectorial real no es propia de Rn , sino que abarca también a otros
conjuntos sobre los cuales se hará una breve mención.

4.1. Espacios vectoriales reales


Si bien nos enfocaremos en el estudio de Rn , comenzamos definiendo la estructura de
espacio vectorial real de una forma más general.

Definición 4.1.1. Espacio vectorial real.


Sea E un conjunto no vacı́o en el cual están definidas dos operaciones que llamaremos
suma y producto por un escalar1 respectivamente. Diremos que E es un espacio vectorial
real si estas operaciones cumplen las siguientes propiedades:
(S1) Asociativa: (u + v) + w = u + (v + w) , ∀ u, v, w ∈ E.
(S2) Conmutativa: u + v = v + u , ∀ u, v ∈ E.
(S3) Existencia de neutro: Existe o ∈ E tal que o + u = u , ∀ u ∈ E.
(S4) Existencia de opuesto: Para cada u ∈ E existe −u ∈ E tal que u + (−u) = o.
(P1) Asociativa: (λβ) u = λ (βu) , ∀ λ, β ∈ R, ∀ u ∈ E.
(P2) Existencia de neutro real: 1u = u , ∀ u ∈ E.
(P3) Distributiva respecto de la suma en R: (λ + β) u = λu + βu , ∀ λ, β ∈ R, ∀ u ∈ E.
(P4) Distributiva respecto de la suma en E: λ (u + v) = λu + λv , ∀ λ ∈ R, ∀u, v ∈ E.

Ejemplo 4.1.1. El espacio E = Rn , con las operaciones de suma de vectores y producto


de un escalar por un vector definidas con anterioridad, es un espacio vectorial real.
1
Recordemos que llamamos escalares a los números reales.
92 Capı́tulo 4. Subespacios vectoriales de Rn

Ejemplo 4.1.2. El conjunto E = Mm×n de todas las matrices de tamaño m × n, con-


siderando las operaciones usuales de suma de matrices y producto de un escalar por una
matriz, es un espacio vectorial real.
Ejemplo 4.1.3. Si I ⊂ R es un intervalo (puede ser de la forma [a, b] o incluso el propio
R) se representa con F(I) al conjunto de todas las funciones definidas en I a valores
reales. Este conjunto es un espacio vectorial real si definimos las operaciones de suma
de funciones y producto de un número por una función de manera habitual, esto es:
(f + g)(x) = f (x) + g(x) y (λf )(x) = λf (x) , ∀ x ∈ R, ∀ λ ∈ R.

Si E es un espacio vectorial real, existen subconjuntos de E que son en sı́ mismos espa-
cios vectoriales reales al considerar las mismas operaciones que las definidas en E. Estos
subconjuntos se llaman subespacios vectoriales de E.
Definición 4.1.2. Subespacio vectorial
Sean E un espacio vectorial real y S un subconjunto no vacı́o de E. Diremos que S es un
subespacio vectorial de E si se cumplen las siguientes condiciones
1. La suma de dos elementos cualesquiera de S es un elemento de S.

2. El producto de número real cualquiera por un elemento cualquiera de S es un ele-


mento de S.
Cuando esto sucede se dice que las operaciones son cerradas en S, pues al operar con
elementos de S (sumándolos o multiplicándolos por números) no nos salimos del subcon-
junto S. Es claro que las mismas propiedades que cumplı́an las operaciones en E también
se seguirán cumpliendo en S y, por lo tanto, S es en sı́ mismo un espacio vectorial real al
restringir a S las mismas operaciones que las definidas en E.
Observación 4.1.1. Dos subespacios vectoriales particulares.
Dado un espacio vectorial E, es inmediato verificar que los siguientes subconjuntos de E
son subespacios vectoriales de E:
el propio espacio E.
el conjunto formado por solamente el elemento nulo: {o}

Proposición 4.1.1. Sean E un espacio vectorial real y S un subespacio vectorial de E.


Entonces
1. o es un elemento de S.
2. si S 6= {o} entonces S tiene una cantidad infinita de elementos.
Demostración.
1. S es no vacı́o, por lo que existe al menos un elemento u en S. Como S es un
subespacio vectorial, el producto de cualquier número real por u es un elemento
de S, en particular 0u = o pertenece a S.
2. Si S es no vacı́o y S 6= {o} entonces existe en S un elemento u tal que u 6= o.
Luego λu ∈ S para todo λ ∈ R. Si λ1 6= λ2 entonces λ1 u 6= λ2 u (como el lec-
tor podrá verificar fácilmente). Se deduce que S contiene una cantidad infinita de
elementos.
4.1. Espacios vectoriales reales 93

Observación 4.1.2. Una definición alternativa de subespacio vectorial.


En la definición de subespacio vectorial se exige que el conjunto S sea no vacı́o. Además,
en la proposición 4.1.1 se demostró que si S es un subespacio de un espacio vectorial
E entonces necesariamente debe contener al elemento nulo. Resulta entonces que en la
definición de subespacio vectorial podrı́amos haber sustituido la condición de ser S no
vacı́o por la de o ∈ S.

Ejemplo 4.1.4. Ver ejemplo 4.2.1

Ejemplo 4.1.5. El conjunto S de todas las matrices diagonales2 de tamaño 2 × 2 es un


subespacio vectorial de M2×2 . En efecto, verifiquemos las condiciones de la definición de
subespacio:
 
0 0
1. La matriz nula o = es una matriz diagonal por lo que pertenece a S.
0 0
2. Si A y B son dos elementos de S, entonces
     
a11 0 b11 0 a11 + b11 0
A+B = + =
0 a22 0 b22 0 a22 + b22

es una matriz diagonal y por lo tanto pertenece a S.


3. Si A es un elemento de S, entonces
   
a11 0 λa11 0
λA = λ =
0 a22 0 λa22

que es un elemento de S cualquiera sea λ ∈ R.

Ejemplo 4.1.6. El conjunto C(I), de las funciones continuas en un intervalo I, es un


subespacio vectorial de F(I), conjunto de todas las funciones definidas en I a valores
reales. En efecto, sabemos que:
1. La función nula o es continua en I.
2. Si f y g son dos funciones continuas en I entonces f + g es continua en I.
3. Si f es una función continua en I y λ ∈ R entonces λf es continua en I.

Ejemplo 4.1.7. El conjunto D(I), de las funciones derivables en I, es un subespacio


vectorial de C(I) (y, por lo tanto, también de F(I)) pues sabemos que:
1. La función nula o es derivable en I.
2. Si f y g son dos funciones derivables en I entonces f + g es derivable en I.
3. Si f es una función derivable en I y λ ∈ R entonces λf es derivable en I.

Ejemplo 4.1.8. El conjunto P, de todos los polinomios es un subespacio vectorial del


conjunto de todas las funciones definidas en R a valores reales. En efecto:
1. La función nula pertenece a P.
2. Si f y g son dos polinomios entonces f + g también lo es.
3. Si f es un polinomio entonces λf también lo es, ∀λ ∈ R.
2
Una matriz A = ((aij )) n × n es diagonal si aij = 0 ∀i 6= j, i, j = 1, . . . , n.
94 Capı́tulo 4. Subespacios vectoriales de Rn

Ejemplo 4.1.9. El conjunto Pn , de los polinomios de grado menor o igual que n (incluido
el polinomio nulo), es un subespacio vectorial de P (y, por lo tanto, también de F(R)).
En efecto:
1. La función nula pertenece a Pn .
2. Si f y g son dos polinomios de grado menor o igual que n entonces f + g también lo
es.
3. Si f es un polinomio de grado menor o igual que n entonces λf también lo es, ∀λ ∈ R.

Una condición equivalente para que un conjunto sea un subespacio vectorial es la que se
enuncia a continuación.

Proposición 4.1.2. Sean E es un espacio vectorial real y S un subconjunto no vacı́o de E.


Entonces S es subespacio vectorial de E si, y solo si, αu+ βv ∈ S , ∀ α, β ∈ R, ∀ u, v ∈ S.

Demostración.

(=⇒) Sean u, v ∈ S y α, β ∈ R. Como S es subespacio se tiene que αu ∈ S y βv ∈ S.


Utilizando nuevamente el hecho de que S es subespacio la suma αu + βv es un
elemento de S.

(⇐=) Por hipótesis αu + βv es un elemento de S , ∀α, β ∈ R, ∀u, v ∈ S.


1. Tomando α = 1 y β = 1 resulta que 1 u + 1 v = u + v ∈ S , ∀u, v ∈ S.
2. Si β = 0 se tiene que αu + 0 v = αu + o = αu ∈ S , ∀α ∈ R, ∀u ∈ S.

Ejercicio 4.1.1. En cada uno de los siguientes casos investigue si la afirmación dada es
verdadera o falsa. En caso de ser verdadera deberá demostrarla y, en caso de ser falsa,
deberá encontrar un contraejemplo.
1. El conjunto S de todas las matrices n × n que tienen traza nula es un subespacio de
Mn×n .
2. El conjunto L∞ (I) = { f : I → R / f está acotada en I } es un subespacio de F(I).
3. El conjunto C([a, b]) es un subespacio de L∞ ([a, b]).
4. El conjunto C(R) es un subespacio de L∞ (R).
5. El conjunto S de todos los polinomios que se anulan en x = 1 y en x = 3 es un
subespacio de P.
6. El conjunto S de todos los polinomios de grado 2 es un subespacio de P.
Rb
7. El conjunto S = { f ∈C([a,b])/ a f = 0} es un subespacio de C([a, b]).

Ejercicio
T 4.1.2. Sean E un espacio vectorial y S1 , S2 subespacios de E. Demuestre que
S1 S2 también es un subespacio de E.
4.2. Subespacios vectoriales de Rn 95

4.2. Subespacios vectoriales de Rn


Si bien puede desarrollarse la teorı́a de subespacios de espacios vectoriales reales en general,
nos centramos en los subespacios del espacio vectorial Rn . Es ası́ que, en lo que sigue,
cada vez que hagamos referencia a un espacio vectorial real se entenderá Rn . Redefinamos
entonces el concepto de subespacio para el este caso particular.
Definición 4.2.1. Subespacios de Rn .
Diremos que un subconjunto S de Rn es un subespacio de Rn si verifica:
1. o ∈ S.

2. Cualesquiera sean u, v ∈ S se cumple que u + v ∈ S.

3. Cualquiera sea u ∈ S y cualquiera sea el número λ ∈ R se cumple que λ u ∈ S.


Lo que exige esta definición es que al operar con vectores de S (sumándolos o multi-
plicándolos por números) obtengamos como resultado nuevos vectores de S (es decir que
no nos salgamos de S), esto es, las operaciones son cerradas en S.
Observación 4.2.1. Dos subespacios particulares.
Es inmediato verificar que Rn y {o} son subespacios vectoriales de Rn .
  
x 2
Ejemplo 4.2.1. Probaremos que S = ∈ R : −x + y = 0 es un subespacio de
y
R2 .  
x
En primer lugar observemos que los elementos de S son aquellos vectores ∈ R2 que
y
satisfacen la condición −x + y = 0, es decir, S está formado por los vectores de R2 que
tienen ambas componentes iguales, por lo que puede escribirse
     
x 2 x 2
S= ∈ R : −x + y = 0 = ∈R :x∈R
y x

Analizamos entonces el cumplimiento de las condiciones planteadas en la definición 4.2.1:


 
0
1. o = ∈ S ya que las componentes del vector nulo son iguales.
0
       
x1 x2 x1 x2
2. Si u = yv= pertenecen a S entonces u = yv= .
y1 y2 x1 x2
Luego el vector suma
     
x1 x2 x1 + x2
u+v = + =
x1 x2 x1 + x2

verifica la condición de pertenencia a S.


   
x x
3. Si u = es un vector de S, entonces u = .
y x
   
x λx
Entonces el vector λu = λ = pertenece a S, ∀ λ ∈ R.
x λx
96 Capı́tulo 4. Subespacios vectoriales de Rn

Por lo tanto S es un subespacio de R2 , que representa además a la recta


  de ecuación y = x,
1
esto es, a la recta que pasa por el origen o y es paralela al vector .
1

  
x
Ejemplo 4.2.2. T = ∈ R2 : −x + y = 1 no es un subespacio de R2 , pues T no
y
contiene al vector nulo o.
  
x
Ejemplo 4.2.3. R = ∈ R : x ≥ 0 no es subespacio de R2 pues, por ejemplo,
2
y
     
4 4 −12
si bien es un elemento de R, el vector −3 = no lo es.
−2 −2 6

  
x
Ejemplo 4.2.4. W = :y= ∈ R2 x2
no es un subespacio de R2 .
y
   
1 2
Basta considerar los vectores u = y en W y observar que el vector suma
1 4
     
1 2 3
u+v = + = es tal que 5 6= 32 por lo que no satisface la condición
1 4 5
de pertenencia al conjunto W .

S T

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
R W
x
x
x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxx

Figura 4.1: S es un subespacio de R2 , T , R y W no son subespacios de R2 .

  
 x 
Ejemplo 4.2.5. S =  y  ∈ R3 : x + 2y − z = 0 es un subespacio de R3 .
 
z
Comenzamos como en el ejemplo 4.2.1, observando que los elementos de S son aquellos
4.2. Subespacios vectoriales de Rn 97

 
x
vectores  y  ∈ R3 que satisfacen la condición x + 2y − z = 0, es decir
z
     
 x   x 
S =  y  ∈ R3 : x + 2y − z = 0 =  y  ∈ R3 : x, y ∈ R
   
z x + 2y
 
0
1. Resulta inmediato verificar que o =  0  ∈ S.
0
   
x1 x2
2. Si u =  y1  yv=  y2  son dos vectores en S, el vector suma
z1 z2
     
x1 x2 x1 + x2
u+v = y1 + y2 = y 1 + x2 
x1 + 2y1 x2 + 2y2 (x1 + x2 ) + 2(y1 + y2 )

verifica la condición de pertenencia a S.


 
x
3. Si u =  y  es un vector de S, entonces
z
   
x λx
λu = λ  y = λy 
x + 2y λ(x + 2y)

pertenece a S para todo λ ∈ R.

Probamos entonces que S es un subespacio R3 . Observemos además que el subespacio S


es el plano que pasa por el origen o y tiene a x + 2y − z = 0 como ecuación reducida.

Observación 4.2.2. En el ejemplo 4.2.1 se probó que la recta de ecuación y = x es un


subespacio de R2 , mientras que en el ejemplo 4.2.5 se demostró que el plano de ecuación
x + 2y − z = 0 es un subespacio de R3 . Ahora, estos resultados no son peculiaridades de
estos ejemplos sino que, se puede demostrar, que toda recta en R2 que pasa por el origen
es un subespacio de R2 , y que toda recta y todo plano en R3 que pasen por el origen son
subespacios de R3 (ejercicio 4.2.5). Es muy fácil visualizar estos resultados . Por ejemplo,
veamos que un plano Π en R3 que pasa por el origen es un subespacio de R3 :

1. o ∈ Π pues Π pasa por el origen o.

2. Si u y v son dos vectores en Π entonces u + v ∈ Π ya que u + v es la diagonal del


paralelogramo cuyos lados conforman u y v.

3. Si u es un vector en Π entonces λu ∈ Π para cualquier escalar λ pues λu está en


una recta que contiene a u.
98 Capı́tulo 4. Subespacios vectoriales de Rn

z
Π
u+v
v
λu
u
o
y

Con argumentos totalmente análogos se muestra que las rectas que pasan por el origen en
R2 y R3 son subespacios vectoriales de R2 y R3 respectivamente.
Es más, puede probarse que en realidad éstos, junto con todo el espacio y el conjunto
formado solo por el vector nulo, son los únicos subespacios de R2 y R3 respectivamente.

Definición 4.2.2. Núcleo de una matriz.


Sea A una matriz m × n. El núcleo de A es, por definición, el conjunto:

N (A) = { x ∈ Rn / Ax = o }

Observemos que el núcleo de A coincide con el conjunto solución del sistema lineal ho-
mogéneo Ax = o.

Proposición 4.2.1. El núcleo de una matriz es un subespacio.


Si A es una matriz m × n entonces N (A) es un subespacio de Rn .

Demostración.
En la demostración que sigue indicamos con om y on a los vectores nulos de Rm y Rn
respectivamente. Se tiene:

1. on pertenece a N (A) pues Aon = om .

2. Si u y v son vectores en N (A), el vector suma u + v satisface

A(u + v) = Au + Av = om + om = om

de donde resulta que u + v pertenece a N (A).

3. Si u es un vector de N (A), el vector λu pertenece a N (A) pues

A(λu) = λ(Au) = λom = om

El siguiente teorema indica que, si consideramos el conjunto formado por todas las com-
binaciones lineales de un cierto subconjunto U = {u1 , u2 , . . . , ur } de Rn , se obtiene un
subespacio que recibe el nombre de subespacio generado por U .
4.2. Subespacios vectoriales de Rn 99

Teorema 4.2.1. Subespacio de las combinaciones lineales.


Sean U = {u1 , u2 , . . . , ur } ⊂ Rn y S = { x ∈ Rn / x es combinación lineal de U }.
Entonces S es un subespacio vectorial de Rn .

Demostración.

1. o pertenece a S ya que o es combinación lineal de cualquier conjunto, basta escribir


o = 0u1 + 0u2 + . . . + 0un .

2. Si v y w son dos elementos de S entonces existen α1 , α2 , . . . , αr y β1 , β2 , . . . , βr en R


tales que v = α1 u1 +α2 u2 +. . . +αr ur y w = β1 u1 +β2 u2 +. . . +βr ur . Luego el vector
suma v+w puede ser escrito como v+w = (α1 +β1 )u1 +(α2 +β2 )u2 +. . .+(αr +βr )ur
por lo que resulta ser combinación lineal de U y, por lo tanto, un elemento de S.

3. Si v ∈ S existen α1 , α2 , . . . , αr ∈ R tales que v = α1 u1 + α2 u2 + . . . + αr ur . Luego


λv = (λα1 )u1 + (λα2 )u2 + . . . + (λαr )ur por lo que λv pertenece a S. ♠

Definición 4.2.3. Subespacio generado por un conjunto.


Si U = {u1 , u2 , . . . , ur } ⊂ Rn entonces el conjunto S = { x ∈ Rn / x es C.L. de U } (que
es subespacio por el teorema anterior), recibe el nombre de subespacio generado por U
y lo denotamos como S = L(U ).

Observación 4.2.3. Hasta ahora, cuando querı́amos demostrar que un conjunto S era un
subespacio de Rn , necesariamente debı́amos verificar el cumplimiento de las condiciones
1. o ∈ S
2. u + v ∈ S , ∀u, v ∈ S
3. λu ∈ S , ∀λ ∈ R, ∀u ∈ S
Ahora bien, el teorema anterior nos permite un camino alternativo (y en muchos casos más
económico). En efecto, para probar que un conjunto S es un subespacio de Rn , podemos
intentar encontrar un conjunto U de modo que S = L(U ). Si lo logramos, el problema
quedará resuelto, pues ya sabemos que L(U ) es un subespacio
  de Rn . 

 x 

  
y 4
 ∈ R /x + z = 0, y + t = 0
Supongamos, por ejemplo, que se quiere probar que S =   z 

 

 
t
es un subespacio de R4 . Basta observar que todos los vectores de S son de la forma
    
x 1 0
 y   0
+y 1 
  
 −x  = x  −1
  
  0 
−y 0 −1
   

 1 0 
   1 
0
esto es, todos los vectores de S son combinación lineal de U =  , 


 −1   0 

 
0 −1
Entonces S = L(U ) por lo que S es un subespacio de R .4
100 Capı́tulo 4. Subespacios vectoriales de Rn

     
 1 2 4 
Ejemplo 4.2.6. Si U =  2  ,  1  ,  5  , veamos cómo encontrar el subes-
 
0 5 5
pacio L(U ). Para ello buscamos qué condición o condiciones debe cumplir un vector de R3
para pertenecer a L(U ):
         
x 1 2 4 x
 y  ∈ L(U ) ⇔ ∃ α1 , α2 , α3 ∈ R : α1  2  + α2  1  + α3  5  =  y 
z 0 5 5 z
    
1 2 4 α1 x
⇔ el sistema  2 1 5   α2  =  y  es compatible.
0 5 5 α3 z
     
1 2 4 x 1 2 4 x 1 2 4 x
 2 1 5 y  ∼  0 −3 −3 −2x + y  ∼  0 −3 −3 −2x + y 
0 5 5 z 0 5 5 z 0 0 0 −10x + 5y + 3z
Luego el sistema es compatible ⇔ −10x + 5y + 3z = 0 por lo que
  
 x 
L(U ) =  y  ∈ R3 / − 10x + 5y + 3z = 0
 
z

Otra forma de hallar el subespacio L(U ) consiste en observar que


     
4 1 2
 5  = 2 2  + 2 1 
5 0 5
     
4  1 2 
por lo que  5  es C.L. de  2  ,  1  (el conjunto U es L.D.). Ası́, este vector
 
5 0 5
pertenece al plano determinado por los otros  dos.Calculando
  la ecuación del plano que pasa
1 2  x = α1 + 2α2
por el origen o y es paralelo a los vectores  2  y  1  se obtiene y = 2α1 + α2

0 5 z = 5α2
como ecuaciones paramétricas y −10x + 5y + 3z = 0 como reducida, entonces
  
 x 
L(U ) =  y  ∈ R3 / − 10x + 5y + 3z = 0
 
z

Ejercicio 4.2.1. Determine cuáles de los siguientes conjuntos son subespacios de R2 e


interprete geométricamente el resultado:
     
x 2 x 2
(1) S = ∈ R : −3x + y = 0 , (2) S = ∈ R : 2x = 0
y y
     
x 2 x 2
(3) S = ∈ R : x − 2y = 3 , (4) S = ∈ R : x ≥ 0, y ≥ 0
y y
4.2. Subespacios vectoriales de Rn 101

   [   
x x
(5) S = ∈ R2 : x ≥ 0, y ≥ 0 ∈ R2 : x ≤ 0, y ≤ 0
y y

Ejercicio 4.2.2. Determine cuáles de los siguientes conjuntos son subespacios de R3 e


interprete geométricamente el resultado:
     
 x   x 
(1) S =  y  ∈ R3 : y = x + z , (2) S =  y  ∈ R3 : y = 0, z = 0
   
z z
     
 x   x 
(3) S =  y  ∈ R3 : z = 0 , (4) S =  y  ∈ R3 : x − y + z − 1 = 0
   
z z
     
 x   x 
(5) S =  y  ∈ R3 : x2 + y 2 − z = 0 , (6) S =  y  ∈ R3 : x2 + y 2 + z 2 = 0
   
z z
Ejercicio 4.2.3. Halle el núcleo de las siguientes matrices:
   
  −3 1 1 1 1 −1 0
2 1 4
A= B =  1 −1 1  C =  −1 2 −5 −3 
−1 1 1
0 2 −4 5 3 −1 2

Ejercicio 4.2.4. Sea S un subconjunto no vacı́o de Rn . Pruebe que S es subespacio si, y


solo si, αu + βv ∈ S , ∀ α, β ∈ R, ∀ u, v ∈ S.

Ejercicio 4.2.5. Demuestre:


  
x
1. S = ∈ R : ax + by = 0 es un subespacio de R2 cualesquiera sean a, b ∈ R.
2
y
  
 x 
2. S =  y  ∈ R3 : ax + by + cz = 0 es un subespacio de R3 cualesquiera sean
 
z
a, b, c ∈ R.
  
 x 
3. S =  y  ∈ R3 : ax + by + cz = 0, dx + ey + f z = 0 es un subespacio de R3
 
z
cualesquiera sean a, b, c, d, e, f ∈ R.

Observación: En este ejercicio se demuestra que toda recta en R2 que pasa por el origen
es un subespacio de R2 , y que todo plano y toda recta en R3 que pasan por el origen son
subespacios de R3 .

Ejercicio 4.2.6. Se consideran los conjuntos:


     
 x   x 
S =  y  ∈ R3 : −x + y = 0 y T =  y  ∈ R3 : x + y − z = 0
   
z z
102 Capı́tulo 4. Subespacios vectoriales de Rn

1. Demuestre que S y T son dos subespacios de R3 .


(Sugerencia: utilice el ejercicio 4.2.5).
2. Calcule S ∩ T y determine si S ∩ T es también un subespacio R3 .
3. Calcule S ∪ T y determine si S ∪ T es también un subespacio R3 .
Ejercicio 4.2.7. Sean A y B dos matrices de dimensiones m × n y n × p respectivamente.
1. Pruebe que N (B) ⊂ N (A.B).
2. Encuentre un ejemplo de dos matrices A y B para las cuales N (B) = N (A.B).
3. Encuentre un ejemplo de dos matrices A y B para las cuales N (B) está incluido
estrictamente en N (A.B).
Ejercicio 4.2.8. Sean M y N dos matrices m × n y consideremos el conjunto
S = { x ∈ Rn / M.x = N.x }
1. Pruebe que S es un subespacio de Rn .
2. Si M = N ¿qué se puede decir de S?
3. Averigue si las siguientes afirmaciones son verdaderas o falsas justificando la res-
puesta:
(i) Si M 6= N entonces necesariamente S = {o}.
(ii) Si M 6= N entonces necesariamente S 6= Rn .
Ejercicio 4.2.9. En cada uno de los siguientes casos encuentre las condición (o con-
diciones) que deben verificar las componentes de un vector para que éste pertenezca al
subespacio generado por el conjunto U :
         
2 1 1 −3 1
(1) U = , (2) U = , (3) U =
3 5 0 0 −1
      
       1 0 0 
1 −2 3
(4) U = , , (5) U =  1  , 1
  , 0 

2 4 3  
0 1 1
           
 −1 1   4 −1 1 0 
(6) U =  1  ,  2  (7) U =  −2  ,  1  ,  2  ,  0 
   
1 3 1 1 0 1
       
       1 1 1 0 
 1 2 2  
        
0   1   0   1 
(8) U =  1  ,  2  ,  2  (9) U =  , ,
 0   1   1   0 ,
  
1 2 1 
 

0 1 0 1

4.3. Generador de un subespacio vectorial de Rn


Definición 4.3.1. Generador de un subespacio vectorial de Rn .
Sean S un subespacio de Rn y U = {u1 , u2 , . . . , ur } ⊂ S un conjunto de vectores de S.
Diremos que U es generador de S si todos los elementos de S pueden ser escritos como
combinación lineal de U .
Es decir, U es generador de S si, y solo si, para cada v ∈ S existen escalares α1 , α2 , . . . , αr
tales que v = α1 u1 + α2 u2 + . . . + αr ur .
4.3. Generador de un subespacio vectorial de Rn 103

g
Notación: Si U es generador de S indicamos U → S.

Observación 4.3.1. W es generador de L(W ).


g
Si W ⊂ Rn y L(W ) es el subespacio generado por W , entonces es claro que W → L(W ).

   
1 −1
Ejemplo 4.3.1. U = , es generador de R2 .
2 1
Veamos 2
  que todo vector de R puede expresarse como combinación   lineal  del conjunto
  U.
x 1 −1 x
es C.L. de U ⇔ existen α1 y α2 en R tales que α1 + α2 =
y 2 1 y

α1 − α2 = x
⇔ el sistema de ecuaciones es compatible. Al escalerizar el sistema
2α1 + α2 = y
   
1 −1 x 1 −1 x
se obtiene ∼ de donde resulta que el sistema es
2 1 y 0 3 −2x + y
 
x g
compatible (determinado) para todos los vectores ∈ R2 , entonces U → R2 .
y
x+y −2x + y
Además la solución del sistema es α1 = , α2 = por lo que
3 3
     
x x+y 1 −2x + y −1
= +
y 3 2 3 1
  
 x 
Ejemplo 4.3.2. S =  y  ∈ R3 : x + 2y − z = 0 es un subespacio vectorial de R3
 
z
(ejemplo 4.2.5).

1. ¿Cómo encontramos un generador  de S?     


x 1 0
Los vectores de S se escriben como  y  = x 0 +y
   1  con x, y ∈ R,
x + 2y 1 2
   
 1 0 
g
por lo que resultan C.L. de U =  0  ,  1  , luego U → S.
 
1 2
     
 1 0 3 
2. ¿Es el conjunto V =  0  ,  1  ,  −1  generador de S?
 
1 2 1
En primer lugar observemos que los dos primeros vectores son los vectores de U
mientras que el tercer vector efectivamente es un vector de S. Es ası́ que U ⊂ V ⊂ S.
Esta observación nos permite responder afirmativamente la pregunta. En efecto,
como U ⊂ V , todo vector que sea C.L. de U también será C.L. de V . Por otra parte,
g
como U → S, todo vector de S es C.L. de U y, por lo tanto, también lo será de V .
   
 1 1 
3. ¿Es el conjunto W =  1  ,  −1  generador de S?
 
3 −1
104 Capı́tulo 4. Subespacios vectoriales de Rn

En primer lugar observamos que W ⊂ S pues ambos vectores pertenecen al subes-


pacio 
 por verificar la condición x + 2y − z = 0.    
x 1 1
 y  es C.L. de W ⇔ existen α1 y α2 en R tales que α1  1  + α2  −1  =
z 3 −1
  
x  α1 + α2 = x
 y  ⇔ el sistema de ecuaciones α1 − α2 = y es compatible.

z 3α1 − α2 = z
   
1 1 x 1 1 x
Escalerizamos y obtenemos  1 −1 y  ∼  0 2 x − y  de donde el
3 −1 z 0 0 x + 2y − z
sistema es compatible (determinado) si, y solo si x + 2y − z = 0, luego el conjunto
de vectores que pueden expresarse como combinación lineal de W coincide con S.
g
Entonces W → S.
    
 1 2 
4. ¿Es el conjunto G =  1  , 2  generador de S?

 
3 6
 
1
G no es generador de S pues, por ejemplo, el vector  −1  pertenece a S pe-
−1
ro
 no puede expresarse como combinación lineal de W debido a que el sistema
 α1 + 2α2 =1
α1 + 2α2 = −1 resulta incompatible como se ve a partir de la escalerización

3α1 + 6α2 = −1
del sistema:
   
1 2 1 1 2 1
 1 2 −1  ∼  0 0 2 
3 6 −1 0 0 −4

Resumiendo
             
 1 0   1 0 3   1 1 
U =  0  ,  1  , V =  0  ,  1  ,  −1  , W =  1  ,  −1 
     
1 2 1 2 1 3 −1
    
 1 2 
son conjuntos generadores de S mientras que G =  1  ,  2  no genera S.
 
3 6

Observación 4.3.2. Un subespacio no está generado de manera única.


En el ejemplo 4.3.2 se demuestra que los conjuntos U, V y W son generadores de S de
donde se deduce que un subespacio no está generado de manera única.

Observación 4.3.3. Generador y sistemas de ecuaciones.


Sean S un subespacio de Rn y U = {u1 , u2 , . . . , ur } un subconjunto de S. De los ejemplos
4.3. Generador de un subespacio vectorial de Rn 105

anteriores se desprende que U es generador de S si, y solo si, para cualquier v ∈ S el sistema
 
λ1
 λ2 
 
MU  .  = v es compatible.
 .. 
λr
Ejemplo 4.3.3. El conjunto canónico.
El conjunto canónico C = {e1 , e2 , . . . , en } es generador de Rn pues (como habı́amos visto
en la observación 3.3.4) todo vector de Rn se puede escribir como C.L. de C.
Teorema 4.3.1. Dependencia lineal de conjuntos generadores.
Sean S un subespacio vectorial de Rn y U = {u1 , u2 , . . . , ur }, r ≥ 2, un generador de S.
Entonces
1. si U es L.D. existe por lo menos un conjunto W ⊂ U, W 6= U , tal que W es
generador de S.
2. si U es L.I. no existe W ⊂ U, W 6= U , tal que W es generador de S.
Demostración.
1. Por hipótesis U es L.D. por lo que al menos un vector de U es combinación lineal de
los restantes vectores de U . Supongamos, sin perder generalidad, que u1 es combina-
ción lineal de {u2 , . . . , ur }. Podemos afirmar entonces existen α2 , . . . , αr ∈ R tales
que
u1 = α2 u2 + . . . + αr ur
g
Sea v ∈ S un vector cualquiera de S. Como U → S, v se puede escribir como C.L.
de U , esto es, existen β1 , β2 , . . . , βr ∈ R tales que

v = β1 u1 + β2 u2 + . . . + βr ur

Luego

v = β1 (α2 u2 + . . . + αr ur )+ β2 u2 + . . . + βr ur = (β1 α2 + β2 ) u2 + . . .+ (β1 αr + βr ) ur

de donde resulta que cualquier vector v de S es combinación lineal de W = {u2 , . . . , ur }.


g
Hemos encontrado entonces un subconjunto W ⊂ U, W 6= U , tal que W → S.
2. Si W ⊂ U pero W 6= U es porque existe algún vector uj de U que no pertenece a W .
Ahora, como U es L.I. resulta que uj no es combinación lineal de W . Esto implica
que uj , que es un elemento de S, no pertenece al subespacio generado por W y, por
lo tanto, W no es generador de S. Conclusión: no existe W ⊂ U, W 6= U , tal que W
es generador de S. ♠
Observación 4.3.4. Reducción de un generador.
De la demostración de la primera parte del teorema anterior surge que si U = {u1 , u2 , . . . , ur }
es un generador del subespacio S y uk ∈ U es C.L. de los restantes vectores de U entonces,
al “quitar” dicho vector, el nuevo conjunto U − {uk } continúa siendo generador de S.
También se concluye que si un generador de un subespacio S de Rn es L.D. entonces
podemos “achicar” ese generador para obtener otro generador de S que sea además L.I.
106 Capı́tulo 4. Subespacios vectoriales de Rn

Como forma de ilustrar este resultado volvamos el ejemplo 4.3.2 donde vimos que
     
 1 0 3 
g
V =  0  ,  1  ,  −1  → S
 
1 2 1
     
3 1 0
Ahora V es L.D. ya que claramente  −1  = 3  0  −  1 . Si quitamos el tercer
1 1 2
vector del conjunto V obtenemos U que se probó es generador de S. Como U está formado
por dos vectores no colineales, es además L.I. Luego éste no puede ser reducido de forma
de obtener otro conjunto generador de S.

Proposición 4.3.1. Modificación de un generador.


Sean S un subespacio vectorial de Rn y U = {u1 , u2 , . . . , ur } un generador de S.
Si u′1 = α1 u1 + α2 u2 + . . . + αr ur y α1 6= 0 entonces el conjunto V = {u′1 , u2 , . . . , ur }
también es generador de S.

Lo que afirma la proposición es que si uno de los vectores de un generador U es suplantado


por una C.L. de U , en la cual el vector sustituido no está multiplicado por 0, entonces
obtenemos un nuevo generador del mismo subespacio.
Demostración.
En primer lugar observemos que, como u′1 es C.L. de U , entonces u′1 ∈ S.
g
Ahora bien, para demostrar que V → S debemos probar que todo vector de S se puede
g
escribir como C.L. de V . Sea entonces v ∈ S. Como U → S, v se puede escribir como C.L.
de U :
∃ β1 , β2 , . . . , βr ∈ R / v = β1 u1 + β2 u2 + . . . + βr ur (1)
Por hipótsis sabemos que u′1 = α1 u1 + α2 u2 + . . . + αr ur . Como α1 6= 0, de la igualdad
anterior podemos despejar u1 obteniendo:
1 
u1 = u′1 − α2 u2 − . . . − αr ur (2)
α1
Sustituyendo (2) en (1) resulta:
 
1 ′

v = β1 u − α2 u2 − . . . − αr ur + β2 u2 + . . . + βr ur
α1 1
Agrupando convenientemente obtenemos que v se pudo expresar como C.L. de V y eso es
lo que querı́amos demostrar. ♠.
     
 1 0 0 
g
Ejemplo 4.3.4. Sabemos que C = {e1 , e2 , e3 } =  0  ,  1  ,  0  → R3
 
0 0 1
Si cambiamos
el primer
 vector
 e1  1− 2e2 + 7e3 , la proposición anterior nos permite
por 5e
 5 0 0 
afirmar que  −2  ,  1  ,  0  también es un generador de R3 .
 
7 0 1
4.3. Generador de un subespacio vectorial de Rn 107

El próximo resultado es fundamental en el desarrollo de esta teorı́a y su demostración se


puede encontrar en el apéndice de este capı́tulo. Recordemos que la cantidad de elementos
de un conjunto finito U se denomina cardinal de U y se simboliza #U .

Teorema 4.3.2. Teorema de Steinitz.


Sean S un subespacio de Rn , U y W dos subconjuntos de S tales que U es L.I. y W es un
generador de S. Entonces

#U ≤ #W

Observación 4.3.5. Cardinal de generadores y conjuntos L.I. en Rn .


El conjunto canónico C = {e1 , e2 , . . . , en } es generador de Rn y también L.I. Como #C = n
del teorema de Steinitz se deduce que cualquier conjunto generador de Rn tiene al menos
n vectores, y que cualquier conjunto L.I. tiene a lo sumo n vectores.
      
 1 1 1 
Ejercicio 4.3.1. Sea U =  1  ,  2  ,  1 
 
1 1 3
1. Demuestre que U es un generador de R3 .
2. Modifique uno de los vectores de U de modo de obtener un nuevo generador de R3 .
3. Pruebe que U es L.I. ¿Es posible reducir U de manera de obtener otro generador de
R3 ?
  
 x 
Ejercicio 4.3.2. Si S =  y  ∈ R3 : −x + y + z = 0 , halle dos conjuntos U y V
 
z
diferentes pero que ambos sean generadores de S.

Ejercicio 4.3.3. Determine un generador de aquellos conjuntos que resultaron ser subes-
pacios en los ejercicios 4.2.1, 4.2.2 y 4.2.3.

Ejercicio 4.3.4. Si U = {u1 , u2 } es un generador de R2 determine si los siguientes con-


juntos son generadores de R2 :

(1) {u1 , u2 , o} , (2) {u1 , u2 , u1 − u2 } , (3) {u1 } , (4) {u1 , u1 + u2 }

Ejercicio 4.3.5. Investigue si las siguientes afirmaciones son verdaderas o falsas justifi-
cando la respuesta.
g
1. Si U → R3 entonces U tiene tres o más vectores.
g
2. Si U es un subconjunto de R3 con tres o más vectores entonces U → R3 .
3. Si U es un conjunto L.D. en R4 entonces U tiene cinco o más vectores.
4. Si U es un conjunto en R4 con cinco o más vectores entonces U es L.D.
5. Si U = {u1 , u2 , u3 } ⊂ R5 entonces existe algún vector de R5 que no es C.L. de U .
108 Capı́tulo 4. Subespacios vectoriales de Rn

4.4. Base y dimensión de un subespacio vectorial de Rn


Si nos preguntan cuál es la dimensión de una recta seguramente responderemos que es
1, de igual forma que imaginamos un plano como un espacio de dimensión 2 y el espacio
R3 tridimensional. En esta sección definiremos el concepto de dimensión de un subespacio
vectorial cualquiera de Rn . Para ello será fundamental el papel que juegan los generadores
que, al mismo tiempo, son conjuntos L.I.

Definición 4.4.1. Base de un subespacio vectorial de Rn .


Sean S un subespacio de Rn y U un subconjunto de S. Diremos que U es una base de S
si es L.I. y generador de S.

b
Notación: Si U es base de un subespacio S escribiremos U → S.

Ejemplo 4.4.1. Base canónica de Rn .


El conjunto C = {e1 , e2 , . . . , en } es L.I. y además generador de Rn por lo que es base de
Rn y recibe el nombre de base canónica de Rn .

Ejemplo 4.4.2. En el ejemplo 4.3.2 el conjunto U es generador de S y es además L.I. por


lo que resulta una base de S. Razonando en forma análoga se concluye que W es también
una base de S, pero V no lo es pues si bien genera S es L.D.

En el ejemplo se muestra que para el subespacio S existen al menos dos conjuntos que
son base de S, ahora podrı́amos preguntarnos ¿todo subespacio S de Rn tiene base? La
respuesta a esta interrogante nos la da el teorema que planteamos a continuación.

Teorema 4.4.1. Existencia de bases de un subespacio.


Si S es un subespacio vectorial de Rn tal que S 6= {o}, entonces existe U base de S.

Demostración.
Como S 6= {o} existe u1 ∈ S tal que u1 6= o y, por lo tanto, el conjunto {u1 } resulta L.I.
Por otra parte, como S es un subespacio de Rn , se tiene que λu1 ∈ S cualquiera sea λ ∈ R,
es decir cualquier combinación lineal de {u1 } pertenece a S, con lo cual L({u1 }) ⊆ S.
g b
Si fuese S = L({u1 }) tendrı́amos que {u1 } → S y es además L.I. entonces {u1 } → S.
Si por el contrario L({u1 }) ⊂ S, L({u1 }) 6= S, existe u2 ∈ S tal que u2 no pertenece a
L({u1 }). Esto implica que u2 no es combinación lineal de {u1 }, o lo que es lo mismo, el
conjunto {u1 , u2 } es L.I. Como antes, debido a que S es un subespacio de Rn , todas las
combinaciones lineales de {u1 , u2 } están en S, esto es L({u1 , u2 }) ⊆ S.
g
Entonces, si L({u1 , u2 }) = S se tiene que {u1 , u2 } → S y además es L.I. por lo que
b
{u1 , u2 } → S, en caso contrario se repite el procedimiento anterior, es decir existe u3 ∈ S
tal que u3 no pertenece a L({u1 , u2 }), etc.
Este proceso finaliza en a los sumo n pasos pues un subconjunto L.I. de Rn tiene como
mucho n vectores. ♠

Proposición 4.4.1. Igualdad en el cardinal de las bases de un subespacio.


Si S es un subespacio vectorial de Rn , U y V son ambas bases de S entonces #U = #V .
4.4. Base y dimensión de un subespacio vectorial de Rn 109

Demostración.

g
)
b
V →S =⇒ V → S
b =⇒ #U ≤ #V (por teorema 4.3.2).
U →S =⇒ U es L.I.
Por otro lado, también es cierto que
)
b
V →S =⇒ V es L.I.
b g =⇒ #V ≤ #U (por teorema 4.3.2).
U →S =⇒ U → S

Se deduce entonces que #U = #V . ♠

Definición 4.4.2. Dimensión de un subespacio vectorial de Rn .


Sea S un subespacio vectorial de Rn .
Si S 6= {o}, llamamos dimensión de S al número de vectores de una base de S.
Si S = {o}, decimos que la dimensión de S es 0.

Notación: Denotamos la dimensión de un subespacio S como dim(S).

Ejemplo 4.4.3. Habı́amos visto que el conjunto canónico es una base de Rn y el cardinal
de este conjunto es n, luego dim(Rn ) = n.

Observación 4.4.1. Sobre la dimensión de un subespacio.


Si S es un subespacio vectorial de Rn entonces, como {o} ⊆ S ⊆ Rn , podemos afirmar
que
0 ≤ dim(S) ≤ n
  
 x 
Ejemplo 4.4.4. La dimensión de S =  y  ∈ R3 : x + 2y − z = 0 es dos.
 
z
   
 1 0 
En el ejemplo 4.3.2 probamos que el conjunto U =  0  ,  1  es base del subes-
 
1 2
pacio S. Como U tiene dos vectores se tiene que dim(S) = 2, lo cual concuerda con la
idea intuitiva de que un plano, que es lo que representa el conjunto S, es un espacio
bidimensional.

Proposición 4.4.2. Si se conoce la dimensión de un subespacio.


Si S es un subespacio vectorial de Rn de dimensión r y V es un subconjunto de S con r
vectores, entonces
b
1. Si V es LI =⇒ V → S.
g b
2. Si V → S =⇒ V → S.
En particular si V es un subconjunto de Rn tal que #V = n entonces son equivalentes:
b
V →S
V es L.I.
g
V →S
110 Capı́tulo 4. Subespacios vectoriales de Rn

Demostración.
Observemos en primer lugar que, como dim(S) = r, el teorema de Steinitz nos permite
afirmar que todos los subconjuntos L.I. de S tienen a lo sumo r vectores, mientras que
todos los generadores de S tienen por lo menos r vectores.
g
1. Alcanza con demostrar que V → S. Supongamos, por reducción al absurdo, que V
S de S. En dicho caso existe w ∈ S tal que w no es C.L. de V . Luego,
no es generador
el conjunto V {w} también serı́a L.I. (teorema 3.4.3). Pero esto es absurdo ya que
en S no puede haber subconjuntos L.I. con más de r vectores.

2. Alcanza con demostrar que V es L.I. Si no lo fuera, serı́a L.D. y existirı́a un vector
v1 ∈ V que no es C.L. de los restantes vectores de V . Debido al teorema 4.3.1 al
quitar este vector, el nuevo conjunto V − {v1 } seguirı́a siendo generador de S. Pero
esto es absurdo ya que S no puede tener generadores con menos de r vectores.
Teorema 4.4.2. Otra caracterización de las bases.
b
Sean S un subespacio de Rn y U un subconjunto de S. Entonces U → S si, y solo si, cada
vector de S se puede expresar de una única forma como combinación lineal de U .
Demostración.
Supongamos que U = {u1 , u2 , . . . ur } es base de S. Esto quiere decir que U es L.I. y
g
generador de S. Sea v un vector cualquiera de S. Como U → S el vector v es C.L.
de U y, por lo tanto, existen α1 , α2 , . . . , αr tales que v = α1 u1 + α2 u2 + . . . + αr ur .
Supongamos que existen β1 , β2 , . . . , βr en R tales que v = β1 u1 + β2 u2 + . . . + βr ur .
Restando miembro a miembro ambas igualdades obtenemos

o = (α1 − β1 ) u1 + (α2 − β2 ) u2 + . . . + (αr − βr ) ur

Como U es L.I. resulta α1 − β1 = 0, α2 − β2 = 0, . . . , αr − βr = 0 y, por lo tanto,


αi = βi , ∀ i = 1, 2, . . . , r. Hemos demostrado entonces que existe una única forma
de escribir v como combinación lineal de U .
Supongamos ahora que cada vector de S se puede expresar de una única forma como
combinación lineal de U .
g
Lo anterior implica claramente que U → S.
Como S es subespacio, el vector nulo o pertenece a S. A partir de nuestra hipótesis
podemos afirmar que o se expresa de una única forma como combinación lineal de
U . Del corolario 3.4.2. deducimos que U es L.I. ♠
Proposición 4.4.3. Sea U ⊂ Rn tal que #U = n. Entonces U es base de Rn si, y solo
si, det (MU ) 6= 0.
Demostración.
n n
Sabemos
 que  U es base de R si, y solo si, para cualquier v ∈ R el sistema de ecuaciones
λ1
 λ2 
 
MU  .  = v es compatible determinado. En este caso el sistema es cuadrado, por lo
.
 . 
λn
que resulta compatible determinado si, y solo si, det (MU ) 6= 0 (recordar el teorema de
Cramer).
4.4. Base y dimensión de un subespacio vectorial de Rn 111

Definición 4.4.3. Coordenadas de un vector en una base.


Sean S 6= {o} un subespacio de Rn y U = {u1 , u2 , . . . , ur } una base de S. Sabemos que
para cada v ∈ S existen y son únicos los escalares λ1 , λ2 , . . . , λr de modo que
v = λ1 u1 + λ2 u2 + . . . + λr ur
A los escalares λ1 , λ2 , . . . , λr los llamaremos coordenadas de v en la base
 U. 
λ1
 λ2 
 
El vector de las coordenadas de v en la base U se simbolizará: coordU (v) =  . 
 .. 
λr
Observación 4.4.2. Cálculo de las coordenadas.
Si U = {u1 , u2 , . . . , ur } es una base del subespacio S y v es un vector cualquiera de S
entonces,
 para
 hallar las coordenadas de v en la base U , debemos resolver el sistema
λ1
 λ2 
 
MU  .  = v (que ya sabemos resultará compatible determinado).
 .. 
λr
En el caso en que el subespacio considerado sea el propio Rn el cálculo de la coordenadas
de un vector v en una base U = {u1 , u2 , . . . , un } de Rn puede hacerse utilizando la matriz
b
inversa de MU . En efecto, como U → Rn , det(MU ) 6= 0 por lo que existe (MU )−1 . Se tiene:
   
λ1 λ1
 λ2   λ2 
MU  .  = v ⇐⇒  .  = (MU )−1 v
   
.
 .  .
 . 
λn λn

De todos modos debemos tener en cuenta que presenta igual (o mayor) dificultad hallar
(MU )−1 que resolver el sistema.
     
 −1 1 1 
Ejemplo 4.4.5. El conjunto U =  3  ,  1  ,  2  es base de R3 ya que
 
0 2 3
 
−1 1 1
det (MU ) = det  3 1 2  = −2 6= 0. Calculemos las coordenadas en esta base U de
0 2 3
 
a
un vector v =  b  cualquiera de R3 :
c
   
λ1 −1 1 1 a
En este caso la matriz ampliada del sistema MU .  λ2  = v es  3 1 2 b .
λ3 0 2 3 c
Escalerizando tenemos que la matriz es equivalente a las siguientes:
   
−1 1 1 a −1 1 1 a
 0 4 5 3a + b  ←− F2 + 3F1 ∼  0 4 5 3a + b 
0 2 3 c 0 0 −1 3a + b − 2c ←− F2 − 2F3
112 Capı́tulo 4. Subespacios vectoriales de Rn

Por sustitución hacia atrás obtenemos la solución del sistema. Las coordenadas de v en la
base U resultan ser:
1 1
λ1 = (a + b − c), λ2 = (9a + 3b − 5c), λ3 = −3a − b + 2c
2 2
lo cual es equivalente a decir que se cumple la siguiente igualdad:
       
a −1 1 1
 b  = 1 (a + b − c)  3  + 1 (9a + 3b − 5c)  1  + (−3a − b + 2c)  2 
2 2
c 0 2 3

La otra manera de hallar las coordenadas hubiese consistido en hallar la inversa de la matriz
MU para luego realizar el producto (MU )−1 v. Dejamos como ejercicio la verificación del
mismo resultado final por este otro camino indicando como dato que
 
1 1 −1
1
(MU )−1 =  9 3 −5 
2
−6 −2 4

Observación 4.4.3. Las coordenadas de un vector dependen de la base.


1. Como se desprende de la definición, las coordenadas de un vector dependen de la base
que se haya fijado. Un mismo vector puede tener coordenadas
  diferentes en bases
−2
diferentes. Por ejemplo, consideremos el vector z = ∈ R2 y las siguientes
2
bases de R2 :
       
1 3 1 0
U= , y C= ,
1 1 0 1

Es inmediato verificar que


           
−2 1 3 −2 1 0
=4 −2 y = −2 +2
2 1 1 2 0 1

de donde resulta:
       
−2 4 −2 −2
coordU = y coordC =
2 −2 2 2

2. Si C = {e1 , e2 , . . . , en } es la base canónica de Rn entonces es claro que


coordC (v) = v , ∀ v ∈ Rn .
3. Si U = {u1 , u2 , . . . , ur } es una base de un subespacio S ¿cuáles son las coordenadas
de ui en la base U ? (i = 1, 2, . . . , r).

En la siguiente proposición se estudia la relación que existe entre las coordenadas de un


mismo vector en diferentes bases de Rn .

Proposición 4.4.4. Cambio de base.


Sean U = {u1 , u2 , . . . , un } y V = {v1 , v2 , . . . , vn } dos bases de Rn . Entonces existe una
única matriz A, de tamaño n × n, tal que:
4.4. Base y dimensión de un subespacio vectorial de Rn 113

1. coordV (z) = A.coordU (z) para todo vector z ∈ Rn .

2. Para cada j (entre 1 y n) la columna j-ésima de A coincide con coordV (uj ).

Demostración.
1. Sea z un vector cualquiera de Rn . Sabemos que:

MU . coordU (z) = z y MV . coordV (z) = z

Igualando obtenemos: MU .coordU (z) = MV .coordV (z). Como la matriz MV es inver-


tible (por ser V base de Rn ) podemos multiplicar la igualdad anterior (a izquierda)
por (MV )−1 obtenidendo:

(MV )−1 . MU . coordU (z) = (MV )−1 . MV . coordV (z)

de donde resulta:
 
(MV )−1 . MU . coordU (z) = coordV (z)

Una matriz A que cumple lo enunciado en la primera parte es entonces A = (MV )−1 .MU
2. Sustitutendo z por el vector uj obtenemos:

coordV (uj ) = A.coordU (uj ) = A.ej = Cj (A) (columna j-ésima de A)

Definición 4.4.4. Matriz de cambio de base.


Manteniendo la misma notación que en la proposición anterior, la matriz A = (MV )−1 .MU
se denomina matriz de cambio de base de la base U a la base V .

La propiedad fundamental de esta matriz viene dada por la igualdad:

coordV (z) = A . coordU (z) , ∀ z ∈ Rn

que nos dice que si multiplicamos dicha matriz por el vector de las coordenadas de z en
la base U obtenemos el vector de las coordenadas de z en la base V .
La matriz de cambio de base de la base U a la base V se simbolizará M .
U →V
Tenemos entonces que
M = (MV )−1 . MU
U →V

Ejercicio 4.4.1. Si S es un subespacio de Rn de dimensión p y U = {u1 , u2 , . . . , ur } ⊂ S,


determine si las siguientes afirmaciones son verdaderas o falsas:
1. si r < p entonces U es L.I.
g
2. si r ≥ p entonces U → S.

Ejercicio 4.4.2.        

 1 −4 −2 1 

   
0 3   5   1
 es base de R4 .
Investigue si U =  0 , 0 , 2 , 1
     


 
 
0 0 0 4
114 Capı́tulo 4. Subespacios vectoriales de Rn

Ejercicio 4.4.3. En cada uno de los casos discuta, según a ∈ R, si el conjunto U es base
de R3 :
           
 2 −a 0   1 a 4 
(1) U =  a  ,  2  ,  0  (2) U =  a  ,  2 , 6 
   
0 0 1 −2 3 −1

Ejercicio 4.4.4. En los siguientes casos se considera L(U ), el subespacio generado por
U . Encuentre una base de L(U ) y calcule su dimensión.
             
 1 2 1   1 2 1 
(1) U =  0  ,  1  ,  1  (2) U =  0  ,  1  ,  1 
   
1 3 2 1 2 2
            
 3 2 1   1 −1 3 
(3) U =  3  ,  2  ,  1  (4) U =  2 , 1 , 0 
   
6 4 2 −1 1 −3

Ejercicio 4.4.5. Demuestre que S es subespacio de R3 , encuentre una base de S y deter-


mine la dimensión de S en cada caso:
     
 x   x 
(1) S =  y  ∈ R3 / 3x + y − 2z = 0 , (2) S =  y  ∈ R3 / x − y = 0
   
z z
     
 x   x 
3 3
(3) S =  y  ∈ R / x − y = 0, z = 0 , (4) S =  y  ∈R /z=0
   
z z

Ejercicio 4.4.6. En cada uno de los siguientes casos:


(a) Pruebe que S es un subespacio de R4 .
(b) Halle una base U de S y calcule dim(S).
(c) Agregue, si es posible, vectores a la base U de forma de obtener una base de R4 .
  

 x1 

 
x 
2  4
1. S =  ∈ R / x 1 + x 2 − x 4 = 0

 x3  

 
x4
  

 x1 

 
x 2

 / x1 + x2 + x3 + x4 = 0 y x2 + 2x3 − x4 = 0
2. S =  x3 

 

 
x4
  

 x 1 

 
x 2

 / x1 + 2x2 + x3 − x4 = 0 y x2 − x3 − x4 = 0
3. S =  x3 

 

 
x4
4.4. Base y dimensión de un subespacio vectorial de Rn 115

  

 x1 

 
x2 
4. S =  x3  / x1 + x2 − x3 + x4 = 0 y x1 + 2x2 − 3x3 − 4x4 = 0


 

 
x4

Ejercicio 4.4.7. Encuentre una base (en caso que exista) y la dimensión del núcleo de
cada una de las siguientes matrices:
     
1 0 −1 −1 2 1 1 2 8
A= 0 2 4  B =  2 0 −1  C= 2 4 16 
1 3 3 0 4 1 −1 −2 −8
  
 x 
Ejercicio 4.4.8. Sea S =  y  ∈ R3 : x + y + z = 0, x + ay + az = 0 .
 
z
(a) Demuestre que S es un subespacio vectorial de R3 para todo a ∈ R.
(b) Discuta según a ∈ R la dimensión de S y determine una base de S en cada caso.
Ejercicio 4.4.9. Si U = {u, v, w} es base de R3 demuestre que W = {u + v, u + w, v + w}
también lo es.
Ejercicio 4.4.10. Sean S1 y S2 dos subespacios de Rn tales que S1 ⊂ S2 . Demuestre que
dim(S1 ) ≤ dim(S2 ). (Sugerencia: si dim(S1 ) = r comienze considerando una base U de
S1 con r vectores).
Ejercicio 4.4.11. Sean S1 y S2 dos subespacios de Rn tales que dim(S1 ) = dim(S2 ).
¿Esto implica que necesariamente S1 = S2 ?
2
  si U es base de R . En caso
Ejercicio 4.4.12. En cada uno de los casos investigue
a
afirmativo, encuentre las coordenadas del vector en la base U .
b
           
−1 1 1 −2 0 1
(a) U = , (b) U = , (c) U = ,
4 −1 3 −6 1 0
     
 −1 3 −2 
Ejercicio 4.4.13. Sea U =  0  ,  2  ,  2  .
 
0 2 1
1. Demuestre que U es base de R3 .
     
−1 2 3
2. Calcule las coordenadas de u =  0  yv=  2  yw=  0  en la base U .
0 2 2
3
Ejercicio 4.4.14. En cada uno de los casos investigue
  si U es base de R . En caso
a
afirmativo, encuentre las coordenadas del vector  b  en la base U .
c
           
 1 0 1   2 1 1 
(a) U =  2  ,  1  ,  0  (b) U =  −3  ,  1  ,  −4 
   
1 0 0 1 1 0
116 Capı́tulo 4. Subespacios vectoriales de Rn

       
 1 1 1 1 
(c) U =  0  ,  1  ,  1  ,  2 
 
0 0 1 3
Ejercicio 4.4.15. Sea U una base de Rn . Pruebe que

coordU (αu + βv) = α coordU (u) + β coordU (v) , ∀u, v ∈ Rn , ∀ α, β ∈ R.

Ejercicio 4.4.16. Sean U = {u1 , u2 , u3 } y V = {v1 , v2 , v3 } dos bases de R3 tales que:


 
1 1 1
M = 1 1 −1 
U →V
1 −1 1

1. Para i = 1, 2, 3 encuentra coordV (ui ), y exprese u1 , u2 y u3 como combinaciones


lineales de V .
2. Halle las coordenadas del vector z = u1 − 2u2 + 3u3 en la base V .
3. Exprese v1 , v2 y v3 como combinaciones lineales de U .

Ejercicio 4.4.17. Consideremos el conjunto


     
1 5 −3
U= , , ⊂ R2
−2 1 −5

1. Encuentre una base de R2 contenida


  en U .
a
2. Calcule las coordenadas de en la base que encontró en la parte anterior.
b

Ejercicio 4.4.18. Sean U = {u1 , u2 , u3 } Y V = {v1 , v2 , v3 } dos bases de R3 tales que:


     
2 1 0
v1 =  1  v2 =  0  v3 =  0  u1 = v1 − 2v2 + 2v3
0 2 2
 
a 0 1
M = b 1 −2 
U →V
c −1 5
1. Halle coordV (u1 ). Determine a, b y c.
2. Halle u1 , u2 y u3 .

4.5. Rango de una matriz


En el Capı́tulo 2 habı́amos introducido el concepto de rango por filas de una matriz.
Se trata simplemente del número de escalones (número de filas no nulas) de cualquiera
de las formas escalerizadas de la matriz. Para calcular el rgf (A) de una matriz A la
escalerizábamos y luego contábamos el número de filas no nulas de la forma escalerizada
4.5. Rango de una matriz 117

obtenida.  
1 1 −2 3
A modo de repaso calculemos el rgf (A) para la matriz A =  1 −2 3 1 
2 −1 1 4
   
1 1 −2 3 1 1 −2 3
A ∼  0 −3 5 −2  ←− F2 − F1 ∼  0 −3 5 −2 
0 −3 5 −2 ←− F3 − 2F1 0 0 0 0 ←− F3 − F2

Resulta entonces que rgf (A) = 2.

Ahora bien, esta matriz tiene tamaño 3 × 4, es decir, es una matriz de 3 filas y 4 columnas.
Observemos que cada una de las filas puede ser considerada como un vector de R4 :
     
1 1 2
 1   −2   −1 
F1 (A) = 
 −2  , F2 (A) =  3  , F3 (A) =  1 
    

3 1 4

Estas filas generan un subespacio S de R4 . Si queremos calcular su dimensión podemos


tener en cuenta que ya disponemos de un generador (el conjunto de las tres filas) y luego
proceder como en los ejemplos y ejercicios previos, esto es, reducir el generador (si fuese
necesario) hasta encontrar otro generador que también sea L.I. En esta sección introduci-
remos otra forma de hacerlo que está basada en la proposición 4.3.1 de “modificación” de
un generador. En lugar de reducirlo la idea es modificarlo de manera que el nuevo gene-
rador esté compuesto por vectores más sencillos. Para ello se puede sustituir una fila por
una C.L. de todas, siempre que la sustituida no la multipliquemos por 0. Pero justamente
eso fue lo que hicimos en el proceso de escalerización al comenzar este ejemplo. Es ası́ que:
 
1 1 −2 3
el subespacio generado por las filas de A =  1 −2 3 1 
2 −1 1 4

coincide con
 
1 1 −2 3
el subespacio generado por las filas de C =  0 −3 5 −2 
0 0 0 0

La dimensión de este último subespacio es inmediata de calcular. En efecto, las dos prime-
ras filas constituyen un generador del mismo pues la tercera fila es C.L. de ellas, y además
son L.I. Luego, la dimensión es 2, que coincide con la cantidad de escalones de C o sea
con el rgf (A).

El razonamiento es general y no depende de este caso particular. Si tenemos una matriz


A de tamaño m × n, sus m filas generan un subespacio S de Rn . Si C es una forma
escalerizada de A entonces sus filas generan el mismo subespacio S (modificación de un
generador). Por la ubicación de los ceros en la matriz C, sus filas no nulas constituirán
118 Capı́tulo 4. Subespacios vectoriales de Rn

un conjunto L.I. y, por lo tanto, una base de S. Resulta entonces que la dimensión de S
coincide con el número de escalones de C, o sea con el rgf (A). En conclusión:

La dimensión del subespacio generado por las filas de una matriz coincide con
el rango por filas de dicha matriz.

Si A es una matriz de tamaño m×n al conjunto de sus filas lo simbolizaremos FA . El subes-


pacio generado por FA es un subespacio de Rn , que se simboliza (con la notación habitual)
L (FA ). El resultado anterior se puede escribir en sı́mbolos de la siguientes manera:

dim [L (FA )] = rgf (A)

De modo análogo podrı́a interesarnos calcular la dimensión del subespacio generado por
las columnas de una matriz. Volviendo al ejemplo de arriba, cada una de las columnas de
A es un vector de R3 :
       
1 1 −2 3
C1 (A) =  1  , C2 (A) =  −2  , C3 (A) =  3  , C4 (A) =  1 
2 −1 1 4

El subespacio L (CA ) generado por las columnas de A es entonces un subespacio de R3


que, en principio, parecerı́a tener poco que ver con L (FA ), que es un subespacio de R4 .
Sin embargo, es posible demostrar (lo admitiremos) el siguiente resultado notable:

Teorema 4.5.1. Igualdad del rango por filas con el rango por columnas.
Si A es una matriz entonces se cumple que dim [L (FA )] = dim [L (CA )]

Definición 4.5.1. Rango de una matriz.


Llamaremos rango de una matriz A, y lo simbolizaremos rg(A), a la dimensión del subes-
pacio generado por sus filas o por sus columnas (que, según el teorema anterior, coinciden).

Observación 4.5.1. Sobre el rango de una matriz. Sea A una matriz m × n.


1. El subespacio L (FA ) generado por las filas de A es un subespacio de Rn .
El subespacio L (CA ) generado por las columnas de A es un subespacio de Rm .
Estos dos subespacios no tienen por qué coincidir (de hecho, esto es imposible si m 6=
n). Sin embargo, el teorema anterior afirma que sus dimensiones siempre coinciden.
2. El rango de A coincide con lo que antes llamábamos rgf (A), es decir, con el número
de escalones de cualquier forma escalerizada de A.
3. Como L (FA ) es un subespacio de Rn , su dimensión no puede superar a n.
Como L (CA ) es un subespacio de Rm , su dimensión no puede superar a m.
Se deduce que rg(A) ≤ min{m, n}.
4. La única matriz que tiene rango 0 es la matriz nula.
5. Como las columnas de una matriz son las filas de su traspuesta se deduce que

rg(A) = rg(At )
4.5. Rango de una matriz 119

6. Supongamos que m = n (matriz cuadrada). El rango de A vale n si, y solo si, las n
columnas (o filas) constituyen un conjunto L.I. de Rn o, lo que es lo mismo en este
caso, si y solo si, éstas constituyen una base de Rn . Se deduce que rg(A) = n ⇐⇒
det(A) 6= 0.

Observación 4.5.2. El caso de una matriz cuadrada 3 × 3.


Para calcular el rango de una matriz cuadrada A ∈ M3×3 alcanza casi con mirar la matriz.
En efecto, como 0 ≤ rg(A) ≤ 3, veamos los casos posibles:
1. rg(A) = 0. La única forma de que esto ocurra es que A sea la matriz nula.
2. rg(A) = 1. La única forma de que esto ocurra es que las tres filas de A sean
proporcionales y esto se ve directamente.
3. Si miramos la matriz y encontramos dos filas no proporcionales entonces su rango
puede valer 2 o 3. Como no siempre es sencillo concluir a simple vista si la fila
restante es, o no, C.L. de las dos mencionadas, podemos calcular el determinante de
la matriz (lo cual, al ser 3 × 3 no ofrece mayores dificultades). Si det(A) 6= 0 entonces
rg(A) = 3, mientras que si det(A) = 0 entonces rg(A) = 2.
4. Para una matriz cuadrada de tamaño mayor a 3 × 3, el método de escalerización es
el más eficiente y económico para calcular su rango y no es aconsejable trabajar con
determinantes.

Ejemplo
 4.5.1. Calculemos,
 discutiendo según el parámetro a ∈ R, el rango de la matriz
1 a −2
A= 2 1 a .
3 4 1
Como es una matriz cuadrada 3 × 3 comenzamos calculando su determinante. Se tiene:
det(A) = 3(a2 − 2a − 3). Las raı́ces de este polinomio son 3 y −1. Esto nos genera la
siguiente discusión:
Caso 1: Si a 6= 3 y a 6= −1 entonces det(A) 6= 0 y, por lo tanto, rg(A) = 3.
Caso 2: Si a = 3 entonces det(A) = 0 y, porlo tanto, rg(A)  < 3. Sustituimos este valor
1 3 −2
de a en la matriz original obteniendo: A =  2 1 3 . Como las dos primeras filas
3 4 1
no son proporcionales resulta rg(A) ≥ 2. Como el rango era menor que 3 deducimos que
rg(A) = 2. (De hecho, se observa fácilmente que la tercera fila es la suma de las dos
primeras).
Caso 2: Si a = −1 entonces det(A) = 0 y, por lo tanto, rg(A)
 < 3. Sustituimos este valor
1 −1 −2
de a en la matriz original obteniendo: A =  2 1 −1 . El mismo razonamiento que
3 4 1
en el caso anterior nos permite afirmar que rg(A) = 2.
120 Capı́tulo 4. Subespacios vectoriales de Rn

Definición 4.5.2. Nulidad de una matriz.


Llamaremos nulidad de una matriz A a la dimensión de N (A) (núcleo de A). La nulidad
se simbolirazá nu(A).
El siguiente teorema establece la relación clave que existe entre la nulidad de una matriz
y su rango.
Teorema 4.5.2. Relación entre el rango y la nulidad de una matriz.
Si A es una matriz de n columnas entonces nu(A) + rg(A) = n.
Demostración.Observemos en primer lugar que, como N (A) es un subespacio de Rn , su
dimensión está comprendida entre 0 y n, es decir: 0 ≤ nu(A) ≤ n. Realizaremos la prueba
distinguiendo tres casos.

Caso 1: nu(A) = n. Tenemos que probar que rg(A) = 0.


Si nu(A) = n entonces la dimensión del núcleo de A vale n, de donde resulta que N (A) =
Rn . Esto implica que A tiene que ser la matriz nula y, por lo tanto, rg(A) = 0.

Caso 2: nu(A) = 0. Como nu(A) = 0 alcanza con demostrar que rg(A) = n. Observemos
que nu(A) = 0 significa que la dimensión del núcleo de A es 0 y, por lo tanto, dicho núcleo
está formado exclusivamente por el vector nulo: N (A) = {o}.
Demostrar que rg(A) = n equivale a probar que la dimensión de L (CA ) (subespacio
generado por las columnas de A) es n y, para ello, debemos encontrar una base de dicho
subespacio con n vectores.
Sabemos que el conjunto CA = {C1 , C2 , . . . , Cn } de las n columnas de A es un generador
de L (CA ). Si probamos que también es L.I. habremos encontrado una base de L (CA ) con
n vectores.
Consideremos entonces una C.L. de CA que de como resultado el vector nulo:

λ1 C1 + λ2 C2 + . . . + λn Cn = o

La igualdad anterior se puede escribir:

A.λ = o

en donde λ es el vector de Rn cuyas componentes son λ1 , λ2 , . . . , λn . Pero si A.λ = o


entonces λ ∈ N (A). Como N (A) está formado exclusivamente por el vector nulo, resulta
λ = o, de donde se deduce que λ1 = λ2 = . . . = λn = 0. Hemos probado entonces que
CA = {C1 , C2 , . . . , Cn } es L.I. y, por lo tanto, base de L (CA ).

Caso 3: 0 < nu(A) < n.

Sea p = nu(A). Tenemos que demostrar que rg(A) = n − p. Como dim(N (A)) = p existe
una base U = {u1 , u2 , . . . , up } de N (A) formada por p vectores. Completamos U hasta
obtener una base B de Rn :

B = {u1 , u2 , . . . , up , v1 , . . . , vq } base de Rn .

Demostraremos que rg(A) = q, con lo cual habremos finalizado, ya que p + q = n. Para


ello vamos a probar que el conjunto (de q vectores) W = {A.v1 , A.v2 , . . . , A.vq } es una
base de L (CA ).
4.5. Rango de una matriz 121

1. Por la forma en que definimos W resulta claro que W ⊂ L (CA ).


2. Sea y ∈ L (CA ). Existe x ∈ Rn tal que y = A.x. Como B es base de Rn existen
escalares α1 , . . . , αp , β1 , . . . , βq ∈ R tales que

x = α1 u1 + . . . + αp up + β1 v1 + . . . + βq vq

Multiplicando (a izquierda) ambos miembros por la matriz A y recordando que los


vectores ui pertenecen al núcleo de A resulta:

y = A.x = β1 A.v1 + . . . + βq A.vq

lo cual prueba que y es C.L. de W . Como todo vector de L (CA ) se puede escribir
como C.L. de W podemos concluir que W es un generador de dicho subespacio.
3. Veamos ahora que W es L.I. Supongamos entonces que

λ1 A.v1 + . . . + λq A.vq = o

Lo anterior es equivalente a A. (λ1 v1 + . . . + λq vq ) = o y esto implica que el vector


λ1 v1 + . . . + λq vq pertenece al núcleo de A. Como U es base de dicho núcleo existen
escalares γ1 , . . . , γp ∈ R tales que:

λ1 v1 + . . . + λq vq = γ1 u1 + . . . + γp up

de donde
γ1 u1 + . . . + γp up − λ1 v1 − . . . − λq vq = o
Como B es base de Rn , lo anterior implica que todos los coeficientes tienen que ser
0 y, por lo tanto, λ1 = . . . = λq = 0.


 
1 −2 3 −1
Ejercicio 4.5.1. Se considera la matriz A =  −1 0 −2 1 .
−1 −4 0 1
1. Halle el rango y la nulidad de A.
2. Halle la dimensión del subespacio
 de R3 generado por las columnas de A y encuentre
11
α ∈ R de modo que el vector  α  pertenezca a dicho subespacio.
13
3. Halle la dimensión del subespacio
 de R4 generado por las filas de A y encuentre

0
 β 
β ∈ R de modo que el vector   8  pertenezca a dicho subespacio.

0
 
a 0
Ejercicio 4.5.2. Se considera la matriz A = .
a a2 + a
1. Discuta, según a ∈ R, el valor del rango de la matriz A.
122 Capı́tulo 4. Subespacios vectoriales de Rn

2. Sean S1 el subespacio de R2 generado por las columnas de A y S2 el subespacio de


R2 generado por las filas de A. Investigue si cada uno de los siguientes enunciados
es verdadero o falso justificando la respuesta:
a) Si rg(A) = 2 entonces S1 = S2 .
b) Si rg(A) = 1 entonces S1 = S2 .
c) Si rg(A) = 0 entonces S1 = S2 .
Ejercicio 4.5.3. En cada uno de los siguientes casos discuta, según a ∈ R, el valor del
rango y de la nulidad de las siguientes matrices.
     
1 a a−1 1 2 −1 1 a −2
A= 1 2 1  , B =  2 1 4  , C =  −2 4a a + 1 
a 4 0 1 1 a 1 7a a − 5
   
1 a −2 1 1 1 1
D =  2 3a − 1 a2 − a − 4  , E =  1 2 1 2 
a a 2 2
a − 2a − 1 a a+1 a a+1 2

 
  1 1 1
1 −a2 −1  4 α α 
F = 1 a −1  , G =   1 α−3 α−3 

a −a −1
1 1 α2 − 15
Ejercicio 4.5.4. Sean A una matriz y k un real. ¿Qué relación existe entre rg(A) y
rg(kA)? ¿Qué relación existe entre nu(A) y nu(kA)?
Ejercicio 4.5.5. En cada uno de los siguientes casos encuentre un ejemplo de dos matrices
A y B tales que:
1. rg(A + B) = rg(A) + rg(B)
2. rg(A + B) < rg(A) + rg(B)
3. rg(A + B) > rg(A) > rg(B)
Ejercicio 4.5.6. Sean A una matriz m × n y B una matriz n × p.
1. Utilizando la primera parte del ejercicio 4.2.7 deduzca que que nu(B) ≤ nu(A.B).
2. Demuestre que rg(A.B) ≤ rg(B) (use la parte anterior).
3. Teniendo en cuenta que el rango de una matriz coincide con el de su traspuesta
demuestre que rg(A.B) ≤ rg(A).
4. En cada uno de los siguientes casos encuentre un ejemplo de dos matrices A y B
tales que:
(a) rg(A.B) = rg(A) = rg(B) (b) rg(A.B) = rg(A) < rg(B)
(c) rg(A.B) < rg(A) < rg(B)
Ejercicio 4.5.7. Demuestre que no existe ninguna matriz n × n, con n impar, n 6= 1, para
la cual el subespacio generador por sus columnas coincida con el núcleo de la matriz.
Ejercicio 4.5.8. Sea A un matriz 2 × 2 tal que el subespacio generador por sus columnas
coincide con el núcleo de la matriz.
Demuestre que rg(A) = 1 y encuentre la forma de la matriz A.
4.6. Apéndice de este capı́tulo 123

4.6. Apéndice de este capı́tulo


Demostración del Teorema de Steinitz.
Sean S un subespacio de Rn , U y W dos subconjuntos de S tales que U es L.I. y W es un
generador de S. Entonces #U ≤ #W .

Supongamos que U = {u1 , u2 , . . . , ur } y W = {w1 , w2 , . . . , wm }. Queremos demostrar que


r ≤ m. Consideramos u1 ∈ U , como U es L.I. entonces necesariamente u1 6= o, además
g
dado que W → S, sabemos que existen escalares α11 , α12 , . . . , α1m no todos nulos tales
que u1 = α11 w1 + α12 w2 + . . . + α1m wm . Supongamos α11 6= 0, luego
1 α12 α1m
w1 = u1 − w2 − . . . − wm
α11 α11 α11
g
Como W → S, si z es un vector en S existen β1 , β2 , . . . , βm ∈ R tales que

z = β1 w1 + β2 w2 + . . . + βm wm
 
1 α12 α1m
= β1 u1 − w2 − . . . − wm + β2 w2 + . . . + βm wm
α11 α11 α11
   
1 α12 α1m
= β1 u1 + −β1 + β2 w2 + . . . + −β1 + βm wm
α11 α11 α11

Ası́ se concluye que z es combinación lineal de {u1 , w2 , . . . , wm } cualquiera sea z ∈ S, por


g
lo que {u1 , w2 , . . . , wm } → S. Consideremos ahora u2 , existen α21 , α22 , . . . , α2m ∈ R no
todos nulos tales que u2 = α21 u1 + α22 w2 + . . . + α2m wm . Supongamos α22 6= 0, luego
α21 1 α2m
w2 = − u1 + u2 − . . . − wm
α22 α22 α22
g
y, debido a que {u1 , w2 , . . . , wm } → S, existen β1 , β2 , . . . , βm ∈ R tales que

z = β1 u1 + β2 w2 + . . . + βm um

cualquiera sea z ∈ S. Operando se llega a que cualquier vector z ∈ S puede expresarse


como combinación lineal de {u1 , u2 , . . . , wm }:
     
α21 1 α23 α2m
z = β1 − β2 u1 + β2 u2 + −β2 + β3 w3 + . . . + −β2 + βm wm
α22 α22 α22 α22

Luego
g
{u1 , u2 , w3 , . . . , wm } → S
Podrı́amos continuar reemplazando los vectores de W por vectores U de forma tal de
obtener nuevos conjuntos generadores de S, pero ¿hasta cuándo? ¿cuántos vectores de W
pueden ser suplantados por vectores de U ? Supongamos por absurdo que r > m, dado que
la cantidad de vectores de U es mayor que la de W , si continuamos con el procedimiento
anterior podremos reemplazar todos los vectores de W y por lo tanto tendremos que

W = {u1 , u2 , . . . , um } ⊂ U = {u1 , u2 , . . . , um , um+1 , . . . , ur }


124 Capı́tulo 4. Subespacios vectoriales de Rn

g
es tal que W → S y los vectores um+1 , . . . , ur que pertenecen a S son entonces combinación
lineal de W , lo que contradice el hecho que U es L.I.
Como el absurdo parte de suponer r > m, se deduce entonces que r ≤ m. ♠

Demostración del Teorema 4.5.1


Para cualquier matriz A = (aij ) (m × n) se cumple que dim [L (FA )] = dim [L (CA )].

Sean p = dim [L (FA )] y q = dim [L (CA )]. Si p = 0 entonces A es la matriz nula y, por lo
tanto, q = 0. Supongamos entonces que p > 0.

Vamos a probar en primer lugar que q ≤ p. Como p = dim [L (FA )] la matriz A tiene p filas
L.I. (podemos suponer que son las p primeras: F1 , F2 , . . . , Fp , mientras que las restantes
m−p filas dependen linealmente de éstas. Tenemos entonces que para cada i = p+1, . . . , m
existen escalares αij tales que:

Fi = αi1 F1 + αi2 F2 + . . . + αip Fp , i = p + 1, . . . , m

Expresando la igualdad anterior en componentes tenemos:

(ai1 , . . . , ain ) = αi1 (a11 , . . . , a1n ) + . . . + αip (ap1 , . . . , apn )

Por lo tanto, una columna cualquiera de A, como la j-ésima, puede expresarse mediante:
   
a1j a1j
 a2j   a2j 
   
 ..   .. 

 .  
  . 

 apj  =  apj =
   
 ap+1,j   αp+1,1 a1j + . . . + αp+1,p apj 
   
 ..   .. 
 .   . 
amj αm,1 a1j + . . . + αm,p apj
     
1 0 0

 0 


 1 


 0 


 0 


 0 


 1 

 ..   ..   .. 
a1j 
 .  + a2j 
  .  + . . . + apj 
  . 

 αp+1,1   αp+1,2   αp+1,p 
     
 ..   ..   .. 
 .   .   . 
αm,1 αm,2 αm,p
Esto muestra que cualquier columna de A se puede expresar como C.L. de un conjunto
de p vectores fijos. Luego, el subespacio generado por las columnas de A tiene dimensión
menor o igual que p, o sea q ≤ p.

Para probar que p ≤ q alcanza con utilizar el resultado que acabamos de demostrar y el
hecho de que las filas de A son las columnas de At :
dim [L (FA )] = dim [L (CAt )] ≤ dim [L (FAt )] = dim [L (CAt )] ♠
Capı́tulo 5

Rn como espacio euclidiano

En este capı́tulo veremos cómo es posible extender a Rn los conceptos métricos que el lector
conoce de R2 . En este contexto más general también será posible hablar (por ejemplo) de
ángulo formado por dos vectores, de vectores perpendiculares, proyecciones ortogonales,
teorema de Pitágoras; ası́ como realizar cálculo de distancias y áreas. Estas ideas, resulta-
dos y técnicas, no solamente poseen una riqueza geométrica intrı́nseca, sino que también
permitirán abordar y resolver relevantes problemas de aplicación a diversas áreas cientı́fi-
cas. En ese sentido desarrollaremos el “método de mı́nimos cuadrados”, el cual (entre otras
aplicaciones) permite establecer un modelo matemático de función de demanda a partir
de datos obtenidos por una encuesta.

5.1. Producto interno, norma y ángulos


Definición 5.1.1. Producto interno en Rn .
   
u1 v1
 u2   v2 
Sean u =  .  y v =  .  dos vectores de Rn . El producto interno de u por v
   
 ..   .. 
un vn
se simboliza hu, vi y es, por definición, el número:

hu, vi = u1 v1 + u2 v2 + . . . + un vn

Observemos que este número coincide con el producto de la matriz fila ut con la matriz
columna v: hu, vi = ut v.
     
2 1 −3
Ejemplo 5.1.1. Si u =  −1 , v =  −1  y w =  1  entonces:
3 2 2
hu, vi = 2 · 1 + (−1) · (−1) + 3 · 2 = 9
hu, wi = 2 · (−3) + (−1) · 1 + 3 · 2 = −1
hv, wi = 1 · (−3) + (−1) · 1 + 2 · 2 = 0
126 Capı́tulo 5. Rn como espacio euclidiano

Proposición 5.1.1. Propiedades básicas del producto interno.


El producto interno de vectores de Rn tiene las siguientes propiedades:
(Pi1) No negatividad: hu, ui ≥ 0 , ∀ u ∈ Rn . Además, hu, ui = 0 ⇐⇒ u = o.
(Pi2) Conmutativa: hu, vi = hv, ui , ∀ u, v ∈ Rn .
(Pi3) Homogénea: hα u, vi = α hu, vi , ∀ u, v ∈ Rn , ∀ α ∈ R.
(Pi4) Distributiva: hu + w, vi = hu, vi + hw, vi , ∀ u, v, w ∈ Rn .

Demostración. La demostración es simple (alcanza con aplicar la definición y las propie-


dades de las operaciones en R) y queda a cargo
 dellector. Observemos, de todos modos,
u1
 u2 
 
la primera de ellas (no negatividad). Si u =  .  entonces
 .. 
un

hu, ui = u1 u1 + u2 u2 + . . . + un un = (u1 )2 + (u2 )2 + . . . + (un )2

Cada sumando de la suma anterior es no negativo, por lo que la suma también lo es.
Además, esa suma vale 0 si, y solo si, todos lo sumandos son nulos, y esto ocurre solamente
cuando u1 = u2 = . . . = un = 0, es decir, cuando u es el vector nulo.

Observación 5.1.1. El producto interno de un vector por sı́ mismo.


Como observamos recién, el producto interno de un vector por sı́ mismo coincide con la
suma de los cuadrados de sus componentes:

hu, ui = (u1 )2 + (u2 )2 + . . . + (un )2

Esto nosrecuerda
 al teorema de Pitágoras (al menos, cuando estamos en R2 ). En efecto,
a
sea u = ∈ R2 . El producto interno hu, ui vale a2 + b2 .
b
Según el teorema de Pitágoras, a2 + b2 (suma de los cuadrados de las medidas de los
catetos del triángulo rectángulo de la figura) coincide con el cuadrado de la medida de
la hipotenusa. La medida √ de dicha phipotenusa, que no es otra cosa que la “longitud” del
vector u, vale entonces a2 + b2 = hu, ui.


a2 + b2

a
5.1. Producto interno, norma y ángulos 127

p
Es ası́ que, en R2 , la longitud de un vector u coincide con hu, ui. Esto nos lleva a dar la
siguiente definición.
Definición
 5.1.2.
 Norma de un vector.
u1
 u2 
Si u =  .  ∈ Rn entonces su norma es, por definición, el número:
 
 .. 
un
p p
kuk = hu, ui = (u1 )2 + (u2 )2 + . . . + (un )2
     
2 1 1
Ejemplo 5.1.2. Si u =  −1 , v =  2  y w =  0  entonces:
3 −2 1
p √
2 2 2
k u k = 2 + (−1) + 3 = 14
p √
k v k = 12 + 22 + (−2)2 = 9 = 3
√ √
k w k = 12 + 02 + 12 = 2
Proposición 5.1.2. Dos propiedades de la norma.
De la definición de norma y de las propiedades del producto interno resultan inmediatas
las siguientes propiedades:
(N1) No negatividad: kuk ≥ 0, ∀ u ∈ Rn . Más aún, kuk = 0 ⇐⇒ u = o.
(N2) Homogeneidad: kλ uk = |λ| kuk, ∀ u ∈ Rn , ∀ λ ∈ R.
Vale la pena observar que k − xk = kxk, ∀ x ∈ Rn .
Proposición 5.1.3. Una suerte de “cuadrado de un binomio”.
Si u y v son dos vectores de Rn entonces se cumple:
1. ku + vk2 = kuk2 + 2hu, vi + kvk2
2. ku − vk2 = kuk2 − 2hu, vi + kvk2
Demostración. Demostraremos la primera parte solamente ya que la segunda es total-
mente análoga. Utilizando la definición de norma y las propiedades del producto interno
obtenemos:
ku + vk2 = hu + v, u + vi = hu, ui + hu, vi + hv, ui + hv, vi = kuk2 + 2hu, vi + kvk2 ♠

Observación 5.1.2. Las medidas de los lados de un triángulo.


Dados u y v no colineales en R2 , las medidas de los lados del triángulo de la próxima
figura (izquierda) valen kuk, kvk y ku − vk. Según la proposición anterior, estas medidas
están relacionadas por
ku − vk2 = kuk2 − 2hu, vi + kvk2
Ahora bien, en el caso particular en que el triángulo es rectángulo (figura derecha), el
teorema de Pitágoras asegura que
ku − vk2 = kuk2 + kvk2
(el cuadrado de la medida de la hipotenusa coincide con la suma de los cuadrados de las
medidas de los catetos).
128 Capı́tulo 5. Rn como espacio euclidiano

v xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
ku − vk
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
ku − vk
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
kvk
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
kvk xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
α
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

o kuk u o kuk u

Resulta entonces que, al menos en R2 , se cumple que u y v son perpendiculares si, y solo
si, hu, vi = 0. Esto motiva la siguiente definición.

Definición 5.1.3. Vectores ortogonales.


Sean u, v ∈ Rn . Diremos que u y v son ortogonales (o perpendiculares) cuando hu, vi = 0.
En este caso escribiremos: u ⊥ v.

Proposición 5.1.4. Pitágoras en Rn .


Si u y v son vectores ortogonales en Rn entonces:

ku + vk2 = ku − vk2 = kuk2 + kvk2

Ejemplo 5.1.3.

  
1 3
 3   −2  4
(a) Los vectores u =   1  y v =  2  ∈ R son ortogonales pues hu, vi = 0.
  

1 1
n
(b) Los vectores canónicos de R son ortogonales entre sı́. En efecto, es inmediato veri-
ficar que hei , ej i = 0, ∀ i 6= j.
(c) Como ho, vi = 0, ∀ v ∈ Rn , deducimos que el vector nulo es ortogonal a todos los
vectores del espacio.
(d) Supongamos que z ∈ Rn es ortogonal a todos los vectores del espacio Rn . En parti-
cular se cumplirá hz, zi = 0. Luego kzk = 0 y, por lo tanto, z = o. Resulta entonces
que el único vector ortogonal a todos los vectores del espacio es el vector nulo.

Proposición 5.1.5. Proyección ortogonal sobre un vector.


Sea u ∈ Rn un vector no nulo. Entonces para cada vector x ∈ Rn existe un único vector z
colineal con u tal que x − z ⊥ u.
hx, ui hx, ui
Este vector viene dado por z = u= u, se denomina proyección ortogonal de x
hu, ui kuk2
sobre u y se simboliza Pu (x).
5.1. Producto interno, norma y ángulos 129

x−z

o u z

Demostración. Un vector colineal con u es de la forma z = λu, con λ ∈ R.


Impongamos que x − z ⊥ u:
x − z ⊥ u ⇐⇒ hx − z, ui = 0 ⇐⇒ hx − λu, ui = 0 ⇐⇒ hx, ui − λhu, ui = 0
hx, ui
⇐⇒ hx, ui = λhu, ui ⇐⇒ λ =
hu, ui
En el último paso se tuvo en cuenta que hu, ui =
6 0 debido a que u no es el vector nulo.

Observación 5.1.3. Relación entre la norma de un vector y su proyección or-
togonal sobre otro.
Si Pu (x) es la proyección ortogonal de x sobre el vector no nulo u entonces el teorema de
Pitágoras nos permite afirmar que:
kxk2 = kx − Pu (x)k2 + kPu (x)k2
De la igualdad anterior se deduce que kPu (x)k2 ≤ kxk2 y, por lo tanto:
kPu (x)k ≤ kxk

Más aún, se cumple la igualdad si, y solo si, Pu (x) = x, lo cual quiere decir que x es
colineal con u.

Teorema 5.1.1. Desigualdad de Cauchy-Schwarz.


Si u y v son dos vectores de Rn entonces se cumple:
1. | hu, vi | ≤ k u k k v k
2. | hu, vi | = k u k k v k si, y solo si, {u, v} es L.D.
Demostración.
1. Si u = o entonces es claro que se cumple la igualdad. Supongamos que u no es el
vector nulo. Si Pu (v) es la proyección ortogonal de v sobre u sabemos que kPu (v)k ≤
hv, ui
kvk. Como Pu (v) = u obtenemos:
kuk2

hv, ui |hv, ui| |hv, ui|
kuk2 u ≤ kvk ⇐⇒ kuk2 kuk ≤ kvk ⇐⇒ kuk ≤ kvk

lo cual es equivalente a lo que querı́amos demostrar. ♠


130 Capı́tulo 5. Rn como espacio euclidiano

2. Tenemos que |hu, vi| = kuk kvk si, y solo si, kPu (v)k = kvk lo cual, como ya sabemos,
es equivalente a que u y v sean colineales. ♠

  
2 1
 −1   2  4
Ejemplo 5.1.4. Consideremos los vectores u =   1  y v =  0  ∈ R . Como
  

−1 1
{u, v} es L.I. la desigualdad de Cauchy-Schwarz debe ser estricta en este caso. Simplemente
verifiquémoslo
√ √ calculando:

kuk kvk = 7 6 = √ 42
|hu, vi| = | − 1| = 1 < 42 = kuk kvk
Proposición 5.1.6. Desigualdad triangular para la norma.
Si u y v son dos vectores de Rn entonces se cumple:
1. ku + vk ≤ kuk + kvk.

2. ku + vk = kuk + kvk si, y solo si, u y v son colineales con coeficiente de proporcio-
nalidad mayor o igual que 0, es decir, si existe α ≥ 0 tal que u = αv o existe β ≥ 0
tal que v = βu.
Antes de realizar la demostración veamos que la “desigualdad triangular” para la norma
tiene una interpretación geométrica simple.

v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
u+v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
ku + vk xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx kvk
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

o kuk u

Las medidas de los lados del triángulo sombreado valen kuk, kvk y ku + vk. Lo que esta-
blece la desigualdad triangular es la conocida propiedad geométrica que establece que un
lado de un triángulo siempre es menor que la suma de los otros dos.

Demostración.
1. Sabemos que ku + vk2 = kuk2 + 2hu, vi + kvk2 . Por otra parte hu, vi ≤ |hu, vi| ≤
kuk kvk (se usó la desigualdad de Cauchy-Schwarz). Tenemos entonces que:

ku + vk2 = kuk2 + 2hu, vi + kvk2 ≤ kuk2 + 2kukkvk + kvk2 = (kuk + kvk)2

de donde se deduce que ku + vk2 ≤ (kuk + kvk)2 . Como las bases de las potencias
anteriores son no negativas podemos concluir que ku + vk ≤ kuk + kvk. ♠
5.1. Producto interno, norma y ángulos 131

2. Si observamos el razonamiento recién realizado podemos afirmar que se cumple la


igualdad ku + vk = kuk + kvk si, y solo si, se cumple la igualdad hu, vi = kukkvk.
A su vez, esta igualdad es verdadera si, y solo si, {u, v} es L.D. (parte (2) del
teorema 5.1.1) y hu, vi ≥ 0. Que {u, v} sea L.D. significa que ambos vectores son
colineales. Supongamos, para fijar ideas que existe α ∈ R tal que u = αv. Tenemos
que hu, vi = hαv, vi = αhv, vi. Luego, hu, vi ≥ 0 si, y solo si, α ≥ 0. ♠

Definición 5.1.4. Distancia entre dos puntos.


Sean p y q dos puntos de Rn . Llamaremos distancia (euclidiana) entre p y q al número
d(p, q) = kq − pk.
Proposición 5.1.7. Propiedades de la distancia.
La distancia definida en Rn tiene las siguientes propiedades básicas:
(D1) No negatividad: d(p, q) ≥ 0 , ∀ p, q ∈ Rn . Además, d(p, q) = 0 ⇐⇒ p = q.
(D2) Conmutativa: d(p, q) = d(q, p) , ∀ p, q ∈ Rn .
(D3) Desigualdad triangular: d(p, r) ≤ d(p, q) + d(q, r) , ∀ p, q, r ∈ Rn .
Observación 5.1.4. Recordando el teorema del coseno.
Sean u y v no colineales en R2 . Pongamos: b = kuk, c = kvk y a = ku − vk. Con esta nota-
ción, el “teorema del coseno” de la geometrı́a euclidiana plana (que establece la relación
que existe entre las medidas de los lados de dicho triángulo) afirma que:

a2 = b2 + c2 − 2 b c cos(α)

o sea
ku − vk2 = kuk2 + kvk2 − 2 kuk kvk cos(α) (∗)

v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
ku − vk
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
kvk
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
α
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

o kuk u

Por otra parte, sabemos que para toda pareja de vectores en Rn vale la igualdad:

ku − vk2 = kuk2 + kvk2 − 2 hu, vi (∗∗)

Si observamos las igualdades (∗) y (∗∗) deducimos que

hu, vi = kuk kvk cos(α)


132 Capı́tulo 5. Rn como espacio euclidiano

lo cual nos dice que el producto interno de dos vectores coincide con el producto de la
norma de ambos por el coseno del ángulo que forman. En el caso particular en que el
ángulo es recto, su coseno vale 0 y por lo tanto el producto interno también. En este caso
el triángulo es rectángulo y el teorema del coseno se reduce al teorema de Pitágoras.

Recordemos que si u y v son dos vectores de Rn , la desigualdad de Cauchy-Schwarz afirma


|hu,vi|
que |hu, vi| ≤ kukkvk. Si ninguno de los vectores es el nulo obtenemos kukkvk ≤ 1, lo cual es
hu,vi
equivalente a −1 ≤ kuk kvk ≤ 1. Es posible concluir entonces que existe un único número
hu,vi
α ∈ [0, π] que verifica cos(α) = kuk kvk .

Definición 5.1.5. Ángulo entre dos vectores.


Sean u y v dos vectores no nulos de Rn . Llamaremos ángulo formado por u y v al número
α ∈ [0, π] que verifica:
hu, vi
cos(α) =
kuk kvk
 
1
Ejemplo 5.1.5. Calculemos el ángulo que forman los vectores u =  √1  y
2
 
1 √
v =  1  ∈ R3 . Tenemos que hu, vi = 2, kuk = 2 y kvk = 2. Luego:
0
 
2 1 1
cos(α) = √ = √ =⇒ α = Arccos √ = π/4
2 2 2 2
   
1 0
 0   −2  4
Ejercicio 5.1.1. Consideremos los vectores u =   −1  y v =  2  ∈ R . Calcule
  

0 1
hu, vi, kuk, kvk y ku + vk. Verifique la desigualdad de Cauchy-Schwarz y la desigualdad
triangular.
   
1 −2
Ejercicio 5.1.2. Sean u =  2  y v =  −1  ∈ R3 .
2 2
1. Calcule hu, vi, kuk, kvk y ku + vk. Verifique la desigualdad de Cauchy-Schwarz y la
desigualdad triangular.
2. Compruebe que los ángulos formados por los vectores u y u + v y por los vectores v
y u + v valen π/4. Interprete geométricamente este resultado.
Ejercicio 5.1.3. Sean u, v ∈ Rn .
1. Demuestre e interprete geométricamente en R2 :
(a) (u + v) ⊥ (u − v) ⇐⇒ kuk = kvk. 
(b) ku + vk2 + ku − vk2 = 2 kuk2 + kvk2 .
2. Halle la condición que deben cumplir u y v para que ku + vk = ku − vk.
5.1. Producto interno, norma y ángulos 133

Ejercicio 5.1.4. Encuentre todos los valores de λ ∈ R para los que se cumpla:
||u + v||2 + ||2u − v||2 = 5||u||2 − λhu, vi + 2||v||2 , ∀ u, v ∈ Rn .
2
Ejercicio 5.1.5. Encuentre dos vectores  u,v ∈ R que cumplan: hu, vi = 100, ||u|| =
3
5, ||v|| = 20, siendo u de la forma u = .
a
Ejercicio 5.1.6. Calcule el área del triángulo cuyos vértices son los puntos:
     
0 1 2
o=  0  , p=  −2  , q=  1 
0 0 2
Ejercicio 5.1.7. Teorema de Pitágoras revisitado.
1. Sean p, q, r tres puntos en Rn tales que r−p ⊥ q −p (esto quiere decir que el triángulo
de vértices p, q, r es rectángulo en p). Demuestre que d2 (q, r) = d2 (p, q) + d2 (p, r).
2. Calcule el área del triángulo cuyos vértices son los puntos:
     
2 3 6
x= 3  , y= 5  , z= 2 
4 2 5
Ejercicio 5.1.8. Si A es una matriz de tamaño m × n demuestre que:
1. hAx, yi = hx, At yi, ∀ x ∈ Rn , ∀ y ∈ Rm . (Observe que el producto interno de la
izquierda es entre vectores de Rm mientras que el de la derecha es el producto interno
en Rn . Para la prueba recuerde que si u, v ∈ Rn entonces hu, vi = ut v).
2. hAt Av, vi = kA.vk2 , ∀ v ∈ Rn .

3. N At A = N (A).

4. rg At A = rg(A).
5. Si rg(A) = n entonces At A es invertible.
Ejercicio 5.1.9. Una fábrica produce cuatro artı́culos y en esa producción se necesita
una materia prima y mano de obra de acuerdo con lo que se indica a continuación:
Artı́culo 1: Cada unidad requiere 5 kilos de materia prima y 2 horas hombre.
Artı́culo 2: Cada unidad requiere 3 kilos de materia prima y 4 horas hombre.
Artı́culo 3: Cada unidad requiere 4 kilos de materia prima y 7 horas hombre.
Artı́culo 4: Cada unidad requiere 2 kilos de materia prima y 3 horas hombre.
1. Sean p1 el precio por kilo de la materia prima y p2 la remuneración por hora de
trabajo. Defina dos vectores u y v de modo que su producto interno sea el costo
variable por producir x unidades del artı́culo 1, y unidades del artı́culo 2, z unidades
del artı́culo 3 y w unidades del artı́culo 4.
2. Sea k el costo fijo de producción y a, b, c y d los precios de venta de cada unidad
de los artı́culos 1, 2, 3 y 4 respectivamente. Exprese mediante productos internos la
utilidad que obtiene la fábrica al vender x unidades del artı́culo 1, y unidades del
artı́culo 2, z unidades del artı́culo 3 y w unidades del artı́culo 4.
Ejercicio 5.1.10. Demuestre que

| kuk − kvk | ≤ ku − vk, ∀ u, v ∈ Rn .


134 Capı́tulo 5. Rn como espacio euclidiano

Ejercicio 5.1.11.
1. Demuestre las propiedades de la distancia.
2. Demuestre que d(λu, λv) = |λ|d(u, v), ∀ u, v ∈ Rn , ∀ λ ∈ R, e interprete geométri-
camente esta propiedad.
3. Demuestre que d(p + z, q + z) = d(p, q), ∀ p, q, z ∈ Rn , e interprete geométricamente
esta propiedad.
Ejercicio 5.1.12. Si p y q son dos puntos distintos en Rn entonces el punto medio del
p+q
segmento por ellos determinado es el punto m = . Verifique que d(p.m) = d(q, m).
2

5.2. Conjuntos ortogonales y proyecciones ortogonales


Definición 5.2.1. Conjuntos ortogonales y ortonormales.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn con r ≥ 2.
Diremos que U es un conjunto ortogonal cuando sus vectores son ortogonales dos a dos,
es decir, cuando ui ⊥ uj , ∀ i 6= j.
Diremos que U es un conjunto ortonormal si, además de ser ortogonal, todos sus vectores
tienen norma 1. (De aquı́ en adelante a los vectores de norma 1 los llamaremos unitarios).
Ejemplo 5.2.1.
1. La base canónica de Rn es un conjunto ortonormal.
   
1 −2
2. El conjunto U = , ⊂ R2 es ortogonal pero no ortonormal pues la
1 2
√ √
norma del primer vector vale 2 y la norma del segundo 8.
( 1
! −2
!)
√ √
3. El conjunto V = √1
2 , √2
8 ⊂ R2 es ortonormal.
2 8
4. Lo que ocurrió en el ejemplo recién mencionado es general. En efecto, si U =
{u1 , un2 , . . . , ur } ⊂ Rn es ortogonal
o y no contiene al vector nulo entonces el conjunto
u1 u2 ur
U = ku1 k , ku2 k , . . . , kur k es ortonormal. Esto se debe a que si u 6= o entonces la
u
norma de kuk vale 1.
Teorema 5.2.1. Independencia lineal de los conjuntos ortogonales.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto ortogonal que no contiene al vector nulo.
Entonces U es L.I.
Demostración. Consideremos una C.L. de U que de como resultado el vector nulo:

α1 u1 + α2 u2 + . . . + αr ur = o (∗)

Queremos demostrar que, necesariamente, todos los coeficientes αi deben valer 0. Si hace-
mos el producto interno de ambos miembros de (∗) por u1 obtenemos la siguiente igualdad:

hu1 , α1 u1 + α2 u2 + . . . + αr ur i = hu1 , oi = 0

Aplicando las propiedades del producto interno obtenemos:

α1 hu1 , u1 i + α2 hu1 , u2 i + . . . + αr hu1 , ur i = 0


5.2. Conjuntos ortogonales y proyecciones ortogonales 135

Como U es un conjunto ortogonal, el vector u1 es ortogonal a los restantes vectores de U


y, por lo tanto, hu1 , uj i = 0, ∀ j 6= 1. Es ası́ que la igualdad anterior se reduce a:

α1 hu1 , u1 i = 0

Como hu1 , u1 i =
6 0 (pues ninguno de los vectores de U es el vector nulo) resulta que nece-
sariamente α1 = 0.

Si en lugar de haber realizado el producto interno de ambos miembros de (∗) por u1 , lo


hubiésemos hecho por u2 , habrı́amos obtenido α2 = 0. Es decir, razonando de manera
análoga se demuestra que todos los coeficientes αi valen 0 y ello prueba que U es L.I. ♠

Observación 5.2.1. Coordenadas de un vector en una base ortogonal.


Sean S un subespacio de Rn y U = {u1 , u2 , . . . , ur } una base ortogonal de S (con esto
queremos decir que U es un conjunto ortogonal que además es base de S). Como sabemos,
para cada vector v ∈ S existen, y son únicos, escalares λ1 , λ2 , . . . , λr ∈ R de modo que
v = λ1 u1 + λ2 u2 + . . . + λr ur . Estos escalares son las coordenadas de v en la base U .
Veamos que, en este caso (U ortogonal) estas coordenadas admiten una expresión muy
simple. En efecto, al realizar el producto interno hv, u1 i obtenemos:

hv, u1 i = hλ1 u1 + λ2 u2 + . . . + λr ur , u1 i = λ1 hu1 , u1 i + λ2 hu2 , u1 i + . . . + λr hur , u1 i

Como U es un conjunto ortogonal, el vector u1 es ortogonal a los restantes vectores de U


y, por lo tanto, huj , u1 i = 0, ∀ j 6= 1. Es ası́ que la igualdad anterior se reduce a:

hv, u1 i = λ1 hu1 , u1 i

Como hu1 , u1 i =
6 0 (pues ninguno de los vectores de U es el vector nulo, por ser U base de
hv, u1 i
S), resulta que la primera coordenada vale λ1 = .
hu1 , u1 i
Si en lugar de haber realizado el producto interno de v por u1 , lo hubiésemos hecho por u2 ,
hv, u2 i
habrı́amos obtenido λ2 = . (Obsérvese la analogı́a con la demostración del teorema
hu2 , u2 i
anterior).

hv, ui i
Luego, razonando de manera análoga, se demuestra que la coordenada λi vale .
hui , ui i
Es ası́ que la expresión del vector v en la base ortogonal U es:

hv, u1 i hv, u2 i hv, ur i


v= u1 + u2 + . . . + ur
hu1 , u1 i hu2 , u2 i hur , ur i

Como los vectores de la suma son ortogonales dos a dos, aplicando el teorema de Pitágoras
para r sumandos obtenemos:

|hv, u1 i|2 |hv, u2 i|2 |hv, ur i|2


kvk2 = + + ... +
hu1 , u1 i hu2 , u2 i hur , ur i
136 Capı́tulo 5. Rn como espacio euclidiano

Si además, la base U es ortonormal, la expresión de v en dicha base queda:


v = hv, u1 iu1 + hv, u2 iu2 + . . . + hv, ur iur
y, por lo tanto:
kvk2 = |hv, u1 i|2 + |hv, u2 i|2 + . . . + |hv, ur i|2
   
1 −2
Ejemplo 5.2.2. U = , es una base ortogonal de R2 . Calculemos las
1 2
 
a
coordenadas de un vector genérico v = en la base U . Para ello alcanza con aplicar
b
directamente las fórmulas:
hv, u1 i hv, u2 i
λ1 = , λ2 =
hu1 , u1 i hu2 , u2 i
Se tiene:
hv, u1 i a+b
λ1 = =
hu1 , u1 i 2
hv, u2 i −2a + 2b
λ2 = =
hu2 , u2 i 8
En otras palabras, la expresión de v en la base U es:
       
a a+b 1 −2a + 2b −2
= +
b 2 1 8 2

Definición 5.2.2. Vector ortogonal a un conjunto.


Sean H un subconjunto cualquiera de Rn y v ∈ Rn . Diremos que v es ortogonal al conjunto
H, y escribiremos v ⊥ H, si y solo si, v es ortogonal a todos los vectores de H, esto es:
v ⊥ h, ∀ h ∈ H.
Teorema 5.2.2. Condición necesaria y suficiente para que un vector sea orto-
gonal a un subespacio.
Sean S un subespacio de Rn y v ∈ Rn . Entonces v es ortogonal a S si, y solo si, v es
ortogonal a un generador de S.
Demostración. Tenemos que probar directo y recı́proco.
( =⇒ ) Esta parte es trivial. En efecto, como todo generador de S está contenido en S, si
v es ortogonal a todos los vectores de S también será ortogonal a los vectores de un
generador de S.
( ⇐= ) Esta es la parte interesante. Sea U = {u1 , u2 , . . . , ur } ⊂ S un generador de S de
modo que v sea ortogonal a los vectores de U : v ⊥ ui , ∀ i = 1, . . . , r. Recordemos
que esto quiere decir que hv, ui i = 0, ∀ i = 1, . . . , r. Tenemos que demostrar que v es
ortogonal a todos los vectores de S. Sea entonces s un vector cualquiera de S. Como
g
U → S existen escalares α1 , α2 , . . . , αr ∈ R tales que s = α1 u1 + α2 u2 + . . . + αr ur .
Se tiene:
hv, si = hv, α1 u1 + α2 u2 + . . . + αr ur i = α1 hv, u1 i + α2 hv, u2 i + . . . + α1 hv, ur i = 0
Resulta entonces que hv, si = 0 y, por lo tanto, v ⊥ s. ♠
5.2. Conjuntos ortogonales y proyecciones ortogonales 137

Observación 5.2.2. Proyección ortogonal sobre un subespacio cualquiera.


Las ideas iniciales introducidas en la proposición 5.1.5 referidas a la proyección ortogonal
de un vector sobre otro pueden extenderse a la proyección ortogonal sobre un subespacio
cualquiera. A los efectos de visualizarlo geométricamente, consideremos un subespacio S
de dimensión 2 en R3 . En este caso, S es un plano que pasa por el origen. Dado un vector
p ∈ R3 (lo podemos pensar como vector o como punto), esperamos que el lector posea una
imagen conceptual de su proyección ortogonal sobre S.

o
z

La idea consiste en considerar la recta que pasa por el punto p y es perpendicular al plano
S y luego intersectarla con dicho plano. El punto z obtenido es la proyección ortogonal de
p sobre S. Este punto (o vector) z tiene las siguientes propiedades:

z ∈ S.

El vector p − z es ortogonal a S.

z es el punto de S más próximo a p. En efecto (ver próxima figura) si s es otro punto


de S diferente de z entonces el teorema de Pitágoras permite afirmar que d(p, z) <
d(p, s), ya que d(p, s) es la medida de la hipotenusa de un triángulo rectángulo del
cual d(p, z) es la medida de uno de los catetos.

o
z

El siguiente teorema establece que la situación que acabamos de describir también es válida
para cualquier subespacio de Rn .
138 Capı́tulo 5. Rn como espacio euclidiano

Teorema 5.2.3. Proyección ortogonal sobre un subespacio.


Sean S un subespacio de Rn y p ∈ Rn . Entonces existe un único vector z ∈ S que cumple:
(a) p − z ⊥ S.

(b) Si U = {u1 , u2 , . . . , ur } es una base ortogonal de S entonces


hp, u1 i hp, u2 i hp, ur i
z= u1 + u2 + . . . + ur
hu1 , u1 i hu2 , u2 i hur , ur i

(c) ∀ s ∈ S, s 6= z, se cumple que d(p, z) < d(p, s).


Demostración. Como z ∈ S y U es una base de S, z se puede escribir de manera única
como combinación lineal de U . Existen entonces escalares λ1 , λ2 , . . . , λr únicos tales que
z = λ1 u1 + λ2 u2 + . . . + λr ur . Queremos imponer que p − z sea ortogonal a S, para lo
cual alcanza (teorema 5.2.2) con que p − z sea ortogonal a todos los vectores de una base
de S. Impongamos entonces que p − z sea ortogonal a uk para k = 1, 2, . . . , r.

0 = hp − z, uk i = hp − (λ1 u1 + λ2 u2 + . . . + λr ur ), uk i =
= hp, uk i − h(λ1 u1 + λ2 u2 + . . . + λr ur ), uk i = hp, uk i − λk huk , uk i
en la última igualdad hemos usado que hui , uk i = 0 para i 6= k, debido a que U es
un conjunto ortogonal. Como huk , uk i =
6 0 (ya que al ser base U no contiene al vector
hp,uk i
nulo), podemos despejar λk obteniendo λk = hu k ,uk i
. Hemos demostrado que existe un
único vector z que cumple (a) y (b). Para probar que este vector también cumple (c)
consideramos un vector cualquiera s ∈ S, s 6= z. Tenemos:

p − s = (p − z) + (z − s)

Como z − s ∈ S y p − z ⊥ S resulta (p − z) ⊥ (z − s). Aplicando el teorema de Pitágoras


obtenemos
kp − sk2 = kp − zk2 + kz − sk2
La igualdad anterior y el hecho de que kz−sk > 0 (pues z 6= s) implican kp−sk2 > kp−zk2 ,
lo cual es equivalente a d(p, s) > d(p, z). ♠

Definición 5.2.3. Proyección ortogonal sobre un subespacio.


Si S es un subespacio de Rn y p ∈ Rn , entonces el vector z que cumple las propiedades
demostradas en el teorema anterior se denomina proyección ortogonal de p sobre S
y se simboliza PS (p).
Observación 5.2.3. Desigualdad de Bessel.
Sean S un subespacio de Rn y x ∈ Rn . Si PS (x) es la proyección ortogonal de x sobre S
entonces del teorema de Pitágoras resulta:

kxk2 = kx − PS (x)k2 + kPS (x)k2

De la igualdad anterior se deduce que kPS (x)k2 ≤ kxk2 y, por lo tanto:

kPS (x)k ≤ kxk


5.2. Conjuntos ortogonales y proyecciones ortogonales 139

Más aún, se cumple la igualdad si, y solo si, PS (x) = x, lo cual quiere decir que x ∈ S.

Si U = {u1 , u2 , . . . , ur } es una base ortogonal de S entonces tenemos la siguiente fórmula


que permite hallar PS (x):
hx, u1 i hx, u2 i hx, ur i
PS (x) = u1 + u2 + . . . + ur
hu1 , u1 i hu2 , u2 i hur , ur i
Si observamos con atención esta expresión y recordamos la proposición 5.1.5 podemos
concluir que la proyección ortogonal de x sobre S coincide con la suma de las proyecciones
ortogonales de p sobre cada uno de los vectores de U . Como los vectores de cada sumando
son ortogonales 2 a 2 el teorema de Pitágoras nos permite afirmar que:
|hx, u1 i|2 |hx, u2 i|2 |hx, ur i|2
kPS (x)k2 = + + ... +
hu1 , u1 i hu2 , u2 i hur , ur i
Como kPS (x)k2 ≤ kxk2 , deducimos que, cualquiera sea x ∈ Rn , se cumple
|hx, u1 i|2 |hx, u2 i|2 |hx, ur i|2
+ + ... + ≤ kxk2
hu1 , u1 i hu2 , u2 i hur , ur i
que suele denominarse Desigualdad de Bessel.

Si además la base U es ortonormal entonces se tiene:


PS (p) = hp, u1 iu1 + hp, u2 iu2 + . . . + hp, ur iur
y, por lo tanto, la desigualdad de Bessel queda:
|hx, u1 i|2 + |hx, u2 i|2 + . . . + |hx, ur i|2 ≤ kxk2
En resumen, si {u1 , u2 , . . . , ur } es un conjunto ortonormal en Rn entonces, cualquiera
sea el vector x ∈ Rn se cumple:
r
X
|hx, uk i|2 ≤ kxk2
k=1

La igualdad se cumple si, y solo si, x pertenece al subespacio generado por {u1 , u2 , . . . , ur },
lo cual siempre ocurrirá si este conjunto es base de Rn .
Definición 5.2.4. Distancia de un punto a un conjunto.
Sean H un subconjunto cualquiera de Rn y p ∈ Rn . Llamaremos distancia de p a H a
la menor de las distancias (en caso que exista) entre p y los puntos de H. Este número lo
simbolizaremos d(p, H). En sı́mbolos:
d(p, H) = min { d(p, h) / h ∈ H }
Observación 5.2.4. Sobre la distancia de un punto a un subespacio.
Si S es un subespacio de Rn y p ∈ Rn entonces del teorema 5.2.3 sabemos que el punto de
S más próximo a p es PS (p). Luego, la distancia de p a S vale:
d(p, S) = kp − PS (p)k
Resulta claro entonces que d(p, S) = 0 ⇐⇒ kp−PS (p)k = 0 ⇐⇒ PS (p) = p ⇐⇒ p ∈ S.
140 Capı́tulo 5. Rn como espacio euclidiano

4
Ejemplo 5.2.3. Sea S el subespacio
 de R generado por {e1 , e3 }. Queremos hallar la
−3
 3 
proyección ortogonal de p =   1  sobre S y calcular la distancia de p a S. Como

4
{e1 , e3 } es una base ortonormal de S tenemos:
 
−3
 0 
PS (p) = hp, e1 ie1 + hp, e3 ie3 = −3e1 + e3 = 
 1 

Luego:
     
−3 −3 0

 3   0   3  √
 1  −  1  = 
d(p, S) =       = 25 = 5
0


4 0 4

Definición 5.2.5. Complemento ortogonal de un subespacio.


Sea S un subespacio de Rn . Llamaremos complemento ortogonal de S al conjunto de
todos los vectores de Rn que son ortogonales a S. Este conjunto se simbolizará S ⊥ . En
sı́mbolos:
S ⊥ = { x ∈ Rn / x ⊥ S }

Ejemplo 5.2.4. Sea S un subespacio de R3 de dimensión 2, es decir un plano que pasa


por el origen. Argumentos geométricos simples permiten concluir que, en este caso, S ⊥ es
una recta que pasa por el origen y es perpendicular a dicho plano.

S⊥

o
S

¿Cuál es el complemento ortogonal en R3 de un subespacio de dimensión 1?


⊥
Encuentre R3 y ({o})⊥ .
5.2. Conjuntos ortogonales y proyecciones ortogonales 141

Proposición 5.2.1. Una caracterización del complemento ortogonal.


Sean S un subespacio de Rn y U = {u1 , u2 , . . . , uk } un generador de S. Entonces S ⊥
coincide con el núcleo de la matriz (MU )t . En otros palabras, se cumple que:
 
S ⊥ = N (MU )t
Demostración. Como S es el subespacio generado por U , todo vector de S se puede
expresar como C.L. de U . Recordemos también que cada C.L. de U es de la forma MU λ
en donde λ es un vector cualquiera de Rk (el vector de los coeficientes de la C.L.). Tenemos
entonces que
x ∈ S ⊥ ⇐⇒ x ⊥ S ⇐⇒ x ⊥ L(U ) ⇐⇒ x ⊥ MU λ , ∀ λ ∈ Rk ⇐⇒
hMU λ, xi = 0 , ∀ λ ∈ Rk ⇐⇒ hλ, (MU )t xi = 0 , ∀ λ ∈ Rk ⇐⇒ (MU )t x = o
 
⇐⇒ x ∈ N (MU )t ♠
Observación 5.2.5. Complemento ortogonal del subespacio generado por las
columnas de una matriz.
Sea A una matriz de tamaño n × k, U = C(A) el conjunto de sus columnas y S = L(U )
el subespacio generado por las columnas de A. En este caso la matriz MU coincide con la
matriz A. Según la proposición anterior podemos afirmar que

( L (C(A)) )⊥ = N At
O sea, lo que está diciendo la proposición anterior es que el complemento ortogonal del
subespacio generado por las columnas de una matriz A coincide con el núcleo de la tras-
puesta de A.
Proposición 5.2.2. Propiedades del complemento ortogonal.
Sean S un subespacio de Rn y S ⊥ su complemento ortogonal. Entonces:
1. S ⊥ es un subespacio de Rn .

2. dim(S) + dim S ⊥ = n.
3. Para cada vector v ∈ Rn existen y son únicos vectores z ∈ S y w ∈ S ⊥ tales que
v = z + w.
Demostración.
1. Según la proposición anterior, S ⊥ es el núcleo de una matriz con n columnas y, por
lo tanto, es un subespacio de Rn .

2. Si S = {o} entonces ({o})⊥ = Rn y la igualdad dim(S)+dim S ⊥ = n es inmediata.
Supongamos entonces S 6= {o} y consideremos una base U = {u1 , u2 , . . . , ur } de
S. A partir de la relación entre el rango y el núcleo de una matriz obtenemos:
   
rg (MU )t + nu (MU )t = n
    
Como S ⊥ = N (MU )t (proposición anterior), tenemos que nu (MU )t = dim S ⊥ .
Por otra parte, como el rango de una matriz y de su traspuesta coinciden, tenemos:
t
rg (MU ) = rg [(MU )] = dim(S).
Se deduce entonces que:
 
dim(S) + dim S ⊥ = n
142 Capı́tulo 5. Rn como espacio euclidiano

3. Sea v ∈ Rn . Si PS (v) es la proyección ortogonal de v sobre S, del teorema 5.2.3


sabemos que PS (v) ∈ S, v − PS (v) ∈ S ⊥ , y es claro que se cumple la igualdad
v = PS (v) + (v − PS (v)). Es ası́ que se cumple la igualdad enunciada tomando
z = PS (v) y w = v − PS (v). Falta demostrar que dicha descomposición es única.
Supongamos que existan z ′ ∈ S y w′ ∈ S ⊥ tales que v = z ′ +w′ . Restando obtenemos
o = (z − z ′ ) + (w − w′ ) con z − z ′ ∈ S y w − w′ ∈ S ⊥ . Aplicando Pitágoras obtenemos
kz − z ′ k2 + kw − w′ k2 = 0, lo cual implica que z = z ′ y w = w′ . ♠

Ejemplo  5.2.5.
 Sea Sel subespacio
 de R4 generado por U = {u1 , u2 } en donde
1 2
 0   −1  ⊥
u1 =   1  y u2 =  1 . Vamos a hallar S . Para ello consideramos un vector
  

0 1
 
a
 b 
genérico v =   c  e imponemos que v ⊥ S. Según el teorema 5.2.2 es suficiente con que

d
v ⊥ u1 y v ⊥ u2 . Se tiene:
v ⊥ u1 ⇐⇒ hv, u1 i = 0 ⇐⇒ a + c = 0.
v ⊥ u2 ⇐⇒ hv, u2 i = 0 ⇐⇒ 2a − b + c + d = 0.
Resolviendo el sistema obtenemos:
        

 a 
 
 1 0 

    
⊥ b  0   1 
S =    / a, b ∈ R = a   + b   / a, b ∈ R

 −a  
   −1   0  
    

−a + b −1 1
   
1 0
 0 

 1 . Más aún,
 
Resulta entonces que S ⊥ = L({v1 , v2 }) siendo v1 =   −1  y v 2 =  0 
−1 1
{v1 , v2 } es una base de S ⊥ .

Observemos que, efectivamente, dim(S) + dim S ⊥ = 4. También vale la pena observar
lo siguiente. Sabemos que todo vector de R4 se expresa de manera única como la suma de
un vector de S más uno de S ⊥ . Como {u1 , u2 } es base de S y {v1 , v2 } es una base de S ⊥ ,
entonces todo vector de R4 se expresa de manera única como C.L. de {u1 , u2 , v1 , v2 }. Se
deduce que este conjunto es base de R4 .

En el teorema 5.2.3 consideramos una base ortogonal de un subespacio S. El siguiente


resultado muestra que eso siempre es posible, es decir, que todo subespacio tiene una base
ortogonal (y, por lo tanto, una base ortonormal).
Teorema 5.2.4. Proceso de ortogonalización de Gram-Schmidt.
Sea V = {v1 , v2 , . . . , vr } un conjunto L.I. en Rn . Entonces existe un conjunto
U = {u1 , u2 , . . . , ur } L.I. y ortogonal tal que L(U ) = L(V ). Más aún, para cada k con
1 ≤ k ≤ r, el subespacio generado por {u1 , . . . , uk } coincide con el subespacio generado
por {v1 , . . . , vk }.
5.2. Conjuntos ortogonales y proyecciones ortogonales 143

Demostración. El proceso es constructivo.

Paso 1: Comenzamos tomando u1 = v1 . Es claro que u1 6= o (pues V era L.I.) y que


L({u1 }) = L({v1 }).

Paso 2: Queremos encontrar un vector u2 tal que u2 ⊥ u1 y de modo que L({u1 , u2 }) =


L({v1 , v2 }). Para ello consideramos la proyección ortogonal z2 de v2 sobre u1

v2
u2 = v2 − z2

o u1 = v1 z2

De esa forma tomamos


hv2 , u1 i
u2 = v2 − z2 = v2 − u1
hu1 , u1 i

Sabemos que, de esta manera, u2 ⊥ u1 . Además, u2 6= o (pues, como V es L.I. , z2 6= v2 )


y además L({u1 , u2 }) = L({v1 , v2 }) pues se modificó un generador de manera adecuada
según la proposición 4.3.1.

Paso 3: Queremos encontrar ahora un vector u3 tal que u3 ⊥ u1 , u3 ⊥ u2 y de modo que


L({u1 , u2 , u3 }) = L({v1 , v2 , v3 }). Para ello consideramos la proyección ortogonal z3 de v3
sobre L({u1 , u2 }) y tomamos
 
hv3 , u1 i hv3 , u2 i
u3 = v3 − z3 = v3 − u1 + u2
hu1 , u1 i hu2 , u2 i

u3

v3

u1

u2

z3
144 Capı́tulo 5. Rn como espacio euclidiano

Nuevamente, el teorema 5.2.3 asegura que u3 ⊥ u1 y u3 ⊥ u2 . Con argumentos similares


a los del paso 2 se deduce que u3 6= o y que L({u1 , u2 , u3 }) = L({v1 , v2 , v3 }).

El proceso se continúa de manera análoga obteniendo que los vectores uk (k = 2, . . . , r)


vienen dados por la expresión:
 
hvk , u1 i hvk , u2 i hvk , uk−1 i
uk = vk − zk = vk − u1 + u2 + . . . uk−1
hu1 , u1 i hu2 , u2 i huk−1 , uk−1 i
Ejemplo 5.2.6. Sea S el subespacio de R4 generado por V = {v1 , v2 , v3 } en donde
     
1 2 5
 0 
 , v2 =  1  , v3 =  0 
   
v1 =  1   0   −1 
0 0 3
V es L.I. (no deje de verificarlo) y, por lo tanto, es una base de S, pero no es un con-
junto ortogonal pues hv1 , v2 i = 2 6= 0. Vamos a aplicar el proceso de Gram-Schmidt para
construir una base ortogonal U de S a partir de la base V . Se tiene:
 
1
 0 
u1 = v1 =  
 1 
0
     
2 1 1
hv2 , u1 i  1  2 0   1 
u2 = v2 −  0  − 2  1  =  −1 
u1 =      
hu1 , u1 i
0 0 0
       
  5 1 1 1
hv3 , u1 i hv3 , u2 i  0  4  0  6  1   −2 
v3 − u1 + u2 =   −1  − 2  1  − 3  −1  =  −1 
      
hu1 , u1 i hu2 , u2 i
3 0 0 3
Resulta entonces que una base ortogonal de S es:
     

 1 1 1 

   
0   1   −2
 
U=   1  ,  −1  ,  −1



 
 
0 0 3

Definición 5.2.6. Matrices ortogonales.


Sea A una matriz n×n. Diremos que A es una matriz ortogonal si, y solo si, sus columnas
constituyen una base ortonormal de Rn .
Ejemplo 5.2.7. Las siguientes matrices son ortogonales pues sus columnas constituyen
bases ortonormales de R2 y R3 respectivamente:
!  
√1 −1
√ 0 0 1
A= 2 2 , B= 1 0 0 
√1 √1
2 2 0 1 0
5.2. Conjuntos ortogonales y proyecciones ortogonales 145

Observemos lo que ocurre al multiplicar At A y B t B:


1 1
! 1 −1
!  
√ √ √ √ 1 0
t 2 2 2 2
AA= −1 √1 √1 √1
=

2 2 2 2
0 1
    
0 1 0 0 0 1 1 0 0
B tB =  0 0 1   1 0 0  =  0 1 0 
1 0 0 0 1 0 0 0 1
La siguiente proposición muestra que lo que ocurrió en este ejemplo es, de hecho, un
resultado general.

Proposición 5.2.3. Sea A una matriz n × n. Entonces A es ortogonal si, y solo si,
At A = I (en donde I es la matriz identidad n × n).

Demostración. Designemos con C1 (A), C2 (A), . . . , Cn (A) a las columnas de A y con


cij a la entrada de la matriz At A correspondiente a la fila i y columna j. Recordando la
definición de producto de matrices observamos que cij coincide con el producto interno de
la fila i de At por la columna j de A. Pero la fila i de At coincide con la columna i de A.
Es ası́ que cij = hCi (A), Cj (A)i. Se tiene:
 
t 1, si i = j 1, si i = j
A A = I ⇐⇒ cij = ⇐⇒ hCi (A), Cj (A)i =
0, si i 6= j 0, si i 6= j

y esto ocurre si, y solo si, las columnas de A constituyen una base ortonormal de Rn , o
sea, si y solo si, A es una matriz ortogonal. ♠

Proposición 5.2.4. Caracterización de las matrices ortogonales.


Sea A una matriz n × n. Entonces las siguientes afirmaciones son equivalentes:

1. A es ortogonal.

2. kA.xk = kxk, ∀ x ∈ Rn (la matriz A preserva la norma).

3. hA.u, A.vi = hu, vi, ∀ u, v ∈ Rn (la matriz A preserva los productos internos).

Demostración.

((1) =⇒ (2)) Como A es ortogonal sabemos que At A = I. Si x es un vector cualquiera


de Rn se tiene:

kA.xk2 = hA.x, A.xi = hAt A.x, xi = hx, xi = kxk2

Como kA.xk2 = kxk2 y las bases son no negativas se deduce que kA.xk = kxk.

((2) =⇒ (3)) Para esta parte utilizaremos la (ya conocida) igualdad vista en la proposi-
ción 5.1.3 según la cual

2hx, yi = kx + yk2 − kxk2 − kyk2 , ∀ x, y ∈ Rn


146 Capı́tulo 5. Rn como espacio euclidiano

Tomando x = A.u, y = A.v tenemos:

2hA.u, A.vi = kA.u + A.vk2 − kA.uk2 − kA.vk2 = kA.(u + v)k2 − kA.uk2 − kA.vk2

Como, por hipótesis, A preserva las normas de los vectores, lo anterior coincide con

ku + vk2 − kuk2 − kvk2

que, a su vez, es igual a 2hu, vi. Hemos probado que 2hA.u, A.vi = 2hu, vi y, por lo
tanto, hA.u, A.vi = hu, vi.
((3) =⇒ (1)) Si Ci (A) es la columna i-ésima de A sabemos que Ci (A) = A.ei (siendo ei
en i-ésimo vector de la base canónica). Luego:

hCi (A), Cj (A)i = hA.ei , A.ej i = hei , ej i = 0 si i 6= j.

Lo anterior prueba que dos columnas diferentes de A son ortogonales. Por otra parte:

kCi (A)k2 = hCi (A), Ci (A)i = hA.ei , A.ei i = hei , ei i = 1

de donde queda probado que cada columna de A tiene norma 1. ♠

Ejercicio 5.2.1. En cada uno de los siguientes casos investigue si U es un conjunto


ortogonal y si U es base de R3 .
           
 1 3 2   2 3 0 
(a) U =  2  ,  1 ,  −1  (b) U =  2  , 1
  , 0 

   
−1 5 0 −2 4 0
          
 3 4   1 2 2 
(c) U =  −2  ,  3  , (d) U =  2  ,  0  ,  −5 
   
3 2 −2 1 −4
     2 
 1 0 a + b2 
(e) U =  b  ,  −a  ,  −b 
 
a b −a
     
 1 0 13 
Ejercicio 5.2.2. Demuestre que U =  2  ,  −3  ,  −2  es una base ortogo-
 
3 2 −3
nal de R3 . Encuentre las coordenadas de un vector genérico de R3 en la base U . (Recuerde
la observación 5.2.1).
   
 1 0 
Ejercicio 5.2.3. Se considera el subespacio S de R3 generado por  −2  ,  1  .
 
2 1
En cada uno de los siguientes casos encuentre la proyección ortogonal de p sobre S y
calcule la distancia de p a S.
       
1 0 1 0
(a) p =  0  (b) p =  2  (c) p =  −1  (d) p =  0 
0 2 3 1
5.2. Conjuntos ortogonales y proyecciones ortogonales 147

⊥
Ejercicio 5.2.4. Si S es un subespacio de Rn demuestre que S ⊥ = S.
Ejercicio 5.2.5. Sean S1 y S2 subespacios de Rn . Diremos que S1 ⊥ S2 si, y solo si,
u ⊥ v, ∀ u ∈ S1 , ∀ v ∈ S2 (es decir, cuando todo vector de S1 es ortogonal a todo vector
de S2 ). Demuestre que S1 ⊥ S2 si, y solo si algún generador de S1 es ortogonal a algún
generador de S2 .
Ejercicio 5.2.6. Consideremos el conjunto
     

 1 0 2 

     1 
0 1
U=   , 
    ,   ⊂ R4

 1 0   −2  
 
0 −1 1
 
2
 0 
1. Sean S = L(U ) y p =   3 . Encuentre la proyección ortogonal de p sobre S y

0
calcule d(p, S).
2. Encuentre S ⊥ . Halle una base de S ⊥ .
3. Encuentre una base de R4 formada por vectores de S y de S ⊥ .
Ejercicio 5.2.7. Consideremos el conjunto
     

 2 1 1 

   0 
−1   2 4
U=   0  ,  1   α  ⊂R
   ,  

 
 
1 0 β
1. Determine α y β para que U sea un conjunto ortogonal. Se continúa trabajando con
los valores de α y β hallados.
 
2
 −1 
2. Sean S = L(U ) y p =   0 . Encuentre la proyección ortogonal de p sobre S y

1
calcule d(p, S).
3. Encuentre la forma de los vectores de S ⊥ (es decir, los vectores de R4 que son
perpendiculares a S). Halle una base de S ⊥ .
S
4. Sea w un vector no nulo de S ⊥ . Pruebe que U {w} es base de R4 .
5. Pruebe que ku + wk2 = kuk2 + kwk2 , ∀ u ∈ S, ∀ w ∈ S ⊥ .
 
1 1 1
Ejercicio 5.2.8. Se considera la matriz A =  a 0 −a 
−1 1 a + 1
1. Discuta, según a ∈ R, el valor del rango y la nulidad de A.
2. Se continúa trabajando con a = 2. Sea S el subespacio generado por las columnas de
A. Demuestre que las dos primeras columnas de Aconstituyen  una base ortogonal
2
de S. Encuentre el punto de S más próximo a p =  −1 
0
148 Capı́tulo 5. Rn como espacio euclidiano

3. Encuentre S ⊥ .
 
4. Encuentre N At y verifique que S ⊥ = N At . (observación 5.2.5).

Ejercicio 5.2.9. Si B es una matriz demuestre que (N (B))⊥ coincide con el subespacio
generado por las columnas de B t . Se sugiere recordar la observación 5.2.5.
 
1 0 1 1
 0 1 −1 1 
Ejercicio 5.2.10. Consideremos la matriz: A =   2

1 1 3 
1 −1 2 0
1. Halle una base de N (A).
2. Verifique que nu(A) = 2 y halle rg(A).
3. Encuentre una base U = {u1 , u2 } de N (A) que sea ortonormal.
 
−2
 0 
 1  ∈ N (A) y halle las coordenadas de v en la base U .
4. Verifique que v =  

1
Ejercicio 5.2.11. Sea H un subconjunto de Rn (no necesariamente subespacio). Se llama
complemento ortogonal de H al conjunto H ⊥ = { x ∈ Rn / x ⊥ H }. Demuestre que
H ⊥ es un subespacio de Rn (aunque H no lo sea). Se sugiere probar las condiciones de la
definición de subespacio.

Ejercicio 5.2.12. Sean A una matriz n × n y u un vector fijo de Rn . Se considera el


conjunto S definido por
S = {x ∈ Rn / Ax = hx, ui u}
1. Demuestre que S es un subespacio de Rn .
   
1 −1 1 1
2. Para A =  2 1 2  y u =  1  obtenga una base de S y halle todos lo
1 0 1 1
vectores ortogonales a S.
    
 1 1 
Ejercicio 5.2.13. Se consideran el conjunto V =  1  ,  1  y el subespacio
 
0 3
S = L(V ).
1. Halle un conjunto ortogonal U tal que L(U ) = S.
 
1
2. Calcule la distancia de v =  1  a S.
0
3. Halle un vector h1 de S tal que el águlo formado por e1 y h1 sea π3 .
      

 1 1 0 
       
1  ,   ,  1  y el subes-
0
Ejercicio 5.2.14. Se consideran el conjunto V =   0   1   1 

 
 
0 0 0
pacio S = L(V ).
5.2. Conjuntos ortogonales y proyecciones ortogonales 149

1. Pruebe que V es L.I. pero no ortogonal.


2. Utilice el proceso de Gram-Schdmidt para construir a partir de V un conjunto orto-
gonal U que sea base de S.
 
0
 0 
3. Calcule la distancia de p = 
 0  a S. (Se sugiere reflexionar un poco y no realizar

e
π
cuenta alguna).

Ejercicio 5.2.15. Se consideran los puntos


     
1 2 2
p1 =  0  , p2 =  2  , p3 =  −1 
1 2 2

y el plano H de R3 determinado por esos tres puntos.


1. Encuentre la ecuación de H.
2. Demuestre que H es un subespacio de R3 .
   
 1 1 
3. Demuestre que  2  ,  −1  es una base ortogonal de H.
 
1 1
 
4
4. Sea p =  1 . Calcule la distancia de p a H y encuentre dos vectores z ∈ H y
0

w ∈ H tales que p = z + w.
 
1
 2 
  5
Ejercicio 5.2.16. Verifique que la distancia de p = 
 3  al subespacio de R generado

 4 
5
por {e1 + e2 , e3 + e4 , e5 } vale 1.

Ejercicio 5.2.17.
1. Encuentre un ejemplo de dos matrices A y B ortogonales tales que A + B no sea
ortogonal.
2. Si A y B son dos matrices n × n ortogonales demuestre que AB es ortogonal.

Ejercicio 5.2.18. Investigue si la siguiente proposición es verdadera o falsa justificando


la respuesta:
Si A es una matriz n × n tal que kAvk = kvk ∀ v ∈ Rn entonces Av = v, ∀ v ∈ Rn .
150 Capı́tulo 5. Rn como espacio euclidiano

5.3. Cálculo de distancias


5.3.1. Vector perpendicular a un plano.
En el capı́tulo 3 habı́amos observado que la ecuación de un plano Π en R3 es de la forma:

ax + by + cz = d (∗)

en donde a, b, c y dson constantes,


 con a, b y c no simultáneamente nulos. Esto quiere
x
decir que los puntos  y  que pertenecen a Π son aquellos cuyas componentes verifican
z
la ecuación (∗). El primer miembro de dicha ecuación  puede
 expresarse
 utilizando un
x a
producto interno entre dos vectores. En efecto, si x =  y  y u =  b  entonces (∗)
z c
se puede escribir ası́:
hx, ui = d , con u 6= o.

Veamos que el vector u tiene una interpretación geométrica simple y útil. Consideremos
entonces un plano Π cuya ecuación es hx, ui = d, en donde u es un vector no nulo. Si q1
y q2 son dos puntos distintos pertenecientes a Π se cumple:

hq1 , ui = d y hq2 , ui = d

Restando miembro a miembro y utilizando las propiedades del producto interno obtene-
mos:
hq1 − q2 , ui = 0
lo cual nos dice que el vector u es ortogonal a todos los vectores cuyos extremos son puntos
pertenecientes al plano.

o Π
q2

q1

Debido a lo anterior, diremos que u es un vector perpendicular (u ortogonal) al plano


Π. De hecho, todos los vectores colineales con u también lo serán.

Las observaciones previas nos permiten encontrar con suma facilidad la ecuación de un
plano que pasa por un punto p y es perpendicular a un vector no nulo u. En efecto, un
punto x pertenece a dicho plano si, y solo si, el vector x − p es ortogonal a u. Resulta
5.3. Cálculo de distancias 151

entonces que la ecuación del plano que pasa por p y es perpendicular a un vector no nulo
u es:
hx − p, ui = 0

   
1 2
Ejemplo 5.3.1. Sean p =  2  yu=  4 . Entonces la ecuación del plano Π que
−1 3
pasa por p y es perpendicular a u es:
* x   1   2 +
 y  −  2 , 4  = 0
z −1 3

o sea: 2x + 4y + 3z = 7.

5.3.2. Distancia de un punto a un plano.


Proposición 5.3.1. Distancia de un punto a un plano.
Sean p ∈ R3 y Π el plano de ecuación hx, ui = d. Entonces el punto p′ de Π más próximo
a p y la distancia de p al plano Π se pueden calcular mediante las siguientes expresiones:

d − hp, ui |hp, ui − d|
p′ = p + u , d(p, Π) =
hu, ui kuk

u
Π

o p′

Demostración. El punto p′ de Π más próximo a p se obtiene intersectando el plano Π


con la recta L que pasa por p y es perpendicular a Π. La ecuación paramétrica de L es
x = p + λu. Tenemos:
 
x = p + λu x = p + λu
⇐⇒
hx, ui = d hp + λu, ui = d

La segunda ecuación es una ecuación lineal de primer grado en la incógnita λ:

hp, ui + λhu, ui = d
152 Capı́tulo 5. Rn como espacio euclidiano

Como hu, ui = 6 0 (por ser u 6= o), la ecuación resulta compatible determinada con única
solución dada por:
d − hp, ui
λ =
hu, ui
Sustituyendo este valor de λ en la primera ecuación del sistema se obtiene
d − hp, ui
p′ = p + u
hu, ui

Ahora bien, la distancia de p al plano Π vale kp′ − pk. Finalmente, sustituyendo aquı́ la
|d − hp, ui|
expresión obtenida para p′ resulta la fórmula d(p, Π) = . ♠
kuk
 
a
Observación 5.3.1. Observemos en primer lugar que si u =  b  entonces la ecuación
c
hx, ui = d del  Π de la proposición anterior puede escribirse ax + by + cz − d = 0. Si
plano 
x0
el punto p es  y0  entonces la distancia de p al plano Π queda:
z0
|hp, ui − d| |ax0 + by0 + cz0 − d|
d(p, Π) = = √
kuk a2 + b2 + c2

 5.3.2. Consideremos el plano Π de ecuación x + 2y − 2z = 2 y el punto p =


Ejemplo

2
 −5 . Entonces:
1
|1 · 2 + 2 · (−5) + (−2) · 1 − 2| 12
d(p, Π) = p = =4
12 + 22 + (−2)2 3

El punto p′ de Π más próximo a p es:


     
2 1 10/3
d − hp, ui 12
p′ = p + u =  −5  +  2  =  −7/3 
hu, ui 9
1 −2 −5/3

5.3.3. Distancia de un punto a una recta.


Proposición 5.3.2. Distancia de un punto a una recta.
Sean p ∈ R3 y L la recta en R3 de ecuación paramétrica x = a + λv , con v 6= o (recta que
pasa por el punto a y es paralela al vector v). Entonces el punto p′ de L más próximo a
p y la distancia de p a la recta L se pueden calcular mediante las siguientes expresiones:
p′ = a + λ1 v , d(p, L) = kp − p′ k = kp − (a + λ1 v)k
en donde
hp − a, vi
λ1 =
hv, vi
5.3. Cálculo de distancias 153

Demostración. El punto p′ de L más próximo a p se obtiene intersectando la recta L


con el plano Π que pasa por p y es perpendicular a L (y por lo tanto a v). La ecuación de
Π es hx − p, vi = 0. La demostración consiste en hallar el dicho punto p′ y queda como
ejercicio. ♠

v
a

p′
Π
p

 
2
Ejemplo 5.3.3. Consideremos el punto p =  1  y la recta L de ecuaciones paramétri-
2

 x =1+λ
cas y = 1 − λ . Queremos hallar el punto de L más próximo a p y la distancia de p a L.

z =2+λ
 
1
Comenzamos observando que un punto que pertenece a la recta es a =  1  y que un
2
 
1
vector paralelo a la recta es v =  −1 . Apliquemos las fórmulas de la proposición
1
anterior:
hp − a, vi 1
λ1 = =
hv, vi 3
Luego, el punto p′ de L más próximo a p es:
     
1 1 4/3
1
p′ =  1  +  −1  =  2/3 
3
2 1 7/3

La distancia de p a L vale:
 
2/3 √

6
d(p, L) = kp − p k =
 1/3 =

−1/3 3
154 Capı́tulo 5. Rn como espacio euclidiano

 
3
Ejercicio 5.3.1. Sea H el plano que pasa por el punto  1  y es perpendicular al
1
 
1
vector  −2 . Calcule la distancia de los siguientes puntos al plano H:
4
   
1 1
p1 =  0  , p2 =  1 
1 −1
     
2 2 1
Ejercicio 5.3.2. Sea U = {u1 , u2 , u3 } siendo u1 =  1 , u2 =  1  y u3 =  2 
3 2 4
1. Calcule la distancia del punto u1 a la recta L que pasa por los puntos u2 y u3 .

2. Sea H el subespacio generado por {u1 , u2 }. Compruebe que H es un plano y calcule


la distancia del punto u3 a H.
 
1
Ejercicio 5.3.3. Se consideran el punto p =  1 , el plano Π de ecuación x+2y −z = 3
1

 x=1+λ
y la recta L de ecuaciones paramétricas y = −1 − λ .

z = −4 − λ
1. Pruebe que L ⊂ Π.
2. Calcule d(p, Π) y encuentre el punto de Π más próximo a p.
3. Calcule d(p, L) y encuentre el punto de L más próximo a p.
4. Verifique que d(p, Π) < d(p, L) y explique este resultado.
5. ¿Existe alguna recta L′ ⊂ Π tal que d(p, Π) = d(p, L′ )? Justifique la respuesta.
 
1
Ejercicio 5.3.4. Halle la ecuación paramétrica de la recta r que pasa por el punto  2 
3

x−y =3
y corta perpendicularmente a la recta s) ¿Qué da r ∩ s?
2x + z = 3

Ejercicio 5.3.5. Dados p y q puntos diferentes de R3 , se considera el conjunto H defi-


nido por: H = {x ∈ R3 / d(x, p) = d(x, q)}. Demuestre que H es un plano e interprete
geométricamente.    
1 2
Encuentre H en el caso en que p =  −1  y q =  0 .
1 1
5.4. Aproximación por el método de mı́nimos cuadrados 155

5.4. Aproximación por el método de mı́nimos cuadrados

En esta sección vamos a discutir un ejemplo interesante, donde casi todas la ideas que
se han desarrollado en el curso pueden aplicarse. Imaginemos que se desea construir un
modelo de demanda de un cierto producto. Existen fuertes indicios para suponer que
la cantidad d de personas dispuestas a comprar un cierto bien es una función lineal del
precio p del mismo. Es decir, d(p) = αp + β. Para ajustar el modelo se realiza una encuesta
consultando a las personas si estarı́an dispuestas a comprar el bien en cuestión a distintos
precios. La encuesta proporciona la siguiente tabla de datos:

precio demanda
p1 d1
p2 d2
.. ..
. .
pn dn

Como es natural suponer, los datos no resultarán (en general) estar alineados y se tra-
tará entonces de determinar α y β para que el modelo ajuste lo “mejor posible” a los
mismos. Primero que nada, claro está, debemos darle significado a la expresión lo “mejor
posible” porque, como veremos, puede haber muchos criterios razonables para hacerlo. La
solución que propondremos para este problema se conoce como método de mı́nimos
cuadrados.

5.4.1. Descripción del método.

Como dijimos anteriormente, no es razonable suponer que los datos empı́ricos estén ali-
neados y, por lo tanto, no existirá ninguna recta que pase por todos los puntos (pi , di ).
Intentaremos buscar entonces la recta que pase “mas cerca” de ellos. En el precio pi el
modelo lineal predice que αpi + β personas compraran el bien. Sin embargo, la encuesta
registró que a ese precio serı́an di las personas que comprarı́an. Una primera idea podrı́a
ser considerar la suma de las diferencias ri = di − (αpi + β), como una medida del error
global entre los datos empı́ricos y los dados por la recta. Se puede rápidamente objetar a
este procedimiento que los errores se compensarı́an y un error positivo muy grande y otro
negativo se anuları́an. Esta objeción podrı́a levantarse considerando la suma de valores
absolutos de la diferencias |ri |. Esta solución es razonable, pero conduce a un problema
muy complejo. El problema resulta mucho mas sencillo de resolver si se considera como
medida del error global la suma de los cuadrados de las diferencias ri2 . La idea es intentar
elegir α y β reales de modo que esta suma de errores cuadráticos sea los más pequeña
posible. En otras palabras deseamos encontrar α y β reales de modo que sea mı́nimo

n
X n
X
R(α, β) = ri2 = [di − (αpi + β)]2
i=1 i=1
156 Capı́tulo 5. Rn como espacio euclidiano

Recordando que la norma de un vector es la raı́z cuadrada de la suma de los cuadrados


de sus coordenadas podemos escribir la función R en estos términos. Llamando
     
d1 p1 1
 d2   p2   1 
     
d =  . , p =  . , 1 =  . 
.
 .   . .  .. 
dn pn 1

Se tiene que
      2

d1 p1 1


 d2 


 p2 


 1
 2
R(α, β) =  .. −α .. −β  = kd − (αp + β1)k
..

.   .   .


dn pn 1

En consecuencia, se trata de calcular, en caso de existir, α y β reales que minimicen el


valor de R(α, β). Veamos ahora cómo podemos reducir el problema al de proyectar un
vector sobre cierto subespacio.  
p1 1
 p2 1 
 
Para esto observemos primero que, llamando A =  . .  podemos escribir
.
 . .  .
pn 1
 
p1 1
   

 p2 1   α α
αp + β1 =  .. ..  β = A
 . .  β
pn 1

Entonces, variar α y β en R es equivalente a hacer combinaciones lineales de los vectores


p y 1 que son las columnas de la matriz A. En consecuencia, encontrar α0 y β0 reales que
minimicen R(α, β) es equivalente a determinar un vector v0 = α0 p + β0 1 en el subespacio
S = L ({p, 1}) que minimice la norma de la diferencia d − v. Como ya hemos visto ante-
riormente en el teorema 5.2.3, este problema tiene solución: debemos elegir v0 = α0 p + β0 1
como la proyección ortogonal de d sobre el subespacio S = L ({p, 1}). Ahora bien, si v0
es la proyección de d sobre S entonces d − v0 ∈ S ⊥ . Por otra parte, según la proposición
5.2.1 se cumple que S ⊥ = N (At ). Por lo tanto, el problema se reduce a calcular v0 tal que
d − v0 ∈ N (At ), es decir, necesitamos determinar v0 tal que At (d − v0 ) = o o, lo que es lo
mismo, tal queAt v0 = At d.
α0
Como v0 = A , sustituyendo arriba se observa que hallar v0 resulta equivalente a
β0
encontrar α0 y β0 solución del sistema
 
x
At A = At d
y

Este sistema se denomina ecuación normal del problema de mı́nimos cuadrados. Final-
mente, una observación clave es la siguiente: como las columnas de A forman un conjunto
5.4. Aproximación por el método de mı́nimos cuadrados 157

linealmente independiente, se tiene que At A es una matriz 2 × 2 invertible (ver ejercicio


5.1.8), de donde resulta:  
α0
= (At A)−1 At d
β0
Ejemplo 5.4.1. Veamos un ejemplo concreto para entender cómo funciona el método.
Supongamos que los datos empı́ricos registrados por la empresa encuestadora son los
indicados en la siguiente tabla, donde los precios se expresan en cientos de pesos y la
cantidad de compradores en miles de personas.

P recio Demanda
1 7
2 5
3 2
4 1

Se supone que la demanda resulta ser función lineal de precio, es decir d(p) = αp + β.
Como los datos no están alineados buscamos, aplicando el método de mı́nimos cuadrados,
α y β de mondo
 que la recta αp + β aproxime
 lo mejor posible los datos. Definimos el
1 7
 2   5 
vector p = 
 3  y el vector d =  2 .
  

4 1
 
1 1  
 2 1 
Resulta entonces la matriz A =   y su traspuesta es At = 1 2 3 4 .
 3 1  1 1 1 1
4 1
Por lo tanto  
  1 1  
1 2 3 4   2 1  = 30 10

At A =
1 1 1 1  3 1  10 4
4 1
Observamos que ni A ni At son invertibles (ni siquiera son cuadradas), pero el producto
de ambas At A sı́ es invertible. Las ecuaciones normales son entonces
 
     7  
30 10 α 1 2 3 4  5  27
=   =
10 4 β 1 1 1 1  2  15
1
Invirtiendo la matriz del sistema (o escalerizando, como guste el lector) se tiene que
 −1  1 
t −1 30 10 5 − 12
(A A) = =
10 4 − 12 3
2

y por lo tanto los valores de α y β son


   1    21 
α 5 − 12 27 − 10
= 1 3 =
β −2 2 15 9
158 Capı́tulo 5. Rn como espacio euclidiano

La función lineal para la demanda en función del precio que ha estimado el método de
mı́nimos cuadrados es entonces:
−21
d(p) = p+9
10
La gráfica de esta recta, ası́ como los cuatro puntos de la tabla de datos se indican en la
siguiente figura:

y 10
9

-1 1 2 3 4 5
-1 v2

El error cuadrático global R(α, β) resulta ser en este caso:


  X 4 4   2
−21 2
X −21
R ,9 = ri = di − pi + 5 = 0, 7
10 10
i=1 i=1

5.4.2. Una fórmula para la proyección ortogonal


Terminemos la sección observando que podemos obtener una fórmula explı́cita para la
proyección ortogonal que no requiere obtener previamente una base ortogonal. Con un ra-
zonamiento similar al que hicimos para el método de mı́nimos cuadrados, supongamos que
queremos proyectar un vector v cualquiera sobre un subespacio S y que B = {v1 , v2 , . . . , vr }
es una base cualquiera (no necesariamente ortogonal) de S. Como ya sabemos, el vector
proyección PS (v) ∈ S y, por lo tanto, es una combinación lineal de los vectores de la base
B. Existen entonces números x1 , x2 , . . . , xr tales que
 
x1
PS (v) = x1 v1 + . . . + xr vr = MB  ... 
 

xr
siendo MB la matriz cuyas columnas son los vectores de la base B. También sabemos que
S coincide con el subespacio generado por las columnas de MB de donde, por el teorema
⊥ t
5.2.1, se cumple que S = N (MB ) . Por otra parte se sabe que
 
x1
v − PS (v) ∈ S ⊥ ⇒ v − MB  ...  ∈ S ⊥ = N (MB )t
  

xr
5.4. Aproximación por el método de mı́nimos cuadrados 159

por lo tanto x1 , . . . , xr son números tales que


  

x1 x1
 ..
t t
(MB )t MB  ...  = (MB )t v
  
(MB ) v − (MB ) MB  . =o ⇒
xr xr

Por ser B una base de S, y por lo tanto un conjunto L.I., el rango de MB es r, de donde
resulta (ver ejercicio 5.1.8) que (MB )t MB es una matriz r×r invertible. Consecuentemente
el vector  
x1
 ..  t
−1
 .  = (MB ) MB (MB )t v
xr
 
x1
y como PS (v) = MB  ...  se deduce que
 

xr
−1
PS (v) = MB (MB )t MB (MB )t v

   
−1 1
 0   1 
Ejemplo 5.4.2. Se consideran en R4 el subespacio S = L    1  ,  −1  . Se
   

−1 2
 
2
 1 
quiere calcular el vector de S mas próximo a v = 
 1 . Sabemos que tal vector es la

2
proyección ortogonal de v sobre S.
Aplicamos entonces lo anterior. Definimos
 
−1 1  
 0 1  t −1 0 1 −1
MB =  
 1 −1  ⇒ (MB ) =
1 1 −1 2
−1 2

Multiplicando se obtiene
 
  −1 1  
−1 0 1 −1  0 1  3 −4
(MB )t MB =  1 −1  = −4
 
1 1 −1 2 7
−1 2

Calculando la inversa se tiene


 7 4

t
−1
(MB ) MB = 5 5
4 3
5 5
160 Capı́tulo 5. Rn como espacio euclidiano

Calculando ahora la proyección obtenemos


     3 
−1 1  7 4   2 5
 0 1  −1 0 1 −1  1   6 
PS (v) =   5 5  = 5 
 1 −1  4 3 1 1 −1 2  1   − 35 
5 5
9
−1 2 2 5

Calcule el lector la distancia de v a S y verifique que efectivamente el vector que obtuvimos


es la proyección, ¿cómo se puede hacer esto?.
Ejercicio 5.4.1. En un experimento se midió, según el tiempo, una cierta magnitud y,
obteniéndose los siguientes valores
t 0 1 3 4
y 0 1 2 5
1. Grafique y contra t .
2. Aplicando el método de mı́nimos cuadrados halle la “mejor” recta que ajuste los
datos anteriores (y = αt + β). Grafique la solución.
3. Aplicando el método de mı́nimos cuadrados halle la “mejor” parábola que ajuste los
datos anteriores (y = αt2 + βt + γ). Grafique la solución.
Ejercicio 5.4.2. (Tomado de [Moretti] pág. 264). Los datos de la tabla corresponden a
los precios y a las cantidades de naranja vendidas en un supermercado durante doce dı́as
consecutivos (precios en pesos por kilo y cantidades en kilos).

Precio p 10,0 9,0 8,0 7,0 7,0 7,0 7,0 6,5 6,0 6,0 5,5 5,0
Cantidad y 55 70 90 100 90 105 80 110 125 115 130 130

Aplicando el método de mı́nimos cuadrados halle la “mejor” recta que ajuste los datos
anteriores (y = αp + β). Calcule el error cuadrático global.
  

 x 

  
y 4
Ejercicio 5.4.3. Sea S =   ∈ R : x + y − z + t = 0 , −x − y + t = 0
 

 z 

 
t
 
−1
 1 
1. Halle el vector w de S mas próximo a v =   0 

1
2. Verifique que v − w es perpendicular a S.
3. Calcule la distancia de v a S.
Ejercicio 5.4.4. Se supone que la magnitud y depende de t según una ley del tipo y =
f (t) = a + bt2 . Determine, usando el método de mı́nimos cuadrados, la función f (t) que
mejor se ajusta a los siguientes datos experimentales:

t -1 0 1 2
y -1 2 -1 8
Capı́tulo 6

Diagonalización

6.1. Introducción

La utilización de matrices de dimensiones grandes en el planteo y resolución de problemas


prácticos concretos (como el desarrollado en la última sección del capı́tulo anterior), moti-
varon el desarrollo de un área cientı́fica denominada “Cálculo Numérico” que tiene, entre
otros objetivos, la creación e implementación de algoritmos computacionales eficientes que
permiten resolver sistemas de ecuaciones y realizar todo tipo de operaciones con matri-
ces. Si bien el estudio de dichos algoritmos está fuera de nuestros objetivos, intentaremos
aquı́ presentar algunas ideas que sirvan de motivación para comprender la relevancia de
los contenidos de este capı́tulo.

Supongamos que tenemos una matriz A de tamaño n × n (n puede ser “grande”) y que
necesitamos calcular alguna de sus potencias, digamos, por ejemplo, A20 . Aún disponien-
do de una calculadora (no programable), dicho cálculo se torna enormemente tedioso e
ineficiente si no contamos con una computadora que contenga programas adecuados para
tales efectos. Sin embargo, hay un caso particular en donde dicha tarea se torna trivial.
Nos estamos refiriendo al caso en que la matriz A sea una matriz diagonal.
 
d1 0 0
Por ejemplo, si A =  0 d2 0  al calcular sus potencias obtenemos:
0 0 d3

   
(d1 )2 0 0 (d1 )3 0 0
A2 =  0 (d2 )2 0  , A3 =  0 (d2 )3 0  , ...
0 0 (d3 )2 0 0 (d3 )3

 
(d1 )20 0 0
A20 = 0 (d2 )20 0 
0 0 (d3 )20
162 Capı́tulo 6. Diagonalización

En general, si A es n × n y k un natural cualquiera se cumple:


   
d1 0 · · · 0 (d1 )k 0 ··· 0
 0 d2 · · · 0   0 (d )k ··· 0 
 k  2 
A= . .. . . ..  =⇒ A =  .. .. .. .. 
 .. . . .   . . . . 
0 0 · · · dn 0 0 · · · (dn )k

Es decir, si A es una matriz diagonal entonces Ak también lo es y tiene en su diagonal


principal las k-ésimas potencias de las correspondientes entradas de la diagonal de A.

El lector podrá pensar (con total razón) que esta observación, si bien correcta, es extre-
madamente restrictiva pues solo vale para matrices diagonales. Sin embargo, veremos a
continuación que es posible simplificar el cálculo de las potencias para una clase de matri-
ces mucho más amplia que las diagonales.

Supongamos ahora que A es una matriz cualquiera n × n no necesariamente diagonal.


Supongamos también que existen matrices n × n, B invertible y D diagonal, tales que
A = BDB −1 . Calculemos A2 :
2   
A2 = BDB −1 = BDB −1 BDB −1 = BD B −1 B DB −1 =

= BDIDB −1 = BDDB −1 = BD 2 B −1
Hemos obtenido que A2 = BD 2 B −1 y, realizando un razonamiento inductivo llegamos a
que, cualquiera que sea k natural se cumple:

A = BDB −1 =⇒ Ak = BD k B −1

Como D es una matriz diagonal, la potencia D k es inmediata de calcular. Luego, para


obtener Ak solamente es necesario conocer
 B −1 y realizar un par de producto de matrices:
primero BD k y, a continuación, BD k B −1 .

Las matrices A que cumplen la condición que acabamos de mencionar (existen B inver-
tible y D diagonal tales que A = BDB −1 ) se denominan matrices diagonalizables y
constituyen en el principal objeto de estudio de este capı́tulo. Hay que reconocer que, al
menos en principio, la condición de “matriz diagonalizable” aparece como complicada o, al
menos, nada fácil de verificar. En el siguiente ejemplo mostraremos un camino alternativo
(de hecho, será uno de los principales resultados de este capı́tulo) para verificar si una
matriz es diagonalizable.
 
−1 −2
Consideremos la matriz A dada por A = . Es inmediato verificar que
3 4
       
2 2 1 1
A =2 y A =1
−3 −3 −1 −1
   
2 1
Poniendo u1 = y u2 = el cálculo anterior nos dice que Au1 = 2u1 y
−3 −1
Au2 = u2 . Es decir, los vectores u1 y u2 tienen la peculiaridad de que, al multiplicarlos
6.2. Valores y vectores propios de una matriz 163

por A, se obtienen vectores colineales con ellos, con coeficientes


 de
 proporcionalidad 2
2 −3
y 1 respectivamente. Sean U = {u1 , u2 } y B = MU = . Observemos que el
1 −1
producto AB lo podemos efectuar sin necesidad de realizar operaciones. En efecto, la
primera columna de AB se obtiene multiplicando A por la primera columna de B o sea
por u1 y, por lo tanto:

Primera columna de AB es Au1 = 2u1

De modo análogo:
Segunda columna de AB es Au2 = u2
Luego, la matriz AB coincide con la matriz cuya primera columna es 2u1 y cuya segunda
 es

2 0
u2 . A su vez, esta matriz coincide con el producto de B = MU por la matriz D = .
0 1
Hemos comprobado que AB = BD siendo D una matriz diagonal. Multiplicando ambos
miembros a derecha por B −1 (que existe pues claramente U es base de R2 ) obtenemos
A = BDB −1 y, por lo tanto, A es diagonalizable.

Si repasamos con cuidado el razonamiento observamos que es de carácter general y no


depende de los números involucrados. Solamente se necesitó una matriz A 2 × 2 con la
particularidad de la existencia de dos vectores u1 y u2 (con U = {u1 , u2 } base de R2 ) y
de dos números λ1 y λ2 tales que Au1 = λ1 u1 y Au2 = λ2 u2 . Si B es la matriz MU se
cumple:
Primera columna de AB es Au1 = λ1 u1
Segunda columna de AB es Au2 = λ2 u2
 
λ1 0
Pero, por otra parte, el producto de B por la matriz diagonal D = también
0 λ2
tiene por columnas a λ1 u1 y λ2 u2 . Es decir: AB = BD. Como B es invertible (por ser U
base de R2 ) se deduce que A = BDB −1 y, por lo tanto, A resulta ser diagonalizable.

Este ejemplo muestra entonces que el hecho de encontrar vectores u tales que Au sea
colineal con u puede ser de utilidad para investigar si la matriz A es diagonalizable.

6.2. Valores y vectores propios de una matriz


Definición 6.2.1. Valores y vectores propios de una matriz.
Sea A una matriz n × n. Diremos que el número λ es valor propio (o autovalor) de A
si, y solo si, existe algún vector v ∈ Rn , con v 6= o, tal que A.v = λv.
Si λ es valor propio de A, entonces a cada vector x ∈ Rn que verifique la igualdad
A.x = λx lo llamaremos vector propio (o autovector) asociado al valor propio λ.

Observación 6.2.1. Sobre la definición de valor propio.


1. Como A.o = λo cualquiera que sea el número λ, para que la definición de valor
propio tenga relevancia se exige que exista algún vector v no nulo tal que A.v = λv.
164 Capı́tulo 6. Diagonalización

2. Si x ∈ Rn es vector propio asociado al valor propio λ entonces cualquier vector


colineal con x también lo es. En efecto, sea w = αx con α ∈ R. Se tiene:

A.w = A.(αx) = αA.x = αλx = λαx = λw =⇒ A.w = λw


 
−1 −2
Ejemplo 6.2.1. En la sección anterior habı́amos observado que si A =
3 4
entonces se cumplı́a:
       
2 2 1 1
A =2 y A =1
−3 −3 −1 −1

De acuerdo a la definición
 dadapodemos decir que
2
2 es valor propio de A y es un vector propio asociado a dicho valor propio.
−3
 
1
1 es valor propio de A y es un vector propio asociado a dicho valor propio.
−1
Para hallar
 todos
 los vectores propios asociados
 alvalor
 propio
 2tenemos
 que buscar los
x −1 −2 x x
vectores ∈ R2 que verifiquen: = 2 . Eso nos lleva al
y 3 4 y y
siguiente sistema de ecuaciones:
  
−x − 2y = 2x −3x − 2y = 0 3x + 2y = 0
∼ ∼
3x + 4y = 2y 3x + 2y = 0 0=0

El conjunto solución de dicho sistema es:


    
x 2
−3x /y∈R =L
2 −3

Hemos obtenido que el conjunto de todos los vectores propios asociados al valor propio 2
constituye un subespacio de R2 (en este caso, de dimensión 1).

Busquemos ahora todos los vectores propios asociados al valor propio 1. Se tiene:
  
−x − 2y = x −2x − 2y = 0 x+y =0
∼ ∼
3x + 4y = y 3x + 3y = 0 0=0

El conjunto solución de dicho sistema es:


    
x 1
/x∈R =L
−x −1

Hemos obtenido que el conjunto de todos los vectores propios asociados al valor propio 1
constituye un subespacio de R2 (en este caso, también de dimensión 1).

Acabamos de observar entonces que, una vez que conocemos un valor propio para A,
la búsqueda de sus correspondientes vectores propios se reduce a resolver un sistema
(cuadrado) de ecuaciones lineales. Sin embargo, el lector se podrá preguntar con total razón
¿cómo se descubrieron los valores propios 1 y 2? Más aún, la matriz A ¿no tendrá además
otros valores propios? El siguiente teorema va en camino de responder estas preguntas.
6.2. Valores y vectores propios de una matriz 165

Teorema 6.2.1. Cálculo de valores y vectores propios.


Sea A una matriz n × n. Se tiene:
1. λ es valor propio de A si, y solo si, det(A − λI) = 0.
2. Si λ es valor propio de A entonces el conjunto {x ∈ Rn / A.x = λx} (de todos los
vectores propios asociados al valor propio λ) es un subespacio no trivial de Rn .
Demostración. En primer lugar, vale la pena observar la equivalencia entre las siguientes
igualdades:
A.x = λx ⇐⇒ A.x − λx = o ⇐⇒ (A − λI).x = o
en donde I es la matriz identidad n × n.
1. Por definición, λ es valor propio de A si, y solo si, existe algún vector v ∈ Rn , con
v 6= o, tal
que (A− λI).v = o. Esto es equivalente a decir que el sistema homogéneo
x1
 x2 
 
(A − λI)  .  = o admite al menos una solución distinta de la trivial. Como
 .. 
xn
el sistema es n × n, el teorema de Cramer nos permite afirmar que lo anterior es
equivalente a que el determinante del sistema sea nulo, es decir, det(A − λI) = 0.
2. Supongamos ahora que λ es valor propio de A. Un vector x ∈ Rn es vector propio
de A asociado a λ si, y solo si, (A − λI).x = o. Pero esto es equivalente a decir que x
pertenece al núcleo de la matriz A − λI. Resulta entonces que el conjunto de todos
los vectores propios asociados al valor propio λ coincide con el núcleo de A − λI y,
por lo tanto, es un subespacio de Rn . Este subespacio no puede ser el trivial pues,
por la propia definición de valor propio, existe v 6= o tal que (A − λI).v = o. ♠

Ejemplo 6.2.2. Volvamosal ejemplo anterior e intentemos calcular todos los valores
−1 −2
propios de A = . Según la proposición anterior tenemos que hallar las raı́ces
3 4
de det(A − λI). Se tiene:

−1 − λ −2
det(A − λI) = = λ2 − 3λ + 2
3 4−λ

Las únicas raı́ces de este polinomios son 1 y 2. Resulta entonces que esta matriz no tiene
otros valores propios.
Observación 6.2.2. Polinomio caracterı́stico de un matriz 2 × 2.
Si A es una matriz n × n entonces al polinomio det(A − λI) lo llamaremos polinomio
caso 2 ×2 podemos hallar una fórmula explı́cita para
caracterı́stico de la matriz. En el 
a b
dicho polinomio. En efecto, si A = entonces:
c d

a−λ b
det(A − λI) = = λ2 − (a + d)λ + (ad − bc) = λ2 − tr(A)λ + det(A)
c d−λ

Definición 6.2.2. Subespacio propio asociado a un valor propio.


Sea λ un valor propio de la matriz A n × n. Según el teorema 6.2.1 el conjunto de todos
166 Capı́tulo 6. Diagonalización

los vectores propios asociados al valor propio λ es un subespacio no trivial de Rn . A dicho


subespacio lo llamaremos subespacio propio asociado al valor propio λ y lo simboli-
zaremos Sλ . Recordemos además que este subespacio coincide con el núcleo de la matriz
A − λI, es decir:
Sλ = N (A − λI)
 
6 8
Ejemplo 6.2.3. Queremos hallar los valores y vectores propios de la matriz A = .
2 6

Valores propios: Tenemos que hallar las raı́ces de det(A − λI). Se tiene:

6−λ 8
det(A − λI) = = λ2 − 12λ + 20
2 6−λ

Las raı́ces de este polinomio de segundo grado son 2 y 10 y, por lo tanto, los valores
propios de A son 2 y 10.

Vectores propios asociados al valor propio 2: Tenemos que hallar el núcleo de la ma-
 
4 8
triz A − 2I = , lo cual nos lleva al siguiente sistema de ecuaciones:
2 4
 
4x + 8y = 0 x + 2y = 0

2x + 4y = 0 0=0

El conjunto solución de dicho sistema, es decir, el subespacio propio asociado al valor


propio λ = 2 es entonces:
    
−2y −2
S2 = /y∈R =L
y 1

Vectores propios asociados al valor propio 10: Tenemos que hallar el núcleo de la
 
−4 8
matriz A − 10I = , lo cual nos lleva al siguiente sistema de ecuaciones:
2 −4
 
−4x + 8y = 0 −x + 2y = 0

2x − 4y = 0 0=0

El conjunto solución de dicho sistema, es decir, el subespacio propio asociado al valor


propio λ = 10 es entonces:
    
2y 2
S10 = /y∈R =L
y 1

 
5 0 −6
Ejemplo 6.2.4. Queremos hallar los valores y vectores propios de la matriz A =  9 −1 −9 .
3 0 −4
6.2. Valores y vectores propios de una matriz 167

Valores propios: Tenemos que hallar las raı́ces de det(A − λI). Se tiene:

5−λ 0 −6

det(A − λI) = 9
−1 − λ −9 = (−1 − λ)(λ2 − λ − 2)

3 0 −4 − λ

El resultado se obtuvo desarrollando el determinante por la segunda columna. Las


raı́ces de este polinomio de tercer grado son −1 (doble) y 2 (simple) y, por lo tanto,
esos son los valores propios de A.

Vectores propios asociados al valor propio 2: Tenemos que hallar el núcleo de la ma-
 
3 0 −6
triz A − 2I =  9 −3 −9 , lo cual nos lleva al siguiente sistema de ecuaciones:
3 0 −6
 
 3x + 0y − 6z = 0  x − 2z = 0
9x − 3y − 9z = 0 ∼ 3x − y − 3z = 0
 
3x + 0y − 6z = 0 0=0

El sistema es compatible indeterminado con un grado de libertad y, el conjunto


solución de dicho sistema, es decir, el subespacio propio asociado al valor propio
λ = 2 es entonces:
    
 2z   2 
S2 =  3z  / z ∈ R = L   3  
   
z 1

Vectores propios asociados al valor propio −1: Tenemos que hallar el núcleo de la
 
6 0 −6
matriz A + I =  9 0 −9 , lo cual nos lleva al siguiente sistema de ecuaciones:
3 0 −3
 
 6x − 6z = 0  x−z =0
9x − 9z = 0 ∼ 0=0
 
3x − 3z = 0 0=0

El sistema es compatible indeterminado con dos grados de libertad y, el conjunto


solución de dicho sistema, es decir, el subespacio propio asociado al valor propio
λ = −1 es entonces:
      
 x   1 0 
S−1 =  y  / x, y ∈ R = L   0  , 1  

   
x 1 0

Teorema 6.2.2. Independencia lineal de vectores propios asociados a valores


propios diferentes.
Sean A una matriz n × n y u1 , u2 , . . . , ur vectores propios no nulos de A asociados res-
pectivamente a los valores propios λ1 , λ2 , . . . , λr diferentes entre sı́. Entonces el conjunto
{u1 , u2 , . . . , ur } es L.I.
168 Capı́tulo 6. Diagonalización

Demostración. Lo demostraremos solamente para dos vectores (para el caso general se


puede proceder por inducción). Queremos probar entonces que {u1 , u2 } es L.I. Suponga-
mos, razonando por reducción al absurdo, que no lo fuera. En este caso uno de los vectores
serı́a colineal con el otro. Digamos que existe α ∈ R tal que u2 = αu1 . Multiplicando ambos
miembros por A obtenemos:

A.u2 = A.(αu1 ) =⇒ A.u2 = αA.(u1 ) =⇒ λ2 u2 = αλ1 u1

Sustituyendo la expresión u2 = αu1 en la última igualdad obtenemos λ2 αu1 = αλ1 u1 , de


donde resulta:
α(λ2 − λ1 )u1 = o (∗)
Por hipótesis u1 6= o y λ2 − λ1 6= 0 (pues los valores propios eran diferentes entre sı́). Para
que se cumpla (∗) la única posibilidad que queda es que α = 0. Pero esto implicarı́a u2 = o
lo cual es absurdo. ♠

Resulta claro del teorema anterior que dos subespacios propios de A asociados a valores
propios diferentes solamente tienen en común al vector nulo.

Ejercicio 6.2.1. Si A es una matriz cuadrada pruebe que A es invertible si, y solo si, 0
no es valor propio de A.

Ejercicio 6.2.2. Supongamos que λ es valor propio de la matriz A. Demuestre que:


1. αλ es valor propio de αA.
2. Si A es invertible entonces λ no puede ser 0 y se cumple que 1/λ es valor propio de
A−1 .

Ejercicio 6.2.3. Sean A y B dos matrices n × n tales que u es vector propio de A y de


B. Demuestre que:
1. αu es vector propio de A para α ∈ R.
2. u es vector propio de A + B y obtenga el valor propio correspondiente.
3. u es vector propio de A.B y obtenga el valor propio correspondiente.

Ejercicio 6.2.4. Encuentre los valores propios y los subespacios propios de las siguientes
matrices:
 
      1 −1 4
4 2 6 8 1 3
A= , B= , C= , D= 3 2 −1 
3 3 −2 6 2 6
2 1 −1

Ejercicio 6.2.5.
1. Demuestre que los únicos valores propios posibles de una matriz ortogonal A son 1
y −1. (Recuerde que si A es ortogonal entonces kA.vk2 = kvk2 , ∀ v ∈ Rn ).
√ √ !
2 2
√2
− √2
2. Verifique que la matriz 2 2
es ortogonal pero que no tiene valores propios.
2 2
6.3. Matrices diagonalizables 169

Ejercicio 6.2.6.
 
5 3 −6
Consideremos la matriz A =  −4 −2 8 . Verifique (aplicando la definición) que
−1 −1 4
los siguientes vectores son vectores propios de A y encuentra sus correspondientes valores
propios:      
−4 1 −3
u1 =  6  , u2 =  −1  , u3 =  4 
1 0 1

6.3. Matrices diagonalizables


Definición 6.3.1. Matrices diagonalizables.
Sea A una matriz n × n. Diremos que A es diagonalizable si, y solo si, existen matrices
n × n, B invertible y D diagonal, tales que B −1 AB = D.
En este caso diremos que B diagonaliza a la matriz A.

Observación 6.3.1. Sobre matrices diagonalizables.


1. Toda matriz diagonal es diagonalizable. En efecto, alcanza con tomar la matriz B
de la definición como la matriz identidad.
2. Siendo B invertible, las siguientes igualdades son equivalentes:

B −1 AB = D ⇐⇒ AB = BD ⇐⇒ A = BDB −1

3. Vale la pena tener presente lo discutido en la introducción al capı́tulo en cuanto a


las potencias de A en el sentido de que si A = BDB −1 entonces Ak = BD k B −1 para
todo número natural k.

El siguiente teorema (cuya demostración se encuentra en el apéndice de esta sección)


establece de forma precisa lo observado en la introducción al capı́tulo.

Teorema 6.3.1. Condiciones necesarias y suficientes para que una matriz sea
diagonalizable.
Si A es una matriz n × n entonces las siguientes afirmaciones son equivalentes:

1. A es diagonalizable (es decir, existen matrices n × n, B invertible y D diagonal, tales


que B −1 AB = D).

2. Existe una base de Rn formada por vectores propios de A. Si U = {u1 , u2 , . . . , un }


es una base de Rn formada por vectores propios de A y λ1 , λ2 , . . . , λn son los
correspondientes valores propios (esto es: A.ui = λi ui , i = 1, 2, . . . , n), entonces
una matriz
 B que diagonaliza  a A es B = MU y la correspondiente matriz diagonal
λ1 0 · · · 0
 0 λ2 · · · 0 
 
es D =  . .. . . .. 
 .. . . . 
0 0 · · · λn
3. La suma de las dimensiones de los subespacios propios es n.
170 Capı́tulo 6. Diagonalización

Veamos varios ejemplos que muestran cómo podemos aplicar el teorema anterior para
decidir si una matriz es diagonalizable o no.
 
6 8
Ejemplo 6.3.1. Consideremos la matriz A = del ejemplo 6.2.3. Sus únicos
2 6
valores propios son λ1 = 2 y λ2 = 10. Se habı́an encontrado los respectivos subespacios
propios obteniendo: dim(Sλ1 ) = dimN (A − 2I) = 1 y dim(Sλ2 ) = dimN (A − 10I) = 1.
Como la suma de las dimensiones de los subespacios propios es 1 + 1 = 2, y A es 2 × 2, la
tercera parte del teorema anterior nos permite afirmar que A es diagonalizable.
¿Cómo encontramos una matriz B que la diagonalice? Para ello usamos la parte (2) del
teorema. En el ejemplo
 6.2.3se habı́an
 calculado también los vectores propios. Por ejem-
−2 2
plo, u1 = y u2 = son vectores propios asociados a λ1 = 2 y λ2 = 10
1 1
respectivamente. Es claro que U = {u1 , u2 } es base de R2 . Luego, unamatriz Bque diago-
2 0
naliza a A es B = MU y la correspondiente matriz diagonal es D = , es decir,
0 10
se cumple la igualdad:
 −1     
−2 2 6 8 −2 2 2 0
B −1 AB = = =D
1 1 2 6 1 1 0 10

o, de manera equivalente:
     −1
6 8 −2 2 2 0 −2 2
A= = = BDB −1
2 6 1 1 0 10 1 1

Si quisiéramos calcular A100 podemos proceder de la siguiente manera:


   −1
−2 2 2100 0 −2 2
A100 =
1 1 0 10100 1 1
 
5 0 −6
Ejemplo 6.3.2. Consideremos ahora la matriz A =  9 −1 −9  del ejemplo 6.2.4.
3 0 −4
Sus únicos valores propios son λ1 = −1 (raı́z doble del polinomio caracterı́stico) y λ2 = 2
(raı́z simple del polinomio caracterı́stico). Con respecto a los subespacios propios se habı́a
obtenido: dim(Sλ1 ) = dimN (A + I) = 2 y dim(Sλ2 ) = dimN (A − 2I) = 1. Como la suma
de las dimensiones de los subespacios propios es 2+1 = 3 (dimensión del espacio) podemos
afirmar que A es diagonalizable.
Para completar el ejemplo encuentre una matriz B que diagonalice a A y la correspondiente
matriz diagonal D.

Observación 6.3.2. Cálculo de las dimensiones de los subespacios propios.


Según el teorema 6.3.1 es suficiente con calcular la suma de las dimensiones de los subes-
pacios propios de una matriz para decidir si es diagonalizable o no. Vale la pena tener en
cuenta que, para dicho cálculo, no es necesario hallar explı́citamente dichos subespacios (o
sea, los vectores propios). En efecto, si λ es valor propio de A entonces la dim(Sλ ) es la
6.3. Matrices diagonalizables 171

dimensión del núcleo de A − λI, o sea, la nulidad de dicha matriz. A su vez, esta nulidad
se puede calcular a partir del rango de la siguiente manera:

nu(A − λI) = n − rg(A − λI)

Ejemplo 6.3.3. Se quiere investigar si las siguientes matrices son diagonalizables:


   
8 −7 π 8 −7 π
W = 0 5 0  , Z= 0 5 1 
0 0 5 0 0 5

Un cálculo muy simple muestra que ambas tienen los mismos valores propios que son
λ1 = 8 (raı́z simple del polinomio caracterı́stico de ambas) y λ2 = 5 (raı́z doble del
polinomio caracterı́stico de ambas). Estudiemos ahora las dimensiones de sus subespacios
propios:
1. Para la matriz W :
   
0 −7 π 0 −7 π
dim(Sλ1 =8 ) = nu  0 −3 0  = 3 − rg  0 −3 0  = 3−2 = 1
0 0 −3 0 0 −3
   
3 −7 π 3 −7 π
dim(Sλ2 =5 ) = nu  0 0 0  = 3 − rg  0 0 0  =3−1 =2
0 0 0 0 0 0
Como dim(Sλ1 ) + dim(Sλ2 ) = 3 podemos concluir que W es diagonalizable.
2. Para la matriz Z:
   
0 −7 π 0 −7 π
dim(Sλ1 =8 ) = nu  0 −3 1  = 3 − rg  0 −3 1  = 3−2 = 1
0 0 −3 0 0 −3
   
3 −7 π 3 −7 π
dim(Sλ2 =5 ) = nu  0 0 1  = 3 − rg  0 0 1  =3−2 =1
0 0 0 0 0 0
Como dim(Sλ1 ) + dim(Sλ2 ) = 2 6= 3 podemos concluir que Z no es diagonalizable.

Proposición 6.3.1. Una condición suficiente para que una matriz sea diagona-
lizable.
Sea A una matriz n × n. Si A tiene n valores propios diferentes entre sı́ entonces es
diagonalizable.

Demostración. Sean λ1 , λ2 , . . . , λn los n valores propios de A diferentes entre sı́. Para


cada λi elegimos un vector ui que sea vector propio no nulo asociado a λi . Por el teorema
6.2.2 el conjunto U = {u1 , u2 , . . . , un } es L.I. y, por lo tanto, es base de Rn . Hemos
encontrado una base de Rn formada por vectores propios de A, de donde resulta (teorema
6.3.1) que A es diagonalizable. ♠
172 Capı́tulo 6. Diagonalización

 √ 
2 −5 2
Ejemplo 6.3.4. Se considera la matriz A =  0 1 2 . Para hallar sus valores
0 1 1
propios debemos hallar las raı́ces del polinomio det(A − λI):

2 − λ −5 2
1−λ 2
det(A − λI) = 0 1−λ 2 = (2 − λ) = (2 − λ)(λ2 − 2λ − 1)
1 1 − λ
0 1 1−λ
√ √
Los valores propios de A son entonces: 2, 1+ 2 y 1− 2. Como A es 3×3 y tiene 3 valores
propios diferentes, la proposición anterior nos permite concluir que A es diagonalizable,
sin necesidad de tener que estudiar la dimensión de los subespacios propios.

Observación 6.3.3. La condición anterior no es necesaria para que una matriz


sea diagonalizable.
Ya nos hemos encontrado con varios ejemplos de matrices 3 × 3 diagonalizables que tenı́an
solamente dos valores propios. Es ası́ que la condición suficiente establecida en la proposi-
ción anterior no es necesaria para que una matriz sea diagonalizable. Dicho de otra manera,
si una matriz n × n no tiene n valores propios diferentes entonces puede ser diagonalizable,
o no.

Una clase importante de matrices diagonalizables la constituye la familia de las matrices


simétricas.

Teorema 6.3.2. Diagonalización de matrices simétricas.


Sea A una matriz simétrica n × n. Entonces se cumple:

1. Vectores propios de A asociados a valores propios diferentes son ortogonales.

2. A es diagonalizable. Más aún, existe una matriz ortogonal que la diagonaliza.

Demostración.
1. Sean u1 y u2 vectores propios de A correspondientes a valores propios distintos λ1 y
λ2 . Esto implica que Au1 = λ1 u1 y Au2 = λ2 u2 . Se tiene:

hAu1 , u2 i = hλ1 u1 , u2 i = λ1 hu1 , u2 i

Por otra parte, utilizando el hecho de que A es simétrica, tenemos:

hAu1 , u2 i = hu1 , At u2 i = hu1 , Au2 i = hu1 , λ2 u2 i = λ2 hu1 , u2 i

Luego, λ1 hu1 , u2 i = λ2 hu1 , u2 i de donde resulta (λ1 − λ2 )hu1 , u2 i = 0.


Como λ1 6= λ2 , debe ser hu1 , u2 i = 0 y, por lo tanto, u1 ⊥ u2 .
parte delteorema la demostraremos solamente para el caso de una matriz 2 × 2:
2. Esta 
a b
A= . Comencemos hallando su polinomio caracterı́stico:
b c

a−λ b
det(A − λI) = = λ2 − (a + c)λ + (ac − b2 )
b c−λ
6.3. Matrices diagonalizables 173

El discriminante de ese polinomio de segundo grado vale ∆ = (a + c)2 − 4(ac − b2 ) =


a2 + c2 − 2ac + 4b2 = (a − c)2 + 4b2 . Es claro que ∆ ≥ 0 cualesquiera que sean a, b y
c. Si ∆ > 0 entonces el polinomio caracterı́stico tiene dos raı́ces reales y diferentes y
entonces (proposición 6.3.1) A es diagonalizable. Sean entonces λ1 y λ2 los valores
propios diferentes y u1 y u2 vectores propios asociados. Por la parte (1) u1 ⊥ u2 .
Dividiendo cada uno de esos vectores entre su norma obtenemos dos vectores u′1 y u′2
tales que U = {u′1 , u′2 } es una base ortonormal de R2 formada por vectores propios
de A. La matriz MU resulta entonces ser ortogonal y, como sabemos, dicha matriz
diagonaliza a A.
Queda por estudiar el caso en que ∆ = 0, en donde no hay dos raı́ces reales y
diferentes.
  Pero ∆ = 0 solamente cuando a = c y b = 0, o sea cuando A es de la forma
a 0
que es una matriz diagonal (y, por lo tanto, trivialmente diagonalizable).
0 a

Proposición 6.3.2. Propiedades de At A.


Si A es una matriz m × n entonces la matriz cuadrada (n × n) At A tiene las siguientes
propiedades:
1. At A es simétrica.
2. At A es no negativa (o semidefinida positiva), esto es: hAt A.x, xi ≥ 0, ∀ x ∈ Rn .
3. Los valores propios de At A son no negativos.
4. At A tiene el mismo rango que A.
5. Si rg(A) = n entonces At A no tiene valor propio 0.
Si rg(A) = r < n entonces 0 es valor propio de At A y el subespacio propio corres-
pondiente tiene dimensión n − r.
Demostración.
t
1. Utilizando las propiedad de la traspuesta de un producto obtenemos At A =
t
At At = At A de donde resulta que At A es simétrica.
2. Para todo x ∈ Rn se tiene: hAt A.x, xi = hA.x, A.xi = kA.xk2 ≥ 0.
3. Sea λ un valor propio de At A. Existe v 6= o tal que At A.v = λv. Luego, utilizando
que At A es no negativa se obtiene: 0 ≤ hAt A.v, vi = hλv, vi = λhv, vi de donde se
deduce que λ ≥ 0.
(Observe que solamente se utilizó que At A es no negativa y, por lo tanto, la misma
demostración prueba que los valores propios de cualquier matriz no negativa son no
negativos).
4. Ver ejercicio 5.1.8.
5. Si rg(A) = n entonces rg(At A) = n y, por lo tanto, At A es invertible. Se deduce que
0 no es valor propio de At A (todos sus valores propios son estrictamente positivos).
Si rg(A) = r < n entonces rg(At A) = r < n, de donde At A no es invertible y
0 es valor propio de At A. Recordemos también que N (At A) = N (A), de donde
resulta nu(At A) = nu(A) = n − r. Se deduce que el subespacio propio de At A
correspondiente al valor propio 0 tiene dimensión n − r.
Una interesante aplicación de las propiedades de puede encontrarse en el apéndice en donde
se demuestra la llamada “descomposición en valores singulares” de una matriz cualquiera.
174 Capı́tulo 6. Diagonalización

Definición 6.3.2. Multiplidad algebraica y multiplicidad geométrica de un valor


propio. Sea λ un valor propio de la matriz A n × n.
Llamaremos multiplicidad algebraica de λ, y la simbolizaremos ma(λ), a su orden de
multiplicidad como raı́z del polinomio caracterı́stico det(A − λI).
Llamaremos multiplicidad geométrica de λ, y la simbolizaremos mg(λ), a la dimensión
de su correspondiente subespacio propio Sλ .

Ejemplo 6.3.5. En el ejemplo 6.3.3 se consideraron las matrices


   
8 −7 π 8 −7 π
W = 0 5 0  , Z = 0 5 1 
0 0 5 0 0 5

que tienen los mismos valores propios λ1 = 8 (raı́z simple del polinomio caracterı́stico de
ambas) y λ2 = 5 (raı́z doble del polinomio caracterı́stico de ambas). Según la definición
anterior ¿cuáles son las multiplicidades algebraica y geométrica de estos valores propios?
Para la matriz W :
ma(λ1 ) = 1 y mg(λ1 ) = 1. ma(λ2 ) = 2 y mg(λ2 ) = 2.
Para la matriz Z:
ma(λ1 ) = 1 y mg(λ1 ) = 1. ma(λ2 ) = 2 y mg(λ2 ) = 1.
Observemos que en la matriz Z el valor propio λ2 = 5 tiene multiplicidad algebraica 2 (es
raı́z doble del polinomio caracterı́stico) mientras que su multiplicidad geométrica es 1.

Admitiremos sin demostración el siguiente resultado.

Teorema 6.3.3. Relación entre las multiplicidades algebraica y geométrica de


un valor propio.
Sea λ un valor propio de la matriz A n × n. Entonces se cumple que:
1. 1 ≤ mg(λ) ≤ ma(λ) ≤ n.
2. Si ma(λ) = 1 entonces mg(λ) = 1.

Ejercicio 6.3.1. Si A n × n es diagonalizable demuestre que α A es diagonalizable para


todo α ∈ R.

Ejercicio 6.3.2. Encuentre un ejemplo de dos matrices A y B ambas diagonalizables


tales que A.B no sea diagonalizable. (Puede buscar matrices de tamaño 2 × 2).

Ejercicio 6.3.3. En cada uno de los siguientes casos verifique que la matriz A es diago-
nalizable y halle una matriz B y una matriz diagonal D tales que B −1 AB = D.
   
  2 −1 2 1 −1 4
2 3
(1) A = , (2) A =  0 1 0  , (3) A =  3 2 −1 
4 6
0 0 1 2 1 −1
 
  1 0 0 0  
2 1 1  −2 3 2 4
3 0 0 
(4) A =  1 2 1  , (5) A =   , (6) A =  2 0 2 
 0 0 −1 2 
0 0 1 4 2 3
0 0 1 0
6.3. Matrices diagonalizables 175

Ejercicio 6.3.4. Investigue si las siguientes matrices son diagonalizables (no es necesario
hallar los subespacios propios):
 
      2 −1 0
1 0 4 1 3 −5
A= , B= , C= , D= 0 0 1 
1 0 0 4 1 −1
0 0 0
     
−5 −5 −9 −1 −3 −9 0 1 0
E= 8 9 18  , F = 0 5 18  , G =  0 0 1 
−2 −3 −7 0 −2 −7 1 −3 3
 
1 3 0 0
 2 2 0 0 
Ejercicio 6.3.5. Se considera la matriz: A =   0 0 −1
.
0 
0 0 0 −1
1. Halle los valores y vectores propios de A.
2. Investigue si A es diagonalizable. Justifique.
3. Si λ no es ningunode los valores
  propios obtenidos en (a), ¿cuál es la solución del
x 0
 y   0 
sistema (A − λI) . 
 z  =  0 ? Justifique.
  

t 0
   
1 1 1 1 1
 1 1 1 1   1 
Ejercicio 6.3.6. Se consideran A =   1 1 1 1  y v =  1 .
  

1 1 1 1 1
1. Halle N (A) y encuentre una base del mismo. ¿Es 0 valor propio de A?
2. Pruebe que v es vector propio de A. ¿Cuál es el valor propio correspondiente?
3. Halle una matriz invetible B 4× 4 y una matriz diagonal D 4× 4 tales que B −1 AB =
D.
 
2 1
Ejercicio 6.3.7. Sea A = siendo k un número real.
2k k
1. Encuentre los valores propios de la matriz A.
2. Investigue si A es diagonalizable discutiendo según k.
 
1 0 0
Ejercicio 6.3.8. Pruebe que la matriz A =  a 1 −a  es diagonalizable solo para
a 0 a
dos valores de a.
 
1 a a
Ejercicio 6.3.9. Pruebe que la matriz A =  a 1 a  es diagonalizable para cualquier
a a 1
valor de a y encuentre una matriz que la diagonalice.
176 Capı́tulo 6. Diagonalización

Ejercicio 6.3.10.
1. Demuestre que si D es una matriz diagonal que tiene todas sus entradas no negativas
entonces existe otra matriz diagonal J tal que J 2 = D.
2. Sea A una matriz diagonalizable tal que todos sus valores propios son no negativos.
Demuestre que existe una matriz S tal que S 2 = A.
 
1 3 1
3. Halle una matriz S tal que S 2 = A en el caso en que A =  0 4 5 
0 0 9

Ejercicio 6.3.11. Una matriz cuadrada A se dice idempotente cuando A2 = A. Si A es


idempotente pruebe que:
1. Los únicos valores propios posibles de A son los números 0 y 1.
2. A es diagonalizable.
 
3 2 4
Ejercicio 6.3.12. Calcule A100 siendo A =  2 0 2 .
4 2 3
 
1 + α −α α
Ejercicio 6.3.13. Se considera A =  2 + α −α α − 1  en donde α ∈ R.
2 −1 0
1. Obtenga los valores propios de A (estos no dependen del parámetro α).
2. Discuta, según α, cuando la matriz A es diagonalizable.

Ejercicio 6.3.14. Verifique que, para cada una de las siguientes matrices, λ = 2 es valor
propio con multiplicidad algebraica 3. En cada uno de los casos calcule su multiplicidad
geométrica. ¿Cuáles son diagonalizables?
     
2 0 0 2 1 0 2 1 0
A1 =  0 2 0  , A2 =  0 2 0  , A3 =  0 2 1 
0 0 2 0 0 2 0 0 2

Ejercicio 6.3.15. Encuentre matrices ortogonales que diagonalicen a las siguientes ma-
trices simétricas:  
  a b b
a b
,  b a b 
b a
b b a

6.4. Apéndice
Demostración de la equivalencia de las partes (1) y (2) del Teorema 6.3.1
b
Supongamos que existe U = {u1 , u2 , . . . , uk } −→ Rn tal que A (ui ) = λi ui para i =
1, 2, . . . , n. Definimos la matriz D mediante D = (MU )−1 AMU . Vamos a probar que D es
una matriz diagonal, más precisamente, que la columna i-ésima de D vale λi ei . Se tiene:
 
Ci (D) = D.ei = D.coordU (ui ) = (MU )−1 AMU .coordU (ui ) =
6.4. Apéndice 177

(MU )−1 A (MU .coordU (ui )) = (MU )−1 A.ui = (MU )−1 λi ui = λi (MU )−1 ui

= λi coordU (ui ) = λi ei

Recı́procamente,
 supongamos queA es diagonalizable. Entonces existen matrices P inver-
d1 0 · · · 0
 0 d2 · · · 0 
  −1
tible y D =  . .. . . ..  diagonal (ambas n × n) tales que: P AP = D. La
 .. . . . 
0 0 · · · dn
igualdad anterior es equivalente a AP = P D. Estudiemos la columna i-ésima de ambos
miembros.
La columna i-ésima de AP coincide con el producto de A por la columna i-ésima de P :

Ci (AP ) = A Ci (P )

La columna i-ésima de P D coincide con el producto de P por la columna i-ésima de D


(que se puede escribir como di ei ):

Ci (P D) = P Ci (D) = P (di ei ) = di P.ei = di Ci (P )

Tenemos entonces que

A Ci (P ) = di Ci (P ) , ∀ i = 1, 2, . . . , n.

Como Ci (P ) 6= o (por ser P invertible), la igualdad anterior implica que, para cada i =
1, 2, . . . , n, el vector Ci (P ) es un vector propio de A asociado al valor propio di . Por otra
parte, y utilizando nuevamente que P es invertible, podemos asegurar que estos vectores
constituyen una base de Rn . Hemos demostrado que {C1 (P ), C2 (P ), . . . , Cn (P )} (conjunto
de las columnas de P ) es una base de Rn formada por vectores propios de A. ♠

Teorema 6.4.1. Descomposición en valores singulares de una matriz (DVS).


Sea A una matriz m × n tal que rg(A) = r > 0. Entonces existen matrices ortogonales P
(m × m) y Q (n × n) tales que P.A.Q = D en donde D = (dij ) (m × n) es una matriz
diagonal no necesariamente cuadrada, esto es, dij = 0 si i 6= j. Más aún, dii = σi para
1 ≤ i ≤ r siendo σi2 valor propio de At A, y dii = 0 para r < i ≤ n (en caso que r < n).

Demostración. Supondremos que 0 < r < n. De hecho, el caso r = n es más sencillo y


el lector no tendrá inconveniente en acomodar la demostración para dicha situación.

(a) La idea es considerar la matriz At A. De la proposición 6.3.2 sabemos que rg(At A) =


rg(A) = r > 0, que At A es simétrica (y por lo tanto diagonalizable), y que sus
valores propios son no negativos. Más aún (recordar el Teorema 6.3.2) existe una
base ortonormal U = {u1 , u2 , . . . , un } de Rn tal que:

At A.ui = σi2 ui , i = 1, 2, . . . , n.

en donde los σi2 son los valores propios de At A y σi ≥ 0.


178 Capı́tulo 6. Diagonalización

Como rg(At A) = r < n, tenemos que 0 es valor propio de At A y que el subespacio


propio de At A correspondiente al valor propio 0 tiene dimensión n − r. Resulta
entonces que:

σ12 ≥ σ22 ≥ . . . ≥ σr2 > 0 y σi2 = 0, si r < i ≤ n.

(Aquı́ hemos supuesto que los vectores de la base U los hemos ordenados de modo
que sus valores propios correspondientes quedan en orden decreciente).
Tomamos como matriz Q a la matriz MU . Como U es una base ortonormal de Rn ,
la matriz Q (n × n) es ortogonal. Observemos que la columna k del producto A.Q
coincide con A.uk .
Trataremos de encontrar una matriz ortogonal Z (m × m) y una matriz diagonal D
(m × n) de modo que A.Q = Z.D. Para ello alcanzará con que la columna k de Z.D
coincida con la columna k de A.Q, o sea con A.uk (para todo k = 1, 2, . . . , n).

(b) Ahora bien, observemos que

hA.ui , A.uj i = hAt A.ui , uj i = σi2 hui , uj i

De lo anterior resulta que:


• El conjunto {A.u1 , A.u2 , . . . , A.un } es ortogonal.
• kA.uk k = σk , para todo k = 1, 2, . . . , n.
• A.uk 6= o, si 1 ≤ k ≤ r, y A.uk = o si r < k ≤ n.
1
Si para 1 ≤ k ≤ r definimos vk = A.uk obtenemos que el conjunto
σk

{v1 , v2 , . . . , vr } es ortonormal en Rm

Completamos este conjunto hasta obtener una base ortonormal de Rm de la forma:


V = {v1 , v2 , . . . , vr , vr+1 , . . . , vm }. Si Z es la matriz MV entonces Z es una matriz
ortogonal y al efectuar su producto con el vector σk ek obtenemos:

 1
σk A.uk = A.uk , si 1 ≤ k ≤ r.
Z.(σk ek ) = σk vk = σk
 o, si r < k ≤ n.

Resulta entonces que si D = (dij ) (m × n) es la matriz diagonal tal que dij = 0 si i 6= j, y


dkk = σk para 1 ≤ k ≤ r, se cumple que A.Q = Z.D.

Como Z es una matriz ortogonal entonces es invertible, de donde resulta Z −1 .A.Q = D y


queda demostrado el teorema. ♠
Capı́tulo 7

Transformaciones lineales

Al estudiar muchos fenómenos de la realidad se hacen supuestos que conducen a pensar


en los llamados modelos lineales. Por ejemplo, suele suponerse que la oferta de un cierto
producto es una función del precio. Al estudiar empı́ricamente cómo funciona este modelo,
se observa que a un cierto precio p la oferta del bien es o, que si el precio se duplica la oferta
también y que si el precio se triplica la oferta también. Es decir, la oferta varı́a linealmente
con el precio. Este capı́tulo se dedica al estudio de las llamadas transformaciones lineales,
funciones que sirven para representar este tipo de modelos. Aún en el caso en que los
fenómenos estudiados no presenten una conducta lineal, es posible aproximarlos de una
manera muy razonable de forma lineal. Y estos últimos son los modelos más sencillos
posibles. Por esto, por su sencillez y por su proximidad a modelos mucho mas complicados,
las transformaciones lineales son objetos matemáticos de gran importancia. Por otra parte,
las transformaciones lineales están ı́ntimamente relacionadas con las matrices, por lo cual
dedicaremos una parte importante del capı́tulo a mostrar esta relación y a sacar provecho
de la misma.

7.1. Definición, propiedades básicas y ejemplos


Definición 7.1.1. Diremos que una función T : Rn → Rm es una transformación
lineal de Rn en Rm si, y solo si, verifica que

(i) T (u + v) = T (u) + T (v) , ∀ u, v ∈ Rn .

(ii) T (αu) = αT (u) , ∀ α ∈ R , ∀ u ∈ Rn .

Observación 7.1.1. El transformado del vector nulo.


1. Sea T : Rn → Rm una transformación lineal y designemos con on y om a los vectores
nulos de Rn y Rm respectivamente. Dado un vector cualquiera u ∈ Rn , la condición
(ii) de la definición nos permite escribir:

T (on ) = T (0.u) = 0.T (u) = om

Tenemos entonces que la imagen del vector nulo por una transformación lineal siem-
pre es el vector nulo. Esta propiedad permite verificar que una función NO es lineal.
Por ejemplo, f : R → R tal que f (x) = x + 2 no es una transformación lineal pues
180 Capı́tulo 7. Transformaciones lineales

f (0) = 2. Pero el recı́proco es falso, es decir, existen funciones que transforman el


vector nulo en el nulo que no son lineales. Por ejemplo f : f (x) = x2 cumple que
f (0) = 0. Sin embargo no es lineal pues, por ejemplo, f (1 + 1) = f (2) = 4 pero
f (1) + f (1) = 1 + 1 = 2.
2. Observemos que una transformación lineal T : Rn → Rm tiene dominio Rn y codo-
minio Rm . Ası́, a cada vector de Rn le hace corresponder un único vector de Rm . Esa
es la razón por la cual tuvimos que distinguir los vectores nulos de ambos espacios.
De todos modos, cuando no haya lugar a confusión, tanto el vector nulo de Rn como
el de Rm serán simbolizados de igual modo por la letra o.

Como las combinaciones lineales combinan (valga la redundancia) las operaciones de suma
de vectores y de producto por un número, las dos condiciones de la definición pueden
expresarse mediante una sola condición, como lo establece la siguiente proposición.

Proposición 7.1.1. La imagen de una combinación lineal.


Sea T : Rn → Rm una función. Entonces T es una transformación lineal si, y solo si:

T (αu + βv) = αT (u) + βT (v) , ∀ α, β ∈ R ; ∀ u, v ∈ Rn . (7.1)

Demostración.
En efecto, si T es lineal entonces usando primero la propiedad (i) de la definición y luego
la (ii) se tiene que

T (αu + βv) = T (αu) + T (βv) = αT (u) + βT (v)

Recı́procamente, si se cumple (7.1) entonces poniendo α = β = 1 se deduce (i) y poniendo


β = 0 se deduce (ii). ♠

Ejemplo 7.1.1.
1. La función identidad I : Rn → Rn definida por I(v) = v , ∀ v ∈ Rn es una
transformación lineal.
2. Dado k ∈ R la transformación T : Rn → Rn dada por T (v) = kv , ∀ v ∈ Rn es
lineal. En particular, la transformación nula (k = 0) es lineal.
3. Dado w ∈ Rn , w 6= o, la transformación S : Rn → Rn dada por S(v) = v + w , ∀ v ∈
Rn no es lineal pues T (o) = w 6= o.

Ejemplo 7.1.2. Linealidad del producto interno.


Sea w ∈ Rn un vector fijo. De las propiedades del producto interno resulta inmediato
verificar que la transformación Tw : Rn → R dada por Tw (v) = hv, wi , ∀ v ∈ Rn es lineal.

Ejemplo 7.1.3. Proyección ortogonal sobre un vector.


Sea u ∈ Rn un vector fijo con u 6= o. Consideremos la función que a cada vector v ∈ Rn le
asocia su proyección ortogonal sobre u (recordar proposición 5.1.5):

hv, ui
Pu : Rn → Rn / Pu (v) = u , ∀ v ∈ Rn .
hu, ui

Queda como ejercicio la verificación de que Pu es lineal.


7.1. Definición, propiedades básicas y ejemplos 181

v − Pu (v)

o u Pu (v)

Ejemplo 7.1.4. Proyección ortogonal sobre un subespacio.


Sea S 6= {o} un subespacio de Rn y consideremos la función que a cada vector de Rn le
asocia su proyección ortogonal sobre S (recordar teorema 5.2.3):

PS : Rn → Rn / v 7→ PS (v) , ∀ v ∈ Rn

Recordemos que PS (v) está caracterizado por ser el único vector de S con la propiedad de
que v − PS (v) ⊥ S

o
PS (v)

Además, si U = {u1 , u2 , . . . , ur } es una base ortonormal de S entonces

PS (v) = hv, u1 iu1 + hv, u2 iu2 + . . . + hv, ur iur

Es decir, PS (v) es la suma de las proyecciones ortogonales de v sobre cada vector ui .


Según el ejemplo anterior, cada uno de los sumandos es lineal y, por lo tanto, PS también
será lineal por ser una suma de transformaciones lineales (como se verá en la proposición
7.3.1).

Ejemplo 7.1.5. La transformación “coordenadas”.


Sea U una base de Rn y T : Rn → Rn definida por T (v) = coordU (v). A cada vector v
de Rn esta transformación le asocia el vector de las coordenadas de v en la base U . Si
recordamos que

coordU ( αu + βv ) = α coordU (u) + β coordU (v) , ∀ u, v ∈ Rn , ∀ α, β ∈ R.

queda probado que T es lineal.


182 Capı́tulo 7. Transformaciones lineales

 
2 1
Ejemplo 7.1.6. Sea A = . Definimos T : R2 → R2 mediante
1 1
   
x x
T = A.
y y
T es lineal pues en virtud de la propiedad distributiva del producto de matrices se tiene
que     ′       ′ 
x x 2 1 x x
T α +β = α +β =
y y′ 1 1 y y′
         ′ 
2 1 x 2 1 x′ x x
α +β ′ = αT + βT
1 1 y 1 1 y y y′
Como se observa fácilmente, si se tomara otra matriz A cualquiera, se podrı́a argumentar
igual que en el ejemplo, por lo que en general tenemos la siguiente proposición:
Proposición 7.1.2. Transformación lineal asociada a una matriz. Sea A una matriz
cualquiera de tamaño m × n. Entonces la función T : Rn → Rm definida por T (v) =
A.v , ∀ v ∈ Rn , es una transformación lineal.
Demostración.
Para toda pareja de reales α, β y para toda pareja de vectores u, v ∈ Rn se tiene:

T (αu + βv) = A.(αu + βv) = αA.u + βA.v = αT (u) + βT (v)


Ejemplo 7.1.7. En cada uno de los siguientes casos tomaremos una matriz A de tamaño
m × n y consideraremos la función T : Rn → Rm definida por T (v) = A.v , ∀ v ∈ Rn . Por
el teorema anterior dicha
 función será una transformación lineal.
1 0
1. A = da lugar a la transformación T : R2 → R2 tal que:
0 −1
      
x 1 0 x x
T = =
y 0 −1 y −y
Como el lector podrá visualizar fácilmente, se trata de una simetrı́a axial de eje Ox.
 
−1 0
2. A = da lugar a la transformación T : R2 → R2 tal que:
0 −1
      
x −1 0 x −x
T = =
y 0 −1 y −y
Se trata
 de una
 simetrı́a central de centro O.
3 0
3. A = da lugar a la transformación T : R2 → R2 tal que:
0 3
      
x 3 0 x 3x
T = =
y 0 3 y 3y
Se trata de una homotecia de centro O y razón 3.
7.1. Definición, propiedades básicas y ejemplos 183

 
1 0 0
4. A =  0 1 0  da lugar a la transformación T : R3 → R3 tal que:
0 0 −1
      
x 1 0 0 x x
T  y  =  0 1 0  y  =  y 
z 0 0 −1 z −z

Se trata de una simetrı́a respecto del plano 0xy.


5. A = In (matriz identidad n × n) da lugar a la transformación T : Rn → Rn tal que
T (v) = v, ∀ v ∈ Rn . Se trata de la función identidad, que a cada vector le asocia el
mismo.
 
1 −1 2
6. A = da lugar a la transformación T : R3 → R2 tal que:
−3 1 5
  
x   x  
1 −1 2 x − y + 2z
T  y  =  y  =
−3 1 5 −3x + y + 5z
z z

En este caso no es tan simple vizualizar el significado geométrico de esta transfor-


mación.

Ejemplo 7.1.8. Consideremos la función T : R2 → R3 definida por la siguiente fórmula:


 
  4x − 2y  
x x
T =  2x + y  , ∀ ∈ R2
y y
x+y

Queremos probar que es lineal. Para ello, en lugar de verificar las condiciones de la defi-
nición de transformación lineal, podemos observar que
   
  4x − 2y 4 −2  
x x
T =  2x + y  =  2 1  .
y y
x+y 1 1
 
4 −2
Luego, si llamamos A a la matriz A =  2 1  hemos obtenido que:
1 1
 
  4 −2    
x x x
T =  2 1  . , ∀ ∈ R2
y y y
1 1

La proposición anterior nos permite concluir que T es lineal. Observemos también que las
columnas de A coinciden con las imágenes por T de los vectores de la base canónica de
R2 :    
  4   −2
1 0
T = 2  , T = 1 
0 1
1 1
184 Capı́tulo 7. Transformaciones lineales

7.2. Matriz asociada a una transformación lineal


Todos los ejemplos anteriores son del mismo tipo que el ejemplo 7.1.2, es decir, en todos
los casos la transformación se definió como la multiplicación por una matriz. Veamos
que esto no es casual y que en realidad el ejemplo 7.1.2 es paradigmático, ya que toda
transformación lineal puede escribirse como la multiplicación por una matriz.

Teorema 7.2.1. Caracterización de las transformaciones lineales.


Sea T : Rn → Rm una transformación lineal. Entonces

1. Existe una única matriz A de tamaño m × n tal que T (v) = A.v , ∀ v ∈ Rn .

2. Las columnas de A son los transformados por T de los vectores de la base canónica
de Rn , es decir, Cj (A) = T (ej ), para j = 1, 2, . . . n.

Demostración.  
x1
Existencia: Sea v =  ...  un vector cualquiera de Rn . El vector v se expresa en la base
 

xn
canónica de la siguiente manera:

v = x1 e1 + x2 e2 + . . . + xn en

Si aplicamos T a ambos miembros y utilizamos la linealidad de T obtenemos:

T (v) = x1 T (e1 ) + x2 T (e2 ) + . . . + xn T (en )

de donde resulta entonces que


 
x1

 x2 

T (v) = A.  ..  = A.v
 . 
xn

en donde A es la matriz que tiene por columnas a los vectores T (e1 ), T (e2 ), . . . , T (en ).

Unicidad: Supongamos que B es una matriz de tamaño m × n tal que T (v) = B.v , ∀ v ∈
Rn . Para v = ej obtenemos: T (ej ) = B.ej = Cj (B). Es decir, necesariamente las columnas
de B son los transformados por T de los vectores de la base canónica de Rn y, por lo tanto,
B = A. ♠

El teorema anterior motiva la siguiente definición:

Definición 7.2.1. Matriz asociada a una transformación lineal.


Sea T : Rn → Rm una transformación lineal, llamaremos matriz asociada a T a la
matriz m × n, que representaremos por [T ] cuyas columnas son los transformados de los
vectores de la base canónica, es decir: Cj ([T ]) = T (ej ), para j = 1, 2, . . . n.
7.2. Matriz asociada a una transformación lineal 185

A partir de esta definición y del teorema anterior tenemos que si T : Rn → Rm es una


transformación lineal y [T ] es una matriz asociada entonces:
     
x1 x1 x1
T (v) = T  ...  = [T ].  ...  , ∀ v =  ...  ∈ Rn
     

xn xn xn

Ejemplo 7.2.1. Consideremos la función T : R2 → R3 definida por la siguiente fórmula:


 
  4x − 2y  
x x
T =  2x + y  , ∀ ∈ R2
y y
xy

¿Es T una transformación lineal? Si lo fuera, deberı́a cumplirse T (v) = [T ].v , ∀ v ∈ R2 ,


en donde las columnas de [T ] son las imágenes de los vectores de la base canónica. Se
tiene:
     
  4   −2 4 −2
1 0
T = 2  y T = 1  y [T ] =  2 1 
0 1
0 0 0 0
   
4 −2   4x − 2y  
x x
Como  2 1 . =  x + y  6= T podemos concluir que T no es
y y
0 0 0
lineal.
Ejemplo 7.2.2. Sea T : R3 → R3 una transformación lineal de la cual se sabe que:
           
1 −2 0 1 0 4
T  0  =  1  , T  1  =  0  , T  0  =  −1 
0 3 0 1 1 π

La matriz asociada a T es entonces:


 
−2 1 4
[T ] =  1 0 −1 
3 1 π
 
x
Para hallar el transformado de un vector  y  cualquiera de R3 procedemos de la
z
siguiente manera:
       
x −2 1 4 x −2x + y + 4z
T  y  =  1 0 −1  .  y  =  x−z 
z 3 1 π z 3x + y + πz

Otra conclusión que se saca del teorema 7.2.1 es que una transformación lineal queda
determinada si se conocen los transformados de los vectores de la base canónica. Este
resultado puede extenderse a una base cualquiera como se prueba en el siguiente teorema.
186 Capı́tulo 7. Transformaciones lineales

Teorema 7.2.2. Determinación de una transformación lineal.


Sean V = {v1 , . . . , vn } una base de Rn y W = {w1 , w2 , . . . , wn } ⊂ Rm , un conjunto de n
vectores arbitrarios (eventualmente repetidos). Entonces, existe una única transformación
lineal T : Rn → Rm tal que T (vi ) = wi , ∀ i = 1, . . . , n.

Demostración.
Existencia: Sea B la matriz de tamaño m × n que tiene por columnas los vectores de W ,
es decir: B = MW . Definimos entonces T : Rn → Rm mediante:

T (x) = B . coordV (x) , ∀ x ∈ Rn . (7.2)

Observemos que si x = x1 v1 + x2 v2 + . . .+ xn vn (o sea, si x1 , x2 , . . . , xn son las coordenadas


de x en la base V ) entonces la definición dada pata T (x) coincide con:

T (x) = x1 w1 + x2 w2 + . . . + xn wn

Veamos, en primer lugar, que T (vi ) = wi , ∀ i = 1, . . . , n. En efecto:

T (vi ) = B.coordV (vi ) = B.ei = wi

Nos falta probar que T es lineal. Sean entonces x e y vectores de Rn y λ, µ números reales.
Se tiene:

T (λx + µy) = B.coordV (λx + µy) = B. ( λcoordV (x) + µcoordV (y) )

= λB.coordV (x) + µB.coordV (y) = λT (x) + µT (y)


Unicidad: Supongamos que existan T : Rn → Rm y S : Rn → Rm lineales tales que
T (vi ) = wi y S (vi ) = wi , para i = 1, 2, . . . , n. Entonces T y S coinciden en una base de
Rn ; y por consiguiente coinciden en todo el espacio. En efecto, sea v ∈ Rn . Como B es
base de Rn , existen α1 , . . . , αn ∈ R tales que v = α1 v1 + . . . + αn vn . Luego, por ser T y S
lineales:

T (v) = T (α1 v1 + · · · + αn vn ) = α1 T (v1 ) + · · · + αn T (vn )


= α1 S (v1 ) + · · · + αn S (vn ) = S (α1 v1 + · · · + αn vn ) = S (v) .

Hemos probado, pues, que una transformación lineal queda determinada por los valores
que toma sobre una base. En otras palabras, si se conocen los transformados de una base
(obsérvese que se trata de una cantidad finita de valores) entonces se conocen los valores
que toma la transformación lineal en cualquier punto. Piense el lector que en general cono-
cer una cantidad finita de valores de una función no es suficiente para determinarla, incluso
por ejemplo si uno considera una función continua real, el conocer una cantidad finita de
imágenes no permite determinar que ocurre en otros puntos. Ocurre que la hipótesis de
linealidad es muy fuerte e implica una gran rigidez.

Veamos cómo es que se puede determinar una transformación lineal a partir de conocer
los valores que toma en una base en un par de ejemplos.
7.2. Matriz asociada a una transformación lineal 187

Ejemplo 7.2.3. Sea T : R2 → R2 lineal tal que


     
1 0 2
T =T =
0 1 3
   
1 0
Como , es la base canónica de R2 , T queda determinada.
0 1
Luego
          
x 1 0 1 0
T =T x +y = xT +yT =
y 0 1 0 1
        
2 2 2 2 x 2x + 2y
=x +y = =
3 3 3 3 y 3x + 3y

Ejemplo 7.2.4. Sea T : R2 → R3 lineal tal que


   
  3   2
1 0
T =  −1  y T = 1 
2 1
5 −1
   
1 0
Como B = , es una base de R2 , T está bien definida.
2 1
   
x x
Calculemos T con ∈ R2 . Para esto escribamos primero un vector cual-
y y
 
x
quiera como combinación lineal de la base B.
y
     
x 1 0
=x + (−2x + y)
y 2 1

Entonces

 
    
x 1 0
T =T x + (−2x + y) =
y 2 1
   
1 0
xT + (−2x + y) T =
2 1
     
3 2 −x + 2y
x  −1  + (−2x + y)  1  =  −3x + y  .
5 −1 7x − y

Entonces    
  −x + 2y −1 2  
x x
T =  −3x + y  =  −3 1 
y y
7x − y 7 −1

Observación 7.2.1. Sobre la determinación de una trasformación lineal.


Si V = {v1 , v2 , . . . , vn } es una base de Rn y w1 , w2 , . . . , wn son n vectores arbitrarios de
188 Capı́tulo 7. Transformaciones lineales

Rm , el teorema 7.2.2 afirma que existe una única transformación lineal T : Rn → Rm tal
que T (vi ) = wi , ∀ i = 1, . . . , n. Dicha transformación lineal viene dada por la fórmula 7.2:

T (x) = B . coordV (x) , ∀ x ∈ Rn .

Si recordamos que coordV (x) = (MV )−1 x entonces la única transformación que cumple
con las condiciones establecidas se puede escribir:

T (x) = B . (MV )−1 . x , ∀ x ∈ Rn .

Resulta entonces que si conociéramos la matriz (MV )−1 podrı́amos hallar T (x) aplicando
esta última fórmula. Apliquemos esto en el ejemplo previo. Tenemos:
 
3 2    
1 0 −1 1 0
B=  −1 1  , MV = , (MV ) =
2 1 −2 1
5 −1
   
3 2   −1 2
1 0
Luego: B. (MV )−1 =  −1 1 . =  −3 1  y, por lo tanto:
−2 1
5 −1 7 −1
   
  −1 2   −x + 2y
x x
T =  −3 1  =  −3x + y 
y y
7 −1 7x − y

7.3. Operaciones con transformaciones lineales


Al igual que con otras funciones, con las transformaciones lineales se puede operar alge-
braicamente, sumándolas, multiplicándolas por números o componiéndolas. Ahora bien,
cuando se opera con funciones que tienen alguna propiedad particular, es de interés pre-
guntarse si la nueva función que se obtiene hereda esa misma propiedad. Por ejemplo, al
sumar funciones continuas se obtiene una nueva función continua. Veremos entonces que
ocurre lo mismo con la linealidad: al sumar dos transformaciones lineales se obtendrá una
nueva transformación lineal, del mismo modo que al multiplicar una transformación lineal
por un número. No solo eso, sino que la matriz asociada a la suma resultará ser la suma
de las matrices asociadas. Más aún, la composición de trasformaciones lineales también
resultará lineal y la matriz asociada a la compuesta será el producto de las matrices aso-
ciadas a cada componente. Este notable hecho ayuda a generar un paralelismos entre las
matrices y las transformaciones lineales. Veamos con detalle todos estos hechos.

Proposición 7.3.1. Sean T, S : Rn → Rm dos transformaciones lineales y α un número


real. Entonces

(i) T + S es una transformación lineal y su matriz asociada es [T + S] = [T ] + [S]

(ii) αT es una transformación lineal y su matriz asociada es [αT ] = α[T ]


7.3. Operaciones con transformaciones lineales 189

Demostración.
Probaremos (i) y dejamos (ii) como ejercicio.
Sean, con la notación habitual, [T ] y [S] las matrices asociadas a T y S respectivamente.
Para todo x ∈ Rn se tiene:

(T + S)(x) = T (x) + S(x) = [T ].x + [S].x = ( [T ] + [S] ) .x

De la proposición 7.1.2 se deduce que T + S es lineal (pues viene dada como el producto
de una matriz) y, del teorema 7.2.1, se deduce que la matriz asociada a T + S es [T ] + [S].

Definición 7.3.1. Composición de transformaciones lineales.


Sean T : Rn → Rm y S : Rm → Rp dos transformaciones lineales. Se define la composición
de S y T como la transformación S ◦ T : Rn → Rp tal que (S ◦ T ) (u) = S (T (u)) , ∀ u ∈
Rn .
 
x  
3 2 2x
Ejemplo 7.3.1. Sean T : R → R tal que T  y  = y S : R2 → R2 tal
y+z
z
   
u v
que S = . Luego S ◦ T : R3 → R2 es tal que
v u
    
x x
(S ◦ T )  y  = S T  y  =
z z
   
2x y+z
=S =
y+z 2x
Proposición 7.3.2. Composición de transformaciones lineales. Sean T : Rn → Rm
y S : Rm → Rp dos transformaciones lineales. Entonces S ◦ T es lineal y además

[S ◦ T ] = [S].[T ]

Demostración.
Para todo x ∈ Rn se tiene:

(S ◦ T )(x) = S(T (x)) = [S] . T (x) = [S] . ([T ].x) = ([S].[T ]) .x

De la proposición 7.1.2 se deduce que S ◦ T es lineal (pues viene dada como el producto
de una matriz) y, del teorema 7.2.1, se deduce que la matriz asociada a S ◦ T es [S].[T ].

Ejemplo 7.3.2. Sean T : R2 → R3 y S : R3 → R2 determinadas por las siguientes


condiciones (recordar el teorema 7.2):
     
  2   1 1  
1 0 1
T = 1  , T =  1  , S  0  =
0 1 3
1 0 0
190 Capı́tulo 7. Transformaciones lineales

  

0   0  
2 2
S  1   = y S   1   =
2 −4
1 −1
   
2 2 x x
Consideramos R = S ◦ T : R → R y queremos calcular R , ∀ ∈ R2 .
y y
   
x x
Como ya hemos observado antes, R = [R]. y, por el teorema previo,
y y
[R] = [S].[T ]. Calculemos entonces
 [T] y [S].
2 1
Es inmediato ver que [T ] =  1 1 . Para hallar [S] debemos conocer las imágenes por
1 0
3
S de los vectores de la base canónica
de R . Para 
elloexpresamos
 dichos vectores como
 1 0 0 
combinación lineal de la base V =  0  ,  1  ,  1  . Se tiene:
 
0 1 −1
           
0 0 0 0 0 0
1 1 1 1
 1 =  1 +  1  y  0 =  1 −  1 
2 2 2 2
0 1 −1 1 1 −1

Por lo tanto:
     
0 0 0      
1 1 1 2 1 2 2
S 1  = S 1 + S 1  = + =
2 2 2 2 2 −4 −1
0 1 −1

     
0 0 0      
1   1  1 2 1 2 0
S  0  = S 1 − S 1  = − =
2 2 2 2 2 −4 3
1 1 −1
En consecuencia:  
1 2 0
[S] =
3 −1 3

Por lo tanto  
  2 1  
1 2 0 4 3
[R] =  1 1 = ⇒
3 −1 3 8 2
1 0
      
x 4 3 x 4x + 3y
R = =
y 8 2 y 8x + 2y

7.4. Inversa de una transformación lineal


Al igual que lo que ocurre con funciones de R en R, es posible estudiar el concepto de
función inversa para transformaciones lineales.
7.4. Inversa de una transformación lineal 191

Definición 7.4.1. Transformación lineal invertible.


Consideremos una transformación lineal T : Rn → Rn . Diremos que T es invertible si,
y solo si, existe S : Rn → Rn tal que

S◦T =T ◦S =I

donde I es la transformación lineal identidad (es decir I(v) = v ∀ v ∈ Rn ).

Si T es invertible entonces hay una única S : Rn → Rn tal que S ◦ T = T ◦ S = I. Por


tal motivo se le llama inversa de T y se utiliza la notación S = T −1 . En efecto, para ver
la unicidad supongamos que S1 y S2 son transformaciones lineales de Rn en Rn tales que
S1 ◦ T = T ◦ S1 = I y S2 ◦ T = T ◦ S2 = I. Se tiene:

S1 = S1 ◦ I = S1 ◦ (T ◦ S2 ) = (S1 ◦ T ) ◦ S2 = I ◦ S2 = S2 ♠

Nuevamente, la propiedad que estamos estudiando para una transformación lineal puede
reducirse al estudio de la misma propiedad para su matriz asociada como lo muestra la
siguiente proposición.

Proposición 7.4.1. Condición necesaria y suficiente para que una transforma-


ción sea invertible.
Sea T : Rn → Rn una transformación lineal. Entonces se cumple que T invertible si, y
solo si, su matriz asociada [T ] es una matriz invertible. En caso afirmativo se tiene que
T −1 es lineal y además [T −1 ] = [T ]−1 (la matriz asociada a T −1 es la inversa de la matriz
asociada a T ).

Demostración.
Supongamos T invertible. Veamos primero que T −1 es lineal. Para esto consideremos w1
y w2 ∈ Rn y λ y µ ∈ R. 
Observando que T ◦ T −1 (w) = w y que T es lineal, tenemos:
 
λ w1 + µ w2 = λ T ◦ T −1 (w1 ) + µ T ◦ T −1 (w2 ) =
  
= λT T −1 (w1 ) + µT T −1 (w2 ) = T λT −1 (w1 ) + µT −1 (w2 )
hemos llegado entonces a que:

λ w1 + µ w2 = T λT −1 (w1 ) + µT −1 (w2 )

Aplicando T −1 a ambos miembros resulta

T −1 (λw1 + µ w2 ) = λT −1 (w1 ) + µT −1 (w2 ) .

lo cual prueba la linealidad de T −1 .

Como T ◦ T −1 = I, en virtud de la proposición 7.3.2 se cumple que

[T ].[T −1 ] = [T ◦ T −1 ] = [I] = In (matriz identidad n × n)


192 Capı́tulo 7. Transformaciones lineales

Tenemos entonces que [T ] es invertible y que su inversa es [T ]−1 .

Recı́procamente, supongamos ahora que [T ] es una matriz invertible, con lo cual se cumple
[T ].[T ]−1 = In . Definimos S : Rn → Rn mediante S(x) = [T ]−1 .x , ∀ x ∈ Rn . La
proposición 7.1.2 nos permite asegurar que S es lineal y además tenemos:

(S ◦ T )(x) = S[T (x)] = [T ]−1 .T (x) = [T ]−1 .[T ].x = x , ∀ x ∈ Rn .

(T ◦ S)(x) = T [S(x)] = [T ].S(x) = [T ].[T ]−1 .x = x , ∀ x ∈ Rn .


de donde S ◦ T = T ◦ S = I. ♠

   
2 2 x 2x + y
Ejemplo 7.4.1. Sea T : R → R tal que T = . Queremos probar
y x+y
que T es invertible y calcular T −1
Según el teorema anterior, para probar que T es invertible es suficiente con ver que la
matriz asociada [T ] es invertible. Para esto último podemos verificar que det[T ] 6= 0.
Observemos que    
2 1 2 1
[T ] = ⇒ det = 1 6= 0
1 1 1 1
Para calcular T −1 calculemos su matriz asociada. Para ello alcanza con invertir [T ]. Te-
nemos:  
−1 1 −1
[T ] = ⇒
−1 2
      
−1 x 1 −1 x x−y
T = =
y −1 2 y −x + 2y

7.5. Núcleo e imagen de una transformación lineal


En esta sección veremos dos subespacios vinculados a una transformación lineal cuya
estructura es fundamental para comprender como actúa la misma.

Definición 7.5.1. Núcleo e imagen de una transformación lineal


Sea T : Rn → Rm una transformación lineal.

(i) Llamaremos núcleo de T al subconjunto del dominio cuya imagen por T es el vector
nulo, es decir
N (T ) = {v ∈ Rn / T (v) = o}

(ii) Llamaremos imagen de T al recorrido de la función T :

Im(T ) = {w ∈ Rm / ∃ v ∈ Rn con w = T (v)}

Ejemplo 7.5.1. Sean S 6= {o} un subespacio de Rn y PS : Rn → Rn la transformación


“proyección ortogonal” sobre S. En este caso resulta claro que Im(PS ) = S y que N (PS ) =
S⊥.
7.5. Núcleo e imagen de una transformación lineal 193

Observación 7.5.1. Relación del núcleo e imagen con la matriz asociada.


Si T : Rn → Rm es una transformación lineal entonces su matriz asociada [T ] es una
matriz de tamaño m × n. Para hallar el transformado por T de cualquier vector v ∈ Rn
alcanza con multiplicar [T ] por dicho vector:

T (v) = [T ] . v , ∀ v ∈ Rn .

1. Tenemos entonces que T (v) = o si, y solo si, [T ].v = o. Resulta entonces que el
núcleo de T coincide con el núcleo de su matriz asociada. En particular, es claro que
N (T ) es un subespacio de Rn .
2. Consideremos ahora el conjunto Im(T ). Tenemos que un vector w ∈ Rm pertenece
a Im(T ) si, y solo si, existe algún vector v ∈ Rn tal que T (v) = w, que es lo mismo
que [T ].v = w. Esta última igualdad equivale a decir que w es combinación lineal
de las columnas de [T ]. Este hecho ya lo hemos utilizado en diversas ocasiones. De
todos modos volvamos a repasarlo:
   
a11 . . . a1n x1
Si [T ] =  ... .. ..  y v =  ..  tenemos :

. .   . 
am1 . . . amn xn
      
a11 . . . a1n x1 a11 a1n
[T ].v =  ... .. ..   ..  = x  ..  + . . . + x  .. 

. .  .  1 .  n . 
am1 . . . amn xn am1 amn
Podemos concluir entonces que Im(T ) está formado por todos aquellos vectores de
Rm que son C.L. de las columnas de [T ], Dicho de otra forma, Im(T ) coincide con el
subespacio generado por las columnas de la matriz asociada a T : Im(T ) = L [C[T ]].
En particular, Im(T ) es un subespacio de Rm .
3. De las observaciones anteriores podemos sacar además las siguientes conclusiones
acerca de las dimensiones del núcleo y la imagen de la transformación T :

dimN (T ) = dimN [T ] = nu[T ] y dimIm(T ) = dimL [C[T ]] = rg[T ]

La dimensión de N (T ) coincide con la nulidad de su matriz asociada y la dimensión


de Im(T ) coincide con el rango de su matriz asociada.

La consideraciones que se acaban de realizar en la observación previa son la demostración


de las siguientes dos proposiciones.

Proposición 7.5.1. Estructura del núcleo y de la imagen.


Sea T : Rn → Rm una transformación lineal. Entonces

1. N (T ) es un subespacio vectorial de Rn que coincide con el núcleo de la matriz


asociada a T .

2. Im(T ) es un subespacio vectorial de Rm que coincide con el subespacio generado por


las columnas de la matriz asociada a T .
194 Capı́tulo 7. Transformaciones lineales

Teorema 7.5.1. Teorema de las dimensiones.


Sea T : Rn → Rm una transformación lineal. Entonces

dim N (T ) + dim Im(T ) = n

Ejemplo 7.5.2. Se considera la transformación lineal T : R3 → R2 tal que


 
x  
x + y + z
T  y  =
2x + 2y + 2z
z

1) Hallemos el núcleo de T .
   
x x      
 y  ∈ N (T ) ⇔ T  y  = 0 ⇔ x+y+z
=
0
0 2x + 2y + 2z 0
z z

x+y+z =0
⇔ ⇔ x+y+z =0
2x + 2y + 2z = 0
       
 x   1 1 
Ası́ el N (T ) =  y  ∈ R3 : x + y + z = 0 = L   −1  ,  0  .
   
z 0 −1
2) Hallemos la imagen de T .
 , 
  x0 x0  
a 3
 a
∈ Im (T ) ⇔ existe  y0  ∈ R T  y0  =
b b
z0 z0
 
x0    
3 x0 + y0 + z0 a
⇔ existe  y0  ∈ R tal que =
2x0 + 2y0 + 2z0 b
z0
 
x0 
3 x0 + y0 + z0 = a
⇔ existe  y0  ∈ R tal que
2x0 + 2y0 + 2z0 = b
z0

x+y+z =a
⇔ el sistema es compatible
2x + 2y + 2z = b

x+y+z =a
⇔ el sistema es compatible
0 = b − 2a

⇔ b = 2a
    
a 2 1
Luego: Im (T ) = ∈ R : b = 2a = L .
b 2
Observemos que se verifica: dimN (T ) + dimIm(T ) = 2 + 1 = 3.
7.6. Transformaciones lineales inyectivas, sobreyectivas y biyectivas 195

Ejemplo 7.5.3. Se considera la transformación lineal T : R3 → R2 tal que


 
x  
x + y
T  y  =
y+z
z

Calculemos en primer lugar la matriz asociada a T :


 
1 1 0
[T ] =
0 1 1
Para hallar el núcleo de T calculamos el núcleo de su matriz asociada [T ]. Como [T ] ya
esta escalerizada se obtiene inmediatamente
    
 x   −1 
N (T ) =  y  ∈ R3 / x = −y, z = −y, y ∈ R = L   1  
   
z −1

Para hallar Im(T ), hallamos el subespacio generado por las columnas de su matriz aso-
ciada [T ]. Como esta matriz tiene rango 2 deducimos que dimIm(T ) = 2 y, por lo tanto,
Im(T ) = R2 .

Observemos que se verifica: dimN (T ) + dimIm(T ) = 1 + 2 = 3.

7.6. Transformaciones lineales inyectivas, sobreyectivas y bi-


yectivas
Como ya se comentó anteriormente, el núcleo y la imagen permiten caracterizar propie-
dades importantes de una transformación lineal. Recordemos las siguientes definiciones

Definición 7.6.1. Transformaciones lineales inyectivas, sobreyectivas y biyecti-


vas.
Sea T : Rn → Rm una transformación lineal.
T es inyectiva si, y solo si, T (v1 ) = T (v2 ) implica v1 = v2 . O, de manera equiva-
lente, si ∀ v1 , v2 ∈ Rn con v1 6= v2 se cumple que T (v1 ) 6= T (v2 ).
T es sobreyectiva si, y solo si, ∀ w ∈ Rm existe v ∈ Rn tal que T (v) = w.
O, de manera equivalente, si Im (T ) = Rm .
T es biyectiva si es inyectiva y sobreyectiva.

Proposición 7.6.1. Caracterización de las transformaciones lineales inyectivas.


Sea T : Rn → Rm una transformación lineal. Entonces son equivalentes las siguientes
afirmaciones:
1. T es inyectiva.
2. Para todo conjunto U linealmente independiente de Rn se cumple que T (U ) es li-
nealmente independiente en Rm .
3. N (T ) = {o}.

Demostración.
196 Capı́tulo 7. Transformaciones lineales

(1) ⇒ (2) Sabemos que T es inyectiva. Sea U = {v1 , v2 , . . . , vn } un conjunto L.I. de Rn .


Probemos que T (U ) = {T (v1 ) , T (v2 ), . . . , T (vn )} es L.I. en Rm . Sean entonces
α1 , α2 , . . . , αn ∈ R tales que

α1 T (v1 ) + α2 T (v2 ) + . . . + αn T (vn ) = o

Debemos probar que α1 = α2 = . . . = αn = 0. Como T es lineal:

T (α1 v1 + . . . + αn vn ) = o = T (o.

Luego, al ser T inyectiva se tiene que

α1 v1 + . . . + αn vn = o

Como U = {v1 , v2 , . . . , vn } es L.I., se cumple que α1 = α2 = . . . = αn = 0.


(2) ⇒ (3) Supongamos, por absurdo, que N (T ) 6= {o}. Entonces existe v ∈ N (T ) con
v 6= o. Luego, el conjunto U = {v} es L.I. en Rn pero el conjunto T (U ) = {T (v)} =
{o} es L.D. en Rm lo cual contradice la hipótesis.
(3) ⇒ (1) Si T (v1 ) = T (v2 ) =⇒ T (v1 ) − T (v2 ) = o. Luego T (v1 − v2 ) = o =⇒
v1 − v2 ∈ N (T ). Por hipótesis debe ser v1 − v2 = o, de donde resulta v1 = v2 . ♠

Proposición 7.6.2. Caracterización de las transformaciones lineales sobreyecti-


vas.
Sea T : Rn → Rm una transformación lineal. Entonces son equivalentes las siguientes
afirmaciones:
1. T es sobreyectiva.
2. Para todo conjunto U = {v1 , v2 , . . . , vp } generador de Rn se cumple que T (U ) =
{T (v1 ), T (v2 ), . . . , T (vp )} es un generador de Rm .

Demostración.
(1) ⇒ (2) Consideremos w ∈ Rm cualquiera. Como T es sobreyectiva entonces w ∈
Im(T ) = Rm y, por lo tanto, existe v ∈ Rn tal que T (v) = w. Como U es ge-
nerador de Rn entonces existen escalares, λ1 , . . . , λp tales que v = λ1 v1 + . . . + λp vp .
Aplicando T y usando la linealidad se tiene que

w = T (v) = T (λ1 v1 + . . . + λp vp ) = λ1 T (v1 ) + . . . + λp (T (vp )

de donde se deduce que w es combinación lineal de T (U ) y por lo tanto este último


genera Rm .
(1) ⇒ (2) Ahora tenemos que probar que Im(T ) = Rm . Sea w ∈ Rm un vector cualquiera y
veamos que pertenece a la imagen. Como T (U ) genera Rm entonces existen α1 , . . . , αp
escalares tales w = α1 T (v1 ) + . . . + αp vp , usando que T es lineal se deduce que
w = T (α1 v1 + . . . + αp vp ) y por lo tanto w ∈ Im(T ). ♠

Proposición 7.6.3. Sobre las dimensiones del dominio y el codominio.


Sea T : Rn → Rm una transformación lineal. Entonces:
1. Si T es inyectiva entonces n ≤ m.
7.6. Transformaciones lineales inyectivas, sobreyectivas y biyectivas 197

2. Si T es sobreyectiva entonces n ≥ m.
3. Si T es biyectiva entonces n = m.
Demostración.
Todo surge del Teorema de las dimensiones (teorema 7.5.1) que establece que:

dim N (T ) + dim Im(T ) = n

En efecto:
1. Si T es inyectiva entonces N (T ) = {o} y, por lo tanto, la relación anterior implica
que dim Im(T ) = n. Por otra parte, dim Im(T ) es el rango de la matriz [T ], que
como tiene m filas, debe ser menor o igual que m. Se deduce que n ≤ m.
2. Si T es sobreyectiva entonces sabemos que Im(T ) = Rm de donde dim Im(T ) = m.
De la igualdad dim N (T ) + dim Im(T ) = n se deduce entonces que n ≥ m.
3. Es inmediato debido a las dos partes anteriores. ♠

Observación 7.6.1. Vale la pena observar que si T : Rn → Rm es lineal e invertible


entonces debe ser m = n. En efecto, si es invertible es biyectiva y, por lo tanto, inyectiva
y sobreyectiva, lo cual implica implica (según el teorema anterior) que m = n.
Otra consecuencia del teorema anterior se establece en la siguiente proposición cuyos
detalles quedan a cargo del lector.
Corolario 7.6.1. Sea T : Rn → Rn una transformación lineal de Rn en sı́ mismo. En-
tonces:
1. Si T es inyectiva entonces T es biyectiva.
2. Si T es sobreyectiva entonces T es biyectiva.

En los próximos dos ejemplos mostraremos cómo el estudio de las transformaciones lineales
permite obtener un panorama más geométrico y conceptual de algunos resultados (para
nada intuitivos a priori) vinculados con operaciones con matrices.

Ejemplo 7.6.1. Queremos probar la siguiente afirmación:


Si A es una matriz de tamaño 5 × 8 y B otra matriz de tamaño 8 × 5 entonces el producto
B.A (que es una matriz cuadrada 8 × 8) NO es invertible. Si pensamos exclusivamente
en la operatoria con matrices, la proposición considerada no parece ni intuitiva ni fácil
de manejar. Consideremos entonces las transformaciones lineales definidas a partir de las
matrices dadas:

T : R8 → R5 / T (x) = A.x , ∀ x ∈ R8 S : R5 → R8 / B(v) = B.v , ∀ v ∈ R5

De esta manera la matriz B.A es la matriz asociada a la composición S ◦ T :

S ◦ T : R8 → R8 / (S ◦ T )(x) = (B.A).x , ∀ x ∈ R8

Ahora bien, como 8 > 5 la transformación T no puede ser inyectiva, con lo cual podemos
afirmar que existe x1 ∈ R8 con x1 6= o tal que T (x1 ) = o. Pero entonces tenemos que:

(S ◦ T )(x1 ) = S (T (x1 )) = S(o) = o


198 Capı́tulo 7. Transformaciones lineales

Resulta entonces que (S ◦T ) tampoco es inyectiva y por lo tanto no invertible (al igual que
su matriz asociada). La proposición ha quedado demostrada de una forma extremadamente
simple.

Como el lector comprenderá fácilmente, los números 8 y 5 no jugaron ningún papel decisivo.
La proposición general (que se prueba igual) es entonces:
Si A es una matriz de tamaño m × n (con m < n) y B otra matriz de tamaño n × m
entonces el producto B.A (que es una matriz cuadrada n × n) NO es invertible.

Ejemplo 7.6.2. Dada una matriz no nula D de tamaño q × r ¿cómo podemos encontrar
una matriz no nula C de tamaño p × q tal que C.D = O (matriz nula)?
Las transformaciones lineales asociadas a estas matrices son:

T : Rr → Rq / T (x) = D.x , ∀ x ∈ Rr , S : Rq → Rp / S(y) = C.y , ∀ y ∈ Rq

(S ◦ T ) : Rr → Rp / (S ◦ T )(x) = (C.D).x , ∀ x ∈ Rr
T S
x 7−→ T (x) 7−→ S (T (x))
Que C.D = O equivale a decir que la transformación (S ◦ T ) es la nula (esto es, a cualquier
x le hace corresponder el vector nulo). Para que esto ocurra el conjunto imagen de T debe
estar contenido en el núcleo de S: Im(T ) ⊂ N (S).

T S
Rq Rp
r
R

N (S) o

Dada la transformación T , conocemos su imagen (es el subespacio generado por las co-
lumnas de D) y debemos encontrar otra transformación S de modo que Im(T ) ⊂ N (S),
o incluso, Im(T ) = N (S). Ahora que lo visualizamos de este modo podemos afirmar que
alcanzará con encontrar una matriz de tamaño p×q cuyonúcleo coincida
 con el subespacio
3 2 1
generado por las columnas de D. Por ejemplo, si D =  3 2 1  entonces claramen-
6 4 2
 
 1 
te una base del subespacio generado por las columnas de D es:  1  . Un vector
 
2
 
 a 
 b  pertenece al subespacio generado por las columnas de D si, y solo si, a − b = 0
 
c
7.7. Valores y vectores propios de una transformación lineal 199

y 2a − c = 0. Para encontrar una matriz cuyo núcleo esté formado por los vectores (a, b, c)
tales que a − b = 0 y y 2a − c = 0 utilizamos
 los coeficientes de esta útimas ecuacio-
1 −1 0
nes y ponemos (también por ejemplo): C = . Es inmediato verificar que
2 0 −1
C.D = O. Obsérvese
 que también
 podrı́amos haber tomado la matriz C con más filas, por
1 −1 0
 2
 0 −1  
ejemplo: C =  1 −1
 0 
.
 2 0 −1 
3 −1 −1

7.7. Valores y vectores propios de una transformación lineal


Definición 7.7.1. Valores y vectores propios de una transformación lineal.
Sea T : Rn → Rn una transformación lineal. Diremos que el número λ es valor propio
(o autovalor) de T si, y solo si, existe algún vector v ∈ Rn , con v 6= o, tal que T (v) = λv.
Si λ es valor propio de T , entonces a cada vector x ∈ Rn que verifique la igualdad
T (x) = λx lo llamaremos vector propio (o autovector) asociado al valor propio λ.
Observación 7.7.1. Valores y vectores propios de una transformación y de su
matriz asociada.
Con la misma notación que en la definición anterior, si [T ] es la matriz asociada a T ,
entonces se cumple que:
T (v) = λv ⇐⇒ [T ].v = λv
Es ası́ que (al igual que todos los conceptos estudiados en las secciones anteriores), el estu-
dio de las propiedades y resultados para valores y vectores propios de una transformación
lineal se reducen al estudio de los mismos para su matriz asociada. Tendremos entonces
las siguientes equivalencias:
λ es valor propio de T ⇐⇒ λ es valor propio de [T ].
v es vector propio de T ⇐⇒ v es vector propio de [T ].
Sλ es un subespacio propio de T ⇐⇒ Sλ es un subespacio propio de [T ].
T es diagonalizable ⇐⇒ [T ] es una matriz diagonalizable.
T es diagonalizable ⇐⇒ existe una base de Rn formada por vectores propios de [T ]
(o cualquiera de las otras condiciones equivalentes estudiadas en el capı́tulo 6).
La diferencia es que, en el caso de transformaciones lineales, podemos interpretar geométri-
camente lo que está sucediendo. Por ejemplo, si Sλ = {x ∈ Rn / T (x) = λx} es el
subespacio propio de T asociados al valor propio λ, entonces la restricción de T a dicho
subespacio es una homotecia (dilatación o contracción) de constante λ. El correspondiente
por la transformación T de cada vector x perteneciente a Sλ se obtiene multiplicando al
vector x por el número λ.

Ejemplo 7.7.1. Sea T : R3 → R3 tal que


   
x 4x + y + z
T  y  =  3y − z 
z −y + 3z
200 Capı́tulo 7. Transformaciones lineales

Queremos investigar si T es diagonalizable y, en caso de serlo, hallar una base de R3 for-


mada por vectores propios de T .

La matriz asociada a T es:  


4 1 1
[T ] =  0 3 −1 
0 −1 3
Para obtener los valores propios de T calculamos el polinomio caracterı́stico
 
4−λ 1 1
det  0 3 − λ −1  = (4 − λ)(λ2 − 6λ + 8) = (4 − λ)2 (2 − λ)
0 −1 3 − λ

Los valores propios son entonces λ1 = 4 (doble) y λ2 = 2 (simple). Para determinar si T


es diagonalizable debemos decidir si existe una base de vectores propios. Recordemos que,
en general se cumple 0 < mg(λ) = dim(Sλ ) ≤ ma(λ) donde ma(λ) es la multiplicidad de
λ como raı́z del polinomio caracterı́stico. Además, para que T sea diagonalizable deben
coincidir la multiplicidad geométrica y algebraica de todos los valores propios.
Volviendo a nuestro ejemplo, como 2 es raı́z simple del polinomio caracterı́stico, es decir
tiene ma(2) = 1, entonces dim(S2 ) = mg(2) = 1. De aquı́ surge que si existiera una base
de vectores propios el subespacio propio S2 aportarı́a un vector. Los otros dos deberı́an
provenir del otro subespacio S4 . Al ser 4 raı́z doble, es decir ma(4) = 2 entonces mg(4)
puede ser 1 o 2. En el primer caso T no serı́a diagonalizable y en el segundo sı́. Usando el
teorema de las dimensiones tenemos que dim(S4 ) = dimN [T − 4I] = 3 − rg[T − 4I]
 
0 1 1
[T − 4I] =  0 −1 −1 
0 −1 −1

De donde es inmediato observar que rg[T − 4I] = 1 y, por lo tanto, mg(4) = 2 = ma(4),
por lo que T es diagonalizable. Para determinar la base de vectores propios calculamos
N (T − 4I) y N (T − 2I):
 
x
 y  ∈ N (T − 4I) ⇔ y = −z, x ∈ R ⇒
z
    
 1 0 
N (T − 4I) = L   0  ,  1  
 
0 −1
Por otra parte  
2 1 1
[T − 2I] =  0 1 −1  ⇒
0 −1 1
 
x
 y  ∈ N (T − 2I) ⇔ y = z, x = 0 ⇒
z
7.7. Valores y vectores propios de una transformación lineal 201

 
 0 
N (T − 2I) = L   1  
 
1
Por lo tanto, una base de vectores propios es
     
 1 0 0 
 0 , 1 , 1 
 
0 −1 1

Todo vector v ∈ R3 se escribe como C.L. única de U = {u1 , u2 , u3 } (siendo U la base de


vectores propios recién indicada). Por otra parte, la restricción de T a S4 es una homotecia
de razón 4 mientras que la restricción de T a S2 es una homotecia de razón 2. Luego, si
v = α1 u1 + α2 u2 + α3 u3 entonces T (v) = 4α1 u1 + 4α2 u2 + 2α3 u3 .

Interacción entre transformaciones lineales y matrices.

Lo estudiado en este capı́tulo con referencia a la relación existente entre transformaciones


lineales y matrices puede resumirse de la siguiente manera.

1. Matriz asociada. A cada transformación lineal T : Rn → Rm le corresponde una


única matriz A de tamaño m × n de modo que T (v) = A.v, ∀ v ∈ Rn . Dicha matriz
A se denomina matriz asociada a T y se simboliza [T ].
Las columnas de la matriz asociada [T ] son las imágenes por T de los vectores de la
base canónica de Rn .

2. Determinación de una trasformación lineal. Si V = {v1 , v2 , . . . , vn } es una


base de Rn y w1 , w2 , . . . , wn son n vectores arbitrarios de Rm , entonces existe una
única transformación lineal T : Rn → Rm tal que T (vi ) = wi , ∀ i = 1, . . . , n. Dicha
transformación lineal viene dada por la fórmula:

T (x) = B . coordV (x) = B . (MV )−1 . x , ∀ x ∈ Rn .

3. Operaciones con transformaciones lineales.

Suma Si T, S : Rn → Rm son dos transformaciones lineales entonces T + S es una


transformación lineal y su matriz asociada es [T + S] = [T ] + [S].
Producto por un número Si T : Rn → Rm es una transformación lineal y α ∈ R
un número real entonces αT es una transformación lineal y su matriz asociada
es [αT ] = α[T ].
Composición Si T : Rn → Rm y S : Rm → Rp son dos transformaciones lineales
entonces S ◦ T es lineal y además

[S ◦ T ] = [S].[T ]
202 Capı́tulo 7. Transformaciones lineales

4. Transformación lineal invertible y transformación inversa.


Sea T : Rn → Rn una transformación lineal. Entonces se cumple que T es invertible
(biyectiva) si, y solo si, su matriz asociada [T ] es una matriz invertible. En caso
afirmativo se tiene que T −1 es lineal y además [T −1 ] = [T ]−1 (la matriz asociada a
T −1 es la inversa de la matriz asociada a T ).

5. Núcleo e imagen de una transformación lineal.


Sea T : Rn → Rm una transformación lineal.

El núcleo de T se simboliza N (T ) y es el núcleo de su matriz asociada.


El conjunto imagen de T se simboliza Im(T ), es el recorrido de T y coincide
con el subespacio generado por las columnas de su matriz asociada.
El teorema de las dimensiones afirma que: dim N (T ) + dim Im(T ) = n.
T es inyectiva si, y solo si, N (T ) = {o}.
T es sobreyectiva si, y solo si, el rango de su matriz asociada es n.
T es biyectiva si, y solo si, m = n y es inyectiva (o sobreyectiva).

6. Vectores propios y diagonalización.

Los valores propios de T son los valores propios de su matriz asociada.


Los vectores propios de T son los vectores propios de su matriz asociada.
T es diagonalizable si, y solo si, lo es su matriz asociada.

7.8. Ejercicios
Ejercicio 7.8.1. En cada uno de los siguientes casos demuestre que la función T dada es
una transformación lineal y encuentre su matriz asociada. (Sugerencia: recuerde que para
probar que T es lineal alcanza con encontrar una matriz A tal que T (x) = A.x , ∀ x ∈
D(T ). Más aún, dicha matriz A es la matriz asociada a T ).
   
2 2 x 2x − 5y
1. T : R −→ R / T = . Encuentre la imagen por T del vector
y x+y
 
2
.
−1
 
  x − 3y
x
2. T : R2 −→ R3 / T =  x − y . Encuentre la imagen por T del vector
y
4x + y
 
2
.
−1
 
x  
3 2 x−y+z
3. T : R −→ R / T   y   = . Encuentre la imagen por T del
x + 9y + z
z
 
1
vector  0 .
−1
7.8. Ejercicios 203

 
 x−y
x  x + y+z 
4. T : R3 −→ R4 / T  y  = 
 2x − z
. Encuentre la imagen por T del

z
0
 
3
vector  3 .
−6
Ejercicio 7.8.2. Encuentre el núcleo y la imagen de las transformaciones lineales del
ejercicio anterior. Verifique la relación que hay entre dim(N (T )) y dim(Im(T )) en cada
uno de los casos.

Ejercicio 7.8.3. Se considera la transformación lineal T : R2 −→ R2 determinada por:


       
1 2 −1 1
T = , T =
0 1 2 1

1. Justifique que, con estos datos, efectivamente queda determinada una transformación
lineal.
2. Demuestre que T es invertible y halle la matriz asociada a T −1 .

Ejercicio 7.8.4. Se considera la transformación lineal T : R2 −→ R3 determinada por:


   
  3   0
1 2
T = 2  , T = 1 
1 −1
1 2

1. Justifique que, con estos datos, efectivamente queda determinada una transformación
lineal.
2. Halle T (v), ∀ v ∈ R2 .

Ejercicio 7.8.5. Se considera la transformación lineal T : R3 −→ R3 definida por


    
x 1 0 1 x
T   y   =  0 1 0   y 
z −1 0 −1 z
 
1
1. Pruebe que el vector  0  está en el N (T ) y también está en la Im(T ).
−1
2. ¿Es T biyectiva? Justifique.
3. Halle los valores y vectores propios de T e investigue si T es diagonalizable.

Ejercicio 7.8.6. Sea T : R4 → R4 tal que


   
x x+y+z+w
 y   y + z + w 
T z  = 
   
z + 2w 
w −w
204 Capı́tulo 7. Transformaciones lineales

1. Investigue si T es invertible.
2. Halle Im(T ) y N (T ).

Ejercicio 7.8.7. Se consideran lassiguientes transformaciones


 lineales:
  x + 2y
x
T1 : R2 −→ R3 / T1 =  2x − 3y 
y
0
 
x  
3 2 x−y
T2 : R −→ R / T2   y   = , T1 ◦ T2 y T2 ◦ T1 . Investigue cuáles
−x + 3y + z
z
de esas transformaciones son invertibles y determine la inversa cuando corresponda.
3 3
Ejercicio
  T : R −→ R la transformación lineal cuya matriz asociada es
7.8.8. Sea
3 0 0
M = 1 7 −2 
0 0 3
 
−4
1. Encuentre la imagen por T del vector u =  1 
0
2. ¿Es T biyectiva? Justifique la respuesta.
3. Demuestre que T es diagonalizable.

Ejercicio 7.8.9. Se considera una transformación lineal T : Rn −→ Rm . Indique si la


siguiente afirmación es verdadera o falsa. Justifique.
“Si kT (x)k = 0 entonces x ∈ N (T )”.

Ejercicio 7.8.10. Sea U = {u1 , u2 , . . . , un } una base de Rn y T : Rn −→ Rn la trans-


formación lineal tal que T (e1 ) = u1 , T (e2 ) = u2 , . . . , T (en ) = un . ¿Es T invertible?
Justifique la respuesta.

Ejercicio 7.8.11. Se considera la transformación lineal T : R3 −→ R3 determinada por:


           
1 0 2 3 0 1
T 2 = 1  , T 1 = 2  , T 0 = 1 
0 −1 0 1 1 2

1. Justifique que, con estos datos, efectivamente queda determinada una transformación
lineal.
2. Halle la matriz asociada a T .
3. Demuestre que T es invertible y halle T −1 .
4. Halle los vectores propios de T e investigue si T es diagonalizable.
5. Halle los vectores propios de T −1 e investigue si T −1 es diagonalizable.

Ejercicio 7.8.12. Sea T : Rn → Rn una transformación lineal. Demuestre que son equi-
valentes las siguientes afirmaciones
(i) T es biyectiva
(ii) Para cualquier base A de Rn se cumple que T (A) es base de Rn .
7.9. Ejercicios variados de opción múltiple 205

Ejercicio 7.8.13. Sean T : Rn → Rm una transformación lineal y A su matriz asociada.


Se define la transformación

T ∗ : Rm → Rn / T ∗ (y) = At y , ∀ y ∈ Rm .

Esta transformación se denomina adjunta de T . Demuestre que:


1. hT (x), yi = hx, T ∗ (y)i , ∀ x ∈ Rn , ∀ y ∈ Rm .
2. N (T )⊥ = Im(T ∗ ).
3. T = T ∗ si, y solo si, A es una matriz simétrica.
Ejercicio 7.8.14. Una transformación lineal T : Rn → Rm se dice isométrica si conserva
las normas, esto es: kT (v)k = kvk, ∀ v ∈ Rn . Demuestre que T es una transformación
lineal isométrica si, y solo si, su matriz asociada es una matriz ortogonal.
Ejercicio
 7.8.15. Se considera
 la transformación lineal T : R2 → R2 cuya matriz asociada
cos(α) −sen(α)
es en donde α ∈ [0, π).
sen(α) cos(α)
1. Verifique que T es una isometrı́a.
2. Calcule hT (v), vi , ∀ v ∈ R2 . Deduzca que el ángulo formado por T (v) y v no depende
de v.
3. ¿Qué interpretación geométrica tiene la isometrı́a T ?
Ejercicio 7.8.16. Teorema de representación de Riesz.
1. Sea w ∈ Rn y Tw : Rn → R dada por Tw (v) = hv, wi, ∀ v ∈ Rn . Demuestre que Tw
es lineal y encuentre su matriz asociada.
2. Sea T : Rn → R una transformación lineal. Demuestre que existe un único w ∈ Rn
tal que T (v) = hv, wi, ∀ v ∈ Rn .
Ejercicio 7.8.17. Sea T : Rn → R una transformación lineal. Demuestre que
kT (x)k ≤ M kxk , ∀ x ∈ Rn siendo:

M = max {kT (e1 )k, kT (e2 )k, . . . , kT (en )k}

Ejercicio 7.8.18. El espacio vectorial de las transformaciones lineales.


Sea L (Rn , Rm ) el conjunto de todas las transformaciones lineales de Rn en Rm , es decir:

L (Rn , Rm ) = { T : Rn → Rm / T es lineal }

Compruebe que, con las operaciones de suma de transformaciones y producto de un número


por una transformación, se cumple que L (Rn , Rm ) es un espacio vectorial real (recordar
la primera sección del capı́tulo 4).

7.9. Ejercicios variados de opción múltiple



 x+y+z =1
Ejercicio 7.9.1. El sistema: 2x − y + z = 0

−4x + 2y − 2z = 1
(1) Es compatible determinado. (2) Es incompatible. (3) Es compatible indeterminado
con un grado de libertad. (4) Es compatible indeterminado con dos grados de libertad.
206 Capı́tulo 7. Transformaciones lineales

     
1 2 −a
Ejercicio 7.9.2. Sean u =  1  , v =  2  , w =  a  Entonces w es combi-
0 3 a
nación lineal de {u, v}
(1) Para infinitos valores de a. (2) Para ningún valor de a.
(3) Sólo para tres valores de a. (4) Sólo para a = 0.

Ejercicio 7.9.3. Sea U = {u1 , u2 , u3 } ⊂ R5 . Entonces se cumple necesariamente que:


(1) Si U es L.D. entonces todo subconjunto de U también lo es.
(2) Si o ∈ U , entonces U es L.I.
(3) Todo vector de R5 es combinación lineal de U .
(4) Ninguna de las anteriores.
     
√1 1 √2
Ejercicio 7.9.4. Sean: u =  5  , v =  0  , w =  5 , y consideremos las
1 3 4
siguientes afirmaciones:
(A) {u, v, w} es L.I. (B) u es C.L. de {v, w}. Entonces:
(1) (A) es verdadera y (B) es verdadera.
(2) (A) es verdadera y (B) NO es verdadera.
(3) (A) NO es verdadera y (B) es verdadera.
(4) (A) NO es verdadera y (B) NO es verdadera.

Ejercicio 7.9.5. Sea U = {v1 , v2 , v3 , v4 } una base de R4 . Entonces:


(1) Existe v ∈ R4 tal que {v1 , v2 , v3 , v4 , v} es L.I.
(2) {v2 , v3 , v4 } es un generador de R4 .
(3) {v + v1 , v2 , v3 , v4 } es base de R4 , para todo vector v ∈ R4 .
(4) Si v = v1 + v2 entonces, v4 es combinación lineal de {v, v1 , v2 , v3 }.
(5) Ninguna de las opciones anteriores es correcta.
     
 a −5 −1 
Ejercicio 7.9.6. Si U =  0  ,  a  ,  2  ⊂ R3 , entonces
 
0 3 a
3
(1) U es base de R para cualquier valor de a. (2) U es base de R3 excepto para a = 0.
3
(3) U es base de R excepto para tres valores de a. (4) U es L.D. para cualquier valor
de a.

Ejercicio 7.9.7. Consideremos las siguientes afirmaciones:


(A) Si U es una base de Rn y H ⊂ U , (H 6= φ), entonces H es L.I.
(B) En R3 hay sólo tres conjuntos que son al mismo tiempo L.I. y generador.
Entonces:
(1) (A) es verdadera y (B) es verdadera.
(2) (A) es verdadera y (B) NO es verdadera.
(3) (A) NO es verdadera y (B) es verdadera.
(4) (A) NO es verdadera y (B) NO es verdadera.

Ejercicio 7.9.8. Sea U = {u1 , u2 , u3 } ⊂ R4 . Entonces se cumple necesariamente que:


(1) Si U es L.I. entonces U = {u1 , u2 , u3 , v} es base de R4 , cualquiera que sea v ∈ R4 .
7.9. Ejercicios variados de opción múltiple 207

(2) Si U es L.D. entonces existe v ∈ R4 tal que U = {u1 , u2 , u3 , v} es generador de R4 .


(3) Algún vector de R4 no es combinación lineal de U .
(4) Ninguna de las anteriores.

Ejercicio 7.9.9.
Sea U = {u1 , u2 , u3 } ⊂ R5 un conjunto L.I. Entonces se cumple necesariamente que:
(1) {u1 , u2 , u3 , v} es L.I., cualquiera que sea v ∈ R5 .
(2) {u1 , u2 , u3 , v} es L.D., cualquiera que sea v ∈ R5 .
(3) Existe w ∈ R5 tal que w es combinación lineal NO única de U .
(4) Ninguna de las anteriores.
 
4
Ejercicio 7.9.10. Sea U = {u1 , u2 , u3 } una base de R3 y el vector z =  −2 
5
Si se sabe que z = u1 − 2u2 + 3u3 entonces
     
4 5 1
(1) coordU (z) =  −2  (2) coordU (z) =  −2  (3) coordU (z) =  −2 
5 4 3

(4) z también puede expresarse como z = 4u1 − 2u2 + 5u3 .

Ejercicio 7.9.11. Sea U = {u, v, w} una base de R3 . Entonces se cumple necesariamente


que:
(1) {u, v, u + v} es L.I.
(2) {u − v, v + w, u − w, u + v + w} es generador de R3 .
(3) {u + v, u − w} es generador de R3 . (4) Ninguna de las anteriores.
 
1 2 a
Ejercicio 7.9.12. Consideremos la matriz: A =  2 −2 0 
1 1 2
Entonces:
(1) rg(A) = 3, ∀ a ∈ R. (2) nu(A) = 1 para algún a ∈ R.
(3) nu(A) = 1 para infinitos valores de a ∈ R.
(4) Ninguna de las anteriores.

Ejercicio 7.9.13. Sea A una matriz m × n. Entonces se cumple necesariamente que:


(1) El subespacio generado por las columnas de A coincide con el subespacio generado por
sus filas.
(2) La dimensión del subespacio generado por las columnas de A es mayor que m.
(3) Si n es impar entonces rg(A) 6= nu(A).
(4) Ninguna de las anteriores.
  
 x 
Ejercicio 7.9.14. Sea S ⊂ R3 definido por: S =  y  / x − 2y + 5z = 0 Enton-
 
z
ces
(1) S es un subespacio de R3 de dimensión 2. (2) S es un subespacio de R3 de dimensión
1. (3) S es un subespacio de R3 de dimensión 3. (4) S no es un subespacio de R3 .
208 Capı́tulo 7. Transformaciones lineales

Ejercicio 7.9.15. Dado U ⊂ Rn (U 6= φ) consideremos el conjunto


S = {v ∈ Rn / v es C.L. de U }. Entonces:
(1) Puede ocurrir que S = φ. (2) Si U es generador de Rn entonces S = Rn .
(3) Si U es L.D. entonces necesariamente S 6= Rn . (4) S contiene a lo sumo n vectores.

Ejercicio 7.9.16. Se sabe que S es un subespacio de R5 de dimensión 2. Entonces:


(1) Existen u1 y u2 , vectores de S tales que S = L ({u1 , u2 }).
(2) La base canónica de R5 es un generador de S ya que todo vector de S se puede escribir
como combinación lineal de la misma.
(3) S tiene exactamente dos vectores.
(4) Existe un subconjunto de S, que es L. I. y que tiene tres vectores.

Ejercicio 7.9.17. Sea U = {v1 , v2 , . . . , vp } un subconjunto L.D. de Rn . Entonces:


(1) L ({v1 , v2 , . . . , vp−1 }) = L ({v1 , v2 , . . . , vp }).
(2) Necesariamente n < p.
(3) Existe algún vi ∈ U tal que U − {vi } es base de Rn .
(3) Existe algún vk ∈ U tal que vk ∈ L (U − {vk }).
(4) Ninguna de las opciones anteriores es correcta.
   
1 2 1 a
Ejercicio 7.9.18. Consideremos la matriz A =  2 1 −1  y el vector v =  b 
1 1 λ 1
Si se sabe que nu(A) = 1 y que v ∈ N (A) entonces: λ = , a = , b =
 
1 2 −1
Ejercicio 7.9.19. Consideremos la matriz: A =  3 −1 4 . Entonces:
5 3 2
(1) El subespacio generado por sus columnas contiene un conjunto L.I. de tres vectores
(distintos).
(2) El subespacio generado por sus filas contiene un conjunto L.I. de tres vectores (distin-
tos).
(3) El subespacio generado por sus columnas contiene un conjunto L.I. de dos vectores
(distintos).
(4) El subespacio generado por sus columnas contiene sólo dos vectores (distintos).
   
1 2 1 3
Ejercicio 7.9.20. Consideremos la matriz A =  2 −1 7  y el vector v =  −1 .
1 1 λ a
Si se sabe que rg(A) = 2 y que v ∈ N (A) entonces:
(1) λ = 5 y a = −1 (2) λ = 5 y a cualquiera
(3) λ = 2 y a = −1 (4) λ = 2 y a cualquiera.

Ejercicio 7.9.21. Sean u y v vectores de Rn tales que√ kuk = 2, kvk = 5, hu, vi = 7/2.
Entonces ku + vk = (1) 7 (2) 36 (3) 6 (4) 7.

Ejercicio 7.9.22. Sean u y v vectores de Rn . Se consideran las siguientes afirmaciones:


(A) Si |hu, vi| = kukkvk entonces {u, v} es L.D.
(B) Si u 6= o y Pu (v) es la proyección ortogonal de v sobre u entonces necesariamente
kPu (v)k = kvk.
7.9. Ejercicios variados de opción múltiple 209

Entonces
(1) Ambas son verdaderas. (2) Ambas son falsas.
(3) (A) es verdadera y (B) es falsa. (4) (B) es verdadera y (A) es falsa.

Ejercicio 7.9.23. Si u y v son dos vectores de Rn entonces el número ||u−2v||2 +||u+v||2


coincide necesariamente con
(1) 2||u||2 − 2||u||.||v|| + 5||v||2 (2) 2||u||2 + 5||v||2
(3) 2||u||2 − 2hu, vi + 5||v||2 (4) 2||u|| + 3||v||
   
1 2
Ejercicio 7.9.24. Sean: u =  1  , v =  −1 . La igualdad k u − λ.v k=k u k se
1 0
cumple:
(1) Solo para λ = 0. (2) Solo para dos valores de λ.
(3) Para infinitos valores de λ. (4) Solo para tres valores de λ.
   
x 2
Ejercicio 7.9.25. Consideremos los puntos p =  y  y q=  1 
z 0
Si se sabe que k p − q k= 2 entonces se cumple necesariamente que:
(1) x + y + z = 7 (2) x2 + y 2 + z 2 + 1 = 0 (3) x2 + y 2 + z 2 − 4x − 2y + 1 = 0
2 2 2
(4) x + y + z − 9 = 0
 
4
Ejercicio 7.9.26. Si se sabe que el vector  6  es perpendicular al plano
−10
de ecuación ax + 3y − 5z = k entonces necesariamente:
(1) a = 2 y k cualquiera. (2) a = 4 y k cualquiera.
(3) a = 2 y k = 1. (4) a = 4 y k = 1.
   
1 5
Ejercicio 7.9.27. Sean: p =  1  , q=  3  , L la recta determinada por p y q,
1 1
y H el plano de ecuación: x − 2y + 3z = 2. Entonces la intersección de L con H es:
(1) L ∩ H = φ (2) L ∩ H = {p} (3) L ∩ H = L (4) L ∩ H = {q}
   
1 3
Ejercicio 7.9.28. Sean: p =  −2  , q =  1  , L la recta determinada por
3 −2
p y q, y H el plano de ecuación: x + y + z = 2.
Entonces la intersección de L con H es:
(1) L ∩ H = φ (2) L ∩ H = {p} (3) L ∩ H = L (4) L ∩ H = {q}

Ejercicio 7.9.29. Consideremos las siguientes afirmaciones:


(A) Sea S un subespacio de Rn y U = {u1 , u2 , . . . . , ur } un generador de S.
Si v ⊥ uk , ∀k = 1, 2, . . . , r entonces v ⊥ S.
(B) Todo subespacio de R3 es un plano.
(C) Toda matriz de 3 filas y 7 columnas tiene rango menor o igual que 3.
210 Capı́tulo 7. Transformaciones lineales

Entonces se cumple que:


1) Solo (C) es verdadera. 2) Solo (A) es verdadera.
3) Solo (A) y (C) son verdaderas. 4) Solo (B) y (C) son verdaderas.
   
 1 0 
Ejercicio 7.9.30. Sean U =  0  ,  1  y S el subespacio generado por U .
 
0 1
 
2 √ √ √
Entonces la distancia de  1  a S es: (1) 0 (2) 3 (3) 5 (4) 2.
3
Ejercicio 7.9.31. Sea A una matriz n × n. Entonces se cumple necesariamente que:
(1) Si A es diagonalizable entonces A tiene n valores propios diferentes entre sı́.
(2) Si A no es invertible entonces no puede ser diagonalizable.
(3) Si det(A − λI) no tiene raı́ces entonces A no es diagonalizable.
(4) At .A.At = I

Ejercicio 7.9.32. Sean A una matriz n × n; {u, v, w, z} ⊂ Rn L.I. tales que A.u =
2u, A.v = 2v, A.w = w, A.z = o. Consideremos las afirmaciones:
(A) 2 es valor propio de A. (B) necesariamente n ≥ 4. Entonces:
(1) Ambas afirmaciones son verdaderas. (2) Ambas afirmaciones son falsas.
(3) Sólo (A) es verdadera. (4) Sólo (B) es verdadera.

Ejercicio 7.9.33. U = {u1 , u2 , u3 , u4 } es una base de R4 y A es una matriz 4 × 4 que


cumple: A.u1 = 2u1 , A.u2 = 2u2 , A.u3 = −u3 , A.u4 = u4 . Entonces
(1) A es diagonalizable y nu(A − 2I) = 1 (2) A es diagonalizable y nu(A − 2I) = 2
(3) A no es diagonalizable. (4) Ninguna de las anteriores.

Ejercicio
 7.9.34.
 Sea T : R3 −→ R3 una transformación lineal de la cual se sabe que
1
u=  2  ∈ N (T ). Entonces se cumple necesariamente que:
−1
(1) T no es inyectiva. (2) u debe pertenecer a Im(T ).
(3) N (T ) es un subespacio de dimensión 1. (4) T es biyectiva.
2 2
Ejercicio
  7.9.35.
 Sea T  −→ R una transformación lineal de la cual se sabe que
: R
1 1 2
T =T = . Entonces:
0 1 4
       
0 1 0 1
(1) ∈ N (T ) y ∈ Im(T ) (2) 6∈ N (T ) y ∈ Im(T )
1 2 1 2
       
0 1 0 1
(3) ∈ N (T ) y 6∈ Im(T ) (4) 6∈ N (T ) y 6∈ Im(T )
1 2 1 2
Capı́tulo 8

Respuestas a los ejercicios

Ejercicios del Capı́tulo 1

   
1 0 a b
o 2 , (b 6= 0).
Ejercicio 1.1.1. A =  3 2  −a
−a
b
5 4 Ejercicio 1.1.9. 1) SF = S + C − V ,
Ejercicio 1.1.2. a = 3, b = −1.
  Piva = 1, 22 P ; 2) I  = V t .P . 
t 10 −1 3p1 + 4p2
Ejercicio 1.1.3. 1) A + A = ,
−1 0 Ejercicio 1.1.10. u =  2p1 + 5p2  ,
 
−5 0−2 4p1 + 6p2
 
2C − 7I3 =  0 −3 −6  , x
 4 2−7
 v= y ,
5 4 3 z
B t .B =  4 13 −13  , 
a
t

 3 −13  26 U tilidad =  b  .v − ut .v − k.
t 14 −9 c
B.B = . 2) Los productos
−9 30 Ejercicio 1.1.11. Hay que multiplicar P t .M y
posibles son  A.B, B.C,  B.D y C.D. luego sumar los elementos de dicha matriz.
1 9 −7
3) X = 4 Ejercicio 1.1.12.
0 −1 
2

Ejercicio 1.1.4. Las partes 1), 2) y 4) son  3 
válidas solamente cuando A.B = B.A. La parte (500 1000 400) . R .   1,5 .

3) es válida siempre.
Ejercicio 1.1.5. (c)a = −2 o a  = −1.  5 
−1 1 −1
±1 b Ejercicio 1.2.1. A = ,
Ejercicio 1.1.6. 1)
0 ∓1
, (b ∈ R)   −1 2
  1/2 −1/2
±1 0 B −1 = .
o , (c ∈ R) −1 2
c ∓1
  Ejercicio 1.2.2. La únicás falsas son 4) y 5). Un
a c contraejemplo para 4) es A = I, B = −I. Un
o 1−a2 , (c 6= 0).
−a contraejemplo para 5) es A = I, B = I. (I es la
 c 
a c matriz identidad).
2) −1−a2 , (c 6= 0)
 c  −a Ejercicio 1.2.3. Se utiliza la parte 1) para
0 b probar que:
3) , (b ∈ R)
0 0 2) (In − A)−1 = In + A
 
0 0 3) (In − A)−1 = In + A + A2
o , (c ∈ R) 4) (In − A)−1 = In + A + A2 + . . . + Ak−1
c 0
212 Capı́tulo 8. Respuestas a los ejercicios

Ejercicios del Capı́tulo 2

Ejercicio 2.4.1. (a) Sistema compatible indeterminado con un grado de libertad y


indeterminado 3 con un grado de libertad. Sol(S) = {(−z, z − 3, z) / z ∈ R}.
7 1 9
Sol(S) = 4 + 4 z, 4 + 4 z, z / z ∈ R . Ejercicio 2.4.4. (a) Sistema incompatible.
(b) Sistema incompatible. Sol(S) = ∅. Sol(S) = ∅. (b) Sistema compatible
(c) Sistema incompatible. Sol(S) = ∅. indeterminado con un grado de libertad
(d) Sistema compatible indeterminado con dos Sol(S) = { (3 − x3 , −1, x3 , 1) / x3 ∈ R }.
grados de libertad Ejercicio 2.5.1. Los determinantes valen (a) −
Sol(S) = { (−x3 − 3x4 + 2, −2x3 + x4 − 23, (b) 0, (c) − 155, (d) 0, (e) − 4, (f ) 31.
3, x3 , x4 ) / x3 , x4 ∈ R }. Ejercicio 2.5.2. 1, −1 y 0.
(e) Sistema incompatible. Sol(S) = ∅. Ejercicio 2.5.3. det(B) = 23 det(A) = 40.
Ejercicio 2.4.2. (a) rgf (A) = 1 < 3 = n de Ejercicio 2.5.6. (a) El determinante de la matriz
donde resulta que el sistema es compatible asociada al sistema vale 0 de donde resulta que
indeterminado con dos grados de libertad. el sistema es compatible indeterminado.
(b) rgf (A) = 3 = n de donde resulta que el (b) El determinante de la matriz asociada al
sistema es compatible determinado sistema vale −k 2 . Luego, el sistema es
(Sol(S) = {(0, 0, 0)}). compatible indeterminado si k = 0 y
(c) rgf (A) = 3 = n de donde resulta que el compatible determinado si k 6= 0.
sistema es compatible determinado (c) El determinante de la matriz asociada al
(Sol(S) = {(0, 0, 0)}). sistema vale k 3 + k − 2 (cuya única raı́z real es
Ejercicio 2.4.3. (a) Si n m 6= 1 y m 6= −2 entonces
o k = 1). Luego, el sistema es compatible
S.C.D. con Sol(S) = −2 1 1 indeterminado si k = 1 y compatible
m−1 , m−1 , m−1 . Si
determinado si k 6= 1. 
m = 1 entonces el sistema es incompatible. Si 
0 1/2 1/2
m = −2 entonces el sistema es compatible
Ejercicio 2.6.1. A−1 =  1/2 0 −1/2 
indeterminado con un grado de libertad y
1/2 −1/2 0
Sol(S) = {(1 + z, z, z) / z ∈ R}.  
0 0 1
(b) Si m 6=0 y m 6= −1 entonces S.C.D. con
1 C −1 =  0 1 −2 
Sol(S) = m, m , −m . Si m = 0 entonces el
sistema es incompatible. Si m = −1 entonces el  1 0 −1 
sistema es compatible indeterminado con un 1 −1 −1
grado de libertad y D−1 =  −1/2 1 1/2 
Sol(S) = {(−1, −z, z) / z ∈ R}. 1/6 −1/3 1/6
 
(c) Si m 6=n
0 y m 6= −1 entonces 1/2 −1/4 1/2 −1/4
o S.C.D. con
m −3 2m
 0 1 −1 0 
Sol(S) = ,
m+1 m+1 m+1 , . Si m = −1 E −1 =  1/2 −3/4 1/2

1/4 
entonces el sistema es incompatible. Si m = 0 0 −1/2 1 1/2
entonces el sistema es compatible B no es invertible pues su determinante vale 0.

Ejercicios del Capı́tulo 3


T T
Ejercicio
 3.1.1. L
1 = ∅ , L1 L3 =
L2 
x=1−λ 2 T 7/5
L1 Ecuación reducida: y = 3 − x. , L2 L3 =
 y =2+λ 1 −7/5
x = −2 + 3λ Ejercicio 3.2.1.
L2 Ecuación reducida: Ecuaciones paramétricas de L1
y = 2 − 3λ 
y =−x.  x = 1 + 2λ
x=2−λ y =2−λ
L3 Ecuación reducida: 
y = 1 − 4λ z = −1 + 3λ
y = −7 + 4x.
213


x + 2y − 5 = 0 (18) es un punto (el origen).
Ecuaciones reducidas:
3y + z − 5 = 0 (19) es un plano.
Ecuaciones paramétricas de L2

 x = −1 + 4λ T 3.2.10. (1) (Π1 ) x + y − 2z = 0.
Ejercicio
(2) L S = {(2, 2, 2)}
y=1 (3) (Π2 ) − x + 2y + 3z =

z = 3 − 2λ T 8.
 Un vector paralelo a Π1 Π2 es (−7, 1, −3).
x + 2z − 5 = 0 Ejercicio 3.2.11. (1) (Π1 ) x + y + z = 1.
Ecuaciones reducidas:
y=1  (3) (Π2 ) x − 2y = 0. T
 x = 3 + 2λ Un vector paralelo aTΠ1 TΠ2 es (2, 1, −3).
Ecuaciones paramétricas de L3 y =1−λ Ejercicio 3.2.12. Π1 Π2 Π3 = {(−3, 3 − 2)}

z = 1 + 3λ Ejercicio 3.3.2. a = 3.

x + 2y − 5 = 0 Ejercicio 3.3.3. Los vectores que son C.L. de U
Ecuaciones reducidas:
T 3y + z − 4 = 0 son
L1 T L2 = ∅ y se cruzan. (1) (a, b, c) tales que 4a + 3b − 2c = 0
L1 L3 = ∅yL1 kL3 . (2) Todos. (3) Todos.
T  3  (4) (a, b, c, d) tales que −a + 3b + 2c = 0 y
L2 L3 =  1  . Las rectas son secantes. −3a + 5b + 2d = 0.
 
1 z1 no y z2 sı́.
Ejercicio 3.2.2. (5) Todos los de R2 .
El sistema con las cuatro T ecuaciones resulta Ejercicio 3.3.4. Solo es falsa la (3).
incompatible de donde L S = ∅. Para decidir Ejercicio 3.3.5. (1) No.
si se cruzan o son paralelas hallamos los (2) (a, b, c, d) tales que −a + b + c + 2d = 0.
vectores que dan la dirección de cada una de Ejercicio 3.3.6. Si a 6= −1, z es C.L. única de U
ellas. T cualquiera sea b. Si a = −1 y b = 1, z es C.L.
Ejercicio 3.2.3. a = 3, b = 2. L S = L = S. no única de U . Si a = −1 y b 6= 1, z no es C.L.
Ejercicio 3.2.4. 2x − y + z = 0. de U .
Ejercicio 3.2.5.
  Ejercicio 3.3.7. (1) x1 = 1 + 2λ , x2 =
T  9/5  −1 + 3λ , x3 = 1 + 2λ , x4 = 2 − λ
1) L Π1 =  3/5  . Ejercicio 3.3.8. (3) No necesariamente.
 
T 1/5 Ejercicio 3.4.1. Son L.I. los conjuntos de las
2) L Π2 = ∅. La recta y el plano son partes 1, 2, 4 y 6. Parte 7: U es L.I. si, y solo
paralelos
T y no tienen puntos en común. si, a 6= 4 y a 6= −4. Parte 8: U es L.D.
3) L Π3 = L. La recta está contenida en el independientemente del valor de a (observar
plano. que la tercera columna es la suma de la
Ejercicio 3.2.6. 1) x + 2y + z = 3. 2) k = 4. primera más la segunda multiplicada por a).
Ejercicio 3.2.7. 1) Π1 −x + 2y + 3z = −1. Ejercicio 3.4.2. (2) Todos con excepción del
2) Π2 3x + y + z = 0. propio conjunto y del vacı́o. (3) No, no es
 x = 0, 1 − 0, 1λ cierto.
3) y=λ Ejercicio 3.4.3. Son verdaderas solamente las

z = −0, 3 − 0, 7λ partes (1) y (3).
Ejercicio 3.2.8. Π es 2y + z = 4. Ejercicio 3.4.4. Son verdaderas solamente las
Ejercicio 3.2.9. Del (1) al (7) son planos partes (1) y (4). Si A es invertible son todas
(¿cuáles?). verdaderas.
Del (8) al (12) son semiespacios (¿cuáles?). Ejercicio 3.4.6. A y B son L.I. mientras que C
Del (13) al (15) son rectas (¿cuáles?). es L.D.
(16) es un semiplano. Ejercicio 3.4.7. Ambas verdaderas.

Ejercicios del Capı́tulo 4


214 Capı́tulo 8. Respuestas a los ejercicios

Ejercicio 4.2.1. Son subespacios solamente (1) y Ejercicio


 4.4.6. Basesson:  
(2). 
 1 0 0 
      
Ejercicio 4.2.2. No son subespacios solamente el 0 , , 0 
1
(1) 
(4) y el (5). 

 0   0   1  

 
Ejercicio 4.2.3.  1 1 0
  
N (A) = {(x, y, z) / x = −z, y = −2z} 
 −2 −3  
   0 
N (B) = {(x, y, z) / x = −z, y = 2z} 1
(2)    ,  
N (C) = {(a, b, c, d) / Ta+b−c = 0, b−2c−d = 0} 
 0   1  
 
Ejercicio 4.2.6. (2) S T es la recta de  1   2 
ecuaciones paramétricas: 
 −3 −1  
x = λ , y = λ , z = 2λ. (3) No. 
1   1 
Ejercicio 4.2.8. Observar que S coincide con el (3)    ,  

 1   0  
núcleo de M − N .  
 0  1
Ejercicio 4.2.9. Ninguna condición en (1), (4),  1 0 

   
(5) y (7). 0

(4)  , 1 
(2) (a, b) / b = 0.   1   0 
 
(3) (a, b) / b = −a. 
0 1

(6) (a, b, c) / a + 4b − 3c = 0. Ejercicio 4.4.7.
   dimN (A) = 0
(8) (a, b, c) / a = b.  −2 
(9) (a, b, c, d) / b = d.  1  es base de N (B)
Ejercicios 4.3.2. y 4.3.3.  
 −4   
Hay infinitas respuestas posibles.  −2 −8 
Ejercicio 4.3.4. Solo (3) no es.  1  ,  0  es base de N (C)
Ejercicio 4.3.5. Solo (2) y (3) son falsas. 
0 1

Ejercicio 4.4.1. Ambas falsas. Ejercicio 4.4.11. No. 
Ejercicio 4.4.2. det(MU ) = 24 6= 0 entonces U Ejercicio 4.4.12. (a) a+b 4a+b
3 , 3
es base de R4 . (b) U no es base. (c) (b, a)
Ejercicio 4.4.3. (a) Es base cualquiera que sea Ejercicio 4.4.13. coordU (u) = (1, 0, 0)
 sia 6=
a. (b) Es base solamente 2 y 
a6= −2. coordU (v) = (1, 1, 0) , coordU (w) = (7, 2, −2)
 1 1  Ejercicio 4.4.14. En (b) y (c) U no es base.
Ejercicio 4.4.4. (a)  0  ,  1  (a) (c, b − 2c, a − c)
 
1 2 Ejercicio 4.4.16. (1) u1 = v1 + v2 + v3
3
(b) Ues basede L(U ) = R . u2 = v1 + v2 − v3 , u3 = v1 − v2 + v3
 1  (2) coordU (z) = (2, −4, 6)
(c)  1  (3) v1 = u2 +u2
3
, v2 = u1 −u
2
3
, v3 = u1 −u
2
2
 
 2    Ejercicio
 4.4.17.
  (1)
 Tomamos, por ejemplo:
 1 −1  1 5 
, . (2) a−5b 2a+b
11 , 11
(d)  2  ,  1  −2 1
 
−1 1 Ejercicio 4.4.18. coordV (u1 ) = (1, −2, 2)
Ejercicio
 4.4.5.  Bases
  son:
 a = 1, b = −2, c = 2.
 1 0  u1 = (0, 1, 0), u2 = (1, 0, 0), u3 = (0, 1, 6)
(1)  −3  ,  2  Ejercicio 4.5.1. (1) rg(A) = nu(A) = 2.
 
 0  1 (2) α = −3. (3) β = −16.
 1 0  Ejercicio 4.5.2. Si a = 0, rg(A) = 0.
(2)  1  ,  0  Si a = −1, rg(A) = 1.
 
 0  1 Si a 6= 0 y a 6= −1, rg(A) = 2.
 1  (2) Solo es falsa (b).
(3)  1  Ejercicio 4.5.3.
 
 0    Si a = 4 o a = 2, rg(A) = 2.
 1 0  En otro caso rg(A) = 3.
(4)  0  ,  1  Si a = 1, rg(B) = 2.

0 0
 Si a 6= 1, rg(B) = 3.
215

rg(C) = 2, ∀ a. Si α = 4, rg(G) = 1.
Si a = 1, rg(D) = 1. Si α = −4, rg(G) = 2.
Si a = −1, rg(D) = 2. En otro caso rg(G) = 3. 
En otro caso rg(D) = 3. 0 1
Ejercicio 4.5.8. A = β
Si a = 0 o a = 1, rg(E) = 2.  0 0 
En otro caso rg(E) = 3. −k −k 2
con β 6= 0 o A = α con α 6= 0.
Si a = 0 o a = 1 o a = −1, rg(F ) = 2. 1 k
En otro caso rg(F ) = 3.

Ejercicios del Capı́tulo 5



Ejercicio 5.1.1. hu, vi√= −2 , kuk = 2 Ejercicio 5.2.7. (1) α = −1 , β = −2.
kvk = 3 , ku + vk = 7. (2) PS (p) = p , d(p, S) = 0.
√ hu, vi = 0 , kuk = kvk = 3 ,
Ejercicio 5.1.2. (3) S ⊥ = {(0, d, −2d, d) / d ∈ R}. Una base
ku + vk = 18. de S ⊥ es {(0, 1, −2, 1)}
Ejercicio 5.1.3. (2) u ⊥ v. Ejercicio 5.2.8. (1) Si a = 0 o a = 2 entonces
Ejercicio 5.1.4. (2) λ = 2. rg(A) = 2 y nu(A) = 1. En otro caso,
Ejercicio 5.1.5. u = (3, 4) y v = (12, 16) o rg(A) = 3.
u = (3, −4) y v =√(12, −16) (2) PS (p) = (1, 0, 1).
Ejercicio 5.1.6. 3 5/2.√ (3) S ⊥ = {(−c, c, c) / c ∈ R}.
Ejercicio 5.1.7. (2) 3 18/2. Ejercicio 5.2.10. (1) Una base de N (A) es
Ejercicio
 5.1.9. (1)   {(−1, 1, 1, 0), (−1, −1, 0,1)}
5p1 + 2p2 x (3) La base hallada es ortogonal. Alcanza con
 3p1 + 4p2   y  dividir
u= √ ambos
√ vectores entre sus normas.
 4p1 + 7p2  , u =  z 
  
(4) ( 3, 3).
2p1 + 3p2 w Ejercicio 5.2.12. (2) Una base de S es
   
* a x + {(−1, 0, 1)}. S ⊥ = {(a, b, a) / a, b ∈ R}.
 b   y  Ejercicio 5.2.13. (1) U = {(1, 1, √ 0), (0, 0, 3)}
(2) U =   c  − u,  z  − k
  
(2) d(v, S) = 0. (3) h1 = (3, 3, 3 2).
d w Ejercicio 5.2.14. (2) U = {(1, 1, 0, 0),
Ejercicio 5.2.1. (a) Es base no ortogonal. (1/2, −1/2, 1, 0), (−2/3, 2/3, 2/3, 0)}
(b) Es ortogonal, no base. (3) d(p, S) = e/π.
(c) No es ortogonal ni base. Ejercicio 5.2.15.√ (1) x − z = 0.
(d) Es ortogonal y es base. (4) d(p, H) = 8.
(e) Es ortogonal. Es base si, y solo si, a y b no z = (2, 1, 2), w = (2, 0, −2).
son simultáneamente nulos. Ejercicio
 5.2.18.Falsa. Un contraejemplo es
Ejercicio 1 0
5.2.2.
  a+2b+3c  A=
a 14
0 −1
coordU  b  =  −3b+2c 13
 Ejercicio 5.3.1.√ d(p1 , H) = 0.
c 13a−2b−3c d(p2 , H) = 10/ 21. p
182
Ejercicio 5.2.3. (1) PS (p) = (1/9, −2/9, 2/9) Ejercicio 5.3.2. (1)√d(u1 , L) = 1/3.

d(p, S) = 72/9 (2) d(u3 , H) = 3/ 5. √
(2) PS (p) = p, d(p, S) = 0 Ejercicio 5.3.3. (2) d(p, Π) = 6/6. 
(3) PS (p) = p, d(p, S) = 0 El punto más próximo es 67 , 86 , 56

(4) PS (p) √
= (2/9, 1/18, 17/18) (3) d(p, L) = 114/3. 
d(p, S) = 18/18 El punto más próximo es −4 4 −5
3 , 63 , 3
Ejercicio 5.2.6. (1) Ejercicio 5.3.4. x = 1 , y = 2 − 4α
PS (p) = (21/10,
√ −1/5, 29/10, −1/5) z = 3 − 2α.
d(p, S) = 10/10 Ejercicio 5.3.5. x + y = 1
(2) S ⊥ = {(a, −2a, −a, −2a) / a ∈ R}. Una Ejercicio 5.4.1 (2) α = 10 11
; β = − 51 .
base de S ⊥ es {(1, −2, −1, −2)} 1 2 7
(3) y = 3 x − 30 x + 10 3
216 Capı́tulo 8. Respuestas a los ejercicios

Ejercicio 5.4.2 α = 15, 78; β = 210, 44. (3) dist(v, S) = √311


R = 698, 9.  Ejercicio 5.4.4 y = −1 + 2t2
Ejercicio 5.4.3 (1) w = − 10 12 4 2
11 , 11 , 11 , 11

Ejercicios del Capı́tulo 6

Ejercicio 6.2.4. A: valores propios: 1 y 6. Ejercicio 6.3.4. Solamente es diagonalizable la


S1 = {(2a, −3a) / a ∈ R}; A.
S6 = {(x, x) / x ∈ R}. Ejercicio 6.3.5. (1) Valores propios: 4 y −1
B no tiene. (triple).
C: valores propios: 0 y 7. S4 = {(x  1 , x1 , 0, 0) /x1 ∈ R};
S0 = {(−3y, y) / y ∈ R}; S−1 = a, −2a 3 , c, d / a, b, c ∈ R .
S7 = {(x, 2x) / x ∈ R}. (2) Es diagonalizable. (3) únicamente la
D: valores propios: 1, −2 y 3. solución trivial.
S1 = {(−z, 4z, z) / z ∈ R}; Ejercicio 6.3.6. (1) Una base de N (A) es:
S−2 = {(−z, z, z) / z ∈ R}; { (-1,1,0,0), (-1,0,1,0), (-1,0,0,1) }
S3 = {(z, 2z, z) / z ∈ R}. Sı́, 0 es valor propio de A pues N (A) 6= {o}.
Ejercicio 6.2.6. Respectivamente 2,
 1 y 3.  (2) El valor
 propio correspondiente  es 4.
−2 0 1 −1 −1 −1
Ejercicio 6.3.2. Por ejemplo A = ,
0 1  1 1 0 0 
  (3) B =   1

1 1 0 1 0 
B=
1 0    1 0 0 1
−3 1 4 0 0 0
Ejercicio 6.3.3. (a) B = y  0 0 0 0 
2 2
  yD=  0 0 0 0 

0 0
D= 0 0 0 0
0 8   
1 1 −2 2 0 0 Ejercicio 6.3.7. (1) Valores propios: 0 y 2 + k.
(b) B =  0 1 0 , D =  0 1 0  (2) Es diagonalizable solamente para k 6= −2.
0 0 1  0 0 1 Ejercicio 6.3.8. a = 0 o a = 1/2.
 Ejercicio 6.3.9. Si a = 0 cualquier matriz 3 × 3
−1 −1 1
(c) B =  4 1 2 , invertible la diagonaliza.  Si a 6= 0 unamatriz
1 1 1 1 0 1

1 0 0
 que la diagonaliza es  0 1 1 .
−1 −1 1
D =  0 −2 0   
0 0 3 1 0 0

1 −1 −1
 
3 0 0
 Ejercicio 6.3.10. S = B  0 2 0  B −1
0 0 3
(d) B =  1 1 0 , D =  0 1 0   
0 0 1 0 0 1 1 1 1

1 0 0 0
 siendo B =  0 1 2 .
 1 0 1 0  0 0 2
(e) B =  0 1 0 −2 
 Ejercicio 6.3.12. Utilice ejercicio 6.3.3. parte (f).
0 1 1 1 Ejercicio 6.3.13. (1) Valores propios: −1 y 1
  (doble).
1 0 0 0
 0 1 0 (2) Es diagonalizable solo para α = 0.
0 
yD=  0 0 3
 Ejercicio 6.3.14. mg(A1 ) = 3, mg(A2 ) = 2 y
0 
mg(A3 ) = 1.
0 0 0 −2  
  1 1
2 1 0 Ejercicio 6.3.15. √12 y
1 −1
(f) B =  1 −2 −2 ,  √ √ 
√2 3 −1
1 0 1
√1  2 √0 2 
 
8 0 0 6 √
2 − 3 −1
D =  0 −1 0 
0 0 −1
217

Ejercicios del Capı́tulo 7


1
Ejercicio7.8.1.      y (T2 oT1 )(a, b) = 14 (11a + 5b, 5a + b).
2 5 2 9 Ejercicio 7.8.8. (1) T (−4, 1, 0) = (−12, 3, 0).
(1) A = ;T =
1 1 −1 1 (2) det(M ) 6= 0 de donde T es biyectiva.
   
1 3   0 Ejercicio 7.8.9.
3
(2) A =  1 1 ; T = 2  kT (x)k = 0 ⇒ T (x) = o ⇒ x ∈ N (T ).
1
4 1 Ejercicio 7.8.10. [T ] = MU y det (MU ) 6= 0 por
  13
  1   ser U base. Luego T es invertible.
1 1 1 0 Ejercicio 7.8.11. (1) Utilice
(3) A =
1 9 1
;T  0  =
0   el teorema 7.2.2.
−1 2 1 0
 
1 1 0 (2) [T ] =  1 0 1 
 1 1 1  1 −1 1
(4) A =  ;
(3) det[T ] 6= {o} ⇒ T es  invertible.
 2 0 −1 
0  0 0 1 1 −1
  0 [T −1 ] = 12  −1 3 −1 
3 −1 1 1
 6 
T 3 = 
(4) Valores propios de T : 2 y 1 (doble).
 12 
−6 S1 = {(x, x + y, y) / x, y ∈ R};
0
S2 = {(z, z, z) / x ∈ R}. Es diagonalizable.
Ejercicio 7.8.2.
 N(A)
(1)  = {o} ;
(5) Valores propios de T −1 : 1/2 y 1 (doble).
2 −5
Im(A) = L ; S1 = {(x, x + y, y) / x, y ∈ R};
1 1
(2) N (A) = {o} ; S1/2 = {(z, z, z) / x ∈ R}. Es diagonalizable.
   
 1 −3  Ejercicio 7.8.12. Recuerde las proposiciones
Im(A) = L   1  ;  1   7.6.1 y 7.6.2.

4
 Ejercicio 7.8.13. Recuerde el ejercicio 5.1.8 y la
 1 proposición 5.2.1.
 −1 
(3) N (A) = L   0   ; Ejercicio 7.8.14. Recuerde la proposición 5.2.4.
  Ejercicio 7.8.15. (2) hT (v), vi = kvk2 cos(α)
  1  de donde kT hT (v),vi
1 −1 (v)kkvk = cos(α).
Im(A) = L ; (3) Se trata de una rotación con centro en el
1 9
(4)N (A) = {o} ; Im(A) = origen y ángulo de giro α (radianes) en sentido
     
 1 −1 0   antihorario.

 1   1   1  Ejercicio 7.9.1 (2)
L 
   ;   ;   
Ejercicio 7.9.2 (4)

 2   0   −1  


0 0 0
 Ejercicio 7.9.3 (4)
Ejercicio 7.8.3. (1) Utiliceel teorema 7.2.2. Ejercicio 7.9.4 (3)
 2 3 Ejercicio 7.9.5 (5)
(2) T −1 = . Ejercicio 7.9.6 (3)
−2 4
Ejercicio 7.8.4. (1) Utilice el teorema 7.2.2. Ejercicio 7.9.7 (2)
(2) T (x, y) = (x + 2y, x + y, x). Ejercicio 7.9.8 (3)
Ejercicio 7.8.5. (1) Ejercicio 7.9.9 (4)
T (1, 0, −1) = (0, 0, 0) ⇒ (1, 0, −1) ∈ N (T ). Ejercicio 7.9.10 (3)
T (1, 0, 0) = (1, 0, −1) ⇒ (1, 0, −1) ∈ Im(T ). Ejercicio 7.9.11 (2)
(2) No, pues N (T ) 6= {o}. Ejercicio 7.9.12 (2)
(3) Valores propios: 0 y 1 (doble). Ejercicio 7.9.13 (3)
S1 = {(0, y, 0) / y ∈ R}; Ejercicio 7.9.14 (1)
S0 = {(x, 0, −x) / x ∈ R}. No es diagonalizable. Ejercicio 7.9.15 (2)
Ejercicio 7.8.6. det[T ] 6= {o} ⇒ T es invertible Ejercicio 7.9.16 (1)
⇒ N (T ) = {o} y Im(T ) = R4 . Ejercicio 7.8.7. Ejercicio 7.9.17 (3)
Solo T2 oT1 es invertible Ejercicio 7.9.18 λ = 0, a = 1, b = −1.
218 Capı́tulo 8. Respuestas a los ejercicios

Ejercicio 7.9.19 (3) Ejercicio 7.9.28 (3)


Ejercicio 7.9.20 (3) Ejercicio 7.9.29 (3)
Ejercicio 7.9.21 (3) Ejercicio 7.9.30 (4)
Ejercicio 7.9.22 (3) Ejercicio 7.9.31 (3)
Ejercicio 7.9.23 (3) Ejercicio 7.9.32 (1)
Ejercicio 7.9.24 (2) Ejercicio 7.9.33 (2)
Ejercicio 7.9.25 (3) Ejercicio 7.9.34 (1)
Ejercicio 7.9.26 (1) Ejercicio 7.9.35 (1)
Ejercicio 7.9.27 (3)

Referencias bibliográficas y lecturas complementarias.

Anton, Howard. Introducción al álgebra lineal. Limusa, 3 Ed. 1994.

Barbolla, Rosa. - Sanz, Paloma Álgebra lineal y teorı́a de matrices. Prentice Hall,
1998.

Moretti, Jorge. Álgebra lineal. Ediciones del CECEA, 2000 a 2009.

Lages Lima, Elon. Álgebra Linear. IMPA.

Strang, Gilbert. Algebra lineal y sus aplicaciones. Cengage Learning Editores, 2007.

Grossman, Stanley. Algebra lineal. McGraw-Hill, 2008.

Hill, Richard. Álgebra lineal elemental con aplicaciones. Prentice Hall, 1997.

Halmos, Paul. Espacios vectoriales de dimensión finita. CECSA, 1971.

Hernández, Eugenio. Álgebra y Geometrı́a. Addison-Wesley, 1998.

Koffman, A. - Kunze, R. Álgebra lineal. Prentice Hall, 1997.

Nakos, G. - Joiner, D. Algebra lineal con aplicaciones. Thomson, 1999.


Índice alfabético

Angulo entre dos vectores, 132 definición, 91


subespacios, 92
Base
cambio de, 112 Generador
canónica, 108 definición, 102
definición, 108 modificación, 106
reducción, 105
Conjuntos convexos, 82
y sistemas de ecuaciones, 104
Coordenadas
de un vector, 111 Mı́nimos cuadrados
en base ortogonal, 135 aproximación por, 155
método de, 155
Dependencia lineal
Matrices
ampliación de un L.I., 88
antisimétricas, 13
conjuntos L.D., 83, 84
cálculo de la inversa, 38
conjuntos L.I., 83, 84
Descomposición en valores singulares, 177
interpretación geométrica, 86
diagonales, 161
modificación de un L.I., 88
reducción de un L.I., 87 diagonalizables, 162, 169
y sistemas de ecuaciones, 84, 85 igualdad de, 7
Determinantes, 32, 33, 37 invertibles, 15
Diagonalización núcleo, 98
condiciones, 171 nulidad, 120
de matrices simétricas, 172 ortogonales, 144
Descomposición en valores singulares, 177 producto de, 8, 11
matrices diagonalizables, 169 producto por un número, 8
multiplicidad algebraica, 174 que conservan el producto interno, 145
multiplicidad geométrica, 174 que conservan la norma, 145
subespacios propios, 165 resta de, 8
valores propios, 163, 165, 199 simétricas, 13
vectores propios, 163, 165, 199 suma de, 7
Distancia Matriz
de un punto a un conjunto, 139 de cambio de base, 113
de un punto a un plano, 151 escalerizada, 24, 44
de un punto a un subespacio, 139 escalerizada reducida, 24
de un punto a una recta, 152 forma escalerizada, 24
entre dos puntos, 131 identidad, 11
número de escalones, 28
Espacios vectoriales rango, 117, 118

219
220 ÍNDICE ALFABÉTICO

rango por columnas, 117, 118 por un punto y paralela a un vector, 54


rango por filas, 29, 117, 118 Rectas en R3
traspuesta, 12 ecuación paramétrica vectorial, 61
ecuaciones paramétricas, 61
Norma de un vector, 127 ecuaciones reducidas, 61
intersección, 62
Ortogonalidad
paralelas, 64
conjuntos ortogonales, 134
por dos puntos, 61
conjuntos ortonormales, 134
por un punto y paralela a un vector, 60
matrices ortogonales, 144
que se cruzan, 63
omplemento ortogonal de un subespa-
cio, 140
Segmentos, 56
proceso de Gram-Schmidt, 142
Semirrectas, 56
proyección ortogonal, 128, 137, 138
Sistemas de ecuaciones lineales
proyección ortogonal sobre un subespa-
compatible determinado, 20
cio, 138
compatible indeterminado, 20
vector ortogonal a un conjunto, 136
conjunto solución, 20
vectores ortogonales, 128
escalerizados, 24, 44
3
Planos en R , 65 grados de libertad, 47
ecuación reducida, 67, 68 homogéneos, 30, 31
ecuaciones paramétricas, 66 incompatible, 20
intersección con una recta, 68 matriz ampliada asociada, 22
por tres puntos no alineados, 67 matriz asociada, 22
por un punto y paralelo a dos vectores, notación matricial, 23
66 transformaciones elementales, 21
vector normal, 150 Subespacios
Producto interno, 125, 126 bases de, 108
Proyección ortogonal de las combinaciones lineales, 99
en una base cualquiera, 158 definición, 95
sobre un subespacio, 137, 138 dimensión, 109
sobre un vector, 128 generado por un conjunto, 99
Punto medio de un segmento, 57, 134 núcleo de una matriz, 98
reducción de un generador, 105
Rango Subespacios vectoriales, 92, 93
de una matriz, 117, 118
por columnas de una matriz, 117, 118 Teorema
por filas de una matriz, 29, 117, 118 caracterización de las transformaciones
Rectas lineales, 184
en R2 , 54 caracterización de transformaciones li-
en R3 , 60 neales inyectivas, 195
en Rn , 82 caracterización de transformaciones li-
Rectas en R2 neales sobreyectivas, 196
ecuación paramétrica vectorial, 54 condición suficiente de diagonalización,
ecuaciones paramétricas, 55 171
intersección, 58 condición suficiente para que un vector
por dos puntos, 55 sea ortogonal a un subespacio, 136
ÍNDICE ALFABÉTICO 221

condiciones de diagonalización, 169 Vectores


de Cramer, 35, 36 ángolo entre, 132
de Gram-Schmidt, 142 canónicos, 80
de la proyección ortogonal, 138 colineales, 52, 74
de las dimensiones, 194 combinación lineal, 74, 78, 79
de Pitágoras, 126, 128, 133 combinación lineal única, 79
de Rouche-Frobenius, 29, 46 coordenadas en una base, 111
de Steinitz, 107, 123 norma, 127
del coseno, 131 producto interno, 125
descomposición en valores singulares de producto por un número, 51, 52, 73
una matriz, 177 resta de, 51, 53, 73
desigualdad de Bessel, 138 suma de, 51, 53, 60, 72
desigualdad de Cauchy-Schwarz, 129 Vectores en R2 , 50
determinación de una transformación li- Vectores en R3 , 59
neal, 186 Vectores en Rn , 72
existencia de bases, 108 Vectores propios, 163, 165, 199
independencia lineal de conjuntos orto-
gonales, 134
independencia lineal de vectores propios,
167
sobre rango y nulidad de una matriz,
120
Transformaciones lineales
biyectivas, 195, 196
composición, 189
definición, 179, 180
determinación, 186
imagen, 192
invertibles, 191
inyectivas, 195
matriz asociada, 184
núcleo, 192
producto interno, 180
producto por un número, 188
propiedades básicas, 180
proyección ortogonal, 181
Proyección ortogonal sobre un vector,
180
sobreyectivas, 195
suma de, 188
teorema de las dimensiones, 194
transformación coordenadas, 181
transformación inversa, 191
valores y vectores propios, 199

Valores propios, 163, 165, 199

También podría gustarte