Libro Algebra 2013 PDF

Introducción al
ÁLGEBRA LINEAL
Ignacio Aemilius, Marcelo Cerminara,
Andrea Mesa, Fernando Peláez
2013
Aemilius, Ignacio - Cerminara, Marcelo - Mesa, Andrea - Peláez, Fernando.
Introducción al álgebra lineal.
c I. Aemilius, M. Cerminara, A. Mesa, F. Peláez

De esta edición:
Grupo Armónico Ediciones Montevideo, Julio 2013.
Diseño de carátula: Fernando Peláez.

Impreso en Uruguay.
Edición amparada por el Art. 79 de la ley 13.349
I.S.B.N. 978-9974-98-735-7
Queda prohibida cualquier forma de reproducción, transmisión o archivo en sistemas recuperables

del presente ejemplar, ya sea para uso privado o público, por medios mecánicos, electrónicos, elec-
trostáticos, magnéticos o cualquier otro, total o parcialmente, con o sin finalidad de lucro, salvo
expresa autorización de los autores.
Índice general
1. Álgebra de Matrices 5
1.1. Matrices y operaciones con matrices . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Matrices invertibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3. Apéndice de esta sección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2. Sistemas de ecuaciones lineales 19

2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2. Matriz asociada a un sistema de ecuaciones lineales . . . . . . . . . . . . . . 22
2.3. El método de escalerización . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4. Teorema de Rouche - Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5. Sistemas cuadrados, determinantes y Cramer . . . . . . . . . . . . . . . . . 31
2.6. Cálculo de la inversa de una matriz invertible . . . . . . . . . . . . . . . . . 38
2.7. Apéndice de esta sección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3. El espacio vectorial Rn 49
3.1. El espacio vectorial R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.1. Suma de vectores y producto de un número por un vector . . . . . . 50
3.1.2. Rectas en R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.2. El espacio vectorial R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.2.2. Rectas en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.3. Planos en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3. El espacio vectorial Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.3.2. Combinaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4. Dependencia e independencia lineal . . . . . . . . . . . . . . . . . . . . . . . 83
4. Subespacios vectoriales de Rn 91
4.1. Espacios vectoriales reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.2. Subespacios vectoriales de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.3. Generador de un subespacio vectorial de Rn . . . . . . . . . . . . . . . . . . 102
4.4. Base y dimensión de un subespacio vectorial de Rn . . . . . . . . . . . . . . 108
4.5. Rango de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.6. Apéndice de este capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
3
5. Rn como espacio euclidiano 125
5.1. Producto interno, norma y ángulos . . . . . . . . . . . . . . . . . . . . . . . 125
5.2. Conjuntos ortogonales y proyecciones ortogonales . . . . . . . . . . . . . . . 134
5.3. Cálculo de distancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5.3.1. Vector perpendicular a un plano. . . . . . . . . . . . . . . . . . . . . 150
5.3.2. Distancia de un punto a un plano. . . . . . . . . . . . . . . . . . . . 151
5.3.3. Distancia de un punto a una recta. . . . . . . . . . . . . . . . . . . . 152
5.4. Aproximación por el método de mı́nimos cuadrados . . . . . . . . . . . . . . 155
5.4.1. Descripción del método. . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.4.2. Una fórmula para la proyección ortogonal . . . . . . . . . . . . . . . 158
6. Diagonalización 161
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
6.2. Valores y vectores propios de una matriz . . . . . . . . . . . . . . . . . . . . 163
6.3. Matrices diagonalizables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.4. Apéndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
7. Transformaciones lineales 179

7.1. Definición, propiedades básicas y ejemplos . . . . . . . . . . . . . . . . . . . 179
7.2. Matriz asociada a una transformación lineal . . . . . . . . . . . . . . . . . . 184
7.3. Operaciones con transformaciones lineales . . . . . . . . . . . . . . . . . . . 188
7.4. Inversa de una transformación lineal . . . . . . . . . . . . . . . . . . . . . . 190
7.5. Núcleo e imagen de una transformación lineal . . . . . . . . . . . . . . . . . 192
7.6. Transformaciones lineales inyectivas, sobreyectivas y biyectivas . . . . . . . 195
7.7. Valores y vectores propios de una transformación lineal . . . . . . . . . . . 199
7.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7.9. Ejercicios variados de opción múltiple . . . . . . . . . . . . . . . . . . . . . 205
8. Respuestas a los ejercicios 211

Capı́tulo 1
Álgebra de Matrices
Es probable que el lector ya tenga experiencia con la utilización de “planillas bidimensio-

nales” que resultan de utilidad para organizar y procesar datos. Por ejemplo, consideremos
el caso de una empresa uruguaya que vende cuatro tipo de artı́culos (de tipo A, B, C y
D), de las cuales se conocen las cantidades vendidas en los meses de setiembre, octubre,
noviembre, diciembre y enero. Esta información figura en la siguiente matriz:
 
60 130 70 150
 100 200 120 330 
 
A=  150 240 130 510 

 129 223 148 947 
88 147 105 430
En la primera fila aparecen las cantidades vendidas en setiembre de los cuatro tipos de
artı́culos, en la segunda las cantidades vendidas en octubre, y ası́ sucesivamente. Esta es
una matriz de 5 filas y 4 columnas.
Ahora bien, esos datos correspondı́an solo a Montevideo. La información adicional sobre
las cantidades vendidas en la ciudad de Tacuarembó viene dada por esta otra matriz:
 
10 13 12 15
 10 24 9 30 
 
B=  16 25 10 48 

 11 21 15 88 
9 15 10 40
Como se sigue el mismo criterio para dar la información, esta matriz también tiene 5 filas
y 4 columnas. ¿Cómo obtenemos el total de ventas en los dos departamentos de cada
artı́culo en cada mes? Resulta claro que debemos sumar cada elemento de la matriz A con
su correspondiente en la matriz B:
 
70 143 82 165
 110 224 129 360 
 
 166 265 140 558 
 
 140 244 163 1035 
97 162 115 470
6 Capı́tulo 1. Álgebra de Matrices
O sea, hemos calculado una nueva matriz (también de 5 filas y 4 columnas) que se obtuvo
realizando ciertas operaciones con los elementos de las matrices originales.
Supongamos ahora que durante esos meses la empresa no ha cambiado el precio de sus
artı́culos: los de tipo A se venden a a pesos, los de tipo B a b pesos, .... La matriz de
precios de los artı́culos es entonces:  
a
 b 
 
 c 
d
Una de las preguntas que nos podemos plantear es: en cada uno de los cinco meses ¿cual
es el ingreso total de la empresa por concepto de ventas en Montevideo? La respuesta es
muy simple: en setiembre fue de 60a + 130b + 70c + 150d; en octubre fue de 100a + 200b +
120c + 330d; y ası́ sucesivamente. La información global sobre los ingresos a cada uno de
los cinco meses podrı́a estar presentada en la siguiente matriz:
 
60a + 130b + 70c + 150d
 100a + 200b + 120c + 330d 
 
 150a + 240b + 130c + 510d 
 
 129a + 223b + 148c + 947d 
88a + 147b + 105c + 430d
que también puede pensarse como el resultado de cierto tipo de operación entre las matrices
 
60 130 70 150  
 100 200 120 330  a
   b 
 150 240 130 510  y  
   c 
 129 223 148 947 
d
88 147 105 430
Este breve ejemplo introductorio pretende poner de relieve que, más allá de las matrices
como objetos estáticos para organizar datos, puede resultar de mucha utilidad estudiar
operaciones (y las propiedades de las mismas) entre estos objetos.
1.1. Matrices y operaciones con matrices

Definición 1.1.1. Llamaremos matriz A de m filas por n columnas (de tamaño m × n)
con entradas aij a un ordenamiento rectangular de números
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
 
A= . .. .. .. 
 .. . . . 
am1 am2 . . . amn
Notación: En general, la matriz A con entradas aij la indicaremos por A = ((aij ))i=1,...,m
j=1,...,n
o más brevemente A = ((aij )) cuando las dimensiones estén claras. El primer ı́ndice, i,
indica la fila y el segundo, j, la columna a la que pertenece la entrada aij . Ası́, se dirá que
1.1. Matrices y operaciones con matrices 7
la entrada aij ocupa la posición ij dentro de la matriz.

El conjunto de todas las matrices m × n lo indicaremos como Mm×n .
Si A es una matriz de m filas por n columnas entonces sus filas serán representadas por
los sı́mbolos F1 (A), F2 (A), ... , Fm (A) respectivamente (es decir, Fi (A) es la i-ésima fila
de A). De modo análogo sus columnas serán representadas mediante C1 (A), C2 (A), ... ,
Cn (A) respectivamente (es decir, Cj (A) es la j-ésima columna de A).
Llamaremos matriz columna (fila) a una matriz de tamaño m × 1 (1 × n).
Definición 1.1.2. Igualdad de matrices.
Diremos que dos matrices son iguales si tienen el mismo tamaño y los mismas entradas
en las mismas posiciones. Dicho de otro modo, si A y B son dos matrices m × n, entonces
A = B ⇐⇒ aij = bij ∀i = 1, . . . , m, j = 1, . . . , n.

1 2 4 2
Ejemplo 1.1.1. Sean A = yB= .
−3 1 −3 1
Entonces A 6= B pues a11 = 1 6= b11 = 4
Definición 1.1.3. Suma de matrices.
Si A = ((aij )) y B = ((bij )) son dos matrices m × n entonces la suma A + B es la matriz
C = ((cij )) también m × n en donde cij = aij + bij .
   
1 5 0 0 −8 −1
Ejemplo 1.1.2. Sean A =  1 2 −1  y B =  2 2 0 , entonces
0 −1 3 1 −2 2
     
1 5 0 0 −8 −1 1+0 5−8 0−1
A+B = 1 2 −1  +  2 2 0  =  1+2 2 + 2 −1 + 0 
0 −1 3 1 −2 2 0 + 1 −1 − 2 3+2
 
1 −3 −1
=  3 4 −1 
1 −3 5
Proposición 1.1.1. Propiedades de la suma de matrices.

(S1) Asociativa: A + B + C = A + B + C , ∀ A, B, C ∈ Mm×n .
(S2) Conmutativa: A + B = B + A, ∀ A, B ∈ Mm×n .
(S3) Existencia de neutro: Existe O ∈ Mm×n tal que A+O = O +A = A, ∀ A ∈ Mm×n .
(S4) Existencia de opuesto: Para cada A ∈ Mm×n existe B ∈ Mm×n tal que A+B = O.
(Notación: B = −A).
La prueba queda a cargo del lector y consiste simplemente en aplicar las propiedades
conocidas de la suma de números reales. Indicamos, no obstante, que la matriz O de la
propiedad (S3) se denomina matriz nula y tiene ceros en todas sus entradas. Por su
parte, la matriz −A (opuesta de A) es la que tiene en sus entradas los opuestos de las
correspondientes entradas de A.
Como toda matriz tiene una matriz opuesta es posible definir la resta de matrices de
manera análoga a lo que se hace con números reales.
Definición 1.1.4. Resta de matrices.

Si A y B son dos matrices m × n entonces la resta A − B es la suma de la matriz A mas
la opuesta de la B.
Definición 1.1.5. Producto de un número por una matriz.

Si λ es un número real y A es una matriz m × n entonces el producto λA es la matriz
B = ((bij )) también m × n en donde bij = λaij
En otras palabras, cada entrada de λA se obtiene multiplicando por λ a la correspondiente
entrada de A.

3 1
Ejemplo 1.1.3. Sean λ = 5 y A = entonces
0 −2

3 1 15 5
λA = 5 =
0 −2 0 −10
Proposición 1.1.2. Propiedades del producto de un número por una matriz.

(P1) Asociativa: αβ A = α(βA), ∀ α, β ∈ R y A ∈ Mm×n .
(P2) Existencia de neutro real: 1.A = A, ∀ A ∈ Mm×n
(P3) Distributiva respecto de la suma de números: (α + β)A = αA + βA, ∀ α, β ∈ R y

∀ A ∈ Mm×n .
(P4) Distributiva respecto de la suma de matrices: α(A + B) = αA + αB, ∀ α ∈ R y
∀ A, B ∈ Mm×n .
Definición 1.1.6. Producto de matrices.
Si A es una matriz m × p y B es una matriz p × n entonces el producto de matrices
A.B es la matriz C = ((cij )) m × n donde
p
X
cij = aih bhj
h=1
El siguiente esquema ayuda a recordar la forma de realizar la operación:

 
b11 . . . b1j . . . b1n
 b21 . . . b2j . . . b2n 
 
 .. .. 
 . ... . ... ... 
bp1 . . . bpj . . . bpn
   
a11 a12 ... a1p
 .. .. ..   
 . . ... .   .. .. .. .. 
   
 .. .. ..   . . ↓ . . 
 . . ... .   .. .. 
   
 ai1 ai2 ... aip   −→ cij . . 

 .. .. ..



 .. .. .. .. .. 

 . . ... .   . . . . . 
.. .. .. .. ..
am1 am2 . . . amp . . . . .

2 −1 1 2
Ejemplo 1.1.4. Si A = yB= entonces:
0 2 −1 3

2 −1 1 2 2·1 + (−1)(−1) 2·2 + (−1)3
A.B = = =
0 2 −1 3 0·1 + 2(−1) 0·2 + 2·3

3 1
=
−2 6
 
1 2
2 1 −1 0  2 1 
Ejemplo 1.1.5. Sean A = yB=
 1 1 . El producto de A por

2 1 2 −1
1 0
B es:
 
1 2
2 1 −1 0  2 1 = 3 4

2 1 2 −1  1 1  5 7
1 0
pues
2·1 + 1·2 + (−1)1 + 0·1 = 3

2·2 + 1·1 + (−1)1 + 0·0 = 4
2·1 + 1·2 + 2·1 + (−1)1 = 5
2·2 + 1·1 + 2·1 + (−1)0 = 7
Vale la pena observar que las matrices no deben ser necesariamente del mismo tamaño
para poder multiplicarlas. De hecho, si se mira con cuidado la definición, se observa que
para poder hacerlo la cantidad de columnas de la primera debe coincidir con la cantidad
de filas de la segunda. Cuando esto ocurre se dice que la primera matriz es conformable
con la segunda.
   
1 2 1 x
Ejemplo 1.1.6. Sean A =  2 1 1  y X =  y  entonces
1 1 2 z
    
1 2 1 x x + 2y + z
A.X =  2 1 1  y  =  2x + y + z 
1 1 2 z x + y + 2z
 
1 2 1
Ejemplo 1.1.7. Sean A =  2 1 1  y Y = x y z entonces
1 1 2
 
1 2 1
Y.A = x y z  2 1 1 = x + 2y + z 2x + y + z x + y + 2z
1 1 2
Observación 1.1.1. Si volvemos a mirar el ejemplo introductorio de comienzo de capı́tulo

observamos que la matriz
 
60a + 130b + 70c + 150d
 100a + 200b + 120c + 330d 
 
 150a + 240b + 130c + 510d 
 
 129a + 223b + 148c + 947d 
88a + 147b + 105c + 430d
que daba la información global sobre los ingresos a cada uno de los cinco meses, coincide
con el producto matricial:
 
60 130 70 150  
 100 200 120 330  a
   b 
 150 240 130 510  .  
   c 
 129 223 148 947 
d
88 147 105 430
Observación 1.1.2. Las columnas de la matriz 
producto.

1 1
2 1 0
Consideremos las matrices A = y B =  2 1 . Su producto A.B resulta
1 2 1
1 1
ser:
 
1 1
2 1 0  4 3
A.B = 2 1 =
1 2 1 6 4
1 1
Podemos observar que la primera columna de A.B coincide con el producto de la matriz
A por la primera columna de B, mientras la segunda columna de A.B coincide con el
producto de la matriz A por la segunda columna de B:
   
1 1
2 1 0   4 2 1 0   3
2 = , 1 =
1 2 1 6 1 2 1 4
1 1
Este resultado es general y surge de la propia definición de producto de matrices. Si A es
una matriz m × n, B una matriz n × p y A.B su producto entonces la columna j-ésima
de A.B coincidirá con el producto de la matriz A por la columna j-ésima de B (para
j = 1, 2, ... , p). En sı́mbolos:
Cj (A.B) = A . Cj (B)
Por otra parte, con las filas sucede algo similar:
   
1 1 1 1
2 1 0  2 1 = 4 3 y 1 2 1  2 1 = 6 4
1 1 1 1
la i-ésima fila de A.B coincide con el producto de la i-ésima fila de A por la matriz B
(i = 1, 2, ... , m). En sı́mbolos:
Fi (A.B) = Fi (A) . B
Definición 1.1.7. La matriz identidad.

Llamaremos matriz identidad In a la matriz n × n dada por
 
1 0 ... 0
 0 1 ... 0 
 
In =  . . . .. 
.
 . .. . . . 
0 0 ... 1
Se trata entonces de la matriz que tiene al número 1 en todas las entradas de la diagonal
principal y al número 0 en el resto de las entradas.
 
1 0 0
Por ejemplo: I3 =  0 1 0 
0 0 1
La matriz identidad juega un papel especial en el producto de matrices pues es inmediato
verificar que cumple:
In .A = A, ∀ A ∈ Mn×p , B.In = B, ∀ B ∈ Mm×n
Observación 1.1.3. Sobre las propiedades del producto de matrices.

En la operación de producto de matrices no se cumplen algunas de las propiedades usuales
del producto de números reales.
No conmutatividad. En el ejemplo 1.1.6 se observa que dos matrices pueden ser confor-
mables en un orden y no en otro. De hecho, en ese ejemplo A.X tiene sentido pero X.A no.
Ahora bien, aunque las matrices sean cuadradas, no tiene por qué
coincidir
el resultado
al

2 1 1 0
multiplicarlas en un orden o en el inverso. En efecto sean A = yB=
1 1 0 0
entonces
2 1 1 0 2 0
A.B = =
1 1 0 0 1 0

1 0 2 1 2 1
B.A = =
0 0 1 1 0 0
Naturalmente el contraejemplo solo indica que en general A.B 6= B.A lo cual no significa
que no existan matrices que conmuten.
No Hankel. El producto de dos matrices puede dar como resultado la matriz nula sin

1 0 0 0
que ninguna de las matrices sea la nula. En efecto, si A = y B =
0 0 1 3
entonces ninguna de las dos matrices es nula y sin embargo:

1 0 0 0 0 0
A.B = . =
0 0 1 3 0 0
Proposición 1.1.3. Propiedades del producto de matrices.
Asociativa Si A ∈ Mm×n , B ∈ Mn×p y C ∈ Mp×q , entonces (A.B).C = A.(B.C)
Distributiva Si A, B ∈ Mm×n , C ∈ Mp×m y D ∈ Mn×q entonces

C.(A + B) = C.A + C.B y (A + B).D = A.D + B.D
Existencia de Neutro Si In es la matriz identidad n × n entonces

In .A = A, ∀ A ∈ Mn×p , B.In = B, ∀ B ∈ Mm×n
La demostración se puede encontrar en el apéndice del final de este capı́tulo.
Definición 1.1.8. Potencias de una matriz.

Sea A una matriz n × n. Definimos:
A0 = In , Ak+1 = A.Ak , ∀ k ∈ N.

1 2 2 3 0
Ejemplo 1.1.8. Si A = entonces A = A.A =
1 −1 0 3
Definición 1.1.9. Traspuesta de una matriz.
Si A = ((aij )) es una matriz m × n, definimos la matriz traspuesta de A como la matriz
B = ((bij )) de dimensión n × m en donde bij = aji . Notación: la traspuesta de A se
simbolizará At .
 
1 2
1 2 3
Ejemplo 1.1.9. Sea A = entonces At =  2 1 
2 1 1
3 1

1 2 1 2
Sea B = entonces B t = . En este caso resultó B = B t , cuando esto
2 3 2 3
ocurra diremos
 que la matriz
 B es simétrica 
0 2 −1 0 −2 1
Sea C =  −2 0 1  entonces C t =  2 0 −1  por lo tanto C t = −C,
1 −1 0 −1 1 0
cuando esto
 ocurra
 diremos que la matriz C es antisimétrica.
1
 −2  t

Sea D =   2  entonces D = 1 −2 2 0 . Obsérvese que la traspuesta de una

0
matriz columna resulta ser un matriz fila.
Proposición 1.1.4. Propiedades de la matriz traspuesta.
1. (A + B)t = At + B t , ∀ A, B ∈ Mm×n .
2. (λ A)t = λ At , ∀ A ∈ Mm×n , ∀λ ∈ R.
3. (A.B)t = B t .At , para toda pareja de matrices A y B conformables.
4. (At )t = A, ∀ A ∈ Mm×n .
La demostración queda cargo del lector.
Ejercicio 1.1.1. Construya la matriz A = ((aij )) 3 × 2 que cumple aij = 2i − j,

(i = 1, 2, 3 , j = 1, 2).

a + b −2 2 −2
Ejercicio 1.1.2. Calcule a y b para que =
3 a−b 3 4
Ejercicio 1.1.3. Se consideran las siguientes matrices:

   
1 0 −1 1 0 −1 2
5 −2 2 3 −1
A= ,B= , C =  0 2 −3  , D =  3 −2 1 6 
1 0 1 −2 5
2 1 0 0 −5 4 3
1. Encuentre las siguientes matrices: A + At , 2C − 7I3 , B t .B , B.B t .

2. Calcule todos los productos (que se puedan realizar) de dos factores utilizando las
matrices A, B, C y D. (Por ejemplo A.B tiene sentido pero A.D no.)

1 3
3. Encuentre todas las matrices X que verifiquen la igualdad 2A − 4X =
2 1
Ejercicio 1.1.4. Investigue si las siguientes igualdades se cumplen para toda pareja de
matrices A, B ∈ Mn×n . En caso de que no se cumplan siempre, halle la condición que
deben verificar A y B para que la igualdad sea verdadera.
1. (A + B)2 = A2 + 2A.B + B 2
2. (A + B)(A − B) = A2 − B 2
3. Ap .Aq = Ap+q , p y q naturales.
4. Ap .B p = (A.B)p , p natural.
Ejercicio 1.1.5.
1. Una matriz A se dice simétrica si At = A. Pruebe que B + B t es simétrica para
toda matriz B n × n.
2. Una matriz A se dice antisimétrica si At = −A. Pruebe que B −B t es antisimétrica
para toda matriz B n × n.
 
a a2 + 2 5
3. Halle todos los valores de a para que la matriz  −3a 1 −1  sea simétrica.
5 −1 0
Ejercicio 1.1.6.
1. Halle todas las matrices A 2 × 2 tales que A2 = I2 .
2. Halle todas las matrices A 2 × 2 tales que A2 = −I2 .
3. Halle todas las matrices A 2 × 2 tales que A2 = O.
Ejercicio 1.1.7. Traza de una matriz cuadrada.

i=n
X
Si A es una matriz se define la traza de A como el número tr(A) = aii .
i=1
Pruebe que:
1. tr(A + B) = tr(A) + tr(B), ∀ A, B ∈ Mn×n .
2. tr(cA) = c tr(A), ∀ A ∈ Mn×n , ∀ c ∈ R.

3. tr(A) = tr At , ∀ A ∈ Mn×n .
4. tr(A.B) = tr(B.A), ∀ A, B ∈ Mn×n .
5. No existen matrices A, B ∈ Mn×n tales que A.B − B.A = In .

1 1 1
Ejercicio 1.1.8. Se considera la matriz A =
1 1 −1
1. Demuestre que existen infinitas matrices B tales que A.B = I2 .

2. Demuestre que no existe ninguna matriz C tal que C.A = I3 .
Ejercicio 1.1.9. Una empresa comercializa cuatro artı́culos. A continuación se dan las
matrices columna correspondientes al stock al comienzo de la semana (S), a las compras
(C) y las ventas (V ) realizadas por la empresa en esa semana y la matriz de precios de
venta de cada artı́culo (vigente en la semana y sin IVA).
       
20 2 7 3000
 17   4   16   2000 
S=
 15  , C =  0
   , V =
  8  , P =  1000
  

4 3 2 9000
1. Exprese las operaciones matriciales que permiten obtener la matriz correspondiente

al stock al final de la semana y la matriz de precios de venta con el IVA.
2. Exprese las operaciones matriciales que permiten obtener el ingreso obtenido por la
empresa durante la semana.
Ejercicio 1.1.10. Una fábrica produce tres artı́culos y en esa producción se necesita una
materia prima y mano de obra de acuerdo con lo que se indica a continuación:
Artı́culo 1: Cada unidad requiere 3 kilos de materia prima y 4 horas hombre.
1. Sean: p1 el precio por kilo de la materia prima y p2 la remuneración por hora de
trabajo. Defina dos matrices u y v de modo que el producto ut v sea el costo variable
por producir x unidades del artı́culo 1, y unidades del artı́culo 2 y z unidades del
artı́culo 3.
2. Sea k el costo fijo de producción y a, b, c los precios de venta de cada unidad de
los artı́culos 1, 2 y 3 respectivamente. Exprese mediante operaciones matriciales la
utilidad que obtiene la fábrica al vender x unidades del artı́culo 1, y unidades del
artı́culo 2 y z unidades del artı́culo 3.
Ejercicio 1.1.11. Una empresa vende cinco clases de artı́culos (de tipo A, de tipo B, de
tipo C, de tipo D y tipo E). Se conocen las cantidades vendidas en los años 2007 al 2010.
Esta información viene dada por la matriz M mientras que los precios de los artı́culos por
la matriz P :    
100 120 130 150 5
 50 60 60 80   9 
   
M =  150 240 200 260 
  P =   10 

 129 223 240 300   7 
111 122 144 157 8
(Esto quiere decir que cada artı́culo de tipo A cuesta 5 pesos, y ası́ sucesivamente). Me-
diante operaciones matriciales ¿es posible calcular el ingreso total de la empresa durante
estos cuatro años?
Ejercicio 1.1.12. Una empresa fabrica tres productos (A, B y C) cada uno de los cuales
requiere de ciertas cantidades de tres tipos de materia prima y de mano de obra. La matriz
1.2. Matrices invertibles 15
R resume los requerimientos por unidad de cada producto:

 
2 4 5 5
R =  3 2 3 8 
1 3 5 4
Las necesidades de materias primas se dan en kg por unidad y las de mano de obra en
horas por unidad. Las tres materias primas cuestan $2, $3 y $1,50 por kg respectivamente.
Los costos de mano de obra son de $5 por hora. Suponga que se deben fabricar 500, 1000
y 400 productos de tipo A, B y C respectivamente. Plantee las operaciones matriciales que
deben realizarse para calcular el costo total de la producción.
Ejercicio 1.1.13. Un experto en sondeos de opinión está observando una elección para
elegir al Intendente de una ciudad. A partir de la última encuesta se obtuvieron los por-
centajes de preferencias de seis zonas diferentes con respecto a los tres candidatos. Dichos
valores se muestran en la siguiente matriz:
 
0, 40 0, 35 0, 30 0, 50 0, 30 0, 36
M =  0, 42 0, 40 0, 25 0, 30 0, 30 0, 32 
0, 18 0, 25 0, 45 0, 20 0, 40 0, 32
El número de ciudadanos que se espera voten en cada zona es 30000, 60000, 70000, 45000,
55000, 40000 respectivamente. En base a esta información ¿cuál es la proyección de resul-
tados que se puede hacer?
1.2. Matrices invertibles

Como toda matriz tiene una matriz opuesta hemos podido definir la resta de matrices de
modo análogo a como se hace con números reales. Sin embargo, el lector habrá notado
que no hemos hablado de “división” de matrices. ¿Cómo se definı́a la división de números
reales? Basándonos en el hecho de que todo real diferente de 0 tiene inverso, si a, b ∈ R y
b 6= 0 la división a/b se define como el producto de a por b−1 en donde b−1 es el inverso
de b, que está caracterizado por b b−1 = 1 (el inverso de un número b es otro número que
multiplicado por b da como resultado el neutro del producto). Estas consideraciones nos
llevan a la siguiente definición.
Definición 1.2.1. Matriz invertible.

Sea A una matriz n × n. Diremos que la matriz A es invertible si, y solo si, existe B
matriz n × n tal que
A.B = In y B.A = In (1.1)
donde In es la matriz identidad n × n
Observación 1.2.1. Nuevamente, como consecuencia de la no conmutatividad del pro-
ducto de matrices debemos, en la definición anterior, exigir que A.B y B.A sean ambos
iguales a la identidad. A priori podrı́a ocurrir que A.B = In 6= B.A. Veremos más adelante
que esto realmente no es posible. De hecho, probaremos que si existe B tal que A.B = In
entonces B.A = In . Observemos además que las matrices invertibles son por definición
matrices cuadradas.
A continuación veremos que la matriz B que cumple (1.1), cuando existe, es única. Por
tal motivo se le llama inversa de A y se utiliza la notación B = A−1
Proposición 1.2.1. Sean B1 y B2 matrices n × n que cumplen (1.1) entonces B1 = B2
Demostración. Se tiene:
B1 = B1 I = B1 (A B2 ) = (B1 A) B2 = I B2 = B2 ♠

2 1 1 −1
Ejemplo 1.2.1. La matriz A = es invertible, pues existe B =
1 1 −1 2
tal que A.B = I y B.A = I (verificarlo).
 
1 1 0
Ejemplo 1.2.2. La matriz A =  1 0 −1  no es invertible, pues para cualquier
0 0 0
 
a b c
matriz B =  d e f  se cumple que
g h i
    
1 1 0 a b c a+d b+e c+f
A.B =  1 0 −1   d e f  =  a − g b − h c − i  6=
0 0 0 g h i 0 0 0
 
1 0 0
6=  0 1 0 =I
0 0 1
Proposición
El caso de matrices 2 × 2
1.2.2.
a b d −b
Sea A = . Si ad − bc 6= 0 entonces A es invertible y A−1 = 1
ad−bc
c d −c a
Demostración. Si no conociéramos
un candidato para A−1 tendrı́amos que plantearnos
e f
una matriz genérica multiplicarla por A, imponer que dicho producto sea la
g h

1 0
identidad y, de ese modo, intentar hallar las entradas e, f, g y h. No nos interesa
0 1
hacer eso en este momento ya que dicho planteo será discutido más adelante. Ahora, el
lector puede simplemente verificar que los productos
d −b d −b
a b ad−bc ad−bc ad−bc ad−bc a b
. −c a y −c a .
c d ad−bc ad−bc ad−bc ad−bc c d

1 0
dan como resultado la matriz identidad . ♠
0 1
Para hallar la inversa (en caso que exista) de una matriz 2×2 alcanza con aplicar la fórmula
que se dio en el teorema anterior. Para matrices cuadradas de dimensiones mayores a 2 la
situación es completamente diferente pues no existen “fórmulas sencillas” para aplicar. En
el próximo capı́tulo veremos una condición necesaria y suficiente para que una matriz sea
1.2. Matrices invertibles 17
invertible ası́ como también un algoritmo que nos permitirá hallar la inversa. Aunque no
sepamos eso todavı́a, podemos continuar estudiando algunas propiedades de las matrices
invertibles.
Proposición 1.2.3. La inversa de un producto de matrices.

Si A y B son dos matrices n × n invertibles entonces A.B es invertible y
(A.B)−1 = B −1 .A−1
Demostración. Para demostrarlo basta con multiplicar A.B por su “candidata” a inversa
y verificar que da la identidad:
= In
z }| {
(A.B) B −1 .A−1 = A (B.B −1 ) A−1 = A.In .A−1 = A.A−1 = In
= In
z }| {
(B −1 .A−1 )(A.B) = B −1 (A−1 .A) B = B −1 .In .B = B −1 .B = In
♠
Ejercicio 1.2.1. Halle la inversa de las siguientes matrices y verifique:

2 1 4 1
A= , B=
1 1 2 1
Ejercicio 1.2.2. Investigue si las siguientes afirmaciones son verdaderas o falsas justi-
ficando la respuesta (en caso de ser verdadera deberá demostrar y, en caso de ser falsa
deberá dar un contraejemplo).
−1
1. Si A es una matriz invertible entonces A−1 =A
2. Si A es una matriz invertible y k 6= 0 entonces kA es invertible y (kA)−1 = k1 A−1
−1 t
3. Si A es una matriz invertible entonces At también lo es y At = A−1
4. Si A y B son dos matrices invertibles n × n entonces A + B es invertible.
5. Si A y B son dos matrices invertibles n × n y A + B es invertible entonces
(A + B)−1 = A−1 + B −1
Ejercicio 1.2.3. Sea A una matriz n × n. Pruebe que:

1. se cumple la igualdad: (In − A)(In + A + A2 + . . . + Ak ) = In − Ak+1 (k natural).
2. si A2 = O entonces In − A es invertible.
3. si A3 = O entonces In − A es invertible.
4. si existe k ∈ N tal que Ak = O entonces In − A es invertible.
5. Si A2 + 2A + In = O entonces A es invertible.
6. Si A3 − A + In = O entonces A es invertible.
Ejercicio 1.2.4. Matrices semejantes.

Se dice que dos matrices A y B, ambas n × n, son semejantes si existe una matriz P
n × n e invertible tal que B = P −1 .A.P . Supongamos que A y B sean semejantes. Pruebe
que:
1. At y B t son semejantes.
2. A es invertible si, y solo si, B es invertible.

3. tr(A) = tr(B) (recuerde la propiedad (4) en el ejercicio 1.1.7).
4. B k = P −1 .Ak .P , ∀ k ∈ N.
5. si Ak = O entonces B k = O.
1.3. Apéndice de esta sección

Demostración de las propiedades del producto de matrices.
Asociativa Si A ∈ Mm×n , B ∈ Mn×p y C ∈ Mp×q , entonces (A.B).C = A.(B.C)

En efecto pongamos (A.B).C = D = ((dij )) y A.(B.C) = D ′ = ((d′ij )). Observemos,
en primer lugar, que ambas matrices D y D ′ tienen tamaño m × q. Debemos probar
que dij = d′ij ∀ i = 1, 2, ... , m ; ∀ j = 1, 2, ... , q.
!! ! !
X X X X
d′ij = aih bhs csj = aih bhs csj = dij
h s s h
Distributiva Si Si A, B ∈ Mm×n , C ∈ Mp×m y D ∈ Mn×q entonces

C.(A + B) = C.A + C.B y (A + B).D = A.D + B.D
Demostremos solamente la primera parte (la otra es totalmente análoga). Pongamos
C.(A + B) = G = ((gij )),

C.A = E = ((eij )) y C.B = F = ((fij )).
Debemos probar entonces que gij = eij + fij ∀ i, j.

X X
gij = cih ahj + bhj = cih ahj + cih bhj =
h h
X X
= cih ahj + cih bhj = eij + fij
h h
♠
Capı́tulo 2
Sistemas de ecuaciones lineales
2.1. Introducción
Gran parte de lo que estudiaremos en este curso se vincula con los sistemas de ecuacio-
nes lineales y, por lo tanto, vale la pena dedicar algún tiempo a presentarlos, discutir sus
propiedades y ciertas estrategias para resolverlos. El lector que ya conozca estos temas
tendrá, en todo caso, una oportunidad para repasarlos.
Algunos ejemplos de sistemas de ecuaciones lineales son los siguientes:

2x − 3y = 4
(sistema de 2 ecuaciones con 2 incógnitas)
3x + 4y = 1

 x + y + 2z = 8
x − y + z = 0 (sistema de 3 ecuaciones con 3 incógnitas)

x+y+z =6

x − 3y + z = 1
x + 4y − z = 2

 x − 2y = 1
x + 3y = 2 (sistema de 3 ecuaciones con 2 incógnitas)

−x + 2y = 3
Cuando tengamos varias incógnitas podemos elegir una misma letra para representarlas y
distinguirlas mediante el uso de subı́ndices diferentes:


 x1 + 2x2 + x3 − x4 + x5 + x6 = 1

x1 − 2x2 + x3 + x4 + x5 − x6 = 0

 x1 + 2x2 + x3 + 9x4 + 5x5 + 3x6 = 3

x1 + 2x2 + x3 + 2x4 − x5 + 3x6 = 2
20 Capı́tulo 2. Sistemas de ecuaciones lineales
Un sistema de m ecuaciones lineales con n incógnitas x1 , x2 , . . . , xn es un problema

del tipo:


 a11 x1 + a12 x2 + . . . + a1n xn = b1

 a21 x1 + a22 x2 + . . . + a2n xn = b2
(S) .. ..


 . .

am1 x1 + am2 x2 + . . . + amn xn = bm
donde aij con i = 1, . . . , m y j = 1, . . . , n (los coeficientes del sistema) y bj con j = 1, . . . , m

(los términos independientes) son números.1 Diremos que el sistema es m × n, indicando
siempre con el primer número la cantidad de ecuaciones y con el segundo la de incógnitas.
Una solución del sistema (S) es una lista ordenada de n números (α1 , α2 , . . . , αn ) tales
que si se sustituye x1 = α1 , x2 = α2 , . . . , xn = αn se verifican simultáneamente las m
ecuaciones.
Llamaremos conjunto solución del sistema (S) y lo notaremos Sol(S) al conjunto de
todas las soluciones de (S). Resolver un sistema es determinar su conjunto solución.2
Clasificaremos los sistemas de acuerdo al número de soluciones que tenga. Diremos enton-
ces que un sistema es compatible determinado si tiene una única solución, compatible
indeterminado si tiene más de una solución3 e incompatible si no tiene ninguna solu-
ción.
Ejemplo 2.1.1. El ejemplo más sencillo de un sistema lineal es el 1 × 1:
ax = b
En pocos renglones podemos discutir completamente como es el conjunto solución. Si a 6= 0

entonces el sistema es compatible determinado y su única solución es x = ab = a−1 b. Si
en cambio a = 0 hay dos posibilidades: si b 6= 0 el sistema es incompatible y si b = 0
trivialmente el sistema es compatible indeterminado y cualquier número es solución del
mismo.
Naturalmente este problema es extremadamente sencillo, pero como acontece muchas veces
las ideas que aquı́ se utilizan, convenientemente adaptadas, resultaran útiles en casos más
generales y complicados.
Ejemplo 2.1.2.

 x=1
(S) y=3

z=2
es un sistema 3 × 3. Se observa de manera inmediata que Sol(S) = {(1, 3, 2)}.
1
En nuestro cursos los números que consideraremos pertenecen al cuerpo de los reales.
2
En general, salvo que se indique lo contrario, las soluciones se consideraran en el mismo conjunto de
números que los coeficientes, o sea los números reales.
3
Veremos más adelante que si un sistema lineal admite más de una solución entonces necesariamente
debe admitir infinitas.
2.1. Introducción 21
Ejemplo 2.1.3. 
 x + y + 2z = 8
(S) 2y + z = 8

z=2
es también un sistema 3 × 3. Aquı́ con algo más de trabajo también se puede deducir
fácilmente el conjunto solución. Para esto basta observar que de abajo hacia arriba cada
ecuación tiene exactamente una incógnita más que la siguiente, por este motivo se dice que
el sistema está “escalerizado”. De la última ecuación se despeja z = 2. Con este valor de z
sustituimos en la segunda ecuación y tenemos 2y+2 = 8 =⇒ 2y = 6 =⇒ y = 3. Finalmente
con los valores de y y z hallados “subimos” a la primera ecuación y sustituyendo se tiene
que x + 3 + 2(2) = 8 =⇒ x = 1. En consecuencia Sol(S) = {(1, 3, 2)}.
Este procedimiento de despejar una incógnita en una ecuación y sustituirla en otra de
arriba se denomina sustitución hacia atrás.
Definición 2.1.1. Sistemas equivalentes.

Diremos que dos sistemas (S) y (S ′ ) son equivalentes cuando sol(S) = sol(S ′ ), es decir,
cuando tienen el mismo conjunto solución.
Observemos que en los ejemplos 2.1.2 y 2.1.3 los conjuntos solución son iguales, por lo que
los sistemas son equivalentes.
Ejemplo 2.1.4. 
 x + y + 2z = 8
(S) x−y+z =0

x+y+z =6
Una estrategia para resolver este sistema, inspirada en los ejemplos anteriores, podrı́a ser
la de sustituir el sistema (S) por otro (S ′ ), equivalente y “escalerizado”, de modo de poder
resolver (S ′ ) (y por ende (S) ya que al ser equivalentes los conjuntos solución de ambos
sistemas coinciden) con el procedimiento utilizado en el ejemplo 2.1.3. Analicemos un poco
estas ideas antes de retomar la resolución concreta del ejemplo.
La pregunta que naturalmente surge es ¿cómo hacer para sustituir un sistema por otro
que resulte equivalente? Para responderla introducimos la siguiente definición.
Definición 2.1.2. Transformaciones elementales.

Llamaremos transformaciones elementales a cualquiera de las siguientes operaciones
efectuadas a las ecuaciones de un sistema lineal:
1. Intercambiar de lugar dos ecuaciones. (Fi ↔ Fj )
2. Multiplicar una ecuación por un número α 6= 0. (αFi )
3. Sumar a una ecuación un múltiplo de otra. (Fi + βFj )
Entre paréntesis se indica la notación que utilizaremos para especificar cada operación en
los ejemplos. La ecuación i-ésima será notada con Fi .
La siguiente proposición responde la pregunta formulada arriba.

Proposición 2.1.1. Si en un sistema lineal de ecuaciones se efectúa una transformación

elemental entonces el sistema resultante es equivalente al original.
La demostración se puede encontrar en el apéndice de este capı́tulo.
Las cuestiones que se imponen ahora son las de saber si cualquier sistema puede ser
“escalerizado” mediante transformaciones elementales y en caso afirmativo determinar un
método o algoritmo que permita hacerlo. Volvamos a analizar el ejemplo 2.1.4.
Ejemplo 2.1.4 (continuación). Para que el sistema quede “escalerizado”, en la segunda y
tercera ecuación no debe aparecer la incógnita x entonces dejemos la primera ecuación igual
y realicemos transformaciones elementales en la segunda y tercera. La idea es combinar
ambas con la primera de modo que los coeficientes de la incógnita x se anulen. Como el
coeficiente de x en las tres ecuaciones es 1 basta en ambos casos restar la primera.
 
 x + y + 2z = 8  x + y + 2z = 8
x−y+z =0 ∼ −2y − z = −8 ←− F2 − F1
 
x+y+z =6 −z = −2 ←− F3 − F1
El sistema está ya “escalerizado”, si multiplicamos las dos últimas ecuaciones por −1 se

obtiene el sistema del ejemplo 2.1.3 por lo cual Sol(S) = {(1, 3, 2)}
2.2. Matriz asociada a un sistema de ecuaciones lineales

Definición 2.2.1. Dado un sistema de ecuaciones lineales

 a11 x1 + a12 x2 + . . . + a1n xn


= b1
 a21 x1 + a22 x2 + . . . + a2n xn = b2
(S) .. ..


 . .

am1 x1 + am2 x2 + . . . + amn xn = bm
llamaremos matriz asociada al sistema a la matriz A, de tamaño m×n, cuyas entradas

son los coeficientes del mismo:
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
 
A= . .. . .. 
 .. . . . . 
am1 am2 . . . amn
Llamaremos matriz ampliada asociada al sistema a la matriz A | b, de tamaño m ×

(n + 1) definida por:
 
a11 a12 ... a1n b1
 a21 a22 ... a2n b2 
 
A|b= . .. .. .. .. 
 .. . . . . 
am1 am2 . . . amn bm
Diremos que dos matrices ampliadas son equivalentes si los respectivos sistemas lo son.
2.3. El método de escalerización 23
Observación 2.2.1. Sistemas de ecuaciones en notación matricial.

Manteniendo la notación de la definición anterior, designemos con X y b a las matrices
columna de las incógnitas y de los términos independientes respectivamente
   
x1 b1

 x2 


 b2 

X= ..  , b= .. 
 .   . 
xn bm
Entonces el sistema se puede escribir: (M ) A.X = b
El sistema (S) y la ecuación matricial (M ) son equivalentes en el siguiente sentido:

 
x1

 x2 

(x1 , x2 , . . . , xn ) es solución de (S) ⇐⇒ X= ..  es solución de (M )
 . 
xn
La ecuación (M ) da lugar a una notación más compacta (matricial) para un sistema de

ecuaciones.
Ejemplo 2.2.1. Consideremos el sistema


 x + y + 2z = 9
(S) 3x + 6y − 5z = 0

2x + 4y − 3z = 1
entonces la matriz del sistema, la matriz de los términos independientes y la matriz am-
pliada son:
     
1 1 2 9 1 1 2 9
A = 3 6 −5 , b =  0  y A|b =  3 6 −5 0 
2 4 −3 1 2 4 −3 1
 
x
El sistema en notación matricial se escribe: A.  y  = b
z
2.3. El método de escalerización

Para aplicar el procedimiento de escalerización del ejemplo 2.1.4 a la matriz ampliada de
un sistema simplemente aplicamos las mismas transformaciones elementales sobre las filas
de esta matriz.
Ejemplo 2.3.1. Intentemos escalerizar el sistema del ejemplo 2.2.1

   
1 1 2 9 1 1 2 9
 3 6 −5 0  ∼  0 3 −11 −27  ←− F2 − 3F1
2 4 −3 1 0 2 −7 −17 ←− F3 − 2F1
 
1 1 2 9
∼  0 3 −11 −27 
1
0 0 3 1 ←− F3 − 23 F2
 
1 1 2 9
∼  0 3 −11 −27 
0 0 1 3 ←− 3F3
Por lo tanto el sistema (S) es equivalente al sistema

 x + y + 2z = 9
3y − 11z = −27

z =3
Ahora podemos proceder a realizar sustitución hacia atrás. De la última ecuación se tiene
z = 3. Con este valor sustituimos en la segunda y tenemos 3y − 33 = −27 =⇒ 3y = 6 =⇒
y = 2. Finalmente sustituyendo en la primera x + 2 + 6 = 9 =⇒ x = 1. En consecuencia
el sistema es compatible determinado y Sol(S) = {(1, 2, 3)}.
Hasta ahora no hemos sido precisos para definir a que le llamamos un sistema o matriz
escalerizada.
Definición 2.3.1. Matriz escalerizada y escalerizada reducida.
Llamaremos matriz escalerizada a una matriz que cumpla las siguientes condiciones
1. Todas las filas, salvo quizás la primera, comienzan con una sucesión de ceros.
2. Cada fila tiene al principio por lo menos un cero más que la fila inmediata superior.
Llamaremos matriz escalerizada reducida a una matriz escalerizada que además cum-
ple las siguientes condiciones:
1. La primera entrada no nula de una fila es 1.
2. La columna correspondiente a la primera entrada no nula de una fila tiene el resto
de las entradas todas nulas.
Diremos que un sistema está escalerizado si su matriz ampliada lo está.
Escalerizar un sistema (o matriz) consiste en encontrar un sistema (matriz) esca-
lerizado equivalente. Si A es una matriz y E es una matriz escalerizada equivalente a A
diremos que E es una forma escalerizada de A.
Ejemplo 2.3.2.
   
2 1 0 1 2 1 0 1
 0 3 2 1   0 0 3 1 
A=
 0
 B= 
0 2 1   0 0 0 2 
0 0 0 4 0 0 0 0
   
1 0 4 0 1 1 0 1 0
 0 1 2 0   0 0 1 2 0 
C=
 0
 D= 
0 0 1   0 0 0 0 1 
0 0 0 0 0 0 0 0 0
Las matrices A y B son escalerizadas mientras que C y D son escalerizadas reducidas.
En el ejemplo 2.2.1 se aprecia que, una vez obtenida la forma escalerizada, el método de
sustitución hacia atrás permite resolver el sistema. Cabe entonces preguntarse el motivo
para introducir la definición de matriz escalerizada reducida. Veamos el siguiente ejemplo.

 2x + 4y + 2z = −2
Ejemplo 2.3.3. Queremos resolver el sistema: (S) x + y + 2z = 0

−x + y − 2z = 2
La matriz ampliada del sistema es:
 
2 4 2 −2
 1 1 2 0 
−1 1 −2 2
Procedamos a escalerizarla, para lo cual, en primer lugar, obtenemos una matriz equiva-
lente, pero con ceros en la segunda y tercera posición de la primera columna. Dejamos la
primera fila fija y la utilizamos como “pivot” para combinar con las otras dos.
   
2 4 2 −2 2 4 2 −2
 1 1 2 0  ∼  0 −1 1 1  ←− F2 − 12 F1
−1 1 −2 2 0 3 −1 1 ←− F3 + 12 F1
Ahora la primera y segunda fila tienen el aspecto adecuado. El segundo paso consiste en
sustituir la tercera fila por otra con dos ceros en los primeros lugares. Para esto combinamos
convenientemente la tercera con la segunda fila.
   
2 4 2 −2 2 4 2 −2
 0 −1 1 1  ∼  0 −1 1 1  (2.1)
0 3 −1 1 0 0 2 4 ←− F3 + 3F2
Nótese que al dar el segundo paso, la primera fila ya no interviene y se procede de manera
análoga al primer paso, pero utilizado la segunda fila como fila “pivot”.
Ahora que obtuvimos una forma escalerizada de la matriz original podrı́amos proceder
con la sustitución hacia atrás, pero en lugar de esto intentemos obtener la forma reducida.
Fijamos la tercera fila como “pivot” y la combinamos con la primera y segunda de modo
que se anulen las entradas de la tercera columna correspondientes a la primera y segunda
fila    
2 4 2 −2 2 4 0 −6 ←− F1 − F3
 0 −1 1 1  ∼  0 −1 0 −1  ←− F2 − 12 F3
0 0 2 4 0 0 2 4
Combinando la segunda fila con la primera obtenemos un cero en la entrada de primera
fila y segunda columna
   
2 4 0 −6 2 0 0 −10 ←− F1 + 4F2
 0 −1 0 −1  ∼  0 −1 0 −1 
0 0 2 4 0 0 2 4
Para llegar a la forma reducida solo resta obtener unos en las entradas no nulas de cada
fila    
2 0 0 −10 1 0 0 −5 ←− 12 F1
 0 −1 0 −1  ∼  0 1 0 1  ←− −F2
0 0 2 4 0 0 1 2 ←− 12 F3
El sistema resultante, equivalente a (S), es entonces

 x = −5
′
(S ) y=1

z=2
Luego, es compatible determinado y Sol(S) = {(−5, 1, 2)}.
Obsérvese que en 2.1 la escalera que se obtuvo tiene todos sus “escalones” de ancho una
columna. Esto implica que en el correspondiente sistema cada ecuación tenga exactamente
una incógnita más que la inmediata inferior.
El proceso de obtener la forma reducida sustituye entonces al algoritmo de sustitución

hacia atrás. Además, el lector puede observar que la forma escalerizada de una matriz no
es única (para obtener otra basta sustituir una fila por una combinación de ella con una
fila inferior), pero la reducida sı́ lo es.

 2x + 4y + 2z = −2
Ejemplo 2.3.4. Queremos resolver el sistema: (S) x + y + 2z = 0 La matriz

−x + y − 4z = 2
ampliada del sistema es:  
2 4 2 −2
 1 1 2 0 
−1 1 −4 2
Procedamos como en el ejemplo anterior
   
2 4 2 −2 2 4 2 −2
 1 1 2 0  ∼  0 −1 1 1  ←− F2 − 12 F1
−1 1 −4 2 0 3 −3 1 ←− F3 + 12 F1
 
2 4 2 −2
∼  0 −1 1 1 
0 0 0 4 ←− F3 + 3F2
A diferencia del ejemplo precedente, la forma escalerizada de la matriz ampliada tiene tres
escalones, esto es, un escalón más que la de la matriz del sistema. La última ecuación del
sistema escalerizado es 0 = 4 y, consecuentemente, el sistema resulta incompatible.
Ejemplo 2.3.5. Procedamos a resolver el sistema:


 x + 2y + 3z = 4
(S) x + 3y + 4z = 5

2x + 5y + 7z = 9
La matriz ampliada del sistema es:

 
1 2 3 4
 1 3 4 5 
2 5 7 9
Se tiene:
   
1 2 3 4 1 2 3 4
 1 3 4 5  ∼  0 1 1 1  ←− F2 − F1
2 5 7 9 0 1 1 1 ←− F3 − 2F1
 
1 2 3 4
∼  0 1 1 1 
0 0 0 0 ←− F3 − F2
Vale la pena observar que, al igual que en el ejemplo 2.3.3, el número de escalones de la
matriz ampliada y el de la matriz del sistema coinciden. Por esta razón el sistema resulta
compatible. Sin embargo, aquı́ la “escalera” presenta “descansos” o escalones largos (el
primero y el segundo). El sistema de ecuaciones asociado es

 x + 2y + 3z = 4
′
(S ) y+z =1

0=0
Despejando y en función de z de la segunda ecuación se obtiene y = 1 − z. Sustituyendo en

la primera y operando resulta x = 2 − z. Cada valor real de z elegido libremente determina
una solución del sistema (S). Por ejemplo, si z = 1, se obtiene la solución (1, 0, 1). Si z = 0
se tiene la solución (2, 1, 0). El sistema es entonces compatible indeterminado y en virtud
de que una de sus incógnitas puede elegirse libremente diremos que tiene un grado de
libertad. El conjunto solución es
Sol(S) = { (2 − z, 1 − z, z) / z ∈ R }
Ejemplo 2.3.6. Hasta ahora hemos visto solamente sistemas de 3 ecuaciones con 3
incógnitas, pero las ideas utilizadas funcionan para cualquier sistema m × n. Veamos
un ejemplo de un sistema de 4 ecuaciones con 3 incógnitas.
  

 x + y − 2z = 3 1 1 −2 3

x + 2y + z = 1  1 2 1 1 
(S) cuya matriz ampliada es:  

 x + y + 3z = 2  1 1 3 2 

x + 2y − 4z = 2 1 2 −4 2
Escalerizando tenemos que la matriz es equivalente a las siguientes:

 
1 1 −2 3
 0
 1 3 −2 
 ←− F2 − F1 intercambiando la tercera fila con la cuarta se obtiene
 0 0 5 −1  ←− F3 − F1
0 1 −2 −1 ←− F4 − F1
   
1 1 −2 3 1 1 −2 3
 0 1 3 −2   0 1 3 −2 
∼  ∼  
 0 1 −2 −1   0 0 −5 1  ←− F3 − F2
0 0 5 −1 0 0 5 −1
 
1 1 −2 3
 0 1 3 −2 
llegando finalmente a  
 0 0 −5 1 
0 0 0 0 ←− F4 + F3
El número de escalones de la matriz ampliada y el de la matriz del sistema coinciden.
Por esta razón el sistema resulta compatible. Mas aún, como el número de escalones
coincide con el número de incógnitas, el sistema es compatible determinado. El sistema de
ecuaciones asociado es entonces


 x + y − 2z = 3

y + 3z = −2
(S ′ )

 −5z = 1

0=0
El valor de z queda determinado z = −1/5 y por sustitución hacia atrás se determinan

los únicos valores de y y x que son: y = −7/5 , x = 4. El conjunto solución del sistema
contiene una sola terna: Sol(S) = {(4, −7/5, −1/5)}.
Otro ejemplo (en este caso de un sistema de cinco ecuaciones con seis incógnitas) puede
encontrarse en el apéndice a este capı́tulo.
Los ejemplos anteriores parecen indicar que cualquier matriz y por ende cualquier sistema
puede ser escalerizado. Establezcamos este hecho en el siguiente resultado (cuya demos-
tración se puede encontrar en el apéndice a este capı́tulo):
Proposición 2.3.1. Toda matriz puede ser transformada en una matriz escalerizada (o
escalerizada reducida) mediante una cantidad finita de transformaciones elementales.
Corolario 2.3.1. Todo sistema lineal es equivalente a uno escalerizado.
2.4. Teorema de Rouche - Frobenius

En las discusiones realizadas de los ejemplos de la sección anterior se aprecia cierta rela-
ción entre el número de escalones de la forma escalerizada y la cantidad de soluciones del
sistema. En esta sección establecemos con precisión esta relación describiendo completa-
mente el conjunto solución de un sistema lineal de ecuaciones en termino de la cantidad
de “escalones” del mismo.
Definición 2.4.1. Número de escalones de una matriz escalerizada.

Si E es una matriz escalerizada el número de escalones de E es la cantidad de filas
no nulas.
Observación 2.4.1. Si E es una matriz escalerizada y E ′ es una matriz reducida equi-

valente entonces el número de escalones de ambas es el mismo.
2.4. Teorema de Rouche - Frobenius 29
Observación 2.4.2. Ya hemos observado que la forma escalonada de una matriz no es

única. Sin embargo, y aunque no lo hemos probado todavı́a, la forma reducida sı́ lo es. De
este hecho y de la observación precedente se deduce que la cantidad de escalones de todas
las formas escalerizadas de una misma matriz coinciden.
Definición 2.4.2. Rango por filas o número de escalones de una matriz.

Si A es una matriz llamaremos número de escalones de A al número de escalones
de cualquiera de sus formas escalerizadas. Este número también se denomina rango por
filas de la matriz y se simboliza rgf (A).
Teorema 2.4.1 (Rouche - Frobenius). Sea (S) un sistema de m ecuaciones lineales con
n incógnitas con matriz ampliada A|b. Si p es el número de escalones de A y p′ el número
de escalones de A|b entonces
1. (S) es compatible si, y solo si, p = p′ .
2. Si (S) es compatible entonces
a) (S) es determinado si, y solo si, p = n.

b) (S) es indeterminado si, y solo si, p < n.
Dicho de otro modo:
1. (S) es compatible si, y solo si, rgf (A) = rgf (A|b) (el rango por filas de A coincide
con el rango por filas de la matriz ampliada).
a) (S) es determinado si, y solo si, rgf (A) = n (el rango por filas de A coincide
con el rango por filas de la matriz ampliada y con el número de columnas de
A).
b) (S) es indeterminado si, y solo si, rgf (A) < n (el rango por filas de A coincide
con el rango por filas de la matriz ampliada pero es menor que el número de
columnas de A).
Observación 2.4.3. Un sistema con más incógnitas que ecuaciones.

Supongamos que tenemos un sistema de m ecuaciones con n incógnitas. Tanto su matriz
asociada como su forma escalerizada serán matrices m × n, es decir, tendrán m filas y
n columnas. Por lo tanto, la cantidad de escalones p de la matriz escalerizada siempre
será menor o igual que m. Supongamos que hay más incógnitas que ecuaciones, o sea
m < n. En este caso resulta que p < n y, por lo tanto, según el teorema de Rouche -
Frobenius, el sistema no puede ser determinado. Conclusión: un sistema lineal con más
incógnitas que ecuaciones solo puede ser incompatible o compatible indeterminado, nunca
compatible determinado.
Ejemplo 2.4.1. Veamos algunos ejemplos en donde se muestra la forma escalerizada de

la matriz ampliada de un sistema y el comportamiento del sistema correspondiente según
el teorema de Rouche-Frobenius.
 
2 1 2 −2 5
 0 −1 1 1 2  rgf (A) = rgf (A|b) = n = 4 =⇒
 
 0 0 2 4 3  sistema compatible determinado.
0 0 0 2 −1
 
1 2 2 −3 1
 0
 1 −1 1 3 
 rgf (A) = rgf (A|b) = 3 < n = 4 =⇒
 0 0 2 1 2  sistema compatible indeterminado.
0 0 0 0 0
 
1 2 2 −3 1
 0
 1 −1 1 3 
 rgf (A) = rgf (A|b) = 2 < n = 4 =⇒
 0 0 0 0 0  sistema compatible indeterminado.
0 0 0 0 0
 
1 2 2 −3 1
 0
 1 −1 1 3 
 rgf (A) = 2 6= rgf (A|b) = 3 =⇒
 0 0 0 0 7  sistema incompatible.
0 0 0 0 0
 
1 2 2 −3 1 7
 0 1 −1 rgf (A) = rgf (A|b) = 3 < n = 5 =⇒
1 3 2 
sistema compatible indeterminado.
0 0 2 1 2 5
Observación 2.4.4. Un sistema homogéneo no es incompatible.

Un sistema con todas las entradas del término independiente nulas se denomina sistema
homogéneo. 

 a11 x1 + a12 x2 + . . . + a1n xn = 0

 a21 x1 + a22 x2 + . . . + a2n xn = 0
(H) .. ..


 . .

am1 x1 + am2 x2 + . . . + amn xn = 0
Se observa que si sustituimos todas las incógnitas por 0 (x1 = 0, . . . , xn = 0) entonces se
verifican todas las ecuaciones. Es decir, (0, 0, . . . , 0) es solución del sistema (H). A esta
solución la llamaremos solución trivial. Tenemos entonces que un sistema homogéneo
nunca es incompatible. Será compatible determinado si solo admite la solución trivial, y
compatible indeterminado si admite soluciones distintas de la trivial (además de la trivial,
claro).
2.5. Sistemas cuadrados, determinantes y Cramer 31
Observación 2.4.5. Más incógnitas que ecuaciones en un sistema homogéneo.

Según la observación 2.4.3 si un sistema tiene más incógnitas que ecuaciones no puede
ser determinado. Luego, todo sistema homogéneo con más incógnitas que ecuaciones es
indeterminado y, por lo tanto, admite soluciones distintas de la trivial.
Ejercicio 2.4.1. Resuelva los siguientes sistemas de ecuaciones:

  
 2x − 2y + z = 1  2x − 2y + z = 1  −x + 5y + 3z = 1
(a) x + y − 4z = 1 (b) x + y − 4z = 1 (c) 2x + y + 5z = 0
  
3x − y − 3z = 2 3x − y − 3z = 4 3x − 2y + 4z = −1

 x + y − 3z = −1
 
 x1 − x2 − x3 + 4x4 = 5 
2x + y − 2z = 1
(d) 2x1 − 3x2 − 4x3 + 9x4 = 13 (e)
  x +y+z =3
2x1 + x2 + 4x3 + 5x4 = 1 

x + 2y − 3z = 1
Ejercicio 2.4.2. En cada uno de los siguientes casos calcule el rango por filas de la matriz
A y concluya el comportamiento del sistema homogéneo A.X = O.
 
    1 1 1
1 1 −2 0 1 −2  1 −2 4 
(a) A =  1 1 −2  (b) A =  1 0 5  (c) A =   2 −1 2 

−3 −3 6 1 −2 3
4 −2 7
Ejercicio 2.4.3. Resuelva los siguientes sistemas discutiendo según el parámetro m ∈ R.
  
 x + y + mz = 1  x + my − z = 2m + 1  mx + y − z = m − 3
(a) x + my + z = 1 (b) x − m2 y − z = m (c) (m + 1)x + (m + 1)z = 3m
  
mx + y + z = −2 mx + my + mz = 1 x + my + z = 0
Ejercicio 2.4.4. Resuelva los siguientes sistemas de ecuaciones:

  x1 + x2 + x3 + 2x4 = 4
 3x1 − x2 − 3x3 − x4 = −2 


  2x1 + x2 + 2x3 + 2x4 = 7

2x1 − 2x2 − 6x3 − 6x4 = −4
(a) (b) x1 + 2x2 + x3 + 4x4 = 5
 2x1 − x2 − 3x3 − 2x4 = −3



 3x1 − 2x2 + 3x3 − 4x4 = 7

3x1 + x2 + 3x3 + 7x4 = 2 

4x1 − 3x2 + 4x3 − 5x4 = 10
2.5. Sistemas cuadrados, determinantes y Cramer

Para los sistemas que tienen la misma cantidad de incógnitas que de ecuaciones (cuadrados)
existen algunos resultados especiales que mencionaremos en esta sección. Comencemos
considerando el caso de un sistema 2 × 2:

ax + by = e a b
con matriz asociada A =
cx + dy = f c d
Si suponemos, para fijar ideas, que a 6= 0, una matriz escalerizada correspondiente a A es:

a b
0 ad − bc ←− (−c)F1 + aF2
Resulta entonces que el sistema es determinado si, y solo si, el número ad − bc es distinto
de cero. Este número se denomina determinante de la matriz A y se simboliza:

a b
det(A) = = ad − bc
c d
Como el lector conoce de cursos anteriores, es posible definir el determinante de una
matriz cuadrada (n × n). Recordemos algunos procedimientos de cálculo. Por ejemplo,
una de las maneras de calcular el determinante de una matriz 3 × 3 es a partir de la regla
de Sarrus:

a11 a12 a13

a21 a22 a23 = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a31 a22 a13 − a21 a12 a33 − a11 a32 a23

a31 a32 a33
Debemos tener presente que la regla de Sarrus es válida solamente para determinantes de
matrices 3 × 3. Otra forma de calcularlo es mediante el “desarrollo por la primera fila”:

a11 a12 a13
a22 a23 a21 a23 a21 a22
a21 a22 a23 = a11 − a12
a31 a33 + a13 a31 a32

a31 a32 a33
a32 a33
También es posible “desarrollarlo” por otras filas o columnas haciendo los cambios corres-
pondientes en cada caso.4 Por ejemplo, el desarrollo del determinante por la segunda fila
es:
a11 a12 a13
a21 a22 a23 = −a21 a12 a13 + a22 a11 a13 − a23 a11 a12

a32 a33 a31 a33 a31 a32
a31 a32 a33
En el caso particular de una matriz triangular (todas las entradas por encima o por debajo
de la diagonal principal son ceros) el resultado es muy simple. En efecto, desarrollándolo
por la primera columna se obtiene:

a11 a12 a13

0 a22 a23 = a11 a22 a33

0 0 a33
Es ası́ que el determinante de una matriz triangular es simplemente el producto de los
elementos que están en la diagonal principal.
Con excepción de la regla de Sarrus, el resto de las consideraciones mencionadas son válidas
también para el determinante de cualquier matriz n × n. Observemos que, por ejemplo,
el cálculo a partir del desarrollo por una fila (o columna) de un determinante 4 × 4 nos
llevarı́a a calcular cuatro determinantes 3 × 3, mientras que el un determinante 5 × 5 a
cinco determinantes 4 × 4. Por suerte, los determinantes tienen una serie de propiedades
que permiten un cálculo más simple y eficiente vinculado nuevamente con un proceso de
escalerización. Repasemos algunas de ellas (en todos los casos nos referiremos a matrices
cuadradas).
4
Recordemos que el desarrollo por una lı́nea (fila o columna) es la suma de los productos de los elementos
de la lı́nea por sus respectivos adjuntos. A su vez, el adjunto asociado a aij es el producto de (−1)i+j por
el subdeterminante de un orden menor que se obtiene al quitar de la matriz original la fila i y la columna
j (que se denomina menor complementario de aij ).
Algunas propiedades de los determinantes.
(1) Si B es una matriz que se obtiene permutando dos filas (o dos columnas) de la matriz
A entonces det(B) = −det(A).
(2) Si B es una matriz que se obtiene multiplicando cada uno de los elementos de una
fila (o columna) de la matriz A por un número k entonces det(B) = k det(A).
(3) Si a una fila (o columna) de una matriz se le suma un múltiplo de otra fila (columna)
entonces su determinante no cambia.
(4) El determinante de una matriz triangular es el producto de los elementos que están
en su diagonal principal.
(5) El determinante de una matriz A y el de su traspuesta At coinciden.
(6) Si una columna (fila) de una matriz A es combinación lineal de otras columnas (filas)
de A entonces det(A) = 0. En particular, si dos filas (o dos columnas) de una matriz
son proporcionales entonces el determinante vale 0.
(7) Si A y B son matrices n × n entonces det(A.B) = det(A) det(B).
Observemos que las transformaciones aplicadas sobre las filas que se mencionan en las tres
primeras propiedades, coinciden con las transformaciones elementales sobre las filas
de una matriz (o sobre las ecuaciones de un sistema) que fueron definidas en 2.1.2. Dichas
transformaciones eran la base del proceso de escalerización de matrices (o sistemas) y
ahora serán utilizadas (conjuntamente con la propiedad (4)), para desarrollar un método
eficiente de cálculo de determinantes por escalerización. Veamos un par de ejemplos.

1 1 1

Ejemplo 2.5.1. Queremos calcular 1 2 −2 . Para ello aplicamos convenientemente
2 1 7
la propiedad (3):

1 1 1 1 1 1

1 2 −2 = 0 1 −3 ←− F2 − F1

2 1 7 0 −1 5 ←− F3 − 2F1

1 1 1

= 0 1 −3 =2
0 0 2 ←− F3 + F2

Al haber llegado al determinante de una matriz triangular, en el último simplemente
multiplicamos los elementos de la diagonal.

4 2 9 1

7 4 5 1
Ejemplo 2.5.2. Queremos calcular . En primer lugar permutamos la
2 5 −3 1
−3 4 2 1
primera columna con la cuarta (utilizando la propiedad (1)), para luego comenzar la
escalerización del determinante obtenido:

4 2 9 1 1 2 9 4 1 2 9 4

0 2 −4 3 ←− F2 − F1
7 4 5 1 1 4 5 7

2 5 −3 1 = − 1 5 −3 = − 0 3 −12 −2 ←− F3 − F1
2
−3 4 2 1 1 4 2 −3 0 2 −7 −7 ←− F4 − F1

1 2 9 4

0 2 −4 3
= −
0 3 −12 −2

0 0 −3 −10 ←− F4 − F2
Ahora, para eliminar el 3 de la segunda columna podrı́amos sumarle a la tercera fila la

segunda multiplicada por −3 2 . En caso de no querer trabajar con fracciones podemos, en
primera instancia, multiplicar la tercera fila por 2. Al hacer esto debemos estar atentos
pues, según la propiedad (2), el nuevo determinante valdrá 2 veces el anterior:

1 2 9 4

1
2 9 4

0 2 −4 3 1 0 2 −4 3
= − = −
0 3 −12 −2
2 0 6 −24 −4 ←− 2F3

0 0 −3 −10 0 0 −3 −10
Continuando la escalerización y luego permutando las dos últimas filas:

1 2 9 4 1 2 9 4

1 0 2 −4
3
1 0 2 −4
3
= − =
2 0 0 −12 −13 ←− F3 − 3F2 2 0 0 −3 −10
0 0 −3 −10 0 0 −12 −13
Finalmente llegamos a:

1 2 9 4

1 0 2 −4 3 1
= = 2 (−3) 27 = −81
2 0 0 −3 −10 2
0 0 0 27 ←− F4 − 4F3
Observación 2.5.1. Determinantes de una matriz y de sus formas  escalerizadas.


4 2 9 1
 7 4 5 1 
Retomemos el ejemplo anterior simbolizando con A a la matriz A =   2 5 −3 1 .

−3 4 2 1
Para obtener una forma escalerizada de A podemos aplicar sobre sus filas las mismas
transformaciones que se realizaron en el ejemplo. Una forma escalerizada de A es enton-
1 2 9 4
 0 2 −4 3 
ces la matriz B =   0 0 −3 −10 . Si bien los determinantes de estas matrices no

0 0 0 27
coinciden, uno es múltiplo no nulo del otro. Según las propiedades (1), (2) y (3), eso ocu-
rrirá siempre que apliquemos sobre las filas de la matriz los tres tipos de transformaciones
elementales. Resulta entonces que si A es una matriz cualquiera n × n, y B es una de sus
formas escalerizadas, entonces existirá m ∈ R, m 6= 0 tal que det(A) = m det(B).
En particular, podemos afirmar que si el determinante de una matriz A vale 0, entonces
también será nulo el determinante de cualquiera de sus formas escalerizadas. Y recı́proca-
mente, si el determinante de alguna de sus formas escalerizadas vale 0, también valdrá 0
el determinante de A.
Lo que ocurrió con el sistema 2 × 2 planteado al comienzo de esta sección admite una
generalización para sistemas cuadrados cualesquiera.
Teorema 2.5.1. Teorema de Cramer.

Sea A una matriz n×n y (S) el sistema de n ecuaciones con n incógnitas dado por A.X = b
(A es la matriz asociada al sistema, X es la matriz columna de las incógnitas y b es la
matriz columna de los términos independientes). Entonces las siguientes afirmaciones son
equivalentes:
1. A es invertible.
2. det(A) 6= 0.
3. (S) es compatible determinado independientemente de b.
Demostración.
(1) =⇒ (2)
Por hipótesis existe A−1 tal que A.A−1 = In . Entonces, aplicando la propiedad (7)
de los determinantes llegamos a

det(A) det A−1 = det (In )
Como det (In ) = 1 obtenemos la siguiente igualdad:

det(A) det A−1 = 1.
Esto implica que det(A) 6= 0. Más aún, podemos despejar y obtener:

1
det A−1 =
det(A)
(2) =⇒ (3)
Para estudiar el comportamiento del sistema (S) consideramos una forma escaleri-
zada de la matriz A. Como A es n × n toda forma escalerizada B de A también
será n × n y tendrá nulas todas sus entradas por debajo de la diagonal principal:
 ′ 
a11 a′12 a′13 . . . . . . a′1n
 0
 a′22 a′23 . . . . . . a′2n 

 ′ .. ′

B= 0  0 a33 . a3n 
 .. .. .. . . . . .. 
 . . . . . . 
0 0 ... ... 0 ′
ann
En principio, B podrı́a tener filas nulas, pues no conocemos su rango por filas. Pero
eso no puede ocurrir. En efecto, como por hipótesis det(A) 6= 0, la observación previa
nos permite asegurar que det(B) 6= 0. Como el determinante de B es el producto de
los elementos de su diagonal principal deducimos que ninguno de ellos puede valer
0 (a′ii 6= 0, ∀ i):  ′ 
a11 a′12 a′13 . . . . . . a′1n
 0
 a′22 a′23 . . . . . . a′2n 

 . 
B=  0 0 a′33 . . ′
a3n 
 .. .. .. .. . . .. 
 . . . . . . 
0 0 ... ... 0 ′
ann
Resulta entonces que el rango por filas de A es n y, por lo tanto, el rango por filas de
A coincide con el rango por filas de la matriz ampliada y con el número de columnas
de A (que es n). Del teorema de Rouche-Frobenius podemos concluir que el sistema
(S) es compatible determinado.
(3) =⇒ (1)
Paso 1: Se demostrará que existe B tal que A.B = In .
Para cada j entre 1 y n designemos con ej a la columna j-ésima de la matriz identidad
In :      
1 0 0
 0   1   0 
     
e1 =  0  , e2 =  0  , . . . , en =  0 
     
 ..   ..   .. 
 .   .   . 
0 0 1
Por hipótesis, los sistemas A.X = e1 , A.X = e2 , . . . , A.X = en son compatibles
determinados. Sean entonces X1 , X2 , . . . , Xn las matrices n × 1 que verifican:
A.X1 = e1 , A.X2 = e2 , . . . . . . , A.Xn = en
Si B es la matriz n × n que tiene como columnas a X1 , X2 , . . . , Xn entonces, de
la definición de producto de matrices (ver Observación 1.1.2), resulta que A.B = In .
Paso 2: Se demostrará que B también cumple B.A = In .
Para ello comenzamos observando que, como 1 = det(In ) = det(A) det(B), el deter-
minante de B no puede ser 0. Aplicando a la matriz B la implicación ( (2) =⇒ (3) )
(ya demostrada) concluimos que el sistema B.X = b es compatible determinado pa-
ra cualquier b. Repitiendo para la matriz B el razonamiento realizado en el Paso 1
para la matriz A, podemos asegurar que existe una matriz C tal que B.C = In . Se
tiene:
C = In .C = (A.B).C = A.(B.C) = A.In = A =⇒ C = A
♠
Observación 2.5.2. Sea A una matriz n × n y (S) el sistema de n ecuaciones con n
incógnitas dado por A.X = b. Del teorema anterior resultan las siguientes observaciones:
1. Si det(A) = 0 entonces el sistema es compatible indeterminado o incompatible (esto
dependerá de b). Ahora bien, si det(A) = 0 y además el sistema es homogéneo,
entonces éste resulta compatible indeterminado.
2. Si det(A) 6= 0 entonces el sistema es compatible determinado independientemente

de b.
3. En el caso en que (S) sea compatible determinado (lo cual, según el teorema de
Cramer, equivale a A invertible) podemos encontrar una fórmula matricial para su
única solución. En efecto:

X̃ es solución de (S) ⇐⇒ A.X̃ = b ⇐⇒ A−1 A.X̃ = A−1 .b ⇐⇒

A−1 .A X̃ = A−1 .b ⇐⇒ In .X̃ = A−1 .b ⇐⇒ X̃ = A−1 .b
Ejemplo 2.5.3. Si bien los sistemas 2 × 2 se resuelven fácilmente por escalerización,

veamos como aplicar la fórmula anterior en esos casos. Supongamos que queremos resolver
el sistema
2x + y = 3
(S)
x + y = −1

2 1
La matriz asociada es A = . Como det(A) = 1 6= 0 el sistema es compatible
1 1

−1 1 −1
determinado y A es invertible. La inversa de A es A = . Luego, la única
−1 2
solución del sistema es:

−1 1 −1 3 4
A .b = =
−1 2 −1 −5
Ejercicio 2.5.1. Calcule los siguientes determinantes:

7 −2 π 1 −2 4
4 5
(a) (b) 2 3 −2 (c) −3 5 2
3 −2
4 6 −4 3 6 −1

2 1
1 1 1 0 1 2 −3 4
1
1 1 −1 1 3 −1 2 4
(d) −1 5 −17 (e) (f )
−8 7 −37 1 0 −1 1 −2 −3 6 −7
−1 1 1 1 1 3 −1 2
Ejercicio 2.5.2. Si A es una matriz n × n tal que A3 = A, ¿cuáles son los posibles valores
para el det(A)?
Ejercicio 2.5.3. Se sabe que A es una matriz 3 × 3 y que det(A) = 5. calcule el determi-
nante de B = 2A2 A−1 .
Ejercicio 2.5.4. Sean A y B dos matrices n × n y k un número real. Investigue si las

siguientes afirmaciones son verdaderas o falsas.
1. det(A + B) = det(A) + det(B)
2. det(kA) = k det(A)
3. det(kA) = kn det(A)
Ejercicio 2.5.5.
1. Sea A una matriz n × n antisimétrica (esto quiere decir que At = −A). Pruebe que
si n es impar entonces det(A) = 0.
2. Una matriz A n×n se dice nilpotente cuando existe algún natural k tal que Ak = O
(matriz nula). Pruebe que el determinante de una matriz nilpotente vale 0.
3. Una matriz A n × n se dice idempotente cuando A2 = A. ¿Qué valores puede tener
el determinante de una matriz idempotente? Construya ejemplos en los que ocurra
los distintos casos.
Ejercicio 2.5.6. Analice (sin resolverlos) si los siguientes sistemas homogéneos son de-
terminados o indeterminados.
  
 x+y−z =0  x + 2y = 0  x + y + kz = 0
(a) x + y + 3z = 0 (b) kx + ky + kz = 0 (c) x − ky + z = 0
  
x + y − 5z = 0 x + 2y + kz = 0 kx + y + z = 0
En los dos últimos se deberá discutir según k ∈ R.
Ejercicio 2.5.7. Sean f y g dos funciones con derivada segunda en un intervalo I. Se

define:

f (t) g(t)
ϕ : I −→ R / ϕ(t) = ′

f (t) g′ (t)

f (t) g(t)
Compruebe que ϕ′ (t) = ′′ , ∀ t ∈ I.
f (t) g′′ (t)
2.6. Cálculo de la inversa de una matriz invertible
La idea utilizada al principio del capı́tulo para resolver un sistema lineal 1×1, funcionó tam-
bién para resolver un sistema lineal n × n con n > 1. La fórmula X = A−1 .b no solo es
análoga a la obtenida en el ejemplo 2.1.1, sino que parece indicar un nuevo procedimiento
para resolver sistemas lineales. Sin embargo hay varios asuntos para aclarar. En primer
lugar todo lo hecho aquı́ se aplica solamente a sistemas cuadrados. En segundo lugar dicha
fórmula es válida solamente bajo la hipótesis de que A sea invertible. Finalmente, cuando
A es invertible, para poder aplicar la fórmula necesitamos saber cómo obtener la matriz
A−1 , inversa de A. A continuación veremos un algoritmo para calcular la matriz inversa.
Como se demostró en el teorema 2.5.1, si A es una matriz n × n y existe B ∈ Mn×n tal que
A.B = In entonces B.A = In y, por lo tanto, B es la inversa de A. Para hallar la inversa
de una matriz A invertible nos bastará entonces con hallar B tal que A.B = In . Esto
es equivalente a resolver n sistemas de ecuaciones con igual matriz asociada y diferentes
términos independientes. En efecto, si indicamos por Cj (B) la columna j-ésima de B y por
2.6. Cálculo de la inversa de una matriz invertible 39
ej la columna j-ésima de In tenemos que
  = I⇐⇒
A.B 
C1 (B) C2 (B) . . . Cn (B) AC1 (B) AC2 (B) . . . ACn (B)
   
   
A.B = A  =  =
   
... ...
 
e1 e2 . . . en
 
 
  = In ⇐⇒
 
...
    ..
b1j 0 .
 ..   ..  ..
 .   .  .
    j
⇐⇒ (Sj ) A b
 jj 
 =  1
 
 = e ←− lugar j (j = 1, 2, ..., n)
 ..   ..  ..
 .   .  .
bnj 0 ..
.
Como los n sistemas S1 , S2 , . . . , Sn tienen la misma matriz A de coeficientes (con diferen-
tes términos independientes), se pueden resolver simultáneamente escalerizando la matriz
( A| I ).

2 1
Ejemplo 2.6.1. Consideremos la matriz A = . Como det(A) = 2 6= 0 resulta
4 3

x11 x12
que A es invertible. Su inversa será la matriz C = tal que A.C = I. Se
x21 x22
tiene:

2 1 x11 x12 2x11 + x21 2x12 + x22 1 0
= =
4 3 x21 x22 4x11 + 3x21 4x12 + 3x22 0 1
Igualando (por columna) se tienen los siguientes sistemas de ecuaciones:

2x11 + x21 = 1 2 1 x11 1
(S1 ) ⇐⇒ =
4x11 + 3x21 = 0 4 3 x21 0

2x12 + x22 = 0 2 1 x12 0
(S2 ) ⇐⇒ =
4x12 + 3x22 = 1 4 3 x22 1
Como para ambos sistemas la matriz A es la matriz de coeficientes, los podemos resolver
simultáneamente

2 1 1 0 2 1 1 0
∼
4 3 0 1 0 1 −2 1 ←− F2 + (−2)F1

2 0 3 −1 ←− F1 − F2
∼
0 1 −2 1

1 0 32 − 12 ←− 12 F1
∼
0 1 −2 1
3

x11 2 x12 − 12
Por lo tanto = y = . Es decir que la inversa de A es
x21 −2 x22 1
3

− 12
A−1 = 2 .
−2 1
Luego de las explicaciones anteriores podemos describir el método de la siguiente forma.

Para calcular la inversa de la matriz A de tamaño n × n, escalerizamos hasta llegar a
la forma escalerizada reducida de A realizando las mismas operaciones en todas las filas
de ( A| I ). Cuando finalmente lleguemos a ( I| B ) tendremos que A−1 = B. Veamos un
ejemplo en donde aplicamos directamente este método.
 
−1 1 1
Ejemplo 2.6.2. Hallemos la inversa de A =  1 −1 1  (verifique que su deter-
1 1 −1
minante es 6= 0). Se tiene:
   
−1 1 1 1 0 0 −1 1 1 1 0 0
 1 −1 1 0 1 0  ∼  0 0 2 1 1 0  ←− F2 + F1
1 1 −1 0 0 1 0 2 0 1 0 1 ←− F3 + F1
 
−1 1 1 1 0 0
∼  0 2 0 1 0 1 
0 0 2 1 1 0
 
2 −2 0 −1 0 0 ←− F3 − 2F1
∼  0 2 0 1 0 1 
0 0 2 1 1 0
 
2 0 0 0 1 1 ←− F1 + F2
∼  0 2 0 1 0 1

0 0 2 1 1 0
 
1 0 0 0 12 12
∼  0 1 0 12 0 12 
0 0 1 12 12 0
Resulta entonces que  
1 1
0 2 2
A−1 =  1
2 0 1
2

1 1
2 2 0
Ejercicio 2.6.1. Investigue si las siguientes matrices son invertibles y, en caso afirmativo,
encuentre la matriz inversa.
     
1 1 1 1 −2 4 1 0 1
A= 1 1 −1  B =  −1 3 −7  C = 2 1 0 
1 −1 1 2 1 −7 1 0 0
 
  1 1 1 0
2 3 3  1 1 −1 1 
D= 1 2 0  E=  1 0 −1 1 

0 1 3
−1 1 1 1
2.7. Apéndice de esta sección 41
2.7. Apéndice de esta sección

Ejemplo 2.7.1. Otro ejemplo de resolución de un sistema de ecuaciones lineales


 x1 + 2x2 + x3 + x5 + x6 = 1

 −x1 − 2x2 + x3 + x4 − x6 = 0

(S) x1 + 2x2 + 3x3 − x4 − 2x5 − x6 = 2

 x + 2x2 + 3x3 + x4 + 2x5 − x6 = 0
 1


x1 + 2x2 + x3 + 4x4 + 9x5 + 3x6 = 1
La matriz del sistema ampliada es:
 
1 2 1 0 1 1 1
 −1 −2 1 1 0 −1 0 
 
 1
 2 3 −1 −2 −1 2 

 1 2 3 1 2 −1 0 
1 2 1 4 9 3 1
Como antes, el proceso comienza fijando la primera fila como “pivot” y utilizando su
primera entrada para lograr anular el resto de la primera columna.
 
1 2 1 0 1 1 1
 −1 −2 1 1 0 −1 0 
 
 1
 2 3 −1 −2 −1 2  ∼
 1 2 3 1 2 −1 0 
1 2 1 4 9 3 1
 
1 2 1 0 1 1 1
 0 0 2
 1 1 0 1 
 ←− F2 + F1
∼  0 0 2 −1 −3 −2
 1 
 ←− F3 − F1
 0 0 2 1 1 −2 −1  ←− F4 − F1
0 0 0 4 8 2 0 ←− F5 − F1
En los ejemplos anteriores, en el segundo paso se utilizaba la entrada ubicada en la segunda
fila y segunda columna para conseguir ceros en el resto de la columna. Aquı́ esto no es
posible pues la segunda columna ya tiene todas sus entradas (salvo la primera) nulas.
Utilizamos entonces la entrada ubicada en la segunda fila y tercera columna para generar
ceros en el resto de la columna tres.
 
1 2 1 0 1 1 1

 0 0 2 1 1 0 1 


 0 0 2 −1 −3 −2 1 ∼

 0 0 2 1 1 −2 −1 
0 0 0 4 8 2 0
 
1 2 1 0 1 1 1

 0 0 2 1 1 0 1 

∼
 0 0 0 −2 −4 −2 0  ←− F3 − F2
 (2.2)
 0 0 0 0 0 −2 −2  ←− F4 − F2
0 0 0 4 8 2 0 ←− F5
En el tercer paso escalerizaremos la columna siguiente (la cuarta)

   
1 2 1 0 1 1 1 1 2 1 0 1 1 1

 0 0 2 1 1 0 1  
  0 0 2 1 1 0 1 


 0 0 0 −2 −4 −2 0 ∼
  0 0 0 −2 −4 −2 0 

 0 0 0 0 0 −2 −2   0 0 0 0 0 −2 −2 
0 0 0 4 8 2 0 0 0 0 0 0 0 0 ←− F5 + 2F3
Ya tenemos la forma escalerizada, pero como en el ejemplo 2.3.3 continuemos hasta obtener
la forma reducida
 
1 2 1 0 1 1 1

 0 0 2 1 1 0 1 


 0 0 0 −2 −4 −2 0 ∼

 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0
 
1 2 1 0 1 0 0 ←− F1 + 12 F4
 0 0 2 1 1 0 1 


∼
 0 0 0 −2 −4 0  ←− F3 − F4 ∼
2 
 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0
 
1 2 1 0 1 0 0
1
 0 0 2
 0 −1 0 2   ←− F2 + 2 F3
 0 0 0 −2 −4
∼ 0 2   ∼
 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0
 3 
1 2 0 0 2 0 −1 ←− F1 − 12 F2

 0 0 2 0 −1 0 2 

∼
 0 0 0 −2 −4 0 2 
 ∼
 0 0 0 0 0 −2 −2 
0 0 0 0 0 0 0
 3 
1 2 0 0 2 0 −1
 0 0 1 0 −1 1
 2 0  ←− 2 F12
1 
∼
 0 0 0 1 2 0 −1 
 ←− − 21 F3 (2.3)
 0 0 0 0 0 1 1  ←− − 2 F4
0 0 0 0 0 0 0
El sistema de ecuaciones asociado queda entonces



 x1 + 2x2 + 32 x5 = −1
x3 − 12 x5 = 1

(S ′ )

 x4 + 2x5 = −1

x6 = 1
Despejando se tiene 

 x1 = −2x2 − 32 x5 − 1
= 12 x5 + 1

x3
x = −2x5 − 1
 4


x6 =1
Las incógnitas x2 y x5 no pueden determinarse, las otras se obtienen como función de ellas.
Cada valor real de x2 y x5 (elegidos libremente) determina una solución del sistema (S). Por
ejemplo, si x2 = 1 y x5 = 0 se obtiene la solución (−3, 1, 1, −1, 0, 1). Si x2 = −1 y x5 = 2
se tiene la solución (−2, −1, 2, −5, 2, 1). El sistema es entonces compatible indeterminado
y en virtud de que dos de sus incógnitas pueden elegirse libremente diremos que tiene dos
grados de libertad. El conjunto solución es

3 1
Sol(S) = −2x2 − x5 − 1, x2 , x5 + 1, −2x5 − 1, x5 , 1 , x2 ∈ R, x5 ∈ R
2 2
Demostración de la Proposición 2.1.1:

Si en un sistema lineal de ecuaciones se efectúan una transformación elemental el sistema
resultante es equivalente al original.
Demostración. La demostración es muy sencilla y la haremos solamente en el caso que

la transformación elemental sea del tipo 3. El resto queda a cargo del lector.
Supongamos que el sistema original sea


 a11 x1 + a12 x2 + · · · + a1n xn = b1


 ..


 .

 ai1 x1 + ai2 x2 + · · · + ain xn = bi


(S) ..
 .



 aj1 x1 + aj2 x2 + · · · + ajn xn = bj


 ..


 .

am1 x1 + am2 x2 + · · · + amn xn = bm
Supongamos que sumamos a la ecuación i un múltiplo de la ecuación j. El sistema resul-

tante es


 a11 x1 + a12 x2 + · · · + a1n xn = b1


 ..


 .

 (ai1 x1 + ai2 x2 + · · · + ain xn ) + β(aj1 x1 + aj2 x2 + · · · + ajn xn ) = bi + βbj


(S ′ ) ..
 .



 a x
j1 1 + a x
j2 2 + · · · + ajn xn = bj


 .
..




am1 x1 + am2 x2 + · · · + amn xn = bm
Para probar que ambos son equivalentes deberemos ver que Sol(S) = Sol(S ′ ). Como se
trata de mostrar la igualdad de dos conjuntos tendremos que demostrar que están mutua-
mente incluidos.
Veamos primero que Sol(S) ⊂ Sol(S ′ ). Sea (α1 , α2 , · · · , αn ) ∈ Sol(S) es claro que (α1 , α2 , · · · , αn )
satisface todas las ecuaciones de (S ′ ) (pues son las mismas que las de (S)) salvo tal vez
la i-esima. Como (α1 , α2 , · · · , αn ) debe verificar la i-esima y j-esima ecuación de (S) se
tiene que
ai1 α1 + ai2 α2 + · · · + αin xn = bi y aj1 α1 + aj2 α2 + · · · + ajn αn = bj
por lo tanto
(ai1 α1 + ai2 α2 + · · · + ain αn ) + β(aj1 α1 + aj2 α2 + · · · + ajn αn ) = bi + βbj
de donde (α1 , α2 , . . . , αn ) ∈ Sol(S ′ ).

Finalmente probemos que Sol(S ′ ) ⊂ Sol(S). Consideremos ahora
(α1 , α2 , . . . , αn ) ∈ Sol(S ′ ).
Igual que antes es claro (α1 , α2 , . . . , αn ) debe verificar todas las ecuaciones de (S) salvo
tal vez la i-esima pero como
(ai1 α1 + ai2 α2 + · · · + ain αn ) + β(aj1 α1 + aj2 α2 + · · · + ajn αn ) = bi + βbj
y
aj1 α1 + aj2 α2 + · · · + ajn αn = bj
se deduce que
ai1 α1 + ai2 α2 + · · · + ain αn = bi
con lo cual (α1 , α2 , . . . , αn ) ∈ Sol(S) y la prueba esta concluida. ♠
Demostración de la Proposición 2.3.1:

Toda matriz puede ser transformada en una matriz escalerizada (o escalerizada reducida)
mediante una cantidad finita de transformaciones elementales.
Demostración. La prueba es algorı́tmica.5 Indicaremos esquemáticamente el procedi-

miento, los detalles quedan a cargo del lector.
Sea A = ((aij )) una matriz m × n cualquiera. En el desarrollo que sigue a continuación
cambiaremos la notación habitual pasando a simbolizar con Ai = (ai1 , ai2 , . . . , ain ) a la
fila i-ésima de la matriz A.
El objetivo del primer paso es obtener una matriz con una primera columna que tenga
nulas todas sus entradas excepto la primera. Si toda la primera columna es nula se pasa
a la segunda y ası́ sucesivamente hasta tener una primera columna con alguna entrada
distinta de cero. La idea para anular el resto de las entradas de la columna es ubicar la
entrada no nula (a la que llamaremos pivot) en la primera fila y utilizar esta para com-
binar convenientemente con cada fila a los efectos de lograr ceros en todas las posiciones.
Para simplificar la notación aquı́ supondremos que ya la primera columna tiene alguna en-
trada no nula. Con la suposición indicada comenzamos reconociendo si a11 6= 0. Si a11 = 0
5
Un algoritmo es, groseramente hablando, un conjunto de acciones expresadas en un lenguaje formal y
sin ambigüedades que pueden ser comprendidos y ejecutados por una persona o una máquina.
Este algoritmo es conocido con el nombre de Método de Gauss.
cambiamos la primera fila por otra cuya primera entrada sea no nula.6 Una vez que el
pivot esta ubicado realizamos el primer paso de la escalerización:
   
A1 A1
 A2   A′  ←− A2 − a21 A1
   2  a11
 .. ..   .. ..  ..
 .
 . ∼ .
  . 
 .
 Ai   A′  ←− Ai − ai1 A1
   i  a11
 .. ..   .. ..  ..
 . .   . .  .
Am A′m ←− Am − aam111
A1
La matriz que obtuvimos tiene el siguiente aspecto:

 
a11 a12 . . . a1n
 0
 a′22 . . . a′2n 

 .. .. . . .. 
 . . . . 
0 a′m2 . . . a′mn
En el segundo paso el objetivo es obtener una nueva matriz que tenga las entradas de
la segunda columna todas nulas salvo tal vez las dos primeras. Para eso repetimos el
procedimiento del paso uno a la sub-matriz que aparece recuadrada.
De nuevo el primer paso es determinar el segundo pivot para esto chequeamos que a′22 6= 0
de lo contrario cambiamos la segunda fila por otra (de abajo) con segunda entrada no
nula. Podrı́a ocurrir que todas las entradas de la segunda fila fuesen nulas en ese caso la
segunda columna ya tiene el aspecto adecuado por lo cual el procedimiento se continúa
ubicando un pivot en al posición 2, 3 (ver (2.2) en el ejemplo 2.7.1). Supongamos, para
fijar ideas, que a′22 6= 0 entonces el segundo paso de la escalerización es:
   
A1 A1

 A′2  
  A′2 

 A′3   A′′3  ←− A′3 − a32 A′2
    a22
 .. ..   .. ..  ..

 . . ∼
  . . 
 .
 A′i   A′′i  ←− A′ − ai2 A′
    i a22 2
 .. ..   .. ..  ..
 . .   . .  .
A′m A′′m ←− A′m − aam222
A′2
La matriz obtenida en el paso dos tiene entonces el aspecto:

 
a11 a12 a13 . . . a1n
 0
 a′22 a′23 . . . a′2n 
 0
 0 a′′33 . . . a′′3n 

 .. .. .. .. .. 
 . . . . . 
0 0 a′′m3 . . . a′′mn
6
Por razones numéricas y para evitar errores de redondeo al resolver sistemas con ayuda de la compu-
tadora resulta muchas veces importante, aún cuando a11 6= 0 cambiar la primera fila por la fila que tenga
la primera entrada mayor, este procedimiento se conoce como pivoteo.
Repetimos nuevamente los pasos previos aplicados a la sub-matriz del recuadro. El proce-
dimiento culmina cuando se llega a la última fila o columna.
Para obtener la matriz escalerizada reducida a partir de la escalerizada, basta con repetir
el procedimiento pero tomando como pivots la entrada que ocupa el lugar inferior derecho
de la matriz y yendo hacia arriba. ♠
Demostración del teorema de Rouche - Frobenius.

Sea (S) un sistema lineal de m ecuaciones con n incógnitas con matriz ampliada A|b. Sea
p el número de escalones de A y p′ el número de escalones de A|b entonces
1. (S) es compatible si y solo si p = p′
a) (S) es determinado si y solo si p = n.

b) (S) es indeterminado si y solo si p < n.
Demostración. Comencemos probando los recı́procos de las tres afirmaciones. Observe-

mos en primer lugar que como A tiene n columnas y cada escalón ocupa por lo menos una
columna deducimos que para cualquier sistemas se cumple que
p≤n (2.4)
Supongamos que p = p′ . De (2.4) se deduce que hay dos posibilidades p′ = p = n o

p′ = p < n. Analicemos el primer caso. La forma reducida debe tener tantos escalones
como columnas por lo tanto debe ser:
 
1 0 0 ... ... 0 c1
 0 1 0 ... ... 0 c2 
 
 .. .. .. 
 0 0 1
 . . . 

 .. .. . . . . . . .. .. 
 . .
 . . . . . 

 .. .. . .. 1 .
0 ..

 . . 
 
 0 0 ... ... 0 1 cn 
0 0 ... ... 0 0 0
Donde la columna de entradas ci representa el termino independiente luego de efectuado

el proceso de escalerización. El sistema correspondiente es


 x1 = c1

 x2 = c2
.. ..


 . .

xn = cn
el cual es compatible determinado.
Veamos ahora el segundo caso, p′ = p < n. Como la forma escalerizada tiene más columnas
que escalones necesariamente algún escalón debe tener “descanso” y por lo tanto la forma
reducida debe ser
 
1 0 ⋆ ... ⋆ 0 ... 0 0⋆ ... ⋆ 0 . . . 0 c1

 0 1 ⋆ ... ⋆ 0 ... 0 0⋆ ... ⋆ 0 . . . 0 c2 

.. . .. .. . . . .
. . . .. . . . .. ... . . .. ..
 

 . 0 ... ... 0 1 . . 

.. .. . .. .. .. .. . . . .
. . . .. . . . .. ... . . .. ..
 
 . . ... . . 0 . . 
 
.. .. .. .. . . . . .
0 .. . . . .. ... . . .. ..
 
 . . ... ... . ... . 1 
 .. .. .. . 
1 ⋆ . . . ⋆ 0 . . . .. cs
 
 . . ... ... . ... ... 0 
 . . . 
. . . .. . . . . . . .. 0 0 . . . 0 1 . . . .. cs+1
 
 0 0 ... 
 .. .. . . .. .. . . .. . 
. . . .. . . . . . . .. . . . . . .. .. . 0 ..
 
 . . ... 
 . 

 0 0 ... ... 0 ... . . . . . . .. 0 . . . 0 0 . . . 1 cp 

 . 

 0 0 ... ... 0 ... . . . . . . .. 0 . . . 0 0 . . . 0 0 

 .. .. .. .. .. . .. .. . . . . 

 . . . . . ... . . . .. . . . . . .. .. . . . .. .. 

.
0 0 ... ... 0 ... . . . . . . .. 0 . . . 0 0 . . . 0 0
donde las zonas de estrellas representan submatrices con entradas arbitrarias.
Para analizar la solución de este sistema intentemos aplicar el algoritmo de sustitución
hacia atrás. Supongamos que s es la primera fila (comenzando desde abajo) con descanso
(escalón de ancho mayor que una columna). Las ecuaciones s + 1, s + 2, . . . , p son entonces
xs+1 = cs+1
xs+2 = cs+2
..
.
xp = cp
la ecuación s es
xh + as h+1 xh+1 + . . . + ass xs = cs
despejando se tiene
xh = cs − (as h+1 xh+1 + . . . + ass xs )
La incógnita xh no puede entonces determinarse sino en función de los valores de xh+1 , . . . , xs .

Fijemos valores arbitrarios para estas últimas s − h incógnitas, xh quedará determinado y
con estos valores podemos ahora sustituir en las ecuación s−1, . . . , 1 y continuar el proceso
de sustitución hacia atrás. Esto demuestra que el sistema es compatible, pues hay solucio-
nes pero si cambiamos la elección hecha para los valores de xh+1 , . . . , xs se obtiene otro
valor para xh y consecuentemente otra solución con lo cual el sistema resulta compatible
indeterminado. De hecho como las variables xh+1 , . . . , xs se pueden elegir arbitrariamente
se obtienen infinitas soluciones. Obsérvese que estas elecciones arbitrarias se pueden ha-
cer sólo en los descansos y que el número de variables que pueden elegirse libremente es
n − p (la suma de los anchos de los descansos es igual al número de columnas menos el de
escalones).
Demostremos ahora que si (S) compatible entonces p′ = p. Para probarlo demostraremos
su contra recı́proco7 y para esto basta con ver que p < p′ implica (S) incompatible pues
en cualquier sistema A|b tiene una columna más que A y por lo tanto se cumple que p ≤ p′
Si p < p′ , la última columna de la forma reducida de la matriz ampliada debe tener un
escalón por lo tanto la forma es:
 
1 0 ⋆ ... ⋆ 0 ... 0 ⋆ ⋆ 0
 0 1 ⋆ ... ⋆ 0 ... 0 ⋆ ⋆ 0 
 
 0 0 0 ... 0 1 ... 0 ⋆ ⋆ 0 
 
 .. .. .. . . . .. .. .. .. 
 . . . . . . .. . . . . . 
 
 0 0 0 ... 0 0 ... 1 ⋆ ⋆ 0 
 
 0 0 0 ... 0 0 ... 0 0 0 1 
0 0 0 ... 0 0 ... 0 0 0 0
En consecuencia la ultima ecuación del sistema es
0=1
de donde resulta que (S) debe ser incompatible.

Si S es compatible determinado debe ser p = n pues si p < n ya hemos visto que (S)
resultarı́a indeterminado.
De manera análoga se razona para probar que S compatible indeterminado implica p < n.
♠
7
Recordemos que un resultado de lógica elemental establece que (A ⇒ B) si, y solo si, (negación de B ⇒
negación de A).
Capı́tulo 3
El espacio vectorial Rn
En diversos problemas de Economı́a, Administración y Ciencias Sociales (además, claro

está, de otras áreas cientı́ficas), aparecen relaciones que expresan la variación de ciertas
magnitudes en función de otras. Consideremos, por ejemplo, el caso de una empresa que
produce y vende un solo tipo de artı́culo. En este contexto se denomina demanda a la
cantidad de artı́culos que los consumidores están dispuestos a comprar. Es claro que di-
cha demanda dependerá del precio p que se le fije al artı́culo y, por lo tanto, puede ser
considerada como una función D : [0, +∞) −→ R / p 7−→ D(p). Para comprender el com-
portamiento de este tipo de funciones el lector a estudiado (desde educación secundaria)
diversos conceptos y técnicas de cálculo, ası́ como también las propiedades fundamentales
del conjunto R de los números reales.
Si bien en este modelo simplificado se supone que la función depende de una sola variable,
parece bastante razonable pensar que pueda depender de varias. De hecho, en microeco-
nomı́a se supone que la demanda de un bien depende, no solamente del precio del mismo
bien, sino también de los precios de los bienes sustitutos y del ingreso del consumidor.
En este caso la demanda serı́a una función de tres variables y, aparentemente, el nue-
vo modelo permitirı́a una descripción más adecuada de la realidad. No debe sorprender
entonces que uno de nuestros próximos objetivos sea el de estudiar funciones de varias
variables. La usual notación f (x) será cambiada por f (x, y) y f (x, y, z) para funciones de
dos y tres variables respectivamente. Como la cantidad de estas no es siempre la misma
(dependerá del problema a considerar), conviene realizar una teorı́a general, en donde la
función dependa de una cantidad arbitraria, digamos n, de variables. En ese caso escribi-
remos f (x1 , x2 , . . . , xn ). Observemos que cada punto del dominio de esta función ya no
es un número real sino una lista ordenada de n números reales: (x1 , x2 , . . . , xn ).
Si bien cada lista (x1 , x2 , . . . , xn ) es simplemente una matriz, un estudio más profundo
del conjunto de tales listas permitirá desarrollar una teorı́a de enorme riqueza dentro de
la Matemática y de suma importancia por sus diversas aplicaciones.
50 Capı́tulo 3. El espacio vectorial Rn
3.1. El espacio vectorial R2

Definición 3.1.1. El conjunto R2 .
Designaremos con R2 al conjunto de todos los pares ordenados de números reales o, de
manera equivalente, a todas las matrices columna de tamaño 2 × 1:

2 x1
R = / x1 , x2 ∈ R
x2
La interpretación geométrica de este conjunto es por demás conocida. En efecto, una vez
fijado un sistema de coordenadas cartesianas en el plano, queda establecida una corres-
pondencia biunı́voca entre los puntos del plano
y los pares ordenados de números reales.
x1
A cada par ordenado de números le corresponde un único punto p del plano
x2
y, recı́procamente, cada punto del plano es correspondiente de un único par de números
reales.
y y

x1
p= x1
x2 p=
x2 x2 x2
o x1 x o x1 x

0
También podemos considerar el “vector” con origen en o = y extremo en p e ima-
0

x1
ginar el par como el vector −
→ Es ası́ que, de manera dual, podemos interpretar
op.
x2
R2 como el conjunto de puntos del plano, o como el conjunto de vectores del plano que
tienen origen en o.
Por este motivo a los elementos de R2 los denominaremos (indistintamente) puntos o

vectores, mientras que a los números reales los llamaremos escalares.
3.1.1. Suma de vectores y producto de un número por un vector

Definición
3.1.2.
Suma de vectores.

x1 2 y1
Si x = ∈R ey= ∈ R2 entonces la suma x + y es el vector definido por
x2 y2

x1 + y 1
x+y = ∈ R2 .
x2 + y 2
3.1. El espacio vectorial R2 51
Dicho de otro modo, el vector x + y se obtiene sumando componente a componente. Ob-

servemos que esta definición coincide con la de suma de matrices (en este caso, de matrices
2 × 1) y, por lo tanto, esta operación tendrá las mismas propiedades que las conocidas para
la suma de matrices.

0
Al vector o = lo llamaremos vector nulo. Asimismo, dado un vector cualquiera
0

x1
x= designaremos con −x al vector cuyas componentes son, respectivamente, las
x2

−x1
opuestas de las de x, es decir: −x =
−x2
Proposición 3.1.1. Propiedades básicas de la suma de vectores.
(S1) Asociativa: (u + v) + w = u + (v + w) , ∀ u, v, w ∈ R2 .
(S2) Conmutativa: u + v = v + u , ∀ u, v ∈ R2 .
(S3) Existencia de neutro: Existe o ∈ R2 tal que o + u = u , ∀ u ∈ R2 .
(S4) Existencia de opuesto: Para cada u ∈ R2 existe −u ∈ R2 tal que u + (−u) = o.
Observación 3.1.1.
(1) Como mencionamos anteriormente, se trata de las propiedades de la suma de matrices
y, por lo tanto, no es necesario demostrarlas. De todos modos, en caso de querer hacerlo, la
prueba es muy simple ya que alcanza con utilizar las propiedades de la suma de números
reales.
(2) Como ya lo sabemos para matrices, el neutro de la suma es único y el opuesto de cada
vector también es único.
(3) Dados dos vectores u, v ∈ R2 , la resta u − v se define como la suma de u mas el
opuesto de v: u − v = u + (−v).
Definición 3.1.3.
Producto
de un número por un vector.
x1
Si λ ∈ R y x = ∈ R2 entonces el producto λx del número λ por x es el vector
x2

λx1
definido por λx = ∈ R2 .
λx2
Dicho de otro modo, el vector λx se obtiene multiplicando por λ a cada componente de
x. Observemos que esta definición coincide con la de producto de un número por una
matriz (en este caso, de matrices 2 × 1) y, por lo tanto, esta operación tendrá las mismas
propiedades que las conocidas para matrices.
Proposición 3.1.2. Propiedades básicas del producto de un número por un

vector.
(P1) Asociativa: (αβ)u = α(βu) , ∀ u ∈ R2 , ∀ α, β ∈ R.
(P2) Existencia de neutro real: 1 u = u , ∀ u ∈ R2 .
(P3) Distributiva respecto de la suma de números: (α + β)u = αu + βu ,
∀ u ∈ R2 , ∀ α, β ∈ R.
(P4) Distributiva respecto de la suma de vectores: α(u + v) = αu + αv ,
∀ u, v ∈ R2 , ∀ α ∈ R.
Definición 3.1.4. Vectores colineales.

Sean u, v ∈ R2 . Diremos que u y v son colineales cuando uno es múltiplo del otro, es
decir, si existe α ∈ R tal que v = αu, o si existe β ∈ R tal que u = βv.

3 6 3
Por ejemplo, los vectores y son colineales, mientras que y
−1 −2 −1

6
no lo son.
7
Sea z un vector cualquiera de R2 y o el vector nulo de R2 . Como o = 0 z, podemos decir
que o es colineal con cualquier otro vector z ∈ R2 .
Observación 3.1.2. Interpretación geométrica del producto de un número por
un vector.

a λa
Si u = y λ ∈ R entonces λu = . El hecho de que las componentes de λu
b λb
son proporcionales a las de u implica que los puntos o, u y λu están alineados (o sea,
están sobre una misma recta).
λu
λb
u
b
o a λa
Vale la pena observar, además, que:

Si λ > 0 entonces el punto λu está en la semirrecta de origen o que contiene a
u. En particular, si λ > 1 entonces λu no pertenece al segmento de extremos o,
u (el vector λu tiene el mismo sentido u pero “longitud” mayor), mientras que si
0 < λ < 1 entonces λu pertenece al segmento de extremos o, u (el vector λu tiene
el mismo sentido u pero “longitud” menor).
Si λ < 0 entonces λu está en la semirrecta de origen o que no contiene a u.
u
0<λ<1 u
λ<0
λu o
λu
o
Observación 3.1.3. Interpretación geométrica de la suma y la resta de vectores.

2 a c
Consideremos dos vectores no nulos de R : u = , v = . El vector suma
b d

a+c
resulta ser u + v = . Veamos cómo podemos obtener geométricamente dicho
b+d
vector u + v (ver próxima figura). A partir de consideraciones geométricas relativamente
sencillas se deduce que el cuadrilátero cuyos vértices son los puntos o, u, v y u + v es un
paralelogramo, y que el vector u + v es una de las diagonales del mismo.
u+v
b+d
b
u
d
v
o a c a+c
Para hallar geométricamente la suma de u mas v procedemos entonces de la siguiente

manera: construimos el paralelogramo con esos vectores como lados y el vector u + v
resultará ser la diagonal (con origen en o) del paralelogramo. A este procedimiento le
llamaremos regla del paralelogramo. De hecho, la interpretación la hemos realizado
en el caso en que u y v no son colineales. Queda como ejercicio para el lector realizar la
correspondiente interpretación geométrica en el caso en que los dos vectores sean colineales.
Ahora bien, la resta u−v coincide con la suma de u más el opuesto de v. La interpretación
geométrica de la resta de vectores se visualiza en la siguiente figura.
u+v u+v
u−v u−v
u u
v v
o o
−v −v
3.1.2. Rectas en R2
Recta que pasa por un punto y es paralela a un vector.
Como el lector conoce de cursos anteriores, existen varias maneras de determinar una recta
en el plano. Por ejemplo, si damos un punto p y un vector no nulo v, entonces hay una
única recta L que pasa por p y es paralela al vector v.
L
p
¿Cómo podemos describir analı́ticamente los puntos de dicha recta L?

En la siguiente figura se observa (a partir de la regla del paralelogramo) que para cada
real λ el punto p + λv pertenece a L.
p + λv
L
λv
v
Recı́procamente, para cada punto x ∈ L existirá algún λ ∈ R tal que x = p + λv. Tenemos
entonces que la recta L coincide con el siguiente conjunto de puntos:
L = { p + λv / λ ∈ R }
Llamaremos ecuación paramétrica vectorial de la recta que pasa por p y es paralela

a v a la ecuación:
x = p + λv , λ ∈ R.
Para cada valor del parámetro λ obtenemos un punto de la recta y, recı́procamente, todo
punto de la recta se obtiene de esa forma para algún valor de λ. Observemos, en particular,
que para λ = 0 se obtiene el punto p.

p1 v1 x
Si p = , v= y x= entonces, igualando componente a compo-
p2 v2 y
nente en la ecuación paramétrica vectorial de la recta obtenemos:

x = p1 + λv1
, λ ∈ R.
y = p2 + λv2
que se denominan ecuaciones paramétricas de la recta.

Ejemplo
3.1.1. Busquemos las ecuaciones
paramétricas de la recta L que pasa por p =
2 1
y es paralela al vector v = . Simplemente hay que sustituir en la ecuación
1 1
anterior obteniendo:
x = 2+λ
(L) , λ ∈ R.
y = 1+λ
v
1 p
o 1 2
Está claro que se trata de la recta que pasa por p y tiene coeficiente angular 1. Si despe-
jamos λ en la primera ecuación obtenemos λ = x − 2. Sustituyendo en la segunda queda
y = x− 1, que es la ecuación reducida de esta recta. Esto quiere decir que un punto
x
pertenece a la recta L si, y solo si, sus componentes verifican la ecuación y = x − 1.
y
Recta que pasa por dos puntos

Sean p y q dos puntos diferentes. Hay una única recta que pasa por ambos puntos. Ob-
servemos que dicha recta es la misma que pasa por p y es paralela al vector q − p.
La ecuación paramétrica vectorial de la recta S que pasa por p y q es entonces:
x = p + λ(q − p) , λ ∈ R.
q−p
Observemos, en particular, que para λ = 0 se obtiene el punto p y que para λ = 1 se

obtiene el punto q.
Las ecuaciones paramétricas permiten describir con cierta comodidad algunos subconjun-
tos particulares de la recta. Por ejemplo, si permitimos que el parámetro λ varı́e solamente
en los reales positivos entonces la expresión:
x = p + λ(q − p) , λ > 0.
representa la semirrecta (abierta) con origen en p que contiene a q
λ(q − p)
q−p
Por otra parte, si restringimos el parámetro al intervalo [0, 1] obtenemos el segmento

cerrado de extremos p y q:
x = p + λ(q − p) , 0 ≤ λ ≤ 1.
q−p
λ(q − p)
o
p+q
En particular, para λ = 1/2 obtenemos el punto medio del segmento: m =
2

p1 q1 x
Si p = , q= y x= entonces las ecuaciones paramétricas de
p2 q2 y
esta recta son:

x = p1 + λ(q1 − p1 )
, λ ∈ R.
y = p2 + λ(q2 − p2 )
En la descripción anterior hemos tenido en cuenta que la recta que pasa por p y q coincide
con la que pasa por p y es paralela al vector q − p. Obviamente, también coincide con la
que pasa por q y es paralela al vector p − q:
x = q + µ(p − q) , µ ∈ R.
Ejemplo 3.1.2. Busquemos lasecuaciones

paramétricas
y la ecuación reducida de la recta
−1 2
S que pasa por los puntos p = yq= . La ecuación paramétrica vectorial
4 −2
es:
x = p + α(q − p) , α ∈ R.
Igualando componente a componente resulta:

x = −1 + 3α
(S) , α ∈ R.
y = 4 − 6α
Si despejamos α en la primera ecuación obtenemos α = x+1

3 . Sustituyendo en la segunda
resulta y = 4−6 x+13 , que luego de operar queda y = −2x+2 que es la ecuación reducida
de esta recta. Observemos que, efectivamente, las coordenadas de ambos puntos verifican
esta ecuación.
Ejemplo 3.1.3. Intersección de dos rectas en R2 .

Cuando buscamos la intersección de dos rectas L y S en R2 las posibilidades que se
presentan son las siguientes:
T
L S = {p0 } : las rectas son secantes (se cortan en un solo punto).
T
L S = L = S : las rectas son coincidentes.
T
L S = ∅ : las rectas son paralelas y no coincidentes.
L L
S
p0 L=S S
Busquemos, a modo de ejemplo, la intersección de las rectas L y S de los ejemplos anterio-

res. Para ello podemos trabajar tanto con las ecuaciones reducidas
como
con las ecuaciones
x
paramétricas. Debe quedar claro que estamos buscando puntos que pertenezcan a
y
ambas rectas.
Si trabajamos con las reducidas el problema se reduce a resolver el siguiente sistema de

y =x−1
dos ecuaciones con dos incógnitas: La única solución de este sistema es
y = −2x + 2
x =1, y= 0. Resulta entonces que las rectas son secantes y su único punto de intersección
1
es .
0
Si trabajamos con las paramétricas
 deberemos resolver el siguiente sistema
 de cuatro ecua-

 x = 2 + λ  x = 2+λ

 
y = 1+λ y = 1+λ
ciones con cuatro incógnitas: que es equivalente a

 x = −1 + 3α 
 2 + λ = −1 + 3α
 
y = 4 − 6α 1 + λ = 4 − 6α
Las últimas dos ecuaciones dan lugar a un subsistema compatible determinado cuya única
solución es λ = −1, α = 2/3. Sustituyendo en las dos primeras resulta x = 1, y = 0.
Ejercicio 3.1.1. Consideremos
las siguientes rectas:
1 −1
L1 que pasa por p1 = y es paralela al vector u1 = .
2 1

−2 1
L2 que pasa por p2 = y por p3 = .
2 −1

2 1
L3 que pasa por p4 = y por p5 = .
1 −3
1. Halle las ecuaciones paramétricas y reducidas de L1 , L2 y L3 .
T T T
2. Encuentre las siguientes intersecciones: L1 L2 , L1 L3 , L2 L3 .
3. Interprete geométricamente los resultados obtenidos en (b).
3.2. El espacio vectorial R3

Definición 3.2.1. El conjunto R3 .
Designaremos con R3 al conjunto de todos las ternas ordenadas de números reales o, de
manera equivalente, a todas las matrices columna de dimensión 3 × 1:
  
 x1 
R3 =  x2  / x1 , x2 , x3 ∈ R
 
x3
Para interpretar geométricamente este conjunto, ya no nos alcanza con un plano, sino
que necesitamos recurrir al espacio. En efecto, una vez fijado un sistema de coordenadas
cartesianas en el espacio, queda establecida una correspondencia biunı́voca entre los puntos
del
 espacio
 y las ternas ordenadas de números reales. A cada terna ordenada de números
x1
 x2  le corresponde un único punto p del espacio (de abscisa x1 , ordenada x2 y cota
x3
x3 ), y recı́procamente, cada punto del espacio es correspondiente de una única terna de
números reales.
x3
 
x1
p =  x2 
x3
x2
o
y
x1
De manera similar a lo que habı́amos hecho en R2 , podemos interpretar R3 como el con-

junto de puntos del espacio, o como el conjunto de vectores del espacio que tienen origen
en o. Es ası́ que, a los elementos de R3 los denominaremos (indistintamente) puntos o
vectores.

En R3 , la suma de vectores y el producto de un número por un vector se definen de manera
análoga a como se hizo en R2 y, de hecho, estas operaciones coinciden con las de suma y
producto por un número de matrices 3 × 1:

         
x1 y1 x1 + y 1 x1 λx1
 x2  +  y 2  =  x2 + y 2  , λ  x2  =  λx2 
x3 y3 x3 + y 3 x3 λx3
Estas operaciones tienen exactamente las mismas propiedades que establecimos en las
proposiciones 3.1.1 y 3.1.2 Por ese motivo no volveremos a escribirlas nuevamente. Por
otra parte, la interpretación geométrica de estas operaciones (ası́ como el concepto de
vectores colineales), es también totalmente análoga a la realizada en R2 . En particular, si
u, v ∈ R3 son dos vectores no colineales, los puntos o, u y v determinan un plano, y la
suma u + v se visualiza a partir de la regla del paralelogramo en dicho plano:
v−u u+v
v
o u
Ejemplo 3.2.1. Consideremos los siguientes vectores en R3 :

     
1 1 −1
u =  −1  , v =  2  , w =  −5 . Entonces:
4 1 2
 

4 0
2u + v − w =  5  y u − 2v − w =  0  = o
7 0
3.2.2. Rectas en R3
Las mismas consideraciones geométricas realizadas en R2 nos permiten llegar a las siguien-
tes caracterizaciones analı́ticas de las rectas en R3 .
Recta que pasa por un punto y es paralela a un vector.

Si p es un punto de R3 y v es un vector no nulo de R3 , entonces la recta L que pasa por
p y es paralela al vector v coincide con el siguiente conjunto de puntos:
L = { p + λv / λ ∈ R }
La ecuación paramétrica vectorial de dicha recta es entonces:
x = p + λv , λ ∈ R.
Para cada valor del parámetro λ obtenemos un punto de la recta y, recı́procamente, todo
punto de la recta se obtiene de esa forma para algún valor de λ. Observemos, en particular,
que para λ = 0 se obtiene el punto p.
     
p1 v1 x
Si p =  p2  , v =  v2  y x =  y  entonces, igualando componente a
p3 v3 z
componente en la ecuación paramétrica vectorial obtenemos:

 x = p1 + λv1
y = p2 + λv2 , λ ∈ R.

z = p3 + λv3
que se denominan ecuaciones paramétricas de la recta.
Ejemplo
  3.2.2. Busquemos las ecuaciones
  paramétricas de la recta L que pasa por p =
2 1
 −3  y es paralela al vector v =  2 . Simplemente hay que sustituir en la ecuación
5 1
anterior obteniendo: 
 x = 2+λ
(L) y = −3 + 2λ , λ ∈ R

z = 5+λ
Si despejamos λ en la primera ecuación obtenemos λ = x − 2. Sustituyendo
 en la segunda
 x = 2+λ
y la tercera obtenemos el siguiente sistema equivalente al anterior: 2x − y − 7 = 0

x−z+3=0

2x − y − 7 = 0
A las dos últimas ecuaciones las llamaremos “ecuaciones reducidas”
x−z+3=0
 
x
de la recta L. Esto quiere decir que un punto  y  pertenece a la recta L si, y solo si,
z

2x − y − 7 = 0
sus componentes verifican el sistema
x−z+3 = 0
Observemos que en R3 una recta tiene dos ecuaciones reducidas.
Recta que pasa por dos puntos

Si p y q son dos puntos diferentes de R3 entonces la recta S que pasa por p y q coincide
con el siguiente conjunto de puntos:
S = { p + λ(q − p) / λ ∈ R }
La ecuación paramétrica vectorial de dicha recta es entonces:
x = p + λ(q − p) , λ ∈ R.
Observemos, en particular, que para λ = 0 se obtiene el punto p y que para λ = 1 se

obtiene el punto q. Por otra parte, si permitimos que el parámetro λ varı́e solamente en
los reales positivos entonces obtenemos la semirecta (abierta) con origen en p que contiene
a q, y si restringimos el parámetro al intervalo [0, 1], obtenemos el segmento cerrado de
extremos p y q.
     
p1 q1 x
Si p =  p2  , q =  q2  y x =  y  entonces las ecuaciones paramétricas de
p3 q3 z
esta recta son:

 x = p1 + λ(q1 − p1 )
y = p2 + λ(q2 − p2 ) , λ ∈ R.

z = p3 + λ(q3 − p3 )
Ejemplo 3.2.3. Busquemos las ecuaciones

 paramétricas
  y la ecuación reducida de la recta
1 2
S que pasa por los puntos p =  3  y q =  1 . La ecuación paramétrica vectorial
2 4
es:
x = p + α(q − p) , α ∈ R.
Igualando componente a componente resulta:


 x = 1+α
(S) y = 3 − 2α , α ∈ R.

z = 2 + 2α
Si despejamos α en la primera ecuación obtenemos α = x − 1. Sustituyendo

 en la segunda
 x = 1+α
y la tercera obtenemos el siguiente sistema equivalente al anterior: 2x + y − 5 = 0

2x − z = 0

2x + y − 5 = 0
Entonces, las ecuaciones reducidas de la recta S son
2x − z = 0
Ejemplo 3.2.4. Intersección de dos rectas en R3 .

Busquemos, a modo de ejemplo, la intersección de las rectas L y S de los ejemplos anterio-
res. Para ello podemos trabajar tanto con las ecuaciones reducidas como con las ecuaciones


x
paramétricas. Debe quedar claro que estamos buscando puntos  y  que pertenezcan a
z
ambas rectas.
Si trabajamos con las reducidas el problemase reduce a resolver el siguiente sistema de

 2x − y − 7 = 0

x−z+3 = 0
cuatro ecuaciones con tres incógnitas: (R)

 2x + y − 5 = 0

2x − z = 0
Si trabajamos con las paramétricas deberemos resolver el siguiente sistema:
 

 x = 2+λ 
 x = 2+λ

 y = −3 + 2λ 
 y = −3 + 2λ

 

 
z = 5+λ z = 5+λ
(P ) que es equivalente a

 x = 1 + α 
 2+λ = 1+α
 


 y = 3 − 2α 

 −3 + 2λ = 3 − 2α
 
z = 2 + 2α 5 + λ = 2 + 2α
A diferencia de lo que ocurrı́a en R2 , y a pesar de que estamos en presencia de seis

ecuaciones con cinco incógnitas, la resolución de este último no presenta mayores dificul-
tades.En efecto, el carácter (determinado, indeterminado o incompatible) del subsistema
 2+λ = 1+α
(P ′ ) −3 + 2λ = 3 − 2α es el mismo que el de (P ). Al resolverlo en este caso particu-

5 + λ = 2 + 2α
lar obtenemos que (P ′ ) es compatible determinado con única solución: λ = 1, α = 2. Esto
implica que (P ) es determinado y que, por lo tanto, las rectas L y S se cortan en un solo
punto. Para hallar dicho punto sustituimos
 en  (P) el valor λ = 1 (o α = 2) obteniendo:
T  3 
x = 3, y = −1, z = 6 =⇒ L S =  −1 
 
6
Observación 3.2.1. Rectas que se cruzan.

En R3 dos rectas pueden tener intersección vacı́a sin ser paralelas.
 
0 B
 0 
1
 
  0
1  1 
 0  0
o
0
A
Entretantos ejemplos posibles

 tomemos las rectas A y B de ecuaciones paramétricas
 x = λ  x = 0
(A) y = 0 , (B) y = 1 Obviamente su intersección es vacı́a. Sin embargo
 
z = 0 z = α
   
1 0
(A) es paralela al vector  0  y (B) al vector  0  que no son colineales. Vale la
0 1
pena observar que la recta A coincide
  con el eje Ox mientras que B es una recta paralela
0
al eje Oz que pasa por el punto  1 
0
Cuando buscamos la intersección de dos rectas L y S en R3 tenemos entonces las siguientes

posibilidades:
T
L S = {p0 } : las rectas son secantes (se cortan en un solo punto).
T
L S = L = S : las rectas son coincidentes.
T
L S = ∅ : las rectas pueden ser paralelas (y no coincidentes) o pueden cruzarse.
Para decidirlo consideramos vectores vL paralelo a L y vS paralelo a S.
• Si vL y vS son colineales entonces L y S son paralelas.
• Si vL y vS no son colineales entonces L y S se cruzan.
     
1 −1 3
Ejercicio 3.2.1. Se consideran: p1 =  2  , p2 =  1  , p3 =  1 
−1 3 1
     
5 2 4
p4 =  0  , u1 =  −1  , u2 =  0  y las rectas L1 que pasa por p1 y es
4 3 −2
paralela a u1 , L2 que pasa por p2 y es paralela a u2 y L3 que pasa por p3 y p4 .
1. Halle las ecuaciones paramétricas y reducidas de L1 , L2 y L3 .
T T T
2. Encuentre las siguientes intersecciones: L1 L2 , L1 L3 , L2 L3 .
3. Interprete geométricamente los resultados obtenidos en la parte anterior.
Ejercicio 3.2.2. Pruebe que las siguientes rectas (dadas por sus ecuaciones reducidas)
son paralelas:

x + 2y − 1 = 0 x + 2z + 1 = 0
(L) (S)
z−y−3 = 0 x+y+z−1=0
Ejercicio 3.2.3. Se consideran las rectas L y S dadas por sus ecuaciones paramétricas:
 
 x = 1 + 2λ  x = 5 + 4α
(L) y = −2 + aλ , (S) y = 4 + 6α
 
z =1−λ z = −1 − bα
Encuentre a, b ∈ R para que las rectas sean

T paralelas (eventualmente coincidentes). Para
los valores de a y b hallados encuentre L S.
3.2.3. Planos en R3
Como habı́amos mencionado, si u y v son dos vectores no colineales de R3 entonces
determinan un plano. Nos estamos refiriendo al plano Πo que pasa por o y que es paralelo
a dichos vectores. A partir de la regla del paralelogramo deducimos que, cualesquiera que
sean los escalares α, β, los puntos de la forma αu + βv siempre pertenecen al plano Πo .
Más aún, todo punto de dicho plano se obtiene de esa forma.
βv αu + βv
v
o u αu
Ahora bien, dado un punto p ∈ R3 (que no tiene por qué ser o) también queda determinado
un plano Π que pasa por p y que es paralelo a u y v. Los puntos de este plano son de la
forma p + αu + βv, en donde los escalares α y β pueden variar en los reales de todas las
maneras posibles.
p + αu + βv
Plano que pasa por un punto y es paralelo a dos vectores no colineales.
Consideremos un punto p ∈ R3 y dos vectores u y v de R3 no colineales. La ecuación

paramétrica del plano Π que pasa por p y es paralelo a los vectores u y v es:
x = p + αu + βv α, β ∈ R.
       
x x0 u1 v1
Si x =  y  , p =  y0 , u =  u2 , v =  v2  entonces las ecuaciones
z z0 u3 v3
paramétricas del plano mencionado son:

 x = x0 + αu1 + βv1
y = y0 + αu2 + βv2 α , β ∈ R.

z = z0 + αu3 + βv3
 
x
Esto quiere decir que un punto x =  y  pertenece a Π si, y solo si, sus coordenadas
z
verifican las tres ecuaciones mencionadas. Observemos también que las tres igualdades
pueden escribirse de la siguiente manera:
     
x − x0 u1 v1
 y − y0  = α  u2  + β  v2 
z − z0 u3 v3

x − x0 u1 v1

lo cual implica que el determinante y − y0 u2 v2 tiene que valer 0 (pues su primera
z − z0 u3 v3
columna es una combinación lineal de las otras dos). Podemos observar también que si
desarrolláramos este determinante por la primera columna y luego ordenáramos en x, y, z,
obtendrı́amos una expresión del tipo ax + by + cz − d, en donde a, b, c y d son constantes
con a,
 b yc no son simultáneamente nulos. Podemos concluir entonces que un un punto
x
x =  y  pertenece a Π si, y solo si, sus coordenadas verifican una ecuación de la forma
z
ax + by + cz − d = 0 que se suele denominar ecuación reducida del plano.
Observación 3.2.2. Ecuación reducida de un plano en R3

Es posible demostrar el recı́proco de la afirmación previa, esto es, toda ecuación de la
forma: ax + by + cz = d, en donde a, b, c son constantes no simultáneamente nulas, es la
ecuación de un plano en R3 . Esto será estudiado utilizando otros elementos en el capı́tulo
6. Vale la pena observar que, como dos ecuaciones equivalentes tienen el mismo conjunto
solución, la ecuación reducida de un plano no es única. Si m 6= 0 las ecuaciones
ax + by + cz = d y max + mby + mcz = md
son equivalentes y, por lo tanto, respresentan el mismo plano.

Con respecto a las rectas en R3 habı́amos observado que tenı́an dos ecuaciones reducidas
de la forma ax + by + cz = d. Ahora podemos interpretar ese resultado. En efecto, al dar
una recta mediante dos ecuaciones de este tipo, estamos determinando dicha recta como
la intersección de dos planos.
     
1 3 −3
Ejemplo 3.2.5. Consideremos p =  0 , u =  1 , v =  1  y sea Π el
2 −1 5
plano que pasa por p y es paralelo a los vectores u y v .
Las ecuaciones paramétricas de Π son:


 x = 1 + 3α − 3β
y =α+β α , β ∈ R.

z = 2 − α + 5β
Ahora bien, despejando α y β (en función de x e y) de las dos primeras ecuaciones obte-
nemos:
x + 3y − 1 −x + 3y + 1
α= β=
6 6
Sustituyendo en la tercera ecuación y ordenando llegamos a: x − 2y + z = 3 , que

 
x
es la ecuación reducida del plano Π. Esto quiere decir que un punto  y  pertenece al
z
plano si, y solo si, sus componentes verifican la ecuación x − 2y + z = 3.
Plano que pasa por tres puntos no alineados.

Sean p1 , p2 , p3 tres puntos no alineados. Sabemos que determinan un plano Π al cual
pertenecen. Como los tres puntos no están alineados entonces los vectores p3 − p1 y
p2 − p1 no son colineales y son paralelos a Π.
Luego, la ecuación paramétrica vectorial del plano Π que pasa por esos puntos es:
x = p1 + α(p3 − p1 ) + β(p2 − p1 ) α , β ∈ R.
p2
Π
p3
p1
p2 − p1
p3 − p1
o
     
1 1 −1
Ejemplo 3.2.6. Consideremos los puntos p1 =  1 , p2 =  −1  y p3 =  −1 .
1 2 3
   
0 −2
Como los vectores p2 − p1 =  −2  y p3 − p1 =  −2  no son colineales los tres
1 2
puntos p1 , p2 y p3 determinan un plano Π al cual pertenecen. Las ecuaciones paramétricas
de dicho plano son:

 x = 1 + −2β
y = 1 − 2α − 2β α , β ∈ R.

z = 1 + α + 2β
El lector podrá verificar que, eliminando α y β entre las tres ecuaciones, la ecuación
reducida de este plano resulta ser:
(Π) x + y + 2z = 4
Como se observa fácilmente, las coordenadas de cada uno de los tres puntos dados verifican
esta última ecuación.
Veamos ahora otra manera de obtener la ecuación reducida de este plano Π sin hallar las
ecuaciones paramétricas. En efecto, sabemos que la ecuación reducida de Π es de la forma
ax + by + cz = d. Como las coordenadas de cada uno de los tres puntos deben verificar
esta ecuación obtenemos: 
 a+b+c=d
a − b + 2c = d

−a − b + 3c = d
Resolviendo este sistema (S) se obtiene que es compatible indeterminado con un grado de
libertad y una forma de expresar su conjunto solucuón es:
sol(S) = { (−b, b,2b, 4b) / b ∈ R }
Por ejemplo, si tomamos b = 1, obtenemos a = 1, b = 1, c = 2 y d = 4, que da lugar a la

ecuación hallada anteriormente x + y + 2z = 4.
Si tomamos otro valor de b, los coeficientes cambian, pero la ecuación final es equivalente
a x + y + 2z = 4, y por lo tanto, representa el mismo plano. Por ejemplo, si tomamos
b = 2, obtenemos a = 2, b = 2, c = 4 y d = 8, que da lugar a la ecuación 2x + 2y + 4z = 8.
Observación 3.2.3. Intersección de recta y plano.

Consideremos el problema de intersecar una recta L con un plano Π en R3 . Supongamos
que conocemos las ecuaciones paramétricas de L y la ecuación reducida de Π:

 x = p1 + λv1
(L) y = p2 + λv2 (Π) ax + by + cz = d

z = p3 + λv3


 x = p1 + λv1

y = p2 + λv2
El problema planteado nos lleva a estudiar el sistema (S) que, a

 z = p3 + λv3

ax + by + cz = d


 x = p 1 + λv1

y = p2 + λv2
su vez, es equivalente a este otro:

 z = p3 + λv3

a(p1 + λv1 ) + b(p2 + λv2 ) + c(p3 + λv3 ) = d
Ordenando la cuarta ecuación, esta resultará de la forma Aλ = B (en donde A y B
son constantes), es decir, una ecuación lineal de primer grado con una sola incógnita. El
comportamiento de esta ecuación (determinada, indeterminada o incompatible) será el
mismo que el del sistema (S). Tenemos entonces que las únicas posibilidades son:
T
Si (S) es compatible determinado entonces L Π = {q} (la recta corta al plano en
un solo punto).
T
Si (S) es compatible indeterminado entonces L Π = L (la recta está contenida en
el plano).
T
Si (S) es incompatible entonces L Π = ∅ (la recta es paralela al plano).
q Π
L Π
     
0 1 1
Ejercicio 3.2.4. Se consideran los puntos p1 =  1  , p2 =  2  , p3 =  1 .
1 0 −1
Encuentre las ecuaciones paramétricas y la ecuación reducida del plano Π que pasa por
esos tres puntos. Verifique que Π pasa por el origen.
 
1
Ejercicio 3.2.5. Consideremos la recta L que pasa por los puntos q1 =  −1  y
1
 
2
q2 =  1 .
0
1. Encuentre la intersección de L con el plano Π1 de ecuación 2x + 3y + 3z = 6.
2. Encuentre la intersección de L con el plano Π2 de ecuación x − y − z = 3.

3. Encuentre la intersección de L con el plano Π3 de ecuación x − y − z = 1.
(En todos los casos realice la interpretación geométrica correspondiente).
     
1 0 1
Ejercicio 3.2.6. Se consideran los puntos p1 =  0  , p2 =  3  , p3 =  1 
2 −3 0
 
3
y q =  −2 
k
1. Verifique que los puntos p1 , p2 y p3 no están alineados y encuentre la ecuación
reducida del plano Π que determinan.
2. Sea L la recta que pasa por p1 y q. Determine el número k sabiendo que L está con-
tenida en Π.
Ejercicio 3.2.7.Se consideran

 las siguientes
 rectas:

1 1
L1 que pasa por  3  y es paralela a  −1 
−2 1
   
0 2
L2 que pasa por  1  y por  −1 
−1 1

y = −x
L3 de ecuaciones reducidas
z = −2x

 x = −1 + λ
L4 de ecuaciones paramétricas y = 2 − 3λ

z=1
1. Verifique que L1 y L2 son paralelas y halle la ecuación del plano Π1 que las contiene.
2. Verifique que L3 y L4 son secantes y halle la ecuación del plano Π2 que las contiene.
3. Halle las ecuaciones paramétricas de la recta intersección de los planos Π1 y Π2 .
Ejercicio 3.2.8.Se consideran

 las siguientes 
rectas:
1 1
L1 que pasa por  2  y es paralela a v1 =  −1 
0 2
   
0 3
L2 que pasa por  1  y es paralela a v2 =  −1 
2 2
1. Verifique que L1 y L2 son coplanares y halle la ecuación del plano Π determinado
por ellas.
 
−3
2. Verifique que q =  2  pertenece a L2 y que la recta que pasa por q y es paralela
0
a v1 está contenida en el plano Π.
Ejercicio 3.2.9. En cada uno de los siguientes casos reconozca geométricamente el sub-
conjunto de R3 definido por las relaciones dadas:
(1) x = 0 (2) y = 0 (3) z = 0 (4) x = 2 (5) y = 3 (6) z = −2
(7) y = x (8) x ≥ 0 (9) y ≥ 0 (10) z ≥ 0 (11) x ≥ 2 (12) y ≤ 3

x=0 x=0 y=0 y=0
(13) (14) (15) (16)
y=0 z=0 z=0 z≥0

x≥0
(17) (18) x2 + y 2 + z 2 = 0 (19) x + y + z = 1
y≥0
(20) x ≥ 0 , y ≥ 0 , z ≥ 0 , x + y + z ≤ 1
Ejercicio 3.2.10.
1. Encuentre las ecuaciones
 paramétricas
 y la
ecuación reducida
 del plano Π1 que pasa

0 1 1
por los puntos: o =  0  , p2 =  1  , p3 =  −1 
0 1 0
   
2 1
2. Se considera la recta L que pasa por  2  y es paralela al vector  −1  , y la
2 1
   
1 3 T
recta S que pasa por los puntos  0  y  4 . Encuentre L S.
3 1
3. Sea T
Π2 el plano determinado por L y S (que resultaron secantes). Demuestre que
Π1 Π2 es una recta y encuentre un vector paralelo a la misma.
Ejercicio 3.2.11.
1. Encuentre las ecuaciones
 paramétricas
 y la   del plano Π1 que pasa
ecuación reducida
1 0 0
por los puntos: e1 =  0  , e2 =  1  , e3 =  0 
0 0 1
 
2
2. Se considera la recta L que pasa por o y es paralela al vector  1  , y la recta S
1
   
0 2
que pasa por los puntos  0  y  1 . Demuestra que L y S son paralelas y no
1 2
coincidentes.
T
3. Sea Π2 el plano determinado por L y S. Demuestre que Π1 Π2 es una recta y
encuentre un vector paralelo a la misma.
Ejercicio 3.2.12. Encuentre la intersección de los tres planos dados por las siguientes
ecuaciones reducidas:
(Π1 ) x + y + z = 2 , (Π2 ) 2x + 3y + z = 5 , (Π3 ) − x − 2y + z = −1
¿Qué otras posibilidades se pueden dar para la intersección de tres planos en R3 ?

3.3. El espacio vectorial Rn

Con excepción de la visualización geométrica, todos los conceptos que hemos introducido
(o repasado) en R2 y R3 se extienden de manera natural a Rn , es decir, al conjunto de
las n-uplas ordenadas de números reales. Muy en particular, las propiedades de la suma
de vectores y producto de un número por un vector continuarán siendo válidas. De todos
modos, repetiremos las definiciones y los teoremas desarrollados en las secciones anteriores,
no solo para insistir con la analogı́a, sino para observar su validez dentro de un contexto
más general.
Definición 3.3.1. El conjunto Rn .

Designaremos con Rn al conjunto de todas las matrices columna de tamaño n × 1:
  

 x1 


  x2  

n  
R =  ..  / xi ∈ R, i = 1, 2, ... , n

  .  


 

xn
A los elementos de Rn los denominaremos (indistintamente) puntos o vectores, mientras

que a los números reales los llamaremos escalares.

Definición 3.3.2. Suma de vectores.
   
x1 y1
 x2   y2 
Si x =  .  ∈ R e y =  .  ∈ Rn entonces la suma x + y es el vector definido
n
   
 ..   .. 
xn yn
 
x1 + y 1
 x2 + y 2 
 ∈ Rn
 
por x + y =  ..
 . 
xn + y n
Dicho de otro modo, el vector x + y se obtiene sumando componente a componente. Ob-

servemos que esta definición coincide con la de suma de matrices (en este caso de matrices
n × 1) y, por lo tanto, esta operación tendrá las mismas propiedades que las conocidas
para la suma de matrices.
En este contexto, a la matriz nula n × 1 (que tiene ceros en todas sus componentes) la
llamaremos vector nulo y la simbolizaremos o. Asimismo, dado un vector cualquiera x
designaremos con −x al vector cuyas componentes son, respectivamente, las opuestas de
las de x.1
1
Como habrán observado hemos introducido un cambio de notación. De aquı́ en adelante los vectores
los designaremos con tipografı́a normal, por ejemplo u, y no en “negrita” u, como lo hicimos antes.
3.3. El espacio vectorial Rn 73
Proposición 3.3.1. Propiedades básicas de la suma de vectores.

(S1) Asociativa: (u + v) + w = u + (v + w) , ∀ u, v, w ∈ Rn .
(S2) Conmutativa: u + v = v + u , ∀ u, v ∈ Rn .
(S3) Existencia de neutro: Existe o ∈ Rn tal que o + u = u , ∀ u ∈ Rn .
(S4) Existencia de opuesto: Para cada u ∈ Rn existe −u ∈ R2 tal que u + (−u) = o.
Observación 3.3.1.
(1) Como mencionamos anteriormente, se trata de las conocidas propiedades de la suma
de matrices y, por lo tanto, no es necesario demostrarlas. De todos modos, en caso de
querer hacerlo, la prueba es muy simple ya que alcanza con utilizar las propiedades de la
suma de números reales.
(2) Como ya lo sabemos para matrices, el neutro de la suma es único y el opuesto de cada
vector también es único.
(3) Dados dos vectores u, v ∈ Rn , la resta u − v se define como la suma de u mas el opuesto
de v: u − v = u + (−v).
Definición 3.3.3.
 Producto
 de un número por un vector.
x1
 x2 
Si λ ∈ R y x =  .  ∈ Rn entonces el producto λx del número λ por x es el vector
 
 .. 
x
n 
λx1
 λx2 
 ∈ Rn
 
definido por λx =  ..
 . 
λxn
Dicho de otro modo, el vector λx se obtiene multiplicando por λ a cada componente de

x. Observemos que esta definición coincide con la de producto de un número por una
matriz (en este caso de matrices n × 1) y, por lo tanto, esta operación tendrá las mismas
propiedades que las conocidas para matrices.
Proposición 3.3.2. Propiedades básicas del producto de un número por un

vector.
(P1) Asociativa: (αβ)u = α(βu) , ∀ u ∈ Rn , ∀ α, β ∈ R.
(P2) Existencia de neutro real: 1 u = u , ∀ u ∈ Rn .
(P3) Distributiva respecto de la suma de números: (α + β)u = αu + βu ,
∀ u ∈ Rn , ∀ α, β ∈ R.
(P4) Distributiva respecto de la suma de vectores: α(u + v) = αu + αv ,
∀ u, v ∈ Rn , ∀ α ∈ R.
   
2 3
 −1 
 , v =  −3/2 .
 
Ejemplo 3.3.1. Consideremos los siguientes vectores en R4 : u = 
 1   3/2 
4 6
Entonces:    
5 6
 −5/2   −3 
u+v =
 5/2 
 , 2v = 
 3  ,
 3u − 2v = o
10 12
Definición 3.3.4. Vectores colineales.
Sean u, v ∈ Rn . Diremos que u y v son colineales cuando uno es múltiplo del otro, es
decir, si existe α ∈ R tal que v = αu, o si existe β ∈ R tal que u = βv.
     
2 4 2
 −1 
 y  −2  son colineales, mientras que  −1 
   
Por ejemplo, los vectores  2   4   2 
1 2 1
 
4
 −2 
 5  no lo son.
y  
π
Sea z un vector cualquiera de Rn y o el vector nulo de Rn . Como o = 0 z, podemos decir
que o es colineal con cualquier otro vector z ∈ Rn .
3.3.2. Combinaciones lineales

Definición 3.3.5. Combinación lineal.
Sean U = {u1 , u2 , . . . , ur } ⊂ Rn y z ∈ Rn . Diremos que z es combinación lineal de U
si, y solo si, existen escalares α1 , α2 , . . . , αr ∈ R tales que z = α1 u1 + α2 u2 + · · · + αr ur .
Cuando z sea combinación lineal de U abreviaremos: “z es C.L. de U ”.
Ejemplo 3.3.2. Consideremos el caso en que U contiene un solo vector no nulo: U = {u}
con u 6= o. En este caso los vectores que son combinación lineal de U son aquellos de la
forma λu con λ ∈ R. Es decir, son todos los vectores colineales con u. ¿Qué ocurre si u
fuese el vector nulo?
Observación 3.3.2. Interpretación geométrica en R2 de las C.L. de dos vectores.

Sea U = {u1 , u2 } ⊂ R2 un conjunto formado por dos vectores no colineales. Si α1 , α2 ∈ R
la regla del paralelogramo nos permite visualizar el vector α1 u1 + α2 u2
α2 u2
u2
u1 α1 u1
Observemos que, al variar α1 y α2 de todas las maneras posibles en R, recorremos todos

los vectores de R2 . Dicho de otro modo, todo vector de R2 se podrá expresar como C.L.
de {u1 , u2 }. ¿Qué hubiese sucedido si u1 y u2 fuesen colineales?
Ejemplo
 3.3.3.
 Veamos ejemplo en R3 . Consideremos U = {u1 , u2 } ⊂ R3 en donde
 un 
1 −1
u1 =  −1  y u2 =  3 .
1 2
(1) ¿Cómo obtenemos combinaciones lineales de U ? Simplemente multiplicando u1 por un
número, u2 por otro número
 y sumando
 los resultados.
−1
Por ejemplo 2u1 + 3u2 =  7  es una C.L. de U . ¿Es posible obtener otras?
8
 
4
Sı́, otro ejemplo es 3u1 − u2 =  −6 . ¿Cuántas C.L. de U podemos formar?
1
(2) Algunas C.L. particulares de U se obtienen cuando  multiplicamos
 uno de los vectores
α1
por 0. Por ejemplo las C.L. de la forma α1 u1 + 0u2 =  −α1  nos dan vectores que son
α1
todos colineales con u1 . Resulta claro que hay infinitas C.L. diferentes de U .
(3) Un caso particular (trivial, pero fundamental a tener en cuenta) es cuando tomamos
todos los escalares nulos. Esta se denomina la C.L. trivial de U y da como resultado el
vector nulo: 0u1 + 0u2 = o.
(4) Ahora bien, un problema más interesante consiste en preguntarnos

 si cierto vector
1
dado es (o no) C.L. de U . Consideremos por ejemplo el vector z =  1  y tratemos de
4
averiguar si es C.L. de U . Tenemos:
z es C.L. de U ⇐⇒ ∃ α1 , α2 ∈ R / α1 u1 + α2 u2 = z
    
1 −1 1
⇐⇒ ∃ α1 , α2 ∈ R / α1  −1  + α2  3  =  1 
1 2 4
Ordenando componente a componente

 resulta que z será C.L. de U si, y solo si, existen
 α1 − α2 =1
α1 , α2 ∈ R que verifiquen: −α1 + 3α2 = 1 .

α1 + 2α2 = 4
El problema se reduce entonces a estudiar un sistema de ecuaciones lineales. Escalerizando
 α1 − α2 = 1
llegamos a 2α2 = 2 . Este sistema es compatible (de hecho compatible determi-

0=0
nado) con única solución α1 = 2 , α2 = 1. La respuesta es entonces afirmativa. El vector
z es C.L. de U . Mas aún, la única manera de expresar z como C.L. de U es: z = 2u1 + u2 .
 
1
Consideremos ahora el vector w =  1  y tratemos de averiguar si es C.L. de U . Repi-
2

 α1 − α2 = 1
tiendo el mismo razonamiento que en el caso anterior llegamos al sistema −α1 + 3α2 = 1

α1 + 2α2 = 2
que (luego de efectuar 
las mismas operaciones en la escalerización que en el caso anterior)
 α1 − α2 = 1
resulta equivalente a 2α2 = 2 . Este sistema es incompatible y, por lo tanto, la

0=4
respuesta es negativa: w NO es C.L. de U .
(5) Como acabamos de ver, hay vectores de R3 que son C.L. de U y otros que no lo
3
son. ¿Podremos caracterizar todos  losvectores de R que sean C.L. de U ? Para ello nos
a
planteamos un vector genérico  b  y efectuamos el mismo procedimiento que antes.
c

 α1 − α2 = a
Este vector será C.L. de U si, y solo si, el sistema −α1 + 3α2 = b (de incógnitas

α1 + 2α2 = c
α1 , α2 ) es compatible.
 Efectuando la misma escalerización que en los ejemplos anteriores
 α1 − α2 = a
llegamos a 2α2 = a + b

0 = 5a + 3b − 2c
Una discusión muy simple que nos lleva a la siguiente concusión: el vector será C.L. de U
si, y solo si, 5a + 3b −  0. Tenemos entonces que los vectores de R3 que son C.L. de U
2c = 
a
son aquellos vectores  b  cuyas componentes verifiquen la relación 5a + 3b − 2c = 0,
c
es decir, son los vectores del conjunto:
  
 a 
 b  ∈ R3 / 5a + 3b − 2c = 0
 
c

 α1 − α2 = a
Una última observación: cuando 5a + 3b − 2c = 0 el sistema 2α2 = a + b

0 = 5a + 3b − 2c
no solamente queda compatible, sino también compatible determinado. Esto quiere decir
que cada vector que sea C.L. de U se podrá escribir de una única manera como C.L. de
U.
     
1 0 2
Ejemplo 3.3.4. Consideremos los vectores u1 =  0  , u2 =  1  , u3 =  −1 
2 1 3
3
y el conjunto V = {u1 , u2 , u3 }. Queremos caracterizar los vectores de R que sean C.L. de
V , es decir, queremos encontrar la condición que debe cumplir un vector de R3 para ser
 
a
C.L. de V . Para ello consideramos un vector genérico z =  b  y planteamos que
c
z es C.L. de V ⇐⇒ ∃ α1 , α2 , α3 ∈ R / α1 u1 + α2 u2 + α3 u3 = z

 α1 + 0α2 + 2α3 = a
Esto nos lleva al sistema de ecuaciones (de incógnitas α1 , α2 , α3 ) 0α1 + α2 − α3 = b

2α1 + α2 + 3α3 = c
 
1 0 2 a
La matriz ampliada asociada a dicho sistema es  0 1 −1 b .
2 1 3 c
Escalerizando tenemos:
   
1 0 2 a 1 0 2 a
 0 1 −1 b  ∼  0 1 −1 b 
0 1 −1 −2a + c ←− F3 − 2F1 0 0 0 2a + b − c ←− F2 − F3
El rango por filas (o sea, el número de escalones) de la matriz del sistema es 2. Según el
teorema de Rouche-Frobenius, el sistema será compatible si, y solo si, el rango por filas
de la matriz ampliada también vale 2. Se deduce entonces que la condición para que z sea
C.L. de V es 2a + b − c = 0.  
a
Conclusión: los vectores de R3 que son C.L. de V son aquellos vectores  b  cuyas
c
componentes verifiquen la relación 2a + b − c = 0, es decir, son los vectores del conjunto:
  
 a 
 b  ∈ R3 / 2a + b − c = 0
 
c
El sistema escalerizado correspondiente es


 α1 + 0α2 + 2α3 = a
(S) α2 − α3 = b

0 = 2a + b − c
Observemos que, a diferencia del ejemplo anterior, cuando 2a + b − c = 0 el sistema (S)

queda compatible, pero no determinado, sino indeterminado con un grado de libertad (α1
y α2 se pueden poner en función de α3 ). Esto quiere decir que cada vector que sea C.L. de
V se podrá escribir
 de infinitas maneras como C.L. de V . Para visualizar
 esto tomemos un
a 1
vector particular  b  que cumpla 2a+b−c = 0. Por ejemplo v =  2  (el lector pue-
c 4

 α1 + 0α2 + 2α3 = 1
de elegir cualquier otro). Para este vector el sistema (S) queda: α2 − α3 = 2

0 =0
Como decı́amos, resulta ser un sistema compatible indeterminado cuyas soluciones vienen
dadas por: α1 = 1 − 2α3 , α2 = 2 + α3 , α3 cualquiera.
Para diferentes elecciones de α3 resultarán los valores de α1 y α2 para los cuales v se

pueda escribir como α1 u1 + α2 u2 + α3 u3 . Tomaremos entonces algunos valores de α3 y
verificaremos que, para todos ellos, se cumple la igualdad v = α1 u1 + α2 u2 + α3 u3
       
1 1 0 2
Si α3 = 1 =⇒ α1 = −1 , α2 = 3 y  2  = −1  0  + 3  1  + 1  −1 
4 2 1 3
       
1 1 0 2
Si α3 = −1 =⇒ α1 = 3 , α2 = 1 y  2  = 3  0  + 1  1  − 1  −1 
4 2 1 3
       
1 1 0 2
Si α3 = 2 =⇒ α1 = −3 , α2 = 4 y  2  = −3  0  + 4  1  + 2  −1 
4 2 1 3
Observación 3.3.3. Combinación lineal en notación matricial.

     
1 1 2
 2   4   1 
Consideremos los vectores u1 =   3  , u2 =  1  , u3 =
     y el conjunto
 3 
5 2 4
4
U = {u1 , u2 , u3 } ⊂ R . La combinación lineal α1 u1 + α2 u2 + α3 u3 se puede escribir:
       
1 1 2 α1 + α2 + 2α3
 2   4   1   2α1 + 4α2 + α3 
α1 
 3  + α2
   + α3
 1 
  = 
 3   3α1 + α2 + 3α3


5 2 4 5α1 + 2α2 + 4α3
 
1 1 2
 2 4 1 
Observemos que el último vector coincide con el producto de la matriz  3
 por
1 3 
5 2 4
 
α1
el vector de coeficientes  α2  . Es ası́ que vale la siguiente igualdad:
α3
       
1 1 2 1 1 2  
 2   4   1   2 α1
4 1  

α1 
 3  + α2
   + α3
 1 
  = 
 3   3 α2 
1 3 
α3
5 2 4 5 2 4
Con respecto a esta matriz observemos que su primera columna está formada por las
componentes de u1 , su segunda columna por las componentes de u2 , y su tercera columna
por las componentes de u3 . Esta matriz se designará MU . Observemos también que, como
en este ejemplo U está formado por tres vectores de R4 , la matriz MU resulta tener 4 filas
y 3 columnas (es decir, es 4 × 3). Tenemos entonces que la C.L. α1 u1 + α2 u2 + α3 u3 se
puede escribir como el producto de la matriz MU por el vector de los coeficientes de la
C.L. :
 
α1
α1 u1 + α2 u2 + α3 u3 = MU .  α2 
α3
Esta observación, que hemos introducido con un ejemplo particular, es totalmente general.
Dado un conjunto U = {u1 , u2 , . . . , ur } ⊂ Rn designaremos con MU a la matriz n × r tal
que su primera columna está formada por las componentes de u1 , su segunda columna por
las componentes de u2 , y ası́ sucesivamente. La C.L. α1 u1 + α2 u2 + . . . + αr ur se puede
escribir como el producto de la matriz MU por el vector de los coeficientes de la C.L. :
 
α1

 α2 

α1 u1 + α2 u2 . . . + αr ur = MU .  .. 
 . 
αr
Como sabemos, un vector z ∈ Rn será C.L. de U si, y solo si, existen escalares α1 , α2 , . . . , αr ∈
R tales que α1 u1 + α2 u2 . . . + αr  ur = z. O, de manera equivalente, si, existen escalares
α1
 α2 
 
α1 , α2 , . . . , αr ∈ R tales que MU .  .  = z. Esta última es la notación matricial para
.
 . 
αr
un sistema de ecuaciones lineales de incógnitas α1 , α2 , . . . , αr . Podemos resumir entonces
lo siguiente:
 
α1
 α2 
 
Si el sistema MU  .  = z
.
 . 
αr
es incompatible entonces z NO es C.L. de U .
es compatible entonces z es C.L. de U .
es compatible determinado entonces hay una sola C.L. de U que da como resultado
z.
es compatible indeterminado entonces hay infinitas C.L. de U que dan como resultado
z.
     
1 1 2
 1   2   3 
Ejemplo 3.3.5. Consideremos los vectores u1 =   −1  , u2 =  1  , u3 =  4 
    
−1 2 1
y el conjunto U = {u1 , u2 , u3 } ⊂ R4 . Queremos caracterizar todos los vectores de R4 que
son C.L. de U , es decir, queremoshallar

 la condición (o condiciones) que deben verificar
a
 b 
a, b, c y d para que el vector z = 
 c  sea C.L. de U . En este caso la matriz ampliada

d
   
α1 1 1 2 a
 α2   1 2 3 b 
del sistema MU .   α3  = z es  −1 1 4 c .
  
α4 −1 2 1 d
   
1 1 2 a 1 1 2 a
 0 1 1 b−a   ←− F2 − F1
 0 1 1 b−a 
 ∼  
 0 2 6 a + c  ←− F3 + F1  0 0 4 3a − 2b + c  ←− F3 − 2F2
0 3 3 a+d ←− F4 + F1 0 0 0 4a − 3b + d ←− F4 − 3F2
El rango por filas (o sea, el número de escalones) de MU es rgf (MU ) = 3. Según el teorema
de Rouche-Frobenius, el sistema será compatible si, y solo si, el rango por filas de la matriz
ampliada también es 3. Se deduce entonces que la condición para que z sea C.L. de U es
4a − 3b + d = 0.
Observación 3.3.4. Los vectores canónicos de Rn .

Para cada j entre 1 y n designaremos con ej al vector de Rn cuyas componentes son todas
nulas, salvo la j-ésima que vale 1:
     
1 0 0

 0 


 1 


 0 


e1 =  0  
 , e2 =  0  
 , . . . , en =  0 

 ..   ..   .. 
 .   .   . 
0 0 1
 
x1

 x2 


Si x =  x3  es un vector cualquiera de Rn entonces vale la igualdad:

 .. 
 . 
xn
x = x1 e1 + x2 e2 + x3 e3 + . . . + xn en
Resulta entonces que cualquier vector es C.L. del conjunto de vectores canónicos. Mas
aún, los coeficientes de la C.L. son las propias componentes del vector x. Además, es claro
que no hay otra manera de escribir x como C.L. de estos vectores canónicos. De aquı́ en
adelante designaremos con la letra C al conjunto de vectores canónicos de Rn , es decir:
C = {e1 , e2 , . . . , en }. Observemos también que la matriz MC no es otra que la matriz
identidad In :  
1 0 ... 0

 0 1 ... 0 

MC =  .... . . ..  = In
 . . . . 
0 0 ... 1
Ejercicio 3.3.1. Sean λ ∈ R y v ∈ Rn . Demuestre que λ v = o si, y solo si, λ = 0 o v = o.
Ejercicio 3.3.2. Se consideran los vectores:

    
1 2 1
u= 1  , v= 1  , w= 2 
2 3 a
Encuentre todos los valores de a para los cuales w es C.L. de {u, v}.
Ejercicio 3.3.3. En cada uno de los siguientes casos se pide:

Halle la matriz MU .
Halle todos los vectores que son C.L. de U .
Decida
 si el 
vector
 z dado  es C.L. deU . 
 1 −1  1
1. U =  0  ,  2  , z= 2 .
 
2 1 3
       
 1 2 1  1
2. U =  0  ,  −1  ,  0  , z= 1 .
 
−1 1 1 −1
         
 1 0 2 1  1
3. U =  1  ,  −1  ,  1  ,  1  , z =  −2  .
 
1 1 −1 0 3
       

 1 2   1 3
  
1 , 0 
 1 
  , z2 =  3  .
 
4. U =   −1   1  , z1 =  1   −3 

 
 
−1 3 1 −3

1 1 2 2 3
5. U = , , , , z= .
2 1 3 2 5
Ejercicio 3.3.4. Determine si las siguientes afirmaciones son verdaderas o falsas justifi-
cando la respuesta.
1. Sean U = {u1 , u2 } ⊂ Rn y z1 , z2 dos vectores que son C.L. de U . Si v = 2z1 + 3z2
entonces v es C.L. de U .
2. Sean u1 , u2 , u3 ∈ Rn tales que u1 es C.L. de {u2 , u3 } y u2 es C.L. de {u3 }. Entonces
u1 es C.L. de {u3 }.
3. Sean u1 , u2 , u3 ∈ Rn tales que u1 es C.L. de {u2 , u3 } y u2 no es C.L. de {u3 }. Entonces
u1 no es C.L. de {u3 }.
Ejercicio 3.3.5. Se considera el conjunto:

     

 1 2 2 

   −1  
−1   1 4
U=   0  ,  1   1  ⊂R
   ,  

 
 
1 0 1
 
−2
 −5 
1. Investigue si z = 
 −2  es combinación lineal de U .

6
2. Encuentre todos los vectores de R4 que son C.L. de U .
Ejercicio 3.3.6. Se consideran:

       
 1 −1 1  1
U =  1 , a , b  , z =  −a 
 
1 −1 −1 −3
Investigue si z es C.L. de U . (Se deberá discutir según a, b ∈ R).
Ejercicio 3.3.7. Rectas en Rn .

Sean p y q dos puntos distintos de Rn y v un vector no nulo de Rn . Análogamente a lo
que ocurre en R2 y R3 damos las siguientes definiciones:
La recta que pasa por p y es paralela al vector v es el conjunto: { p + λv / λ ∈ R }
La recta que pasa por p y q es el conjunto : { p + λ(q − p) / λ ∈ R }
El segmento de extremos p y q es el conjunto : { p + λ(q − p) / λ ∈ [0, 1] } que también
puede expresarse como { (1 − t)p + tq / t ∈ [0, 1] }
1. 
Encuentre
 lasecuaciones
 paramétricas de la recta en R4 que pasa por los puntos
1 3
 −1   2 
 1  y  3 . Encuentre una recta que pase por el origen y que sea paralela
   
2 1
a la recta anterior.
2. Diremos que tres puntos p1 , p2 , p3 ∈ Rn están alineados cuando pertenecen a una
misma recta. Demuestre que p1 , p2 , p3 están alineados si, y solo si, los vectores p2 −p1
y p3 − p1 son colineales.
Ejercicio 3.3.8. Conjuntos convexos.

Un subconjunto C de Rn se dice convexo cuando para toda pareja de puntos p, q ∈ C se
cumple que el segmento con extremos en p y en q está contenido en C. (Dicho de manera
más coloquial, es un conjunto donde no se puede jugar a la escondida). En sı́mbolos:
C ⊂ Rn es convexo ⇐⇒ ∀ p, q ∈ C se cumple (1 − t)p + tq ∈ C, ∀ t ∈ [0, 1]
1. Encuentre ejemplos de conjuntos convexos en R2 .

2. Demuestre que la intersección de dos conjuntos convexos es un conjunto convexo.
3. ¿Es la unión de conjuntos convexos un conjunto convexo?
3.4. Dependencia e independencia lineal 83
3.4. Dependencia e independencia lineal

Definición 3.4.1. Conjuntos linealmente dependientes y linealmente indepen-
dientes.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto con al menos dos vectores (r ≥ 2).
Diremos que U es linealmente dependiente (L.D.) cuando alguno de sus vectores es
C.L. de los restantes vectores de U .
Cuando U no sea linealmente dependiente diremos que es linealmente independiente
(L.I.).
     
1 2 3
 0   1   1 
Ejemplo 3.4.1. Sean u1 =   1  , u2 =  2  , u3 =  3 
    
−1 1 0
y el conjunto U = {u1 , u2 , u3 }. Es inmediato observar que u3 = u1 +u2 . Se deduce entonces
que U es L.D.
Observemos también que u3 = u1 + u2 implica u1 + u2 − u3 = o y esto quiere decir que
hemos encontrado una C.L. no trivial de U que da como resultado o.
      
 1 0 0 
Ejemplo 3.4.2. Sea C = {e1 , e2 , e3 } =  0  ,  1  ,  0  . Observemos que
 
0 0 1
cualquier C.L. entre e1 y e2 tendrá un 0 en la tercera componente, de donde resulta que
e3 no es C.L. de {e1 , e2 }. Con un razonamiento similar se concluye que e1 no es C.L. de
{e2 , e3 } y que e2 no es C.L. de {e1 , e3 }. Ninguno de los vectores de C se puede expresar
como C.L. de los restantes y, por lo tanto, C es L.I.
Observación 3.4.1. Dos situaciones muy simples.
(a) Si un conjunto (con más de un vector) contiene al vector nulo entonces es L.D. En
efecto, sea U = {o, u2 , . . . , ur }. Como, obviamente, o = 0u2 + . . . 0ur , el vector
nulo es C.L. de los restantes y, por lo tanto, U es L.D.
(b) Cuando el conjunto en cuestión contiene exactamente dos vectores entonces es inme-
diato estudiar si es L.I. o L.D. Sea U = {u, v} ⊂ Rn . U es L.D. si, y solo si, algunos
de sus vectores es C.L. del otro, es decir, si y solo si, son colineales. Resulta entonces
que cuando tenemos solamente dos vectores alcanza con mirarlos para poder decidir:
si son proporcionales entonces U es L.D. y, si no lo son, entonces U es L.I.
En la observación anterior se vio que cuando el conjunto contiene solamente dos vectores
entonces es trivial estudiar si es L.I. o L.D. Ahora bien, cuando el conjunto contiene más
de dos vectores, dicho estudio no es (en general) inmediato. Consideremos el siguiente
ejemplo:      

 1 −5 2  
  10   −1 
2 
U=  
 ,  −7  ,  1 
    
 −1

 

3 −19 7
¿Alguno de sus vectores es C.L. de los restantes? A “simple vista” (y sin hacer operaciones)
parecerı́a que no podemos adelantarnos a responder la pregunta. El próximo teorema nos
dará una caracterización diferente de los conjuntos L.D.
Teorema 3.4.1. Condición necesaria y suficiente para que un conjunto sea L.D.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto con al menos dos vectores (r ≥ 2).
Entonces U es L.D. si, y solo si, existe una C.L. no trivial de U que da como resultado el
vector nulo o.
Demostración. Como mencionamos anteriormente, el vector nulo siempre es C.L. de
cualquier conjunto, pues se obtiene trivialmente multiplicando por ceros los vectores de
dicho conjunto. A dicha C.L. la denominábamos C.L. trivial. Pero, como ya hemos visto
en algunos ejemplos, puede suceder que existan C.L. no triviales de U que también den
como resultado o.
( =⇒ ) Por hipótesis U es L.D. Esto quiere decir que alguno de sus vectores es C.L.
de los restantes. Supongamos (para fijar ideas) que u1 es C.L. de los demás. Tenemos
entonces que existen escalares α2 , . . . , αr ∈ R tales que u1 = α2 u2 + . . . + αr ur .
Lo anterior implica que o = −u1 + α2 u2 + . . . + αr ur . Hemos encontrado entonces
una C.L. no trivial (con al menos uno de los coeficientes diferente de cero) de U que
da o.
( ⇐= ) Ahora nuestra hipótesis es que existe una C.L. no trivial de U que da como
resultado o. O sea, existe alguna C.L. de U con al menos un coeficiente diferente
de 0 que da o. Tenemos entonces que existen escalares λ1 , λ2 , . . . , λr ∈ R, no
todos nulos, tales que o = λ1 u1 + λ2 u2 + . . . + λr ur . Supongamos (sin pérdida de
generalidad)
que es λ1 6=0. De la igualdad anterior podemos despejar u1 obteniendo:
−λ2
u1 = λ1 u2 + . . . + −λ λ1
r
ur . Hemos encontado entonces un vector de U que es
C.L. de los restantes, y eso es precisamente lo que querı́amos probar. ♠
Corolario 3.4.2. Condición necesaria y suficiente para que un conjunto sea L.I.
Del teorema anterior surge inmediatamente lo siguiente:
Un conjunto U es L.I. si, y solo si, la única C.L. de U que da como resultado o es la
trivial.
Observación 3.4.2. Una convención para un conjunto con un solo vector. Si

u ∈ Rn es un vector no nulo entonces λu = o si, y solo si, λ = 0. Dicho de otro modo,
la única C.L. de {u} que da o es la trivial. Debido a esto convenimos en que un conjunto
con un solo vector no nulo es L.I.
Por otra parte, el producto de cualquier real por o da como resultado o. Consideraremos
entonces que {o} es L.D.
Según los resultados anteriores, para averiguar si el conjunto U = {u1 , u2 , . . . , ur } ⊂ Rn

es L.I. o L.D. podemos considerar el sistema lineal homogéneo
 
α1
 α2 
 
MU .  .  = o
 . .
αr
y decidir de la siguiente manera:

Si el sistema es compatible determinado (solo admite la solución trivial) entonces U

es L.I.
Si el sistema es compatible indeterminado (admite soluciones distintas de la trivial)

entonces U es L.D.
Ejemplo 3.4.3. Consideremos el conjunto

     

 1 −5 2 
     3 
U = {u1 , u2 , u3 } = 
2  ,  −6 , 


 1   −1   1 

 
4 −12 6
Para investigar si es L.I. o L.D. trabajamos con la matriz ampliada:

   
1 −5 2 0 1 −5 2 0
 2 −6 3 0   0 4 −1 0 

 1 −1
 que escalerizando queda  
1 0   0 0 0 0 
4 −12 6 0 0 0 0 0
El sistema es entonces compatible indeterminado y, por lo tanto, U es L.D.
Ahora bien, como U es L.D., alguno de sus vectores tiene que ser C.L. de los restantes.
¿Cómo deberı́amos proceder para hallar tal vector? Si volvemos al sistema escalerizado
(colocando ahora las incógnitas) tenemos:


 α1 − 5α2 + 2α3 = 0

4α2 − α3 = 0

 0=0

0=0
Hay infinitas soluciones que vienen dadas (por ejemplo) mediante: α1 = −3α2 , α3 = 4α2 ,
α2 cualquiera. Para todas las ternas (α1 , α2 , α3 ) que verifiquen esas relaciones se cumplirá:
α1 u1 + α2 u2 + α3 u3 = o. Por ejemplo, si tomamos α2 = 1 resultan α1 = −3 y α3 = 4 con
lo que −3u1 + u2 + 4u3 = o. De esta última igualdad podemos despejar cualquiera de los
tres vectores en función de los otros dos. En este caso, cualquiera de los tres vectores es
C.L. de los restantes.
Observación 3.4.3. No siempre tiene que ocurrir lo que sucedió en el ejemplo anterior.
Es decir, si un conjunto U es L.D. eso no implica que cualquiera de sus vectores sea
C.L.
 delosrestantes.
  Para  ello consideremos el siguiente ejemplo: U = {u1 , u2 , u3 } =

 1 2 0 
       
  ,   ,  0  . Este conjunto es L.D. (pues u2 = 2u1 + 0u3 ) y sin embargo
1 2
  1   2   0 

 

1 2 7
u3 no es C.L. de {u1 , u2 }.
Observación 3.4.4. En Rn no hay conjuntos L.I. con más de n vectores.

Supongamos que U = {u1 , u2 , . . . , ur } ⊂ Rn  subconjunto de Rn con más de n vec-
es un 
α1
 α2 
 
tores (r > n). En este caso el sistema MU  .  = o es un sistema homogéneo con
 .. 
αr
más incógnitas que ecuaciones y, por lo tanto (recordar la observación 2.4.5), es compati-
ble indeterminado (tiene soluciones distintas de la trivial). Se deduce entonces que todo
subconjunto de Rn con más de n vectores es necesariamente L.D.
Observación 3.4.5. Interpretación geométrica en R2 y R3 .
Según la observación previa, en R2 no puede haber un conjunto L.I. con más de dos
vectores. Esto tiene una interpretación geométrica bastante simple. En efecto, sea
{u, v} ⊂ R2 un conjunto L.I. Sabemos que esto es equivalente a decir que u y v no
son colineales. Sea w otro vector de R2 . Si w es colineal con u o con v entonces es
claro que {u, v, w} es L.D. Supongamos entonces que w no es colineal con u ni con
v. Designemos con S a la recta que pasa por o y u, y con T a la que pasa por o y
v. La paralela por w a T intersecta a S en u1 , mientras que la paralela por w a S
intersecta a T en v2 . La regla del paralelogramo nos permite afirmar que w = u1 + v2
y, por lo tanto, w es C.L. de {u, v}.
v2 w
v
o u u1 S
En definitiva, se observa geométricamente que si {u, v} ⊂ R2 es L.I., entonces cual-

quier otro vector w de R2 se puede escribir como C.L. de {u, v} y, consecuentemente,
{u, v, w} es L.D.
Consideremos ahora un conjunto {u, v} ⊂ R3 L.I. Como estos dos vectores no son
colineales determinan un plano Π que pasa por o y que es paralelo a ambos. Sea
ahora un tercer vector w no colineal con u ni con v.
Tenemos que {u, v, w} es L.D. si, y solo si, w es C.L. de {u, v}. Esto es equivalente
a decir que w pertenece al plano Π.
Π
u
o
y
Ahora bien, si {u, v, w} es L.I. entonces w no puede ser C.L. de {u, v}. Esto significa
que w no pertenece al plano Π.
z
w
v Π
u
o
y
Observación 3.4.6. Reducción y ampliación de un conjunto L.I.

Es bastante sencillo probar que si a un conjunto L.I. (con más de un vector) le qui-
tamos uno de sus vectores, entonces el conjunto resultante también es L.I. En efecto,
sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto L.I. y V = U − {u1 } = {u2 , . . . , ur }. Si
V no fuese L.I. entonces alguno de sus vectores deberı́a ser C.L. de los restantes.
Supongamos (para fijar ideas) que u2 = α3 u3 + . . . + αr ur . Pero entonces también
tendrı́amos la igualdad u2 = 0u1 + α3 u3 + . . . + αr ur , de donde resultarı́a que U
no serı́a L.I.
Ahora bien, ¿qué ocurre si a un conjunto U L.I. le agregamos un vector? Es claro

que si ese vector es C.L. de U entonces el nuevo conjunto (ampliado con ese vector)
ya no será L.I. Sin embargo, si el vector que agregamos no es C.L. de U , el conjunto
ampliado seguirá siendo L.I. Esta importante propiedad es demostrada en el próximo
teorema.
Teorema 3.4.3. Ampliación de un conjunto L.I.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto L.I. Si v ∈ Rn no es C.L. de U entonces
V = {u1 , u2 , . . . , ur , v} también es L.I.
Demostración. Para probar que V es L.I. podemos intentar probar que la única C.L. de
V que da o es la trivial. Supongamos entonces que
o = λ1 u1 + λ2 u2 + . . . + λr ur + βv (3.1)
Queremos demostrar que necesariamente λ1 = λ2 = . . . = λr = β = 0. Ahora bien,

¿qué ocurre si β no fuese 0? Si β 6= 0 entonces de 3.1 podrı́amos despejar el vector v
obteniendo:
−λ1 −λ2 −λr
v= u1 + u2 + . . . + ur
β β β
Pero esto es absurdo, ya que por hipótesis v no es C.L. de U . Hemos llegado a probar que
β = 0. Como β = 0 la igualdad 3.1 queda:
o = λ1 u1 + λ2 u2 + . . . + λr ur
Esta es una C.L. de U que da como resultado o. Como por hipótesis U es L.I. sabemos que
la única C.L. de U que da o es la trivial, de donde se deduce que λ1 = λ2 = . . . = λr = 0.
♠
El próximo resultado muestra que también se mantiene la independencia lineal de un

conjunto si cambiamos uno de sus vectores por una “adecuada” C.L. de todos los vectores
del conjunto.
Teorema 3.4.4. Modificación de un conjunto L.I.

Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto L.I. Si u′1 = α1 u1 + α2 u2 + . . . + αr ur con
α1 6= 0 entonces el conjunto V = {u′1 , u2 , . . . , ur } también es L.I. (El conjunto V coincide
con U en todos los vectores salvo en el primero de ellos en donde se ha sustituido u1 por
u′1 ).
Demostración. Vamos a probar que la única C.L. de V que da o es la trivial. Supongamos
entonces que
λ1 u′1 + λ2 u2 + . . . + λr ur = o (3.2)
Queremos demostrar que necesariamente λ1 = λ2 = . . . = λr = 0. En primer lugar
sustituimos en 3.2 la expresión u′1 = α1 u1 + α2 u2 + . . . + αr ur obteniendo:
λ1 (α1 u1 + α2 u2 + . . . + αr ur ) + λ2 u2 + . . . + λr ur = o
Ordenando resulta:
λ1 α1 u1 + (λ1 α2 + λ2 )u2 + . . . + (λ1 αr + λr )ur = o (3.3)

Como por hipótesis U es L.I. todos los coeficientes de esta última C.L. deben valer 0:


 λ1 α1 = 0



 λ1 α2 + λ2 = 0


..


 .





λ1 αr + λr = 0
Como α1 6= 0, de la igualdad λ1 α1 = 0 resulta λ1 = 0. Luego, el resto de la igualdades

quedan:
λ2 = 0 , . . . . . . , λr = 0
y eso es lo que querı́amos demostrar. ♠
Ejemplo 3.4.4. Sea U = {u, v} ⊂ Rn un conjunto L.I. Vamos a probar de dos formas
diferentes que V = {2u − v, u + 3v} también es L.I.
(1) Para intentar probar que V es L.I. consideramos una C.L. de V igualada al vector
nulo:
λ1 (2u − v) + λ2 (u + 3v) = o
Tenemos que demostrar que necesariamente λ1 = λ2 = 0. Ordenando queda:
(2λ1 + λ2 )u + (−λ1 + 3λ2 )v = o
Como U = {u, v} es L.I. ambos coeficientes de la última C.L. deben ser nulos. Tenemos
entonces que: 2λ1 + λ2 = 0 y −λ1 + 3λ2 = 0. Resolviendo este sistema de dos ecuaciones
con dos incógnitas se obtiene λ1 = λ2 = 0 y eso prueba que V es L.I.
(2) Una manera alternativa de probar la afirmación consiste en utilizar (con cuidado) el
teorema anterior de “modificación”. Partimos de U = {u, v} L.I. En un primer paso modi-
ficamos el vector u por 2u−v. Como en esta C.L. el coeficiente de u (vector modificado) no
es 0, el teorema anterior nos permite asegurar que U ′ = {2u−v, v} es L.I.. Ahora volvemos
a aplicar el teorema, pero en este caso al conjunto U ′ . Ahora, en U ′ , vamos a modificar
el vector v por una C.L. de los dos vectores de U ′ . Como queremos llegar a u + 3v, en
lugar de v ponemos 12 (2u − v) + 72 v. De esta manera llegamos a que V = {2u − v, u + 3v}
también es L.I.
Ejercicio 3.4.1. En los siguientes casos investigue si el conjunto U es L.I. En el caso en

que no lo sea, exprese uno de sus vectores como combinación lineal de los restantes.
            
 1 0 0   −1 1 1 
(1) U =  2  ,  5  ,  0  (2) U =  1  ,  −1  ,  1 
   
3 6 7 1 1 −1
             
 1 1 2   1 1 1 
(3) U =  2  ,  1  ,  3  (4) U =  1  ,  2  ,  1 
   
3 1 4 1 1 3
  
        

 1 1 3 
 
 1 2 2 

   
0   2   2 −1   1   −1
(5) U =   ,   ,   (6) U =   0  ,  1  ,  1
    


 0   1   1 
 



   
1 1 3 1 0 1
     
 a −1 0 
a 8
(7) U = , (8) U =  a2  ,  a  ,  2a2 
2 a  
1 a a2 + 1
(En las dos últimas partes se deberá discutir según a ∈ R).
     

 1 2 1  
   0   −3 
1
Ejercicio 3.4.2. Se considera el conjunto U =   −1  ,  1  ,  5 .
    

 
 
−1 3 9
1. Pruebe que U es L.D.
2. Encuentre todos los subconjuntos de U que son L.I.
3. ¿Es cierto que para todo conjunto L.D. en R4 todos sus subconjuntos, con excepción
del propio conjunto y del vacı́o, son L.I.?
Ejercicio 3.4.3. Investigue si las siguientes afirmaciones son verdaderas o falsas.
1. Si U es un conjunto de R4 con cinco o más vectores entonces U es L.D.
2. Si U es un conjunto L.D. de R4 entonces contiene cinco o más vectores.
3. Sea U un subconjunto L.I. de Rn que contiene cinco vectores. Entonces n ≥ 5.
4. Sea U un subconjunto L.D. de Rn que contiene cuatro vectores. Entonces n ≥ 4.
Ejercicio 3.4.4. Sean U = {u1 , u2 , . . . , up } ⊂ Rn , A una matriz n × n y V el conjunto
definido por: V = {A.u1 , A.u2 , . . . , A.up }. Investigue si la siguientes afirmaciones son
verdaderas o falsas. (En caso de ser verdaderas demuestre y, en caso contrario, encuentre
un contraejemplo).
1. Si U es L.D. entonces V es L.D.
2. Si V es L.D. entonces U es L.D.
3. Si U es L.I. entonces V es L.I.
4. Si V es L.I. entonces U es L.I.
¿Cambian las respuestas si se supone que A es invertible?
Ejercicio 3.4.5. Sea U = {u, v, w} ⊂ Rn un conjunto L.I.
Demuestre que V = {u + v, u − v, u + v + w} también es L.I.
Ejercicio 3.4.6. Sea {u, v, w} ⊂ Rn un conjunto L.I. Indique si los siguientes conjuntos
son L.I. o L.D. justificando la respuesta.
A = {u, u + v} , B = {u, u + v, u + v + w} , C = {u, v + w, u + v + w}
Ejercicio 3.4.7. Se consideran u, w ∈ R3 . Analice, justificando, si son verdaderas o falsas

las siguientes afirmaciones:
1. Si V = {u, w} es L.I. entonces T = {2u, u + w} es L.I.
2. Si T = {2u, u + w} es L.I. entonces V = {u, w} es L.I.
Capı́tulo 4
Subespacios vectoriales de Rn
En los capı́tulos anteriores se trabajó con operaciones y propiedades de los elementos de

R2 , R3 y más en general de Rn , elementos a los que llamamos vectores. El espacio Rn
con las operaciones definidas con anterioridad, forma una estructura que recibe el nombre
de espacio vectorial real y es el estudio de ésta el centro de este capı́tulo. Ahora, la
estructura de espacio vectorial real no es propia de Rn , sino que abarca también a otros
conjuntos sobre los cuales se hará una breve mención.
4.1. Espacios vectoriales reales

Si bien nos enfocaremos en el estudio de Rn , comenzamos definiendo la estructura de
espacio vectorial real de una forma más general.
Definición 4.1.1. Espacio vectorial real.

Sea E un conjunto no vacı́o en el cual están definidas dos operaciones que llamaremos
suma y producto por un escalar1 respectivamente. Diremos que E es un espacio vectorial
real si estas operaciones cumplen las siguientes propiedades:
(S1) Asociativa: (u + v) + w = u + (v + w) , ∀ u, v, w ∈ E.
(S2) Conmutativa: u + v = v + u , ∀ u, v ∈ E.
(S3) Existencia de neutro: Existe o ∈ E tal que o + u = u , ∀ u ∈ E.
(S4) Existencia de opuesto: Para cada u ∈ E existe −u ∈ E tal que u + (−u) = o.
(P1) Asociativa: (λβ) u = λ (βu) , ∀ λ, β ∈ R, ∀ u ∈ E.
(P2) Existencia de neutro real: 1u = u , ∀ u ∈ E.
(P3) Distributiva respecto de la suma en R: (λ + β) u = λu + βu , ∀ λ, β ∈ R, ∀ u ∈ E.
(P4) Distributiva respecto de la suma en E: λ (u + v) = λu + λv , ∀ λ ∈ R, ∀u, v ∈ E.
Ejemplo 4.1.1. El espacio E = Rn , con las operaciones de suma de vectores y producto

de un escalar por un vector definidas con anterioridad, es un espacio vectorial real.
1
Recordemos que llamamos escalares a los números reales.
92 Capı́tulo 4. Subespacios vectoriales de Rn
Ejemplo 4.1.2. El conjunto E = Mm×n de todas las matrices de tamaño m × n, con-

siderando las operaciones usuales de suma de matrices y producto de un escalar por una
matriz, es un espacio vectorial real.
Ejemplo 4.1.3. Si I ⊂ R es un intervalo (puede ser de la forma [a, b] o incluso el propio
R) se representa con F(I) al conjunto de todas las funciones definidas en I a valores
reales. Este conjunto es un espacio vectorial real si definimos las operaciones de suma
de funciones y producto de un número por una función de manera habitual, esto es:
(f + g)(x) = f (x) + g(x) y (λf )(x) = λf (x) , ∀ x ∈ R, ∀ λ ∈ R.
Si E es un espacio vectorial real, existen subconjuntos de E que son en sı́ mismos espa-
cios vectoriales reales al considerar las mismas operaciones que las definidas en E. Estos
subconjuntos se llaman subespacios vectoriales de E.
Definición 4.1.2. Subespacio vectorial
Sean E un espacio vectorial real y S un subconjunto no vacı́o de E. Diremos que S es un
subespacio vectorial de E si se cumplen las siguientes condiciones
1. La suma de dos elementos cualesquiera de S es un elemento de S.
2. El producto de número real cualquiera por un elemento cualquiera de S es un ele-

mento de S.
Cuando esto sucede se dice que las operaciones son cerradas en S, pues al operar con
elementos de S (sumándolos o multiplicándolos por números) no nos salimos del subcon-
junto S. Es claro que las mismas propiedades que cumplı́an las operaciones en E también
se seguirán cumpliendo en S y, por lo tanto, S es en sı́ mismo un espacio vectorial real al
restringir a S las mismas operaciones que las definidas en E.
Observación 4.1.1. Dos subespacios vectoriales particulares.
Dado un espacio vectorial E, es inmediato verificar que los siguientes subconjuntos de E
son subespacios vectoriales de E:
el propio espacio E.
el conjunto formado por solamente el elemento nulo: {o}
Proposición 4.1.1. Sean E un espacio vectorial real y S un subespacio vectorial de E.

Entonces
1. o es un elemento de S.
2. si S 6= {o} entonces S tiene una cantidad infinita de elementos.
Demostración.
1. S es no vacı́o, por lo que existe al menos un elemento u en S. Como S es un
subespacio vectorial, el producto de cualquier número real por u es un elemento
de S, en particular 0u = o pertenece a S.
2. Si S es no vacı́o y S 6= {o} entonces existe en S un elemento u tal que u 6= o.
Luego λu ∈ S para todo λ ∈ R. Si λ1 6= λ2 entonces λ1 u 6= λ2 u (como el lec-
tor podrá verificar fácilmente). Se deduce que S contiene una cantidad infinita de
elementos.
4.1. Espacios vectoriales reales 93
Observación 4.1.2. Una definición alternativa de subespacio vectorial.

En la definición de subespacio vectorial se exige que el conjunto S sea no vacı́o. Además,
en la proposición 4.1.1 se demostró que si S es un subespacio de un espacio vectorial
E entonces necesariamente debe contener al elemento nulo. Resulta entonces que en la
definición de subespacio vectorial podrı́amos haber sustituido la condición de ser S no
vacı́o por la de o ∈ S.
Ejemplo 4.1.4. Ver ejemplo 4.2.1
Ejemplo 4.1.5. El conjunto S de todas las matrices diagonales2 de tamaño 2 × 2 es un

subespacio vectorial de M2×2 . En efecto, verifiquemos las condiciones de la definición de
subespacio:

0 0
1. La matriz nula o = es una matriz diagonal por lo que pertenece a S.
0 0
2. Si A y B son dos elementos de S, entonces

a11 0 b11 0 a11 + b11 0
A+B = + =
0 a22 0 b22 0 a22 + b22
es una matriz diagonal y por lo tanto pertenece a S.

3. Si A es un elemento de S, entonces

a11 0 λa11 0
λA = λ =
0 a22 0 λa22
que es un elemento de S cualquiera sea λ ∈ R.
Ejemplo 4.1.6. El conjunto C(I), de las funciones continuas en un intervalo I, es un

subespacio vectorial de F(I), conjunto de todas las funciones definidas en I a valores
reales. En efecto, sabemos que:
1. La función nula o es continua en I.
2. Si f y g son dos funciones continuas en I entonces f + g es continua en I.
3. Si f es una función continua en I y λ ∈ R entonces λf es continua en I.
Ejemplo 4.1.7. El conjunto D(I), de las funciones derivables en I, es un subespacio

vectorial de C(I) (y, por lo tanto, también de F(I)) pues sabemos que:
1. La función nula o es derivable en I.
2. Si f y g son dos funciones derivables en I entonces f + g es derivable en I.
3. Si f es una función derivable en I y λ ∈ R entonces λf es derivable en I.
Ejemplo 4.1.8. El conjunto P, de todos los polinomios es un subespacio vectorial del

conjunto de todas las funciones definidas en R a valores reales. En efecto:
1. La función nula pertenece a P.
2. Si f y g son dos polinomios entonces f + g también lo es.
3. Si f es un polinomio entonces λf también lo es, ∀λ ∈ R.
2
Una matriz A = ((aij )) n × n es diagonal si aij = 0 ∀i 6= j, i, j = 1, . . . , n.
Ejemplo 4.1.9. El conjunto Pn , de los polinomios de grado menor o igual que n (incluido
el polinomio nulo), es un subespacio vectorial de P (y, por lo tanto, también de F(R)).
En efecto:
1. La función nula pertenece a Pn .
2. Si f y g son dos polinomios de grado menor o igual que n entonces f + g también lo
es.
3. Si f es un polinomio de grado menor o igual que n entonces λf también lo es, ∀λ ∈ R.
Una condición equivalente para que un conjunto sea un subespacio vectorial es la que se
enuncia a continuación.
Proposición 4.1.2. Sean E es un espacio vectorial real y S un subconjunto no vacı́o de E.

Entonces S es subespacio vectorial de E si, y solo si, αu+ βv ∈ S , ∀ α, β ∈ R, ∀ u, v ∈ S.
Demostración.
(=⇒) Sean u, v ∈ S y α, β ∈ R. Como S es subespacio se tiene que αu ∈ S y βv ∈ S.

Utilizando nuevamente el hecho de que S es subespacio la suma αu + βv es un
elemento de S.
(⇐=) Por hipótesis αu + βv es un elemento de S , ∀α, β ∈ R, ∀u, v ∈ S.

1. Tomando α = 1 y β = 1 resulta que 1 u + 1 v = u + v ∈ S , ∀u, v ∈ S.
2. Si β = 0 se tiene que αu + 0 v = αu + o = αu ∈ S , ∀α ∈ R, ∀u ∈ S.
♠
Ejercicio 4.1.1. En cada uno de los siguientes casos investigue si la afirmación dada es
verdadera o falsa. En caso de ser verdadera deberá demostrarla y, en caso de ser falsa,
deberá encontrar un contraejemplo.
1. El conjunto S de todas las matrices n × n que tienen traza nula es un subespacio de
Mn×n .
2. El conjunto L∞ (I) = { f : I → R / f está acotada en I } es un subespacio de F(I).
3. El conjunto C([a, b]) es un subespacio de L∞ ([a, b]).
4. El conjunto C(R) es un subespacio de L∞ (R).
5. El conjunto S de todos los polinomios que se anulan en x = 1 y en x = 3 es un
subespacio de P.
6. El conjunto S de todos los polinomios de grado 2 es un subespacio de P.
Rb
7. El conjunto S = { f ∈C([a,b])/ a f = 0} es un subespacio de C([a, b]).
Ejercicio
T 4.1.2. Sean E un espacio vectorial y S1 , S2 subespacios de E. Demuestre que
S1 S2 también es un subespacio de E.
4.2. Subespacios vectoriales de Rn 95
4.2. Subespacios vectoriales de Rn

Si bien puede desarrollarse la teorı́a de subespacios de espacios vectoriales reales en general,
nos centramos en los subespacios del espacio vectorial Rn . Es ası́ que, en lo que sigue,
cada vez que hagamos referencia a un espacio vectorial real se entenderá Rn . Redefinamos
entonces el concepto de subespacio para el este caso particular.
Definición 4.2.1. Subespacios de Rn .
Diremos que un subconjunto S de Rn es un subespacio de Rn si verifica:
1. o ∈ S.
2. Cualesquiera sean u, v ∈ S se cumple que u + v ∈ S.
3. Cualquiera sea u ∈ S y cualquiera sea el número λ ∈ R se cumple que λ u ∈ S.

Lo que exige esta definición es que al operar con vectores de S (sumándolos o multi-
plicándolos por números) obtengamos como resultado nuevos vectores de S (es decir que
no nos salgamos de S), esto es, las operaciones son cerradas en S.
Observación 4.2.1. Dos subespacios particulares.
Es inmediato verificar que Rn y {o} son subespacios vectoriales de Rn .

x 2
Ejemplo 4.2.1. Probaremos que S = ∈ R : −x + y = 0 es un subespacio de
y
R2 .
x
En primer lugar observemos que los elementos de S son aquellos vectores ∈ R2 que
y
satisfacen la condición −x + y = 0, es decir, S está formado por los vectores de R2 que
tienen ambas componentes iguales, por lo que puede escribirse

x 2 x 2
S= ∈ R : −x + y = 0 = ∈R :x∈R
y x
Analizamos entonces el cumplimiento de las condiciones planteadas en la definición 4.2.1:

0
1. o = ∈ S ya que las componentes del vector nulo son iguales.
0

x1 x2 x1 x2
2. Si u = yv= pertenecen a S entonces u = yv= .
y1 y2 x1 x2
Luego el vector suma

x1 x2 x1 + x2
u+v = + =
x1 x2 x1 + x2
verifica la condición de pertenencia a S.

x x
3. Si u = es un vector de S, entonces u = .
y x

x λx
Entonces el vector λu = λ = pertenece a S, ∀ λ ∈ R.
x λx
Por lo tanto S es un subespacio de R2 , que representa además a la recta

de ecuación y = x,
1
esto es, a la recta que pasa por el origen o y es paralela al vector .
1

x
Ejemplo 4.2.2. T = ∈ R2 : −x + y = 1 no es un subespacio de R2 , pues T no
y
contiene al vector nulo o.

x
Ejemplo 4.2.3. R = ∈ R : x ≥ 0 no es subespacio de R2 pues, por ejemplo,
2
y

4 4 −12
si bien es un elemento de R, el vector −3 = no lo es.
−2 −2 6

x
Ejemplo 4.2.4. W = :y= ∈ R2 x2
no es un subespacio de R2 .
y

1 2
Basta considerar los vectores u = y en W y observar que el vector suma
1 4

1 2 3
u+v = + = es tal que 5 6= 32 por lo que no satisface la condición
1 4 5
de pertenencia al conjunto W .
S T
x
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
x
x
x
x
x
x
x
x
x
x
x
R W
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Figura 4.1: S es un subespacio de R2 , T , R y W no son subespacios de R2 .
  
 x 
Ejemplo 4.2.5. S =  y  ∈ R3 : x + 2y − z = 0 es un subespacio de R3 .
 
z
Comenzamos como en el ejemplo 4.2.1, observando que los elementos de S son aquellos
 
x
vectores  y  ∈ R3 que satisfacen la condición x + 2y − z = 0, es decir
z
     
 x   x 
S =  y  ∈ R3 : x + 2y − z = 0 =  y  ∈ R3 : x, y ∈ R
   
z x + 2y
 
0
1. Resulta inmediato verificar que o =  0  ∈ S.
0
   
x1 x2
2. Si u =  y1  yv=  y2  son dos vectores en S, el vector suma
z1 z2
     
x1 x2 x1 + x2
u+v = y1 + y2 = y 1 + x2 
x1 + 2y1 x2 + 2y2 (x1 + x2 ) + 2(y1 + y2 )
verifica la condición de pertenencia a S.

 
x
3. Si u =  y  es un vector de S, entonces
z
   
x λx
λu = λ  y = λy 
x + 2y λ(x + 2y)
pertenece a S para todo λ ∈ R.
Probamos entonces que S es un subespacio R3 . Observemos además que el subespacio S

es el plano que pasa por el origen o y tiene a x + 2y − z = 0 como ecuación reducida.
Observación 4.2.2. En el ejemplo 4.2.1 se probó que la recta de ecuación y = x es un

subespacio de R2 , mientras que en el ejemplo 4.2.5 se demostró que el plano de ecuación
x + 2y − z = 0 es un subespacio de R3 . Ahora, estos resultados no son peculiaridades de
estos ejemplos sino que, se puede demostrar, que toda recta en R2 que pasa por el origen
es un subespacio de R2 , y que toda recta y todo plano en R3 que pasen por el origen son
subespacios de R3 (ejercicio 4.2.5). Es muy fácil visualizar estos resultados . Por ejemplo,
veamos que un plano Π en R3 que pasa por el origen es un subespacio de R3 :
1. o ∈ Π pues Π pasa por el origen o.
2. Si u y v son dos vectores en Π entonces u + v ∈ Π ya que u + v es la diagonal del

paralelogramo cuyos lados conforman u y v.
3. Si u es un vector en Π entonces λu ∈ Π para cualquier escalar λ pues λu está en

una recta que contiene a u.
z
Π
u+v
v
λu
u
o
y
Con argumentos totalmente análogos se muestra que las rectas que pasan por el origen en
R2 y R3 son subespacios vectoriales de R2 y R3 respectivamente.
Es más, puede probarse que en realidad éstos, junto con todo el espacio y el conjunto
formado solo por el vector nulo, son los únicos subespacios de R2 y R3 respectivamente.
Definición 4.2.2. Núcleo de una matriz.

Sea A una matriz m × n. El núcleo de A es, por definición, el conjunto:
N (A) = { x ∈ Rn / Ax = o }
Observemos que el núcleo de A coincide con el conjunto solución del sistema lineal ho-
mogéneo Ax = o.
Proposición 4.2.1. El núcleo de una matriz es un subespacio.

Si A es una matriz m × n entonces N (A) es un subespacio de Rn .
Demostración.
En la demostración que sigue indicamos con om y on a los vectores nulos de Rm y Rn
respectivamente. Se tiene:
1. on pertenece a N (A) pues Aon = om .
2. Si u y v son vectores en N (A), el vector suma u + v satisface
A(u + v) = Au + Av = om + om = om
de donde resulta que u + v pertenece a N (A).
3. Si u es un vector de N (A), el vector λu pertenece a N (A) pues
A(λu) = λ(Au) = λom = om
El siguiente teorema indica que, si consideramos el conjunto formado por todas las com-
binaciones lineales de un cierto subconjunto U = {u1 , u2 , . . . , ur } de Rn , se obtiene un
subespacio que recibe el nombre de subespacio generado por U .
Teorema 4.2.1. Subespacio de las combinaciones lineales.

Sean U = {u1 , u2 , . . . , ur } ⊂ Rn y S = { x ∈ Rn / x es combinación lineal de U }.
Entonces S es un subespacio vectorial de Rn .
Demostración.
1. o pertenece a S ya que o es combinación lineal de cualquier conjunto, basta escribir

o = 0u1 + 0u2 + . . . + 0un .
2. Si v y w son dos elementos de S entonces existen α1 , α2 , . . . , αr y β1 , β2 , . . . , βr en R

tales que v = α1 u1 +α2 u2 +. . . +αr ur y w = β1 u1 +β2 u2 +. . . +βr ur . Luego el vector
suma v+w puede ser escrito como v+w = (α1 +β1 )u1 +(α2 +β2 )u2 +. . .+(αr +βr )ur
por lo que resulta ser combinación lineal de U y, por lo tanto, un elemento de S.
3. Si v ∈ S existen α1 , α2 , . . . , αr ∈ R tales que v = α1 u1 + α2 u2 + . . . + αr ur . Luego

λv = (λα1 )u1 + (λα2 )u2 + . . . + (λαr )ur por lo que λv pertenece a S. ♠
Definición 4.2.3. Subespacio generado por un conjunto.

Si U = {u1 , u2 , . . . , ur } ⊂ Rn entonces el conjunto S = { x ∈ Rn / x es C.L. de U } (que
es subespacio por el teorema anterior), recibe el nombre de subespacio generado por U
y lo denotamos como S = L(U ).
Observación 4.2.3. Hasta ahora, cuando querı́amos demostrar que un conjunto S era un
subespacio de Rn , necesariamente debı́amos verificar el cumplimiento de las condiciones
1. o ∈ S
2. u + v ∈ S , ∀u, v ∈ S
3. λu ∈ S , ∀λ ∈ R, ∀u ∈ S
Ahora bien, el teorema anterior nos permite un camino alternativo (y en muchos casos más
económico). En efecto, para probar que un conjunto S es un subespacio de Rn , podemos
intentar encontrar un conjunto U de modo que S = L(U ). Si lo logramos, el problema
quedará resuelto, pues ya sabemos que L(U ) es un subespacio
  de Rn . 

 x 

  
y 4
 ∈ R /x + z = 0, y + t = 0
Supongamos, por ejemplo, que se quiere probar que S =   z 

 

 
t
es un subespacio de R4 . Basta observar que todos los vectores de S son de la forma
    
x 1 0
 y   0
+y 1 
  
 −x  = x  −1
  
  0 
−y 0 −1
   

 1 0 
   1 
0
esto es, todos los vectores de S son combinación lineal de U =  , 


 −1   0 

 
0 −1
Entonces S = L(U ) por lo que S es un subespacio de R .4
     
 1 2 4 
Ejemplo 4.2.6. Si U =  2  ,  1  ,  5  , veamos cómo encontrar el subes-
 
0 5 5
pacio L(U ). Para ello buscamos qué condición o condiciones debe cumplir un vector de R3
para pertenecer a L(U ):
         
x 1 2 4 x
 y  ∈ L(U ) ⇔ ∃ α1 , α2 , α3 ∈ R : α1  2  + α2  1  + α3  5  =  y 
z 0 5 5 z
    
1 2 4 α1 x
⇔ el sistema  2 1 5   α2  =  y  es compatible.
0 5 5 α3 z
     
1 2 4 x 1 2 4 x 1 2 4 x
 2 1 5 y  ∼  0 −3 −3 −2x + y  ∼  0 −3 −3 −2x + y 
0 5 5 z 0 5 5 z 0 0 0 −10x + 5y + 3z
Luego el sistema es compatible ⇔ −10x + 5y + 3z = 0 por lo que
  
 x 
L(U ) =  y  ∈ R3 / − 10x + 5y + 3z = 0
 
z
Otra forma de hallar el subespacio L(U ) consiste en observar que

     
4 1 2
 5  = 2 2  + 2 1 
5 0 5
     
4  1 2 
por lo que  5  es C.L. de  2  ,  1  (el conjunto U es L.D.). Ası́, este vector
 
5 0 5
pertenece al plano determinado por los otros  dos.Calculando
  la ecuación del plano que pasa
1 2  x = α1 + 2α2
por el origen o y es paralelo a los vectores  2  y  1  se obtiene y = 2α1 + α2

0 5 z = 5α2
como ecuaciones paramétricas y −10x + 5y + 3z = 0 como reducida, entonces
  
 x 
L(U ) =  y  ∈ R3 / − 10x + 5y + 3z = 0
 
z
Ejercicio 4.2.1. Determine cuáles de los siguientes conjuntos son subespacios de R2 e

interprete geométricamente el resultado:

x 2 x 2
(1) S = ∈ R : −3x + y = 0 , (2) S = ∈ R : 2x = 0
y y

x 2 x 2
(3) S = ∈ R : x − 2y = 3 , (4) S = ∈ R : x ≥ 0, y ≥ 0
y y
[
x x
(5) S = ∈ R2 : x ≥ 0, y ≥ 0 ∈ R2 : x ≤ 0, y ≤ 0
y y
Ejercicio 4.2.2. Determine cuáles de los siguientes conjuntos son subespacios de R3 e

interprete geométricamente el resultado:
     
 x   x 
(1) S =  y  ∈ R3 : y = x + z , (2) S =  y  ∈ R3 : y = 0, z = 0
   
z z
     
 x   x 
(3) S =  y  ∈ R3 : z = 0 , (4) S =  y  ∈ R3 : x − y + z − 1 = 0
   
z z
     
 x   x 
(5) S =  y  ∈ R3 : x2 + y 2 − z = 0 , (6) S =  y  ∈ R3 : x2 + y 2 + z 2 = 0
   
z z
Ejercicio 4.2.3. Halle el núcleo de las siguientes matrices:
   
−3 1 1 1 1 −1 0
2 1 4
A= B =  1 −1 1  C =  −1 2 −5 −3 
−1 1 1
0 2 −4 5 3 −1 2
Ejercicio 4.2.4. Sea S un subconjunto no vacı́o de Rn . Pruebe que S es subespacio si, y

solo si, αu + βv ∈ S , ∀ α, β ∈ R, ∀ u, v ∈ S.
Ejercicio 4.2.5. Demuestre:

x
1. S = ∈ R : ax + by = 0 es un subespacio de R2 cualesquiera sean a, b ∈ R.
2
y
  
 x 
2. S =  y  ∈ R3 : ax + by + cz = 0 es un subespacio de R3 cualesquiera sean
 
z
a, b, c ∈ R.
  
 x 
3. S =  y  ∈ R3 : ax + by + cz = 0, dx + ey + f z = 0 es un subespacio de R3
 
z
cualesquiera sean a, b, c, d, e, f ∈ R.
Observación: En este ejercicio se demuestra que toda recta en R2 que pasa por el origen
es un subespacio de R2 , y que todo plano y toda recta en R3 que pasan por el origen son
subespacios de R3 .
Ejercicio 4.2.6. Se consideran los conjuntos:

     
 x   x 
S =  y  ∈ R3 : −x + y = 0 y T =  y  ∈ R3 : x + y − z = 0
   
z z
1. Demuestre que S y T son dos subespacios de R3 .

(Sugerencia: utilice el ejercicio 4.2.5).
2. Calcule S ∩ T y determine si S ∩ T es también un subespacio R3 .
3. Calcule S ∪ T y determine si S ∪ T es también un subespacio R3 .
Ejercicio 4.2.7. Sean A y B dos matrices de dimensiones m × n y n × p respectivamente.
1. Pruebe que N (B) ⊂ N (A.B).
2. Encuentre un ejemplo de dos matrices A y B para las cuales N (B) = N (A.B).
3. Encuentre un ejemplo de dos matrices A y B para las cuales N (B) está incluido
estrictamente en N (A.B).
Ejercicio 4.2.8. Sean M y N dos matrices m × n y consideremos el conjunto
S = { x ∈ Rn / M.x = N.x }
1. Pruebe que S es un subespacio de Rn .
2. Si M = N ¿qué se puede decir de S?
3. Averigue si las siguientes afirmaciones son verdaderas o falsas justificando la res-
puesta:
(i) Si M 6= N entonces necesariamente S = {o}.
(ii) Si M 6= N entonces necesariamente S 6= Rn .
Ejercicio 4.2.9. En cada uno de los siguientes casos encuentre las condición (o con-
diciones) que deben verificar las componentes de un vector para que éste pertenezca al
subespacio generado por el conjunto U :

2 1 1 −3 1
(1) U = , (2) U = , (3) U =
3 5 0 0 −1
      
 1 0 0 
1 −2 3
(4) U = , , (5) U =  1  , 1
  , 0 

2 4 3  
0 1 1
           
 −1 1   4 −1 1 0 
(6) U =  1  ,  2  (7) U =  −2  ,  1  ,  2  ,  0 
   
1 3 1 1 0 1
       
       1 1 1 0 
 1 2 2  
        
0   1   0   1 
(8) U =  1  ,  2  ,  2  (9) U =  , ,
 0   1   1   0 ,
  
1 2 1 
 

0 1 0 1
4.3. Generador de un subespacio vectorial de Rn

Definición 4.3.1. Generador de un subespacio vectorial de Rn .
Sean S un subespacio de Rn y U = {u1 , u2 , . . . , ur } ⊂ S un conjunto de vectores de S.
Diremos que U es generador de S si todos los elementos de S pueden ser escritos como
combinación lineal de U .
Es decir, U es generador de S si, y solo si, para cada v ∈ S existen escalares α1 , α2 , . . . , αr
tales que v = α1 u1 + α2 u2 + . . . + αr ur .
4.3. Generador de un subespacio vectorial de Rn 103
g
Notación: Si U es generador de S indicamos U → S.
Observación 4.3.1. W es generador de L(W ).

g
Si W ⊂ Rn y L(W ) es el subespacio generado por W , entonces es claro que W → L(W ).

1 −1
Ejemplo 4.3.1. U = , es generador de R2 .
2 1
Veamos 2
que todo vector de R puede expresarse como combinación lineal del conjunto
U.
x 1 −1 x
es C.L. de U ⇔ existen α1 y α2 en R tales que α1 + α2 =
y 2 1 y

α1 − α2 = x
⇔ el sistema de ecuaciones es compatible. Al escalerizar el sistema
2α1 + α2 = y

1 −1 x 1 −1 x
se obtiene ∼ de donde resulta que el sistema es
2 1 y 0 3 −2x + y

x g
compatible (determinado) para todos los vectores ∈ R2 , entonces U → R2 .
y
x+y −2x + y
Además la solución del sistema es α1 = , α2 = por lo que
3 3

x x+y 1 −2x + y −1
= +
y 3 2 3 1
  
 x 
Ejemplo 4.3.2. S =  y  ∈ R3 : x + 2y − z = 0 es un subespacio vectorial de R3
 
z
(ejemplo 4.2.5).
1. ¿Cómo encontramos un generador  de S?     

x 1 0
Los vectores de S se escriben como  y  = x 0 +y
   1  con x, y ∈ R,
x + 2y 1 2
   
 1 0 
g
por lo que resultan C.L. de U =  0  ,  1  , luego U → S.
 
1 2
     
 1 0 3 
2. ¿Es el conjunto V =  0  ,  1  ,  −1  generador de S?
 
1 2 1
En primer lugar observemos que los dos primeros vectores son los vectores de U
mientras que el tercer vector efectivamente es un vector de S. Es ası́ que U ⊂ V ⊂ S.
Esta observación nos permite responder afirmativamente la pregunta. En efecto,
como U ⊂ V , todo vector que sea C.L. de U también será C.L. de V . Por otra parte,
g
como U → S, todo vector de S es C.L. de U y, por lo tanto, también lo será de V .
   
 1 1 
3. ¿Es el conjunto W =  1  ,  −1  generador de S?
 
3 −1
En primer lugar observamos que W ⊂ S pues ambos vectores pertenecen al subes-

pacio 
 por verificar la condición x + 2y − z = 0.    
x 1 1
 y  es C.L. de W ⇔ existen α1 y α2 en R tales que α1  1  + α2  −1  =
z 3 −1
  
x  α1 + α2 = x
 y  ⇔ el sistema de ecuaciones α1 − α2 = y es compatible.

z 3α1 − α2 = z
   
1 1 x 1 1 x
Escalerizamos y obtenemos  1 −1 y  ∼  0 2 x − y  de donde el
3 −1 z 0 0 x + 2y − z
sistema es compatible (determinado) si, y solo si x + 2y − z = 0, luego el conjunto
de vectores que pueden expresarse como combinación lineal de W coincide con S.
g
Entonces W → S.
    
 1 2 
4. ¿Es el conjunto G =  1  , 2  generador de S?

 
3 6
 
1
G no es generador de S pues, por ejemplo, el vector  −1  pertenece a S pe-
−1
ro
 no puede expresarse como combinación lineal de W debido a que el sistema
 α1 + 2α2 =1
α1 + 2α2 = −1 resulta incompatible como se ve a partir de la escalerización

3α1 + 6α2 = −1
del sistema:
   
1 2 1 1 2 1
 1 2 −1  ∼  0 0 2 
3 6 −1 0 0 −4
Resumiendo
             
 1 0   1 0 3   1 1 
U =  0  ,  1  , V =  0  ,  1  ,  −1  , W =  1  ,  −1 
     
1 2 1 2 1 3 −1
    
 1 2 
son conjuntos generadores de S mientras que G =  1  ,  2  no genera S.
 
3 6
Observación 4.3.2. Un subespacio no está generado de manera única.

En el ejemplo 4.3.2 se demuestra que los conjuntos U, V y W son generadores de S de
donde se deduce que un subespacio no está generado de manera única.
Observación 4.3.3. Generador y sistemas de ecuaciones.

Sean S un subespacio de Rn y U = {u1 , u2 , . . . , ur } un subconjunto de S. De los ejemplos
anteriores se desprende que U es generador de S si, y solo si, para cualquier v ∈ S el sistema
 
λ1
 λ2 
 
MU  .  = v es compatible.
 .. 
λr
Ejemplo 4.3.3. El conjunto canónico.
El conjunto canónico C = {e1 , e2 , . . . , en } es generador de Rn pues (como habı́amos visto
en la observación 3.3.4) todo vector de Rn se puede escribir como C.L. de C.
Teorema 4.3.1. Dependencia lineal de conjuntos generadores.
Sean S un subespacio vectorial de Rn y U = {u1 , u2 , . . . , ur }, r ≥ 2, un generador de S.
Entonces
1. si U es L.D. existe por lo menos un conjunto W ⊂ U, W 6= U , tal que W es
generador de S.
2. si U es L.I. no existe W ⊂ U, W 6= U , tal que W es generador de S.
Demostración.
1. Por hipótesis U es L.D. por lo que al menos un vector de U es combinación lineal de
los restantes vectores de U . Supongamos, sin perder generalidad, que u1 es combina-
ción lineal de {u2 , . . . , ur }. Podemos afirmar entonces existen α2 , . . . , αr ∈ R tales
que
u1 = α2 u2 + . . . + αr ur
g
Sea v ∈ S un vector cualquiera de S. Como U → S, v se puede escribir como C.L.
de U , esto es, existen β1 , β2 , . . . , βr ∈ R tales que
v = β1 u1 + β2 u2 + . . . + βr ur
Luego
v = β1 (α2 u2 + . . . + αr ur )+ β2 u2 + . . . + βr ur = (β1 α2 + β2 ) u2 + . . .+ (β1 αr + βr ) ur
de donde resulta que cualquier vector v de S es combinación lineal de W = {u2 , . . . , ur }.

g
Hemos encontrado entonces un subconjunto W ⊂ U, W 6= U , tal que W → S.
2. Si W ⊂ U pero W 6= U es porque existe algún vector uj de U que no pertenece a W .
Ahora, como U es L.I. resulta que uj no es combinación lineal de W . Esto implica
que uj , que es un elemento de S, no pertenece al subespacio generado por W y, por
lo tanto, W no es generador de S. Conclusión: no existe W ⊂ U, W 6= U , tal que W
es generador de S. ♠
Observación 4.3.4. Reducción de un generador.
De la demostración de la primera parte del teorema anterior surge que si U = {u1 , u2 , . . . , ur }
es un generador del subespacio S y uk ∈ U es C.L. de los restantes vectores de U entonces,
al “quitar” dicho vector, el nuevo conjunto U − {uk } continúa siendo generador de S.
También se concluye que si un generador de un subespacio S de Rn es L.D. entonces
podemos “achicar” ese generador para obtener otro generador de S que sea además L.I.
Como forma de ilustrar este resultado volvamos el ejemplo 4.3.2 donde vimos que
     
 1 0 3 
g
V =  0  ,  1  ,  −1  → S
 
1 2 1
     
3 1 0
Ahora V es L.D. ya que claramente  −1  = 3  0  −  1 . Si quitamos el tercer
1 1 2
vector del conjunto V obtenemos U que se probó es generador de S. Como U está formado
por dos vectores no colineales, es además L.I. Luego éste no puede ser reducido de forma
de obtener otro conjunto generador de S.
Proposición 4.3.1. Modificación de un generador.

Sean S un subespacio vectorial de Rn y U = {u1 , u2 , . . . , ur } un generador de S.
Si u′1 = α1 u1 + α2 u2 + . . . + αr ur y α1 6= 0 entonces el conjunto V = {u′1 , u2 , . . . , ur }
también es generador de S.
Lo que afirma la proposición es que si uno de los vectores de un generador U es suplantado

por una C.L. de U , en la cual el vector sustituido no está multiplicado por 0, entonces
obtenemos un nuevo generador del mismo subespacio.
Demostración.
En primer lugar observemos que, como u′1 es C.L. de U , entonces u′1 ∈ S.
g
Ahora bien, para demostrar que V → S debemos probar que todo vector de S se puede
g
escribir como C.L. de V . Sea entonces v ∈ S. Como U → S, v se puede escribir como C.L.
de U :
∃ β1 , β2 , . . . , βr ∈ R / v = β1 u1 + β2 u2 + . . . + βr ur (1)
Por hipótsis sabemos que u′1 = α1 u1 + α2 u2 + . . . + αr ur . Como α1 6= 0, de la igualdad
anterior podemos despejar u1 obteniendo:
1
u1 = u′1 − α2 u2 − . . . − αr ur (2)
α1
Sustituyendo (2) en (1) resulta:

1 ′

v = β1 u − α2 u2 − . . . − αr ur + β2 u2 + . . . + βr ur
α1 1
Agrupando convenientemente obtenemos que v se pudo expresar como C.L. de V y eso es
lo que querı́amos demostrar. ♠.
     
 1 0 0 
g
Ejemplo 4.3.4. Sabemos que C = {e1 , e2 , e3 } =  0  ,  1  ,  0  → R3
 
0 0 1
Si cambiamos
el primer
 vector
 e1  1− 2e2 + 7e3 , la proposición anterior nos permite
por 5e
 5 0 0 
afirmar que  −2  ,  1  ,  0  también es un generador de R3 .
 
7 0 1
El próximo resultado es fundamental en el desarrollo de esta teorı́a y su demostración se

puede encontrar en el apéndice de este capı́tulo. Recordemos que la cantidad de elementos
de un conjunto finito U se denomina cardinal de U y se simboliza #U .
Teorema 4.3.2. Teorema de Steinitz.

Sean S un subespacio de Rn , U y W dos subconjuntos de S tales que U es L.I. y W es un
generador de S. Entonces
#U ≤ #W
Observación 4.3.5. Cardinal de generadores y conjuntos L.I. en Rn .

El conjunto canónico C = {e1 , e2 , . . . , en } es generador de Rn y también L.I. Como #C = n
del teorema de Steinitz se deduce que cualquier conjunto generador de Rn tiene al menos
n vectores, y que cualquier conjunto L.I. tiene a lo sumo n vectores.
      
 1 1 1 
Ejercicio 4.3.1. Sea U =  1  ,  2  ,  1 
 
1 1 3
1. Demuestre que U es un generador de R3 .
2. Modifique uno de los vectores de U de modo de obtener un nuevo generador de R3 .
3. Pruebe que U es L.I. ¿Es posible reducir U de manera de obtener otro generador de
R3 ?
  
 x 
Ejercicio 4.3.2. Si S =  y  ∈ R3 : −x + y + z = 0 , halle dos conjuntos U y V
 
z
diferentes pero que ambos sean generadores de S.
Ejercicio 4.3.3. Determine un generador de aquellos conjuntos que resultaron ser subes-
pacios en los ejercicios 4.2.1, 4.2.2 y 4.2.3.
Ejercicio 4.3.4. Si U = {u1 , u2 } es un generador de R2 determine si los siguientes con-

juntos son generadores de R2 :
(1) {u1 , u2 , o} , (2) {u1 , u2 , u1 − u2 } , (3) {u1 } , (4) {u1 , u1 + u2 }
Ejercicio 4.3.5. Investigue si las siguientes afirmaciones son verdaderas o falsas justifi-
cando la respuesta.
g
1. Si U → R3 entonces U tiene tres o más vectores.
g
2. Si U es un subconjunto de R3 con tres o más vectores entonces U → R3 .
3. Si U es un conjunto L.D. en R4 entonces U tiene cinco o más vectores.
4. Si U es un conjunto en R4 con cinco o más vectores entonces U es L.D.
5. Si U = {u1 , u2 , u3 } ⊂ R5 entonces existe algún vector de R5 que no es C.L. de U .
4.4. Base y dimensión de un subespacio vectorial de Rn

Si nos preguntan cuál es la dimensión de una recta seguramente responderemos que es
1, de igual forma que imaginamos un plano como un espacio de dimensión 2 y el espacio
R3 tridimensional. En esta sección definiremos el concepto de dimensión de un subespacio
vectorial cualquiera de Rn . Para ello será fundamental el papel que juegan los generadores
que, al mismo tiempo, son conjuntos L.I.
Definición 4.4.1. Base de un subespacio vectorial de Rn .

Sean S un subespacio de Rn y U un subconjunto de S. Diremos que U es una base de S
si es L.I. y generador de S.
b
Notación: Si U es base de un subespacio S escribiremos U → S.
Ejemplo 4.4.1. Base canónica de Rn .

El conjunto C = {e1 , e2 , . . . , en } es L.I. y además generador de Rn por lo que es base de
Rn y recibe el nombre de base canónica de Rn .
Ejemplo 4.4.2. En el ejemplo 4.3.2 el conjunto U es generador de S y es además L.I. por

lo que resulta una base de S. Razonando en forma análoga se concluye que W es también
una base de S, pero V no lo es pues si bien genera S es L.D.
En el ejemplo se muestra que para el subespacio S existen al menos dos conjuntos que
son base de S, ahora podrı́amos preguntarnos ¿todo subespacio S de Rn tiene base? La
respuesta a esta interrogante nos la da el teorema que planteamos a continuación.
Teorema 4.4.1. Existencia de bases de un subespacio.

Si S es un subespacio vectorial de Rn tal que S 6= {o}, entonces existe U base de S.
Demostración.
Como S 6= {o} existe u1 ∈ S tal que u1 6= o y, por lo tanto, el conjunto {u1 } resulta L.I.
Por otra parte, como S es un subespacio de Rn , se tiene que λu1 ∈ S cualquiera sea λ ∈ R,
es decir cualquier combinación lineal de {u1 } pertenece a S, con lo cual L({u1 }) ⊆ S.
g b
Si fuese S = L({u1 }) tendrı́amos que {u1 } → S y es además L.I. entonces {u1 } → S.
Si por el contrario L({u1 }) ⊂ S, L({u1 }) 6= S, existe u2 ∈ S tal que u2 no pertenece a
L({u1 }). Esto implica que u2 no es combinación lineal de {u1 }, o lo que es lo mismo, el
conjunto {u1 , u2 } es L.I. Como antes, debido a que S es un subespacio de Rn , todas las
combinaciones lineales de {u1 , u2 } están en S, esto es L({u1 , u2 }) ⊆ S.
g
Entonces, si L({u1 , u2 }) = S se tiene que {u1 , u2 } → S y además es L.I. por lo que
b
{u1 , u2 } → S, en caso contrario se repite el procedimiento anterior, es decir existe u3 ∈ S
tal que u3 no pertenece a L({u1 , u2 }), etc.
Este proceso finaliza en a los sumo n pasos pues un subconjunto L.I. de Rn tiene como
mucho n vectores. ♠
Proposición 4.4.1. Igualdad en el cardinal de las bases de un subespacio.

Si S es un subespacio vectorial de Rn , U y V son ambas bases de S entonces #U = #V .
4.4. Base y dimensión de un subespacio vectorial de Rn 109
Demostración.
g
)
b
V →S =⇒ V → S
b =⇒ #U ≤ #V (por teorema 4.3.2).
U →S =⇒ U es L.I.
Por otro lado, también es cierto que
)
b
V →S =⇒ V es L.I.
b g =⇒ #V ≤ #U (por teorema 4.3.2).
U →S =⇒ U → S
Se deduce entonces que #U = #V . ♠
Definición 4.4.2. Dimensión de un subespacio vectorial de Rn .

Sea S un subespacio vectorial de Rn .
Si S 6= {o}, llamamos dimensión de S al número de vectores de una base de S.
Si S = {o}, decimos que la dimensión de S es 0.
Notación: Denotamos la dimensión de un subespacio S como dim(S).
Ejemplo 4.4.3. Habı́amos visto que el conjunto canónico es una base de Rn y el cardinal
de este conjunto es n, luego dim(Rn ) = n.
Observación 4.4.1. Sobre la dimensión de un subespacio.

Si S es un subespacio vectorial de Rn entonces, como {o} ⊆ S ⊆ Rn , podemos afirmar
que
0 ≤ dim(S) ≤ n
  
 x 
Ejemplo 4.4.4. La dimensión de S =  y  ∈ R3 : x + 2y − z = 0 es dos.
 
z
   
 1 0 
En el ejemplo 4.3.2 probamos que el conjunto U =  0  ,  1  es base del subes-
 
1 2
pacio S. Como U tiene dos vectores se tiene que dim(S) = 2, lo cual concuerda con la
idea intuitiva de que un plano, que es lo que representa el conjunto S, es un espacio
bidimensional.
Proposición 4.4.2. Si se conoce la dimensión de un subespacio.

Si S es un subespacio vectorial de Rn de dimensión r y V es un subconjunto de S con r
vectores, entonces
b
1. Si V es LI =⇒ V → S.
g b
2. Si V → S =⇒ V → S.
En particular si V es un subconjunto de Rn tal que #V = n entonces son equivalentes:
b
V →S
V es L.I.
g
V →S
Demostración.
Observemos en primer lugar que, como dim(S) = r, el teorema de Steinitz nos permite
afirmar que todos los subconjuntos L.I. de S tienen a lo sumo r vectores, mientras que
todos los generadores de S tienen por lo menos r vectores.
g
1. Alcanza con demostrar que V → S. Supongamos, por reducción al absurdo, que V
S de S. En dicho caso existe w ∈ S tal que w no es C.L. de V . Luego,
no es generador
el conjunto V {w} también serı́a L.I. (teorema 3.4.3). Pero esto es absurdo ya que
en S no puede haber subconjuntos L.I. con más de r vectores.
2. Alcanza con demostrar que V es L.I. Si no lo fuera, serı́a L.D. y existirı́a un vector
v1 ∈ V que no es C.L. de los restantes vectores de V . Debido al teorema 4.3.1 al
quitar este vector, el nuevo conjunto V − {v1 } seguirı́a siendo generador de S. Pero
esto es absurdo ya que S no puede tener generadores con menos de r vectores.
Teorema 4.4.2. Otra caracterización de las bases.
b
Sean S un subespacio de Rn y U un subconjunto de S. Entonces U → S si, y solo si, cada
vector de S se puede expresar de una única forma como combinación lineal de U .
Demostración.
Supongamos que U = {u1 , u2 , . . . ur } es base de S. Esto quiere decir que U es L.I. y
g
generador de S. Sea v un vector cualquiera de S. Como U → S el vector v es C.L.
de U y, por lo tanto, existen α1 , α2 , . . . , αr tales que v = α1 u1 + α2 u2 + . . . + αr ur .
Supongamos que existen β1 , β2 , . . . , βr en R tales que v = β1 u1 + β2 u2 + . . . + βr ur .
Restando miembro a miembro ambas igualdades obtenemos
o = (α1 − β1 ) u1 + (α2 − β2 ) u2 + . . . + (αr − βr ) ur
Como U es L.I. resulta α1 − β1 = 0, α2 − β2 = 0, . . . , αr − βr = 0 y, por lo tanto,

αi = βi , ∀ i = 1, 2, . . . , r. Hemos demostrado entonces que existe una única forma
de escribir v como combinación lineal de U .
Supongamos ahora que cada vector de S se puede expresar de una única forma como
combinación lineal de U .
g
Lo anterior implica claramente que U → S.
Como S es subespacio, el vector nulo o pertenece a S. A partir de nuestra hipótesis
podemos afirmar que o se expresa de una única forma como combinación lineal de
U . Del corolario 3.4.2. deducimos que U es L.I. ♠
Proposición 4.4.3. Sea U ⊂ Rn tal que #U = n. Entonces U es base de Rn si, y solo
si, det (MU ) 6= 0.
Demostración.
n n
Sabemos
 que  U es base de R si, y solo si, para cualquier v ∈ R el sistema de ecuaciones
λ1
 λ2 
 
MU  .  = v es compatible determinado. En este caso el sistema es cuadrado, por lo
.
 . 
λn
que resulta compatible determinado si, y solo si, det (MU ) 6= 0 (recordar el teorema de
Cramer).
Definición 4.4.3. Coordenadas de un vector en una base.

Sean S 6= {o} un subespacio de Rn y U = {u1 , u2 , . . . , ur } una base de S. Sabemos que
para cada v ∈ S existen y son únicos los escalares λ1 , λ2 , . . . , λr de modo que
v = λ1 u1 + λ2 u2 + . . . + λr ur
A los escalares λ1 , λ2 , . . . , λr los llamaremos coordenadas de v en la base
 U. 
λ1
 λ2 
 
El vector de las coordenadas de v en la base U se simbolizará: coordU (v) =  . 
 .. 
λr
Observación 4.4.2. Cálculo de las coordenadas.
Si U = {u1 , u2 , . . . , ur } es una base del subespacio S y v es un vector cualquiera de S
entonces,
 para
 hallar las coordenadas de v en la base U , debemos resolver el sistema
λ1
 λ2 
 
MU  .  = v (que ya sabemos resultará compatible determinado).
 .. 
λr
En el caso en que el subespacio considerado sea el propio Rn el cálculo de la coordenadas
de un vector v en una base U = {u1 , u2 , . . . , un } de Rn puede hacerse utilizando la matriz
b
inversa de MU . En efecto, como U → Rn , det(MU ) 6= 0 por lo que existe (MU )−1 . Se tiene:
   
λ1 λ1
 λ2   λ2 
MU  .  = v ⇐⇒  .  = (MU )−1 v
   
.
 .  .
 . 
λn λn
De todos modos debemos tener en cuenta que presenta igual (o mayor) dificultad hallar
(MU )−1 que resolver el sistema.
     
 −1 1 1 
Ejemplo 4.4.5. El conjunto U =  3  ,  1  ,  2  es base de R3 ya que
 
0 2 3
 
−1 1 1
det (MU ) = det  3 1 2  = −2 6= 0. Calculemos las coordenadas en esta base U de
0 2 3
 
a
un vector v =  b  cualquiera de R3 :
c
   
λ1 −1 1 1 a
En este caso la matriz ampliada del sistema MU .  λ2  = v es  3 1 2 b .
λ3 0 2 3 c
   
−1 1 1 a −1 1 1 a
 0 4 5 3a + b  ←− F2 + 3F1 ∼  0 4 5 3a + b 
0 2 3 c 0 0 −1 3a + b − 2c ←− F2 − 2F3
Por sustitución hacia atrás obtenemos la solución del sistema. Las coordenadas de v en la
base U resultan ser:
1 1
λ1 = (a + b − c), λ2 = (9a + 3b − 5c), λ3 = −3a − b + 2c
2 2
lo cual es equivalente a decir que se cumple la siguiente igualdad:
       
a −1 1 1
 b  = 1 (a + b − c)  3  + 1 (9a + 3b − 5c)  1  + (−3a − b + 2c)  2 
2 2
c 0 2 3
La otra manera de hallar las coordenadas hubiese consistido en hallar la inversa de la matriz
MU para luego realizar el producto (MU )−1 v. Dejamos como ejercicio la verificación del
mismo resultado final por este otro camino indicando como dato que
 
1 1 −1
1
(MU )−1 =  9 3 −5 
2
−6 −2 4
Observación 4.4.3. Las coordenadas de un vector dependen de la base.

1. Como se desprende de la definición, las coordenadas de un vector dependen de la base
que se haya fijado. Un mismo vector puede tener coordenadas
diferentes en bases
−2
diferentes. Por ejemplo, consideremos el vector z = ∈ R2 y las siguientes
2
bases de R2 :

1 3 1 0
U= , y C= ,
1 1 0 1
Es inmediato verificar que

−2 1 3 −2 1 0
=4 −2 y = −2 +2
2 1 1 2 0 1
de donde resulta:

−2 4 −2 −2
coordU = y coordC =
2 −2 2 2
2. Si C = {e1 , e2 , . . . , en } es la base canónica de Rn entonces es claro que

coordC (v) = v , ∀ v ∈ Rn .
3. Si U = {u1 , u2 , . . . , ur } es una base de un subespacio S ¿cuáles son las coordenadas
de ui en la base U ? (i = 1, 2, . . . , r).
En la siguiente proposición se estudia la relación que existe entre las coordenadas de un

mismo vector en diferentes bases de Rn .
Proposición 4.4.4. Cambio de base.

Sean U = {u1 , u2 , . . . , un } y V = {v1 , v2 , . . . , vn } dos bases de Rn . Entonces existe una
única matriz A, de tamaño n × n, tal que:
1. coordV (z) = A.coordU (z) para todo vector z ∈ Rn .
2. Para cada j (entre 1 y n) la columna j-ésima de A coincide con coordV (uj ).
Demostración.
1. Sea z un vector cualquiera de Rn . Sabemos que:
MU . coordU (z) = z y MV . coordV (z) = z
Igualando obtenemos: MU .coordU (z) = MV .coordV (z). Como la matriz MV es inver-

tible (por ser V base de Rn ) podemos multiplicar la igualdad anterior (a izquierda)
por (MV )−1 obtenidendo:
(MV )−1 . MU . coordU (z) = (MV )−1 . MV . coordV (z)
de donde resulta:

(MV )−1 . MU . coordU (z) = coordV (z)
Una matriz A que cumple lo enunciado en la primera parte es entonces A = (MV )−1 .MU
2. Sustitutendo z por el vector uj obtenemos:
coordV (uj ) = A.coordU (uj ) = A.ej = Cj (A) (columna j-ésima de A)
Definición 4.4.4. Matriz de cambio de base.

Manteniendo la misma notación que en la proposición anterior, la matriz A = (MV )−1 .MU
se denomina matriz de cambio de base de la base U a la base V .
La propiedad fundamental de esta matriz viene dada por la igualdad:
coordV (z) = A . coordU (z) , ∀ z ∈ Rn
que nos dice que si multiplicamos dicha matriz por el vector de las coordenadas de z en
la base U obtenemos el vector de las coordenadas de z en la base V .
La matriz de cambio de base de la base U a la base V se simbolizará M .
U →V
Tenemos entonces que
M = (MV )−1 . MU
U →V
Ejercicio 4.4.1. Si S es un subespacio de Rn de dimensión p y U = {u1 , u2 , . . . , ur } ⊂ S,

determine si las siguientes afirmaciones son verdaderas o falsas:
1. si r < p entonces U es L.I.
g
2. si r ≥ p entonces U → S.
Ejercicio 4.4.2.        

 1 −4 −2 1 

   
0 3   5   1
 es base de R4 .
Investigue si U =  0 , 0 , 2 , 1
     


 
 
0 0 0 4
Ejercicio 4.4.3. En cada uno de los casos discuta, según a ∈ R, si el conjunto U es base
de R3 :
           
 2 −a 0   1 a 4 
(1) U =  a  ,  2  ,  0  (2) U =  a  ,  2 , 6 
   
0 0 1 −2 3 −1
Ejercicio 4.4.4. En los siguientes casos se considera L(U ), el subespacio generado por
U . Encuentre una base de L(U ) y calcule su dimensión.
             
 1 2 1   1 2 1 
(1) U =  0  ,  1  ,  1  (2) U =  0  ,  1  ,  1 
   
1 3 2 1 2 2
            
 3 2 1   1 −1 3 
(3) U =  3  ,  2  ,  1  (4) U =  2 , 1 , 0 
   
6 4 2 −1 1 −3
Ejercicio 4.4.5. Demuestre que S es subespacio de R3 , encuentre una base de S y deter-

mine la dimensión de S en cada caso:
     
 x   x 
(1) S =  y  ∈ R3 / 3x + y − 2z = 0 , (2) S =  y  ∈ R3 / x − y = 0
   
z z
     
 x   x 
3 3
(3) S =  y  ∈ R / x − y = 0, z = 0 , (4) S =  y  ∈R /z=0
   
z z
Ejercicio 4.4.6. En cada uno de los siguientes casos:

(a) Pruebe que S es un subespacio de R4 .
(b) Halle una base U de S y calcule dim(S).
(c) Agregue, si es posible, vectores a la base U de forma de obtener una base de R4 .
  

 x1 

 
x 
2  4
1. S =  ∈ R / x 1 + x 2 − x 4 = 0

 x3  

 
x4
  

 x1 

 
x 2

 / x1 + x2 + x3 + x4 = 0 y x2 + 2x3 − x4 = 0
2. S =  x3 

 

 
x4
  

 x 1 

 
x 2

 / x1 + 2x2 + x3 − x4 = 0 y x2 − x3 − x4 = 0
3. S =  x3 

 

 
x4
  

 x1 

 
x2 
4. S =  x3  / x1 + x2 − x3 + x4 = 0 y x1 + 2x2 − 3x3 − 4x4 = 0


 

 
x4
Ejercicio 4.4.7. Encuentre una base (en caso que exista) y la dimensión del núcleo de
cada una de las siguientes matrices:
     
1 0 −1 −1 2 1 1 2 8
A= 0 2 4  B =  2 0 −1  C= 2 4 16 
1 3 3 0 4 1 −1 −2 −8
  
 x 
Ejercicio 4.4.8. Sea S =  y  ∈ R3 : x + y + z = 0, x + ay + az = 0 .
 
z
(a) Demuestre que S es un subespacio vectorial de R3 para todo a ∈ R.
(b) Discuta según a ∈ R la dimensión de S y determine una base de S en cada caso.
Ejercicio 4.4.9. Si U = {u, v, w} es base de R3 demuestre que W = {u + v, u + w, v + w}
también lo es.
Ejercicio 4.4.10. Sean S1 y S2 dos subespacios de Rn tales que S1 ⊂ S2 . Demuestre que
dim(S1 ) ≤ dim(S2 ). (Sugerencia: si dim(S1 ) = r comienze considerando una base U de
S1 con r vectores).
Ejercicio 4.4.11. Sean S1 y S2 dos subespacios de Rn tales que dim(S1 ) = dim(S2 ).
¿Esto implica que necesariamente S1 = S2 ?
2
si U es base de R . En caso
Ejercicio 4.4.12. En cada uno de los casos investigue
a
afirmativo, encuentre las coordenadas del vector en la base U .
b

−1 1 1 −2 0 1
(a) U = , (b) U = , (c) U = ,
4 −1 3 −6 1 0
     
 −1 3 −2 
Ejercicio 4.4.13. Sea U =  0  ,  2  ,  2  .
 
0 2 1
1. Demuestre que U es base de R3 .
     
−1 2 3
2. Calcule las coordenadas de u =  0  yv=  2  yw=  0  en la base U .
0 2 2
3
Ejercicio 4.4.14. En cada uno de los casos investigue
  si U es base de R . En caso
a
afirmativo, encuentre las coordenadas del vector  b  en la base U .
c
           
 1 0 1   2 1 1 
(a) U =  2  ,  1  ,  0  (b) U =  −3  ,  1  ,  −4 
   
1 0 0 1 1 0
       
 1 1 1 1 
(c) U =  0  ,  1  ,  1  ,  2 
 
0 0 1 3
Ejercicio 4.4.15. Sea U una base de Rn . Pruebe que
coordU (αu + βv) = α coordU (u) + β coordU (v) , ∀u, v ∈ Rn , ∀ α, β ∈ R.
Ejercicio 4.4.16. Sean U = {u1 , u2 , u3 } y V = {v1 , v2 , v3 } dos bases de R3 tales que:

 
1 1 1
M = 1 1 −1 
U →V
1 −1 1
1. Para i = 1, 2, 3 encuentra coordV (ui ), y exprese u1 , u2 y u3 como combinaciones

lineales de V .
2. Halle las coordenadas del vector z = u1 − 2u2 + 3u3 en la base V .
3. Exprese v1 , v2 y v3 como combinaciones lineales de U .
Ejercicio 4.4.17. Consideremos el conjunto

1 5 −3
U= , , ⊂ R2
−2 1 −5
1. Encuentre una base de R2 contenida

en U .
a
2. Calcule las coordenadas de en la base que encontró en la parte anterior.
b
Ejercicio 4.4.18. Sean U = {u1 , u2 , u3 } Y V = {v1 , v2 , v3 } dos bases de R3 tales que:

     
2 1 0
v1 =  1  v2 =  0  v3 =  0  u1 = v1 − 2v2 + 2v3
0 2 2
 
a 0 1
M = b 1 −2 
U →V
c −1 5
1. Halle coordV (u1 ). Determine a, b y c.
2. Halle u1 , u2 y u3 .
4.5. Rango de una matriz

En el Capı́tulo 2 habı́amos introducido el concepto de rango por filas de una matriz.
Se trata simplemente del número de escalones (número de filas no nulas) de cualquiera
de las formas escalerizadas de la matriz. Para calcular el rgf (A) de una matriz A la
escalerizábamos y luego contábamos el número de filas no nulas de la forma escalerizada
4.5. Rango de una matriz 117
obtenida.  
1 1 −2 3
A modo de repaso calculemos el rgf (A) para la matriz A =  1 −2 3 1 
2 −1 1 4
   
1 1 −2 3 1 1 −2 3
A ∼  0 −3 5 −2  ←− F2 − F1 ∼  0 −3 5 −2 
0 −3 5 −2 ←− F3 − 2F1 0 0 0 0 ←− F3 − F2
Resulta entonces que rgf (A) = 2.
Ahora bien, esta matriz tiene tamaño 3 × 4, es decir, es una matriz de 3 filas y 4 columnas.
Observemos que cada una de las filas puede ser considerada como un vector de R4 :
     
1 1 2
 1   −2   −1 
F1 (A) = 
 −2  , F2 (A) =  3  , F3 (A) =  1 
    
3 1 4
Estas filas generan un subespacio S de R4 . Si queremos calcular su dimensión podemos

tener en cuenta que ya disponemos de un generador (el conjunto de las tres filas) y luego
proceder como en los ejemplos y ejercicios previos, esto es, reducir el generador (si fuese
necesario) hasta encontrar otro generador que también sea L.I. En esta sección introduci-
remos otra forma de hacerlo que está basada en la proposición 4.3.1 de “modificación” de
un generador. En lugar de reducirlo la idea es modificarlo de manera que el nuevo gene-
rador esté compuesto por vectores más sencillos. Para ello se puede sustituir una fila por
una C.L. de todas, siempre que la sustituida no la multipliquemos por 0. Pero justamente
eso fue lo que hicimos en el proceso de escalerización al comenzar este ejemplo. Es ası́ que:
 
1 1 −2 3
el subespacio generado por las filas de A =  1 −2 3 1 
2 −1 1 4
coincide con
 
1 1 −2 3
el subespacio generado por las filas de C =  0 −3 5 −2 
0 0 0 0
La dimensión de este último subespacio es inmediata de calcular. En efecto, las dos prime-
ras filas constituyen un generador del mismo pues la tercera fila es C.L. de ellas, y además
son L.I. Luego, la dimensión es 2, que coincide con la cantidad de escalones de C o sea
con el rgf (A).
El razonamiento es general y no depende de este caso particular. Si tenemos una matriz

A de tamaño m × n, sus m filas generan un subespacio S de Rn . Si C es una forma
escalerizada de A entonces sus filas generan el mismo subespacio S (modificación de un
generador). Por la ubicación de los ceros en la matriz C, sus filas no nulas constituirán
un conjunto L.I. y, por lo tanto, una base de S. Resulta entonces que la dimensión de S
coincide con el número de escalones de C, o sea con el rgf (A). En conclusión:
La dimensión del subespacio generado por las filas de una matriz coincide con
el rango por filas de dicha matriz.
Si A es una matriz de tamaño m×n al conjunto de sus filas lo simbolizaremos FA . El subes-

pacio generado por FA es un subespacio de Rn , que se simboliza (con la notación habitual)
L (FA ). El resultado anterior se puede escribir en sı́mbolos de la siguientes manera:
dim [L (FA )] = rgf (A)
De modo análogo podrı́a interesarnos calcular la dimensión del subespacio generado por
las columnas de una matriz. Volviendo al ejemplo de arriba, cada una de las columnas de
A es un vector de R3 :
       
1 1 −2 3
C1 (A) =  1  , C2 (A) =  −2  , C3 (A) =  3  , C4 (A) =  1 
2 −1 1 4
El subespacio L (CA ) generado por las columnas de A es entonces un subespacio de R3

que, en principio, parecerı́a tener poco que ver con L (FA ), que es un subespacio de R4 .
Sin embargo, es posible demostrar (lo admitiremos) el siguiente resultado notable:
Teorema 4.5.1. Igualdad del rango por filas con el rango por columnas.
Si A es una matriz entonces se cumple que dim [L (FA )] = dim [L (CA )]
Definición 4.5.1. Rango de una matriz.

Llamaremos rango de una matriz A, y lo simbolizaremos rg(A), a la dimensión del subes-
pacio generado por sus filas o por sus columnas (que, según el teorema anterior, coinciden).
Observación 4.5.1. Sobre el rango de una matriz. Sea A una matriz m × n.

1. El subespacio L (FA ) generado por las filas de A es un subespacio de Rn .
El subespacio L (CA ) generado por las columnas de A es un subespacio de Rm .
Estos dos subespacios no tienen por qué coincidir (de hecho, esto es imposible si m 6=
n). Sin embargo, el teorema anterior afirma que sus dimensiones siempre coinciden.
2. El rango de A coincide con lo que antes llamábamos rgf (A), es decir, con el número
de escalones de cualquier forma escalerizada de A.
3. Como L (FA ) es un subespacio de Rn , su dimensión no puede superar a n.
Como L (CA ) es un subespacio de Rm , su dimensión no puede superar a m.
Se deduce que rg(A) ≤ min{m, n}.
4. La única matriz que tiene rango 0 es la matriz nula.
5. Como las columnas de una matriz son las filas de su traspuesta se deduce que
rg(A) = rg(At )
6. Supongamos que m = n (matriz cuadrada). El rango de A vale n si, y solo si, las n
columnas (o filas) constituyen un conjunto L.I. de Rn o, lo que es lo mismo en este
caso, si y solo si, éstas constituyen una base de Rn . Se deduce que rg(A) = n ⇐⇒
det(A) 6= 0.
Observación 4.5.2. El caso de una matriz cuadrada 3 × 3.

Para calcular el rango de una matriz cuadrada A ∈ M3×3 alcanza casi con mirar la matriz.
En efecto, como 0 ≤ rg(A) ≤ 3, veamos los casos posibles:
1. rg(A) = 0. La única forma de que esto ocurra es que A sea la matriz nula.
2. rg(A) = 1. La única forma de que esto ocurra es que las tres filas de A sean
proporcionales y esto se ve directamente.
3. Si miramos la matriz y encontramos dos filas no proporcionales entonces su rango
puede valer 2 o 3. Como no siempre es sencillo concluir a simple vista si la fila
restante es, o no, C.L. de las dos mencionadas, podemos calcular el determinante de
la matriz (lo cual, al ser 3 × 3 no ofrece mayores dificultades). Si det(A) 6= 0 entonces
rg(A) = 3, mientras que si det(A) = 0 entonces rg(A) = 2.
4. Para una matriz cuadrada de tamaño mayor a 3 × 3, el método de escalerización es
el más eficiente y económico para calcular su rango y no es aconsejable trabajar con
determinantes.
Ejemplo
 4.5.1. Calculemos,
 discutiendo según el parámetro a ∈ R, el rango de la matriz
1 a −2
A= 2 1 a .
3 4 1
Como es una matriz cuadrada 3 × 3 comenzamos calculando su determinante. Se tiene:
det(A) = 3(a2 − 2a − 3). Las raı́ces de este polinomio son 3 y −1. Esto nos genera la
siguiente discusión:
Caso 1: Si a 6= 3 y a 6= −1 entonces det(A) 6= 0 y, por lo tanto, rg(A) = 3.
Caso 2: Si a = 3 entonces det(A) = 0 y, porlo tanto, rg(A)  < 3. Sustituimos este valor
1 3 −2
de a en la matriz original obteniendo: A =  2 1 3 . Como las dos primeras filas
3 4 1
no son proporcionales resulta rg(A) ≥ 2. Como el rango era menor que 3 deducimos que
rg(A) = 2. (De hecho, se observa fácilmente que la tercera fila es la suma de las dos
primeras).
Caso 2: Si a = −1 entonces det(A) = 0 y, por lo tanto, rg(A)
 < 3. Sustituimos este valor
1 −1 −2
de a en la matriz original obteniendo: A =  2 1 −1 . El mismo razonamiento que
3 4 1
en el caso anterior nos permite afirmar que rg(A) = 2.
Definición 4.5.2. Nulidad de una matriz.

Llamaremos nulidad de una matriz A a la dimensión de N (A) (núcleo de A). La nulidad
se simbolirazá nu(A).
El siguiente teorema establece la relación clave que existe entre la nulidad de una matriz
y su rango.
Teorema 4.5.2. Relación entre el rango y la nulidad de una matriz.
Si A es una matriz de n columnas entonces nu(A) + rg(A) = n.
Demostración.Observemos en primer lugar que, como N (A) es un subespacio de Rn , su
dimensión está comprendida entre 0 y n, es decir: 0 ≤ nu(A) ≤ n. Realizaremos la prueba
distinguiendo tres casos.
Caso 1: nu(A) = n. Tenemos que probar que rg(A) = 0.

Si nu(A) = n entonces la dimensión del núcleo de A vale n, de donde resulta que N (A) =
Rn . Esto implica que A tiene que ser la matriz nula y, por lo tanto, rg(A) = 0.
Caso 2: nu(A) = 0. Como nu(A) = 0 alcanza con demostrar que rg(A) = n. Observemos
que nu(A) = 0 significa que la dimensión del núcleo de A es 0 y, por lo tanto, dicho núcleo
está formado exclusivamente por el vector nulo: N (A) = {o}.
Demostrar que rg(A) = n equivale a probar que la dimensión de L (CA ) (subespacio
generado por las columnas de A) es n y, para ello, debemos encontrar una base de dicho
subespacio con n vectores.
Sabemos que el conjunto CA = {C1 , C2 , . . . , Cn } de las n columnas de A es un generador
de L (CA ). Si probamos que también es L.I. habremos encontrado una base de L (CA ) con
n vectores.
Consideremos entonces una C.L. de CA que de como resultado el vector nulo:
λ1 C1 + λ2 C2 + . . . + λn Cn = o
La igualdad anterior se puede escribir:
A.λ = o
en donde λ es el vector de Rn cuyas componentes son λ1 , λ2 , . . . , λn . Pero si A.λ = o

entonces λ ∈ N (A). Como N (A) está formado exclusivamente por el vector nulo, resulta
λ = o, de donde se deduce que λ1 = λ2 = . . . = λn = 0. Hemos probado entonces que
CA = {C1 , C2 , . . . , Cn } es L.I. y, por lo tanto, base de L (CA ).
Caso 3: 0 < nu(A) < n.
Sea p = nu(A). Tenemos que demostrar que rg(A) = n − p. Como dim(N (A)) = p existe
una base U = {u1 , u2 , . . . , up } de N (A) formada por p vectores. Completamos U hasta
obtener una base B de Rn :
B = {u1 , u2 , . . . , up , v1 , . . . , vq } base de Rn .
Demostraremos que rg(A) = q, con lo cual habremos finalizado, ya que p + q = n. Para

ello vamos a probar que el conjunto (de q vectores) W = {A.v1 , A.v2 , . . . , A.vq } es una
base de L (CA ).
1. Por la forma en que definimos W resulta claro que W ⊂ L (CA ).

2. Sea y ∈ L (CA ). Existe x ∈ Rn tal que y = A.x. Como B es base de Rn existen
escalares α1 , . . . , αp , β1 , . . . , βq ∈ R tales que
x = α1 u1 + . . . + αp up + β1 v1 + . . . + βq vq
Multiplicando (a izquierda) ambos miembros por la matriz A y recordando que los

vectores ui pertenecen al núcleo de A resulta:
y = A.x = β1 A.v1 + . . . + βq A.vq
lo cual prueba que y es C.L. de W . Como todo vector de L (CA ) se puede escribir
como C.L. de W podemos concluir que W es un generador de dicho subespacio.
3. Veamos ahora que W es L.I. Supongamos entonces que
λ1 A.v1 + . . . + λq A.vq = o
Lo anterior es equivalente a A. (λ1 v1 + . . . + λq vq ) = o y esto implica que el vector

λ1 v1 + . . . + λq vq pertenece al núcleo de A. Como U es base de dicho núcleo existen
escalares γ1 , . . . , γp ∈ R tales que:
λ1 v1 + . . . + λq vq = γ1 u1 + . . . + γp up
de donde
γ1 u1 + . . . + γp up − λ1 v1 − . . . − λq vq = o
Como B es base de Rn , lo anterior implica que todos los coeficientes tienen que ser
0 y, por lo tanto, λ1 = . . . = λq = 0.
♠
 
1 −2 3 −1
Ejercicio 4.5.1. Se considera la matriz A =  −1 0 −2 1 .
−1 −4 0 1
1. Halle el rango y la nulidad de A.
2. Halle la dimensión del subespacio
 de R3 generado por las columnas de A y encuentre
11
α ∈ R de modo que el vector  α  pertenezca a dicho subespacio.
13
3. Halle la dimensión del subespacio
 de R4 generado por las filas de A y encuentre

0
 β 
β ∈ R de modo que el vector   8  pertenezca a dicho subespacio.

0

a 0
Ejercicio 4.5.2. Se considera la matriz A = .
a a2 + a
1. Discuta, según a ∈ R, el valor del rango de la matriz A.
2. Sean S1 el subespacio de R2 generado por las columnas de A y S2 el subespacio de

R2 generado por las filas de A. Investigue si cada uno de los siguientes enunciados
es verdadero o falso justificando la respuesta:
a) Si rg(A) = 2 entonces S1 = S2 .
b) Si rg(A) = 1 entonces S1 = S2 .
c) Si rg(A) = 0 entonces S1 = S2 .
Ejercicio 4.5.3. En cada uno de los siguientes casos discuta, según a ∈ R, el valor del
rango y de la nulidad de las siguientes matrices.
     
1 a a−1 1 2 −1 1 a −2
A= 1 2 1  , B =  2 1 4  , C =  −2 4a a + 1 
a 4 0 1 1 a 1 7a a − 5
   
1 a −2 1 1 1 1
D =  2 3a − 1 a2 − a − 4  , E =  1 2 1 2 
a a 2 2
a − 2a − 1 a a+1 a a+1 2
 
  1 1 1
1 −a2 −1  4 α α 
F = 1 a −1  , G =   1 α−3 α−3 

a −a −1
1 1 α2 − 15
Ejercicio 4.5.4. Sean A una matriz y k un real. ¿Qué relación existe entre rg(A) y
rg(kA)? ¿Qué relación existe entre nu(A) y nu(kA)?
Ejercicio 4.5.5. En cada uno de los siguientes casos encuentre un ejemplo de dos matrices
A y B tales que:
1. rg(A + B) = rg(A) + rg(B)
2. rg(A + B) < rg(A) + rg(B)
3. rg(A + B) > rg(A) > rg(B)
Ejercicio 4.5.6. Sean A una matriz m × n y B una matriz n × p.
1. Utilizando la primera parte del ejercicio 4.2.7 deduzca que que nu(B) ≤ nu(A.B).
2. Demuestre que rg(A.B) ≤ rg(B) (use la parte anterior).
3. Teniendo en cuenta que el rango de una matriz coincide con el de su traspuesta
demuestre que rg(A.B) ≤ rg(A).
4. En cada uno de los siguientes casos encuentre un ejemplo de dos matrices A y B
tales que:
(a) rg(A.B) = rg(A) = rg(B) (b) rg(A.B) = rg(A) < rg(B)
(c) rg(A.B) < rg(A) < rg(B)
Ejercicio 4.5.7. Demuestre que no existe ninguna matriz n × n, con n impar, n 6= 1, para
la cual el subespacio generador por sus columnas coincida con el núcleo de la matriz.
Ejercicio 4.5.8. Sea A un matriz 2 × 2 tal que el subespacio generador por sus columnas
coincide con el núcleo de la matriz.
Demuestre que rg(A) = 1 y encuentre la forma de la matriz A.
4.6. Apéndice de este capı́tulo 123
4.6. Apéndice de este capı́tulo

Demostración del Teorema de Steinitz.
Sean S un subespacio de Rn , U y W dos subconjuntos de S tales que U es L.I. y W es un
generador de S. Entonces #U ≤ #W .
Supongamos que U = {u1 , u2 , . . . , ur } y W = {w1 , w2 , . . . , wm }. Queremos demostrar que

r ≤ m. Consideramos u1 ∈ U , como U es L.I. entonces necesariamente u1 6= o, además
g
dado que W → S, sabemos que existen escalares α11 , α12 , . . . , α1m no todos nulos tales
que u1 = α11 w1 + α12 w2 + . . . + α1m wm . Supongamos α11 6= 0, luego
1 α12 α1m
w1 = u1 − w2 − . . . − wm
α11 α11 α11
g
Como W → S, si z es un vector en S existen β1 , β2 , . . . , βm ∈ R tales que
z = β1 w1 + β2 w2 + . . . + βm wm

1 α12 α1m
= β1 u1 − w2 − . . . − wm + β2 w2 + . . . + βm wm
α11 α11 α11

1 α12 α1m
= β1 u1 + −β1 + β2 w2 + . . . + −β1 + βm wm
α11 α11 α11
Ası́ se concluye que z es combinación lineal de {u1 , w2 , . . . , wm } cualquiera sea z ∈ S, por

g
lo que {u1 , w2 , . . . , wm } → S. Consideremos ahora u2 , existen α21 , α22 , . . . , α2m ∈ R no
todos nulos tales que u2 = α21 u1 + α22 w2 + . . . + α2m wm . Supongamos α22 6= 0, luego
α21 1 α2m
w2 = − u1 + u2 − . . . − wm
α22 α22 α22
g
y, debido a que {u1 , w2 , . . . , wm } → S, existen β1 , β2 , . . . , βm ∈ R tales que
z = β1 u1 + β2 w2 + . . . + βm um
cualquiera sea z ∈ S. Operando se llega a que cualquier vector z ∈ S puede expresarse

como combinación lineal de {u1 , u2 , . . . , wm }:

α21 1 α23 α2m
z = β1 − β2 u1 + β2 u2 + −β2 + β3 w3 + . . . + −β2 + βm wm
α22 α22 α22 α22
Luego
g
{u1 , u2 , w3 , . . . , wm } → S
Podrı́amos continuar reemplazando los vectores de W por vectores U de forma tal de
obtener nuevos conjuntos generadores de S, pero ¿hasta cuándo? ¿cuántos vectores de W
pueden ser suplantados por vectores de U ? Supongamos por absurdo que r > m, dado que
la cantidad de vectores de U es mayor que la de W , si continuamos con el procedimiento
anterior podremos reemplazar todos los vectores de W y por lo tanto tendremos que
W = {u1 , u2 , . . . , um } ⊂ U = {u1 , u2 , . . . , um , um+1 , . . . , ur }

g
es tal que W → S y los vectores um+1 , . . . , ur que pertenecen a S son entonces combinación
lineal de W , lo que contradice el hecho que U es L.I.
Como el absurdo parte de suponer r > m, se deduce entonces que r ≤ m. ♠
Demostración del Teorema 4.5.1

Para cualquier matriz A = (aij ) (m × n) se cumple que dim [L (FA )] = dim [L (CA )].
Sean p = dim [L (FA )] y q = dim [L (CA )]. Si p = 0 entonces A es la matriz nula y, por lo
tanto, q = 0. Supongamos entonces que p > 0.
Vamos a probar en primer lugar que q ≤ p. Como p = dim [L (FA )] la matriz A tiene p filas
L.I. (podemos suponer que son las p primeras: F1 , F2 , . . . , Fp , mientras que las restantes
m−p filas dependen linealmente de éstas. Tenemos entonces que para cada i = p+1, . . . , m
existen escalares αij tales que:
Fi = αi1 F1 + αi2 F2 + . . . + αip Fp , i = p + 1, . . . , m
Expresando la igualdad anterior en componentes tenemos:
(ai1 , . . . , ain ) = αi1 (a11 , . . . , a1n ) + . . . + αip (ap1 , . . . , apn )
Por lo tanto, una columna cualquiera de A, como la j-ésima, puede expresarse mediante:
   
a1j a1j
 a2j   a2j 
   
 ..   .. 

 .  
  . 

 apj  =  apj =
   
 ap+1,j   αp+1,1 a1j + . . . + αp+1,p apj 
   
 ..   .. 
 .   . 
amj αm,1 a1j + . . . + αm,p apj
     
1 0 0

 0 


 1 


 0 


 0 


 0 


 1 

 ..   ..   .. 
a1j 
 .  + a2j 
  .  + . . . + apj 
  . 

 αp+1,1   αp+1,2   αp+1,p 
     
 ..   ..   .. 
 .   .   . 
αm,1 αm,2 αm,p
Esto muestra que cualquier columna de A se puede expresar como C.L. de un conjunto
de p vectores fijos. Luego, el subespacio generado por las columnas de A tiene dimensión
menor o igual que p, o sea q ≤ p.
Para probar que p ≤ q alcanza con utilizar el resultado que acabamos de demostrar y el
hecho de que las filas de A son las columnas de At :
dim [L (FA )] = dim [L (CAt )] ≤ dim [L (FAt )] = dim [L (CAt )] ♠
Capı́tulo 5
Rn como espacio euclidiano
En este capı́tulo veremos cómo es posible extender a Rn los conceptos métricos que el lector
conoce de R2 . En este contexto más general también será posible hablar (por ejemplo) de
ángulo formado por dos vectores, de vectores perpendiculares, proyecciones ortogonales,
teorema de Pitágoras; ası́ como realizar cálculo de distancias y áreas. Estas ideas, resulta-
dos y técnicas, no solamente poseen una riqueza geométrica intrı́nseca, sino que también
permitirán abordar y resolver relevantes problemas de aplicación a diversas áreas cientı́fi-
cas. En ese sentido desarrollaremos el “método de mı́nimos cuadrados”, el cual (entre otras
aplicaciones) permite establecer un modelo matemático de función de demanda a partir
de datos obtenidos por una encuesta.
5.1. Producto interno, norma y ángulos

Definición 5.1.1. Producto interno en Rn .
   
u1 v1
 u2   v2 
Sean u =  .  y v =  .  dos vectores de Rn . El producto interno de u por v
   
 ..   .. 
un vn
se simboliza hu, vi y es, por definición, el número:
hu, vi = u1 v1 + u2 v2 + . . . + un vn
Observemos que este número coincide con el producto de la matriz fila ut con la matriz
columna v: hu, vi = ut v.
     
2 1 −3
Ejemplo 5.1.1. Si u =  −1 , v =  −1  y w =  1  entonces:
3 2 2
hu, vi = 2 · 1 + (−1) · (−1) + 3 · 2 = 9
hu, wi = 2 · (−3) + (−1) · 1 + 3 · 2 = −1
hv, wi = 1 · (−3) + (−1) · 1 + 2 · 2 = 0
126 Capı́tulo 5. Rn como espacio euclidiano
Proposición 5.1.1. Propiedades básicas del producto interno.

El producto interno de vectores de Rn tiene las siguientes propiedades:
(Pi1) No negatividad: hu, ui ≥ 0 , ∀ u ∈ Rn . Además, hu, ui = 0 ⇐⇒ u = o.
(Pi2) Conmutativa: hu, vi = hv, ui , ∀ u, v ∈ Rn .
(Pi3) Homogénea: hα u, vi = α hu, vi , ∀ u, v ∈ Rn , ∀ α ∈ R.
(Pi4) Distributiva: hu + w, vi = hu, vi + hw, vi , ∀ u, v, w ∈ Rn .
Demostración. La demostración es simple (alcanza con aplicar la definición y las propie-

dades de las operaciones en R) y queda a cargo
 dellector. Observemos, de todos modos,
u1
 u2 
 
la primera de ellas (no negatividad). Si u =  .  entonces
 .. 
un
hu, ui = u1 u1 + u2 u2 + . . . + un un = (u1 )2 + (u2 )2 + . . . + (un )2
Cada sumando de la suma anterior es no negativo, por lo que la suma también lo es.
Además, esa suma vale 0 si, y solo si, todos lo sumandos son nulos, y esto ocurre solamente
cuando u1 = u2 = . . . = un = 0, es decir, cuando u es el vector nulo.
Observación 5.1.1. El producto interno de un vector por sı́ mismo.

Como observamos recién, el producto interno de un vector por sı́ mismo coincide con la
suma de los cuadrados de sus componentes:
hu, ui = (u1 )2 + (u2 )2 + . . . + (un )2
Esto nosrecuerda
al teorema de Pitágoras (al menos, cuando estamos en R2 ). En efecto,
a
sea u = ∈ R2 . El producto interno hu, ui vale a2 + b2 .
b
Según el teorema de Pitágoras, a2 + b2 (suma de los cuadrados de las medidas de los
catetos del triángulo rectángulo de la figura) coincide con el cuadrado de la medida de
la hipotenusa. La medida √ de dicha phipotenusa, que no es otra cosa que la “longitud” del
vector u, vale entonces a2 + b2 = hu, ui.
√
a2 + b2
a
5.1. Producto interno, norma y ángulos 127
p
Es ası́ que, en R2 , la longitud de un vector u coincide con hu, ui. Esto nos lleva a dar la
siguiente definición.
Definición
 5.1.2.
 Norma de un vector.
u1
 u2 
Si u =  .  ∈ Rn entonces su norma es, por definición, el número:
 
 .. 
un
p p
kuk = hu, ui = (u1 )2 + (u2 )2 + . . . + (un )2
     
2 1 1
Ejemplo 5.1.2. Si u =  −1 , v =  2  y w =  0  entonces:
3 −2 1
p √
2 2 2
k u k = 2 + (−1) + 3 = 14
p √
k v k = 12 + 22 + (−2)2 = 9 = 3
√ √
k w k = 12 + 02 + 12 = 2
Proposición 5.1.2. Dos propiedades de la norma.
De la definición de norma y de las propiedades del producto interno resultan inmediatas
las siguientes propiedades:
(N1) No negatividad: kuk ≥ 0, ∀ u ∈ Rn . Más aún, kuk = 0 ⇐⇒ u = o.
(N2) Homogeneidad: kλ uk = |λ| kuk, ∀ u ∈ Rn , ∀ λ ∈ R.
Vale la pena observar que k − xk = kxk, ∀ x ∈ Rn .
Proposición 5.1.3. Una suerte de “cuadrado de un binomio”.
Si u y v son dos vectores de Rn entonces se cumple:
1. ku + vk2 = kuk2 + 2hu, vi + kvk2
2. ku − vk2 = kuk2 − 2hu, vi + kvk2
Demostración. Demostraremos la primera parte solamente ya que la segunda es total-
mente análoga. Utilizando la definición de norma y las propiedades del producto interno
obtenemos:
ku + vk2 = hu + v, u + vi = hu, ui + hu, vi + hv, ui + hv, vi = kuk2 + 2hu, vi + kvk2 ♠
Observación 5.1.2. Las medidas de los lados de un triángulo.

Dados u y v no colineales en R2 , las medidas de los lados del triángulo de la próxima
figura (izquierda) valen kuk, kvk y ku − vk. Según la proposición anterior, estas medidas
están relacionadas por
ku − vk2 = kuk2 − 2hu, vi + kvk2
Ahora bien, en el caso particular en que el triángulo es rectángulo (figura derecha), el
teorema de Pitágoras asegura que
ku − vk2 = kuk2 + kvk2
(el cuadrado de la medida de la hipotenusa coincide con la suma de los cuadrados de las
medidas de los catetos).
v xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
ku − vk
ku − vk
kvk
kvk xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
α
o kuk u o kuk u
Resulta entonces que, al menos en R2 , se cumple que u y v son perpendiculares si, y solo
si, hu, vi = 0. Esto motiva la siguiente definición.
Definición 5.1.3. Vectores ortogonales.

Sean u, v ∈ Rn . Diremos que u y v son ortogonales (o perpendiculares) cuando hu, vi = 0.
En este caso escribiremos: u ⊥ v.
Proposición 5.1.4. Pitágoras en Rn .

Si u y v son vectores ortogonales en Rn entonces:
ku + vk2 = ku − vk2 = kuk2 + kvk2
Ejemplo 5.1.3.

  
1 3
 3   −2  4
(a) Los vectores u =   1  y v =  2  ∈ R son ortogonales pues hu, vi = 0.
  
1 1
n
(b) Los vectores canónicos de R son ortogonales entre sı́. En efecto, es inmediato veri-
ficar que hei , ej i = 0, ∀ i 6= j.
(c) Como ho, vi = 0, ∀ v ∈ Rn , deducimos que el vector nulo es ortogonal a todos los
vectores del espacio.
(d) Supongamos que z ∈ Rn es ortogonal a todos los vectores del espacio Rn . En parti-
cular se cumplirá hz, zi = 0. Luego kzk = 0 y, por lo tanto, z = o. Resulta entonces
que el único vector ortogonal a todos los vectores del espacio es el vector nulo.
Proposición 5.1.5. Proyección ortogonal sobre un vector.

Sea u ∈ Rn un vector no nulo. Entonces para cada vector x ∈ Rn existe un único vector z
colineal con u tal que x − z ⊥ u.
hx, ui hx, ui
Este vector viene dado por z = u= u, se denomina proyección ortogonal de x
hu, ui kuk2
sobre u y se simboliza Pu (x).
x−z
o u z
Demostración. Un vector colineal con u es de la forma z = λu, con λ ∈ R.

Impongamos que x − z ⊥ u:
x − z ⊥ u ⇐⇒ hx − z, ui = 0 ⇐⇒ hx − λu, ui = 0 ⇐⇒ hx, ui − λhu, ui = 0
hx, ui
⇐⇒ hx, ui = λhu, ui ⇐⇒ λ =
hu, ui
En el último paso se tuvo en cuenta que hu, ui =
6 0 debido a que u no es el vector nulo.
♠
Observación 5.1.3. Relación entre la norma de un vector y su proyección or-
togonal sobre otro.
Si Pu (x) es la proyección ortogonal de x sobre el vector no nulo u entonces el teorema de
Pitágoras nos permite afirmar que:
kxk2 = kx − Pu (x)k2 + kPu (x)k2
De la igualdad anterior se deduce que kPu (x)k2 ≤ kxk2 y, por lo tanto:
kPu (x)k ≤ kxk
Más aún, se cumple la igualdad si, y solo si, Pu (x) = x, lo cual quiere decir que x es
colineal con u.
Teorema 5.1.1. Desigualdad de Cauchy-Schwarz.

1. | hu, vi | ≤ k u k k v k
2. | hu, vi | = k u k k v k si, y solo si, {u, v} es L.D.
Demostración.
1. Si u = o entonces es claro que se cumple la igualdad. Supongamos que u no es el
vector nulo. Si Pu (v) es la proyección ortogonal de v sobre u sabemos que kPu (v)k ≤
hv, ui
kvk. Como Pu (v) = u obtenemos:
kuk2

hv, ui |hv, ui| |hv, ui|
kuk2 u ≤ kvk ⇐⇒ kuk2 kuk ≤ kvk ⇐⇒ kuk ≤ kvk

lo cual es equivalente a lo que querı́amos demostrar. ♠

2. Tenemos que |hu, vi| = kuk kvk si, y solo si, kPu (v)k = kvk lo cual, como ya sabemos,
es equivalente a que u y v sean colineales. ♠
  
2 1
 −1   2  4
Ejemplo 5.1.4. Consideremos los vectores u =   1  y v =  0  ∈ R . Como
  
−1 1
{u, v} es L.I. la desigualdad de Cauchy-Schwarz debe ser estricta en este caso. Simplemente
verifiquémoslo
√ √ calculando:
√
kuk kvk = 7 6 = √ 42
|hu, vi| = | − 1| = 1 < 42 = kuk kvk
Proposición 5.1.6. Desigualdad triangular para la norma.
1. ku + vk ≤ kuk + kvk.
2. ku + vk = kuk + kvk si, y solo si, u y v son colineales con coeficiente de proporcio-
nalidad mayor o igual que 0, es decir, si existe α ≥ 0 tal que u = αv o existe β ≥ 0
tal que v = βu.
Antes de realizar la demostración veamos que la “desigualdad triangular” para la norma
tiene una interpretación geométrica simple.
v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
u+v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
ku + vk xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx kvk
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx
o kuk u
Las medidas de los lados del triángulo sombreado valen kuk, kvk y ku + vk. Lo que esta-
blece la desigualdad triangular es la conocida propiedad geométrica que establece que un
lado de un triángulo siempre es menor que la suma de los otros dos.
Demostración.
1. Sabemos que ku + vk2 = kuk2 + 2hu, vi + kvk2 . Por otra parte hu, vi ≤ |hu, vi| ≤
kuk kvk (se usó la desigualdad de Cauchy-Schwarz). Tenemos entonces que:
ku + vk2 = kuk2 + 2hu, vi + kvk2 ≤ kuk2 + 2kukkvk + kvk2 = (kuk + kvk)2
de donde se deduce que ku + vk2 ≤ (kuk + kvk)2 . Como las bases de las potencias
anteriores son no negativas podemos concluir que ku + vk ≤ kuk + kvk. ♠
2. Si observamos el razonamiento recién realizado podemos afirmar que se cumple la

igualdad ku + vk = kuk + kvk si, y solo si, se cumple la igualdad hu, vi = kukkvk.
A su vez, esta igualdad es verdadera si, y solo si, {u, v} es L.D. (parte (2) del
teorema 5.1.1) y hu, vi ≥ 0. Que {u, v} sea L.D. significa que ambos vectores son
colineales. Supongamos, para fijar ideas que existe α ∈ R tal que u = αv. Tenemos
que hu, vi = hαv, vi = αhv, vi. Luego, hu, vi ≥ 0 si, y solo si, α ≥ 0. ♠
Definición 5.1.4. Distancia entre dos puntos.

Sean p y q dos puntos de Rn . Llamaremos distancia (euclidiana) entre p y q al número
d(p, q) = kq − pk.
Proposición 5.1.7. Propiedades de la distancia.
La distancia definida en Rn tiene las siguientes propiedades básicas:
(D1) No negatividad: d(p, q) ≥ 0 , ∀ p, q ∈ Rn . Además, d(p, q) = 0 ⇐⇒ p = q.
(D2) Conmutativa: d(p, q) = d(q, p) , ∀ p, q ∈ Rn .
(D3) Desigualdad triangular: d(p, r) ≤ d(p, q) + d(q, r) , ∀ p, q, r ∈ Rn .
Observación 5.1.4. Recordando el teorema del coseno.
Sean u y v no colineales en R2 . Pongamos: b = kuk, c = kvk y a = ku − vk. Con esta nota-
ción, el “teorema del coseno” de la geometrı́a euclidiana plana (que establece la relación
que existe entre las medidas de los lados de dicho triángulo) afirma que:
a2 = b2 + c2 − 2 b c cos(α)
o sea
ku − vk2 = kuk2 + kvk2 − 2 kuk kvk cos(α) (∗)
v
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
ku − vk
kvk
α
o kuk u
Por otra parte, sabemos que para toda pareja de vectores en Rn vale la igualdad:
ku − vk2 = kuk2 + kvk2 − 2 hu, vi (∗∗)
Si observamos las igualdades (∗) y (∗∗) deducimos que
hu, vi = kuk kvk cos(α)

lo cual nos dice que el producto interno de dos vectores coincide con el producto de la
norma de ambos por el coseno del ángulo que forman. En el caso particular en que el
ángulo es recto, su coseno vale 0 y por lo tanto el producto interno también. En este caso
el triángulo es rectángulo y el teorema del coseno se reduce al teorema de Pitágoras.
Recordemos que si u y v son dos vectores de Rn , la desigualdad de Cauchy-Schwarz afirma

|hu,vi|
que |hu, vi| ≤ kukkvk. Si ninguno de los vectores es el nulo obtenemos kukkvk ≤ 1, lo cual es
hu,vi
equivalente a −1 ≤ kuk kvk ≤ 1. Es posible concluir entonces que existe un único número
hu,vi
α ∈ [0, π] que verifica cos(α) = kuk kvk .
Definición 5.1.5. Ángulo entre dos vectores.

Sean u y v dos vectores no nulos de Rn . Llamaremos ángulo formado por u y v al número
α ∈ [0, π] que verifica:
hu, vi
cos(α) =
kuk kvk
 
1
Ejemplo 5.1.5. Calculemos el ángulo que forman los vectores u =  √1  y
2
 
1 √
v =  1  ∈ R3 . Tenemos que hu, vi = 2, kuk = 2 y kvk = 2. Luego:
0

2 1 1
cos(α) = √ = √ =⇒ α = Arccos √ = π/4
2 2 2 2
   
1 0
 0   −2  4
Ejercicio 5.1.1. Consideremos los vectores u =   −1  y v =  2  ∈ R . Calcule
  
0 1
hu, vi, kuk, kvk y ku + vk. Verifique la desigualdad de Cauchy-Schwarz y la desigualdad
triangular.
   
1 −2
Ejercicio 5.1.2. Sean u =  2  y v =  −1  ∈ R3 .
2 2
1. Calcule hu, vi, kuk, kvk y ku + vk. Verifique la desigualdad de Cauchy-Schwarz y la
desigualdad triangular.
2. Compruebe que los ángulos formados por los vectores u y u + v y por los vectores v
y u + v valen π/4. Interprete geométricamente este resultado.
Ejercicio 5.1.3. Sean u, v ∈ Rn .
1. Demuestre e interprete geométricamente en R2 :
(a) (u + v) ⊥ (u − v) ⇐⇒ kuk = kvk.
(b) ku + vk2 + ku − vk2 = 2 kuk2 + kvk2 .
2. Halle la condición que deben cumplir u y v para que ku + vk = ku − vk.
Ejercicio 5.1.4. Encuentre todos los valores de λ ∈ R para los que se cumpla:
||u + v||2 + ||2u − v||2 = 5||u||2 − λhu, vi + 2||v||2 , ∀ u, v ∈ Rn .
2
Ejercicio 5.1.5. Encuentre dos vectores u,v ∈ R que cumplan: hu, vi = 100, ||u|| =
3
5, ||v|| = 20, siendo u de la forma u = .
a
Ejercicio 5.1.6. Calcule el área del triángulo cuyos vértices son los puntos:
     
0 1 2
o=  0  , p=  −2  , q=  1 
0 0 2
Ejercicio 5.1.7. Teorema de Pitágoras revisitado.
1. Sean p, q, r tres puntos en Rn tales que r−p ⊥ q −p (esto quiere decir que el triángulo
de vértices p, q, r es rectángulo en p). Demuestre que d2 (q, r) = d2 (p, q) + d2 (p, r).
2. Calcule el área del triángulo cuyos vértices son los puntos:
     
2 3 6
x= 3  , y= 5  , z= 2 
4 2 5
Ejercicio 5.1.8. Si A es una matriz de tamaño m × n demuestre que:
1. hAx, yi = hx, At yi, ∀ x ∈ Rn , ∀ y ∈ Rm . (Observe que el producto interno de la
izquierda es entre vectores de Rm mientras que el de la derecha es el producto interno
en Rn . Para la prueba recuerde que si u, v ∈ Rn entonces hu, vi = ut v).
2. hAt Av, vi = kA.vk2 , ∀ v ∈ Rn .

3. N At A = N (A).

4. rg At A = rg(A).
5. Si rg(A) = n entonces At A es invertible.
Ejercicio 5.1.9. Una fábrica produce cuatro artı́culos y en esa producción se necesita
una materia prima y mano de obra de acuerdo con lo que se indica a continuación:
1. Sean p1 el precio por kilo de la materia prima y p2 la remuneración por hora de
trabajo. Defina dos vectores u y v de modo que su producto interno sea el costo
variable por producir x unidades del artı́culo 1, y unidades del artı́culo 2, z unidades
del artı́culo 3 y w unidades del artı́culo 4.
2. Sea k el costo fijo de producción y a, b, c y d los precios de venta de cada unidad
de los artı́culos 1, 2, 3 y 4 respectivamente. Exprese mediante productos internos la
utilidad que obtiene la fábrica al vender x unidades del artı́culo 1, y unidades del
artı́culo 2, z unidades del artı́culo 3 y w unidades del artı́culo 4.
Ejercicio 5.1.10. Demuestre que
| kuk − kvk | ≤ ku − vk, ∀ u, v ∈ Rn .

Ejercicio 5.1.11.
1. Demuestre las propiedades de la distancia.
2. Demuestre que d(λu, λv) = |λ|d(u, v), ∀ u, v ∈ Rn , ∀ λ ∈ R, e interprete geométri-
camente esta propiedad.
3. Demuestre que d(p + z, q + z) = d(p, q), ∀ p, q, z ∈ Rn , e interprete geométricamente
esta propiedad.
Ejercicio 5.1.12. Si p y q son dos puntos distintos en Rn entonces el punto medio del
p+q
segmento por ellos determinado es el punto m = . Verifique que d(p.m) = d(q, m).
2
5.2. Conjuntos ortogonales y proyecciones ortogonales

Definición 5.2.1. Conjuntos ortogonales y ortonormales.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn con r ≥ 2.
Diremos que U es un conjunto ortogonal cuando sus vectores son ortogonales dos a dos,
es decir, cuando ui ⊥ uj , ∀ i 6= j.
Diremos que U es un conjunto ortonormal si, además de ser ortogonal, todos sus vectores
tienen norma 1. (De aquı́ en adelante a los vectores de norma 1 los llamaremos unitarios).
Ejemplo 5.2.1.
1. La base canónica de Rn es un conjunto ortonormal.

1 −2
2. El conjunto U = , ⊂ R2 es ortogonal pero no ortonormal pues la
1 2
√ √
norma del primer vector vale 2 y la norma del segundo 8.
( 1
! −2
!)
√ √
3. El conjunto V = √1
2 , √2
8 ⊂ R2 es ortonormal.
2 8
4. Lo que ocurrió en el ejemplo recién mencionado es general. En efecto, si U =
{u1 , un2 , . . . , ur } ⊂ Rn es ortogonal
o y no contiene al vector nulo entonces el conjunto
u1 u2 ur
U = ku1 k , ku2 k , . . . , kur k es ortonormal. Esto se debe a que si u 6= o entonces la
u
norma de kuk vale 1.
Teorema 5.2.1. Independencia lineal de los conjuntos ortogonales.
Sea U = {u1 , u2 , . . . , ur } ⊂ Rn un conjunto ortogonal que no contiene al vector nulo.
Entonces U es L.I.
Demostración. Consideremos una C.L. de U que de como resultado el vector nulo:
α1 u1 + α2 u2 + . . . + αr ur = o (∗)
Queremos demostrar que, necesariamente, todos los coeficientes αi deben valer 0. Si hace-
mos el producto interno de ambos miembros de (∗) por u1 obtenemos la siguiente igualdad:
hu1 , α1 u1 + α2 u2 + . . . + αr ur i = hu1 , oi = 0
Aplicando las propiedades del producto interno obtenemos:
α1 hu1 , u1 i + α2 hu1 , u2 i + . . . + αr hu1 , ur i = 0

5.2. Conjuntos ortogonales y proyecciones ortogonales 135
Como U es un conjunto ortogonal, el vector u1 es ortogonal a los restantes vectores de U

y, por lo tanto, hu1 , uj i = 0, ∀ j 6= 1. Es ası́ que la igualdad anterior se reduce a:
α1 hu1 , u1 i = 0
Como hu1 , u1 i =
6 0 (pues ninguno de los vectores de U es el vector nulo) resulta que nece-
sariamente α1 = 0.
Si en lugar de haber realizado el producto interno de ambos miembros de (∗) por u1 , lo

hubiésemos hecho por u2 , habrı́amos obtenido α2 = 0. Es decir, razonando de manera
análoga se demuestra que todos los coeficientes αi valen 0 y ello prueba que U es L.I. ♠
Observación 5.2.1. Coordenadas de un vector en una base ortogonal.

Sean S un subespacio de Rn y U = {u1 , u2 , . . . , ur } una base ortogonal de S (con esto
queremos decir que U es un conjunto ortogonal que además es base de S). Como sabemos,
para cada vector v ∈ S existen, y son únicos, escalares λ1 , λ2 , . . . , λr ∈ R de modo que
v = λ1 u1 + λ2 u2 + . . . + λr ur . Estos escalares son las coordenadas de v en la base U .
Veamos que, en este caso (U ortogonal) estas coordenadas admiten una expresión muy
simple. En efecto, al realizar el producto interno hv, u1 i obtenemos:
hv, u1 i = hλ1 u1 + λ2 u2 + . . . + λr ur , u1 i = λ1 hu1 , u1 i + λ2 hu2 , u1 i + . . . + λr hur , u1 i
Como U es un conjunto ortogonal, el vector u1 es ortogonal a los restantes vectores de U

y, por lo tanto, huj , u1 i = 0, ∀ j 6= 1. Es ası́ que la igualdad anterior se reduce a:
hv, u1 i = λ1 hu1 , u1 i
Como hu1 , u1 i =
6 0 (pues ninguno de los vectores de U es el vector nulo, por ser U base de
hv, u1 i
S), resulta que la primera coordenada vale λ1 = .
hu1 , u1 i
Si en lugar de haber realizado el producto interno de v por u1 , lo hubiésemos hecho por u2 ,
hv, u2 i
habrı́amos obtenido λ2 = . (Obsérvese la analogı́a con la demostración del teorema
hu2 , u2 i
anterior).
hv, ui i
Luego, razonando de manera análoga, se demuestra que la coordenada λi vale .
hui , ui i
Es ası́ que la expresión del vector v en la base ortogonal U es:
hv, u1 i hv, u2 i hv, ur i

v= u1 + u2 + . . . + ur
hu1 , u1 i hu2 , u2 i hur , ur i
Como los vectores de la suma son ortogonales dos a dos, aplicando el teorema de Pitágoras
para r sumandos obtenemos:
|hv, u1 i|2 |hv, u2 i|2 |hv, ur i|2

kvk2 = + + ... +
Si además, la base U es ortonormal, la expresión de v en dicha base queda:

v = hv, u1 iu1 + hv, u2 iu2 + . . . + hv, ur iur
y, por lo tanto:
kvk2 = |hv, u1 i|2 + |hv, u2 i|2 + . . . + |hv, ur i|2

1 −2
Ejemplo 5.2.2. U = , es una base ortogonal de R2 . Calculemos las
1 2

a
coordenadas de un vector genérico v = en la base U . Para ello alcanza con aplicar
b
directamente las fórmulas:
hv, u1 i hv, u2 i
λ1 = , λ2 =
hu1 , u1 i hu2 , u2 i
Se tiene:
hv, u1 i a+b
λ1 = =
hu1 , u1 i 2
hv, u2 i −2a + 2b
λ2 = =
hu2 , u2 i 8
En otras palabras, la expresión de v en la base U es:

a a+b 1 −2a + 2b −2
= +
b 2 1 8 2
Definición 5.2.2. Vector ortogonal a un conjunto.

Sean H un subconjunto cualquiera de Rn y v ∈ Rn . Diremos que v es ortogonal al conjunto
H, y escribiremos v ⊥ H, si y solo si, v es ortogonal a todos los vectores de H, esto es:
v ⊥ h, ∀ h ∈ H.
Teorema 5.2.2. Condición necesaria y suficiente para que un vector sea orto-
gonal a un subespacio.
Sean S un subespacio de Rn y v ∈ Rn . Entonces v es ortogonal a S si, y solo si, v es
ortogonal a un generador de S.
Demostración. Tenemos que probar directo y recı́proco.
( =⇒ ) Esta parte es trivial. En efecto, como todo generador de S está contenido en S, si
v es ortogonal a todos los vectores de S también será ortogonal a los vectores de un
generador de S.
( ⇐= ) Esta es la parte interesante. Sea U = {u1 , u2 , . . . , ur } ⊂ S un generador de S de
modo que v sea ortogonal a los vectores de U : v ⊥ ui , ∀ i = 1, . . . , r. Recordemos
que esto quiere decir que hv, ui i = 0, ∀ i = 1, . . . , r. Tenemos que demostrar que v es
ortogonal a todos los vectores de S. Sea entonces s un vector cualquiera de S. Como
g
U → S existen escalares α1 , α2 , . . . , αr ∈ R tales que s = α1 u1 + α2 u2 + . . . + αr ur .
Se tiene:
hv, si = hv, α1 u1 + α2 u2 + . . . + αr ur i = α1 hv, u1 i + α2 hv, u2 i + . . . + α1 hv, ur i = 0
Resulta entonces que hv, si = 0 y, por lo tanto, v ⊥ s. ♠
Observación 5.2.2. Proyección ortogonal sobre un subespacio cualquiera.

Las ideas iniciales introducidas en la proposición 5.1.5 referidas a la proyección ortogonal
de un vector sobre otro pueden extenderse a la proyección ortogonal sobre un subespacio
cualquiera. A los efectos de visualizarlo geométricamente, consideremos un subespacio S
de dimensión 2 en R3 . En este caso, S es un plano que pasa por el origen. Dado un vector
p ∈ R3 (lo podemos pensar como vector o como punto), esperamos que el lector posea una
imagen conceptual de su proyección ortogonal sobre S.
o
z
La idea consiste en considerar la recta que pasa por el punto p y es perpendicular al plano
S y luego intersectarla con dicho plano. El punto z obtenido es la proyección ortogonal de
p sobre S. Este punto (o vector) z tiene las siguientes propiedades:
z ∈ S.
El vector p − z es ortogonal a S.
z es el punto de S más próximo a p. En efecto (ver próxima figura) si s es otro punto

de S diferente de z entonces el teorema de Pitágoras permite afirmar que d(p, z) <
d(p, s), ya que d(p, s) es la medida de la hipotenusa de un triángulo rectángulo del
cual d(p, z) es la medida de uno de los catetos.
o
z
El siguiente teorema establece que la situación que acabamos de describir también es válida
para cualquier subespacio de Rn .
Teorema 5.2.3. Proyección ortogonal sobre un subespacio.

Sean S un subespacio de Rn y p ∈ Rn . Entonces existe un único vector z ∈ S que cumple:
(a) p − z ⊥ S.
(b) Si U = {u1 , u2 , . . . , ur } es una base ortogonal de S entonces

hp, u1 i hp, u2 i hp, ur i
z= u1 + u2 + . . . + ur
(c) ∀ s ∈ S, s 6= z, se cumple que d(p, z) < d(p, s).

Demostración. Como z ∈ S y U es una base de S, z se puede escribir de manera única
como combinación lineal de U . Existen entonces escalares λ1 , λ2 , . . . , λr únicos tales que
z = λ1 u1 + λ2 u2 + . . . + λr ur . Queremos imponer que p − z sea ortogonal a S, para lo
cual alcanza (teorema 5.2.2) con que p − z sea ortogonal a todos los vectores de una base
de S. Impongamos entonces que p − z sea ortogonal a uk para k = 1, 2, . . . , r.
0 = hp − z, uk i = hp − (λ1 u1 + λ2 u2 + . . . + λr ur ), uk i =
= hp, uk i − h(λ1 u1 + λ2 u2 + . . . + λr ur ), uk i = hp, uk i − λk huk , uk i
en la última igualdad hemos usado que hui , uk i = 0 para i 6= k, debido a que U es
un conjunto ortogonal. Como huk , uk i =
6 0 (ya que al ser base U no contiene al vector
hp,uk i
nulo), podemos despejar λk obteniendo λk = hu k ,uk i
. Hemos demostrado que existe un
único vector z que cumple (a) y (b). Para probar que este vector también cumple (c)
consideramos un vector cualquiera s ∈ S, s 6= z. Tenemos:
p − s = (p − z) + (z − s)
Como z − s ∈ S y p − z ⊥ S resulta (p − z) ⊥ (z − s). Aplicando el teorema de Pitágoras

obtenemos
kp − sk2 = kp − zk2 + kz − sk2
La igualdad anterior y el hecho de que kz−sk > 0 (pues z 6= s) implican kp−sk2 > kp−zk2 ,
lo cual es equivalente a d(p, s) > d(p, z). ♠
Definición 5.2.3. Proyección ortogonal sobre un subespacio.

Si S es un subespacio de Rn y p ∈ Rn , entonces el vector z que cumple las propiedades
demostradas en el teorema anterior se denomina proyección ortogonal de p sobre S
y se simboliza PS (p).
Observación 5.2.3. Desigualdad de Bessel.
Sean S un subespacio de Rn y x ∈ Rn . Si PS (x) es la proyección ortogonal de x sobre S
entonces del teorema de Pitágoras resulta:
kxk2 = kx − PS (x)k2 + kPS (x)k2
De la igualdad anterior se deduce que kPS (x)k2 ≤ kxk2 y, por lo tanto:
kPS (x)k ≤ kxk

Más aún, se cumple la igualdad si, y solo si, PS (x) = x, lo cual quiere decir que x ∈ S.
Si U = {u1 , u2 , . . . , ur } es una base ortogonal de S entonces tenemos la siguiente fórmula

que permite hallar PS (x):
hx, u1 i hx, u2 i hx, ur i
PS (x) = u1 + u2 + . . . + ur
Si observamos con atención esta expresión y recordamos la proposición 5.1.5 podemos
concluir que la proyección ortogonal de x sobre S coincide con la suma de las proyecciones
ortogonales de p sobre cada uno de los vectores de U . Como los vectores de cada sumando
son ortogonales 2 a 2 el teorema de Pitágoras nos permite afirmar que:
|hx, u1 i|2 |hx, u2 i|2 |hx, ur i|2
kPS (x)k2 = + + ... +
Como kPS (x)k2 ≤ kxk2 , deducimos que, cualquiera sea x ∈ Rn , se cumple
|hx, u1 i|2 |hx, u2 i|2 |hx, ur i|2
+ + ... + ≤ kxk2
que suele denominarse Desigualdad de Bessel.
Si además la base U es ortonormal entonces se tiene:

PS (p) = hp, u1 iu1 + hp, u2 iu2 + . . . + hp, ur iur
y, por lo tanto, la desigualdad de Bessel queda:
|hx, u1 i|2 + |hx, u2 i|2 + . . . + |hx, ur i|2 ≤ kxk2
En resumen, si {u1 , u2 , . . . , ur } es un conjunto ortonormal en Rn entonces, cualquiera
sea el vector x ∈ Rn se cumple:
r
X
|hx, uk i|2 ≤ kxk2
k=1
La igualdad se cumple si, y solo si, x pertenece al subespacio generado por {u1 , u2 , . . . , ur },
lo cual siempre ocurrirá si este conjunto es base de Rn .
Definición 5.2.4. Distancia de un punto a un conjunto.
Sean H un subconjunto cualquiera de Rn y p ∈ Rn . Llamaremos distancia de p a H a
la menor de las distancias (en caso que exista) entre p y los puntos de H. Este número lo
simbolizaremos d(p, H). En sı́mbolos:
d(p, H) = min { d(p, h) / h ∈ H }
Observación 5.2.4. Sobre la distancia de un punto a un subespacio.
Si S es un subespacio de Rn y p ∈ Rn entonces del teorema 5.2.3 sabemos que el punto de
S más próximo a p es PS (p). Luego, la distancia de p a S vale:
d(p, S) = kp − PS (p)k
Resulta claro entonces que d(p, S) = 0 ⇐⇒ kp−PS (p)k = 0 ⇐⇒ PS (p) = p ⇐⇒ p ∈ S.
4
Ejemplo 5.2.3. Sea S el subespacio
 de R generado por {e1 , e3 }. Queremos hallar la
−3
 3 
proyección ortogonal de p =   1  sobre S y calcular la distancia de p a S. Como

4
{e1 , e3 } es una base ortonormal de S tenemos:
 
−3
 0 
PS (p) = hp, e1 ie1 + hp, e3 ie3 = −3e1 + e3 = 
 1 

Luego:
     
−3 −3 0

 3   0   3  √
 1  −  1  = 
d(p, S) =       = 25 = 5
0


4 0 4
Definición 5.2.5. Complemento ortogonal de un subespacio.

Sea S un subespacio de Rn . Llamaremos complemento ortogonal de S al conjunto de
todos los vectores de Rn que son ortogonales a S. Este conjunto se simbolizará S ⊥ . En
sı́mbolos:
S ⊥ = { x ∈ Rn / x ⊥ S }
Ejemplo 5.2.4. Sea S un subespacio de R3 de dimensión 2, es decir un plano que pasa

por el origen. Argumentos geométricos simples permiten concluir que, en este caso, S ⊥ es
una recta que pasa por el origen y es perpendicular a dicho plano.
S⊥
o
S
¿Cuál es el complemento ortogonal en R3 de un subespacio de dimensión 1?

⊥
Encuentre R3 y ({o})⊥ .
Proposición 5.2.1. Una caracterización del complemento ortogonal.

Sean S un subespacio de Rn y U = {u1 , u2 , . . . , uk } un generador de S. Entonces S ⊥
coincide con el núcleo de la matriz (MU )t . En otros palabras, se cumple que:

S ⊥ = N (MU )t
Demostración. Como S es el subespacio generado por U , todo vector de S se puede
expresar como C.L. de U . Recordemos también que cada C.L. de U es de la forma MU λ
en donde λ es un vector cualquiera de Rk (el vector de los coeficientes de la C.L.). Tenemos
entonces que
x ∈ S ⊥ ⇐⇒ x ⊥ S ⇐⇒ x ⊥ L(U ) ⇐⇒ x ⊥ MU λ , ∀ λ ∈ Rk ⇐⇒
hMU λ, xi = 0 , ∀ λ ∈ Rk ⇐⇒ hλ, (MU )t xi = 0 , ∀ λ ∈ Rk ⇐⇒ (MU )t x = o

⇐⇒ x ∈ N (MU )t ♠
Observación 5.2.5. Complemento ortogonal del subespacio generado por las
columnas de una matriz.
Sea A una matriz de tamaño n × k, U = C(A) el conjunto de sus columnas y S = L(U )
el subespacio generado por las columnas de A. En este caso la matriz MU coincide con la
matriz A. Según la proposición anterior podemos afirmar que

( L (C(A)) )⊥ = N At
O sea, lo que está diciendo la proposición anterior es que el complemento ortogonal del
subespacio generado por las columnas de una matriz A coincide con el núcleo de la tras-
puesta de A.
Proposición 5.2.2. Propiedades del complemento ortogonal.
Sean S un subespacio de Rn y S ⊥ su complemento ortogonal. Entonces:
1. S ⊥ es un subespacio de Rn .

2. dim(S) + dim S ⊥ = n.
3. Para cada vector v ∈ Rn existen y son únicos vectores z ∈ S y w ∈ S ⊥ tales que
v = z + w.
Demostración.
1. Según la proposición anterior, S ⊥ es el núcleo de una matriz con n columnas y, por
lo tanto, es un subespacio de Rn .

2. Si S = {o} entonces ({o})⊥ = Rn y la igualdad dim(S)+dim S ⊥ = n es inmediata.
Supongamos entonces S 6= {o} y consideremos una base U = {u1 , u2 , . . . , ur } de
S. A partir de la relación entre el rango y el núcleo de una matriz obtenemos:

rg (MU )t + nu (MU )t = n

Como S ⊥ = N (MU )t (proposición anterior), tenemos que nu (MU )t = dim S ⊥ .
Por otra parte, como el rango de una matriz y de su traspuesta coinciden, tenemos:
t
rg (MU ) = rg [(MU )] = dim(S).
Se deduce entonces que:

dim(S) + dim S ⊥ = n
3. Sea v ∈ Rn . Si PS (v) es la proyección ortogonal de v sobre S, del teorema 5.2.3

sabemos que PS (v) ∈ S, v − PS (v) ∈ S ⊥ , y es claro que se cumple la igualdad
v = PS (v) + (v − PS (v)). Es ası́ que se cumple la igualdad enunciada tomando
z = PS (v) y w = v − PS (v). Falta demostrar que dicha descomposición es única.
Supongamos que existan z ′ ∈ S y w′ ∈ S ⊥ tales que v = z ′ +w′ . Restando obtenemos
o = (z − z ′ ) + (w − w′ ) con z − z ′ ∈ S y w − w′ ∈ S ⊥ . Aplicando Pitágoras obtenemos
kz − z ′ k2 + kw − w′ k2 = 0, lo cual implica que z = z ′ y w = w′ . ♠
Ejemplo  5.2.5.
 Sea Sel subespacio
 de R4 generado por U = {u1 , u2 } en donde
1 2
 0   −1  ⊥
u1 =   1  y u2 =  1 . Vamos a hallar S . Para ello consideramos un vector
  
0 1
 
a
 b 
genérico v =   c  e imponemos que v ⊥ S. Según el teorema 5.2.2 es suficiente con que

d
v ⊥ u1 y v ⊥ u2 . Se tiene:
v ⊥ u1 ⇐⇒ hv, u1 i = 0 ⇐⇒ a + c = 0.
v ⊥ u2 ⇐⇒ hv, u2 i = 0 ⇐⇒ 2a − b + c + d = 0.
Resolviendo el sistema obtenemos:
        

 a 
 
 1 0 

    
⊥ b  0   1 
S =    / a, b ∈ R = a   + b   / a, b ∈ R

 −a  
   −1   0  
    

−a + b −1 1
   
1 0
 0 

 1 . Más aún,
 
Resulta entonces que S ⊥ = L({v1 , v2 }) siendo v1 =   −1  y v 2 =  0 
−1 1
{v1 , v2 } es una base de S ⊥ .

Observemos que, efectivamente, dim(S) + dim S ⊥ = 4. También vale la pena observar
lo siguiente. Sabemos que todo vector de R4 se expresa de manera única como la suma de
un vector de S más uno de S ⊥ . Como {u1 , u2 } es base de S y {v1 , v2 } es una base de S ⊥ ,
entonces todo vector de R4 se expresa de manera única como C.L. de {u1 , u2 , v1 , v2 }. Se
deduce que este conjunto es base de R4 .
En el teorema 5.2.3 consideramos una base ortogonal de un subespacio S. El siguiente

resultado muestra que eso siempre es posible, es decir, que todo subespacio tiene una base
ortogonal (y, por lo tanto, una base ortonormal).
Teorema 5.2.4. Proceso de ortogonalización de Gram-Schmidt.
Sea V = {v1 , v2 , . . . , vr } un conjunto L.I. en Rn . Entonces existe un conjunto
U = {u1 , u2 , . . . , ur } L.I. y ortogonal tal que L(U ) = L(V ). Más aún, para cada k con
1 ≤ k ≤ r, el subespacio generado por {u1 , . . . , uk } coincide con el subespacio generado
por {v1 , . . . , vk }.
Demostración. El proceso es constructivo.
Paso 1: Comenzamos tomando u1 = v1 . Es claro que u1 6= o (pues V era L.I.) y que

L({u1 }) = L({v1 }).
Paso 2: Queremos encontrar un vector u2 tal que u2 ⊥ u1 y de modo que L({u1 , u2 }) =

L({v1 , v2 }). Para ello consideramos la proyección ortogonal z2 de v2 sobre u1
v2
u2 = v2 − z2
o u1 = v1 z2
De esa forma tomamos

hv2 , u1 i
u2 = v2 − z2 = v2 − u1
hu1 , u1 i
Sabemos que, de esta manera, u2 ⊥ u1 . Además, u2 6= o (pues, como V es L.I. , z2 6= v2 )

y además L({u1 , u2 }) = L({v1 , v2 }) pues se modificó un generador de manera adecuada
según la proposición 4.3.1.
Paso 3: Queremos encontrar ahora un vector u3 tal que u3 ⊥ u1 , u3 ⊥ u2 y de modo que

L({u1 , u2 , u3 }) = L({v1 , v2 , v3 }). Para ello consideramos la proyección ortogonal z3 de v3
sobre L({u1 , u2 }) y tomamos

hv3 , u1 i hv3 , u2 i
u3 = v3 − z3 = v3 − u1 + u2
hu1 , u1 i hu2 , u2 i
u3
v3
u1
u2
z3
Nuevamente, el teorema 5.2.3 asegura que u3 ⊥ u1 y u3 ⊥ u2 . Con argumentos similares

a los del paso 2 se deduce que u3 6= o y que L({u1 , u2 , u3 }) = L({v1 , v2 , v3 }).
El proceso se continúa de manera análoga obteniendo que los vectores uk (k = 2, . . . , r)

vienen dados por la expresión:

hvk , u1 i hvk , u2 i hvk , uk−1 i
uk = vk − zk = vk − u1 + u2 + . . . uk−1
hu1 , u1 i hu2 , u2 i huk−1 , uk−1 i
Ejemplo 5.2.6. Sea S el subespacio de R4 generado por V = {v1 , v2 , v3 } en donde
     
1 2 5
 0 
 , v2 =  1  , v3 =  0 
   
v1 =  1   0   −1 
0 0 3
V es L.I. (no deje de verificarlo) y, por lo tanto, es una base de S, pero no es un con-
junto ortogonal pues hv1 , v2 i = 2 6= 0. Vamos a aplicar el proceso de Gram-Schmidt para
construir una base ortogonal U de S a partir de la base V . Se tiene:
 
1
 0 
u1 = v1 =  
 1 
0
     
2 1 1
hv2 , u1 i  1  2 0   1 
u2 = v2 −  0  − 2  1  =  −1 
u1 =      
hu1 , u1 i
0 0 0
       
5 1 1 1
hv3 , u1 i hv3 , u2 i  0  4  0  6  1   −2 
v3 − u1 + u2 =   −1  − 2  1  − 3  −1  =  −1 
      
hu1 , u1 i hu2 , u2 i
3 0 0 3
Resulta entonces que una base ortogonal de S es:
     

 1 1 1 

   
0   1   −2
 
U=   1  ,  −1  ,  −1



 
 
0 0 3
Definición 5.2.6. Matrices ortogonales.

Sea A una matriz n×n. Diremos que A es una matriz ortogonal si, y solo si, sus columnas
constituyen una base ortonormal de Rn .
Ejemplo 5.2.7. Las siguientes matrices son ortogonales pues sus columnas constituyen
bases ortonormales de R2 y R3 respectivamente:
!  
√1 −1
√ 0 0 1
A= 2 2 , B= 1 0 0 
√1 √1
2 2 0 1 0
Observemos lo que ocurre al multiplicar At A y B t B:

1 1
! 1 −1
!
√ √ √ √ 1 0
t 2 2 2 2
AA= −1 √1 √1 √1
=
√
2 2 2 2
0 1
    
0 1 0 0 0 1 1 0 0
B tB =  0 0 1   1 0 0  =  0 1 0 
1 0 0 0 1 0 0 0 1
La siguiente proposición muestra que lo que ocurrió en este ejemplo es, de hecho, un
resultado general.
Proposición 5.2.3. Sea A una matriz n × n. Entonces A es ortogonal si, y solo si,
At A = I (en donde I es la matriz identidad n × n).
Demostración. Designemos con C1 (A), C2 (A), . . . , Cn (A) a las columnas de A y con

cij a la entrada de la matriz At A correspondiente a la fila i y columna j. Recordando la
definición de producto de matrices observamos que cij coincide con el producto interno de
la fila i de At por la columna j de A. Pero la fila i de At coincide con la columna i de A.
Es ası́ que cij = hCi (A), Cj (A)i. Se tiene:

t 1, si i = j 1, si i = j
A A = I ⇐⇒ cij = ⇐⇒ hCi (A), Cj (A)i =
0, si i 6= j 0, si i 6= j
y esto ocurre si, y solo si, las columnas de A constituyen una base ortonormal de Rn , o
sea, si y solo si, A es una matriz ortogonal. ♠
Proposición 5.2.4. Caracterización de las matrices ortogonales.

Sea A una matriz n × n. Entonces las siguientes afirmaciones son equivalentes:
1. A es ortogonal.
2. kA.xk = kxk, ∀ x ∈ Rn (la matriz A preserva la norma).
3. hA.u, A.vi = hu, vi, ∀ u, v ∈ Rn (la matriz A preserva los productos internos).
Demostración.
((1) =⇒ (2)) Como A es ortogonal sabemos que At A = I. Si x es un vector cualquiera

de Rn se tiene:
kA.xk2 = hA.x, A.xi = hAt A.x, xi = hx, xi = kxk2
Como kA.xk2 = kxk2 y las bases son no negativas se deduce que kA.xk = kxk.
((2) =⇒ (3)) Para esta parte utilizaremos la (ya conocida) igualdad vista en la proposi-
ción 5.1.3 según la cual
2hx, yi = kx + yk2 − kxk2 − kyk2 , ∀ x, y ∈ Rn

Tomando x = A.u, y = A.v tenemos:
2hA.u, A.vi = kA.u + A.vk2 − kA.uk2 − kA.vk2 = kA.(u + v)k2 − kA.uk2 − kA.vk2
Como, por hipótesis, A preserva las normas de los vectores, lo anterior coincide con
ku + vk2 − kuk2 − kvk2
que, a su vez, es igual a 2hu, vi. Hemos probado que 2hA.u, A.vi = 2hu, vi y, por lo
tanto, hA.u, A.vi = hu, vi.
((3) =⇒ (1)) Si Ci (A) es la columna i-ésima de A sabemos que Ci (A) = A.ei (siendo ei
en i-ésimo vector de la base canónica). Luego:
hCi (A), Cj (A)i = hA.ei , A.ej i = hei , ej i = 0 si i 6= j.
Lo anterior prueba que dos columnas diferentes de A son ortogonales. Por otra parte:
kCi (A)k2 = hCi (A), Ci (A)i = hA.ei , A.ei i = hei , ei i = 1
de donde queda probado que cada columna de A tiene norma 1. ♠
Ejercicio 5.2.1. En cada uno de los siguientes casos investigue si U es un conjunto

ortogonal y si U es base de R3 .
           
 1 3 2   2 3 0 
(a) U =  2  ,  1 ,  −1  (b) U =  2  , 1
  , 0 

   
−1 5 0 −2 4 0
          
 3 4   1 2 2 
(c) U =  −2  ,  3  , (d) U =  2  ,  0  ,  −5 
   
3 2 −2 1 −4
     2 
 1 0 a + b2 
(e) U =  b  ,  −a  ,  −b 
 
a b −a
     
 1 0 13 
Ejercicio 5.2.2. Demuestre que U =  2  ,  −3  ,  −2  es una base ortogo-
 
3 2 −3
nal de R3 . Encuentre las coordenadas de un vector genérico de R3 en la base U . (Recuerde
la observación 5.2.1).
   
 1 0 
Ejercicio 5.2.3. Se considera el subespacio S de R3 generado por  −2  ,  1  .
 
2 1
En cada uno de los siguientes casos encuentre la proyección ortogonal de p sobre S y
calcule la distancia de p a S.
       
1 0 1 0
(a) p =  0  (b) p =  2  (c) p =  −1  (d) p =  0 
0 2 3 1
⊥
Ejercicio 5.2.4. Si S es un subespacio de Rn demuestre que S ⊥ = S.
Ejercicio 5.2.5. Sean S1 y S2 subespacios de Rn . Diremos que S1 ⊥ S2 si, y solo si,
u ⊥ v, ∀ u ∈ S1 , ∀ v ∈ S2 (es decir, cuando todo vector de S1 es ortogonal a todo vector
de S2 ). Demuestre que S1 ⊥ S2 si, y solo si algún generador de S1 es ortogonal a algún
generador de S2 .
     

 1 0 2 

     1 
0 1
U=   , 
    ,   ⊂ R4

 1 0   −2  
 
0 −1 1
 
2
 0 
1. Sean S = L(U ) y p =   3 . Encuentre la proyección ortogonal de p sobre S y

0
calcule d(p, S).
2. Encuentre S ⊥ . Halle una base de S ⊥ .
3. Encuentre una base de R4 formada por vectores de S y de S ⊥ .
     

 2 1 1 

   0 
−1   2 4
U=   0  ,  1   α  ⊂R
   ,  

 
 
1 0 β
1. Determine α y β para que U sea un conjunto ortogonal. Se continúa trabajando con
los valores de α y β hallados.
 
2
 −1 
2. Sean S = L(U ) y p =   0 . Encuentre la proyección ortogonal de p sobre S y

1
calcule d(p, S).
3. Encuentre la forma de los vectores de S ⊥ (es decir, los vectores de R4 que son
perpendiculares a S). Halle una base de S ⊥ .
S
4. Sea w un vector no nulo de S ⊥ . Pruebe que U {w} es base de R4 .
5. Pruebe que ku + wk2 = kuk2 + kwk2 , ∀ u ∈ S, ∀ w ∈ S ⊥ .
 
1 1 1
Ejercicio 5.2.8. Se considera la matriz A =  a 0 −a 
−1 1 a + 1
1. Discuta, según a ∈ R, el valor del rango y la nulidad de A.
2. Se continúa trabajando con a = 2. Sea S el subespacio generado por las columnas de
A. Demuestre que las dos primeras columnas de Aconstituyen  una base ortogonal
2
de S. Encuentre el punto de S más próximo a p =  −1 
0
3. Encuentre S ⊥ .

4. Encuentre N At y verifique que S ⊥ = N At . (observación 5.2.5).
Ejercicio 5.2.9. Si B es una matriz demuestre que (N (B))⊥ coincide con el subespacio
generado por las columnas de B t . Se sugiere recordar la observación 5.2.5.
 
1 0 1 1
 0 1 −1 1 
Ejercicio 5.2.10. Consideremos la matriz: A =   2

1 1 3 
1 −1 2 0
1. Halle una base de N (A).
2. Verifique que nu(A) = 2 y halle rg(A).
3. Encuentre una base U = {u1 , u2 } de N (A) que sea ortonormal.
 
−2
 0 
 1  ∈ N (A) y halle las coordenadas de v en la base U .
4. Verifique que v =  
1
Ejercicio 5.2.11. Sea H un subconjunto de Rn (no necesariamente subespacio). Se llama
complemento ortogonal de H al conjunto H ⊥ = { x ∈ Rn / x ⊥ H }. Demuestre que
H ⊥ es un subespacio de Rn (aunque H no lo sea). Se sugiere probar las condiciones de la
definición de subespacio.
Ejercicio 5.2.12. Sean A una matriz n × n y u un vector fijo de Rn . Se considera el

conjunto S definido por
S = {x ∈ Rn / Ax = hx, ui u}
1. Demuestre que S es un subespacio de Rn .
   
1 −1 1 1
2. Para A =  2 1 2  y u =  1  obtenga una base de S y halle todos lo
1 0 1 1
vectores ortogonales a S.
    
 1 1 
Ejercicio 5.2.13. Se consideran el conjunto V =  1  ,  1  y el subespacio
 
0 3
S = L(V ).
1. Halle un conjunto ortogonal U tal que L(U ) = S.
 
1
2. Calcule la distancia de v =  1  a S.
0
3. Halle un vector h1 de S tal que el águlo formado por e1 y h1 sea π3 .
      

 1 1 0 
       
1  ,   ,  1  y el subes-
0
Ejercicio 5.2.14. Se consideran el conjunto V =   0   1   1 

 
 
0 0 0
pacio S = L(V ).
1. Pruebe que V es L.I. pero no ortogonal.

2. Utilice el proceso de Gram-Schdmidt para construir a partir de V un conjunto orto-
gonal U que sea base de S.
 
0
 0 
3. Calcule la distancia de p = 
 0  a S. (Se sugiere reflexionar un poco y no realizar

e
π
cuenta alguna).
Ejercicio 5.2.15. Se consideran los puntos

     
1 2 2
p1 =  0  , p2 =  2  , p3 =  −1 
1 2 2
y el plano H de R3 determinado por esos tres puntos.

1. Encuentre la ecuación de H.
2. Demuestre que H es un subespacio de R3 .
   
 1 1 
3. Demuestre que  2  ,  −1  es una base ortogonal de H.
 
1 1
 
4
4. Sea p =  1 . Calcule la distancia de p a H y encuentre dos vectores z ∈ H y
0
⊥
w ∈ H tales que p = z + w.
 
1
 2 
  5
Ejercicio 5.2.16. Verifique que la distancia de p = 
 3  al subespacio de R generado

 4 
5
por {e1 + e2 , e3 + e4 , e5 } vale 1.
Ejercicio 5.2.17.
1. Encuentre un ejemplo de dos matrices A y B ortogonales tales que A + B no sea
ortogonal.
2. Si A y B son dos matrices n × n ortogonales demuestre que AB es ortogonal.
Ejercicio 5.2.18. Investigue si la siguiente proposición es verdadera o falsa justificando

la respuesta:
Si A es una matriz n × n tal que kAvk = kvk ∀ v ∈ Rn entonces Av = v, ∀ v ∈ Rn .
5.3. Cálculo de distancias

5.3.1. Vector perpendicular a un plano.
En el capı́tulo 3 habı́amos observado que la ecuación de un plano Π en R3 es de la forma:
ax + by + cz = d (∗)
en donde a, b, c y dson constantes,

 con a, b y c no simultáneamente nulos. Esto quiere
x
decir que los puntos  y  que pertenecen a Π son aquellos cuyas componentes verifican
z
la ecuación (∗). El primer miembro de dicha ecuación  puede
 expresarse
 utilizando un
x a
producto interno entre dos vectores. En efecto, si x =  y  y u =  b  entonces (∗)
z c
se puede escribir ası́:
hx, ui = d , con u 6= o.
Veamos que el vector u tiene una interpretación geométrica simple y útil. Consideremos
entonces un plano Π cuya ecuación es hx, ui = d, en donde u es un vector no nulo. Si q1
y q2 son dos puntos distintos pertenecientes a Π se cumple:
hq1 , ui = d y hq2 , ui = d
Restando miembro a miembro y utilizando las propiedades del producto interno obtene-
mos:
hq1 − q2 , ui = 0
lo cual nos dice que el vector u es ortogonal a todos los vectores cuyos extremos son puntos
pertenecientes al plano.
o Π
q2
q1
Debido a lo anterior, diremos que u es un vector perpendicular (u ortogonal) al plano

Π. De hecho, todos los vectores colineales con u también lo serán.
Las observaciones previas nos permiten encontrar con suma facilidad la ecuación de un
plano que pasa por un punto p y es perpendicular a un vector no nulo u. En efecto, un
punto x pertenece a dicho plano si, y solo si, el vector x − p es ortogonal a u. Resulta
5.3. Cálculo de distancias 151
entonces que la ecuación del plano que pasa por p y es perpendicular a un vector no nulo
u es:
hx − p, ui = 0
   
1 2
Ejemplo 5.3.1. Sean p =  2  yu=  4 . Entonces la ecuación del plano Π que
−1 3
pasa por p y es perpendicular a u es:
* x   1   2 +
 y  −  2 , 4  = 0
z −1 3
o sea: 2x + 4y + 3z = 7.
5.3.2. Distancia de un punto a un plano.

Proposición 5.3.1. Distancia de un punto a un plano.
Sean p ∈ R3 y Π el plano de ecuación hx, ui = d. Entonces el punto p′ de Π más próximo
a p y la distancia de p al plano Π se pueden calcular mediante las siguientes expresiones:
d − hp, ui |hp, ui − d|
p′ = p + u , d(p, Π) =
hu, ui kuk
u
Π
o p′
Demostración. El punto p′ de Π más próximo a p se obtiene intersectando el plano Π

con la recta L que pasa por p y es perpendicular a Π. La ecuación paramétrica de L es
x = p + λu. Tenemos:

x = p + λu x = p + λu
⇐⇒
hx, ui = d hp + λu, ui = d
La segunda ecuación es una ecuación lineal de primer grado en la incógnita λ:
hp, ui + λhu, ui = d
Como hu, ui = 6 0 (por ser u 6= o), la ecuación resulta compatible determinada con única
solución dada por:
d − hp, ui
λ =
hu, ui
Sustituyendo este valor de λ en la primera ecuación del sistema se obtiene
d − hp, ui
p′ = p + u
hu, ui
Ahora bien, la distancia de p al plano Π vale kp′ − pk. Finalmente, sustituyendo aquı́ la
|d − hp, ui|
expresión obtenida para p′ resulta la fórmula d(p, Π) = . ♠
kuk
 
a
Observación 5.3.1. Observemos en primer lugar que si u =  b  entonces la ecuación
c
hx, ui = d del  Π de la proposición anterior puede escribirse ax + by + cz − d = 0. Si
plano 
x0
el punto p es  y0  entonces la distancia de p al plano Π queda:
z0
|hp, ui − d| |ax0 + by0 + cz0 − d|
d(p, Π) = = √
kuk a2 + b2 + c2
 5.3.2. Consideremos el plano Π de ecuación x + 2y − 2z = 2 y el punto p =

Ejemplo

2
 −5 . Entonces:
1
|1 · 2 + 2 · (−5) + (−2) · 1 − 2| 12
d(p, Π) = p = =4
12 + 22 + (−2)2 3
El punto p′ de Π más próximo a p es:

     
2 1 10/3
d − hp, ui 12
p′ = p + u =  −5  +  2  =  −7/3 
hu, ui 9
1 −2 −5/3
5.3.3. Distancia de un punto a una recta.

Proposición 5.3.2. Distancia de un punto a una recta.
Sean p ∈ R3 y L la recta en R3 de ecuación paramétrica x = a + λv , con v 6= o (recta que
pasa por el punto a y es paralela al vector v). Entonces el punto p′ de L más próximo a
p y la distancia de p a la recta L se pueden calcular mediante las siguientes expresiones:
p′ = a + λ1 v , d(p, L) = kp − p′ k = kp − (a + λ1 v)k
en donde
hp − a, vi
λ1 =
hv, vi
5.3. Cálculo de distancias 153
Demostración. El punto p′ de L más próximo a p se obtiene intersectando la recta L

con el plano Π que pasa por p y es perpendicular a L (y por lo tanto a v). La ecuación de
Π es hx − p, vi = 0. La demostración consiste en hallar el dicho punto p′ y queda como
ejercicio. ♠
v
a
p′
Π
p
 
2
Ejemplo 5.3.3. Consideremos el punto p =  1  y la recta L de ecuaciones paramétri-
2

 x =1+λ
cas y = 1 − λ . Queremos hallar el punto de L más próximo a p y la distancia de p a L.

z =2+λ
 
1
Comenzamos observando que un punto que pertenece a la recta es a =  1  y que un
2
 
1
vector paralelo a la recta es v =  −1 . Apliquemos las fórmulas de la proposición
1
anterior:
hp − a, vi 1
λ1 = =
hv, vi 3
Luego, el punto p′ de L más próximo a p es:
     
1 1 4/3
1
p′ =  1  +  −1  =  2/3 
3
2 1 7/3
La distancia de p a L vale:
 
2/3 √
′
6
d(p, L) = kp − p k =
 1/3 =

−1/3 3
 
3
Ejercicio 5.3.1. Sea H el plano que pasa por el punto  1  y es perpendicular al
1
 
1
vector  −2 . Calcule la distancia de los siguientes puntos al plano H:
4
   
1 1
p1 =  0  , p2 =  1 
1 −1
     
2 2 1
Ejercicio 5.3.2. Sea U = {u1 , u2 , u3 } siendo u1 =  1 , u2 =  1  y u3 =  2 
3 2 4
1. Calcule la distancia del punto u1 a la recta L que pasa por los puntos u2 y u3 .
2. Sea H el subespacio generado por {u1 , u2 }. Compruebe que H es un plano y calcule

la distancia del punto u3 a H.
 
1
Ejercicio 5.3.3. Se consideran el punto p =  1 , el plano Π de ecuación x+2y −z = 3
1

 x=1+λ
y la recta L de ecuaciones paramétricas y = −1 − λ .

z = −4 − λ
1. Pruebe que L ⊂ Π.
2. Calcule d(p, Π) y encuentre el punto de Π más próximo a p.
3. Calcule d(p, L) y encuentre el punto de L más próximo a p.
4. Verifique que d(p, Π) < d(p, L) y explique este resultado.
5. ¿Existe alguna recta L′ ⊂ Π tal que d(p, Π) = d(p, L′ )? Justifique la respuesta.
 
1
Ejercicio 5.3.4. Halle la ecuación paramétrica de la recta r que pasa por el punto  2 
3

x−y =3
y corta perpendicularmente a la recta s) ¿Qué da r ∩ s?
2x + z = 3
Ejercicio 5.3.5. Dados p y q puntos diferentes de R3 , se considera el conjunto H defi-

nido por: H = {x ∈ R3 / d(x, p) = d(x, q)}. Demuestre que H es un plano e interprete
geométricamente.    
1 2
Encuentre H en el caso en que p =  −1  y q =  0 .
1 1
5.4. Aproximación por el método de mı́nimos cuadrados 155
5.4. Aproximación por el método de mı́nimos cuadrados
En esta sección vamos a discutir un ejemplo interesante, donde casi todas la ideas que
se han desarrollado en el curso pueden aplicarse. Imaginemos que se desea construir un
modelo de demanda de un cierto producto. Existen fuertes indicios para suponer que
la cantidad d de personas dispuestas a comprar un cierto bien es una función lineal del
precio p del mismo. Es decir, d(p) = αp + β. Para ajustar el modelo se realiza una encuesta
consultando a las personas si estarı́an dispuestas a comprar el bien en cuestión a distintos
precios. La encuesta proporciona la siguiente tabla de datos:
precio demanda
p1 d1
p2 d2
.. ..
. .
pn dn
Como es natural suponer, los datos no resultarán (en general) estar alineados y se tra-
tará entonces de determinar α y β para que el modelo ajuste lo “mejor posible” a los
mismos. Primero que nada, claro está, debemos darle significado a la expresión lo “mejor
posible” porque, como veremos, puede haber muchos criterios razonables para hacerlo. La
solución que propondremos para este problema se conoce como método de mı́nimos
cuadrados.
5.4.1. Descripción del método.
Como dijimos anteriormente, no es razonable suponer que los datos empı́ricos estén ali-
neados y, por lo tanto, no existirá ninguna recta que pase por todos los puntos (pi , di ).
Intentaremos buscar entonces la recta que pase “mas cerca” de ellos. En el precio pi el
modelo lineal predice que αpi + β personas compraran el bien. Sin embargo, la encuesta
registró que a ese precio serı́an di las personas que comprarı́an. Una primera idea podrı́a
ser considerar la suma de las diferencias ri = di − (αpi + β), como una medida del error
global entre los datos empı́ricos y los dados por la recta. Se puede rápidamente objetar a
este procedimiento que los errores se compensarı́an y un error positivo muy grande y otro
negativo se anuları́an. Esta objeción podrı́a levantarse considerando la suma de valores
absolutos de la diferencias |ri |. Esta solución es razonable, pero conduce a un problema
muy complejo. El problema resulta mucho mas sencillo de resolver si se considera como
medida del error global la suma de los cuadrados de las diferencias ri2 . La idea es intentar
elegir α y β reales de modo que esta suma de errores cuadráticos sea los más pequeña
posible. En otras palabras deseamos encontrar α y β reales de modo que sea mı́nimo
n
X n
X
R(α, β) = ri2 = [di − (αpi + β)]2
i=1 i=1
Recordando que la norma de un vector es la raı́z cuadrada de la suma de los cuadrados

de sus coordenadas podemos escribir la función R en estos términos. Llamando
     
d1 p1 1
 d2   p2   1 
     
d =  . , p =  . , 1 =  . 
.
 .   . .  .. 
dn pn 1
Se tiene que
      2

d1 p1 1


 d2 


 p2 


 1
 2
R(α, β) =  .. −α .. −β  = kd − (αp + β1)k
..

.   .   .


dn pn 1
En consecuencia, se trata de calcular, en caso de existir, α y β reales que minimicen el

valor de R(α, β). Veamos ahora cómo podemos reducir el problema al de proyectar un
vector sobre cierto subespacio.  
p1 1
 p2 1 
 
Para esto observemos primero que, llamando A =  . .  podemos escribir
.
 . .  .
pn 1
 
p1 1


 p2 1   α α
αp + β1 =  .. ..  β = A
 . .  β
pn 1
Entonces, variar α y β en R es equivalente a hacer combinaciones lineales de los vectores

p y 1 que son las columnas de la matriz A. En consecuencia, encontrar α0 y β0 reales que
minimicen R(α, β) es equivalente a determinar un vector v0 = α0 p + β0 1 en el subespacio
S = L ({p, 1}) que minimice la norma de la diferencia d − v. Como ya hemos visto ante-
riormente en el teorema 5.2.3, este problema tiene solución: debemos elegir v0 = α0 p + β0 1
como la proyección ortogonal de d sobre el subespacio S = L ({p, 1}). Ahora bien, si v0
es la proyección de d sobre S entonces d − v0 ∈ S ⊥ . Por otra parte, según la proposición
5.2.1 se cumple que S ⊥ = N (At ). Por lo tanto, el problema se reduce a calcular v0 tal que
d − v0 ∈ N (At ), es decir, necesitamos determinar v0 tal que At (d − v0 ) = o o, lo que es lo
mismo, tal queAt v0 = At d.
α0
Como v0 = A , sustituyendo arriba se observa que hallar v0 resulta equivalente a
β0
encontrar α0 y β0 solución del sistema

x
At A = At d
y
Este sistema se denomina ecuación normal del problema de mı́nimos cuadrados. Final-
mente, una observación clave es la siguiente: como las columnas de A forman un conjunto
linealmente independiente, se tiene que At A es una matriz 2 × 2 invertible (ver ejercicio

5.1.8), de donde resulta:
α0
= (At A)−1 At d
β0
Ejemplo 5.4.1. Veamos un ejemplo concreto para entender cómo funciona el método.
Supongamos que los datos empı́ricos registrados por la empresa encuestadora son los
indicados en la siguiente tabla, donde los precios se expresan en cientos de pesos y la
cantidad de compradores en miles de personas.
P recio Demanda
1 7
2 5
3 2
4 1
Se supone que la demanda resulta ser función lineal de precio, es decir d(p) = αp + β.
Como los datos no están alineados buscamos, aplicando el método de mı́nimos cuadrados,
α y β de mondo
 que la recta αp + β aproxime
 lo mejor posible los datos. Definimos el
1 7
 2   5 
vector p = 
 3  y el vector d =  2 .
  
4 1
 
1 1
 2 1 
Resulta entonces la matriz A =   y su traspuesta es At = 1 2 3 4 .
 3 1  1 1 1 1
4 1
Por lo tanto  
1 1
1 2 3 4   2 1  = 30 10

At A =
1 1 1 1  3 1  10 4
4 1
Observamos que ni A ni At son invertibles (ni siquiera son cuadradas), pero el producto
de ambas At A sı́ es invertible. Las ecuaciones normales son entonces
 
7
30 10 α 1 2 3 4  5  27
=   =
10 4 β 1 1 1 1  2  15
1
Invirtiendo la matriz del sistema (o escalerizando, como guste el lector) se tiene que
−1 1
t −1 30 10 5 − 12
(A A) = =
10 4 − 12 3
2
y por lo tanto los valores de α y β son

1 21
α 5 − 12 27 − 10
= 1 3 =
β −2 2 15 9
La función lineal para la demanda en función del precio que ha estimado el método de
mı́nimos cuadrados es entonces:
−21
d(p) = p+9
10
La gráfica de esta recta, ası́ como los cuatro puntos de la tabla de datos se indican en la
siguiente figura:
y 10
9
-1 1 2 3 4 5
-1 v2
El error cuadrático global R(α, β) resulta ser en este caso:

X 4 4 2
−21 2
X −21
R ,9 = ri = di − pi + 5 = 0, 7
10 10
i=1 i=1
5.4.2. Una fórmula para la proyección ortogonal

Terminemos la sección observando que podemos obtener una fórmula explı́cita para la
proyección ortogonal que no requiere obtener previamente una base ortogonal. Con un ra-
zonamiento similar al que hicimos para el método de mı́nimos cuadrados, supongamos que
queremos proyectar un vector v cualquiera sobre un subespacio S y que B = {v1 , v2 , . . . , vr }
es una base cualquiera (no necesariamente ortogonal) de S. Como ya sabemos, el vector
proyección PS (v) ∈ S y, por lo tanto, es una combinación lineal de los vectores de la base
B. Existen entonces números x1 , x2 , . . . , xr tales que
 
x1
PS (v) = x1 v1 + . . . + xr vr = MB  ... 
 
xr
siendo MB la matriz cuyas columnas son los vectores de la base B. También sabemos que
S coincide con el subespacio generado por las columnas de MB de donde, por el teorema
⊥ t
5.2.1, se cumple que S = N (MB ) . Por otra parte se sabe que
 
x1
v − PS (v) ∈ S ⊥ ⇒ v − MB  ...  ∈ S ⊥ = N (MB )t
 
xr
por lo tanto x1 , . . . , xr son números tales que

  

x1 x1
 ..
t t
(MB )t MB  ...  = (MB )t v
  
(MB ) v − (MB ) MB  . =o ⇒
xr xr
Por ser B una base de S, y por lo tanto un conjunto L.I., el rango de MB es r, de donde
resulta (ver ejercicio 5.1.8) que (MB )t MB es una matriz r×r invertible. Consecuentemente
el vector  
x1
 ..  t
−1
 .  = (MB ) MB (MB )t v
xr
 
x1
y como PS (v) = MB  ...  se deduce que
 
xr
−1
PS (v) = MB (MB )t MB (MB )t v
   
−1 1
 0   1 
Ejemplo 5.4.2. Se consideran en R4 el subespacio S = L    1  ,  −1  . Se
   
−1 2
 
2
 1 
quiere calcular el vector de S mas próximo a v = 
 1 . Sabemos que tal vector es la

2
proyección ortogonal de v sobre S.
Aplicamos entonces lo anterior. Definimos
 
−1 1
 0 1  t −1 0 1 −1
MB =  
 1 −1  ⇒ (MB ) =
1 1 −1 2
−1 2
Multiplicando se obtiene
 
−1 1
−1 0 1 −1  0 1  3 −4
(MB )t MB =  1 −1  = −4
 
1 1 −1 2 7
−1 2
Calculando la inversa se tiene

7 4

t
−1
(MB ) MB = 5 5
4 3
5 5
Calculando ahora la proyección obtenemos

     3 
−1 1 7 4 2 5
 0 1  −1 0 1 −1  1   6 
PS (v) =   5 5  = 5 
 1 −1  4 3 1 1 −1 2  1   − 35 
5 5
9
−1 2 2 5
Calcule el lector la distancia de v a S y verifique que efectivamente el vector que obtuvimos

es la proyección, ¿cómo se puede hacer esto?.
Ejercicio 5.4.1. En un experimento se midió, según el tiempo, una cierta magnitud y,
obteniéndose los siguientes valores
t 0 1 3 4
y 0 1 2 5
1. Grafique y contra t .
2. Aplicando el método de mı́nimos cuadrados halle la “mejor” recta que ajuste los
datos anteriores (y = αt + β). Grafique la solución.
3. Aplicando el método de mı́nimos cuadrados halle la “mejor” parábola que ajuste los
datos anteriores (y = αt2 + βt + γ). Grafique la solución.
Ejercicio 5.4.2. (Tomado de [Moretti] pág. 264). Los datos de la tabla corresponden a
los precios y a las cantidades de naranja vendidas en un supermercado durante doce dı́as
consecutivos (precios en pesos por kilo y cantidades en kilos).
Precio p 10,0 9,0 8,0 7,0 7,0 7,0 7,0 6,5 6,0 6,0 5,5 5,0
Cantidad y 55 70 90 100 90 105 80 110 125 115 130 130
Aplicando el método de mı́nimos cuadrados halle la “mejor” recta que ajuste los datos
anteriores (y = αp + β). Calcule el error cuadrático global.
  

 x 

  
y 4
Ejercicio 5.4.3. Sea S =   ∈ R : x + y − z + t = 0 , −x − y + t = 0
 

 z 

 
t
 
−1
 1 
1. Halle el vector w de S mas próximo a v =   0 

1
2. Verifique que v − w es perpendicular a S.
3. Calcule la distancia de v a S.
Ejercicio 5.4.4. Se supone que la magnitud y depende de t según una ley del tipo y =
f (t) = a + bt2 . Determine, usando el método de mı́nimos cuadrados, la función f (t) que
mejor se ajusta a los siguientes datos experimentales:
t -1 0 1 2
y -1 2 -1 8
Capı́tulo 6
Diagonalización
6.1. Introducción
La utilización de matrices de dimensiones grandes en el planteo y resolución de problemas

prácticos concretos (como el desarrollado en la última sección del capı́tulo anterior), moti-
varon el desarrollo de un área cientı́fica denominada “Cálculo Numérico” que tiene, entre
otros objetivos, la creación e implementación de algoritmos computacionales eficientes que
permiten resolver sistemas de ecuaciones y realizar todo tipo de operaciones con matri-
ces. Si bien el estudio de dichos algoritmos está fuera de nuestros objetivos, intentaremos
aquı́ presentar algunas ideas que sirvan de motivación para comprender la relevancia de
los contenidos de este capı́tulo.
Supongamos que tenemos una matriz A de tamaño n × n (n puede ser “grande”) y que
necesitamos calcular alguna de sus potencias, digamos, por ejemplo, A20 . Aún disponien-
do de una calculadora (no programable), dicho cálculo se torna enormemente tedioso e
ineficiente si no contamos con una computadora que contenga programas adecuados para
tales efectos. Sin embargo, hay un caso particular en donde dicha tarea se torna trivial.
Nos estamos refiriendo al caso en que la matriz A sea una matriz diagonal.
 
d1 0 0
Por ejemplo, si A =  0 d2 0  al calcular sus potencias obtenemos:
0 0 d3
   
(d1 )2 0 0 (d1 )3 0 0
A2 =  0 (d2 )2 0  , A3 =  0 (d2 )3 0  , ...
0 0 (d3 )2 0 0 (d3 )3
 
(d1 )20 0 0
A20 = 0 (d2 )20 0 
0 0 (d3 )20
162 Capı́tulo 6. Diagonalización
En general, si A es n × n y k un natural cualquiera se cumple:

   
d1 0 · · · 0 (d1 )k 0 ··· 0
 0 d2 · · · 0   0 (d )k ··· 0 
 k  2 
A= . .. . . ..  =⇒ A =  .. .. .. .. 
 .. . . .   . . . . 
0 0 · · · dn 0 0 · · · (dn )k
Es decir, si A es una matriz diagonal entonces Ak también lo es y tiene en su diagonal

principal las k-ésimas potencias de las correspondientes entradas de la diagonal de A.
El lector podrá pensar (con total razón) que esta observación, si bien correcta, es extre-
madamente restrictiva pues solo vale para matrices diagonales. Sin embargo, veremos a
continuación que es posible simplificar el cálculo de las potencias para una clase de matri-
ces mucho más amplia que las diagonales.
Supongamos ahora que A es una matriz cualquiera n × n no necesariamente diagonal.

Supongamos también que existen matrices n × n, B invertible y D diagonal, tales que
A = BDB −1 . Calculemos A2 :
2
A2 = BDB −1 = BDB −1 BDB −1 = BD B −1 B DB −1 =
= BDIDB −1 = BDDB −1 = BD 2 B −1
Hemos obtenido que A2 = BD 2 B −1 y, realizando un razonamiento inductivo llegamos a
que, cualquiera que sea k natural se cumple:
A = BDB −1 =⇒ Ak = BD k B −1
Como D es una matriz diagonal, la potencia D k es inmediata de calcular. Luego, para

obtener Ak solamente es necesario conocer
B −1 y realizar un par de producto de matrices:
primero BD k y, a continuación, BD k B −1 .
Las matrices A que cumplen la condición que acabamos de mencionar (existen B inver-
tible y D diagonal tales que A = BDB −1 ) se denominan matrices diagonalizables y
constituyen en el principal objeto de estudio de este capı́tulo. Hay que reconocer que, al
menos en principio, la condición de “matriz diagonalizable” aparece como complicada o, al
menos, nada fácil de verificar. En el siguiente ejemplo mostraremos un camino alternativo
(de hecho, será uno de los principales resultados de este capı́tulo) para verificar si una
matriz es diagonalizable.

−1 −2
Consideremos la matriz A dada por A = . Es inmediato verificar que
3 4

2 2 1 1
A =2 y A =1
−3 −3 −1 −1

2 1
Poniendo u1 = y u2 = el cálculo anterior nos dice que Au1 = 2u1 y
−3 −1
Au2 = u2 . Es decir, los vectores u1 y u2 tienen la peculiaridad de que, al multiplicarlos
6.2. Valores y vectores propios de una matriz 163
por A, se obtienen vectores colineales con ellos, con coeficientes

de
proporcionalidad 2
2 −3
y 1 respectivamente. Sean U = {u1 , u2 } y B = MU = . Observemos que el
1 −1
producto AB lo podemos efectuar sin necesidad de realizar operaciones. En efecto, la
primera columna de AB se obtiene multiplicando A por la primera columna de B o sea
por u1 y, por lo tanto:
Primera columna de AB es Au1 = 2u1
De modo análogo:
Segunda columna de AB es Au2 = u2
Luego, la matriz AB coincide con la matriz cuya primera columna es 2u1 y cuya segunda
es

2 0
u2 . A su vez, esta matriz coincide con el producto de B = MU por la matriz D = .
0 1
Hemos comprobado que AB = BD siendo D una matriz diagonal. Multiplicando ambos
miembros a derecha por B −1 (que existe pues claramente U es base de R2 ) obtenemos
A = BDB −1 y, por lo tanto, A es diagonalizable.
Si repasamos con cuidado el razonamiento observamos que es de carácter general y no

depende de los números involucrados. Solamente se necesitó una matriz A 2 × 2 con la
particularidad de la existencia de dos vectores u1 y u2 (con U = {u1 , u2 } base de R2 ) y
de dos números λ1 y λ2 tales que Au1 = λ1 u1 y Au2 = λ2 u2 . Si B es la matriz MU se
cumple:
Primera columna de AB es Au1 = λ1 u1
Segunda columna de AB es Au2 = λ2 u2

λ1 0
Pero, por otra parte, el producto de B por la matriz diagonal D = también
0 λ2
tiene por columnas a λ1 u1 y λ2 u2 . Es decir: AB = BD. Como B es invertible (por ser U
base de R2 ) se deduce que A = BDB −1 y, por lo tanto, A resulta ser diagonalizable.
Este ejemplo muestra entonces que el hecho de encontrar vectores u tales que Au sea
colineal con u puede ser de utilidad para investigar si la matriz A es diagonalizable.
6.2. Valores y vectores propios de una matriz

Definición 6.2.1. Valores y vectores propios de una matriz.
Sea A una matriz n × n. Diremos que el número λ es valor propio (o autovalor) de A
si, y solo si, existe algún vector v ∈ Rn , con v 6= o, tal que A.v = λv.
Si λ es valor propio de A, entonces a cada vector x ∈ Rn que verifique la igualdad
A.x = λx lo llamaremos vector propio (o autovector) asociado al valor propio λ.
Observación 6.2.1. Sobre la definición de valor propio.

1. Como A.o = λo cualquiera que sea el número λ, para que la definición de valor
propio tenga relevancia se exige que exista algún vector v no nulo tal que A.v = λv.
2. Si x ∈ Rn es vector propio asociado al valor propio λ entonces cualquier vector

colineal con x también lo es. En efecto, sea w = αx con α ∈ R. Se tiene:
A.w = A.(αx) = αA.x = αλx = λαx = λw =⇒ A.w = λw

−1 −2
Ejemplo 6.2.1. En la sección anterior habı́amos observado que si A =
3 4
entonces se cumplı́a:

2 2 1 1
A =2 y A =1
−3 −3 −1 −1
De acuerdo a la definición
dadapodemos decir que
2
2 es valor propio de A y es un vector propio asociado a dicho valor propio.
−3

1
1 es valor propio de A y es un vector propio asociado a dicho valor propio.
−1
Para hallar
todos
los vectores propios asociados
alvalor
propio
2tenemos
que buscar los
x −1 −2 x x
vectores ∈ R2 que verifiquen: = 2 . Eso nos lleva al
y 3 4 y y
siguiente sistema de ecuaciones:

−x − 2y = 2x −3x − 2y = 0 3x + 2y = 0
∼ ∼
3x + 4y = 2y 3x + 2y = 0 0=0
El conjunto solución de dicho sistema es:

x 2
−3x /y∈R =L
2 −3
Hemos obtenido que el conjunto de todos los vectores propios asociados al valor propio 2
constituye un subespacio de R2 (en este caso, de dimensión 1).
Busquemos ahora todos los vectores propios asociados al valor propio 1. Se tiene:

−x − 2y = x −2x − 2y = 0 x+y =0
∼ ∼
3x + 4y = y 3x + 3y = 0 0=0
El conjunto solución de dicho sistema es:

x 1
/x∈R =L
−x −1
Hemos obtenido que el conjunto de todos los vectores propios asociados al valor propio 1
constituye un subespacio de R2 (en este caso, también de dimensión 1).
Acabamos de observar entonces que, una vez que conocemos un valor propio para A,
la búsqueda de sus correspondientes vectores propios se reduce a resolver un sistema
(cuadrado) de ecuaciones lineales. Sin embargo, el lector se podrá preguntar con total razón
¿cómo se descubrieron los valores propios 1 y 2? Más aún, la matriz A ¿no tendrá además
otros valores propios? El siguiente teorema va en camino de responder estas preguntas.
Teorema 6.2.1. Cálculo de valores y vectores propios.

Sea A una matriz n × n. Se tiene:
1. λ es valor propio de A si, y solo si, det(A − λI) = 0.
2. Si λ es valor propio de A entonces el conjunto {x ∈ Rn / A.x = λx} (de todos los
vectores propios asociados al valor propio λ) es un subespacio no trivial de Rn .
Demostración. En primer lugar, vale la pena observar la equivalencia entre las siguientes
igualdades:
A.x = λx ⇐⇒ A.x − λx = o ⇐⇒ (A − λI).x = o
en donde I es la matriz identidad n × n.
1. Por definición, λ es valor propio de A si, y solo si, existe algún vector v ∈ Rn , con
v 6= o, tal
que (A− λI).v = o. Esto es equivalente a decir que el sistema homogéneo
x1
 x2 
 
(A − λI)  .  = o admite al menos una solución distinta de la trivial. Como
 .. 
xn
el sistema es n × n, el teorema de Cramer nos permite afirmar que lo anterior es
equivalente a que el determinante del sistema sea nulo, es decir, det(A − λI) = 0.
2. Supongamos ahora que λ es valor propio de A. Un vector x ∈ Rn es vector propio
de A asociado a λ si, y solo si, (A − λI).x = o. Pero esto es equivalente a decir que x
pertenece al núcleo de la matriz A − λI. Resulta entonces que el conjunto de todos
los vectores propios asociados al valor propio λ coincide con el núcleo de A − λI y,
por lo tanto, es un subespacio de Rn . Este subespacio no puede ser el trivial pues,
por la propia definición de valor propio, existe v 6= o tal que (A − λI).v = o. ♠
Ejemplo 6.2.2. Volvamosal ejemplo anterior e intentemos calcular todos los valores
−1 −2
propios de A = . Según la proposición anterior tenemos que hallar las raı́ces
3 4
de det(A − λI). Se tiene:

−1 − λ −2
det(A − λI) = = λ2 − 3λ + 2
3 4−λ
Las únicas raı́ces de este polinomios son 1 y 2. Resulta entonces que esta matriz no tiene
otros valores propios.
Observación 6.2.2. Polinomio caracterı́stico de un matriz 2 × 2.
Si A es una matriz n × n entonces al polinomio det(A − λI) lo llamaremos polinomio
caso 2 ×2 podemos hallar una fórmula explı́cita para
caracterı́stico de la matriz. En el
a b
dicho polinomio. En efecto, si A = entonces:
c d

a−λ b
det(A − λI) = = λ2 − (a + d)λ + (ad − bc) = λ2 − tr(A)λ + det(A)
c d−λ
Definición 6.2.2. Subespacio propio asociado a un valor propio.

Sea λ un valor propio de la matriz A n × n. Según el teorema 6.2.1 el conjunto de todos
los vectores propios asociados al valor propio λ es un subespacio no trivial de Rn . A dicho

subespacio lo llamaremos subespacio propio asociado al valor propio λ y lo simboli-
zaremos Sλ . Recordemos además que este subespacio coincide con el núcleo de la matriz
A − λI, es decir:
Sλ = N (A − λI)

6 8
Ejemplo 6.2.3. Queremos hallar los valores y vectores propios de la matriz A = .
2 6
Valores propios: Tenemos que hallar las raı́ces de det(A − λI). Se tiene:

6−λ 8
det(A − λI) = = λ2 − 12λ + 20
2 6−λ
Las raı́ces de este polinomio de segundo grado son 2 y 10 y, por lo tanto, los valores
propios de A son 2 y 10.
Vectores propios asociados al valor propio 2: Tenemos que hallar el núcleo de la ma-

4 8
triz A − 2I = , lo cual nos lleva al siguiente sistema de ecuaciones:
2 4

4x + 8y = 0 x + 2y = 0
∼
2x + 4y = 0 0=0
El conjunto solución de dicho sistema, es decir, el subespacio propio asociado al valor

propio λ = 2 es entonces:

−2y −2
S2 = /y∈R =L
y 1
Vectores propios asociados al valor propio 10: Tenemos que hallar el núcleo de la

−4 8
matriz A − 10I = , lo cual nos lleva al siguiente sistema de ecuaciones:
2 −4

−4x + 8y = 0 −x + 2y = 0
∼
2x − 4y = 0 0=0
El conjunto solución de dicho sistema, es decir, el subespacio propio asociado al valor

propio λ = 10 es entonces:

2y 2
S10 = /y∈R =L
y 1
 
5 0 −6
Ejemplo 6.2.4. Queremos hallar los valores y vectores propios de la matriz A =  9 −1 −9 .
3 0 −4
Valores propios: Tenemos que hallar las raı́ces de det(A − λI). Se tiene:

5−λ 0 −6

det(A − λI) = 9
−1 − λ −9 = (−1 − λ)(λ2 − λ − 2)

3 0 −4 − λ
El resultado se obtuvo desarrollando el determinante por la segunda columna. Las

raı́ces de este polinomio de tercer grado son −1 (doble) y 2 (simple) y, por lo tanto,
esos son los valores propios de A.
Vectores propios asociados al valor propio 2: Tenemos que hallar el núcleo de la ma-
 
3 0 −6
triz A − 2I =  9 −3 −9 , lo cual nos lleva al siguiente sistema de ecuaciones:
3 0 −6
 
 3x + 0y − 6z = 0  x − 2z = 0
9x − 3y − 9z = 0 ∼ 3x − y − 3z = 0
 
3x + 0y − 6z = 0 0=0
El sistema es compatible indeterminado con un grado de libertad y, el conjunto

solución de dicho sistema, es decir, el subespacio propio asociado al valor propio
λ = 2 es entonces:
    
 2z   2 
S2 =  3z  / z ∈ R = L   3  
   
z 1
Vectores propios asociados al valor propio −1: Tenemos que hallar el núcleo de la
 
6 0 −6
matriz A + I =  9 0 −9 , lo cual nos lleva al siguiente sistema de ecuaciones:
3 0 −3
 
 6x − 6z = 0  x−z =0
9x − 9z = 0 ∼ 0=0
 
3x − 3z = 0 0=0
El sistema es compatible indeterminado con dos grados de libertad y, el conjunto

solución de dicho sistema, es decir, el subespacio propio asociado al valor propio
λ = −1 es entonces:
      
 x   1 0 
S−1 =  y  / x, y ∈ R = L   0  , 1  

   
x 1 0
Teorema 6.2.2. Independencia lineal de vectores propios asociados a valores

propios diferentes.
Sean A una matriz n × n y u1 , u2 , . . . , ur vectores propios no nulos de A asociados res-
pectivamente a los valores propios λ1 , λ2 , . . . , λr diferentes entre sı́. Entonces el conjunto
{u1 , u2 , . . . , ur } es L.I.
Demostración. Lo demostraremos solamente para dos vectores (para el caso general se

puede proceder por inducción). Queremos probar entonces que {u1 , u2 } es L.I. Suponga-
mos, razonando por reducción al absurdo, que no lo fuera. En este caso uno de los vectores
serı́a colineal con el otro. Digamos que existe α ∈ R tal que u2 = αu1 . Multiplicando ambos
miembros por A obtenemos:
A.u2 = A.(αu1 ) =⇒ A.u2 = αA.(u1 ) =⇒ λ2 u2 = αλ1 u1
Sustituyendo la expresión u2 = αu1 en la última igualdad obtenemos λ2 αu1 = αλ1 u1 , de

donde resulta:
α(λ2 − λ1 )u1 = o (∗)
Por hipótesis u1 6= o y λ2 − λ1 6= 0 (pues los valores propios eran diferentes entre sı́). Para
que se cumpla (∗) la única posibilidad que queda es que α = 0. Pero esto implicarı́a u2 = o
lo cual es absurdo. ♠
Resulta claro del teorema anterior que dos subespacios propios de A asociados a valores
propios diferentes solamente tienen en común al vector nulo.
Ejercicio 6.2.1. Si A es una matriz cuadrada pruebe que A es invertible si, y solo si, 0
no es valor propio de A.
Ejercicio 6.2.2. Supongamos que λ es valor propio de la matriz A. Demuestre que:

1. αλ es valor propio de αA.
2. Si A es invertible entonces λ no puede ser 0 y se cumple que 1/λ es valor propio de
A−1 .
Ejercicio 6.2.3. Sean A y B dos matrices n × n tales que u es vector propio de A y de

B. Demuestre que:
1. αu es vector propio de A para α ∈ R.
2. u es vector propio de A + B y obtenga el valor propio correspondiente.
3. u es vector propio de A.B y obtenga el valor propio correspondiente.
Ejercicio 6.2.4. Encuentre los valores propios y los subespacios propios de las siguientes
matrices:
 
1 −1 4
4 2 6 8 1 3
A= , B= , C= , D= 3 2 −1 
3 3 −2 6 2 6
2 1 −1
Ejercicio 6.2.5.
1. Demuestre que los únicos valores propios posibles de una matriz ortogonal A son 1
y −1. (Recuerde que si A es ortogonal entonces kA.vk2 = kvk2 , ∀ v ∈ Rn ).
√ √ !
2 2
√2
− √2
2. Verifique que la matriz 2 2
es ortogonal pero que no tiene valores propios.
2 2
6.3. Matrices diagonalizables 169
Ejercicio 6.2.6.
 
5 3 −6
Consideremos la matriz A =  −4 −2 8 . Verifique (aplicando la definición) que
−1 −1 4
los siguientes vectores son vectores propios de A y encuentra sus correspondientes valores
propios:      
−4 1 −3
u1 =  6  , u2 =  −1  , u3 =  4 
1 0 1
6.3. Matrices diagonalizables

Definición 6.3.1. Matrices diagonalizables.
Sea A una matriz n × n. Diremos que A es diagonalizable si, y solo si, existen matrices
n × n, B invertible y D diagonal, tales que B −1 AB = D.
En este caso diremos que B diagonaliza a la matriz A.
Observación 6.3.1. Sobre matrices diagonalizables.

1. Toda matriz diagonal es diagonalizable. En efecto, alcanza con tomar la matriz B
de la definición como la matriz identidad.
2. Siendo B invertible, las siguientes igualdades son equivalentes:
B −1 AB = D ⇐⇒ AB = BD ⇐⇒ A = BDB −1
3. Vale la pena tener presente lo discutido en la introducción al capı́tulo en cuanto a

las potencias de A en el sentido de que si A = BDB −1 entonces Ak = BD k B −1 para
todo número natural k.
El siguiente teorema (cuya demostración se encuentra en el apéndice de esta sección)

establece de forma precisa lo observado en la introducción al capı́tulo.
Teorema 6.3.1. Condiciones necesarias y suficientes para que una matriz sea
diagonalizable.
Si A es una matriz n × n entonces las siguientes afirmaciones son equivalentes:
1. A es diagonalizable (es decir, existen matrices n × n, B invertible y D diagonal, tales

que B −1 AB = D).
2. Existe una base de Rn formada por vectores propios de A. Si U = {u1 , u2 , . . . , un }

es una base de Rn formada por vectores propios de A y λ1 , λ2 , . . . , λn son los
correspondientes valores propios (esto es: A.ui = λi ui , i = 1, 2, . . . , n), entonces
una matriz
 B que diagonaliza  a A es B = MU y la correspondiente matriz diagonal
λ1 0 · · · 0
 0 λ2 · · · 0 
 
es D =  . .. . . .. 
 .. . . . 
0 0 · · · λn
3. La suma de las dimensiones de los subespacios propios es n.
Veamos varios ejemplos que muestran cómo podemos aplicar el teorema anterior para
decidir si una matriz es diagonalizable o no.

6 8
Ejemplo 6.3.1. Consideremos la matriz A = del ejemplo 6.2.3. Sus únicos
2 6
valores propios son λ1 = 2 y λ2 = 10. Se habı́an encontrado los respectivos subespacios
propios obteniendo: dim(Sλ1 ) = dimN (A − 2I) = 1 y dim(Sλ2 ) = dimN (A − 10I) = 1.
Como la suma de las dimensiones de los subespacios propios es 1 + 1 = 2, y A es 2 × 2, la
tercera parte del teorema anterior nos permite afirmar que A es diagonalizable.
¿Cómo encontramos una matriz B que la diagonalice? Para ello usamos la parte (2) del
teorema. En el ejemplo
6.2.3se habı́an
calculado también los vectores propios. Por ejem-
−2 2
plo, u1 = y u2 = son vectores propios asociados a λ1 = 2 y λ2 = 10
1 1
respectivamente. Es claro que U = {u1 , u2 } es base de R2 . Luego, unamatriz Bque diago-
2 0
naliza a A es B = MU y la correspondiente matriz diagonal es D = , es decir,
0 10
se cumple la igualdad:
−1
−2 2 6 8 −2 2 2 0
B −1 AB = = =D
1 1 2 6 1 1 0 10
o, de manera equivalente:
−1
6 8 −2 2 2 0 −2 2
A= = = BDB −1
2 6 1 1 0 10 1 1
Si quisiéramos calcular A100 podemos proceder de la siguiente manera:

−1
−2 2 2100 0 −2 2
A100 =
1 1 0 10100 1 1
 
5 0 −6
Ejemplo 6.3.2. Consideremos ahora la matriz A =  9 −1 −9  del ejemplo 6.2.4.
3 0 −4
Sus únicos valores propios son λ1 = −1 (raı́z doble del polinomio caracterı́stico) y λ2 = 2
(raı́z simple del polinomio caracterı́stico). Con respecto a los subespacios propios se habı́a
obtenido: dim(Sλ1 ) = dimN (A + I) = 2 y dim(Sλ2 ) = dimN (A − 2I) = 1. Como la suma
de las dimensiones de los subespacios propios es 2+1 = 3 (dimensión del espacio) podemos
afirmar que A es diagonalizable.
Para completar el ejemplo encuentre una matriz B que diagonalice a A y la correspondiente
matriz diagonal D.
Observación 6.3.2. Cálculo de las dimensiones de los subespacios propios.

Según el teorema 6.3.1 es suficiente con calcular la suma de las dimensiones de los subes-
pacios propios de una matriz para decidir si es diagonalizable o no. Vale la pena tener en
cuenta que, para dicho cálculo, no es necesario hallar explı́citamente dichos subespacios (o
sea, los vectores propios). En efecto, si λ es valor propio de A entonces la dim(Sλ ) es la
dimensión del núcleo de A − λI, o sea, la nulidad de dicha matriz. A su vez, esta nulidad
se puede calcular a partir del rango de la siguiente manera:
nu(A − λI) = n − rg(A − λI)
Ejemplo 6.3.3. Se quiere investigar si las siguientes matrices son diagonalizables:

   
8 −7 π 8 −7 π
W = 0 5 0  , Z= 0 5 1 
0 0 5 0 0 5
Un cálculo muy simple muestra que ambas tienen los mismos valores propios que son
λ1 = 8 (raı́z simple del polinomio caracterı́stico de ambas) y λ2 = 5 (raı́z doble del
polinomio caracterı́stico de ambas). Estudiemos ahora las dimensiones de sus subespacios
propios:
1. Para la matriz W :
   
0 −7 π 0 −7 π
dim(Sλ1 =8 ) = nu  0 −3 0  = 3 − rg  0 −3 0  = 3−2 = 1
0 0 −3 0 0 −3
   
3 −7 π 3 −7 π
dim(Sλ2 =5 ) = nu  0 0 0  = 3 − rg  0 0 0  =3−1 =2
0 0 0 0 0 0
Como dim(Sλ1 ) + dim(Sλ2 ) = 3 podemos concluir que W es diagonalizable.
2. Para la matriz Z:
   
0 −7 π 0 −7 π
dim(Sλ1 =8 ) = nu  0 −3 1  = 3 − rg  0 −3 1  = 3−2 = 1
0 0 −3 0 0 −3
   
3 −7 π 3 −7 π
dim(Sλ2 =5 ) = nu  0 0 1  = 3 − rg  0 0 1  =3−2 =1
0 0 0 0 0 0
Como dim(Sλ1 ) + dim(Sλ2 ) = 2 6= 3 podemos concluir que Z no es diagonalizable.
Proposición 6.3.1. Una condición suficiente para que una matriz sea diagona-
lizable.
Sea A una matriz n × n. Si A tiene n valores propios diferentes entre sı́ entonces es
diagonalizable.
Demostración. Sean λ1 , λ2 , . . . , λn los n valores propios de A diferentes entre sı́. Para

cada λi elegimos un vector ui que sea vector propio no nulo asociado a λi . Por el teorema
6.2.2 el conjunto U = {u1 , u2 , . . . , un } es L.I. y, por lo tanto, es base de Rn . Hemos
encontrado una base de Rn formada por vectores propios de A, de donde resulta (teorema
6.3.1) que A es diagonalizable. ♠
 √ 
2 −5 2
Ejemplo 6.3.4. Se considera la matriz A =  0 1 2 . Para hallar sus valores
0 1 1
propios debemos hallar las raı́ces del polinomio det(A − λI):
√
2 − λ −5 2
1−λ 2
det(A − λI) = 0 1−λ 2 = (2 − λ) = (2 − λ)(λ2 − 2λ − 1)
1 1 − λ
0 1 1−λ
√ √
Los valores propios de A son entonces: 2, 1+ 2 y 1− 2. Como A es 3×3 y tiene 3 valores
propios diferentes, la proposición anterior nos permite concluir que A es diagonalizable,
sin necesidad de tener que estudiar la dimensión de los subespacios propios.
Observación 6.3.3. La condición anterior no es necesaria para que una matriz

sea diagonalizable.
Ya nos hemos encontrado con varios ejemplos de matrices 3 × 3 diagonalizables que tenı́an
solamente dos valores propios. Es ası́ que la condición suficiente establecida en la proposi-
ción anterior no es necesaria para que una matriz sea diagonalizable. Dicho de otra manera,
si una matriz n × n no tiene n valores propios diferentes entonces puede ser diagonalizable,
o no.
Una clase importante de matrices diagonalizables la constituye la familia de las matrices

simétricas.
Teorema 6.3.2. Diagonalización de matrices simétricas.

Sea A una matriz simétrica n × n. Entonces se cumple:
1. Vectores propios de A asociados a valores propios diferentes son ortogonales.
2. A es diagonalizable. Más aún, existe una matriz ortogonal que la diagonaliza.
Demostración.
1. Sean u1 y u2 vectores propios de A correspondientes a valores propios distintos λ1 y
λ2 . Esto implica que Au1 = λ1 u1 y Au2 = λ2 u2 . Se tiene:
hAu1 , u2 i = hλ1 u1 , u2 i = λ1 hu1 , u2 i
Por otra parte, utilizando el hecho de que A es simétrica, tenemos:
hAu1 , u2 i = hu1 , At u2 i = hu1 , Au2 i = hu1 , λ2 u2 i = λ2 hu1 , u2 i
Luego, λ1 hu1 , u2 i = λ2 hu1 , u2 i de donde resulta (λ1 − λ2 )hu1 , u2 i = 0.

Como λ1 6= λ2 , debe ser hu1 , u2 i = 0 y, por lo tanto, u1 ⊥ u2 .
parte delteorema la demostraremos solamente para el caso de una matriz 2 × 2:
2. Esta
a b
A= . Comencemos hallando su polinomio caracterı́stico:
b c

a−λ b
det(A − λI) = = λ2 − (a + c)λ + (ac − b2 )
b c−λ
El discriminante de ese polinomio de segundo grado vale ∆ = (a + c)2 − 4(ac − b2 ) =

a2 + c2 − 2ac + 4b2 = (a − c)2 + 4b2 . Es claro que ∆ ≥ 0 cualesquiera que sean a, b y
c. Si ∆ > 0 entonces el polinomio caracterı́stico tiene dos raı́ces reales y diferentes y
entonces (proposición 6.3.1) A es diagonalizable. Sean entonces λ1 y λ2 los valores
propios diferentes y u1 y u2 vectores propios asociados. Por la parte (1) u1 ⊥ u2 .
Dividiendo cada uno de esos vectores entre su norma obtenemos dos vectores u′1 y u′2
tales que U = {u′1 , u′2 } es una base ortonormal de R2 formada por vectores propios
de A. La matriz MU resulta entonces ser ortogonal y, como sabemos, dicha matriz
diagonaliza a A.
Queda por estudiar el caso en que ∆ = 0, en donde no hay dos raı́ces reales y
diferentes.
Pero ∆ = 0 solamente cuando a = c y b = 0, o sea cuando A es de la forma
a 0
que es una matriz diagonal (y, por lo tanto, trivialmente diagonalizable).
0 a
♠
Proposición 6.3.2. Propiedades de At A.

Si A es una matriz m × n entonces la matriz cuadrada (n × n) At A tiene las siguientes
propiedades:
1. At A es simétrica.
2. At A es no negativa (o semidefinida positiva), esto es: hAt A.x, xi ≥ 0, ∀ x ∈ Rn .
3. Los valores propios de At A son no negativos.
4. At A tiene el mismo rango que A.
5. Si rg(A) = n entonces At A no tiene valor propio 0.
Si rg(A) = r < n entonces 0 es valor propio de At A y el subespacio propio corres-
pondiente tiene dimensión n − r.
Demostración.
t
1. Utilizando las propiedad de la traspuesta de un producto obtenemos At A =
t
At At = At A de donde resulta que At A es simétrica.
2. Para todo x ∈ Rn se tiene: hAt A.x, xi = hA.x, A.xi = kA.xk2 ≥ 0.
3. Sea λ un valor propio de At A. Existe v 6= o tal que At A.v = λv. Luego, utilizando
que At A es no negativa se obtiene: 0 ≤ hAt A.v, vi = hλv, vi = λhv, vi de donde se
deduce que λ ≥ 0.
(Observe que solamente se utilizó que At A es no negativa y, por lo tanto, la misma
demostración prueba que los valores propios de cualquier matriz no negativa son no
negativos).
4. Ver ejercicio 5.1.8.
5. Si rg(A) = n entonces rg(At A) = n y, por lo tanto, At A es invertible. Se deduce que
0 no es valor propio de At A (todos sus valores propios son estrictamente positivos).
Si rg(A) = r < n entonces rg(At A) = r < n, de donde At A no es invertible y
0 es valor propio de At A. Recordemos también que N (At A) = N (A), de donde
resulta nu(At A) = nu(A) = n − r. Se deduce que el subespacio propio de At A
correspondiente al valor propio 0 tiene dimensión n − r.
Una interesante aplicación de las propiedades de puede encontrarse en el apéndice en donde
se demuestra la llamada “descomposición en valores singulares” de una matriz cualquiera.
Definición 6.3.2. Multiplidad algebraica y multiplicidad geométrica de un valor

propio. Sea λ un valor propio de la matriz A n × n.
Llamaremos multiplicidad algebraica de λ, y la simbolizaremos ma(λ), a su orden de
multiplicidad como raı́z del polinomio caracterı́stico det(A − λI).
Llamaremos multiplicidad geométrica de λ, y la simbolizaremos mg(λ), a la dimensión
de su correspondiente subespacio propio Sλ .
Ejemplo 6.3.5. En el ejemplo 6.3.3 se consideraron las matrices

   
8 −7 π 8 −7 π
W = 0 5 0  , Z = 0 5 1 
0 0 5 0 0 5
que tienen los mismos valores propios λ1 = 8 (raı́z simple del polinomio caracterı́stico de
ambas) y λ2 = 5 (raı́z doble del polinomio caracterı́stico de ambas). Según la definición
anterior ¿cuáles son las multiplicidades algebraica y geométrica de estos valores propios?
Para la matriz W :
ma(λ1 ) = 1 y mg(λ1 ) = 1. ma(λ2 ) = 2 y mg(λ2 ) = 2.
Para la matriz Z:
ma(λ1 ) = 1 y mg(λ1 ) = 1. ma(λ2 ) = 2 y mg(λ2 ) = 1.
Observemos que en la matriz Z el valor propio λ2 = 5 tiene multiplicidad algebraica 2 (es
raı́z doble del polinomio caracterı́stico) mientras que su multiplicidad geométrica es 1.
Admitiremos sin demostración el siguiente resultado.
Teorema 6.3.3. Relación entre las multiplicidades algebraica y geométrica de

un valor propio.
Sea λ un valor propio de la matriz A n × n. Entonces se cumple que:
1. 1 ≤ mg(λ) ≤ ma(λ) ≤ n.
2. Si ma(λ) = 1 entonces mg(λ) = 1.
Ejercicio 6.3.1. Si A n × n es diagonalizable demuestre que α A es diagonalizable para

todo α ∈ R.
Ejercicio 6.3.2. Encuentre un ejemplo de dos matrices A y B ambas diagonalizables

tales que A.B no sea diagonalizable. (Puede buscar matrices de tamaño 2 × 2).
Ejercicio 6.3.3. En cada uno de los siguientes casos verifique que la matriz A es diago-
nalizable y halle una matriz B y una matriz diagonal D tales que B −1 AB = D.
   
2 −1 2 1 −1 4
2 3
(1) A = , (2) A =  0 1 0  , (3) A =  3 2 −1 
4 6
0 0 1 2 1 −1
 
  1 0 0 0  
2 1 1  −2 3 2 4
3 0 0 
(4) A =  1 2 1  , (5) A =   , (6) A =  2 0 2 
 0 0 −1 2 
0 0 1 4 2 3
0 0 1 0
Ejercicio 6.3.4. Investigue si las siguientes matrices son diagonalizables (no es necesario
hallar los subespacios propios):
 
2 −1 0
1 0 4 1 3 −5
A= , B= , C= , D= 0 0 1 
1 0 0 4 1 −1
0 0 0
     
−5 −5 −9 −1 −3 −9 0 1 0
E= 8 9 18  , F = 0 5 18  , G =  0 0 1 
−2 −3 −7 0 −2 −7 1 −3 3
 
1 3 0 0
 2 2 0 0 
Ejercicio 6.3.5. Se considera la matriz: A =   0 0 −1
.
0 
0 0 0 −1
1. Halle los valores y vectores propios de A.
2. Investigue si A es diagonalizable. Justifique.
3. Si λ no es ningunode los valores
  propios obtenidos en (a), ¿cuál es la solución del
x 0
 y   0 
sistema (A − λI) . 
 z  =  0 ? Justifique.
  
t 0
   
1 1 1 1 1
 1 1 1 1   1 
Ejercicio 6.3.6. Se consideran A =   1 1 1 1  y v =  1 .
  
1 1 1 1 1
1. Halle N (A) y encuentre una base del mismo. ¿Es 0 valor propio de A?
2. Pruebe que v es vector propio de A. ¿Cuál es el valor propio correspondiente?
3. Halle una matriz invetible B 4× 4 y una matriz diagonal D 4× 4 tales que B −1 AB =
D.

2 1
Ejercicio 6.3.7. Sea A = siendo k un número real.
2k k
1. Encuentre los valores propios de la matriz A.
2. Investigue si A es diagonalizable discutiendo según k.
 
1 0 0
Ejercicio 6.3.8. Pruebe que la matriz A =  a 1 −a  es diagonalizable solo para
a 0 a
dos valores de a.
 
1 a a
Ejercicio 6.3.9. Pruebe que la matriz A =  a 1 a  es diagonalizable para cualquier
a a 1
valor de a y encuentre una matriz que la diagonalice.
Ejercicio 6.3.10.
1. Demuestre que si D es una matriz diagonal que tiene todas sus entradas no negativas
entonces existe otra matriz diagonal J tal que J 2 = D.
2. Sea A una matriz diagonalizable tal que todos sus valores propios son no negativos.
Demuestre que existe una matriz S tal que S 2 = A.
 
1 3 1
3. Halle una matriz S tal que S 2 = A en el caso en que A =  0 4 5 
0 0 9
Ejercicio 6.3.11. Una matriz cuadrada A se dice idempotente cuando A2 = A. Si A es

idempotente pruebe que:
1. Los únicos valores propios posibles de A son los números 0 y 1.
2. A es diagonalizable.
 
3 2 4
Ejercicio 6.3.12. Calcule A100 siendo A =  2 0 2 .
4 2 3
 
1 + α −α α
Ejercicio 6.3.13. Se considera A =  2 + α −α α − 1  en donde α ∈ R.
2 −1 0
1. Obtenga los valores propios de A (estos no dependen del parámetro α).
2. Discuta, según α, cuando la matriz A es diagonalizable.
Ejercicio 6.3.14. Verifique que, para cada una de las siguientes matrices, λ = 2 es valor
propio con multiplicidad algebraica 3. En cada uno de los casos calcule su multiplicidad
geométrica. ¿Cuáles son diagonalizables?
     
2 0 0 2 1 0 2 1 0
A1 =  0 2 0  , A2 =  0 2 0  , A3 =  0 2 1 
0 0 2 0 0 2 0 0 2
Ejercicio 6.3.15. Encuentre matrices ortogonales que diagonalicen a las siguientes ma-
trices simétricas:  
a b b
a b
,  b a b 
b a
b b a
6.4. Apéndice
Demostración de la equivalencia de las partes (1) y (2) del Teorema 6.3.1
b
Supongamos que existe U = {u1 , u2 , . . . , uk } −→ Rn tal que A (ui ) = λi ui para i =
1, 2, . . . , n. Definimos la matriz D mediante D = (MU )−1 AMU . Vamos a probar que D es
una matriz diagonal, más precisamente, que la columna i-ésima de D vale λi ei . Se tiene:

Ci (D) = D.ei = D.coordU (ui ) = (MU )−1 AMU .coordU (ui ) =
6.4. Apéndice 177
(MU )−1 A (MU .coordU (ui )) = (MU )−1 A.ui = (MU )−1 λi ui = λi (MU )−1 ui
= λi coordU (ui ) = λi ei
Recı́procamente,
 supongamos queA es diagonalizable. Entonces existen matrices P inver-
d1 0 · · · 0
 0 d2 · · · 0 
  −1
tible y D =  . .. . . ..  diagonal (ambas n × n) tales que: P AP = D. La
 .. . . . 
0 0 · · · dn
igualdad anterior es equivalente a AP = P D. Estudiemos la columna i-ésima de ambos
miembros.
La columna i-ésima de AP coincide con el producto de A por la columna i-ésima de P :
Ci (AP ) = A Ci (P )
La columna i-ésima de P D coincide con el producto de P por la columna i-ésima de D

(que se puede escribir como di ei ):
Ci (P D) = P Ci (D) = P (di ei ) = di P.ei = di Ci (P )
Tenemos entonces que
A Ci (P ) = di Ci (P ) , ∀ i = 1, 2, . . . , n.
Como Ci (P ) 6= o (por ser P invertible), la igualdad anterior implica que, para cada i =
1, 2, . . . , n, el vector Ci (P ) es un vector propio de A asociado al valor propio di . Por otra
parte, y utilizando nuevamente que P es invertible, podemos asegurar que estos vectores
constituyen una base de Rn . Hemos demostrado que {C1 (P ), C2 (P ), . . . , Cn (P )} (conjunto
de las columnas de P ) es una base de Rn formada por vectores propios de A. ♠
Teorema 6.4.1. Descomposición en valores singulares de una matriz (DVS).

Sea A una matriz m × n tal que rg(A) = r > 0. Entonces existen matrices ortogonales P
(m × m) y Q (n × n) tales que P.A.Q = D en donde D = (dij ) (m × n) es una matriz
diagonal no necesariamente cuadrada, esto es, dij = 0 si i 6= j. Más aún, dii = σi para
1 ≤ i ≤ r siendo σi2 valor propio de At A, y dii = 0 para r < i ≤ n (en caso que r < n).
Demostración. Supondremos que 0 < r < n. De hecho, el caso r = n es más sencillo y

el lector no tendrá inconveniente en acomodar la demostración para dicha situación.
(a) La idea es considerar la matriz At A. De la proposición 6.3.2 sabemos que rg(At A) =

rg(A) = r > 0, que At A es simétrica (y por lo tanto diagonalizable), y que sus
valores propios son no negativos. Más aún (recordar el Teorema 6.3.2) existe una
base ortonormal U = {u1 , u2 , . . . , un } de Rn tal que:
At A.ui = σi2 ui , i = 1, 2, . . . , n.
en donde los σi2 son los valores propios de At A y σi ≥ 0.

Como rg(At A) = r < n, tenemos que 0 es valor propio de At A y que el subespacio

propio de At A correspondiente al valor propio 0 tiene dimensión n − r. Resulta
entonces que:
σ12 ≥ σ22 ≥ . . . ≥ σr2 > 0 y σi2 = 0, si r < i ≤ n.
(Aquı́ hemos supuesto que los vectores de la base U los hemos ordenados de modo
que sus valores propios correspondientes quedan en orden decreciente).
Tomamos como matriz Q a la matriz MU . Como U es una base ortonormal de Rn ,
la matriz Q (n × n) es ortogonal. Observemos que la columna k del producto A.Q
coincide con A.uk .
Trataremos de encontrar una matriz ortogonal Z (m × m) y una matriz diagonal D
(m × n) de modo que A.Q = Z.D. Para ello alcanzará con que la columna k de Z.D
coincida con la columna k de A.Q, o sea con A.uk (para todo k = 1, 2, . . . , n).
(b) Ahora bien, observemos que
hA.ui , A.uj i = hAt A.ui , uj i = σi2 hui , uj i
De lo anterior resulta que:

• El conjunto {A.u1 , A.u2 , . . . , A.un } es ortogonal.
• kA.uk k = σk , para todo k = 1, 2, . . . , n.
• A.uk 6= o, si 1 ≤ k ≤ r, y A.uk = o si r < k ≤ n.
1
Si para 1 ≤ k ≤ r definimos vk = A.uk obtenemos que el conjunto
σk
{v1 , v2 , . . . , vr } es ortonormal en Rm
Completamos este conjunto hasta obtener una base ortonormal de Rm de la forma:

V = {v1 , v2 , . . . , vr , vr+1 , . . . , vm }. Si Z es la matriz MV entonces Z es una matriz
ortogonal y al efectuar su producto con el vector σk ek obtenemos:

 1
σk A.uk = A.uk , si 1 ≤ k ≤ r.
Z.(σk ek ) = σk vk = σk
 o, si r < k ≤ n.
Resulta entonces que si D = (dij ) (m × n) es la matriz diagonal tal que dij = 0 si i 6= j, y

dkk = σk para 1 ≤ k ≤ r, se cumple que A.Q = Z.D.
Como Z es una matriz ortogonal entonces es invertible, de donde resulta Z −1 .A.Q = D y

queda demostrado el teorema. ♠
Capı́tulo 7
Transformaciones lineales
Al estudiar muchos fenómenos de la realidad se hacen supuestos que conducen a pensar

en los llamados modelos lineales. Por ejemplo, suele suponerse que la oferta de un cierto
producto es una función del precio. Al estudiar empı́ricamente cómo funciona este modelo,
se observa que a un cierto precio p la oferta del bien es o, que si el precio se duplica la oferta
también y que si el precio se triplica la oferta también. Es decir, la oferta varı́a linealmente
con el precio. Este capı́tulo se dedica al estudio de las llamadas transformaciones lineales,
funciones que sirven para representar este tipo de modelos. Aún en el caso en que los
fenómenos estudiados no presenten una conducta lineal, es posible aproximarlos de una
manera muy razonable de forma lineal. Y estos últimos son los modelos más sencillos
posibles. Por esto, por su sencillez y por su proximidad a modelos mucho mas complicados,
las transformaciones lineales son objetos matemáticos de gran importancia. Por otra parte,
las transformaciones lineales están ı́ntimamente relacionadas con las matrices, por lo cual
dedicaremos una parte importante del capı́tulo a mostrar esta relación y a sacar provecho
de la misma.
7.1. Definición, propiedades básicas y ejemplos

Definición 7.1.1. Diremos que una función T : Rn → Rm es una transformación
lineal de Rn en Rm si, y solo si, verifica que
(i) T (u + v) = T (u) + T (v) , ∀ u, v ∈ Rn .
(ii) T (αu) = αT (u) , ∀ α ∈ R , ∀ u ∈ Rn .
Observación 7.1.1. El transformado del vector nulo.

1. Sea T : Rn → Rm una transformación lineal y designemos con on y om a los vectores
nulos de Rn y Rm respectivamente. Dado un vector cualquiera u ∈ Rn , la condición
(ii) de la definición nos permite escribir:
T (on ) = T (0.u) = 0.T (u) = om
Tenemos entonces que la imagen del vector nulo por una transformación lineal siem-
pre es el vector nulo. Esta propiedad permite verificar que una función NO es lineal.
Por ejemplo, f : R → R tal que f (x) = x + 2 no es una transformación lineal pues
180 Capı́tulo 7. Transformaciones lineales
f (0) = 2. Pero el recı́proco es falso, es decir, existen funciones que transforman el

vector nulo en el nulo que no son lineales. Por ejemplo f : f (x) = x2 cumple que
f (0) = 0. Sin embargo no es lineal pues, por ejemplo, f (1 + 1) = f (2) = 4 pero
f (1) + f (1) = 1 + 1 = 2.
2. Observemos que una transformación lineal T : Rn → Rm tiene dominio Rn y codo-
minio Rm . Ası́, a cada vector de Rn le hace corresponder un único vector de Rm . Esa
es la razón por la cual tuvimos que distinguir los vectores nulos de ambos espacios.
De todos modos, cuando no haya lugar a confusión, tanto el vector nulo de Rn como
el de Rm serán simbolizados de igual modo por la letra o.
Como las combinaciones lineales combinan (valga la redundancia) las operaciones de suma
de vectores y de producto por un número, las dos condiciones de la definición pueden
expresarse mediante una sola condición, como lo establece la siguiente proposición.
Proposición 7.1.1. La imagen de una combinación lineal.

Sea T : Rn → Rm una función. Entonces T es una transformación lineal si, y solo si:
T (αu + βv) = αT (u) + βT (v) , ∀ α, β ∈ R ; ∀ u, v ∈ Rn . (7.1)
Demostración.
En efecto, si T es lineal entonces usando primero la propiedad (i) de la definición y luego
la (ii) se tiene que
T (αu + βv) = T (αu) + T (βv) = αT (u) + βT (v)
Recı́procamente, si se cumple (7.1) entonces poniendo α = β = 1 se deduce (i) y poniendo

β = 0 se deduce (ii). ♠
Ejemplo 7.1.1.
1. La función identidad I : Rn → Rn definida por I(v) = v , ∀ v ∈ Rn es una
transformación lineal.
2. Dado k ∈ R la transformación T : Rn → Rn dada por T (v) = kv , ∀ v ∈ Rn es
lineal. En particular, la transformación nula (k = 0) es lineal.
3. Dado w ∈ Rn , w 6= o, la transformación S : Rn → Rn dada por S(v) = v + w , ∀ v ∈
Rn no es lineal pues T (o) = w 6= o.
Ejemplo 7.1.2. Linealidad del producto interno.

Sea w ∈ Rn un vector fijo. De las propiedades del producto interno resulta inmediato
verificar que la transformación Tw : Rn → R dada por Tw (v) = hv, wi , ∀ v ∈ Rn es lineal.
Ejemplo 7.1.3. Proyección ortogonal sobre un vector.

Sea u ∈ Rn un vector fijo con u 6= o. Consideremos la función que a cada vector v ∈ Rn le
asocia su proyección ortogonal sobre u (recordar proposición 5.1.5):
hv, ui
Pu : Rn → Rn / Pu (v) = u , ∀ v ∈ Rn .
hu, ui
Queda como ejercicio la verificación de que Pu es lineal.

7.1. Definición, propiedades básicas y ejemplos 181
v − Pu (v)
o u Pu (v)
Ejemplo 7.1.4. Proyección ortogonal sobre un subespacio.

Sea S 6= {o} un subespacio de Rn y consideremos la función que a cada vector de Rn le
asocia su proyección ortogonal sobre S (recordar teorema 5.2.3):
PS : Rn → Rn / v 7→ PS (v) , ∀ v ∈ Rn
Recordemos que PS (v) está caracterizado por ser el único vector de S con la propiedad de
que v − PS (v) ⊥ S
o
PS (v)
Además, si U = {u1 , u2 , . . . , ur } es una base ortonormal de S entonces
PS (v) = hv, u1 iu1 + hv, u2 iu2 + . . . + hv, ur iur
Es decir, PS (v) es la suma de las proyecciones ortogonales de v sobre cada vector ui .

Según el ejemplo anterior, cada uno de los sumandos es lineal y, por lo tanto, PS también
será lineal por ser una suma de transformaciones lineales (como se verá en la proposición
7.3.1).
Ejemplo 7.1.5. La transformación “coordenadas”.

Sea U una base de Rn y T : Rn → Rn definida por T (v) = coordU (v). A cada vector v
de Rn esta transformación le asocia el vector de las coordenadas de v en la base U . Si
recordamos que
coordU ( αu + βv ) = α coordU (u) + β coordU (v) , ∀ u, v ∈ Rn , ∀ α, β ∈ R.
queda probado que T es lineal.


2 1
Ejemplo 7.1.6. Sea A = . Definimos T : R2 → R2 mediante
1 1

x x
T = A.
y y
T es lineal pues en virtud de la propiedad distributiva del producto de matrices se tiene
que ′ ′
x x 2 1 x x
T α +β = α +β =
y y′ 1 1 y y′
′
2 1 x 2 1 x′ x x
α +β ′ = αT + βT
1 1 y 1 1 y y y′
Como se observa fácilmente, si se tomara otra matriz A cualquiera, se podrı́a argumentar
igual que en el ejemplo, por lo que en general tenemos la siguiente proposición:
Proposición 7.1.2. Transformación lineal asociada a una matriz. Sea A una matriz
cualquiera de tamaño m × n. Entonces la función T : Rn → Rm definida por T (v) =
A.v , ∀ v ∈ Rn , es una transformación lineal.
Demostración.
Para toda pareja de reales α, β y para toda pareja de vectores u, v ∈ Rn se tiene:
T (αu + βv) = A.(αu + βv) = αA.u + βA.v = αT (u) + βT (v)
♠
Ejemplo 7.1.7. En cada uno de los siguientes casos tomaremos una matriz A de tamaño
m × n y consideraremos la función T : Rn → Rm definida por T (v) = A.v , ∀ v ∈ Rn . Por
el teorema anterior dicha
función será una transformación lineal.
1 0
1. A = da lugar a la transformación T : R2 → R2 tal que:
0 −1

x 1 0 x x
T = =
y 0 −1 y −y
Como el lector podrá visualizar fácilmente, se trata de una simetrı́a axial de eje Ox.

−1 0
0 −1

x −1 0 x −x
T = =
y 0 −1 y −y
Se trata
de una
simetrı́a central de centro O.
3 0
0 3

x 3 0 x 3x
T = =
y 0 3 y 3y
Se trata de una homotecia de centro O y razón 3.
7.1. Definición, propiedades básicas y ejemplos 183
 
1 0 0
4. A =  0 1 0  da lugar a la transformación T : R3 → R3 tal que:
0 0 −1
      
x 1 0 0 x x
T  y  =  0 1 0  y  =  y 
z 0 0 −1 z −z
Se trata de una simetrı́a respecto del plano 0xy.

5. A = In (matriz identidad n × n) da lugar a la transformación T : Rn → Rn tal que
T (v) = v, ∀ v ∈ Rn . Se trata de la función identidad, que a cada vector le asocia el
mismo.

1 −1 2
−3 1 5
  
x x
1 −1 2 x − y + 2z
T  y  =  y  =
−3 1 5 −3x + y + 5z
z z
En este caso no es tan simple vizualizar el significado geométrico de esta transfor-

mación.
Ejemplo 7.1.8. Consideremos la función T : R2 → R3 definida por la siguiente fórmula:

 
4x − 2y
x x
T =  2x + y  , ∀ ∈ R2
y y
x+y
Queremos probar que es lineal. Para ello, en lugar de verificar las condiciones de la defi-
nición de transformación lineal, podemos observar que
   
4x − 2y 4 −2
x x
T =  2x + y  =  2 1  .
y y
x+y 1 1
 
4 −2
Luego, si llamamos A a la matriz A =  2 1  hemos obtenido que:
1 1
 
4 −2
x x x
T =  2 1  . , ∀ ∈ R2
y y y
1 1
La proposición anterior nos permite concluir que T es lineal. Observemos también que las
columnas de A coinciden con las imágenes por T de los vectores de la base canónica de
R2 :    
4 −2
1 0
T = 2  , T = 1 
0 1
1 1
7.2. Matriz asociada a una transformación lineal

Todos los ejemplos anteriores son del mismo tipo que el ejemplo 7.1.2, es decir, en todos
los casos la transformación se definió como la multiplicación por una matriz. Veamos
que esto no es casual y que en realidad el ejemplo 7.1.2 es paradigmático, ya que toda
transformación lineal puede escribirse como la multiplicación por una matriz.
Teorema 7.2.1. Caracterización de las transformaciones lineales.

Sea T : Rn → Rm una transformación lineal. Entonces
1. Existe una única matriz A de tamaño m × n tal que T (v) = A.v , ∀ v ∈ Rn .
2. Las columnas de A son los transformados por T de los vectores de la base canónica
de Rn , es decir, Cj (A) = T (ej ), para j = 1, 2, . . . n.
Demostración.  
x1
Existencia: Sea v =  ...  un vector cualquiera de Rn . El vector v se expresa en la base
 
xn
canónica de la siguiente manera:
v = x1 e1 + x2 e2 + . . . + xn en
Si aplicamos T a ambos miembros y utilizamos la linealidad de T obtenemos:
T (v) = x1 T (e1 ) + x2 T (e2 ) + . . . + xn T (en )
de donde resulta entonces que

 
x1

 x2 

T (v) = A.  ..  = A.v
 . 
xn
en donde A es la matriz que tiene por columnas a los vectores T (e1 ), T (e2 ), . . . , T (en ).
Unicidad: Supongamos que B es una matriz de tamaño m × n tal que T (v) = B.v , ∀ v ∈
Rn . Para v = ej obtenemos: T (ej ) = B.ej = Cj (B). Es decir, necesariamente las columnas
de B son los transformados por T de los vectores de la base canónica de Rn y, por lo tanto,
B = A. ♠
El teorema anterior motiva la siguiente definición:
Definición 7.2.1. Matriz asociada a una transformación lineal.

Sea T : Rn → Rm una transformación lineal, llamaremos matriz asociada a T a la
matriz m × n, que representaremos por [T ] cuyas columnas son los transformados de los
vectores de la base canónica, es decir: Cj ([T ]) = T (ej ), para j = 1, 2, . . . n.
7.2. Matriz asociada a una transformación lineal 185
A partir de esta definición y del teorema anterior tenemos que si T : Rn → Rm es una

transformación lineal y [T ] es una matriz asociada entonces:
     
x1 x1 x1
T (v) = T  ...  = [T ].  ...  , ∀ v =  ...  ∈ Rn
     
xn xn xn
Ejemplo 7.2.1. Consideremos la función T : R2 → R3 definida por la siguiente fórmula:

 
4x − 2y
x x
T =  2x + y  , ∀ ∈ R2
y y
xy
¿Es T una transformación lineal? Si lo fuera, deberı́a cumplirse T (v) = [T ].v , ∀ v ∈ R2 ,

en donde las columnas de [T ] son las imágenes de los vectores de la base canónica. Se
tiene:
     
4 −2 4 −2
1 0
T = 2  y T = 1  y [T ] =  2 1 
0 1
0 0 0 0
   
4 −2 4x − 2y
x x
Como  2 1 . =  x + y  6= T podemos concluir que T no es
y y
0 0 0
lineal.
Ejemplo 7.2.2. Sea T : R3 → R3 una transformación lineal de la cual se sabe que:
           
1 −2 0 1 0 4
T  0  =  1  , T  1  =  0  , T  0  =  −1 
0 3 0 1 1 π
La matriz asociada a T es entonces:

 
−2 1 4
[T ] =  1 0 −1 
3 1 π
 
x
Para hallar el transformado de un vector  y  cualquiera de R3 procedemos de la
z
siguiente manera:
       
x −2 1 4 x −2x + y + 4z
T  y  =  1 0 −1  .  y  =  x−z 
z 3 1 π z 3x + y + πz
Otra conclusión que se saca del teorema 7.2.1 es que una transformación lineal queda
determinada si se conocen los transformados de los vectores de la base canónica. Este
resultado puede extenderse a una base cualquiera como se prueba en el siguiente teorema.
Teorema 7.2.2. Determinación de una transformación lineal.

Sean V = {v1 , . . . , vn } una base de Rn y W = {w1 , w2 , . . . , wn } ⊂ Rm , un conjunto de n
vectores arbitrarios (eventualmente repetidos). Entonces, existe una única transformación
lineal T : Rn → Rm tal que T (vi ) = wi , ∀ i = 1, . . . , n.
Demostración.
Existencia: Sea B la matriz de tamaño m × n que tiene por columnas los vectores de W ,
es decir: B = MW . Definimos entonces T : Rn → Rm mediante:
T (x) = B . coordV (x) , ∀ x ∈ Rn . (7.2)
Observemos que si x = x1 v1 + x2 v2 + . . .+ xn vn (o sea, si x1 , x2 , . . . , xn son las coordenadas

de x en la base V ) entonces la definición dada pata T (x) coincide con:
T (x) = x1 w1 + x2 w2 + . . . + xn wn
Veamos, en primer lugar, que T (vi ) = wi , ∀ i = 1, . . . , n. En efecto:
T (vi ) = B.coordV (vi ) = B.ei = wi
Nos falta probar que T es lineal. Sean entonces x e y vectores de Rn y λ, µ números reales.
Se tiene:
T (λx + µy) = B.coordV (λx + µy) = B. ( λcoordV (x) + µcoordV (y) )
= λB.coordV (x) + µB.coordV (y) = λT (x) + µT (y)

Unicidad: Supongamos que existan T : Rn → Rm y S : Rn → Rm lineales tales que
T (vi ) = wi y S (vi ) = wi , para i = 1, 2, . . . , n. Entonces T y S coinciden en una base de
Rn ; y por consiguiente coinciden en todo el espacio. En efecto, sea v ∈ Rn . Como B es
base de Rn , existen α1 , . . . , αn ∈ R tales que v = α1 v1 + . . . + αn vn . Luego, por ser T y S
lineales:
T (v) = T (α1 v1 + · · · + αn vn ) = α1 T (v1 ) + · · · + αn T (vn )

= α1 S (v1 ) + · · · + αn S (vn ) = S (α1 v1 + · · · + αn vn ) = S (v) .
Hemos probado, pues, que una transformación lineal queda determinada por los valores
que toma sobre una base. En otras palabras, si se conocen los transformados de una base
(obsérvese que se trata de una cantidad finita de valores) entonces se conocen los valores
que toma la transformación lineal en cualquier punto. Piense el lector que en general cono-
cer una cantidad finita de valores de una función no es suficiente para determinarla, incluso
por ejemplo si uno considera una función continua real, el conocer una cantidad finita de
imágenes no permite determinar que ocurre en otros puntos. Ocurre que la hipótesis de
linealidad es muy fuerte e implica una gran rigidez.
Veamos cómo es que se puede determinar una transformación lineal a partir de conocer
los valores que toma en una base en un par de ejemplos.
7.2. Matriz asociada a una transformación lineal 187
Ejemplo 7.2.3. Sea T : R2 → R2 lineal tal que

1 0 2
T =T =
0 1 3

1 0
Como , es la base canónica de R2 , T queda determinada.
0 1
Luego

x 1 0 1 0
T =T x +y = xT +yT =
y 0 1 0 1

2 2 2 2 x 2x + 2y
=x +y = =
3 3 3 3 y 3x + 3y
Ejemplo 7.2.4. Sea T : R2 → R3 lineal tal que

   
3 2
1 0
T =  −1  y T = 1 
2 1
5 −1

1 0
Como B = , es una base de R2 , T está bien definida.
2 1

x x
Calculemos T con ∈ R2 . Para esto escribamos primero un vector cual-
y y

x
quiera como combinación lineal de la base B.
y

x 1 0
=x + (−2x + y)
y 2 1
Entonces

x 1 0
T =T x + (−2x + y) =
y 2 1

1 0
xT + (−2x + y) T =
2 1
     
3 2 −x + 2y
x  −1  + (−2x + y)  1  =  −3x + y  .
5 −1 7x − y
Entonces    
−x + 2y −1 2
x x
T =  −3x + y  =  −3 1 
y y
7x − y 7 −1
Observación 7.2.1. Sobre la determinación de una trasformación lineal.

Si V = {v1 , v2 , . . . , vn } es una base de Rn y w1 , w2 , . . . , wn son n vectores arbitrarios de
Rm , el teorema 7.2.2 afirma que existe una única transformación lineal T : Rn → Rm tal
que T (vi ) = wi , ∀ i = 1, . . . , n. Dicha transformación lineal viene dada por la fórmula 7.2:
T (x) = B . coordV (x) , ∀ x ∈ Rn .
Si recordamos que coordV (x) = (MV )−1 x entonces la única transformación que cumple
con las condiciones establecidas se puede escribir:
T (x) = B . (MV )−1 . x , ∀ x ∈ Rn .
Resulta entonces que si conociéramos la matriz (MV )−1 podrı́amos hallar T (x) aplicando
esta última fórmula. Apliquemos esto en el ejemplo previo. Tenemos:
 
3 2
1 0 −1 1 0
B=  −1 1  , MV = , (MV ) =
2 1 −2 1
5 −1
   
3 2 −1 2
1 0
Luego: B. (MV )−1 =  −1 1 . =  −3 1  y, por lo tanto:
−2 1
5 −1 7 −1
   
−1 2 −x + 2y
x x
T =  −3 1  =  −3x + y 
y y
7 −1 7x − y
7.3. Operaciones con transformaciones lineales

Al igual que con otras funciones, con las transformaciones lineales se puede operar alge-
braicamente, sumándolas, multiplicándolas por números o componiéndolas. Ahora bien,
cuando se opera con funciones que tienen alguna propiedad particular, es de interés pre-
guntarse si la nueva función que se obtiene hereda esa misma propiedad. Por ejemplo, al
sumar funciones continuas se obtiene una nueva función continua. Veremos entonces que
ocurre lo mismo con la linealidad: al sumar dos transformaciones lineales se obtendrá una
nueva transformación lineal, del mismo modo que al multiplicar una transformación lineal
por un número. No solo eso, sino que la matriz asociada a la suma resultará ser la suma
de las matrices asociadas. Más aún, la composición de trasformaciones lineales también
resultará lineal y la matriz asociada a la compuesta será el producto de las matrices aso-
ciadas a cada componente. Este notable hecho ayuda a generar un paralelismos entre las
matrices y las transformaciones lineales. Veamos con detalle todos estos hechos.
Proposición 7.3.1. Sean T, S : Rn → Rm dos transformaciones lineales y α un número

real. Entonces
(i) T + S es una transformación lineal y su matriz asociada es [T + S] = [T ] + [S]
(ii) αT es una transformación lineal y su matriz asociada es [αT ] = α[T ]

7.3. Operaciones con transformaciones lineales 189
Demostración.
Probaremos (i) y dejamos (ii) como ejercicio.
Sean, con la notación habitual, [T ] y [S] las matrices asociadas a T y S respectivamente.
Para todo x ∈ Rn se tiene:
(T + S)(x) = T (x) + S(x) = [T ].x + [S].x = ( [T ] + [S] ) .x
De la proposición 7.1.2 se deduce que T + S es lineal (pues viene dada como el producto
de una matriz) y, del teorema 7.2.1, se deduce que la matriz asociada a T + S es [T ] + [S].
♠
Definición 7.3.1. Composición de transformaciones lineales.

Sean T : Rn → Rm y S : Rm → Rp dos transformaciones lineales. Se define la composición
de S y T como la transformación S ◦ T : Rn → Rp tal que (S ◦ T ) (u) = S (T (u)) , ∀ u ∈
Rn .
 
x
3 2 2x
Ejemplo 7.3.1. Sean T : R → R tal que T  y  = y S : R2 → R2 tal
y+z
z

u v
que S = . Luego S ◦ T : R3 → R2 es tal que
v u
    
x x
(S ◦ T )  y  = S T  y  =
z z

2x y+z
=S =
y+z 2x
Proposición 7.3.2. Composición de transformaciones lineales. Sean T : Rn → Rm
y S : Rm → Rp dos transformaciones lineales. Entonces S ◦ T es lineal y además
[S ◦ T ] = [S].[T ]
Demostración.
Para todo x ∈ Rn se tiene:
(S ◦ T )(x) = S(T (x)) = [S] . T (x) = [S] . ([T ].x) = ([S].[T ]) .x
De la proposición 7.1.2 se deduce que S ◦ T es lineal (pues viene dada como el producto
de una matriz) y, del teorema 7.2.1, se deduce que la matriz asociada a S ◦ T es [S].[T ].
♠
Ejemplo 7.3.2. Sean T : R2 → R3 y S : R3 → R2 determinadas por las siguientes

condiciones (recordar el teorema 7.2):
     
2 1 1
1 0 1
T = 1  , T =  1  , S  0  =
0 1 3
1 0 0
  

0 0
2 2
S  1   = y S   1   =
2 −4
1 −1

2 2 x x
Consideramos R = S ◦ T : R → R y queremos calcular R , ∀ ∈ R2 .
y y

x x
Como ya hemos observado antes, R = [R]. y, por el teorema previo,
y y
[R] = [S].[T ]. Calculemos entonces
 [T] y [S].
2 1
Es inmediato ver que [T ] =  1 1 . Para hallar [S] debemos conocer las imágenes por
1 0
3
S de los vectores de la base canónica
de R . Para 
elloexpresamos
 dichos vectores como
 1 0 0 
combinación lineal de la base V =  0  ,  1  ,  1  . Se tiene:
 
0 1 −1
           
0 0 0 0 0 0
1 1 1 1
 1 =  1 +  1  y  0 =  1 −  1 
2 2 2 2
0 1 −1 1 1 −1
Por lo tanto:
     
0 0 0
1 1 1 2 1 2 2
S 1  = S 1 + S 1  = + =
2 2 2 2 2 −4 −1
0 1 −1
     
0 0 0
1   1  1 2 1 2 0
S  0  = S 1 − S 1  = − =
2 2 2 2 2 −4 3
1 1 −1
En consecuencia:
1 2 0
[S] =
3 −1 3
Por lo tanto  
2 1
1 2 0 4 3
[R] =  1 1 = ⇒
3 −1 3 8 2
1 0

x 4 3 x 4x + 3y
R = =
y 8 2 y 8x + 2y
7.4. Inversa de una transformación lineal

Al igual que lo que ocurre con funciones de R en R, es posible estudiar el concepto de
función inversa para transformaciones lineales.
7.4. Inversa de una transformación lineal 191
Definición 7.4.1. Transformación lineal invertible.

Consideremos una transformación lineal T : Rn → Rn . Diremos que T es invertible si,
y solo si, existe S : Rn → Rn tal que
S◦T =T ◦S =I
donde I es la transformación lineal identidad (es decir I(v) = v ∀ v ∈ Rn ).
Si T es invertible entonces hay una única S : Rn → Rn tal que S ◦ T = T ◦ S = I. Por

tal motivo se le llama inversa de T y se utiliza la notación S = T −1 . En efecto, para ver
la unicidad supongamos que S1 y S2 son transformaciones lineales de Rn en Rn tales que
S1 ◦ T = T ◦ S1 = I y S2 ◦ T = T ◦ S2 = I. Se tiene:
S1 = S1 ◦ I = S1 ◦ (T ◦ S2 ) = (S1 ◦ T ) ◦ S2 = I ◦ S2 = S2 ♠
Nuevamente, la propiedad que estamos estudiando para una transformación lineal puede
reducirse al estudio de la misma propiedad para su matriz asociada como lo muestra la
siguiente proposición.
Proposición 7.4.1. Condición necesaria y suficiente para que una transforma-

ción sea invertible.
Sea T : Rn → Rn una transformación lineal. Entonces se cumple que T invertible si, y
solo si, su matriz asociada [T ] es una matriz invertible. En caso afirmativo se tiene que
T −1 es lineal y además [T −1 ] = [T ]−1 (la matriz asociada a T −1 es la inversa de la matriz
asociada a T ).
Demostración.
Supongamos T invertible. Veamos primero que T −1 es lineal. Para esto consideremos w1
y w2 ∈ Rn y λ y µ ∈ R.
Observando que T ◦ T −1 (w) = w y que T es lineal, tenemos:

λ w1 + µ w2 = λ T ◦ T −1 (w1 ) + µ T ◦ T −1 (w2 ) =

= λT T −1 (w1 ) + µT T −1 (w2 ) = T λT −1 (w1 ) + µT −1 (w2 )
hemos llegado entonces a que:

λ w1 + µ w2 = T λT −1 (w1 ) + µT −1 (w2 )
Aplicando T −1 a ambos miembros resulta
T −1 (λw1 + µ w2 ) = λT −1 (w1 ) + µT −1 (w2 ) .
lo cual prueba la linealidad de T −1 .
Como T ◦ T −1 = I, en virtud de la proposición 7.3.2 se cumple que
[T ].[T −1 ] = [T ◦ T −1 ] = [I] = In (matriz identidad n × n)

Tenemos entonces que [T ] es invertible y que su inversa es [T ]−1 .
Recı́procamente, supongamos ahora que [T ] es una matriz invertible, con lo cual se cumple
[T ].[T ]−1 = In . Definimos S : Rn → Rn mediante S(x) = [T ]−1 .x , ∀ x ∈ Rn . La
proposición 7.1.2 nos permite asegurar que S es lineal y además tenemos:
(S ◦ T )(x) = S[T (x)] = [T ]−1 .T (x) = [T ]−1 .[T ].x = x , ∀ x ∈ Rn .
(T ◦ S)(x) = T [S(x)] = [T ].S(x) = [T ].[T ]−1 .x = x , ∀ x ∈ Rn .

de donde S ◦ T = T ◦ S = I. ♠

2 2 x 2x + y
Ejemplo 7.4.1. Sea T : R → R tal que T = . Queremos probar
y x+y
que T es invertible y calcular T −1
Según el teorema anterior, para probar que T es invertible es suficiente con ver que la
matriz asociada [T ] es invertible. Para esto último podemos verificar que det[T ] 6= 0.
Observemos que
2 1 2 1
[T ] = ⇒ det = 1 6= 0
1 1 1 1
Para calcular T −1 calculemos su matriz asociada. Para ello alcanza con invertir [T ]. Te-
nemos:
−1 1 −1
[T ] = ⇒
−1 2

−1 x 1 −1 x x−y
T = =
y −1 2 y −x + 2y
7.5. Núcleo e imagen de una transformación lineal

En esta sección veremos dos subespacios vinculados a una transformación lineal cuya
estructura es fundamental para comprender como actúa la misma.
Definición 7.5.1. Núcleo e imagen de una transformación lineal

Sea T : Rn → Rm una transformación lineal.
(i) Llamaremos núcleo de T al subconjunto del dominio cuya imagen por T es el vector
nulo, es decir
N (T ) = {v ∈ Rn / T (v) = o}
(ii) Llamaremos imagen de T al recorrido de la función T :
Im(T ) = {w ∈ Rm / ∃ v ∈ Rn con w = T (v)}
Ejemplo 7.5.1. Sean S 6= {o} un subespacio de Rn y PS : Rn → Rn la transformación

“proyección ortogonal” sobre S. En este caso resulta claro que Im(PS ) = S y que N (PS ) =
S⊥.
7.5. Núcleo e imagen de una transformación lineal 193
Observación 7.5.1. Relación del núcleo e imagen con la matriz asociada.

Si T : Rn → Rm es una transformación lineal entonces su matriz asociada [T ] es una
matriz de tamaño m × n. Para hallar el transformado por T de cualquier vector v ∈ Rn
alcanza con multiplicar [T ] por dicho vector:
T (v) = [T ] . v , ∀ v ∈ Rn .
1. Tenemos entonces que T (v) = o si, y solo si, [T ].v = o. Resulta entonces que el
núcleo de T coincide con el núcleo de su matriz asociada. En particular, es claro que
N (T ) es un subespacio de Rn .
2. Consideremos ahora el conjunto Im(T ). Tenemos que un vector w ∈ Rm pertenece
a Im(T ) si, y solo si, existe algún vector v ∈ Rn tal que T (v) = w, que es lo mismo
que [T ].v = w. Esta última igualdad equivale a decir que w es combinación lineal
de las columnas de [T ]. Este hecho ya lo hemos utilizado en diversas ocasiones. De
todos modos volvamos a repasarlo:
   
a11 . . . a1n x1
Si [T ] =  ... .. ..  y v =  ..  tenemos :

. .   . 
am1 . . . amn xn
      
a11 . . . a1n x1 a11 a1n
[T ].v =  ... .. ..   ..  = x  ..  + . . . + x  .. 

. .  .  1 .  n . 
am1 . . . amn xn am1 amn
Podemos concluir entonces que Im(T ) está formado por todos aquellos vectores de
Rm que son C.L. de las columnas de [T ], Dicho de otra forma, Im(T ) coincide con el
subespacio generado por las columnas de la matriz asociada a T : Im(T ) = L [C[T ]].
En particular, Im(T ) es un subespacio de Rm .
3. De las observaciones anteriores podemos sacar además las siguientes conclusiones
acerca de las dimensiones del núcleo y la imagen de la transformación T :
dimN (T ) = dimN [T ] = nu[T ] y dimIm(T ) = dimL [C[T ]] = rg[T ]
La dimensión de N (T ) coincide con la nulidad de su matriz asociada y la dimensión

de Im(T ) coincide con el rango de su matriz asociada.
La consideraciones que se acaban de realizar en la observación previa son la demostración

de las siguientes dos proposiciones.
Proposición 7.5.1. Estructura del núcleo y de la imagen.

1. N (T ) es un subespacio vectorial de Rn que coincide con el núcleo de la matriz

asociada a T .
2. Im(T ) es un subespacio vectorial de Rm que coincide con el subespacio generado por

las columnas de la matriz asociada a T .
Teorema 7.5.1. Teorema de las dimensiones.

dim N (T ) + dim Im(T ) = n
Ejemplo 7.5.2. Se considera la transformación lineal T : R3 → R2 tal que

 
x
x + y + z
T  y  =
2x + 2y + 2z
z
1) Hallemos el núcleo de T .
   
x x
 y  ∈ N (T ) ⇔ T  y  = 0 ⇔ x+y+z
=
0
0 2x + 2y + 2z 0
z z

x+y+z =0
⇔ ⇔ x+y+z =0
2x + 2y + 2z = 0
       
 x   1 1 
Ası́ el N (T ) =  y  ∈ R3 : x + y + z = 0 = L   −1  ,  0  .
   
z 0 −1
2) Hallemos la imagen de T .
 , 
x0 x0
a 3
a
∈ Im (T ) ⇔ existe  y0  ∈ R T  y0  =
b b
z0 z0
 
x0
3 x0 + y0 + z0 a
⇔ existe  y0  ∈ R tal que =
2x0 + 2y0 + 2z0 b
z0
 
x0
3 x0 + y0 + z0 = a
⇔ existe  y0  ∈ R tal que
2x0 + 2y0 + 2z0 = b
z0

x+y+z =a
⇔ el sistema es compatible
2x + 2y + 2z = b

x+y+z =a
⇔ el sistema es compatible
0 = b − 2a
⇔ b = 2a

a 2 1
Luego: Im (T ) = ∈ R : b = 2a = L .
b 2
Observemos que se verifica: dimN (T ) + dimIm(T ) = 2 + 1 = 3.
7.6. Transformaciones lineales inyectivas, sobreyectivas y biyectivas 195
Ejemplo 7.5.3. Se considera la transformación lineal T : R3 → R2 tal que

 
x
x + y
T  y  =
y+z
z
Calculemos en primer lugar la matriz asociada a T :

1 1 0
[T ] =
0 1 1
Para hallar el núcleo de T calculamos el núcleo de su matriz asociada [T ]. Como [T ] ya
esta escalerizada se obtiene inmediatamente
    
 x   −1 
N (T ) =  y  ∈ R3 / x = −y, z = −y, y ∈ R = L   1  
   
z −1
Para hallar Im(T ), hallamos el subespacio generado por las columnas de su matriz aso-
ciada [T ]. Como esta matriz tiene rango 2 deducimos que dimIm(T ) = 2 y, por lo tanto,
Im(T ) = R2 .
Observemos que se verifica: dimN (T ) + dimIm(T ) = 1 + 2 = 3.
7.6. Transformaciones lineales inyectivas, sobreyectivas y bi-

yectivas
Como ya se comentó anteriormente, el núcleo y la imagen permiten caracterizar propie-
dades importantes de una transformación lineal. Recordemos las siguientes definiciones
Definición 7.6.1. Transformaciones lineales inyectivas, sobreyectivas y biyecti-

vas.
T es inyectiva si, y solo si, T (v1 ) = T (v2 ) implica v1 = v2 . O, de manera equiva-
lente, si ∀ v1 , v2 ∈ Rn con v1 6= v2 se cumple que T (v1 ) 6= T (v2 ).
T es sobreyectiva si, y solo si, ∀ w ∈ Rm existe v ∈ Rn tal que T (v) = w.
O, de manera equivalente, si Im (T ) = Rm .
T es biyectiva si es inyectiva y sobreyectiva.
Proposición 7.6.1. Caracterización de las transformaciones lineales inyectivas.

Sea T : Rn → Rm una transformación lineal. Entonces son equivalentes las siguientes
afirmaciones:
1. T es inyectiva.
2. Para todo conjunto U linealmente independiente de Rn se cumple que T (U ) es li-
nealmente independiente en Rm .
3. N (T ) = {o}.
Demostración.
(1) ⇒ (2) Sabemos que T es inyectiva. Sea U = {v1 , v2 , . . . , vn } un conjunto L.I. de Rn .

Probemos que T (U ) = {T (v1 ) , T (v2 ), . . . , T (vn )} es L.I. en Rm . Sean entonces
α1 , α2 , . . . , αn ∈ R tales que
α1 T (v1 ) + α2 T (v2 ) + . . . + αn T (vn ) = o
Debemos probar que α1 = α2 = . . . = αn = 0. Como T es lineal:
T (α1 v1 + . . . + αn vn ) = o = T (o.
Luego, al ser T inyectiva se tiene que
α1 v1 + . . . + αn vn = o
Como U = {v1 , v2 , . . . , vn } es L.I., se cumple que α1 = α2 = . . . = αn = 0.

(2) ⇒ (3) Supongamos, por absurdo, que N (T ) 6= {o}. Entonces existe v ∈ N (T ) con
v 6= o. Luego, el conjunto U = {v} es L.I. en Rn pero el conjunto T (U ) = {T (v)} =
{o} es L.D. en Rm lo cual contradice la hipótesis.
(3) ⇒ (1) Si T (v1 ) = T (v2 ) =⇒ T (v1 ) − T (v2 ) = o. Luego T (v1 − v2 ) = o =⇒
v1 − v2 ∈ N (T ). Por hipótesis debe ser v1 − v2 = o, de donde resulta v1 = v2 . ♠
Proposición 7.6.2. Caracterización de las transformaciones lineales sobreyecti-

vas.
Sea T : Rn → Rm una transformación lineal. Entonces son equivalentes las siguientes
afirmaciones:
1. T es sobreyectiva.
2. Para todo conjunto U = {v1 , v2 , . . . , vp } generador de Rn se cumple que T (U ) =
{T (v1 ), T (v2 ), . . . , T (vp )} es un generador de Rm .
Demostración.
(1) ⇒ (2) Consideremos w ∈ Rm cualquiera. Como T es sobreyectiva entonces w ∈
Im(T ) = Rm y, por lo tanto, existe v ∈ Rn tal que T (v) = w. Como U es ge-
nerador de Rn entonces existen escalares, λ1 , . . . , λp tales que v = λ1 v1 + . . . + λp vp .
Aplicando T y usando la linealidad se tiene que
w = T (v) = T (λ1 v1 + . . . + λp vp ) = λ1 T (v1 ) + . . . + λp (T (vp )
de donde se deduce que w es combinación lineal de T (U ) y por lo tanto este último

genera Rm .
(1) ⇒ (2) Ahora tenemos que probar que Im(T ) = Rm . Sea w ∈ Rm un vector cualquiera y
veamos que pertenece a la imagen. Como T (U ) genera Rm entonces existen α1 , . . . , αp
escalares tales w = α1 T (v1 ) + . . . + αp vp , usando que T es lineal se deduce que
w = T (α1 v1 + . . . + αp vp ) y por lo tanto w ∈ Im(T ). ♠
Proposición 7.6.3. Sobre las dimensiones del dominio y el codominio.

Sea T : Rn → Rm una transformación lineal. Entonces:
1. Si T es inyectiva entonces n ≤ m.
7.6. Transformaciones lineales inyectivas, sobreyectivas y biyectivas 197
2. Si T es sobreyectiva entonces n ≥ m.
3. Si T es biyectiva entonces n = m.
Demostración.
Todo surge del Teorema de las dimensiones (teorema 7.5.1) que establece que:
dim N (T ) + dim Im(T ) = n
En efecto:
1. Si T es inyectiva entonces N (T ) = {o} y, por lo tanto, la relación anterior implica
que dim Im(T ) = n. Por otra parte, dim Im(T ) es el rango de la matriz [T ], que
como tiene m filas, debe ser menor o igual que m. Se deduce que n ≤ m.
2. Si T es sobreyectiva entonces sabemos que Im(T ) = Rm de donde dim Im(T ) = m.
De la igualdad dim N (T ) + dim Im(T ) = n se deduce entonces que n ≥ m.
3. Es inmediato debido a las dos partes anteriores. ♠
Observación 7.6.1. Vale la pena observar que si T : Rn → Rm es lineal e invertible

entonces debe ser m = n. En efecto, si es invertible es biyectiva y, por lo tanto, inyectiva
y sobreyectiva, lo cual implica implica (según el teorema anterior) que m = n.
Otra consecuencia del teorema anterior se establece en la siguiente proposición cuyos
detalles quedan a cargo del lector.
Corolario 7.6.1. Sea T : Rn → Rn una transformación lineal de Rn en sı́ mismo. En-
tonces:
1. Si T es inyectiva entonces T es biyectiva.
2. Si T es sobreyectiva entonces T es biyectiva.
En los próximos dos ejemplos mostraremos cómo el estudio de las transformaciones lineales
permite obtener un panorama más geométrico y conceptual de algunos resultados (para
nada intuitivos a priori) vinculados con operaciones con matrices.
Ejemplo 7.6.1. Queremos probar la siguiente afirmación:

Si A es una matriz de tamaño 5 × 8 y B otra matriz de tamaño 8 × 5 entonces el producto
B.A (que es una matriz cuadrada 8 × 8) NO es invertible. Si pensamos exclusivamente
en la operatoria con matrices, la proposición considerada no parece ni intuitiva ni fácil
de manejar. Consideremos entonces las transformaciones lineales definidas a partir de las
matrices dadas:
T : R8 → R5 / T (x) = A.x , ∀ x ∈ R8 S : R5 → R8 / B(v) = B.v , ∀ v ∈ R5
De esta manera la matriz B.A es la matriz asociada a la composición S ◦ T :
S ◦ T : R8 → R8 / (S ◦ T )(x) = (B.A).x , ∀ x ∈ R8
Ahora bien, como 8 > 5 la transformación T no puede ser inyectiva, con lo cual podemos
afirmar que existe x1 ∈ R8 con x1 6= o tal que T (x1 ) = o. Pero entonces tenemos que:
(S ◦ T )(x1 ) = S (T (x1 )) = S(o) = o

Resulta entonces que (S ◦T ) tampoco es inyectiva y por lo tanto no invertible (al igual que
su matriz asociada). La proposición ha quedado demostrada de una forma extremadamente
simple.
Como el lector comprenderá fácilmente, los números 8 y 5 no jugaron ningún papel decisivo.
La proposición general (que se prueba igual) es entonces:
Si A es una matriz de tamaño m × n (con m < n) y B otra matriz de tamaño n × m
entonces el producto B.A (que es una matriz cuadrada n × n) NO es invertible.
Ejemplo 7.6.2. Dada una matriz no nula D de tamaño q × r ¿cómo podemos encontrar
una matriz no nula C de tamaño p × q tal que C.D = O (matriz nula)?
Las transformaciones lineales asociadas a estas matrices son:
T : Rr → Rq / T (x) = D.x , ∀ x ∈ Rr , S : Rq → Rp / S(y) = C.y , ∀ y ∈ Rq
(S ◦ T ) : Rr → Rp / (S ◦ T )(x) = (C.D).x , ∀ x ∈ Rr
T S
x 7−→ T (x) 7−→ S (T (x))
Que C.D = O equivale a decir que la transformación (S ◦ T ) es la nula (esto es, a cualquier
x le hace corresponder el vector nulo). Para que esto ocurra el conjunto imagen de T debe
estar contenido en el núcleo de S: Im(T ) ⊂ N (S).
T S
Rq Rp
r
R
N (S) o
Dada la transformación T , conocemos su imagen (es el subespacio generado por las co-
lumnas de D) y debemos encontrar otra transformación S de modo que Im(T ) ⊂ N (S),
o incluso, Im(T ) = N (S). Ahora que lo visualizamos de este modo podemos afirmar que
alcanzará con encontrar una matriz de tamaño p×q cuyonúcleo coincida
 con el subespacio
3 2 1
generado por las columnas de D. Por ejemplo, si D =  3 2 1  entonces claramen-
6 4 2
 
 1 
te una base del subespacio generado por las columnas de D es:  1  . Un vector
 
2
 
 a 
 b  pertenece al subespacio generado por las columnas de D si, y solo si, a − b = 0
 
c
7.7. Valores y vectores propios de una transformación lineal 199
y 2a − c = 0. Para encontrar una matriz cuyo núcleo esté formado por los vectores (a, b, c)
tales que a − b = 0 y y 2a − c = 0 utilizamos
los coeficientes de esta útimas ecuacio-
1 −1 0
nes y ponemos (también por ejemplo): C = . Es inmediato verificar que
2 0 −1
C.D = O. Obsérvese
 que también
 podrı́amos haber tomado la matriz C con más filas, por
1 −1 0
 2
 0 −1  
ejemplo: C =  1 −1
 0 
.
 2 0 −1 
3 −1 −1
7.7. Valores y vectores propios de una transformación lineal

Definición 7.7.1. Valores y vectores propios de una transformación lineal.
Sea T : Rn → Rn una transformación lineal. Diremos que el número λ es valor propio
(o autovalor) de T si, y solo si, existe algún vector v ∈ Rn , con v 6= o, tal que T (v) = λv.
Si λ es valor propio de T , entonces a cada vector x ∈ Rn que verifique la igualdad
T (x) = λx lo llamaremos vector propio (o autovector) asociado al valor propio λ.
Observación 7.7.1. Valores y vectores propios de una transformación y de su
matriz asociada.
Con la misma notación que en la definición anterior, si [T ] es la matriz asociada a T ,
entonces se cumple que:
T (v) = λv ⇐⇒ [T ].v = λv
Es ası́ que (al igual que todos los conceptos estudiados en las secciones anteriores), el estu-
dio de las propiedades y resultados para valores y vectores propios de una transformación
lineal se reducen al estudio de los mismos para su matriz asociada. Tendremos entonces
las siguientes equivalencias:
λ es valor propio de T ⇐⇒ λ es valor propio de [T ].
v es vector propio de T ⇐⇒ v es vector propio de [T ].
Sλ es un subespacio propio de T ⇐⇒ Sλ es un subespacio propio de [T ].
T es diagonalizable ⇐⇒ [T ] es una matriz diagonalizable.
T es diagonalizable ⇐⇒ existe una base de Rn formada por vectores propios de [T ]
(o cualquiera de las otras condiciones equivalentes estudiadas en el capı́tulo 6).
La diferencia es que, en el caso de transformaciones lineales, podemos interpretar geométri-
camente lo que está sucediendo. Por ejemplo, si Sλ = {x ∈ Rn / T (x) = λx} es el
subespacio propio de T asociados al valor propio λ, entonces la restricción de T a dicho
subespacio es una homotecia (dilatación o contracción) de constante λ. El correspondiente
por la transformación T de cada vector x perteneciente a Sλ se obtiene multiplicando al
vector x por el número λ.
Ejemplo 7.7.1. Sea T : R3 → R3 tal que

   
x 4x + y + z
T  y  =  3y − z 
z −y + 3z
Queremos investigar si T es diagonalizable y, en caso de serlo, hallar una base de R3 for-

mada por vectores propios de T .
La matriz asociada a T es:  

4 1 1
[T ] =  0 3 −1 
0 −1 3
Para obtener los valores propios de T calculamos el polinomio caracterı́stico
 
4−λ 1 1
det  0 3 − λ −1  = (4 − λ)(λ2 − 6λ + 8) = (4 − λ)2 (2 − λ)
0 −1 3 − λ
Los valores propios son entonces λ1 = 4 (doble) y λ2 = 2 (simple). Para determinar si T

es diagonalizable debemos decidir si existe una base de vectores propios. Recordemos que,
en general se cumple 0 < mg(λ) = dim(Sλ ) ≤ ma(λ) donde ma(λ) es la multiplicidad de
λ como raı́z del polinomio caracterı́stico. Además, para que T sea diagonalizable deben
coincidir la multiplicidad geométrica y algebraica de todos los valores propios.
Volviendo a nuestro ejemplo, como 2 es raı́z simple del polinomio caracterı́stico, es decir
tiene ma(2) = 1, entonces dim(S2 ) = mg(2) = 1. De aquı́ surge que si existiera una base
de vectores propios el subespacio propio S2 aportarı́a un vector. Los otros dos deberı́an
provenir del otro subespacio S4 . Al ser 4 raı́z doble, es decir ma(4) = 2 entonces mg(4)
puede ser 1 o 2. En el primer caso T no serı́a diagonalizable y en el segundo sı́. Usando el
teorema de las dimensiones tenemos que dim(S4 ) = dimN [T − 4I] = 3 − rg[T − 4I]
 
0 1 1
[T − 4I] =  0 −1 −1 
0 −1 −1
De donde es inmediato observar que rg[T − 4I] = 1 y, por lo tanto, mg(4) = 2 = ma(4),
por lo que T es diagonalizable. Para determinar la base de vectores propios calculamos
N (T − 4I) y N (T − 2I):
 
x
 y  ∈ N (T − 4I) ⇔ y = −z, x ∈ R ⇒
z
    
 1 0 
N (T − 4I) = L   0  ,  1  
 
0 −1
Por otra parte  
2 1 1
[T − 2I] =  0 1 −1  ⇒
0 −1 1
 
x
 y  ∈ N (T − 2I) ⇔ y = z, x = 0 ⇒
z
7.7. Valores y vectores propios de una transformación lineal 201
 
 0 
N (T − 2I) = L   1  
 
1
Por lo tanto, una base de vectores propios es
     
 1 0 0 
 0 , 1 , 1 
 
0 −1 1
Todo vector v ∈ R3 se escribe como C.L. única de U = {u1 , u2 , u3 } (siendo U la base de

vectores propios recién indicada). Por otra parte, la restricción de T a S4 es una homotecia
de razón 4 mientras que la restricción de T a S2 es una homotecia de razón 2. Luego, si
v = α1 u1 + α2 u2 + α3 u3 entonces T (v) = 4α1 u1 + 4α2 u2 + 2α3 u3 .
Interacción entre transformaciones lineales y matrices.
Lo estudiado en este capı́tulo con referencia a la relación existente entre transformaciones

lineales y matrices puede resumirse de la siguiente manera.
1. Matriz asociada. A cada transformación lineal T : Rn → Rm le corresponde una

única matriz A de tamaño m × n de modo que T (v) = A.v, ∀ v ∈ Rn . Dicha matriz
A se denomina matriz asociada a T y se simboliza [T ].
Las columnas de la matriz asociada [T ] son las imágenes por T de los vectores de la
base canónica de Rn .
2. Determinación de una trasformación lineal. Si V = {v1 , v2 , . . . , vn } es una

base de Rn y w1 , w2 , . . . , wn son n vectores arbitrarios de Rm , entonces existe una
única transformación lineal T : Rn → Rm tal que T (vi ) = wi , ∀ i = 1, . . . , n. Dicha
transformación lineal viene dada por la fórmula:
T (x) = B . coordV (x) = B . (MV )−1 . x , ∀ x ∈ Rn .
3. Operaciones con transformaciones lineales.
Suma Si T, S : Rn → Rm son dos transformaciones lineales entonces T + S es una

transformación lineal y su matriz asociada es [T + S] = [T ] + [S].
Producto por un número Si T : Rn → Rm es una transformación lineal y α ∈ R
un número real entonces αT es una transformación lineal y su matriz asociada
es [αT ] = α[T ].
Composición Si T : Rn → Rm y S : Rm → Rp son dos transformaciones lineales
entonces S ◦ T es lineal y además
[S ◦ T ] = [S].[T ]
4. Transformación lineal invertible y transformación inversa.

Sea T : Rn → Rn una transformación lineal. Entonces se cumple que T es invertible
(biyectiva) si, y solo si, su matriz asociada [T ] es una matriz invertible. En caso
afirmativo se tiene que T −1 es lineal y además [T −1 ] = [T ]−1 (la matriz asociada a
T −1 es la inversa de la matriz asociada a T ).
5. Núcleo e imagen de una transformación lineal.

El núcleo de T se simboliza N (T ) y es el núcleo de su matriz asociada.

El conjunto imagen de T se simboliza Im(T ), es el recorrido de T y coincide
con el subespacio generado por las columnas de su matriz asociada.
El teorema de las dimensiones afirma que: dim N (T ) + dim Im(T ) = n.
T es inyectiva si, y solo si, N (T ) = {o}.
T es sobreyectiva si, y solo si, el rango de su matriz asociada es n.
T es biyectiva si, y solo si, m = n y es inyectiva (o sobreyectiva).
6. Vectores propios y diagonalización.
Los valores propios de T son los valores propios de su matriz asociada.

Los vectores propios de T son los vectores propios de su matriz asociada.
T es diagonalizable si, y solo si, lo es su matriz asociada.
7.8. Ejercicios
Ejercicio 7.8.1. En cada uno de los siguientes casos demuestre que la función T dada es
una transformación lineal y encuentre su matriz asociada. (Sugerencia: recuerde que para
probar que T es lineal alcanza con encontrar una matriz A tal que T (x) = A.x , ∀ x ∈
D(T ). Más aún, dicha matriz A es la matriz asociada a T ).

2 2 x 2x − 5y
1. T : R −→ R / T = . Encuentre la imagen por T del vector
y x+y

2
.
−1
 
x − 3y
x
2. T : R2 −→ R3 / T =  x − y . Encuentre la imagen por T del vector
y
4x + y

2
.
−1
 
x
3 2 x−y+z
3. T : R −→ R / T   y   = . Encuentre la imagen por T del
x + 9y + z
z
 
1
vector  0 .
−1
7.8. Ejercicios 203
 
 x−y
x  x + y+z 
4. T : R3 −→ R4 / T  y  = 
 2x − z
. Encuentre la imagen por T del

z
0
 
3
vector  3 .
−6
Ejercicio 7.8.2. Encuentre el núcleo y la imagen de las transformaciones lineales del
ejercicio anterior. Verifique la relación que hay entre dim(N (T )) y dim(Im(T )) en cada
uno de los casos.
Ejercicio 7.8.3. Se considera la transformación lineal T : R2 −→ R2 determinada por:

1 2 −1 1
T = , T =
0 1 2 1
1. Justifique que, con estos datos, efectivamente queda determinada una transformación
lineal.
2. Demuestre que T es invertible y halle la matriz asociada a T −1 .

   
3 0
1 2
T = 2  , T = 1 
1 −1
1 2
lineal.
2. Halle T (v), ∀ v ∈ R2 .
Ejercicio 7.8.5. Se considera la transformación lineal T : R3 −→ R3 definida por

    
x 1 0 1 x
T   y   =  0 1 0   y 
z −1 0 −1 z
 
1
1. Pruebe que el vector  0  está en el N (T ) y también está en la Im(T ).
−1
2. ¿Es T biyectiva? Justifique.
3. Halle los valores y vectores propios de T e investigue si T es diagonalizable.
Ejercicio 7.8.6. Sea T : R4 → R4 tal que

   
x x+y+z+w
 y   y + z + w 
T z  = 
   
z + 2w 
w −w
1. Investigue si T es invertible.
2. Halle Im(T ) y N (T ).
Ejercicio 7.8.7. Se consideran lassiguientes transformaciones

 lineales:
x + 2y
x
T1 : R2 −→ R3 / T1 =  2x − 3y 
y
0
 
x
3 2 x−y
T2 : R −→ R / T2   y   = , T1 ◦ T2 y T2 ◦ T1 . Investigue cuáles
−x + 3y + z
z
de esas transformaciones son invertibles y determine la inversa cuando corresponda.
3 3
Ejercicio
  T : R −→ R la transformación lineal cuya matriz asociada es
7.8.8. Sea
3 0 0
M = 1 7 −2 
0 0 3
 
−4
1. Encuentre la imagen por T del vector u =  1 
0
2. ¿Es T biyectiva? Justifique la respuesta.
3. Demuestre que T es diagonalizable.
Ejercicio 7.8.9. Se considera una transformación lineal T : Rn −→ Rm . Indique si la

siguiente afirmación es verdadera o falsa. Justifique.
“Si kT (x)k = 0 entonces x ∈ N (T )”.
Ejercicio 7.8.10. Sea U = {u1 , u2 , . . . , un } una base de Rn y T : Rn −→ Rn la trans-

formación lineal tal que T (e1 ) = u1 , T (e2 ) = u2 , . . . , T (en ) = un . ¿Es T invertible?
Justifique la respuesta.

           
1 0 2 3 0 1
T 2 = 1  , T 1 = 2  , T 0 = 1 
0 −1 0 1 1 2
lineal.
2. Halle la matriz asociada a T .
3. Demuestre que T es invertible y halle T −1 .
4. Halle los vectores propios de T e investigue si T es diagonalizable.
5. Halle los vectores propios de T −1 e investigue si T −1 es diagonalizable.
Ejercicio 7.8.12. Sea T : Rn → Rn una transformación lineal. Demuestre que son equi-
valentes las siguientes afirmaciones
(i) T es biyectiva
(ii) Para cualquier base A de Rn se cumple que T (A) es base de Rn .
7.9. Ejercicios variados de opción múltiple 205
Ejercicio 7.8.13. Sean T : Rn → Rm una transformación lineal y A su matriz asociada.

Se define la transformación
T ∗ : Rm → Rn / T ∗ (y) = At y , ∀ y ∈ Rm .
Esta transformación se denomina adjunta de T . Demuestre que:

1. hT (x), yi = hx, T ∗ (y)i , ∀ x ∈ Rn , ∀ y ∈ Rm .
2. N (T )⊥ = Im(T ∗ ).
3. T = T ∗ si, y solo si, A es una matriz simétrica.
Ejercicio 7.8.14. Una transformación lineal T : Rn → Rm se dice isométrica si conserva
las normas, esto es: kT (v)k = kvk, ∀ v ∈ Rn . Demuestre que T es una transformación
lineal isométrica si, y solo si, su matriz asociada es una matriz ortogonal.
Ejercicio
7.8.15. Se considera
la transformación lineal T : R2 → R2 cuya matriz asociada
cos(α) −sen(α)
es en donde α ∈ [0, π).
sen(α) cos(α)
1. Verifique que T es una isometrı́a.
2. Calcule hT (v), vi , ∀ v ∈ R2 . Deduzca que el ángulo formado por T (v) y v no depende
de v.
3. ¿Qué interpretación geométrica tiene la isometrı́a T ?
Ejercicio 7.8.16. Teorema de representación de Riesz.
1. Sea w ∈ Rn y Tw : Rn → R dada por Tw (v) = hv, wi, ∀ v ∈ Rn . Demuestre que Tw
es lineal y encuentre su matriz asociada.
2. Sea T : Rn → R una transformación lineal. Demuestre que existe un único w ∈ Rn
tal que T (v) = hv, wi, ∀ v ∈ Rn .
Ejercicio 7.8.17. Sea T : Rn → R una transformación lineal. Demuestre que
kT (x)k ≤ M kxk , ∀ x ∈ Rn siendo:
M = max {kT (e1 )k, kT (e2 )k, . . . , kT (en )k}
Ejercicio 7.8.18. El espacio vectorial de las transformaciones lineales.

Sea L (Rn , Rm ) el conjunto de todas las transformaciones lineales de Rn en Rm , es decir:
L (Rn , Rm ) = { T : Rn → Rm / T es lineal }
Compruebe que, con las operaciones de suma de transformaciones y producto de un número

por una transformación, se cumple que L (Rn , Rm ) es un espacio vectorial real (recordar
la primera sección del capı́tulo 4).
7.9. Ejercicios variados de opción múltiple


 x+y+z =1
Ejercicio 7.9.1. El sistema: 2x − y + z = 0

−4x + 2y − 2z = 1
(1) Es compatible determinado. (2) Es incompatible. (3) Es compatible indeterminado
con un grado de libertad. (4) Es compatible indeterminado con dos grados de libertad.
     
1 2 −a
Ejercicio 7.9.2. Sean u =  1  , v =  2  , w =  a  Entonces w es combi-
0 3 a
nación lineal de {u, v}
(1) Para infinitos valores de a. (2) Para ningún valor de a.
(3) Sólo para tres valores de a. (4) Sólo para a = 0.
Ejercicio 7.9.3. Sea U = {u1 , u2 , u3 } ⊂ R5 . Entonces se cumple necesariamente que:

(1) Si U es L.D. entonces todo subconjunto de U también lo es.
(2) Si o ∈ U , entonces U es L.I.
(3) Todo vector de R5 es combinación lineal de U .
(4) Ninguna de las anteriores.
     
√1 1 √2
Ejercicio 7.9.4. Sean: u =  5  , v =  0  , w =  5 , y consideremos las
1 3 4
siguientes afirmaciones:
(A) {u, v, w} es L.I. (B) u es C.L. de {v, w}. Entonces:
(1) (A) es verdadera y (B) es verdadera.
(2) (A) es verdadera y (B) NO es verdadera.
(3) (A) NO es verdadera y (B) es verdadera.
(4) (A) NO es verdadera y (B) NO es verdadera.
Ejercicio 7.9.5. Sea U = {v1 , v2 , v3 , v4 } una base de R4 . Entonces:

(1) Existe v ∈ R4 tal que {v1 , v2 , v3 , v4 , v} es L.I.
(2) {v2 , v3 , v4 } es un generador de R4 .
(3) {v + v1 , v2 , v3 , v4 } es base de R4 , para todo vector v ∈ R4 .
(4) Si v = v1 + v2 entonces, v4 es combinación lineal de {v, v1 , v2 , v3 }.
(5) Ninguna de las opciones anteriores es correcta.
     
 a −5 −1 
Ejercicio 7.9.6. Si U =  0  ,  a  ,  2  ⊂ R3 , entonces
 
0 3 a
3
(1) U es base de R para cualquier valor de a. (2) U es base de R3 excepto para a = 0.
3
(3) U es base de R excepto para tres valores de a. (4) U es L.D. para cualquier valor
de a.
Ejercicio 7.9.7. Consideremos las siguientes afirmaciones:

(A) Si U es una base de Rn y H ⊂ U , (H 6= φ), entonces H es L.I.
(B) En R3 hay sólo tres conjuntos que son al mismo tiempo L.I. y generador.
Entonces:
(1) (A) es verdadera y (B) es verdadera.
(2) (A) es verdadera y (B) NO es verdadera.
(3) (A) NO es verdadera y (B) es verdadera.
(4) (A) NO es verdadera y (B) NO es verdadera.
Ejercicio 7.9.8. Sea U = {u1 , u2 , u3 } ⊂ R4 . Entonces se cumple necesariamente que:

(1) Si U es L.I. entonces U = {u1 , u2 , u3 , v} es base de R4 , cualquiera que sea v ∈ R4 .
(2) Si U es L.D. entonces existe v ∈ R4 tal que U = {u1 , u2 , u3 , v} es generador de R4 .

(3) Algún vector de R4 no es combinación lineal de U .
Ejercicio 7.9.9.
Sea U = {u1 , u2 , u3 } ⊂ R5 un conjunto L.I. Entonces se cumple necesariamente que:
(1) {u1 , u2 , u3 , v} es L.I., cualquiera que sea v ∈ R5 .
(2) {u1 , u2 , u3 , v} es L.D., cualquiera que sea v ∈ R5 .
(3) Existe w ∈ R5 tal que w es combinación lineal NO única de U .
 
4
Ejercicio 7.9.10. Sea U = {u1 , u2 , u3 } una base de R3 y el vector z =  −2 
5
Si se sabe que z = u1 − 2u2 + 3u3 entonces
     
4 5 1
(1) coordU (z) =  −2  (2) coordU (z) =  −2  (3) coordU (z) =  −2 
5 4 3
(4) z también puede expresarse como z = 4u1 − 2u2 + 5u3 .
Ejercicio 7.9.11. Sea U = {u, v, w} una base de R3 . Entonces se cumple necesariamente

que:
(1) {u, v, u + v} es L.I.
(2) {u − v, v + w, u − w, u + v + w} es generador de R3 .
(3) {u + v, u − w} es generador de R3 . (4) Ninguna de las anteriores.
 
1 2 a
Ejercicio 7.9.12. Consideremos la matriz: A =  2 −2 0 
1 1 2
Entonces:
(1) rg(A) = 3, ∀ a ∈ R. (2) nu(A) = 1 para algún a ∈ R.
(3) nu(A) = 1 para infinitos valores de a ∈ R.
Ejercicio 7.9.13. Sea A una matriz m × n. Entonces se cumple necesariamente que:

(1) El subespacio generado por las columnas de A coincide con el subespacio generado por
sus filas.
(2) La dimensión del subespacio generado por las columnas de A es mayor que m.
(3) Si n es impar entonces rg(A) 6= nu(A).
  
 x 
Ejercicio 7.9.14. Sea S ⊂ R3 definido por: S =  y  / x − 2y + 5z = 0 Enton-
 
z
ces
(1) S es un subespacio de R3 de dimensión 2. (2) S es un subespacio de R3 de dimensión
1. (3) S es un subespacio de R3 de dimensión 3. (4) S no es un subespacio de R3 .
Ejercicio 7.9.15. Dado U ⊂ Rn (U 6= φ) consideremos el conjunto

S = {v ∈ Rn / v es C.L. de U }. Entonces:
(1) Puede ocurrir que S = φ. (2) Si U es generador de Rn entonces S = Rn .
(3) Si U es L.D. entonces necesariamente S 6= Rn . (4) S contiene a lo sumo n vectores.
Ejercicio 7.9.16. Se sabe que S es un subespacio de R5 de dimensión 2. Entonces:

(1) Existen u1 y u2 , vectores de S tales que S = L ({u1 , u2 }).
(2) La base canónica de R5 es un generador de S ya que todo vector de S se puede escribir
como combinación lineal de la misma.
(3) S tiene exactamente dos vectores.
(4) Existe un subconjunto de S, que es L. I. y que tiene tres vectores.
Ejercicio 7.9.17. Sea U = {v1 , v2 , . . . , vp } un subconjunto L.D. de Rn . Entonces:

(1) L ({v1 , v2 , . . . , vp−1 }) = L ({v1 , v2 , . . . , vp }).
(2) Necesariamente n < p.
(3) Existe algún vi ∈ U tal que U − {vi } es base de Rn .
(3) Existe algún vk ∈ U tal que vk ∈ L (U − {vk }).
(4) Ninguna de las opciones anteriores es correcta.
   
1 2 1 a
Ejercicio 7.9.18. Consideremos la matriz A =  2 1 −1  y el vector v =  b 
1 1 λ 1
Si se sabe que nu(A) = 1 y que v ∈ N (A) entonces: λ = , a = , b =
 
1 2 −1
Ejercicio 7.9.19. Consideremos la matriz: A =  3 −1 4 . Entonces:
5 3 2
(1) El subespacio generado por sus columnas contiene un conjunto L.I. de tres vectores
(distintos).
(2) El subespacio generado por sus filas contiene un conjunto L.I. de tres vectores (distin-
tos).
(3) El subespacio generado por sus columnas contiene un conjunto L.I. de dos vectores
(distintos).
(4) El subespacio generado por sus columnas contiene sólo dos vectores (distintos).
   
1 2 1 3
Ejercicio 7.9.20. Consideremos la matriz A =  2 −1 7  y el vector v =  −1 .
1 1 λ a
Si se sabe que rg(A) = 2 y que v ∈ N (A) entonces:
(1) λ = 5 y a = −1 (2) λ = 5 y a cualquiera
(3) λ = 2 y a = −1 (4) λ = 2 y a cualquiera.
Ejercicio 7.9.21. Sean u y v vectores de Rn tales que√ kuk = 2, kvk = 5, hu, vi = 7/2.
Entonces ku + vk = (1) 7 (2) 36 (3) 6 (4) 7.
Ejercicio 7.9.22. Sean u y v vectores de Rn . Se consideran las siguientes afirmaciones:

(A) Si |hu, vi| = kukkvk entonces {u, v} es L.D.
(B) Si u 6= o y Pu (v) es la proyección ortogonal de v sobre u entonces necesariamente
kPu (v)k = kvk.
Entonces
(1) Ambas son verdaderas. (2) Ambas son falsas.
(3) (A) es verdadera y (B) es falsa. (4) (B) es verdadera y (A) es falsa.
Ejercicio 7.9.23. Si u y v son dos vectores de Rn entonces el número ||u−2v||2 +||u+v||2

coincide necesariamente con
(1) 2||u||2 − 2||u||.||v|| + 5||v||2 (2) 2||u||2 + 5||v||2
(3) 2||u||2 − 2hu, vi + 5||v||2 (4) 2||u|| + 3||v||
   
1 2
Ejercicio 7.9.24. Sean: u =  1  , v =  −1 . La igualdad k u − λ.v k=k u k se
1 0
cumple:
(1) Solo para λ = 0. (2) Solo para dos valores de λ.
(3) Para infinitos valores de λ. (4) Solo para tres valores de λ.
   
x 2
Ejercicio 7.9.25. Consideremos los puntos p =  y  y q=  1 
z 0
Si se sabe que k p − q k= 2 entonces se cumple necesariamente que:
(1) x + y + z = 7 (2) x2 + y 2 + z 2 + 1 = 0 (3) x2 + y 2 + z 2 − 4x − 2y + 1 = 0
2 2 2
(4) x + y + z − 9 = 0
 
4
Ejercicio 7.9.26. Si se sabe que el vector  6  es perpendicular al plano
−10
de ecuación ax + 3y − 5z = k entonces necesariamente:
(1) a = 2 y k cualquiera. (2) a = 4 y k cualquiera.
(3) a = 2 y k = 1. (4) a = 4 y k = 1.
   
1 5
Ejercicio 7.9.27. Sean: p =  1  , q=  3  , L la recta determinada por p y q,
1 1
y H el plano de ecuación: x − 2y + 3z = 2. Entonces la intersección de L con H es:
(1) L ∩ H = φ (2) L ∩ H = {p} (3) L ∩ H = L (4) L ∩ H = {q}
   
1 3
Ejercicio 7.9.28. Sean: p =  −2  , q =  1  , L la recta determinada por
3 −2
p y q, y H el plano de ecuación: x + y + z = 2.
Entonces la intersección de L con H es:
(1) L ∩ H = φ (2) L ∩ H = {p} (3) L ∩ H = L (4) L ∩ H = {q}
Ejercicio 7.9.29. Consideremos las siguientes afirmaciones:

(A) Sea S un subespacio de Rn y U = {u1 , u2 , . . . . , ur } un generador de S.
Si v ⊥ uk , ∀k = 1, 2, . . . , r entonces v ⊥ S.
(B) Todo subespacio de R3 es un plano.
(C) Toda matriz de 3 filas y 7 columnas tiene rango menor o igual que 3.
Entonces se cumple que:

1) Solo (C) es verdadera. 2) Solo (A) es verdadera.
3) Solo (A) y (C) son verdaderas. 4) Solo (B) y (C) son verdaderas.
   
 1 0 
Ejercicio 7.9.30. Sean U =  0  ,  1  y S el subespacio generado por U .
 
0 1
 
2 √ √ √
Entonces la distancia de  1  a S es: (1) 0 (2) 3 (3) 5 (4) 2.
3
Ejercicio 7.9.31. Sea A una matriz n × n. Entonces se cumple necesariamente que:
(1) Si A es diagonalizable entonces A tiene n valores propios diferentes entre sı́.
(2) Si A no es invertible entonces no puede ser diagonalizable.
(3) Si det(A − λI) no tiene raı́ces entonces A no es diagonalizable.
(4) At .A.At = I
Ejercicio 7.9.32. Sean A una matriz n × n; {u, v, w, z} ⊂ Rn L.I. tales que A.u =
2u, A.v = 2v, A.w = w, A.z = o. Consideremos las afirmaciones:
(A) 2 es valor propio de A. (B) necesariamente n ≥ 4. Entonces:
(1) Ambas afirmaciones son verdaderas. (2) Ambas afirmaciones son falsas.
(3) Sólo (A) es verdadera. (4) Sólo (B) es verdadera.
Ejercicio 7.9.33. U = {u1 , u2 , u3 , u4 } es una base de R4 y A es una matriz 4 × 4 que

cumple: A.u1 = 2u1 , A.u2 = 2u2 , A.u3 = −u3 , A.u4 = u4 . Entonces
(1) A es diagonalizable y nu(A − 2I) = 1 (2) A es diagonalizable y nu(A − 2I) = 2
(3) A no es diagonalizable. (4) Ninguna de las anteriores.
Ejercicio
 7.9.34.
 Sea T : R3 −→ R3 una transformación lineal de la cual se sabe que
1
u=  2  ∈ N (T ). Entonces se cumple necesariamente que:
−1
(1) T no es inyectiva. (2) u debe pertenecer a Im(T ).
(3) N (T ) es un subespacio de dimensión 1. (4) T es biyectiva.
2 2
Ejercicio
7.9.35.
Sea T −→ R una transformación lineal de la cual se sabe que
: R
1 1 2
T =T = . Entonces:
0 1 4

0 1 0 1
(1) ∈ N (T ) y ∈ Im(T ) (2) 6∈ N (T ) y ∈ Im(T )
1 2 1 2

0 1 0 1
(3) ∈ N (T ) y 6∈ Im(T ) (4) 6∈ N (T ) y 6∈ Im(T )
1 2 1 2
Capı́tulo 8
Respuestas a los ejercicios
Ejercicios del Capı́tulo 1
 
1 0 a b
o 2 , (b 6= 0).
Ejercicio 1.1.1. A =  3 2  −a
−a
b
5 4 Ejercicio 1.1.9. 1) SF = S + C − V ,
Ejercicio 1.1.2. a = 3, b = −1.
Piva = 1, 22 P ; 2) I  = V t .P . 
t 10 −1 3p1 + 4p2
Ejercicio 1.1.3. 1) A + A = ,
−1 0 Ejercicio 1.1.10. u =  2p1 + 5p2  ,
 
−5 0−2 4p1 + 6p2
 
2C − 7I3 =  0 −3 −6  , x
 4 2−7
 v= y ,
5 4 3 z
B t .B =  4 13 −13  , 
a
t
3 −13 26 U tilidad =  b  .v − ut .v − k.
t 14 −9 c
B.B = . 2) Los productos
−9 30 Ejercicio 1.1.11. Hay que multiplicar P t .M y
posibles son A.B, B.C, B.D y C.D. luego sumar los elementos de dicha matriz.
1 9 −7
3) X = 4 Ejercicio 1.1.12.
0 −1 
2

Ejercicio 1.1.4. Las partes 1), 2) y 4) son  3 
válidas solamente cuando A.B = B.A. La parte (500 1000 400) . R .   1,5 .

3) es válida siempre.
Ejercicio 1.1.5. (c)a = −2 o a = −1. 5
−1 1 −1
±1 b Ejercicio 1.2.1. A = ,
Ejercicio 1.1.6. 1)
0 ∓1
, (b ∈ R) −1 2
1/2 −1/2
±1 0 B −1 = .
o , (c ∈ R) −1 2
c ∓1
Ejercicio 1.2.2. La únicás falsas son 4) y 5). Un
a c contraejemplo para 4) es A = I, B = −I. Un
o 1−a2 , (c 6= 0).
−a contraejemplo para 5) es A = I, B = I. (I es la
c
a c matriz identidad).
2) −1−a2 , (c 6= 0)
c −a Ejercicio 1.2.3. Se utiliza la parte 1) para
0 b probar que:
3) , (b ∈ R)
0 0 2) (In − A)−1 = In + A

0 0 3) (In − A)−1 = In + A + A2
o , (c ∈ R) 4) (In − A)−1 = In + A + A2 + . . . + Ak−1
c 0
212 Capı́tulo 8. Respuestas a los ejercicios
Ejercicio 2.4.1. (a) Sistema compatible indeterminado con un grado de libertad y

indeterminado 3 con un grado de libertad. Sol(S) = {(−z, z − 3, z) / z ∈ R}.
7 1 9
Sol(S) = 4 + 4 z, 4 + 4 z, z / z ∈ R . Ejercicio 2.4.4. (a) Sistema incompatible.
(b) Sistema incompatible. Sol(S) = ∅. Sol(S) = ∅. (b) Sistema compatible
(c) Sistema incompatible. Sol(S) = ∅. indeterminado con un grado de libertad
(d) Sistema compatible indeterminado con dos Sol(S) = { (3 − x3 , −1, x3 , 1) / x3 ∈ R }.
grados de libertad Ejercicio 2.5.1. Los determinantes valen (a) −
Sol(S) = { (−x3 − 3x4 + 2, −2x3 + x4 − 23, (b) 0, (c) − 155, (d) 0, (e) − 4, (f ) 31.
3, x3 , x4 ) / x3 , x4 ∈ R }. Ejercicio 2.5.2. 1, −1 y 0.
(e) Sistema incompatible. Sol(S) = ∅. Ejercicio 2.5.3. det(B) = 23 det(A) = 40.
Ejercicio 2.4.2. (a) rgf (A) = 1 < 3 = n de Ejercicio 2.5.6. (a) El determinante de la matriz
donde resulta que el sistema es compatible asociada al sistema vale 0 de donde resulta que
indeterminado con dos grados de libertad. el sistema es compatible indeterminado.
(b) rgf (A) = 3 = n de donde resulta que el (b) El determinante de la matriz asociada al
sistema es compatible determinado sistema vale −k 2 . Luego, el sistema es
(Sol(S) = {(0, 0, 0)}). compatible indeterminado si k = 0 y
(c) rgf (A) = 3 = n de donde resulta que el compatible determinado si k 6= 0.
sistema es compatible determinado (c) El determinante de la matriz asociada al
(Sol(S) = {(0, 0, 0)}). sistema vale k 3 + k − 2 (cuya única raı́z real es
Ejercicio 2.4.3. (a) Si n m 6= 1 y m 6= −2 entonces
o k = 1). Luego, el sistema es compatible
S.C.D. con Sol(S) = −2 1 1 indeterminado si k = 1 y compatible
m−1 , m−1 , m−1 . Si
determinado si k 6= 1. 
m = 1 entonces el sistema es incompatible. Si 
0 1/2 1/2
m = −2 entonces el sistema es compatible
Ejercicio 2.6.1. A−1 =  1/2 0 −1/2 
indeterminado con un grado de libertad y
1/2 −1/2 0
Sol(S) = {(1 + z, z, z) / z ∈ R}.  
0 0 1
(b) Si m 6=0 y m 6= −1 entonces S.C.D. con
1 C −1 =  0 1 −2 
Sol(S) = m, m , −m . Si m = 0 entonces el
sistema es incompatible. Si m = −1 entonces el  1 0 −1 
sistema es compatible indeterminado con un 1 −1 −1
grado de libertad y D−1 =  −1/2 1 1/2 
Sol(S) = {(−1, −z, z) / z ∈ R}. 1/6 −1/3 1/6
 
(c) Si m 6=n
0 y m 6= −1 entonces 1/2 −1/4 1/2 −1/4
o S.C.D. con
m −3 2m
 0 1 −1 0 
Sol(S) = ,
m+1 m+1 m+1 , . Si m = −1 E −1 =  1/2 −3/4 1/2

1/4 
entonces el sistema es incompatible. Si m = 0 0 −1/2 1 1/2
entonces el sistema es compatible B no es invertible pues su determinante vale 0.

T T
Ejercicio
3.1.1. L
1 = ∅ , L1 L3 =
L2
x=1−λ 2 T 7/5
L1 Ecuación reducida: y = 3 − x. , L2 L3 =
y =2+λ 1 −7/5
x = −2 + 3λ Ejercicio 3.2.1.
L2 Ecuación reducida: Ecuaciones paramétricas de L1
y = 2 − 3λ 
y =−x.  x = 1 + 2λ
x=2−λ y =2−λ
L3 Ecuación reducida: 
y = 1 − 4λ z = −1 + 3λ
y = −7 + 4x.
213

x + 2y − 5 = 0 (18) es un punto (el origen).
Ecuaciones reducidas:
3y + z − 5 = 0 (19) es un plano.
Ecuaciones paramétricas de L2

 x = −1 + 4λ T 3.2.10. (1) (Π1 ) x + y − 2z = 0.
Ejercicio
(2) L S = {(2, 2, 2)}
y=1 (3) (Π2 ) − x + 2y + 3z =

z = 3 − 2λ T 8.
Un vector paralelo a Π1 Π2 es (−7, 1, −3).
x + 2z − 5 = 0 Ejercicio 3.2.11. (1) (Π1 ) x + y + z = 1.
y=1  (3) (Π2 ) x − 2y = 0. T
 x = 3 + 2λ Un vector paralelo aTΠ1 TΠ2 es (2, 1, −3).
Ecuaciones paramétricas de L3 y =1−λ Ejercicio 3.2.12. Π1 Π2 Π3 = {(−3, 3 − 2)}

z = 1 + 3λ Ejercicio 3.3.2. a = 3.

x + 2y − 5 = 0 Ejercicio 3.3.3. Los vectores que son C.L. de U
T 3y + z − 4 = 0 son
L1 T L2 = ∅ y se cruzan. (1) (a, b, c) tales que 4a + 3b − 2c = 0
L1 L3 = ∅yL1 kL3 . (2) Todos. (3) Todos.
T  3  (4) (a, b, c, d) tales que −a + 3b + 2c = 0 y
L2 L3 =  1  . Las rectas son secantes. −3a + 5b + 2d = 0.
 
1 z1 no y z2 sı́.
Ejercicio 3.2.2. (5) Todos los de R2 .
El sistema con las cuatro T ecuaciones resulta Ejercicio 3.3.4. Solo es falsa la (3).
incompatible de donde L S = ∅. Para decidir Ejercicio 3.3.5. (1) No.
si se cruzan o son paralelas hallamos los (2) (a, b, c, d) tales que −a + b + c + 2d = 0.
vectores que dan la dirección de cada una de Ejercicio 3.3.6. Si a 6= −1, z es C.L. única de U
ellas. T cualquiera sea b. Si a = −1 y b = 1, z es C.L.
Ejercicio 3.2.3. a = 3, b = 2. L S = L = S. no única de U . Si a = −1 y b 6= 1, z no es C.L.
Ejercicio 3.2.4. 2x − y + z = 0. de U .
Ejercicio 3.2.5.
  Ejercicio 3.3.7. (1) x1 = 1 + 2λ , x2 =
T  9/5  −1 + 3λ , x3 = 1 + 2λ , x4 = 2 − λ
1) L Π1 =  3/5  . Ejercicio 3.3.8. (3) No necesariamente.
 
T 1/5 Ejercicio 3.4.1. Son L.I. los conjuntos de las
2) L Π2 = ∅. La recta y el plano son partes 1, 2, 4 y 6. Parte 7: U es L.I. si, y solo
paralelos
T y no tienen puntos en común. si, a 6= 4 y a 6= −4. Parte 8: U es L.D.
3) L Π3 = L. La recta está contenida en el independientemente del valor de a (observar
plano. que la tercera columna es la suma de la
Ejercicio 3.2.6. 1) x + 2y + z = 3. 2) k = 4. primera más la segunda multiplicada por a).
Ejercicio 3.2.7. 1) Π1 −x + 2y + 3z = −1. Ejercicio 3.4.2. (2) Todos con excepción del
2) Π2 3x + y + z = 0. propio conjunto y del vacı́o. (3) No, no es
 x = 0, 1 − 0, 1λ cierto.
3) y=λ Ejercicio 3.4.3. Son verdaderas solamente las

z = −0, 3 − 0, 7λ partes (1) y (3).
Ejercicio 3.2.8. Π es 2y + z = 4. Ejercicio 3.4.4. Son verdaderas solamente las
Ejercicio 3.2.9. Del (1) al (7) son planos partes (1) y (4). Si A es invertible son todas
(¿cuáles?). verdaderas.
Del (8) al (12) son semiespacios (¿cuáles?). Ejercicio 3.4.6. A y B son L.I. mientras que C
Del (13) al (15) son rectas (¿cuáles?). es L.D.
(16) es un semiplano. Ejercicio 3.4.7. Ambas verdaderas.

Ejercicio 4.2.1. Son subespacios solamente (1) y Ejercicio

 4.4.6. Basesson:  
(2). 
 1 0 0 
      
Ejercicio 4.2.2. No son subespacios solamente el 0 , , 0 
1
(1) 
(4) y el (5). 

 0   0   1  

 
Ejercicio 4.2.3.  1 1 0
  
N (A) = {(x, y, z) / x = −z, y = −2z} 
 −2 −3  
   0 
N (B) = {(x, y, z) / x = −z, y = 2z} 1
(2)    ,  
N (C) = {(a, b, c, d) / Ta+b−c = 0, b−2c−d = 0} 
 0   1  
 
Ejercicio 4.2.6. (2) S T es la recta de  1   2 
ecuaciones paramétricas: 
 −3 −1  
x = λ , y = λ , z = 2λ. (3) No. 
1   1 
Ejercicio 4.2.8. Observar que S coincide con el (3)    ,  

 1   0  
núcleo de M − N .  
 0  1
Ejercicio 4.2.9. Ninguna condición en (1), (4),  1 0 

   
(5) y (7). 0

(4)  , 1 
(2) (a, b) / b = 0.   1   0 
 
(3) (a, b) / b = −a. 
0 1

(6) (a, b, c) / a + 4b − 3c = 0. Ejercicio 4.4.7.
   dimN (A) = 0
(8) (a, b, c) / a = b.  −2 
(9) (a, b, c, d) / b = d.  1  es base de N (B)
Ejercicios 4.3.2. y 4.3.3.  
 −4   
Hay infinitas respuestas posibles.  −2 −8 
Ejercicio 4.3.4. Solo (3) no es.  1  ,  0  es base de N (C)
Ejercicio 4.3.5. Solo (2) y (3) son falsas. 
0 1

Ejercicio 4.4.1. Ambas falsas. Ejercicio 4.4.11. No.
Ejercicio 4.4.2. det(MU ) = 24 6= 0 entonces U Ejercicio 4.4.12. (a) a+b 4a+b
3 , 3
es base de R4 . (b) U no es base. (c) (b, a)
Ejercicio 4.4.3. (a) Es base cualquiera que sea Ejercicio 4.4.13. coordU (u) = (1, 0, 0)
 sia 6=
a. (b) Es base solamente 2 y 
a6= −2. coordU (v) = (1, 1, 0) , coordU (w) = (7, 2, −2)
 1 1  Ejercicio 4.4.14. En (b) y (c) U no es base.
Ejercicio 4.4.4. (a)  0  ,  1  (a) (c, b − 2c, a − c)
 
1 2 Ejercicio 4.4.16. (1) u1 = v1 + v2 + v3
3
(b) Ues basede L(U ) = R . u2 = v1 + v2 − v3 , u3 = v1 − v2 + v3
 1  (2) coordU (z) = (2, −4, 6)
(c)  1  (3) v1 = u2 +u2
3
, v2 = u1 −u
2
3
, v3 = u1 −u
2
2
 
 2    Ejercicio
4.4.17.
(1)
Tomamos, por ejemplo:
 1 −1  1 5
, . (2) a−5b 2a+b
11 , 11
(d)  2  ,  1  −2 1
 
−1 1 Ejercicio 4.4.18. coordV (u1 ) = (1, −2, 2)
Ejercicio
 4.4.5.  Bases
  son:
 a = 1, b = −2, c = 2.
 1 0  u1 = (0, 1, 0), u2 = (1, 0, 0), u3 = (0, 1, 6)
(1)  −3  ,  2  Ejercicio 4.5.1. (1) rg(A) = nu(A) = 2.
 
 0  1 (2) α = −3. (3) β = −16.
 1 0  Ejercicio 4.5.2. Si a = 0, rg(A) = 0.
(2)  1  ,  0  Si a = −1, rg(A) = 1.
 
 0  1 Si a 6= 0 y a 6= −1, rg(A) = 2.
 1  (2) Solo es falsa (b).
(3)  1  Ejercicio 4.5.3.
 
 0    Si a = 4 o a = 2, rg(A) = 2.
 1 0  En otro caso rg(A) = 3.
(4)  0  ,  1  Si a = 1, rg(B) = 2.

0 0
 Si a 6= 1, rg(B) = 3.
215
rg(C) = 2, ∀ a. Si α = 4, rg(G) = 1.
Si a = 1, rg(D) = 1. Si α = −4, rg(G) = 2.
Si a = −1, rg(D) = 2. En otro caso rg(G) = 3.
En otro caso rg(D) = 3. 0 1
Ejercicio 4.5.8. A = β
Si a = 0 o a = 1, rg(E) = 2. 0 0
En otro caso rg(E) = 3. −k −k 2
con β 6= 0 o A = α con α 6= 0.
Si a = 0 o a = 1 o a = −1, rg(F ) = 2. 1 k
En otro caso rg(F ) = 3.

√
Ejercicio 5.1.1. hu, vi√= −2 , kuk = 2 Ejercicio 5.2.7. (1) α = −1 , β = −2.
kvk = 3 , ku + vk = 7. (2) PS (p) = p , d(p, S) = 0.
√ hu, vi = 0 , kuk = kvk = 3 ,
Ejercicio 5.1.2. (3) S ⊥ = {(0, d, −2d, d) / d ∈ R}. Una base
ku + vk = 18. de S ⊥ es {(0, 1, −2, 1)}
Ejercicio 5.1.3. (2) u ⊥ v. Ejercicio 5.2.8. (1) Si a = 0 o a = 2 entonces
Ejercicio 5.1.4. (2) λ = 2. rg(A) = 2 y nu(A) = 1. En otro caso,
Ejercicio 5.1.5. u = (3, 4) y v = (12, 16) o rg(A) = 3.
u = (3, −4) y v =√(12, −16) (2) PS (p) = (1, 0, 1).
Ejercicio 5.1.6. 3 5/2.√ (3) S ⊥ = {(−c, c, c) / c ∈ R}.
Ejercicio 5.1.7. (2) 3 18/2. Ejercicio 5.2.10. (1) Una base de N (A) es
Ejercicio
 5.1.9. (1)   {(−1, 1, 1, 0), (−1, −1, 0,1)}
5p1 + 2p2 x (3) La base hallada es ortogonal. Alcanza con
 3p1 + 4p2   y  dividir
u= √ ambos
√ vectores entre sus normas.
 4p1 + 7p2  , u =  z 
  
(4) ( 3, 3).
2p1 + 3p2 w Ejercicio 5.2.12. (2) Una base de S es
   
* a x + {(−1, 0, 1)}. S ⊥ = {(a, b, a) / a, b ∈ R}.
 b   y  Ejercicio 5.2.13. (1) U = {(1, 1, √ 0), (0, 0, 3)}
(2) U =   c  − u,  z  − k
  
(2) d(v, S) = 0. (3) h1 = (3, 3, 3 2).
d w Ejercicio 5.2.14. (2) U = {(1, 1, 0, 0),
Ejercicio 5.2.1. (a) Es base no ortogonal. (1/2, −1/2, 1, 0), (−2/3, 2/3, 2/3, 0)}
(b) Es ortogonal, no base. (3) d(p, S) = e/π.
(c) No es ortogonal ni base. Ejercicio 5.2.15.√ (1) x − z = 0.
(d) Es ortogonal y es base. (4) d(p, H) = 8.
(e) Es ortogonal. Es base si, y solo si, a y b no z = (2, 1, 2), w = (2, 0, −2).
son simultáneamente nulos. Ejercicio
5.2.18.Falsa. Un contraejemplo es
Ejercicio 1 0
5.2.2.
  a+2b+3c  A=
a 14
0 −1
coordU  b  =  −3b+2c 13
 Ejercicio 5.3.1.√ d(p1 , H) = 0.
c 13a−2b−3c d(p2 , H) = 10/ 21. p
182
Ejercicio 5.2.3. (1) PS (p) = (1/9, −2/9, 2/9) Ejercicio 5.3.2. (1)√d(u1 , L) = 1/3.
√
d(p, S) = 72/9 (2) d(u3 , H) = 3/ 5. √
(2) PS (p) = p, d(p, S) = 0 Ejercicio 5.3.3. (2) d(p, Π) = 6/6.
(3) PS (p) = p, d(p, S) = 0 El punto más próximo es 67 , 86 , 56
√
(4) PS (p) √
= (2/9, 1/18, 17/18) (3) d(p, L) = 114/3.
d(p, S) = 18/18 El punto más próximo es −4 4 −5
3 , 63 , 3
Ejercicio 5.2.6. (1) Ejercicio 5.3.4. x = 1 , y = 2 − 4α
PS (p) = (21/10,
√ −1/5, 29/10, −1/5) z = 3 − 2α.
d(p, S) = 10/10 Ejercicio 5.3.5. x + y = 1
(2) S ⊥ = {(a, −2a, −a, −2a) / a ∈ R}. Una Ejercicio 5.4.1 (2) α = 10 11
; β = − 51 .
base de S ⊥ es {(1, −2, −1, −2)} 1 2 7
(3) y = 3 x − 30 x + 10 3
Ejercicio 5.4.2 α = 15, 78; β = 210, 44. (3) dist(v, S) = √311

R = 698, 9. Ejercicio 5.4.4 y = −1 + 2t2
Ejercicio 5.4.3 (1) w = − 10 12 4 2
11 , 11 , 11 , 11
Ejercicio 6.2.4. A: valores propios: 1 y 6. Ejercicio 6.3.4. Solamente es diagonalizable la

S1 = {(2a, −3a) / a ∈ R}; A.
S6 = {(x, x) / x ∈ R}. Ejercicio 6.3.5. (1) Valores propios: 4 y −1
B no tiene. (triple).
C: valores propios: 0 y 7. S4 = {(x 1 , x1 , 0, 0) /x1 ∈ R};
S0 = {(−3y, y) / y ∈ R}; S−1 = a, −2a 3 , c, d / a, b, c ∈ R .
S7 = {(x, 2x) / x ∈ R}. (2) Es diagonalizable. (3) únicamente la
D: valores propios: 1, −2 y 3. solución trivial.
S1 = {(−z, 4z, z) / z ∈ R}; Ejercicio 6.3.6. (1) Una base de N (A) es:
S−2 = {(−z, z, z) / z ∈ R}; { (-1,1,0,0), (-1,0,1,0), (-1,0,0,1) }
S3 = {(z, 2z, z) / z ∈ R}. Sı́, 0 es valor propio de A pues N (A) 6= {o}.
Ejercicio 6.2.6. Respectivamente 2,
1 y 3. (2) El valor
 propio correspondiente  es 4.
−2 0 1 −1 −1 −1
Ejercicio 6.3.2. Por ejemplo A = ,
0 1  1 1 0 0 
(3) B =   1

1 1 0 1 0 
B=
1 0  1 0 0 1
−3 1 4 0 0 0
Ejercicio 6.3.3. (a) B = y  0 0 0 0 
2 2
yD=  0 0 0 0 

0 0
D= 0 0 0 0
0 8   
1 1 −2 2 0 0 Ejercicio 6.3.7. (1) Valores propios: 0 y 2 + k.
(b) B =  0 1 0 , D =  0 1 0  (2) Es diagonalizable solamente para k 6= −2.
0 0 1  0 0 1 Ejercicio 6.3.8. a = 0 o a = 1/2.
 Ejercicio 6.3.9. Si a = 0 cualquier matriz 3 × 3
−1 −1 1
(c) B =  4 1 2 , invertible la diagonaliza.  Si a 6= 0 unamatriz
1 1 1 1 0 1

1 0 0
 que la diagonaliza es  0 1 1 .
−1 −1 1
D =  0 −2 0   
0 0 3 1 0 0

1 −1 −1
 
3 0 0
 Ejercicio 6.3.10. S = B  0 2 0  B −1
0 0 3
(d) B =  1 1 0 , D =  0 1 0   
0 0 1 0 0 1 1 1 1

1 0 0 0
 siendo B =  0 1 2 .
 1 0 1 0  0 0 2
(e) B =  0 1 0 −2 
 Ejercicio 6.3.12. Utilice ejercicio 6.3.3. parte (f).
0 1 1 1 Ejercicio 6.3.13. (1) Valores propios: −1 y 1
  (doble).
1 0 0 0
 0 1 0 (2) Es diagonalizable solo para α = 0.
0 
yD=  0 0 3
 Ejercicio 6.3.14. mg(A1 ) = 3, mg(A2 ) = 2 y
0 
mg(A3 ) = 1.
0 0 0 −2
  1 1
2 1 0 Ejercicio 6.3.15. √12 y
1 −1
(f) B =  1 −2 −2 ,  √ √ 
√2 3 −1
1 0 1
√1  2 √0 2 
 
8 0 0 6 √
2 − 3 −1
D =  0 −1 0 
0 0 −1
217

1
Ejercicio7.8.1. y (T2 oT1 )(a, b) = 14 (11a + 5b, 5a + b).
2 5 2 9 Ejercicio 7.8.8. (1) T (−4, 1, 0) = (−12, 3, 0).
(1) A = ;T =
1 1 −1 1 (2) det(M ) 6= 0 de donde T es biyectiva.
   
1 3 0 Ejercicio 7.8.9.
3
(2) A =  1 1 ; T = 2  kT (x)k = 0 ⇒ T (x) = o ⇒ x ∈ N (T ).
1
4 1 Ejercicio 7.8.10. [T ] = MU y det (MU ) 6= 0 por
  13
1 ser U base. Luego T es invertible.
1 1 1 0 Ejercicio 7.8.11. (1) Utilice
(3) A =
1 9 1
;T  0  =
0   el teorema 7.2.2.
−1 2 1 0
 
1 1 0 (2) [T ] =  1 0 1 
 1 1 1  1 −1 1
(4) A =  ;
(3) det[T ] 6= {o} ⇒ T es  invertible.
 2 0 −1 
0  0 0 1 1 −1
  0 [T −1 ] = 12  −1 3 −1 
3 −1 1 1
 6 
T 3 = 
(4) Valores propios de T : 2 y 1 (doble).
 12 
−6 S1 = {(x, x + y, y) / x, y ∈ R};
0
S2 = {(z, z, z) / x ∈ R}. Es diagonalizable.
Ejercicio 7.8.2.
N(A)
(1) = {o} ;
(5) Valores propios de T −1 : 1/2 y 1 (doble).
2 −5
Im(A) = L ; S1 = {(x, x + y, y) / x, y ∈ R};
1 1
(2) N (A) = {o} ; S1/2 = {(z, z, z) / x ∈ R}. Es diagonalizable.
   
 1 −3  Ejercicio 7.8.12. Recuerde las proposiciones
Im(A) = L   1  ;  1   7.6.1 y 7.6.2.

4
 Ejercicio 7.8.13. Recuerde el ejercicio 5.1.8 y la
 1 proposición 5.2.1.
 −1 
(3) N (A) = L   0   ; Ejercicio 7.8.14. Recuerde la proposición 5.2.4.
  Ejercicio 7.8.15. (2) hT (v), vi = kvk2 cos(α)
1 de donde kT hT (v),vi
1 −1 (v)kkvk = cos(α).
Im(A) = L ; (3) Se trata de una rotación con centro en el
1 9
(4)N (A) = {o} ; Im(A) = origen y ángulo de giro α (radianes) en sentido
     
 1 −1 0   antihorario.

 1   1   1  Ejercicio 7.9.1 (2)
L 
   ;   ;   
Ejercicio 7.9.2 (4)

 2   0   −1  


0 0 0
 Ejercicio 7.9.3 (4)
Ejercicio 7.8.3. (1) Utiliceel teorema 7.2.2. Ejercicio 7.9.4 (3)
2 3 Ejercicio 7.9.5 (5)
(2) T −1 = . Ejercicio 7.9.6 (3)
−2 4
Ejercicio 7.8.4. (1) Utilice el teorema 7.2.2. Ejercicio 7.9.7 (2)
(2) T (x, y) = (x + 2y, x + y, x). Ejercicio 7.9.8 (3)
Ejercicio 7.8.5. (1) Ejercicio 7.9.9 (4)
T (1, 0, −1) = (0, 0, 0) ⇒ (1, 0, −1) ∈ N (T ). Ejercicio 7.9.10 (3)
T (1, 0, 0) = (1, 0, −1) ⇒ (1, 0, −1) ∈ Im(T ). Ejercicio 7.9.11 (2)
(2) No, pues N (T ) 6= {o}. Ejercicio 7.9.12 (2)
(3) Valores propios: 0 y 1 (doble). Ejercicio 7.9.13 (3)
S1 = {(0, y, 0) / y ∈ R}; Ejercicio 7.9.14 (1)
S0 = {(x, 0, −x) / x ∈ R}. No es diagonalizable. Ejercicio 7.9.15 (2)
Ejercicio 7.8.6. det[T ] 6= {o} ⇒ T es invertible Ejercicio 7.9.16 (1)
⇒ N (T ) = {o} y Im(T ) = R4 . Ejercicio 7.8.7. Ejercicio 7.9.17 (3)
Solo T2 oT1 es invertible Ejercicio 7.9.18 λ = 0, a = 1, b = −1.
Ejercicio 7.9.19 (3) Ejercicio 7.9.28 (3)

Ejercicio 7.9.27 (3)
Referencias bibliográficas y lecturas complementarias.
Anton, Howard. Introducción al álgebra lineal. Limusa, 3 Ed. 1994.
Barbolla, Rosa. - Sanz, Paloma Álgebra lineal y teorı́a de matrices. Prentice Hall,
1998.
Moretti, Jorge. Álgebra lineal. Ediciones del CECEA, 2000 a 2009.
Lages Lima, Elon. Álgebra Linear. IMPA.
Strang, Gilbert. Algebra lineal y sus aplicaciones. Cengage Learning Editores, 2007.
Grossman, Stanley. Algebra lineal. McGraw-Hill, 2008.
Hill, Richard. Álgebra lineal elemental con aplicaciones. Prentice Hall, 1997.
Halmos, Paul. Espacios vectoriales de dimensión finita. CECSA, 1971.
Hernández, Eugenio. Álgebra y Geometrı́a. Addison-Wesley, 1998.
Koffman, A. - Kunze, R. Álgebra lineal. Prentice Hall, 1997.
Nakos, G. - Joiner, D. Algebra lineal con aplicaciones. Thomson, 1999.

Índice alfabético
Angulo entre dos vectores, 132 definición, 91

subespacios, 92
Base
cambio de, 112 Generador
canónica, 108 definición, 102
definición, 108 modificación, 106
reducción, 105
Conjuntos convexos, 82
y sistemas de ecuaciones, 104
Coordenadas
de un vector, 111 Mı́nimos cuadrados
en base ortogonal, 135 aproximación por, 155
método de, 155
Dependencia lineal
Matrices
ampliación de un L.I., 88
antisimétricas, 13
conjuntos L.D., 83, 84
cálculo de la inversa, 38
conjuntos L.I., 83, 84
Descomposición en valores singulares, 177
interpretación geométrica, 86
diagonales, 161
modificación de un L.I., 88
reducción de un L.I., 87 diagonalizables, 162, 169
y sistemas de ecuaciones, 84, 85 igualdad de, 7
Determinantes, 32, 33, 37 invertibles, 15
Diagonalización núcleo, 98
condiciones, 171 nulidad, 120
de matrices simétricas, 172 ortogonales, 144
Descomposición en valores singulares, 177 producto de, 8, 11
matrices diagonalizables, 169 producto por un número, 8
multiplicidad algebraica, 174 que conservan el producto interno, 145
multiplicidad geométrica, 174 que conservan la norma, 145
subespacios propios, 165 resta de, 8
valores propios, 163, 165, 199 simétricas, 13
vectores propios, 163, 165, 199 suma de, 7
Distancia Matriz
de un punto a un conjunto, 139 de cambio de base, 113
de un punto a un plano, 151 escalerizada, 24, 44
de un punto a un subespacio, 139 escalerizada reducida, 24
de un punto a una recta, 152 forma escalerizada, 24
entre dos puntos, 131 identidad, 11
número de escalones, 28
Espacios vectoriales rango, 117, 118
219
220 ÍNDICE ALFABÉTICO
rango por columnas, 117, 118 por un punto y paralela a un vector, 54

rango por filas, 29, 117, 118 Rectas en R3
traspuesta, 12 ecuación paramétrica vectorial, 61
ecuaciones paramétricas, 61
Norma de un vector, 127 ecuaciones reducidas, 61
intersección, 62
Ortogonalidad
paralelas, 64
conjuntos ortogonales, 134
por dos puntos, 61
conjuntos ortonormales, 134
por un punto y paralela a un vector, 60
matrices ortogonales, 144
que se cruzan, 63
omplemento ortogonal de un subespa-
cio, 140
Segmentos, 56
proceso de Gram-Schmidt, 142
Semirrectas, 56
proyección ortogonal, 128, 137, 138
Sistemas de ecuaciones lineales
proyección ortogonal sobre un subespa-
compatible determinado, 20
cio, 138
compatible indeterminado, 20
vector ortogonal a un conjunto, 136
conjunto solución, 20
vectores ortogonales, 128
escalerizados, 24, 44
3
Planos en R , 65 grados de libertad, 47
ecuación reducida, 67, 68 homogéneos, 30, 31
ecuaciones paramétricas, 66 incompatible, 20
intersección con una recta, 68 matriz ampliada asociada, 22
por tres puntos no alineados, 67 matriz asociada, 22
por un punto y paralelo a dos vectores, notación matricial, 23
66 transformaciones elementales, 21
vector normal, 150 Subespacios
Producto interno, 125, 126 bases de, 108
Proyección ortogonal de las combinaciones lineales, 99
en una base cualquiera, 158 definición, 95
sobre un subespacio, 137, 138 dimensión, 109
sobre un vector, 128 generado por un conjunto, 99
Punto medio de un segmento, 57, 134 núcleo de una matriz, 98
reducción de un generador, 105
Rango Subespacios vectoriales, 92, 93
de una matriz, 117, 118
por columnas de una matriz, 117, 118 Teorema
por filas de una matriz, 29, 117, 118 caracterización de las transformaciones
Rectas lineales, 184
en R2 , 54 caracterización de transformaciones li-
en R3 , 60 neales inyectivas, 195
en Rn , 82 caracterización de transformaciones li-
Rectas en R2 neales sobreyectivas, 196
ecuación paramétrica vectorial, 54 condición suficiente de diagonalización,
ecuaciones paramétricas, 55 171
intersección, 58 condición suficiente para que un vector
por dos puntos, 55 sea ortogonal a un subespacio, 136
ÍNDICE ALFABÉTICO 221
condiciones de diagonalización, 169 Vectores

de Cramer, 35, 36 ángolo entre, 132
de Gram-Schmidt, 142 canónicos, 80
de la proyección ortogonal, 138 colineales, 52, 74
de las dimensiones, 194 combinación lineal, 74, 78, 79
de Pitágoras, 126, 128, 133 combinación lineal única, 79
de Rouche-Frobenius, 29, 46 coordenadas en una base, 111
de Steinitz, 107, 123 norma, 127
del coseno, 131 producto interno, 125
descomposición en valores singulares de producto por un número, 51, 52, 73
una matriz, 177 resta de, 51, 53, 73
desigualdad de Bessel, 138 suma de, 51, 53, 60, 72
desigualdad de Cauchy-Schwarz, 129 Vectores en R2 , 50
determinación de una transformación li- Vectores en R3 , 59
neal, 186 Vectores en Rn , 72
existencia de bases, 108 Vectores propios, 163, 165, 199
independencia lineal de conjuntos orto-
gonales, 134
independencia lineal de vectores propios,
167
sobre rango y nulidad de una matriz,
120
Transformaciones lineales
biyectivas, 195, 196
composición, 189
definición, 179, 180
determinación, 186
imagen, 192
invertibles, 191
inyectivas, 195
matriz asociada, 184
núcleo, 192
producto interno, 180
producto por un número, 188
propiedades básicas, 180
proyección ortogonal, 181
Proyección ortogonal sobre un vector,
180
sobreyectivas, 195
suma de, 188
teorema de las dimensiones, 194
transformación coordenadas, 181
transformación inversa, 191
valores y vectores propios, 199
Valores propios, 163, 165, 199

Libro Algebra 2013 PDF

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Libro Algebra 2013 PDF

Cargado por

Copyright:

Formatos disponibles

Introducción al

Ignacio Aemilius, Marcelo Cerminara,

Andrea Mesa, Fernando Peláez

c I. Aemilius, M. Cerminara, A. Mesa, F. Peláez

Diseño de carátula: Fernando Peláez.

Queda prohibida cualquier forma de reproducción, transmisión o archivo en sistemas recuperables

2. Sistemas de ecuaciones lineales 19

7. Transformaciones lineales 179

8. Respuestas a los ejercicios 211

Es probable que el lector ya tenga experiencia con la utilización de “planillas bidimensio-

1.1. Matrices y operaciones con matrices

la entrada aij ocupa la posición ij dentro de la matriz.

Definición 1.1.4. Resta de matrices.

Definición 1.1.5. Producto de un número por una matriz.

(P3) Distributiva respecto de la suma de números: (α + β)A = αA + βA, ∀ α, β ∈ R y

El siguiente esquema ayuda a recordar la forma de realizar la operación:

2·1 + 1·2 + (−1)1 + 0·1 = 3

Observación 1.1.1. Si volvemos a mirar el ejemplo introductorio de comienzo de capı́tulo

Definición 1.1.7. La matriz identidad.

In .A = A, ∀ A ∈ Mn×p , B.In = B, ∀ B ∈ Mm×n

Observación 1.1.3. Sobre las propiedades del producto de matrices.

Proposición 1.1.3. Propiedades del producto de matrices.

Asociativa Si A ∈ Mm×n , B ∈ Mn×p y C ∈ Mp×q , entonces (A.B).C = A.(B.C)

Distributiva Si A, B ∈ Mm×n , C ∈ Mp×m y D ∈ Mn×q entonces

Existencia de Neutro Si In es la matriz identidad n × n entonces

La demostración se puede encontrar en el apéndice del final de este capı́tulo.

Definición 1.1.8. Potencias de una matriz.

Proposición 1.1.4. Propiedades de la matriz traspuesta.

3. (A.B)t = B t .At , para toda pareja de matrices A y B conformables.

La demostración queda cargo del lector.

Ejercicio 1.1.1. Construya la matriz A = ((aij )) 3 × 2 que cumple aij = 2i − j,

Ejercicio 1.1.3. Se consideran las siguientes matrices:

1. Encuentre las siguientes matrices: A + At , 2C − 7I3 , B t .B , B.B t .

Ejercicio 1.1.7. Traza de una matriz cuadrada.

1. Demuestre que existen infinitas matrices B tales que A.B = I2 .

1. Exprese las operaciones matriciales que permiten obtener la matriz correspondiente

R resume los requerimientos por unidad de cada producto:

1.2. Matrices invertibles

Definición 1.2.1. Matriz invertible.

Proposición 1.2.1. Sean B1 y B2 matrices n × n que cumplen (1.1) entonces B1 = B2

Proposición 1.2.3. La inversa de un producto de matrices.

Ejercicio 1.2.1. Halle la inversa de las siguientes matrices y verifique:

Ejercicio 1.2.3. Sea A una matriz n × n. Pruebe que:

Ejercicio 1.2.4. Matrices semejantes.

2. A es invertible si, y solo si, B es invertible.

1.3. Apéndice de esta sección

Asociativa Si A ∈ Mm×n , B ∈ Mn×p y C ∈ Mp×q , entonces (A.B).C = A.(B.C)

Distributiva Si Si A, B ∈ Mm×n , C ∈ Mp×m y D ∈ Mn×q entonces

C.(A + B) = G = ((gij )),

Debemos probar entonces que gij = eij + fij ∀ i, j.

Sistemas de ecuaciones lineales

Algunos ejemplos de sistemas de ecuaciones lineales son los siguientes:

Un sistema de m ecuaciones lineales con n incógnitas x1 , x2 , . . . , xn es un problema

donde aij con i = 1, . . . , m y j = 1, . . . , n (los coeficientes del sistema) y bj con j = 1, . . . , m

Ejemplo 2.1.1. El ejemplo más sencillo de un sistema lineal es el 1 × 1:

En pocos renglones podemos discutir completamente como es el conjunto solución. Si a 6= 0

es un sistema 3 × 3. Se observa de manera inmediata que Sol(S) = {(1, 3, 2)}.

Definición 2.1.1. Sistemas equivalentes.

Definición 2.1.2. Transformaciones elementales.

1. Intercambiar de lugar dos ecuaciones. (Fi ↔ Fj )

2. Multiplicar una ecuación por un número α 6= 0. (αFi )

3. Sumar a una ecuación un múltiplo de otra. (Fi + βFj )