Está en la página 1de 46

Tema 4.- El espacio vectorial Rn.

1.
2.
3.
4.
5.

Subespacios vectoriales de Rn .
Bases de un subespacio.
Rango de una matriz.
Bases de Rn . Cambios de base.
Ejercicios.

En este tema estudiamos la estructura vectorial del espacio Rn , de las nuplas ordenadas de n
umeros reales, es
decir, la estructura relacionada con las operaciones suma (de vectores) y multiplicacion de un n
umero (real) por un
vector. El espacio Rn es uno de los modelos para el estudio de los denominados espacios vectoriales (generales). Sin
entrar en mas detalles y definiciones, un espacio vectorial es un conjunto de elementos sobre el que hay definida una
operaci
on suma (de dichos elementos) y una operaci
on producto de un n
umero por uno de dichos elementos. Por
ejemplo, son espacios vectoriales:
el conjunto de las matrices de unas dimensiones dadas, con la operaci
on suma de matrices y producto de un
escalar (real, complejo) por una matriz,
el conjunto de todos los polinomios en una variable, con las operaciones suma de polinomios y producto de un
escalar por un polinomio,
el conjunto de todos los polinomios en una variable y con grado menor o igual que un cierto valor prefijado. Por
ejemplo, el conjunto de todos los polinomios de grado menor o igual que 3.
Para finalizar, daremos la definicion formal de base y consideraremos los resultados fundamentales asociados a
dicho concepto.

1.

Subespacios vectoriales de Rn .

Los subespacios vectoriales de Rn seran los subconjuntos de Rn que se pueden caracterizar mediante ecuaciones
lineales homogeneas (ecuaciones implcitas en las n variables dadas por las coordenadas de un vector generico). Como
ya hemos visto, cualquier conjunto de vectores descrito como el conjunto de todas las combinaciones lineales de ciertos
vectores tambien puede caracterizarse mediante ecuaciones lineales homogeneas. A la hora de manipular subespacios
vectoriales recurriremos, de forma habitual, a su expresion mediante ecuaciones implcitas o a su expresion mediante
ecuaciones parametricas. Una de las cuestiones que trataremos es el n
umero mnimo de ecuaciones implcitas mediante
las que se puede caracterizar un subespacio y el n
umero mnimo de vectores que permiten generar dicho subespacio. En
el espacio tridimensional R3 , los subespacios vectoriales son, ademas del subespacio nulo {0} y del total R3 , las rectas
y los planos que pasan por el origen de coordenadas. Recordemos que cualquier recta o plano se puede caracterizar
mediante ecuaciones implcitas y mediante ecuaciones parametricas. En R3 , para caracterizar una recta que pasa por
el origen de coordenadas necesitamos dos ecuaciones (no redundantes) o un vector, y para caracterizar un plano que
pasa por el origen de coordenadas necesitamos una ecuaci
on o dos vectores linealmente independientes (una base de
dicho plano).

1.1.

Subespacios vectoriales.

Definici
on. Se llama subespacio vectorial de Rn a todo subconjunto no vaco S Rn que verifica:
(1) Si un vector est
a en S, tambien lo est
a cualquiera de sus m
ultiplos, es decir,
v S = v S,

R,

(2) Si dos vectores est


an en S, tambien lo est
a la suma de ambos, es decir,
v1 , v2 S = v1 + v2 S.

79

La propiedad (1) nos dice que si tenemos un vector no nulo de un subespacio vectorial, la recta determinada por
dicho vector est
a contenida en el subespacio. La propiedad (2) nos dice que si tenemos dos vectores (no colineales) de
un subespacio vectorial, el plano determinado por dichos vectores est
a contenido en el subespacio.
Las dos propiedades anteriores se pueden expresar de forma conjunta: Si dos vectores est
an en S, tambien lo
est
a cualquiera de sus combinaciones lineales:


v1 , v2 S

= v1 + v2 S.
, R
En particular el vector nulo pertenece a cualquier subespacio vectorial.
n o
Obviamente S = ~0 y S = Rn son subespacios vectoriales (a veces llamados subespacios triviales).

En el espacio bidimensional, R2 , ademas de esos dos subespacios triviales, cualquier recta que pase por el origen
es un subespacio vectorial. Sin embargo, los vectores de posicion determinados por los puntos de una par
abola NO
forman un subespacio vectorial.
n o
En el espacio tridimensional, R3 , ademas de los dos subespacios triviales ( ~0 y R3 ), cualquier recta o plano que
pase por el origen es un subespacio vectorial.
Ejercicio resuelto
Encontrar unas ecuaciones implcitas del subespacio de R4
E = Gen{(1, 1, 1, 0)T , (2, 0, 1, 2)T , (0, 2, 1, 2)T , (0, 2, 1, 2)T , (1, 1, 0, 2)T }.
Dado un conjunto generador {v1 , v2 , v3 , v4 , v5 } de un subespacio E R4 , encontrar las ecuaciones implcitas de E
es hallar las condiciones que deben verificar las componentes de un vector de R4 , x = (x1 , x2 , x3 , x4 )T , para que
pertenezca a E, es decir, para que se pueda escribir como combinaci
on lineal del conjunto generador x = c1 v1 + c2 v2 +
c3 v3 + c4 v4 + c5 v5 , es decir, para que existan esos escalares ci , o lo que es equivalente, para que el sistema
(v1 |v2 |v3 |v4 |v5 )c = x, con c = (c1 , c2 , c3 , c4 , c5 )T
sea compatible. Para exigir esto

1 2 0
1 0 2

1 1 1
0 2 2

construimos la matriz ampliada (v1 |v2 |v3 |v4 |v5 |x):

0 1 x1
1 2
0
0 1 x1
0 2 2 2 2 x2 x1
F

F
2 1 x2
2
1

1 0 x3 F3 F1 0 1 1 1 1 x3 x1
- 0 2 2 2 2 x4
2 2 x4

1 2 0 0 1 x1

F3 F2 /2
,
0 2 2 2 2 x2 x1

F4 + F2
0 0 0 0
0 x3 x1 /2 x2 /2
- 0 0 0 0
0 x4 + x2 x1

es decir, el sistema es compatible cuando



x3 x1 /2 x2 /2 = 0,
x4 + x2 x1 = 0,
que son unas ecuaciones implcitas de E.
Observemos que podamos haber buscado
(v1 |v2 |v3 |v4 |v5 ):

1 2 0
0 1
1 0 2 2 1 F2 F1

1 1 1 1 0 F3 F1
0 2 2 2 2

x1 + x2 2x3 = 0,
x1 x2 x4 = 0,

primero una base de E, aplicando eliminacion gaussiana a la matriz

1 2
0
0 1

0 2 2 2 2
F3 F2 /2
0 1 1 1 1 F4 + F2
0 2 2 2 2

1
0
0
0

2
2
0
0

0 0
2 2
0 0
0 0

1
2
,
0
0

de donde deducimos que E = Gen{v1 , v2 }, es decir, una base de E es BE = {v1 , v2 }. Dada una base {v1 , v2 } de
un subespacio E R4 , encontrar las ecuaciones implcitas de E es hallar las condiciones que deben verificar las
componentes de un vector de R4 , x = (x1 , x2 , x3 , x4 )T , para que pertenezca a E, es decir, para que se pueda escribir
como combinaci
on lineal de los vectores de la base x = c1 v1 + c2 v2 , es decir, para que existan esos escalares ci , o lo
que es equivalente, para que el sistema
(v1 |v2 )c = x, con c = (c1 , c2 )T
80

sea compatible.

1
1

1
0

Para exigir esto construimos la matriz ampliada (v1 |v2 |x):

1 2 x1
2 x1

0 x2
F2 F1 0 2 x2 x1 F3 F2 /2

F4 + F2
F3 F1
1 x3
0 1 x3 x1
2 x4
0 2 x4

es decir, el sistema es compatible cuando



x3 x1 /2 x2 /2 = 0,
x4 + x2 x1 = 0,

1
0
0
0

2
2
0
0

x1

x2 x1
,
x3 x1 /2 x2 /2
x4 + x2 x1

x1 + x2 2x3 = 0,
x1 x2 x4 = 0,

que son unas ecuaciones implcitas de E.


La garanta de que el resultado al que hemos llegado es correcto se obtiene comprobando que todos los vectores vi
verifican todas las ecuaciones implcitas obtenidas.

1.2.

Espacio nulo y espacio columna de una matriz.

Asociados a una matriz A, m n,

A = [v1 |v2 |...|vn ] =

a11
a21
..
.

a12
a22
..
.

..
.

a1n
a2n
..
.

am1

am2

amn

hemos considerado los denominados

Espacio nulo de la matriz A, esto es, el conjunto de vectores reales x Rn caracterizados por las ecuaciones
implcitas

a11 x1 + a12 x2 + + a1n xn


= 0

= 0

a21 x1 + a22 x2 + + a2n xn

.
.
.
..
.. ..
Ax = 0
.

a x + am2 x2 + + amn xn = 0

m1 1

Espacio columna de la matriz A, subespacio generado por las columnas de A, esto es, el conjunto de vectores
y que se pueden escribir como combinaci
on lineal de dichas columnas
y = 1 v1 + 2 v2 + + n vn ,
caracterizado por las ecuaciones

y1 =

y2 =
..
..
.
.

y
=

parametricas
1 a11 + 2 a12 + + n a1n
1 a21 + 2 a22 + + n a2n
..
.
1 am1 + 2 am2 + + n amn

, con 1 , 2 , . . . , n R.

Resolviendo el sistema homogeneo Ax = 0 podemos obtener los vectores del espacio nulo de A como el conjunto
de vectores que se pueden expresar como combinaci
on lineal (arbitraria) de determinados vectores, es decir, como el
subespacio generado por ciertos vectores o como el espacio columna de la matriz que tiene a dichos vectores como
vectores columna. Por otra parte, puesto que el espacio columna de una matriz A est
a formado por los vectores y tales
que el sistema de ecuaciones Ax = y es compatible, obteniendo las condiciones de compatibilidad de este sistema (en
funci
on del termino independiente y), tendremos unas ecuaciones lineales homogeneas que permiten expresar el citado
espacio columna como espacio nulo de otra matriz.
Por tanto, hablar de espacio nulo o espacio columna de una matriz (o subespacio generado por ciertos vectores)
no es hablar de conjuntos de vectores con caractersticas distintas, sino que es hablar de un mismo tipo de conjunto
de vectores, que son los denominados subespacios vectoriales, pero expresados en forma distinta:
cuando uno de dichos conjuntos de vectores viene dado como espacio nulo de una matriz tenemos una descripcion
implcita (ecuaciones implcitas) de dicho conjunto (un vector est
a en el conjunto considerado si, y solo si,
sus coordenadas verifican el sistema homogeneo asociado a la matriz),
81

cuando uno de dichos conjuntos de vectores viene dado como espacio columna de una matriz tenemos una descripcion parametrica (ecuaciones param
etricas) de dicho conjunto (un vector est
a en el conjunto considerado
si, y solo si, puede expresarse como combinaci
on lineal de determinados vectores).
Entre las descripciones parametricas de un subespacio vectorial unas seran mejores que otras en el sentido de que
unas involucren menos vectores que otras. Es decir, si tenemos el espacio columna de una cierta matriz A, m n,
y los vectores columna de A son linealmente dependientes, suprimiendo vectores que sean combinaci
on lineal de los
que quedan, tendremos que el espacio columna de la matriz original tambien es el espacio columna de la matriz que
resulta de la matriz anterior suprimiendo algunas columnas. Si nos quedamos con un conjunto de vectores linealmente
independiente, tendremos que dichos vectores generan el espacio columna de la matriz original y cada vector de
dicho espacio se puede expresar de forma u
nica como combinaci
on lineal de los vectores linealmente independientes
obtenidos. Dichos vectores constituyen lo que se denomina una base (es decir, un conjunto de vectores linealmente
independiente que genera el subespacio) del subespacio vectorial considerado, el espacio columna de la matriz original.
Si en la representa-cion parametrica eliminamos los par
ametros, llegaremos a unas ecuaciones homogeneas que dar
an
una descripcion implcita del subespacio considerado.
De forma paralela, entre las descripciones implcitas de un subespacio vectorial tambien habr
a unas mejores que
otras, en el sentido de que una puede tener ecuaciones redundantes y otra no. Si mediante operaciones fila reducimos
una matriz A a forma escalonada y obtenemos la matriz U , las soluciones del sistema U x = 0 coinciden con las del
sistema Ax = 0, es decir los espacios nulos de la matriz A y de la matriz U coinciden. Si de la matriz U eliminamos las
filas nulas, que proceden de ecuaciones originales redundantes en el sistema Ax = 0, tendremos un sistema de ecuaciones
sin ecuaciones redundantes y cuyas soluciones forman el espacio nulo de la matriz A original. Si resolvemos el
sistema homogeneo tendremos una descripci
on parametrica del conjunto solucion, es decir, del subespacio dado.
Podemos caracterizar las matrices invertibles en terminos de sus espacios nulo y columna.
Teorema.- Consideremos una matriz cuadrada de orden n.
(1) La matriz A tiene inversa si, y solo si, Col (A) = Rn .
(2) La matriz A tiene inversa si, y solo si, Nul (A) = {0}.
Cuando se consideran las transformaciones lineales sin hacer referencia a la matriz asociada, se suele utilizar la
siguiente terminologa:
Definici
on. Consideremos una aplicacion lineal T : Rn Rm .
(1) Se denomina n
ucleo de T y se denota por ker(T ) al conjunto (subespacio)
ker(T ) = {x Rn : T (x) = 0} .
(2) Se denomina conjunto o espacio imagen de T al conjunto de vectores de Rm que tienen anti-imagen, es decir,
Imagen(T ) = T (Rn ) = {T (x) : x Rm } = {y Rm : x Rn , y = T (x)} .
Si consideramos la matriz A asociada a T , tenemos
ker(T ) = {x Rn : Ax = 0} = Nul (A)
Imagen(T ) = T (Rn ) = {Ax : x Rm } = {y Rm : x Rn , y = Ax} =
= {y Rm : Ax = y es un S.C.} = Col (A).
Ejemplo.- Consideremos el espacio nulo de la matriz

1 2 0
A= 3 0 1
1 4 1

3
1 ,
5

es decir, estamos considerando el conjunto S de los vectores x R4


ecuaciones (implcitas)
x1 + 2x2 +
3x4 =
3x1 +
x3 x4
=
x1 + 4x2 + x3 + 5x4 =

cuyas coordenadas (x1 , x2 , x3 , x4 ) verifican las

0
0
.

Haciendo operaciones fila sobre la matriz A (que se corresponden con operaciones sobre las ecuaciones del sistema)
tenemos

1 2 0 3
F3 F2
1 2 0 3
1 2 0 3
F2 + 3F1
- 0 6 1 8
- U = 0 6 1 8 .
A = 3 0 1 1
0 6 1 8
F3 + F1
0 0 0 0
1 4 1 5
82

De hecho, refiriendonos a la matriz original tenemos que F3 (A) = F2 (A) + 2F1 (A). Equivalentemente, la tercera
ecuaci
on del sistema original es combinaci
on lineal de las dos primeras con lo cual si un vector es solucion de las dos
primeras tambien lo es de la tercera. Resumiendo, tenemos que




1 2 0 3
1 2 0 3
S = Nul (A) = Nul
= Nul (U ) = Nul
3 0 1 1
0 6 1 8
con lo cual nuestro conjunto S de vectores est
a caracterizado por las ecuaciones (no redundantes)


x1 + 2x2 +
3x4 = 0
x1 + 2x2 +
3x4 = 0
o por
3x1 +
x3 + x4
= 0 .
6x2 + x3 + 8x4 = 0

Resolviendo el sistema U x = 0 tenemos

-1
0
0

2
6
0

0
1
0

Variables libres
3 0

x3 y x4 .

8 0 =
Variables fijas =
0 0
x1 y x2 .

x2 = 16 (x3 8x4 )

x1 = 2x2 + 3x4 = 26 (x3 8x4 ) + 3x4 = 31 x3 + 31 x4

x1

x2


x3 = x3
x4

Por tanto,

Nul (A) =

1
3

1
6
Gen v1 =
1

31
1
6
Col
1
0

31
3
4
61
+ x4 3
0
1
0
1

, v2 =
= Gen

1
3
34

2 1

= Col 1 4 .

6
0
0
0
3
1

1
3
68

1
6v1 =
6

, 3v2 =

Los vectores {v1 , v2 } forman una base de S = Nul (A). Los vectores de Nul (A) son los que pueden expresarse como
combinaci
on lineal de v1 y v2 y, como consecuencia de la independencia lineal, cada vector de S solo puede expresarse
de una u
nica forma como combinaci
on lineal de v1 y v2 . Los coeficientes que aparezcan en dicha combinaci
on lineal
son las coordenadas del vector de S respecto a la base {v1 , v2 } (de S). El vector v = [8 5 18 6] est
a en S y sus
coordenadas respecto a {v1 , v2 } son la solucion de
1


3
8
3


1 4 5

6
3
,

v = v1 + v2 v = v1 v2
1

18
0
0
1 6
es decir, = 18, = 6 (v = 18v1 6v2 ).

Ejemplo.- Vamos a utilizar la misma matriz A del ejemplo anterior. El espacio columna de dicha matriz es, por
definicion de espacio columna, el conjunto de vectores y que se pueden expresar como combinaci
on lineal de las
columnas de A, es decir los vectores y (con 3 coordenadas!) que se pueden expresar mediante

1
y1
2
0
3
y = y2 = 3 + 0 + 1 + 1
y3
1
4
1
5

para ciertos , , , R. Esto es lo mismo que decir que el espacio columna est
a formado por los vectores y R3
para los que el sistema de ecuaciones Ax = y tiene solucion. En dicho caso, cada solucion del sistema Ax = y nos
dara una forma de expresar y como combinaci
on lineal de las columnas de A. Obtengamos, para un vector generico
83

y R3 las condiciones de compatibilidad del sistema Ax = y, reduciendo la matriz ampliada del sistema [A|y] a forma
escalonada. Haciendo las mismas operaciones fila que hemos hecho cuando hemos obtenido el espacio nulo tenemos

F2 + 3F1
1 2 0 3
y1
1 2 0 3 y1
- 0 6 1 8 y2 + 3y1
[A|y] = 3 0 1 1 y2
F3 + F1
1 4 1 5 y3
0 6 1 8 y3 + y1
F3 F2

-1
- U = 0
0

2
6
0

0
1
0

3
y1
.
8
y2 + 3y1
0 y3 y2 2y1

Por tanto, el sistema Ax = y es compatible (determinado o indeterminado) y3 y2 2y1 = 0. Es decir, el espacio


columna de A est
a formado por los vectores y R3 cuyas coordenadas verifican la ecuaci
on (lineal homogenea)
y3 y2 2y1 = 0. Se trata, por tanto, de un plano (en R3 ) que pasa por el origen de coordenadas. Ademas, teniendo
la forma escalonada U que hemos obtenido, puesto que:
Las columnas 1 y 2 de U son linealmente independientes y
Las columnas 3 y 4 son combinaci
on lineal de las columnas 1 y 2,
lo mismo sucede con las columnas correspondientes de la matriz A con lo cual, el espacio columna de A (generado por
las 4 columnas) coincide con el espacio generado por las columnas 1 y 2 de A (no de U !). Los vectores dados por las
columnas 1 y 2 de A forman una base de Col (A) puesto que son linealmente independientes y generan dicho espacio.
Si denotamos por v1 , v2 , v3 y v4 a los vectores columna de A, cada vector y Col (A) se puede expresar de infinitas
formas distintas como combinaci
on lineal de v1 , v2 , v3 y v4 puesto que el sistema de ecuaciones Ax = y es compatible
(puesto que y Col (A)) indeterminado (puesto que hay 2 variables libres). Sin embargo, dicho vector y Col (A)
solo puede expresarse de una u
nica forma como combinaci
on lineal de v1 y v2 puesto que el sistema de ecuaciones



y1
v1 v2 = y2

y3
tendra solucion u
nica. Para discutir,
que hemos hecho del sistema Ax = y

1 2
3 0
1 4

y resolver, este sistema basta con suprimir las columnas 3 y 4 de la reduccion


con lo cual tenemos

y1
-1
2
y1
.
y2
- 0
6
y2 + 3y1
y3
0
0 y3 y2 2y1

La solucion u
nica (, ) de este sistema (compatible cuando y R3 ) nos dar
a los coeficientes para los cuales se verifica
y = v1 + v2 .

Estos coeficientes (, ) (
unicos para cada vector y Col (A)) se denominan coordenadas de y respecto de la base
{v1 , v2 }. Por ejemplo, las coordenadas del vector

1
y= 1
( Col (A) puesto que y3 y2 2y1 = 3 1 2 = 0)
3
respecto a la base {v1 , v2 } de Col (A) vienen dadas por la



1
v1 v2 = 1

3
Ejercicio resuelto
Dada la matriz

solucion del sistema


 
-1
2 1

=
=
0
6 4

0
0 0

0
1
1
1 1 3
,
A=
2 0
4
1 2
a

1
3
4
6


.

a R,

encontrar, seg
un los valores del par
ametro a, unas ecuaciones implcitas del espacio columna de A, Col(A). Para
a = 1, escribir razonadamente, si es que existe, una matriz C, 4 5, tal que Col(C) = Col(A).
84

Si llamamos vi a las columnas de A, A = [v1 |v2 |v3 ], entonces su espacio columna, Col(A) = Gen {v1 , v2 , v3 }, que
est
a contenido en R4 .
Dado un conjunto generador {v1 , v2 , v3 } de un subespacio E R4 , encontrar las ecuaciones implcitas de E es hallar
las condiciones que deben verificar las componentes de un vector de R4 , x = (x1 , x2 , x3 , x4 )T , para que pertenezca a
E, es decir, para que se pueda escribir como combinaci
on lineal del conjunto generador, x = c1 v1 + c2 v2 + c3 v3 , es
decir, para que existan esos escalares ci , o lo que es equivalente, para que el sistema
(v1 |v2 |v3 )c = x, con c = (c1 , c2 , c3 )T
sea compatible. Para exigir esto construimos la matriz ampliada (v1 |v2 |v3 |x):

0
1
1 x1
1 1 3 x2
1 1 3 x2

1
1 x1

F2 F1 0
F3 + 2F1
2 0

2 0

F
+
F
x
4 x3
4
4
1
3
1 2
a x4
1 2
a x4

x2
1 1 3
1 1

x
0
1
1
F3 2F2
1

F4 F3 0 1

x3 + 2x2 + 2x1
0
F4 F2 0 0
- 0 0
- 0 0 a 4 x4 + x2 x1
0 0

es decir, si a 6= 4 aparecen tres pivotes y el sistema es compatible cuando

x2
1 1 3

0 1
1
x1

0 2 2 x3 + 2x2
0 1 a 3 x4 + x2

x2
3

x1
1
,
a 4 x4 + x2 x1
0
x3 + 2x2 + 2x1

2x1 + 2x2 + x3 = 0
(si a 6= 4, Col(A) R4 tiene una sola ecuaci
on implcita pues al ser las tres columnas linealmente independientes,
dim(Col(A)) = 3). Sin embargo, si a = 4, solo aparecen dos pivotes (solo hay dos columnas linealmente independientes,
con lo que dim(Col(A)) = 2 y ese subespacio tendra dos ecuaciones implcitas) y, por tanto, el sistema es compatible
cuando

2x1 + 2x2 + x3 = 0,
x1 x2 x4 = 0,

que son unas ecuaciones implcitas de Col(A) cuando a = 4.


La garanta de que el resultado al que hemos llegado es correcto se tiene comprobando que todos los vectores vi
verifican todas las ecuaciones implcitas obtenidas (una en el caso a 6= 4 y dos cuando a = 4).
Nos piden despues que, para a = 1, encontremos si es posible alguna matriz C, 4 5, tal que Col(C) = Col(A).
Es decir, C = [u1 |u2 |u3 |u4 |u5 ] y como los ui R4 , entonces Col(C) R4 con lo que s puede darse Col(C) = Col(A).
(Si C no tuviera 4 filas, entonces los ui
/ R4 y no existira C tal que Col(C) = Col(A)).
Para escribir una matriz C, 4 5, cuyo espacio columna coincida con Col(A) basta con que sus cinco columnas
sean combinaci
on lineal de v1 , v2 y v3 (columnas de A) y que tres de ellas sean linealmente independientes (pues las
tres columnas de A lo son para a = 1). Por ejemplo, nos sirven las matrices siguientes (por comodidad repetimos las
tres primeras columnas de A, aunque basta con que las cinco columnas verifiquen la ecuaci
on implcita de Col(A),
2x1 + 2x2 + x3 = 0, y que haya tres linealmente independientes):

0
1
1
1
1
0
1
1
0
0
0
1
1 0 0

1 1 3 0 0 1 1 3 1
1
, 1 1 3 1 3 ,
,

2 0
2 0
4
0
4
2 0
4 2 2
4 0 0
1 2
1
2
1
1 2
1 1 1
1 2
1 0 0

0
1
1
0
0
0
1
1
0
3

1 1 3 2 3 1 1 3 1
1
, ...
,

2 0
4 2 2
4 4 0 2 0
1 2
1
27
0
1 2
1 2 6
Observemos que para las matrices B1 = [v1 |v1 |v1 |v1 |v1 ], B2 = [v1 |v2 |v1 v2 |0|2v1 3v2 ], B3 = [v2 |v2 |v3 v2 |v3 |4v2
5v3 ], se verifica Col(Bi ) Col(A) pero no se da la igualdad Col(Bi ) = Col(A) (que es lo que nos pide el enunciado; por tanto, tres columnas deben ser linealmente independientes) ya que dim(Col(B1 )) = 1, dim(Col(B2 )) =
dim(Col(B3 )) = 2, mientras que dim(Col(A)) = 3.
Ejercicio resuelto
Dada la matriz

1
B= 1
0

1 1
1
2
0 1 ,
b 1 2

b R,

encontrar, seg
un los valores del par
ametro b, un conjunto generador linealmente independiente del espacio nulo de
B, N ul(B).

85

El espacio nulo de B est


a formado por los vectores x R4 tales que Bx = 0. Nos piden que encontremos un conjunto
generador linealmente independiente (una base) de dicho espacio nulo, en funci
on del par
ametro b. Para ello basta con
resolver el sistema Bx = 0 (homogeneo, de tres ecuaciones y cuatro inc
ognitas):

1
1
0

1 1
1
2
0 1
b 1 2

1
F2 F1 0
- 0

1 1
1 1
1
3 1 2 F3 3b F2 0 3
- 0 0
b 1 2

Entonces, cuando b = 3, la matriz que representa al sistema es

1 1 1
1
0 3 1 2
0 0
0
0

1
1
.
1
2
b
b
3 1 2( 3 1)

con lo que tomando x3 , x4 como variables libres (al ser las columnas tercera y cuarta columnas no pivote) obtenemos

x1
2/3
1/3
x3 , x4 R

x2

= x3 1/3 + x4 2/3 ,
x2 = 31 (x3 + 2x4 )
x=

x
1
0

3
x1 = x2 x3 x4 = 23 x3 31 x4
0
x4
1

con lo que

2/3
1/3

2/3
1/3

N ul(B) = Gen
,
= Gen
1 0

0
1


2
1

2
1


3 , 0

0
3

y una base de N ul(B), para b = 3, es {(2, 1, 3, 0)T , (1, 2, 0, 3)T }. Conviene comprobar que estos vectores verifican
el sistema Bx = 0.
Si b 6= 3, la matriz que representa el sistema (hemos dividido la tercera fila por 3b 1 6= 0) es

1 1 1
1
0 3 1 2
0 0
1
2
con lo que, tomando x4 como variable libre (al ser la cuarta columna

1
x1
x4 R

0
x2
x3 = 2x4

x=
x3 = x4 2
x2 = 31 (x3 + 2x4 ) = 0

1
x1 = x2 x3 x4 = x4
x4

no pivote), obtenemos

N ul(B) = Gen

y una base de N ul(B), para b 6= 3, es {(1, 0, 2, 1)T }. Conviene comprobar que este vector verifica el sistema Bx = 0.
Ejercicio resuelto 

1
2
1
Dada la matriz A =
, escribir, si es posible, dos matrices cuadradas de orden 3 y dos matrices
2 4 2
3 4 cuyo espacio columna coincida con el espacio nulo de A, N ul(A).
Vamos a calcular, en primer lugar el espacio nulo de A, N ul(A), es decir vamos a encontrar los vectores x tales que
Ax = 0. Puesto que A es una matriz 2 3, para que se pueda hacer el producto Ax, debe verificarse que x R3 . As,
Ax = 0 nos proporciona las ecuaciones implcitas de N ul(A):


2
1

x1 + 2x2 + x3 = 0
N ul(A) = Gen v1 = 1 , v2 = 0 .
N ul(A)
2x1 4x2 2x3 = 0

0
1

Por tanto, una base de N ul(A) es {v1 , v2 }. Para escribir matrices 3 3 cuyo espacio columna coincida con N ul(A)
basta con que sus tres columnas sean combinaci
on lineal de v1 y v2 (o, equivalentemente, que verifiquen su ecuaci
on
implcita x1 + 2x2 + x3 = 0) y que dos sean linealmente independientes:

2 1 0
2 1 2
2 1 1
1 2 3
1
2
4
1
0 0 , 1
0
1 , 1
0
0 , 0
1
1 , 0 1 0 , ...
0
1 0
0
1
0
0
1
1
1
0
1
1 0 4
86

Observemos que para la matriz B = [v1 |v1 |v1 ] se verifica Col(B) N ul(A) pero no se da la igualdad Col(B) = N ul(A)
(que es lo que nos pide el enunciado). Por tanto, dos columnas deben ser linealmente independientes.
Si las matrices son 3 4, se aplica el mismo razonamiento sobre las cuatro columnas: todas deben ser combinaci
on
lineal de v1 y v2 y, simult
aneamente, dos deben ser linealmente independientes:

2 1 0 0
2 1 2 4
2 1 2 7
1 2 2 2
1
0 0 0 , 1
0
1
0 , 1
0 1 0 , 0
1
1
1 , ...
0
1 0 0
0
1
0
4
0
1
0
7
1
0
0
0

2.

Bases de un subespacio.

Definici
on. Dado un subespacio S de Rn distinto del subespacio nulo S 6= {0}, se dice que un conjunto de vectores
{v1 , v2 , . . . , vr }
de S es una base de S si:
(a) {v1 , v2 , . . . , vr } es linealmente independiente,
(b) {v1 , v2 , . . . , vr } genera S,

S = Gen {v1 , v2 , . . . , vr } .

Las anteriores condiciones se pueden expresar de forma matricial:


son los vectores dados

..
.
..
. ..
.

A = v1 v2 . . . vr

..
.
..
. ..
.
las columnas de A forman una base de un subespacio vectorial S si:

Si denotamos por A a la matriz cuyas columnas

(a) El sistema homogeneo Ax = 0 tiene solucion u


nica (condici
on equivalente a que los vectores sean linealmente
independientes) y
(b) S = Col (A), es decir S est
a formado por los vectores y Rm para los que el sistema de ecuaciones Ax = y es
compatible.
Ejemplo. Los vectores can
onicos de Rn ,

e1 =

forman una base de Rn . Los vectores

1
0
..
.
0

, e2 =

..

.
, . . . , en =

0
1
0
1
..
.

{e1 , e1 + e2 , , e1 + e2 + + en }
tambien forman una base de Rn .
Definici
on/Teorema. (Coordenadas respecto de una base) Dada una base {v1 , v2 , . . . , vr } de un subespacio vectorial
S, cada vector v de S se puede expresar de forma u
nica como combinaci
on lineal de los vectores de la base dada,
v = c1 v1 + c2 v2 + + cr vr .
Los coeficientes que aparecen en dicha expresion (c1 , . . . , cr ) se denominan coordenadas de v respecto a la base dada
B = {v1 , v2 , . . . , vr } y se suelen denotar por

c1

[v]B = ... .
cr

Definici
on/Teorema. Consideremos un subespacio vectorial S de Rm distinto del subespacio nulo S 6= {0}. Se
verifican:
87

(a) S tiene base.


(b) Todas las bases de S tienen el mismo n
umero de elementos.
Al n
umero de elementos de una base de S se le denomina dimensi
on de S. Por definicion, la dimensi
on del
subespacio formado por el vector nulo es cero.
Si, al igual que antes, denotamos por A a la matriz cuyas columnas son los vectores dados

..
..
..
.
.
.

A = v1 v2 . . . vr ,

..
.
..
. ..
.

para cada vector v (vector columna) de S se verifica que

v = Ac
para alg
un vector de coeficientes c.
Teorema (El Teorema de la Base). Consideremos un subespacio vectorial S de Rm de dimensi
on p (p m) y un
conjunto de vectores {u1 , . . . , uq } S.
(a) Si {u1 , . . . , uq } generan S, entonces q p. Ademas, q = p {u1 , . . . , uq } es una base de S.
(b) Si {u1 , . . . , uq } es linealmente independiente, entonces q p. Ademas, q = p {u1 , . . . , uq } es una base de S.
En particular, si tenemos un conjunto de n vectores de Rm :
Si n > m, los n vectores no pueden ser linealmente independientes,
Si m > n, los n vectores no pueden generar Rm .

3.

Rango de una matriz.

Definici
on. Dada una matriz A, m n, se llama rango de A a la dimensi
on de su espacio columna, es decir, a la
dimensi
on del subespacio vectorial (de Rm )
Col (A) = {combinaciones lineales de las columnas de A}
= {Ax : x Rn } = {y Rm : Ax = y es compatible} .
Teniendo en cuenta la relaci
on entre la dimensi
on del espacio columna de A y la reduccion de A a forma escalonada
tenemos que
rango(A) = n
umero de pivotes de A.
Para una matriz cuadrada A de orden n, teniendo en cuenta los resultados sobre la existencia de la inversa
obtenemos que:
A tiene inversa rango(A) = n.
Teorema. Consideremos una matriz A, m n. Se verifican:
(a) rango(A) = rango(AT ). Es decir, la dimensi
on del subespacio vectorial (de Rn ) generado por las m filas de A
coincide con la dimensi
on del espacio columna de A (subespacio vectorial de Rm generado por las n columnas
de A):

dim (Col (A)) = dim Col (AT ) .
Es decir, si por un lado reducimos la matriz A a forma escalonada por filas (mediante operaciones fila) y por
otro reducimos a forma escalonada por columnas (mediante operaciones columna), el n
umero de pivotes que se
tienen en ambas reducciones es el mismo.
88

(b) Teorema del rango.


dim (Col (A)) + dim (Nul (A)) = n.
(c) En terminos de la reduccion por filas de A a forma escalonada, el Teorema del rango se puede expresar mediante:
(n
umero de pivotes) + (n
umero de variables libres) = n.
Si consideramos la transformaci
on lineal T : Rn Rm , asociada a una matriz real A, m n, el espacio imagen
de la transformaci
on es el espacio columna de la matriz A,
Imagen(T ) = T (Rn ) = {T (x) Rm : x Rn } =
= {y Rm : y = T (x) para alg
un x Rn } = Col (A).
Se trata, por tanto, de un subespacio vectorial de Rm cuya dimensi
on es rango(A).
La imagen, mediante T , de cualquier subespacio vectorial S de Rn sera un subespacio vectorial T (S) de Rm
contenido en el espacio imagen (columna) y por tanto la dimensi
on de dicho subespacio T (S) sera menor o igual que
el rango de A (y menor o igual que la dimensi
on del subespacio S original).
Por otra parte, si consideramos un subespacio vectorial H de Rm , el conjunto de los vectores x Rn cuyos
transformados T (x) = Ax pertenecen a H forman un subespacio vectorial de Rn . En particular, si H es el subespacio
nulo de Rm , es decir, H = {0} Rm entonces, obtenemos el n
ucleo de la transformaci
on T o lo que es lo mismo, el
espacio nulo de A,
ker(T ) = {x Rn : T (x) = 0} = {x Rn : Ax = 0} = Nul (A).
Ejercicio resuelto
Considera la transformaci
on lineal

T 2 =

T que verifica

1
1

1
, T 1 =

1
0
2

0
3
,
0
3

1
1
4

T 0 =
1 .
1
5

(a) Calcula la matriz A tal que T (x) = Ax para todo x R3 .


(b) Calcula unas ecuaciones implcitas del espacio columna de A.
(c) Calcula un conjunto linealmente independiente de vectores S que genere el subespacio nulo de A.
(a) La aplicacion lineal T : R3 R4 tiene asociada, respecto de las bases canonicas, la matriz A en cuyas columnas
aparecen los transformados de la base can
onica del espacio de partida, es decir, A = [T (e1 )|T (e2 )|T (e3 )].
Una posibilidad es plantear el sistema de ecuaciones vectoriales, donde, por comodidad llamamos a = (1, 1, 1, 2)T ,
b = (0, 3, 0, 3)T , c = (1, 4, 1, 5)T ,

T ([1, 2, 0]T ) = T (e1 + 2e2 ) = T (e1 ) + 2T (e2 ) = a


T (e2 ) = a b = (1, 2, 1, 1)T

T ([1, 1, 0]T ) = T (e1 + e2 ) = T (e1 ) + T (e2 ) = b


T (e1 ) = b T (e2 ) = (1, 5, 1, 4)T

T ([1, 0, 1]T ) = T (e1 + e3 ) = T (e1 ) + T (e3 ) = c


T (e3 ) = c T (e1 ) = (2, 1, 2, 1)T
que en este caso se resuelve trivialmente (en general, lo resolveremos
Por tanto,

1
5
A = [T (e1 )|T (e2 )|T (e3 )] =
1
4

mediante eliminacion de Gauss).

1
2
2
1
.
1 2
1 1

Antes de seguir, podemos asegurarnos de que la matriz encontrada es la correcta comprobando que
A[1, 2, 0]T = (1, 1, 1, 2)T , A[1, 1, 0]T = (0, 3, 0, 3)T A[1, 0, 1]T = (1, 4, 1, 5)T .
Otra forma de encontrar A es escribir


1
1
1
1


A 2 =
1 , A 1 =
0
0
2

matricialmente las igualdades que nos

0
1
1
1

3
0 = 4 A 2
,
A
1
0
1
0
3
5
89

dan:
1
1
0

1
0
1
1
1 3 4
0 =
1 0 1
1
2
3
5

de donde deducimos

1
0
1
1 3 4 1

A=
1 0 1 2
0
2
3
5
La matriz inversa

1
2
0

(b) Puesto que

1 1
1 0
0 1

1
0
1
1 3 4 1
2
=
1 0 1
0
2
3
5

1 1
2
1
1
5 2
1

1 2 =
1 1 2 .
0
1
4 1 1

que aparece la hemos calculado aplicando el metodo de GaussJordan:

1 1
1
1 1 0 1 0 1
1 0 0
1 1 1 0 0
1 0 0 1 0 0 1 2 2 1 0 0 1 0 2 1 2
0 1 0 0 1
0 0
1
0 0 1
0 0 1 0 0 1

1 0 0 1 1
1
1 0 0 1 1 1
0 1 0 2 1 2 0 1 0 2 1 2 .
0 0 1 0 0 1
0 0 1 0
0
1


1
1

2
5

Col(A) = Gen
1 , 1

4
1

1
,
,
2

dado un conjunto generador {v1 , v2 , v3 } del subespacio Col(A) R4 , encontrar las ecuaciones implcitas de Col(A) es
hallar las condiciones que deben verificar las componentes de un vector de R4 , x = (x1 , x2 , x3 , x4 )T , para que pertenezca
a Col(A), es decir, para que se pueda escribir como combinaci
on lineal del conjunto generador x = c1 v1 + c2 v2 + c3 v3 ,
es decir, para que existan esos escalares ci , o lo que es equivalente, para que el sistema
(v1 |v2 |v3 )c = x, con c = (c1 , c2 , c3 )T
sea compatible. Para exigir esto construimos la matriz ampliada (v1 |v2 |v3 |x):



1 1
2 x1
1 1
2
1 1
2
x1
x1
5 2
0 3 9 x2 5x1 0 3 9
x
x

5x1
1
2
2

1 1 2 x3 0
x3 + x1 0
x3 + x1
0
0
0
0
4 1 1 x4
0
3
9 x4 + 4x1
0
0
0 x4 x1 + x2
es decir, las coordenadas de los vectores que pertenezcan a Col(A) deben verificar
x1 + x3 = 0,

x1 x2 x4 = 0.

Merece la pena emplear unos segundos, para estar seguros de que el resultado obtenido es correcto, en comprobar que
los tres vectores que generan el espacio columna verifican todas (dos en nuestro caso) las ecuaciones obtenidas.
Observemos que dim(Col(A)) = 2 (pues la tercera columna de A es combinaci
on lineal de las dos primeras) y al
estar ese subespacio en R4 lo definen dos ecuaciones implcitas.
(c) El espacio nulo de A est
a formado por los vectores x R3 tales que Ax = 0. Al aplicar el metodo de eliminacion
para resolverlo vamos a obtener el mismo resultado (en las tres primeras columnas) que el conseguido al buscar las
ecuaciones implcitas en el apartado anterior:

1 1
2
1 1
2
1 1
2


5 2
x1 = x2 + 2x3 = 3x3 + 2x3 = x3 ,
1
0 3 9 0 3 9

1 1 2 0
0
0
0
0 0
x2 = 3x3 ,
0
0
0
0
3
9
4 1 1

1
con lo que N ul(A) = Gen {v = (1, 3, 1)T }, es decir, S = 3 . Es facil comprobar que v verifica Av = 0,

1
es decir, que pertenece a N ul(A). Ademas, sabiendo que, en nuestro caso, T est
a definida en R3 , la igualdad
dim(Col(A)) + dim(N ul(A)) = 3
nos permita saber, antes de comenzar este apartado, que
dim(N ul(A)) = 3 dim(Col(A)) = 3 2 = 1.

90

4.
4.1.

Bases de Rn . Cambios de base.


Bases de Rn .

Todas las bases de Rn est


an formadas por n vectores. Puesto que en ese caso tendremos n vectores linealmente
independientes con n coordenadas cada uno, la matriz cuadrada formada por dichos vectores como vectores columna
tiene inversa (y los vectores columna de dicha matriz inversa formaran otra base de Rn ). Por otra parte, tambien los
vectores fila de las dos matrices citadas seran una base de Rn . Para comprobar si n vectores forman una base de Rn
bastara con reducir a forma escalonada la matriz formada por dichos vectores como vectores columna y comprobar si
se obtienen n pivotes. Notemos que, el orden de los vectores no influye en si estos forman base o no.
Ejemplo. Siendo e1 , e2 , . . . , en los vectores de la base canonica de Rn , los vectores
e1 , e1 + e2 , e1 + e2 + e3 , . . . , e1 + e2 + + en
forman una base de Rn y para calcular las coordenadas
resolver el sistema (con termino independiente x)

1 1 1
0 1 1

.. .. . .
.
. .
. ..
0 0

Resolvemos el sistema

1
0
..
.
0

1 1 x1
1 1 x2
..
.. . .
.
. ..
.
.
0 1 xn

de un vector generico x Rn respecto de esta base basta con

1
2
..
.

1 0
0 1
.. ..
. .
0 0
0 0

xn

0
0
..
.

0
x1 x2
x2 x3
0
..
..
..
. .
.
1 0 xn1 xn
xn
0 1

Por tanto, las coordenadas de x respecto a la base dada son


1
x1 x2
2 x2 x3


..
..
. =
.


n1 xn1 xn
n
xn

4.2.

x1
x2
..
.

Cambios de base.

Dada una base B = {v1 , v2 , . . . , vn } de Rn , las coordenadas


coeficientes (
unicos) 1 , 2 , . . . , n para los cuales se verifica

..
..
.
.

1 v1 + 2 v2 + + n vn = x v1 v2

..
..
.
.

Dadas dos bases

con x =

x1
x2
..
.
xn

de un vector x Rn respecto a dicha base son los


.
..
..
. vn
.
..

1
2
..
.
n

=x=

x1
x2
..
.
xn

las coordenadas de x respecto de la base canonica.

U = {u1 , u2 , . . . , un }

B = {v1 , v2 , . . . , vn }

de Rn se trata de hallar la relaci


on entre las coordenadas de un vector x Rn respecto de ambas bases. Hallemos
primero, la relacion entre las coordenadas del vector x en la base U y la base canonica C. Las coordenadas de un vector
91

x Rn respecto a U vienen dadas por un vector [x]U que verifica que

1
x1
2
x2

x = . , [x]U = . x = 1 u1 + 2 u2 + + n un
..
..
xn

La matriz

..
.

u1

..
.

..
.

= u1

..
.

x1
x2
..
.
xn
..
.

.
..
..
. un
.
..

u2
..
.

..
.

u2
..
.

.
..
..
. un
.
..

1
2
..
.
n

()

que relaciona las coordenadas de un mismo vector x respecto a la base canonica con las coordenadas del mismo vector
x respecto a la base U se denomina matriz del cambio de base U C de U a la base canonica C = {e1 , e2 , . . . , en }
y se denota por

..
..
..
. .
.
P

P
= u1 u2 . . . un ,
[x]U
x = [x]C =
CU

CU
..
..
..
.
. .

Puesto que la igualdad () es equivalente a

1

..
..
..
x1
1
.
.
.


1
2
x2
P



[x]C
.. = u1 u2 . . . un .. [x]U =
CU
.
.
..
..
.
xn
n
.
. ..

1
P
la matriz
es la matriz del cambio de base C U con lo cual
CU

1
P
P
=
.
U C
CU
De forma analoga, si consideramos ahora las bases de Rn ,
B = {v1 , v2 , . . . , vn }

U = {u1 , u2 , . . . , un }

podramos obtener las matrices de cambio de base B U y U B de la misma forma que lo que acabamos de
hacer si conocieramos las coordenadas de los vectores de una base respecto a la otra. Si, en cambio, conocemos las
coordenadas de los vectores de ambas bases respecto, por ejemplo, a la base canonica, tenemos un planteamiento
similar.
Denotemos las coordenadas de un vector generico x Rn respecto de ambas bases B y U mediante

1
1

[x]B = ... , [x]U = ... .


n

Tenemos entonces que x = 1 v1 + + n vn = 1 u1 + + n un y expresando estas igualdades en forma matricial


tenemos que



x1
1
1
..
..
..

x = . = v1 v2 vn . = u1 u2 un .
x3
n
n

es decir, siendo B la matriz cuyas columnas son los vectores de la base B en la base canonica y siendo U la matriz
cuyas columnas son los vectores de la base U en la base canonica, se verifica que
x = B[x]B = U [x]U .
92

Por tanto,
[x]B = B 1 U [x]U =

P
= B 1 U,
BU

[x]U = U 1 B[x]B =

P
= U 1 B.
U B

Ejemplos.
(1) Vamos a calcular las matrices de cambio de base entre la base canonica de R3 y la base
o
n
T
T
T
B = v1 = [2 1 0] , v2 = [1 2 3] , v3 = [1 0 1] .

Siendo las coordenadas de un vector generico x R3 respecto a B y respecto a la base canonica

1
x1
[x]B = 2 ,
x = x2 ,
3
x3

respectivamente, se verifica que

x = 1 v1 + 2 v2 + 3 v3
Por tanto, la matriz

P = v1

v2


x1
x2 = v1
x3

v2

1
v3 2 .
3

2 1 1
v3 = 1 2 0
0
3 1

(cuyas columnas son las coordenadas de los vectores de la base B respecto a la base C es la matriz
cambio de base B C puesto que
Puesto que la inversa P 1 verifica

x = [x]C = P [x]B ,
[x]B = P 1 [x]C ,

P
del
CB

x R3 .
x R3

dicha matriz es la del cambio de base C B. Resumiendo,

2 1 1
2 2
1
P
P
= P = 1 2 0 ,
= P 1 = 1 2
6
CB
0
3 1
BC
3 6

2
1 .
3

(2) Calculemos las matrices de cambio de base entre las bases

2
1
1

B = v1 = 1 , v2 = 2 , v3 = 0
y

0
3
1

1
1
1

U = u1 = 2 , u2 = 2 , u3 = 3 .

1
2
2

Denotemos las coordenadas de un vector generico x R3 respecto de ambas bases B y U mediante

1
1
[x]B = 2 , [x]U = 2 .
3
3

Tenemos entonces que x = 1 v1 + 2 v2 + 3 v3 = 1 u1 + 2 u2 + 3 u3 . Escribiendo estas igualdades en forma


matricial

2 1 1
x1
1 1 1
1
1
x2 = 1 2 0 2 = 2 2 3 2
x3
0
3 1
3
1 2
2
3
93

obtenemos


1
1
1 1
2 1 1
2 = 1 2 0 2 2
1 2
0
3 1
3

y, por tanto,

1
2 1 1
1 1
1 2 0 2 2
0
3 1
1 2

P
=
BU

12
3 .
21

4
2
1
4
7
6
18 9

Analogamente podramos obtener

P
P
=
U B
BU
Ejercicio resuelto

1
1
3 2
2
3

2 2 2
1
1
3 = 16 1 2 1 2
3 6
3
1
2

1 1
2 3
2
2

20 25 15
1
5
22
6 .
=
15
15 12
6



 


 

5
2
3
4
Dadas las bases de R , B1 =
,
y B2 =
,
, encontrar, con la ayuda
2
1
1
1
de la matriz correspondiente, las coordenadas en la base B2 del vector v cuyas coordenadas en la base B1 son
[v]B1 = (2, 1)B1 .
2

Sabemos que dada una base de R2 , B1 = {v1 , v2 }, la matriz PB1 = [v1 |v2 ] relaciona las coordenadas que un vector v
tiene en la base can
onica, [v]BC , y las que tiene en la base B1 , [v]B1 , de forma que
[v]BC = PB1 [v]B1 .
Analogamente, dada una base B2 = {u1 , u2 }, la matriz PB2 = [u1 |u2 ] relaciona las coordenadas que un vector v tiene
en la base canonica, [v]BC , y las que tiene en la base B2 , [v]B2 , de forma que
[v]BC = PB2 [v]B2 .
Combinando ambas expresiones obtenemos
PB1 [v]B1 = PB2 [v]B2

PB1 [v]B1 = PB2 B1 [v]B1 ,


[v]B2 = PB1
2
1
[v]B1 = PB1 PB2 [v]B2 = PB1 B2 [v]B2 .

PB1 [v]B1 . Puesto que


Como el enunciado nos da [v]B1 , usaremos [v]B2 = PB1
2
PB1 =

5
2

2
1

, PB2 =

3 4
1
1

PB1
PB1
2

1
4
1 3



5
2

2
1

3 2
1 1


 

3 2
2
4
=
.
1 1
1
1
Es facil comprobar que el resultado es correcto. Teniendo en cuenta las coordenadas obtenidas en ambas bases
v = 2v1 + v2 = 4u1 u2 con lo que debe ser cierto

 


 

5
2
3
4
2
+
=4

.
2
1
1
1

obtenemos [v]B2 = PB1


PB1 [v]B1 =
2

De aqu deducimos ademas (sin mas que sumar los vectores) que, en la base canonica, v = (8, 3)T .
Ejercicio resuelto
Consideremos una transformaci
on lineal f : R3 R3 .
Hallar la matriz A que representa a f cuando se trabaja con la base canonica B = {e1 , e2 , e3 }, sabiendo que A es
simetrica, que f (e1 ) = e2 + e3 , f (e1 + e2 + e3 ) = 2(e1 + e2 + e3 ) y que f (e2 ) pertenece al subespacio E de ecuaci
on
x z = 0.

94

La aplicacion lineal dada f : R3 R3 tiene asociada, respecto de las bases canonicas, la matriz A
aparecen los transformados de la base can
onica del espacio de partida, es decir,

a1 b 1 c1
A = [f (e1 )|f (e2 )|f (e3 )] = a2 b2 c2 .
a3 b 3 c3

a1 a2
Al ser A simetrica, AT = A, debe ser b1 = a2 , c1 = a3 y c2 = b3 , con lo que A = a2 b2
a3 b 3
f (e1 ) = Ae1 = e2 + e3 = (0, 1, 1)T la matriz A sera

0 1 1
A = 1 b2 b3 .
1 b 3 c3
Puesto que f (e2 ) pertenece al subespacio E de ecuaci
on x z
verificar dicha ecuaci
on, es decir, 1 b3 = 0, con lo que b3 = 1

0 1
A = 1 b2
1 1

en cuyas columnas

a3
b3 . Puesto que
c3

= 0, los elementos de la segunda columna de A deben


y tenemos

1
1 .
c3

Finalmente, usando f (e1 + e2 + e3 ) = f (e1 ) + f (e2 ) + f (e3 ) = (2, 2, 2)T , obtenemos que la tercera columna de A debe
verificar
f (e3 ) = (2, 2, 2)T f (e1 ) f (e2 ) = (2, 2, 2)T (0, 1, 1)T (1, b2 , 1)T = (1, 1 b2 , 0)T .
Por tanto, debe ser (1, 1, c3 )T = (1, 1 b2 , 0)T , con lo que

0
A= 1
1

b2 = 0, c3 = 0, y la matriz pedida es

1 1
0 1 .
1 0

Es recomendable emplear un minuto en comprobar que la matriz calculada satisface todas las condiciones del enunciado,
es decir, que no nos hemos equivocado al calcularla.

5.

Ejercicios.

Ejercicio 1. Determinar si los siguientes conjuntos son subespacios vectoriales de R2 y R3 , respectivamente:





x
2
(a) H =
R : x 0, y 0 .
y

(b) H = y R3 : x + y = 0 .

z
Ejercicio 2. Sea E el conjunto de vectores de R4 cuyas dos primeras coordenadas suman cero.
(a) Probar que E es un subespacio vectorial de R4 .
(b) Calcular un sistema generador linealmente independiente para dicho subespacio.
(c) Hallar unas ecuaciones implcitas del subespacio E.

Ejercicio 3. Probar que el espacio nulo y columna de una matriz A de orden m n son subespacios vectoriales de
Rn y Rm respectivamente.

Ejercicio 4. Dados la matriz A y el vector b por

1
A= 1
0

2
3
1 , b = 2 .
2
2
95

(a) Determinar si el vector b pertenece al espacio columna de la matriz A.


(b) Obtener los vectores pertenecientes al espacio nulo de la matriz A.

Ejercicio 5. Sean las matrices A, B y

1
1
A=
1
1

el vector b dados por

0 1 1
1
1 2 0
, B = 0
0 1 1
1
1 2 0

3
1 0
0

1 2 , b =
1 .
1 3
0

(a) Determinar unas ecuaciones implcitas y parametricas del espacio columna de las matrices A y B.
(b) Determinar unas ecuaciones implcitas linealmente independientes y unas ecuaciones parametricas del espacio
nulo de A y B.
(c) Hallar un sistema generador linealmente independiente para el espacio nulo y columna de dichas matrices.
(d) Razonar si el vector b pertenece al espacio nulo de la matriz A. Y al espacio nulo de la matriz B?
Ejercicio 6. (a) Determinar el rango de

0
0
A=
0
0

las siguientes matrices:

1
1 1 2
0
3
2 1
2 2
, B =
2
1 1 2
0
0
0 1 2 3

1
2
1
1

1 2
3
2
.
2
2
0 2

(b) Sea A una matriz 20 15 cuyo rango es 12. Determinar la dimensi


on de los siguientes subespacios vectoriales,
Col (A), Nul (A), Col (AT ) y Nul (AT ).

Ejercicio 7. Siendo e1 , e2 , e3 los vectores de la base canonica de R3 y sabiendo que los vectores de la base B verifican
e1 = 2u1 + 2u2 + u3 , e2 = u1 2u2 + 2u3 , e3 = 2u1 + u2 + 2u3 , se
nalar la relacion correcta entre las siguientes
(considerando a los vectores como vectores-columna)

2
2 1
(a) [e1 e2 e3 ] = 1 2 2 [u1 u2 u3 ] .
2 1 2

2
2 1
2 1 2
(b) [u1 u2 u3 ] = 1 2 2 = 19 2 2 1 .
2 1 2
1 2
2

2 1 2
2
2 1
(c) [u1 u2 u3 ] = 2 2 1 = 19 1 2 2 .
1 2
2
2 1 2
Ejercicio 8. Consideremos la base B = {(2, 1)T , (3, 1)T } de R2 . R4 :
(a) Obtener, en dicha base, las ecuaciones implcitas y las parametricas de los subespacios que, en la base canonica,
vienen definidos mediante
E x1 + x2 = 0, F x1 2x2 = 0, G = Gen {(1, 1)T }, H = Gen {(3, 1)T }.
(b) Obtener, en la base can
onica, las ecuaciones implcitas y las parametricas de los subespacios que, en la base B,
vienen definidos mediante
E y1 + 5y2 = 0, F y2 = 0, G = Gen {(1, 0)TB }, H = Gen {(2, 4)TB }.

96

Tema 5.- Ortogonalidad. Mnimos cuadrados


1.
2.
3.
4.
5.
6.
7.
8.

Producto escalar. Norma, distancia,


angulos y ortogonalidad.
El complemento ortogonal de un subespacio.
Bases ortonormales de un subespacio. Matrices ortogonales.
Proyeccion ortogonal sobre un subespacio. El teorema de la mejor aproximacion.
El metodo de Gram-Schmidt.
Problemas de mnimos cuadrados. Ecuaciones normales de Gauss.
Ajuste de curvas, regresion lineal.
Ejercicios.

En este tema estudiamos la estructura metrica de los espacios Rn , es decir, las cuestiones relacionadas con distancias
y
angulos. Al contrario de lo que sucede con el estudio de la resolucion de sistemas de ecuaciones lineales, el algebra de
matrices, etc., el hecho de considerar aqu vectores reales es esencial. Para poder considerar conceptos metricos en Cn ,
es decir, con vectores de coordenadas complejas, habra que considerar la definicion apropiada (coherente) de producto
escalar de vectores complejos, que se suele denominar producto hermtico. Al aplicar dicha definicion a vectores reales
nos dara la definicion usual que vemos a continuacion y que los alumnos conocen en dimensi
on 2 y en dimensi
on 3.
Finalmente, estudiaremos el problema del ajuste por mnimos cuadrados, de gran interes en las aplicaciones.

1.

Producto escalar. Norma, distancia,


angulos y ortogonalidad.

Definici
on. (Producto escalar, norma, ortogonalidad) Consideremos dos vectores x, y Rn
Se denomina Producto escalar de dos vectores x, y Rn al n
umero real
x y = xT y = y T x = x1 y1 + x2 y2 + + xn yn R.
Se denomina Norma de un vector x Rn al n
umero real no-negativo
q

2
2
||x|| = |x1 | + + |xn | = x x 0.

Se denomina Distancia entre dos vectores x, y Rn al n


umero real no-negativo
d(x, y) = ||x y|| .
Ortogonalidad
(a) Se dice que dos vectores x, y Rn son ortogonales (x y) si
x y = 0.
(b) Se dice que un conjunto de vectores {v1 , . . . , vm } de Rn es un conjunto ortogonal si cada uno de los
vectores vk es ortogonal a todos los dem
as,
vk vj = 0, j 6= k.
(c) Se dice que un conjunto de vectores {v1 , . . . , vm } de Rn es un conjunto ortonormal si es un conjunto
ortogonal y cada uno de los vectores vk tiene norma igual a 1,
vk vj = 0, j 6= k;

||v1 || = = ||vm || = 1.

Las propiedades del producto escalar, la norma, la distancia y la ortogonalidad son conocidas por el alumno
para vectores en R2 y en R3 . En los espacios Rn , las propiedades son esencialmente las mismas. Notemos que si
consider
asemos dichos conceptos de forma independiente de un sistema de referencia, en cada uno de ellos aparecen
involucrados uno o dos vectores. Algunas de las propiedades del producto escalar pueden obtenerse directamente
del hecho de que el producto escalar de dos vectores puede expresarse como un producto matricial, vector-fila por
vector-columna

y1
x1

x y = [x1 , x2 , . . . , xn ] ... = xT y = y T x = [y1 , y2 , . . . , yn ] ... = y x.


yn

xn

97

Propiedades. Sean x, y Rn , R.
(1) ||x|| = 0 x = 0.
(2) ||x|| = || ||x||.
(3) Desigualdad triangular: ||x + y|| ||x|| + ||y|| , (||x y|| ||x|| + ||y||).
(1) Desigualdad de Cauchy-Schwartz: |x y| ||x|| ||y||.
(4) Teorema de Pit
agoras:
2

x y ||x + y|| = ||x|| + ||y|| .


El angulo (los angulos) determinado por dos vectores no-nulos x, y Rn puede caracterizarse (definirse) mediante
la igualdad
x y = ||x|| ||y|| cos().

2.

El complemento ortogonal de un subespacio.

Definici
on. (El complemento ortogonal de un subespacio) Dado un subespacio vectorial S de Rn se denomina complemento ortogonal de S al conjunto
S = {v Rn : v u , u S} .
Es decir, S est
a formado por todos losnvectores
que son ortogonales a todos los vectores de S. Por tanto, el como
n
~
plemento ortogonal del subespacio nulo 0 es R puesto que cualquier vector es ortogonal al vector nulo. Por otra
parte, el complemento ortogonal del espacio total Rn es el subespacio nulo, puesto que el vector nulo (de Rn ) es el
u
nico que es ortogonal a todos los vectores de Rn .

Ejemplos. A la hora de trabajar con el complemento ortogonal de un subespacio es conveniente tener presente c
omo se
puede caracterizar, el complemento ortogonal de un subespacio, cuando el subespacio viene dado en forma parametrica
o cuando viene dado en forma implcita. En R2 , un subespacio vectorial de dimensi
on 1 es una recta que pasa por el
origen y su complemento ortogonal sera (como es natural) la recta que pasa por el origen (es un subespacio vectorial)
y es perpendicular a la recta dada. En R3 , un subespacio vectorial de dimensi
on 1 es una recta que pasa por el origen.
Su complemento ortogonal sera el plano que pasa por el origen (es un subespacio vectorial) y es perpendicular a la
recta dada. Un subespacio vectorial de dimensi
on 2 es un plano que pasa por el origen. Su complemento ortogonal
sera la recta que pasa por el origen (es un subespacio vectorial) y es perpendicular al plano dado.
(1) Consideremos un subespacio de dimensi
on 1 en R2 , dado en forma parametrica, es decir, una recta que pasa por
el origen de coordenadas, dada por un vector direcci
on v1 . Por ejemplo, para v1 = [2, 1]T

x1 = 2
S = Gen {v1 } = {v1 : R}
,
x2 =
T

su complemento ortogonal estar


a formado por los vectores v = [x1 , x2 ] R2 que son ortogonales a todos los
vectores de la forma v1 , R
v S (v1 ) v = 0, R v1 v = 0 2x1 x2 = 0.
T

Es decir, el complemento ortogonal S est


a formado por todos los vectores v = [x1 , x2 ] R2 cuyas coordenadas
verifican la ecuaci
on
2x1 x2 = 0,

con lo cual S es un subespacio vectorial (de dimensi


on 1) que viene dado en forma implcita y los coeficientes
de la ecuaci
on implcita son las coordenadas del vector direcci
on de S. Si hubieramos considerado otro vector
direcci
on de S (que sera un m
ultiplo no-nulo de v1 ), habramos obtenido una ecuaci
on equivalente.

(2) Si consideramos un subespacio vectorial S de dimensi


on 1 en Rn , es decir una recta que pasa por el origen,
n
generada por un vector no-nulo v1 R

a1

S = Gen v1 = ... ,

an
98

su complemento ortogonal estar


a formado por los vectores v = [x1 , . . . , xn ] Rn cuyas coordenadas verifican
la ecuaci
on
v1 v = 0 a1 x1 + + an xn = 0,

con lo cual S es un subespacio vectorial (de dimensi


on n 1) que viene dado mediante una ecuaci
on implcita
y los coeficientes de dicha ecuaci
on son las coordenadas del vector direcci
on de S.
Teorema. Dado un subespacio vectorial S de Rn se verifica:
(1) S es un subespacio vectorial de Rn .

(2) S = S.

(3) Se verifica la siguiente relaci


on entre S y S .
Por tanto, todo vector v de Rn se puede expresar de forma u
nica como suma
(a) S S = {0}.
de un vector de S y un vector de S . (Esto sera consecuencia del teorema de
(b) S + S = Rn .
la proyeccion ortogonal que veremos mas adelante).
(5) Si S = Gen {v1 , . . . , vp }, entonces

v S v v1 , . . . , v vp .

Ejemplo. Antes hemos obtenido el complemento ortogonal de un subespacio de Rn de dimensi


on 1, que era un
subespacio vectorial de dimensi
on n1 (estos subespacios se suelen denominar hiperplanos). Las propiedades anteriores
permiten obtener facilmente el complemento ortogonal de un subespacio, de dimensi
on n 1, cuya ecuaci
on implcita
es
W a1 x1 + + an xn = 0.
Como hemos visto antes,
W = S ,

tenemos que W = S

siendo S = Gen

a1

.. ,

an

= S. Es decir, de manera inmediata obtenemos, W , en forma parametrica.

El hecho de expresar el complemento ortogonal de una u otra forma parametrica/implcita dependiendo de como
venga expresado el subespacio vectorial:
S en forma parametrica
S en forma implcita

S en forma implcita
S en forma parametrica

queda reflejado con el siguiente Teorema.


Teorema. (Los cuatro subespacios asociados a una matriz) Sea A una matriz real m n. Se verifica:
[Col (A)] = Nul (AT ),

[Nul (A)] = Col (AT )

El espacio Col (AT ) se suele denominar espacio fila de la matriz A.

Notemos que en lo que se refiere a las dimensiones de los complementos ortogonales tenemos




dim [Col (A)]


= dim Nul (AT ) = m pivotes de AT = m rango (A) = m dim (Col (A)) .

Puesto que cualquier subespacio vectorial se puede expresar como el espacio columna de una matriz tenemos que para
cualquier subespacio vectorial S de Rm , se verifica

dim S = m dim (S).

99

3.

Bases ortonormales de un subespacio. Matrices ortogonales.

Proposici
on. Si {u1 , u2 , . . . , ur } es un conjunto de vectores no-nulos ortogonales dos a dos, entonces son linealmente
independientes.
Demostraci
on.- Si tenemos una combinaci
on lineal de los vectores dados igual al vector nulo
1 u1 + 2 u2 + + p up = ~0

()

al multiplicar escalarmente por el vector u1 tenemos


(1 u1 + 2 u2 + + p up ) u1 = ~0 u1 = 0.
Desarrollando el primer miembro de la igualdad

usando la
on de =
1 u1 u1 + 2 u2 u1 + + p up u1 = condici
ortogonalidad

= 1 ||u1 ||2 + 2 0 + + p 0 = 0

puesto
que u1 6= 0

= 1 = 0.

De manera an
aloga, al multiplicar escalarmente la igualdad () por un vector
uk , k = 1, 2, . . . , p,
se obtiene
1 0 + 2 0 + + k ||uk ||2 + + n 0 = 0

puesto
que uk 6= 0

k = 0.

Por tanto, la u
nica combinaci
on lineal que es igual al vector nulo es la combinaci
on lineal identicamente nula (todos los
coeficientes son nulos). Es decir, los vectores dados son linealmente independientes.
2

Proposici
on. Sea {u1 , u2 , . . . , ur } una base ortogonal de un subespacio S de Rn . Entonces:
u uk
Las coordenadas de un vector u S respecto de dicha base vienen dadas por
2 , es decir, se verifica que
||uk ||
u=

u u1

||u1 ||

2 u1

+ +

u ur

||ur ||

2 ur .

La expresion anterior se suele denominar desarrollo de Fourier de v respecto a la base {u1 , u2 , . . . , ur }.


Antes de pasar a estudiar la proyeccion ortogonal de un vector sobre un subespacio, vamos a considerar las
propiedades de las matrices cuyas columnas son ortonormales. En particular, vamos a considerar las matrices cuadradas
cuyas columnas son ortonormales. Cuando se tiene un conjunto ortogonal de vectores no-nulos y se normalizan (se
divide cada uno por su norma), obtenemos un conjunto ortonormal de vectores que formaran una base ortonormal del
subespacio vectorial que generan. En terminos de computacion numerica, las matrices cuyas columnas son ortonormales
juegan un papel importante por ser matrices que transmiten los errores de redondeo de manera controlada.
Proposici
on. Sea U = [u1 , . . . , un ] una matriz real m n.
(1) U tiene columnas ortonormales U T U = I.
(2) Si U tiene columnas ortonormales, la transformaci
on lineal asociada
U : x Rn y = U x Rm
conserva angulos y distancias, es decir
(a) ||U x|| = ||x|| ,

x Rn .

(b) (U x) (U y) = x y,

(c) U x U y x y.

x, y Rn y en particular,

Un caso particularmente importante lo constituyen las matrices cuadradas con columnas ortonormales.
Definici
on. (Matriz ortogonal) Se denomina matriz ortogonal a toda matriz Q real cuadrada no-singular cuya
inversa coincide con su traspuesta, Q1 = QT .

100

Proposici
on. Se verifica:
(1) Si Q es ortogonal = det(Q) = 1.
(2) Q es ortogonal QT es ortogonal.
(3) Si Q1 y Q2 son ortogonales, entonces Q1 Q2 es ortogonal.
Proposici
on. Sea Q una matriz real cuadrada n n. Son equivalentes:
(1) Q es una matriz ortogonal.
(2) Las n columnas de Q son ortonormales (y por tanto forman una base ortonormal de Rn ).
(3) Las n filas de Q son ortonormales (y por tanto forman una base ortonormal de Rn ).

4.

Proyecci
on ortogonal sobre un subespacio. El teorema de la mejor
aproximaci
on.

Si consideramos el subespacio vectorial S, de dimensi


on uno (una recta), generado por un vector, u1 , no-nulo,
S = Gen {u1 }, la proyeccion ortogonal de un vector v Rn sobre S sera el vector u = u1 S que verifica que
v u = v u1
es ortogonal a S, es decir, tenemos que determinar con la condicion que v u1 sea ortogonal a u1 ,
2

(v u1 ) u1 = v u1 ||u1 || = 0 =

vu1
||u1 ||2

= u = proy S (v) =

vu1
u .
||u1 ||2 1

Para un subespacio de dimensi


on arbitraria puede darse una expresion de la proyeccion ortogonal de un vector sobre
dicho subespacio cuando disponemos de una base ortogonal de dicho subespacio. Considerando una base ortonormal
puede darse una expresion c
omoda de la matriz de la proyeccion ortogonal.
Teorema (de la descomposici
on ortogonal). Sea S un subespacio vectorial de Rn . Dado cualquier vector v
n
R existe un u
nico vector u S (llamado proyeccion ortogonal de v sobre S) tal que v u S . De hecho, si
{u1 , u2 , . . . , ur } es una base ortogonal de S, entonces la proyeccion ortogonal de v sobre S es
v u1

u := proy S (v) =

||u1 ||

2 u1

v ur

+ +

||ur ||

2 ur ,

y la proyeccion ortogonal de v sobre S es


w = v u.
Notemos que:
Cada sumando de la expresion

v u1

||u1 ||

2 u1

+ +

v ur

||ur ||

2 ur

nos da la proyeccion ortogonal del vector v sobre el subespacio generado por el correspondiente vector uk .
2

El vector u = proy S (v) verifica que ||u|| ||v|| .


Corolario. (Matriz de una proyeccion ortogonal) Sea S un subespacio vectorial de Rn .
(a) Si {u1 , u2 , . . . , ur } es una base ortonormal de S, la proyeci
on ortogonal de un vector v Rn sobre S es
u := proy S (v) = (v u1 ) u1 + + (v ur ) ur .

101

(b) Siendo U una matriz cuyas columnas forman una base ortonormal de S, la matriz de la proyeccion ortogonal
sobre S es PS = U U T , es decir
proy S (v) = U U T v, v Rn .
Aunque puedan considerarse distintas matrices U como en el enunciado, la matriz PS = U U T que representa
a la proyeccion ortogonal, respecto a la base canonica, es u
nica. Las propiedades caractersticas de las matrices de
proyeccion ortogonal son
2
PS2 = PS ,
U U T = U (U T U )U T = U IU T = U U T ,
T
PS es simetrica, U U T
= (U T )T U T = U U T .

Teorema (de la mejor aproximaci


on). Sea S un subespacio vectorial de Rn y consideremos un vector x Rn y
un vector y S. Son equivalentes:
(a) y es la proyeccion ortogonal de x sobre S,
S
es decir,
y S,

x y S.

(b) y es la mejor aproximacion de x desde S,


es decir,
y S,

y
O
S

||x y|| ||x w||

para todo w S.

Sea y = proy S (x) y sea w S. Puesto que


xw = (xy)+(yw),

xy S , yw S,

aplicando el Teorema de Pit


agoras tenemos
||x w||2 = ||x y||2 + ||y w||2 ||x y||2 .

5.

El m
etodo de Gram-Schmidt.

En el Tema 4 hemos visto c


omo obtener una base de un subespacio vectorial a partir de un conjunto de vectores
que genera el subespacio vectorial. En los epgrafes anteriores hemos visto que el c
alculo de las coordenadas de un
vector respecto de una base ortogonal es muy simple (desarrollo de Fourier) y que estas permiten dar la expresion
de la proyeccion ortogonal sobre el subespacio que generan dichos vectores. El metodo de ortogonalizaci
on de GramSchmidt, que vamos a describir, permite construir de manera progresiva una base ortogonal de un subespacio vectorial
a partir de una base de dicho subespacio e incluso de un conjunto de vectores que genere el subespacio.
Partiendo de una base {v1 , v2 , . . . , vp } de un subespacio S, el metodo consiste en generar uno a uno vectores que
son ortogonales a los construidos. Denotamos por S1 , S2 , . . . , los subespacios vectoriales definidos por
S1 = Gen {v1 } , S2 = Gen {v1 , v2 } , . . . , Sp = Gen {v1 , v2 , . . . , vp } = S.
El metodo de Gram-Schmidt consiste en generar los vectores:
u1 = v1 S1 ,
nico vector de la forma u2 = v2 + u1 que es ortogonal a u1 ,
u2 = v2 proy S1 (v2 ) S2 , es decir, u2 es el u
nico vector de la forma u3 = v3 + u1 + u2 que es ortogonal a
u3 = v3 proy S2 (v3 ) S3 , es decir, u3 es el u
u1 y a u2 ,
...
Notemos que, puesto que los vectores {v1 , v2 , . . . , vp } son linealmente independientes, necesariamente los subespacios
S1 S2 Sp = S

102

son todos distintos (dim (Sk ) = k, k = 1, 2, . . . , p), los vectores u1 , u2 , . . . , up son todos no-nulos y linealmente independientes y se verifica que
S1 = Gen {v1 }
= Gen {u1 },
S2 = Gen {v1 , v2 }
= Gen {u1 , u2 } ,
S3 = Gen {v1 , v2 , v3 } = Gen {u1 , u2 , v3 } = Gen {u1 , u2 , u3 } ,
..
..
.
.
Sp = Gen {v1 , . . . , vp } = . . .
= Gen {u1 , , up } .
Teorema (M
etodo de ortogonalizaci
on de Gram-Schmidt). Consideremos una base {v1 , v2 , . . . , vp } de un
subespacio vectorial S de Rn . Entonces, los siguientes vectores est
an bien definidos
u1 = v1
u2

= v2

u3

= v3

v2 u1
||u1 ||

v3 u1
||u1 ||

u1
u1

v3 u2
||u2 ||2

u2

..
.
vp u1
vp up1
up = vp
2 u1
2 up1
||u1 ||
||up1 ||
y son no-nulos y ortogonales dos a dos.
(a) {u1 , u2 , . . . , up } es una base ortogonal de S = Gen {v1 , v2 , . . . , vp }.
(b) Para cada k = 1, . . . , p, {u1 , u2 , . . . , uk } es una base ortogonal de Sk = Gen {v1 , v2 , . . . , vk }.
Observaciones.
(a) Si el objetivo es obtener una base ortonormal de S, una vez que se ha obtenido una base ortogonal basta normalizar
los vectores obtenidos.
(b) En cada paso del metodo de Gram-Schmidt que acabamos de describir podramos multiplicar (o dividir) el vector
obtenido por un coeficiente no-nulo y seguir los c
alculos con dicho vector.
(c) Si el vector vk es combinaci
on lineal de los anteriores, v1 , v2 , ..., vk1 , al aplicar el metodo de Gram-Schmidt
obtenemos uk = 0. Es decir, el metodo de Gram-Schmidt devuelve el vector nulo cuando se aplica a un conjunto
de vectores linealmente dependientes.
Ejercicio resuelto
Consideremos la matriz

1
0
A=
1
0

0
1
0
1

b a
a b
,
b a
a b

a, b R.

Si a = 0 y b = 1, la matriz B = 21 A es la matriz de la proyeccion ortogonal sobre un cierto subespacio S R4 .


(a) Encontrar una base ortonormal del subespacio S.
(b) Calcular la proyeccion ortogonal del vector (1, 1, 1, 1)T sobre S .
Si a = 0 y b = 1 la matriz B es

1
1
1
0
B= A=

2
2 1
0

0
1
0
1

1
0
1
0

0
1
.
0
1

(a) Nos dicen que B es la matriz PS de la proyeccion ortogonal sobre un cierto subespacio S R4 , es decir, que la
proyeccion ortogonal de cualquier vector x R4 sobre S es Bx. Los vectores v que pertenecen a S son aquellos que
coinciden con su proyeccion ortogonal sobre S, es decir, los que verifican Bv = v. Resolviendo este sistema

v1
v1
v1
0
1 0 1 0
1 0
1
0


1
v1 v3 = 0,
1
v2 = 0
0 1 0 1 v2 = v2 1 0 1 0
v2 v4 = 0,
0 1 0 v3 0
2 1 0 1 0 v3 v3
2 1
v4
v4
v4
0
0 1 0 1
0
1
0 1
103

obtenemos

1
0

v =
1 +
0

0
1

0
1
, , R S = Gen u1 =
1
0

1
0

Como la base encontrada ya es ortogonal (u1 u2 = 0),


una base ortonormal de S:

1
0

1

(b) Para calcular la proyeccion ortogonal del


ortogonal sobre S , PS , vale

1 0 0
0 1 0
PS = I PS =
0 0 1
0 0 0
con lo que

, u2 = 1 .

basta con dividir por la norma de cada vector para encontrar

1 1
.
,

2 0

vector w = (1, 1, 1, 1)T sobre S , usamos que la matriz de la proyeccion

0
1

0
2
1

1
0
1
0

0
1
0
1

1
0
1
0

1
= 1

0
2
1

1
1
0 1 0
1
1
0
1
0
1

P royS w = PS w =
1
0 1
2 1 0
1
0 1 0
1

1
0
0
1
1 0
0 1

1 0
0 1

1
0
0
1

0
0

=
0 ,
0

resultado logico ya que w S, pues verifica sus ecuaciones implcitas (halladas en el apartado anterior), x1 x3 = 0,
x2 x4 = 0 (en particular, podemos ver que w = u1 + u2 ).
Ejercicio resuelto
Dados el subespacio E de R4 y la matriz A

1
0

0
1

E = Gen u1 =
,u =
0 2 0

1
2

, u3 = 0 ,

(a) Encontrar la matriz de la proyeccion ortogonal sobre E.

a1 b 1
a2 2

A=
a3 b 2 .
2 b3

(b) Calcular A sabiendo que Col(A) est


a contenido en E .
(a) Para calcular la matriz de la proyeccion ortogonal PE sobre un subespacio E necesitamos una base ortonormal
de E. Pero teniendo en cuenta que PE + PE = I, puede ser mas facil calcular primero PE a partir de una base
ortonormal de E . Por tanto, lo mas conveniente es trabajar con el espacio que tenga menor dimensi
on entre E y E .
Por un lado, dim(E) = 3 pues los tres vectores que lo generan son linealmente independientes

1 0 0
1 0 0
1 0 0
1 0 0
0 1 0 0 1 0 0 1 0 0 1 0

0 0 1 0 0 1 0 0 1 0 0 1 .
1 2 1
0 2 1
0 0 1
0 0 0
De esta forma, al estar en R4 , dim(E ) = 4 dim(E) = 4 3 = 1, con lo que es trivial encontrar una base ortonormal
de E y muy tedioso hallarla para E.
Para trabajar con E podemos escribir sus ecuaciones implcitas (a partir de un conjunto generador de E; si se
trata de una base de E, entonces tenemos garanta de que no nos sobra ninguna ecuacion en ese conjunto de ecuaciones
implcitas):

1
x4 R

x1 + x4 = 0

2
x
=
x
1
4

x2 + 2x4 = 0
.
E = Gen
E

1
x2 = 2x4

x3 + x4 = 0

1
x3 = x4
Otra forma de encontrar una base de E es a partir de las ecuaciones implcitas de E, y estas son faciles de calcular

104

(repetimos la primera eliminacion que hicimos para ver la dimensi


on de E, a
nadiendo una cuarta columna):

1 0 0
x1
1 0 0 x1
1 0 0
1 0 0
x1
x1

x2
0 1 0 x2 0 1 0
0 1 0
0 1 0

x2
x2

0 0 1
,
x3

0 0 1 x3 0 0 1

x3
x3
0 0 1
0 0 0
x4 x1
1 2 1 x4
0 2 1 x4 x1
0 0 1 x4 x1 2x2
2x2 x3

de donde deducimos que x1 + 2x2 + x3 x4 = 0 es una ecuaci


on implcita de E (es recomendable emplear unos
segundos en comprobar que todos los vectores que generan E satisfacen todas las ecuaciones implcitas obtenidas;
en nuestro caso, que los tres vectores verifican la ecuaci
on). Observemos que obtenemos una sola ecuaci
on implcita
pues E tiene dimensi
on 3 y es un subespacio de R4 . A partir de dicha ecuaci
on implcita de E deducimos que
E = Gen{(1, 2, 1, 1)T }.
La ventaja de trabajar con E es que la base obtenida ya es ortogonal (al tener un u
nico vector) y, por tanto, una
base ortonormal es BE = {v1 = 17 (1, 2, 1, 1)T }. Construyendo la matriz U = [v1 ] podemos ya calcular la matriz
de la proyeccion ortogonal sobre E que viene dada por

1
1
2
1 1

 1 2
1 2
4
2 2
1
.
1 2 1 1 =
PE = U U T =

1
2
1 1
1
7
7
7
1 2 1 1
1
Es muy facil obtener entonces la matriz de la proyeccion ortogonal sobre E

6 2 1 1
1
2
3 2 2
PE = I PE =
7 1 2 6 1
1
2
1 6

Para estar seguros de que las matrices encontradas son las correctas es recomendable comprobar que, al proyectar cada
vector de la base de ese espacio obtenemos el mismo vector, y que, al proyectar cada vector de la base del subespacio
ortogonal obtenemos el vector nulo. Ademas, hay dos comprobaciones inmediatas que si no las satisface una matriz
de proyeccion seguro que est
a mal calculada: es siempre una matriz cuadrada, en este caso al estar el subespacio en
R4 es 4 4 y debe ser simetrica al ser (U U T )T = (U T )T U T = U U T .
Observemos que un camino no recomendable (pues nos puede llevar mucho tiempo y seguramente con errores en los
c
alculos) para calcular PE consiste en buscar una base de E, {z1 , z2 , z3 }, aplicarle el metodo de GramSchmidt para
conseguir una base ortogonal, {t1 , t2 , t3 }, dividir por las normas de los vectores para conseguir una base ortonormal y
construir la matriz




t1 t2 t3
,
U=
||t1 || ||t2 || ||t3 ||

con lo que, finalmente, PE = U U T .

(b) Si Col(A) est


a contenido en E , quiere decir que cada columna de A se puede escribir como combinaci
on lineal
de los vectores de cualquier base de E . Como una base de E es {(1, 2, 1, 1)T }, debe verificarse

b1
1
= 2,
a1
1
= 1,

2
2
a2
2
a
=
2,
b
1
1 = 1,

b2 = 1 b2 = 1,
a3 = 1 a2 = 4, ;

1
a3 = 2,
2
b3
1
b3 = 1,


b1
2
1

2
2
.
= 4

b2
2
1
b3
2 1
la matriz siguiente tenga rango uno

a2 2a1 = 0,

a
=
0,
b1

3
1

2 2b1
a1 2 = 0,

=
1

2 2b1 = 0,
b2 b1

b3 + b1
b

b
=
0,

2
1

b3 + b1 = 0,

a1
a2

con lo que la matriz A buscada resulta ser A =


a3
2
Un planteamiento equivalente consiste en exigir que

1
a1 b 1
1
a1

2
0 a2 2a1
a
2
2
= r
r
1
0 a3 a1
a3 b 2
1 2 b3
0 a1 2

105

a1 = 2,
a2 = 4,
a3 = 2,
b1 = 1,
b2 = 1,
b3 = 1.

Otra posibilidad es exigir que las columnas de A verifiquen las tres ecuaciones implcitas de E obtenidas en el primer
apartado.
Ejercicio resuelto
Consideremos el subespacio E de R3 definido mediante x z
(en la base canonica de R3 ) por la matriz

3 2
A = 0 1
2 1

= 0 y la aplicacion lineal f : R3 R3 representada

1
2 .
0

(a) Hallar la proyeccion ortogonal del vector (1, 1, 1)T sobre el subespacio f (E).
(b) Encontrar la matriz de la proyeccion ortogonal sobre el subespacio [f (E)] .

(a) A partir de las ecuaciones implcitas de E, x z = 0, es inmediato deducir (resolviendo la ecuaci


on que define a
E) que:

1
0

E = Gen v1 = 0 , v2 = 1 .

1
0

Si x es un vector de E, x E, entonces se podra escribir como x = 1 v1 + 2 v2 y su transformado, mediante la


transformaci
on lineal f , sera f (x) = f (1 v1 + 2 v2 ) = 1 f (v1 ) + 2 f (v2 ) es decir, que si E = Gen {v1 , v2 } entonces,
f (E) = Gen {f (v1 ), f (v2 )}. Calculamos pues


3 2 1
1
4
f (v1 ) = Av1 = 0 1 2 0 = 2 ,
2 1 0
1
2

3 2 1
0
2
f (v2 ) = Av2 = 0 1 2 1 = 1 ,
2 1 0
0
1
con lo que f (E) = Gen {(4, 2, 2)T , (2, 1, 1)T } = Gen {w = (2, 1, 1)T }.
Puesto que dim(f (E)) = 1 y se trata de un subespacio de R3 , entonces dim([f (E)] ) = 2, con lo que es mas facil
proyectar sobre f (E) que sobre [f (E)] .
Cuidado, no hay que confundir [f (E)] con f (E ). Este u
ltimo viene generado por f [(1, 0, 1)T ] = (2, 2, 2)T , ya

T
que E = Gen {(1, 0, 1) }, mientras que una ecuaci
on implcita que define [f (E)] es 2x + y + z = 0 y, por tanto,

resolviendo esta ecuaci


on, [f (E)] = Gen {u1 = (1, 2, 0)T , u2 = (0, 1, 1)T }.
Para proyectar sobre un subespacio necesitamos conocer una base ortogonal suya. Puesto que una base de f (E) es
w = (2, 1, 1)T (que es ortogonal al estar formada por un u
nico vector) ya podemos proyectar el vector u = (1, 1, 1)T
sobre f (E)

0
0
uw
w = w = 0 .
P royf (E) u =
ww
6
0

Este resultado indica que el vector u que hemos proyectado sobre f (E) pertenece a [f (E)] .
Si preferimos proyectar mediante la matriz de la proyeccion Pf (E) , la calculamos construyendo U = (w/||w||) de
forma que

2
4 2 2

6 6
1
2 1 1 = 2 1 1 .
1
Pf (E) = U U T =
6
6
6
1
2 1 1

Conviene emplear unos segundos en comprobar que la matriz Pf (E) calculada es correcta (hay dos comprobaciones
inmediatas que si no las satisface seguro que est
a mal: es siempre una matriz cuadrada, en este caso al estar el
subespacio en R3 es 3 3; ademas debe ser simetrica al ser (U U T )T = (U T )T U T = U U T ). Para tener garanta de que
est
a bien calculada, vemos que Pf (E) w = w (como la proyeccion de cualquier vector de f (E) sobre f (E) es el propio
vector, basta con comprobarlo con todos los vectores de su base) y que Pf (E) u1 = Pf (E) u2 = 0 (como la proyeccion de
cualquier vector de [f (E)] sobre f (E) es el vector nulo, lo verificamos con todos los vectores de la base de [f (E)] ).
De esta forma


4 2 2
1
0
1
P royf (E) u = Pf (E) u = 2 1 1 1 = 0 .
6
2 1 1
1
0

106

(b) Por la consideracion de las dimensiones f (E) y de [f (E)] , la manera mas facil de calcular P[f (E)] es teniendo
en cuenta que Pf (E) + P[f (E)] = I. Puesto que ya hemos calculado Pf (E) , es inmediato que
P[f (E)] = I Pf (E)

4
0
1
0 2
6
2
1

1 0
= 0 1
0 0

2 2
2 2 2
1
1 1 = 2 5 1 .
6
1 1
2 1 5

Veamos que si no recurrimos al subespacio ortogonal, es decir, si trabajamos directamente con [f (E)] los c
alculos
seran mas engorrosos. Para calcular la matriz de la proyeccion necesitamos una base ortonormal del subespacio. Como
una ecuaci
on implcita de [f (E)] es 2x + y + z = 0, resolviendo esta ecuaci
on, obtenemos una base B[f (E)] = {u1 =
T
(1, 2, 0) , u2 = (0, 1, 1)T }. Para obtener una base ortogonal vamos a aplicar el metodo de GramSchmidt a esos
dos vectores

1
0
1
2/5
2
u2 w1
w1 = 1 2 = 1/5 .
w1 = u1 = 2 ; w2 = u2
w1 w1
5
0
1
0
1

Conviene comprobar, para detectar posibles errores, que w1 y w2 son ortogonales, es decir, que w1 w2 = 0.
Por tanto, una base ortogonal de [f (E)] viene dada por {w1 , w2 }. Por comodidad, en vez de w2 podemos tomar
un m
ultiplo suyo para evitar la aparici
on de fracciones, obteniendo la base ortogonal
{w1 = (1, 2, 0)T , w2 = (2, 1, 5)T }.
Dividiendo por su norma conseguimos una base ortonormal de [f (E)] , B[f (E)] =


w1 w2
construimos la matriz U = ||w
con lo que

1 || ||w ||

w2
w1
||w1 || , ||w2 ||

, a partir de la cual

P[f (E)] = U U T =

5
5
2 5
5

30
15
30
30

630

5
5
30
15

2 5 5
30
30

30
6

2 2 2
1
= 2 5 1 .
6
2 1 5

Observemos que una alternativa a aplicar el metodo de Gram-Schmidt es buscar con cuidado una base ortogonal
de [f (E)] . Como su ecuaci
on implcita es 2x + y + z = 0, elegimos un primer vector cualquiera (cuanto mas sencillo
mejor, pues en la solucion aparecen dos par
ametros) que verifique esa ecuaci
on, por ejemplo, z1 = (1, 2, 0)T . Ahora
T
un segundo vector, z2 = (a, b, c) , lo determinamos exigiendo que verifique la ecuaci
on anterior y que sea perpendicular
a z1 , es decir, debe verificar 2a + b + c = 0, a 2b = 0. Elegimos un vector cualquiera (en la solucion aparece un
par
ametro) que verifique este sistema, por ejemplo, z2 = (2, 1, 5)T . La base ortogonal encontrada es {z1 , z2 }.
Ejercicio resuelto
Hallar la proyeccion ortogonal del vector (3, 4, 5)T sobre el
por la matriz

1 0
A = 1 1
0 1

y E el subespacio de R3 dado por x y z = 0.

subespacio f (E) siendo f la aplicacion lineal dada

1
0
1

A partir de las ecuaciones implcitas de E, x y z = 0, es inmediato deducir (resolviendo la ecuaci


on que define a
E) que:

1
1

E = Gen v1 = 1 , v2 = 0 .

0
1

Si x es un vector de E, x E, entonces se podra escribir como x = 1 v1 + 2 v2 y su transformado, mediante la


transformaci
on lineal f , sera f (x) = f (1 v1 + 2 v2 ) = 1 f (v1 ) + 2 f (v2 ) es decir, que si E = Gen {v1 , v2 } entonces,
f (E) = Gen {f (v1 ), f (v2 )}. Calculamos pues


1 0 1
1
1
f (v1 ) = Av1 = 1 1 0 1 = 0 ,
0 1 1
0
1

1 0 1
1
2
f (v2 ) = Av2 = 1 1 0 0 = 1 .
0 1 1
1
1
107

Puesto que dim(f (E)) = 2 (pues f (v1 ) y f (v2 ) son linealmente independientes) y estamos en R3 entonces dim([f (E)] ) =
1, con lo que es mas f
acil proyectar sobre [f (E)] . Cuidado, no hay que confundir [f (E)] con f (E ). Este u
ltimo
viene generado por f [(1, 1, 1)T ] = (0, 2, 0)T , ya que E = Gen {(1, 1, 1)T }.
Si hallamos las ecuaciones implcitas de f (E) (debe ser una ecuaci
on, pues es un subespacio de dimensi
on 2 en R3 )

x
x
1 2
1 2
1 2 x
f (E) x + 3y z = 0,
0 1 y 0 1
y 0 1
y
1 1 z
0 3 z x
0 0 z x 3y

podemos deducir inmediatamente que [f (E)] = Gen {w = (1, 3, 1)T }. Observemos que, por estar en R3 , podemos
encontrar un vector de [f (E)] calculando el producto vectorial de f (v1 ) con f (v2 ), f (v1 ) f (v2 ) = (1, 3 1)T .
Puesto que w es una base ortogonal de [f (E)] , ya podemos proyectar ortogonalmente

1
14
uw
3 .
w=
P roy[f (E)] u =
ww
11
1
De esta forma,

1
47
3
1
14
3 =
2 .
P royf (E) u = u P roy[f (E)] u = 4 +
11
11
1
41
5

Mencionemos otros caminos que podamos haber seguido, aunque sean menos aconsejables pues son mas largos.
Conocida una base ortogonal de f (E), {w1 , w2 } (para lo que tenemos que aplicar el metodo de GramSchmidt
a f (v1 ), f (v2 ) o bien, buscar con cuidado, a partir de la ecuaci
on implcita de f (E), x + 3y z = 0, dos vectores
ortogonales) podemos aplicar
u w1
u w2
P royf (E) u =
w1 +
w2 .
w1 w1
w2 w2
Si preferimos proyectar sobre f (E) usando la matriz de la proyeccion, lo mas facil es calcular mediante una base
ortonormal de [f (E)] (como solo tiene un vector, w, basta con dividir por su norma, w/|w|) la matriz P[f (E)] y
luego Pf (E) = I P[f (E)] con lo que P royf (E) u = Pf (E) u. Notemos que si pretendemos calcular la matriz Pf (E)
directamente, necesitamos una base ortonormal de f (E) por lo que tenemos que aplicar el metodo de GramSchmidt
a f (v1 ), f (v2 ) o bien, buscaremos con cuidado, a partir de la ecuaci
on implcita de f (E), x + 3y z = 0, dos vectores
ortogonales.
Ejercicio resuelto
Considera el siguiente subespacio de R4 :
F x1 + x3 + x4 = 0.

(a) Determina las matrices de la proyeccion ortogonal sobre F y sobre F .


(b) Sea v = [5 3 4 6]T . Halla unos vectores u1 F y u2 F tales que v = u1 + u2 .
(a) Para calcular las matrices de la proyeccion ortogonal sobre F , PF , y sobre F , PF , lo mas conveniente es trabajar
con el espacio de menor dimensi
on. Por un lado, dim(F ) = 3 pues F R4 y est
a definido por una ecuaci
on implcita.

De esta forma, dim(F ) = 4 dim(F ) = 4 3 = 1. Con lo que es trivial encontrar una base ortonormal de F y muy
muy tedioso hallarla para F .
Como F x1 + x2 + x4 = 0 entonces


1/ 3
1

0
0

F = Gen = Gen
.
1
1/3

1
1/ 3
Usando esta base ortonormal, la matriz de la proyeccion ortogonal sobre F

1/ 3
1/3 0 1/3
0

 0 0 0


PF =
1/ 3 1/ 3 0 1/ 3 1/ 3 = 1/3 0 1/3

1/3 0 1/3
1/ 3

viene dada por

1
1/3
0
1
0
=
1/3 3 1
1
1/3

Es muy facil obtener entonces la matriz de la proyeccion ortogonal sobre F

2
2/3 0 1/3 1/3
1 0
0
1
0
0

PF = I PF =
1/3 0 2/3 1/3 = 3 1
1
1/3 0 1/3 2/3
108

0
3
0
0

0
0
0
0

1 1
0
0
.
2 1
1 2

1
0
1
1

1
0
.
1
1

Para estar seguros de que las matrices encontradas son correctas es recomendable comprobar que, al proyectar cada
vector de la base de ese espacio obtenemos el mismo vector, y que, al proyectar cada vector del subespacio ortogonal
obtenemos el vector nulo.
Observemos que un camino no recomendable (pues nos puede llevar mucho tiempo y seguramente con errores en los
c
alculos) para calcular PF consiste en buscar una base de F , {z1 , z2 , z3 }, aplicarle el metodo de GramSchmidt para
conseguir una base ortogonal, {t1 , t2 , t3 }, dividir por las normas de los vectores para conseguir una base ortonormal y
construir la matriz




t1 t2 t3
,
U=
||t1 || ||t2 || ||t3 ||
con lo que, finalmente, PF = U U T .

(b) Dado el vector v, pedirnos unos vectores u1 F y u2 F tales que v = u1 + u2 , es demandarnos las proyecciones
ortogonales de v sobre F y F :
v = u1 + u2 = P royF v + P royF v.
Estas proyecciones las calculamos f
acilmente

2 0 1 1

1 0 3 0
0

u1 = PF v =

3 1 0 2 1
1 0 1 2


4
5

3
= 3
4 3
7
6


; u2 = P royF v = v s1 s1 = 3 s1 = 0 .

1
s1 s1
3
1

Obviamente, podemos calcular primero P royF v o P royF v y despues encontrar el otro vector aplicando que v =
P royF v + P royF v.
Ejercicio resuelto
Siendo R, consideremos el subespacio H x1 + x2 + 4 x3 = 0 de R3 y los vectores

1
1
v1 = 1 y v2 = 0 .
2
2

Determina para que la proyeccion ortogonal de v1 sobre H sea perpendicular a v2 .

Nos piden que hallemos exigiendo que P royH v1 v2 = 0. Necesitamos pues calcular la proyeccion ortogonal de v1
sobre el subespacio H, P royH v1 . Como dim(H) = 2 y H R3 , entonces dim(H ) = 1, con lo que es mas sencillo
calcular la proyeccion sobre H = Gen{u = (, 1, 4)T }:

92 +
v1 u
9 + 1
1
9 + 1 .
1 =
P royH v1 =
u=
uu
172 + 1
172 + 1
4
362 + 4
As,

P royH v1 = v1 P royH v1 =
172 + 1

82 + 1
172 9 ,
22 4 + 2

con lo que podemos hallar los valores de pedidos exigiendo


82 + 1
1
1
172 9 0 = 0 42 9 + 5 = 0 = 1, 5 .
P royH v1 v2 =
172 + 1
4
22 4 + 2
2

Vamos a comentar un procedimiento alternativo y menos engorroso que el anterior. Como H = Gen{u}, entonces
P royH v1 = ku siendo k un n
umero que desconocemos. Con esto

1 k
P royH v1 = v1 P royH v1 = v1 ku = 1 k ,
2 4k
y como P royH v1 H debe verificar su ecuaci
on implcita, lo que nos proporciona la siguiente condicion para k y :
(1 k) + (1 k) + 4(2 4k) = 0 17k2 9 + k 1 = 0.
Esta ecuaci
on junto con la que obtenemos al exigir


1 k
1
P royH v1 v2 = 0 1 k 0 = 5 9k = 0,
2 4k
2
109

(7)

forma un sistema de dos ecuaciones con dos inc


ognitas
17k2 9 + k 1 = 0
9k = 5

que podemos resolver despejando k de la segunda ecuaci


on, k = 5/9 (notemos que no puede anularse porque la
segunda ecuaci
on sera incompatible, 0 = 5) y sustituyendo en la primera con lo que llegamos a la misma ecuaci
on de
segundo grado para
5
42 9 + 5 = 0 = 1, .
4
Ejercicio resuelto
Dado el subespacio
E = Gen{(a, 0, 0, 0)T , (a, a, b, 0)T , (a, b, a, 1)T },

a, b R.

(a) Hallar una base ortonormal del subespacio E seg


un los valores de los par
ametros a y b.
(b) Para a = 0, hallar la matriz de la proyeccion ortogonal sobre E, seg
un los valores de b.

x1 = 0,
5x1 + x2 + 3x3 = 0,
determinar los valores de a y b para que F sea
(c) Dado el subespacio F

2x1 + 3x2 x3 + x4 = 0,
ortogonal a E, F = E .
(a) Como nos piden una base ortonormal, primero buscamos una base de E, luego encontramos una base ortogonal
aplicando el metodo de GramSchmidt y, finalmente, dividiendo por la norma de cada vector, una base ortonormal.
Al darnos un conjunto generador de E, para encontrar una base debemos estudiar que vectores son linealmente
independientes. As, para a 6= 0 obtenemos

a a
a
a a a
a a a
0 a b
0 a
0 a b
b
b

0 b a F3 a F2 0 0 a b2 0 0 1
a
0 0 0
0 0 1
0 0
1
es decir, los tres vectores son linealmente independientes
caso, es {(a, 0, 0, 0)T , (a, a, b, 0)T , (a, b, a, 1)T }.
Observemos que si lo preferimos, en el primer
paso

1 1
0 1
tres primeras filas y trabajar con la matriz
0 b/a
0 0
T
T
T
{(1, 0, 0, 0) , (1, 1, b/a, 0) , (1, b/a, 1, 1) }.

para cualquier valor de b, con lo que una base de E, en este

del proceso
de eliminacion podemos dividir por a 6= 0 las

1
b/a
. Podemos entonces, si queremos, tomar como base
1
1

0 0 0
0 0 b

Cuando a = 0, formamos, con los vectores que generan E, la siguiente matriz


0 b 0 , con lo que es inmediato
0 0 1
obtener que {(0, 0, b, 0)T , (0, b, 0, 1)T } es una base si b 6= 0 (las dos u
ltimas columnas son linealmente independientes)
y que {(0, 0, 0, 1)T } forma una base cuando b = 0 (el u
nico vector no nulo es el tercero).
Hemos visto pues que: si a 6= 0 la dimensi
on de E es tres, independientemente del valor de b; si a = 0 y b 6= 0 E
tiene dimensi
on dos; si a = b = 0, la dimensi
on de E es uno.
Comenzamos con el caso mas sencillo. Si a = b = 0 la base {(0, 0, 0, 1)T } ya es ortogonal (pues solo tiene un vector)
y casualmente tambien es ortonormal (pues el vector tiene norma uno).
La segunda situaci
on aparece cuando a = 0 y b 6= 0. La base encontrada, {(0, 0, b, 0)T , (0, b, 0, 1)T }, coincide
que es ortogonal (el producto escalar de sus dos vectores es nulo) pero no es ortonormal. Basta con dividir cada vector por su norma. La del primero es |b| y la del segundo b2 + 1. Una base ortonormal es, por ejemplo,
{(0, 0, 1, 0)T , b21+1 (0, b, 0, 1)T }. Observemos, como anecdota, que para obtener el primer vector (0, 0, 1, 0)T tenemos
que dividir por |b| si b > 0 y por |b| si b < 0.
La u
ltima posibilidad aparece cuando a 6= 0 (y cualquier valor de b). En este caso la base obtenida, {v1 =
(a, 0, 0, 0)T , v2 = (a, a, b, 0)T , v3 = (a, b, a, 1)T }, no es ortogonal. Aplicamos el metodo de GramSchmidt para encontrar una base ortogonal:

a
0
a
a
0
a a2 0 a
v2 x1

x2 = v2
x1 = v1 =
x1 =
0 ,
b a2 0 = b ,
x1 x1
0
0
0
0

110

x3

a
b a2
v3 x1
v3 x2

v3
x1
x2 =
a a2
x1 x1
x2 x2
1

a
0
0

0 a2 + b 2
0


0
0
a b

b = a
1
0

Recordemos que siempre que se aplica el metodo de GramSchmidt conviene comprobar, en cada paso, que el vector
obtenido es ortogonal a todos los anteriores. As, tras el primer paso comprobamos que x2 x1 = 0 y tras el segundo
que x3 x1 = 0 y x3 x2 = 0. Hemos encontrado una base ortogonal de E cuando a 6= 0, {x1 , x2 , x3 }. Normalizando
cada vector llegamos a la base ortonormal
1
1
{(1, 0, 0, 0)T ,
(0, a, b, 0)T ,
(0, b, a, 1)T }.
2
2
2
a +b
a + b2 + 1
(b) Para calcular la matriz de la proyeccion sobre un subespacio necesitamos una base ortonormal suya (que hemos
calculado en el apartado anterior), formamos una matriz U colocando en sus columnas los vectores de dicha base y la
matriz de la proyeccion buscada se obtiene multiplicando U U T .
Nos piden en el caso a = 0, con lo que hay que distinguir entre b = 0 y b 6= 0. As, para b = 0 obtenemos

0
0
0 0 0 0
0
0
 0 0 0 0
T

U =
0 PE = U U = 0 0 0 0 1 = 0 0 0 0 ,
1
1
0 0 0 1
mientras que para b 6= 0 llegamos a

0
0
0
0 2b

0
b +1 P = U U T =
U =
E
1

1
0
0 b21+1
0

0
b
b2 +1

0
1
b2 +1


0

0
b
b2 +1

1
0

0
1
b2 +1

0
0
=
0
0

0
b2
b2 +1

b
b2 +1

0
0
1
0

0
b
b2 +1

1
b2 +1

Una comprobaci
on inmediata que permite detectar errores en los c
alculos es verificar que la matriz de la proyeccion
ortogonal obtenida es simetrica, pues PET = (U U T )T = U T U = PE .
(c) Una forma de resolver este apartado es buscar una base de F y exigir que todos los vectores de dicha base sean
perpendiculares a todos los de cualquier base de E. Resolviendo el sistema de ecuaciones implcitas obtenemos

0
0
x1
x1 = 0,

x2
= x3 3 , x3 R u 3 ,
5x1 + x2 + 3x3 = 0,
F

1
1
x

3
2x1 + 3x2 x3 + x4 = 0,
10
10
x4

con lo que el vector u es una base de F , BF = {u}. Por tanto, exigiendo perpendicularidad entre todos los vectores
de las bases, BF y BE = {v1 , v2 , v3 }, llegamos a


u v1 = 0
u v1 = 0
0=0
a = 1,
u v2 = 0
u

v
=
0
3a
+
b
=
0

2
b = 3.

u v3 = 0
u v3 = 0
3b a + 10 = 0
Ejercicio resuelto
Sea V R5 el subespacio formado por los vectores cuyas componentes suman cero. Encontrar el vector de V mas
proximo a w = (1, 2, 3, 4, 5)T .

Del enunciado deducimos que V viene definido por la ecuaci


on implcita x1 + x2 + x3 + x4 + x5 = 0. Sabemos que el
vector de V mas proximo a w es la proyeccion ortogonal de w sobre V , P royV w. Como V R5 y viene definido por
una ecuaci
on implcita, deducimos que dim(V ) = 4 y que dim(V ) = 5 dim(V ) = 5 4 = 1. Ante esta diferencia
entre las dimensiones de V y V , es obvio que resulta mucho mas facil proyectar ortogonalmente sobre V que sobre
V.
Recordemos que para proyectar ortogonalmente sobre un subespacio necesitamos una base ortogonal suya. En
nuestro caso, de la ecuaci
on implcita de V deducimos que
V = Gen {u = (1, 1, 1, 1, 1)T },
es decir, ya tenemos una base ortogonal (pues solo tiene un vector) de V , BV = {u}. Por tanto,
P royV w =

wu
15
u=
u = 3u = (3, 3, 3, 3, 3)T ,
uu
5
111

es decir, el vector que nos piden es


P royV w = w P royV w = (1, 2, 3, 4, 5)T (3, 3, 3, 3, 3)T = (2, 1, 0, 1, 2)T .
Conviene comprobar que el vector encontrado pertenece a V , es decir, que verifica su ecuaci
on implcita: 2 1 + 0 +
1 + 2 = 0.
Si elegimos el camino de proyectar directamente sobre V (cosa totalmente desaconsejable, como podemos ver a
continuacion, por los c
alculos tan tediosos que aparecen) procederemos de la siguiente forma. Primero encontramos
una base de V resolviendo su ecuaci
on implcita, con lo que llegamos a
V = Gen {v1 = (1, 1, 0, 0, 0)T , v2 = (1, 0, 1, 0, 0)T , v3 = (1, 0, 0, 1, 0)T , v4 = (1, 0, 0, 0, 1)T }.
Como esta base no es ortogonal, aplicamos el metodo de GramSchmidt a esos cuatro vectores:

1
1

x1 = v1 =
0 ,
0
0

1/2
1
1/2
1

1
v2 x1

x1 = v2 x1 = 1 x2 =
x2 = v2
2 ,
x1 x1
2
0
0
0
0

1/3
1
1/3
1

v3 x1
v3 x2
1
1

x3 = v3
x1
x = v3 x1 x2 = 1/3 x3 =
1 ,
x1 x1
x2 x2 2
2
6
1
3
0
0

1/4
1/4

v4 x2
v4 x3
1
1
1
v4 x1

x1
x
x = v4 x1 x2 x3 = 1/4 x4 =
x4 = v4

x1 x1
x2 x2 2 x3 x3 3
2
6
12
1/4

1
1
1
1
4

N
otese que hemos introducido el vector x2 (m
ultiplo de x2 ) para evitar la aparici
on de fracciones en los c
alculos
posteriores. El mismo comentario justifica la introduccion de x3 y x4 .
Para detectar posibles errores, comprobamos: despues del primer paso que x2 es perpendicular a x1 (x1 x2 = 0)
y que pertenece a V (que verifica su ecuaci
on implcita, x1 + x2 + x3 + x4 + x5 = 0); despues del segundo paso, que
x3 es perpendicular a x1 y a x2 y que pertenece a V ; despues del tercer y u
ltimo paso, que x4 es perpendicular a x1 ,

a x2 y a x3 y que pertenece a V .
Con la base ortogonal de V encontrada llegamos a
P royV w =

w x
w x
w x
1
3
6
10
w x1
x1 + 2 x2 + 3 x3 + 4 x4 = x1 + x2 + x3 + x4 = (2, 1, 0, 1, 2)T .
x1 x1
x2 x2
x3 x3
x4 x4
2
6
12
20

Observemos que una alternativa a aplicar el metodo de Gram-Schmidt es buscar con cuidado una base ortogonal de
V . Como su ecuaci
on implcita es x1 + x2 + x3 + x4 + x5 = 0, elegimos un primer vector cualquiera (cuanto mas sencillo
mejor, pues en la solucion aparecen cuatro par
ametros) que verifique esa ecuaci
on, por ejemplo, w1 = (1, 1, 0, 0, 0)T .
T
Ahora un segundo vector, w2 = (a, b, c, d, e) , lo determinamos exigiendo que verifique la ecuaci
on anterior y que
sea perpendicular a w1 , es decir, debe verificar a + b + c + d + e = 0, a b = 0. Elegimos un vector cualquiera
(cuanto mas sencillo mejor, pues en la solucion aparecen tres par
ametros) que verifique este sistema, por ejemplo,
w2 = (1, 1, 2, 0, 0)T . Un tercer vector, w3 = (a, b, c, d, e)T , lo determinamos exigiendo que verifique la ecuaci
on de V
y que sea perpendicular a w1 y a w2 , es decir, debe verificar a + b + c + d + e = 0, a b = 0, a + b 2c = 0. Elegimos un
vector cualquiera (cuanto mas sencillo mejor, pues en la solucion aparecen dos par
ametros) que verifique este sistema,
por ejemplo, w3 = (1, 1, 1, 3, 0)T . Por u
ltimo, un cuarto vector, w4 = (a, b, c, d, e)T , lo determinamos exigiendo que
verifique la ecuaci
on de V y que sea perpendicular a w1 , a w2 y a w3 , es decir, debe verificar a + b + c + d + e =
0, a b = 0, a + b 2c = 0, a + b + c 3d = 0. Elegimos un vector cualquiera (en la solucion aparecen los m
ultiplos
de (1, 1, 1, 1, 4)T ) que verifique este sistema, por ejemplo, w4 = (1, 1, 1, 1, 4)T . De esta forma, una base ortogonal
de V sera {w1 , w2 , w3 , w4 }.
Notemos que si queremos calcular las matrices de la proyeccion ortogonal sobre V , PV , y sobre V , PV , conviene

112

calcular primero PV (usando una base ortonormal de V ):


1/5
1/ 5

PV =
1/5 1/ 5 1/ 5 1/ 5 1/ 5
1/ 5

1/ 5

y luego, trivialmente que

PV = I PV =

4
1
1
1
1

1
4
1
1
1

 1
1/ 5 =
5

1
1
4
1
1

1
1
1
4
1

1
1
1
1
4

1
1
1
1
1

1
1
1
1
1

1
1
1
1
1

1
1
1
1
1

1
1
1
1
1

Con PV ya podemos calcular P royV w: P royV w = PV w = (3, 3, 3, 3, 3)T y, por tanto, obtenemos P royV w =
w P royV w = (2, 1, 0, 1, 2)T .
Si trabajamos con PV , entonces P royV w = PV w = (2, 1, 0, 1, 2)T .
Ejercicio resuelto


1
1
1
Consideremos la base B = 2 , 1 , 2 .

3
2
6

(a) Determinar las matrices de cambio de base entre B y la base canonica.


(b) Calcular todos los vectores de R3 cuyas coordenadas son las mismas en la base B que en la base canonica.
T
5
(c) Calcular
 la proyeccion ortogonal del vector [3 0 1 2 1] sobre el subespacio de R cuyas ecuaciones implcitas
x1 +x2
+ x4 x5 =0,
son
2x1
+x3 +2x4
=0.

(d) Demostrar que Nul (M ) Nul (M 2 ) para cualquier matriz cuadrada M .


(a) Tenemos que encontrar dos matrices. La primera de ellas, correspondiente al paso de la base B a la base canonica
(que denotaremos por E), no es mas que

1 1 1
PB = P = 2 1 2 ,
EB
3 2 6
donde hemos situado, por columnas, los vectores de la
la inversa de la anterior, es decir,

1 1
1
P = P = 2 1
EB
BE
3 2

Esta inversa

1
2
3

base B. La matriz de paso de la base canonica a la base B es

1
2 4 1
1
1
2 = 6 3 0 .
3 1 1 1
6

se puede calcular, por ejemplo, por el metodo de Gauss-Jordan:

1 1 1 1 0 0
1 1 1 1
0 0
1 1 1 0 0
1 2 0 1 0 0 1 0 2 1 0 0 1 0 2 1 0
2 6 0 0 1
0 1 3 3 0 1
0 0 3 1 1 1

1
0
0
1 1 0 4/3
1 1 1
2
1
0 0 1 0
2
0 1 0
0 0 1 1/3 1/3 1/3
0 0 1 1/3

1 0 0 2/3 4/3 1/3


0 1 0
2
1
0 .
0 0 1 1/3 1/3 1/3

1/3 1/3
1
0
1/3 1/3

(b) Queremos aquellos vectores de R3 cuyas coordenadas coinciden en la base canonica y en B, es decir, aquellos
vectores v = [x y z]T , tales que PB v = v. Escrito en forma de sistema queda

1 1 1
x
x
2 1 2 y = y ,
3 2 6
z
z
113

o, equivalentemente,

0 1
2 0
3 2

1
x
0
2 y = 0 ,
5
z
0

ya que este u
ltimo sistema no es mas que (PB I)v = 0.
Una simple eliminacion de Gauss transforma este sistema en otro equivalente,





0 1 1
2 0 2
1 0 1
1 0 1
1
2 0 2 0 1 1 0 1 1 0 1 1 0
3 2 5
3 2 5
3 2 5
0 2 2
0

que, una vez resuelto, tiene como solucion

x
1
y = z 1 ,
z
1

0 1
1 1 ,
0 0

siendo z R, una variable libre.

(c) Para simplificar, llamemos S al subespacio y u al vector que nos dan. Ya que la dimensi
on de S es 3 (viene definido
por dos ecuaciones implcitas independientes en R5 ) y estamos trabajando en R5 , es conveniente calcular la proyeccion
ortogonal sobre S , que tiene menor dimensi
on (en concreto su dimensi
on es 2).
Una base de S se obtiene directamente de los coeficientes de las ecuaciones implcitas de S, ya que dan lugar a
dos vectores linealmente independientes:

1
2

, v2 = 1 .
0
v1 =

1
2

1
0
Estos vectores no son ortogonales, as que vamos a aplicarles el metodo

2
1
0
1

v2 w1

w1 =
w2 = v2
w1 = v1 =
1
0 ;
w1 w1
2
1
0
1
De este modo, hemos obtenido una base ortogonal de S :

BS = w1 =
0

, w2 =

de Gram-Schmidt:

1 0 =

1
1

1
1
1
1
1

1
1
1
1
1

Si nos pidiesen la matriz de la proyeccion ortogonal, necesitaramos normalizar los vectores y despues multiplicar la
matriz que se obtuviese a partir de ellos, coloc
andolos por columnas, por su traspuesta. Esto nos llevara a trabajar con
fracciones y radicales hasta llegar a una matriz 5 5, que en este caso, no es necesaria. Para proyectar ortogonalmente
un vector sobre un subespacio basta con tener una base ortogonal de este:

1
1
12/5

7 1 2/5
u w2
u w1
+ 1 = 7/5 .
0
w1 +
w2 = 1
ProyS u =

w1 w1
w2 w2
1 5 1 12/5
1
1
2/5
Volviendo al subespacio original, S, el vector pedido no es mas que


3
12/5
0 2/5



ProyS u = u ProyS u =
1 7/5
2 12/5
1
2/5

3/5
2/5
2/5
2/5
3/5

(d) Si un vector v pertenece a Nul (M ) significa que M v = 0. Si multiplicamos esta expresion por M quedara M 2 v =
M 0 = 0, por lo que v tambien pertenece a Nul (M 2 ).

114

6.

Problemas de mnimos cuadrados. Ecuaciones normales de Gauss.

En terminos generales, resolver un problema en el sentido de los mnimos cuadrados es sustituir un problema en
el que hay que resolver un sistema de ecuaciones (que no tiene solucion) por el problema de minimizar una suma de
cuadrados.
Ejemplo. El problema de la regresi
on lineal. Si consideramos dos magnitudes, x e y, de las que suponemos
que est
an relacionadas mediante una igualdad del tipo y = ax + b, donde tenemos que determinar a y b mediante la
obtencion de resultados experimentales, y dichos resultados son
x x1
y y1

x2
y2

xn
yn

los valores a y b los obtendremos de la resolucion del sistema de ecuaciones lineales


y1
x1 1
ax1 + b = y1



y2
x2 1
ax2 + b = y2

= . ,
.

.
.. b

..
..

axn + b = yn
yn
xn 1

pero lo habitual es que un sistema de ecuaciones como el anterior no tenga solucion. Resolver el sistema anterior en el
sentido de los mnimos cuadrados consiste en determinar los valores a y b para los cuales la suma de cuadrados
2

(ax1 + b y1 ) + (ax2 + b y2 ) + + (axn + b yn )

es mnima (si hubiera solucion, del sistema dado, dicho valor mnimo sera cero). Puesto que esta suma de cuadrados
es el cuadrado de la norma del vector

y1
x1 1
 y
x2 1 
2
a

. ,

..
..
..
.
. b
xn

y los vectores de la forma

yn

x1
x2
..
.

1
1
..
.

xn



a
,

a, b R,

forman el espacio columna S de la matriz considerada, resolver el sistema en mnimos cuadrados es determinar el
vector de S mas cercano al termino independiente considerado y resolver el sistema (que sera compatible) con ese
nuevo termino independiente.
Para un sistema generico de ecuaciones lineales Ax = b, resolverlo en el sentido de los mnimos cuadrados es
determinar el vector (o vectores) x Rn para los cuales
||Ax b||

es mnima.

Puesto que los vectores Ax recorren el espacio columna de A (cuando x recorre Rn ), ||Ax b|| sera mnima para los
vectores x Rn tales que Ax es igual a la proyeccion ortogonal de b sobre el espacio Col (A).
A

Rm
R

proyS (b)
Ax

Col (A)

Teorema. Consideremos un sistema de ecuaciones Ax = b, A matriz real m n, b Rm , S = Col (A) y sea x


Rn .
Son equivalentes:
(a) x
es solucion en mnimos cuadrados del sistema Ax = b, es decir,
||A
x b|| ||Ax b|| ,
115

x Rn .

(b) x
verifica A
x = proy S (b).
(c) x
verifica las ecuaciones normales de Gauss: AT A
x = AT b.
Observaciones.
(a) El sistema de ecuaciones Ax = proy S (b) (sistema m n) y el sistema AT Ax = AT b (sistema n n) son siempre
compatibles y tienen el mismo conjunto de soluciones.
(b) El sistema Ax = proy S (b) sera compatible determinado (es decir, el problema en mnimos cuadrados tendra solucion u
nica) si y solo si el sistema homogeneo asociado Ax = 0 tiene solucion u
nica. Por tanto,
las columnas de A son linealmente indeel sistema Ax = b tiene solucion u
nica

pendientes (rango(A) = n).


en mnimos cuadrados

7.

Ajuste de curvas, regresi


on lineal.

En el epgrafe anterior hemos planteado el problema de la regresion lineal. Resolviendo en mnimos cuadrados el
sistema planteado se obtiene la recta de regresi
on de y sobre x (en el planteamiento del sistema, la variable
y est
a expresada en funci
on de x) para la nube de puntos dada. Notemos que la resolucion en mnimos cuadrados
considerada consiste en determinar la recta que hace mnima la suma de cuadrados de las distancias sobre la vertical
de los puntos dados a la recta.
Y
yk
y = ax + b
axk + b

X
xk

De forma similar (y resultado distinto, por lo general) podramos haber planteado el problema de determinar una
recta x = y + que pase por los puntos (xk , yk ), k = 1, . . . , n dados. Por lo general, el sistema resultante


x1
y1 1
y1 + = x1

 x
y2 1 
y2 + = x2
2


= .
. .
.
.

..

. .

yn + = xn
xn
yn 1

no tiene solucion y su resolucion en el sentido de los mnimos cuadrados permite determinar la recta que hace mnima
la suma de cuadrados de las distancias sobre la horizontal de los puntos dados a la recta. La recta que se obtiene
mediante la resolucion en mnimos cuadrados del sistema anterior se denomina recta de regresi
on de x sobre y
para la nube de puntos dada. Notemos que cualquier recta que no sea paralela a ninguno de los ejes coordenados puede
expresarse mediante y = ax + b y mediante x = y + . Sin embargo, no es equivalente resolver en el sentido de los
mnimos cuadrados el sistema asociado a una u otra expresion.

116

Y
x = y +
yk

xk
yk +

Desde un punto de vista mas generico que el de la regresion lineal (ajustar una recta a una nube de puntos), puede
considerarse el problema de ajustar, a una nube de puntos del plano (x1 , y1 ), . . . , (xn , yn ), una curva de un cierto tipo
(dada por un tipo de ecuaci
on explcita y = f (x) o implcita F (x, y) = 0). As, podemos considerar el problema de
determinar
la par
abola (de eje principal vertical) y = ax2 + bx + c,
la circunferencia x2 + y 2 + ax + by + c = 0
...
que mejor se ajusta, en el sentido de los mnimos cuadrados, a una nube de puntos dada. En cualquier
caso, se trata de problemas que llevan a sistemas de ecuaciones lineales que no tienen solucion y se resuelven en el
sentido de los mnimos cuadrados.
Un planteamiento similar al de ajustar una curva a una nube de puntos es valido para ajustar una superficie en
R3 de un tipo prefijado a una determinada nube de puntos
(x1 , y1 , z1 ), . . . , (xn , yn , zn ).
Por ejemplo, puede considerarse el problema de ajustar, en el sentido de los mnimos cuadrados,
un plano dado por la ecuaci
on z = ax + by + c (regresion lineal z sobre (x, y)),
una esfera de ecuaci
on x2 + y 2 + z 2 + ax + by + cz + d = 0,
...
a los puntos dados.
Ejercicio resuelto
Encontrar la recta y = x + que mejor ajusta, en el sentido de los mnimos cuadrados, a la nube de puntos (0, 2),
(1, 6) y (3, 0).
Queremos ajustar la nube de puntos (0, 2), (1, 6) y (3, 0) por una recta del tipo y = x + . En primer lugar escribimos
el sistema correspondiente Ax = b, despues calculamos las ecuaciones normales de Gauss, AT Ax = AT b, y finalmente
las resolvemos.
As, cada punto da lugar a una ecuaci
on, y podemos identificar A, x y b:




(0, 2) 2 = 0 +
0 1 
2
0 1
2

(1, 6) 6 = 1 +
1 1
= 6 A = 1 1 , x =
, b = 6 .

(3, 0) 0 = 3 +
3 1
0
3 1
0
Las ecuaciones normales de Gauss, AT Ax = AT b, son pues



 0 1 
 
 2


  

0 1 3

0
1
3

6
5
6 10 4
1 1
=
=

1 1 1

1 1 1
4 3

8
4
3 1
0

117

2
3



3
8

y resolviendolas obtenemos

 
 
 
5 2 3
20 8 12
20 8 12
5

4 3 8
20 15 40
0 7 28
0

2
1

3
4

= 1,
= 4,

con lo que la recta que mejor ajusta a la nube de puntos en el sentido de los mnimos cuadrados es
y = x + 4.
Ejercicio resuelto
Por el metodo de los mnimos cuadrados, ajustar una par
abola y = ax2 + bx + c a los puntos (1, 3), (1, 1),
(1, 2), (1, 1).
Si exigimos que los puntos pertenezcan a la par
abola, obtenemos el siguiente sistema (una ecuaci
on por cada punto):

1 1 1 3
a + b + c = 3
3 = 12 a + 1 b + c
1 1 1 3

1 1 1 1 0 0 0 4
a+b+c=1
1 = 12 a + 1 b + c

2
1 1 1 2 0 2 0 5
a

b
+
c
=
2
2
=
(1)
a
+
(1)b
+
c

a b + c = 1
1 = (1)2 a + (1)b + c
1 1 1 1
0 2 0 2
que obviamente es incompatible (comp
arense, por ejemplo, las dos
ecuaciones normales de Gauss, AT Ax = AT b,

4 0 4
a
1
4 0 4 1
0 4 0 b = 3 0 4 0 3
4 0 4
c
4 0 4 1
1

primeras ecuaciones). Escribimos y resolvemos las


4 0
0 4
0 0

1
4 1
a
4 c
0 3 b = 43
c
0 0
c

que resultan ser un sistema compatible indeterminado (c R). Es decir, las par
abolas


3
1
+ c x2 x + c, c R
y=
4
4
son la solucion al problema planteado.
Ejercicio resuelto
Encontrar la circunferencia de la familia
x2 + y 2 + ax + by + c = 0

que mejor se ajuste, en el sentido de los mnimos cuadrados, a los puntos (0, 0), (1, 0), (0, 1) y (1, 1), indicando las
coordenadas del centro y el radio de la misma.
Exigimos que cada punto pertenezca a la circunferencia ax + by + c = x2 y 2 , con lo que obtenemos el sistema, de
cuatro ecuaciones y tres inc
ognitas,
(0, 0) :
(1, 0) :
(0, 1) :
(1, 1) :

0 a + 0 b + c = 02 02 = 0
1 a + 0 b + c = 12 02 = 1

0 a + 1 b + c = 02 12 = 1
1 a + 1 b + c = 12 12 = 2

que matricialmente se puede escribir como Ax = b

0 0 1
1 0 1

0 1 1
1 1 1

0
a

b = 1 .

1
c
2

El sistema que debemos resolver para encontrar la solucion en el


proporcionan las ecuaciones normales de Gauss, AT Ab = AT b,

0 0 1

0 1 0 1
a
0 1 0 1

0 0 1 1 1 0 1 b = 0 0 1 1
0 1 1

1 1 1 1
c
1 1 1 1
1 1 1
118

sentido de los mnimos cuadrados es el que nos

0
2
1
1
1
2
2

1 2
a
3
2 2 b = 3
2 4
c
4

que resolvemos facilmente


1 2
2 1 2 3
1 2 2 3 2 1
2 2 4 4
1 1


2 3
1 2
2
2 3 0 3 2
2 2
0 1 0


1
3
3 0
1
0

2 2 3
1 0 1 ,
0 2 0

con lo que obtenemos c = 0, b = 1 y a = 1. Es decir, la circunferencia que mejor ajusta en el sentido de los mnimos
cuadrados es
!2

2
2
2 
2


1
1
1
1
1
1
2
2
2
x +y xy = 0 x
+ y
=0 x
+ y
=
,
2
4
2
4
2
2
2

con centro en ( 12 , 12 ) y de radio 22 .


Observemos que, casualmente, el sistema Ax = b que obtenemos es compatible (ya que los cuatro puntos que nos
dan son los vertices de un cuadrado de lado unidad y con centro en ( 21 , 12 )). Sabemos entonces que la solucion en el
sentido de los mnimos cuadrados coincide con la solucion del sistema original.
Ejercicio resuelto
Determinar la c
onica de la familia
ax2 + 4axy + ay 2 + bx by + 1 = 0
que mejor se ajusta, en el sentido de los mnimos cuadrados, a los puntos (1, 0), (1, 0), (1, 1) y (0, 2).
Exigimos que cada punto pertenezca a la c
onica a(x2 + 4xy + y 2 ) + b(x y) + 1 = 0, con lo que obtenemos el sistema,
de cuatro ecuaciones y dos inc
ognitas,
(12 + 4 1 0 + 02 )a + (1 0)b + 1 = 0 a + b = 1,
((1)2 + 4(1) 0 + 02 )a + (1 0)b + 1 = 0 a b = 1,

(1, 0) :
(1, 0) :

((1)2 + 4(1) 1 + 12 )a + (1 1)b + 1 = 0 2a 2b = 1,


(02 + 4 0 2 + 22 )a + (0 2)b + 1 = 0 4a 2b = 1,

(1, 1) :
(0, 2) :

que matricialmente se puede escribir como Ax = b

1
1
1 1

2 2
4 2

a
b

1
1

=
1 .
1

El sistema que debemos resolver para encontrar la solucion en el sentido


proporcionan las ecuaciones normales de Gauss, AT Ab = AT b,

1 

 1
 
 1

1 1 2 4
1 1 a = 1 1 2 4 1
1 1 2 2 2 2 b
1 1 2 2 1
4 2
1

que resolvemos facilmente

22
4

4 4
10
4

22 4 4
22 55 22

de los mnimos cuadrados es el que nos

22 4
4 10

22 4 4
0 51 18



a
b

4
4

2
6
y a = 17
. Es decir, la c
onica que mejor ajusta, en el sentido de los mnimos cuadrados,
con lo que obtenemos b = 17
a la nube de puntos dada es
2
6
(x2 + 4xy + y 2 ) + (x y) + 1 = 0 2(x2 + 4xy + y 2 ) 6(x y) = 17.
17
17

Ejercicio resuelto

2
Consideremos la matriz A = 2
2

2 0
2 0 .
0 2

(a) Determinar una base y unas ecuaciones implcitas de Col(A) y (Nul(A)) .


(b) Obtener una base ortonormal de Col(A) y calcular la matriz de la proyeccion ortogonal sobre dicho subespacio.
(c) Siendo b = [0 2 2]T , encontrar las p
soluciones en el sentido de los mnimos cuadrados de Ax = b. Determinar,
entre ellas, las que tengan norma 5/4.

(d) Sea S = {v1 , . . . , vp } un conjunto ortonormal en Rn . Probar que S es linealmente independiente.


119

(a) Comentamos una de las diversas formas que hay para resolver este apartado.
Ecuaciones implcitas de Col(A): Como sabemos, para encontrar unas ecuaciones implcitas de un subespacio generado por varios vectores (en este caso los vectores columna de A) basta considerar un vector generico [x1 x2 x3 ]T e
imponer que sea combinaci
on lineal de dichos vectores.


2 2 0 x1
2
2
0
x1
2 2 0 x2 0
0
0 x2 x1 .
2 0 2 x3
-2 2 x3 x1
0
Comprobamos que la ecuaci
on implcita

x2 = x1

(8)

define a Col(A) y una base viene dada por


BCol(A)

2
2
= 2 , 2 .

2
0

Ecuaciones implcitas de (Nul(A)) : Comenzamos hallando una base de Nul(A), lo que se consigue sin mas que
resolver Ax = 0. De la eliminacion de Gauss anterior se desprende que unas ecuaciones equivalentes al sistema son

2x1 +2x2
=0,
2x2 +2x3 =0,
las cuales, una vez resueltas nos dan la siguiente base
BNul(A)

1
= 1 .

Para obtener unas ecuaciones implcitas de (Nul(A)) simplemente hemos de utilizar las componentes de los vectores
(s
olo uno en este caso) de la base como coeficientes en dichas ecuaciones. As tenemos que
x1 + x2 + x3 = 0

(9)

es una ecuaci
on implcita de (Nul(A)) .
(b) Como ya hemos hecho una eliminacion de Gauss con la matriz A, sabemos que una base del espacio Col(A) puede
estar formada por las dos primeras columnas de la matriz. Sin embargo, estos dos vectores no son ortogonales, as que
tendramos que ortogonalizar los vectores mediante el metodo de Gram-Schmidt.
Para evitar esos c
alculos solo tenemos que darnos cuenta (por simple inspeccion) de que las dos u
ltimas columnas
de A tambien forman una base de Col(A) y, ademas, es ortogonal. Dividiendo los dos vectores por su norma tendremos
la base ortonormal que pide el enunciado:

0
1/2
BCol(A) = 1/ 2 , 0 .

1
0
Siendo ahora

1/2 0
Q = 1/ 2 0 ,
0
1

la matriz de la proyeccion ortogonal sobre Col(A) se puede calcular como

1/2 1/2 0
1/2 0 
2
1/
2
0
1/
= 1/2 1/2 0 .
P = QQT = 1/ 2 0
0
0
1
0
0 1
0
1

Nota: Esta matriz es siempre la misma, independientemente de la base ortonormal escogida.


(c) Podemos resolver el problema usando las ecuaciones normales de Gauss, pero ya que tenemos, del apartado anterior,
la matriz P de la proyeccion ortogonal sobre Col(A), es mas corto calcular la proyeccion del vector b sobre Col(A) y
despues resolver
Ax = ProyCol(A) b.
Entonces, como

1
ProyCol(A) b = P b = 1 ,
2
120

el sistema que hemos de resolver es

2
2
2

2 0
x1
1
2 0 x2 = 1 .
0 2
x3
2

Realizamos ahora una eliminacion de Gauss, que


2 2 0 1
2 2 0 1
2 0 2 2
llegando a la forma escalonada reducida

1
1
0
1
0
0

es analoga a la que hicimos en



2 2 0 1
2
2
0 0 0 0 0
-2
0 2 2 1
0
0


0
1/2
1
1 1/2 0
0
0
0

0
1
0

el primer apartado,

0 1
2 1 ,
0 0

1
1
1 1/2 .
0
0

Es inmediato, tomando como variable libre x3 R, que la solucion del sistema es

x1
1
1
1 x3
x2 = 1/2 + x3 1 = 1/2 + x3 .
x3
0
1
x3
p
Veamos ahora cual de esas soluciones verifica que su norma es 5/4.


r

q
1 x3


1/2 + x3 = (1 x3 )2 + (1/2 + x3 )2 + x23 = 3x23 3x3 + 5 .


4


x3
p
Imponiendo que la norma sea 5/4 queda la condicion
3x23 3x3 = 0,

que nos da los valores x3 = 0 y x3 = 1. Sustituyendo en la solucion del sistema de mnimos cuadrados tenemos las dos
soluciones que pide el enunciado:

1
0
1/2 y 1/2 .
0
1

(d) Escribamos una combinaci


on lineal de los vectores de S igualada a cero:
1 v1 + . . . + p vp = 0.

En caso de que probemos que todos los coeficientes han de ser nulos tendremos que S es linealmente independiente.
Multiplicando escalarmente la expresion anterior por cualquiera de los vectores de S (digamos vi ) tendremos
1 (vi v1 ) + . . . + i1 (vi vi1 ) + i (vi vi ) + i+1 (vi vi+1 ) + . . . + p (vi vp ) = 0.
Por ser S ortonormal, vi vj = 0 siempre que j 6= i y ademas vi vi = 1. Llevando todo esto a la expresion anterior
tendremos
=0
=0
=1
=0
=0
z }| {
z }| {
z }| {
z }| {
z }| {
1 (vi v1 ) + . . . + i1 (vi vi1 ) +i (vi vi ) +i+1 (vi vi+1 ) + . . . + p (vi vp ) = 0,
quedando, por tanto,

i = 0.
Como el razonamiento no depende del subndice i escogido, acabamos de probar que todos los coeficientes de la
combinaci
on lineal son nulos y, de ese modo, S es linealmente independiente.

8.

Ejercicios.

Ejercicio 1. Dados los subespacios

0
E = Gen
2


2
0
1 1
,

2 , 2
3
1

obtener una base y unas ecuaciones implcitas de E y de F .


121

2x + y + 3z t = 0,
3x + 2y 2t = 0,
F

3x + y + 9z t = 0,

Ejercicio 2. Descomponer el vector (1, 3, 1, 4)T en suma de dos vectores u + v siendo u proporcional a (2, 1, 0, 1)T
y v u.
Ejercicio 3. Hallar la proyeccion ortogonal de los siguientes vectores sobre los subespacios que se indican:
(a) (4, 1, 3, 2)T sobre el subespacio definido por x1 + x2 + x3 + x4 = 0.
(b) (1, 1, 1, 1)T sobre el subespacio de R4 dado por:
E

x y + z 2t = 0,
y + z = 0.

(c) (3, 4, 5)T sobre el subespacio f (E) siendo f la aplicacion lineal dada por la matriz

1 0 1
A = 1 1 0
0 1 1
y E el subespacio de R3 dado por x y z = 0.

Ejercicio 4. Dados los subespacios de R3 ,


E {3x + y 2z = 0} y

F {x + 7y + z = 0, x y z = 0},

obtener una base de (E + F ) .


Ejercicio 5. Dadas las bases ortonormales de R2




T
T

B1 =
u1 = 1/ 2, 1/ 2 , u2 = 1/ 2, 1/ 2


T 

T
B2 =
w1 = 1/2, 3/2 , w2 = 3/2, 1/2

hallar la matriz correspondiente al cambio de una de esas bases a la otra. Comprobar que la matriz de paso es ortogonal.
Ejercicio 6. Hallar el vector perteneciente al subespacio de R4 generado por los vectores
(2, 0, 1, 2)T , (1, 2, 2, 0)T y (1, 2, 0, 2)T
que est
a mas cerca del vector (1, 1, 1, 1)T .
Ejercicio 7. Hallar la matriz de la proyeccion ortogonal sobre cada uno de los siguientes subespacios de R4 :
(a) el subespacio generado por (0, 2, 1, 0)T y (1, 1, 0, 1)T .
(b) el subespacio generado por (0, 0, 2, 1)T y (1, 1, 1, 0)T .

x 3y + z + t = 0
(c) Sobre E y E , siendo E
Comprobar que, como debe ser, la suma de ambas matrices
2x 5y + z + 2t = 0
vale I.
Ejercicio 8. Dado el subespacio S R3 definido por x1 2x2 + 2x3 = 0, se pide:
(a) Hallar la matriz de la proyeccion ortogonal sobre S. Cual es la matriz de la proyeccion ortogonal sobre S ?
(b) Obtener una base de S .
(c) Demostrar que Col (A) = S, siendo

2
A= 0
1
122

0
1 .
1

(d) Dado el vector v = (1, 1, 1)T , calcular el vector de S que dista menos de v.

Ejercicio 9. Aplicar el metodo de Gram-Schmidt a la siguiente base de R4 :




(1, 0, 1, 0)T , (1, 1, 0, 0)T , (0, 1, 1, 1)T , (0, 1, 1, 0)T .
Ejercicio 10. La proyeccion ortogonal del vector v = (5, 2, 3)T sobre la recta x = y, y = z es:
T
(1, 1, 1) .
T
(3, 3, 3) .
T
(2, 2, 2) .

Ejercicio 11. Halla una base ortonormal de Col (A) y otra de N ul (A) siendo

1
1
0
0 1
1
.
A=
1
1 1
1
1
1
Ejercicio 12. Dado el subespacio


con a, b R.
E = Gen (a, 0, 0, 0)T , (a, a, b, 0)T , (a, b, a, 1)T

(1) Hallar una base ortonormal del subespacio E seg


un los valores de a y b.
(2) Hallar la matriz de la proyeccion ortogonal sobre E, cuando a = 0.

(3) Calcular los valores de los par


ametros a y b tales que el subespacio dado por las ecuaciones

x1 = 0
5x1 + x2 + 3x3 = 0

2x1 + 3x2 x3 + x4 = 0
sea ortogonal a E.

Ejercicio 13. Sea A una matriz cuadrada de orden 25 cuyo rango es 21. Que sucede al aplicar el metodo de
Gram-Schmidt a los vectores columna de A? Cuantas veces? Por que?
Ejercicio 14. Resolver en el sentido de los mnimos cuadrados los siguientes sistemas de ecuaciones
(a) x = 1, x = 7, x = 3, x = 12.
(b) x = a1 , x = a2 , ..., x = an , siendo a1 , a2 , ..., an n
umeros reales. Que se obtiene cuando alguno de los valores ak
aparece repetido?
(c) Ax = b siendo
A=

1
1

1
1

yb=

2
4

Ejercicio 15. Resuelve en el sentido de los mnimos cuadrados los dos sistemas equivalentes siguientes (que tendran
las mismas soluciones exactas si fueran compatibles)


x1 + x2
= 3
x1 + x2 = 3
2x1 + 2x2 = 4
x1 + x2 = 1

123

Ejercicio 16. Dados el subespacio E = Gen

(a) Calcular una base de E .

[1, 0, 0, 1] , [0, 1, 0, 2] , [0, 0, 1, 1]

a1 b 1
a2 2

A=
a3 b 2 .
2 b3

y la matriz

(b) Hallar la matriz de la proyeccion ortogonal sobre E.


(c) Calcular A sabiendo que Col (A)) est
a contenido en E .
t

(d) Resolver en el sentido de los mnimos cuadrados, el sistema Ax = b con b = (1, 1, 0, 0) .


Ejercicio 17. Calcular las rectas de regresion y = ax + b y x = y + para los datos:
x
y

1 2
2 3

3 4
1 4

5 6
6 7

7
5

Ejercicio 18. Se supone que el n


umero de horas de autonoma de un avi
on est
a relacionada con las cantidades de
dos tipos de combustible x1 y x2 (que se pueden utilizar de manera indistinta o mezclados) mediante y = c1 x1 + c2 x2 .
Despues de realizar un experimento se obtienen los siguientes datos.
x1
x2
y

1
0
4

0 1
1 1
5 6

2 1
1 2
5 4

Cu
ales son los mejores coeficientes c1 y c2 en el sentido de los mnimos cuadrados?

Ejercicio 19. Consideremos el sistema

0 1 


1 1 x

1 1 y
2 1

1
1
.
3
3

Sus  ecuaciones

normales
 
6 1
x
4
=
.
1 4
y
8


6 2
2 4



x
y

2
4

6 2
2 4



x
y

4
8

de

Gauss

Ejercicio 20. Consideremos los vectores v1 , v2 , v3 y v4 de R4 y la matriz C dados por

1
1
0
1
8
1
1
1

C = v1
v1 =
2 , v2 = 2 , v3 = 2 , v4 = 1 ;
2
3
2
0

son:

v2 .

(a) Calcular la matriz de la proyeccion ortogonal sobre S = Gen {v1 , v2 , v3 }, el vector de S mas cercano a v4 y la
distancia de v4 a S.
(b) Resolver, en el sentido de los mnimos cuadrados, el sistema Cx = v3 .

124

También podría gustarte