Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Álgebra Lineal
Ortogonalidad
1
Dr. José Antonio Camarena Ibarrola
Septiembre, 2020
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Outline
La longitud de un vector
• La longitud del vector x se denota ||x||
• En 2 dimensiones es la longitud de la hipotenusa de un triángulo
rectángulo ||x||2 = x12 + x22
• En 3 dimensiones la longitud se obtiene por dos aplicaciones del teorema
de Pitágoras ||x||2 = x12 + x22 + x32
• Generalizando a n dimensiones ||x||2 = x12 + x22 + ... + xn2 = x T x
[Str06]
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Vectores Ortogonales
Si dos vectores x y y son ortogonales, se cumple ||x||2 + ||y ||2 = ||x − y ||2
De donde:
(x12 + x22 + ...xn2 ) + (y12 + y22 + ...yn2 ) = (x1 − y1 )2 + (x2 − y2 )2 + ...(xn − yn )2
(x1 y1 + x2 y2 + ...xn yn ) = 0
X y1
T
x y= xi yi = x1 ... xn : = x1 y1 + x2 y2 + ... + xn yn
yn
c1 v1T v1 = 0
Subespacios ortogonales
• Para que dos subespacios sean ortogonales se requiere que cada vector de
un subespacio sea ortogonal a cada uno de los vectores del otro subespacio
• Un subespacio de 1D puede ser ortogonal a un subespacio de 1D
• Un subespacio de 2D puede ser ortogonal a un subespacio de 1D
• Un subespacio de 2D NO puede ser ortogonal a un subespacio de 2D
• Ejemplo: Sea V el plano generado por los vectores v1 = (1, 0, 0, 0) y
v2 = (1, 1, 0, 0), mientras que W es la linea generada por el vector
w = (0, 0, 4, 5). Es fácil comprobar que V y W son ortogonales, pero
como son vectores en R 4 hay espacio para un tercer subespacio ortogonal,
la lı́nea L generada por el vector (0,0,5,-4), los tres son subespacios de R 4
y los tres (V , W , L) son ortogonales
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
• Sea la matriz
1 3
A= 2 6
3 9
• Todos los renglones son múltiplos del vector (1, 3), entonces el espacio
renglones es una lı́nea en R 2 donde están todos los múltiplos de (1,3) (no
solo los renglones de la matriz).
• Como la segunda columna es el triple de la primera, el vector (-3, 1)
pertenece N(A), el espacio nulo es una lı́nea en R 2
• Podemos ver que el vector (-3,1) que funciona como base de N(A) es
ortogonal al vector (1,3) que funciona como base de C (AT )
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo (continuación)
•
1 3
A= 2 6
3 9
• Todas las columnas son múltiplos del vector (1, 2, 3), entonces el espacio
columnas es una lı́nea en R 3 donde están todos los múltiplos de (1, 2, 3)
1 0 0 1 3 1 3
EA = −2 1 0 2 6 = 0 0
0 0 1 3 9 3 9
1 0 0 1 3 1 3
FEA = 0 1 0 0 0 = 0 0
−3 0 1 3 9 0 0
1 0 0 1 0 0 1 0 0
L−1 = FE = 0 1 0 −2 1 0 = −2 1 0
−3 0 1 0 0 1 −3 0 1
• Entonces los vectores (-2, 1, 0) y (-3 , 0, 1) funcionan como base para
N(AT ), es un plano en R 3 y es ortogonal a C (A) como pueden checarlo
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
Complementos Ortogonales
[Str06]
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
[Str06]
Ax = A(xr + xn ) = Axr + Axn = Axr + 0 = Axr = b
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Outline
[Str06]
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
[Str06]
||a|| es la hipotenusa del triángulo OaQ; senα = a2 /||a||, y cosα = a1 /||a||
b1 a1 b2 a2 a1 b1 + a2 b2
cosθ = cos(β−α) = cosβcosα+senβsenα = + =
||b|| ||a|| ||b|| ||a|| ||a|| ||b||
En conclusión, El producto interno de los vectores a y b es una medida del
coseno del ángulo entre ellos
aT b
cosθ =
||a|| ||b||
Se utiliza como medida de distancia entre vectores, la distancia coseno
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
(b − p)⊥a; aT (b − p) = 0
aT (b − x̂a) = 0; aT b − x̂aT a = 0
aT b aT b
x̂ = ; p = x̂a = a
aT a aT a
[Str06]
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
La desigualdad de Schwarz
||e||2 no puede ser negativo
||b − p||2 ≥ 0
T
2
b − a b a ≥ 0
T
a a
T 2
T (aT b)2 a b
b b−2 T + aT a ≥ 0
a a aT a
(b T b)(aT a) − (aT b)2
≥0
aT a
(b T b)(aT a) − (aT b)2 ≥ 0
(b T b)(aT a) ≥ (aT b)2
||b||2 ||a||2 ≥ (aT b)2
La desigualdad de Schwarz es
(aT b)
1≥ ; |cosθ| ≤ 1
||b|| ||a||
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
aT b 6
x̂ = = =2
aT a 3
• La proyección es entonces p = x̂a = (2, 2, 2)
• El ángulo entre a y b es
aT b 6
cosθ = = √ √
||a|| ||b|| 3 14
• Checando desigualdad de Schwarz
√ √
(aT b) ≤ ||b|| ||a||; 6≤ 3 14; 36 ≤ (3)(14); 36 ≤ 42
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
aT b
p = x̂a = a
aT a
• Podemos hacer un aparentemente sutil cambio
aT b
p=a
aT a
1 1
p= aaT b = Pb; P= aaT
aT a aT a
• aaT resulta en una matriz cuadrada de rango 1
• Ejemplo. La matriz que proyecta un vector sobre la linea definida por el
vector a = (1, 1, 1) es
1 1/3 1/3 1/3
1
1 T
P = T aa = 1 1 1 1 = 1/3 1/3 1/3
a a 3
1 1/3 1/3 1/3
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
• Observe que el espacio columnas de esta matriz es la lı́nea que pasa por
a = (1, 1, 1)
• El espacio nulo consiste de los vectores perpendiculares a a (Un plano
perpendicular a a)
• Como toda matrı́z de proyección P es simétrica y P 2 = P
• De hecho C (P) = N(P T )⊥ y C (P T ) = N(P)⊥ pero como P es simétrica,
entonces C (P) = C (P T )
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
dE 2
= 2(2x − b1 )2 + 2(3x − b2 )3 + 2(4x − b3 )4 = 0
dx
2b1 + 3b2 + 4b3 aT b
x̂ = 2 2 2
= T
2 +3 +4 a a
• la teorı́a de Cálculo confirma el enfoque del álgebra lineal (El vector error
e que conecta a b con p debe ser perpendicular a a)
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
[Str06]
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
• AT Ax̂ = AT b
• x̂ = (AT A)−1 AT b
• p = Ax̂ = A(AT A)−1 AT b
• Ejemplo, sea
1 42
A= 1b= 5 3 ;
0 60
2 1
1 1 0
2 5
AT A = 3 = 1
2 3 05 13
0 0
4
T −1 T 13 −5 1 1 0 2
x̂ = (A A) A b = 5 =
−5 2 2 3 0 1
6
1 2 4
2
p = Ax̂ = 1 3 = 5
1
0 0 0
4 4 0
e =b−p = 5 − 5 = 0
6 0 6
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Observaciones
Matriz de proyección
Ejemplo
Se toman 3 mediciones como se muestra en la figura:
[Str06]
1 −1 1
C
Ax = 1 1 = 1 =b
D
1 2 3
Convertimos Ax = b en AT Ax̂ = AT b
1 −1
T 1 1 1 3 2
A A= 1 1 =
−1 1 2 2 6
1 2
1
1 1 1 5
AT b = 1 =
−1 1 2 6
3
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
3 2 Ĉ 5
=
2 6 D̂ 6
De donde Ĉ = 9/7 y D̂ = 4/7 por lo que la mejor lı́nea es (4/7)t + 9/7
[Str06]
1 −1 5/7
9/7
p = Ax̂ = 1 1 = 13/7
4/7
1 2 17/7
1 5/7 2/7
e = b − p = 1 − 13/7 = −6/7 ; ||e||2 = e T e = 56/49
3 17/7 4/7
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Formulación rápida
1 t1 P
1 1 ... 1 1 t2 m P t2i
AT A = = P
t1 t2 ... tm : : ti ti
1 tm
b1 P
1 1 ... 1 b2 = P bi
AT b =
t1 t2 ... tm : ti bi
bm
Por lo tanto el sistema de ecuaciones que hay que resolver es:
P P
m P t2i Ĉ bi
P = P
ti ti D̂ ti bi
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Matrı́z Ortogonal
qiT qj = 0 ∀i 6= j
qiT q1 = 1 ∀i
• Una matriz es ortogonal si todas sus columnas conforman un conjunto
ortonormal de vectores y se denota por Q
• Si las columnas de Q son ortonormales entonces Q T Q = I
[Str06]
Matriz ortogonal
Base ortogonal
De donde:
x1 = q1T b
• De manera similar determinamos el valor de x2 como x2 = q2T b
• Todo el conjunto de coeficientes se determina como x = Q T b donde Q es
la matriz cuyas columnas son la base del espacio vectorial (q1 , q2 , ..., qn )
• Cualquier vector b es igual a (q1T b)q1 + (q2T b)q2 + ... + (qnT b)qn
• En otras palabras cualquier vector del espacio es igual a la suma de sus
proyecciones sobre los vectores ortogonales
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Matriz ortogonal
q1T y y1 + y2 + y3
Ĉ = = 2
q1T q1 1 + 12 + 12
Ortogonalización de Gram-Schmidt
Para obtener un conjunto de vectores ortonormales q1 , q2 , q3 a partir de un
conjunto de vectores independientes a, b, c se procede de la siguiente manera:
q1 = a/||a||
B = b − (q1T b)q1
q2 = B/||B||
C = c − (q1T c)q1 − (q2T c)q2
q3 = C /||C ||
[Str06]
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
Sean los siguientes vectores independientes
1 1 2
a = 0 , b = 0 , c= 1
1 0 0
√
1/ 2
q1 = a/||a|| = 0√
1/ 2
√
1 √ √ 1 1/ 2 1/2
T
B = b −(q1 b)q1 = 0 − 1/ 2 0 1/ 2 0 0√ = 0
0 0 1/ 2 −1/2
√
1/ 2
q2 = B/||B|| = 0√
−1/ 2
C = c − (q1T c)q1 − (q2T c)q2
√ √
2
1 1 2 1/ 2
1 1 2 1/ 2
C = 1 − √ 0 √ 1 0√ − √ 0 −√ 1 0√
0 2 2 0 1/ 2 2 2 0 −1/ 2
0 0
C = 1 q3 = C /||C || = 1
0 0
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Matriz ortogonal
Ortogonalización de Gram-Schmidt
• El proceso de ortogonalización de Gram-Schmidt comienza con un
conjunto de vectores independientes a1 , a2 , ..., an
• En el paso j substrae de aj sus proyecciones en las direcciones de los
vectores q1 , q2 , ..., qj−1 los cuales ya son ortogonales entre ellos
Factorización QR
[Str06]
b= (q1T b)q1 + (q2T b)q2
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Matriz ortogonal
Entonces
b = (q1T b)q1 + (q2T b)q2
De manera similar
[Str06]
Entonces podemos descomponer una matrı́z A en dos factores, una matriz
ortogonal Q y una matrı́z triangular superior R
A = QR
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
Para el ejemplo
1
√ √
1 1
q1T a = √ 0 √ 0 = 2/ 2 = 2
2 2 1
1
√
1 1
q1T b = √ 0 √ 0 = 1/ 2
2 2 0
1
√
1 1
q2T b = √ 0 − √ 0 = 1/ 2
2 2 0
2
T 1 1
q1 c = √ 0 √ 1 = sqrt2
2 2 0
2
T 1 1
q2 c = √ 0 − √ 1 = sqrt2
2 2 0
2
q3T c = [0 1 0] 1 = 1
0
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Ejemplo
[Str06]
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
QRx = b
Q T QR x̂ = Q T b
Pero como Q es ortogonal Q −1 = Q T
R x̂ = Q T b
El espacio de Hilbert
v T w = v1 w1 + v2 w2 + v3 w3 + ... = 0
Espacio de funciones
• El conjunto de valores que puede tomar una función en un intervalo finito
se pude ver como un vector con un número infinito de valores, por ejemplo
la función f (x) = sen(x) en el intervalo de 0 a 2π
• Para encontrar la magnitud de una función integramos en lugar de sumar
Z 2π Z 2π
||f ||2 = f 2 (x)dx = sen2 (x)dx = π
0 0
Series de Fourier
Un sinnúmero de funciones se pueden expresar como una serie de Fourier que se puede
ver como una combinación lineal de senos y cosenos
f (x) = a0 + a1 cos(x) + b1 sen(x) + a2 cos(2x) + b2 sen(2x) + ...
Para calcular el coeficiente de Fourier a1 multiplicamos ambos miembros por cos(x) e
integramos
R 2π R 2π
+ a1 02π cos 2 (x)dx + b1 02π sen(x)cos(x)dx +
R R
0 R f (x)cos(x)dx = a0 0 cos(x)dx
2π R 2π
a2 0 cos(2x)cos(x)dx + b2 0 sen(2x)cos(x)dx + ...
Gracias a que todos estos senos y cosenos son funciones ortogonales, este cálculo se
reduce a solo Z 2π Z 2π
f (x)cos(x)dx = a1 cos 2 (x)dx
0 0
De donde R 2π
0 f (x)cos(x)dx (f , cos(x))
a1 = R 2π =
cos 2 (x)dx (cos(x), cos(x))
0
Se puede ver la analogı́a, el componente del vector b sobre la linea a es (b T a)/(aT a)
• Hay muchas funciones útiles para conformar una base para un espacio
funcional
• Por ejemplo 1, x, x 2 , x 3 , ...
• Conviene ortogonalizar en el intervalo de -1 a 1 pues en ese intervalo al
menos dos parejas ya son ortogonales (1, x) = 0 y (x, x 2 ) = 0
• Como v1 = 1 y v2 = x ya son ortogonales en ese intervalo, iniciamos la
ortogonalización con x 2
(1, x 2 ) (x, x 2 )
v3 = x 2 − 1− x
(1, 1) (x, x)
R1 2
x dx 1
v3 = x − R−1
2
1
= x2 −
1dx 3
−1
Dudas
antonio.camarena@umich.mx
Vectores ortogonales y subespacios vectoriales ortogonales Proyecciones sobre lineas
Bibliografı́a
Gilbert Strang.
Linear algebra and its applications.
Thomson, Brooks/Cole, Belmont, CA, 2006.