Está en la página 1de 75

Análisis matricial

Martı́n D. Safe

Departamento de Matemática, Universidad Nacional del Sur

Métodos Numéricos “A”


2.o cuatrimestre 2020
Vectores y normas (1)

I Para analizar errores en problemas numéricos que involucran


vectores, es útil introducir la noción de norma.
I Los vectores con los que trabajaremos serán usualmente
vectores de Rn para alguna dimensión n.
I Sin embargo, los normas se pueden definir en cualquier
espacio vectorial.
Espacios vectoriales (2)
La noción de espacio vectorial es una abstracción de los conjuntos
de vectores en el Plano (o en el Espacio) con las operaciones de
suma de vectores y de multiplicación de un vector por un escalar.

Un R-espacio vectorial es un conjunto V, cuyos elementos se


llaman vectores, provisto de dos operaciones:
I una suma + : V × V → V tal que:
I u + (v + w) = (u + v) + w para todos los vectores u, v, w ∈ V
I u + v = v + u para todo los vectores u, v ∈ V
I Existe un vector nulo 0 ∈ V tal que 0 + v = v para todo v ∈ V
I Para todo v ∈ V existe un −v ∈ V tal que v + (−v) = 0
I un producto por escalar · : R × V → V tal que:
I λ(u + v) = λu + λv para todos λ ∈ R y u, v ∈ V
I (λ + η)v = λv + ηv para todos λ, η ∈ R y v ∈ V
I λ(ηv) = (λη)v para todos λ, η ∈ R y todo v ∈ V
I 1 · v = v para todos v ∈ V
En este contexto, los elementos de R se llaman escalares.
Espacios vectoriales: ejemplos (3)

Los ejemplos más importantes de R-espacios vectoriales son:

I El conjunto V = Rn (n ∈ N) con la suma y con el producto


por escalar habituales:

(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ) y


λ(x1 , . . . , xn ) = (λx1 , . . . , λxn )

es un R-espacio vectorial.
I El conjunto V = Rm×n (m, n ∈ N) de matrices m × n con la
suma y con el producto por escalar habituales:

(aij ) + (bij ) = (aij + bij ) y λ(aij ) = (λaij )

es un R-espacio vectorial.
Normas (4)

I Las normas son funciones que asignan una ‘longitud’ a cada


uno de los vectores de un espacio vectorial.
I La norma más usual e intuitiva en R2 es la norma euclı́dea
definida para cada vector x = (x1 , x2 ) ∈ R2 por
q
kxk2 = x21 + x22 .

I Sin embargo, nos encontraremos con situaciones en las que


será más útil recurrir a otras normas.
I También nos hallaremos en situaciones en las que alcanza con
verificar una condición en una norma cualquiera. Esto nos
permitirá elegir hacer nuestros cálculos en la norma que nos
resulte más conveniente.
Normas (5)
La noción de norma en un espacio vectorial se definen a través de
ciertas condiciones que uno asociarı́a naturalmente a una noción
de ‘longitud’.
Sea V un R-espacio vectorial. Una norma de V es una función
k · k : V → R tal que para todos x, y ∈ V y todo λ ∈ R:
I No negatividad: kxk > 0;
I Positividad: kxk = 0 si y sólo si x = 0;
I Homogeneidad: kλxk = |λ| kxk;
I Desigualdad triangular: kx + yk 6 kxk + kyk.

x+y y

x
Norma de la diferencia (6)
Lema
Si V es un R-espacio vectorial y k · k es una norma de V entonces

kxk − kyk 6 kx − yk, para todos x, y ∈ V.

Demostración.
Como x = y + (x − y) entonces, por la desigualdad triangular,
kxk 6 kyk + kx − yk. Luego,

kxk − kyk 6 kx − yk. (1)

Razonando igual pero intercambiando x e y, kyk − kxk 6 ky − xk.


Además, ky − xk = k(−1)(x − y)k = |(−1)|kx − yk = kx − yk por
la homogeneidad. Combinando ambas cosas, obtenemos

kyk − kxk 6 kx − yk. (2)



De (1) y (2) se sigue que kxk − kyk 6 kx − yk.
Normas (7)
Nos interesan especialmente las normas de Rn .
Algunos ejemplos importantes de normas de Rn son:
P
I kxk1 = n i=1 |xi | (norma uno).
qP
I kxk2 = n 2
i=1 xi (norma euclı́dea).
I kxk∞ = máx16i6n |xi | (norma infinito).

Por ejemplo:
Si x = (−6, 0, 5) entonces

kxk1 = | − 6| + |0| + |5| = 11


q √
kxk2 = (−6)2 + 02 + 52 = 61
kxk∞ = máx{| − 6|, |0|, |5|} = 6.

Ejercicio:
Verificar que k · k1 y k · k∞ cumplen la desigualdad triangular.
Producto interno canónico (8)
q
I La norma euclı́dea del Plano kxk2 = x21 + x22 está asociada
con el producto interno hx, yi = x1 y1 + x2 y2 .
I Recordemos que si x, y ∈ R2 son no nulos entonces
hx, yi = kxk2 kyk2 cos θ donde θ es el ángulo entre x e y.
I De aquı́ que x e y son ortogonales si y sólo si hx, yi = 0.
I En general, la norma euclı́dea de Rn está asociada al producto
interno canónico de Rn definido de la siguiente forma.

El producto interno canónico de dos vectores x = (x1 , . . . , xn ) e


y = (y1 , . . . , yn ) de Rn , denotado hx, yi, es

hx, yi = x1 y1 + x2 y2 + · · · + xn yn .

Por ejemplo: Si x = (−2, 0, 5) e y = (7, −3, 1) entonces

hx, yi = (−2) × 7 + 0 × (−3) + 5 × 1 = −11.


Producto interno canónico (9)
Convenimos que, cuando operemos con vectores de Rn como
matrices, los identificaremos con matrices columna. Explı́citamente,
el vector x = (x1 , x2 , . . . , xn ) ∈ Rn se corresponderá con la matriz
 
x1
 x2 
 ..  .
 
 . 
xn

Con esta convención, si x, y ∈ Rn , entonces yT x coincide con el


producto interno canónico hx, yi. En efecto,
 T    
y1 x1 x1
 y2   x2   x2 
yT x =  ..   ..  = y1 y2 . . . yn  .. 
      
 .   .   . 
yn xn xn
= x1 y1 + x2 y2 + · · · + xn yn = hx, yi.
Producto interno canónico (10)
Las siguientes propiedades del producto interno canónico se siguen
de inmediato de la definición:
I No negatividad: hx, xi > 0;
I Positividad: hx, xi = 0 si y sólo si x = 0;
I Aditividad: hx + y, zi = hx, zi + hy, zi;
I Homogeneidad: hλx, yi = λhx, yi para todo λ ∈ R;
I Simetrı́a: hx, yi = hy, xi.

Notemos que si x = (x1 , x2 , . . . , xn ) ∈ Rn entonces

hx, xi = x21 + x22 + · · · + x2n = kxk22 .

Por lo tanto:
p
kxk2 = hx, xi.
Desigualdad de Cauchy-Schwarz (11)
Teorema (Desigualdad de Cauchy-Schwarz)
Si x, y ∈ Rn entonces

|hx, yi| 6 kxk2 kyk2 .

Una consecuencia importante es que permite introducir una noción


de ángulo θ entre dos vectores no nulos x e y de Rn mediante

hx, yi
cos θ = ,
kxk2 kyk2

ya que asegura que la expresión de la derecha es menor o igual a 1


en valor absoluto.

En particular, cuando hx, yi = 0 tendremos que cos θ = 0 y


diremos que los vectores x e y son ortogonales.
Desigualdad de Cauchy-Schwarz (12)
La desigualdad de Cauchy-Schwarz implica también lo siguiente.
Proposición
k · k2 es una norma de Rn .
Demostración.
La condiciones de no negatividad, positividad y homogeneidad de
la definición de norma se siguen claramente de la definición de
kxk2 . Veamos que la desigualdad triangular es consecuencia de la
desigualdad de Cauchy-Schwarz. En efecto,

kx + yk22 = hx + y, x + yi
= hx, xi + hx, yi + hy, xi + hy, yi
= kxk22 + 2hx, yi + kyk22
6 kxk22 + 2kxk2 kyk2 + kyk22 = (kxk2 + kyk2 )2 .

Luego, por la no negatividad, kx + yk2 6 kxk2 + kyk2 .


Normas p (13)

Si 1 6 p < ∞, se define la norma p de Rn como


!1/p
X
n
kxkp = |xi |
p
para cada x ∈ Rn .
i=1

I Cuando p = 1 y cuando p = 2 se obtienen la norma uno kxk1


y la norma euclı́dea kxk2 .
I Además, lı́mp→+∞ kxkp = kxk∞ .

I Satisfacen que 1 6 p1 < p2 6 ∞ entonces kxkp2 6 kxkp1 .

I El teorema que asegura la desigualdad triangular para la


norma p se conoce como desigualdad de Minkowski.
Normas p (14)
Teorema (Desigualdad de Minkowski)
Si 1 6 p < ∞ y x, y ∈ Rn entonces
!1/p !1/p !1/p
X
n X
n X
n
|xi + yi |
p
6 |xi |
p
+ |yi |
p
.
i=1 i=1 i=1

Equivalentemente, kx + ykp 6 kxkp + kykp .

Otra desigualdad importante para normas p es la siguiente.


Teorema (Desigualdad de Hölder)
1 1
Si 1 6 p, q < ∞ y + = 1 entonces
p q

|hx, yi| 6 kxkp kykq para todos x, y ∈ Rn .

La desigualdad de Cauchy-Schwarz es un caso especial (p = q = 2).


Normas p en Octave (15)
>> x = [ -6 0 5];
>> format long
>> norm (x ,1)
ans = 11
>> sum ( abs ( x ) )
ans = 11
>> norm (x ,2)
ans = 7.81024967590666
>> sqrt (( -6) ^2 + 0^2 + 5^2)
ans = 7.81024967590665
>> norm (x ,4)
ans = 6.62036358530423
>> (( -6) ^4 + 0^4 + 5^4) ^(1/4)
ans = 6.62036358530423
>> norm (x , inf )
ans = 6
>> max ( abs ( x ) )
ans = 6
Normas p (16)
Algunas bolas unitarias (kxkp 6 1) en R2 :

kxk1 6 1 kxk2 6 1

kxk4 6 1 kxk∞ 6 1
Normas p (17)
I Si 0 < p < 1 entonces kxkp no es una norma.
I En efecto, podemos ver con un ejemplo que si 0 < p < 1 no
se verifica la desigualdad triangular.
Si x = (1, 0, 0 . . . , 0) e y = (0, 1, 0 . . . , 0) entonces
kx + ykp = (1p + 1p )1/p = 21/p > 2 = kxkp + kykp .
I Otra razón es que la bola unitaria de toda norma es siempre
un conjunto convexo: si dos puntos pertenecen entonces todos
los puntos en el segmento que los une también.
Y esto no se verifica cuando 0 < p < 1. Por ejemplo:

p = 2/3 p = 1/2
Error relativo y error relativo (18)

Las normas de Rn nos permiten definir una noción de error


absoluto y un error relativo cuando el resultado computado es un
vector.

Sea k · k una norma de Rn . Los errores absoluto y relativo de


x̂ ∈ Rn como aproximación de x ∈ Rn con respecto a esa norma
se definen por:
I Error absoluto:

kx̂ − xk

I Error relativo:
kx̂ − xk
(si x 6= 0)
kxk
Error relativo y error absoluto (19)
I Supongamos que queremos medir el error cometido en un
valor computado x̂ = (111, −2, 15) como aproximación de un
valor exacto x = (83, −5, 12).
I El error absoluto dependerá de la norma:

kx̂ − xk1 = |111 − 83| + |(−2) − (−5)| + |15 − 12|


= 28 + 3 + 3 = 34
q
kx̂ − xk2 = (111 − 83)2 + (−2 − (−5))2 + (15 − 12)2
p √
= 282 + 32 + 32 = 802 ≈ 28,32
kx̂ − xk∞ = máx{|111 − 83|, | − 2 − (−5)|, |15 − 12|}
= máx{28, 3, 3} = 28.

I Al menos sabemos que kx̂ − xk∞ 6 kx̂ − xk2 6 kx̂ − xk1 se


satisface siempre.
Error relativo y error absoluto (20)
I De la misma forma, el error relativo dependerá de la norma:
kx̂ − xk1 |111 − 83| + | − 2 − (−5)| + |15 − 12|
=
kxk1 |83| + | − 5| + |12|
34
= = 0,34
100
p
kx̂ − xk2 (111 − 83)2 + (−2 − (−5))2 + (15 − 12)2
= p
kxk2 832 + (−5)2 + 122

802
=√ ≈ 0,33709
7058
kx̂ − xk∞ máx{|111 − 83|, | − 2 − (−5)|, |15 − 12|}
=
kxk∞ máx{|83|, | − 5|, |12|}
28
= ≈ 0,33735.
83
I Al contrario que los errores absolutos, los errores relativos
correspondientes a p = 1, 2 e ∞ no tienen un orden
determinado entre sı́ (pueden estar en cualquier orden).
Equivalencia entre normas (21)
Teorema (de equivalencia entre normas)
Si k · k y k · k 0 son dos normas cualesquiera de Rn entonces existen
constantes positivas Cm y CM (que dependen de n y de las
normas involucradas) tales que

Cm kxk 6 kxk 0 6 CM kxk, para todo x ∈ Rn .

Ejemplos:
I En R3 ,
1
√ kxk1 6 kxk2 6 kxk1
3
y

kxk∞ 6 kxk2 6 3kxk∞ .
Equivalencia entre normas (22)

I En general, en Rn ,

1
√ kxk1 6 kxk2 6 kxk1
n
y

kxk∞ 6 kxk2 6 nkxk∞ .

I También en Rn , se tiene que

1
kxk1 6 kxk∞ 6 kxk1 6 nkxk∞ .
n
(Ejercicio: Demostrar estas desigualdades.)
Equivalencia de normas (23)
I Sean k · k y k · k 0 son dos normas cualesquiera de Rn .
I Por la equivalencia de normas existen constantes positivas Cm
y CM tales que

Cm kxk 6 kxk 0 6 CM kxk para todo x ∈ Rn .

I Luego, si x̂ ∈ Rn es una aproximación de x ∈ Rn entonces los


errores absolutos en ambas normas están relacionados por

Cm kx̂ − xk 6 kx̂ − xk 0 6 CM kx̂ − xk.

I Y si x 6= 0, los errores absolutos están relacionados por

Cm kx̂ − xk kx̂ − xk 0 CM kx̂ − xk


6 0
6 .
CM kxk kxk Cm kxk
I Los errores absolutos y relativos con respecto a distintas
normas son equivalentes en el mismo sentido que las normas
son equivalentes.
Convergencia (con respecto a una norma) (24)
Sea k · k una norma cualquiera de Rn . Se dice que una sucesión
{x(k) } = {x(1) , x(2) , . . .} de vectores de Rn converge a un vector
x ∈ Rn con respecto a la norma k · k si y sólo si

lı́m kx(k) − xk = 0
k→∞

En tal caso, x se dice el lı́mite de {x(k) } con respecto a k · k.

Notemos que si la sucesión {x(k) } tiene lı́mite con respecto a una


norma k · k entonces es único. En efecto, si tiene lı́mites x, x 0 ∈ Rn
entonces, usando la desigualdad triangular,

0 6 kx − x 0 k = k(x − x(k) ) + (x(k) − x 0 )k


6 kx − x(k) k + kx(k) − x 0 k.

Como esta última expresión tiende a 0, necesariamente x = x 0 .


Convergencia (con respecto a una norma) (25)
Una consecuencia importante del teorema de equivalencia de
normas es que la convergencia en Rn es independiente de la norma.
Teorema
Sean k · k y k · k 0 son dos normas cualesquiera de Rn , sea {x(k) }
una sucesión de vectores en Rn y sea x ∈ Rn . Entonces {x(k) }
tiene lı́mite x con respecto a k · k si y sólo si {x(k) } tiene lı́mite x
con respecto a k · k 0 .

En efecto, por la equivalencia de normas,

Cm kxk 6 kxk 0 6 CM kxk, para todo x ∈ Rn ,

para constantes positivas Cm y CM . En particular,

Cm kx(k) − xk 6 kx(k) − xk 0 6 CM kx(k) − xk, para todo k ∈ N.

De modo que kx(k) − xk → 0 si y sólo si kx(k) − xk 0 → 0.


Convergencia y norma (26)
Otra propiedad de las normas es la siguiente.
Proposición
Sea {x(k) } una sucesión de vectores de Rn que converge a un
x ∈ Rn . Entonces, para toda norma k · k de Rn ,
x → kxk cuando k → ∞.
(k)

Esto es porque, por una proposición anterior,



kyk − kxk 6 ky − xk.

Tomando y = x(k) obtenemos



(k)
x − kxk 6 x(k) − x .

Y como x(k) − x → 0 entonces kx(k) → kxk cuando k → ∞.



Normas matriciales (27)

La definición de norma aplica a cualquier R-espacio vectorial V.

En particular, aplica al espacio V = Rn×n de las matrices n × n


de números reales.

Por la definición, una norma de Rn×n es una función


k · k : Rn×n → R tal que para todas las matrices A, B ∈ Rn×n y
todo λ ∈ R satisface las siguientes propiedades:
I No negatividad: kAk > 0;
I Positividad: kAk = 0 si y sólo si A = 0;
I Homogeneidad: kλAk = |λ| kAk;
I Desigualdad triangular: kA + Bk 6 kAk + kBk.
Normas matriciales (28)

Para distinguir entre unas y otras, a las normas de Rn las


llamaremos normas vectoriales, mientras que a las normas de
Rn×n las llamaremos normas matriciales.

La consistencia es una propiedad deseable para las normas


matriciales.

Una norma k · k de Rn×n se dice consistente si

kABk 6 kAk · kBk, para todas A, B ∈ Rn×n .

Veremos ahora de qué forma cada norma vectorial induce una


norma matricial que además es consistente.
Norma inducida por una norma vectorial (29)
La norma de Rn×n inducida por una norma k · k de Rn es:

kAk = máx kAxk para todo A ∈ Rn×n .


kxk=1

Usamos la misma notación para la norma vectorial y la norma


matricial que induce.
Ejemplo:  
1/4 7/8
A=
−1/2 −1/2
I Con norma vectorial uno: kAk1 = 11/8 = 1,375.

1 11
8

kxk1 = 1 Ax : kxk1 = 1
Norma inducida por una norma vectorial (30)
I Con norma vectorial infinito: kAk∞ = 9/8 = 1,125.

9
1 8

kxk∞ = 1 Ax : kxk∞ = 1

I Con la norma vectorial euclı́dea: kAk2 = 5/2 ≈ 1,11803.


1 5
2

kxk2 = 1 Ax : kxk2 = 1
Norma inducida por una norma vectorial (31)
El siguiente teorema afirma que la definición de norma inducida es
siempre correcta.
Teorema
Toda norma inducida por una norma de Rn es efectivamente una
norma de Rn×n .

Veamos por ejemplo que vale la desigualdad triangular:

kA + Bk = máx k(A + B)xk


kxk=1

= máx kAx + Bxk


kxk=1

6 máx (kAxk + kBxk)


kxk=1

6 máx kAxk + máx kBxk


kxk=1 kxk=1

= kAk + kBk.
Norma inducida por una norma vectorial (32)
La siguiente proposición da otra expresión para la norma inducida.
Proposición
La norma de k · k de Rn×n inducida por una norma vectorial k · k
de Rn satisface
kAxk
kAk = máx .
x6=0 kxk

En particular, kAxk 6 kAkkxk para todo x ∈ Rn .

Proposición
Toda norma de Rn×n inducida por una norma vectorial de Rn es
consistente.

En efecto, como kABxk 6 kAkkBxk 6 kAkkBkkxk entonces

kABk = máx kABxk 6 máx kAkkBkkxk = kAkkBk.


kxk=1 kxk=1
Norma inducida por una norma vectorial (33)

Proposición
Si k · k1 es la norma de Rn×n inducida por la norma uno de Rn :
Xn
kAk1 = máx |aij |.
16j6n
i=1

Es decir, es el máximo entre las sumas de los valores absolutos de


cada una de las columnas de A.
Norma inducida por una norma vectorial (34)
Ejemplo:
 
1/4 7/8
A=
−1/2 −1/2

1 11
8

kxk1 = 1 Ax : kxk1 = 1

X
n 
1 1 7 1

kAk1 = máx |aij | = máx + , +
16j6n 4 2 8 2
i=1
 
3 11 11
= máx , = .
4 8 8
Norma inducida por una norma vectorial (35)

Proposición
Si k · k∞ es la norma de Rn×n inducida por la norma infinito de
Rn :
Xn
kAk∞ = máx |aij |.
16i6n
j=1

Es decir, es el máximo entre las sumas de los valores absolutos de


cada una de las filas de A.
Norma inducida por una norma vectorial (36)
Ejemplo:
 
1/4 7/8
A=
−1/2 −1/2

9
1 8

kxk∞ = 1 Ax : kxk∞ = 1

X
n 
1 7 1 1

kAk∞ = máx |aij | = máx + , +
16i6n 4 8 2 2
j=1
 
9 9
= máx ,1 = .
8 8
Norma inducida por una norma vectorial (37)

Si A ∈ Rn×n , se llama radio espectral de A y se denota ρ(A) al


máximo entre los módulos de todos los autovalores de A (es
decir, incluyendo los autovalores complejos no reales).

Por ejemplo, si
 
3 5 0
A = −1 3 0
4 0 2
√ √
entonces sus autovalores son 3 + 5i, 3 − 5i y 2. Luego
√ √
ρ(A) = máx{|3 + 5i|, |3 − 5i|, |2|}
√ √
= máx{ 14, 14, 2}

= 14 ≈ 3,74.
Norma inducida por una norma vectorial (38)

Teorema
Si A ∈ Rn×n y k · k2 es la norma de Rn×n inducida por la norma
euclı́dea de Rn entonces
q
kAk2 = ρ(AT A).

Más aún,
kAvk2
kAk2 =
kvk2

para todo autovector v de AT A asociado a un autovalor µ tal que


|µ| = ρ(AT A).

La norma k · k2 de Rn×n inducida por la norma euclı́dea de Rn


recibe el nombre de norma espectral.
Norma inducida por una norma vectorial (39)
Ejemplo:
 
1/4 7/8
A=
−1/2 −1/2


5
2

kxk2 = 1 Ax : kxk2 = 1

Los autovalores de
 
T 5/16 15/32
A A=
15/32 65/64
son 5/4 y 5/64. Luego, ρ(AT A) = 5/4. Por lo tanto,

5
q
T
kAk2 = ρ(A A) = .
2
Norma inducida por una norma vectorial (40)
Además el teorema nos dice que el máximo
kAvk2
kAk2 =
kvk2
se alcanza en los autovectores v asociados al autovalor 5/4.
Los autovectores asociados a 5/4 son los múltiplos no nulos de
v = (1, 2).
Y efectivamente:
     
1/4 7/8 1 2

kAvk2 −1/2 −1/2 2 2 −3
=   =  2 2
kvk2 1

1

2 2
2 2

q
2
22 + − 23

5/2 5
= √ = √ = = kAk2 .
2
1 +2 2 5 2
Norma inducida por una norma vectorial (41)

Si A es una simétrica (AT = A) entonces ρ(AT A) = ρ(A)2 .


En ese caso, el teorema anterior se simplifica de la siguiente forma.
Corolario
Si A ∈ Rn×n es simétrica entonces su norma espectral es

kAk2 = ρ(A).

Más aún,
kAvk2
kAk2 =
kvk2

para todo autovector v de A asociado a un autovalor λ tal que


|λ| = ρ(A).
Norma Frobenius (42)

La norma Frobenius de A = (aij ) ∈ Rn×n se define por


 1/2
Xn X
n
kAkF =  a2ij  .
i=1 j=1

Por ejemplo, si
 
1/4 7/8
A=
−1/2 −1/2

entonces

85
q
kAkF = (1/4)2 + (7/8)2 + (−1/2)2 + (−1/2)2 = ≈ 1,1524.
8
Notar que coincide con el resultado de aplicar la norma euclı́dea de
R4 al vector (1/4, 7/8, −1/2, −1/2).
Norma Frobenius (43)
La desigualdad de Cauchy-Schwarz implica lo siguiente.
Teorema
La norma Frobenius de Rn×n es una norma consistente. Es decir,
si A, B ∈ Rn×n entonces kABkF 6 kAkF kBkF .

Notemos que si I denote la matriz identidad n × n entonces para


toda norma inducida

kIk = máx kIxk = máx kxk = 1.


kxk=1 kxk=1

√ √
Pero como kIkF = 12 + · · · + 12 = n, la norma Frobenius no
es una norma inducida por ninguna norma vectorial si n > 2.
p
Se puede comprobar que kAkF = tr(AT A) donde la tr(·) denota
la traza, es decir, la suma de las entradas en la diagonal principal.
Norma no consistente (44)
I La función

kAk(∞) = máx |aij | para cada A ∈ Rn×n


16i6n
16j6n

es una norma de Rn×n .


I kAk(∞) se obtiene pensando a la matriz n × n A como un
vector con n2 componentes y aplicando la norma vectorial
2
k · k∞ de Rn .
I La norma kAk(∞) no coincide en general con la norma
inducida kAk∞ .
Por ejemplo, si A = ( 11 11 ) entonces kAk(∞) = 1 6= kAk∞ = 2.
I La norma k · k(∞) es un ejemplo de norma no consistente.
Por ejemplo, si A = ( 11 11 ) entonces A2 = ( 22 22 ). Por lo tanto,
2 = kA2 k(∞) > kAk2(∞) = 1.
Equivalencia entre normas matriciales (45)
I También vale la equivalencia de normas en Rn×n : todo par
de normas de Rn×n son equivalentes entre sı́.
I Por ejemplo,
kAkα 6 cα,β kAkβ , para toda A ∈ Rn×n ,
donde cα,β viene dada por:
α\β 1 2 ∞ F
√ √
1 1 n n n
√ √
2 n 1 n 1
√ √
∞ n n 1 n
√ √ √
F n n n 1
De esta tabla se siguen por ejemplo que
1 √
√ kAk∞ 6 kAk2 6 nkAk∞
n
y

kAk2 6 kAkF 6 nkAk2 .
Normas matriciales en Octave (46)

>> A = [1/4 7/8


-1/2 -1/2];
>> format long
>> norm (A ,1)
ans = 1.37500000000000
>> norm (A , inf )
ans = 1.12500000000000
>> norm (A ,2)
ans = 1.11803398874990
>> sqrt ( eigs (A ’* A ,1 ," lm ") )
ans = 1.11803398874989
>> norm (A ," fro ")
ans = 1.15244305716161
>> sqrt ( trace (A ’* A ) )
ans = 1.15244305716161
Número de condición de una matriz (47)

I Vamos a utilizar normas de vectores y matrices para el


problema de acotar el error en la solución de un sistema de
ecuaciones lineales Ax = b.
I Si las matrices A y b se almacenan en precisión finita, habrá
inevitablemente errores de redondeo.
I Más aún, las entradas de A y b podrı́an ser el resultado de un
experimento o una medición, y por lo tanto sujetas a error o
incerteza acerca de sus entradas.
I ¿Cómo afectan a la solución estos errores en las entradas de
las estas matrices?
Número de condición de una matriz (48)
I Consideremos el sistema de ecuaciones lineales

x1 + 1,00001x2 = 2
x1 + x2 = 2.
La solución exacta es (x1 , x2 ) = (2, 0).
I Consideremos ahora un segundo sistema de ecuaciones lineales
con una ligera perturbación del lado derecho:

x1 + 1,00001x2 = 2,00001
x1 + x2 = 2.
La solución exacta de este sistema es (x1 , x2 ) = (1, 1), que
prácticamente no guarda relación en términos relativos con la
solución del sistema original.
I Notemos que estamos hablando de soluciones exactas de cada
uno de los sistemas. La situación no se genera por utilizar
ninguna forma de resolverlos en particular.
Número de condición de una matriz (49)

I Esto muestra que el sistema de ecuaciones



x1 + 1,00001x2 = b1
x1 + x2 = b2

tiene una solución que es muy sensible a cambios en los datos


b = (b1 , b2 ) cuando b ≈ (2, 2).

I Este fenómeno es el de mal condicionamiento: pequeños


cambios relativos en los datos producen grandes cambios
relativos en la solución.

I Vamos a explicar el mal condicionamiento de este ejemplo a


través del número de condición de la matriz del sistema.
Número de condición de una matriz (50)
I Supongamos que A ∈ Rn×n es inversible y que
Ax = b.
I Supongamos que el vector b sufre una perturbación ∆b.
I Como consecuencia, x sufre una perturbación ∆x tal que

A(x + ∆x) = b + ∆b.


I Como

Ax + A∆x = A(x + ∆x) = b + ∆b


y Ax = b entonces
A∆x = ∆b.
I Como estamos suponiendo que A es inversible entonces
A∆x = ∆b es equivalente a
∆x = A−1 ∆b.
Número de condición de una matriz (51)
I Acabamos de ver que ∆x = A−1 ∆b.
I Si k · k es una norma de Rn y usamos para matrices su norma
inducida,

k∆xk = kA−1 ∆bk 6 kA−1 kk∆bk.


k∆xk k∆bk
I ¿Cómo se relacionan los cambios relativos y ?
kxk kbk
I Observemos que, si x 6= 0 entonces b = Ax 6= 0 (porque A es
inversible) y
k∆xk kA−1 kk∆bk kA−1 kk∆bk kAxk
6 =
kxk kxk kxk kbk
−1
kA k∆bk kAkkxk
6
kxk kbk
k∆bk
= kA−1 kkAk .
kbk
Número de condición de una matriz (52)
Si A ∈ Rn×n es inversible y k · k es una norma consistente de
Rn×n , se llama número de condición de A y se denota κ(A) a

κ(A) = kA−1 kkAk.

I El número κ(A) depende de la norma matricial utilizada.


I Acabamos de ver que, si usamos una norma inducida, el error
relativo en x es a lo sumo κ(A) veces el error relativo en b:
k∆xk k∆bk
6 κ(A) .
kxk kbk

I Notemos que κ(A) = κ(A−1 ). En efecto,


κ(A−1 ) = k(A−1 )−1 kkA−1 k = kAkkA−1 k = κ(A).
I Además, para normas inducidas, κ(A) > 1. En efecto,
1 = kIk = kA−1 Ak 6 kA−1 kkAk = κ(A).
Número de condición de una matriz (53)
I Consideremos por ejemplo la matriz
 
1/4 7/8
A=
−1/2 −1/2
y calculemos su número de condición con la norma inducida
por la norma uno.
I Ya hemos calculado kAk1 = 11/8.
I Resulta que
 
−1 −8/5 −14/5
A = .
8/5 4/5
I Por lo tanto,
 
−1 8 8 14 4 18
kA k1 = máx + , + = .
5 5 5 5 5
I Concluimos que
18 11 99
κ1 (A) = kA−1 k1 kAk1 = · = = 4,95.
5 8 20
Número de condición de una matriz (54)
I Calculemos ahora el número de condición de la misma matriz
A con la norma inducida por la norma euclı́dea.

5
I Ya hemos calculado que kAk2 = .
2
I Vamos a calcular kA−1 k2 . Como
 
−1 T −1 1 128 144
(A ) A = ,
25 144 212

cuyos autovalores son 64/5 y 4/5, entonces


r
64 8
q
−1 −1 T −1
kA k2 = ρ((A ) A ) = =√ .
5 5
I Por lo tanto,

−1 8 5
κ2 (A) = kA k2 kAk2 = √ · = 4.
5 2
Número de condición de una matriz (55)
I Volvamos a considerar el problema de resolver el sistema

x1 + 1,00001x2 = b1
x1 + x2 = b2
dependiendo de los datos b = (b1 , b2 ).
I Para ello, sea
 
1 1+
A=
1 1
la matriz del sistema, donde  = 0,00001.
I Ya vimos que si Ax = b y A(x + ∆x) = b + ∆b entonces
k∆xk k∆bk
6 κ(A) .
kxk kbk
I Luego, la única explicación posible para el gran cambio
relativo en x frente a pequeños cambios relativos en b que
observamos en el ejemplo es que κ(A) sea muy grande.
Número de condición de una matriz (56)

I Para verificarlo calculemos el número de condición de


 
1 1+
A=
1 1

donde  es algún número entre 0 y 1.


I Lo haremos en la norma inducida por la norma infinito.
I Por definición, κ∞ (A) = kA−1 k∞ kAk∞ .
I Por un lado tenemos que
 
1 1+
kAk∞ =
1 1

= máx (1 + (1 + ), 1 + 1)
= 2 + .
Número de condición de una matriz (57)
I Por el otro, como
 
−1 1 −1 1 + 
A =
 1 −1
entonces
 
−1 1 1+ 1 1 2+
kA k∞ = máx + , + = .
    
I Por lo tanto,

2+ (2 + )2
κ∞ (A) = kA−1 k∞ kAk∞ = (2 + ) = .
 
I Observamos que κ∞ (A) → ∞ cuando  → 0+ .
I En el caso del ejemplo,  = 0,00001 y tenemos que

(2 + 0,00001)2
κ∞ (A) = ≈ 4 × 105 .
0,00001
Número de condición de una matriz (58)
I Una perturbación en el lado derecho del sistema lineal podrı́a
ser consecuencia de aplicar redondeo.

I Sea b ∈ Rn y sea fl(b) = (fl(b1 ), fl(b2 ), . . . , fl(bn )).

I Es decir, las componentes de fl(b) son las aproximaciones por


redondeo de las componentes de b.

I Si todas las entradas de b están dentro del rango de máquina,

fl(bi ) = bi (1 + δi ) para algún δi tal que |δi | 6 u

donde u es el error de redondeo unitario.

I Luego

fl(bi ) − bi = bi δi para cada i = 1, 2, . . . , n.


Número de condición de una matriz (59)
I Si ∆b = fl(b) − b entonces

k∆bk∞ = máx | fl(bi ) − bi | = máx |bi δi | 6 kbk∞ u.


16i6n 16i6n

I Luego, el error relativo de fl(b) como aproximación de b en


norma infinito es:
k fl(b) − bk∞ k∆bk∞
= 6 u.
kbk∞ kbk∞
I Por el teorema, si A(x + ∆x) = fl(b) entonces

k∆xk∞ k∆bk∞
6 κ∞ (A) 6 κ∞ (A)u.
kxk∞ kbk∞
I De manera que si la perturbación en b y el número de
condición κ(A) es pequeño (cercano a 1), tendremos un error
relativo en x (en norma ∞) pequeño. De hecho, si κ∞ (A) = 1,
será comparable con el error de la aproximación por redondeo.
Número de condición de una matriz (60)
I Notemos de todas formas que en el proceso de pasar de un
vector a su norma se pierde información.
I Consideremos por ejemplo
     
1,0000 1,0001 1,0001
x = 0,0050 , y = 0,0051 , z = 0,0050001  .
0,0001 0,0002 0,00010001
I Notemos que ambas matrices y y z tienen el mismo error
relativo como aproximaciones de x en norma infinito:
ky − xk∞ 0,0001 kz − xk∞ 0,0001
= = 10−4 y = = 10−4 .
kxk∞ 1 kxk∞ 1
I Sin embargo, la tercera componente de y aproxima la tercera
componente de x con un error relativo de 1.
I Si uno quisiera que este error relativo diera información más
equilibrada sobre todas las componentes, podrı́a intentar
hacer un cambio de variables para reescalarlas de manera que
todas ellas tengan aproximadamente la misma magnitud.
Número de condición de una matriz (61)
El siguiente teorema muestra que para cada matriz A hay un
vector b y una perturbación ∆b tal que el cambio relativo en b se
traduce en un cambio relativo de x magnificado por κ(A).
Teorema
Sea A ∈ Rn×n inversible y sean b, ∆b ∈ Rn . Sean x, ∆x ∈ Rn
tales que Ax = b y A(x + ∆x) = b + ∆b. Si k · k es una norma de
Rn y b 6= 0 entonces

k∆xk k∆bk
6 κ(A) ,
kxk kbk

donde κ(A) se calcula con la correspondiente norma inducida.


Más aún, la igualdad vale para alguna elección de b y ∆b.

Demostración.
Ya vimos que vale la desigualdad. Solo resta probar que se pueden
elegir ∆b y b de forma tal que valga con igualdad. (. . .)
Número de condición de una matriz (62)
Demostración (cont.)
Como estamos utilizando una norma inducida
kAxk
kAk = máx .
x6=0 kxk

Sea x 6= 0 donde se alcanza el máximo, es decir,

kAxk
kAk = .
kxk

Entonces

kAxk = kAkkxk.

Razonando de la misma forma con A−1 existe ∆b 6= 0 tal que

kA−1 ∆bk = kA−1 kk∆bk. (. . .)


Número de condición de una matriz (63)
Demostración (cont.)
Acabamos de probar que existen x, ∆b ∈ Rn no nulos tales que

kAxk = kAkkxk y kA−1 ∆bk = kA−1 kk∆bk.

Sean

∆x = A−1 ∆b y b = Ax.

Entonces Ax = b y A(x + ∆x) = Ax + A∆x = b + ∆b. Y por


construcción,

k∆xk = kA−1 ∆bk = kA−1 kk∆bk y kbk = kAxk = kAkkxk.

Concluimos que

k∆xk kA−1 kk∆bk k∆bk k∆bk


= = kA−1 kkAk = κ(A) .
kxk kbk/kAk kbk kbk
Número de condición de una matriz (64)

I Consideremos nuevamente
 
1 1+
A=
1 1

donde 0 <  < 1.


I Recordemos que
 
−1 1 −1 1 + 
A = .
 1 −1

I Siguiendo el camino de la demostración podemos buscar


vectores no nulos x, ∆b ∈ R2 tales que

kAxk∞ = kAk∞ kxk∞ y kA−1 ∆bk∞ = kA−1 k∞ k∆bk∞ .


Número de condición de una matriz (65)
I Tenemos que
   
1 1+ 1 −1 1 + 
A= y A−1 =
1 1  1 −1
2+
donde kAk∞ = 2 +  y kA−1 k∞ = .

I Si x = (1, 1) y ∆b = (δ, −δ) con δ 6= 0 entonces
 
2+
kAxk∞ = = 2 +  = kAk∞ kxk∞ y
2
 ∞ 
δ −2 − 
kA−1 ∆bk∞ = = (2 + ) |δ| = kA−1 k∞ k∆bk∞ .
 2
∞ 
I Continuando como en la demostración, sean
 
−1 δ −2 − 
∆x = A ∆b = y
 2
 
2+
b = Ax = .
2
Número de condición de una matriz (66)
I Por la demostración, para estos x = (1, 1), ∆b = (δ, −δ),
   
2+ δ −2 − 
b= y ∆x =
2  2

valen las igualdades Ax = b y A(x + ∆x) = b + ∆b.

I Y tenemos que

k∆xk∞ |δ|(2 + )/ (2 + )2 |δ| k∆bk∞


= = = κ∞ (A)
kxk∞ 1  2+ kbk∞

cualquiera sea δ 6= 0.

I Tenemos ası́ una familia de ejemplos donde el cambio relativo


en x es igual al cambio relativo en b multiplicado por el
número de condición.
Número de condición de una matriz (67)
I Tomemos, por ejemplo, δ = .
I En ese caso, x = (1, 1), ∆b = (δ, −δ) = (, −),
     
2+ δ −2 −  −2 − 
b= y ∆x = = .
2  2 2
I Luego,
     
2+  2 + 2
b + ∆b = + = y
2 − 2−
     
1 −2 −  −1 − 
x + ∆x = + = .
1 2 3
I Esto nos dice que las soluciones de los sistemas
 
x1 + (1 + )x2 = 2 +  x1 + (1 + )x2 = 2 + 2
y
x1 + x2 = 2 x1 + x2 = 2 − 

son x = (1, 1) y x + ∆x = (−1 − , 3), respectivamente.


Número de condición de una matriz (68)
I En particular, si  = 0,00001, el sistema de ecuaciones

x1 + 1,00001x2 = 2,00001
x1 + x2 = 2

tiene por solución x = (1, 1) mientras que el sistema



x1 + 1,00001x2 = 2,00002
x1 + x2 = 1,99999

tiene por solución x + ∆x = (−1,00001, 3), respectivamente.


I Y tenemos que
k∆bk∞ 0,00001 k∆xk∞
= ≈ 0,000005 pero = 2,00001.
kbk∞ 2,0001 kxk∞

I Es un ejemplo en el que el error relativo se multiplicó por


κ∞ (A) ≈ 4 × 105 .
Número de condición de una matriz (69)
Corolario
Sea A ∈ Rn×n inversible y sean b, ∆b ∈ Rn . Sean x, ∆x tales que
Ax = b y A(x + ∆x) = b + ∆b. Si k · k es una norma de Rn
entonces
1 k∆bk k∆xk
6 ,
κ(A) kbk kxk

donde κ(A) se calcula con la correspondiente norma inducida.


Más aún, la igualdad vale para alguna elección de b y ∆b.

Demostración.
Como A−1 b = x y A−1 (b + ∆b) = x + ∆x, por el teorema anterior:

k∆bk k∆xk k∆xk


6 κ(A−1 ) = κ(A) .
kbk kxk kxk

El mismo teorema asegura que existen x y ∆x tales que para


b = Ax y ∆b = A∆x, la desigualdad vale con igualdad.
Número de condición de una matriz (70)
I Los números de condición asociados a distintas normas son
equivalentes en el mismo sentido que las normas.
I Si k · k y k · k 0 son dos normas consistentes de Rn×n y κ y κ 0
son los números de condición con respecto a dichas normas
entonces existen constantes positivas c1 y c2 tales

c1 κ(A) 6 κ 0 (A) 6 c2 κ(A), para toda A ∈ Rn×n .

I Por ejemplo, para toda matriz A ∈ Rn×n ,

1
κ2 (A) 6 κ1 (A) 6 nκ2 (A)
n
1
κ∞ (A) 6 κ2 (A) 6 nκ∞ (A)
n
1
κ1 (A) 6 κ∞ (A) 6 n2 κ1 (A).
n2
Número de condición de una matriz (71)
I Notar que un determinante cercano a 0 no implica que una
matriz esté mal condicionada. Por ejemplo, para cualquier
 > 0,
 
 0 ··· 0
0  · · · 0
n×n
An = I =  .. .. . . . ∈ R
 
. . . .. 
0 0 ··· 
tiene det(An ) = n pero κ(An ) = 1.
I Asimismo, un número de condición muy grande no implica
que el determinante sea cercano a 0. Por ejemplo,
 
1 −1 · · · −1
0 1 · · · −1
n×n
Bn =  .. ..  ∈ R
 
.. ..
. . . . 
0 0 ··· 1
satisface κ∞ (Bn ) = n2n−1 pero det(Bn ) = 1.
Número de condición de una matriz (72)

El siguiente teorema muestra que de todas formas el número de


condición admite una interpretación ‘geométrica’ como una medida
de la cercanı́a al conjunto de las matrices singulares.

Teorema
Si A ∈ Rn×n es inversible y k · k es una norma de Rn entonces
1 kB − Ak
= mı́n
κ(A) B∈Rn×n singular kAk
donde κ y los cocientes de la derecha se calculan con la norma
inducida.

Es decir, el número de condición es el menor cambio relativo que


es necesario aplicar a A para obtener una matriz singular B.
Número de condición de una matriz (73)
I Supongamos ahora es la matriz A del sistema la que sufre una
perturbación que la vuelve A + E.
I La solución x de Ax = b sufrirá una perturbación ∆x tal que
(A + E)(x + ∆x) = b.
I El siguiente teorema muestra que el número de condición
κ(A) lo es también frente a perturbaciones de A.

Teorema
Sean A ∈ Rn×n inversible, b ∈ Rn y x ∈ Rn tal que Ax = b.
Sean E ∈ Rn×n y ∆x ∈ Rn tales que (A + E)(x + ∆x) = b. Si
kEk
x 6= 0 y kEk < kA1−1 k (es decir, κ(A) kAk < 1) entonces

kEk  !
κ(A) kAk kEk 2

k∆xk kEk
6 kEk
= κ(A) +O ,
kxk 1 − κ(A) kAk kAk kAk

para toda norma vectorial y su norma matricial inducida.


Número de condición de una matriz (74)
El siguiente teorema combina los efectos de perturbaciones tanto
en la matriz A como en el lado derecho b.
Teorema
Sean A ∈ Rn×n inversible, b ∈ Rn y x ∈ Rn tal que Ax = b.
Sean E ∈ Rn×n y ∆x, ∆b ∈ Rn tales que

(A + E)(x + ∆x) = b + ∆b.

1 kEk
Si x 6= 0 y kEk < kA−1 k
(es decir, κ(A) kAk < 1) entonces
 
k∆xk κ(A) k∆bk kEk
6 kEk
+
kxk 1 − κ(A) kAk kbk kAk
   
k∆bk kEk kEk
= κ(A) + 1+O ,
kbk kAk kAk

para toda norma vectorial y su norma matricial inducida.

También podría gustarte