Está en la página 1de 42

7 Diagonalización de matrices.

7.1 Autovalores y autovectores.


Definición y ejemplos.
Definición: Sea A ∈ Mn una matriz cuadrada, se dice que v ∈ Rn es autovector (o
vector propio) de A con autovalor (o valor propio) λ ∈ R si se cumple que

Av = λv,

con v 6= 0.

Observaciones:

Sólo tiene sentido para matrices cuadradas.

Todo autovector tiene asociado un único autovalor.

Todo autovalor tiene asociados infinitos autovectores ya que, si Av = λv, entonces


A(αv) = λ(αv) para cualquier α ∈ R.
 
−1 3
Ejercicio 7.1 Dada la matriz A = , di si los siguientes vectores son vectores de
1 1
propios de A y, si es así, con qué autovalor.

a) v1 = (1, 0)

b) v2 = (1, 1)

c) v3 = (2, 2)

87
88 Sara Cuenda

d) v4 = (3, −1)

 
1 0 1
Ejercicio 7.2 Repite el ejercicio para la matriz B = 0 1 1 y los vectores

0 0 1

a) u1 = (1, 1, 0)

b) u2 = (0, 1, 0)

Observaciones:

¿Cuántos autovalores tiene una matriz?

¿Cuántos autovectores linealmente independientes podemos encontrar?

¿Podemos encontrar una base de autovectores de una matriz?

Cálculo de autovalores.
Pasos a seguir:

1. A partir de la ecuación de los autovectores, Av = λv, agrupando todo en el lado


izquierdo de la ecuación, queda

(A − λIn )v = 0,

donde In es la matriz identidad de Mn .

2. Por tanto, los autovectores con autovalor λ verifican un sistema de ecuaciones linea-
les homogéneo, con matriz de coeficientes

(A − λIn ).

3. El sistema anterior tiene solución distinta de la trivial si y sólo si rg(A − λIn ) < n, es
decir, cuando
|A − λIn | = 0.
Álgebra Lineal (2016-17) 89

Definición: El polinomio característico de una matriz A ∈ Mn es el polinomio

p(λ) = |A − λIn |,

donde In es la matriz identidad de tamaño n.

Definición: La ecuación característica de una matriz A ∈ Mn viene dada por la expresión

|A − λIn | = 0.

Teorema: Los autovalores de una matriz A ∈ Mn son las soluciones (o raíces) de la


ecuación característica |A − λIn | = 0.
Ejercicio 7.3 Calcula los autovalores de las siguientes matrices:
 
−1 3
a) A =
1 1

 
1 0 1
b) B = 0 1 1
0 0 1

Observaciones:

El polinomio característico de una matriz de tamaño n tiene grado n.

El número de autovalores (reales y complejos) es, por tanto, n.

Nosotros sólo nos quedaremos con los autovalores reales. Además, pueden estar
repetidos.

El número de autovalores reales distintos es, por tanto, menor o igual que n.
90 Sara Cuenda

Definición: La multiplicidad algebraica de un autovalor λ, mλ , es el número de veces


que se repite dicho autovalor.

Ejercicio 7.4 Di cuáles son las multiplicidades algebraicas de los autovalores calculados
en el ejercicio anterior.

Cálculo de autovectores.
Teorema: Los autovectores de una matriz A ∈ Mn asociados al autovalor λ son las solu-
ciones no triviales del sistema de ecuaciones

(A − λIn )v = 0.

Definición: El subespacio propio de una matriz A ∈ Mn asociado al autovalor λ, Vλ , es


el conjunto de soluciones del sistema lineal homogéneo (A − λIn )v = 0, es decir,

Vλ = {v ∈ Rn : (A − λIn )v = 0}.

Definición: La multiplicidad geométrica de un autovalor λ es la dimensión de su subes-


pacio propio, dim(Vλ ).
Ejercicio
 7.5
 Calcula una base de cada uno de los subespacios propios de la matriz
−1 3
A= .
1 1
Álgebra Lineal (2016-17) 91

Ejercicio
 7.6 Calcula una base de cada uno de los subespacios propios de la matriz
1 0 1
B = 0 1 1 .
0 0 1

7.2 Diagonalización de matrices.


Matriz diagonal asociada a una aplicación lineal.
Definición: Sea f : Rn → Rn la aplicación linal asociada a la matriz A ∈ Mn en la
base canónica. Supongamos que podemos encontrar una base de autovectores de Rn ,
B = {v1 , v2 , ... , vn }, de forma que, para cada uno de ellos, se verifica que

f (vi ) = λi vi

para algún λi ∈ R.

Entonces la matriz diagonal asociada a f es la matriz que representa a la aplicación f en


la base B de Rn formada por autovectores,
 
λ1 0 ... 0
0 λ2 ... 0
D =  .. ..  .
 
.. ..
. . . .
0 0 ... λn

Terorema: Puesto que A y D representan la misma aplicación lineal f en la base canónica


y en la base de autovectores B = {v1 , v2 , ... , vn }, respectivamente, entonces se verifica
que
A = PDP −1 ,
92 Sara Cuenda


donde P = v1 v2 ... vn es la matriz cambio de base de la base B a la base canónica,
cuyas columnas están formadas por los vectores de B .
Demostración: Para cualquier x ∈ Rn , x = P(x)B . Además, f (x) tiene que dar el mismo
resultado en la base canónica, f (x) = Ax, como en la base de autovectores, (f (x))B = D(x)B .
Definición: Decimos que la matriz A ∈ Mn es diagonalizable cuando existe una base de
Rn formada por autovectores de A, B = {v1 , v2 , ... , vn }.
 
1 0 1
Ejercicio 7.7 Con los resultados de ejercicios anteriores, razona si la matriz B = 0 1 1
0 0 1
es diagonalizable o no.

 
−1 3
Ejercicio 7.8 Con los resultados de ejercicios anteriores, razona si la matriz A =
1 1
es diagonlizable o no.

Observaciones:

Estamos interesados en construir una base de Rn formada por autovectores de A.

Necesitamos (y son suficientes) n autovectores de A linealmente independientes en-


tre sí.

Podemos construir una base para cada subespacio propio, pero ¿qué pasa con la
dependencia lineal de autovectores de subespacios propios distintos?

Cómo diagonalizar una matriz.


Teorema: Los subespacios propios asociados a autovalores distintos son linealmente in-
dependientes entre sí.

Observaciones:

Esto significa que, si λ1 , λ2 , ... , λk son los autovalores distintos de la matriz A, y Bλ1 es
una base del subespacio propio Vλ1 , Bλ2 una base de Vλ2 , etc., entonces el conjunto
{Bλ1 ∪ Bλ2 ∪ · · · Bλk } es un conjunto linealmente independiente.
Álgebra Lineal (2016-17) 93

Por tanto, la matriz A será diagonalizable si, y sólo si, la suma de las dimensiones de
los subespacios propios es la dimensión de Rn , es decir si

dim(Vλ1 ) + dim(Vλ2 ) + · · · + dim(Vλk ) = n.

En términos de operaciones con espacios vectoriales, A es diagonalizable si, y sólo


si, Rn = Vλ1 + Vλ2 + · · · + Vλk .

Teorema: La dimensión del subespacio propio asociado al autovalor λ es 1 ≤ dim(Vλ ) ≤


mλ , donde mλ es la multiplicidad algebraica del autovalor λ.

Observaciones:

La suma de las multiplicidades algebraicas de los autovalores es igual al grado del


polinomio característico, n.

Por tanto, la matriz A sólo será diagonalizable si todos sus autovalores son reales y,
además, la multiplicidad geométrica de cada autovalor coincide con su multiplicidad
algebraica.

Pasos a seguir: Sea A ∈ Mn una matriz cuadrada de orden n, si queremos estudiar si A


es diagonalizable, tenemos que seguir los siguientes pasos.

1. Calcular los autovalores de A, y sus multiplicidades algebraicas.

2. Si la matriz tiene los n autovalores distintos, entonces A es diagonalizable.

3. Si no, calculamos la dimensión de los espacios propios asociados a los autovalores


múltiples (mλ > 1). La matriz A sólo es diagonalizable cuando en todos ellos se
verifica que dim(Vλ ) = mλ .
 
0 1 0
Ejercicio 7.9 Estudia si la matriz A1 = 0 0 1 es diagonalizble o no.
0 −3 3
94 Sara Cuenda

 
−11 −4 8
Ejercicio 7.10 Estudia si la matriz A2 =  0 1 0 es diagonalizble o no.
−12 −4 9

 
1 1
Ejercicio 7.11 Estudia si la matriz A3 = es diagonalizable o no.
−1 1

Propiedades de los autovalores.


Teorema: Sea A ∈ Mn una matriz cuadrada con autovalores {λ1 , λ2 , ... , λn }, diagonaliza-
ble o no, entonces se cumple que

|A| = λ1 λ2 · · · λn .

tr(A) = λ1 + λ2 + · · · + λn .

Los autovalores de AT son los mismos que los de A.


Álgebra Lineal (2016-17) 95

Los autovalores de αA son αλi .

Si A es invertible, los autovalores de A−1 son 1


λi
.

Para cualquier k ∈ Z no nulo, los autovalores de Ak son (λi )k .

Ejercicio 7.12 De la matriz A ∈ M3 conocemos que |A| = −1, tr(A) = 1, y que unos de
sus autovalores es λ = 1. ¿Cuáles son sus otros autovalores?

 
2 −5
Ejercicio 7.13 Dada la matriz A = , calcula los autovalores de las matrices A2 ,
0 3
1 3 −1
A , A y A−2 .
2

Teorema: Sea A ∈ Mn una matriz diagonalizable tal que A = PDP −1 , con D diagonal,
entonces Ak = PD k P −1 .

Observaciones:

Proviene de que Ak = (PDP −1 )k = (PDP −1 )(PDP −1 ) · · · (PDP −1 ) = PD k P −1 .


| {z }
k veces

Permite calcular potencias muy grandes de manera muy rápida, ya que los elementos
de D k son λk .

Igualmente, si f (x) es un polinomio, entonces f (A) = Pf (D)P −1 .


 
2 1
Ejercicio 7.14 Dada la matriz A = , calcula la matriz B = A100 + 2A10 − 3I.
0 1
96 Sara Cuenda

7.3 Matrices especiales.


Matrices simétricas.
Teorema: En el caso en el que A sea una matriz simétrica (AT = A) de coeficientes reales,

Los autovalores de A son todos reales.

A es siempre diagonalizable.

Existe una base ortonormal de autovectores en la que podemos expresar la matriz A


de la forma A = QDQ T , donde las columnas de Q están formadas por los vectores
ortonormales de la base.

Autovalores de otras matrices especiales.


Sea A una matriz diagonalizable, entonces A2 = PD 2 P −1 . Por tanto, se deduce que:

A es idempotente, A2 = A, si y sólo si λi = 0 ó λi = 1,
ya que sus autovalores verifican λ2i = λi .

A es unipotente, A2 = I, si y sólo si λi = ±1,


ya que sus autovalores verifican λ2i = 1.

A no puede ser nilpotente, A2 = O,


ya que, si lo fuera, D = O y, por tanto, A = O.
O, lo que es lo mismo, las matrices nilpotentes no son diagonalizables.
Álgebra Lineal (2016-17) 97

Ejercicio 7.15 Calcula los autovalores de la siguiente matriz:


 
−1 1 2
A =  2 0 −2
−2 1 3

a) ¿Es A unipotente?

b) ¿Podemos afirmar que es idempotente?


98 Sara Cuenda
8 Formas cuadráticas
8.1 Conceptos básicos.
Definición de forma cuadrática.
Definición: Una forma cuadrática es una aplicación q : Rn → R cuyo valor numérico
viene dado por un polinomio cuadrático, esto es, un polinomio cuyos términos tienen todos
grado dos, de la forma
n X
X n
q(x1 , ... , xn ) = aij xi xj ,
i=1 j=1

donde las aij ∈ R son los coeficientes y las xi son las variables.

Ejemplo 8.1 En funciones de una variable, un polinomio cuadrático es de la forma

q(x) = ax 2 .

En dos variables,
q(x, y) = ax 2 + bxy + cy 2 .

Ejercicio 8.1 Indica cuáles de las siguientes funciones son formas cuadráticas.

a) f (t) = −t 2 .

b) p(x, y ) = x 2 + y 2 .

c) q(x, y , z) = 2x 2 − 4xy − y 2 + z 2 .

d) f (x, y ) = x 2 − 4y 2 + 2x.

e) r (x, y , z) = ax 2 + ay 2 + 2xy.

f) q(x, y, z) = ax 2 − z 2 − 4az.

99
100 Sara Cuenda

Observaciones:

El resultado de una forma cuadrática es un número.

Para cualquier forma cuadrática, q(0, 0, ... , 0) = 0.

Resulta útil conocer el signo de la forma cuadrática.

Forma cuadrática asociada a una matriz cuadrada.


Caso de dos variables: Dada la matriz
 
a11 a12
A= ,
a21 a22

la expresión   
 a11 a12 x1
q(x1 , x2 ) = x1 x2
a21 a22 x2
define la forma cuadrática

q(x1 , x2 ) = a11 x12 + (a12 + a21 )x1 x2 + a22 x22 .

  
 1 2 x
Ejercicio 8.2 Calcula q(x, y ) = x y .
3 4 y

 
1 1
Ejercicio 8.3 Calcula la forma cuadrática asociada a la matriz .
4 4

Ejercicio 8.4 ¿Se te ocurren otras matrices que den lugar a la misma forma cuadrática?
Álgebra Lineal (2016-17) 101

Caso de tres variables: Para una matriz 3 × 3, se cumple que


  
 a11 a12 a13 x1
q(x1 , x2 , x3 ) = x1 x2 x3 a21 a22 a23  x2 
a31 a32 a33 x3
= a11 x12 + a22 x22 + a33 x32 + (a12 + a21 )x1 x2 +
+ (a13 + a31 )x1 x3 + (a23 + a32 )x2 x3

define una forma cuadrática en tres variables.


Ejercicio 8.5 Calcula
  
 1 −1 0 x
q(x, y , z) = x y z  1 −1 2   y
3 0 2 z

Ejercicio 8.6 Calcula las formas cuadráticas asociadas a las siguientes matrices.
 
1 1 0
a) A1 = 3 0
 2 
1 −2 −1

 
1 5 −1
b) A2 = −1 0 −1

2 1 −1

Caso general: Para una matriz n × n, la aplicación q(x) = xT Ax, x ∈ Rn , define una forma
cuadrática en Rn tal que:

El coeficiente de cada témino xi2 viene dado por el elemento de la diagonal aii .

El coeficiente de cada término cruzado xi xj viene dado por la suma (aij + aji ).
102 Sara Cuenda

Observaciones:

Todas las matrices que den el mismo resultado aij + aji dan lugar a la misma forma
cuadrática.

Si elegimos una matriz simétrica, puesto que aij = aji , el coeficiente del término cru-
zado xi xj fija el valor de los coeficientes de la matriz. Por tanto, sólo hay una matriz
simétrica asociada a cada forma cuadrática.

La matriz simétrica Q se obtiene a partir de cualquiera de las otras, tomando su parte


T
simétrica, Q = A+A
2
.

Ejercicio 8.7 ¿Cuáles son las partes simétricas de las matrices A1 y A2 ?


 
1 1 0
A1 = 3 0
 2 
1 −2 −1

 
1 5 −1
A2 = −1 0 −1

2 1 −1

Matriz asociada a una forma cuadrática


Teorema+definición: Dada una forma cuadrática q : Rn → R, existe una única matriz
simétrica Q ∈ Mn tal que
q(x) = xT Qx.
A dicha matriz Q se le denomina matriz asociada a la forma cuadrática q, o expresión
matricial de q.

Dicha matriz Q:

Tiene como elemento diagonal aii el coeficiente del término xi2 .

Tiene como elemento fuera de la diagonal aij , con i 6= j, la mitad del coeficiente del
término xi xj .
Álgebra Lineal (2016-17) 103

Ejercicio 8.8 ¿Cuál es la matriz simétrica asociada a las siguientes formas cuadráticas?
Da también una matriz no simétrica A tal que q(x) = xT Ax.

a) q1 (x1 , x2 , x3 ) = 2x12 − x1 x3 + x22 + 4x2 x3 − 4x32

b) q2 (x, y ) = 2x 2 + xy + y 2

c) q3 (x1 , x2 , x3 ) = −x12 + 2x1 x2 + x1 x3 + x22 + 5x2 x3 − x32

d) q4 (x, y) = −x 2 − y 2 + xy

Forma canónica.
Definición: Se dice que una forma cuadrática está en forma canónica cuando no tiene
ningún término cruzado (y, por tanto, la matriz que la representa es diagonal).

Ejercicio 8.9 Escribe la matriz simétrica asociada a las siguientes formas cuadráticas.

a) q(x, y ) = x 2 + y 2 → Q =

b) q(x, y) = 2x 2 → Q =
104 Sara Cuenda

c) q(x, y , z) = 4x 2 − z 2 → Q =

8.2 Clasificación de formas cuadráticas


Signo de una forma cuadrática.
Definición: Dada una forma cuadrática q : Rn → R, se dice que es

Definida positiva (DP) cuando q(x) > 0 para todo x 6= 0.

Definida negativa (DN) cuando q(x) < 0 para todo x 6= 0.

Semidefinida positiva (SDP) cuando q(x) ≥ 0 para todo x 6= 0 y existe algún x0 6= 0


tal que q(x0 ) = 0.

Semidefinida negativa (SDN) cuando q(x) ≤ 0 para todo x 6= 0 y existe algún x0 6= 0


tal que q(x0 ) = 0.

Indefinida (IND) cuando existen x1 y x2 tales que q(x1 ) > 0 y q(x2 ) < 0.

Cada forma cuadrática tiene que ser de uno de estos tipos.


Ejercicio 8.10 Clasifica las siguientes formas cuadráticas según su signo.

a) q(x, y ) = 2x 2 + y 2

b) q(x, y ) = −3x 2 − y 2

c) q(x, y ) = x 2

d) q(x, y ) = −2y 2

e) q(x, y ) = x 2 − 5y 2
Álgebra Lineal (2016-17) 105

Clasificación en forma canónica.


Teorema: Sea una forma cuadrática en forma canónica,

q(x1 , ... , xn ) = d1 x12 + d2 x22 + · · · + dn xn2 ,

entonces:

q es DP si, y sólo si, d1 > 0, d2 > 0, ... , dn > 0.

q es DN si, y sólo si, d1 < 0, d2 < 0, ... , dn < 0.

q es SDP si, y sólo si, d1 ≥ 0, d2 ≥ 0, ... , dn ≥ 0, y algún dj = 0.

q es SDN si, y sólo si, d1 ≤ 0, d1 ≤ 0, ... , dn ≤ 0, y algún dj = 0.

q es IND si, y sólo si, existe algún di > 0 y algún dj < 0.

Ejercicio 8.11 Comprueba que las formas cuadráticas del ejercicio anterior verifican dicho
criterio.

Clasificación por los elementos de la diagonal.


Ejercicio 8.12 Dadas las siguientes formas cuadráticas, calcula su valor en (1, 0) y en
(0, 1) y clasifícalas.

a) q(x, y ) = x 2 − 2y 2 + xy

b) q(x1 , x2 ) = −4x12 + x22 + 6x1 x2

Teorema: Dada una forma cuadrática q(x) con x ∈ Rn y sea Q su matriz simétrica aso-
ciada. Si algunos elementos de la diagonal de Q son positivos y algunos son negativos,
entonces la forma cuadrática tiene que ser indefinida.

Observación:

Si los elementos de la diagonal son todos del mismo signo o nulos entonces este
método no clasifica la forma cuadrática.
106 Sara Cuenda

Clasificación por el criterio de los menores principales.


Definición: Dada la matriz simétrica Q ∈ Mn asociada a la forma cuadrática q : Rn → R,
se llaman menores principales D1 , D2 , ..., Dn a los menores
a11 a12 a13
a11 a12
D1 = a11 , D2 = , D3 = a21 a22 a23 , ... , Dn = |Q |.
a21 a22
a31 a32 a33

Ejercicio 8.13 Calcula los menores principales de las siguientes matrices.


 
1 −1
a) Q1 =
−1 1

 
0 2
b) Q2 =
2 0

 
1 1 1
c) Q3 = 1 2 −1

1 −1 1

Teorema: Sea q(x) = xT Qx una forma cuadrática en las variables x = (x1 , x2 , ... , xn ) y
Q ∈ Mn su matriz simétrica asociada, entonces se verifica que:

a) Si |Q | =
6 0:
• D1 > 0, D2 > 0, . . . , Dn > 0 ⇐⇒ q es DP
• Los Di van alternando el signo, con D1 < 0 ⇐⇒ q es DN
• En cualquier otro caso q es IND
Álgebra Lineal (2016-17) 107

b) Si |Q | = 0:
b.1) Si todos los menores Di hasta n − 1 son no nulos:
• D1 > 0, D2 > 0, . . . , Dn−1 > 0 ⇒ q es SDP
• Los Di van alternando el signo, con D1 < 0 ⇒ q es SDN
b.2) Si existe algún Di = 0, con i < n, el método no decide.

Teorema (condiciones necesarias): Sea q(x) = xT Qx una forma cuadrática en las va-
riables x = (x1 , x2 , ... , xn ) y Q ∈ Mn su matriz simétrica asociada, entonces se verifica
que:

Si q es SDP entonces D1 ≥ 0, D2 ≥ 0, . . . , Dn ≥ 0.

Si q es SDN entonces D1 ≤ 0, D2 ≥ 0, . . .

Observaciones:

Este criterio sólo es válido si se usa la matriz simétrica asociada, Q.

Si |Q | =
6 0 (caso a) entonces q sólo puede ser definida positiva, definida negativa o
indefinida.

Si |Q | = 0 (caso b) sólo puede ser semidefinida positiva, semidefinida negativa o


indefinida.

En el caso b.2 el método no decide, es decir, no podemos afirmar de qué tipo es (que
no es lo mismo que decir que es indefinida!).

Demostración: El método se basa en completar cuadrados.

Para n = 2, suponiendo que a11 6= 0:

q(x1 , x2 ) = a11 x12 + 2a12 x1 x2 + a22 x22 =


 
2a12
= a11 + x12 x1 x2 + a22 x22 =
a11
2 2
   
2 2a12 a12 2 a12
= a11 x1 + x1 x2 + 2 x2 + a22 − x22 =
a11 a11 a11
 2
a12 |A|
= a11 x1 + x2 + x22
a11 a11
Es decir,  2
a12 D2 2
q(x1 , x2 ) = D1 x1 + x2 + x .
a11 D1 2
108 Sara Cuenda

En general, para cualquier n, con D1 6= 0, . . . , Dn−1 6= 0:

q(x1 , ... , xn ) = D1 (x1 + b12 x2 + · · · + b1n xn )2


D2
+ (x2 + b23 x3 + · · · + b2n xn )2
D1
Dn 2
+ ··· + x
Dn−1 n

Ejercicio 8.14 Clasificar, si es posible, las siguientes formas cuadráticas por el método de
los menores principales.

a) q1 (x1 , x2 , x3 ) = 2x12 + 2x22 + x32 − 4x1 x2 .


Matriz simétrica asociada:

Menores principales:

Conclusión:

b) q2 (x1 , x2 , x3 ) = −3x12 + 2x1 x2 + 2x1 x3 + 2x22 − 6x2 x3 + 7x32 .


Matriz simétrica asociada:

Menores principales:

Conclusión:
Álgebra Lineal (2016-17) 109

c) q3 (x1 , x2 , x3 , x4 ) = −2x12 − x22 − 3x32 + 4x1 x3 − 3x42


Matriz simétrica asociada:

Menores principales:

Conclusión:

d) q4 (x1 , x2 , x3 ) = 2x12 + 2x1 x2 + x22 + 2x2 x3 + 3x32


Matriz simétrica asociada:

Menores principales:

Conclusión:

e) q5 (x1 , x2 , x3 ) = −x12 + 3x22 + 4x1 x3 − 2x1 x2 + 3x32


Matriz simétrica asociada:
110 Sara Cuenda

Menores principales:

Conclusión:

i) q9 (x, y , z) = −3x 2 + 6xy − 4y 2 + 2yz − z 2


Matriz simétrica asociada:

Menores principales:

Conclusión:

j) q10 (x, y , z) = −2x 2 + 2xz + 3z 2


Matriz simétrica asociada:

Menores principales:

Conclusión:
Álgebra Lineal (2016-17) 111

k) q11 (x, y, z) = x 2 − 2xy + 2y 2 − 2yz + z 2


Matriz simétrica asociada:

Menores principales:

Conclusión:

l) q12 (x, y , z) = x 2 − 2xy + y 2 − 2yz + z 2


Matriz simétrica asociada:

Menores principales:

Conclusión:

Clasificación por el criterio de los autovalores.


Teorema: Sea q(x) = xT Qx una forma cuadrática con matriz simétrica asociada Q ∈ Mn ,
y sean λ1 , λ2 , ... , λn los autovalores de Q. Entonces se verifica que:

q es DP ⇐⇒ todos sus autovalores son positivos.

q es DN ⇐⇒ todos sus autovalores son negativos.

q es SDP ⇐⇒ todos sus autovalores son positivos o cero.


112 Sara Cuenda

q es SDN ⇐⇒ todos sus autovalores son negativos o cero.

q es IND ⇐⇒ tiene autovalores positivos y negativos.

Observaciones:

El signo de q no depende de la base de Rn que se utilice.

El teorema está basado en el estudio del signo de q en la base de autovectores de


Q.

El signo de q es el mismo que el signo de la forma cuadrática en forma canónica


asociada a la matriz diagonal formada por los autovalores de Q.

Este criterio no deja ningún caso sin resolver.

Si empleamos este criterio cuando el método de los menores principales no decide


entonces uno de los autovalores tiene que ser cero.

Ejercicio 8.15 Clasifica por el criterio de los autovalores los casos que no pudimos resolver
antes:

a) q1 (x1 , x2 , x3 ) = 2x12 + 2x22 + x32 − 4x1 x2 .


 
2 −2 0
Matriz simétrica asociada: Q = −2 2 0
0 0 1
Ecuación característica:

Autovalores:

Conclusión:

b) q10 (x, y , z) = −2x 2 + 2xz + 3z 2


 
−2 0 1
Matriz simétrica asociada: Q =  0 0 0
1 0 3
Álgebra Lineal (2016-17) 113

Ecuación característica:

Autovalores:

Conclusión:

Clasificación en función de un parámetro.


Ejercicio 8.16 Clasificar la forma cuadrática

q(x, y , z) = x 2 + 4y 2 + 3z 2 − 4axy

en función del parámetro a.


114 Sara Cuenda

8.3 Operaciones con formas cuadráticas


Relación con matrices asociadas.
Sean q(x) y p(x) dos formas cuadráticas de Rn a R, y A y B sus respectivas matrices
simétricas asociadas. Entonces,

Producto por un escalar: (αq)(x) = xT (αA)x, α ∈ R.

Suma: (q + p)(x) = xT (A + B)x.

Observaciones:

Para cualquier α > 0, el signo de αq es el mismo que el signo de q.

Para cualquier α < 0, el signo de αq cambia (salvo que q sea indefinida).

Si p y q son definidas del mismo signo, también lo es p + q.

Si p es definida y q es semidefinida del mismo signo, entonces p + q es definida del


mismo signo.

El resto de los casos no se puede generalizar.

Ejercicio 8.17 Dadas q1 (x, y) = x 2 +2y 2 y q2 (x, y ) = −x 2 − y 2 +2xy, clasifica las siguientes
formas cuadráticas:

a) q1 y q2 .

b) r1 (x, y) = 2q1 (x, y ) y r2 (x, y) = −3q2 (x, y).


Álgebra Lineal (2016-17) 115

c) s1 (x, y ) = q1 (x, y) + q2 (x, y ).

d) s2 (x, y) = q1 (x, y) − q2 (x, y ).


116 Sara Cuenda
9 Conjuntos y funciones convexos.
9.1 Conjuntos convexos.
Definición de conjunto convexo.
Definición: Dados x, y ∈ Rn , el segmento de extremos x e y es la porción de recta de Rn
que une los puntos x e y.

Dicho conjunto lo denotaremos por [x, y] y matemáticamente se define como

[x, y] = {z ∈ Rn : z = λx + (1 − λ)y, con λ ∈ [0, 1]}.

Ejercicio 9.1 Representa el segmento de R dado por

[a, b] = {x ∈ R : x = λb + (1 − λ)a, con λ ∈ [0, 1]}.

Ejercicio 9.2 Representa el segmento de R2 dado por

[a, b] = {x ∈ R2 : x = λa + (1 − λ)b, con λ ∈ [0, 1]}.

con a = (0, 1) y b = (1, 0).

Definición: Sea S ⊂ Rn un subconjunto de Rn , se dice que S es convexo si para cualquier


par de puntos x, y ∈ S del conjunto, el segmento que los une [x, y] también pertenece al
conjunto.

117
118 Sara Cuenda

Ejercicio 9.3 Decir cúal de estos dos conjuntos es convexo y cuál no.

Operaciones con conjuntos convexos:


Intersección: La intersección de dos conjuntos convexos también es un conjunto convexo.

Unión: En general, la unión de dos conjuntos convexos no tiene por qué ser un conjunto
convexo.

Hay excepciones, como cuando un conjunto contiene a otro.


Álgebra Lineal (2016-17) 119

Suma de conjuntos: Dados los conjunto A, B ⊂ Rn , se define el conjunto suma como

A + B = {z ∈ Rn : z = x + y, con x ∈ A, y ∈ B }.

Si A y B son convexos, entonces A + B también lo es.

Producto por un escalar: Dado el conjunto S ⊂ Rn y el escalar α ∈ R, se define el


conjunto
αS = {y ∈ Rn : y = αx, x ∈ S }.
Si S es convexo, entonces αS también lo es.
120 Sara Cuenda

Algunos ejemplos especiales.


Los siguientes conjuntos son conjuntos convexos:

Un punto, una recta, un plano... en general, un hiperplano:

H = {x ∈ Rn : a0 · x = c, a ∈ Rn , a 6= 0, c ∈ R}.

Una semirecta, un semiplano, ... (delimitados por un punto y una recta, respectiva-
mente), y su generalización en Rn .

{x ∈ Rn : a0 · x ≥ c } {x ∈ Rn : a0 · x ≤ c }
Álgebra Lineal (2016-17) 121

Un segmento, un polígono regular, un simplex.

Un intervalo en R, un círculo en R2 , una bola en R3 , y su generalización en Rn .

9.2 Funciones cóncavas y convexas


Concavidad y convexidad de funciones
Definición: Dada la función f : M → R definida sobre un conjunto M ⊆ Rn convexo, se
dice que f es convexa en M cuando la región definida por encima de la gráfica de f es un
conjunto convexo.

Definición: Dada la función f : M → R definida sobre un conjunto M ⊆ Rn convexo, se


dice que f es cóncava en M cuando la región definida por debajo de la gráfica de f es un
conjunto convexo.
122 Sara Cuenda

Observaciones:

Es importante que el conjunto M sobre el que se define f sea convexo. Si no lo es,


no tiene sentido hablar de concavidad o convexidad de funciones.

Una función puede no ser cóncava ni convexa.

Ejercicio 9.4 Estudia la convexidad de las siguientes regiones de R2 :

a) {(x, y ) ∈ R2 : y ≤ ln(x − 2)}

b) {(x, y) ∈ R2 : y ≤ x 2 − 3x + 2}

Corolario: Una función f : M → R definida sobre un conjunto M ⊆ Rn convexo es convexa


cuando, para cualquier par de puntos de la gráfica de f , el valor de la función es menor o
igual que el valor de la cuerda que los une:
f (λx + (1 − λ)y)≤λf (x) + (1 − λ)f (y)
para cualquier x, y ∈ M y cualquier λ ∈ [0, 1].

Se dice que f es estrictamente convexa cuando la relación es <.


Álgebra Lineal (2016-17) 123

De la misma forma, f es cóncava sobre M cuando para cualquier par de puntos de la


gráfica, el valor de la función es mayor o igual que el valor de la cuerda que los une,

f (λx + (1 − λ)y)≥λf (x) + (1 − λ)f (y)

(f es estrictamente cóncava cuando la relación es >).

Observaciones:

Los corolarios provienen de la definición de los conjuntos convexos, que debían con-
tener cualquier segmento que uniese dos puntos del conjunto.

Una función estrictamente convexa es convexa, e igualmente un función estrictamen-


te cóncava es cóncava. Son restricciones más fuertes sobre su forma.

Las expresiones son válidas para funciones no diferenciables.

Tanto las funciones cóncavas como las convexas se definen sobre una cierta región,
M.

Ejercicio 9.5 Estudia gráficamente la concavidad y convexidad de la función f (x) = x 3

a) En el intervalo (−∞, 0].


124 Sara Cuenda

b) En el intervalo [0, ∞].

c) En el intervalo [−1, 1].

Ejercicio 9.6 Estudia gráficamente la concavidad y convexidad de las siguientes funcio-


nes:

a) f (x) = ln(x − 2)

b) f (x) = x + 1

c) f (x) = | − 2x + 4|
Álgebra Lineal (2016-17) 125


d) f (x) = x

Concavidad y convexidad de funciones diferenciables


Condiciones de primer orden: Sea M ⊆ Rn un conjunto convexo abierto, sea f : M → R
una función diferenciable en M y ∇f (x) el gradiente de la función en x ∈ M. Entonces, f es
convexa en M cuando
f (y) ≥ f (x) + ∇f (x)(y − x),
o cuando
[∇f (y) − ∇f (x)] (y − x) ≥ 0
para cualquier par de puntos x, y ∈ M.

Igualmente, f es cóncava en M cuando se verifican las expresiones con el ≤.


Significado de las expresiones:

z = f (x) + ∇f (x)(y − x) → Es la recta/plano tangente a la curva/superficie en el pun-


to x (analogía con ec. punto pendiente y = y0 + m(x − x0 )).

f (y) ≥ f (x) + ∇f (x)(y − x) → Significa que la función está siempre por encima de la
recta/plano tangente.

[∇f (y) − ∇f (x)] (y − x) ≥ 0 → Significa que la derivada/gradiente es creciente cuan-


do me dirijo de x a y.
126 Sara Cuenda

Condiciones de segundo orden: Sea M ⊆ Rn un conjunto convexo abierto, sea f : M →


R una función con derivadas parciales primeras y segundas continuas en M.
Sea Hf (x0 ) el hessiano de la función en x0 ∈ M y q(y) = yT Hf (x0 )y, con y ∈ Rn , la forma
cuadrática asociada a dicho hessiano.

Entonces,

f es convexa (cóncava) en M si y sólo si q es semidefinida positiva (negativa) o


definida positiva (negativa) para todo x0 ∈ M.

Condición suficiente: Si q es definida positiva (negativa) para todo x0 ∈ M entonces


f es estrictamente convexa (cóncava) en M.

Ejercicio 9.7 Clasifica la concavidad o convexidad de las siguientes funciones utilizando


las condiciones de segundo orden.

a) f (x, y ) = x 2 + y 2

b) f (x) = x 4 + y 4
Álgebra Lineal (2016-17) 127

Propiedades de funciones cóncavas y convexas

Si f es convexa entonces −f es cóncava.

Las funciones lineales,


f (x) = x · a + c con x, a ∈ Rn , c ∈ R,
son cóncavas y convexas, ya que Hf (x) = O ∈ Mn .

Combinaciones lineales no negativas de funciones convexas generan funciones con-


vexas.

Si f es convexa en M ⊆ Rn , entonces la región de Rn que verifica


f (x) ≤ α, con x ∈ M
es un conjunto convexo de Rn para cualquier α ∈ R.
Igualmente, si f es cóncava, f (x)≥α define un conjunto convexo.

Observaciones:

Si f es cóncava entonces −f es convexa y la restricción f (x) ≥ α es equivalente a


−f (x) ≤ −α, con lo que ambos casos son equivalentes.
Son condiciones suficientes de convexidad, no necesarias.

Ejercicio 9.8 Decide si las siguientes regiones definen conjuntos convexos:

a) y + ln(x) ≥ 0 en R2 .
128 Sara Cuenda

b) x 2 + y 2 + z 2 ≤ 4 en R3 .

También podría gustarte