Está en la página 1de 37

0.1.

Ecuaciones lineales 1

0.1. Ecuaciones lineales


En esta sección estudiaremos la manera de encontrar la solución a una ecuación
lineal en varias incógnitas. Empezaremos por introducir las definiciones y terminologı́a
necesarias para este fin.

Definición 0.1.1 Un monomio es una expresión algebraica la cual está compuesta por
un sólo término, por ejemplo, son monomios:

2xy, 5x, 6xy 2 z 3 , 3.

Y no son monomios:

3x + 2y, 4x − 2xy 3 , 2yz 2 + 6xy − 5.

Aquı́ las dos primeras expresiones están formadas por dos términos, es decir, es la suma
de dos monomios, y la tercera por tres términos, es decir, está compuesto por la suma de
tres monomios.
Un monomio, como podemos verlo en los ejemplos anteriores, está formado, en general,
por un número, al cual llamaremos coeficiente, y por algunas letras cada una de ellas
elevada a un exponente.

Definición 0.1.2 (Grado de un monomio) El grado de un monomio puede ser de


dos tipos:
1. Grado absoluto

2. Grado relativo
El grado absoluto de un monomio es la suma de los exponentes de las letras que lo
componen.
El grado relativo de un monomio es siempre considerado con respecto a una letra y
se define como el exponente al que está elevada dicha letra.
Ası́, en los ejemplos anteriores, 2xy tiene grado absoluto igual a 2, y su grado relativo
con respecto a la letra x es 1, al igual que con respecto a la letra y.

6xy 2 z 3 , tiene grado absoluto igual a 6, su grado relativo con respecto a la letra x es
1, con respecto a la letra y es 2, y con respecto a la letra z es 3.

El monomio 3 tiene grado absoluto igual a 0, y no hablamos de su grado relativo.


2

En matemáticas aparecen dos cantidades de importancia fundamental, ellas son las vari-
ables y las constantes. Una cantidad se considera variable si es susceptible de tomar
valores numéricos diferentes. Por ejemplo, la edad de una persona, la estatura de un niño
durante sus primeros diez años de vida, el tiempo, la deuda interna de un paı́s, etc.
Una cantidad se considera constante si su valor no cambia, es decir, es una cantidad
que mantiene un valor fijo en el tiempo. Por ejemplo, el número de dı́as que tiene el mes
de enero, el número de estados en la república mexicana, el número de átomos que hay
en un mol de una sustancia, etc.
En general, para denotar a las cantidades variables se acostumbra emplear a las
últimas letras del abecedario, por ejemplo, u, v, w, x, y, z. Y para denotar a las cantidades
constantes se acostumbra emplear a las primeras letras del abecedario, por ejemplo,
a, b, c, d, e, f. Aquı́ es importante hacer notar que aun cuando se acostumbre representar
a las cantidades variables o constantes de la manera expuesta arriba, nada nos impide
representar a una cantidad variable con alguna de las primeras letras del abecedario,
ası́ como también, nada nos impide representar a una cantidad constante con alguna
de las últimas letras del abecedario. Pero aquı́, mientras no se establezca lo contrario,
emplearemos las últimas letras del abecedario para denotar a las cantidades variables y,
las primeras, para las cantidades constantes.
Definición 0.1.3 Un polinomio o función polinomial en las variables x1 , x2 , ...., xn
es una suma de monomios, cada uno de ellos de la forma
cxr11 xr22 · · · xrnn .
Donde c es un número real y los exponentes r1 , r2 , ..., rn son números enteros positivos o
cero. Definimos el grado de un polinomio como el mayor de los grados absolutos de
los monomios que lo componen.
Ası́, por ejemplo, son polinomios
2xy + 3z − 4, x3 yz 2 + 5y 6 x − 3, x3 + 3x − 2.
Los dos primeros son polinomios en las variables x, y, z y el tercero es un polinomio en
la variable x. El primero es de grado 2, el segundo es de grado 7 y el tercero es de grado 3.

Observación:
Es importante notar que el grado de un polinomio depende de las letras que son
consideradas como variables. Por ejemplo, si decretamos que las letras x, y denoten a las
variables y que las letras z, w representen cantidades constantes, entonces el grado del
polinomio,
2x2 y 3 + 5w7 xz 5 + 6,
en las variables x, y, es igual a 5, es decir, no consideramos a los exponentes de w, z pues
ellas no están siendo consideradas como variables.
0.1. Ecuaciones lineales 3

Definición 0.1.4 Una ecuación lineal en las n-variables (o indeterminadas o tam-


bién llamadas incógnitas), x1 , x2 , ...., xn , es una igualdad en la cual intervienen fun-
ciones polinomiales de grado uno (a las que se acostumbra llamar lineales), en las n-
variables x1 , x2 , ...., xn . Por lo tanto, una ecuación lineal en las n-incógnitas x1 , x2 , ...., xn
es cualquier expresión de la forma
a1 x1 + a2 x2 + .... + an xn = b. (1)
En donde a1 , a2 , ..., an , b son números reales.
Ejemplo 0.1.1
Las expresiones algebraicas siguientes son ecuaciones lineales
2x + 3y − 5z = 2, 3x + 2y − 5z + 2w − 10 = 0, 2x + y = 3z − 2w + t − 1.
Mientras que las siguientes expresiones algebraicas no son ecuaciones lineales
i) 2x2 +x+2y = 0. No es una ecuación lineal, pues uno de sus monomios es de grado 2.

ii) 3x + 2y − 5z − 2. No es una ecuación, pues no establece una igualdad.


iii) x + y − z + 10 = 0. No es una ecuación lineal, pues un monomio contiene una raı́z
cuadrada, es decir, no es de grado uno.

1 1
iv) + x − 2y = 2. No es una ecuación lineal, pues x
no es un monomio de grado uno.
x

v) x + yz + 4w − t = 5. No es una ecuación lineal, pues contiene un monomio de grado


2. ¥

0.1.1. Solución de una ecuación lineal en n-incógnitas


En esta sección estudiaremos técnicas las cuales nos permitirán encontrar la solución
a un sistema de ecuaciones lineales empleando la teorı́a de matrices desarrollada en la
sección anterior.

Definición 0.1.5 Una solución o solución particular de la ecuación lineal


a1 x1 + a2 x2 + .... + an xn = b, (2)
son valores para las variables xi , i = 1, 2, .., n los cuales, al ser sustituidos en la ecuación
lineal, hacen que la proposición resultante sea verdadera. Es decir, son valores de las xi
para los cuales la igualdad que define a la ecuación lineal se verifica.
4

Ejemplo 0.1.2
Dada la ecuación lineal
2x − 3y + 6z + 2v − 5w = 3,
los valores x = z = v = w = 0, y = −1 forman una solución de ésta, pues al sustituirlos
en la ecuación obtenemos una proposición verdadera.
3 = 2(0) − 3(−1) + 6(0) + 2(0) − 5(0) = 3 (proposición verdadera).
En cambio, los valores x = y = z = 1, v = w = 0 no constituyen una solución, pues al
sustituirlos en la ecuación resulta una afirmación que no es verdadera. En efecto,
5 = 2(1) − 3(1) + 6(1) + 2(0) − 5(0) = 3 (proposición falsa).
Una ecuación lineal puede admitir más de una solución. Por ejemplo, si consideramos los
valores
x = y = 0, z = w = v = 1,
ellos constituyen una solución diferente a la establecida arriba. Veámoslo
3 = 2(0) − 3(0) + 6(1) + 2(1) − 5(1) = 3 (proposición verdadera).
¥

Notación:
Si x1 = c1 , x2 = c2 , ..., xn = cn conforman una solución para la ecuación lineal
a1 x1 + a2 x2 + .... + an xn = b,
es decir, si la proposición
a1 c1 + a2 c2 + .... + an cn = b es verdadera,
entonces nosotros escribiremos esta solución como
(c1 , c2 , ..., cn ) o bien (x1 = c1 , x2 = c2 , ..., xn = cn ).
En este libro emplearemos, en general, la primera notación dando por sobreentendido
que el orden en el que aparecen las ci es el mismo en que aparecen las incógnitas xi en la
ecuación considerada.
Definición 0.1.6 Al conjunto formado por todas las posibles soluciones de la ecuación
lineal
a1 x1 + a2 x2 + .... + an xn = b, (3)
le llamaremos la solución general o el conjunto solución. Es decir, la solución general
(o conjunto solución) de la ecuación lineal (12) es:
n ¯ o
¯
S = (c1 , c2 , ..., cn ) ¯ a1 c1 + a2 c2 + .... + an cn = b . (4)
0.1. Ecuaciones lineales 5

Definición 0.1.7 Dada la ecuación lineal

a1 x1 + a2 x2 + .... + an xn = b,

llamaremos variable distinguida a la primer variable que aparece en la ecuación al


leerla de izquierda a derecha (aquı́ x1 es la variable distinguida). Y llamaremos variables
libres a todas las restantes (aquı́ x2 , ..., xn son las variables libres).

Observación:
Podemos obtener una solución particular para una ecuación lineal

a1 x1 + a2 x2 + .... + an xn = b,

asignándole valores particulares a las variables libres y, con ellos, una vez
sustituidos en la ecuación, obtener el valor de la variable distinguida mediante
un simple despeje. Es posible demostrar que todos los elementos del conjunto solución
(o solución general) de la ecuación lineal

a1 x1 + a2 x2 + .... + an xn = b,

se pueden obtener mediante el procedimiento antes descrito. Desgraciadamente, al no


ser éste uno de los objetivos principales de este libro, únicamente emplearemos dicho
resultado para obtener el conjunto solución de las ecuaciones lineales, dando por cierto,
sin demostración alguna, tal resultado.
Ejemplo 0.1.3
Para la ecuación lineal
2x + 3y − 5z + 2w = 1,
las variables, y, z, w son libres, mientras que x es la variable distinguida. Por ello, para
encontrar una solución particular para la ecuación dada, basta con asignarle valores
arbitrarios a las variables libres. Por ejemplo, para y = z = w = 0 obtengamos el
valor correspondiente a la variable distinguida. Ası́, en este caso al sustituir los valores
propuestos para las variables libres tendremos que

2x + 3(0) − 5(0) + 2(0) = 1,

lo que implica que x = 21 . Por lo tanto, la solución particular buscada es ( 21 , 0, 0, 0). Si


queremos encontrar otra solución particular, asignamos nuevos valores a las variables
libres; por ejemplo, podemos poner, y = 1, z = −2, w = 0 y, sustituyendo estos valores
en la ecuación considerada, obtendremos el valor particular para la variable distinguida.
Hagámoslo,
2x + 3(1) − 5(−2) + 2(0) = 1,
lo que implica que
2x + 13 = 1, es decir, x = −6.
6

Obtengamos ahora el conjunto solución (o solución general) de la ecuación

2x + 3y − 5z + 2w = 1.

Para lograr esto nos basta, básicamente, con despejar a la variable x y declarar que las
variables libres pueden tomar cualquier valor. Hagámoslo

1 − 3y + 5z − 2w
2x + 3y − 5z + 2w = 1 =⇒ x= .
2

Por lo tanto, el conjunto solución o solución general de la ecuación dada es


n³ ´¯ o
1 ¯
S= 2
(1 − 3y + 5z − 2w), y, z, w ¯ y, z, w ∈ R .

Ejemplo 0.1.4

Dada la ecuación lineal


3x + 2y − 6z − w = 1,

encontremos su solución general. Primero es necesario clasificar a las variables involu-


cradas: x es variable distinguida, mientras que y, z, w son variables libres. Ahora, escri-
bamos a la variable distinguida x en términos de y, z, w.

x = 13 (1 − 2y + 6z + w).

Y, por ello, la solución general o conjunto solución de la ecuación es


n³ ´¯ o
1 ¯
3
(1 − 2y + 6z + w), y, z, w ¯ y, z, w ∈ R .

Si queremos encontrar una solución particular, bastará con asignarle valores particulares
a las variables libres. Por ejemplo, si y = −1, z = 0, w = 1 obtendremos que la solución
particular será:
³ ´ ³ ´
1
3
(1 − 2(−1) + 6(0) + 1), −1, 0, 1 = 34 , −1, 0, 1 .

En este momento para el lector debe ser claro que las variables libres pueden tomar
cualquier valor y que el valor de la variable distinguida dependerá de los valores asignados
a las variables libres. ¥
0.2. Sistemas de ecuaciones lineales 7

0.2. Sistemas de ecuaciones lineales


En esta sección presentaremos algunos métodos que nos permiten encontrar la solu-
ción a un sistema de ecuaciones lineales.

Consideremos al sistema de ecuaciones lineales

a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = b1


a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = b3
(5)
· · · · · · ··· · · · ·

am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm .

Donde los bi y los aij , representan números reales los cuales, en el caso de los aij , para
cada i y j, aij es el coeficiente de la incógnita xj , en la i-ésima ecuación, es decir, el primer
subı́ndice, i, se refiere al número de ecuación, mientras que el segundo subı́ndice, j, se
refiere al número de la incógnita a la que acompaña el coeficiente aij . Por ello, a los aij
les llamaremos los coeficientes del sistema, mientras que a los bi les denominaremos
términos independientes. Cuando todos los términos independientes son iguales a
cero, es decir, bi = 0, para i = 1, 2, . . . , m decimos que el sistema de ecuaciones es un
sistema de ecuaciones lineales homogéneo, o simplemente, en este texto, sistema
de ecuaciones homogéneo.

0.2.1. Solución particular y general de un sistema de ecuaciones


lineales
Al igual que en el caso de una ecuación lineal, en un sistema de ecuaciones podemos
hablar del conjunto solución y de las soluciones particulares.

Definición 0.2.1 Una n-ada de números reales

(x1 = c1 , x2 = c2 , x3 = c3 , ..., xn = cn ),

es una solución particular (o simplemente una solución) para el sistema de ecuaciones


lineales (14), si al sustituir los valores asignados a las xi , es decir, si en lugar de xi es-
cribimos ci , en todas y cada una de las ecuaciones que componen al sistema, la proposición
resultante es verdadera.
Cuando no exista ambigüedad acerca de la posición de las incógnitas en la ecuación,
denotaremos esta solución simplemente por la n-ada (c1 , c2 , c3 , ..., cn ) en lugar de la n-
ada (x1 = c1 , x2 = c2 , x3 = c3 , ..., xn = cn ).
8

Ejemplo 0.2.1
Dado el sistema de ecuaciones

x + 2y − 2z + 3w = 2
2x + 4y − 3z + 4w = 5 ,
5x + 10y − 8z + 11w = 12
la 4-ada (4, 0, 1, 0), es una solución particular para el sistema anterior, pues, si sustitui-
mos estos valores en las ecuaciones que componen al sistema, obtenemos una proposición
verdadera. Veámoslo

2 = (4) + 2(0) − 2(1) + 3(0) = 2


5 = 2(4) + 4(0) − 3(1) + 4(0) = 5
12 = 5(4) + 10(0) − 8(1) + 11(0) = 12.
La cual es una proposición verdadera.
Mientras que la 4-ada (1, 0, −1, 0), no constituye una solución para el sistema de ecua-
ciones dado, pues, al sustituir estos valores en las ecuaciones que componen al sistema,
no obtenemos una proposición verdadera. Veámoslo
3 = (1) + 2(0) − 2(−1) + 3(0) = 2
5 = 2(1) + 4(0) − 3(−1) + 4(0) = 5
13 = 5(1) + 10(0) − 8(−1) + 11(0) = 12.
La cual es una proposición falsa. ¥

Definición 0.2.2 Al conjunto formado por todas las soluciones particulares de un sis-
tema de ecuaciones lineales le llamaremos la solución general, o bien, el conjunto
solución del sistema.

La siguiente observación, como podremos ver posteriormente, es de gran utilidad en las


aplicaciones, por ello, es necesario tenerla siempre presente.

Observación:
Dado el sistema de ecuaciones lineales siguiente
a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = b1
a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = b3
(6)
· · · · · · ··· · · · ·

am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm .


Si denotamos por Si al conjunto solución de la i-ésima ecuación, entonces la inter-
sección de todos estos conjuntos será igual al conjunto solución del sistema de
0.3. Método de Gauss y Método de Gauss-Jordan 9

ecuaciones lineales considerado. Es decir, si S denota al conjunto solución, o solución


general del sistema de ecuaciones (15), entonces

S = S1 ∩ S2 ∩ ... ∩ Sm . (7)

Aún cuando es evidente, es importante observar que el conjunto solución de un sistema de


ecuaciones homogéneo siempre tiene por elemento a la solución (x1 = 0, x2 = 0, . . . , xn =
0). Por tanto, para un sistema de ecuaciones homogéneo siempre se tienen dos posi-
bilidades, el sistema tiene solución única, en este caso será la solución (x1 = 0, x2 =
0, . . . , xn = 0), o el sistema admite una infinidad de soluciones.

Desde un punto de vista algebraico, no resulta práctico encontrar el conjunto solución,


o solución general, de un sistema de ecuaciones lineales como la intersección de los con-
juntos solución de cada una de las ecuaciones que lo componen. Pero con la ayuda de las
matrices podemos encontrar dicha solución general de una manera sencilla y, podrı́amos
decir, elegante.

0.3. Método de Gauss y Método de Gauss-Jordan

Los métodos de Gauss y de Gauss-Jordan son algoritmos, los cuales nos permiten
encontrar la solución a un sistema de ecuaciones lineales usando métodos matriciales,
básicamente, usando operaciones elementales entre los renglones de una matriz. Grosso
modo, el procedimiento que hay que seguir, de acuerdo a estos métodos, para encontrar
la solución general a un sistema de ecuaciones lineales es:

A un sistema de ecuaciones lineales dado le asignaremos una matriz, la cual formaremos


con los coeficientes de las variables, o incógnitas1 , involucradas en el sistema. Posterior-
mente, llevaremos esta matriz, en el caso del método de Gauss, a la forma escalonada
y, en el caso del método de Gauss-Jordan, a su forma canónica. A la matriz obtenida,
en cada caso, le asignaremos un sistema de ecuaciones, el cual tendrá el mismo conjunto
solución que el sistema original, y clasificaremos sus varables en libres y distinguidas.
Por último, determinaremos el valor de las incógnitas. A continuación presentamos con
detalle estos métodos.

1
Algunos autores también les llaman indeterminadas o términos algebraicos.
10

A un sistema de ecuaciones lineales del tipo

a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = b1


a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = b3
(8)
· · · · · · ··· · · · ·

am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm ,

le asociamos la matriz siguiente, a la cual llamaremos la matriz aumentada del sistema:


 
a11 a12 a13 . . . a1n b1
 a21 a22 a23 . . . a2n b2 
 
 a31 a32 a33 . . . a3n b3 
 
 . . . . . . . (9)
 
 . . . . . . 
 
 . . . . . . 
am1 am2 am3 . . . amn bm

Es muy importante notar que en el sistema de ecuaciones lineales (17), las incógnitas están
alineadas de tal manera que podemos hablar de la columna, en la matriz aumentada, que
corresponde a una variable determinada; por ejemplo, la columna que corresponde a la
variable x1 , será la primera columna de la matriz aumentada, la columna asociada a la
variable x2 , será la segunda columna y ası́ sucesivamente.
A la matriz cuyas componentes son los coeficientes de las incógnitas le llamaremos la
matriz de coeficientes:

 
a11 a12 a13 . . . a1n
 a21 a22 a23 . . . a2n 
 
 a31 a32 a33 . . . a3n 
 
 . . . . . . (10)
 
 . . . . . 
 
 . . . . . 
am1 am2 am3 . . . amn

Ejemplo 0.3.1
Dado el sistema de ecuaciones lineales
2x1 − 3x2 + x3 = −3
3x2 − 5x3 = 4
,
5x1 + 2x2 + 4x3 = 3
2x1 + 5x3 = 2
0.3. Método de Gauss y Método de Gauss-Jordan 11

antes de asignarle la matriz aumentada correspondiente, y con el fin de evitar confu-


siones, es conveniente ordenar las incógnitas de manera tal que todos los términos que
contienen a x1 se encuentren en una misma columna, lo mismo para las incógnitas x2 y
x3 . Ordenando las incógnitas tenemos

2x1 − 3x2 + x3 = −3
3x2 − 5x3 = 4
.
5x1 + 2x2 + 4x3 = 3
2x1 + 5x3 = 2

A partir del sistema anterior establecemos la matriz aumentada asociada, que es:
 
2 −3 1 −3
 0 3 −5 4 
 .
 5 2 4 3 
2 0 5 2

La matriz de coeficientes es:


 
2 −3 1
 0 3 −5 
 .
 5 2 4 
2 0 5
¥

Nota:
Dado el sistema de ecuaciones lineales
a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = b1
a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = b3

· · · · · · ··· · · · ·

am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm ,

le podemos asociar su matriz aumentada A. Si sobre los renglones de la matriz A efec-


tuamos alguna operación elemental, nosotros obtendremos una nueva matriz B, y con
12

esta matriz podemos construir, de manera natural, un sistema de ecuaciones el cual ten-
drá por matriz aumentada a la matriz B. Se puede demostrar que los dos sistemas de
ecuaciones, el asociado a la matriz A y el asociado a la matriz B, tienen el
mismo conjunto solución. La demostración se puede consultar en [1], [8] o [9].
Ejemplo 0.3.2
Dado el sistema de ecuaciones
3x1 − x2 + x3 = 1
x1 + 3x2 − x3 = 0
,
5x1 + x2 + 4x3 = 1
2x1 − 2x2 + 5x3 = 2

su matriz aumentada es
 
3 −1 1 1
 1 3 −1 0 
A=
 5
.
1 4 1 
2 −2 5 2
Si sobre la matriz A efectuamos, por ejemplo, las operaciones elementales
R3 7−→ R3 + (−5)R2
R4 7−→ R4 + (−2)R2
nosotros obtendremos la nueva matriz
 
3 −1 1 1
 1 3 −1 0 
B=
 0 −14
.
9 1 
0 −8 7 2
Con la matriz B ası́ obtenida, podemos construir un sistema de ecuaciones el cual
tenga por matriz aumentada a la matriz B. Basta con recordar como fue que construimos
la matriz A; la manera de hacerlo fue poniendo en la primera columna a los coeficientes
de la primera variable que aparecı́a en las ecuaciones, al leer éstas de izquierda a derecha,
en este caso x1 , en la segunda columna, los coeficientes de la segunda variable, en la tercer
columna, los coeficientes de la tercera variable y en la última columna, la columna formada
por los términos independientes. Por tanto, si hacemos el proceso inverso, obtendremos
el sistema buscado, que en este caso es:
3x1 − x2 + x3 = 1
x1 + 3x2 − x3 = 0
.
− 14x2 + 9x3 = 1
− 8x2 + 7x3 = 2
0.3. Método de Gauss y Método de Gauss-Jordan 13

Se puede demostrar que los dos sistemas de ecuaciones anteriores tienen el mismo
conjunto solución.
¥

Definición 0.3.1 Dado el sistema de ecuaciones lineales


a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = b1
a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = b3

· · · · · · ··· · · · ·

am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm ,

le asociamos su matriz aumentada A y, vı́a operaciones elementales entre renglones, la


llevamos a una forma escalonada B, en ésta podemos ubicar a los elementos distingui-
dos. Aquellas variables, en cuya columna asociada en la matriz B, aparezcan elementos
distinguidos les llamaremos variables distinguidas. Aquella variable, en cuya columna
asociada en la matriz B, no aparezcan elementos distinguidos le llamaremos variable
libre.

0.3.1. Método de Gauss


A continuación describiremos los métodos de Gauss y de Gauss-Jordan, dichos méto-
dos nos permiten encontrar la solución general a un sistema de ecuaciones lineales de
una manera rápida y elegante. No justificaremos de una manera formal la razón por la
cual, mediante tales métodos, nosotros podemos obtener la solución de un sistema de
ecuaciones lineales, nos concretaremos simplemente a describir y a usar dichas técnicas.

Dado el sistema de ecuaciones lineales


a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = b1
a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = b3

· · · · · · ··· · · · ·

am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm ,


14

para encontrar su solución general procedemos de la manera siguiente:


1. Al sistema de ecuaciones, cuya solución queremos obtener, le asociamos su matriz
aumentada.
2. Valiéndonos de operaciones elementales entre los renglones de la matriz aumentada,
la llevamos a la forma escalonada.
3. Clasificamos las variables como variables libres y variables distinguidas.
4. Planteamos el sistema de ecuaciones lineales el cual tenga por matriz aumentada a
la matriz escalonada obtenida en el punto 2).
5. Le asignamos valores arbitrarios a las variables libres, con estos valores, y el sis-
tema de ecuaciones obtenido en el punto 4), obtenemos los valores de las variables
distinguidas, haciendo uso primero de la última ecuación que aparece en el sis-
tema, después de la ecuación que está arriba de esta última y ası́ sucesivamente,
hasta agotar todas las ecuaciones que componen al sistema obtenido en el punto 4).

Ejemplo 0.3.3
Dado el sistema de ecuaciones lineales
x1 + 5x2 + 11x3 = −5
2x1 + 3x2 + 8x3 = 4
−x1 + 2x2 + 3x3 = −9,

resolvámoslo empleando el método de Gauss. Sigamos los 5 pasos anteriores:


1. La matriz aumentada asociada al sistema es
 
1 5 11 −5
A= 2 3 8 4 .
−1 2 3 −9

2. Vı́a operaciones elementales entre los renglones, llevemos la matriz anterior a su


forma escalonada:

   
1 5 11 −5 1 5 11 −5
A= 2 3 8 4  ∼  0 −7 −14 14 
−1 2 3 −9 R2 7−→R2 +(−2)R1 0 7 14 −14 R3 7−→R3 +R2
R3 7−→R3 +R1
 
1 5 11 −5
∼  0 −7 −14 14  .
0 0 0 0
0.3. Método de Gauss y Método de Gauss-Jordan 15

3. Clasifiquemos las variables: Las columnas asociadas a las variables x1 y x2 , en la


matriz escalonada, contienen elementos distinguidos. Por ello, x1 y x2 son variables
distinguidas, mientras que la variable x3 es variable libre.
4. El sistema de ecuaciones lineales
x1 + 5x2 + 11x3 = −5
− 7x2 − 14x3 = 14,

tiene por matriz aumentada a la matriz escalonada obtenida en el punto 2.


5. Asignémosle valores arbitrarios a la variable libre x3 , por ejemplo, x3 = t, t ∈ R
y, usando este valor en el sistema planteado en el punto anterior, obtengamos los
valores de las variables distinguidas: Sustituyamos el valor asignado a x3 en la
segunda ecuación
−7x2 − 14(t) = 14 =⇒ x2 = −2 − 2t.
Sustituyendo los valores de x2 y x3 en la primera ecuación, obtenemos
x1 + 5(−2 − 2t) + 11(t) = −5 =⇒ x1 = 5 − t.
El conjunto solución del sistema de ecuaciones
x1 + 5x2 + 11x3 = −5
2x1 + 3x2 + 8x3 = 4
−x1 + 2x2 + 3x3 = −9

es exactamente el mismo que el conjunto solución del sistema


x1 + 5x2 + 11x3 = −5
− 7x2 − 14x3 = 14
Por ello, el conjunto solución, o solución general, buscada es
n ¯ o
¯
(5 − t, −2 − 2t, t) ¯ t ∈ R .

Una solución particular del sistema es cualquier elemento del conjunto solución y
éste lo obtenemos asignándole valores particulares a t, que es el valor de la variable
libre. Pongamos, por ejemplo, t = 0 lo que nos dá la solución particular
(5, −2, 0).
Es decir, si sustituimos los valores
x1 = 5, x2 = −2, x3 = 0,
en el sistema de ecuaciones considerado, obtenemos una proposición verdadera.
¥
16

Ejemplo 0.3.4

Dado el sistema de ecuaciones lineales

2x1 + 3x2 + x3 = 3
x1 + 2x2 + x3 = 1
−x1 + 4x2 = −2,

resolvámoslo empleando el método de Gauss. Sigamos los mismos 5 pasos anteriores:

1. La matriz aumentada asociada al sistema es


 
2 3 1 3
A= 1 2 1 1 .
−1 4 0 −2

2. Vı́a operaciones elementales entre los renglones, llevemos la matriz anterior a la


forma escalonada:

   
2 3 1 3 1 2 1 1
A= 1 2 1 1  ∼ 2 3 1 3 
−1 4 0 −2 R1 ←→R2 −1 4 0 −2 R2 7−→R2 +(−2)R1
R3 7−→R3 +R1

   
1 2 1 1 1 2 1 1
∼  0 −1 −1 1  ∼  0 −1 −1 1 
0 6 1 −1 R3 7−→R3 +(6)R2 0 0 −5 5

3. Clasifiquemos las variables: Las columnas asociadas a las variables x1 , x2 y x3 , en


la matriz escalonada contienen elementos distinguidos. Por ello, x1 , x2 y x3 son
variables distinguidas, y no hay variables libres.

4. El sistema de ecuaciones lineales

x1 + 2x2 + x3 = 1
− x2 − x3 = 1
− 5x3 = 5

tiene por matriz aumentada a la matriz escalonada obtenida en el punto 2)


0.3. Método de Gauss y Método de Gauss-Jordan 17

5. Con ayuda del sistema planteado en el punto anterior, obtengamos los valores de
las variables distinguidas:
De la última ecuación tenemos que

−5x3 = 5 =⇒ x3 = −1.

Sustituyamos el valor encontrado de x3 en la segunda ecuación

−x2 − x3 = 1, lo que da lugar a, − x2 − (−1) = 1 =⇒ x2 = 0.

Sustituyendo los valores x3 = −1 y x2 = 0 en la primera ecuación

x1 + 2x2 + x3 = 1, obtenemos x1 + 2(0) + (−1) = 1 =⇒ x1 = 2.

El conjunto solución del sistema de ecuaciones

2x1 + 3x2 + x3 = 3
x1 + 2x2 + x3 = 1
−x1 + 4x2 = −2,

es exactamente el mismo que el conjunto solución del sistema

x1 + 2x2 + x3 = 1
− x2 − x3 = 1
− 5x3 = 5.

Por ello, el conjunto solución, o solución general, es


n o
(2, 0, −1) .

Ası́, si sustituimos los valores

x1 = 2, x2 = 0, x3 = −1,

en el sistema de ecuaciones considerado, obtenemos una proposición verdadera.


¥

Nota:
En este ejemplo es importante observar que el sistema considerado admite una solu-
ción única, mientras que en el ejemplo anterior el sistema admitı́a una infinidad de solu-
ciones.

Ejemplo 0.3.5
18

Dado el sistema de ecuaciones lineales

x1 + 5x2 + 4x3 − 13x4 = 3


3x1 − x2 + 2x3 + 5x4 = 2
2x1 + 2x2 + 3x3 − 4x4 = 1,

resolvámoslo empleando el método de Gauss. Sigamos los mismos 5 pasos anteriores:

1. La matriz aumentada asociada al sistema es


 
1 5 4 −13 3
A =  3 −1 2 5 2 
2 2 3 −4 1.

2. Vı́a operaciones elementales entre los renglones, llevemos la matriz anterior a su


forma escalonada:
   
1 5 4 −13 3 1 5 4 −13 3
A =  3 −1 2 5 2  ∼  0 −16 −10 44 −7 
2 2 3 −4 1 R2 ←→R2 +(−3)R1 0 −8 −5 22 −5 R2 ←→R3
R3 7−→R3 +(−2)R1

   
1 5 4 −13 3 1 5 4 −13 3
∼  0 −8 −5 22 −5  ∼  0 −8 −5 22 −5  .
0 −16 −10 44 −7 R3 7−→R3 +(−2)R2 0 0 0 0 3

3. Clasifiquemos las variables: Las columnas asociadas a las variables x1 y x2 , en la


matriz escalonada, contienen elementos distinguidos, por ello, x1 y x2 son variables
distinguidas. Mientras que al no contener, las columnas asociadas a las variables
x3 ,x4 en la matriz escalonada, elementos distinguidos, estas variables son variables
libres.

4. El sistema de ecuaciones lineales

x1 + 5x2 + 4x3 − 13x4 = 3


− 8x2 − 5x3 + 22x4 = −5
0 = 3

tiene por matriz aumentada a la matriz escalonada obtenida en el punto 2).

5. El sistema anterior contiene una contradicción en su último renglón, pues nunca


0 = 3. Por lo tanto, para ningún valor de las variables x1 ,x2 ,x3 obtendremos una
proposición verdadera. Ası́ podemos concluir que el sistema anterior no admite
solución alguna; su conjunto solución es el conjunto vacio.
0.3. Método de Gauss y Método de Gauss-Jordan 19

Observación:
Los tres ejemplos anteriores nos muestran que existen tres posibilidades para el con-
junto solución de un sistema de ecuaciones lineales, las cuales son:

1. El sistema tiene una infinidad de soluciones particulares, es decir, el conjunto


solución tiene una infinidad de elementos.

2. El sistema tiene una única solución particular, es decir, el conjunto solución


tiene un único elemento.

3. El sistema no tiene soluciónes particulares, es decir, el conjunto solución


no tiene elementos, es el conjunto vacı́o ∅.

Cuando ocurre la primera, la segunda o la tercera de las tres posibilidades anteriores,


se acostumbra decir que el sistema de ecuaciones tiene, respectivamente, una infinidad
de soluciones, que tiene solución única o que no tiene solución.
Otro método que nos permite encontrar la solución de un sistema de ecuaciones linea-
les es el método de Gauss-Jordan. Este método se basa, como veremos, en el método de
Gauss, pero tiene la virtud de que se obtienen los valores de las incógnitas de una manera
casi directa y, con ello, la solución del sistema de ecuaciones lineales de una manera más
sencilla que en el caso del método de Gauss.

0.3.2. Método de Gauss-Jordan


Dado el sistema de ecuaciones lineales
a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = b1
a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = b3

· · · · · · ··· · · · ·

am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm

Para encontrar su solución general por el método de Gauss-Jordan procedemos de la


manera siguiente:
1. Al sistema de ecuaciones lineales, cuya solución queremos obtener, le asociamos su
matriz aumentada.
20

2. Valiéndonos de las operaciones elementales entre los renglones de la matriz aumen-


tada la llevamos a su forma canónica.

3. Clasificamos las variables en variables libres y variables distinguidas.

4. Planteamos el sistema de ecuaciones lineales el cual tenga por matriz aumentada a


la matriz obtenida en el punto 2).

5. Le asignamos valores arbitrarios a las variables libres y, con ayuda de ellos, y del
sistema de ecuaciones obtenido en el punto 4), obtenemos los valores de las varia-
bles distinguidas.

Ejemplo 0.3.6

Apliquemos el método de Gauss-Jordan para obtener la solución del sistema de ecua-


ciones
x1 + 2x2 + 2x3 = 2
3x1 − 2x2 − x3 = 5
(11)
2x1 − 5x2 + 3x3 = −4
x1 + 4x2 + 6x3 = 0.
Sigamos los 5 pasos anteriores:

1. La matriz aumentada asociada al sistema de ecuaciones lineales anterior es:


 
1 2 2 2
 3 −2 −1 5 
A=  2 −5
.
3 −4 
1 4 6 0

2. Llevemos la matriz anterior a su forma canónica, llevándola primero a su forma


escalonada, después haciendo que todos sus elementos distinguidos sea iguales al
número uno y, posteriormente, tomando dichos elementos distinguidos como pivo-
tes, hacemos que ellos sean los únicos elementos no cero en su columna respectiva.
Hagámoslo:

   
1 2 2 2 1 2 2 2
 3 −2 −1 5   0 −8 −7 −1 
A=
 2 −5
 ∼ 
3 −4   0 −9 −1 −8 
1 4 6 0 RR23 7−7−→R 2 +(−3)R1
→R3 +(−2)R1 0 2 4 −2 R2 7−→R2 +(−1)R3
R4 7−→R4 +(−1)R1
0.3. Método de Gauss y Método de Gauss-Jordan 21

   
1 2 2 2 1 2 2 2
 0 1 −6 7   0 1 −6 7 
∼ 
 0 −9 −1 −8  ∼
 0

0 −55 55 
0 2 4 −2 R3 7−→R3 +(9)R2 0 0 16 −16 R3 7−→ 551 R3
R4 7−→R4 +(−2)R2 1 R
R4 7−→ 16 4

   
1 2 2 2 1 2 2 2
 0 1 −6 
7   0 1 −6 7 
∼
 0  ∼



0 −1 1 0 0 −1 1
0 0 1 −1 R4 7−→R4 +R3 0 0 0 0 R3 7−→(−1)R3

   
1 2 2 2 1 2 0 4
 0 1 −6 7   0 1 0 1 
∼
 0
 ∼ 
0 1 −1   0 0 1 −1 
0 0 0 0 R2 7−→R2 +(6)R3 0 0 0 0 R1 7−→R1 +(−2)R2
R1 7−→R1 +(−2)R3

 
1 0 0 2
 0 1 0 1 
∼
 0
.
0 1 −1 
0 0 0 0

3. En las tres columnas correspondientes a las variables x1 ,x2 ,x3 hay elementos dis-
tinguidos, por ello, dichas variables son variables distinguidas. No hay variables
libres.

4. El sistema de ecuaciones lineales

x1 = 2
x2 = 1
x3 = −1

tiene por matriz aumentada a la matriz obtenida en el punto 2.


22

5. Aquı́ no tenemos variables libres y, como podemos ver, del punto 4 obtenemos
directamente
n los valores
o de las incógnitas. Ası́, el sistema (20) tiene por solución
general (2, 1, −1) . ¥

Ejemplo 0.3.7
Apliquemos el método de Gauss-Jordan para obtener la solución del sistema de ecua-
ciones
x1 + 2x2 − 3x3 + 2x4 = 2
2x1 + 5x2 − 8x3 + 6x4 = 5 (12)
3x1 + 4x2 − 5x3 + 2x4 = 4.
Sigamos los mismos 5 pasos que seguimos anteriormente:
1. La matriz aumentada asociada al sistema de ecuaciones lineales anterior es:
 
1 2 −3 2 2
A =  2 5 −8 6 5 
3 4 −5 2 4.

2. Llevemos la matriz anterior a su forma canónica, llevándola primero a su forma


escalonada, después haciendo que todos sus elementos distinguidos sea iguales a uno
y, posteriormente, tomando dichos elementos distinguidos como pivotes, hacemos
que ellos sean los únicos elementos no cero en su columna respectiva. Hagámoslo:

   
1 2 −3 2 2 1 2 −3 2 2
A =  2 5 −8 6 5  ∼ 0 1 −2 2 1 
3 4 −5 2 4 R2 7−→R2 +(−2)R1 0 −2 4 −4 −2 R3 7−→R3 +(2)R2
R3 7−→R3 +(−3)R1

   
1 2 −3 2 2 1 0 1 −2 0
∼  0 1 −2 2 1  ∼  0 1 −2 2 1 
0 0 0 0 0 R1 7−→R1 +(−2)R2 0 0 0 0 0

3. En las dos columnas correspondientes a las variables x1 y x2 hay elementos dis-


tinguidos, por ello, dichas variables son variables distinguidas. Mientras que en las
columnas correspondientes a x3 ,x4 no hay elementos distinguidos, por lo tanto, ellas
son variables libres.
0.3. Método de Gauss y Método de Gauss-Jordan 23

4. El sistema de ecuaciones lineales


x1 + x3 − 2x4 = 0
x2 − 2x3 + 2x4 = 1,

tiene por matriz aumentada a la matriz obtenida en el punto 2.

5. Asignémosle a las variables libres valores arbitrarios, pongamos, por ejemplo,

x3 = a, x4 = b a, b ∈ R.

Sustituyendo estos valores en el sistema de ecuaciones del punto anterior y operando


algebraicamente, tenemos:

0 = x1 + x3 − 2x4 = x1 + (a) − 2(b) =⇒ x1 = −a + 2b,

1 = x2 − 2x3 + 2x4 = x2 − 2a + 2(b) =⇒ x2 = 1 + 2a − 2b.

Ası́, el sistema (21) tiene por solución general


n ¯ o
¯
(−a + 2b, 1 + 2a − 2b, a, b) ¯ a, b ∈ R .

Producto de matrices.

De una manera formal la definición del producto de matrices es la siguiente: si A ∈


Mn×m , B ∈ Mm×s , entonces el producto AB es
m
X
AB = (aij )(bjk ) = (cik ); en donde cik = aij bjk .
j=1

En la práctica, cuando nos enfrentamos por primera vez al producto de matrices, no


resulta sencillo recordar la definición de éste. Por tal motivo, sugerimos al lector usar
la siguiente estrateguia. La presentaremos para dos matrices muy particulares, pero esta
estrategia vale para el producto de dos matrices cualesquiera, siempre que su producto
esté definido.

En lugar de escribir el producto como es usual, es decir,


 
  b11 b12 b13 b14  
a11 a12 a13 a14   c11 c12 c13 c14
a21 a22 a23 a24  b21 b22 b23 b24  
= c21 c22 c23 c24 
b31 b32 b33 b34 
a31 a32 a33 a34 c31 c32 c33 c34
b41 b42 b43 b44
24

lo escribiremos de la forma:
 
b11 b12 b13 b14
b21 b22 b23 b24 
 
b31 b32 b33 b34 
b41 b42 b43 b44
.
   
a11 a12 a13 a14 c11 c12 c13 c14
a21 a22 a23 a24  c21 c22 c23 c24 
a31 a32 a33 a34 c31 c32 c33 c34

Arreglo que nos permitirá recordar la manera en que son obtenidas las componentes cik ,
como el producto de un renglón por una columna. Por ejemplo, el elemento c11 , es el
resultado de multiplicar el renglón 1, de la matriz A, por la columna 1, de la matriz B.
Producto que se realiza de la siguiente manera:

b11
b21
b31
b41

a11 a12 a13 a14 c11 = a11 b11 + a12 b21 + a13 b31 + a14 b41 .

En general, la componente cik , es el resultado de multiplicar el i-ésimo renglón de la


primera matriz, por la k-ésima columna de la segunda matriz. Tal producto se efectúa
de la siguiente manera:

b1k
b2k
b3k
b4k

ai1 ai2 ai3 ai4 cik = ai1 b1k + ai2 b2k + ai3 b3k + ai4 b4k .

Ası́, el primer renglón de la matriz producto está alineado con el primer renglón del primer
factor, y la primera columna de la matriz producto, está alineada con la primera columna
del segundo factor. En general, el i-ésimo renglón de la matriz producto está alineado
con el i-ésimo renglón del primer factor, y la k-ésima columna de la matriz producto,
está alineada con la k-ésima columna del segundo factor.

Entre la ventajas de este tipo de arreglo es que resulta claro el tamaño de la matriz
que resulta al efectuar el producto, pues el número de renglones de la matriz produco
0.3. Método de Gauss y Método de Gauss-Jordan 25

coincide con el número de renglones del primer factor, y el número de columnas es el


número de columnas del segundo factor.

A continuación presentamos las propiedades principales del producto de matrices.

Teorema 0.3.1 Sean A, B, C matrices tal que las sumas y los productos especificados
a continuación se pueden realizar, y λ un escalar, entonces son ciertas las igualdades
siguientes:

i) (AB)C = A(BC), (asociatividad)

ii) A(B + C) = AB + AC, (distributividad por la izquierda)

iii) (B + C)A = BA + CA, (distributividad por la derecha)

iv) λ(AB) = (λA)B = A(λB),

iv) en general, el producto de matrices no es conmutativo, esto es, en general,

AB 6= BA.

El producto entre dos matrices no siempre está definido, sin importar que éstas sean o no
de igual tamaño. Por ejemplo, si A es una matriz de tamaño 2 × 3, no es posible realizar
el producto AA, pues estariamos multiplicando una matriz 2 × 3 por una 2 × 3, cosa que
no es posible. Más, sin embargo, el producto entre matrices cuadradas de igual tamaño
siempre está definido y, por tal motivo, siempre podemos hablar de las potencias de una
matriz cuando ésta es cuadrada.

Para una matriz A ∈ Mm (R), definimos, para n ∈ N,

A2 = AA, A3 = A2 A = AA2 , A4 = A3 A = AA3 , . . . , An = An−1 A = AAn−1 .

En vista de esto, si P (λ) = a0 + a1 λ + a2 λ2 + . . . + an λn es un polinomio en la variable λ,


con coeficientes rales y si A ∈ Mm (R), definimos lo que será el polinomio P (λ) evaluado
en la matriz A, como la matriz

P (A) = a0 In + a1 A + a2 A2 + . . . + an An ∈ Mm (R). (13)

Es sumamente importante el observar que al evaluar un polinomio en una matriz, el


término independiente del polinomio a0 , se escribe como el término independiente mul-
tiplicando a la matriz identidad, a0 In . De no hacerse esto, se tendrı́a una inconsistencia,
pues estariamos tratando de sumar un ecalar con una matriz.
26
 
0 1 2

Por ejemplo, si A = −1 0 1 y P (λ) = 3 + λ + 3λ2 − λ3 , entonces, en vista
−2 −1 0
de que     
0 1 2 0 1 2 −5 −2 1
2
A = AA = −1 0 1 −1 0 1 = −2 −2 −2 ,
−2 −1 0 −2 −1 0 1 −2 −5

    
0 1 2 −5 −2 1 0 −6 −12
A3 = AA2 = −1 0 1 −2 −2 −2 =  6 0 −6  ,
−2 −1 0 1 −2 −5 12 6 0
se tiene que:
P (A) = 3I3 + A + 3A2 − A3
       
1 0 0 0 1 2 −5 −2 1 0 −6 −12
= 3 0 1 0 + −1 0 1 + 3 −2 −2 −2 −  6 0 −6 
0 0 1 −2 −1 0 1 −2 −5 12 6 0
       
3 0 0 0 1 2 −15 −6 3 0 6 12
= 0 3 0 + −1 0 1 +  −6 −6 −6  +  −6 0 6
0 0 3 −2 −1 0 3 −6 −15 −12 −6 0
 
−12 1 17
=  −13 −3 1 .
−11 −13 −12
¥

0.3.2.1. Inversa y transpuesta de una matriz.


Como el lector se podrá imaginar, si tenemos definido un producto entre matrices re-
sulta natural preguntarse por el inverso multiplicativo, o la inversa de una matriz dada.
Al estudiar los números reales vimos que para asegurar la existencia del inverso mul-
tiplicativo de un número, era necesario que este número fuera diferente de cero. En el
caso de matrices, como veremos, son varias las condiciones que una matriz debe cumplir
para ser invertible. De manera natural, para definir lo que en matrices entenderemos por
el inverso multiplicativo, es necesario contar con un elemento neutro multiplicativo. En
el caso de los números reales es el número uno, en el caso de las matrices, el neutro
multiplicativo lo constituye la matriz identidad I ∈ Mn (R), pues para toda A ∈ Mn (R),
se cumple que AI = IA = A. Definamos lo que entenderemos por una matriz invertible.
0.3. Método de Gauss y Método de Gauss-Jordan 27

Definición 0.3.2 Una matriz A se dice que es invertible, o no singular, si existe una
matriz, que se denota como A−1 , tal que
AA−1 = I = A−1 A. (14)
Donde I es la matriz identidad. La matriz A−1 se denomina la inversa de la matriz A.

Si una matriz no es invertible entonces diremos que es singular.


Observación:
La única manera de que los productos AA−1 y A−1 A estén ambos definidos es si A
y A−1 son matrices cuadradas de igual tamaño. Por lo tanto, las únicas matrices que
tienen posibilidad de ser invertibles son las matrices cuadradas, pero esto no
basta para asegurar que una matriz es invertible.

Observación:
Para mostrar que una matriz A−1 es en efecto la inversa de una matriz A, nos basta
con mostrar que uno de los productos, ya sea AA−1 , o A−1 A, es igual a la identidad.

Es importante observar que cuando una matriz A es invertible, su inversa es única.

Para encontrar la inversa de una matriz A de tamaño n × n, procedemos de la manera


siguiente:
Formamos la matriz por bloques (A | I ), donde I es la matriz identidad de tamaño
n × n. Posteriormente, llevamos la matriz (A | I ) a su forma canónica. Aquı́ tendremos
dos posibilidades:
i) La forma canónica se ve como la matriz por bloques (I | A−1 ), entonces la matriz
que queda en el bloque de la derecha es la inversa de la matriz A.
ii ) La forma canónica se ve como la matriz (B | C ), donde B no es la matriz identidad,
entonces la matriz A no es invertible.
Ejemplo 0.3.8
Vea si la matriz  
1 0 1
A= 0 1 1 
1 0 0
es o no invertible.
Solución:
Formemos la matriz por bloques (A | I ) y llevémosla a su forma canónica:
   
1 0 1 1 0 0 1 0 1 1 0 0
(A | I ) =  0 1 1 0 1 0  ∼ 0 1 1 0 1 0 
1 0 0 0 0 1 R3 7−→R3 +(−1)R1 0 0 −1 −1 0 1 R2 7−→R2 +R3
R1 7−→R1 +R3
28
   
1 0 0 0 0 1 1 0 0 0 0 1
∼ 0 1 0 −1 1 1  ∼  0 1 0 −1 1 1  = (I | A−1 ).
0 0 −1 −1 0 1 R3 7−→(−1)R3 0 0 1 1 0 −1

Por lo tanto, la matriz dada si es invertible y su inversa es:


 
0 0 1
A−1 =  −1 1 1 .
1 0 −1

Como el lector podrá comprobar al efectuar el producto AA−1 (o A−1 A) se obtiene la


matriz identidad.
¥

Ejemplo 0.3.9

Determinemos si la matriz  
1 3 −2
2 −1 0  ,
4 5 −4
es, o no, invertible.

Formemos la matriz por bloques (A | I ) y llevémosla a su forma canónica:


   
1 3 −2 1 0 0 1 3 −2 1 0 0

(A | I) = 2 −1 0 0 1 0  ∼  0 −7 4 −2 1 0 
4 5 −4 0 0 1 R2 7−→R2 +(−2)R1 0 −7 4 −4 0 1 R3 7−→R3 +(−1)R2
R3 7−→R3 +(−4)R1

 
1 3 −2 1 0 0
∼  0 −7 4 −2 1 0 
0 0 0 −2 −1 1 R2 7−→(− 1 )R2
7
   
1 3 −2 1 0 0 1 0 − 27 1
7
3
7
0
∼  0 1 − 47 2
7
− 71 0  ∼  0 1 − 47 2
7
− 17 0 
0 0 0 −2 −1 1 R1 7−→R1 +(−3)R2 0 0 0 −2 −1 1

En vista de que la forma canónica obtenida no tiene la estructura (I | A−1 ), la matriz


dada no es invertible.
¥

Proposición 0.3.1 Sean A, B ∈ Mn (R) matrices invertibles de igual tamaño y sea λ ∈


R \ {0}, entonces
0.3. Método de Gauss y Método de Gauss-Jordan 29

i) A−1 es inverible y [A−1 ]−1 = A.

ii) λA es invertible y [λA]−1 = λ−1 A−1 .

iii) AB es invertible y [AB]−1 = B −1 A−1 .

Es de observar que la suma de matrices invertibles no es necesariamente invertible,


basta con considerar las matrices A y −A, ambas son invertibles, si A lo es, y su suma
A + (−A) = 0, no es invertible.

Otra operación asociada a matrices es lo que se conoce como la transpuesta. Es im-


portante observar que, a diferencia de la inversa de una matriz, la cual únicamente puede
ser asociada a matrices cuadradas, y esto no a cualquier matriz cuadrada, la transpuesta
de una matriz está definida, como veremos, para todo tipo de matrices.

Dada una matriz A = (aij ) ∈ Mm×n definimos la transpuesta de A como la matriz


At = (aji ) ∈ Mn×m . Es decir, At es la matriz que resulta de intercambiar los renglones
de A por sus columnas, el primer renglón se convierte en la primera columna, el segundo
renglón se convierte en la segunda columna y ası́ sucesivamente. Por ejemplo,
 t
2 5 3  
0 8 6  2 0 1 9
   
1 2 4  = 5 8 2 6 .
3 6 4 5
9 6 5

En la proposición siguiente listamos algunas de las propiedades más importantes de la


transpuesta.

Proposición 0.3.2 Sean A y B matrices para las cuales están definidas las operaciones
indicadas y λ es un escalar, entonces

i) [A + B]t = At + B t ,

ii) [λA]t = λAt ,

iii) [AB]t = B t At ,

iv) A es invertible si, y sólo si, At es invertible y se tiene que [At ]−1 = [A−1 ]t .

0.3.2.2. Álgebra matricial.


Que el producto de matrices no sea conmutativo nos obliga a poner mucho cuidado
al simplificar expresiones algebraicas cuyos elementos sean matrices. También, el hecho
de que el producto de dos matrices pueda ser igual a la matriz cero, sin necesidad de que
30

alguno de los factores involucrados sea la matriz cero, nos obliga a resolver las ecuaciones
matriciales de una manera un poco diferente a como resolvemos las ecuaciones algebraicas
que hemos conocido desde nuestros estudios elementales. Por esto, hemos decidido in-
cluir esta sección en la cual presentaremos algunos ejemplos que muestren la manera
como se resuelven estas ecuaciones matriciales y como se pueden reducir algunas expre-
siones algebraicas que involucran matrices. Nuestro objetivo inmediato es el de mostrar
al lector algunas de las diferencias y coincidencias que tienen el álgebra de números reales
y el álgebra matricial. Por tal motivo, listaremos las propiedades de las matrices bajo
las operaciones que hemos definido, sin importar que ya las hallamos listado previamente.

Teorema 0.3.2 Sean A, B, C, X matrices para las cuales son válidas todas las opera-
ciones indicadas a continuación y α, β, λ ∈ R, entonces se tiene que:

1) (A + B) + C = A + (B + C),

2) A + B = B + A,

3) A + 0 = A,

4) A + (−A) = 0,

5) α(A + B) = αA + αB,

6) (α + β)A = αA + βA,

7) (αβ)A = α(βA) = β(αA),

8) 1A = A,

9) (AB)C = A(BC),

10) XB + XC = X(B + C),

11) BX + CX = (B + C)X,

12) λ(AB) = (λA)B = A(λB),

13) A−1 es inverible y [A−1 ]−1 = A,

14) λA es invertible y [λA]−1 = λ−1 A−1 ,

15) AB es invertible y [AB]−1 = B −1 A−1 ,

16) [At ]t = A,

17) [A + B]t = At + B t ,
0.3. Método de Gauss y Método de Gauss-Jordan 31

18) [λA]t = λAt ,

19) [AB]t = B t At ,

20) A es invertible si, y sólo si, At es invertible, y se tiene que [At ]−1 = [A−1 ]t ,

21) [At ]n = [An ]t , [A−1 ]n = [An ]−1 , n ∈ N.


En vista de las propiedades 13 y 16 se dice que el tomar inversa es una operación idem-
potente, lo mismo ocurre con la transpuesta.
Antes de proceder con los ejemplos, recordemos que la notación aditiva nos dice que si
n ∈ N, y A es una matriz, entonces

nA = A
| +A+
{z. . . + A} .
n−sumandos

Por otra parte, la notación multiplicativa nos dice que

An = A · . . . · A} .
| · A {z
n−f actores

Ejemplo 0.3.10

En vista de que el producto de números reales sı́ es conmutativo, dados a, b ∈ R,


entonces (ab)n = an bn . En el caso de matrices, ya que el producto no es conmutativo,
esta igualdad, en general, no es cierta. Por ejemplo, si A y B son dos matrices cualesquiera,
en vista de que
[AB]2 = [AB][AB] = A(BA)B, (15)
para que se diera la igualdad [AB]2 = A2 B 2 , serı́a necesario que BA = AB, y, como
sabemos, esto no es cierto para cualesquiera dos matrices. Por lo tanto, concluimos que,
en general,
[AB]n 6= An B n .
¥

Ejemplo 0.3.11

En los números reales sı́ es válido el desarrollo binomial llamado el binomio de Newton.
Por ejemplo, si a, b ∈ R, entonces

(a + b)2 = a2 + 2ab + b2 .

Por otra parte, si A y B son dos matrices de igual tamaño, entonces

(A + B)2 = (A + B)(A + B) = A(A + B) + B(A + B)


= AA + AB + BA + BB = A2 + AB + BA + B 2 .
32

En vista de que, en general, AB 6= BA, el término AB + BA no se puede sustituir por la


matriz 2AB y, por lo tanto, no se puede establecer la igualdad (A+B)2 = A2 +2AB +B 2 .
Concluimos que , en general,

(A + B)2 6= A2 + 2AB + B 2 . (16)

Ejemplo 0.3.12

En nuestro estudio del álgebra de números reales, uno de los llamados productos notables
es el producto entre binomios conjugados, cuyo resultado es una diferencia de cuadrados.
Esto es, si a, b ∈ R, entonces

(a + b)(a − b) = a2 − b2 .

Esta igualdad, en general, no se tiene en el caso de matrices. Pues si A B son dos matrices,
entonces

[A + B][A − B] = A[A − B] + B[A − B] = AA − AB + BA − BB = A2 − AB + BA − B 2 .

Para que se diera la igualdad (A + B)(A − B) = A2 − B 2 , serı́a necesario que AB = BA.


Pero esto, en general, no sucede. Por lo tanto, en general,

[A + B][A − B] 6= A2 − B 2 .

Ejemplo 0.3.13

Si a ∈ R \ (0), entonces existe a−1 ∈ R \ (0), tal que aa−1 = a−1 a = 1. La conmuta-
tividad del producto de números reales, nos permite usar la notación

b
= ba−1 = a−1 b.
a
En el caso de matrices, esta notación no es posible usarla. Pues, si A y B son matrices,
A
entonces al escribir B , nosotros no sabemos si se está refiriendo al producto AB −1 , o bien,
al producto B −1 A; y como ya hemos dicho, al ser el producto de matrices no conmutativo,
se tiene que, en general, AB −1 6= B −1 A.
¥

Ejemplo 0.3.14
0.3. Método de Gauss y Método de Gauss-Jordan 33

Si A y B son matrices cuadradas del mismo orden, entonces

[At B t ]t = [B t ]t [At ]t = BA.

Si estas matrices son invertibles, entonces

[A−1 B −1 ]−1 = [B −1 ]−1 [A−1 ]−1 = BA.

Como una aplicación de estos resultados, simplifiquemos la expresión

A[A−1 BA]4 + B 3 [At B t ]t + 3B 3 [A−1 B −1 ]−1 − [B 2 + A]2 A + B 2 A2 − AB 2 A + A3 . (17)

Para reducir esta expresión, reduciremos cada sumando por separado y luego susti-
tuiremos en el lugar correspondiente.

A[A−1 BA]4 = AA−1 B 4 A = IB 4 A = B 4 A.

B 3 [At B t ]t = B 3 BA = B 4 A.

3B 3 [A−1 B −1 ]−1 = 3B 3 BA = 3B 4 A.

(B 2 + A)2 A = [B 2 + A][B 2 + A]A

= [B 2 B 2 + B 2 A + AB 2 + AA]A

= [B 4 + B 2 A + AB 2 + A2 ]A

= B 4 A + B 2 A2 + AB 2 A + A3

Al sustituir en(26), resulta:

A[A−1 BA]4 + B 3 [At B t ]t + 3B 3 [A−1 B −1 ]−1 − [B 2 + A]2 A + B 2 A2 − AB 2 A + A3

= B 4 A + B 4 A + 3B 4 A − [B 4 A + B 2 A2 + AB 2 A + A3 ] + B 2 A2 − AB 2 A + A3

= B 4 A + B 4 A + 3B 4 A − B 4 A − B 2 A2 − AB 2 A − A3 + B 2 A2 − AB 2 A + A3

= 4B 4 A − 2AB 2 A.

¥
34

Como hemos podido observar, muchos problemas nos conducen a resolver una ecuación
matricial. A continuación presentamos algunos ejemplos en los cuales mostraremos la
manera de despejar en una ecuación matricial, una matriz incógnita X. El lector po-
drá darse cuenta de las analogı́as existentes entre la solución de ecuaciones que involucran
números reales y las ecuaciones matriciales. En la solución de estas ecuaciones matriciales
sugerimos al lector proceder de la manera siguiente:

1. Sumando o restando las matrices adecuadas, haga que en el segundo miembro de


la igualdad aparezcan únicamente matrices diferentes de la matriz incógnita X,
y, también sumando o restando las matrices adecuadas, haga que en el primer
miembro aparezcan todos los términos que contengan a la matriz incógnita X.

2. Como resultado del punto anterior, en el primer miembro de nuestra igualdad, han
de aparecer puros términos en los cuales se encuentre a la matriz incógnita X. Es
posible que en estos términos se encuentren la transpuestas o la inversa de la matriz
incógnita X. Use las propiedades de la inversa y la transpuesta hasta que en cada
sumando aparezca la matriz X como transpuesta, o como inversa, o, aun mejor,
como la misma matriz X.

3. Factorice a la matriz X, o a su transpuesta, o a su inversa y despejela.

4. Por último, si es necesario, usando la idempotencia de la transpuesta y la inversa


encuentre el valor de la matriz X.

Ejemplo 0.3.15

Suponiendo que todas las matrices involucradas son invertibles, despeje la matriz X
de la ecuación matricial
AX + B = C.
AX + B = C ⇒ AX + B − B = C − B ⇒ AX = C − B
⇒ A−1 AX = A−1 [C − B] ⇒ IX = A−1 [C − B] ⇒ X = A−1 [C − B].
¥

Ejemplo 0.3.16

Suponiendo que todas las matrices involucradas son invertibles, despeje la matriz X
de la ecuación matricial
AX + BX = C.
AX + BX = C ⇒ [A + B]X = C ⇒ [A + B]−1 [A + B]X = [A + B]−1 C
⇒ IX = [A + B]−1 C ⇒ X = [A + B]−1 C.
¥
0.3. Método de Gauss y Método de Gauss-Jordan 35

Ejemplo 0.3.17
Suponiendo que todas las matrices involucradas son invertibles, despeje la matriz X
de la ecuación matricial
XA + XB = C.
XA + XB = C ⇒ X[A + B] = C ⇒ X[A + B][A + B]−1 = C[A + B]−1
⇒ XI = C[A + B]−1 ⇒ X = C[A + B]−1 .
¥
Es muy importante observar que aun y cuando las ecuaciones matriciales propuestas
en los dos ejemplos anteriores son muy parecidas, las soluciones encontradas no necesaria-
mente son iguales. Por ejemplo, si
· ¸ · ¸ · ¸
1 3 1 0 2 −1
A= ,B = ,C = ,
0 2 −1 2 1 0
entonces la solución de la ecuación AX + BX = C es
· ¸−1 · ¸
−1 2 3 2 −1
X = [A + B] C =
−1 4 1 0
 4 −3  5 
· ¸ · ¸· ¸ −4

 2 −1 = 1 4 −3 2 −1 = 
11 11 11 11
=  .
1 2 1 0 11 1 2 1 0 4 −1
11 11 11 11

Mientras que la solución a la ecuación XA + XB = C es


· ¸· ¸−1
−1 2 −1 2 3
X = C[A + B] =
1 0 −1 4
  7 
· ¸ 4 −3 · ¸ · ¸ −8
2 −1   = 2 −1 1 4 −3 = 
11 11 11 11
= .
1 0 1 2 1 0 11 1 2 4 −3
11 11 11 11

Ejemplo 0.3.18
Suponiendo que todas las matrices involucradas son invertibles, despeje la matriz X de
la ecuación matricial
AX + B = CX + D.
AX + B = CX + D ⇒ AX + B − B = CX + D − B ⇒ AX = CX + D − B
⇒ AX −CX = CX +D−B−CX ⇒ AX −CX = D−B ⇒ [A−C]X = D−B
⇒ [A − C]−1 [A − C]X = [A − C]−1 [D − B] ⇒ IX = [A − C]−1 [D − B]
⇒ X = [A − C]−1 [D − B].
¥
36

Ejemplo 0.3.19
Dada la ecuación matricial
AX + [X −1 B −1 ]−1 = B,
con A, B, X matrices invertibles, establezcamos las condiciones necesarias sobre las ma-
trices A y B para garantizar que es posible despejar a la matriz X.

En vista de las propiedades de la inversa de una matriz y del producto de matrices,


podemos escribir:
¡ ¢−1 ¡ −1 ¢−1
AX + [X −1 B −1 ]−1 = B ⇔ AX + B −1 X =B
⇔ AX + BX = B ⇔ (A + B)X = B ⇔ (A + B)−1 (A + B)X = (A + B)−1 B
⇔ IX = (A + B)−1 B ⇔ X = (A + B)−1 B.
Partiendo del desarrollo anterior, la hipótesis que es necesario formular es que la matriz
A + B sea una matriz invertible. Esto es necesario en vista de que la suma de matrices
no necesariamente es una matriz invertible.
¥
Ejemplo 0.3.20
Suponiendo que las matrices A, B y X son invertibles, establezcamos hipótesis las
cuales nos permitan despejar a la matriz X de la ecuación matricial siguiente:
A−1 [AXA−1 ]2 + X 2 B = X[A−1 + B].
Esta igualdad se tiene
⇔ A−1 [AX 2 A−1 ] + X 2 B = X[A−1 + B]

⇔ X 2 A−1 + X 2 B = X[A−1 + B]

⇔ X 2 [A−1 + B] = X[A−1 + B]

⇔ X −1 X 2 [A−1 + B] = X −1 X[A−1 + B]

⇔ X[A−1 + B] = [A−1 + B].

Si la matriz A−1 + B es una matriz invertible, entonces


X[A−1 + B] = [A−1 + B] ⇔ X[A−1 + B][A−1 + B]−1 = [A−1 + B][A−1 + B]−1 ⇔ X = I.
¥
0.3. Método de Gauss y Método de Gauss-Jordan 37

Ejemplo 0.3.21

Despeje la matriz X 2 de la ecuación matricial

(AXA−1 )2 + (X t At )t X − (X −1 A−1 )−1 X = 2AX 2 + B. (18)

Con el fin de facilitar la lectura, simplificaremos cada uno de los sumandos y, posterior-
mente, sustituiremos en la expresión (27) los resultados obtenidos.

[AXA−1 ]2 = AX 2 A−1 .
(X t At )t X = [At ]t [X t ]t X = AXX = AX 2 .
(X −1 A−1 )−1 X = [A−1 ]−1 [X −1 ]−1 X = AXX = AX 2 .

Al sustituir, resulta:

(AXA−1 )2 + (X t At )t X − (X −1 A−1 )−1 X = 2AX 2 + B ⇔


AX 2 A−1 + AX 2 − AX 2 = 2AX 2 + B ⇔
AX 2 A−1 = 2AX 2 + B ⇔
AX 2 A−1 − 2AX 2 = 2AX 2 + B − 2AX 2 ⇔
AX 2 A−1 − 2AX 2 = B ⇔
A[X 2 A−1 − 2X 2 ] = B ⇔
A−1 A[X 2 A−1 − 2X 2 ] = A−1 B ⇔
I[X 2 A−1 − 2X 2 ] = A−1 B ⇔
IX 2 [A−1 − 2I] = A−1 B ⇔
X 2 [A−1 − 2I][A−1 − 2I]−1 = A−1 B[A−1 − 2I]−1 ⇔
X 2I = A−1 B[A−1 − 2I]−1 ⇔
X2 = A−1 B[A−1 − 2I]−1 .

En donde hemos supuesto que la matriz A−1 − 2I es una matriz invertible.


¥

También podría gustarte