Mis Notas de Clase A.L PDF

Álgebra lineal
David Ojeda Marulanda

Índice general
1. Ecuaciones lineales 5
1.1. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Ecuación cartesiana de la recta . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2 . . . . . . . . . . . . . . . . 18
1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3 . . . . . . . . . . . . . . . . 24
1.5. Sistemas de ecuaciones lineales tamaño m × n . . . . . . . . . . . . . . . . . 33
1.5.1. Ecuaciones Diofánticas . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.6. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.6.1. Sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.6.2. Suma y multiplicación por escalar de matrices . . . . . . . . . . . . . 51
1.6.3. Producto matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2. Determinantes 63
2.1. Definición de determinante de una matriz . . . . . . . . . . . . . . . . . . . . 63
2.2. Interpretación geométrica del determinante de tamaño 2 × 2 . . . . . . . . . 64
2.3. Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4. Determinantes e inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.6. Taller 1 corte 1 parte 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3. Vectores en Rn 80
3.1. Vectores en el plano enfoque analı́tico . . . . . . . . . . . . . . . . . . . . . . 80
3.2. Vectores en el plano enfoque geométrico . . . . . . . . . . . . . . . . . . . . 82
3.2.1. Vector resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.3. Diferencia entre vectores y vectores geométricos . . . . . . . . . . . . . . . . 84
3.4. Desigualdad triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.5. Movimiento relativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.5.1. Vector proyección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
2
4. Nociones de cálculo integral 102
4.1. Área bajo la curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.2. Integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3. Propiedades de la integral definida . . . . . . . . . . . . . . . . . . . . . . . 110
4.4. La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.4.1. Problemas de valor inicial . . . . . . . . . . . . . . . . . . . . . . . . 111
4.5. Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 117
4.5.1. Primer teorema fundamental del cálculo . . . . . . . . . . . . . . . . 117
4.5.2. Segundo teorema fundamental del cálculo . . . . . . . . . . . . . . . . 118
4.6. Área entre curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.7. Curvas en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.7.1. Ecuación vectorial y normal de la recta . . . . . . . . . . . . . . . . . 128
4.8. Continuidad y diferenciación de aplicaciones vectoriales . . . . . . . . . . . . 135
4.8.1. Vector tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.9. Movimiento en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.9.1. Movimiento rectilineo . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.9.2. Movimiento circular uniforme . . . . . . . . . . . . . . . . . . . . . . 140
4.9.3. Movimiento con aceleración constante . . . . . . . . . . . . . . . . . . 146
4.9.4. Fuerza resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.10. Vectores en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
4.11. Producto cruz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
4.12. Rectas y planos en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
4.13. Aplicaciones de los vectores en el espacio . . . . . . . . . . . . . . . . . . . . 169
4.13.1. Movimiento en tres dimensiones . . . . . . . . . . . . . . . . . . . . . 169
4.14. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
4.17. Método de los mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . 186
4.17.1. Punto de vista del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 186
5. Espacios vectoriales 195

5.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
5.1.1. Ejemplos de espacios vectoriales . . . . . . . . . . . . . . . . . . . . . 196
5.2. Subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
5.3. Combinación lineal y espacio generado . . . . . . . . . . . . . . . . . . . . . 199
5.4. Independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.5. Interpretación geométrica de la independencia lineal en R3 . . . . . . . . . . 205
5.6. Bases y dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
5.7. Espacio de los renglones y espacio de las columnas de una matriz . . . . . . 210
3
5.8. Cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.9. Bases ortonormales y proyecciones en Rn . . . . . . . . . . . . . . . . . . . . 213
5.10. Espacios con producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.11. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
6. Transformaciones lineales 217

6.1. Definición y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.2. Núcleo e imagen de una transformación lineal . . . . . . . . . . . . . . . . . 219
6.3. Teorema del cambio de variables en el plano (Opcional) . . . . . . . . . . . . 222
6.4. Representación matricial de una transformación lineal . . . . . . . . . . . . . 230
6.5. Isomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
6.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
7. Formas canónicas elementales 233

7.1. Valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.2. Matrices semejantes y diagonalización . . . . . . . . . . . . . . . . . . . . . . 233
7.3. Matrices semejantes y diagonalización ortogonal . . . . . . . . . . . . . . . . 233
7.4. Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.6. Soluciones a algunos de los problemas . . . . . . . . . . . . . . . . . . . . . . 236
7.7. Solución Examen Final Conjunto de Álgebra Lineal 6 de Junio del 2018 . . . 243
7.8. Cálculo e ingenierı́a civil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
Bibliografı́a 253
4
Capı́tulo 1
Ecuaciones lineales
Una ecuación lineal de una variable es una expresión de la forma
ax + b = c, (1.1)
donde a 6= 0. Para resolver una ecuación de este tipo se utilizan dos propiedades fundamen-
tales
x = y ⇔ x + c = y + c, c ∈ R (1.2)
x = y ⇔ cx = cy si c 6= 0 (1.3)
El sı́mbolo ⇔ se lee si y sólo si y significa que las ecuaciones que separa son equivalentes,
es decir, que tienen el mismo conjunto solución. Lo cual significa que podemos sumar una
constante c en ambos lados de una ecuación sin alterar su solución, lo mismo ocurre con
la multiplicación, pero la equivalencia se mantiene si la constante c 6= 0. Por ejemplo, la
siguiente expresión es falsa
x2 = 4x ⇔ x = 4,
ya que, el conjunto solución de la primera ecuación es {0, 4}, mientras que el de la segunda
es {4}. La flecha no puede ir en los sentidos indicando equivalencia, solo podemos escribir
x2 = 4x ⇐ x = 4.
Volviendo a la ecuación (1.1), por la propiedad (1.2) podemos escribir
ax + b = c ⇔ (ax + b) + (−b) = c + (−b),
y el proceso de solución continua como sigue
(ax + b) + (−b) = c + (−b) ⇔ ax + (b + (−b)) = c + (−b) ⇔ ax + 0 = c − b ⇔ ax = c − b,
5
en donde para pasar de la primera equivalencia a la segunda se supuso primero que
(ax + b) + (−b) = ax + (b + (−b)),
y para pasar de la segunda a la tercera que b+(−b) = 0. La última equivalencia la obtenemos

al suponer que ax+0 = ax. En consecuencia, si las constantes a, b, c pertenecen a un conjunto
F debemos requerir que en este conjunto, esté definida una operación de suma, la cual debe
cumplir la propiedad asociativa, modulativa, y a cada elemento en F debe tener su inverso
aditivo en F . Para hallar finalmente el valor de x, utilizamos la propiedad (1.3)
ax = c − b ⇔ (1/a)(ax) = (1/a)(c − b)
⇔ ((1/a)a)x = (1/a)(c − b)
⇔ 1 · x = (1/a)(c − b)
⇔ x = (1/a)(c − b)
Debemos dotar el conjunto F de una segunda operación llamada multiplicación que debe
cumplir también la propiedad asociativa, modulativa, y cada elemento en F debe tener su
inverso multiplicativo en F . Si además, requerimos que la solución x esté en F , se deben
cumplir los axiomas de cerradura, esto es, si x, y ∈ F entonces x + y, xy ∈ F . Vemos que
definidas dos operaciones de suma y producto, estas deben cumplir ciertas propiedades, que
llamaremos propiedades de campo para que las ecuaciones se puedan solucionar y para
que dicha solución exista en el conjunto F que llamaremos campo.
1.1. Campos
La evolución de los sistemas numéricos se ha dado en conexión con la búsqueda de
soluciones de ciertas ecuaciones. Por ejemplo, la ecuación lineal
x+2 =0 (1.4)
no tiene solución en el conjunto N = {1, 2, . . .} de los números naturales, el problema radica

en que en este conjunto no se cumplen ciertas propiedades de campo, ya que los naturales no
contienen al elemento neutro para suma, el 0, ni los inversos aditivos de sus elementos. Esto
obliga a considerar un conjunto más grande de números (en el sentido de la contenencia),
que contenga al cero y a los inversos aditivos de los naturales, dicho conjunto se denota por
Z y está dado por
Z = {. . . , −2, −1, 0, 1, 2, . . .}
La ecuación (1.4) tiene solución en este conjunto, por que en los enteros se cumplen los
axiomas de campo para la suma, no ası́, para la multiplicación, por eso, una ecuación lineal
6
como 2x + 1 = 0 no tiene solución en los enteros. Se debe considerar una nuevo conjunto que
contenga a los fraccionarios como −1/2 que soluciona la ecuación 2x + 1 = 0. Este nuevo
conjunto se denota por Q y se define como
Q = {p/q : p, q ∈ Z}
Este conjunto es nuestro primer prototipo de campo (ver el Problema1.7.4). Aunque existen
campos más grandes en el sentido de la contenencia, ya que ecuaciones como
x2 − 2 = 0
√ √
cuyas soluciones son − 2, 2 no son racionales. Tenemos entonces el campo de los números
reales, denotado por R y definido como
R = Q ∪ Qc ,
el conjunto Qc se define como
Qc = {x ∈ R : x ∈
/ Q} ,
también se denota por I el conjunto de los números irracionales. En (1.6) se definen los
números complejos, seguidamente se demuestra que este conjunto es un campo. Los números
complejos surgieron cuando se intento solucionar la ecuación
x2 + 1 = 0 (1.5)
El conjunto de los números reales, además de tener estructura de campo, tiene un orden
definido en el, dado por los axiomas de orden, de los cuales se implica que
x2 ≥ 0 ∀ x ∈ R,
con lo cual, x2 + 1 > 0 ∀ x ∈ R, por lo que la ecuación (1.5) no tiene solución en los reales.
Definición 1.1.1. Un campo es una tripla conformada por un conjunto F y dos operaciones
de adicción y producto, que cumplen las siguientes propiedades
Axiomas de cerradura
(a) Si x, y ∈ F , entonces x + y ∈ F
(b) Si x, y ∈ F , entonces xy ∈ F .
1. La adicción es conmutativa,
x+y = y+x
para todo x, y ∈ F .
7
2. La adicción es asociativa,
x + (y + z) = (x + y) + z
para todo x, y, z ∈ F .
La adicción es modulativa
3. Existe un único elemento 0 (cero) en F tal que
x+0 =0
para cada x ∈ F .
4. Para cada x ∈ F existe un único elemento (−x) en F tal que
x + (−x) = 0
5. La multiplicación es conmutativa,
xy = yx
para todo x, y ∈ F .
6. La multiplicación es asociativa,
x(yz) = (xy)z
para todo x, y, z ∈ F .
La multiplicación es modulativa
7. Existe un único elemento diferente de cero 1 (uno) en F tal que
x1 = x
para cada x ∈ F .
8. Para cada elemento x diferente de cero en F existe un único elemento x−1 (o 1/x) en
F tal que
xx−1 = 1.
9. La multiplicación es distributiva respecto a la adicción; esto es,
x(y + z) = xy + xz
para cada x, y, z ∈ F .
8
Ejemplo 1.1 (Construcción de un campo finito). Definimos los enteros módulo 3 como
Z3 = {0, 1, 2} .
La suma en Z3 se define como sigue : si m, n ∈ Z3 , entonces m ⊕ n = m + n si m + n < 3 y

m ⊕ n = r si m + n ≥ 3 donde r es el residuo de dividir m + n entre 3. De la misma forma,
definimos la multiplicación m ⊙ n de Z3 . Con esta definición podemos generar las tablas de
la suma y la multiplicación en Z3 :
⊕ 0 1 2 ⊙ 0 1 2
0 0 1 2 0 0 0 0
1 1 2 0 1 0 1 2
2 2 0 1 2 0 2 1
De las tablas de la suma y la multiplicación se observa que se cumplen los axiomas de cerra-
dura. Además, como Z3 ⊆ Z, en particular se cumplen las leyes conmutativas y asociativas
de la suma y la multiplicación, además de la ley distributiva y las leyes modulativas de la
suma y la multiplicación. Para finalizar debemos encontrar los inversos aditivos y multipli-
cativos de cada elemento de Z3 . De la tabla vemos que el inverso aditivo del 1 es 2, ya que
1 + 2 = 0, por conmutatividad (o observando la tabla) vemos que 2 + 1 = 0, luego el inverso
aditivo de 2 es 1. El inverso multiplicativo de 1 es 1 y de 2 es 2, con lo cual cada elemento
diferente de 0 tiene un inverso multiplicativo. Concluimos que Z3 con la suma y producto
ası́ definidos es un campo. Nótese que 1 + 2 = 0, es decir, 3 es el módulo de Z3 , de ahı́ el
nombre que se le da a este conjunto.
Ejemplo 1.2. Demostrar que el conjunto

n √ o
F := x + 2y : x, y ∈ Q ,
con la suma y multiplicación usual de números reales es un campo
Solución. Nótese que como F ⊆ R, en particular se cumplen las leyes conmutativas y

asociativas de la suma y la multiplicación, además de la ley distributiva. Más aún, como
√ √
0 = 0 + 0 2 ∈ F y 1 = 1 + 0 2 ∈ F , resulta que se cumple la ley modulativa de la suma y
la multiplicación.
√
Demostremos ahora los axiomas de cerradura. Como x ∈ F , x = a + b 2 donde a, b ∈ Q,
9
√
de manera similar, para c, d ∈ Q, y = c + d 2, entonces
√
x + y = (a + c) + (b + d) 2.
√ √
xy = (a + b 2)(c + d 2)
√ √ √
= (a + b 2)c + (a + b 2)d 2
√ √
= ac + bc 2 + ad 2 + 2bd
√
= (ac + 2bd) + (bc + ad) 2
Dado que los números son racionales son un campo (ver problema 1.7.4), en particular
cumplen axiomas de cerradura, lo cual implica que a + c, b + d ∈ Q y ac + 2bd, bc + ad ∈ Q.
Lo que a su vez implica que el conjunto F cumple los axiomas de cerradura. Sólo nos queda
verificar la existencia de inversos aditivo y multiplicativo para cada elemento de F . Sea
√ √
x = a + b 2 ∈ F , entonces −x := −a − b 2 ∈ F y x + (−x) = 0. Ahora, supongamos que
√
x = a + b 2 6= 0. Tenemos que
xy = 1,
1 √
donde y = √ . Veamos que y ∈ F . En efecto, supongamos que a − b 2 = 0, como
a+b 2
x 6= 0, a y b no son simultáneamente iguales a 0. Lo cual nos lleva a considerar dos casos:
a 6= 0, o, b 6= 0. Si b 6= 0, entonces
a √
= 2.
b
Lo cual es imposible. Ahora bien, si a 6= 0 tenemos que
b 1
=√ .
a 2
√
Lo cual nos conduce de nuevo a una contradicción pues, 1/ 2 es un número irracional.
√ √
Concluimos que a − b 2 6= 0 si x = a + b 2 6= 0, y en ese caso obtenemos que
√
1 a−b 2
y= √ · √
a+b 2 a−b 2
√
a−b 2
= 2
a − 2b2
a b √
= 2 + 2.
a − 2b2 2b2 − a2
Con lo cual verificamos que y ∈ F , concluyendo de esta manera la demostración.
Demostremos ahora que el conjunto de los números complejos es un campo. Definimos

este conjunto como
10
C = a + bi : a, b ∈ R, i2 = −1 .

(1.6)
Vemos que este espacio no esta contenido en los números reales, por lo tanto, debemos
demostrar cada una de las propiedades de campo de la definición 1.1.1.
Sean z = a + bi y w = c + di dos números complejos, entonces
z=w⇔a=c y b=d
Ahora, para recordar las fórmulas que definen la suma y el producto en los números com-
plejos, podemos asociar el término a + bi con el polinomio lineal a + bx, y entonces sumar
y multiplicar complejos tal cual como hacemos con los polinomios lineales, esto es, para la
suma de dos complejos a + bi y c + di tenemos que
(a + bi) + (c + di) = (a + c) + (b + d)i,
y para el producto
(a + bi)(c + di) = ac + adi + bci + bdi2

= ac − bd + (ad + bc)i
Demostraremos que los números complejos con la suma y el producto ası́ definidas, con-
forman un campo. Lo primero que tenemos que verificar son los axiomas de cerradura.
Esto es,
1. Si z, w ∈ C, entonces z + w ∈ C
2. Si z, w ∈ C, entonces zw ∈ C.
Si tomamos z = a + bi y w = c + di, puesto que los números reales cumplen a su vez,

los axiomas de cerradura vemos que a + c, b + d ∈ R y ac − bd, ad + bc ∈ R, de lo cual
inmediatamente se sigue que z + w ∈ C y que zw ∈ C. Demostremos que la suma es
conmutativa,
z + w = (a + bi) + (c + di)
= (a + c) + (b + d)i
= (c + a) + (d + b)i
= (c + di) + (a + bi)
= w + z.
11
Vemos que la conmutatividad de la suma de complejos se sigue de la conmutatividad de la
suma de los números reales. La ley asociativa de la suma complejos se demuestra de manera
análoga. Ahora estableceremos la propiedad modulativa de la suma. Si definimos 0 = 0 + 0i,
tenemos que si z = a + bi ∈ C, entonces
z + 0 = (a + bi) + (0 + 0i)
= (a + 0) + (b + 0)i
= a + bi
= z.
Además, para todo z = a + bi ∈ C, si w := −a − bi, se cumple que
z + w = (a + bi) + (−a − bi)
= (a + (−a)) + (b + (−b)i
= 0 + 0i
Es decir, todo número complejo tiene un inverso aditivo. Ahora demostraremos las propie-
dades de campo de la multiplicación de números complejos.
wz = (c + di)(a + bi)
= ca + cbi + dai − db
= (ac − bd) + adi + bci
= (ac − bd) + (ad + bc)i
= zw
Como el caso de la suma de complejos, vemos la conmutatividad de la multiplicación de
complejos se hereda de la conmutatividad de la multiplicación de los números reales. Ahora,
sean x = a + bi, y = c + di y z = e + f i un números complejos, entonces
x(yz) = (a + bi) [(c + di)(e + f i)]
= (a + bi) [ce − df + (cf + de)i]
= a(ce − df ) − b(cf + de) + [a(cf + de) + b(ce − df )] i
= a(ce) − a(df ) − b(cf ) − b(de) + [a(cf ) + a(de) + b(ce) − b(df )] i
= (ac)e − (ad)f − (bc)f − (bd)e + [(ac)f + (ad)e + (bc)e − (bd)f ] i
= (ac)e − (bd)e − (ad)f − (bc)f + [(ac)f − (bd)f + (ad)e + (bc)e] i
= (ac − bd)e − (ad + bc)f + [(ac − bd)f + (ad + bc)e] i
= [(ac − bd) + (ad + bc)i] (e + f i)
= [(a + bi)(c + di)] (e + f i)
= (xy)z.
12
Demostrando de esta forma, la ley asociativa de la multiplicación. Construiremos a conti-
nuación el elemento neutro de la para multiplicación de complejos. Queremos encontrar un
complejo e = x + yi tal que para todo z = a + bi se cumpla que ze = z, esto es,
(a + bi)(x + iy) = (a + bi),

o equivalentemente,
ax − by + (ay + bx)i = a + bi,

que según la igualdad de números complejos, conduce a el siguiente sistema

ax − by = a
bx + ay = b
Para este sistema la matriz de coeficientes es

a −b
A=
b a
para la cual, det A = a2 + b2 6= 0 si a + bi 6= 0 + 0i. Por lo tanto, por la Regla de Krammer
(ver Teorema 2.4.2) encontramos que
det B1 det B2
x= ,y = ,
det A det A
donde

a −b a a
B1 = , B2 =
b a b b
por consiguiente, x = 1, y = 0. De modo que, e = 1 + 0i = 1. Encontremos ahora el inverso
multiplicativo de un complejo z = a + bi 6= 0. Tenemos que
zw = 1 + 0i = 1,
1
donde w = . Demostraremos que w ∈ C.
a + bi
1 a − bi
w= ·
a + bi a − bi
a − bi
= 2
a + b2
a −b
= 2 2
+ 2 i.
a +b a + b2
Nótese que a − bi y a2 + b2 son diferentes de 0 + 0i, ya que a + bi 6= 0.
La última propiedad por verificar es la ley distributiva de la suma respecto a la multipli-

cación, la cual se deja como ejercicio.
13
1.2. Ecuación cartesiana de la recta
Sean P = (x1 , y1 ) y Q = (x2 , y2 ) dos puntos dados de la recta l. Definimos la pendiente
de la recta, la cual denotaremos con la letra m como
y2 − y1
m = tan θ = (1.7)
x2 − x1
donde el ángulo θ se mide desde el eje x en el sentido contrario de las manecillas del reloj
(ver la figura 1.1). Como se ve en la la fórmula (1.7), la pendiente es una razón de cambio
de y con respecto a x y es una medida de la inclinación de la recta con respecto al eje x.
y
l
Q
b
y2 − y1
Pb θ
x2 − x1
θ x
O
Figura 1.1: Cálculo de la pendiente de una recta dados dos de sus puntos
Vemos que la hipotenusa del triángulo de la figura 1.7 nos da la distancia entre los puntos
P y Q, por el Teorema de Pitagóricas tenemos que
p
d(P, Q) = (x1 − x2 )2 + (y1 − y2 )2 (1.8)
En la figura 1.2 se muestran la diferentes inclinaciones que puede tener una recta.
14
y y y
0 < θ < 90
m = tan θ > 0
b m=0 m=∞
y=b
a θ
x x x
x=a
(a) m = 0, la recta es (b) m = ∞, la recta (c) m > 0, relación
horizontal es vertical directa
y
90 < θ < 180
m = tan θ < 0
θ
x
(d) m < 0, relación

inversa
Figura 1.2: Recta horizontal, vertical, positiva y negativa
Ahora, fijemos el punto P sobre la recta l en la figura 1.2. Esto es, P = (x0 , y0 ) es un
punto dado de la recta. Supongamos además que Q = (x, y) es un punto arbitrario.
y
l
Q
b
y − y0
P
b θ
x − x0
θ x
O
Figura 1.3: Ecuación de una recta dados uno de sus puntos y su pendiente
Entonces por la fórmula (1.7) tenemos que
15
y − y0
m = tan θ = .
x − x0
O bien,
y − y0 = m(x − x0 ) (Fórmula punto-pendiente)
La fórmula anterior nos dice que para, determinar completamente una recta es suficiente
con tener un punto y una dirección, la cual es dada por la pendiente m. Esta claro que dados
dos puntos de la recta, con la fórmula (1.7) podemos hallar la pendiente y escoger uno de los
puntos para con la Fórmula punto-pendiente hallar la ecuación de la recta. Concluimos que:
Nota 1.2.1. Dos puntos determinan una recta, o bien, un punto y una dirección.
Ahora despejemos la variable y en la Fórmula punto-pendiente.
y = y0 + m(x − x0 ) = mx + y0 − mx0 ,
pongamos b = y0 − mx0 , obtenemos
y = mx + b (Fórmula pendiente-intercepto)
Vemos que cuando x = 0, y = b, es decir la recta corta al eje y en b, por eso este número
es llamado intercepto de la recta con eje y. Si m = 0 en la Fórmula pendiente-intercepto
obtenemos y = b que es la ecuación de una recta horizontal (ver figura 1.2(a)). Si m > 0
(figura 1.2(c)), x, y y guardan una relación directa, es decir, la variable y crece cuando x
crece. Por el contrario, si la variable y decrece cuando la variable x aumenta, tenemos que
m < 0, y la gráfica es la recta decreciente que se muestra en la figura 1.2(d). Finalmente, si
la recta es vertical, θ = π/2 = 90◦ , y m = tan(π/2) = ∞ (ver figura 1.2(b)).
Una relación de la forma dada en la Fórmula pendiente-intercepto es llamada función

lineal, y se suele escribir y = f (x) = mx + b.
Ejemplo 1.3 (Modelo de costo lineal). A una compañı́a le cuesta $75 producir 10 unidades
de cierto artı́culo al dı́a y $120 producir 25 unidades del mismo artı́culo al dı́a.
(a) Determine la ecuación de costos, suponiendo que sea lineal.
(b) ¿Cuál es el costo de producir 20 artı́culos al dı́a?
16
Solución. Denotemos con y = C(x) el costo total de producir y vender x unidades diarias
del artı́culo. Según los datos del problema y1 = 75 cuando x1 = 10, y y2 = 120 cuando
x2 = 25. Por lo tanto, por la Fórmula (1.7) obtenemos
y2 − y1 120 − 75
m= = = 3.
x2 − x1 25 − 10
Como m = 3 > 0, concluimos que entre más artı́culos se produzcan, su costo total aumentará.
Además, m = 3/1, lo que significa que por cada artı́culo de más que se produzca, el costo
total de producción de los artı́culos aumentará en $3. Ahora, utilizando la Fórmula punto-
pendiente, con (x0 , y0 ) = (25, 120), obtenemos
y − 120 = 3(x − 25).
De donde y = C(x) = 120 + 3(x − 25) = 3x + 45. Con lo cual se tiene la parte (a). Se observa
que aunque se produzcan 0 artı́culos, se incurre en un costo de $45, dichos costos son llamados
costos fijos. Por ejemplo, cuando una empresa esta en temporada de vacaciones hay que
pagar arriendo servicios, etc.
Teniendo ya la función de costos para cualquier número de artı́culos x, ponemos x = 20

para obtener y = C(20) = 3(20) + 45 = 105.
Ejemplo 1.4. El aire seco al moverse hacia arriba se expande y enfrı́a a razón de aproxi-
madamente 1◦ C por cada 100m de elevación, hasta cerca de 12km.
(a) Si la temperatura del suelo es de 20◦ C, escriba una fórmula para la temperatura a una
altura h.
(b) ¿Qué intervalo de temperaturas puede esperarse si un avión despega y alcanza una
altura máxima de 5km?
Solución. Según la información dada en el ı́tem (a), T (0) = 20◦ C, donde T (h) representa
la temperatura a una altura h. Además, nótese que la razón cambio de la temperatura con
respecta a la altura viene dada por la pendiente
∆T 1◦ C
m=− =−
∆h 100m
1◦ C 1m
=− ·
100m (1/1000)km
1◦ C
=−
(1/10)km
= −10◦ C/km
17
Aquı́, m < 0, ya que tenemos una relación inversa; a medida que aumenta la altura disminuye
la temperatura. Como además de la pendiente tenemos el intercepto con el eje y, b = 20◦ C,
por la fórmula pendiente–intercepto tenemos que
T (h) = 20 − 10h, 0 ≤ h ≤ 12
Para el inciso (b), vemos que T (5) = 20−10(5) = −30. Por lo tanto, cuando el avión despega
la temperatura es de 20◦ C, y al alcanzar los 5km de altura, la temperatura a disminuido
hasta −30◦ C.
También podemos resolver el ı́tem (b) como sigue: Si 0 ≤ h ≤ 5, entonces
−50 ≤ −10h ≤ 0 ⇔ −30 ≤ 20 − 10h ≤ 20.
Esto es, mientra que h varia entre 0 y 5, T varia entre −30 y 20.
Una ecuación de la forma
Ax + By + C = 0 (1.9)
donde A, B y C son constantes y A y B no son simultáneamente iguales a cero es llamada

ecuación lineal. Observamos que la ecuación de una recta es una ecuación lineal. En efecto,
al despejar la variable y en (1.9) obtenemos
A C
y =− x−
B B
que es la Fórmula pendiente-intercepto con m = −A/B y b = −C/A. La fórmula (1.9) es
llamada ecuación general de la recta.
A continuación introduciremos las nociones de paralelismo y ortogonalidad de rectas.
Teorema 1.2.1. Sean l1 y l2 dos rectas con ecuaciones y = m1 x + b1 y y = m2 x + b2

respectivamente, entonces la recta l1 es paralela a la recta l2 , lo cual denotamos por l1 k l2 si
y sólo si m1 = m2 . Y las rectas l1 y l2 son ortogonales, o perpendiculares, lo cual denotamos
por l1 ⊥ l2 si y sólo si m1 · m2 = −1.
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2

Consideremos el sistema de ecuaciones con dos incógnitas

a11 x + a12 y = b1
(1.10)
a21 x + a22 y = b2
18
Puesto que las variables x y y tienen exponente 1, y el sistema consta de 2 ecuaciones con
2 incógnitas (1.10) es llamado sistema de ecuaciones lineales de tamaño 2 × 2. La
primera pregunta que nos formulamos es: bajo que condiciones el sistema en (1.10) tiene
solución. Esto es, una pareja (x, y) que satisface ambas ecuaciones. Como sabemos de la
sección anterior cada una de estas ecuaciones es representada por una linea recta, y esta
claro que si estas son paralelas no existe un punto (x, y) que este en ambas rectas, es decir el
sistema no tiene solución. Supongamos entonces que las rectas de ecuaciones a11 x+ a12 y = b1
y a21 x + a22 y = b2 son paralelas. Despejando la variable y en ambas ecuaciones obtenemos
a11 b1 a21 b2
y=− x+ , y =− x+
a12 a12 a22 a22
a11 a21
en donde se identifican las pendientes de las rectas, m1 = − y m2 = − . Dado que
a12 a22
estas son paralelas tenemos que
a11 a21
m1 = m2 ⇔ − =− ⇔ a11 a22 − a21 a12 = 0.
a12 a22
Por lo tanto, si el sistema (1.10) no tiene solución entonces a11 a22 − a21 a12 = 0. Recı́proca-
mente, si a11 a22 − a21 a12 = 0 entonces m1 = m2 , y el sistema (1.10) no tiene solución. Lo
anterior lo podemos decir de manera equivalente como sigue:
El sistema (1.10) tiene una única solución si y sólo si a11 a22 − a21 a12 6= 0.
Observese que en el análisis anterior sólo se considero en caso en que a11 , a22 6= 0, (Ver, [3,
pag. 2]) en donde se consideran todos los casos.
Consideremos ahora en sistema

x−y =2
(1.11)
2x − 2y = 4
Vemos que para este caso a11 = 1, a12 = −1, a21 = 2 y a22 = −2. Con lo cual a11 a22 −a21 a12 =
1(−2) − 2(−1) = 0, sin embargo el sistema tiene solución, por ejemplo, la pareja (2, 0) es
solución. Más aún, este sistema tiene infinitas soluciones, para verlo nótese que la primera
ecuación puede ser obtenida de la segunda al multiplicarla por 1/2. Entonces si y = t de la
primera ecuación x = t + 2, luego las soluciones del sistema (1.11) son de la forma
x = t + 2, y = t, t ∈ R.
En la figura 1.4 se muestran la interpretación geométrica de las diferentes opciones de

solución de un sistema de tamaño 2 × 2.
19
y y y
l1
l1
l1 = l2
l2 l2
x x x
(a) Solución única (b) Sin solución (c) Infinitas solucio-

nes
Figura 1.4: Opciones para la solución de un sistema de tamaño 2 × 2
Antes de dar algunos ejemplos, resumimos lo hecho en la sección en el siguiente resultado
Teorema 1.3.1. El sistema

a11 x + a12 y = b1
a21 x + a22 y = b2
de tamaño 2 × 2, tiene solución única, no tiene solución, en cuyo caso diremos que es
inconsistente, o tiene infinitas soluciones.
(a) Tiene solución única si y sólo si a11 a22 − a12 a21 6= 0.
(b) No tiene solución o tiene infinitas soluciones si y sólo si a11 a22 − a12 a21 = 0.
Ejemplo 1.5. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a

un punto P0 = (x0 , y0 ) que no pertenece a l está dada por
|ax0 + by0 + c|
dmı́n = √ .
a2 + b2
Solución. Se pueden definir infinitas distancias del punto P0 a la recta l (ver figura 1.5),
pero sólo hay una que es la menor, precisamente la perpendicular trazada desde el punto P0
hasta la recta l. Supongamos que dicha perpendicular corta a l en un punto P1 = (x1 , y1 ).
20
y
P0
l
dmı́n
P1
l⊥
x
O
Figura 1.5: Distancia de un punto a una recta
Por la fórmula (1.8) tenemos que
d2mı́n = d2 (P1 , P0 ) = (x1 − x0 )2 + (y1 − y0 )2 . (1.12)
Debe notarse que las constantes a, b, c, x0 y y0 son dadas y tenemos que expresar x1 y y1
en términos de estas constantes. Para tal fin plantearemos dos ecuaciones. Empecemos por
calcular la pendiente de la recta l⊥ que une los puntos P0 y P1 . Por la fórmula 1.7 encontramos
que
y1 − y0
m⊥ =
x1 − x0
Ahora calculemos la pendiente de la recta l, tememos que ax + by + c = 0, en donde las
constantes a y b no son simultáneamente iguales a cero, por ejemplo supongamos que b 6= 0,
entonces
a c
y =− x−
b b
a
en donde vemos la pendiente de la recta l es m = − . Como las rectas l y l⊥ son perpendi-
b
culares por el Teorema 1.3.1 el producto de sus pendientes es −1, esto es,
a y − y
1 0
m · m⊥ = −1 ⇔ − · = −1.
b x1 − x0
De forma equivalente
a
x1 − x0 = (y1 − y0 ). (1.13)
b
21
Con lo cual tenemos nuestra primera ecuación
−bx1 + ay1 = ay0 − bx0 . (1.14)
Para plantear la segunda ecuación nótese que (x1 , y1 ) ∈ l, entonces ax1 + by1 + c = 0, o bien
ax1 + by1 = −c. (1.15)
Con las ecuaciones (1.14) y (1.15) formamos el siguiente sistema de ecuaciones lineales de
tamaño 2 × 2
−bx1 + ay1 = ay0 − bx0
(1.16)
ax1 + by1 = −c
Aquı́ las variables x1 , y1 reemplazan a las variables x, y en (1.10), y tenemos que a11 = −b,
a12 = a, a21 = a y a22 = b, de donde
a11 a22 − a12 a21 = −b(b) − a(a) = −(a2 + b2 ),
nótese que como a y b no son simultáneamente iguales a cero, a2 + b2 6= 0, por lo tanto,

por el Teorema 1.3.1 el sistema 1.16 tiene solución única. Ahora, multiplicando la primera
ecuación por a y la segunda por b obtenemos el sistema de ecuaciones equivalente al primero
−abx1 + a2 y1 = a2 y0 − abx0

(1.17)
abx1 + b2 y1 = −bc
Decimos que los sistemas (1.16) y (1.17) son equivalentes en el sentido de ambos tienen la
misma solución. Consideremos un tercer sistema equivalente a los dos primeros reemplazando
la segunda ecuación por la suma de la primera y segunda ecuación
−abx1 + a2 y1 = a2 y0 − abx0

(1.18)
0 + (a2 + b2 )y1 = a2 y0 − abx0 − bc
En el sistema (1.18) se observa que podemos despejar la variable y1 al multiplicar la segunda

ecuación por 1/(a2 + b2 ). Tenemos que
a2 y0 − abx0 − bc
y1 = .
a2 + b2
Entonces
a2 y0 − aby0 − bc − a2 y0 − b2 y0
y1 − y0 =
a2 + b2
2
−abx0 − b y0 − bc
=
a2 + b2
−b(ax0 + by0 + c)
= .
a2 + b2
22
Ası́,
−b(ax0 + by0 + c)
y1 − y0 = . (1.19)
a2 + b2
Ahora hagamos lo mismo pero con la diferencia x1 − x0 . En efecto, reemplazando (1.19) en
(1.13) obtenemos que esta diferencia es igual a
a −b(ax0 + by0 + c)
x1 − x0 = · ,
b a2 + b2
o bien,
−a(ax0 + by0 + c)
x1 − x0 = , (1.20)
a2 + b2
Finalmente, reemplazando las ecuaciones (1.19) y (1.20) en (1.12) y realizando un poco de
álgebra obtenemos
2 2
2 −b(ax0 + by0 + c) −a(ax0 + by0 + c)
dmı́n = +
a2 + b2 a2 + b2
b2 (ax0 + by0 + c)2 a2 (ax0 + by0 + c)2
= +
(a2 + b2 )2 (a2 + b2 )2
(a2 + b2 )(ax0 + by0 + c)2
=
(a2 + b2 )2
(ax0 + by0 + c)2
= .
a2 + b2
De donde
s
(ax0 + by0 + c)2
dmı́n =
a2 + b2
p
(ax0 + by0 + c)2
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2
Existen cinco métodos para resolver sistemas de ecuaciones lineales de tamaño 2 × 2:

eliminación, que fue el que utilizamos para simplificar el sistema 1.16, igualación, sustitución,
la regla de Krammer y el método gráfico. A continuación ilustramos con otro ejemplo, esta
vez el método de igualación
23
Ejemplo 1.6. (Ver, [3, pag. 7, Problema 34]). La compañı́a Sunrise Porcelain fabrica tazas y
platos de cerámica. Para cada taza o plato un trabajador mide una cantidad fija de material
y la pone en una maquina que los forma, de donde pasa al secado y vidriado automático. En
promedio, un trabajador necesita 3 minutos para iniciar el proceso de una tasa y 2 minutos
para el de un plato. El material para una tasa cuesta 25c y el material para un plato cuesta
20c. Si se asignan $44 diarios para la producción de tazas y platos, ¿cuántos deben fabricarse
de cada uno en un dı́a de trabajo de 8 horas, si un trabajador se encuentra trabajando cada
minuto y se gasta exactamente $44 en materiales?
Solución. Sea x := el número de tazas que se debe fabricar en un dı́a de trabajo de 8

horas, y y := el número de platos que se debe fabricar en un dı́a de trabajo de 8 horas. Se
deben emplear exactamente $44 en la fabricación de las tazas y platos, de donde tenemos al
ecuación
25 20
x+ y = 44.
100 100
Además, no se deben gastar ni más ni menos de 8 horas en la fabricación de platos y tazas,
por lo que
3 2
x + y = 8.
60 60
Simplificando las dos ecuaciones anteriores obtenemos el sistema

5x + 4y = 880
3x + 2y = 480.
Despejando la variable x en la primera ecuación y reemplazandola en la segunda obtenemos

3(880 − 4y)/5 + 2y = 480, de donde y = 120, por lo tanto, x = 3(880 − 4(120))/5 = 80.
Se concluye que se deben fabricar diariamente 80 tazas y 120 platos para cumplir con las
necesidades requeridas por el problema.
1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3

Ahora consideraremos un sistema de ecuaciones lineales con tres incógnitas y tres ecua-
ciones lineales 
 a11 x + a12 y + a13 z = b1
a x + a22 y + a23 z = b2 (1.21)
 21
a31 x + a32 y + a33 z = b3
También podemos hacer una interpretación geométrica de las posibles soluciones de un sis-
tema 3 × 3, pero tendrá que esperar hasta el capı́tulo 2 en el que se introduce la noción
24
de plano. En esta sección se describirá un método de solución para el sistema (1.21). Es-
te método se basa en el hecho de que las soluciones, o conjunto solución de un sistema se
mantiene invariante bajo la acción de tres operaciones que llamaremos elementales. Antes de
definir dichas operaciones introduciremos la noción de matriz, que nos permitirá simplificar
la escritura de cada paso del procedimiento.
Definición 1.4.1 (Matriz). Una matriz es un arreglo rectangular de números.
Una matriz con m filas y n columnas es llamada matriz de tamaño m × n. Utilizaremos

la notación Mm×n (R) para referirnos a el conjunto de todas la matrices de tamaño m × n con
entradas en los reales. Se pueden escribir los coeficientes de las variables de un sistema de
ecuaciones utilizando la notación matricial. Por ejemplo, los coeficientes del sistema (1.21)
se pueden organizar en la matriz
 
a11 a12 a13
A = a21 a22 a23 
a31 a32 a33
lo cual es llamada matriz de coeficientes. Cuando se consideran los elementos (términos

independientes) después de cada igualdad en un sistema de ecuaciones en el arreglo, se obtiene
una matriz llamada matriz aumentada. Para el sistema (1.21) la matriz aumentada está
dada por
a11 a12 a13 | b1

 
a21 a22 a23 | b2 
a31 a32 a33 | b3
A continuación se enuncian las tres operaciones elementales con filas.
Definición 1.4.2 (Operaciones elementales con filas). Para reducir una matriz se utilizan
las siguientes operaciones elementales
(a) Multiplicar (o dividir ) una fila por un número diferente de cero.
(b) Sumar un múltiplo de una fila o otra fila.
(c) Intercambiar dos filas
El proceso de aplicar operaciones elementales con filas para simplificar una matriz au-
mentada se llama reducción por filas.
Notación
25
(a) Ri → cRi significa que la i−ésima fila se reemplaza por esa misma fila multiplicada
por c.
(b) Rj → Rj + cRi significa la j−ésima fila se reemplaza por la suma de la fila j más la
fila i multiplicada por c
(c) Ri ↔ Rj quiere decir intercambiar dos filas i y j.
(d) A ⇐⇒ B indica que las matrices aumentadas A y B son equivalentes; es decir, que los
sistemas que representan tienen la misma solución
Cuando se aplica el método de reducción por filas a una matriz se puede llegar a dos
formas equivalentes de dicha matriz: forma escalonada reducida por renglones (FERR)
y forma escalonada por renglones (FER). A continuación damos la definición general
de estas dos formas.
Definición 1.4.3 (FERR). Una matriz se encuentra en la forma escalonada reducida por
renglones (FERR) si se cumplen las siguientes condiciones
(a) Todos los renglones (si los hay) cuyos elementos son todos cero aparecen en la parte
inferior de la matriz.
(b) El primer número diferente de cero (comenzando por la izquierda) en cualquier renglón
cuyos elementos no todos son cero es 1.
(c) Si dos renglones sucesivos tienen elementos distintos de cero, entonces el primer 1 en
el renglón de abajo está más hacia la derecha que el primer 1 en el renglón de arriba.
(d) Cualquier columna que contiene el primer 1 en un renglón tiene ceros en el resto de
sus elementos.
El primer número diferente de cero en un renglón (si lo hay) es llamado pivote para este
renglón.
Si una matriz cumple sólo las condiciones (a),(b) y (c) en la definición 1.4.3 se dice que
está en la forma escalonada por renglones (FER).
Ejemplo 1.7. Consideremos el siguiente par de matrices

 
1 2 3
1 0 0 5
A = 0 1 5, B = .
0 0 1 2
0 0 1
26
Vemos que la matriz A se encuentra en la FER, mientras que la matriz B está en la FERR.
También notamos que la matriz A se puede reducir aún más,
1 2 3 R1 → −3R3 + R1 1 2 0 1 0 0
     
0 1 5 R2 → −5R3 + R2 0 1 0 R1 → −2R2 + R1 0 1 0
⇐⇒
0 0 1 ⇐⇒ 0 0 1 0 0 1
Advertimos que la última matriz en el proceso de simplificación de la matriz A está en la
FERR, lo que nos dice esta forma es más refinada que la FER. Vemos además que la FER
no es única.
El proceso de simplificación de una matriz dada para llevarla a la FER tiene un orden
determinado. Mostraremos mediante el siguiente ejemplo cada uno de estos pasos.
Ejemplo 1.8. Llevar la matriz
 
0 0 5
0 2 0
 
A=
0 3 2

0 0 3
a la FER
Solución. Se debe aclarar que para llevar esta matriz a la FER puede existir un número
menor de pasos que los que llevaremos acabo a continuación, sin embargo, esto funcionaria
para esta matriz en particular. El proceso que describe permite simplificar cualquier matriz
de tamaño m × n.
Paso 1
Determinar la primera columna de A (comenzando de izquierda a derecha), cuyos ele-
mentos no sean todos nulos. Para este caso serı́a la columna 2, que llamaremos columna
pivote.
 
0 0 5
0 2 0
 
A=
0 3 2

0 0 3
Paso 2
Identificar la primera entrada (comenzando de arriba hacia abajo) de la columna pivote
que sea distinta de cero. Este elemento es llamado pivote, para es caso es 2.
 
0 0 5
0 2 0
 
A=
0 3 2

0 0 3
27
Paso 3
Intercambiar, en caso de ser necesario, la primera fila por el reglón que contiene al pivote,
esta es ahora la llamada fila pivote. Denotamos la matriz obtenida al realizar esta operación
elemental por A1 . Esto es,
   
0 0 5 0 2 0
0 2 0 R1 ↔ R2  0 0 5
   
A=  = A1
0 3 2 ⇐⇒  0 3 2
 
0 0 3 0 0 3
Paso 4
Ahora se puede multiplicar por el inverso del pivote, para generar un 1 en la fila pivote.
Esta nueva matriz la denotamos por A2
   
0 2 0 0 1 0
 0 0 5  R1 → (1/2)R1  0 0 5 
   
A1 =   = A2
0 3 2 ⇐⇒ 0 3 2
 
0 0 3 0 0 3
Paso 5
La nueva fila pivote es ahora la primera fila de la matriz A2 , y el nuevo pivote es 1, con
la cual podemos generar ceros en la columna que lo contiene, obteniendo una matriz A3
   
0 1 0 0 1 0
0 0 5 R → −3R + R 0 0 5
 3 1 3
A2 =   = A3
 
 0 3 2 ⇐⇒  0 0 2
 
0 0 3 0 0 3
Paso 6
Considerar la matriz B de tamaño (m − 1) × n obtenida a partir de A3 al suprimir la

primera fila de esta. Ahora, repetir los pasos de 1 a 5 (que sean necesarios) con la matriz B
 
0 0 5
B = 0 0 2
0 0 3
28
La columna pivote es la tercera, y elemento pivote, para este caso el 5, ya está en la primera
fila, por lo que se omite el paso 3. Se empieza entonces con el paso 4, multiplicar fila 1 de la
matriz B1 , por el inverso del pivote
   
0 0 5 0 0 1
R1 → (1/5)R1 
B = B1 =  0 0 2  0 0 2  = B2
⇐⇒
0 0 3 0 0 3
Ahora podemos generar ceros en los elementos de la columna que contiene el nuevo pivote,
que ahora es 1
0 0 1 R2 → −2R1 + R2 0 0 1
   
B2 = 0 0 2  R3 → −3R1 + R3 0 0 0 = B3
0 0 3 ⇐⇒ 0 0 0
Paso 7
Considerar la matriz C de tamaño (m − 2) × n obtenida a partir de B3 al suprimir la

primera fila de esta. Ahora, repetir los pasos de 1 a 5 (que sean necesarios) con la matriz C

0 0 0
C=
0 0 0
La matriz C no tiene columna pivote, lo que nos indica que el proceso de simplificación a
terminado. La matriz D consistente de la matriz C y las dos filas suprimidas en el proceso
simplificación, primero a la matriz A3 y luego a B3 :
 
0 1 0
0 0 1
 
D=
0 0 0

0 0 0
ya está en la FER.
En ejemplo anterior, la matriz A también está en la FERR, pero este no siempre es el

caso, ver el Problema 2.6.1.
Problema 1.4.1 (Kolman-Hill). Un ebanista fabrica sillas, mesas para café y mesas para
comedor. Se necesitan 10 minutos para lijar una silla, 6 para pintarla y 12 para barnizarla.
Se requieren 12 minutos para lijar una mesa para café, 8 para pintarla y 12 para barnizarla.
Son necesarios 15 minutos para lijar una mesa para comedor, 12 minutos para pintarla y 18
para barnizarla. El centro de lijado está disponible 16 horas a la semana, el de pintura 11 a
la semana y el barnizado 18 horas. ¿Cuántas unidades de cada mueble deben fabricarse por
semana de modo que las mesas de trabajo se utilicen a toda su capacidad?
29
Solución. Empezamos por definir las variables. sea x el número de sillas que se deben
fabricar por semana, y el número de mesas de café y z el número de mesas para comedor
que se deben fabricar por semana. Es conveniente organizar los datos del problema en una
tabla
x y z Disponibilidad semanal
Lijado (1/6)x (1/5)y (1/4)z 16
Pintado (1/10)x (2/15)y (1/5)z 11
Barnizado (1/5)x (1/5)y (3/10)z 18
Figura 1.6: Disponibilidad semanal de los centros de lijado, pintado y barnizado
Tenemos entonces el siguiente sistema


 (1/6)x + (1/5)y + (1/4)z = 16
(1/10)x + (2/15)y + (1/5)z = 11
(1/5)x + (1/5)y + (3/10)z = 18

cuya matriz aumentada es
1/6 1/5 1/4 | 16

 
1/10 2/15 1/5 | 11
1/5 1/5 3/10 | 18
La primera columna es la columna pivote y el pivote es 1/6
1/6 1/5 1/4 1/6 1/5 1/4

  
1/10 2/15 1/5  1/10 2/15 1/5 
1/5 1/5 3/10 1/5 1/5 3/10
este elemento ya se encuentra en la primera fila, por lo que el paso 3 del ejemplo 1.8 se omite.
El paso 4 indica que se debe multiplicar por el inverso del pivote, la fila pivote
1/6 1/5 1/4 | 16 6/5 3/2 | 96

   
1
1/10 2/15 1/5 | 11  R1 → 6R1 1/10 2/15 1/5 | 11 
⇐⇒
1/5 1/5 3/10 | 18 1/5 1/5 3/10 | 18
Ahora aplicamos el paso 5, generar ceros en la columna que contiene al pivote
1 6/5 3/2 | 96 R2 → (−1/10)R1 + R2 1 6/5 3/2 | 96

   
1/10 2/15 1/5 | 11  R3 → (−1/5)R1 + R3 0 1/75 1/20 | 7/5 
1/5 1/5 3/10 | 18 ⇐⇒ 0 −1/25 0 | −6/5
30
El algoritmo puede continuar como en el ejemplo 1.8, sin embargo, como se genero otro cero
en la tercera fila en el último paso, es posible encontrar el valor de la variable y y hacer la
sustitución hacia atrás, para encontrar la solución del sistema
(−1/25)y = −6/5 ⇔ y = 30,
reemplazando este valor de y en la segunda ecuación
(1/75)(30) + (1/20)z = 7/5 ⇔ (1/20)z = 7/5 − (1/75)(30)

⇔ z = 7(20/5) − 30(20/75)
⇔ z = 20
Los valores encontrados de y y z se reemplazan ahora en la primera ecuación
x + (6/5)(30) + (3/2)(20) = 96 ⇔ x + 36 + 30 = 96 ⇔ x = 96 − 66 = 30.
Ejemplo 1.9. Una fábrica produce tres productos A, B y C. Las ventas por cada unidad de
A, B y C son $1, $2 y $3, respectivamente. Los costos fijos son $19000 por año y los costos
de producción de cada unidad de A, B y C son $4, $5 y $7, respectivamente. El próximo
año, un total 9000 unidades de estos tres productos deben ser producidas y vendidas, y se
destina un total de $20000 para ventas. Si el costo total debe ser $71000, ¿cuántas unidades
de cada producto se deberı́an producir el próximo año?
Solución. Sea x el número de unidades del artı́culo A que se deben producir el próximo
año, y y, z, las respectivas variables que representan el número de unidades del artı́culos B
y C que se deben producir el próximo año.
Se deben producir y vender exactamente 9000 unidades de los productos A, B y C, esto

es,
x + y + z = 9000.
Se tiene un total de $20000 para las venta del próximo año, por lo que
x + 2y + 3z = 20000.
Además, como
costo total=costos fijos + costos de producción,
31
tenemos que la tercera ecuación es
71000 = 19000 + 4x + 5y + 7z.
Con lo cual formamos el sistema

 x + y + z = 9000
x + 2y + 3z = 20000

4x + 5y + 7z = 52000
La matriz aumentada para este sistema es
1 1 1 | 9000
 
1 2 3 | 20000
4 5 7 | 52000
Al aplicar reducción por filas obtenemos
1 1 1 | 9000 R1 → −R1 + R2 1 1 1 | 9000
   
1 2 3 | 20000 R3 → −4R1 + R3 0 1 2 | 11000
4 5 7 | 52000 ⇐⇒ 0 1 3 | 16000
1 1 1 | 9000
 
R3 → −R2 + R3 
0 1 2 | 11000
⇐⇒
0 0 1 | 5000
Observamos que la forma de la última matriz aumentada del sistema se encuentra en la FER
y se puede ver de inmediato que z = 5000. Después se usa la sustitución hacia atrás
para despejar primero y, y luego x. La segunda ecuación queda y + 2z = 11000, de donde,
y = 11000 − 2(5000) = 1000. Ahora reemplazando los valores de y y z en la primera ecuación
obtenemos x + 1000 + 5000 = 9000 o x = 3000. Esta es la solución única para el sistema.
Se escribe el la forma (3000, 1000, 5000). El método de solución que se acaba de emplear se
denomina eliminación Gaussiana.
Ahora podemos llevar la matriz de coeficientes que tenı́amos en un inicio, a la FERR.

Con el método de eliminación Gaussiana se llego a que
1 1 1 | 9000 1 1 1 | 9000
   
1 2 3 | 20000 ⇐⇒ 0 1 2 | 11000
4 5 7 | 52000 0 0 1 | 5000
Sin embargo, está última expresión para la matriz aumentada del sistema se puede reducir
aun más:
1 1 1 | 9000 R1 → −R3 + R1 1 1 0 | 4000
   
0 1 2 | 11000 R2 → −2R3 + R2 0 1 0 | 1000
0 0 1 | 5000 ⇐⇒ 0 0 1 | 5000
32
1 1 0 | 4000 1 0 0 | 3000
   
0 1 0 | 1000 R1 → −R2 + R1 0 1 0 | 1000
⇐⇒
0 0 1 | 5000 0 0 1 | 5000
Vemos que la matriz aumentada del sistema está en la FERR. De inmediato se observa que
x = 3000, y = 1000 y z = 5000. Y de nuevo se encuentra que la solución del sistema es
(3000, 1000, 5000). El método descrito anteriormente se denomina eliminación de Gauss–
Jordan.
Por ahora se cuenta con dos métodos para resolver sistemas de ecuaciones
Eliminación Gaussiana
Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la

definición 1.4.2, para llevar una matriz a la FER es llamado Eliminación Gaussiana.
Eliminación de Gauss–Jordan
Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la

definición 1.4.2, para llevar una matriz a la FERR es llamado Eliminación de Gauss–
Jordan.
1.5. Sistemas de ecuaciones lineales tamaño m × n

Hasta ahora hemos considerado sistemas de ecuaciones con la misma cantidad de incógni-
tas que ecuaciones, como ya mencionamos para el caso de sistemas 2 × 2, existen 5 métodos
de solución, de los cuales sólo dos ellos resultan prácticos en la solución de sistemas 3 × 3:
el método de eliminación y la regla de Krammer. Si pensamos en minimizar la cantidad de
operaciones necesarias para resolver un sistema de ecuaciones, la regla de Krammer queda
descartada, pues en su aplicación es necesario el cálculo de determinantes, lo cual suma
una buena cantidad de operaciones. Además, el hecho que la regla de Krammer implique el
cálculo de determinantes limita su aplicación sólo a sistemas n × n. Siendo ası́, nos queda
el método de eliminación, en realidad tenemos dos métodos eliminación, que definimos en
el sección anterior: Eliminación de Gaussiana y Eliminación de Gauss–Jordan. Los
cuales, permiten encontrar la solución de sistemas m × n, esto es sistemas de la forma


 a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = b1
 a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = b2



a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = b3 (1.22)
 .
.
.




am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm

33
donde los coeficiente aij , ası́ como los términos independientes bj , son elementos de un campo
F , que por lo regular es R o C. El sistema (1.22) puede tener infinitas soluciones reales,
e infinitas soluciones enteras, pero finitas soluciones enteras positivas. Para encontrar las
soluciones enteras positivas de un sistema m × n introduciremos la noción de Ecuación
Diofántica.
1.5.1. Ecuaciones Diofánticas

Definición 1.5.1. Una ecuación Diofántica lineal en dos variables tiene la forma
ax + by = c,
donde a, b y c son enteros con ab 6= 0.
El siguiente resultado da información sobre las soluciones de una ecuación Diofántica

lineal
Teorema 1.5.1 (Soluciones de una ecuación Diofántica). La ecuación Diofántica ax+by = c

tiene solución, si y sólo si, d|c donde d = (a, b) . Además, x0 y y0 es una solución particular
de la ecuación, entonces todas las soluciones vienen dadas en la forma
b a
x = x0 + k , y = y0 − k ,
d d
donde k es una entero arbitrario.
Aquı́ (a, b) denota el máximo común divisor entre los enteros a y b y el sı́mbolo d|c
significa que d divide a c.
Ejemplo 1.10. Una señora compró 100 frutas por $5000. Las ciruelas le costaron a $25
cada una, las manzanas a $150 y las pitayas a $500. ¿Cuántas frutas de cada clase compro?
Solución. Sea x el número de ciruelas, y el número de manzanas, y z la cantidad de pitayas

que compro la señora. Según los datos del problema obtenemos el siguiente sistema

x + y + z = 100
25x + 150y + 500z = 5000
cuya matriz aumentada es

1 1 1 | 100
1 6 20 | 200
34
Ahora reduciremos esta matriz hasta llevarla a la F.E.R.R.

1 1 1 | 100 R2 → −R1 + R2 1 1 1 | 100
1 6 20 | 200 ⇐⇒ 0 5 19 | 100

1 1 1 | 100 R2 → (1/5)R2 1 1 1 | 100
0 5 19 | 100 ⇐⇒ 0 1 19/5 | 20

1 1 1 | 100 R1 → −R2 + R1 1 0 −14/5 | 80
0 1 19/5 | 20 ⇐⇒ 0 1 19/5 | 20
Regresando al sistema obtenemos

x − (14/5)z = 80
y + (19/5)z = 20
Vemos que la variable z, relaciona las otras dos variables, nos referimos a dicha variable como
variable de ligamiento. Si asignamos a la variable de ligamiento, el valor de un parámetro
t podemos expresar las variables x, y en términos de dicho parámetro, para obtener

x = 80 + (14/5)t
y = 20 − (19/5)t, t ∈ R
De esta forma encontramos lo que se conoce como forma paramétrica del sistema

 x = 80 + (14/5)t
y = 20 − (19/5)t
z = t, t ∈ R

Notamos inmediatamente que hay una solución por cada valor que toma el parámetro, es
decir, el sistema tiene infinitas soluciones reales. Pero, dado que cada una de las variables
debe ser positiva, tenemos las siguientes restricciones
20 − (19/5)t > 0, t > 0,
esto es, 0 < t < 100/19 = 5 + 5/19. Además, de las expresiones paramétricas para x, y,
advertimos, que para que estas variables representen números enteros, t debe ser un múltiplo
de 5 diferente de 1. Como el único múltiplo de 5 diferente de 1 en el intervalo (0, 100/19),
es 5, la única opción es que t = 5. De donde, la única solución entera positiva del sistema es
x = 94, y = 1 y z = 5.
35
Ahora utilicemos ecuaciones Diofánticas para hallar las soluciones enteras del sistema.
Despejando el parámetro en la primera ecuación de la forma paramétrica para el sistema
obtenemos
5
t = (x − 80),
14
reemplazando este valor en la segunda ecuación de la forma paramétrica para el sistema nos
da

19 5
y = 20 − (x − 80)
5 14
o equivalentemente,
19x + 14y = 19(80) + 14(20) = 1800. (1.23)
Tenemos entonces una ecuación Diofántica con a = 19, b = 14 y c = 1800, además, como
(19, 14) = 1|1800, por el Teorema 1.5.1 la ecuación tiene solución, más aún, este mismo
resultado nos asegura que la solución viene dada por
14 19
x = x0 + k , y = y0 − k ,
1 1
donde x0 , y0 es una solución particular de la ecuación, y sea observa de la ecuación (1.23)
que x0 = 80 y y0 = 20. Por lo tanto,

x = 80 + 14k
y = 20 − 19k
Para expresar la variable z como una función de k, nótese que x + y + z = 100, con lo cual,
z = 100 − x − y = 100 − (80 + 14k) − (20 − 19k) = 5k.
Entonces, las soluciones enteras del problema son


 x = 80 + 14k
y = 20 − 19k
z = 5k, k ∈ Z

De lo cual inmediatamente se deduce que el problema tiene infinitas soluciones enteras.

Finalmente, de las restricciones y, z > 0, extraemos la única solución entera positiva del
problema, pues como 0 < k < 20/19, debemos tener que k = 1. De lo cual obtenemos de
nuevo que x = 94, y = 1 y z = 5.
A continuación presentamos la noción de congruencia lineal que nos permitirá hallar

la solución particular de una ecuación Diofántica, además de introducir los enteros módulo
n.
36
Definición 1.5.2 (congruencia lineal). Sean a y b enteros y n un entero positivo. Si n|(a−b)
decimos que a y b son congruentes módulo n y escribimos
a ≡ b(mod n).
Por ejemplo, 23 ≡ 11(mod 12) y 1 ≡ −1(mod 2). Si n|a, entonces a ≡ 0(mod n) y

recı́procamente. En el siguiente resultado se dan las principales propiedades de la congruencia
módulo n.
Teorema 1.5.2. Si a ≡ b(mod n) y c ≡ d(mod n), entonces
(a) a ± c ≡ b ± d(mod n).
(b) ac ≡ bd(mod n).
(c) Para todo entero positivo k, ak ≡ bk (mod n).
(d) Para todo entero r, a + r ≡ b + r(mod n).
(e) Para todo entero r, ar ≡ br(mod n).

a b n
(f) Si r es un divisor común de a, b y n y a ≡ b(mod n), entonces ≡ mod .
r r r
n
Fermat, estudió los números de la forma 22 + 1 para n = 0, 1, 2, . . . llamados números
de Fermat y conjeturó en 1650 que siempre eran primos. La conjetura resulta ser cierta
para los cinco primeros números de Fermat que son 3, 5, 17, 257, 65537, sin embargo, Euler
demostró en 1732 que el sexto número de Fermat no es primo. Demostraremos este hecho
usando congruencias.
5
Ejemplo 1.11. El sexto número de Fermat, 22 + 1, no es primo
Solución. En efecto, puesto que, 216 = 65536 = (102)(641) + 154. Por la de congruencia
lineal tenemos
216 ≡ 154(mod 641).
Ahora, por la propiedad (c) del Teorema 1.5.2
232 ≡ 1542 (mod 641),
pero, 1542 = 23716 = (36)(641) + 640 y en consecuencia
1542 ≡ 640(mod 641).
37
por lo que por, transitividad debemos tener que
232 ≡ 640(mod 641),
y por la propiedad (d) del Teorema 1.5.2
232 + 1 ≡ 641(mod 641).
Finalmente, como 641 ≡ 0(mod 641), de nuevo por transitividad tenemos que
5
22 + 1 ≡ 0(mod 641),
5 5
lo cual implica que 641|(22 + 1), en efecto, 22 + 1 = (641)(6700417).
Además de las propiedades dadas en el teorema 1.5.2la relación ser congruente con es
transitiva, más aún, la relación de congruencia es una relación equivalencia. Recordemos
que
Definición 1.5.3. Sean A y B conjuntos. Una relación de A en B es un subconjunto del

producto cartesiano entre A y B.
Concluimos de la definición anterior que si A un conjunto arbitrario y R es una relación

en A, entonces R ⊆ A × A.
Definición 1.5.4. Sea A un conjunto arbitrario y R es una relación en A; entonces

R es reflexiva si
∀x ∈ A, (x, x) ∈ R.
R es simetrica si
(x, y) ∈ R ⇒ (y, x) ∈ R.
R es antisimetrica si
(x, y) ∈ R y (y, x) ∈ R ⇒ x = y.
R es transitiva si
(x, y) ∈ R y (y, z) ∈ R ⇒ (x, z) ∈ R.
Definición 1.5.5. Una relación en A es llamada relación de equivalencia si es reflexiva

simétrica y transitiva.
38
Si a y b están relacionados escribimos aRb, o bien (a, b) ∈ R.
Definición 1.5.6. Sean A un conjunto y R una relación de equivalencia en A, para cada
a ∈ A denotamos la clase de equivalencia de a por [a] y la definimos como
[a] = {x ∈ A : (x, a) ∈ R}
La clase de equivalencia de un elemento a ∈ A también suele denotarse por a.

Teorema 1.5.3. Sea R una relación de equivalencia en A. Entonces
aRb ⇔ [a] = [b].
Definición 1.5.7 (Conjunto cociente). Sea R una relación de equivalencia en A. El conjunto

de todas las clases de equivalencia es llamado conjunto cociente de A generado por R,
denotamos este conjunto por A/R. Tenemos entonces que
A/R = {[a] : a ∈ A} .
Teorema 1.5.4. La congruencia módulo n es una relación de equivalencia sobre Z.

El hecho que la relación de congruencia sea transitiva es clave para solucionar congruen-
cias lineales, esto encontrar los x tales
x ≡ a(mod n)
Ejemplo 1.12. Un comerciante compró lápices y borradores por $2,490. Si cada lápiz costo
$29 y cada borrador costo $33, ¿cuántos lápices y borradores compro? Sugerencia
Solución. Sea x el número de lápices y y el número de borradores que el comerciante
compró. Tenemos entonces la ecuación Diofántica
29x + 33y = 2490, (1.24)
sujeta a las condiciones x, y > 0. Para hallar la solución general de la ecuación primero
debemos hallar una solución particular. En ocasiones es fácil hallar esta solución si a|c, o b|c.
Por ejemplo, en la ecuación Diofántica
77x + 55y = 28600,
tenemos que a = 77, b = 55 y c = 28600, y observamos que 28600 = 520 · 55, esto es,
55|28600. Por lo tanto, si hacemos que la variable x sea igual a cero, obtenemos para y es
valor 28600/55 = 520. De esta forma vemos que una solución particular de la ecuación es
x0 = 0 y y0 = 520. Con lo cual, por el Teorema 1.5.1 la solución general de la ecuación es
x = 5k, y = 520 − 7k, k ∈ Z
39
Sin embargo, para la ecuación (1.24) a = 29, b = 33 y, entonces d = (29, 33) = 1 divide a
c = 2490, por lo que la ecuación tiene solución, pero ni a, ni b dividen a c, en consecuencia
al tomar x, o y igual a cero no obtenemos una solución entera. En este caso para encontrar
la solución particular podemos utilizar congruencias lineales. Procedemos como sigue.
Dado que 33y = 2490 − 29x tenemos que 29x ≡ 2490(mod 33). Por el algoritmo de la
división 2490 = 33(75) + 15, entonces 2490 ≡ 15(mod 33). Luego, por la propiedad transitiva
de la congruencia lineal
29x ≡ 15(mod 33)
Ahora, −4 ≡ 29(mod 33), entonces por el inciso (e) del Teorema 1.5.2,
−4x ≡ 29x(mod 33)
De nuevo por transitividad tenemos que −4x ≡ 15(mod33), con lo cual, −32x ≡ 120(mod33)
y 120 = 33(3) + 21 de donde 120 ≡ 21(mod 33), por consiguiente,
−32x ≡ 21(mod 33).
Por último, como 1 ≡ −32(mod 33), x ≡ −32x(mod 33), lo cual por transitividad implica
que x ≡ 21(mod 33). Esta última congruencia se satisface si x = x0 = 21, de donde y0 =
2490 − 29 · 21
= 57. En consecuencia, la solución general de la ecuación es
33
x = 21 + 33k, y = 57 − 29k, k ∈ Z.
Como x, y > 0, 21 + 33k > 0 y 57 − 29k > 0, de donde −21/33 < k < 57/29, entonces
k = 0, 1.
Si k = 0 obtenemos x = 21, y = 57.
Si k = 1 obtenemos x = 54, y = 28.
Ejemplo 1.13. Solucionar la congruencia lineal 3x ≡ 15(mod 18)
Solución. Dado que 15 ≡ −3(mod 18), por transitividad tenemos que 3x ≡ −3(mod 18).
Entonces, por la propiedad (f) del Teorema 1.5.2, x ≡ −1(mod 6) y −1 ≡ 5(mod 6), luego
de nuevo por transitivivdad x ≡ 5(mod 6). Por consiguiente, x = 5 + 6k, k ∈ Z.
Ejemplo 1.14. Un hombre cambió un cheque por cierta cantidad de dinero. El cajero equivo-
cadamente intercambio el número de pesos con el número de centavos. Al revisar la cantidad
recibida el hombre observó que tenia el doble de la cantidad por la cual habı́a girado el cheque
más dos centavos. Por que valor fue girado el cheque?
40
Solución. Sea x la variable que representa el número de pesos, y y la variable que representa
el número de centavos. La cantidad por la cual fue girado el cheque en pesos viene dada por
1
x+ y.
100
Si se intercambian el número de pesos con el número de centavos, la cantidad obtenida en
pesos está dada por
1
y+ x,
100
según los datos del problema esta cantidad el igual a el doble de la cantidad por la cual habı́a
girado el cheque más dos centavos, por lo tanto, tenemos la ecuación

1 2 1
2 x+ y + =y+ x,
100 100 100
o equivalentemente,
−199x + 98y = 2,
en donde vemos que a = −199, b = 98 y c = 2, además, d = (−199, 98) = 1 y 1|2, por

lo que la ecuación Diofántica tiene solución, puesto que esta es equivalente a la ecuación
98y − 2 = 199y, podemos hallar una solución particular al resolver la congruencia lineal
98y ≡ 2(mod 199).
Multiplicando la anterior congruencia por 2, obtenemos
196y ≡ 4(mod 199).
Ahora, −3 ≡ 196(mod 199), entonces −3y ≡ 196y(mod 199). Con lo cual por transitividad
−3y ≡ 4(mod 199).
Multiplicando esta última congruencia por 66 nos da
−198y ≡ 264(mod 199).
Pero 1 ≡ −198(mod 199), entonces y ≡ −198y(mod 199), por consiguiente por transitividad
y ≡ 264(mod 199).
Finalmente, como 264 ≡ 65(mod 199), tenemos que y ≡ 65(mod 199), de lo cual deducimos
que
y = 199k + 65, k ∈ Z.
41
98(65) − 2
Si k = 0, obtenemos y = y0 = 65, de donde x0 = = 32. Por lo tanto, la solución
199
general de la ecuación es
x = 32 + 98k, y = 199k + 65, k ∈ Z,
donde x > 0 y 0 < y < 100. De las restricciones x, y > 0, obtenemos dos correspondientes
cotas inferiores para el parámetro k:
32 65
− <k y − < k,
98 199
y la restricción y < 100, nos da una cota superior para k:
100 − 65 35
k< = .
199 199
Como
65 32
− <− ,
199 98
el intervalo más pequeño que puede contener a k es

32 35
− , ,
98 199
de lo cual, k = 0, de donde x = 32, y y = 65. Luego el cheque se giró por $32, 65.
Según el Teorema 1.5.4 la relación aRb ⇔ a ≡ b(mod n) define una relación de equiva-
lencia en Z. Entonces la clase de equivalencia a de un elemento a ∈ Z está dada por
a = {x ∈ Z : x ≡ a(mod n)}
= {x ∈ Z : x = a + kn, para algún z ∈ Z} .
El conjunto cociente generado por esta relación es denotado por Zn . Ahora, si a es un entero
arbitrario como n > 0, por el algoritmo de la división podemos representarlo en la forma
a = qn + r con 0 ≤ r < n, luego a ≡ r(mod n) y en consecuencia por el Teorema 1.5.3, a = r.
Por ejemplo, en Z4 tenemos que
4 ≡ 0(mod 4) ⇒ 4 = 0
5 ≡ 1(mod 4) ⇒ 5 = 1
6 ≡ 2(mod 4) ⇒ 6 = 2
7 ≡ 3(mod 4) ⇒ 7 = 3
8 ≡ 0(mod 4) ⇒ 8 = 0
42
Por lo tanto, Z4 sólo puede estar conformado por 4 clases:

Z4 = 0, 1, 2, 3 .
En general, dado que n ≡ 0(mod n) tenemos que n = 0, en consecuencia,

Zn = 0, 1, . . . , n − 1 ,
llamamos a este conjunto enteros módulo n. Sobre Zn podemos definir una adición una
multiplicación mediante las siguientes fórmulas
x + y = x + y,
x · y = xy.
Los enteros módulo n con la suma ası́ definida cumplen las propiedades de campo de la
definición 1.1.1.
Teorema 1.5.5. La adición en Zn tiene las siguientes propiedades
(a) x, y ∈ Zn , entonces x + y ∈ Zn .
(b) x, y ∈ Zn , entonces x · y ∈ Zn .
La suma en Zn es conmutativa, asociativa, modulativa y cada elemento en este conjunto

tiene un inverso aditivo.
(c) x + y = y + x,
(d) x + (y + z) = (x + y) + z.
(d) Para todo x ∈ Zn existe e ∈ Zn tal que x + e = x
(e) Para todo x ∈ Zn existe y ∈ Zn tal que x + y = e.
Demostración. Sean x, y ∈ Zn . Si x+y < n, entonces x+y = x + y ∈ Zn . Ahora si x+y ≥ n,

por el algoritmo de la división existen enteros q y r tales que x + y = nq + r donde 0 ≤ r < n,
entonces x + y ≡ r(mod n), en consecuencia, por el Teorema 1.5.3 tenemos que x + y = r.
Por lo tanto, x + y = x + y = r ∈ Zn . De la misma forma demostramos la cerradura de la
multiplicación. Demostremos la conmutatividad. Sean x, y ∈ Zn
x+y =x+y
=y+x
= y + x.
43
Nótese que como x + y = y + x, entonces x + y = y + x. De forma análoga demostramos la
asociatividad.
Sea e := 0, entonces e ∈ Zn y para todo x ∈ Zn tenemos que
x+0 =x+0= x
De esta forma vemos que 0 es el elemento neutro para suma en Zn .
Para cada x ∈ Zn sea y := n − x, entonces como n − x < n, y ∈ Zn y
x+n−x= x+n−x =n= 0
La demostración del inciso (a) en el teorema anterior nos indica como construir las tablas
de suma y la multiplicación en Zn .
Ejemplo 1.15. Construir las tablas de adición y multiplicación para Z4
Solución. Por lo hecho en la demostración del inciso (a) del Teorema 1.5.5 tenemos que
+ 0 1 2 3 · 0 1 2 3
0 0 1 2 3 0 0 0 0 0
1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1
Por comodidad hemos omitido las barras. Se observa de la tabla de la multiplicación que
hay simetrı́a respecto a la diagonal principal, esto quiere decir que la multiplicación en Z4 es
conmutativa, además se advierte que el elemento neutro de la multiplicación es 1 y podemos
comprobar que dicha multiplicación es además asociativa. Finalmente notamos que
2 · 0 = 0, 2 · 1 = 2, 2 · 2 = 0 y 2 · 3 = 2,
es decir, no existe ningún elemento en Z4 que multiplicado por 2 nos de 1, esto es, el 2 no
tiene inverso multiplicativo, lo cual implica que Z4 no es campo. Esto a su vez implica que
ecuaciones tan simples como 2x + 1 = 2, no tengan solución en Z4 .
Como vimos en el ejemplo 1.15, Zn no es campo, sin embargo la multiplicación es con-

mutativa, asociativa, módulativa y distributiva.
44
Teorema 1.5.6. La multiplicación en Zn tiene las siguientes propiedades
(c) x · y = y · x,
(d) x · (y · z) = (x · y) · z.
(d) x · (y + z) = x · y + x · z
(e) Para todo x ∈ Zn existe 1 ∈ Zn tal que x · 1 = 1.

A continuación demostraremos que si n es un número primo Zn es un campo. Para la
demostración es necesario el siguiente resultado.
Teorema 1.5.7 (Identidad de Bézout). Sean a y b enteros no nulos cuyo máximo común
divisor es d, entonces existen enteros x, y tales que
ax + by = d (1.25)
EL recı́proco del teorema anterior se tiene si d = 1, esto es,
Teorema 1.5.8. Sean a y b enteros no nulos. Entonces
(a, b) = 1 si y sólo si existen enteros x, y tales que ax + by = 1.
Los números x e y de la identidad (1.25), llamada identidad de Bézout, pueden determi-
narse mediante el algoritmo extendido de Euclides. Este constituye otro método para
encontrar una solución particular de una ecuación Diofántica.
Teorema 1.5.9 (Zp es un campo). Si n es un número primo, entonces Zn es un campo.
Demostración. Supongamos que n es un número primo. Sea m ∈ Zn con m 6= 0, entonces
0 < m < n. Como m y n son primos relativos, es decir, (m, n) = 1, por el Teorema de Bezút
existen enteros x, y tales que
mx + ny = 1.
Por lo tanto tenemos
mx + ny = 1.
Pero,
mx + ny = mx + ny
=m·x+n·y
Como n = 0 nos queda que
m · x = 1.
Es decir, x es el inverso multiplicativo de m. De este último hecho y los Teoremas 1.5.5 y
1.5.6 concluimos que Zn es un campo si n es un número primo.
45
Problema 1.5.10. Resolver la siguiente ecuación lineal en Z73
14(x + 16) + 72(x + 2) = 53
Solución. Por comodidad omitiremos las barras. Por el Teorema 1.5.6 sabemos que en Z73
se cumple la ley distributiva por lo que
14(x + 16) + 72(x + 2) = 53 ⇔ 14x + 14 · 16 + 72x + 72 · 2 = 53
Dado que 14 · 16 = 224 = 73 · 3 + 5 y 72 · 2 = 144 = 73 · 1 + 71, tenemos que
14x + 14 · 16 + 72x + 72 · 2 = 53 ⇔ (14x + 5) + (72x + 71) = 53
Por el Teorema 1.5.5 la suma en Z73 es asociativa, por lo que
(14x + 5) + (72x + 71) = 53 ⇔ (14x + 72x) + (5 + 71) = 53.
Notando que 14 + 72 = 86 = 73 · 1 + 13 y 5 + 71 = 76 = 73 · +3, una nueva aplicación de la

ley distributiva nos permite concluir que
(14x + 72x) + (5 + 71) = 53 ⇔ (14 + 72)x + 3 = 53 ⇔ 13x + 3 = 53.
El inverso aditivo de 3 es 70 y 53+70 = 123 = 73·1+50. Entonces, de nuevo, por el Teorema

1.5.5
13x = 50
La certeza de que la ecuación anterior tiene solución, nos la da el Teorema 1.5.9, ya que 73 es
un número primo. Debe existir entonces y ∈ N con 0 < y < 73 tal que el residuo de dividir
el entero 13y entre 73 es 1. más aún, por el algoritmo de la división existe n ∈ N cumpliendo
que
13y = 73n + 1 (1.26)
Trasladamos entonces el problema de encontrar el inverso aditivo de 13 módulo 73 al de

resolver la ecuación Diofántica en (1.26). La ecuación equivale a la congruencia lineal
13y ≡ 1(mod 73)
73 = 13(5) + 8, entonces
13y ≡ 1(mod 73) ⇒ 65y ≡ 5(mod 73)
73 = 65(1) + 8
−8 ≡ 65(mod 73) ⇒ −8y ≡ 65y(mod 73)
46
Por transitividad
−8y ≡ 5(mod 73)
73 = 8(9) + 1
−72y ≡ 45(mod 73)
Como
1 ≡ −72(mod 73) ⇒ y ≡ −72y(mod 73)
de nuevo por transitividad y ≡ 45(mod 73). Es decir,
y = 73k + 45 k ∈ Z
Luego, y = 45.
Siguiendo con la ecuación
(45 · 13)x = 45 · 50
donde, 45 · 50 = 73 · 30 + 60. En consecuencia, x = 60.
1.6. Matrices
1.6.1. Sumatorias
Definición 1.6.1 (Sucesión). Sea X un conjunto no vacı́o, una sucesión en X es una fun-
ción definida en el conjunto los naturales que toma valores en el conjunto X. En sı́mbolos
escribimos
an : N → X.
Se acostumbra utilizar la notación
(an ) = {a1 , a2 , . . .} .
A partir de la sucesión (an ) creamos otra sucesión, llamada sucesión de sumas parciales
denotada por (Sn ) y definida como
Sn = a1 + a2 + · · · + an .
47
Para expresar de manera más cómoda la sucesión (Sn ) introducimos la notación sigma
P
. Con esta notación podemos expresar la sucesión Sn como sigue
n
X
Sn = ai ,
i=1
que se lee, sumatoria desde i = 1 hasta i = n. A continuación estableceremos las propiedades

fundamentales de la sumatoria.
Teorema 1.6.1 (Propiedades de la sumatoria). Sean (ai ), (bi ) sucesiones en R. Entonces

n
X n
X n
X
(a) (ai + bi ) = ai + bi . (propiedad aditiva)
i=1 i=1 i=1
Xn n
X
(b) cai = c ai . (propiedad homogénea)
i=1 i=1
Xn n−1
X
(c) ai−1 = ai .
i=1 i=0
n
X
(d) (ai − ai−1 ) = an − a0 . (propiedad telescópica)
i=1
n
X 1 − xn+1
(e) xi = x 6= 1. (sumas parciales de la serie geométrica)
i=0
1−x
Demostración. Los ı́tems (a), (b) y (c) se siguen de la definición de sumatoria. Establezcamos
la propiedad telescópica. De las propiedades (a) y (c)
n
X n
X n
X
(ai − ai−1 ) = ai − ai−1
i=1 i=1 i=1
n−1
X n
X
= an + ai − a0 − ai−1
i=1 i=2
n−1
X n−1
X
= an + ai − a0 − ai
i=1 i=1
= an − a0 .
48
Demostremos ahora el ı́tem (d). Por la propiedad (b) y la propiedad telescópica tenemos que
n
X n
X
(1 − x) xi = (1 − x)xi
i=0 i=0
n n
ai :=xi
X X
i i+1
= (x − x ) = (ai − ai+1 )
i=0 i=0
= a0 − an+1
= 1 − xn+1 .
Como x 6= 1, vemos la propiedad (d) se sigue.
Las propiedades (a) y (b) del teorema 1.6.1 se denominan propiedades de linealidad.
Con las propiedades de linealidad junto con la propiedad telescópica, podemos calcular las
siguientes sumas parciales.
Teorema 1.6.2. Para entero n ≥ 1, se cumple que

n
X n(n + 1)
(a) i=
i=1
2
n
X n(n + 1)(2n + 1)
(b) i2 =
i=1
6
n 2
X
3 n(n + 1)
(c) i =
i=1
2
Demostración. Demostraremos sólo la parte (a), las partes (b) y (c) se dejan como ejercicios.
Xn
Nótese que, 2i − 1 = i2 − (i − 1)2 , y que 1 = n. Por lo tanto, por las propiedades
i=1
de linealidad de la sumatoria (propiedades (a) y (b)) en el teorema 1.6.1 y la propiedad
telescópica tenemos que
n
X n
X n
X
2 i−n= 2i − 1
i=1 i=1 i=1
n
X
= (2i − 1)
i=1
n n
2 X
2 ai :=i
X 2
= i − (i − 1) = (ai − ai−1 )
i=1 i=1
2
= an − a0 = n .
49
n
X
Entonces, 2 i − n = n2 , de donde
i=1
n
X n2 + n n(n + 1)
i= = .
i=1
2 2
El teorema anterior también puede ser demostrado utilizando el principio de inducción

matemática (P.I.M)
Teorema 1.6.3 (Principio de inducción matemática). Sea S un subconjunto de los naturales

que tiene las dos propiedades siguientes
(a) 1 ∈ S.
(b) Si k ∈ S, también k + 1 ∈ S.
Entonces S = N.
Demostremos usando el principio de inducción matemática el ı́tem (a) del teorema 1.6.2.
Nótese que
1 + 3 = 4 = 22 , 1 + 3 + 5 = 9 = 32 , 1 + 3 + 5 + 7 = 16 = 42 .
Si seguimos este patrón vemos que
1 + 3 + 5 + · · · 2n − 1 = n2 . (1.27)
Definamos S = {n ∈ N : 1 + 3 + 5 + · · · 2n − 1 = n2 }. Nótese que 1 ∈ S, ya que 1 = 12 .

Ahora supongamos k ∈ S (hipótesis de inducción), esto es,
1 + 3 + 5 + · · · 2k − 1 = k 2 . (1.28)
El k-ésimo impar es de la forma 2k −1, entonces k +1-ésimo impar es de la forma 2(k +1)−1.
Sumando este término en ambos lados de (1.28) obtenemos
1 + 3 + 5 + · · · 2k − 1 + 2(k + 1) − 1 = k 2 + 2(k + 1) − 1.
Como k 2 + 2(k + 1) − 1 = k 2 + 2k + 1 = (k + 1)2 , demostramos que k + 1 ∈ S. Entonces por

el Teorema 1.6.3 (principio de inducción matemática) S = N. Esto es, (1.27) se cumple para
todo número natural n.
50
Por lo tanto, por las propiedades de linealidad de la sumatoria
n2 = 1 + 3 + · · · 2n − 1
Xn
= (2i − 1)
i=1
X n n
X
=2 i− 1
i=1 i=1
n
X
=2 i − n.
i=1
De donde finalmente obtenemos que

n
X 1 n(n + 1)
i = (n2 + n) = .
i=1
2 2
Álgebra de matrices
Como ya dijimos una matriz es un arreglo rectangular de números dispuestos en m filas
y n columnas
 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
A= . (1.29)
 
.. .. 
 .. . . 
am1 am2 · · · amn
Para simplificar el manejo de las matrices usamos la notación A = [aij ]m×n , o simple-
mente, A = [aij ] para denotar una matriz tı́pica del conjunto Mm×n (R).
Definición 1.6.2 (Igualdad de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A = B si y sólo si aij = bij para todo 1 ≤ i ≤ m, y todo 1 ≤ j ≤ n. Es decir, dos
matrices son iguales si y sólo si son iguales componente a componente.
1.6.2. Suma y multiplicación por escalar de matrices

De la misma forma en la que se definió la igualdad matricial definimos la suma y la
multiplicación por escalar de matrices, esto es, en términos de las componentes.
Definición 1.6.3 (Suma de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A + B = C donde C = [cij ] y cij = aij + bij .
51
Definición 1.6.4 (Multiplicación por escalar). Sean A ∈ Mm×n (R) y k ∈ R. Definimos la
multiplicación por escalar entre el escalar k y la matriz A como kA = C donde C = [cij ] y
cij = kaij .
A continuación estableceremos las propiedades del la suma y la multiplicación por escalar
de matrices.
Teorema 1.6.4 (Propiedades de la suma matricial). Sean A, B, C ∈ Mm×n (R), con A =
[aij ], B = [bij ] y C = [cij ], α, β escalares. Entonces
(a) A + B = B + A.
(b) A + (B + C) = (A + B) + C.
(c) Existe la matriz E = 0m×n con E = [eij ] y eij = 0 para todo i y todo j tal que
A + 0m×n = A.
(d) Para toda matriz A existe −A = [−aij ] tal que A + (−A) = 0m×n .
(e) α(A + B) = αA + αB
(f) (α + β)A = αA + βA
1.6.3. Producto matricial

Una matriz de tamaño n × 1 es llamada vector fila, que escribimos en la forma

x1 x2 · · · xn
Una matriz de tamaño 1 × n es llamada vector columna, que escribimos en la forma

 
x1
 x2 
 
 .. 
.
xn
Definición 1.6.5 (Producto escalar). Sean
   
x1 y1
 x2   y2 
A= .  yB=.
   
..  .. 
xn yn
dos vectores. Entonces el producto escalar entre A y B denotado por A · B, está dado por
A · B = x1 y1 + x2 y2 + · · · + xn yn .
52
De la definición de producto escalar se deducen las siguientes propiedades
Teorema 1.6.5 (Propiedades del producto escalar). Sean A, B y C tres vectores y α, β
escalares. Entonces
(a) A · 0 = 0.
(b) A · B = B · A.
(c) A · (B + C) = A · B + A · C.
(d) (αA) · B = α(A · B) = A · (αB).

Definimos el producto punto también entre dos vectores fila

A = x1 x2 · · · xn y B = y1 y2 · · · yn

A · B = x1 x2 · · · xn · y1 y2 · · · yn = x1 y1 + x2 y2 + · · · + xn yn .
Con frecuencia se tomará el producto escalar de un vector fila y un vector columna.
 
y1
 y2 

A · B = x1 x2 · · · xn ·  ..  = x1 y1 + x2 y2 + · · · + xn yn .

.
yn
Definición 1.6.6 (Producto matricial). Sea A ∈ Mm×n (R) y B ∈ Mn×p (R) con A = [aij ]m×n
y B = [bij ]n×p . Entonces AB = C donde C = [cij ] y
cij = [fila i de A] · [columna j de B]
Es decir,
n
X
cij = ai1 ai2 · · · ain · a1j a2j · · · anj = aik bkj .
k=1
Como primera consecuencia de la definición del producto matricial es que dicho producto
no es conmutativo.
Ejemplo 1.16. En ∈ M2×2 (R) consideremos

1 0 0 0
A= , A=
1 1 0 2
Entonces

0 0 0 0
AB = , BA =
0 2 2 2
Como AB 6= BA, vemos que el producto de matrices no es conmutativo
53
Se puede demostrar que el producto matricial si es asociativo y distributivo
Teorema 1.6.6 (Propiedades del producto matricial). Si todas las sumas y productos están
bien definidos, entonces
(a) A(BC) = (AB)C (Ley asociativa)

(b) A(B + C) = AB + AC, (A + B)C = AC + BC (Leyes distributivas)
(c) (αA)B = α(AB) = A(αB) y (αA)(βB) = αβ(AB), α, β ∈ R.
El espacio Mm×n (R)
Cuando m = n tenemos el espacio de las matrices cuadradas, en el existe un elemento

neutro para la multiplicación llamado matriz identidad, que se denota por In×n , o simple-
mente por I y define como I = [δij ] donde
(
1, si i = j,
δij =
0, si i 6= j,
El escalar δij es llamado delta de Kronecker. Si aplicamos la definición de matrices para
el producto AI = C, donde A = [aij ]n×n y C = [cij ]n×n obtenemos
n
X
cij = aik δkj .
k=1
Pero por definición del delta de Kronecker cij = aij , de modo que AI = A. De manera similar
tenemos que IA = A. Hemos demostrado que
Teorema 1.6.7. Sea A una matriz cuadrada de n × n. Entonces
AI = IA = A.
En todo campo F para cada elemento a 6= 0 existe b ∈ F tal que ab = 1. Esto ya no se

cumple en el espacio Mm×n (R), pues por ejemplo,

1 1 0 0
A := 6=
0 0 0 0
Sin embargo, no existe una matriz B tal que AB = BA = I2×2 . No basta entonces con que
la matriz sea distinta de la matriz cero, se debe pedir además, como veremos en el capı́tulo
2, que det A 6= 0. Llamamos a este tipo de matrices, matrices invertibles
Definición 1.6.7. Una matriz A ∈ Mn×n (R) es invertible si existe B ∈ Mn×n (R)
AB = BA = I
En este caso escribimos B = A−1 .
54
Nota 1.6.1. Si A ∈ Mn×n (R) es una matriz tal que existe B ∈ Mn×n (R) cumpliendo que
AB = I, entonces necesariamente tenemos que BA = I, ya que
det A det B = det(AB) = det I = 1,
lo cual implica que det A, det B 6= 0, de lo cual, a su vez concluimos que las matrices A, B,
deben ser invertibles. En particular, como la matriz A es invertible
A−1 (AB) = A−1 ⇔ (A−1 A)B = A−1

⇔ IB = A−1
⇔ B = A−1
Por lo tanto, BA = A−1 A = I.

Teorema 1.6.8. Sean A, B ∈ Mn×n (R). Entonces AB es invertible y
(AB)−1 = B −1 A−1
Potenciación de matrices
Sea A ∈ Mn×n (R). Definimos A0 = I y An = An−1 A.
En los números reales si an = 0, se tiene que a = 0. Veámos que en las matrices este
hecho en general no se cumple.
Ejemplo 1.17. Hallar todas las matrices A ∈ Mn×n (R) tales que A2 = 0.
Solución. Sea

a b
A= ,
c d
Como A2 = 0, det A det A = det(A2 ) = 0, entonces det A = 0, esto es, ad − bc = 0.

2
2 2 a + bc ab + bd 0 0
A =0⇔A = =
ac + cd d2 + bc 0 0
Por lo tanto, de esta ecuación matricial obtenemos 4 ecuaciones escalares que junto con la
ecuación ad − bc = 0, conforman el sistema
a2 + bc = 0 (1.30)
ab + bd = 0 (1.31)
ac + cd = 0 (1.32)
d2 + bc = 0 (1.33)
ad − bc = 0 (1.34)
55
Igualando las ecuaciones (1.30) y (1.33) obtenemos que a2 = d2 , de donde a = ±d. Si a = d,
de la ecuación (1.34) tenemos que a2 − bc = 0, sumando esta última ecuación con la ecuación
(1.30) nos da 2a2 = 0, de donde a = 0. Por lo tanto, bc = 0. Luego, la opción a = d genera
matrices de la forma

0 b 0 0
, b 6= 0 y , c 6= 0
0 0 c 0
Por ejemplo,

0 1
A= 6 0, y A2 = 0.
=
0 0
Ahora si a = −d, entonces a+d = 0, y las ecuaciones (1.31) y (1.32) no dan información pero
tampoco contradicción y las ecuaciones (1.30), (1.33) y (1.34) se vuelven la misma ecuación:
a2 + bc = 0. Por lo tanto, en este caso obtenemos matrices de la forma

a b
,
c −a
donde a, b y c satisfacen la ecuación a2 + bc = 0. Se observa que si a = 0, entonces bc = 0,
de modo que este caso también abarca el caso anterior. Concluimos que la todas la matrices
tales que A2 = 0 son de la forma

a b
,
c −a
con a2 + bc = 0.
Ejemplo 1.18. Sea A ∈ Mn×n (R) y α ∈ R. Usar inducción matemática para establecer que
(αA)n = αn An .
Solución. Supongamos que
(αA)n = αn An ∀n ∈ N (1.35)
Para n = 1, (αA)1 = α1 A1 , esto es, (1.35) se tiene para n = 1. Supongamos que (1.35) se
tiene para n = k, es decir
(αA)k = αk Ak ∀k ∈ N (Hipótesis de inducción)
Entonces
(αA)k+1 = (αA)(αA)k
= (αA)(αk Ak ) (Hipótesis de inducción)
= (αk α)(AAk ) (Teorema 1.6.6 inciso (c))
= αk+1Ak+1
56
Por consiguiente, (1.35) se cumple para n = k + 1. Luego por el (PIM) tenemos la validez
de (1.35).

1 0
Ejemplo 1.19. Sea A = . Comprobar que A2 = 2A − I y calcular A100
−1 1
Solución. Por calculo directo tenemos

2 1 0 1 0 1 0
A = =
−1 1 −1 1 −2 1
Por otro lado,

2 0 1 0 1 0
2A − I = − =
−2 2 0 1 −2 1
Con lo cual comprobamos que A2 = 2A − I. Entonces por la propiedad distributiva del

producto matricial, las propiedades (e) y (f) del Teorema 1.6.4 y el Ejemplo 1.18 tenemos
A4 = A2 A2 = (2A − I)(2A − I)
= (2A − I)(2A) − (2A − I)(I)
= (2A)2 − 2A − 2A + I
= 4A2 − 4A + I
= 4(2A − I) − 4A + I
= 8A − 4I − 4A + I
= 4A − 3I.
Siguiendo el patrón vemos que
A2n = 2nA − (2n − 1)I.
Por lo tanto, si n = 50, obtenemos
A100 = 100A − 99I.

100 0 −99 0
= +
−100 100 0 −99

1 0
= .
−100 1
La potenciación de matrices cumple las siguientes propiedades
57
Teorema 1.6.9. Sean n, m ∈ Z+ y A ∈ Mn×n (R). Entonces
An Am = An+m , (An )m = Anm .
Ejemplo 1.20. Sean A, B ∈ Mn×n (R). Entonces
(a) Si A, B son matrices triangulares, o estrictamente triangulares, A + B es una matriz

triangular, o estrictamente triangular.
(b) Si A, B son matrices triangulares, o estrictamente triangulares, AB es una matriz

triangular, o estrictamente triangular.
Solución. En el caso de la suma, es suficiente demostrar el caso en que A y B sean matrices

triangulares superiores. Sean A = [aij ] y B = [bij ] matrices triangulares superiores, esto es
aij = 0 y bij = 0 si i > j. Tenemos que C = [cij ], donde
cij = aij + bij ,
entonces cij = 0 + 0 = 0 si i > j, esto es, C es una matriz triangular superior. Ahora para
el producto tenemos que
n
X
cij = aik bkj .
k=1
Supongamos que i > j, entonces existe p ∈ N tal que i = j + p, donde p = 1, 2, . . . , n − j. Y

tenemos dos casos: k ≤ j, o k > j. Si k ≤ j, entonces k ≤ j < j + p = i, esto es, k < i, con
lo cual aik = 0, y por lo tanto cij = 0. Ahora si k > j, entonces bkj = 0, y de nuevo cij = 0.
Es decir C es triangular superior.
Ahora, supongamos que A y B son matrices estrictamente triangulares superiores, esto

es aij = 0 y bij = 0 si i ≥ j. Si i > j, estamos en el caso anterior y cij = 0. Y si i = j tenemos
que
n
X
cii = aik bki ,
k=1
si i 6= k, entonces i > k, i < k, con lo cual respectivamente tenemos que aik = 0, o bki = 0.
En ambos casos cii = 0. Alternativamente, si i = k, aik = 0, bki = 0, y de nuevo cii = 0. En
consecuencia, la matriz C es estrictamente triangular superior.
Se puede ahora utilizar inducción matemática para demostrar que
Corolario 1.6.10. La suma y el producto de n matrices estrictamente triangulares superio-

res, es una matriz estrictamente triangular superior.
58
1.7. Problemas
Sección 1.1. Campos

Problema 1.7.1 (Dificultad 3). Suponga que k un entero positivo que no es un cuadrado
perfecto. Demostrar que
n √ o
F := x + ky : x, y ∈ Q
√
es un campo. Sugerencia: Recuerde que k es un número irracional si k no es un cuadrado
perfecto
Problema 1.7.2 (Dificultad 2). En Z7 resolver las ecuaciones 3x + 4 = 1 y x2 + 2x + 6 = 0.
Problema 1.7.3. Muestre que la ecuación 2x + 1 = 2 no tiene solución en Z4 . Concluya
que Z4 no es un campo.
Problema 1.7.4 (Dificultad 2). Verifique que el conjunto de los números racionales con las
operaciones usuales de suma y producto de racionales es un campo. Asuma que la suma y
producto en los enteros es conmutativa, asociativa y modulativa.
Problemas que se resuelven por ecuaciones de primer

grado con una incógnita
Problema 1.7.5. Un capataz contrata un obrero ofreciéndole un sueldo anual de 3000 sucres
y una sortija. Al cabo de de 7 meses el obrero es despedido y recibe 1500 sucres y la sortija.
¿Cuál era el valor de la sortija?
Problema 1.7.6. Un conejo es perseguido por un perro. El conejo lleva una ventaja inicial
de 50 de sus saltos al perro. El conejo de 5 saltos mientras el perro da 2, pero el perro en
3 saltos avanza tanto como el conejo en 8 saltos. ¿Cuántos saltos debe dar el perro para
alcanzar la conejo?
Problema 1.7.7. Un profesor asigna 3 ejercicios. Pide a 1/4 del número de estudiantes que
está en clase que resuelva el primer ejercicio, a 3/8 el segundo y a 5/16 el tercero. Del total
de alumnos dos están ausentes. ¿Cuál es la cantidad total de alumnos?
Problemas que se resuelven por ecuaciones no lineales

Problema 1.7.8. Un joven estudiante gasta diariamente $3200 en transporte y $6400 en
el almuerzo. Para cubrir estos gastos compra bolsas de 12 paquetes de papas fritas a $8800
cada una, con el fin de vender paquetes sueltos a $1000. ¿Cuál es el mı́nimo de paquetes que
debe vender diariamente para cubrir sus gastos?
59
Problema 1.7.9. Un recipiente contiene 5000L de agua pura. Una salmuera que contiene
30g de sal por litro de agua es bombeada al recipiente a razón de 25L/min. Hallar la con-
centración de sal después de t minutos(en gramos por litro). ¿Qué sucede cuando t tiende a
infinito?
Sección 1.3. Sistemas de ecuaciones lineales de tamaño

2×2
Problema 1.7.10. (Ver, [3, pag. 7, Problema 37]). Una tienda de helados vende sólo helados
con soda y malteadas. Se pone una 1 onza de jarabe y cuatro onzas de helado en un helado
con soda, y 1 onza de jarabe y 3 onzas de helado en una malteada. Si la tienda usa 4 galones
de helado 5 cuartos de jarabe en un dı́a, ¿cuántos helados con soda y cuántas malteadas
vende? Sugerencia: 1 cuarto =32 onzas; 1 galón=128 onzas.
Problema 1.7.11. (Ver, [3, pag. 27, Problema 38]). Un viajero que acaba de regresar de
Europa gastó $30 diarios en Inglaterra, $20 diarios en Francia y $20 diarios en España por
concepto de hospedaje. En comida gasto $20 diarios en en Inglaterra, $30 diarios en Francia
y $20 en España. Sus gastos adicionales fueron $10 en cada paı́s. Los registros del viajero
indican un gasto total de $340 en hospedaje, $320 en comida y $140 en gastos adicionales
durante su viaje por estos tres paı́ses. Calcule el número de dı́as que pasó el viajero en cada
paı́s o muestre que los registros deben estar incorrectos debido a que las cantidades gastadas
no son compatibles una con la otra.
Problema 1.7.12. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.
Problema 1.7.13. (Ver, [3, pag. 27, Problema 40]). Una gente secreto sabe que 60 equipos
aéreos, que consisten en aviones de combate y bombarderos, están estacionados en cierto
campo aéreo secreto. El agente quiere determinar cuántos de los 60 equipos son aviones de
combate y cuántos son bombarderos. Existe un tipo de cohete que llevan ambos aviones; el
de combate lleva 6 de ellos y el bombardero sólo 2. El agente averigua que se requieren 250
cohetes para armar todos los aviones del campo aéreo. Aún más, escucha que se tiene el
60
doble de aviones de combate que bombarderos en al base. Calcule el número de aviones de
combate y bombarderos en el campo aéreo o muestre que la información del agente debe ser
incorrecta ya que es inconsistente.
Sección 1.5. Sistemas de ecuaciones lineales de tamaño

m×n
Problema 1.7.14. Analizar si el siguiente sistema es consistente o inconsistente. Si es
consistente dar la forma que tienen las soluciones.

 w + x − y − 6z = −4
2w + 3x + 2y + 12z = 12
2w + x + 2y + 4z = 4

Problema 1.7.15. Considere el sistema


 2x + 3y − z = a
x − y + 3z = b
3x + 7y − 5z = c

Encuentre las condiciones de a, b y c para que el sistema sea inconsistente.
Subsección 1.5.1. Ecuaciones Diofánticas

Problema 1.7.16. La entrada a cierto museo vale $900 para adultos y $375 para niños.
Cierto dı́a en que asistieron más adultos que niños se recaudaron $45000. ¿Cuántos adultos
y cuantos niños asistieron al museo?
Problema 1.7.17. Una caja contiene un total de 13 monedas distintas de 1, 5 y 10 centavos,

cuyo valor total es de 83 centavos. ¿Cuántas monedas de cada denominación hay?
Sección 1.6. Matrices

a −b
Problema 1.7.18 (**). Muestre que el conjunto de todas las matrices de la forma ,
b a
siendo a y b números reales es un campo.

n cos θ − sen θ
Problema 1.7.19 (**). Determinar A , si A := .
sen θ cos θ
61
Problema 1.7.20 (**). En los números reales, la ecuación a2 = 1, tiene dos soluciones,
a = ±1. Esto no se cumple para las matrices. Muestre que la ecuación A2 = I se satisface
para cada una de las matrices

1 0 1 0 1 b
, , ,
0 1 c 1 0 1
donde b y c son números reales arbitrarios. Hallar todas las matrices A ∈ M2×2 (R) tales que
A2 = I.

1 1 2 1 2
Problema 1.7.21 (**). Sea A = . Comprobar que A = y calcular An .
0 1 0 1
   
1 1 1 1 2 3
Problema 1.7.22 (**). Sea A = 0  1 1. Comprobar que A2 = 0 1 2. Inducir una
0 0 1 0 0 1
forma general para An y demostrarla por inducción.
Problema 1.7.23 (**). Hallar todas las matrices A ∈ M2×2 (R), tales que A2 = 0.
Problema 1.7.24. Sea A ∈ Mn×n (R) estrictamente triangular superior (es decir todas entra-
das en la diagonal y abajo de ella son cero). Demuestre que si A es una matriz estrictamente
triangular superior, entonces An es estrictamente triangular superior.
Problema 1.7.25. Sean A, B ∈ Mn×n (R). Entonces
(a) (A−1 )−1 = A si la matriz A es invertible.
(b) (AB)−1 = B −1 A−1 si A y B son matrices invertibles.
Problema 1.7.26 (***). Sea A una matriz estrictamente triangular superior. Demuestre
que I − A es invertible y exprese su inversa en función de A.
62
Capı́tulo 2
Determinantes
2.1. Definición de determinante de una matriz

a11 a12
Sea A = . Se define el determinante de A por
a21 a22
det A = a11 a22 − a12 a21 .
Con frecuencia se denotará det A por

a11 a12
|A| o .
a21 a22
Definición 2.1.1 (Menor de una matriz). Sea A ∈ Mn×n (R) y sea Mij la matriz de tamaño
(n − 1) × (n − 1) obtenida a partir de A al eliminar la fila i y la columna j. Mij se llama
menor ij de A.
Definición 2.1.2 (Cofactor de una matriz). Sea A ∈ Mn×n (R). El cofactor ij de A,
denotado por Aij , está dado por
Aij = (−1)i+j |Mij |.
Nótese que definición anterior tiene sentido por que ya se definió el determinante para
una matriz 2 × 2.
Definición 2.1.3 (Determinante de una matriz). Sea A ∈ Mn×n (R). Entonces el determi-
nante de A, denotado por det A o |A|, está dado por
n
X
det A = |A| = a11 A11 + a12 A12 + · · · + an1 An1 = a1k A1k . (2.1)
k=1
La expresión en lado derecho de (2.1) se llama desarrollo por cofactores o expansión por
cofactores a través de la primera fila de A.
63
Definición 2.1.4 (Matriz triangular y diagonal). Una matriz cuadrada se dice triangular
superior si todos sus componentes abajo de la diagonal son cero. Se dice estrictamente
triangular superior si todas sus entradas en la diagonal y abajo de ella son cero. Es una
matriz triangular inferior si todos sus componentes arriba de la diagonal son cero. Se
dice estrictamente triangular superior si todas sus entradas en la diagonal y arriba de
ella son cero. Es una matriz diagonal si todos los elementos que no están en la diagonal
cero.
Teorema 2.1.1 (Determinante de una matriz triangular). Sea A ∈ Mn×n (R) una matriz
triangular. Entonces
det A = a11 a22 · · · ann .
2.2. Interpretación geométrica del determinante de ta-

maño 2 × 2
En la figura 2.1 se muestra un paralelogramo de vértices OBCA. El triángulo △BP C es
rectángulo en P , además, BP = a y CP = c, de tal forma que las coordenadas del punto C
son
x = BP + OR = a + b, y = RB + CP = c + d.
C(a + b, c + d)
b
Q
b
B(b, d) b P
b A(a, c)
x
R O
Figura 2.1: Interpretación geométrica del determinante 2 × 2
Suponemos que los segmentos de recta OQ y BC son perpendiculares en Q, tal forma

que el segmento OQ es la altura del paralelogramo. Por lo tanto, su área está por
OQ · BC.
64
El segmento BC como función de a y c viene dado en la forma
p √
BC = d(B, C) = (a + b − b)2 + (c + d − d)2 = a2 + c2 .
Ahora, expresaremos el segmento OQ como función de a, b, c y d. Dado que los segmentos

OQ y BC son perpendiculares tenemos que
mOQ · mBC = −1.
Pero, mBC = mOA = c/a. Con lo cual,
mOQ = −1/mBC = −a/c.
Por lo tanto, la ecuación de la recta que contiene el segmento OQ está dada por
a
y=− x
c
Para generar otra ecuación que relacione las variables x, y, hallamos la ecuación de la recta
que contiene al segmento BC. Como esta recta pasa por B y tiene pendiente mBC = mOA =
c/a, su ecuación es
c
y = (x − b) + d.
a
Como y = −(a/c)x, obtenemos que
a c
− x = (x − b) + d.
c a
Multiplicando la ecuación anterior por el término −(c/a), nos da
cc
x= − (x − b) + d
a a
c c bc
= − x− +d
a a a
2 2
c bc cd
= − 2x + 2 −
a a a
2 2
c bc − acd
= − 2x + .
a a2
De donde obtenemos que
bc2 − acd ad − bc
x= 2 2
= −c 2 .
a +c a + c2
65
Se advierte que el numerador en la última igualdad en la ecuación anterior, es el determinante
de la matriz

a b
A= ,
c d
por lo que podemos expresar la variable x en términos de este determinante:

det A
x = −c .
a2 + c2
a
Dado que y = − x, obtenemos
c

a det A
y = − · −c 2
c a + c2
det A
=a 2 .
a + c2
De esta forma obtenemos las coordenadas del punto Q:

det A det A
Q = −c 2 ,a . .
a + c2 a2 + c2
En consecuencia, el área del paralelogramo es

s
a2 det2 A + c2 det2 A √ 2
OQ · BC = · a + c2
(a2 + c2 )2
√
det2 A √ 2
=√ · a + c2
a2 + c2
= | det A|.
2.3. Propiedades de los determinantes

Teorema 2.3.1 (Determinante de un producto). Sean A, B ∈ Mn×n (R). Entonces
det(AB) = det A det B.
Teorema 2.3.2 (Teorema fundamental de los determinantes). Sea A = (aij )n×n . Entonces
n
X
det A = aik Aik
k=1
66
para todo i = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier fila de la matriz A. Más aún,
n
X
det A = akj Akj
k=1
para todo j = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier columna de la matriz A.
El Teorema 2.3.2 le da sentido a la definición 2.1.3 y tiene las siguientes consecuencias
Corolario 2.3.3. Sea A ∈ Mn×n (R)
(a) det A = det At .
(b) A es una matriz invertible si y sólo si det A 6= 0 y det A−1 = 1/ det A.
(c) Si la matriz A tiene una fila o columna de ceros, entonces det A = 0.

Además tenemos las siguientes propiedades
Teorema 2.3.4 (Propiedad 1). Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al multiplicar su fila i o su columna j por un escalar c, entonces
det B = c det A.
Teorema 2.3.5 (Propiedad 2). Sean

   
a11 a12 · · · a1j · · · a1n a11 a12 · · · α1j · · · a1n
a a · · · a2j · · · a2n   a21 a12 · · · α2j · · · a2n 
   
A =  21 12 ,B = 
. . . . . . . . . . . . . . . . . . . . . . . . . . .  . . . . . . . . . . . . . . . . . . . . . . . . . . . 

an1 a12 · · · anj · · · ann an1 a12 · · · αnj · · · ann
y
 
a11 a12 · · · a1j + α1j · · · a1n
a a · · · a2j + α2j · · · a2n 
 
C =  21 12
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

an1 a12 · · · anj + αnj · · · ann
Entonces
det C = det A + det B.
En otras palabras, supongamos que las matrices A, B y C son idénticas excepto por la columna
j y que la columna j de C es igual a la suma de las columnas j–esimas de A y B. Entonces
det C = det A + det B.
67
Teorema 2.3.6 (Propiedad 3). Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al intercambiar dos de sus filas o sus columnas. Entonces
det B = − det A.
Teorema 2.3.7 (Propiedad 4). Si la matriz A tiene dos filas o columnas iguales, entonces
det A = 0.
Teorema 2.3.8 (Propiedad 5). Si una fila o columna de una matriz A es un múltiplo escalar
de otra fila o columna, entonces det A = 0
Teorema 2.3.9 (Propiedad 6). Si se suma un múltiplo escalar de una fila o columna o otro
fila o columna, entonces el determinante no cambia.
Problema 2.3.10. Demuestre utilizando inducción matemática que

1 + x1
x 2 · · · x n

x1 1 + x2 · · · xn
.. = 1 + x1 + x2 + · · · + xn , n = 2, 3, . . . , (2.2)

.. ..
. . .

x1 x2 · · · 1 + xn
Ahora, sea A = [aij ]n×n donde
(
1 + xi , si i = j,
aij :=
xj , si i 6= j,
y sea xi := i2 . Calcule el determinante de la matriz A.

Solución. Para encontrar la forma de proceder en el caso general, consideremos la casos
n = 2 y n = 3. Para el caso n = 2, por calculo directo tenemos que

1 + x1 x 2

= (1 + x1 )(1 + x2 ) − x1 x2 = 1 + x2 + x1 + x1 x2 − x1 x2 = 1 + x1 + x2
x1 1 + x2
Para el caso n = 3, utilizaremos las propiedades de los determinantes:

1 + x1 x 2 x3 1 x2 x3 x1 x2 x3
P2
x1
1 + x2 x3 = 0 1 + x2 x3 + x1 1 + x2 x3
x x2 1 + x3 0 x2 1 + x3 x1 x2 1 + x3
1
Ahora podemos calcular el primer determinante en el miembro derecho de la ecuación anterior

expandiendo por cofactores sobre la primera columna de la matriz y posteriormente aplicando
el caso n = 2:

1 x2 x3

0 1 + x2 = 1 + x 2 x3

= 1 + x2 + x3 .
x 3 x2

0 1 + x3

x2 1 + x3
68
Ahora,
x1 x2 x3 R2 → −R1 + R2 x1 x2 x3
   
x1 1 + x2 x3  R3 → −R1 + R3  0 1 0 
x1 x2 1 + x3 ⇐⇒ 0 0 1
Aplicando dos veces la Propiedad 6 (Teorema 2.3.9), y el Teorema 2.1.1 obtenemos

x1 x2 x3 x1 x2 x3
P6
x1 1 + x2
x3 = 0 1 0 = x1
x x2 1 + x3 0 0 1
1
En consecuencia,

1 + x1 x2 x3 1 x2 x3 x1 x2 x3

x1
1 + x2 x3 = 0 1 + x2 x3 + x1 1 + x2 x3 = 1 + x2 + x3 + x1 .
x x2 1 + x3 0 x2 1 + x3 x1 x2 1 + x3
1
Demostremos ahora el caso general. Ya demostramos que (2.2) se tiene si n = 2, supongamos

que se tiene para n = k, esta es nuestra hipótesis de inducción. Entonces, por la propiedad
2 (Teorema 2.3.5), tenemos que

1 + x1
x2 · · · xk xk+1
x1
1 + x2 · · · xk xk+1
.. .. ..
. . .

x1 x2 · · · xk 1 + xk+1

1
x 2 · · · x k xk+1
x1
x 2 · · · x k xk+1

0 1 + x2 · · · xk xk+1
x1 1 + x2 · · · xk xk+1

= . + (2.3)

.. .. .. .. .. ..
. .

. . .

0 x2 · · · xk 1 + xk+1 x1 x2 · · · xk 1 + xk+1
Ahora podemos calcular el primer determinante en el miembro derecho de la ecuación anterior

expandiendo por cofactores sobre la primera columna de la matriz y posteriormente aplicando
la hipótesis inducción:

1
x 2 · · · x k xk+1
1 + x2
x 2 · · · x k xk+1

0 1 + x2 · · · xk xk+1
x2 1 + x2 · · · x k xk+1

= = 1 + x2 + · · · + xk+1

.. .. .. .. .. ..
. . . . . .

0 x2 · · · xk 1 + xk+1 x2 x2 · · · xk 1 + xk+1
69
Para calcular el determinante en el segundo sumando en la ecuación (2.3), multiplicamos la
primera fila por (−1) y sumamos el resultado con las otras k filas, y después aplicamos el
Teorema 2.1.1 para obtener

x1
x2 · · · xk xk+1 x1 x2 · · · xk xk+1
x1 1 + x2 · · · xk xk+1 0 1 + x2 · · · xk xk+1
= .. = x1

.. .. .. .. ..
. . . . . .

x1 x2 · · · xk 1 + xk+1 0 0 ··· 0 1
Nótese que se aplico la propiedad 6, k veces. Por lo tanto tenemos que

1 + x1
x2 · · · xk xk+1
x1
1 + x2 · · · xk xk+1
.. .. ..
. . .

x1 x2 · · · xk 1 + xk+1

1
x2 · · · xk xk+1 x1 x2 · · · xk xk+1
0 1 + x2 · · · xk xk+1 x1 1 + x2 · · · xk xk+1
= . + ..

.. .. .. .. ..
. . .
. .

0 x2 · · · xk 1 + xk+1 x1 x2 · · · xk 1 + xk+1
= 1 + x2 + · · · + xk+1 + x1 .
Lo cual significa que (2.2) si tiene para n = k + 1. En consecuencia, por (P.I.M) tenemos la
valides de (2.2).
Nótese que por (2.2)
det A = 1 + x1 + · · · + xn ,
Si xi := i2 , entonces
det A = 1 + 12 + · · · + n2
n(n + 1)(2n + 1)
=1+
6
n(n + 1)(2n + 1) + 6
= .
6
70
Ejemplo 2.1. Calcule el determinante de Vardermonde de tamaño 3 × 3:

1 1 1

a1 a2 a3

a2 a2 a2
1 2 3
Solución. La matriz A3 = [aij ]3×3 , donde aij = ai−1

j con 1 ≤ i, j ≤ 3, es llamada matriz de
Vardermonde. En este ejemplo calcularemos el determinante de Vardermonde de tamaño
3 × 3; D3 = detA3 (ver el Problema 2.7.2).
Antes de aplicar las propiedades de los determinantes para calcular D3 , simplificaremos

la matriz A3 utilizando reducción por columnas:
1 1 1 C2 → −C1 + C2 1 0 0
   
a1 a2 a3  C3 → −C1 + C3 a1 a2 − a1 a3 − a1 
a21 a22 a23 ⇐⇒ a21 a22 − a21 a23 − a21
Por diferencia de cuadrados tenemos que

   
1 0 0 1 0 0
a1 a2 − a1 a3 − a1  = a1 a2 − a1 a3 − a1 
a21 a22 − a21 a23 − a21 a21 (a2 − a1 )(a2 + a1 ) (a3 − a1 )(a3 + a1 )
Ahora, aplicando dos veces la propiedad 1 (Teorema 2.3.4) obtenemos que

1 0 0 1 0 0

a1 a2 − a1 a3 − a1 = (a2 − a1 )(a3 − a1 ) a1 1 1

a2 (a − a )(a + a ) (a − a )(a + a ) a2 a + a a + a
1 2 1 2 1 3 1 3 1 1 2 1 3 1
Finalmente, desarrollando el determinante en el segundo miembro de la desigualdad anterior,

por la primera fila nos da

1 0 0

(a2 − a1 )(a3 − a1 ) a1 1 1
a2 a + a a + a
1 2 1 3 1
= (a2 − a1 )(a3 − a1 ) [(a3 + a1 ) − (a2 + a1 )]

= (a2 − a1 )(a3 − a1 )(a3 − a2 ).
Por lo tanto, D3 = (a2 − a1 )(a3 − a1 )(a3 − a2 ). Se advierte que D3 es un producto de términos

de la forma (aj − ai ), esta expresión es caso particular de lo que conoce como productoria.
Definimos este concepto de manera similar al de sumatoria, si no que en vez de sumar cada
valor que toma la variable, lo multiplicamos, esto es,
71
n
Y
ai = a1 a2 · · · an
i=1
Por ejemplo, utilizando el sı́mbolo de productoia podemos expresar D3 como sigue:

2
Y
D3 = (aj − ai )
i=1
i<j≤3
2.4. Determinantes e inversas

Definición 2.4.1 (Matriz de cofactores y matriz adjunta). Sea A ∈ Mn×n (R) y sea B la
matriz dada por
 
A11 A12 · · · A1n
 A21 A22 · · · A2n 
 
B=
. . . . . . . . . . . . . . . . . . .

An1 An2 · · · Ann
B es llamada matriz de cofactores de A. Entonces la adjunta de A denotada por adj A

es la transpuesta de la matriz de cofactores, esto es,
 
A11 A21 · · · An1
A A22 · · · An2 
 
adj A = B t =  12
. . . . . . . . . . . . . . . . . . . 

An1 A2n · · · Ann
Teorema 2.4.1 (Cálculo de la inversa de una matriz). Sea A ∈ Mn×n (R). Entonces A es
invertible si sólo si det A 6= 0. Si det A 6= 0, entonces
1
A−1 = adj A.
det A
Teorema 2.4.2 (Regla de Cramer). Sea A ∈ Mn×n (R) y suponga que det A 6= 0. Entonces
la solución única del sistema Ax = b viene dada por
D1 D2 Dn
x1 = , x2 = , . . . , xn = ,
D D D
72
donde Dj = det Aj , j = 1, . . . , n, D = det A y Aj la matriz obtenida de A al cambiar su
columna j por el vector columna
 
b1
 b2 
b=.
 
 .. 
bn
Ejemplo 2.2. Considere el triángulo de la figura 2.2
b a
h
A B
x y
c
Figura 2.2: Regla de Krammer y teorema del coseno
(a) Demuestre, usando trigonometrı́a elemental las llamadas leyes de proyección
c cos A + a cos C = b (2.4)
b cos A + a cos B = c (2.5)
c cos B + b cos C = a (2.6)
(b) Utilice la regla de Krammer y las leyes de proyección para demostrar el teorema del
coseno:
a2 = b2 + c2 − 2bc cos A (2.7)
b2 = a2 + c2 − 2ac cos B (2.8)
c2 = a2 + b2 − 2ab cos C (2.9)
Solución. Del triángulo en la figura 2.2 obtenemos

x y
cos A = , cos B = ⇒ c = x + y = b cos A + a cos B.
b a
Con lo cual tenemos (2.5).
73
Ahora, como A + B + C = π, tenemos que
cos C = cos(π − (A + B))

= − cos(A + B)
= −(cos A cos B − sen A sen B)
= sen A sen B − cos A cos B
h h y
= · − cos A.
b a a
Entonces
h h y h2
cos C = · − cos A ⇔ a cos C = − y cos A.
b a a b
Además nótese que por el Teorema de Pitagoras b2 = x2 + h2 , con lo cual
h2 h2
− (c − x) cos A = − c cos A + x cos A
b b
h2 x
= + x − c cos A
b b
h2 + x2
= − c cos A
b
b2
= − c cos A
b
= b − c cos A.
Por lo tanto, a cos C = b − c cos A, o bien, a cos C + c cos A = b. Luego (2.4) se tiene. Ahora,
cos A = x/b y sen B = y/a, entonces
c = x + y = b cos A + a sen B.
Con lo cual tenemos (2.5). De manera similar a como se demostró (2.4) tenemos que
hh x h2
cos C = sen A sen B − cos A cos B = − cos B ⇔ b cos C = − (c − y) cos B
ab b a
h2
⇔ b cos C + c cos B = + y cos B,
a
y por el Teorema de pitagoras a2 = h2 + y 2 , por consiguiente,
h2 h2 y h2 + y 2
+ y cos B = +y = = a.
a a a a
Por lo tanto,
b cos C + c cos B = a.
74
Como se querı́a demostrar. Demostremos ahora el teorema del coseno. Sean x = cos A,
y = cos B y z = cos C. Entonces el sistema conformado por las ecuaciones (2.4), (2.5) y (2.6)
expresado en forma matricial toma la forma
c 0 a x b
    
 b a 0 y  =  c 
0 c b z a
Sea
 
c 0 a
A =  b a 0 ,
0 c b
entonces det A = 2abc > 0, por lo tanto la matriz A es invertible y por la Regla de Krammer,
D1 D2 D3
x= ,y = ,z = ,
D D D
donde Dj = det Aj , j = 1, 2, 3, D = det A y Aj es la matriz obtenida de A al cambiar su
columna j por el vector columna
b
 
b = c
a
Cuando realizamos los determinantes de las matrices Aj por la primera fila obtenemos

b 0 a
det A1 = c a 0 = bab − a(c2 − a2 ) = a(b2 + c2 − a2 ).

a c b

c b a
det A2 = b c 0 = c(cb) − bb2 + a(ab) = b(c2 − b2 + a2 ).

o a b

c 0 b
det A3 = b a c = c(a2 − c2 ) = c(a2 − c2 + b2 ).

o c a
Entonces
D1 a(b2 + c2 − a2 )
cos A = x = =
D 2abc
75
Con lo cual
2bc cos A = b2 + c2 − a2 ⇔ a2 = b2 + c2 − 2bc cos A
De donde obtenemos (2.7). De manera similar
D2 b(c2 − b2 + a2 )
cos B = y = =
D 2abc
D3 c(b + c2 − a2 )
2
cos C = z = =
D 2abc
De donde se siguen (2.8) y (2.9).
2.5. Problemas
2.6. Taller 1 corte 1 parte 1

Problema 2.6.1. Sea
 
0 2 3 −4 1
0 0 2 3 4
 
A=
2 2 −5 2 4

2 0 −6 9 7
Llevar la matriz A a la (FER). Cuando la matriz ya este en esta forma ubicar la fila que
contiene el 1 que está más hacia la derecha y utilizarlo como pivote para generar ceros en
la columna que lo contiene. Posteriormente, con la fila anterior a esta, realizar el mismo
proceso. Llevar acabo estos pasos las veces que sea necesario hasta obtener la (FERR) de la
matriz A.
Problema 2.6.2. Un jugador tiene un total de 200 fichas para apostar en un casino, las
fichas son de tres colores: amarillo azul y rojo. Ganó $51 con cada ficha de color amarillo,
perdió $15 con cada ficha de color azul y ganó $4 con cada ficha de color rojo. El apostador
término con un total de $152. Si se sabe que la cantidad de fichas rojas es mayor que el
número de fichas amarillas, pero menor que el número de fichas azules, hallar el número
de fichas de cada color que tenı́a el jugador. Sugerencia: Tome como referencia el Ejem-
plo1.10. Para hallar una solución particular de la ecuación Diofántica se pueden consultar
los Ejemplos 1.12 y 1.14 y el Problema 1.5.10.
Problema 2.6.3. Una inversionista afirma a su corredor de bolsa que todas su acciones
son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y que hace 2 dı́as su valor bajó
$350 pero ayer aumentó $600. El corredor recuerda que hace 2 dı́as el precio de las acciones
76
de Delta airlines bajó $1 por acción y el de las de Hilton Hotels $1,50, pero el precio de
las acciones de McDonald’s subió $0,50. También recuerda que ayer el precio de la acciones
Delta subió $1,50 por acción, el de las de Hilton Hotels bajó otros $0,50 por acción y el de
las de McDonald’s subieron $1. Demuestre que el corredor no tiene suficiente información
para calcular el número de acciones que tiene el inversionista en cada compañı́a, pero que si
ella dice que tiene más de 305 acciones de Delta, y más de 79 acciones de Hilton Hotels el
corredor puede calcular exactamente cuantas acciones tiene en cada compañı́a. Sugerencia:
Tome como referencia el Ejemplo 1.10.
Problema 2.6.4. Sea △ el triángulo en el plano con vértices en (x1 , y1 ), (x2 , y2 ) y (x3 , y3 ).
Demuestre que el área del triángulo está dada por

1 x1 y1
1
a(△) = ± 1 x2 y2
2
1 x3 y3
Sugerencia: Con lo demostrado en la sección 2.2 se puede hallar el área de un triángulo con
uno de sus vértices en el origen. Utilice la geometrı́a de la figura 2.3 para hallar el área del
triángulo △P1 P2 P3 en términos de las coordenadas de sus vértices.
y y
P2
P(b, d) P3
Q(a, c)
β
α b b
β
α P1 R1 T1
O
b
R
b
T
x O
x
(a) Triángulo con uno de sus vértices en (b) Triángulo con vértices arbitrarios
el origen
Figura 2.3: El triángulo △OP Q se traslada de tal forma que sus correspondientes vértices
ahora son P1 , P2 y P3 cuyas coordenadas respectivamente son (x1 , y1 ), (x2 , y2 ) y (x3 , y3). El
par de triángulos rectángulos: △OP R, △P1 P2 R1 y △OQT , △P1P3 T1 comparten la misma
hipotenusa, de tal forma que se puede expresar los lados del triángulo △OP Q como función
de las coordenadas de los puntos P1 , P2 y P3 .
Problema 2.6.5. Tres rectas que no son paralelas por pares, determinan un triángulo en el
77
plano. Suponga que las tres rectas están dadas por
a11 x + a12 y + a13 = 0

a21 x + a22 y + a23 = 0
a31 x + a32 y + a33 = 0
Demuestre que área determinada por las rectas es

A11 A12 A13
±1
A21 A22 A23

2A13 A23 A13

A31 A32 A33
Sugerencia: Utilice el Problema 2.6.4.

1
Problema 2.7.1. Consideremos la sucesión (An ) donde An = [aij ]n×n con aij = i+j−1 .
llamaremos a cada término de esta sucesión matriz armonica. A partir de la sucesión
(An ) construimos la sucesión en R dada por (Dn ) con Dn = det An . Calcular Dn , y la
inversa de la matriz An .
Problema 2.7.2. Sea (An ) una sucesión de matrices definida como sigue An = [aij ]n×n ,
donde aij = ai−1
j y 1 ≤ i, j ≤ n. Llamaremos a cada elemento de esta sucesión matriz de
Vardermonde (ver el Ejemplo 2.1), y cada elemento de la sucesión en R dada por (Dn )
con Dn := det An , determinante de Vardermonde de tamaño n × n. Defina las matrices
de Vandermonde para n = 2 y n = 4 y calcule sus respectivos determinantes. Conjeture
una fórmula para calcular Dn y demuestrela utilizando inducción matemática, exprese dicha
fórmula usando el sı́mbolo de productoria.
Problema 2.7.3. Si A ∈ Mn×n (R), A = [aij ]n×n , la matriz B := [bij ]n×n donde bij = aji es
llamada matriz transpuesta de A, escribimos B = At .
Una matriz A ∈ Mn×n (R) tal que At = −A es llamada matriz antisimétrica.
Una matriz invertible A ∈ Mn×n (R) tal que At = A−1 es llamada matriz ortogonal.
Demuestre que
(a) det A = det At .
(b) det(αA) = αn det A para toda matriz A ∈ Mn×n (R), todo escalar α y n = 1, 2, . . . ,
(c) det At = (−1)n det A para todo n = 1, 2 . . . , si A es antisimétrica.
78
(d) Si A ∈ Mn×n (R) es antisimétrica y n es impar, entonces det A = 0
(e) det A = ±1 si A es ortogonal.
Problema 2.7.4. Demuestre que para cualquier matriz cuadrada A se tiene que
(a) A + At es simétrica
(b) A − At es antisimétrica
Problema 2.7.5. Demuestre que toda matriz cuadrada A se puede escribir de manera única
en la forma A = S + K donde S es simétrica y K antisimétrica.
Problema 2.7.6 (***). Sea A una matriz estrictamente triangular superior. Demuestre que
I − A es invertible y exprese su inversa en función de A.
Problema 2.7.7 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m y la
parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta completa
cada 20s, determine el vector posición de una persona que va sentada en la rueda. Suponga
que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta moviendo
la persona?
79
Capı́tulo 3
Vectores en Rn
Definición 3.0.1. Definimos el espacio Euclideo de n dimensiones como el producto

cartesiano del conjunto R de números reales con sigo mismo n veces, esto es,
Rn = R × · · · × R
= {(x1 , x2 , . . . , xn ) : xi ∈ R, 1 ≤ i ≤ n} .
Estudiaremos especialmente el plano xy, esto es
R2 = {(x, y) : x, y ∈ R} ,
y el espacio
R3 = {(x, y, z) : x, y, z ∈ R} ,
3.1. Vectores en el plano enfoque analı́tico

Definición 3.1.1. Definimos un vector de R2 como una pareja ordenada de números reales,
esto es,
A = (Ax , Ay ).
Al escalar Ax se le llama componente en x del vector A, y a Ay componente en y. La

dirección del vector se define como el ángulo θ que forma el vector con el eje x medido en
el sentido contrario de las manecillas del reloj. (Ver Figura 3.1). La magnitud del vector se
denota por kAk y está dada por
q
kAk = A2x + A2y .
80
y
A
kAk
Ay
θ
x
O Ax
Figura 3.1: Dirección y magnitud de un vector
Definición 3.1.2 (Igualdad de vectores). Dos vectores A = (Ax , Ay ) y B = (Bx , By ) son

iguales si y sólo si son iguales componente a componente, esto es,
A = B ⇔ Ax = Bx y Ay = By .
Definición 3.1.3 (Adición de vectores). Sean A = (Ax , Ay ) y B = (Bx , By ) dos vectores de
R2 . La suma vectorial entre los vectores A y B se define como
A + B = (Ax + Bx , Ay + By ).
Definición 3.1.4 (Multiplicación por escalar). Definimos la multiplicación por escalar entre
el vector A = (Ax , Ay ) y el escalar k como
kA = k(Ax , Ay ) = (kAx , kAy ).
Utilizando la suma y multiplicación por escalar de vectores tenemos que para todo vector
A = (Ax , Ay ), se cumple que
A = (Ax , Ay ) = Ax (1, 0) + Ay (0, 1).
Los vectores i := (1, 0) y j := (0, 1), son llamados vectores coordenados unitarios.
Usando estos vectores podemos expresar el vector A como una suma de sus componentes
Ax = kAk cos θ, Ay = kAk sen θ,
tenemos que
A = kAk cos θi + kAk sen θj.
La expresión anterior se conoce como forma polar del vector A.
A continuación enunciamos las propiedades la suma y multiplicación por escalar de vec-

tores
81
Teorema 3.1.1 (Propiedades de los vectores). Sean A, B y C tres vectores de R2 y α, β ∈ R.
Entonces
(a) A + B = B + A.
(b) A + (B + C) = (A + B) + C.
(c) A + 0 = A, A + (−A) = 0. Aquı́, 0 = (0, 0) es el vector cero, elemento neutro de R2 .
(d) α(A + B) = αA + αB.
(e) (α + β)A = αA + βA.
Las propiedades de la norma o magnitud de un vector se dan en el siguiente resultado
Teorema 3.1.2 (Propiedades de la norma). Sean A y B vectores de R2 y k un escalar.

Entonces
(a) kAk ≥ 0 (Positividad)

(b) kAk = 0 ⇔ A = 0
(c) kkAk = |k|kAk (Propiedad homogénea)
(d) kA + Bk ≤ kAk + kBk (Desigualdad triangular)
3.2. Vectores en el plano enfoque geométrico

3.2.1. Vector resultante
A la adicción vectorial de los vectores
A = Ax i + Ay j, B = Bx i + By j,
se le conoce como vector resultante, esto es,
R = (Rx , Ry ) = (Ax + Bx )i + (Ay + By )j.
Podemos hallar la dirección del vector resultante en términos de las componentes de los
vectores A y B con la fórmula

Ry Ay + By
arctan = arctan .
Rx Ax + Bx
Para graficar el vector resultante trasladamos el vector B, respetando magnitud y direc-
ción de tal forma que su punto inicial coincida con el punto final de A, luego hacemos lo
mismo con el vector A (figura 3.2) generando de esta forma un paralelogramo, cuya diagonal
82
representa el vector resultante R. Esta interpretación de la suma vectorial es conocida como
regla del paralelogramo. Si tenemos las componentes de los vectores A y B podemos
hallar la magnitud del vector resultante con la fórmula
q
kRk = (Ax + Bx )2 + (Ay + By )2 .
4
y
B
2
By R
Ry
1
Ay A
0
x
O
Ax Bx
-1
Rx
-2
-2 -1 0 1 2 3 4 5
Figura 3.2: Construcción geométrica para la suma de dos vectores
Ahora si tenemos las magnitudes y direcciones de los vectores A y B, expresando los vec-
tores en la forma polar podemos encontrar una fórmula para la magnitud de R dependiendo
de dichas magnitudes y direcciones. En efecto, si α y β son direcciones de los vectores A y
B respectivamente, tenemos que
A = kAk cos αi + kAk sen αj, B = kBk cos βi + kBk sen βj.
Con lo cual,
kRk2 = (kAk cos α + kBk cos β)2 + (kAk sen α + kBk sen β)2
= kAk2 cos2 α + 2kAkkBk cos α cos β + kBk2 cos2 β
+ kAk2 sen2 α + 2kAkkBk sen α sen β + kBk2 sen2 β
= kAk2 + kBk2 + 2kAkkBk(cos α cos β + sen α sen β)
= kAk2 + kBk2 + 2kAkkBk cos(α − β)
= kAk2 + kBk2 + 2kAkkBk cos θ.
83
Donde θ = α − β es el ángulo entre A y B.
En el problema 4.14.21 se pide encontrar esta fórmula usando el teorema del coseno.
3.3. Diferencia entre vectores y vectores geométricos

Sean A y B vectores de R2 cuyos puntos iniciales coinciden en el origen O ver (figura
3.3).
−→
A AB
B
x
O
Figura 3.3: El vector que va del punto A a el punto B es igual a B − A
El vector con punto inicial en A y punto final en B es llamado vector diferencia. Vemos
−→
que el vector B resulta de la suma entre los vectores A y AB, esto es,
−→
A+ AB= B.
Entonces por el Teorema 3.1.1 tenemos que

−→ −→
A+ AB= B ⇔ −A + (A+ AB) = −A + B
−→
⇔ (−A + A)+ AB= B − A
−→
⇔ 0+ AB= B − A
−→
⇔AB= B − A.
Una interpretación similar nos permite concluir que

−→
BA= A − B.
−→
El vector AB= B−A, también es llamado vector geométrico. Los vectores geométricos son
especialmente útiles para representar magnitudes fı́sicas tales como fuerzas, desplazamientos,
84
velocidades, y aceleraciones, las cuales poseen magnitud y dirección. Lo que mide la flecha
indica la magnitud y la punta de la flecha indica la dirección.
Supongamos que introducimos un sistema de coordenadas con origen O. En la figura 3.4

−→ −→
se muestran dos vectores geométricos AB y CD que tienen la misma dirección y magnitud.
y
D
d2 − c2
C θ
d1 − c1
B
b 2 − a2
A θ
b 1 − a1
x
O
−→ −→
Figura 3.4: AB y CD representan vectores geométricos equivalentes.
Tenemos que
b1 − a1 d 1 − c1
cos θ = = ,
kB − Ak kD − Ck
Dado que kB − Ak = kD − Ck, nos da que b1 − a1 = d1 − c1 . De manera análoga vemos que

b2 − a2 = d2 − c2 . Entonces, de acuerdo a la definición 3.1.2 encontramos que
−→ −→
AB=CD ⇔ B − A = D − C.
Llamamos a tales vectores geométricos equivalentes. En fı́sica se utiliza la noción de vectores

equivalentes para definir la igualdad entre vectores.
Cuando el punto inicial de un vector geométrico coincide con el origen y el punto final
A tiene coordenadas (a, b) tenemos que
−→
OA= A − 0 = (a, b) − (0,0) = (a, b) = A.
−→
Por es razón escribimos A en lugar de OA. Este hecho tiene importantes repercusiones, ya
que nos dice que las componentes de cualquier vector A son las mismas de cualquier vector
geométrico equivalente a el.
85
y
D
d2 − c2
C θ
d1 − c1
A = (a, b)
θ
x
O
Figura 3.5: Un vector geométrico cuyo punto inicial coincide con el origen tiene las mismas
componentes que cualquier vector que tenga la misma magnitud y dirección.
Por ejemplo, en la figura 3.5 vemos que a = d1 − c1 y b = d2 − c2 , de modo que

−→
A =CD (3.1)
Problema 3.3.1 (Velocidad verdadera de un avión). Un avión vuela por un viento que fluye
con una rapidez de 55mi/h en la dirección N 30◦ E. El avión tiene una rapidez de 765mi/h
respecto al aire, y el piloto dirige son avión en la dirección N 45◦ E.
(a) Halle la velocidad del viento, en términos de los vectores coordenados unitarios.
(b) Halle la velocidad del avión con respecto al aire, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del avión con respecto a la tierra, en términos de los vectores coor-
denados unitarios.
(d) Determine la rapidez y dirección verdaderas del avión.
Solución. El vector A denota la velocidad del viento y el vector B, define la velocidad del
avión respecto al viento. Esta velocidad queda completamente determinada, conociendo sus
componentes, o bien su magnitud y dirección. En este contexto, la magnitud de la velocidad
define la rapidez de la partı́cula. La frase: velocidad del avión respecto al viento,
se refiere a la velocidad que mide el piloto, esta es la velocidad relativa al piloto, dicha
velocidad es distinta a la que mide una persona en tierra, lo cual tiene que contemplar el
efecto del viento sobre el avión. La velocidad del avión respecto a la tierra, también se conoce
como velocidad verdadera del avión.
86
y y B
N
A
O E
S
A
O
x O
x
(a) Viento cruzado en dirección N 30◦ E (b) Los vectores A y B coincidiendo en P
Figura 3.6: Movimiento relativo de un avión
En la figura 3.6(a) se muestran varias representaciones del vector A, con el fin de facilitar
el calculo de las componentes de este vector consideramos el vector geométrico cuyo punto
inicial coincide con el origen el cual es llamado vector de posición. Diremos que un vector
está en posición normal cuando su punto inicial coincide con el origen. En la figura 3.7(a)
se muestra la magnitud y dirección del vector A.
y y
N
kBk = 765
O E
kAk = 55
60◦ 45◦
O
x O
x
(a) Vector A en posición normal (b) Vector B en posición normal
Figura 3.7: Dado que fluye un viento en dirección N 30◦ E, la dirección del vector A es 60◦ .
Teniendo la magnitud y dirección del vector A, podemos hallar sus componentes:

Ax = kAk cos α = 55 cos 60◦ = 55/2
√
Ay = kAk sen α = 55 sen 60◦ = 55 3/2.
Por lo tanto, la velocidad del viento en términos de los vectores coordenados unitarios es
√ √
A = (55/2, 55 3/2) = (55/2)i + (55 3/2)j.
87
Como la rapidez del avión respecto al aire es 765mi/h, tenemos que kBk = 765, además
el piloto dirige el avión en la dirección N 45◦ E (es común, referirse a este ángulo como
enfilamiento o curso relativo del avión), por lo que la dirección del vector B es β =
90◦ − 45◦ = 45◦ (ver figura 3.7(b)). De modo que las componentes de la velocidad del avión
respecto al aire son:
√
Bx = kBk cos β = 765 cos 45◦ = 765 2/2
√
By = kBk sen β = 765 cos 45◦ = 765 2/2.
ası́, el vector en términos de los vectores coordenados unitarios viene dado por
√ √ √ √
B = (765 2/2, 765 2/2) = (765 2/2)i + (765 2/2)j.
Por efecto del viento, al avión experimenta un leve corrimiento hacia el norte (ver figura
3.8(b)) este movimiento es imperceptible para el piloto, pero puede ser detectado por una
persona en tierra, la cual registrarı́a la información que se muestra en la figura 3.8(a) sobre
el avión.
y y
R
kRk = 818, 25
46◦
O
x O
x
(a) Magnitud y dirección verdaderas de (b) Suma vectorial entre A y B

la velocidad del avión
Figura 3.8: La representación gráfica de la magnitud y dirección verdaderas del avión, se

lleva acabo mediante la ley del paralelogramo: para graficar el vector resultante de la suma
vectorial de los vectores A y B, trasladamos el vector B respetando magnitud y dirección,
de tal forma que el punto inicial coincida con el punto final de A. La resultante viene dada
entonces por el vector geométrico que va del punto en que coinciden A y B a el punto final
del vector B trasladado.
Para encontrar estas cantidades: magnitud y dirección verdaderas del avión, se deben
88
encontrar las componentes del vector resultante.
√
Rx = Ax + Bx = 55/2 + 765 2/2 = 568, 44
√ √
Ry = Ay + By = (55/2) 3 + 765 2/2 = 588, 57.
Con lo cual, la velocidad verdadera del avión en término de los vectores coordenados unitarios
es
√ √ √
R = 55/2 + 765 2/2 i + (55/2) 3 + 765 2/2 j.
La rapidez del avión medida desde la tierra es entonces

q p
kRk = Rx2 + Ry2 = 568, 442 + 588, 572 = 818, 25mi/h.
Si denotamos por φ, a la dirección verdadera del avión, tenemos que

Ry 588, 57
tan φ = = ,
Rx 568, 44
de donde φ = arctan (588, 57/568, 44) = 45,996◦ ≈ 46◦ . La dirección, o curso verdadero del
avión, medida desde el norte es entonces N 44◦ E.
La magnitud y dirección verdaderas de la velocidad del avión, pueden ser obtenidas
directamente de los datos del problema. Con la fórmula:
kRk2 = kAk2 + kBk2 + 2kAkkBk cos θ,
donde θ = α − β es el ángulo entre A y B, obtenemos la rapidez verdadera del avión
kRk2 = 552 + 7652 + 2 · 55 · 765 cos(60 − 45) = 6,6953 · 105 ,

p
con lo cual, kRk = 6,6953 · 105 = 818,25. La dirección de R por lo general se encuentra
por medio del Teorema del seno o el coseno. Con los puntos finales de los vectores
−→ −→ −→
A =OA, B =OB y R =OR
formamos el paralelogramo OARB (ver figura 3.9(a)). Como ∠AOB = 60◦ − 45◦ = 15◦ y
los ángulos opuestos de un paralelogramo son iguales y suman 360◦ tenemos que
2∠AOB + 2∠OBR = 360◦ ⇔ 30◦ + 2∠OBR = 360◦ ⇔ ∠OBR = 165◦ .
89
y y
R R
A A
O
x O
x
(a) Paralelogramo generado por A y B (b) Triángulo generado por los vectores
A, B y R
Figura 3.9: La dirección del vector resultante puede ser obtenida mediante la aplicación del
Teorema del seno, si se conocen las magnitudes y direcciones de los vectores A y B
Al trazar la diagonal principal del paralelogramo, generamos el triángulo △OAR, cuyos

lados vienen dados por las respectivas magnitudes de los vectores A, B y R (ver figura
3.9(b)). De este triángulo tenemos además el ángulo ∠OAR = ∠OBR = 165◦ . Entonces por
el Teorema del seno
sen 165◦ sen ∠AOR
=
kRk kBk
Con lo cual,
kBk 765
sen ∠AOR = sen 165◦ = 0,25882 = 0,24198.
kRk 818,25
Ası́, ∠AOR = arc sen(0,24198) = 14,003◦. Por lo tanto, la dirección del vector R, es φ =
60◦ − 14,003◦ = 45,997◦ ≈ 46◦ .
Paralelismo y ortogonalidad de vectores

Dos vectores A y B de R2 son paralelos si el primero se puede expresar como un múltiplo
escalar del segundo, es decir
Definición 3.3.1 (Vectores paralelos). Sean A y B dos vectores de R2 . El vector A es

paralelo a el vector B lo cual se denota por A k B si y solo si existe k ∈ R tal que A = kB.
90
Para obtener un criterio que nos permita saber cuando dos vectores son ortogonales,
utilizaremos el producto punto, o producto escalar, el cual fue introducido en la subsección
1.6.3. Primero que todo debemos notar que si A = (x, y) ∈ R2 , entonces
A · A = x2 + y 2 = kAk2 .
Demostramos que
Teorema 3.3.2. Si A ∈ R2 , entonces
kAk2 = A · A.
Ahora utilizaremos el Teorema del coseno para demostrar que

Teorema 3.3.3. Sean A y B son vectores de R2 , entonces
A · B = kAkkBk cos θ, (3.2)
donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.
Demostración. Aplicando el Teorema del coseno al triángulo que se muestra en la figura 3.3
−→
A AB
B
θ
x
O
obtenemos
kB − Ak2 = kAk2 + kBk2 − 2kAkkBk cos θ, (3.3)
donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Ahora, dado que el producto punto es conmutativo y distributivo
respecto a la suma de vectores, por el Teorema 3.3.2 tenemos que
kB − Ak2 = (B − A) · (B − A)
= B · B − 2B · A + A · A
= kBk2 − 2A · B + kAk2 .
91
Por lo tanto, tenemos que
kAk2 − 2A · B + kBk2 = kAk2 + kBk2 − 2kAkkBk cos θ
Sumando el término −(kAk2 + kBk2 ) en ambos lados de la ecuación anterior y luego multi-
plicando por 1/2 obtenemos (3.2).
Nótese que (3.3) permite calcular la magnitud del vector diferencia.
Además, de (3.2) podemos concluir que
A · B = 0 ⇔ si solo si θ = π/2.
Es decir, dos vectores no nulos A y B son ortogonales si solo si A · B = 0. Tenemos entonces

el siguiente resultado
Teorema 3.3.4 (Vectores ortogonales). Dos vectores no nulos A y B son ortogonales si

solo si A · B = 0
Con lo fórmula (3.2) podemos calcular el ángulo entre vectores.
Teorema 3.3.5 (Ángulo entre vectores). Si θ denota el ángulo más pequeño que hay entre
dos vectores no nulos A y B medido en el sentido contrario de las manecillas del reloj,
entonces
A·B A B
cos θ = = · . (3.4)
kAkkBk kAk kBk
Ejemplo 3.1. Utilice el producto punto para demostrar las siguientes identidades
(a) cos(α − β) = cos α cos β + sen α sen β.
(b) cos(α + β) = cos α cos β − sen α sen β.
(c) sen(α − β) = sen α cos β − sen β cos α.
(d) sen(α + β) = sen α cos β + sen β cos α.
Solución. Sean A y B vectores unitarios cuyas direcciones están dadas por los ángulos α y
β respectivamente. Entonces para el vector A tenemos que
Ax = kAk cos α = cos α

Ay = kAk sen α = sen α,
de modo que
A = cos αi + sen αj = (cos α, sen α).
92
De la misma forma, vemos que
B = cos βi + sen βj = (cos β, sen β).
A
β
α
x
Figura 3.10: Todo vector unitario u cuya dirección está dada por un ángulo θ se puede
expresar en la forma u = cos θi + sen θj
Como se ve en la figura 3.10, el ángulo entre los vectores unitarios A y B es θ = β − α.

Por lo tanto, por la fórmula (3.2) encontramos que
(cos α, sen α) · (cos β, sen β) = 1 · 1 cos(β − α).
O de manera equivalente,
cos(β − α) = cos(α − β) = cos α cos β + sen α sen β.
Con cual, tenemos (a).
Ahora, dado que la función coseno es par, y la función seno es impar, aplicando en inciso
(a) tenemos que
cos(α + β) = cos(α − (−β)) = cos α cos(−β) + sen α sen(−β).
= cos α cos β − sen α sen β.
Para obtener (c), rotamos el vector A de la figura 3.10 un ángulo de 90 grados en dirección
contraria de las manecillas del reloj, sin cambiar su magnitud, de tal forma que generamos
un vector C que también es unitario pero cuya dirección es α + π/2 (ver figura 3.11). Por lo
tanto sus componentes son
Cx = kCk cos(α + π/2) = − sen α
Cy = kCk sen(α + π/2) = cos α,
93
Nótese que en las fórmulas anteriores para hallar la componente en x del vector C usamos
(b) con β = π/2. Y para hallar la componente en y, usamos la identidad fundamental:
p √
sen(α + π/2) = 1 − cos2 (α + π/2) = 1 − sen2 α = cos α.
B A
π/2
α
x
Figura 3.11: Utilización del propucto punto para hallar una fórmula para el seno de la suma
de la de ángulos
Ahora bien, dado que el ángulo entre los vectores B y C es θ = β−(π/2+α) = β−α−π/2,
por (3.2) tenemos que
(cos β, sen β) · (− sen α, cos α) = 1 · 1 cos(β − α − π/2).
Que equivale a
− sen α cos β + sen β cos α = sen(β − α)
Al multiplicar por (−1) la identidad anterior obtenemos (c).

La identidad (d) se deduce de la identidad (c) de manera análoga como se demostró la
identidad (b) a partir de la (a).
3.4. Desigualdad triangular

Consideremos dos vectores A y B que coinciden en un punto O como se muestra en la
figura 3.12.
94
B R
O A
−→ −→ −→
Figura 3.12: Las magnitudes de los vectores geométricos OA= A, OB= B y OR= R son los
lados del triángulo △OAR. Para que estas tres normas conformen los lados de un triángulo
se debe cumplir la relación kAk + kBk ≥ kA + Bk, conocida como desigualdad triangular
Unos de los principales postulados de la geometrı́a Euclidiana afirma que la menor dis-
tancia entre dos puntos es la recta, es decir, que toma menos tiempo ir del punto O al R,
que de el punto O al punto A y luego al R. En términos de vectores, esto se expresa con la
relación
kAk + kBk ≥ kA + Bk (3.5)
que se conoce como desigualdad triangular. La desigualdad triangular es una consecuencia
de la desigualdad de Cauchy-Schwarz (desigualdad de C-S). La cual establece que
|X · Y | ≤ kXkkY k,
para vectores X = (a1 , a2 , . . . , an ), Y = (b1 , b2 , . . . , bn ) en Rn . Este hecho se demuestra de
forma general en la sección 4.17. Para el caso de R2 , este resultado puede ser obtenido como
un consecuencia del Teorema 3.3.3, ya que, para todo θ tenemos que | cos θ| ≤ 1, con lo cual,
|A · B| = |kAkkBk cos θ| = kAkkBk| cos θ| ≤ kAkkBk.
Es decir,
|A · B| ≤ kAkkBk. (3.6)
Ahora podemos establecer que
Teorema 3.4.1. Si A y B son vectores de R2 . Entonces
kAk + kBk ≥ kA + Bk
Demostración. Como kAk2 = A · A, tenemos que
kA + Bk2 = (A + B) · (A + B)
= A · A + 2A · B + B · B (Ley conmutativa y distridutiva)
2 2
= kAk + 2A · B + kBk
≤ kAk2 + 2kAk · kBk + kBk2 (Desigualdad de C-S)
= (kAk + kBk)2
95
√ √
Se sigue la desigualdad triangular de la propiedad: 0 ≤ x ≤ y ⇒ x≤ y para números
reales x, y.
Teorema 3.4.2. Si A y B son vectores de R2 . Entonces
kAk − kBk ≤ kA − Bk
Demostración. Por la desigualdad triangular
kAk = kA − B + Bk ≤ kA − Bk + kBk
Esto es, kAk − kBk ≤ kA − Bk.
3.5. Movimiento relativo

A continuación ilustraremos con un ejemplo el uso de los vectores para describir como
están relacionadas entre sı́ las mediciones realizadas por observadores que las calculan desde
distintos marcos de referencia. Un ejemplo clásico de este tipo de movimiento, llamado
movimiento relativo es el movimiento de un avión, que puede tener una velocidad v
en relación con el aire, en este caso una persona que está en la tierra medirá una velocidad
distinta a la del piloto, dependiendo de la dirección y magnitud de v.
Problema 3.5.1. Un piloto tiene que volar hacia el este de A a B y después regresar hacia
el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto a
la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.
(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c
(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2
(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2
(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?
96
Realizar las gráficas correspondientes para ilustrar la situación.
Solución. Resolveremos solo el caso 1 del inciso (b), y el caso 1 del inciso (c). El resto se
deja como ejercicio (ver el problema 4.15.7).
Denotemos por C a el vector que representa la velocidad del avión respecto a el aire, esto
es, la velocidad que mide el piloto. Y denotemos por D el vector que representa la velocidad
del aire con respecto a la tierra, es decir la velocidad del viento que mide una persona que
está estacionaria en el tierra.
N N
Ab b
D C Bb
Ab
C b
D Bb
E E
S S
(a) Para el viaje de ida, un observador en tierra (b) Para el viaje de venida, dado que el viento es
mide la misma dirección de la velocidad del viento contrario a la dirección del movimiento del avión,
que el piloto, pero como existe un viento hacia el un observador en tierra calcula que la rapidez del
este, el observador en tierra calcula que la rapidez avión es c − v.
del avión es c + v.
Figura 3.13: Movimiento de un avión cuando prevalece un viento hacia el este
Suponemos como caso 1, que la dirección del vector D es hacia el este en el viaje de ida
y de venida. En el viaje de ida. La dirección que mide el piloto para el vector C es α = 0,
además, la magnitud es kCk = c, por lo tanto,
Cx = c cos 0 = c, Cy = c sen 0 = 0,
con lo cual,
C = (c, 0).
De forma análoga, encontramos que
D = (v, 0).
En consecuencia, la velocidad en el viaje de ida (ver figura 3.13(a)) que mide un observador
en tierra es
RAB = C + D = (c + v, 0).
97
Vemos de esta forma, que desde la perspectiva de un observador en tierra la rapidez del
avión en el viaje de ida es kRAB k = c + v. Y dado que cuando dicha rapidez es constante,
según la ecuación 4.16 con x0 = 0 es igual a distancia sobre tiempo, tenemos que el tiempo
tAB que tarda el avión en ir desde A hasta B es
l
tAB = .
c+v
Ahora, para el viaje de vuelta el vector D mantiene su dirección y magnitud (ver figura
3.13(b)). Sin embargo, el vector C a pesar de mantener su magnitud invierte su dirección,
esto es, la velocidad que mide el piloto para el viaje de vuelta es,
C = (c cos π, c sen π) = (−c, 0).
Por lo que para un observador en tierra el velocidad en el viaje de vuelta es
RBA = −C + D = (v − c, 0).
Además, Por el inciso (d) c > v, ası́, la rapidez del avión en el viaje de vuelta para un
observador en tierra es
kRBA k = |v − c| = c − v.
Con lo cual,
l
tBA = .
c−v
Concluimos de esta forma, que el tiempo necesario para completar un viaje redondo es
tE = tAB + tBA
l l
= +
c+v c−v
(c − v)l + (c + v)l
=
c2 − v 2
2cl
= 2
c − v2
2l/c
=
1 − v 2 /c2
t0
= .
1 − v 2 /c2
Ahora, supongamos que prevalece un viento hacia el norte. En este caso, si el piloto dirige
el avión en el segmento que va desde el punto A hasta el punto B, un observador en tierra
98
verı́a que el avión sigue la dirección noreste, ya que prevalece un viento hacia el norte. Por
lo tanto, el piloto debe enfilar el avión en la dirección sureste, con cierta inclinación medida
a partir del sur, que depende de la magnitud del vector D, para que un observador en tierra
vea que el avión sigue exactamente la dirección del segmento AB
N N
√ √
Ab b
c2 − v 2 B
b
Ab
c2 − v 2
b
Bb
c v v c
E E
S S
(a) El piloto debe enfilar el avión en dirección sur- (b) En el viaje de vuelta, el piloto debe enfilar el
este, para que un observador en tierra vea que el avión en dirección suroeste, para que un observador
avión sigue el segmento AB en tierra vea que el avión sigue el segmento BA
Figura 3.14: Movimiento de un avión cuando prevalece un viento hacia el norte
En la figura 3.14(a) se muestra la velocidad del avión en azul, desde el punto de vista del
piloto. La velocidad del aire se muestra en verde. La velocidad del avión calculada por un
observador en tierra es entonces
RAB = C + D.
Observese que los tres vectores el ecuación anterior se relacionan según el triángulo que
muestra en la figura 3.14(a), y dado que el vector D es ortogonal a el vector RAB , dicho
triángulo es rectángulo. Por lo tanto, por el Teorema de Pitagoras
√
kRAB k = c2 − v 2 .
Ahora podemos calcular el tiempo que tarda el avión en ir desde el punto A hasta el punto
B,
l
tAB = √ .
c2 − v 2
Para el viaje de vuelta, el piloto debe enfilar el avión en la dirección sur oeste (ver figura
3.14(b)), y entonces un observador en tierra verı́a que el avión sigue el segmento de recta
BA calculando que el tiempo en recorrerlo es
l
tBA = √ .
c2 − v 2
99
Con lo cual, finalmente obtenemos que
2l t0
tN = tAB + tBA = √ =p .
c2 − v 2 1 − v 2 /c2
3.5.1. Vector proyección

Sean A y B vectores no nulos de R2 . Queremos hallar un escalar t que nos permita
encontrar el vector tB, el cual tiene la misma dirección de B y es llamado proyección de
A sobre B.
y y
A A
θ
θ B
x x
O B O
tB tB
(a) t > 0, A · B > 0 (b) t < 0, A · B < 0
Figura 3.15: Vector proyección
Como se muestra en la figura 3.15 el escalar t puede ser positivo o negativo dependiendo
del ángulo θ que hay entre A y B. Supongamos primero que 0 ≤ θ ≤ π/2 de tal forma que
t > 0. En la figura 3.15(a) vemos que
ktBk
cos θ = .
kAk
Dado que t > 0, por el Teorema 3.1.2 inciso (c),
ktBk = |t|kBk = tkBk
Por lo tanto,
tkBk
cos θ = ,
kAk
100
de donde despejando t obtenemos
kAk cos θ
t= .
kBk
Por otro lado, por el Teorema 3.2
A · B = kAkkBk cos θ,
o bien,
A·B
kAk cos θ =
kBk
Por consiguiente,
A·B
t= .
kBk2
Tenemos entonces la siguiente definición
Definición 3.5.1 (Vector proyección). Sean A y B vectores no nulos de R2 . La proyección
de A sobre B se denota por ProyB A y define como el vector
A·B
ProyB A = B.
kBk2
Propiedades del vector proyección

Resumimos las propiedades del vector proyección en el siguiente resultado.
Teorema 3.5.2. Sean A, B y C vectores no nulos de R2 . Entonces
(a) ProyB A es paralelo a B.
(b) A − ProyB A es ortogonal a B.
(c) El vector proyección cumple las propiedades linealidad :
ProyB (αA) = α ProyB A

ProyC (A + B) = ProyC A + ProyC B.
(d) Proy−B A = ProyB A.
(e) La magnitud del vector proyección es llamada proyección escalar y está dada por
|A · B|
k ProyB Ak = .
kBk
101
Capı́tulo 4
Nociones de cálculo integral
4.1. Área bajo la curva

En esta sección se pretende encontrar una expresión para el área bajo la curva de la
función y = f (x) entre x = a y y = b. Consideremos primero en caso en que f (x) > 0 para
a ≤ x ≤ b, e intentemos aproximar el área bajo f por exceso por medio de rectángulos. Para
tal fin hagamos una partición regular(ver figura 4.1)
y = f (x)
x
a = x0 x1 ··· xi−1 xi ··· xn = b
Figura 4.1: Aproximación por exceso
102
del intervalo [a, b] en n subintervalos
[x0 , x1 ], [x1 , x2 ], . . . , [xn−1 , xn ],
cada rectángulo tiene por base

b−a
∆x = ,
n
por lo tanto, una aproximación del área A bajo la función f es
n
X
A ≈ ∆xf (x1 ) + ∆xf (x2 ) + · · · + ∆xf (xn ) = ∆xf (xi ).
i=1
Está claro que esta aproximación mejora cuando n → ∞. Por lo tanto tenemos
n
X
A = lı́m ∆xf (xi ). (4.1)
n→∞
i=1
Ahora observese que
x0 = a, x1 = a + ∆x, x2 = a + 2∆x, x3 = a + 3∆x, . . . ,
es decir, xi = a + i∆x, 0 ≤ i ≤ n.
El método mediante el cual se obtuvo la fórmula (4.1), es un caso particular de una

técnica desarrollada por los griegos hace más de 2000 años, conocida como método de
exhaución. Ilustramos esta técnica en el siguiente ejemplo.
Ejemplo 4.1. Sea An el área de un polı́gono de n lados iguales, inscrito un circulo de radio
r. Al dividir el polı́gono en n triángulos congruentes con un ángulo central 2π/n, demuestre
que
1 2π
(a) An = nr 2 sen
2 n
(b) lı́m An = πr 2
n→∞
Solución. Basaremos nuestra demostración en el siguiente resultado de cálculo diferencial

Teorema 4.1.1 (Continuidad secuencial). Una función f : D ⊆ R → R es continua en
x0 ∈ D si y sólo si
xn → x0 implica que f (xn ) → f (x0 ).
103
Al trazar la altura h de uno de los n triángulos que conforman el polı́gono de n lados de
longitud L, obtenemos un triángulo rectángulo de hipotenusa r y ángulo central
1 2π π
θ= · = ,
2 n n
ver la figura
L/2
r h
θ
L/2
Tenemos que cos θ = h/r y sen θ = . Por lo tanto, el área de uno de los triángulos
r
que conforman el polı́gono es
Lh 1 1 1 1 2π
A= = (r cos θ)(2r sen θ) = r 2 (2 sen θ cos θ) = r 2 sen 2θ = r 2 sen .
2 2 2 2 2 n
Con lo cual, el área An del polı́gono está dada por
1 2π
An = nr 2 sen
2 n
Ahora puesto que
sen x
→ 1 cuando x → 0,
x
la función
 sen x , si x 6= 0,

f (x) := x
1, si x = 0,
2π
es continua en x = 0. Además, xn = → 0 cuando n → ∞. Entonces por el Teorema 4.1.1
n
f (xn ) → f (0) = 1. Lo cual implica que
2π
n 2π sen
lı́m sen = lı́m n = 1.
n→∞ 2π n n→∞ 2π
n
Finalmente,
1 2 2π n 2π
lı́m An = lı́m nr sen = πr 2 lı́m sen = πr 2 · 1 = πr 2
n→∞ n→∞ 2 n n→∞ 2π n
104
4.2. Integral definida
En la sección 4.1 se aproximo el área bajo la gráfica de una función continua y = f (x)
desde x = a hasta x = b por exceso. Sin embargo, se puede demostrar que el valor de A en
(4.1) no cambia cuando tomamos los extremos izquierdos de cada subintervalo, esto es, la
aproximación se hace por defecto
n−1
X n
X
A = lı́m ∆xf (xi ) = lı́m ∆xf (xi−1 ). (4.2)
n→∞ n→∞
i=0 i=1
De hecho, en lugar de usar los extremos izquierdos o derechos, podrı́amos tomar la altura
del i-esimo rectángulo como el valor de f en cualquier número x∗i en el i-esimo subintervalo
[xi−1 , xi ]. A los números x∗1 , . . . , x∗n se les llama puntos de muestra. Podemos calcular el
valor del área usando estos puntos
n
X
A = lı́m ∆xf (x∗i ). (4.3)
n→∞
i=1
A el valor común del área A obtenido en (4.1), (4.2) y (4.3), se el denota por
Z b
f (x)dx,
a
que se lee, integral definida de f , desde a hasta b. En resumen
Definición 4.2.1 (Integral definida). Si f es una función continua en el intervalo [a, b],
el cual dividimos en n subintervalos de igual ancho ∆x = (b − a)/n. Denotamos con x0 =
a, x1 , . . . , xn = b los puntos extremos de estos subintervalos y elegimos los puntos de muestra
x∗1 , . . . , x∗n en cada uno de estos subintervalos, de modo que x∗i se encuentre en el i-esimo
subintervalo [xi−1 , xi ]. Entonces integral definida de f , desde a hasta b, es
Z b n
X
f (x)dx = lı́m ∆xf (x∗i ). (4.4)
a n→∞
i=1
La suma en (4.4) se conoce como suma de Riemann. Sabemos que si es f es no negativa

en [a, b], esta suma de Riemann es una aproximación del área bajo la función en [a, b]. Y la
Z b
integral definida f (x)dx da el valor exacto de esta área.
a
Z π/2
Ejemplo 4.2. Usar sumas de Riemann para calcular cos x dx.
0
105
Solución. Partamos de la identidad
2 sen B cos A = sen(A + B) − sen(A − B). (4.5)

x
Tomemos B = , A = ix. Entonces
2
x x x x x
2 sen cos ix = sen(ix + ) − sen(ix − ) = sen(2i + 1) − sen(2i − 1) .
2 2 2 2 2
x x
Definamos ai = sen(2i + 1) , entonces ai−1 = sen(2i − 1) . Por lo tanto, por las propiedades
2 2
homogénea y telescópica de las sumatorias tenemos que
n n
xX X x
2 sen cos ix = 2 sen cos ix
2 i=1 i=1
2
n
Xh x xi
= sen(2i + 1) − sen(2i − 1)
i=1
2 2
n
X
= (ai − ai−1 )
i=1
= an − a0
x x
= sen(2n + 1) − sen .
2 2
Ahora nos proponemos usar de nuevo la identidad (4.5), pero esta vez, de derecha a izquierda.
Para tal fin debemos encontrar A y B tales que
x x
A + B = (2n + 1) , A − B = .
2 2
Entonces,
x x
2A = A + B + A − B = (2n + 1) + = (n + 1)x,
2 2
x x x
de donde A = (n+1) . Con lo cual, B = A− = n . De esta forma obtenemos la identidad
2 2 2
x x x x
2 sen n cos(n + 1) = sen(2n + 1) − sen .
2 2 2 2
Lo que a su vez nos lleva a concluir que si, x 6= 2mπ, entonces
1 1
n sen nx cos (n + 1)x
2 2
X
cos ix = . (4.6)
1
i=1 sen x
2
106
Ahora por definición de integral de Riemann
Z π/2 n
X
cos xdx = lı́m ∆x cos xi ,
0 n→∞
i=1
π π π
donde ∆x = , xi = ∆xi = i. Entonces por la identidad (4.6), con x = , tenemos que
2n 2n 2n
n n
X X π π
∆x cos xi = cos i
i=1 i=1
2n 2n
n
π X π
= cos i
2n i=1 2n
hn π i
(n + 1)π
sen cos
π 2 2n 4n
= π
2n sen
4n
π π/2n π π
= sen · cos + .
4 sen π 4 4n
4n
π n→∞
Ahora como −→ 0, por el Teorema 4.1.1,
4n
π/4n 1 n→∞ 1
2 π = 2 sen(π/4n) −→ 2 · 1 = 2,
sen
4n π/4n
y
π
π n→∞ π π
cos + −→ cos + 0 = cos .
4 4n 4 4
En conclusión
Z π/2
π π/2n π π π π π
cos xdx = lı́m sen · π cos + = sen · 2 · cos = sen = 1.
0 n→∞ 4 sen 4 4n 4 4 2
4n
En la mayorı́a de problemas que involucran sumas de Riemann se toman como puntos de

muestra los extremos izquierdos, o bien los extremos derechos de los subintervalos [xi−1 , xi ],
1 ≤ i ≤ n. Sin embargo, en ocasiones dicha elección no es útil como mostraremos en el
siguiente ejemplo.
2
1
Z
Ejemplo 4.3. Utilizar sumas de Riemann para calcular la integral dx. Sugerencia:
√ 1 x2
Tome x∗i = xi−1 xi .
107
Solución. Intentemos calcular el área pedida por exceso. Tenemos que
Z b X n
f (x)dx = lı́m ∆xf (xi ),
a n→∞
i=1
b−a 1
donde ∆x = = , xi = a + i∆x = 1 + i/n. Entonces
n n
1 n2
f (xi ) = = .
(1 + i/n)2 (n + i)2
Por lo tanto tenemos que
Z 2 n n
X X n
f (x)dx = lı́m ∆xf (xi ) = lı́m . (4.7)
1 n→∞
i=1
n→∞
i=1
(n + i)2
El lı́mite en (4.7) se puede calcular usando el teorema fundamental del cálculo, pero cier-
tamente la integral que nos plantean también. Para resolver el problema usando sumas de
Riemann, debemos definir
√
x∗i = xi−1 xi ,
1 ≤ i ≤ n. Primero que todo notemos que como 0 < 1 ≤ xi−1 ≤ xi para todo 1 ≤ i ≤ n,
entonces
xi−1 xi ≤ x2i y x2i−1 ≤ xi−1 xi ⇔ x2i−1 ≤ xi−1 xi ≤ x2i .

√
Ahora como la función h(x) := x es creciente para x > 0. Tenemos que
√
h(x2i−1 ) ≤ h(xi−1 xi ) ≤ h(x2i ) ⇔ xi−1 ≤ xi−1 xi ≤ xi .
Comprobando de esta forma, que los x∗i definen efectivamente puntos de muestra. Podemos
ahora calcular la integral usando estos puntos de muestra
Z 2 n n
X
∗
X 1 1
f (x)dx = lı́m ∆xf (xi ) = lı́m · .
1 n→∞
i=1
n→∞
i=1
n xi−1 xi
Como xi = 1 + i/n. Tenemos que

1 1 1/n n
· = = .
n xi−1 xi (1 + i/n)(1 + (i − 1)/n) (n + i)(n + i − 1)
Por otro lado,

1 n + i − (n + i − 1) 1 1
n =n =n − .
(n + i)(n + i − 1) n + i)(n + i − 1) n+i−1 n+1
108
Entonces
n n
X 1 1 X 1 1
· = n −
i=1
n xi−1 xi i=1
n+i−1 n+1
n
X 1 1
=n −
i=1
n + i − 1 n+1
n
X
=n (ai−1 − ai ).
i=1
1
Donde ai := . Finalmente, por la propiedad telescópica de las sumas finitas
n+i
Z 2 Xn
f (x)dx = lı́m n (ai−1 − ai )
1 n→∞
i=1
= lı́m n(a0 − an )
n→∞
= lı́m n(1/n − 1/2n)

n→∞
= 1/2.
109
4.3. Propiedades de la integral definida
Teorema 4.3.1 (Propiedades de la integral definida). Sean f y g funciones continuas en
un intervalo [a, b] y c ∈ R. Entonces
Z b Z b Z b
(a) (f (x) ± g(x))dx = f (x)dx ± g(x)dx
a a a
Z b Z b
cf (x)dx = c f (x)dx. (Propiedades de linealidad)
a a
Z b Z c Z b
(b) f (x)dx = f (x)dx + f (x)dx (Propiedad de aditividad)
a a c
(c)
Z b
Si f (x) ≥ 0, entonces f (x)dx ≥ 0
a
Z b Z b (Propiedades de orden)
Si f (x) ≥ g(x), entonces f (x)dx ≥ g(x)dx.
a a
Z b
Si m ≤ f (x) ≤ M, entonces m(b − a) ≤ f (x)dx ≤ M(b − a)
a
Z b Z b+c
(d) f (x)dx = f (x − c)dx (Propiedad de invariancia frente a traslación)
a a+c
Z b Z a
(e) f (x)dx = − f (x)dx. (Propiedad de inversión de la orientación)
a b
b cb
1 x
Z Z
(f ) f (x)dx = f dx, c 6= 0.
a c ca c
(Propiedad de dilatación o contracción del intervalo)
Corolario 4.3.2. Si f es continua en [0, b]. Entonces

Z b Z b
(a) f (x)dx = 2 f (x)dx si f es par.
−b 0
Z b
(b) f (x)dx = 0 si f es impar.
−b
4.4. La integral indefinida

Definición 4.4.1. Una función F es una antiderivada de f en intervalo I si F ′ (x) = f (x)
para todo x ∈ I.
La antiderivada de una función no es única. Por ejemplo, si C ∈ R cada elemento de la
familia de funciones F (x) = x3 + C es un antiderivada de la función f (x) = 3x2 .
110
Un sı́mbolo especial se utiliza para denotar la colección de todas las antiderivadas de una
función f .
Definición 4.4.2 (Integral definida). la colección de todas las antiderivadas de una función
f se denomina integral indefinida de f con respecto a x, lo cual se denota mediante
Z
f (x)dx.
4.4.1. Problemas de valor inicial

La noción de antiderivada de una función es importante en relación con la ecuaciones
diferenciales, dado que la determinación de una antiderivada de la función f (x) es el mismo
problema de encontrar una función y(x) que satisface la ecuación
dy
= f (x), (4.8)
dx
la cual se denomina ecuación diferencial. La solución general de (4.8) es y(x) = F (x)+C,
donde C es una constante arbitraria y F es una antiderivada de f . Por lo tanto, la ecuación
tiene infinitas soluciones una por cada valor de C. Luego para darle unicidad al problema
pedimos a la función y = y(x) que satisfaga la condición inicial y(x0 ) = y0 . El par conformado
por la ecuación diferencial y el condición inicial y(x0 ) = y0 , se denomina problema de valor
inicial.
Ejemplo 4.4 (Movimiento en una dimensión con aceleración constante (MUA)). Cuando
una partı́cula se mueve en una dimensión con aceleración constante, podemos hallar la po-
sición de la partı́cula como una función del tiempo al resolver el par de problemas de valor
inicial

 dv
= a(t) = cte
dt (4.9)
 v(0) = v ,
0

 dx
= at + v0
dt (4.10)
 x(0) = x .
0
En efecto, de la fı́sica clásica se sabe que la velocidad v(t) de una partı́cula en el tiempo t
es la derivada de la posición de la partı́cula respecto al tiempo, a su vez, la derivada de la
velocidad de la partı́cula con respecto al tiempo es igual a la aceleración a(t) en el tiempo t.
Esto es,
d2 x

d dx d
a(t) = 2 = = v(t).
dt dt dt dt
111
dv
Si suponemos que a(t) = = cte = c y que velocidad en el tiempo t = 0 es v0 , esto es
dt
v(0) = v0 , obtenemos el problema de valor inicial (4.9). Resolveremos este problema por un
método usado en ecuaciones diferenciales conocido como separación de variables.
dv
Tenemos que : = a = cte. Entonces separando variables obtenemos
dt
dv = adt.
Ahora integrando respecto t y aplicando las propiedades de linealidad de la integral tenemos

que
Z Z Z
dv = a dt = a dt ⇔ v = at + C1 .
Luego obtenemos que
v(t) = at + C1 ,
donde C1 es un a constante, la cual podemos hallar usando la condición inicial v(0) = v0 .

Esto es, v(0) = C1 = v0 . De donde la velocidad de la velocidad de la partı́cula en el tiempo
t viene dada por
v(t) = at + v0 (4.11)
Aplicando de nuevo el método de separación de variables, esta vez para resolver (4.10) obte-
nemos
Z Z
dx = (at + v0 )dt ⇔ dx = (at + v0 )dt.
Entonces, por las propiedades de linealidad de la integral

Z Z Z Z
dx = (at + v0 )dt = atdt + v0 tdt = at2 /2 + v0 t + C2 .
Ahora, x(0) = C2 = x0 , de donde la posición en el tiempo t de la partı́cula está dada por
x(t) = x0 + v0 t + at2 /2. (4.12)
Ahora podemos usar las ecuaciones (4.9), (4.12) para hallar una expresión para la velocidad
final v(t) que no dependa del tiempo. De (4.9) despejando el tiempo obtenemos
vf − v0
t= (4.13)
a
donde vf = v(t).
112
Reemplazando (4.13) en (4.12) obtenemos
2
vf − v0 1 vf − v0
x = v0 + a ,
a 2 a
donde por comodidad suponemos que x(0) = x0 = 0. Entonces tenemos que

2
vf − v0 1 vf − v0
x = v0 + a
a 2 a
2v0 (vf − v0 ) (vf − v0 )2
= +
2a 2a
2v0 (vf − v0 ) + (vf − v0 )2
=
2a
(vf − v0 )(2v0 + vf − v0 )
=
2a
(vf − v0 )(vf + v0 )
=
2a
vf2 − v02
= .
2a
De donde obtenemos
vf2 = v02 + 2ax. (4.14)
Otro problema tı́pico de valor inicial, que se presenta en este contexto es el de una partı́cula
que se mueve en una dimensión con velocidad constante. Para este caso tenemos

 dx
= v = cte
dt (4.15)
 x(0) = x .
0
Resolviendo problema de valor inicial obtenemos
x(t) = x0 + vt. (4.16)
Ejemplo 4.5. Un automovilista viaja a 18 m/s cuando ve un venado en el camino, a una

distancia de 38 m, adelante.
(a) Si la desaceleración máxima del vehı́culo es de −4,5 m/s2 , ¿cuál es el tiempo de reac-
ción mı́nimo del automovilista que le permitirá evitar golpear al venado? .
(b) Si el tiempo de reacción es de 0,30 s, ¿Cuán rápido viajará cuando golpeé al venado?
113
Solución. Sea t0 el tiempo de reacción mı́nimo del automovilista que le permitirá evitar
golpear al venado. En este tiempo puesto que no ha empezado a frenar, el automovilista se
desplaza con una velocidad constante de v = 18m/s. Por lo tanto, la distancia recorrida en
este tiempo se halla utilizando la fórmula (4.16) con x0 = 0, si denotemos dicha distancia
por X0 tenemos que X0 = 18t0 .
Ahora pasado el tiempo t0 , el automovilista empieza a frenar y podemos calcular el tiempo

de frenado del vehı́culo con la fórmula (4.11). Para este tiempo, vf = 0, además v0 = 18 y
a = −4,5, entonces
0 = −4,5t + 18,
de donde t = 4s. Para hallar la distancia que recorrió el automóvil antes de detenerse
completamente utilizamos la fórmula (4.12) con x0 = 0, para obtener
X1 = 18 · 4 + (1/2)(−4,5)(4)2 = 36.
v0 = 18m/s
38m
X0 X1
Figura 4.2: El auotmovilista recorre la distancia X0 con velocidad cosntante de 18m/s, y la

distancia X1 con una desaceleración constante de −4,5m/s2
.
Para que el automovilista no atropelle al venado se debe tener que la distancia de reacción
X0 más la distancia de frenado X1 sea exactamente igual a 38m (ver figura 4.2). Esto es,
X0 + X1 = 38.
Tenemos entonces que 18t0 + 36 = 38, con lo cual t0 = (1/9)s ≈ 0, 1s.
Ahora, si el tiempo de reacción es de 0,3s, en este tiempo el automovilista a recorrido
x = x(0,3) = 18 · 0, 3 = 5,4m,
pasado ese tiempo empieza a frenar, y la velocidad con la que atropella al venado se calcula
con la fórmula (4.14), tomando v0 = 18, a = −4,5 y x = 38 − 5,4 = 32,6. Tenemos que
p
vf = 182 − 2(4,5)(32,6) = 5,5317m/s.
114
Ejemplo 4.6 (Difusión social). En ocasiones, los sociólogos utilizan la frase difusión social
para describir la manera en que la información se difunde en una población. La información
puede ser un rumor, una moda cultural, o una noticia de una innovación tecnológica. En una
población suficientemente grande, el número de personas x que conoce la información se trata
como una función diferenciable del tiempo t, mientras que la velocidad de difusión, dx/dt,
se supone proporcional al número de personas que conocen la información por el número de
personas que la desconocen. Lo anterior lleva a la ecuación diferencial
dx
= kx(N − x),
dt
donde N es el número de personas en la población.
Suponga que t está en dı́as, k = 1/250, y que dos personas inician un rumor en el instante
t = 0 en una población de N = 1000 personas.
(a) Determine x como una función del tiempo t.
(b) ¿Cuándo la mitad de la población a escuchado el rumor? (Esto es cuando el rumor se

propaga de la manera más rápida).
Solución. Utilizaremos un método conocido como separación de variables para resolver

la ecuación.
dx dx
= kx(N − x) ⇔ = dt.
dt kx(N − x)
Ahora integrando la última ecuación obtenemos

dx
Z
= t + C.
kx(N − x)
Ahora nótese que

dx 1 x+N −x 1 1 1
= · = · + .
x(N − x) N x(N − x) N N −x x
Además, del cálculo diferencial se sabe que

d 1
ln x = .
dx x
Entonces por la regla de la cadena
d 1
− ln(N − x) = .
dx N −x
115
Luego por las propiedades de linealidad de la integral.
dx 1 dx
Z Z
=
kx(N − x) k x(N − x)

1 1 1 1
Z
= · + dx
k N N −x x
Z
1 1 1
= + dx
kN N −x x
Z
1 1 1
Z
= dx + dx
kN N −x x
1
= [ln x − ln(N − x)] .
kN
Tenemos entonces que

1 x 1
ln = [ln x − ln(N − x)] = t + C,
kN N −x kN
donde kN = 1000/250 = 4. Por consiguiente,
x x
ln = 4t + 4C ⇔ = e4t+4C = e4t e4C
N −x N −x
⇔ x = Ne4C e4t − e4t e4C x
⇔ x + e4t e4C x = Ne4C e4t
⇔ x(1 + e4t e4C ) = Ne4C e4t
Ne4C e4t
⇔x= .
1 + e4t e4C
Esto es,
1000e4C e4t
x = x(t) = (4.17)
1 + e4t e4C
x
Además como x = 2 cuando t = 0 y = e4t e4C , tenemos que e4C = 1/499. Reempla-
N −x
zando este último valor en (4.17), obtenemos
1000e4t
x = x(t) = .
499 + e4t
Con lo cual tenemos la parte (a). Para la parte (b), debemos resolver para t, la ecuación
1000e4t
= 500.
499 + e4t
Esto es,
1000e4t 1000 4t
4t
= 500 ⇔ e = 499 + e4t ⇔ e4t = 499.
499 + e 500
Entonces t = ln 499/4 ≈ 1,55.
116
4.5. Teorema fundamental del cálculo
4.5.1. Primer teorema fundamental del cálculo
Teorema 4.5.1 (Primer teorema fundamental del cálculo). Si f e continua en [a, b], la
función F definida por
Z x
F (x) = f (t)dt a ≤ x ≤ b
a
es continua en [a, b] y diferenciable en (a, b), y F ′ (x) = f (x).

Cuando la función f es no negativa para a ≤ t ≤ x, la función F representa el área
debajo la función y = f (t) que se acumulada hasta el valor x.
Ejemplo 4.7. Si f es continua y satisface la fórmula dada para todo x ≥ 0, calcular f (2).
Z x2 (x+1)
f (t)dt = x
0
Z x
Solución. Sea F (x) = f (t)dt y h(x) = x2 (x + 1). Si
0
Z h(x) Z x2 (x+1)
z = F (h(x)) = f (t)dt = f (t)dt, (4.18)
0 0
entonces por la regla de la cadena

dz
= F ′ (h(x))h′ (x).
dx
Nótese que el primer Teorema fundamental del cálculo F es diferenciable en (0, x), más
aún, F ′ (x) = f (x), con lo cual F ′ (h(x)) = f (h(x)). Por lo tanto, derivando respecto a x la
ecuación integral (4.18) obtenemos
f (h(x))h′ (x) = f (x2 (x + 1))(3x2 + 2x) = 1.
De donde
f (x2 (x + 1))(3x2 + 2x) = 1 (4.19)
Como se quiere hallar f (2), debemos hallar x > 0 tal que h(x) = 2. Esto es,
x2 (x + 1) = 2 ⇔ x2 + x3 − 2 = 0
⇔ x2 − 1 + x3 − 1 = 0
⇔ (x − 1)(x + 1) + (x − 1)(x2 + 2x + 1) = 0
⇔ (x − 1)(x2 + 2x + 2) = 0.
117
Para y = x2 + 2x + 2, tenemos a = 1, b = c = 2, con lo cual, D = b2 − 4ac = 22 − 4(1)(2) < 0.
Entonces x2 + 2x + 2 > 0 para todo x ∈ R. Por consiguiente x − 1 = 0, esto es, x = 1.
Reemplazando este valor en (4.19) encontramos que
f (12(1 + 1))(3(1)2 + 2(1)) = 1 ⇔ f (2)5 = 1.
De donde f (2) = 1/5.
4.5.2. Segundo teorema fundamental del cálculo

Teorema 4.5.2 (Segundo teorema fundamental del cálculo). Si f es continua en [a, b],
entonces
Z b
f (t)dt = F (b) − F (a),
a
donde F es una antiderivada de f , esto es, una función tal que F ′ (x) = f (x).
Ejemplo 4.8. Sea 


0, si x < 0,


x, si 0 ≤ x ≤ 1,
f (x) =


2 − x, si 1 < x ≤ 2,

0, si x > 2.

Z x
y F (x) := f (t)dt.
0
(a) Halle F (x)
(b) Dibuje las graficas de f y F
(c) ¿En dónde f es diferenciable? ¿En dónde F es diferenciable?
Solución. Si x ≤ 0, entonces f (x) = 0, con lo cual F (x) = 0.
CasoZ 1. Si 0 ≤ x ≤ 1, como 0 ≤ t ≤ x, entonces 0 ≤ t ≤ 1, y f (t) = t, con lo cual

x
F (x) = tdt = x2 /2. El valor x2 /2 es obtenido como el área del triángulo que se muestra
0
en la figura 4.3. Por el segundo Teorema fundamental del cálculo tenemos que F1 (t) = t2 /2.
Por lo tanto,
Z x
tdt = F1 (x) − F1 (0) = x2 /2.
0
118
y
x
0 x 1 2
Z x
Figura 4.3: La integral tdt es igual a el área del triángulo de lados x y y = f (x) = x
0
Caso 2. Si 1 < x ≤ 2. Utilizando la propiedad aditiva de la integral definida tenemos

que
Z x Z 1 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt = A1 + A2 .
0 0 1
A1 A2
x
0 1 x 2
Figura 4.4: En este caso el área acumulada hasta x es igual a el área del triángulo más el
área del trapecio
Geométricamente podemos calcular el área como la suma del área del triángulo y el
119
trapecio que se muestran el la figura 4.4. Tenemos que:
Z 1 Z x
1·1 (1 + 2 − x)(x − 1)
f (t)dt = A1 = = 1/2, f (t)dt = A2 = .
0 2 1 2
Entonces
x
(3 − x)(x − 1)
Z
F (x) = f (t)dt = 1/2 + = −x2 /2 + 2x − 1.
0 2
Si queremos hallar el área acumulada hasta un valor x, utilizando el segundo teorema fun-
damental del cálculo, procedemos como sigue. Para el área A1 tenemos que 0 ≤ t ≤ 1, con
lo cual f (t) = t. Entonces
Z 1
A1 = tdt = F1 (1) − F1 (0) = 1/2 − 0 = 1/2.
0
Para el área A2 tenemos que 1 ≤ t ≤ x ≤ 2. Es decir, f (t) = 2 − t. En consecuencia,

Z x Z x Z x
A2 = (2 − t)dt = 2dt − tdt
1 1 1
= 2(x − 1) − ((F1 (x) − F1 (1))
= 2x − 2 − (x2 /2 − 1/2)
= −x2 /2 + 2x − 3/2.
Sumando estas áreas obtenemos

Z x
F (x) = f (t)dt = 1/2 + −x2 /2 + 2x − 3/2 = −x2 /2 + 2x − 1.
0
Caso 3. x > 2. En este caso ya se acumulo todo el área.

Z x Z 2 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt
0 0 2
Z 1 Z 2 Z x
= f (t)dt + f (t)dt f (t)dt
0 1 2
Z 1 Z 2 Z x
= tdt + (2 − t)dt + 0dt
0 1 2
= 1.
Ver la figura 4.5.
120
y
x
0 1 2 x
Figura 4.5: Si x > 2, ya se acumulo toda el área, la cual es igual a el área del triángulo que
se muestra
De los casos 1,2 y 3, encontramos F (x):



0, si x < 0,

x2 /2,

si 0 ≤ x ≤ 1,
F (x) =


−x2 /2 + 2x − 1, si 1 < x ≤ 2,

1, si x > 2.

De donde obtenemos la gráfica de la función
x
0 1 2
Figura 4.6: Gráfica de la función de área
121
La función f es diferenciable en R − {0, 1, 2}. Por el primer Teorema fundamental del
cálculo, la función F es diferenciable donde f es continua, esto es, en todo R.
4.6. Área entre curvas

Supongamos que y = ϕ1 (x) y y = ϕ2 (x) son funciones continuas en el intervalo [a, b],
y supongamos además que ϕ1 (x) ≤ ϕ2 (x) para todo x ∈ [a, b]. Consideremos la región R
limitada por las gráficas de estas funciones en el intervalo dado, esto es
R = (x, y) ∈ R2 : a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x) .

Observamos en la figura 4.7 que al mover la linea vertical en rojo desde x = a, hasta x = b,
barremos toda la región, y mientras hacemos esto, dicha linea siempre entra en la curva
y = ϕ1 (x) y sale en la curva y = ϕ2 (x). Un subconjunto del plano con estas caracterı́sticas
es denominado región del tipo I.
y
y = ϕ2 (x)
y = ϕ1 (x)
x
a b
Figura 4.7: Región del tipo I
Dado que 0 ≤ ϕ1 (x) ≤ ϕ2 (x), para x ∈ [a, b], podemos hallar el área de la región R
como una resta de áreas. En efecto, denotemos dicha área por a(R), utilizando la integral
de Riemann tenemos que
Z b Z b Z b
a(R) = A2 − A1 = ϕ2 (x)dx − ϕ1 (x)dx = [ϕ2 (x) − ϕ1 (x)] dx.
a a a
Además por el Teorema fundamental del cálculo

Z ϕ2 (x)
dy = ϕ2 (x) − ϕ1 (x).
ϕ1 (x)
122
Por lo tanto, podemos expresar el área de la región como
Z b
a(R) = [ϕ2 (x) − ϕ1 (x)] dx
a
" #
Z Z b ϕ2 (x)
= dy dx
a ϕ1 (x)
Z bZ ϕ2 (x)
= dydx
a ϕ1 (x)
ZZ
= dA.
R
ZZ
La expresión dA es denominada integral doble extendida sobre la región R del dife-
R
rencial de área, el diferencial de área, dA, es igual a dydx.
Ejemplo 4.9. Calcular el área de la región acotada por la hipérbola xy = 1 y las rectas
y = x y y = 2.
Solución. Hallemos los puntos de corte entre la hipérbola y = 1/x, y la recta y = 2. Esto
es, resolvemos para x la ecuación 1/x = 2, encontrando que x = 1/2. De manera similar, las
rectas y = x y y = 2 se cortan en x = 2 y la hipérbola y la recta y = x en x = 1. Con esta
información hallamos la gráfica de la región.
y
y=x
2
y=2
R
xy = 1
x
1/2 1 2
Figura 4.8: Región plana del tipo II
Vemos que trazando una linea vertical empezando en x = 1/2 y terminando en x = 1,

esta entra en la hipérbola y = 1/x y sale en la recta y = 2, pero cuando movemos esta linea
123
desde x = 1 hasta x = 2 entra en la recta y = x y sale en la recta y = 2, por lo que la región
R no puede ser del tipo I. Sin embargo, al trazar una linea horizontal vemos que cuando la
desplazamos desde y = 1 hasta y = 2, siempre entra en la hipérbola x = 1/y y sale en la
recta x = y. Un subconjunto del plano con esta propiedad es denominado región del tipo II.
De manera más general definimos una región plana del tipo II como sigue
R = (x, y) ∈ R2 : ψ1 (y) ≤ x ≤ ψ2 (y), c ≤ y ≤ d .

Análogamente como se hizo con la regiones de tipo I calculamos el área de una región del
tipo II
ZZ
a(R) = dA
R
Z "Z d
#
ψ2 (y)
= dx dy
c ψ1 (y)
Z d Z ψ2 (y)
= dxdy
c ψ1 (y)
Z d
= [ψ2 (y) − ψ1 (y)] dy.
c
En una región del tipo II, el diferencial de área está dado por dA = dxdy. Ahora para nuestro
caso tenemos que
R = (x, y) ∈ R2 : 1/y ≤ x ≤ y, 1 ≤ y ≤ 2 .

Por lo tanto,
Z 2
a(R) = (y − 1/y)dy
1
2
= y 2 /2 1 − [ln y]21

= 22 /2 − 1/2 − (ln 2 − ln 1) = 3/2 − ln 2.
Cuando aplicamos el segundo Teorema fundamental del cálculo, usamos la notación

Z b
f (x)dx = F (b) − F (a) = [F (x)]ba .
a
A pesar de que la región R no es del tipo I, se puede ver como la unión de dos regiones del
tipo I.
124
y
y=x
2
y=2
R1 R2
xy = 1
x
1/2 1 2
Figura 4.9: Región del tipo II, que puede ser vista como la unión de dos regiones del tipo I
En efecto, R = R1 ∪ R2 , donde
R1 = {(x, y) : 1/2 ≤ x ≤ 1, 1/x ≤ y ≤ 2} , R2 = {(x, y) : 1 ≤ x ≤ 2, x ≤ y ≤ 2}
Podemos entonces calcular el área pedida utilizando la propiedad aditiva de las integrales
dobles
ZZ ZZ ZZ
a(R) = dA = dA + dA = a(R1 ) + a(R2 ).
R R1 R2
Tenemos que
ZZ Z 1
a(R1 ) = dA = (2 − 1/x)dx = 1 + ln 1/2 = 1 − ln 2,
R1 1/2
y
ZZ Z 2
a(R2 ) = dA = (2 − x)dx = 1/2.
R2 1
Por la tanto, a(R) = a(R1 ) + a(R2 ) = 1 − ln 2 + 1/2 = 3/2 − ln 2.
Existen regiones planas que pueden ser del tipo I y del tipo II al mismo tiempo. Llama-
remos a estos subconjuntos del plano regiones del tipo III.
Para calcular área entre curvas debemos utilizar la propiedad aditiva de la integrales
dobles en su caso más general.
125
Teorema 4.6.1 (Propiedad aditiva de las integrales dobles). Supongamos que
R = R1 ∪ R2 ∪ · · · ∪ Rn ,
donde las regiones Ri , 1 ≤ i ≤ n, son regiones elementales en el plano de alguno de los tres
tipos definidos; tipo I, tipo II, o bien tipo III, las cuales son disyuntas dos a dos, esto es,
Ri ∩ Rj = ∅, i 6= j,
salvo quizás en sus fronteras. Entonces

ZZ
a(R) = dA
ZZ R ZZ ZZ
= dA + dA + · · · + dA
R1 R2 Rn
= a(R1 ) + a(R2 ) + · · · + a(Rn ).
4.7. Curvas en el plano

Consideremos una partı́cula que se está moviendo sobre la circunferencia C de ecuación
x + y 2 = 1 mostrada en la figura 4.10.
2
Figura 4.10: Movimiento de una partı́cula sobre una circunferencia
Es imposible describir la trayectoria C seguida por la partı́cula mediante una ecuación de

la forma y = f (x) porque C no pasa la prueba de la linea vertical. Es decir, en la ecuación
de la circunferencia no podemos determinar y de manera única como una función de x. En
vez de eso, utilizamos un par de ecuaciones de la forma
x = x(t), y = y(t).
Por ejemplo para partı́cula que describe la circunferencia de la figura 4.10,
x(t) = cos t, y(t) = sen t.
126
t x y
0 1 0
π/2 0 1
π −1 0
3π/2 0 −1
2π 1 0
Cuadro 4.1: Tiempo necesario para completar una revolución
Para este caso el parámetro t representa el tiempo, y vemos que si 0 ≤ t ≤ 2π, la partı́cula
completa una revolución pasados 2π segundos (ver cuadro 4.1)
Se observa que a medida que el parámetro crece de 0 a 2π los puntos se distribuyen sobre
la circunferencia siguiendo la dirección contraria a las manecillas del reloj.
A continuación introducimos la noción de curva en forma general.
Definición 4.7.1. Una aplicación vectorial en R2 es una función definida en un intervalo

I ⊆ R que toma valores en R2 .
En sı́mbolos escribimos
α : I ⊆ R → R2 , α(t) = (x(t), x(t)).
Las funciones x, y : I ⊆ R → R, son llamadas funciones componentes de la aplicación

vectorial α.
Definición 4.7.2. Una curva en el plano es la imagen por medio de una función vectorial
en R2 de un intervalo I de números reales.
Escribimos C = α(I) = {α(t) : t ∈ I}. A la función vectorial α se le llama parametriza-

ción de la curva C. A las funciones componentes x = x(t), y = y(t) de la función vectorial
α, también se les llama ecuaciones paramétricas.
Ejemplo 4.10 (Parametrización de una función en el plano). Sea y = f (x) una función
definida en un intervalo I de números reales. Entonces su gráfica:
C = graf (f ) = {(x, f (x)) : x ∈ I} ,
es muy sencilla de parametrizar, pues vasta definir, α(t) = (t, f (t)), t ∈ I, en tal caso
C = α(I).
127
4.7.1. Ecuación vectorial y normal de la recta
En la sección 1.2 hallamos la ecuación de la recta usando argumentos geométricos. Des-
afortunadamente, este tipo de argumentos no se pueden extender para deducir la ecuación
de una recta, por ejemplo en R3 , por lo que usaremos métodos vectoriales para encontrar la
ecuación de una recta en Rn .
Sea P0 = (x0 , y0 ) un punto dado de la recta. Supongamos además que v es el vector que
la da dirección a la recta l, nos referimos a este vector como vector director. Supongamos
además que P = (x, y) es un punto arbitrario de l ver figura 4.11.
y
l
P b
P0
b
x
O
Figura 4.11: Ecuación de la recta dados un punto y el vector director
Entonces el vector v es paralelo a el vector que va del punto P0 a el punto P , por lo

tanto, existe t ∈ R tal que
−→
P0 P = P − P0 = tv,
o bien,
P = P0 + tv. (4.20)
La ecuación (4.20) es llamada ecuación vectorial de la recta. Como veremos en la sección
4.10 el procedimiento utilizado para encontrar la ecuación (4.20) se puede extender fácilmente
a R3 .
Ahora, si expresemos (4.20) en términos de las componentes de los vectores P, P0 y v

obtenemos
(x, y) = (x0 , y0 ) + t(v1 , v2 ).
128
Aplicando la multiplicación por escalar y la suma de vectores, encontramos que

x = x(t) = x0 + tv1
(4.21)
y = y(t) = y0 + tv2
Con lo cual tenemos entonces las llamadas ecuaciones paramétricas de la recta. De
las ecuaciones (4.21) concluimos que la parametrización de la recta está dada por
α(t) = P0 + tv = (x0 + tv1 , y0 + tv2 ) = (x(t), y(t)), t ∈ R.
Si despejamos el parámetro t en la primera y segunda ecuación en el sistema (4.21) e igua-

lamos obtenemos
x − x0 y − y0
= . (4.22)
v1 v2
La cual se conoce como ecuación simétrica de la recta. Nótese que si despejamos y de
la ecuación (4.22) obtenemos la ecuación cartesiana de la recta.
De la ecuación (4.20) se hace patente que para determinar completamente una recta es
suficiente con un punto el vector director, o bien teniendo dos de sus puntos, como mostra-
remos en el siguiente ejemplo.
Ejemplo 4.11. Parametrizar la recta que pasa por los puntos P y Q.
Solución. Dado que ya tenemos un punto de la recta, por ejemplo, P0 = P , solo falta
−→
determinar el vector director, el cual podemos tomar como v =P Q ver figura 4.12.
y
l
Q
b
−→
P v =P Q
b
x
O
Figura 4.12: Ecuación de la recta dados dos de sus puntos.
129
Por lo tanto, la parametrización de la recta es
−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), t ∈ R.
Ecuación normal de la recta

Vimos en la sección 4.7.1 que para determinar completamente la ecuación de una recta
suficiente con un punto y el vector director, o bien dos puntos de la recta. Veremos a conti-
nuación que también se puede determinar completamente una recta con un punto y el vector
normal a la recta.
Sea P0 = (x0 , y0) un punto dado de la recta l y n = (a, b) el vector normal a l, esto es, el
vector n es ortogonal a cualquier vector sobre la recta l (ver figura 4.13).
vector n trasladado
l
n = (a, b)
P
P0
x
O
Figura 4.13: Ecuación de la recta dados un punto y el vector normal.

−→
Y sea P = (x, y) un punto arbitrario de la recta l. Entonces el vector P0 P está sobre la
recta l de tal forma que
−→
P0 P ·n = 0. (4.23)
La expresión anterior en términos de las componentes de los vectores toma la forma
[(x, y) − (x0 , y0 )] · (a, b) = 0.
130
Lo que equivale a
a(x − x0 ) + b(y − y0 ) = 0 ⇔ ax + by − (ax0 + by0 ) = 0.
Si llamamos c = −(ax0 + by0 ) obtenemos
ax + by + c = 0. (4.24)
La ecuación (4.24) se conoce como ecuación normal de la recta. Se observa que las
componentes del vector normal son los coeficientes de las variables x y y respectivamente.
Nota 4.7.1. En la deducción de la forma normal de la recta, hay un sutileza, en la ecuación
−→ −→
(4.23) el producto punto debe realizarse en realidad entre vectores P0 P y P0 P2 , donde P2 es
el punto final del vector n trasladado. Sin embargo, por el análisis hecho en la sección 3.3,
−→
dado que el vector n es equivalente a el vector geométrico P0 P2 tenemos que
−→
n = P0 P2 .
Por lo tanto,
−→ −→ −→
P0 P ·n =P0 P · P0 P2 = 0.
Ejemplo 4.12. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a
un punto P0 = (x0 , y0 ) que no pertenece a l está dada por
|ax0 + by0 + c|
√
dmı́n = .
a2 + b2
Solución. Este problema ya se soluciono de forma puramente geométrica en el ejemplo 1.5.
Ahora utilizaremos el vector proyección para resolver el problema.
y
l
P0
b
dmı́n P
P1
P2
vector normal n trasladado
x
O
n = (a, b)
Figura 4.14: La distancia entre el punto P0 y la recta l recta es igual a la proyección escalar
−→
entre vector P0 P y el vector normal n trasladado.
131
En la figura 4.14 trasladamos el vector normal n respetando dirección y magnitud, de tal
forma que su punto inicial coincida con el punto P0 , si el punto final de este vector es P2 ,
−→
entonces el vector P0 P2 es ortogonal a la recta l en el punto P1 . Si P = (x, y) es cualquier
punto de la recta l, vemos que la distancia entre P0 y la recta l; dmı́n = kP0 − P1 k es la
−→ −→
proyección escalar entre el vector P0 P y el vector P0 P2 . Por lo tanto, por el Teorema 3.5.2
inciso (e) tenemos que
−→ −→
−→ | P0 P · P0 P2 |
dmı́n = k Proy −→ P0 P k = −→ .
P0 P2
k P0 P2 k
−→
Ahora, dado que los vector n y el vector geométrico P0 P2 tienen la misma dirección y
magnitud, por (3.1) tenemos que
−→
n = P0 P2 .
De donde concluimos que

−→ −→ −→
−→ | P0 P · P0 P2 | | P0 P ·n|
k Proy −→ P0 P k = −→ = .
P0 P2
k P0 P2 k knk
Con lo cual,
−→
| P0 P ·n|
dmı́n = .
knk
Como la ecuación de la recta está en la forma normal ax + by + c = 0, las componentes
del vector normal son a y b, esto es, n = (a, b). Además dado que (x, y) ∈ l tenemos que
ax + by + c = 0, o bien, ax + by = −c. Entonces
−→
| P0 P ·n|
dmı́n =
knk
|a(x − x0 ) + b(y − y0 )|
= √
a2 + b2
|ax + by − (ax0 + by0 )|
= √
a2 + b2
| − c − ax0 − by0 |
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2
132
Parametrización de la elipse
La ecuación cartesiana de la elipse con centro en (h, k) y semiejes a y b viene dada por
(x − h)2 (y − k)2
+ = 1. (4.25)
a2 b2
Para parametrizar la elipse utilizamos la identidad fundamental
cos2 t + sen2 t = 1.
(x − h)2 2 (y − k)2
Podemos escoger = cos t y = sen2 t, de donde despejando las variables x,
a2 b2
y y obtenemos las ecuaciones paramétricas
x = x(t) = a cos t + h, y = y(t) = b sen t + k.
De lo cual obtenemos que la parametrización de la elipse es
α(t) = (a cos t + h, b sen t + k), 0 ≤ t ≤ 2π. (4.26)
Cuando a = b = R en (4.25) nos da
(x − h)2 + (y − k)2 = R2 , (4.27)
la cual es la ecuación de una circunferencia con centro en (h, k) y radio R.
Parametrización de la cicloide
Ejemplo 4.13 (Cicloide). La curva trazada por un punto en la circunferencia de un cı́rculo
que rueda sin resbalar por una recta se llama cicloide (ver figura 4.15). Si el cı́rculo tiene
radio r y rueda a lo largo del eje x, y un punto P sobre el cicloide empieza en el origen,
parametrice el cicloide.
y
b
C(rθ, r)
r θ
P
Q
y
x x
O T
rθ
Figura 4.15: Un punto P sobre la rueda de una bicicleta que se desplaza sobre plano horizontal
genera una curva llamada cicloide.
133
Solución. Elijamos el ángulo de rotación θ del cı́rculo como parámetro, cuando θ = 0,
el punto P está en el origen. Cuando el cı́rculo ha girado θ radianes, la distancia que ha
recorrido desde el origen es
OT = arc P T = rθ
Dado que el centro del cı́rculo está en C(rθ, r), si (x, y) son las coordenadas del punto P ,
entonces, según la figura 4.15
x = OT − P Q = rθ − r sen θ = r(θ − sen θ)

y = T C − QC = r − r cos θ = r(1 − cos θ).
Por lo tanto,
α(θ) = (r(θ − sen θ), r(1 − cos θ)).
La parametrización anterior contempla el caso en que 0 ≤ θ ≤ π/2. Ahora supongamos

que π/2 ≤ θ ≤ π.
P Q
α
b
C(rθ, r)
θ
x
O T
rθ
Figura 4.16: Parametrización del cicloide para π/2 ≤ θ ≤ π
En la figura 4.16 el triángulo △P QC es rectángulo en Q. Además,

QC PQ
cos α = , sen α =
PC PC
Dado que P C = r, y α + θ = π tenemos que
y−r
− cos θ = cos(π − θ) = cos α = ,
r
134
de donde
y = r(1 − cos θ).
De manera análoga,
rθ − x
sen θ = sen(π − θ) = sen α = ,
r
o bien
x = r(θ − sen θ).
Y de nuevo obtenemos que
α(θ) = (r(θ − sen θ), r(1 − cos θ)).
La misma parametrización se obtiene en los casos en que π ≤ θ ≤ 3π/2 y 3π/2 ≤ θ ≤ 2π.

Esto completa la parametrización de la cicloide, pues un arco de esta se tiene al variar el
ángulo θ entre 0 y 2π.
4.8. Continuidad y diferenciación de aplicaciones vec-

toriales
Antes de presentar la noción continuidad y diferenciabilidad de aplicaciones vectoriales
debemos especificar el significado de la expresión
lı́m α(t) = L. (4.28)

t→t0
Dado que t, t0 son números reales, la expresión t → t0 significa que |t − t0 | → 0. Para el

caso α(t) y L, puesto que estamos comparando vectores, diremos que α(t) → L si y solo si
kα(t) − (L1 , L2 )k → 0 donde L = (L1 , L2 ) y
p
kα(t) − (L1 , L2 )k = (x(t) − L1 )2 + (y(t) − L2 )2 .
Ahora podemos aclarar el significado de (4.28).
lı́mt→t0 α(t) = L significa que kα(t) − (L1 , L2 )k → 0 siempre que |t − t0 | → 0.
El siguiente resultado nos permite es establecer los conceptos de continuidad de y dife-

renciación de aplicaciones vectoriales en términos de sus funciones componentes.
135
Teorema 4.8.1. Sea α : I ⊆ R → R2 una aplicación vectorial dada por
α(t) = (x(t), y(t)).
El lı́mite lı́mt→t0 α(t) existe si solo si los lı́mites lı́mt→t0 x(t), lı́mt→t0 y(t) existen, más aún,

lı́m α(t) = lı́m x(t), lı́m y(t) .
t→t0 t→t0 t→t0
Teorema 4.8.2 (Continuidad de aplicaciones vectoriales). Una aplicación vectorial α : I ⊆

R → R2 , dada por
α(t) = (x(t), y(t)),
es continua en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son continuas en

t = t0 .
4.8.1. Vector tangente

Cuando el parámetro t representa el tiempo la función vectorial α(t) = (x(t), y(t)) repre-
senta el vector posición de una partı́cula que se está moviendo en dos dimensiones, de este
modo, la partı́cula describe una trayectoria C = α(I) (ver la figura 4.17).
y
α′ (t0 )
P
Q
Figura 4.17: El vector velocidad, o vector tangente es igual a el cambio de la posición de la

partı́cula respecto a el tiempo
donde las funciones paramétricas x(t) y y(t) representan la posición en x y y de la

partı́cula en el momento t respectivamente. Supongamos que la partı́cula está en el punto P
en el momento t0 , esto es, α(t0 ) = P y pasado un tiempo h > 0 se encuentra en el punto Q,
136
es decir α(t0 + h) = Q. Tenemos entonces que el cambio en la posición de la partı́cula viene
dado por
−→
P Q= Q − P = α(t0 + h) − α(t0 ).
El vector
α(t0 + h) − α(t0 )
,
h
es secante a la trayectoria C y cuando h → 0, de tal forma que los punto P y Q se aproximan,
tiende a ser el vector tangente a la trayectoria C en el punto P . Por consiguiente, el vector
tangente o vector velocidad de la partı́cula en el momento t0 , el cual se denota por α′ (t0 )
está dado por
α(t0 + h) − α(t0 )
α′ (t0 ) = lı́m , (4.29)
h→0 h
si el lı́mite en la derecha de (4.29) existe. En tal caso diremos que la función α es diferenciable
en t = t0 .
El Teorema 4.8.1 nos permite encontrar una expresión para calcular el vector tangente.
Teorema 4.8.3 (Diferenciabilidad de aplicaciones vectoriales). Una aplicación vectorial α :

I ⊆ R → R2 , dada por
α(t) = (x(t), y(t)),
es diferenciable en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son diferen-

ciables en t = t0 . Más aún, tenemos que
α′ (t0 ) = (x′ (t0 ), y ′(t0 )).
Nota 4.8.1. El Teorema 4.8.3 nos dice que la derivada de una aplicación vectorial es a su
vez una aplicación vectorial, por lo tanto podemos hablar de una aplicación vectorial cuya
derivada sea continua. Decimos que una curva C es suave si su representación vectorial
α(t) = (x(t), y(t)), t ∈ I
es diferenciable con continuidad para todo t ∈ I. Es decir, α′ (t) existe y es continua para
todo punto del intervalo I. La gráfica de una curva suave, se distingue por que no se rompe
y no tiene puntas. Decimos que una curva C, que es diferenciable en un intervalo I, salvo
por un número finito de puntos es suave a trozos.
137
y y y
R
C
x x x
(a) Curva suave (b) Suave a trozos (c) Curva que se rom-
pe
Figura 4.18: Curva suave y suave a trozos
La gráfica de una circunferencia es una curva suave, ver figura 4.18(a). La frontera de
la región R, ver figura 4.18(b), para este caso un triángulo no es una curva suave, pues no
es diferenciable en cada uno de sus vértices. Sin embargo, si es suave a trozos. La gráfica
de la figura 4.18(c) no es suave ni suave a trozos, pues al presentar un número infinito de
discontinuidades no es diferenciable un número infinito de puntos.
Como mencionamos anteriormente, si el parámetro representa el tiempo, el vector posi-

ción de la partı́cula que da determinado por una función vectorial
α(t) = (x(t), y(t)), t ∈ I
si dicha función es diferenciable en t = t0 ∈ I, vimos que el vector velocidad de la partı́cula
en el momento t = t0 está dado por
v(t0 ) = α′ (t0 ),
la magnitud de este vector define la rapidez de la partı́cula en el instante t = t0 , esto es,
v = kv(t0 )k = kα′ (t0 )k.
Si además, la función α′ es diferenciable en t = t0 , el vector aceleración de la partı́cula en
t0 , es decir el cambio de la velocidad con respecto a el tiempo en t0 , está dado por
a(t0 ) = v′ (t0 ) = α′′ (t0 ).
4.9. Movimiento en el plano

4.9.1. Movimiento rectilineo
El movimiento más sencillo que podemos analizar, es el de una partı́cula que se desplaza
sobre una linea recta. Para determinar completamente la posición de una partı́cula que sigue
138
un movimiento rectilineo es suficiente con conocer su velocidad y donde esta inicialmente.
Supongamos que la partı́cula está en el momento t = 0 en el punto P0 y que su velocidad
viene dada por un vector constante v (ver la figura 4.11), entonces el vector posición está
dado por
α(t) = P0 + tv, t ≥ 0. (4.30)
Nótese que α(0) = P0 y α′ (t) = v.
Ejemplo 4.14. Una partı́cula se desplaza en una linea recta con una rapidez constante v
desde el punto P hasta el punto Q. Determinar el vector posición de la partı́cula.
Solución. Por el ejemplo 4.11, la parametrización de la recta está dada por
α(t) = P + t(Q − P ), t ∈ R.
Si resulta que kQ − P k = v, por (4.30) el vector posición de partı́cula es

−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), 0 ≤ t ≤ 1,
−→
donde el vector velocidad está dado por v =P Q= Q − P . Se observa que la partı́cula está
inicialmente en P y pasado un segundo está en el punto Q.
Ahora, si el por el contrario tenemos que kQ − P k =

6 v, consideremos el vector unitario
en la dirección de v = Q − P (ver figura 4.19).
y
l
Q
b
w
−→
P v =P Q
b
u
x
O
Figura 4.19: Podemos determinar la posición de una partı́cula, dados dos puntos de su
trayectoria rectilinea junto con su rapidez.
139
Esto es, definimos
v
u= .
kvk
Entonces el vector w dado por
w = vu,
tiene la misma dirección de v y su magnitud es kwk = v. Por lo tanto, el vector posición de

la partı́cula es
β(t) = P + tw, 0 ≤ t ≤ t1 ,
donde t1 es el tiempo transcurrido para la partı́cula esté en el punto Q, es decir, tenemos

que β(t1 ) = Q. Lo que nos lleva a considerar la siguiente ecuación vectorial
P + t1 w = Q.
Vemos entonces que
t1 v = t1 kwk = kt1 wk = kQ − P k.
Entonces t1 = kQ − P k/v.
En conclusión, la posición en el tiempo t de la partı́cula es
β(t) = P + tw, 0 ≤ t ≤ t1 ,
v Q−P
donde w = vu, u = = y t1 = kQ − P k/v.
kvk kQ − P k
4.9.2. Movimiento circular uniforme

Consideremos ahora una partı́cula que se está moviendo sobre una circunferencia con
una rapidez constante, es decir, siguiendo un movimiento circular uniforme. Queremos
hallar el vector posición de la partı́cula. Recordemos que la ecuación cartesiana de una
circunferencia con centro en (h, k) y radio R viene dada por
(x − h)2 + (y − k)2 = R2 ,
Si escogemos R2 cos2 t = (x − h)2 y R2 sen2 t = (y − k)2 obtenemos la parametrización
α(t) = (R cos t + h, R sen t + k), 0 ≤ t ≤ 2π.
140
Ahora, nótese que la función vectorial dada por
β(t) = (x(t), y(t)),
donde x(t) = R cos [ω (t − δ)] + h y y(t) = R sen [ω (t − δ)] + k, también parametriza la

circunferencia dada. Más aún, la función β(t) representa el vector posición de una partı́cula
que se mueve sobre la circunferencia con una rapidez angular constante ω. Recordaremos la
rapidez angular ω se define como la tasa de cambio del ángulo barrido por unidad de tiempo,
esto es,
dθ
ω= .
dt
Si la rapidez angular es constante, separando variables e integrando obtenemos (ver la sección
4.4.1)
θ = θ(t) = θ0 + ωt.
Si suponemos que θ0 = 0, tenemos que

θ
ω= .
t
Denotamos por T a el periodo de la partı́cula, es decir, el tiempo en completar una revolución.
Dado que una revolución se completa cuando se barre un ángulo de 2π radianes encontramos
que
2π
ω= ,
T
para una rapidez angular constante. La otra constante que aparece en las ecuaciones pa-
ramétricas que definen la función vectorial β es δ, la cual tiene que ver con el punto donde
la partı́cula inicia su movimiento. Nótese además que el hecho de escoger la variable x como
una función cosenosoidal o senosoidal tiene que ver con la orientación que sigue la partı́cula.
Calculemos ahora el vector velocidad y la rapidez de la partı́cula. Tenemos que el vector
velocidad viene dado por
v(t) = β ′ (t) = (−Rω sen [ω (t − δ)] , Rω cos [ω (t − δ)])
Con lo cual la rapidez lineal de la partı́cula está dada por
v = kβ ′ (t)k = Rω.
Cambio en la orientación de una curva

141
Consideremos las funciones vectoriales
α(t) = (cos t, sen t), 0 ≤ t ≤ 2π,

β(t) = (cos t, − sen t), 0 ≤ t ≤ 2π.
Ambas parametrizan la circunferencia x2 + y 2 = 1 y tienen el mismo punto inicial y final. Sin

embargo, cuando el parámetro varia entre 0 y 2π, en la primera parametrización los puntos
se distribuyen sobre la circunferencia siguiendo la dirección contraria de las manecillas del
reloj, mientras que la segunda parametrización lo hacen siguiendo las manecillas del reloj.
Como puede comprobarse ambas parametrizaciones se relacionan por la ecuación
β(t) = α(2π − t),
La cual es un caso particular de lo que denominaremos fórmula de inversión. En general,

si un función vectorial α(t) = (x(t), y(t)), a ≤ t ≤ b parametriza una curva C, entonces la
función
β(t) := α(a + b − t) (Fórmula de inversión)
también parametriza la curva C pero induciendo la dirección contraria a la que induce la

función α sobre esta. Denotamos la curva generada por la función β por −C.
Ejemplo 4.15. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en dirección

contraria a las de las manecillas del reloj con una rapidez constante de 2m/s. Encuentre el
vector posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (1, 0) y
da una revolución completa.
Solución. Tenemos que la rapidez lineal de la partı́cula está dada por v = 2m/s, y dado
que R = 1 y v = ωR tenemos que ω = 2 rad /s. Teniendo la rapidez angular podemos
hallar el periodo de la partı́cula con la fórmula ω = 2π/T , de donde T = πs. Suponemos
que la posición en x que sigue la partı́cula es una función cosenosoidal, la cual inducirá una
dirección sobre la curva, si resulta que no es la dirección que se pide en el problema, entonces
utilizamos la fórmula de inversión para obtener la dirección pedida. Además como el centro
de la circunferencia es (h, k) = (0, 0), el vector posición de la partı́cula es de la forma
α(t) = (cos 2(t − δ), sen 2(t − δ)),
donde queda por determinar la constante δ, lo cual podemos hallar con la condición inicial
α(0) = (cos 2(0 − δ), sen 2(0 − δ)) = (1, 0). Obtenemos:
cos 2δ = 1, − sen 2δ = 0.
142
El único ángulo en el intervalo [0, π] que satisface simultáneamente las ecuaciones anteriores
es 0. En consecuencia, δ = 0. Concluimos que el vector posición de la partı́cula es
α(t) = (cos 2t, sen 2t), 0 ≤ t ≤ π.
A modo de comprobación, nótese que, α(0) = (1, 0) = α(π). Ademas, la velocidad en el

instante t es
v(t) = α′ (t) = (−2 sen 2t, 2 cos 2t).
Con lo cual la rapidez de la partı́cula es
kv(t)k = k(−2 sen 2t, 2 cos 2t)k = 2m/s.
Además la parametrización encontrada induce la dirección contraria de las manecillas del

reloj en la circunferencia.
Problema 4.9.1. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en dirección

contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando su
movimiento en el punto (1, 0). Una segunda partı́cula parte del mismo punto que la primera,
pero sigue la dirección de las manecillas del reloj desplazándose con una rapidez constante
de 3m/s, ¿en que tiempo se encuentran por primera vez ambas partı́culas?
Solución. El vector posición de la primera partı́cula se encontró en el ejemplo anterior:
α1 (t) = (cos 2t, sen 2t), 0 ≤ t ≤ π.
Para hallar el vector posición de la segunda partı́cula procedemos como sigue. Como la
partı́cula se mueve sobre la circunferencia unitaria tenemos que
x = cos θ, y = sen θ,
siendo el ángulo θ la dirección del vector unitario (x, y). Ademas, como v2 = 3m/s y v2 =
ω2 R, tenemos que la rapidez angular de la segunda partı́cula es ω2 = 3 rad /s. Esta rapidez
angular se relaciona con el ángulo θ por la fórmula ω2 = θ/t, de modo que θ = 3t. Por ser
constante la rapidez angular, sabemos que ω2 = 2π/T2 , de donde el periodo de la segunda
partı́cula es T2 = 2π/3. Reuniendo la información anterior encontramos que
β2 (t) = (cos 3t, sen 3t), 0 ≤ t ≤ 2π/3.
Se advierte que la función vectorial β2 modela el movimiento de una partı́cula que se desplaza
con una rapidez de 3m/s empezando en el punto (1, 0) pero siguiendo la dirección contraria
143
a la de las manecillas del reloj. Para obtener la dirección deseada usamos la fórmula de
inversión:
α2 (t) = β2 (2π/3 − t) = (cos 3t, − sen 3t), 0 ≤ t ≤ 2π/3.
Al tener la posición de las dos partı́culas, debemos igualarlas para hallar el tiempo en que
se encuentran. Esto es, debemos encontrar un tiempo t tal que
α1 (t) = α2 (t)
o bien, igualando componente a componente
cos 2t = cos 3t y sen 2t = − sen 3t
Reescribiendo las ecuaciones anteriores en la forma
sen 3t = − sen 2t y cos 2t = cos 3t,
y multiplicando miembro a miembro obtenemos
sen 3t cos 2t = − sen 2t cos 3t,
de donde, por el seno de suma de ángulos obtenemos que
sen 5t = sen(3t + 2t) = sen 3t cos 2t + sen 2t cos 3t = 0
Como queremos hallar el tiempo en el que las partı́culas se encuentran por primera vez,
tenemos la restricción 0 ≤ t ≤ 2π/3, por lo que
5t = 0, 5t = π, o 5t = 2π.
Para t = 0, obtenemos el punto de partida; (1, 0). Y de las identidades
cos(2π − x) = cos x y sen(2π − x) = − sen x,
sustituyendo x por 2π/5 vemos que
cos(6π/5) = cos(2π − 4π/5) = cos(4π/5) y sen(6π/5) sen(2π − 4π/5) = − sen(4π/5).
Es decir, las partı́culas se encuentran por primera vez, pasado un tiempo de t = (2π/5)s.
Problema 4.9.2. Encuentre el primer punto de colisión de las partı́culas del problema 4.9.1.
144
Solución. Como el las partı́culas encuentran por primera vez, pasado un tiempo de t =
(2π/5)s, el primer punto de colisión está dado por
α1 (2π/5) = (cos 2(2π/5), sen 2(2π/5)) = (cos 3(2π/5), − sen 3(2π/5)) = α2 (2π/5)
Debemos entonces calcular el valor exacto de cos(2π/5) = cos 72◦ . En la figura 4.20 se
muestra un triángulo isósceles
R
b
36◦
T 108◦
b
72◦
36◦
72◦
Pb 36◦ b
Q
Triángulo áureo
Figura 4.20: El triángulo isósceles △P QR se denomina áureo, ya que la razón entre lados
mayor y menor es el número ϕ.
Escribamos P R = a y P Q = b. Al bisecar el ángulo ∠P QR por el segmento QT , se

observa que obtenemos de nuevo un triángulo isósceles, que además es semejante al primero
por tener los mismos ángulos. Tenemos entonces que QT = P Q = b, más aun, RT = QT = b,
ya que el △QT R, también es isósceles. Entonces como los triángulos △P QR y △P QT son
semejantes tenemos la siguiente relación de proporcionalidad
a−b b
= ,
b a
de modo que
a2 − ab = b2 ⇔ a2 − ab + b2 /4 = b2 + b2 /4
⇔ (a − b/2)2 = (5/4)b2
√
⇔ a − b/2 = ( 5/2)b
√
⇔ a = (( 5 + 1)/2)b
√
La constante ( 5 + 1)/2 se suele denotar por ϕ, y se denomina número de oro, o número
de áureo. Vemos entonces que
a
= ϕ,
b
145
por está razón el triángulo △P QR se denomina áureo. Ahora, aplicando el Teorema de
coseno al triángulo △P QT , tenemos que
b2 = (a − b)2 + b2 − 2(a − b)b cos 72◦ ⇔ 2(a − b)b cos 72◦ = (a − b)2
◦ 1 a
cos 72 = −1
2 b
Por lo tanto,
◦ 1 a 1 1 √
cos 72 = − 1 = (ϕ − 1) = ( 5 − 1).
2 b 2 4
De la identidad del ángulo doble:
cos 2x = 2 cos2 x − 1,
calculamos que
1 √
cos 2(72◦ ) = 2 cos2 72◦ − 1 = − ( 5 − 1).
4
Y De la identidad fundamental, encontramos que
◦
p √ q √
sen 2(72 ) = 1− cos2 2(72◦ ) = (1/4) 2 (5 − 5)
En consecuencia, el primer punto colisión entre las partı́culas es
1 √ √ q √

α1 (2π/5) = (cos 2(2π/5), sen 2(2π/5)) = − ( 5 − 1), (1/4) 2 (5 − 5) = α2 (2π/5).
4
4.9.3. Movimiento con aceleración constante

Supongamos que una partı́cula se desplaza con aceleración constante, esto es, el vector
aceleración a(t) no cambia, ni en dirección ni magnitud, esto implica que las componentes
ax (t) y ay (t) son a su vez constantes para todo tiempo t. Es decir tenemos que
x′′ (t) = ax (t) = cte, y ′′(t) = ay (t) = cte.
El movimiento con aceleración constante en una dimensión ya se analizó en la subsección

4.4.1, en donde se concluyó que
x(t) = x0 + vox t + (1/2)ax (t)t2 , y(t) = y0 + voy t + (1/2)ay (t)t2 ,
146
ver ecuación (4.12). De esta forma vemos que
α(t) = (x(t), y(t))

= (x, y)
= (x0 + vox t + (1/2)ax (t)t2 , y0 + voy t + (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox t, voy t) + ((1/2)ax (t)t2 , (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox , voy )t + (1/2)(ax (t), ay (t))t2
= x0 + v0 t + (1/2)a(t)t2 .
Concluimos entonces que el vector posición para una partı́cula que se desplaza con aceleración
constante es
α(t) = x0 + v0 t + (1/2)at2 . (4.31)
Un tipo especial de movimiento con aceleración constante lo constituye el movimiento

parabólico. Aquı́ se supone que la partı́cula se desplaza bajo única influencia de fuerza
gravitatoria. Entonces demostraremos que cuando es disparada con una velocidad inicial v0
la partı́cula sigue una trayectoria parabólica (ver figura 4.21)
y
vy = 0 vxo
b
g
v0
vyo
θ0
b b
x
O vxo
Figura 4.21: Cuando un proyectil es lanzado desde el origen con una inicial v0 describe una
trayectoria parabólica. Nótese además, que el proyectil alcanza su altura máxima cuando
vy = 0.
Para hallar el vector posición del proyectil, utilizamos (4.31) con x0 = (0, 0) y a(t) = g =
147
(0, −g) donde g = 9,8m/s2 , es la aceleración de la gravedad, con lo cual obtenemos
α(t) = (x(t), y(t)) = v0 t + (1/2)gt2

= (vox t, voy t) + (0, −(1/2)gt2)
= (vox t, voy t − (1/2)gt2)
En consecuencia, la posición en x es
x(t) = vox t = v0 cos θ0 t, (4.32)
donde v0 = kv0 k. Vemos entonces que la trayectoria seguida por el proyectil en x queda
descrita por un movimiento con velocidad constante. La posición en y está dada por
y(t) = voy t − (1/2)gt2 = v0 sen θ0 t − (1/2)gt2 , (4.33)
de modo que el movimiento en y del proyectil queda descrito por un movimiento de caı́da
libre.
De esta forma vemos que el movimiento del proyectil es un combinado entre un movi-
miento con velocidad constante y un movimiento de caı́da libre.
Ahora despejando t en (4.32) y reemplazando el resultado en (4.33) obtenemos

v0 sen θ0 x
y = y(t) = x − (1/2)g
v0 cos θ0 (v cos θ0 )2
0
g
= (tan θ0 ) x − 2 2
x2 .
2v0 cos θ0
Es decir, al eliminar el parámetro t, obtenemos la ecuación de una parábola de la forma

g
y = (tan θ0 ) x − x2 . (4.34)
2v02 cos2 θ0
Alcance horizontal y altura máxima de un proyectil

En la figura 4.21 vemos que el proyectil alcanza su altura máxima cuando vy = 0. Debemos
entonces encontrar una expresión para vy como función del tiempo. Derivando (4.33) respecto
a t obtenemos
dy
vy (t) = = v0y − gt = v0 sen θ0 − gt.
dt
Por lo tanto,
vy = 0 ⇔ v0 sen θ0 − gt = 0.
148
Con lo cual el proyectil alcanza su altura máxima después de un tiempo t1 dado por
v0 sen θ0
t1 = .
g
Entonces la altura máxima del proyectil es
hmáx = h(t1 )
2
v0 sen θ0 1 v0 sen θ0
= (v0 sen θ0 ) − g
g 2 g
2 2
v sen θ0
= 0 .
2g
Ahora, dado que el tiempo de vuelo es tv = 2t1 , el alcance horizontal está dado por
R = x(tv ) = x(2t1 )
2v0 sen θ0
= (v0 cos θ0 )
g
2
2v sen θ0 cos θ0
= 0
g
2
v sen 2θ0
= 0 .
g
Problema 4.9.3. Se lanza un proyectil desde el pie de un plano inclinado un ángulo θ
respecto a la horizontal. Si la velocidad inicial de proyectil forma un ángulo φ con el plano
inclinado, ¿qué alcance tendrá el proyectil sobre el plano inclinado?
Solución. En la figura 4.22 se muestra el plano uv con el eje u sobre la horizontal. Este
plano gira un ángulo θ en el sentido contrario de las manecillas del reloj para generar el
plano xy, el eje x de este sistema de referencia so coloca sobre el plano inclinado.
y v0 x
P
b
φ
θ
u
Figura 4.22: Se lanza un proyectil con una velocidad inicial v0 con ángulo φ medido respecto
a un plano inclinado un ángulo θ respecto a la horizontal.
149
De esta forma una observador que tiene como punto de referencia el plano uv, medirá las
componentes de la velocidad inicial en la forma
v0u = v0 cos(θ + φ), v0v = v0 sen(θ + φ).
Por lo tanto, la posición en u del proyectil respecto al tiempo, medida desde la horizontal
está dada por
u = u(t) = v0u t = v0 cos(θ + φ)t.
Ası́ mismo, la posición en v del proyectil respecto al tiempo, medida desde la horizontal viene
dada por
v = v(t) = v0v t − (1/2)gt2 = v0 sen(θ + φ)t − (1/2)gt2.
Para hallar la ecuación de la parábola que describe la trayectoria del proyectil despejamos
el tiempo de la ecuación para la posición en u, y reemplazamos el resultado en la ecuación
que nos da la posición en v.
v0 sen(θ + φ) u
v = v(t) = u − (1/2)g
v0 cos(θ + φ) (v0 cos(θ + φ))2

g
= (tan(θ + φ)) u − u2 .
2v02 cos2 (θ + φ)
Ahora, dado que le recta que pasa por el origen y el punto P tiene un inclinación θ sobre la
horizontal, su ecuación está dada por
v = (tan θ)u.
Al igualar las ecuaciones de esta recta y la parábola, obtenemos la componente en u del

punto P :

g
(tan θ)u = (tan(θ + φ)) u − 2 2
u2
2v0 cos (θ + φ)
2 2
2v cos (θ + φ)(tan(θ + φ) − tan θ)
⇔u= 0
g
La componente en u del punto P , y alcance R del proyectil sobre el eje x, se relacionan por
la ecuación
u = R cos θ.
De modo que, el alcance R del proyectil sobre el plano inclinado está dado por
2v02 cos2 (θ + φ)(tan(θ + φ) − tan θ)
R= .
g cos θ
150
4.9.4. Fuerza resultante
Una de las principales aplicaciones de los vectores, se presenta, en la solución de problemas
mediante el uso de la segunda ley Newton, la cual establece que la fuerza neta que actúa
sobre un cuerpo es igual a el producto de masa por su aceleración, en términos matemáticos
esto se expresa con una ecuación vectorial:
F = ma (Segunda ley de Newton)
La masa m de la partı́cula es una cantidad escalar, por lo tanto, lo que define la fuerza que
actúa sobre un cuerpo es la multiplicación por escalar entre su masa y su aceleración. Lo que
queremos decir con fuerza neta, es la fuerza resultante o sumatoria de fuerzas que actúan
sobre el cuerpo, por ejemplo, si n fuerzas F1 , . . . , Fn actúan sobre un cuerpo de masa m por
la segunda ley de Newton tendrı́amos que
F1 + · · · + Fn = ma.
Ahora si suponemos que la partı́cula se está moviendo en dos dimensiones, al descomponer

cada vector fuerza y el vector aceleración encontramos que
Fi = (Fix , Fiy ) , 1 ≤ i ≤ n, a = (ax , ay ) .
Por lo tanto, por la definición de igualdad y suma entre vectores tenemos que
X
Fx = F1x + · · · + Fnx = max
X
Fy = F1y + · · · + Fny = may .
Cuando la fuerza resultante es cero, la aceleración de la partı́cula también es cero, decimos

que la partı́cula está en equilibrio. En este caso
X
Fx = 0
X
Fy = 0.
Problema 4.9.4. Considere un peso de w Newtons suspendido por dos alambres como se
muestra en el diagrama, donde T1 y T2 son vectores de fuerza dirigidos a lo largo de los
alambres. Obtenga los vectores T1 y T2 y demuestre que sus magnitudes son
w cos α w cos β
kT1 k = y kT1 k =
sen(α + β) sen(α + β)
151
α β
T2 T1
α β
Figura 4.23: Una masa de peso w es suspendida por dos cables con tensiones T1 y T2
Solución. Según la gráfica de la figura 4.23 las direcciones de los vectores de fuerza T1 , T2
y w son respectivamente, β, π − α y 3π/2. En consecuencia tenemos que
T1x = kT1 k cos β,

T2x = kT2 k cos(π − α) = −kT2 k cos α
wx = kwk cos(3π/2) = 0,
T1y = kT1 k sen β,
T2y = kT2 k sen(π − α) = kT2 k sen α
wy = kwk sen(3π/2) = −w.
Ahora dado que la masa de peso w = kwk se encuentra en reposo se debe tener que
X
Fx = T1x + T2x + wx = 0
X
Fy = T1y + T2y + wy = 0.
Que equivale a
X
Fx = kT1 k cos β − kT2 k cos α + 0 = 0
X
Fy = kT1 k sen β + kT2 k sen α − w = 0.
Definamos x = kT1 k y y = kT2 k. Entonces tenemos un sistema de ecuaciones lineales de

tamaño 2 × 2
cos βx − cos αy = 0
sen βx + sen αy = w
Que en forma matricial se expresa como

cos β − cos α x 0
=
sen β sen α y w
152

cos β − cos α
Aquı́, la matriz de coeficientes es A = , con lo cual
sen β sen α
D := det A = sen α cos β + sen β cos α = sen(α + β).
Descontamos los casos en que α + β = 0, π, de tal forma que det A = sen(α + β) 6= 0.

Entonces por la Regla de Krammer
D1 D2
x= ,y = ,
D D
donde

0 − cos α cos β 0
D1 =
= w cos α, D1 =
= w cos β.
w sen α sen β w
Por consiguiente,
D1 w cos α D2 w cos β
kT1 k = = , kT2 k = = .
D sen(α + β) D sen(α + β)
Teniendo las magnitudes y direcciones de los vectores de fuerza T1 y T2 podemos obtener
dichos vectores. Para el vector T1 tenemos
w cos α cos β
T1x = kT1 k cos β = .
sen(α + β)
w cos α sen β
T1y = kT1 k sen β = .
sen(α + β)
Por lo tanto,
w cos α cos β w cos α sen β
T1 = i+ j.
Y para el vector T2 tenemos que
−w cos β cos α
T2x = kT2 k cos(π − α) = .
sen(α + β)
w cos β sen α
T2y = kT2 k sen(π − α) = .
sen(α + β)
En consecuencia,
−w cos β cos α w cos β sen α
T2 = i+ j.
153
4.10. Vectores en el espacio
Se define el espacio Euclideo de tres dimensiones como el conjunto de todas la triplas
ordenadas de números reales (x, y, z), esto es,
R3 = {(x, y, z) : x, y, z ∈ R} .
En analogı́a como se definió un vector en el plano, definimos un vector de R3 como un tripla

ordenada de números reales (Ax , Ay , Az ). La noción de vector geométrico (ver el problema
4.14.25) también se puede introducir en el espacio, por lo que escribimos A = (Ax , Ay , Az )
−→
en lugar de OA para denotar el vector A. Dado que cada componente Ax , Ay , Az de A puede
ser positiva o negativa, dividimos el espacio en 8 regiones llamadas octantes, en la figura
4.24 se muestra una caja rectangular ubicada en el primer octante (x, y, z ≥ 0).
O
P b
Q y
Figura 4.24: Magnitud o norma de un vector en el espacio
La diagonal de esta caja, el segmento que va del origen a el punto A, es la magnitud del
vector A, que vendrı́a a ser la hipotenusa del triángulo rectángulo △OQA. Por el Teorema
de Pitágoras tenemos que
kAk2 = |OA|2
= |OQ|2 + |QA|2
= |OQ|2 + A2z .
Como el punto Q tiene coordenadas (Ax , Ay , 0), de nuevo por el Teorema de Pitágoras, esta
vez aplicado en el triángulo △OP Q obtenemos que
|OQ|2 = |OP |2 + |P Q|2

= A2x + A2y .
154
Por lo tanto, tenemos que la magnitud del vector A está dada por
q
kAk = A2x + A2y + A2z .
Utilizando la noción de norma de un vector junto con el concepto de vector geométrico

podemos establecer una fórmula para la distancia entre dos puntos en el espacio.
Teorema 4.10.1. Sean P = (x1 , x2 , x3 ) y Q = (y1 , y2 , y3 ) dos puntos en el espacio. Entonces

−→
la distancia entre P y Q está dada por la norma del vector geométrico P Q, esto es,
−→ p
d(P, Q) = k P Q k = kQ − P k = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 .
En el caso de R3 no se puede definir la dirección del vector A como el ángulo θ que forma
el vector con el eje x ya que, por ejemplo, si 0 < θ < π/2, existe un número infinito de
vectores con la misma magnitud que forman el mismo ángulo θ con el eje x, el conjunto de
dichos vectores forman el cono mostrado en la figura 4.25.
θ O
b
θ
y
x
Figura 4.25: Todos los vectores sobre el cono forman un ángulo θ con el eje x
La dirección de un vector en R3 , formalmente se define como sigue
Definición 4.10.1. La dirección de un vector no nulo A en R3 se define como el vector

unitario
A
u= .
kAk
Sin embargo, también podemos definir la dirección de un vector en R3 en términos de

−→
ángulos. Los ángulos α, β y γ que forma el vector A =OA con cada uno de los ejes coorde-
nados, x, y y z son llamados ángulos directores del vector A. Entonces como se muestra
en la figura 4.26 del triángulo rectángulo △OAP tenemos que
x
cos α = .
kAk
155
De manera similar, utilizando los triángulos rectángulos △OAQ y △OAR encontramos que
y z
cos β = , cos γ = .
kAk kAk
Por definición, cada uno de estos ángulos está en el intervalo [0, π]. Los cosenos de estos
ángulos son llamados cosenos directores. Podemos entonces expresar cualquier vector de
R3 en términos de estos cosenos directores
A = (x, y, z) = (kAk cos α, kAk cos β, kAk cos γ). (4.35)
b
R
γ
O A
β
α
P b
x
b
Q
y
Figura 4.26: El vector A forma un ángulo α con lado positivo del eje x, β con el lado positivo
del eje y y γ con el eje positvo del eje z
Se observa que si el vector es unitario tenemos que
A = (cos α, cos β, cos γ).
Además para todo vector A
cos2 α + cos2 β + cos2 γ = 1
4.11. Producto cruz

Como se vio en el ejemplo 4.11 dos puntos determinan completamente una recta. Como
veremos en la sección 4.12 tres puntos no colineales (que no están en la misma recta) de-
terminan completamente un plano. Otra forma de determinar completamente un plano es
teniendo un punto y su vector normal, este último vector podemos compararlo con el vector
156
director para el caso de la recta, pues en cierto sentido da la dirección al plano. Supóngase
que queremos determinar la ecuación un plano π sabiendo que conocemos tres de sus puntos
P , Q y R.
π
P
Q
Figura 4.27: El vector normal al plano π es obtenido como el producto cruz entre los vectores
−→ −→
geométricos P Q y P R
Como se ve en la figura 4.27, n es el vector normal al plano, por lo tanto ha de ser

perpendicular a cualquier vector que este sobre este, en particular debe ser perpendicular
−→ −→
a los vectores geométricos P Q y P R. Si estos vectores tienen coordenadas (a1 , b1 , c1 ) y
(a2 , b2 , c2 ) respectivamente, y las coordenadas del vector n son (a, b, c), entonces tenemos
que
(a1 , b1 , c1 ) · (a, b, c) = 0
(a1 , b1 , c1 ) · (a, b, c) = 0,
o bien

a1 a + b1 b + c1 c = 0
(4.36)
a2 a + b2 b + c2 c = 0
En el sistema (4.36) tomamos como variables las componentes del vector normal a, b y c.
Entonces por la regla de Krammer obtenemos para a y b

−c1 c b1 a1 −c1 c

−c2 c b2 c(b1 c2 − b2 c1 ) a2 −c2 c c(a2 c1 − a1 c2 )
a= = ,b = = ·
a1 b1 a1 b2 − a2 b1 a1 b1 a1 b2 − a2 b1

a2 b2 a2 b2
157
De esta forma vemos que

c(b1 c2 − b2 c1 ) c(a2 c1 − a1 c2 )
n = (a, b, c) = , ,c
a1 b2 − a2 b1 a1 b2 − a2 b1
c
= (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ).
a1 b2 − a2 b1
Ahora bien, como puede comprobarse las ecuaciones que conforman (4.36) se verifican si-
multáneamente si tomamos c = a1 b2 − a2 b1 . Por lo tanto, una solución del sistema (4.36)
está dada por
a = b1 c2 − b2 c1 , b = a2 c1 − a1 c2 y c = a1 b2 − a2 b1 .
Lo que significa que dados dos vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ), el vector
n := (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ),
es perpendicular a ambos, dicho vector se conoce como producto cruz o producto vec-
torial de los vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ).
El análisis hecho anteriormente justifica la siguiente definición.
Definición 4.11.1 (Producto cruz). Sean A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ) dos vectores de

R3 . El producto cruz entre A y B se denota por A × B y define como
A × B = (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ). (4.37)
Si definimos la matriz

a11 a12 a13

A = a1 b1 c1
a b2 c2
2
y desarrollamos su determinante por la primera fila obtenemos
|A| = a11 A11 + a12 A12 + a13 A13

= a11 (b1 c2 − b2 c1 ) + a12 (a2 c1 − a1 c2 ) + a13 (a1 b2 − a2 b1 ).
Vemos que las componentes del producto vectorial son precisamente los cofactores de la
matriz A en el desarrollo anterior, por lo tanto podemos expresar el producto vectorial como
sigue
A × B = (A11 , A12 , A13 ) = A11 i + A12 j + A13 k,
158
donde i, j y k son los vectores coordenados unitarios de R3 . La última expresión para el
producto cruz en términos de estos vectores nos permite escribir

i j k

A × B = a1 b1 c1 (4.38)
a b c
2 2 2
La fórmula (4.38) no solo evita la memorización de la tediosa fórmula en (4.37) si no que es

muy útil a la hora de demostrar las propiedades del producto cruz.
Teorema 4.11.1 (Propiedades del producto cruz). Sean A, B y C vectores en R3 y α
escalar, entonces
(a) A × 0 = 0.
(b) A × B = −B × A (propiedad anticonmutativa para el producto vectorial)
(c) (αA) × B = A × (αB) = α(A × B).
(d) A × (B + C) = A × B + A × C
(propiedad distributiva para el producto vectorial)
(e) (A × B) · C = A · (B × C) (triple producto escalar)
(f ) (A × B) · A = (A × B) · B = 0.
(g) A × B = 0 ⇔ A k B.
(h) kA × Bk2 = kAk2 kBk2 − (A · B)2 (identidad de Lagrange)
Utilizando la identidad de Lagrange podemos demostrar que la magnitud del producto
cruz está dada por
kA × Bk = kAkkBk sen θ (4.39)
donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.
Existe un interpretación interesante de (4.39).
h
θ A
Figura 4.28: El área del paralelogramo determinado por los vectores A y B es igual a la
magnitud del pruducto cruz entre estos vectores.
159
En la figura 4.28 el paralelogramo determinado por los vectores A y B tiene como base
la magnitud del vector A, dado que su altura es h, su área está dada por kAkh, pero
h = kBk sen θ.
Entonces el área del paralelogramo es kAkkBk sen θ, que es precisamente la magnitud del
producto cruz entre A y B. Concluimos que:
El área del paralelogramo determinado por los vectores A y B es igual a la magnitud del
producto cruz entre ellos.
Combinando (4.38) y (4.39) podemos hacer una interpretación geométrica del determi-
nante de tamaño 2 × 2 (ver sección 2.2). Supongamos que el paralelogramo de la figura 4.28
está dispuesto sobre el plano xy, y que los vectores A y B tienen componentes (a, c, 0) y
(b, d, 0) respectivamente. Entonces el producto cruz entre estos vectores es

i j k

A × B = a c 0 = i(0) − j(0) + k(ad − bc) = (0, 0, ad − bc).
b d 0
Con lo cual,
kA × Bk = |ad − bc|
La parte derecha de la ecuación anterior, es el valor absoluto del determinante de la matriz

a b
A :=
c d
Concluimos que el área del paralelogramo determinado por los vectores A y B es igual
al determinante de la matriz formada por estos, vistos como vectores columna.
4.12. Rectas y planos en el espacio

Como se menciono en la sección 4.7.1 mediante métodos vectoriales se puede extender
la noción de recta a Rn . En particular para el caso de R3 la ecuación vectorial de la recta
viene dada en la forma
P = P0 + tv, (4.40)
donde P = (x, y, z) es un punto arbitrario de la recta, P0 = (x0 , y0 , z0 ) un punto dado

y v = (v1 , v2 , v3 ) es el vector director. Con la ecuación vectorial podemos encontrar las
ecuaciones paramétricas y simétricas de la recta
160

 x = x(t) = x0 + tv1
y = y(t) = y0 + tv2 (Ecuaciones paramétricas de la recta)
z = z(t) = z0 + tv3

x − x0 y − y0 z − z0
= = (Ecuaciones simétricas de la recta)
v1 v2 v3
Las nociones de paralelismo y ortogonalidad entre rectas vienen dadas en términos de los
vectores directores.
Definición 4.12.1. Sean l1 y l2 rectas, con respectivos vectores directores v1 y v2 , entonces
l1 k l2 ⇔ v1 k v2 y l1 ⊥ l2 ⇔ v1 ⊥ v2 .
Ejemplo 4.16. Determine si las rectas
x = 3 + 2t, y = 4 − 3t, z = 5 + 4t y x = 1 − 2s, y = 7 + 4s, z = 1 − 3s.
son paralelas o perpendiculares, o ninguna de las dos.
Solución. Mostraremos que las rectas dadas no son paralelas, encontrando su punto de
corte. Si las rectas se cortan en un punto de coordenadas (x, y, z) se debe cumplir que

 3 + 2t = 1 − 2s
4 − 3t = 7 + 4s
5 + 4t = 1 − 3s

Despejando t en la primera ecuación obtenemos t = −(s+1), reemplazando este resultado

en la segunda ecuación nos da 4 + 3(s + 1) = 7 + 4s. De donde, s = 0, entonces t = −(0 + 1) =
−1. Si resulta que para los valores s = 0, t = −1, la tercera ecuación se satisface, quiere decir
que las rectas se cortan, lo cual en efecto ocurre, pues 5 + 4(−1) = 1 − 3(0). Concluimos que
las rectas se cortan en el punto
(x, y, z) = (1 − 2(0), 7 + 4(0), 1 − 3(0)) = (1, 7, 1).
En consecuencia, las rectas no son paralelas. Para ver si son perpendiculares, nótese que para
la recta de parámetro t el vector director es v1 = (2, −3, 4), mientras que para la recta de
parámetro s, tenemos que v2 = (−2, 4, −3) es el vector director. Dado que
v1 · v2 = (2, −3, 4) · (−2, 4, −3) = −4 − 12 − 12 6= 0,
los vectores directores no son perpendiculares, por lo tanto, las rectas no son perpendiculares.
161
Ecuación cartesiana del plano
Sea P0 = (x0 , y0, z0 ) un punto dado del plano π (ver la figura 4.29).
P0
−→
π n P0 P
x
y
Figura 4.29: Un punto y el vector normal al plano lo determinan completamente.
y P = (x, y, z) un punto arbitrario de π, si n = (a, b, c) denota el vector normal al plano,

−→
como el vector geométrico P0 P está sobre éste, tenemos que
−→
P0 P ·n = 0
Al expresar cada vector en términos de sus componentes, obtenemos

−→
P0 P ·n = (P − P0 ) · (a, b, c) ⇔ (x − x0 , y − y0 , z − z0 ) · (a, b, c) = 0
⇔ a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0
⇔ ax + by + cz = ax0 + by0 + cz0 .
Con lo cual vemos que, la ecuación de un plano π que pasa por un punto P0 = (x0 , y0 , z0 ) y
cuyo vector normal es n = (a, b, c) está dada por
ax + by + cz = ax0 + by0 + cz0 (4.41)
Lamamos a (4.41) ecuación cartesiana del plano, muchas veces esta ecuación viene dada
en la forma
ax + by + cz + d = 0,
donde d = −(ax0 + by0 + cz0 ). Definimos entonces el plano π como el subconjunto de puntos
de R3 dado por
π = (x, y, z) ∈ R3 : ax + by + cz + d = 0

162
Como se menciono en el sección 4.11, el vector normal n es el que le da la dirección al plano
π, por lo que las nociones de orgonalidad y paralelismo de planos vienen dadas en términos
de sus vectores normales.
Definición 4.12.2. Sean π1 y π2 planos, con respectivos vectores normales n1 y n2 , entonces
π1 k π2 ⇔ n1 k n2 y π1 ⊥ π2 ⇔ n1 ⊥ n2 .
Problema 4.12.1. Demuestre que las rectas
x = a1 s + b1 , y = a2 s + b2 , z = a3 s + b3 , s ∈ R,
x = c1 t + d1 , y = c2 t + d2 , z = c3 t + d3 , t ∈ R,
se cortan o son paralelas si y sólo si

a1 c1 b1 − d1

a2 c2 b2 − d2 = 0.

a c b − d
3 3 3 3
Solución. Supongamos que las rectas se cortan en un punto P .
z
n = v1 × v2
v1 v2
P
P0 Q0
L1 L2
x y
Figura 4.30: Dos rectas que se cortan en un punto P determinan un plano.
Denotemos por L1 , a la recta de parámetro s, y por L2 , a la recta de parámetro t, entonces
L1 = {α(s) : s ∈ R} y L2 = {β(t) : t ∈ R} ,
donde respectivamente tenemos que
α(s) = P0 + sv1 , β(t) = Q0 + tv2 .
Vemos que en el enunciado del problema nos dan la forma paramétrica de las rectas, a partir
de esta forma, para la recta L1 , obtenemos la forma vectorial como sigue:
α(s) = (x, y, z) = (a1 s + b1 , a2 s + b2 , a3 s + b3 ) = (b1 , b2 , b3 ) + s(a1 , a2 , a3 ) = P0 + sv1 .
163
Es decir, la recta L1 pasa por el punto P0 = (b1 , b2 , b3 ) y tiene vector director v1 = (a1 , a2 , a3 ).
De manera similar, la recta L2 pasa por el punto Q0 = (d1 , d2 , d3) y tiene vector director
v2 = (c1 , c2 , c3 ). Como las rectas se cortan, sus vectores directores determinan un plano,
cuyo vector normal está dado por n = v1 × v2 (ver la figura 4.30). Además, éste plano pasa
−→
por los puntos P0 y Q0 , por lo que, el vector geométrico Q0 P0 está sobre éste, de tal forma
que
−→
Q0 P0 ·n = 0
Ahora, expresando los vectores en términos de las componentes y realizando el producto cruz
entre los vectores v1 , v2 por la primera fila obtenemos
−→
Q0 P0 ·n = 0 ⇔ (P0 − Q0 ) · v1 × v2 = 0
⇔ (b1 − d1 , b2 − d2 , b3 − d3 ) · (A11 , A12 , A13 ) = 0
⇔ (b1 − d1 )A11 + (b2 − d2 )A12 + (b3 − d3 )A13 = 0
Nótese que el escalar (b1 − d1 )A11 + (b2 − d2 )A12 + (b3 − d3 )A13 representa la expansión por
cofactores a través de la primera fila de la matriz
b1 − d1 b2 − d2 b3 − d3
 
 a1 a2 a3  .
c1 c2 c3
−→
Por lo tanto, si Q0 P0 ·n = 0, entonces

b1 − d1 b2 − d2 b3 − d3

a1
a2 a3 = 0.
c c2 c3
1
Pero el determinante de una matriz es igual al determinante de su matriz transpuesta, por

lo que,

b1 − d1 a1 c1

b2 − d2 a2 c2 = 0.

b − d a c3
3 3 3
En consecuencia la primera parte de la primera implicación se tiene, ya que una doble

aplicación del Teorema 2.3.5 nos permite concluir que

b1 − d1 a1 c1 a1 b1 − d1 c1 a1 c1 b1 − d1

b2 − d2 a2 c2 = (−1) a2 b2 − d2 c2 = (−1)(−1) a2 c2 b2 − d2 .

b − d a c a b − d c a c b − d
3 3 3 3 3 3 3 3 3 3 3 3
164
Por lo tanto,

a1 c1 b1 − d1

a2 c2 b2 − d2 = 0.

a c b − d
3 3 3 3
Ahora supongamos que las rectas L1 y L2 son paralelas.
z
−→
n = v1 × P0 Q0
v2
−→
P0 Q0 Q0
L2
P0
v1
L1
x y
Figura 4.31: Dos rectas paralelas determinan un plano.

−→
Consideraremos los vectores v1 , y el vector geométrico P0 Q0 . Nótese que estos vectores
no pueden ser paralelos tal como se muestra en la figura 4.31, por que si ası́ fuera, tendrı́amos
−→
que v2 kP0 Q0 , ya que v1 k v2 . Esto implicarı́a que P0 ∈ L2 contradiciendo el hecho de que
−→
L1 k L2 . Entonces los vectores v1 , P0 Q0 determinan un plano cuyo vector normal está dado
por
−→
n = v1 × P0 Q0 .
Dado que el vector v2 está sobre este plano, tenemos que

−→
v2 · v1 × P0 Q0 = v2 · n = 0.
Además, en la primera parte de la primera implicación se demostró que

a1 c1 b1 − d1
−→
Q0 P0 ·v1 × v2 = a2 c2 b2 − d2 ,
a c b − d
3 3 3 3
y por la propiedad (e) del Teorema 4.11.1

−→ −→
v2 · v1 × P0 Q0 = v2 × v1 · P0 Q0
165
−→
El producto punto es conmutativo y el producto cruz anticonmutativo, además, P0 Q0 =
−→
− Q0 P0 , entonces
−→ −→ −→ −→
v2 × v1 · P0 Q0 =P0 Q0 ·v2 × v1 = − Q0 P0 · (−v1 × v2 ) =Q0 P0 ·v1 × v2 .
De esta forma, si suponemos que las rectas L1 y L2 son paralelas, tenemos que
−→ −→ −→
0 = v2 · n = v2 · v1 × P0 Q0 = v2 × v1 · P0 Q0 =Q0 P0 ·v1 × v2

a1 c1 b1 − d1

= a2 c2 b2 − d2
a c b − d
3 3 3 3
Lo cual demuestra la segunda parte la primera implicación.
Para demostrar la segunda implicación, asumamos que

a1 c1
b1 − d1
a2 c2
b2 − d2 = 0.
a c
3 3 b3 − d3
Entonces

a1 c1 b1 − d1
−→
0 = a2 c2 b2 − d2 =Q0 P0 ·v1 × v2 .
a c b − d
3 3 3 3
Ahora bien, si v1 × v2 = 0, v1 k v2 y por lo tanto L1 k L2 . Alternativamente, si v1 × v2 6= 0,

los vectores directores v1 , v2 determinan un plano π, cuyo vector normal es
n = v1 × v2 ,
estos vectores tienen como punto inicial un punto P (ver la figura 4.30), y como
−→
Q0 P0 ·v1 × v2 = 0,
−→
el vector geométrico Q0 P0 está sobre π, de tal forma que dicho plano pasa por los puntos P0
y Q0 , en consecuencia, los vectores geométricos
−→ −→
P0 P y Q0 P ,
están sobre π, por lo que

−→ −→
P0 P ·v1 × v2 = 0 y Q0 P ·v1 × v2 = 0,
166
−→
resulta entonces que P0 P ⊥ v1 × v2 , pero por las propiedades del producto cruz, v1 , v2 ⊥
−→ −→
v1 × v2 , de modo que P0 P k v1 , ya que, los tres vectores: v1 , v2 y P0 P , están sobre el mismo
plano. Pero, esto último implica que existe s1 ∈ R tal que
−→
P0 P = s1 v1 ,
−→
esto es, P = P0 + s1 v1 , lo cual significa que P ∈ L1 . De manera similar, dado que Q0 P k v2
t1 ∈ R tal que
−→
Q0 P = t1 v2 ,
significando esto que P = Q0 + t1 v2 , es decir P ∈ L2 . Se concluye que las rectas L1 , L2 se
cortan en el punto P .
Ecuación vectorial del plano

En la ecuación vectorial de una recta L:
P = α(s) = P0 + sv1 ,
el punto P0 y el vector director v1 son dados, de tal forma que al variar el parámetro s
sobre todos los números reales generamos cualquier punto P de la recta L, mostrando ası́,
que para determinar completamente una recta es suficiente con un parámetro. Como vimos
en el Problema 4.12.1 dos rectas que se cortan en un punto P determinan un plano. Vemos
entonces que para determinar completamente un plano son necesarios dos parámetros.
b
B A
P0 sA
tB
π
P
x y
Figura 4.32: Plano que pasa por P0 , generado por los vectores A y B
En la figura 4.32 el plano π pasa por el punto P0 y es generado por la vectores A y B,

−→
de modo que, si P es un arbitrario del plano, el vector geométrico P0 P es obtenido como la
suma vectorial de sA y tB. Esto es,
−→
P0 P = sA + tB,
167
o bien,
P = P0 + sA + tB (4.42)
La ecuación (4.42) llamada (ecuación vectorial, o paramétrica del plano) nos dice que
al variar los parámetros s y t sobre todos los números reales, generamos cualquier punto P
del plano π. De esta forma vemos que
π = {π(s, t) : s, t ∈ R} = (x, y, z) ∈ R3 : (x, y, z) = P0 + sA + tB : s, t ∈ R .

En consecuencia, la parametrización del plano π está dada por
P = π(s, t) = P0 + sA + tB, s, t ∈ R.
Ejemplo 4.17. Encuentre la intersección entre el plano π1 que pasa por (1, 1, 1) y es gene-
rado por los vectores (2, −1, 3) y (−1, 0, 2), y el plano π2 que pasa por (2, 3, 1) y es generado
por los vectores (1, 2, 3) y (3, 2, 1).
Solución. Las respectivas ecuaciones vectoriales para los planos π1 y π2 son
π1 (s, t) = (1, 1, 1) + s(2, −1, 3) + t(−1, 0, 2), π2 (p, q) = (2, 3, 1) + p(1, 2, 3) + q(3, 2, 1).
De tal forma que si (x, y, z) ∈ π1 , entonces
x = 1 + 2s − t, y = 1 − s, z = 1 + 3s + 2t.
Estas ecuaciones son llamadas ecuaciones paramétricas del plano. Ahora, para hallar la
ecuación cartesiana de este, una de las formas de proceder es eliminar los parámetros s y t
de las ecuaciones paramétricas. Al despejar el parámetro s en la ecuación para y obtenemos
s = 1 − y. Reemplazando este valor en la ecuación para x
x = 1 + 2(1 − y) − t.
De la ecuación anterior despejando t obtenemos t = 1 + 2(1 − y) − x. Ya tenemos los

parámetros s, t como función de y y x, al sustituirlos en la ecuación para z nos da
z = 1 + 3(1 − y) + 2(1 + 2(1 − y) − x) = 10 − 7y − 2x.
Luego la ecuación cartesiana de π1 es
2x + 7y + z = 10.
Otra forma de hallar la ecuación cartesiana de un plano dada su forma paramétrica, es la

que utilizaremos a continuación con π2 . Como el plano es generado por los vectores (1, 2, 3)
168
y (3, 2, 1) su vector normal es obtenido como el producto cruz entre estos (ver el Problema
4.12.1), es decir,

i j k

n2 = (1, 2, 3) × (3, 2, 1) = 1 2 3 = i(−4) − j(−8) + k(−4) = (−4, 8, −4) = 4(−1, 2, −1).
3 2 1
Como además, π2 pasa por (2, 3, 1), podemos utilizar la fórmula (4.41) para obtener
(−1)x + (2)y + (−1)z = (−1)2 + (2)3 + (−1)1,
de donde la ecuación cartesiana de π2 es
x − 2y + z = −3.
4.13. Aplicaciones de los vectores en el espacio

4.13.1. Movimiento en tres dimensiones
Cuando una partı́cula se desplaza en tres dimensiones su movimiento es modelado me-
diante una función vectorial
α(t) = (x(t), y(t), z(t)) = (x, y, z).
Para cada valor de t

√
Problema 4.13.1. Una partı́cula se lanza desde el plano x + y − 3z = 2 en el punto
√
(1, 1, 3) en dirección normal a este en el tiempo t = 0 con una rapidez de 10 unidades por
segundo ¿Cuándo y dónde cruza el plano xy?
4.14. Problemas
Vectores en el plano
Problema 4.14.1. De las siguientes afirmaciones, demuestre las que son verdaderas y de
un contraejemplo para las que son falsas
(a) Sean A, B vectores de Rn . Los vectores kAkB+kBkA y kAkB−kBkA son ortogonales.
(b) Los vectores A − B y A + B son ortogonales.
169
(c) Sean A, B vectores de Rn . Entonces
1 1
A · B = kA + Bk − kA − Bk
4 4
(d) Sean A, B vectores de Rn . Entonces
kA + Bk2 + kA − Bk2 = 2(kAk2 + kBk2 )
(e) Sean A, B vectores de R2 . El vector kBkA + kAkB biseca al ángulo entre A y B.
(f) Si A = (2, k) y B = (3, 5) existe valores de k tales que el ángulo entre A y B es π/4.
(g) Sean A, B vectores de R2 . Si el ángulo entre A y C es igual al ángulo entre B y C,

entonces el vector C es ortogonal al vector kBkA − kAkB.
Problema 4.14.2. Sea A = (a, b) un vector de R2 . Si la magnitud de A se define por
kAk = |a| + |b|.
Demostrar k · k define una norma. Es decir, satisface las propiedades de (a) hasta (f) del
Teorema 3.1.2.
Problema 4.14.3. Sean A = (1, 2) y B = (3, 4). Dado (x, y) en R2 , encuentre escalares α
y β, que dependan de x, y tales que
(x, y) = αA + βB
(x, y)
b
O
x
Figura 4.33: En la figura: A = (4, 1) y B = (2, 4). Si se quiere expresar (x, y) = (3, 5/2)
como combinación lineal de A y B, escogemos α = 1/2 y β = 1/2 y de esta forma vemos
que (x, y) = (1/2)A + (1/2)B.
Movimiento en una dimensión

170
Problema 4.14.4. La altura de una partı́cula en función del tiempo viene dada por la
parábola
y = y(t)
101,25
50
x
O 9 9
2
Figura 4.34: Gráfica de la posición de una partı́cula respecto al tiempo
(a) Utilizar la gráfica que se muestra el la figura 4.34 para hallar el domino de la función
que representa la altura de la partı́cula como función del tiempo, ¿qué representa este
dominio?
(b) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.
(c) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.
(d) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.
Problema 4.14.5. La altura de una partı́cula en función del tiempo viene dada por la
parábola
171
y = y(t)
500
250
x
O 10 20
(a) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.
(b) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.
(c) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.
Sección 4.9. Movimiento en el plano

Problema 4.14.6. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).
(a) Halle el vector posición de un punto de su borde, si está inicialmente en O.
(b) Halle las componentes de la velocidad y aceleración del punto.
(c) Dibuje la velocidad y la aceleración del punto.
(d) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.
Problema 4.14.7. La posición de una partı́cula en el momento t está dada por elipse
x2 y 2
+ = 1.
9 4
172
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por
x2 + y 2 + 6x − 2y = −9
Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.
(a) Halle el vector posición para ambas partı́culas.
(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?
(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.
x2 y 2
+ = 1.
9 4
x2 + y 2 − 6x − 2y = −9.
Esta segunda partı́cula empieza su movimiento en el punto (4, 1) y sigue la dirección contraria
de las manecillas del reloj completando una revolución.
(a) Halle el vector posición para ambas partı́culas
Problema 4.14.9. La posición de una partı́cula en el momento t está dada por
x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π
y una segunda partı́cula tiene posición
x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π
(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?
173
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión
(c) Describa la situación si la segunda partı́cula tiene la trayectoria
x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.
Problema 4.14.10 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m
y la parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta
completa cada 20s, determine el vector posición de una persona que va sentada en la rueda.
Suponga que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta
moviendo la persona?
Problema 4.14.11. Suponga que ajusta la boquilla de una manguera para que el agua salga
más rápido. La boquilla de la manguera se encuentra a 1,8m del suelo, y mientras el agua
sale rápidamente de esta, 2,5s se escucha cuando golpea el suelo. Cuál es la velocidad del
agua, cuando esta deja la boquilla?
Problema 4.14.12. Una osada nadadora se lanza desde un risco con un impulso horizontal.
Si el risco tiene una altura H0 y en la parte inferior hay una saliente de roca, cuya extensión
horizontal es de x0 , cual debe ser la velocidad inicial para que la nadadora no choque con la
roca y caiga directamente sobre el agua?
Problema 4.14.13. Una rueda de la fortuna de 14,0m de radio gira sobre un eje horizontal
en el centro. La rapidez lineal de un pasajero en el borde es constante igual a 7,00m/s. ¿Qué
magnitud y dirección tiene la aceleración del pasajero al pasar
(a) Por el punto más bajo de su movimiento circular?
(b) Por el punto más alto de su movimiento circular?
(c) ¿Cuánto tarda una revolución de la rueda?
Problema 4.14.14. Una rueda de la fortuna de 14,0m de radio que gira en sentido antiho-
rario, se acaba de poner en movimiento. En un instante dado, un pasajero en el borde de la
rueda que está pasando por el punto más bajo de su movimiento circular tiene una rapidez
de 3,00m/s, la cual está aumentando a razón de 0,500m/s2 .
(a) Calcule la magnitud y la dirección de la aceleración del pasajero en este instante.
(b) Dibuje la rueda de la fortuna y el pasajero mostrando sus vectores de velocidad y ace-
leración.
Problema 4.14.15. Remı́tase al problema 4.9.3.
174
(a) Qué ángulo φ da el alcance máximo sobre la rampa?
(b) Un arquero parado en un terreno con inclinación ascendente constante de 30◦ apunta
hacia un blanco situado 60,0m más arriba del plano. La flecha en el arco y el centro del
blanco están ambos a 1,50m sobre el suelo. Justo al salir del arco, la rapidez inicial de
la flecha es de 32,0m/s. ¿Con qué ángulo sobre la horizontal debe apuntar el arquero
para dar en el blanco? Si hay dos ángulos, calcule el menor. Tal vez necesite resolver
la ecuación del ángulo por iteración, es decir, ensayo y error. Compare el ángulo con
el que se necesita cuando el suelo está horizontal.
(c) Repita con una pendiente constante hacia abajo de 30◦ .
Problema 4.14.16. Un cohete diseñado para colocar cargas pequeñas en órbita se lleva hasta
una altitud de 12,0km sobre el nivel del mar, montado en un avión comercial convertido.
Cuando el avión está volando en lı́nea recta, con rapidez constante de 850km/h, deja caer
el cohete. Después, el avión mantiene la misma altitud y rapidez, y sigue volando en lı́nea
recta. El cohete cae durante un lapso corto, después del cual se enciende el motor. A partir
de ese momento, los efectos combinados del empuje y la gravedad imparten al cohete una
aceleración constante de magnitud 3,00g dirigida con un ángulo de 30◦ arriba de la horizontal.
Por motivos de seguridad, el cohete deberá estar por lo menos a 1,00km adelante del avión
cuando vuelva a alcanzar la altitud de éste. Hay que determinar el tiempo mı́nimo que el
cohete debe caer antes de que su motor se encienda. Se puede ignorar la resistencia del aire.
La respuesta debe incluir i) un diagrama que muestre las trayectorias de vuelo del cohete y del
avión, rotuladas en varios puntos con vectores que representen su velocidad y su aceleración;
ii) una gráfica x − t que muestre los movimientos del cohete y del avión; y iii) una gráfica
y − t que muestre los movimientos del cohete y del avión. En el diagrama y las gráficas,
indique los momentos cuando el cohete se deja caer, el motor del cohete se enciende y el
cohete en ascenso alcanza la altura del avión.
Problema 4.14.17. Dos estudiantes pasean en canoa por un rı́o. Yendo rı́o arriba, dejan
caer accidentalmente una botella vacı́a al agua, después de lo cual reman durante 60 minutos
hasta llegar a un punto a 2,0km rı́o arriba. En ese momento, se dan cuenta de que la botella
no está y, preocupados por la ecologı́a, se dan vuelta y reman rı́o abajo. Alcanzan la botella
(que se ha estado moviendo con la corriente) 5,0km rı́o abajo del punto donde se dieron la
vuelta, y la recogen. a) Suponiendo un esfuerzo de paleo constante todo el tiempo, ¿con qué
rapidez fluye el rı́o? b) ¿Qué rapidez tendrı́a la canoa en un lago tranquilo con el mismo
esfuerzo de paleo?
Problema 4.14.18. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en direc-

ción contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando
175
√ √
su movimiento en el punto (1/ 2, 1/ 2) y terminando en el punto (1, 0). Calcular el trabajo
que realiza el campo de fuerza
F(x, y) = (−2y, 2x)
sobre la partı́cula. Dibujar el vector posición, el vector tangente y el vector fuerza.
Problema 4.14.19 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en

dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa. Resuelva este problema de dos formas distintas.
Subsección 3.2.1. Vector resultante

Problema 4.14.20 (Navegación: dirección y rumbo). Un piloto parte de un aeropuerto y
se dirige en dirección N 20◦ E, volando con una rapidez de 200 mi/h. Después de una hora
hace una corrección de curso y se dirige en la dirección N 40◦ E. Media hora después, un
problema en el motor obliga a hacer un aterrizaje de emergencia.
(a) Encuentre la distancia entre el aeropuerto y su punto de aterrizaje final.
(b) Encuentre el rumbo desde aeropuerto hasta su punto final de aterrizaje.
Problema 4.14.21. Sean A y B dos vectores de R2 . Utilizar el teorema del coseno (ver
ejemplo 2.2) para demostrar que
kRk2 = kA + Bk2 = kAk2 + kBk2 + 2kAkkBk cos θ, (4.43)
donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Hacer las gráfica correspondiente.
Subsección 3.5. Movimiento relativo

Problema 4.14.22 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?
Problema 4.14.23 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.
(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.
176
(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.
(d) Determine la rapidez y dirección verdaderas del bote.
Problema 4.14.24 (Velocidad de un bote). El navegador del problema 4.14.23 quiere llegar
a un punto en la orilla norte del rı́o directamente opuesto la punto de partida. ¿En qué
dirección debe dirigir el bote?
Sección 4.10. Vectores en el espacio

Problema 4.14.25. Sean A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) y C = (c1 , c2 , c3 ), D = (d1 , d2 , d3 )
−→ −→
puntos de R3 . Demuestre que si los vectores geométricos AB y CD tienen como dirección un
vector unitario u, y además tienen la misma magnitud, entonces son equivalentes. Use este
hecho para demostrar que todo vector cuyo punto inicial coincide con el origen, y punto final
A tiene coordenadas (a, b, c) es equivalente a cualquier vector geométrico que tenga la misma
−→
magnitud y dirección que este. Es decir, si el vector geométrico CD donde C = (c1 , c2 , c3 ) y
−→
D = (d1 , d2 , d3 ) tiene la misma magnitud y dirección que el vector OA= (a, b, c), entonces
−→ −→
A =OA=CD .
Sección 4.11. Producto cruz

Problema 4.14.26 (Examen conjunto de Álgebra lineal 6 de junio de 2018 punto 10).
En la plazoleta principal de la Universidad se quiere construir en centro de descanso para
los estudiantes. La plazoleta tendrá un techo cubierto en forma triangular. El ingeniero
encargado ubicó los soportes en los puntos A = (2, 3, 3), B = (5, 6, 4) y C = (3, 6, 8) con
cada entrada medida en metros.
(a) El techo se sostendrá con alambre de acero, indique la cantidad de alambre que se
necesita para sostener el techo.
(b) El techo utilizará una lona de color blanco, indique la cantidad de metros cuadrados
empleados en el techo.
Problema 4.14.27. Demuestre que si u, v, w y r son vectores en el espacio, entonces
(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.
177
(b) u × v = (u · v × i)i + (u · v × j)j + (u · v × k)k.

u · w v · w
(c) (u × v) · (w × r) = .
u·r v ·r
Problema 4.14.28. Utilice el producto cruz para demostrar que
sen(A − B) = sen A cos B − sen B cos A.
Sección 4.12. Rectas y planos en el espacio

Problema 4.14.29. Utilice el Teorema 5.5.1 para demostrar que los tres puntos, (1, 2, 1),
(0, 1, 0) y (1, 1, 4) determinan un plano. Hallar la ecuación vectorial y cartesiana de dicho
plano.
Problema 4.14.30. Calcule la distancia entre las rectas
x − b1 y − b2 z − b3 x − d1 y − d2 z − d3
L1 : = = y L2 : = =
a1 a2 a3 c1 c2 c3
Sugerencia: La distancia se mide a lo largo del vector v que es perpendicular a L1 y a L2 .
−→
Sea P un punto de L1 y Q un punto de L2 . Entonces la longitud de la proyección de P Q
sobre v es la distancia entre las rectas, medida a lo largo del vector que es perpendicular a
ambas.
Problema 4.14.31. Demuestre que la distancia del punto P0 = (x0 , y0, z0 ) al plano
π = (x, y, z) ∈ R3 : ax + by + cz + d = 0 ,

está dada por

|ax0 + by0 + cz0 + d|
dmı́n = √ .
a2 + b2 + c2
Problema 4.14.32. Demuestre que

x1 − x y1 − y z1 − z

x2 − x y2 − y z2 − z = 0

x − x y − y z − z
3 3 3
es una ecuación del plano que pasa por los tres puntos no colineales
P1 (x1 , y1, z1 ), P2 (x2 , y2, z2 ) y P3 (x3 , y3 , z3 ).
Sección 4.13. Aplicaciones de los vectores en el espacio

Problema 4.14.33 (***). Una partı́cula se desplaza sobre la curva de intersección de las
√
superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.
178
Problema 4.15.1 (Velocidad de un avión respecto a la tierra). Encuentre la rapidez y
dirección verdaderas del avión del problema 3.3.1 si el piloto dirige el avión en la dirección
N 30◦ O.
Problema 4.15.2 (Velocidad de un avión respecto a la tierra). ¿En qué dirección debe
dirigir el avión el piloto del problema 3.3.1 para que el curso verdadero sea al norte?
Problema 4.15.3. De las siguientes afirmaciones, demuestre las que son verdaderas y de
un contraejemplo para las que son falsas
(a) Sean A, B vectores de Rn . Los vectores kAkB+kBkA y kAkB−kBkA son ortogonales.
(b) Los vectores A − B y A + B son ortogonales.
(c) Sean A, B vectores de Rn . Entonces

1 1
A · B = kA + Bk − kA − Bk
4 4
(d) Sean A, B vectores de Rn . Entonces
kA + Bk2 + kA − Bk2 = 2(kAk2 + kBk2 )
(e) Sean A, B vectores de R2 . El vector kBkA + kAkB biseca al ángulo entre A y B.
(f) Si A = (2, k) y B = (3, 5) existe valores de k tales que el ángulo entre A y B es π/4.
(g) Sean A, B vectores de R2 . Si el ángulo entre A y C es igual al ángulo entre B y C,

entonces el vector C es ortogonal al vector kBkA − kAkB.
Problema 4.15.4. Sea A = (a, b) un vector de R2 . Si la magnitud de A se define por
kAk = |a| + |b|.
Demostrar k · k define una norma. Es decir, satisface las propiedades de (a) hasta (f) del
Teorema 3.1.2.
Problema 4.15.5. En la figura 4.35 considere un peso suspendido por dos alambres. Obtenga
la magnitud y componentes de los vectores F1 y F2 , y los ángulos α y β. Ver el problema
4.9.4.
179
5m
α β
F1 F2
3m
4m
100N
Figura 4.35: Una masa de peso 100N es suspendida por dos alambres representados por los
vectores F1 y F2
Recuerde que 1N = 1Kg · m/s2 .

Problema 4.15.6 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?
Problema 4.15.7 (***). Un piloto tiene que volar hacia el este de A a B y después regresar
hacia el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto
a la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.
(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c
(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2
(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2
(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?
Ver el problema 3.5.1 para solución del caso 1 del inciso (b), y el caso 1 del inciso (c).
180
Problema 4.15.8 (***). Dos nadadores, Alan y Camillé, parten desde el mismo punto en la
orilla de una corriente ancha que circula con una rapidez v. Ambos se mueven con la misma
rapidez c (donde c > v) en relación con el agua. Alan nada corriente abajo una distancia L
y luego corriente arriba la misma distancia. Camillé nada de modo que su movimiento en
relación con la Tierra es perpendicular a las orillas de la corriente. Ella nada la distancia
L y luego de vuelta la misma distancia, de modo que ambos nadadores regresan al punto de
partida. ¿Cuál nadador regresa primero? Sugerencia: Demuestre que si c > v > 0, entonces
√
0 < 1 − v 2 /c2 < 1. Gráfique en un mismo plano cartesiano las funciones y = 1/ x y
y = 1/x para saber que relación de orden guardan en el intervalo (0, 1). Utilice este hecho
para establecer que nadador regresa primero al punto de partida.
Problema 4.15.9 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.
(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.
(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.
(d) Determine la rapidez y dirección verdaderas del bote.
x2 y 2
+ = 1.
9 4
x2 + y 2 + 6x − 2y = −9
181
Problema 4.16.1. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).
(a) Halle el vector posición de un punto P de su borde, si está inicialmente en O.
(b) Halle las componentes de la velocidad y aceleración del punto P .
(c) Muestre que la rapidez del punto P en el instante t está dada por
V0 t
kv(t)k = kα′ (t)k = 2V0 sen .
2R
(d) Dibuje la velocidad y la aceleración del punto.
(e) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.
x2 y 2
+ = 1.
9 4
x2 + y 2 + 6x − 2y = −9
Problema 4.16.3. La posición de una partı́cula en el momento t está dada por
x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π
y una segunda partı́cula tiene posición
x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π
182
(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión
(c) Describa la situación si la segunda partı́cula tiene la trayectoria
x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.
Problema 4.16.4. Una partı́cula se desplaza sobre la circunferencia x2 +y 2 = 4 en dirección

contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando su
movimiento en el punto (2, 0). Una segunda partı́cula su mueve sobre la circunferencia
x2 + y 2 − 4x = 0,
en dirección contraria a las de las manecillas del reloj con una rapidez constante de 4m/s
empezando su movimiento en el punto (4, 0).
(a) Grafique las trayectorias seguidas por ambas partı́culas.
(b) Halle el vector posición de cada partı́cula.
(c) Halle los puntos, o punto de colisión de las partı́culas.
Problema 4.16.5 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en

dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa.
Problema 4.16.6. Una avión tiene una rapidez en el aire de 250mi/h, el piloto desea volar
hacia el norte. Suponiendo que prevalezca un viento de 60mi/h hacia el este,
(a) ¿cuál debe ser el enfilamiento del avión?
(b) ¿Cúal será la rapidez a tierra cuando viaja en dicho curso?.
Problema 4.16.7. Una pelota de golf es golpeada con una rapidez inicial v0 formando un
ángulo α con respecto a la horizontal desde un punto que está al pie de una colina que forma
un ángulo de inclinación φ con la horizontal donde
0 < φ < α < π/2.
183
Demuestre que la pelota toca tierra a una distancia
2v02 cos α
sen(α − φ),
g cos2 φ
medida sobre la colina. Demuestre que el mayor alcance que se puede lograr para un v0 dado
ocurre cuando α = (φ/2) + (π/4); es decir, cuando el vector velocidad inicial biseca el ángulo
entre la vertical y la colina.
Problema 4.16.8. Sean A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) y C = (c1 , c2 , c3 ), D = (d1 , d2 , d3 )

−→ −→
puntos de R3 . Demuestre que si los vectores geométricos AB y CD tienen como dirección un
vector unitario u, y además tienen la misma magnitud, entonces son equivalentes. Use este
hecho para demostrar que todo vector cuyo punto inicial coincide con el origen, y punto final
A tiene coordenadas (a, b, c) es equivalente a cualquier vector geométrico que tenga la misma
−→
magnitud y dirección que este. Es decir, si el vector geométrico CD donde C = (c1 , c2 , c3 ) y
−→
D = (d1 , d2 , d3 ) tiene la misma magnitud y dirección que el vector OA= (a, b, c), entonces
−→ −→
A =OA=CD .
Problema 4.16.9. Demuestre que si u, v, w y r son vectores en el espacio, entonces
(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.
(b) u × v = (u · v × i)i + (u · v × j)j + (u · v × k)k.

u · w v · w
(c) (u × v) · (w × r) = .
u·r v ·r
Problema 4.16.10. Utilice el producto cruz para demostrar que
sen(A − B) = sen A cos B − sen B cos A.
Problema 4.16.11. Utilice el Teorema 5.5.1 para demostrar que los tres puntos, (1, 2, 1),
(0, 1, 0) y (1, 1, 4) determinan un plano. Hallar la ecuación vectorial y cartesiana de dicho
plano.
Problema 4.16.12. Calcule la distancia entre las rectas

x − b1 y − b2 z − b3 x − d1 y − d2 z − d3
L1 : = = y L2 : = =
a1 a2 a3 c1 c2 c3
Sugerencia: La distancia se mide a lo largo del vector v que es perpendicular a L1 y a L2 .
−→
Sea P un punto de L1 y Q un punto de L2 . Entonces la longitud de la proyección de P Q
sobre v es la distancia entre las rectas, medida a lo largo del vector que es perpendicular a
ambas.
184

x1 − x y1 − y z1 − z

x2 − x y2 − y z2 − z = 0

x − x y − y z − z
3 3 3
es una ecuación del plano que pasa por los tres puntos no colineales
P1 (x1 , y1, z1 ), P2 (x2 , y2, z2 ) y P3 (x3 , y3 , z3 ).
Problema 4.16.14. Dos barcos maniobran en la superficie tratando de determinar el curso

y la rapidez de un submarino para preparar un ataque aéreo. El barco A está en (4, 0, 0),
mientras el barco B está en (0, 5, 0). Todas las coordenadas están dadas en miles de pies. El
barco A localiza el submarino en la dirección del vector 2i + 3j − (1/3)k, y el barco B en la
dirección del vector 18i − 6j − k. Cuatro minutos antes, el submarino estaba localizado en
(2, −1, −1/3). Se que el avión para el ataque aéreo llegue en 20 minutos. Si el submarino
se desplaza en linea recta a velocidad constante, ¿a qué posición deben dirigir los barcos el
avión?
√
Problema 4.16.16. Demuestre que la distancia de un punto (x0 , y0 , z0 ) al plano π de ecua-
ción ax + by + cz + d = 0 está dada por
|ax0 + by0 + cz0 |
d= √ .
a2 + b2 + c2
Problema 4.16.17. Una partı́cula sigue la trayectoria dada por la intersección de los planos
x + 2y + 3z = 0
2x − y − z = 0.
La partı́cula pasa por el punto (−1/5, −7/5, 1) en el tiempo t = 0 y tiene una rapidez de 2
metros por segundo. Hallar el vector posición de la partı́cula.
√
Problema 4.16.18. Una partı́cula se lanza desde el plano x + y − 3z = 2 en el punto
√
(1, 1, 3) en dirección normal a este en el tiempo t = 0 con una rapidez de 10 unidades por
segundo ¿Cuándo y dónde cruza el plano xy?
Problema 4.16.19. Una partı́cula parte desde el punto P0 = (2, 3, 4) en dirección normal
al plano x + y + z = 1. La partı́cula corta al plano en un punto P1 después de 3s. Hallar el
vector posición de la partı́cula.
185
4.17. Método de los mı́nimos cuadrados
4.17.1. Punto de vista del cálculo
Supongamos que tenemos un conjunto de n puntos distribuidos en plano xy, generando
lo que se conoce como nube de puntos, o gráfico de dispersión (ver la figura 4.36). El objetivo
es encontrar la ecuación de la recta que mejor ajuste el conjunto de datos, la cual se conoce
como recta de mı́nimos cuadrados o recta de regresión, correspondiente a los datos
(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ), con este fin en mente consideramos cada una de las diferencias,
entre el valor real, y = yi y el valor estimado correspondiente al dato xi , y = y est = axi +b:
ei = yi − y est = yi − (axi + b),
el término ei se denomina residuo y describe el error en el ajuste del modelo en el i–ésimo

punto los datos. Como lo que se quiere, es que el error ei sea el menor posible, es razonable
pensar que la recta que mejor ajusta los datos es aquella que minimiza la suma de los
cuadrados de estos errores. El problema de los mı́nimos cuadrados se puede establecer
entonces como sigue: Encontrar números a y b tales que la suma
S(a, b) = e21 + e22 + · · · + e2n = (y1 − (ax1 + b))2 + (y2 − (ax2 + b))2 + · · · + (yn − (axn + b))2
sea mı́nima.
y
(x3 , y3 ) y = ax + b
b
(x1 , y1 )
b b
(x2 , y2 ) (x3 , ax3 + b)

b
b
(x2 , ax2 + b)
b
(x1 , ax1 + b)
x
O
Figura 4.36: Gráfico de dispersión para una nube de n puntos. En rojo, la recta que mejor
ajusta esta nube puntos
El problema se reduce entonces a encontrar el mı́nimo local de la función S(a, b). Utili-
186
zando la notación sigma tenemos que
n
X
S(a, b) = (axi + b − yi )2 .
i=1
por la linealidad de la derivada y la sumatoria obtenemos que

n
∂S ∂S X
= (axi + b − yi )2
∂a ∂a i=1
n
X ∂S
= (axi + b − yi )2
i=1
∂a
Xn
= 2(axi + b − yi )xi
i=1
n
X n
X n
X
= 2a x2i + 2b xi − 2 xi yi .
i=1 i=1 i=1
Por lo tanto, cuando igualamos a cero, la derivada parcial de la función S respecto a la

variable a obtenemos
n
X Xn Xn
2
2a xi + 2b xi − 2 xi yi = 0 (4.44)
i=1 i=1 i=1
Haciendo lo mismo pero con la derivada parcial de S respecto a la variable b nos da

n
∂S ∂S X
= (axi + b − yi )2
∂b ∂b i=1
n
X ∂S
= (axi + b − yi )2
i=1
∂b
n
X
= 2(axi + b − yi )
i=1
n
X n
X
= 2a x2i + 2bn − 2 yi .
i=1 i=1
Igualando a cero
n
X n
X
2a x2i + 2bn − 2 yi = 0. (4.45)
i=1 i=1
Despejando b en (4.45) obtenemos

n n
1X aX
b= yi − xi = y − ax. (4.46)
n i=1 n i=1
187
Ahora reemplazando la expresión del medio en (4.46) en (4.44)
n
X n
X n
X
2a x2i + 2b xi − 2 xi yi = 0 ⇔
i=1
n n n
!i=1n i=1
n
X 1X aX X X
a x2i+ yi − xi xi − xi yi = 0 ⇔
i=1
n i=1 n i=1 i=1 i=1
n n
!2 n n n
X
2 a X X 1X X
a xi − xi = xi yi − xi yi ⇔
n n
 i=1 i=1
!2 
i=1 i=1 i=1
n n n n n
X
2 1 X X 1X X
a  xi − xi  = xi yi − xi yi
i=1
n i=1 i=1
n i=1 i=1
Ahora, nótese que

Problema 4.17.1. Demuestre que para una muestra de tamaño n > 1 se tiene que
P 1P P
xi yi − xi yi P
(xi − x)(yi − y)
Sxy = n = . (4.47)
n−1 n−1
Utilizando (4.47) demuestre que
1 P 2
x2i −
P
( xi )
Sxx = Sx2 = n . (4.48)
n−1
Demostración. Por la propiedad distributiva y las propiedades del linealidad de la sumatoria
tenemos que
X X
(xi − x)(yi − y) = (xi yi − xi y + xyi − xy)
X X X X
= xi yi − (xi y) − (xyi ) + xy
X X X X X
= xi yi − (1/n) xi yi − (1/n) xi yi + nxy
X X X X X
= xi yi − (2/n) xi yi + (1/n) xi yi
X X X
= xi yi − (1/n) xi yi .
Multiplicando por 1/(n − 1) obtenemos (4.47).

P P
Ahora, supongamos que yi = xi para todo i, entonces xi = yi , x = y. Por lo tanto,
(4.47) nos proporciona la identidad
1 P 2
x2i −
P
( xi ) P
(xi − x)2
n = = Sx2 .
n−1 n−1
188
Nótese, que la parte derecha en la identidad anterior es la varianza muestral, Sx2 , por lo tanto,
si denotamos la parte izquierda por Sxx obtenemos (4.48).
Por lo demostrado en el problema 4.17.1 tenemos la ecuación
a(n − 1)Sx2 = (n − 1)Sxy ,
de donde
Sxy
a= .
Sx2
Luego,
Sxy
a= , b = y − ax
Sx2
es un punto critico para la función S. Demostraremos que este punto critico es un mı́nimo
local. En efecto, la matriz Hessiana para la función S, está dada por

Saa Sab
HS(a, b) =
Sba Sbb ,
donde
n n
∂2S X
2 ∂2S X ∂2S
Saa = =2 xi , Sba = Sab = =2 xi , Sbb = 2 = 2n.
∂a2 i=1
∂a∂b i=1
∂b
Por lo tanto, el determinante de la matriz Hessiana viene dado por

 !2 
Pn 2 Pn n n
Saa Sab 2 i=1 xi 2 i=1 xi X X
|HS(a, b)| = = Pn = 4 n x2i − xi 
Sba Sbb , 2 i=1 xi 2n,
i=1 i=1
Entonces por identidad (4.48) demostrada en el Problema 4.17.1, tenemos que

 !2 
n
X Xn
|HS(a, b)| = 4 n x2i − xi 
i=1 i=1
 !2 
n n
X 1 X
= 4n  x2i − xi 
i=1
n i=1
= 4n(n − 1)Sx2 > 0.

Como
n
∂2S X
|HS(a, b)| > 0 y = 2 x2i > 0,
∂a2 i=1
en (a, b) hay un mı́nimo local, como se querı́a demostrar. Hemos establecido que
189
Teorema 4.17.2. La recta que mejor ajusta el conjunto de datos (x1 , y1 ), . . . , (xn , yn ) en el
sentido de los mı́nimos cuadrados, está dada por y est(x) = ax + b donde
Sxy
a= y b = y − ax,
Sx2
donde la cantidad Sxy denominada covarianza muestral de las variables
X = (x1 , x2 , . . . , xn ), Y = (y1 , y2, . . . , yn ),
está dada por

Pn 1 Pn
( i=1 xi ) ( ni=1 yi )
P
i=1 xi yi − Pn
(xi − x)(yi − y)
Sxy = n = i=1 .
n−1 n−1
Hay una forma de saber, si dadas dos variables X, Y , estás tienen una fuerte relación
lineal, introduciendo lo que se conoce como coeficiente de correlación de las variables
X, Y , el cual viene dado por
Sxy
r= .
Sx Sy
Demostraremos que el coeficiente de correlación r de las variables X, Y siempre varia
entre −1 y 1. Este hecho es una consecuencia de la desigualdad de Cauchy–Schwarz
Teorema 4.17.3 (Desigualdad de Cauchy–Schwarz). Sean
X = (a1 , a2 , . . . , an ), Y = (b1 , b2 , . . . , bn ),
vectores de Rn . Entonces
|X · Y | ≤ kXkkY k. (4.49)
La igualdad en (4.49) se tiene si, y sólo si, existe x ∈ R tal que ai x + bi = 0 para todo
i = 1, 2, . . . , n.
Demostración. Nótese que por definición de producto punto entre vectores, y de magnitud
de un vector, la desigualdad (4.49) es la misma que
v v
Xn u Xn u n
u uX
2t
ai bi ≤ ai b2i (4.50)
t

i=1 i=1 i=1
Además, como la función f (x) := x2 es creciente si x ≥ 0, la desigualdad anterior es equiva-

lente a
n
!2 n n
X X X
ai bi ≤ a2i b2i . (4.51)
i=1 i=1 i=1
190
Para todo x ∈ R tenemos que
n
X
(ai x + bi )2 ≥ 0,
i=1
y por las propiedades de linealidad de la sumatoria

n n
! n
! n
X X X X
2 2 2
(ai x + bi ) = ai x + 2x ai bi + b2i .
i=1 i=1 i=1 i=1
En consecuencia, podemos afirmar que
Ax2 + 2xB + C ≥ 0 ∀x∈R , (4.52)
donde
n
X n
X n
X
A= a2i , B = ai bi y C = b2i
i=1 i=1 i=1
Ahora nótese que si A = 0, entonces ai = 0 para todo i = 1, 2, . . . , n, con lo cual ambos

miembros de (4.49) serian cero, y el resultado se tiene. Alternativamente, si A > 0, tomando
x = −B/A en (4.52) obtenemos que
B 2 ≤ AC.
Es decir, (4.49) se tiene.
Supongamos ahora que ai x + bi = 0 para todo i = 1, 2, . . . , n, entonces Ax2 + 2xB +

C = 0, y tomando x = −B/A, obtenemos que B 2 = AC, que es la igualdad en (4.49).
Recı́procamente, si la igualdad en (4.49) se tiene, esto es, B 2 = AC. Tenemos que
B 2 = AC ⇔ B 2 /A = C
2B 2 B 2
⇔ − =C
A A
2B 2 B 2
⇔− + +C =0
A A
2
−B −B
⇔A +2 B + C = 0.
A A
De lo cual se concluye que Ax2 + 2xB + C = 0 con x = −B/A, o lo que es lo mismo
n
X
(ai x + bi )2 = 0,
i=1
donde x = −B/A. Pero entonces tenemos que ai x + bi = 0 para todo i = 1, 2, . . . , n con

x = −B/A.
191
Ahora en la desigualdad de Cauchy–Schwarz, expresada en la forma (4.50) tomemos
ai = xi − x y bi = yi − y, donde x y y son la medias aritméticas de las variables
X = (x1 , x2 , . . . , xn ), Y = (y1 , y2, . . . , yn ),
respectivamente. La desigualdad que resulta es

v v
Xn u Xn u n
u uX
(xi − x)(yi − y) ≤ (xi − x)2 t (yi − y)2 ,
t

i=1 i=1 i=1
La cual, equivale a
√ √
|(n − 1)Sxy | ≤ n − 1Sx n − 1Sy .
Es decir,

Sxy
|r| = ≤ 1.
Sx Sy
Lo cual implica que −1 ≤ r ≤ 1, como se querı́a demostrar. En el mejor de los casos, todos
los puntos (x1 , y1 ), . . . , (xn , yn ), están sobre la recta de regresión, con lo cual tendrı́amos que
Sxy Sxy
yi = xi + y − x ∀1≤i≤n (4.53)
Sx2 Sx2
Ahora bien, según la demostración de la desigualdad de Cauchy–Schwarz, La igualdad en
(4.49) se tiene si, y sólo si, ai x + bi = 0 para todo i = 1, 2, . . . , n, donde
P
B ai bi
x=− =− P 2 .
A ai
Como estamos suponiendo que ai = xi − x y bi = yi − y, tendrı́amos que si |Sxy | = Sx Sy ,

entonces
P
(xi − x)(yi − y)
− P (xi − x) + yi − y = 0 ∀1≤i≤n ,
(xi − x)2
que es equivalente a (4.53). Es decir, si |r| = 1 todos los puntos (x1 , y1 ), . . . , (xn , yn ), están
sobre la recta de regresión, lo cual implica que si |r| se aproxima a 1, hay una fuerte relación
lineal entre las variables X, Y . En caso contrario, si |r| se aproxima a 0, la relación lineal
entre las variables X, Y es débil. Además, como la pendiente de la recta de regresión se
puede expresar en la forma
Sxy Sy Sxy Sy
a= 2
= · = r.
Sx Sx Sx Sy Sx
192
Concluimos que si r tiende a 1, hay una fuerte relación entre las variables X, Y , y al ser
r > 0, a > 0, lo cual implica que, la variable Y es directamente proporcional a la variable
X. Alternativamente, si r tiende a −1, también hay una fuerte relación entre las variables
X, Y , pero en este caso la variable Y es inversamente proporcional a la variable X, por que
al ser r < 0, la pendiente a es negativa.
Ejemplo 4.18. Una pintura abstracta fue vendida por el autor en 1915 por 100 dólares.
Debido a su importancia histórica, su valor ha venido aumentando al correr los años. Su
valor era 4600 dólares en 1935, de 11000 en 1955, y de 20000 en 1975. Suponiendo que el
valor del cuadro siga subiendo al mismo ritmo, use el método de mı́nimos cuadrados para
estimar su valor en 1995.
Solución. Se observa que en la variable X = (x1 , x2 , x3 , x4 ) los datos están organizados en

progresión aritmética, con x1 = 1915 y razón r = 20, por lo que
xi = 1915 + 20(i − 1) = 1895 + 20i.
Para este caso X, es la variable independiente, y
Y = (y1 , y2 , y3, y4 ) = (100, 4600, 11000, 20000),
la variable dependiente. Para calcular las respectivas desviaciones de las variables X, Y ,

Sx , Sy , ası́ como la covarianza Sxy , empezamos como sigue:
4
X 4
X 4
X 4
X
xi = (1895 + 20i) = 7780, x2i = (1895 + 20i)2 = 15 134 100
i=1 i=1 i=1 i=1
4
X
yi = 100 + 4600 + 11000 + 20000 = 35 700
i=1
X4
yi2 = 1002 + 46002 + 110002 + 200002 = 542 170 000
i=1
4
X
xi yi = 1915 × 100 + 1935 × 4600 + 1955 × 11000 + 1975 × 20000 = 70 097 500
i=1
s s
77802 35 7002
15 134 100 − 4
542 170 000 − 4
Sx = = 25. 820, Sy = = 8632. 3
3 3
7780×35 700
70 097 500 −
Sxy = 4
= 2. 203 3 × 105
3
193
Ahora podemos calcular el coeficiente de correlación
Sxy 2. 203 3 × 105

r= = = 0,988 53
Sx Sy 25. 820 × 8632. 3
Vemos que r es aproximadamente 1, lo cual indica por un lado, que existe una fuerte relación
entre las variables X, Y , y por el otro, que esta relación es positiva, es decir, la variable Y
es directamente proporcional a la variable X, esto es, el precio del cuadro aumenta progre-
sivamente con los años.
La pendiente a, de la recta de regresión, ası́ como las respectivos promedios de la variables

X, Y se calculan a continuación:
2. 203 3 × 105 7780 35 700

a= 2
= 330. 49, x = = 1945,0, y = = 8925,0
25. 820 4 4
Con esto el intercepto b con el eje y de la recta de regresión está dado por
b = y − ax = 8925,0 − 330. 49 × 1945,0 = −6. 338 8 × 105
Por la tanto, la ecuación de la recta de regresión es
y est(x) = ax + b = 330. 49x − 6. 338 8 × 105 .
Para x = 1995 estimamos el valor del libro en
y est(1995) = 330. 49 × (1995) − 6. 338 8 × 105 = 25448.
194
Capı́tulo 5
Espacios vectoriales
5.1. Definición y propiedades

Definición 5.1.1 (Espacio vectorial). Sea V un conjunto no vacı́o de objetos llamados
elementos. El conjunto V es llamado espacio vectorial sobre el campo F si satisface
cada uno de los siguientes diez axiomas
Axioma 5.1.1 (Cerradura respecto a la suma). Para cada par elementos x, y ∈ V corres-
ponde un único elemento de V llamado suma de x, y, denotado por x + y.
Axioma 5.1.2 (Cerradura respecto al producto por escalar). Para cada x ∈ V y cada λ ∈ F
corresponde un único elemento de V llamado producto por escalar entre λ y x, denotado
por λx.
Axiomas para la suma
Axioma 5.1.3 (Ley conmutativa). Para todo x, y ∈ V , tenemos que
x + y = y + x.
Axioma 5.1.4 (Ley asociativa). Para todo x, y, z ∈ V , tenemos que
(x + y) + z = x + (y + z).
Axioma 5.1.5 (Existencia de elemento neutro). Para cada x ∈ V existe 0 ∈ V , tal que
x + 0 = x.
Axioma 5.1.6 (Existencia de inverso aditivo). Para cada x ∈ V existe y ∈ V denotado por
(−1)x tal que
x + (−1)x = 0.
195
Axiomas para el producto por escalar
Axioma 5.1.7 (Ley asociativa). Para x ∈ V y α, β ∈ F , tenemos que
α(βx) = (αβ)x.
Axioma 5.1.8 (Ley distributiva de la suma con respecto al producto por escalar). Para
x, y ∈ V y α ∈ F , tenemos que
α(x + y) = αx + αy.
Axioma 5.1.9 (Ley distributiva de la suma de escalares con respecto al producto por
escalar). Para x ∈ V y α, β ∈ F , tenemos que
(α + β)x = αx + βx.
Axioma 5.1.10 (Existencia de elemento identidad). Para x ∈ V , tenemos que
1x = x.
Cuando F = R, decimos que V es un espacio vectorial sobre el campo de los números

reales o espacio vectorial real. Si F = C, decimos que V es un espacio vectorial sobre el
campo de los números complejos o espacio vectorial complejo. A menudo nos referiremos a
los elemento de V como vectores.
5.1.1. Ejemplos de espacios vectoriales

Cada uno de los siguientes conjuntos es un espacio vectorial sobre el campo de los números
reales
Ejemplo 5.1. (a) Sea V = R, el conjunto de los números reales y F = R
(b) V = Rn , el espacio Euclideo de n dimensiones, con F = R y la suma y el producto por

escalar definidas como sigue. Para x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) en Rn y λ ∈ R
x + y = (x1 + y2 , . . . , xn + yn ), λx = (λx1 , . . . , λxn ).
(c) Sea V el conjunto de todos los vectores en Rn que son ortogonales a un vector no nulo
dado n.
(d) Sea V el conjunto de todas las funciones definidas en un intervalo dado I, con la suma
y producto por escalar usual de funciones, esto es,
(f + g)(x) = f (x) + g(x), (λf )(x) = λf (x).
196
(e) El conjunto de todas la matrices de tamaño m × n con entradas en los reales, esto es,
V = Mm×n (R).
Ejemplo 5.2. Demuestre que el conjunto de los números reales positivos forma un espacio
vectorial bajo las operaciones x + y = xy, λx = xλ .
Solución. Lo primero que debemos hacer es verificar los axiomas de cerradura. Sean x, y ∈
R+ y λ ∈ R. Entonces xy > 0, con lo cual x + y = xy ∈ R+ . Además, λx = xλ ∈ R+ , ya que
x ∈ R+ . La suma ası́ definida es conmutativa y asociativa. En efecto
x + y = xy = yx = y + x, (x + y) + z = (xy)z = x(yz) = x + (y + z).
para todo x, y, z ∈ R+ .
Sea x ∈ R+ , entonces se cumple la ley modulativa de la suma, esto es, existe 1 ∈ R+ tal
que
x + 1 = x(1) = x.
En este caso 0 = 1, es decir. el elemento neutro es el 1. Ahora, sabiendo que el elemento

neutro para la suma es el 1, debemos demostrar que todo x ∈ R+ tiene un inverso aditivo,
lo que nos lleva a plantear la ecuación
x + y = 1 ⇔ xy = 1 ⇔ y = 1/x.
Ası́, el inverso aditivo de x es 1/x. Verifiquemos los axiomas correspondientes a la multipli-

cación por escalar. Sean α, β ∈ R y x ∈ R+ .
α(βx) = (βx)α = (xβ )α = xβα = xαβ = (αβ)x.
Si x, yR+
α(x + y) = (x + y)α = (xy)α = xα y α = (αx)(αy) = αx + αy.
(α + β)x = xα+β = xα xβ = (αx)(βx) = αx + βx.
Finalmente,
1x = x1 = x,
para cada x ∈ R+ .
De los axiomas que definen un espacio vectorial, se deducen las siguientes propiedades
197
Teorema 5.1.11. Sea V un espacio vectorial sobre el campo F . Entonces
(a) α0 = 0 para todo α ∈ F .
(b) 0x = 0 para todo x ∈ V .
(c) Si αx = 0, entonce α = 0 o x = 0, o ambos.
(d) (−1)x = −x para todo x ∈ V .
5.2. Subespacios
Definición 5.2.1 (Subespacio). Sea H un subconjunto no vacı́o de un espacio vectorial V
que es en si mismo un espacio vectorial con las operaciones de suma y producto por escalar
definidas en V es llamado subespacio de V .
El siguiente resultado caracteriza los subesapcios de un espacio vectorial
Teorema 5.2.1. Un subconjunto no vacı́o H de un espacio vectorial V es un subespacio de

V si y sólo si se cumplen los axiomas de cerradura:
(a) Si x, y ∈ H, entonces x + y ∈ H.
(b) Si λ ∈ F, x ∈ H, entonces λx ∈ H.
Nota 5.2.1. El teorema 5.2.1 se puede enunciar de forma equivalente como sigue: Un sub-
conjunto no vacı́o H de un espacio vectorial V es un subespacio de V si y sólo si
αx + βy ∈ H,
para todos los escalares α, β ∈ F y todo x, y ∈ H.
Ejemplo 5.3. Para cualquier espacio vectorial V , el subconjunto H = {0} que consta úni-
camente del cero es un subesapcio de V . Ası́ mismo, V es subepacio de si mismo. Los subes-
pacios {0} , V son llamados subespacios triviales. Los subespacios distintos de {0} y V
son llamados subespacios propios.
Ejemplo 5.4 (Subespacio propio de R2 ). Toda recta que pasa por el origen es un subespacio
propio de R2 .
Ejemplo 5.5 (Subespacios propios de R3 ). Toda recta que pasa por el origen es un subespacio
propio de R3 . Ası́ mismo, todo plano que pasa por el origen es un subespacio propio de R3 .
Teorema 5.2.2. Sean H1 , H2 subespacios de un espacio vectorial V . Entonces H1 ∩ H2 es

un subespacio de V .
198
5.3. Combinación lineal y espacio generado
Definición 5.3.1 (Combinación lineal). Sean v1 , . . . , vn vectores de un espacio vectorial V .
Entonces cualquier vector de la forma
v = α1 v1 + · · · + αn vn ,
αi ∈ F , para todo 1 ≤ i ≤ n es llamado combinación lineal de los vectores v1 , . . . , vn .
Definición 5.3.2 (Espacio generado). Sea H = {v1 , . . . , vn } un subconjunto de espacio

vectorial V . Denotamos por gen H a el conjunto de todas las combinaciones lineales que
podemos formar con los vectores de H. Esto es,
gen H = {v : v = α1 v1 + · · · + αn vn , αi ∈ F, 1 ≤ i ≤ n} .
Nos referimos a gen H como espacio generado por el conjunto de vectores v1 , . . . , vn .
Teorema 5.3.1. Sea H un subconjunto de un espacio vectorial V . Entonces el generado por

H, gen H es un subespacio de V .
Demostración. Sean v, w ∈ H y α, β ∈ F . Entonces existen escalares α1 , . . . , αn y β1 , . . . , βn

en F tales que
v = α1 v1 + · · · + αn vn , w = β1 v1 + · · · + βn vn .
Por lo tanto,
αv + βw = α(α1 v1 + · · · + αn vn ) + β(β1 v1 + · · · + βn vn )
= αα1 v1 + · · · + ααn vn + ββ1 v1 + · · · + ββn vn
= (αα1 + ββ1 )v1 + · · · + (ααn + ββn )vn .
Ahora dado que ααi + ββi ∈ F para todo 1 ≤ i ≤ n, αv + βw ∈ H. Esto es, H es un

subespacio de V .
Definición 5.3.3 (Conjunto generador). Decimos que un conjunto H = {v1 , . . . , vn } genera

un espacio vectorial V si
gen H = V.
Ejemplo 5.6. Sea V = Pn , el conjunto de todos los polinomios de grado ≤ n, y F = R.

El conjunto V es un espacio vectorial real generado por n + 1− vectores. En efecto, sea
H = {1, x, x2 , . . . , xn }. Entonces
gen H = {p ∈ Pn : p(x) = a0 (1) + a1 x + · · · + an xn , ai ∈ R, 0 ≤ i ≤ n} = V.
199
5.4. Independencia lineal
Definición 5.4.1 (Dependencia lineal e independencia lineal). Sean v1 , . . . , vn n vectores
de un espacio vectorial V . Entonces se dice que los vectores son linealmente indepen-
dientes si toda combinación lineal de ellos igualada a 0 implica que todos los vectores de la
combinación son cero. Esto es,
α1 v1 + · · · + αn vn = 0 implica que α1 = · · · = αn = 0.
Si los vectores no son linealmente independientes, se dice que son linealmente dependien-
tes. Esto es, existen n escalares no todos cero tales que
α1 v1 + · · · + αn vn = 0.
Ejemplo 5.7. Sea V el espacio vectorial de todas las funciones de R en R. Determinar si

cada uno de los siguientes subconjuntos de V es dependiente o independiente.
(a) 1, eax , ebx , a 6= b.

(b) {cos x, sen x}.
(c) {ex , e−x , (ex + e−x )/2}.
(d) {cos2 x, sen2 x, 1}.

Solución. Consideremos una combinación lineal de las funciones 1, eax , ebx igualada a la
función cero, esto es,
α1 1 + α2 eax + α3 ebx = f (x)
donde f (x) = 0 para todo x ∈ R. Por lo tanto tenemos
α1 1 + α2 eax + α3 ebx = 0,
para todo x ∈ R. En particular, si x = 0 obtenemos la ecuación
α1 + α2 + α3 = 0.
Ahora generamos otro par de ecuaciones al tomar x = 1, luego x = −1:
α1 + α2 ea + α3 eb = 0, α1 + α2 e−a + α3 e−b = 0.
Luego tenemos el sistema lineal de ecuaciones homogéneas


 α1 + α2 + α3 = 0
α + α2 ea + α3 eb = 0
 1
α1 + α2 e−a + α3 e−b = 0
200
Que en forma matricial se expresa como
    
1 1 1 α1 0
1 ea eb  α2  = 0 (5.1)
1 e−a e−b α3 0
Aplicando Gauss–Jordan podemos simplificar el determinante de la matriz A de coeficientes

del sistema

1 1 1 R2 → −R1 + R2 1 1 1

a b a b
1 e
e R3 → −R1 + R3 0 e − 1 e − 1
1 e−a e−b ⇐⇒ 0 e−a − 1 e−b − 1
En consecuencia tenemos que

1 1 1 1 1 1
e = (ea − 1)(e−b − 1) − (e−a − 1)(eb − 1)

a b a b
det A := 1 e e = 0 e
1 e−a e−b 0 e−a e−b
Ahora, si det A = 0, tendrı́amos que
(ea − 1)(e−b − 1) − (e−a − 1)(eb − 1) = 0,
o equivalentemente
(ea − 1)(1 − eb ) (1 − ea )(eb − 1)

=
eb ea
Al multiplicar por −1 esta última ecuación obtenemos
(ea − 1)(eb − 1) (ea − 1)(eb − 1)

= ,
eb ea
de donde ea = eb , es decir a = b, lo cual es una contradicción puesto que estamos suponiendo
que a 6= b. Se debe tener entonces que det A 6= 0, lo cual implica que el sistema en (5.1) tiene
sólo la solución trivial, esto es, α1 = α2 = α3 = 0, es decir el conjunto dado es linealmente
independiente. Con cual tenemos el ı́tem (a).
Sean α1 y α2 escalares tales que
α1 cos x + α2 sen x = 0 ∀ x ∈ R.
En particular, si x = 0, α1 = 0, y si x = π/2, α2 = 0. Con lo cual, las funciones son

linealmente independientes.
201
Observese que
(−1/2)ex + (−1/2)e−x + (1)(ex + e−x )/2 = 0 ∀ x ∈ R.
Con lo cual, las funciones son linealmente dependientes.
Por la identidad fundamental sabemos que
(1) cos2 x + (1) sen2 x + (−1)(1) = 0 ∀ x ∈ R.

Esto significa que las funciones son linealmente dependientes.
Ejemplo 5.8 (**). Sean v1 , v2 dos vectores linealmente independientes de R3 . Demuestre
que el gen {v1 , v2 } es un plano que pasa por el origen. Hallar la ecuación cartesiana del plano.
Solución. Debemos demostrar que
gen {v1 , v2 } = π = {(x, y, z) : ax + by + cz = 0} .
Tomemos (x, y, z) ∈ gen {v1 , v2 }. Donde v1 = (a1 , b1 , c1 ) y v2 = (a1 , b1 , c1 ). Entonces existen
escalares s, t tales que
(x, y, z) = sv1 + tv2
Definamos n = v1 × v2 . En tal caso tenemos que
n · (x, y, z) = v1 × v2 · (sv1 + tv2 )
= v1 × v2 · sv1 + v1 × v2 · tv2
= s(v1 × v2 · v1 ) + t(v1 × v2 · v2 )
= 0.
Es decir, (x, y, z) ∈ π, donde
n = (a, b, c) = v1 × v2 = iA11 + jA12 + kA13 = (A11 , A12 , A13 ),
es el vector normal al plano. Recı́procamente, si (x, y, z) ∈ π, entonces ax + by + cz = 0
donde
a = A11 , b = A12 , c = A13 ,
Al menos uno de los escalares a, b, c es distinto de cero. Por ejemplo supongamos que c =
A13 6= 0. Debemos encontrar escalares s y t tales que
x = sa1 + ta2
y = sb1 + tb2
z = sc1 + tc2
202
Si consideramos sólo la primera y segunda ecuación, podemos encontrar estos escalares usan-
do la regla de Krammer:

x a2

y b2 b2 x − a2 y b2 x − a2 y
s= = = ,
a1 a2 a1 b2 − a2 b1 A13

b1 b2

a1 x

b1 y a1 y − b1 x
t= = .
a1 a2 A13

b1 b2
Entonces
b2 x − a2 y a1 y − b1 x
sv1 + tv2 = (a1 , b1 , c1 ) + (a2 , b2 , c2 )
A13 A13

a1 b2 x − a1 a2 y b1 b2 x − a2 b1 y b2 c1 x − a2 c1 y
= , ,
A13 A13 A13

a1 a2 y − a2 b1 x a1 b2 y − b1 b2 x a1 c2 y − b1 c2 x
+ , ,
A13 A13 A13

(a1 b2 − a2 b1 )x (a1 b2 − a2 b1 )y (b2 c1 − b1 c2 )x + (a1 c2 − a2 c1 )y
= , ,
A13 A13 A13

−ax − by
= x, y,
c
= (x, y, z).
Esto es, (x, y, z) ∈ gen {v1 , v2 }.

Teorema 5.4.1. Dos vectores de un espacio vectorial son linealmente dependientes si y sólo
si uno es múltiplo escalar del otro.
Se concluye del Teorema 5.4.1 que dos vectores de un espacio vectorial son linealmente
dependientes si y sólo si son paralelos.
Teorema 5.4.2. Sean v1 = (x1 , y1) y v2 = (x2 , y2 ) dos vectores de R2 , y sea A la matriz
formada por estos vectores, esto es,

v1 x1 y1
A := = .
v2 x2 y2
Entonces, los vectores v1 , v2 son linealmente dependientes ⇔ det A = 0. En consecuencia,
v1 , v2 son linealmente independientes ⇔ det A 6= 0.
203
Demostración. (⇒). Supongamos que v1 , v2 son linealmente dependientes. Entonces por el
Teorema 5.4.1 existe k ∈ R tal que v1 = kv2 . Pero entonces tenemos que

v1 x1 y1
det A = det = det = 0.
kv1 kx1 ky1
(⇐). Ahora, supongamos que v1 , v2 son linealmente independientes y que
xv1 + yv2 = (0, 0) (5.2)
Entonces por definición de independencia lineal tenemos que x = y = 0. Pero (5.2), es

equivalente a
(x1 x + x2 y, y1x + yy2 x) = (0, 0)
Lo que a su vez se puede escribir en forma matricial como sigue

x1 x2 x 0
= (5.3)
y1 y2 y 0
En consecuencia, si v1 , v2 son linealmente independientes, el sistema homogéneo en (5.3)

tiene una única solución, lo cual implica que

x1 x2
det 6= 0.
y1 y2
Finalmente, como el determinante de una matriz es igual a el determinante de su matriz

transpuesta, tenemos que

x1 y1 x1 x2
det A = det = det 6= 0.
x2 y2 y1 y2
Se demostró que si v1 , v2 son linealmente independientes, entonces det A 6= 0, o equivalente-

mente, si det A = 0, entonces v1 , v2 son linealmente dependientes.
Teorema 5.4.3. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2 ) dos vectores de R2 . Entonces gen {v1 , v2 }
es una recta que pasa por el origen, si v1 , v2 son linealmente dependientes y es R2 , si v1 , v2
son linealmente independientes.
Corolario 5.4.4. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2) dos vectores de R2 y A la matriz formada
por estos vectores, entonces
(a) gen {v1 , v2 } es una recta que pasa por el origen si sólo si det A = 0.
(b) gen {v1 , v2 } es R2 si sólo si det A 6= 0.
204
5.5. Interpretación geométrica de la independencia li-
neal en R3
Sean u, v y w tres vectores de R3 . Se define el triple producto escalar de estos vectores
como
w·u×v
En la figura 5.1 se muestra que si estos vectores son linealmente independientes determinan
un paralelepı́pedo.
u×v
h v
Figura 5.1: Construcción geométrica del triple producto escalar
Demostraremos que el volumen de este paralelepı́pedo es precisamente el valor absoluto

del triple producto escalar entre ellos.
Teorema 5.5.1. Sean u = (a1 , a2 , a3 ), v = (b1 , b2 , b3 ) y w = (c1 , c2 , c3 ) vectores no nulos de

R3 y A la matriz conformada por estos vectores:
a1 a2 a3
 
A =  b1 b2 b3 
c1 c2 c3
Entonces, det A 6= 0 si y sólo si u, v y w son linealmente independientes, más aún, si

det A 6= 0, los vectores determinan un paralelepı́pedo cuyo volumen está dado por
| det A| = |w · u × v|.
Demostración. Empecemos demostrando que
det A = w · u × v.
205
En efecto,
w · u × v = (c1 , c2 , c3 ) · (A11 , A12 , A13 )
= c1 A11 + c2 A12 + c3 A13 .
Entonces,
c1 c2 c3
 
w · u × v = c1 A11 + c2 A12 + c3 A13 = a1 a2 a3 

b1 b2 b3
Ahora, por la Propiedad 3 de los determinantes, Teorema 2.3.6, tenemos que
c1 c2 c3 a1 a2 a3 a1 a2 a3
     
a1 a2 a3  = −  c1 c2 c3  =  b1 b2 b3  = det A.
b1 b2 b3 b1 b2 b3 c1 c2 c3
Supongamos que los vectores u, v y w son linealmente dependientes. Entonces existen esca-
lares α1 , β1 y γ1 no todos cero tales que
α1 u + β1 v + γ1 w = 0.
Por ejemplo, si γ1 6= 0
w = αu + βv,
donde −α = α1 /γ1 y −β = β1/γ1. Con lo cual,

det A = w · u × v = (αu + βv) · u × v
= α(u · u × v) + β(v · u × v)
= 0.
Los otros dos casos surgen al suponer que α1 6= 0, o bien β1 6= 0 (ver el problema 5.11.13).
Demostramos que si los vectores u, v y w son linealmente dependientes, entonces det A =

0, pero esto es equivalente a decir que si det A 6= 0, entonces los vectores u, v y w son
linealmente independientes.
Recı́procamente, supongamos que
det A = w · u × v = 0.
Esto significa que el vector w es ortogonal al vector u × v, pero sabemos que este último
vector es el vector normal al plano generado por u y v. Es decir, w ∈ gen {u, v}, lo que cual
implica que existen escalares α y β tales que
w = αu + βv.
206
Ahora bien, si α y β son ambos cero, resulta que w = 0, lo cual contradice la hipótesis. Se
debe tener entonces que algunos de los escalares α o β es distinto de cero. Por lo tanto la
expresión
w − αu − βv = 0,
es una combinación lineal de los vectores u, v y w en la que no todos los escalares de la

combinación son cero, lo cual quiere decir que los vectores son linealmente dependientes.
Ahora bien, si det A 6= 0, entonces los vectores u, v y w son linealmente independientes,

por lo que ninguno de ellos puede ser un múltiplo escalar del otro. Por lo tanto, forman un
paralelepı́pedo (ver figura 5.1). Como se ve en esta gráfica, la altura del paralelepı́pedo es la
proyección escalar del vector w sobre el vector u × v, esto es,
h = k Proy wu×v k
|w · u × v|
=
ku × vk
Recordemos que ku × vk es igual al área del paralelogramos determinado por los vectores u
y v. Por lo que, si denotamos por V al volumen del paralelepı́pedo, encontramos que
V = ku × vkh
= |w · u × v|
= | det A|.
5.6. Bases y dimensión

Definición 5.6.1 (Base para un espacio vectorial). Un subconjunto finito de n vectores
B = {v1 , v2 , . . . , vn } es una base para un espacio vectorial V si
(a) B es linealmente independiente.
(b) gen B = V , esto es, B genera a V .
El espacio vectorial V es dimensión finita si tiene una base finita. De otro modo, V tiene
dimensión infinita.
Definición 5.6.2 (Dimensión de un espacio vectorial). Si espacio vectorial V tiene tiene

una base n elementos, el entero n se llama dimensión de V . Escribimos n = dim V . Si
V = {0}, definimos la dimensión de V como cero.
207
Teorema 5.6.1. Sea V espacio vectorial de dimensión finita n. Tenemos
(a) Cualquier conjunto linealmente independiente de V es un subconjunto de cierta base

para V .
(b) Cualquier conjunto de n elementos linealmente independientes es una base para V .
Ejemplo 5.9. El conjunto B = {e1 , e2 , . . . , en }, donde
e1 = (1, 0, . . . , 0)
e2 = (0, 1, . . . , 0)
..
.
en = (0, 0, . . . , 1),
es una base para Rn . Los vectores e1 , e2 , . . . , en se denominan vectores coordenados uni-

tarios de Rn y el conjunto B es llamado base canónica de Rn .
Teorema 5.6.2. Sea H un subespacio de un espacio vectorial de dimensión n. Entonces

dim H ≤ n.
Teorema 5.6.3. Los únicos subespacios no triviales de R3 son las rectas y planos que pasan
por el origen.
Demostración. Por el Teorema 5.6.2 si H es un subespacio propio de R3 , entonces dim H = 1,

o bien, dim H = 2. Si dim H = 1, el subespacio H es una recta que pasa por el origen (ver el
problema 5.11.6). Ahora bien, si dim H = 2. Escogemos una base B = {v1 , v2 } de H. Como
el conjunto B es linealmente independiente, por Ejemplo 5.8 sabemos que gen B es un plano
que pasa por el origen. Como gen B = H el teorema está demostrado.
Ejemplo 5.10. Sean H y K subespacios de un espacio vectorial V . Demuestre que si H∩K =

{0}, entonces dim(H + K) = dim H + dim K.
Solución. Sea B1 = {v1 , . . . , vm } una base para H, y B2 = {w1 , . . . , wn } una base para
K. Demostraremos que B = {v1 , . . . , vm , w1 , . . . , wn } es una base para H + K. Primero que
todo nótese que como B1 ⊆ H y B2 ⊆ K, entonces B1 ∩ B2 ⊆ H ∩ K = {0}. Esto es,
B1 ∩ B2 ⊆ {0} (5.4)
Y dado que B1 , B2 son linealmente independientes ninguno de estos conjuntos contiene al

vector cero. Por lo tanto la única forma de que se mantenga la contenencia (5.4) es que
B1 ∩ B2 = ∅. Lo cual implica que los vectores que conforman la base B son todos diferentes,
es decir, el conjunto B está conformado por m + n vectores. Ahora, tomemos v ∈ H + K,
208
entonces existe h ∈ H y k ∈ K tales que v = h + k. Además, existen escalares α1 , . . . , αm
y β1 , . . . , βn que cumplen que
h = α1 v1 + · · · + αm vm , k = β1 w1 + · · · + βn wn .
Con lo cual,
v = α1 v1 + · · · + αm vm + β1 w1 + · · · + βn wn ,
Lo cual quiere decir que v ∈ gen B. Demostramos que H + K ⊆ gen B. La otra contenencia
se obtiene de manera similar para concluir que gen B = H + K .
Para demostrar la independencia lineal de B nótese que si w1 ∈ gen B1 , entonces
w1 = α1 v1 + · · · + αm vm ∈ H.
Con lo cual, w1 ∈ H ∩ K, contradiciendo de nuevo el hecho que H ∩ K = {0}. Por lo tanto,

w1 ∈
/ gen B1 , pero esto implica que el conjunto
{v1 , . . . , vm , w1 } ,
pues si
α1 v1 + · · · + αm vm + αm+1 w1 = 0,
y αm+1 6= 0, tendrı́amos que
w1 = (α1 /αm+1 )v1 + · · · + (αm /αm+1 )vm .
Contradiciendo el hecho que w1 ∈

/ gen B1 . Se debemos tener entonces que αm+1 = 0, con lo
que
α1 v1 + · · · + αm vm = 0,
y la independencia de B1 implica que α1 = · · · = αm = 0. De esta misma forma demostramos

que el conjunto
{v1 , . . . , vm , w1 , w2 } ,
es linealmente independiente, ya que w2 ∈ / gen B1 . Vemos de esta manera que podemos ex-
tender el conjunto B1 para formar el conjunto B de tal forma que este último sea linealmente
independiente, y ası́ demostrar que B es una base para H + K. Finalmente tenemos que
dim(H + K) = m + n = dim H + dim K.
Como se querı́a demostrar.
209
5.7. Espacio de los renglones y espacio de las columnas
de una matriz
Sea A ∈ Mm×n (R) y sea
ker A = {x ∈ Rn : Ax = 0}
Entonces ker A es un subespacio de Rn llamado espacio nulo de la matriz A y ν(A) :=

dim(ker A) es llamado nulidad de A.
Ejemplo 5.11. Hallar la nulidad de la matriz
1 −1
 
A = 1 1 
1 0
Solución. Si vemos el vector (x, y) como columna tenemos que
1 −1 x−y
     
0
x
Ax = 1 1
  = x + y = 0
  
y
1 0 x 0
Con lo cual, x − y = 0, x + y = 0 y x = 0. Vemos entonces que ker T = {(0, 0)}, por lo que
ν(A) = 0.
Si A ∈ Mn×n (R) es una matriz invertible el sistema homogéneo Ax = 0 tiene como única
solución la trivial, por lo que tenemos el siguiente resultado
Teorema 5.7.1. Sea A ∈ Mn×n (R). Entonces A es invertible si y sólo si ν(A) = 0.
Definición 5.7.1 (Imagen y rango de una matriz). Si A ∈ Mm×n (R). Entonces la imagen
de A denotada por Im(A) se define como
Im(A) = {y ∈ Rm /∃ x ∈ Rm : y = Ax} .
La dimensión de la imagen de A se denota por ρ(A) y escribimos ρ(A) = dim(Im(A)).
Definición 5.7.2. Si A ∈ Mm×n (R) y sean {r1 , . . . , rm } los renglones de A y {c1 , . . . , cn }

los columnas de A. Entonces
FA = Espacio de los renglones de A = gen {r1 , . . . , rm }

CA = Espacio de las columnas de A = gen {c1 , . . . , cn }
Teorema 5.7.2. Si A ∈ Mm×n (R). Entonces, CA = Im(A).
210
El Teorema 5.7.2 nos dice que el espacio de las columnas de una matriz coincide con la
imagen de la matriz. Sin embargo, el espacio de los renglones de A no coincide con el ker A.
Ejemplo 5.12 (En general FA 6= ker A). Consideremos la matriz

1 2 −1
A=
2 −1 3
Aplicando Gauss-Jordan simplificamos la matriz para obtener

1 0 1
B=
0 1 −1
como las matrices A y B son equivalentes ker A = ker B, donde
   
x 
1 0 1   0

ker B = (x, y, z) : y = ,
0 1 −1 0 
z

lo que conduce al sistema x + z = 0, y − z = 0, que representa las ecuaciones simétricas de

una recta que pasa por el origen:
ker A = {(x, y, z) : x = −z, y = z}

= {(−z, z, z) : z ∈ R}
= gen {(−1, 1, 1)} .
Vemos que ν(A) = 1. Por otro lado,
FA = gen {(1, 2, −1), (2, −1, 3)} ,
que es un plano que pasa por el origen, ya que los vectores (1, 2, −1) y (2, −1, 3) son lineal-
mente independientes. Vemos que dim(FA ) = 2 y que FA 6= ker A.
Ejemplo 5.13. Hallar la imagen y el rango de la matriz

1 2 −1
A=
2 −1 3
Solución. Por el Teorema 5.7.2

1 2 −1
Im(A) = CA = gen , ,
2 −1 3
Dado que

1 2
2 −1 = −1 − 4 6= 0,

211
tenemos que

1 2
gen , = R2
2 −1
Por lo tanto,

1 2 −1
Im(A) = CA = gen , , = R2 .
2 −1 3
Ası́ que, ρ(A) = 2.
El ejemplo precedente, junto con el ejemplo 5.12 nos muestra que dim(FA ) = 2 =
dim(Im(A)) = dim(CA ). Esto hecho no es una coincidencia.
Teorema 5.7.3. Si A ∈ Mm×n (R), entonces dim FA = dim CA = ρ(A).
El siguiente resultado nos dice que el proceso de hallar el núcleo y la imagen de una
matriz se reduce al hecho simplificarla mediante operaciones elementales.
Teorema 5.7.4. Sean A, B ∈ Mm×n (R), donde A es equivalente por renglones a B, entonces
FA = FB , CA = CB , ρ(A) = ρ(B) y ν(A) = ν(B).
Teorema 5.7.5. El rango de una matriz es igual al número de pivotes de su FER.
Ejemplo 5.14. La FER de la matriz
1 −1 3
 
A= 2 0 4
−1 3 1
es la matriz B dada por
1 −1 3
 
B = 0 1 −1 ,
0 0 0
dado que esta matriz presenta dos pivotes, por el Teorema 5.7.5, ρ(A) = 2.
Teorema 5.7.6 (Teorema de la dimensión para matrices). Sea A ∈ Mm×n (R). Entonces
ρ(A) + ν(A) = n.
Del Teorema de la dimensión para matrices concluimos que
ν(A) = el número de columnas de la FER de A que no contienen pivotes.
Teorema 5.7.7. Sea A ∈ Mm×n (R). Entonces A es invertible si y sólo si ρ(A) = n.
Teorema 5.7.8. Sea A ∈ Mm×n (R). El sistema Ax = b tiene al menos una solución si y
sólo si b ∈ CA . Esto ocurre si y sólo si A y la matriz aumentada (A|b) tienen el mismo
rango.
212
5.8. Cambio de base
5.9. Bases ortonormales y proyecciones en Rn
5.10. Espacios con producto interno
5.11. Problemas
Sección 5.1 Definición y propiedades de un espacio

vectorial
Problema 5.11.1. Demuestre que el conjunto de todas las funciones definidas y acotadas
en R es un espacio vectorial.
Problema 5.11.2. Demuestre que el conjunto de todas las funciones que satisfacen la ecua-
ción funcional
f (x) = f (x − 1),
para toda x ∈ R es un espacio vectorial
En los siguientes problemas, determinar si cada uno de los conjuntos dados es un espacio
vectorial real.
Problema 5.11.3. El conjunto de todos los polinomios de grado igual n.
Problema 5.11.4. Sea V el conjunto de todos los pares (x, y) de números reales, con las
operaciones de suma y producto por escalar definidas como sigue:
(x, y) + (x1 , y1 ) = (x + x1 , y + y1 ), λ(x, y) = (λx, y).
Sección 5.2 Subespacios de un espacio vectorial

Problema 5.11.5. Demuestre que el espacio vectorial de los números reales no tiene subes-
pacios propios.
Problema 5.11.6. Demuestre que los únicos subespacios propios R2 son las rectas que
pasan por el origen. Hallar la ecuación cartesiana de la recta. Demuestre además que todo
subespacio de dimensión 1 de R3 es una recta que pasa por el origen. Hallar la ecuación
paramétrica de dicha recta.
213
Problema 5.11.7. Sea V = Mn×n (R), ¿cuáles de los siguientes subconjuntos de V son
subespacios.
(a) El conjunto de todas las matrices invertibles.
(b) El conjunto de todas las A ∈ V tales que AB = BA, B es una matriz fija en V .
(c) Todas las matrices A tales que A2 = A.
Problema 5.11.8. Sean H1 , H2 dos subespacios de un espacio vectorial V . Entonces
(a) H1 ∪ H2 no es un subespacio de V .
(b) H := H1 + H2 = {v : v = v1 + v2 , v1 ∈ H1 , v2 ∈ H2 },
es un subespacio de V .
Problema 5.11.9 (**). Sea V el espacio vectorial de todas las funciones de R en R, sea Ve ,
el subconjunto de las funciones pares, f (x) = f (−x); sea V0 el subconjunto de las funciones
impares, f (−x) = −f (x).
(a) Demuestre que Ve y V0 son subespacios de V .

L
(b) Demuestre que V = Ve V0 .
L
La notación V = H K, significa que V = H + K y que H ∩ K = {0}, donde H, K son
subespacios del espacio vectorial V .

M
Mn×n (R) = Sn×n Kn×n ,
donde Sn×n denota el conjunto de todas las matrices simétricas de tamaño n × n y Kn×n el
conjunto de todas las matrices antisimétricas de tamaño n × n.
Problema 5.11.11 (***). Sea H = {x ∈ Rn : x · n = 0}, donde n es un vector fijo no nulo

de Rn .
(a) Demuestre que H es un subespacio de Rn
(b) De una interpretación geométrica para los casos n = 2 y n = 3.
(c) Si H = {(x, y, z, w) : ax + by + cz + dw = 0}, donde abcd 6= 0. Demuestre que H es

un subespacio de Rn y encuentre una base para H.
(d) Encuentre la dimensión del subespacio H = {x ∈ Rn : x · n = 0}.
214
Sección 5.3 Combinación lineal y espacio generado
Problema 5.11.12. Sean v1 , v2 vectores de R2 . Hallar, gen {v1 , v2 } si,
(a) v1 , v2 son linealmente dependientes.
(b) v1 , v2 son linealmente independientes.
(c) v1 , v2 son linealmente independientes y los escalares de la combinación varı́an entre 0 y
1. ¿Qué representan los conjuntos hallados en (a),(b) y en (c)?
Sección 5.4 Independencia lineal

Problema 5.11.13. Demuestre que si los vectores u, v y u son linealmente dependientes,
entonces w · u × v = 0.
Problema 5.11.14. Demuestre que si los vectores v1 , . . . , vn son linealmente dependientes

en Rm y si vn+1 es cualquier otro vector en Rm , entonces el conjunto v1 , . . . , vn , vn+1 es
linealmente independiente.
Problema 5.11.15. Demuestre que si dos vectores no nulos v1 , v2 son ortogonales, entonces
el conjunto {v1 , v1 } es linealmente independiente.
Problema 5.11.16. Sea V el espacio vectorial de todas las funciones de R en R. Determinar

si cada uno de los siguientes subconjuntos de V es dependiente o independiente.
(a) {eax , xeax }.
(b) {1, eax , xeax }.
(c) {eax , xeax , x2 eax }.
(d) {1, cos 2x, sen2 x}.
(e) {ex cos x, e−x sen x}.
Sección 5.6 Bases y dimension

Problema 5.11.17 (**). Hallar la dimensión del espacio Dn de las matrices diagonales.
Problema 5.11.18 (**). Demuestre que el espacio Snn de las matrices simétricas de tamaño
n × n es un subespacio de Mn×n (R) el espacio de la matrices de tamaño n × n con estradas
en los reales. Hallar la dimensión del espacio Snn .
215
Problema 5.11.19 (*). Sea {v1 , . . . , vn } una base para un espacio vectorial V . Si
n
X
un := vi .
i=1
Demuestre que el conjunto {u1 , . . . , un } también es una base para V .
Problema 5.11.20 (***). Si H es un subespacio de un espacio vectorial de dimensión finita

L
V , demuestre que existe un único subespacio K de V tal que V = H K.
216
Capı́tulo 6
Transformaciones lineales
6.1. Definición y ejemplos

Definición 6.1.1 (Transformaciones lineales). Sean V y W espacios vectoriales reales. Una
transformación lineal es una función definida en V que toma valores en W y que satisface,
para cada u, v ∈ V y cada escalar α
T (u + v) = T (u) + T (v)
(6.1)
T (αu) = αT (u)
Las ecuaciones en (6.1) reciben el nombre de propiedades de linealidad.
En la sección 6.3 se estudian las transformaciones lineales de R2 en R2 , en especial el ope-

rador rotación. A continuación estudiamos otro importante de operador lineal denominado
transformación de proyección ortogonal
Ejemplo 6.1 (Operador proyección). Sea H un subespacio de Rn , y B = {u1 , . . . , uk } una

base ortonormal para H. La transformación de proyección ortogonal P : Rn → H se denota
por Proy vH y se define como
P (v) = Proy vH = (v · u1 )u1 + · · · + (v · uk )uk .
Consideremos el caso n = 3 y supongamos que queremos proyectar un punto v = (x, y, z) de

R3 sobre por ejemplo el plano xz. Tenemos que el plano xz está dado por
H = {(x, 0, z) : x, z ∈ R} .
Dado que
(x, 0, z) = (x, 0, 0) + (0, 0, z) = xi + zk,
217
Vemos que H es generado por la base ortonormal B = {i, k}. Por lo que
P (x, y, z) = Proy vH = ((x, y, z) · i))i + ((x, y, z) · k))k

= xi + zk
= (x, 0, z).
En cálculo vectorial para aplicar el Teorema de Stokes, en ciertas ocasiones es necesario

proyectar una curva C en el espacio sobre alguno de los tres planos coordenados. En el
Ejemplo 7.6.2 se encontró que la representación paramétrica de la curva de intersección de
las superficies 2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
viene dada por la función vectorial
√
α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).
Γ
C
y
x
Figura 6.1: La proyección de la curva C, que es una circunferencia, sobre el plano xz es una
elipse.
Si queremos saber cuál es la proyección de la curva C sobre el plano xz, hallamos la

acción del operador T (x, y, z) = (x, 0, z) sobre la función α. Esto es,
√
T (α(t)) = T (1 + cos t, 1 − cos t, 2 sen t)
√
= (1 + cos t, 0, 2 sen t)
= β(t).
Vemos que la proyección está representada por una función vectorial

√
β(t) = (1 + cos t, 0, 2 sen t) = (x, y, z),
218
para hallar la ecuación cartesiana de dicha curva eliminamos el parámetro en la ecuaciones
paramétricas
√
x = 1 + cos t, z = 2 sen t,
de donde obtenemos
(x − 1)2 + z 2 /2 = cos2 t + sen2 t = 1
Para este caso la proyección es un elipse (ver la figura 6.1).
De forma análoga podemos demostrar que la proyección de la curva C sobre el plano yz

también es una elipse, mientras que al proyectar sobre el plano xy obtenemos una recta. (ver
el problema 6.6.2)
6.2. Núcleo e imagen de una transformación lineal

Definición 6.2.1. Sean V y W espacios vectoriales y T : V → W una transformación
lineal. Entonces el núcleo de T denotado por ker T , y la imagen de T denotada por R(T ) se
definen respectivamente por
ker T = {v ∈ V : T (v) = 0}
R(T ) = {T (v) : v ∈ V } .
Como puede demostrarse el ker T es un subespacio de V , y la imagen de T es un subes-

pacio de W . La dimensión del núcleo de T la llamamos nulidad de T , y se denota por ν(T ),
a la dimensión de la imagen de T se le llama rango de T , el cual se denota por ρ(T ).
Ejemplo 6.2. Sea T : R3 → R3 una transformación lineal tal que T (1, 0, 1) = (2, 2, 0),
T (1, 1, 1) = (1, 3, 1) y T (1, 1, 0) = (0, 2, 2).
(a) Encontrar la transformación T .
(b) Hallar la nulidad de T .
(c) Hallar la imagen de T .
Solución. Nótese que como el operador T es lineal tenemos que
T (x, y, z) = T (xi + yj + zk) = xT (i) + yT (j) + zT (k)
219
Lo que significa que la linealidad de T implica que para determinar completamente operador
es suficiente con conocer su acción sobre los elementos de una base. Pasa este caso, la base
canónica de R3 . Tenemos que
T (i) + T (k) = T (i + k) = T (1, 0, 1) = (2, 2, 0)

T (i) + T (j) + T (k) = T (i + j + k) = T (1, 1, 1) = (1, 3, 1).
De donde obtenemos que
T (j) = (1, 3, 1) − (2, 2, 0) = (−1, 1, 1).
Ahora como
T (i) + T (j) = T (i + j) = (0, 2, 2).
Podemos hallar T (i):
T (i) = (0, 2, 2) − T (j) = (0, 2, 2) − (−1, 1, 1) = (1, 1, 1).
Utilizando que
T (i) + T (j) + T (k) = (1, 3, 1),
tenemos que
T (k) = (1, 3, 1) − T (i) − T (j)

= (1, 3, 1) − (1, 1, 1) − (−1, 1, 1)
= (1, 1, −1).
De esta forma vemos que
T (x, y, z) = xT (i) + yT (j) + zT (k)

= x(1, 1, 1) + y(−1, 1, 1) + z(1, 1, −1)
= (x − y + z, x + y + z, x + y − z).
Con lo cual tenemos en inciso (a).
Tomemos (x, y, z) ∈ ker, entonces T (x, y, z) = (0, 0, 0), o bien,
(x − y + z, x + y + z, x + y − z) = (0, 0, 0).
De obtenemos el sistema
220

 x−y+z = 0
x+y+z =0
x+y−z =0

Sumando la primera y segunda ecuación nos da 2x + 2y = 0, de donde x = −y y sumando la

primera y la tercera ecuación obtenemos x = 0. Por lo tanto, la única solución del sistema
es x = y = z = 0, por lo que el núcleo de la transformación consta únicamente del (0, 0, 0).
Esto se hace evidente al ver el vector (x, y, z) como un vector columna, ya que
x x
   
T (x) = T y  = A y 
z z
donde A es la matriz
1 −1 1
 
A = 1 1 1
1 1 −1
Luego, encontrar el núcleo de la transformación T se reduce a encontrar la solución del

sistema homogéneo Ax = 0, como la matriz A es invertible, la única solución del sistema es
la trivial, en consecuencia,
ker T = {(x, y, z) : T (x, y, z) = (0, 0, 0)}

= {(x, y, z) : Ax = 0}
= {0} = {(0, 0, 0)} .
Podemos escribir la imagen de T como
Im(T ) = {w ∈ W : ∃v ∈ V, w = T (v)} .
En este ejemplo V = W = R3 . Claramente, Im(T ) ⊆ R3 , y si w ∈ R3 y definimos v = A−1 w,

entonces v ∈ R3 y
T (v) = A(A−1 w) = (AA−1 )w = Iw = w,
esto es, w ∈ Im(T ), con lo cual, R3 ⊆ Im(T ). Se concluye que la imagen de la transformación
T es todo el espacio tridimensional: Im(T ) = R3 .
221
6.3. Teorema del cambio de variables en el plano (Op-
cional)
Teorema 6.3.1 (Teorema del cambio de variables en el plano). Sea T : R2 → R2 un
operador de C 1 en una región elemental G(las funciones componentes del operador T tienen
derivadas parciales de primer orden continuas en la región G) del plano uv. En la figura 6.2
se muestran el operador T y el operador S que es el operador inverso de T .
y v
2 2
R T
G
1 S 1
x u
1/2 1 2 1 2
Figura 6.2: El operador T deforma una región G en el plano uv para convertirla en una
región R en el plano xy, una medida de dicha deformación viene dada por el Jacobiano del
operador T
.
y supongase que T mapea de manera inyectiva la región G en una región R del plano xy,
siendo
T (u, v) = (g(u, v), h(u, v)) = (x, y).
Entonces si f : R → R es integrable tenemos que
ZZ ZZ
f (x, y)dxdy = f (g(u, v), h(u, v))|J(u, v)|dudv.
R G
El número J(u, v) denota el Jacobiano del operador T , el cual se define como

∂g ∂g
 
 ∂u ∂v 
∇g
J(u, v) := det = det 
 
∇h

 ∂h ∂h 
∂u ∂v
222
Un caso particular importante del Teorema anterior se da en el siguiente resultado
Teorema 6.3.2. Sea A un matriz de tamaño 2 × 2 con det A 6= 0 y T un operador dado por

x x
T =A . (6.2)
y y
Entonces T transforma paralelogramos en paralelogramos y vértices en vértices. Más aún, si

T (G) es un paralelogramo, G debe ser un paralelogramo.
Nota 6.3.1. Nótese que todo operador lineal de R2 en R2 viene dado en la forma (6.2).
En efecto, puesto que el operador T es lineal es suficiente con conocer su acción sobre los
elementos de alguna base para determinarlo completamente. Por ejemplo, si tomamos la base
canónica de R2 , B = {i, j}, y suponemos que T (i) = (a, b) y T (j) = (c, d) tenemos que
T (x, y) = T (xi + yj) = xT (i) + yT (j) = x(a, b) + y(c, d) = (ax + cy, bx + dy).

a c
La expresión anterior en forma matricial es (6.2) con A = . Observese además que
b d
si, J(x, y) = det A = ad − bc 6= 0, entonces el operador T es inyectivo, por lo tanto, si
T (G) = R, por el Teorema del cambio de variables tenemos que
ZZ
a(R) = dxdy
ZZ R
= |J(u, v)|dudv
ZZ G
= | det A|dudv
G
ZZ
= | det A| dudv
G
= | det A|a(G).
Ejemplo 6.3 (Coordenadas polares). Como un caso particular del Teorema 6.3.1, damos
una fórmula para integración en coordenadas polares. En este caso el operador T del plano
rθ al plano xy está dado por
x = g(r, θ) = r cos θ, y = h(r, θ) = r sen θ,
223
θ y
T R
β
G r=a r=b
α
β
r α x
a b
Figura 6.3: En el plano xy se muestra un rectángulo polar
si θ = k = cte, entonces,
y r sen k
= = tan k.
x r cos k
Es decir, tenemos una recta que pasa por el origen ypque forma un ángulo de k grados con
el eje x. Por otro lado, si r = k = cte, entonces, x2 + y 2 = k, una circunferencia con
centro en (0, 0) y radio k. De este forma, obtenemos el rectángulo polar en el plano xy que
se muestra en la figura 6.3. Además tenemos que
∂g ∂g
 
 ∂r ∂θ 
cos θ −r sen θ
J(r, θ) = det   = det = r.
 
 ∂h ∂h  sen θ r cos θ
∂r ∂θ
Entonces por el Teorema del cambio de variables obtenemos
ZZ ZZ
f (x, y)dxdy = f (r cos θ, r sen θ)|J(r, θ)|drdθ
R G
Z βZ b
= f (r cos θ, r sen θ)rdrdθ
α a
Para el caso más general en el que tengamos una región polar R de la forma
R = {(r, θ) : h1 (θ) ≤ r ≤ h2 (θ), α ≤ θ ≤ β}
tal como se muestra el la figura
224
R r = h2 (θ)
r = h1 (θ)
β
α
Figura 6.4: Para encontrar los lı́mites de integración en un cambio a coordenadas polares,
trazamos un rayo que atraviese la región R, vemos que este entra en una función polar de
ecuación r = h1 (θ) y sale en r = h2 (θ), si movemos este rayo empezando en θ = α hasta
θ = β barremos la región.
podemos hallar el área de la región R por un cambio a coordenadas polares, utilizando el

Teorema del cambio de variables, el Teorema de Fubinni y segundo Teorema fundamental del
cálculo.
ZZ
a(R) = dxdy
R
ZZ
= |J(r, θ)|drdθ
G
Z β Z h2 (θ)
= rdrdθ
α h1 (θ)
"Z #
Z β h2 (θ)
= rdr dθ
α h1 (θ)
Z β Z h2 (θ)
2
= r /2 dθ
α h1 (θ)
β
1 2
Z
h2 (θ) − h21 (θ) dθ.

=
α 2
Por lo tanto, como un caso particular del Teorema del cambio de variables, tenemos una
fórmula para calcular el área entre curvas en coordenadas polares
Z β
1 2
h2 (θ) − h21 (θ) dθ.

a(R) = (6.3)
α 2
225
Ejemplo 6.4 (Operador rotación). Un caso particular de operador lineal de R2 en R2 es el
operador rotación, cuya fórmula deducimos a continuación. Tomemos un vector (u, v) en
el plano uv con magnitud r y dirección α y supongamos que este vector gira un ángulo de θ
radianes en dirección contraria de las manecillas del reloj como se muestra en la figura 6.5.
(x, y)
r (u, v)
θ r
α
u
Figura 6.5: El vector (u, v) gira un ángulo θ en dirección contraria de las manecillas del reloj
Entonces la magnitud del vector (x, y), sigue siendo r, pero su dirección es α + θ. En
consecuencia,
x = r cos(α + θ)
= r cos α cos θ − r sen α sen θ
= u cos θ − v sen θ.
y = r sen(α + θ)
= r sen α cos θ + r cos α sen θ
= v cos θ + u sen θ.
Lo cual expresamos en forma matricial como sigue

x cos θu − sen θv cos θ − sen θ u
= =
y sen θu cos θv sen θ cos θ v
Con lo cual vemos que el operador rotación está definido en el plano uv, tomando valores en
el plano xy, y está dado por

u cos θ − sen θ u x
T = = .
v sen θ cos θ v y
226
Dado que

cos θ − sen θ
det = 1 6= 0,
sen θ cos θ
si R = T (G), el Teorema del cambio de variables nos da

ZZ
a(R) = dxdy = | det A|a(G) = a(G).
R
El uso del operador rotación se ilustra en el problema 6.3.4.
Problema 6.3.3. Hallar el área del paralelogramo generado por los vectores A = (a, b) y
B = (c, d).
Solución. Este problema se puede resolver directamente, de forma cartesiana, o bien uti-
lizando el producto cruz. Para resolver el problema utilizando el Teorema del cambio de
variables la idea es definir un operador T que aplique el cuadrado unitario en el plano uv en
el paralelogramo R en el plano xy como se representa en la figura 6.6.
v y
j B
R
(x, y)
T b
G
A
u x
i
Figura 6.6: El operador T transforma el cuadrado unitario en un paralelogramo
La elección de la región G como el cuadrado unitario viene del hecho que todo punto
(x, y) en la región R se puede expresar como una combinación lineal de la forma
(x, y) = uA + vB
donde los escalares u, v pertenecen al intervalo [0, 1]. Entonces, según el Teorema 6.3.2 y lo
hecho en la Nota 6.3.1 debemos suponer que el operador T es lineal y que
T (i) = A, T (j) = B
227
Con lo cual, T (u, v) = T (ui + vj) = uT (i) + vT (j) = u(a, b) + v(c, d) = (au + cv, bu + dv).
Lo cual se expresa en forma matricial como

u a c u x
T = = .
v b d v y
Ahora como los vectores A y B son linealmente independientes resulta que

a c
det = ad − bc 6= 0,
b d
lo cual implica que el operador T es inyectivo. Más aún, demostraremos que R = T (G),
donde
T (G) = {T (u, v) : (u, v) ∈ G} ,
G = [0, 1] × [0, 1] = {(u, v) : 0 ≤ u ≤ 1, 0 ≤ v ≤ 1}
En efecto, tomemos (x, y) ∈ R, entonces existe (u, v) ∈ G tal que
(x, y) = u(a, b) + v(c, d) = T (u, v).
Esto es, (x, y) ∈ T (G). Por otro lado, si (x, y) ∈ T (G), entonces existe (u, v) ∈ G con
T (u, v) = (x, y), es decir (x, y) = u(a, b) + v(c, d), lo cual significa (x, y) ∈ R. Ahora, por lo
hecho el Nota 6.3.1 podemos podemos concluir que
a(R) = | det A|a(G) = | det A|12 = | det A|.
Problema 6.3.4. Hallar el área encerrada por la curva de ecuación
a2
x2 + xy + y 2 = , a > 0.
2
Solución. Para resolver este problema consideraremos los siguientes resultados
Teorema 6.3.5. La gráfica de la ecuación
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
es una cónica o bien una cónica degenerada. Si es una cónica entonces es
(a) Una parábola si B 2 − 4AC = 0
228
(b) Una elipse si B 2 − 4AC < 0
(c) Una hipérbola si B 2 − 4AC > 0.
Teorema 6.3.6. Si B 6= 0, la ecuación
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 (6.4)
se puede trasformar en la ecuación
Au2 + Cv 2 + Du + Ev + F = 0 (6.5)
donde A y C no son ambos cero, por una rotación de ejes en un ángulo de θ radianes para
el cual se cumple que:
A−C
cot 2θ = .
B
Para pasar de la ecuación (6.4) a la ecuación (6.5) utilizamos el operador rotación:

u cos θ − sen θ u x
T = = .
v sen θ cos θ v y
si queremos pasar del la ecuación (6.5) a la ecuación (6.4), utilizamos el operador inverso

x cos θ sen θ x u
S = = .
y − sen θ cos θ y v
Para nuestro caso tenemos que A = B = C = 1, D = E = 0 y F = −a2 /2. Con lo cual,
B 2 − 4AC = 1 − 4 < 0, luego por el Teorema 6.3.5, la cónica es una elipse. Ahora como
B = 1 6= 0, por el Teorema 6.3.6, la elipse está rotada y el ángulo de rotación satisface la
relación
A−C
cot 2θ = = 0,
B
de donde, cos 2θ = 0, esto es, θ = π/4. Por lo tanto, el operador rotación está dado por
√ √
u 1/ 2 −1/ 2, u x
T = √ √ = .
v 1/ 2 1/ 2 v y
De donde obtenemos las ecuaciones de transformación

1
x = √ (u − v)
2
1
y = √ (u + v).
2
229
Ahora consideremos la región
R := (x, y) : x2 + xy + y 2 ≤ a2 /2 ,

(6.6)
y supongamos que (x, y) ∈ ∂R. En tal caso tenemos que

a2 1 1 1 3 1
= x2 + xy + y 2 = (u − v)2 + (u − v)(u + v) + (u + v)2 = u2 + v 2 .
2 2 2 2 2 2
Es decir, 3u2 + v 2 = a2 . Concluimos que el operador T mapea una región G en el plano uv
en la región R en la plano xy dada por (6.6), donde
G := (x, y) : 3u2 + v 2 ≤ a2 .

(6.7)
Ver la figura de abajo.
v y
G S R
u x
Podemos ahora aplicar el Teorema de cambio de variables para concluir que

a π
Z Z Z
A(R) = dA = |J(u, v)|dudv = dudv = A(G) = π √ · a = √ a2 .
R G G 3 3
Ver el Problema 6.6.1.
6.4. Representación matricial de una transformación

lineal
Si A ∈ Mm×n (R) y definimos la función T : Rn → Rm dada por T (x) = Ax, por la ley
distributiva del producto matricial la transformación T resulta ser lineal. Recı́procamente,
si T : Rn → Rm es lineal, existe una matriz A ∈ Mm×n (R) tal que T (x) = Ax. En efecto,
sea B = {e1 , . . . , en } la base canónica de Rn , de tal forma que si x = (x1 , . . . , xn )
x = x1 e1 + · · · + xn en .
230
Como T : Rn → Rm es lineal tenemos que
T (x) = x1 T (e1 ) + · · · + xn T (en ).
Entonces, si A = [aij ]m×n es una matriz tal que sus columnas son respectivamente los vec-
tores T (e1 )t , . . . , T (en )t , tenemos que T (x) = Ax. A la matriz A se le conoce como matriz
asociada a la transformación T respecto a la base canónica, también se le llama represen-
tación matricial de T y escribimos A = [T ]B .
Las nociones presentadas en la sección 5.7 también son validas para transformaciones
lineales.
Teorema 6.4.1. Sea A = [T ]B la representación matricial de una transformación lineal T .

Entonces
(a) Im(T ) = Im(A) = CA
(b) ρ(T ) = ρ(A)
(c) ker T = ker A
(d) ν(T ) = ν(A)
Teorema 6.4.2 (Teorema de la dimensión para transformaciones lineales). Sean V y W

espacios vectoriales de dimensión finita y T : V → W una transformación lineal. Entonces
ν(T ) + ρ(T ) = dim V.
Ejemplo 6.5. Considere la función T : R3 → R2 dada por T (x, y, z) = (x+2y−z, 2x−y+3z).

Encuentre la nulidad y el rango de T y verifique el teorema de la dimensión.
Solución. Como T (e1 ) = (1, 2), T (e2 ) = (2, −1) y T (e3 ) = (−1, 3), la matriz asociada a T
respecto a la base canónica es

t t t
1 2 −1
A = [T ]B = T (e1 ) T (e2 ) T (e3 ) =
2 −1 3
En el ejemplo 5.12 se encontró que ν(A) = 1 y en el ejemplo 5.13 que ρ(A) = 2. Se verifica
que
ν(T ) + ρ(T ) = ν(A) + ρ(A) = 1 + 2 = 3 = dim R3 .
231
6.5. Isomorfismos
6.6. Problemas
x2 y 2
Problema 6.6.1 (**). Halle el área encerrada por la elipse 2 + 2 = 1. Sugerencia: Use
a b
el operador
T (u, v) = (au, bv) = (x, y).
Note que este operador mapea de manera inyectiva, el interior del circulo unitario en el plano
uv en el interior de la elipse en el plano xy.
Problema 6.6.2. En el Ejemplo 7.6.2 se encontró que la representación paramétrica de la

curva de intersección de las superficies
2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
viene dada por la función vectorial

√
α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).
Utilizando el operador proyección demostrar que la proyección de la curva C sobre el plano

yz es una elipse, mientras que la proyección de C sobre el plano xy es una recta.
232
Capı́tulo 7
Formas canónicas elementales
7.1. Valores y vectores propios
7.2. Matrices semejantes y diagonalización
7.3. Matrices semejantes y diagonalización ortogonal
7.4. Formas cuadráticas
7.5. Problemas
Problema 7.5.1. Demostrar que
Z √
F · dα = π 3a2 ,
C
siendo F = (y, z, x) y C la curva de intersección entre la esfera x2 + y 2 + z 2 = a2 y el plano

x + y + z = 0, a > 0:
(a) Directamente,
(b) usando el teorema de Stokes.
Solución. Resolvamos primero el problema directamente. Los puntos sobre la curva de

intersección C satisfacen el sistema de ecuaciones
2
x + y 2 + z 2 = a2
x + y + z = 0.
233
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando z en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos
a2 = x2 + y 2 + (−x − y)2 = 2x2 + 2xy + 2y 2 ,
o equivalentemente, x2 + xy + y 2 = a2 /2. Tenemos la ecuación cartesiana de una curva

proyectada sobre el plano xy y vemos que la curva es precisamente la elipse rotada del.
Demostramos en ese problema que esta elipse proviene de la elipse no rotada 3u2 + v 2 = a2
y que ambas elipses están relacionadas mediante la ecuaciones de transformación
1
x = √ (u − v)
2
(7.1)
1
y = √ (u + v).
2
a
Entonces tomemos u = √ sen t y v = a cos t, al variar t entre 0 y 2π parametrizamos
3
la frontera de la región G en dirección horaria (ver la figura al final. Ahora utilizando las
ecuaciones de transformación (7.1), obtenemos
a 1 a a
x = √ ( √ sen t − cos t) = √ sen t − √ cos t,
2 3 6 2
a 1 a a
y = √ ( √ sen t + cos t) = √ sen t + √ cos t.
2 3 6 2
Pero z = −x − y, entonces
2a
z = − √ sen t.
6
Por lo tanto,
a a a a 2a
α(t) = ( √ sen t − √ cos t, √ sen t + √ cos t, − √ sen t), 0 ≤ t ≤ 2π.
6 2 6 2 6
De este modo tenemos que C = α ([0, 2π]) = {α(t), 0 ≤ t ≤ 2π}.
234
Z
y = −x, z = 0
C
Ahora podemos empezar a calcular la integral.
dx a a
= √ cos t + √ sen t
dt 6 2
dy a a
= √ cos t − √ sen t
dt 6 2
dz 2a
= − √ cos t.
dt 6
a2 a2

dx a a a a
y = √ sen t + √ cos t √ cos t + √ sen t = sen 2t + √ .
dt 6 2 6 2 3 2 3
a2 a2

dy 2a a a
z = − √ sen t √ cos t − √ sen t = − sen 2t + √ sen2 t.
dt 6 6 2 6 3
a2 a2

dz a a 2a
x = √ sen t − √ cos t − √ cos t = − sen 2t + √ cos2 t.
dt 6 2 6 6 3
235
Entonces
Z Z
F · dα = ydx + zdy + xdz
C C
Z 2π
2
a2

a
= √ + √ dt
0 2 3 3
√ 2
= π 3a .
En la gráfica de abajo se muestra la curva de intersección C, junto con su proyección Γ

sobre el plano xy.
z
Efectuaremos la integración sobre la superficie C
S del plano x + y + z = 0 encerrada por la curva C.
Esto es, S = {(x, y, z) : x + y + z = 0, (x, y) ∈ T }, Γ
siendo, T = {(x, y) : x2 + xy + y 2 ≤ a2 /2}. y
x
7.6. Soluciones a algunos de los problemas

Problema 7.6.1. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.
Solución. Sean x, y y z el número de acciones que la inversionista tiene en Delta, Hilton

Hotels y McDonald’s respectivamente. El corredor recuerda que hace dos dı́as el precio de
las acciones de Delta airlines bajó $1 por acción. Por lo tanto, hace dos dı́as el precio de las
acciones Delta bajó x pesos. De manera similar el precio de las acciones de Hilton Hotels
3 1
bajó y pesos, y el precio de las acciones de McDonald’s subió z pesos. De donde tenemos
2 2
la ecuación
3 1
−x − y + z = −350.
2 2
236
Ahora, con la información que el corredor tiene sobre el dı́a de ayer, establecemos la ecuación
3 1
x − y + z = 600.
2 2
La matriz aumentada del sistema conformado por las dos ecuaciones anteriores es:

−1 −3/2 1/2 | −350
3/2 −1/2 1 | 600
Ahora aplicamos eliminación Gaussiana para obtener la forma escalonada por filas de la
matriz.
R1 → −6R1
−1 −3/2 1/2 | −350 6 9 −3 | 2100
R1 → −4R1
3/2 −1/2 1 | 600 −6 2 −4 | −2400
⇐⇒

6 9 −3 | 2100 R2 → R1 + R2 6 9 −3 | 2100
−6 2 −4 | −2400 ⇐⇒ 0 11 −7 | −300
R1 → (1/3)R1
6 9 −3 | 2100 2 3 −1 | 700
R2 → (1/11)R2
0 11 −7 | −300 0 1 −7/11 | −300/11
⇐⇒

2 3 −1 | 700 R1 → −3R1 + R2 2 0 10/11 | 8600/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11

2 0 10/11 | 8600/11 R1 → (1/2)R1 1 0 5/11 | 4300/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11
Volviendo de nuevo al sistema encontramos que

5 4300 7 300
x+ z= , y− z=− .
11 11 11 11
Se observa que z es la variable de ligamiento, por lo tanto si z = t. Entonces
4300 5 4300 − 5t 7 300 7t − 300
x= − t= , y = t− = , t ∈ R. (7.2)
11 11 11 11 11 11
237
Es decir, el sistema tiene infinitas soluciones reales dadas en la forma

 x = (4300 − 5t)/11
y = (7t − 300)/11
z = t, t ∈ R

Ahora despejando el parámetro t de la primera ecuación obtenemos

4300 − 11x
t= ,
5
Reemplazando este valor en la segunda ecuación nos da

7 4300 − 11x 300
y= − ,
11 5 11
o equivalentemente,
77x + 55y = 28600. (7.3)
Luego, tenemos una ecuación Diofántica con a = 77, b = 55 y c = 28600. Además, como
(77, 55) = 11 y 11|28600 por el Teorema 1.5.1 la ecuación tiene solución. Más aún, si el
corredor sabe que la inversionista tiene z = t = 200 acciones de McDonald’s, entonces
puede determinar que además posee x0 = (4300 − 5 · 200)/11 = 300 acciones de Delta, y
y0 = (7 · 200 − 300)/11 = 100 acciones de Hilton. Nótese que x0 = 300 y y0 = 100 es una
solución particular de la ecuación Diofántica (7.3). Por lo tanto una nueva aplicación del
Teorema 1.5.1 nos permite concluir que la solución general de la ecuación Diofántica es
55 77
x = 300 + k = 300 + 5k, y = 100 − k = 100 − 7k, k ∈ Z.
11 11
Pero
4300 − 11x 4300 − 11(300 + 5k)
z= = = 200 − 11k.
5 5
Concluimos que las soluciones enteras del problema son

 x = 300 + 5k
y = 100 − 7k
z = 200 − 11k, k ∈ Z

Con la restricción x, y, z ≥ 0. Luego,

2
x = 300 + 5k ≥ 0 ⇔ k ≥ −60, y = 100 − 7k ≥ 0 ⇔ k ≤ 100/7 = 14 + .
7
238
Por lo tanto, −60 ≤ k ≤ 14. Esto es, k = −60, −59, . . . , 0, 1, 2 . . . , 14. Por consiguiente, el
problema tiene en realidad finitas soluciones, más exactamente, tenemos 75 soluciones, una
por cada valor de k. Este número de soluciones pudo haber sido obtenido sin usar ecuaciones
Diofánticas como sigue: Dado que las variables x, y deben ser no negativas, de la forma
paramétrica de las soluciones dada en (7.2) se tiene que
4300 − 5t ≥ 0, 7t − 300 ≥ 0,
de donde
860 = 4300/5 ≤ t ≤ 300/7 = 42,857.
Esto es, 43 ≤ t ≤ 860. Ahora bien, como el denominador en las expresiones paramétricas
para x y y dadas en (7.2) es 11, para saber el número de la soluciones enteras del problema,
debemos
j 860 k contar los múltiplos de 11 presentes en el intervalo de 43 a 860. De 1 a 860 hay
= 78 múltiplos de 11
11
44 858
11(1), 11(2), 11(3), 11(4), . . . , 11(78).
Entonces, de 43 a 860 hay 78 − 3 = 75 múltiplos de 11. Lo que quiere decir que hay 75
soluciones enteras positivas del problema.
√
Solución. Los puntos sobre la curva de intersección C satisfacen el sistema de ecuaciones

2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando y en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos
(x − 1)2 + z 2 /2 = 1.
239
Tenemos la ecuación cartesiana de una curva proyectada sobre el plano xz, para este caso
una elipse. En la figura 7.2 se muestra esta curva en azul. Denotemos por Γ a el conjunto de
puntos en el espacio que están sobre esta elipse, esto es,
Γ = (x, y, z) : (x − 1)2 + z 2 /2 = 1, y = 0 .

plano x + y = 2
y
x
Figura 7.1: En rojo se muestra la trayectoria seguida por la partı́cula junto con su dirección.
Se advierte que desde nuestro punto de vista (opuesto al origen) se aprecia que la partı́cula
sigue la dirección de las manecillas del reloj.
√
Empecemos por parametrizar la curva Γ. Tomemos x−1 = cos t y y = 2 sen t. Entonces
√
β(t) = (1 + cos t, 0, 2 sen t), 0 ≤ t ≤ 2π.
Ası́,
Γ = β([0, 2π]) = {β(t) : t ∈ [0, 2π]} .
240
z
Γ
C
y
x
Figura 7.2: En azul se muestra la proyección Γ de la trayectoria C. Para este caso tenemos
una elipse proyectada sobre el plano xz.
Ahora para parametrizar la curva C, utilizamos el hecho de que x + y = 2 para todo

punto de C. Entonces y = 2 − x = 2 − (1 + cos t) = 1 − cos t. Con lo cual,
C = α([0, 2π]),
donde
√
α(t) = (1 + cos t, 1 − cos t, 2 sen t).
En la figura 7.1 vemos esta curva en rojo. Vemos que α(0) = (2, 0, 0). Esto es, la partı́cula
empieza su recorrido en el punto (2, 0, 0). Si la función α(t) representa la posición de la
√
partı́cula se debe cumplir que su rapidez kα′ (t)k = 2 2m/s. Sin embargo tenemos que
√
α′ (t) = (− sen t, sen t, 2 cos t),
√ √
de donde kα′ (t)k = 2 6= 2 2. Para encontrar el vector posición de la partı́cula debemos
hallar ω tal que
√
kγ ′ (t)k = 2 2.
√
donde γ(t) = α(ωt) = (1 + cos ωt, 1 − cos ωt, 2 sen ωt).
√
γ ′ (t) = (−ω sen ωt, ω sen ωt, 2ω cos ωt).
√ √ √ √
kγ ′ (t)k = 2 2 ⇔ ω 2 cos2 ωt + ω 2 cos2 ωt + 2ω 2 sen2 ωt = 2ω = 2 2.
241
Por lo tanto, ω = 2 y el vector posición de la partı́cula está dado por
√
γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t).
√
(1, 1, 2)
b C
b (0, 2, 0)
(2, 0, 0) b b
y
x
b
√
(1, 1, − 2)
Figura 7.3: A medida que crece el parámetro t crece de 0 a π, los puntos se distribuyen sobre
la curva de intersección C siguiendo la dirección de la opuesta a las agujas del reloj, vista
desde el origen
En el cuadro 7.1 se observa que la partı́cula tiene un periodo (tiempo en completar una
revolución) de π segundos
t x y z
0 2 0 0
√
π/4 1 1 2
π/2 0 2 0
√
3π/4 1 1 − 2
π 2 0 0
Cuadro 7.1: La partı́cula empieza su recorrido en el punto (2, 0, 0), pasado un tiempo de π
segundos regresa al mismo punto.
Conclusión: el vector posición de la partı́cula está dado por

√
γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t), 0 ≤ t ≤ π.
242
7.7. Solución Examen Final Conjunto de Álgebra Li-
neal 6 de Junio del 2018
Problema 7.7.1. ¿Cuál de las siguientes afirmaciones es verdadera?
(a) Las operaciones elementales entre matrices no alteran el determinante.
(b) Para toda matriz cuadrada tenemos que: det A = − det(At ).
(c) Para toda matriz cuadrada se tiene que det(A−1 ) = 1/ det A.
(d) Para cualquier par de matrices cuadradas tendremos: det(AB t ) = det A det B
Solución. A continuación mostramos las tres operaciones elementales definidas entre ma-
trices, ası́ como su efecto sobre del el determinante.
(1) Ri → cRi ⇒ det B = c det A
(2) Rj → Rj + cRi ⇒ det B = det A
(3) Ri ↔ Rj ⇒ det B = − det A
Para la primera operación elemental la matriz B es obtenida de A al cambiar i- ésima fila

por esa misma fila multiplicada por c, y vemos que el efecto sobre el determinante es que
queda multiplicado por la constante c.
Para el caso de la tercera operación elemental, vemos que el efecto sobre el determinante,
es que este cambia de signo, cuando se intercambian dos de sus filas.
La segunda operación elemental, es la única que no cambia el determinante.
Vemos que la afirmación en (a) es falsa.
En el inciso (b), nótese que si A ∈ Mn×n (R), entonces det A = det At (ver el problema
2.7.3). Por lo tanto, si suponemos que la afirmación (b) es cierta, tendrı́amos que
det A = − det At = − det A ⇒ det A = 0.
Luego, es suficiente con escoger una matriz cuyo determinante sea distinto de cero para
mostrar que la afirmación es falsa. Por ejemplo, si

1 0
A :=
2 3
243
entonces

1 0 1 2
det A =
= 3 6= −3 = −

2 3 0 3
Claramente, la afirmación (c) es falsa. Dado det A debe ser diferente de cero. Si A ∈
Mn×n (R) y det A 6= 0, entonces por el Teorema 2.4.1, A es invertible, por lo tanto, existe
A−1 , y AA−1 = I, de lo cual, por el Teorema 2.3.1, y el Teorema 2.1.1 obtenemos que
det A det A−1 = det(AA−1 ) = det I = 1.
Concluimos que
det A−1 = 1/ det A.
Nos queda demostrar la veracidad de la afirmación (d). De nuevo por el Teorema 2.3.1
tenemos que
det(AB t ) = det A det B t = det AB.
Problema 7.7.2. ¿Cuál de las siguientes matrices no es triangular superior?
(a) Matriz cuadrada nula.
(b) Matriz diagonal.
(c) Matriz antisimétrica no nula.
(d) Matriz identidad.
Solución. Las matrices de los incisos (a), (b) y (d) son todas casos particulares de una
matriz triangular superior. Construiremos una matriz antisimétrica no nula.
Sea

a b
A :=
c d
Como A es antisimétrica tenemos que At = −A, es decir

a c −a −b
= =
b d −c −d
de donde obtenemos el sistema
a = −a, c = −b, b = −c, d = −d.
244
De la primera y última ecuaciones nos da que a = 0 y d = 0, y de las ecuaciones del medio,
obtenemos que b = −c. En consecuencia, todas las matrices antisimétricas de tamaño 2 × 2
son de la forma

0 −c
,c ∈ R
c 0
Vemos que hay un número infinito de matrices antisimétricas de tamaño 2 × 2, si c = 0,

tenemos la matriz cero, y si c 6= 0, generamos un conjunto infinito de matrices antisimétricas
no nulas, que a su vez no son triangulares superiores.
Para una aplicación de las propiedades del determinante ver el problema 2.3.10 y el
ejemplo 2.1.
245
7.8. Cálculo e ingenierı́a civil
Problema 7.8.1 (Cálculo en varias variables e ingenierı́a civil). Encuentre el volumen y
área superficial del soporte para tuberı́a (columna de base elı́ptica donde se pone una
tuberı́a, por ejemplo un oleoducto, como el que se muestra en color azul en la figura 7.4(a)).
Encuentre además, el área del cilindro circular cortada por el cilindro elı́ptico. Esta es el
área encerrada por la curva de intersección C que se muestra en gris en la figura 7.4(b).
z
z
Cilindro cı́rcular
C C
b
H h
b
a y
x y x
Cilindro elı́ptico
(a) Soporte elı́ptico de una tuberı́a (b) Sólido limitado por dos cilin-
circular dros
Figura 7.4: El cilindro elı́ptico genera una curva de intersección C sobre el cilindro circular.
Denotamos con H a el punto más alto sobre la curva C y con h a su punto más bajo. Estos
valores se alcanzan respectivamente en los puntos (a, 0, 0) y (0, b, 0), donde las constantes a
y b son los semiejes de la elipse que genera el cilindro elı́ptico.
Solución. Supongamos que el cilindro elı́ptico es generado por una elipse de semiejes a y b.
246
z
p
z =R+h+ R2 − x 2 , y = 0
b b
(R, R + h)
R
y
b
(a, H)
x2 y2 h
+ = 1, z = 0 b
a2 b2 z =R+h−
p
R2 − x 2 , y = 0
b
T a
x −a
b b
a x
(a) Curva base del cilindro (b) Curva base del cilindro circular
elı́ptico
Figura 7.5: En la parte (a) se muestra la intersección del cilindro elı́ptico con el plano xy y
en la parte (b) la intersección del cilindro circular con el plano xz
Esta serı́a la base del cilindro elı́ptico, ver la figuras 7.4 y 7.5(a). Se supone además que
el eje del cilindro elı́ptico es el eje z. Por lo tanto, la ecuación de este cilindro es
x2 y 2
+ 2 = 1, z ∈ R
a2 b
Suponemos que los semiejes a y b son dados. Sobre el punto (a, 0, 0) medimos una altura
H y sobre el punto (0, b, 0) medimos una altura h donde 0 < h < H. La altura mı́nima h
es la distancia a la que está el cilindro circular del piso, y la altura máxima H es el mayor
valor permitido para las componentes en z de ambos cilindros. Ver la figura 7.4(b) y la figura
7.5(b). Las alturas h, H también las suponemos dadas.
Ahora bien, si R denota el radio del cilindro circular, según se ve en la figura 7.5(b) el
centro del cilindro es (0, 0, R + h). Estamos suponiendo que el eje de este cilindro es la recta
paralela al eje y que está a un altura h del piso, de modo que su ecuación es
x2 + (z − (R + h))2 = R2 , y ∈ R.
Para que el cilindro circular no se doble sobre si mismo, debemos tener que 0 ≤ z ≤ R + h.
Esto queda claro al observar la figura 7.5(b) donde se infiere que z varia entre 0 y R + h,
mientras x lo hace entre 0 y R. Esto, para parte del cilindro que queda por debajo de la
recta z = R + h, que es la que no interesa. Concluimos que la ecuación del cilindro circular
es
√
z = f (x, y) = R + h − R2 − x2 , y ∈ R.
247
De nuevo, al observar la figura 7.5(b), vemos que z = H cuando x = a. Por lo tanto, tenemos
que
√
H = R + h − R2 − a2 . (7.4)
Podemos despejar R de la ecuación anterior para obtener
a2 + (H − h)2
R= . (7.5)
2(H − h)
La relación (7.4) impone las siguientes restricciones
0 < h − H < R, 0 < a ≤ R.
Podemos resumir lo hecho hasta ahora como sigue: Dada una tuberı́a elı́ptica de ancho mayor
2a, y de ancho menor 2b, la cual cortamos a una altura H, en la que introducimos a una
altura h < H (medida desde el piso) un oleoducto circular de radio dado por (7.5), generando
el sólido que se muestra en la figura 7.4(b), para el queremos determinar el volumen y el
área superficial, tanto lateral como superior.
Por simetrı́a, podemos obtener el volumen del sólido al multiplicar por 4 la integral doble
ZZ
f (x, y)dA,
T
donde T es la región del tipo 2 limitada en el primer cuadrante por la elipse base del cilindro
elı́ptico y los ejes coordenados (ver la figura 7.5(a)), esto es,
b√ 2

T = (x, y) : 0 ≤ x ≤ a, 0 ≤ y ≤ a −x2
a
El volumen del sólido en cuestión es entonces
Z a Z b √a2 −x2 √
V =4 a 2 2
R + h − R − x dydx
0 0
4b
Z a √ √
= R + h − R2 − x2 a2 − x2 dx.
a 0
Esto es,
4b
Z a √ √
V = R+h− R2 − x2 a2 − x2 dx 0 < a ≤ R. (7.6)
a 0
Por ejemplo, si queremos saber, cuanto cemento se requiere para rellenar un soporte elı́ptico
de semiejes a = 0,4m = 15,7pulg, b = 0,3m = 11,8pulg y una altura H = 100pulg, sobre el
248
cual se coloca a una altura h = 87,3pulg un cilindro circular, primero aplicamos la fórmula
(7.5) para el radio del cilindro circular
15,72 + (100 − 87,3)2
R= = 16,054.
2(100 − 87,3)
Se observa que se cumple que 16,054 ≥ 15,7, y que 16,054 > 100 − 87,3 = 12,7. Ahora
aplicamos la fórmula (7.6) para hallar el la cantidad aproximada de cemento necesaria para
rellenar el sólido
4 · 11,8 15,7
Z p p
V = 2
16,054 + 87,3 − 16,054 − x 2 15,72 − x2 = 52140pulg 3.
15,7 0
El área de la parte superior de la tuberı́a (área de la superficie del cilindro circular cortada
por el cilindro elı́ptico) está dada por
ZZ q
A=4 1 + fx2 + fy2 dA
T
Z √
4bR a a2 − x2
= √ dx 0 < a ≤ R.
a 0 R2 − x2
Es decir,
a
√
4bR a2 − x2
Z
A= √ dx 0 < a ≤ R. (7.7)
a 0 R2 − x2
Con los mismos valores usados para a, b, h y H para hallar el volumen del sólido, encontramos
que el área de la parte superior de la tuberı́a es
p
4(11,8)(16,054) 15,7 15,72 − x2
Z
A= p dx = 716,29pulg 2.
15,7 0
2
16,054 − x 2
Para hallar el área lateral de la tuberı́a (área del cilindro elı́ptico cortada por el cilindro
circular) empezamos parametrizando la curva Γ que se muestra en figura 7.6
C
b
H h
b
a Γ
y
x
Figura 7.6: La recta vertical que se muestra en verde se mueve entre las curvas Γ y C para
generar el área lateral del cilindro elı́ptico cortada por el cilindro circular
249
Sea I = [0, 2π], entonces Γ = α(I) donde
α(t) = (a cos t, b sen t) = (x, y),

√
con (x, y, z) ∈ C. Como z = f (x, y) = R + h − R2 − x2 . Tenemos que el área lateral del la
tuberı́a esta dada por
Z Z 2π
Al = f ds = f (α(t))kα′(t)kdt
Γ 0
Z 2π √ √
= 2
R + h − R − a cos t 2 2 a2 sen2 t + b2 cos2 tdt.
0
Esto es,
Z 2π √ √
Al = R + h − R2 − a2 cos2 t a2 sen2 t + b2 cos2 tdt. (7.8)
0
La fórmula (7.8) se obtuvo utilizando una integral de linea, también podemos hallar el área
lateral de la tuberı́a mediante una integral de superficie.
Si S es la superficie del cilindro elı́ptico cortada por el cilindro circular, entonces S = r(G)
donde
r(u, v) = (a cos u, b sen u, v),
y G = {(u, v) : 0 ≤ u ≤ 2π, 0 ≤ v ≤ g(u)} con

√
g(u) = R + h − R2 − a2 cos2 u.
Con lo cual, el área lateral de la tuberı́a está dada por

ZZ
Al = kru × rv kdvdu
G
Z 2π Z g(u) √
= a2 sen2 u + b2 cos2 udvdu
Z0 2π √0
= a2 sen2 u + b2 cos2 ug(u)du
0
Entonces
Z 2π √ √
Al = a2 sen2 u + b2 cos2 u R + h − R2 − a2 cos2 u du. (7.9)
0
Si comparamos esta fórmula con la fórmula (7.8) vemos que es la misma, reemplazando u
por t. El área lateral de la tuberı́a también se puede obtener con una fórmula similar a la
encontrada en (7.7).
250
Problema 7.8.2 (***). Encuentre una fórmula similar a la encontrada en (7.7) para hallar
el área lateral de la tuberı́a del problema 7.8.1. Compruebe la validez de su fórmula, com-
parando el valor encontrado para el área al sustituir a = 15,7pulg y R = 16,054pulg, en la
fórmula (7.8).
Suponga que los cilindros del problema 7.8.1 son ambos circulares y del mismo radio R.
Encuentre el volumen del sólido en cuestión como función de la altura h y el radio R. Lo
mismo, para el área lateral y superior de la tuberı́a.
251
252
Bibliografı́a
[1] T. M. Apostol, Calculus, vol. I (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1988, 813 pp.
[2] T. M. Apostol, Calculus, vol. II (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1980, 813 pp.
[3] S. I. Grossman, Álgebra lineal (5th ed.), McGraw–Hill, 1996, 634 pp.
[4] K. Hoffman and R. Kunze Linear algebra(2nd ed.), Prentice–Hall, Inc., Englewood
Cliffs, New Jersey, 1971, 407 pp.
[5] B. Kolman and D. R. Hill, Álgebra lineal (8th ed.), Pearson Educación, 2006, 643 pp.
[6] L. Leithold, El Cálculo(6a ed.), Harla, 1992, 1563 pp.
[7] J. Stewart, L. Redlin And S. Watson, Precálculo(5a ed.), Cengage Learning Editores,
2007, 933 pp.
[8] J. Stewart, Calculus(6th ed.), Thomson–Brook–cole, 2008, 1338 pp.
253

Mis Notas de Clase A.L PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Mis Notas de Clase A.L PDF

Cargado por

Copyright:

Formatos disponibles

Álgebra lineal

David Ojeda Marulanda

5. Espacios vectoriales 195

6. Transformaciones lineales 217

7. Formas canónicas elementales 233

Una ecuación lineal de una variable es una expresión de la forma

Volviendo a la ecuación (1.1), por la propiedad (1.2) podemos escribir

ax + b = c ⇔ (ax + b) + (−b) = c + (−b),

y el proceso de solución continua como sigue

(ax + b) + (−b) = c + (−b) ⇔ ax + (b + (−b)) = c + (−b) ⇔ ax + 0 = c − b ⇔ ax = c − b,

(ax + b) + (−b) = ax + (b + (−b)),

y para pasar de la segunda a la tercera que b+(−b) = 0. La última equivalencia la obtenemos

no tiene solución en el conjunto N = {1, 2, . . .} de los números naturales, el problema radica

el conjunto Qc se define como

3. Existe un único elemento 0 (cero) en F tal que

4. Para cada x ∈ F existe un único elemento (−x) en F tal que

7. Existe un único elemento diferente de cero 1 (uno) en F tal que

9. La multiplicación es distributiva respecto a la adicción; esto es,

La suma en Z3 se define como sigue : si m, n ∈ Z3 , entonces m ⊕ n = m + n si m + n < 3 y

Ejemplo 1.2. Demostrar que el conjunto

con la suma y multiplicación usual de números reales es un campo

Solución. Nótese que como F ⊆ R, en particular se cumplen las leyes conmutativas y

Demostremos ahora que el conjunto de los números complejos es un campo. Definimos

Sean z = a + bi y w = c + di dos números complejos, entonces

(a + bi) + (c + di) = (a + c) + (b + d)i,

(a + bi)(c + di) = ac + adi + bci + bdi2

Si tomamos z = a + bi y w = c + di, puesto que los números reales cumplen a su vez,

(a + bi)(x + iy) = (a + bi),

ax − by + (ay + bx)i = a + bi,

La última propiedad por verificar es la ley distributiva de la suma respecto a la multipli-

(d) m < 0, relación

Figura 1.2: Recta horizontal, vertical, positiva y negativa

Entonces por la fórmula (1.7) tenemos que

y − y0 = m(x − x0 ) (Fórmula punto-pendiente)

Ahora despejemos la variable y en la Fórmula punto-pendiente.

pongamos b = y0 − mx0 , obtenemos

Una relación de la forma dada en la Fórmula pendiente-intercepto es llamada función

(a) Determine la ecuación de costos, suponiendo que sea lineal.

(b) ¿Cuál es el costo de producir 20 artı́culos al dı́a?

y − 120 = 3(x − 25).

Teniendo ya la función de costos para cualquier número de artı́culos x, ponemos x = 20

También podemos resolver el ı́tem (b) como sigue: Si 0 ≤ h ≤ 5, entonces

−50 ≤ −10h ≤ 0 ⇔ −30 ≤ 20 − 10h ≤ 20.

Una ecuación de la forma

donde A, B y C son constantes y A y B no son simultáneamente iguales a cero es llamada

A continuación introduciremos las nociones de paralelismo y ortogonalidad de rectas.

Teorema 1.2.1. Sean l1 y l2 dos rectas con ecuaciones y = m1 x + b1 y y = m2 x + b2

1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2

Consideremos ahora en sistema

En la figura 1.4 se muestran la interpretación geométrica de las diferentes opciones de

(a) Solución única (b) Sin solución (c) Infinitas solucio-

Figura 1.4: Opciones para la solución de un sistema de tamaño 2 × 2

Antes de dar algunos ejemplos, resumimos lo hecho en la sección en el siguiente resultado

Teorema 1.3.1. El sistema 

(a) Tiene solución única si y sólo si a11 a22 − a12 a21 6= 0.

Ejemplo 1.5. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a

Figura 1.5: Distancia de un punto a una recta

Por la fórmula (1.8) tenemos que

d2mı́n = d2 (P1 , P0 ) = (x1 − x0 )2 + (y1 − y0 )2 . (1.12)

−bx1 + ay1 = ay0 − bx0 . (1.14)

ax1 + by1 = −c. (1.15)

a11 a22 − a12 a21 = −b(b) − a(a) = −(a2 + b2 ),

nótese que como a y b no son simultáneamente iguales a cero, a2 + b2 6= 0, por lo tanto,

Teorema 1.3.1. El sistema