Está en la página 1de 253

Álgebra lineal

David Ojeda Marulanda


Índice general

1. Ecuaciones lineales 5
1.1. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Ecuación cartesiana de la recta . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2 . . . . . . . . . . . . . . . . 18
1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3 . . . . . . . . . . . . . . . . 24
1.5. Sistemas de ecuaciones lineales tamaño m × n . . . . . . . . . . . . . . . . . 33
1.5.1. Ecuaciones Diofánticas . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.6. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.6.1. Sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.6.2. Suma y multiplicación por escalar de matrices . . . . . . . . . . . . . 51
1.6.3. Producto matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

2. Determinantes 63
2.1. Definición de determinante de una matriz . . . . . . . . . . . . . . . . . . . . 63
2.2. Interpretación geométrica del determinante de tamaño 2 × 2 . . . . . . . . . 64
2.3. Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4. Determinantes e inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.6. Taller 1 corte 1 parte 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.7. Taller 1 corte 1 parte 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

3. Vectores en Rn 80
3.1. Vectores en el plano enfoque analı́tico . . . . . . . . . . . . . . . . . . . . . . 80
3.2. Vectores en el plano enfoque geométrico . . . . . . . . . . . . . . . . . . . . 82
3.2.1. Vector resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.3. Diferencia entre vectores y vectores geométricos . . . . . . . . . . . . . . . . 84
3.4. Desigualdad triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.5. Movimiento relativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.5.1. Vector proyección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

2
4. Nociones de cálculo integral 102
4.1. Área bajo la curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.2. Integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3. Propiedades de la integral definida . . . . . . . . . . . . . . . . . . . . . . . 110
4.4. La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.4.1. Problemas de valor inicial . . . . . . . . . . . . . . . . . . . . . . . . 111
4.5. Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 117
4.5.1. Primer teorema fundamental del cálculo . . . . . . . . . . . . . . . . 117
4.5.2. Segundo teorema fundamental del cálculo . . . . . . . . . . . . . . . . 118
4.6. Área entre curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.7. Curvas en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.7.1. Ecuación vectorial y normal de la recta . . . . . . . . . . . . . . . . . 128
4.8. Continuidad y diferenciación de aplicaciones vectoriales . . . . . . . . . . . . 135
4.8.1. Vector tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.9. Movimiento en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.9.1. Movimiento rectilineo . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.9.2. Movimiento circular uniforme . . . . . . . . . . . . . . . . . . . . . . 140
4.9.3. Movimiento con aceleración constante . . . . . . . . . . . . . . . . . . 146
4.9.4. Fuerza resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.10. Vectores en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
4.11. Producto cruz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
4.12. Rectas y planos en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
4.13. Aplicaciones de los vectores en el espacio . . . . . . . . . . . . . . . . . . . . 169
4.13.1. Movimiento en tres dimensiones . . . . . . . . . . . . . . . . . . . . . 169
4.14. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
4.15. Taller 2 corte 2 parte 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.16. Taller 2 corte 2 parte 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
4.17. Método de los mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . 186
4.17.1. Punto de vista del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 186

5. Espacios vectoriales 195


5.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
5.1.1. Ejemplos de espacios vectoriales . . . . . . . . . . . . . . . . . . . . . 196
5.2. Subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
5.3. Combinación lineal y espacio generado . . . . . . . . . . . . . . . . . . . . . 199
5.4. Independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.5. Interpretación geométrica de la independencia lineal en R3 . . . . . . . . . . 205
5.6. Bases y dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
5.7. Espacio de los renglones y espacio de las columnas de una matriz . . . . . . 210

3
5.8. Cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.9. Bases ortonormales y proyecciones en Rn . . . . . . . . . . . . . . . . . . . . 213
5.10. Espacios con producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.11. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

6. Transformaciones lineales 217


6.1. Definición y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.2. Núcleo e imagen de una transformación lineal . . . . . . . . . . . . . . . . . 219
6.3. Teorema del cambio de variables en el plano (Opcional) . . . . . . . . . . . . 222
6.4. Representación matricial de una transformación lineal . . . . . . . . . . . . . 230
6.5. Isomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
6.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232

7. Formas canónicas elementales 233


7.1. Valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.2. Matrices semejantes y diagonalización . . . . . . . . . . . . . . . . . . . . . . 233
7.3. Matrices semejantes y diagonalización ortogonal . . . . . . . . . . . . . . . . 233
7.4. Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
7.6. Soluciones a algunos de los problemas . . . . . . . . . . . . . . . . . . . . . . 236
7.7. Solución Examen Final Conjunto de Álgebra Lineal 6 de Junio del 2018 . . . 243
7.8. Cálculo e ingenierı́a civil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246

Bibliografı́a 253

4
Capı́tulo 1

Ecuaciones lineales

Una ecuación lineal de una variable es una expresión de la forma

ax + b = c, (1.1)

donde a 6= 0. Para resolver una ecuación de este tipo se utilizan dos propiedades fundamen-
tales

x = y ⇔ x + c = y + c, c ∈ R (1.2)
x = y ⇔ cx = cy si c 6= 0 (1.3)

El sı́mbolo ⇔ se lee si y sólo si y significa que las ecuaciones que separa son equivalentes,
es decir, que tienen el mismo conjunto solución. Lo cual significa que podemos sumar una
constante c en ambos lados de una ecuación sin alterar su solución, lo mismo ocurre con
la multiplicación, pero la equivalencia se mantiene si la constante c 6= 0. Por ejemplo, la
siguiente expresión es falsa

x2 = 4x ⇔ x = 4,

ya que, el conjunto solución de la primera ecuación es {0, 4}, mientras que el de la segunda
es {4}. La flecha no puede ir en los sentidos indicando equivalencia, solo podemos escribir

x2 = 4x ⇐ x = 4.

Volviendo a la ecuación (1.1), por la propiedad (1.2) podemos escribir

ax + b = c ⇔ (ax + b) + (−b) = c + (−b),

y el proceso de solución continua como sigue

(ax + b) + (−b) = c + (−b) ⇔ ax + (b + (−b)) = c + (−b) ⇔ ax + 0 = c − b ⇔ ax = c − b,

5
en donde para pasar de la primera equivalencia a la segunda se supuso primero que

(ax + b) + (−b) = ax + (b + (−b)),

y para pasar de la segunda a la tercera que b+(−b) = 0. La última equivalencia la obtenemos


al suponer que ax+0 = ax. En consecuencia, si las constantes a, b, c pertenecen a un conjunto
F debemos requerir que en este conjunto, esté definida una operación de suma, la cual debe
cumplir la propiedad asociativa, modulativa, y a cada elemento en F debe tener su inverso
aditivo en F . Para hallar finalmente el valor de x, utilizamos la propiedad (1.3)

ax = c − b ⇔ (1/a)(ax) = (1/a)(c − b)
⇔ ((1/a)a)x = (1/a)(c − b)
⇔ 1 · x = (1/a)(c − b)
⇔ x = (1/a)(c − b)

Debemos dotar el conjunto F de una segunda operación llamada multiplicación que debe
cumplir también la propiedad asociativa, modulativa, y cada elemento en F debe tener su
inverso multiplicativo en F . Si además, requerimos que la solución x esté en F , se deben
cumplir los axiomas de cerradura, esto es, si x, y ∈ F entonces x + y, xy ∈ F . Vemos que
definidas dos operaciones de suma y producto, estas deben cumplir ciertas propiedades, que
llamaremos propiedades de campo para que las ecuaciones se puedan solucionar y para
que dicha solución exista en el conjunto F que llamaremos campo.

1.1. Campos
La evolución de los sistemas numéricos se ha dado en conexión con la búsqueda de
soluciones de ciertas ecuaciones. Por ejemplo, la ecuación lineal

x+2 =0 (1.4)

no tiene solución en el conjunto N = {1, 2, . . .} de los números naturales, el problema radica


en que en este conjunto no se cumplen ciertas propiedades de campo, ya que los naturales no
contienen al elemento neutro para suma, el 0, ni los inversos aditivos de sus elementos. Esto
obliga a considerar un conjunto más grande de números (en el sentido de la contenencia),
que contenga al cero y a los inversos aditivos de los naturales, dicho conjunto se denota por
Z y está dado por

Z = {. . . , −2, −1, 0, 1, 2, . . .}

La ecuación (1.4) tiene solución en este conjunto, por que en los enteros se cumplen los
axiomas de campo para la suma, no ası́, para la multiplicación, por eso, una ecuación lineal

6
como 2x + 1 = 0 no tiene solución en los enteros. Se debe considerar una nuevo conjunto que
contenga a los fraccionarios como −1/2 que soluciona la ecuación 2x + 1 = 0. Este nuevo
conjunto se denota por Q y se define como

Q = {p/q : p, q ∈ Z}

Este conjunto es nuestro primer prototipo de campo (ver el Problema1.7.4). Aunque existen
campos más grandes en el sentido de la contenencia, ya que ecuaciones como

x2 − 2 = 0
√ √
cuyas soluciones son − 2, 2 no son racionales. Tenemos entonces el campo de los números
reales, denotado por R y definido como

R = Q ∪ Qc ,

el conjunto Qc se define como

Qc = {x ∈ R : x ∈
/ Q} ,

también se denota por I el conjunto de los números irracionales. En (1.6) se definen los
números complejos, seguidamente se demuestra que este conjunto es un campo. Los números
complejos surgieron cuando se intento solucionar la ecuación

x2 + 1 = 0 (1.5)

El conjunto de los números reales, además de tener estructura de campo, tiene un orden
definido en el, dado por los axiomas de orden, de los cuales se implica que

x2 ≥ 0 ∀ x ∈ R,

con lo cual, x2 + 1 > 0 ∀ x ∈ R, por lo que la ecuación (1.5) no tiene solución en los reales.
Definición 1.1.1. Un campo es una tripla conformada por un conjunto F y dos operaciones
de adicción y producto, que cumplen las siguientes propiedades

Axiomas de cerradura

(a) Si x, y ∈ F , entonces x + y ∈ F

(b) Si x, y ∈ F , entonces xy ∈ F .

1. La adicción es conmutativa,

x+y = y+x

para todo x, y ∈ F .

7
2. La adicción es asociativa,

x + (y + z) = (x + y) + z

para todo x, y, z ∈ F .

La adicción es modulativa

3. Existe un único elemento 0 (cero) en F tal que

x+0 =0

para cada x ∈ F .

4. Para cada x ∈ F existe un único elemento (−x) en F tal que

x + (−x) = 0

5. La multiplicación es conmutativa,

xy = yx

para todo x, y ∈ F .

6. La multiplicación es asociativa,

x(yz) = (xy)z

para todo x, y, z ∈ F .

La multiplicación es modulativa

7. Existe un único elemento diferente de cero 1 (uno) en F tal que

x1 = x

para cada x ∈ F .

8. Para cada elemento x diferente de cero en F existe un único elemento x−1 (o 1/x) en
F tal que

xx−1 = 1.

9. La multiplicación es distributiva respecto a la adicción; esto es,

x(y + z) = xy + xz

para cada x, y, z ∈ F .

8
Ejemplo 1.1 (Construcción de un campo finito). Definimos los enteros módulo 3 como

Z3 = {0, 1, 2} .

La suma en Z3 se define como sigue : si m, n ∈ Z3 , entonces m ⊕ n = m + n si m + n < 3 y


m ⊕ n = r si m + n ≥ 3 donde r es el residuo de dividir m + n entre 3. De la misma forma,
definimos la multiplicación m ⊙ n de Z3 . Con esta definición podemos generar las tablas de
la suma y la multiplicación en Z3 :

⊕ 0 1 2 ⊙ 0 1 2
0 0 1 2 0 0 0 0
1 1 2 0 1 0 1 2
2 2 0 1 2 0 2 1

De las tablas de la suma y la multiplicación se observa que se cumplen los axiomas de cerra-
dura. Además, como Z3 ⊆ Z, en particular se cumplen las leyes conmutativas y asociativas
de la suma y la multiplicación, además de la ley distributiva y las leyes modulativas de la
suma y la multiplicación. Para finalizar debemos encontrar los inversos aditivos y multipli-
cativos de cada elemento de Z3 . De la tabla vemos que el inverso aditivo del 1 es 2, ya que
1 + 2 = 0, por conmutatividad (o observando la tabla) vemos que 2 + 1 = 0, luego el inverso
aditivo de 2 es 1. El inverso multiplicativo de 1 es 1 y de 2 es 2, con lo cual cada elemento
diferente de 0 tiene un inverso multiplicativo. Concluimos que Z3 con la suma y producto
ası́ definidos es un campo. Nótese que 1 + 2 = 0, es decir, 3 es el módulo de Z3 , de ahı́ el
nombre que se le da a este conjunto.

Ejemplo 1.2. Demostrar que el conjunto


n √ o
F := x + 2y : x, y ∈ Q ,

con la suma y multiplicación usual de números reales es un campo

Solución. Nótese que como F ⊆ R, en particular se cumplen las leyes conmutativas y


asociativas de la suma y la multiplicación, además de la ley distributiva. Más aún, como
√ √
0 = 0 + 0 2 ∈ F y 1 = 1 + 0 2 ∈ F , resulta que se cumple la ley modulativa de la suma y
la multiplicación.

Demostremos ahora los axiomas de cerradura. Como x ∈ F , x = a + b 2 donde a, b ∈ Q,

9

de manera similar, para c, d ∈ Q, y = c + d 2, entonces

x + y = (a + c) + (b + d) 2.
√ √
xy = (a + b 2)(c + d 2)
√ √ √
= (a + b 2)c + (a + b 2)d 2
√ √
= ac + bc 2 + ad 2 + 2bd

= (ac + 2bd) + (bc + ad) 2

Dado que los números son racionales son un campo (ver problema 1.7.4), en particular
cumplen axiomas de cerradura, lo cual implica que a + c, b + d ∈ Q y ac + 2bd, bc + ad ∈ Q.
Lo que a su vez implica que el conjunto F cumple los axiomas de cerradura. Sólo nos queda
verificar la existencia de inversos aditivo y multiplicativo para cada elemento de F . Sea
√ √
x = a + b 2 ∈ F , entonces −x := −a − b 2 ∈ F y x + (−x) = 0. Ahora, supongamos que

x = a + b 2 6= 0. Tenemos que

xy = 1,
1 √
donde y = √ . Veamos que y ∈ F . En efecto, supongamos que a − b 2 = 0, como
a+b 2
x 6= 0, a y b no son simultáneamente iguales a 0. Lo cual nos lleva a considerar dos casos:
a 6= 0, o, b 6= 0. Si b 6= 0, entonces
a √
= 2.
b
Lo cual es imposible. Ahora bien, si a 6= 0 tenemos que
b 1
=√ .
a 2

Lo cual nos conduce de nuevo a una contradicción pues, 1/ 2 es un número irracional.
√ √
Concluimos que a − b 2 6= 0 si x = a + b 2 6= 0, y en ese caso obtenemos que

1 a−b 2
y= √ · √
a+b 2 a−b 2

a−b 2
= 2
a − 2b2
a b √
= 2 + 2.
a − 2b2 2b2 − a2
Con lo cual verificamos que y ∈ F , concluyendo de esta manera la demostración.

Demostremos ahora que el conjunto de los números complejos es un campo. Definimos


este conjunto como

10
C = a + bi : a, b ∈ R, i2 = −1 .

(1.6)

Vemos que este espacio no esta contenido en los números reales, por lo tanto, debemos
demostrar cada una de las propiedades de campo de la definición 1.1.1.

Sean z = a + bi y w = c + di dos números complejos, entonces

z=w⇔a=c y b=d

Ahora, para recordar las fórmulas que definen la suma y el producto en los números com-
plejos, podemos asociar el término a + bi con el polinomio lineal a + bx, y entonces sumar
y multiplicar complejos tal cual como hacemos con los polinomios lineales, esto es, para la
suma de dos complejos a + bi y c + di tenemos que

(a + bi) + (c + di) = (a + c) + (b + d)i,

y para el producto

(a + bi)(c + di) = ac + adi + bci + bdi2


= ac − bd + (ad + bc)i

Demostraremos que los números complejos con la suma y el producto ası́ definidas, con-
forman un campo. Lo primero que tenemos que verificar son los axiomas de cerradura.
Esto es,

1. Si z, w ∈ C, entonces z + w ∈ C

2. Si z, w ∈ C, entonces zw ∈ C.

Si tomamos z = a + bi y w = c + di, puesto que los números reales cumplen a su vez,


los axiomas de cerradura vemos que a + c, b + d ∈ R y ac − bd, ad + bc ∈ R, de lo cual
inmediatamente se sigue que z + w ∈ C y que zw ∈ C. Demostremos que la suma es
conmutativa,

z + w = (a + bi) + (c + di)
= (a + c) + (b + d)i
= (c + a) + (d + b)i
= (c + di) + (a + bi)
= w + z.

11
Vemos que la conmutatividad de la suma de complejos se sigue de la conmutatividad de la
suma de los números reales. La ley asociativa de la suma complejos se demuestra de manera
análoga. Ahora estableceremos la propiedad modulativa de la suma. Si definimos 0 = 0 + 0i,
tenemos que si z = a + bi ∈ C, entonces
z + 0 = (a + bi) + (0 + 0i)
= (a + 0) + (b + 0)i
= a + bi
= z.
Además, para todo z = a + bi ∈ C, si w := −a − bi, se cumple que
z + w = (a + bi) + (−a − bi)
= (a + (−a)) + (b + (−b)i
= 0 + 0i
Es decir, todo número complejo tiene un inverso aditivo. Ahora demostraremos las propie-
dades de campo de la multiplicación de números complejos.
wz = (c + di)(a + bi)
= ca + cbi + dai − db
= (ac − bd) + adi + bci
= (ac − bd) + (ad + bc)i
= zw
Como el caso de la suma de complejos, vemos la conmutatividad de la multiplicación de
complejos se hereda de la conmutatividad de la multiplicación de los números reales. Ahora,
sean x = a + bi, y = c + di y z = e + f i un números complejos, entonces
x(yz) = (a + bi) [(c + di)(e + f i)]
= (a + bi) [ce − df + (cf + de)i]
= a(ce − df ) − b(cf + de) + [a(cf + de) + b(ce − df )] i
= a(ce) − a(df ) − b(cf ) − b(de) + [a(cf ) + a(de) + b(ce) − b(df )] i
= (ac)e − (ad)f − (bc)f − (bd)e + [(ac)f + (ad)e + (bc)e − (bd)f ] i
= (ac)e − (bd)e − (ad)f − (bc)f + [(ac)f − (bd)f + (ad)e + (bc)e] i
= (ac − bd)e − (ad + bc)f + [(ac − bd)f + (ad + bc)e] i
= [(ac − bd) + (ad + bc)i] (e + f i)
= [(a + bi)(c + di)] (e + f i)
= (xy)z.

12
Demostrando de esta forma, la ley asociativa de la multiplicación. Construiremos a conti-
nuación el elemento neutro de la para multiplicación de complejos. Queremos encontrar un
complejo e = x + yi tal que para todo z = a + bi se cumpla que ze = z, esto es,

(a + bi)(x + iy) = (a + bi),


o equivalentemente,

ax − by + (ay + bx)i = a + bi,


que según la igualdad de números complejos, conduce a el siguiente sistema

ax − by = a
bx + ay = b
Para este sistema la matriz de coeficientes es
 
a −b
A=
b a
para la cual, det A = a2 + b2 6= 0 si a + bi 6= 0 + 0i. Por lo tanto, por la Regla de Krammer
(ver Teorema 2.4.2) encontramos que
det B1 det B2
x= ,y = ,
det A det A
donde
   
a −b a a
B1 = , B2 =
b a b b
por consiguiente, x = 1, y = 0. De modo que, e = 1 + 0i = 1. Encontremos ahora el inverso
multiplicativo de un complejo z = a + bi 6= 0. Tenemos que

zw = 1 + 0i = 1,
1
donde w = . Demostraremos que w ∈ C.
a + bi
1 a − bi
w= ·
a + bi a − bi
a − bi
= 2
a + b2
a −b
= 2 2
+ 2 i.
a +b a + b2
Nótese que a − bi y a2 + b2 son diferentes de 0 + 0i, ya que a + bi 6= 0.

La última propiedad por verificar es la ley distributiva de la suma respecto a la multipli-


cación, la cual se deja como ejercicio.

13
1.2. Ecuación cartesiana de la recta
Sean P = (x1 , y1 ) y Q = (x2 , y2 ) dos puntos dados de la recta l. Definimos la pendiente
de la recta, la cual denotaremos con la letra m como

y2 − y1
m = tan θ = (1.7)
x2 − x1
donde el ángulo θ se mide desde el eje x en el sentido contrario de las manecillas del reloj
(ver la figura 1.1). Como se ve en la la fórmula (1.7), la pendiente es una razón de cambio
de y con respecto a x y es una medida de la inclinación de la recta con respecto al eje x.

y
l

Q
b

y2 − y1
Pb θ
x2 − x1

θ x
O

Figura 1.1: Cálculo de la pendiente de una recta dados dos de sus puntos

Vemos que la hipotenusa del triángulo de la figura 1.7 nos da la distancia entre los puntos
P y Q, por el Teorema de Pitagóricas tenemos que
p
d(P, Q) = (x1 − x2 )2 + (y1 − y2 )2 (1.8)

En la figura 1.2 se muestran la diferentes inclinaciones que puede tener una recta.

14
y y y
0 < θ < 90
m = tan θ > 0
b m=0 m=∞
y=b
a θ
x x x
x=a
(a) m = 0, la recta es (b) m = ∞, la recta (c) m > 0, relación
horizontal es vertical directa
y
90 < θ < 180
m = tan θ < 0

θ
x

(d) m < 0, relación


inversa

Figura 1.2: Recta horizontal, vertical, positiva y negativa

Ahora, fijemos el punto P sobre la recta l en la figura 1.2. Esto es, P = (x0 , y0 ) es un
punto dado de la recta. Supongamos además que Q = (x, y) es un punto arbitrario.

y
l

Q
b

y − y0
P
b θ
x − x0

θ x
O

Figura 1.3: Ecuación de una recta dados uno de sus puntos y su pendiente

Entonces por la fórmula (1.7) tenemos que

15
y − y0
m = tan θ = .
x − x0
O bien,

y − y0 = m(x − x0 ) (Fórmula punto-pendiente)

La fórmula anterior nos dice que para, determinar completamente una recta es suficiente
con tener un punto y una dirección, la cual es dada por la pendiente m. Esta claro que dados
dos puntos de la recta, con la fórmula (1.7) podemos hallar la pendiente y escoger uno de los
puntos para con la Fórmula punto-pendiente hallar la ecuación de la recta. Concluimos que:

Nota 1.2.1. Dos puntos determinan una recta, o bien, un punto y una dirección.

Ahora despejemos la variable y en la Fórmula punto-pendiente.

y = y0 + m(x − x0 ) = mx + y0 − mx0 ,

pongamos b = y0 − mx0 , obtenemos

y = mx + b (Fórmula pendiente-intercepto)

Vemos que cuando x = 0, y = b, es decir la recta corta al eje y en b, por eso este número
es llamado intercepto de la recta con eje y. Si m = 0 en la Fórmula pendiente-intercepto
obtenemos y = b que es la ecuación de una recta horizontal (ver figura 1.2(a)). Si m > 0
(figura 1.2(c)), x, y y guardan una relación directa, es decir, la variable y crece cuando x
crece. Por el contrario, si la variable y decrece cuando la variable x aumenta, tenemos que
m < 0, y la gráfica es la recta decreciente que se muestra en la figura 1.2(d). Finalmente, si
la recta es vertical, θ = π/2 = 90◦ , y m = tan(π/2) = ∞ (ver figura 1.2(b)).

Una relación de la forma dada en la Fórmula pendiente-intercepto es llamada función


lineal, y se suele escribir y = f (x) = mx + b.

Ejemplo 1.3 (Modelo de costo lineal). A una compañı́a le cuesta $75 producir 10 unidades
de cierto artı́culo al dı́a y $120 producir 25 unidades del mismo artı́culo al dı́a.

(a) Determine la ecuación de costos, suponiendo que sea lineal.

(b) ¿Cuál es el costo de producir 20 artı́culos al dı́a?

16
Solución. Denotemos con y = C(x) el costo total de producir y vender x unidades diarias
del artı́culo. Según los datos del problema y1 = 75 cuando x1 = 10, y y2 = 120 cuando
x2 = 25. Por lo tanto, por la Fórmula (1.7) obtenemos
y2 − y1 120 − 75
m= = = 3.
x2 − x1 25 − 10
Como m = 3 > 0, concluimos que entre más artı́culos se produzcan, su costo total aumentará.
Además, m = 3/1, lo que significa que por cada artı́culo de más que se produzca, el costo
total de producción de los artı́culos aumentará en $3. Ahora, utilizando la Fórmula punto-
pendiente, con (x0 , y0 ) = (25, 120), obtenemos

y − 120 = 3(x − 25).

De donde y = C(x) = 120 + 3(x − 25) = 3x + 45. Con lo cual se tiene la parte (a). Se observa
que aunque se produzcan 0 artı́culos, se incurre en un costo de $45, dichos costos son llamados
costos fijos. Por ejemplo, cuando una empresa esta en temporada de vacaciones hay que
pagar arriendo servicios, etc.

Teniendo ya la función de costos para cualquier número de artı́culos x, ponemos x = 20


para obtener y = C(20) = 3(20) + 45 = 105.

Ejemplo 1.4. El aire seco al moverse hacia arriba se expande y enfrı́a a razón de aproxi-
madamente 1◦ C por cada 100m de elevación, hasta cerca de 12km.

(a) Si la temperatura del suelo es de 20◦ C, escriba una fórmula para la temperatura a una
altura h.

(b) ¿Qué intervalo de temperaturas puede esperarse si un avión despega y alcanza una
altura máxima de 5km?

Solución. Según la información dada en el ı́tem (a), T (0) = 20◦ C, donde T (h) representa
la temperatura a una altura h. Además, nótese que la razón cambio de la temperatura con
respecta a la altura viene dada por la pendiente
∆T 1◦ C
m=− =−
∆h 100m
1◦ C 1m
=− ·
100m (1/1000)km
1◦ C
=−
(1/10)km
= −10◦ C/km

17
Aquı́, m < 0, ya que tenemos una relación inversa; a medida que aumenta la altura disminuye
la temperatura. Como además de la pendiente tenemos el intercepto con el eje y, b = 20◦ C,
por la fórmula pendiente–intercepto tenemos que

T (h) = 20 − 10h, 0 ≤ h ≤ 12

Para el inciso (b), vemos que T (5) = 20−10(5) = −30. Por lo tanto, cuando el avión despega
la temperatura es de 20◦ C, y al alcanzar los 5km de altura, la temperatura a disminuido
hasta −30◦ C.

También podemos resolver el ı́tem (b) como sigue: Si 0 ≤ h ≤ 5, entonces

−50 ≤ −10h ≤ 0 ⇔ −30 ≤ 20 − 10h ≤ 20.

Esto es, mientra que h varia entre 0 y 5, T varia entre −30 y 20.

Una ecuación de la forma

Ax + By + C = 0 (1.9)

donde A, B y C son constantes y A y B no son simultáneamente iguales a cero es llamada


ecuación lineal. Observamos que la ecuación de una recta es una ecuación lineal. En efecto,
al despejar la variable y en (1.9) obtenemos

A C
y =− x−
B B
que es la Fórmula pendiente-intercepto con m = −A/B y b = −C/A. La fórmula (1.9) es
llamada ecuación general de la recta.

A continuación introduciremos las nociones de paralelismo y ortogonalidad de rectas.

Teorema 1.2.1. Sean l1 y l2 dos rectas con ecuaciones y = m1 x + b1 y y = m2 x + b2


respectivamente, entonces la recta l1 es paralela a la recta l2 , lo cual denotamos por l1 k l2 si
y sólo si m1 = m2 . Y las rectas l1 y l2 son ortogonales, o perpendiculares, lo cual denotamos
por l1 ⊥ l2 si y sólo si m1 · m2 = −1.

1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2


Consideremos el sistema de ecuaciones con dos incógnitas

a11 x + a12 y = b1
(1.10)
a21 x + a22 y = b2

18
Puesto que las variables x y y tienen exponente 1, y el sistema consta de 2 ecuaciones con
2 incógnitas (1.10) es llamado sistema de ecuaciones lineales de tamaño 2 × 2. La
primera pregunta que nos formulamos es: bajo que condiciones el sistema en (1.10) tiene
solución. Esto es, una pareja (x, y) que satisface ambas ecuaciones. Como sabemos de la
sección anterior cada una de estas ecuaciones es representada por una linea recta, y esta
claro que si estas son paralelas no existe un punto (x, y) que este en ambas rectas, es decir el
sistema no tiene solución. Supongamos entonces que las rectas de ecuaciones a11 x+ a12 y = b1
y a21 x + a22 y = b2 son paralelas. Despejando la variable y en ambas ecuaciones obtenemos
a11 b1 a21 b2
y=− x+ , y =− x+
a12 a12 a22 a22
a11 a21
en donde se identifican las pendientes de las rectas, m1 = − y m2 = − . Dado que
a12 a22
estas son paralelas tenemos que
a11 a21
m1 = m2 ⇔ − =− ⇔ a11 a22 − a21 a12 = 0.
a12 a22
Por lo tanto, si el sistema (1.10) no tiene solución entonces a11 a22 − a21 a12 = 0. Recı́proca-
mente, si a11 a22 − a21 a12 = 0 entonces m1 = m2 , y el sistema (1.10) no tiene solución. Lo
anterior lo podemos decir de manera equivalente como sigue:

El sistema (1.10) tiene una única solución si y sólo si a11 a22 − a21 a12 6= 0.

Observese que en el análisis anterior sólo se considero en caso en que a11 , a22 6= 0, (Ver, [3,
pag. 2]) en donde se consideran todos los casos.

Consideremos ahora en sistema



x−y =2
(1.11)
2x − 2y = 4

Vemos que para este caso a11 = 1, a12 = −1, a21 = 2 y a22 = −2. Con lo cual a11 a22 −a21 a12 =
1(−2) − 2(−1) = 0, sin embargo el sistema tiene solución, por ejemplo, la pareja (2, 0) es
solución. Más aún, este sistema tiene infinitas soluciones, para verlo nótese que la primera
ecuación puede ser obtenida de la segunda al multiplicarla por 1/2. Entonces si y = t de la
primera ecuación x = t + 2, luego las soluciones del sistema (1.11) son de la forma

x = t + 2, y = t, t ∈ R.

En la figura 1.4 se muestran la interpretación geométrica de las diferentes opciones de


solución de un sistema de tamaño 2 × 2.

19
y y y
l1
l1
l1 = l2

l2 l2
x x x

(a) Solución única (b) Sin solución (c) Infinitas solucio-


nes

Figura 1.4: Opciones para la solución de un sistema de tamaño 2 × 2

Antes de dar algunos ejemplos, resumimos lo hecho en la sección en el siguiente resultado

Teorema 1.3.1. El sistema 


a11 x + a12 y = b1
a21 x + a22 y = b2
de tamaño 2 × 2, tiene solución única, no tiene solución, en cuyo caso diremos que es
inconsistente, o tiene infinitas soluciones.

(a) Tiene solución única si y sólo si a11 a22 − a12 a21 6= 0.

(b) No tiene solución o tiene infinitas soluciones si y sólo si a11 a22 − a12 a21 = 0.

Ejemplo 1.5. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a


un punto P0 = (x0 , y0 ) que no pertenece a l está dada por

|ax0 + by0 + c|
dmı́n = √ .
a2 + b2
Solución. Se pueden definir infinitas distancias del punto P0 a la recta l (ver figura 1.5),
pero sólo hay una que es la menor, precisamente la perpendicular trazada desde el punto P0
hasta la recta l. Supongamos que dicha perpendicular corta a l en un punto P1 = (x1 , y1 ).

20
y

P0
l
dmı́n

P1
l⊥
x
O

Figura 1.5: Distancia de un punto a una recta

Por la fórmula (1.8) tenemos que

d2mı́n = d2 (P1 , P0 ) = (x1 − x0 )2 + (y1 − y0 )2 . (1.12)

Debe notarse que las constantes a, b, c, x0 y y0 son dadas y tenemos que expresar x1 y y1
en términos de estas constantes. Para tal fin plantearemos dos ecuaciones. Empecemos por
calcular la pendiente de la recta l⊥ que une los puntos P0 y P1 . Por la fórmula 1.7 encontramos
que
y1 − y0
m⊥ =
x1 − x0
Ahora calculemos la pendiente de la recta l, tememos que ax + by + c = 0, en donde las
constantes a y b no son simultáneamente iguales a cero, por ejemplo supongamos que b 6= 0,
entonces
a c
y =− x−
b b
a
en donde vemos la pendiente de la recta l es m = − . Como las rectas l y l⊥ son perpendi-
b
culares por el Teorema 1.3.1 el producto de sus pendientes es −1, esto es,
 a y − y
1 0
m · m⊥ = −1 ⇔ − · = −1.
b x1 − x0
De forma equivalente
a
x1 − x0 = (y1 − y0 ). (1.13)
b

21
Con lo cual tenemos nuestra primera ecuación

−bx1 + ay1 = ay0 − bx0 . (1.14)

Para plantear la segunda ecuación nótese que (x1 , y1 ) ∈ l, entonces ax1 + by1 + c = 0, o bien

ax1 + by1 = −c. (1.15)

Con las ecuaciones (1.14) y (1.15) formamos el siguiente sistema de ecuaciones lineales de
tamaño 2 × 2 
−bx1 + ay1 = ay0 − bx0
(1.16)
ax1 + by1 = −c
Aquı́ las variables x1 , y1 reemplazan a las variables x, y en (1.10), y tenemos que a11 = −b,
a12 = a, a21 = a y a22 = b, de donde

a11 a22 − a12 a21 = −b(b) − a(a) = −(a2 + b2 ),

nótese que como a y b no son simultáneamente iguales a cero, a2 + b2 6= 0, por lo tanto,


por el Teorema 1.3.1 el sistema 1.16 tiene solución única. Ahora, multiplicando la primera
ecuación por a y la segunda por b obtenemos el sistema de ecuaciones equivalente al primero

−abx1 + a2 y1 = a2 y0 − abx0

(1.17)
abx1 + b2 y1 = −bc

Decimos que los sistemas (1.16) y (1.17) son equivalentes en el sentido de ambos tienen la
misma solución. Consideremos un tercer sistema equivalente a los dos primeros reemplazando
la segunda ecuación por la suma de la primera y segunda ecuación

−abx1 + a2 y1 = a2 y0 − abx0

(1.18)
0 + (a2 + b2 )y1 = a2 y0 − abx0 − bc

En el sistema (1.18) se observa que podemos despejar la variable y1 al multiplicar la segunda


ecuación por 1/(a2 + b2 ). Tenemos que
a2 y0 − abx0 − bc
y1 = .
a2 + b2
Entonces
a2 y0 − aby0 − bc − a2 y0 − b2 y0
y1 − y0 =
a2 + b2
2
−abx0 − b y0 − bc
=
a2 + b2
−b(ax0 + by0 + c)
= .
a2 + b2

22
Ası́,

−b(ax0 + by0 + c)
y1 − y0 = . (1.19)
a2 + b2
Ahora hagamos lo mismo pero con la diferencia x1 − x0 . En efecto, reemplazando (1.19) en
(1.13) obtenemos que esta diferencia es igual a

a −b(ax0 + by0 + c)
x1 − x0 = · ,
b a2 + b2
o bien,

−a(ax0 + by0 + c)
x1 − x0 = , (1.20)
a2 + b2
Finalmente, reemplazando las ecuaciones (1.19) y (1.20) en (1.12) y realizando un poco de
álgebra obtenemos
 2  2
2 −b(ax0 + by0 + c) −a(ax0 + by0 + c)
dmı́n = +
a2 + b2 a2 + b2
b2 (ax0 + by0 + c)2 a2 (ax0 + by0 + c)2
= +
(a2 + b2 )2 (a2 + b2 )2
(a2 + b2 )(ax0 + by0 + c)2
=
(a2 + b2 )2
(ax0 + by0 + c)2
= .
a2 + b2
De donde
s
(ax0 + by0 + c)2
dmı́n =
a2 + b2
p
(ax0 + by0 + c)2
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2

Existen cinco métodos para resolver sistemas de ecuaciones lineales de tamaño 2 × 2:


eliminación, que fue el que utilizamos para simplificar el sistema 1.16, igualación, sustitución,
la regla de Krammer y el método gráfico. A continuación ilustramos con otro ejemplo, esta
vez el método de igualación

23
Ejemplo 1.6. (Ver, [3, pag. 7, Problema 34]). La compañı́a Sunrise Porcelain fabrica tazas y
platos de cerámica. Para cada taza o plato un trabajador mide una cantidad fija de material
y la pone en una maquina que los forma, de donde pasa al secado y vidriado automático. En
promedio, un trabajador necesita 3 minutos para iniciar el proceso de una tasa y 2 minutos
para el de un plato. El material para una tasa cuesta 25c y el material para un plato cuesta
20c. Si se asignan $44 diarios para la producción de tazas y platos, ¿cuántos deben fabricarse
de cada uno en un dı́a de trabajo de 8 horas, si un trabajador se encuentra trabajando cada
minuto y se gasta exactamente $44 en materiales?

Solución. Sea x := el número de tazas que se debe fabricar en un dı́a de trabajo de 8


horas, y y := el número de platos que se debe fabricar en un dı́a de trabajo de 8 horas. Se
deben emplear exactamente $44 en la fabricación de las tazas y platos, de donde tenemos al
ecuación
25 20
x+ y = 44.
100 100
Además, no se deben gastar ni más ni menos de 8 horas en la fabricación de platos y tazas,
por lo que
3 2
x + y = 8.
60 60
Simplificando las dos ecuaciones anteriores obtenemos el sistema

5x + 4y = 880
3x + 2y = 480.

Despejando la variable x en la primera ecuación y reemplazandola en la segunda obtenemos


3(880 − 4y)/5 + 2y = 480, de donde y = 120, por lo tanto, x = 3(880 − 4(120))/5 = 80.
Se concluye que se deben fabricar diariamente 80 tazas y 120 platos para cumplir con las
necesidades requeridas por el problema.

1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3


Ahora consideraremos un sistema de ecuaciones lineales con tres incógnitas y tres ecua-
ciones lineales 
 a11 x + a12 y + a13 z = b1
a x + a22 y + a23 z = b2 (1.21)
 21
a31 x + a32 y + a33 z = b3
También podemos hacer una interpretación geométrica de las posibles soluciones de un sis-
tema 3 × 3, pero tendrá que esperar hasta el capı́tulo 2 en el que se introduce la noción

24
de plano. En esta sección se describirá un método de solución para el sistema (1.21). Es-
te método se basa en el hecho de que las soluciones, o conjunto solución de un sistema se
mantiene invariante bajo la acción de tres operaciones que llamaremos elementales. Antes de
definir dichas operaciones introduciremos la noción de matriz, que nos permitirá simplificar
la escritura de cada paso del procedimiento.

Definición 1.4.1 (Matriz). Una matriz es un arreglo rectangular de números.

Una matriz con m filas y n columnas es llamada matriz de tamaño m × n. Utilizaremos


la notación Mm×n (R) para referirnos a el conjunto de todas la matrices de tamaño m × n con
entradas en los reales. Se pueden escribir los coeficientes de las variables de un sistema de
ecuaciones utilizando la notación matricial. Por ejemplo, los coeficientes del sistema (1.21)
se pueden organizar en la matriz
 
a11 a12 a13
A = a21 a22 a23 
a31 a32 a33

lo cual es llamada matriz de coeficientes. Cuando se consideran los elementos (términos


independientes) después de cada igualdad en un sistema de ecuaciones en el arreglo, se obtiene
una matriz llamada matriz aumentada. Para el sistema (1.21) la matriz aumentada está
dada por

a11 a12 a13 | b1


 
a21 a22 a23 | b2 
a31 a32 a33 | b3

A continuación se enuncian las tres operaciones elementales con filas.

Definición 1.4.2 (Operaciones elementales con filas). Para reducir una matriz se utilizan
las siguientes operaciones elementales

(a) Multiplicar (o dividir ) una fila por un número diferente de cero.

(b) Sumar un múltiplo de una fila o otra fila.

(c) Intercambiar dos filas

El proceso de aplicar operaciones elementales con filas para simplificar una matriz au-
mentada se llama reducción por filas.

Notación

25
(a) Ri → cRi significa que la i−ésima fila se reemplaza por esa misma fila multiplicada
por c.

(b) Rj → Rj + cRi significa la j−ésima fila se reemplaza por la suma de la fila j más la
fila i multiplicada por c

(c) Ri ↔ Rj quiere decir intercambiar dos filas i y j.

(d) A ⇐⇒ B indica que las matrices aumentadas A y B son equivalentes; es decir, que los
sistemas que representan tienen la misma solución

Cuando se aplica el método de reducción por filas a una matriz se puede llegar a dos
formas equivalentes de dicha matriz: forma escalonada reducida por renglones (FERR)
y forma escalonada por renglones (FER). A continuación damos la definición general
de estas dos formas.

Definición 1.4.3 (FERR). Una matriz se encuentra en la forma escalonada reducida por
renglones (FERR) si se cumplen las siguientes condiciones

(a) Todos los renglones (si los hay) cuyos elementos son todos cero aparecen en la parte
inferior de la matriz.

(b) El primer número diferente de cero (comenzando por la izquierda) en cualquier renglón
cuyos elementos no todos son cero es 1.

(c) Si dos renglones sucesivos tienen elementos distintos de cero, entonces el primer 1 en
el renglón de abajo está más hacia la derecha que el primer 1 en el renglón de arriba.

(d) Cualquier columna que contiene el primer 1 en un renglón tiene ceros en el resto de
sus elementos.

El primer número diferente de cero en un renglón (si lo hay) es llamado pivote para este
renglón.

Si una matriz cumple sólo las condiciones (a),(b) y (c) en la definición 1.4.3 se dice que
está en la forma escalonada por renglones (FER).

Ejemplo 1.7. Consideremos el siguiente par de matrices


 
1 2 3  
1 0 0 5
A = 0 1 5, B = .
0 0 1 2
0 0 1

26
Vemos que la matriz A se encuentra en la FER, mientras que la matriz B está en la FERR.
También notamos que la matriz A se puede reducir aún más,
1 2 3 R1 → −3R3 + R1 1 2 0 1 0 0
     
0 1 5 R2 → −5R3 + R2 0 1 0 R1 → −2R2 + R1 0 1 0
⇐⇒
0 0 1 ⇐⇒ 0 0 1 0 0 1
Advertimos que la última matriz en el proceso de simplificación de la matriz A está en la
FERR, lo que nos dice esta forma es más refinada que la FER. Vemos además que la FER
no es única.
El proceso de simplificación de una matriz dada para llevarla a la FER tiene un orden
determinado. Mostraremos mediante el siguiente ejemplo cada uno de estos pasos.
Ejemplo 1.8. Llevar la matriz
 
0 0 5
0 2 0
 
A=
0 3 2

0 0 3
a la FER
Solución. Se debe aclarar que para llevar esta matriz a la FER puede existir un número
menor de pasos que los que llevaremos acabo a continuación, sin embargo, esto funcionaria
para esta matriz en particular. El proceso que describe permite simplificar cualquier matriz
de tamaño m × n.
Paso 1
Determinar la primera columna de A (comenzando de izquierda a derecha), cuyos ele-
mentos no sean todos nulos. Para este caso serı́a la columna 2, que llamaremos columna
pivote.
 
0 0 5
0 2 0
 
A=
0 3 2

0 0 3
Paso 2
Identificar la primera entrada (comenzando de arriba hacia abajo) de la columna pivote
que sea distinta de cero. Este elemento es llamado pivote, para es caso es 2.
 
0 0 5
0 2 0
 
A=
0 3 2

0 0 3

27
Paso 3

Intercambiar, en caso de ser necesario, la primera fila por el reglón que contiene al pivote,
esta es ahora la llamada fila pivote. Denotamos la matriz obtenida al realizar esta operación
elemental por A1 . Esto es,

   
0 0 5 0 2 0
0 2 0 R1 ↔ R2  0 0 5
   
A=  = A1
0 3 2 ⇐⇒  0 3 2
 
0 0 3 0 0 3

Paso 4

Ahora se puede multiplicar por el inverso del pivote, para generar un 1 en la fila pivote.
Esta nueva matriz la denotamos por A2
   
0 2 0 0 1 0
 0 0 5  R1 → (1/2)R1  0 0 5 
   
A1 =   = A2
0 3 2 ⇐⇒ 0 3 2
 
0 0 3 0 0 3

Paso 5

La nueva fila pivote es ahora la primera fila de la matriz A2 , y el nuevo pivote es 1, con
la cual podemos generar ceros en la columna que lo contiene, obteniendo una matriz A3
   
0 1 0 0 1 0
0 0 5 R → −3R + R 0 0 5
 3 1 3
A2 =   = A3
 
 0 3 2 ⇐⇒  0 0 2
 
0 0 3 0 0 3

Paso 6

Considerar la matriz B de tamaño (m − 1) × n obtenida a partir de A3 al suprimir la


primera fila de esta. Ahora, repetir los pasos de 1 a 5 (que sean necesarios) con la matriz B
 
0 0 5
B = 0 0 2
0 0 3

28
La columna pivote es la tercera, y elemento pivote, para este caso el 5, ya está en la primera
fila, por lo que se omite el paso 3. Se empieza entonces con el paso 4, multiplicar fila 1 de la
matriz B1 , por el inverso del pivote
   
0 0 5 0 0 1
R1 → (1/5)R1 
B = B1 =  0 0 2  0 0 2  = B2
⇐⇒
0 0 3 0 0 3
Ahora podemos generar ceros en los elementos de la columna que contiene el nuevo pivote,
que ahora es 1
0 0 1 R2 → −2R1 + R2 0 0 1
   

B2 = 0 0 2  R3 → −3R1 + R3 0 0 0 = B3
0 0 3 ⇐⇒ 0 0 0
Paso 7

Considerar la matriz C de tamaño (m − 2) × n obtenida a partir de B3 al suprimir la


primera fila de esta. Ahora, repetir los pasos de 1 a 5 (que sean necesarios) con la matriz C
 
0 0 0
C=
0 0 0
La matriz C no tiene columna pivote, lo que nos indica que el proceso de simplificación a
terminado. La matriz D consistente de la matriz C y las dos filas suprimidas en el proceso
simplificación, primero a la matriz A3 y luego a B3 :
 
0 1 0
0 0 1
 
D=
0 0 0

0 0 0
ya está en la FER.

En ejemplo anterior, la matriz A también está en la FERR, pero este no siempre es el


caso, ver el Problema 2.6.1.
Problema 1.4.1 (Kolman-Hill). Un ebanista fabrica sillas, mesas para café y mesas para
comedor. Se necesitan 10 minutos para lijar una silla, 6 para pintarla y 12 para barnizarla.
Se requieren 12 minutos para lijar una mesa para café, 8 para pintarla y 12 para barnizarla.
Son necesarios 15 minutos para lijar una mesa para comedor, 12 minutos para pintarla y 18
para barnizarla. El centro de lijado está disponible 16 horas a la semana, el de pintura 11 a
la semana y el barnizado 18 horas. ¿Cuántas unidades de cada mueble deben fabricarse por
semana de modo que las mesas de trabajo se utilicen a toda su capacidad?

29
Solución. Empezamos por definir las variables. sea x el número de sillas que se deben
fabricar por semana, y el número de mesas de café y z el número de mesas para comedor
que se deben fabricar por semana. Es conveniente organizar los datos del problema en una
tabla

x y z Disponibilidad semanal
Lijado (1/6)x (1/5)y (1/4)z 16
Pintado (1/10)x (2/15)y (1/5)z 11
Barnizado (1/5)x (1/5)y (3/10)z 18

Figura 1.6: Disponibilidad semanal de los centros de lijado, pintado y barnizado

Tenemos entonces el siguiente sistema



 (1/6)x + (1/5)y + (1/4)z = 16
(1/10)x + (2/15)y + (1/5)z = 11
(1/5)x + (1/5)y + (3/10)z = 18

cuya matriz aumentada es

1/6 1/5 1/4 | 16


 
1/10 2/15 1/5 | 11
1/5 1/5 3/10 | 18

La primera columna es la columna pivote y el pivote es 1/6

1/6 1/5 1/4 1/6 1/5 1/4


  
1/10 2/15 1/5  1/10 2/15 1/5 
1/5 1/5 3/10 1/5 1/5 3/10

este elemento ya se encuentra en la primera fila, por lo que el paso 3 del ejemplo 1.8 se omite.
El paso 4 indica que se debe multiplicar por el inverso del pivote, la fila pivote

1/6 1/5 1/4 | 16 6/5 3/2 | 96


   
1
1/10 2/15 1/5 | 11  R1 → 6R1 1/10 2/15 1/5 | 11 
⇐⇒
1/5 1/5 3/10 | 18 1/5 1/5 3/10 | 18

Ahora aplicamos el paso 5, generar ceros en la columna que contiene al pivote

1 6/5 3/2 | 96 R2 → (−1/10)R1 + R2 1 6/5 3/2 | 96


   
1/10 2/15 1/5 | 11  R3 → (−1/5)R1 + R3 0 1/75 1/20 | 7/5 
1/5 1/5 3/10 | 18 ⇐⇒ 0 −1/25 0 | −6/5

30
El algoritmo puede continuar como en el ejemplo 1.8, sin embargo, como se genero otro cero
en la tercera fila en el último paso, es posible encontrar el valor de la variable y y hacer la
sustitución hacia atrás, para encontrar la solución del sistema

(−1/25)y = −6/5 ⇔ y = 30,

reemplazando este valor de y en la segunda ecuación

(1/75)(30) + (1/20)z = 7/5 ⇔ (1/20)z = 7/5 − (1/75)(30)


⇔ z = 7(20/5) − 30(20/75)
⇔ z = 20

Los valores encontrados de y y z se reemplazan ahora en la primera ecuación

x + (6/5)(30) + (3/2)(20) = 96 ⇔ x + 36 + 30 = 96 ⇔ x = 96 − 66 = 30.

Ejemplo 1.9. Una fábrica produce tres productos A, B y C. Las ventas por cada unidad de
A, B y C son $1, $2 y $3, respectivamente. Los costos fijos son $19000 por año y los costos
de producción de cada unidad de A, B y C son $4, $5 y $7, respectivamente. El próximo
año, un total 9000 unidades de estos tres productos deben ser producidas y vendidas, y se
destina un total de $20000 para ventas. Si el costo total debe ser $71000, ¿cuántas unidades
de cada producto se deberı́an producir el próximo año?

Solución. Sea x el número de unidades del artı́culo A que se deben producir el próximo
año, y y, z, las respectivas variables que representan el número de unidades del artı́culos B
y C que se deben producir el próximo año.

Se deben producir y vender exactamente 9000 unidades de los productos A, B y C, esto


es,

x + y + z = 9000.

Se tiene un total de $20000 para las venta del próximo año, por lo que

x + 2y + 3z = 20000.

Además, como
costo total=costos fijos + costos de producción,

31
tenemos que la tercera ecuación es
71000 = 19000 + 4x + 5y + 7z.
Con lo cual formamos el sistema

 x + y + z = 9000
x + 2y + 3z = 20000

4x + 5y + 7z = 52000
La matriz aumentada para este sistema es
1 1 1 | 9000
 
1 2 3 | 20000
4 5 7 | 52000
Al aplicar reducción por filas obtenemos
1 1 1 | 9000 R1 → −R1 + R2 1 1 1 | 9000
   
1 2 3 | 20000 R3 → −4R1 + R3 0 1 2 | 11000
4 5 7 | 52000 ⇐⇒ 0 1 3 | 16000
1 1 1 | 9000
 
R3 → −R2 + R3 
0 1 2 | 11000
⇐⇒
0 0 1 | 5000
Observamos que la forma de la última matriz aumentada del sistema se encuentra en la FER
y se puede ver de inmediato que z = 5000. Después se usa la sustitución hacia atrás
para despejar primero y, y luego x. La segunda ecuación queda y + 2z = 11000, de donde,
y = 11000 − 2(5000) = 1000. Ahora reemplazando los valores de y y z en la primera ecuación
obtenemos x + 1000 + 5000 = 9000 o x = 3000. Esta es la solución única para el sistema.
Se escribe el la forma (3000, 1000, 5000). El método de solución que se acaba de emplear se
denomina eliminación Gaussiana.

Ahora podemos llevar la matriz de coeficientes que tenı́amos en un inicio, a la FERR.


Con el método de eliminación Gaussiana se llego a que
1 1 1 | 9000 1 1 1 | 9000
   
1 2 3 | 20000 ⇐⇒ 0 1 2 | 11000
4 5 7 | 52000 0 0 1 | 5000
Sin embargo, está última expresión para la matriz aumentada del sistema se puede reducir
aun más:
1 1 1 | 9000 R1 → −R3 + R1 1 1 0 | 4000
   
0 1 2 | 11000 R2 → −2R3 + R2 0 1 0 | 1000
0 0 1 | 5000 ⇐⇒ 0 0 1 | 5000

32
1 1 0 | 4000 1 0 0 | 3000
   
0 1 0 | 1000 R1 → −R2 + R1 0 1 0 | 1000
⇐⇒
0 0 1 | 5000 0 0 1 | 5000
Vemos que la matriz aumentada del sistema está en la FERR. De inmediato se observa que
x = 3000, y = 1000 y z = 5000. Y de nuevo se encuentra que la solución del sistema es
(3000, 1000, 5000). El método descrito anteriormente se denomina eliminación de Gauss–
Jordan.
Por ahora se cuenta con dos métodos para resolver sistemas de ecuaciones

Eliminación Gaussiana

Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la


definición 1.4.2, para llevar una matriz a la FER es llamado Eliminación Gaussiana.

Eliminación de Gauss–Jordan

Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la


definición 1.4.2, para llevar una matriz a la FERR es llamado Eliminación de Gauss–
Jordan.

1.5. Sistemas de ecuaciones lineales tamaño m × n


Hasta ahora hemos considerado sistemas de ecuaciones con la misma cantidad de incógni-
tas que ecuaciones, como ya mencionamos para el caso de sistemas 2 × 2, existen 5 métodos
de solución, de los cuales sólo dos ellos resultan prácticos en la solución de sistemas 3 × 3:
el método de eliminación y la regla de Krammer. Si pensamos en minimizar la cantidad de
operaciones necesarias para resolver un sistema de ecuaciones, la regla de Krammer queda
descartada, pues en su aplicación es necesario el cálculo de determinantes, lo cual suma
una buena cantidad de operaciones. Además, el hecho que la regla de Krammer implique el
cálculo de determinantes limita su aplicación sólo a sistemas n × n. Siendo ası́, nos queda
el método de eliminación, en realidad tenemos dos métodos eliminación, que definimos en
el sección anterior: Eliminación de Gaussiana y Eliminación de Gauss–Jordan. Los
cuales, permiten encontrar la solución de sistemas m × n, esto es sistemas de la forma


 a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = b1
 a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = b2



a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = b3 (1.22)
 .
.
.




am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm

33
donde los coeficiente aij , ası́ como los términos independientes bj , son elementos de un campo
F , que por lo regular es R o C. El sistema (1.22) puede tener infinitas soluciones reales,
e infinitas soluciones enteras, pero finitas soluciones enteras positivas. Para encontrar las
soluciones enteras positivas de un sistema m × n introduciremos la noción de Ecuación
Diofántica.

1.5.1. Ecuaciones Diofánticas


Definición 1.5.1. Una ecuación Diofántica lineal en dos variables tiene la forma

ax + by = c,

donde a, b y c son enteros con ab 6= 0.

El siguiente resultado da información sobre las soluciones de una ecuación Diofántica


lineal

Teorema 1.5.1 (Soluciones de una ecuación Diofántica). La ecuación Diofántica ax+by = c


tiene solución, si y sólo si, d|c donde d = (a, b) . Además, x0 y y0 es una solución particular
de la ecuación, entonces todas las soluciones vienen dadas en la forma
b a
x = x0 + k , y = y0 − k ,
d d
donde k es una entero arbitrario.

Aquı́ (a, b) denota el máximo común divisor entre los enteros a y b y el sı́mbolo d|c
significa que d divide a c.

Ejemplo 1.10. Una señora compró 100 frutas por $5000. Las ciruelas le costaron a $25
cada una, las manzanas a $150 y las pitayas a $500. ¿Cuántas frutas de cada clase compro?

Solución. Sea x el número de ciruelas, y el número de manzanas, y z la cantidad de pitayas


que compro la señora. Según los datos del problema obtenemos el siguiente sistema

x + y + z = 100
25x + 150y + 500z = 5000
cuya matriz aumentada es

 
1 1 1 | 100
1 6 20 | 200

34
Ahora reduciremos esta matriz hasta llevarla a la F.E.R.R.
   
1 1 1 | 100 R2 → −R1 + R2 1 1 1 | 100
1 6 20 | 200 ⇐⇒ 0 5 19 | 100

   
1 1 1 | 100 R2 → (1/5)R2 1 1 1 | 100
0 5 19 | 100 ⇐⇒ 0 1 19/5 | 20

   
1 1 1 | 100 R1 → −R2 + R1 1 0 −14/5 | 80
0 1 19/5 | 20 ⇐⇒ 0 1 19/5 | 20

Regresando al sistema obtenemos



x − (14/5)z = 80
y + (19/5)z = 20

Vemos que la variable z, relaciona las otras dos variables, nos referimos a dicha variable como
variable de ligamiento. Si asignamos a la variable de ligamiento, el valor de un parámetro
t podemos expresar las variables x, y en términos de dicho parámetro, para obtener

x = 80 + (14/5)t
y = 20 − (19/5)t, t ∈ R

De esta forma encontramos lo que se conoce como forma paramétrica del sistema

 x = 80 + (14/5)t
y = 20 − (19/5)t
z = t, t ∈ R

Notamos inmediatamente que hay una solución por cada valor que toma el parámetro, es
decir, el sistema tiene infinitas soluciones reales. Pero, dado que cada una de las variables
debe ser positiva, tenemos las siguientes restricciones

20 − (19/5)t > 0, t > 0,

esto es, 0 < t < 100/19 = 5 + 5/19. Además, de las expresiones paramétricas para x, y,
advertimos, que para que estas variables representen números enteros, t debe ser un múltiplo
de 5 diferente de 1. Como el único múltiplo de 5 diferente de 1 en el intervalo (0, 100/19),
es 5, la única opción es que t = 5. De donde, la única solución entera positiva del sistema es
x = 94, y = 1 y z = 5.

35
Ahora utilicemos ecuaciones Diofánticas para hallar las soluciones enteras del sistema.
Despejando el parámetro en la primera ecuación de la forma paramétrica para el sistema
obtenemos
5
t = (x − 80),
14
reemplazando este valor en la segunda ecuación de la forma paramétrica para el sistema nos
da
 
19 5
y = 20 − (x − 80)
5 14
o equivalentemente,

19x + 14y = 19(80) + 14(20) = 1800. (1.23)

Tenemos entonces una ecuación Diofántica con a = 19, b = 14 y c = 1800, además, como
(19, 14) = 1|1800, por el Teorema 1.5.1 la ecuación tiene solución, más aún, este mismo
resultado nos asegura que la solución viene dada por
14 19
x = x0 + k , y = y0 − k ,
1 1
donde x0 , y0 es una solución particular de la ecuación, y sea observa de la ecuación (1.23)
que x0 = 80 y y0 = 20. Por lo tanto,

x = 80 + 14k
y = 20 − 19k
Para expresar la variable z como una función de k, nótese que x + y + z = 100, con lo cual,

z = 100 − x − y = 100 − (80 + 14k) − (20 − 19k) = 5k.

Entonces, las soluciones enteras del problema son



 x = 80 + 14k
y = 20 − 19k
z = 5k, k ∈ Z

De lo cual inmediatamente se deduce que el problema tiene infinitas soluciones enteras.


Finalmente, de las restricciones y, z > 0, extraemos la única solución entera positiva del
problema, pues como 0 < k < 20/19, debemos tener que k = 1. De lo cual obtenemos de
nuevo que x = 94, y = 1 y z = 5.

A continuación presentamos la noción de congruencia lineal que nos permitirá hallar


la solución particular de una ecuación Diofántica, además de introducir los enteros módulo
n.

36
Definición 1.5.2 (congruencia lineal). Sean a y b enteros y n un entero positivo. Si n|(a−b)
decimos que a y b son congruentes módulo n y escribimos

a ≡ b(mod n).

Por ejemplo, 23 ≡ 11(mod 12) y 1 ≡ −1(mod 2). Si n|a, entonces a ≡ 0(mod n) y


recı́procamente. En el siguiente resultado se dan las principales propiedades de la congruencia

módulo n.

Teorema 1.5.2. Si a ≡ b(mod n) y c ≡ d(mod n), entonces

(a) a ± c ≡ b ± d(mod n).

(b) ac ≡ bd(mod n).

(c) Para todo entero positivo k, ak ≡ bk (mod n).

(d) Para todo entero r, a + r ≡ b + r(mod n).

(e) Para todo entero r, ar ≡ br(mod n).


a b n
(f) Si r es un divisor común de a, b y n y a ≡ b(mod n), entonces ≡ mod .
r r r
n
Fermat, estudió los números de la forma 22 + 1 para n = 0, 1, 2, . . . llamados números
de Fermat y conjeturó en 1650 que siempre eran primos. La conjetura resulta ser cierta
para los cinco primeros números de Fermat que son 3, 5, 17, 257, 65537, sin embargo, Euler
demostró en 1732 que el sexto número de Fermat no es primo. Demostraremos este hecho
usando congruencias.
5
Ejemplo 1.11. El sexto número de Fermat, 22 + 1, no es primo

Solución. En efecto, puesto que, 216 = 65536 = (102)(641) + 154. Por la de congruencia
lineal tenemos

216 ≡ 154(mod 641).

Ahora, por la propiedad (c) del Teorema 1.5.2

232 ≡ 1542 (mod 641),

pero, 1542 = 23716 = (36)(641) + 640 y en consecuencia

1542 ≡ 640(mod 641).

37
por lo que por, transitividad debemos tener que

232 ≡ 640(mod 641),

y por la propiedad (d) del Teorema 1.5.2

232 + 1 ≡ 641(mod 641).

Finalmente, como 641 ≡ 0(mod 641), de nuevo por transitividad tenemos que
5
22 + 1 ≡ 0(mod 641),
5 5
lo cual implica que 641|(22 + 1), en efecto, 22 + 1 = (641)(6700417).

Además de las propiedades dadas en el teorema 1.5.2la relación ser congruente con es
transitiva, más aún, la relación de congruencia es una relación equivalencia. Recordemos
que

Definición 1.5.3. Sean A y B conjuntos. Una relación de A en B es un subconjunto del


producto cartesiano entre A y B.

Concluimos de la definición anterior que si A un conjunto arbitrario y R es una relación


en A, entonces R ⊆ A × A.

Definición 1.5.4. Sea A un conjunto arbitrario y R es una relación en A; entonces


R es reflexiva si

∀x ∈ A, (x, x) ∈ R.

R es simetrica si

(x, y) ∈ R ⇒ (y, x) ∈ R.

R es antisimetrica si

(x, y) ∈ R y (y, x) ∈ R ⇒ x = y.

R es transitiva si

(x, y) ∈ R y (y, z) ∈ R ⇒ (x, z) ∈ R.

Definición 1.5.5. Una relación en A es llamada relación de equivalencia si es reflexiva


simétrica y transitiva.

38
Si a y b están relacionados escribimos aRb, o bien (a, b) ∈ R.
Definición 1.5.6. Sean A un conjunto y R una relación de equivalencia en A, para cada
a ∈ A denotamos la clase de equivalencia de a por [a] y la definimos como

[a] = {x ∈ A : (x, a) ∈ R}

La clase de equivalencia de un elemento a ∈ A también suele denotarse por a.


Teorema 1.5.3. Sea R una relación de equivalencia en A. Entonces

aRb ⇔ [a] = [b].

Definición 1.5.7 (Conjunto cociente). Sea R una relación de equivalencia en A. El conjunto


de todas las clases de equivalencia es llamado conjunto cociente de A generado por R,
denotamos este conjunto por A/R. Tenemos entonces que

A/R = {[a] : a ∈ A} .

Teorema 1.5.4. La congruencia módulo n es una relación de equivalencia sobre Z.


El hecho que la relación de congruencia sea transitiva es clave para solucionar congruen-
cias lineales, esto encontrar los x tales

x ≡ a(mod n)

Ejemplo 1.12. Un comerciante compró lápices y borradores por $2,490. Si cada lápiz costo
$29 y cada borrador costo $33, ¿cuántos lápices y borradores compro? Sugerencia
Solución. Sea x el número de lápices y y el número de borradores que el comerciante
compró. Tenemos entonces la ecuación Diofántica

29x + 33y = 2490, (1.24)

sujeta a las condiciones x, y > 0. Para hallar la solución general de la ecuación primero
debemos hallar una solución particular. En ocasiones es fácil hallar esta solución si a|c, o b|c.
Por ejemplo, en la ecuación Diofántica

77x + 55y = 28600,

tenemos que a = 77, b = 55 y c = 28600, y observamos que 28600 = 520 · 55, esto es,
55|28600. Por lo tanto, si hacemos que la variable x sea igual a cero, obtenemos para y es
valor 28600/55 = 520. De esta forma vemos que una solución particular de la ecuación es
x0 = 0 y y0 = 520. Con lo cual, por el Teorema 1.5.1 la solución general de la ecuación es

x = 5k, y = 520 − 7k, k ∈ Z

39
Sin embargo, para la ecuación (1.24) a = 29, b = 33 y, entonces d = (29, 33) = 1 divide a
c = 2490, por lo que la ecuación tiene solución, pero ni a, ni b dividen a c, en consecuencia
al tomar x, o y igual a cero no obtenemos una solución entera. En este caso para encontrar
la solución particular podemos utilizar congruencias lineales. Procedemos como sigue.

Dado que 33y = 2490 − 29x tenemos que 29x ≡ 2490(mod 33). Por el algoritmo de la
división 2490 = 33(75) + 15, entonces 2490 ≡ 15(mod 33). Luego, por la propiedad transitiva
de la congruencia lineal

29x ≡ 15(mod 33)

Ahora, −4 ≡ 29(mod 33), entonces por el inciso (e) del Teorema 1.5.2,

−4x ≡ 29x(mod 33)

De nuevo por transitividad tenemos que −4x ≡ 15(mod33), con lo cual, −32x ≡ 120(mod33)
y 120 = 33(3) + 21 de donde 120 ≡ 21(mod 33), por consiguiente,

−32x ≡ 21(mod 33).

Por último, como 1 ≡ −32(mod 33), x ≡ −32x(mod 33), lo cual por transitividad implica
que x ≡ 21(mod 33). Esta última congruencia se satisface si x = x0 = 21, de donde y0 =
2490 − 29 · 21
= 57. En consecuencia, la solución general de la ecuación es
33
x = 21 + 33k, y = 57 − 29k, k ∈ Z.

Como x, y > 0, 21 + 33k > 0 y 57 − 29k > 0, de donde −21/33 < k < 57/29, entonces
k = 0, 1.
Si k = 0 obtenemos x = 21, y = 57.
Si k = 1 obtenemos x = 54, y = 28.

Ejemplo 1.13. Solucionar la congruencia lineal 3x ≡ 15(mod 18)

Solución. Dado que 15 ≡ −3(mod 18), por transitividad tenemos que 3x ≡ −3(mod 18).
Entonces, por la propiedad (f) del Teorema 1.5.2, x ≡ −1(mod 6) y −1 ≡ 5(mod 6), luego
de nuevo por transitivivdad x ≡ 5(mod 6). Por consiguiente, x = 5 + 6k, k ∈ Z.

Ejemplo 1.14. Un hombre cambió un cheque por cierta cantidad de dinero. El cajero equivo-
cadamente intercambio el número de pesos con el número de centavos. Al revisar la cantidad
recibida el hombre observó que tenia el doble de la cantidad por la cual habı́a girado el cheque
más dos centavos. Por que valor fue girado el cheque?

40
Solución. Sea x la variable que representa el número de pesos, y y la variable que representa
el número de centavos. La cantidad por la cual fue girado el cheque en pesos viene dada por
1
x+ y.
100
Si se intercambian el número de pesos con el número de centavos, la cantidad obtenida en
pesos está dada por
1
y+ x,
100
según los datos del problema esta cantidad el igual a el doble de la cantidad por la cual habı́a
girado el cheque más dos centavos, por lo tanto, tenemos la ecuación
 
1 2 1
2 x+ y + =y+ x,
100 100 100
o equivalentemente,

−199x + 98y = 2,

en donde vemos que a = −199, b = 98 y c = 2, además, d = (−199, 98) = 1 y 1|2, por


lo que la ecuación Diofántica tiene solución, puesto que esta es equivalente a la ecuación
98y − 2 = 199y, podemos hallar una solución particular al resolver la congruencia lineal

98y ≡ 2(mod 199).

Multiplicando la anterior congruencia por 2, obtenemos

196y ≡ 4(mod 199).

Ahora, −3 ≡ 196(mod 199), entonces −3y ≡ 196y(mod 199). Con lo cual por transitividad

−3y ≡ 4(mod 199).

Multiplicando esta última congruencia por 66 nos da

−198y ≡ 264(mod 199).

Pero 1 ≡ −198(mod 199), entonces y ≡ −198y(mod 199), por consiguiente por transitividad

y ≡ 264(mod 199).

Finalmente, como 264 ≡ 65(mod 199), tenemos que y ≡ 65(mod 199), de lo cual deducimos
que

y = 199k + 65, k ∈ Z.

41
98(65) − 2
Si k = 0, obtenemos y = y0 = 65, de donde x0 = = 32. Por lo tanto, la solución
199
general de la ecuación es

x = 32 + 98k, y = 199k + 65, k ∈ Z,

donde x > 0 y 0 < y < 100. De las restricciones x, y > 0, obtenemos dos correspondientes
cotas inferiores para el parámetro k:
32 65
− <k y − < k,
98 199
y la restricción y < 100, nos da una cota superior para k:
100 − 65 35
k< = .
199 199
Como
65 32
− <− ,
199 98
el intervalo más pequeño que puede contener a k es
 
32 35
− , ,
98 199

de lo cual, k = 0, de donde x = 32, y y = 65. Luego el cheque se giró por $32, 65.

Según el Teorema 1.5.4 la relación aRb ⇔ a ≡ b(mod n) define una relación de equiva-
lencia en Z. Entonces la clase de equivalencia a de un elemento a ∈ Z está dada por

a = {x ∈ Z : x ≡ a(mod n)}
= {x ∈ Z : x = a + kn, para algún z ∈ Z} .

El conjunto cociente generado por esta relación es denotado por Zn . Ahora, si a es un entero
arbitrario como n > 0, por el algoritmo de la división podemos representarlo en la forma
a = qn + r con 0 ≤ r < n, luego a ≡ r(mod n) y en consecuencia por el Teorema 1.5.3, a = r.
Por ejemplo, en Z4 tenemos que

4 ≡ 0(mod 4) ⇒ 4 = 0
5 ≡ 1(mod 4) ⇒ 5 = 1
6 ≡ 2(mod 4) ⇒ 6 = 2
7 ≡ 3(mod 4) ⇒ 7 = 3
8 ≡ 0(mod 4) ⇒ 8 = 0

42
Por lo tanto, Z4 sólo puede estar conformado por 4 clases:

Z4 = 0, 1, 2, 3 .

En general, dado que n ≡ 0(mod n) tenemos que n = 0, en consecuencia,



Zn = 0, 1, . . . , n − 1 ,

llamamos a este conjunto enteros módulo n. Sobre Zn podemos definir una adición una
multiplicación mediante las siguientes fórmulas

x + y = x + y,
x · y = xy.

Los enteros módulo n con la suma ası́ definida cumplen las propiedades de campo de la
definición 1.1.1.

Teorema 1.5.5. La adición en Zn tiene las siguientes propiedades

Axiomas de cerradura

(a) x, y ∈ Zn , entonces x + y ∈ Zn .

(b) x, y ∈ Zn , entonces x · y ∈ Zn .

La suma en Zn es conmutativa, asociativa, modulativa y cada elemento en este conjunto


tiene un inverso aditivo.

(c) x + y = y + x,

(d) x + (y + z) = (x + y) + z.

(d) Para todo x ∈ Zn existe e ∈ Zn tal que x + e = x

(e) Para todo x ∈ Zn existe y ∈ Zn tal que x + y = e.

Demostración. Sean x, y ∈ Zn . Si x+y < n, entonces x+y = x + y ∈ Zn . Ahora si x+y ≥ n,


por el algoritmo de la división existen enteros q y r tales que x + y = nq + r donde 0 ≤ r < n,
entonces x + y ≡ r(mod n), en consecuencia, por el Teorema 1.5.3 tenemos que x + y = r.
Por lo tanto, x + y = x + y = r ∈ Zn . De la misma forma demostramos la cerradura de la
multiplicación. Demostremos la conmutatividad. Sean x, y ∈ Zn

x+y =x+y
=y+x
= y + x.

43
Nótese que como x + y = y + x, entonces x + y = y + x. De forma análoga demostramos la
asociatividad.

Sea e := 0, entonces e ∈ Zn y para todo x ∈ Zn tenemos que

x+0 =x+0= x

De esta forma vemos que 0 es el elemento neutro para suma en Zn .

Para cada x ∈ Zn sea y := n − x, entonces como n − x < n, y ∈ Zn y

x+n−x= x+n−x =n= 0

La demostración del inciso (a) en el teorema anterior nos indica como construir las tablas
de suma y la multiplicación en Zn .

Ejemplo 1.15. Construir las tablas de adición y multiplicación para Z4

Solución. Por lo hecho en la demostración del inciso (a) del Teorema 1.5.5 tenemos que

+ 0 1 2 3 · 0 1 2 3
0 0 1 2 3 0 0 0 0 0
1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1

Por comodidad hemos omitido las barras. Se observa de la tabla de la multiplicación que
hay simetrı́a respecto a la diagonal principal, esto quiere decir que la multiplicación en Z4 es
conmutativa, además se advierte que el elemento neutro de la multiplicación es 1 y podemos
comprobar que dicha multiplicación es además asociativa. Finalmente notamos que

2 · 0 = 0, 2 · 1 = 2, 2 · 2 = 0 y 2 · 3 = 2,

es decir, no existe ningún elemento en Z4 que multiplicado por 2 nos de 1, esto es, el 2 no
tiene inverso multiplicativo, lo cual implica que Z4 no es campo. Esto a su vez implica que
ecuaciones tan simples como 2x + 1 = 2, no tengan solución en Z4 .

Como vimos en el ejemplo 1.15, Zn no es campo, sin embargo la multiplicación es con-


mutativa, asociativa, módulativa y distributiva.

44
Teorema 1.5.6. La multiplicación en Zn tiene las siguientes propiedades
(c) x · y = y · x,

(d) x · (y · z) = (x · y) · z.

(d) x · (y + z) = x · y + x · z

(e) Para todo x ∈ Zn existe 1 ∈ Zn tal que x · 1 = 1.


A continuación demostraremos que si n es un número primo Zn es un campo. Para la
demostración es necesario el siguiente resultado.
Teorema 1.5.7 (Identidad de Bézout). Sean a y b enteros no nulos cuyo máximo común
divisor es d, entonces existen enteros x, y tales que
ax + by = d (1.25)
EL recı́proco del teorema anterior se tiene si d = 1, esto es,
Teorema 1.5.8. Sean a y b enteros no nulos. Entonces
(a, b) = 1 si y sólo si existen enteros x, y tales que ax + by = 1.
Los números x e y de la identidad (1.25), llamada identidad de Bézout, pueden determi-
narse mediante el algoritmo extendido de Euclides. Este constituye otro método para
encontrar una solución particular de una ecuación Diofántica.
Teorema 1.5.9 (Zp es un campo). Si n es un número primo, entonces Zn es un campo.
Demostración. Supongamos que n es un número primo. Sea m ∈ Zn con m 6= 0, entonces
0 < m < n. Como m y n son primos relativos, es decir, (m, n) = 1, por el Teorema de Bezút
existen enteros x, y tales que
mx + ny = 1.
Por lo tanto tenemos
mx + ny = 1.
Pero,
mx + ny = mx + ny
=m·x+n·y
Como n = 0 nos queda que
m · x = 1.
Es decir, x es el inverso multiplicativo de m. De este último hecho y los Teoremas 1.5.5 y
1.5.6 concluimos que Zn es un campo si n es un número primo.

45
Problema 1.5.10. Resolver la siguiente ecuación lineal en Z73

14(x + 16) + 72(x + 2) = 53

Solución. Por comodidad omitiremos las barras. Por el Teorema 1.5.6 sabemos que en Z73
se cumple la ley distributiva por lo que

14(x + 16) + 72(x + 2) = 53 ⇔ 14x + 14 · 16 + 72x + 72 · 2 = 53

Dado que 14 · 16 = 224 = 73 · 3 + 5 y 72 · 2 = 144 = 73 · 1 + 71, tenemos que

14x + 14 · 16 + 72x + 72 · 2 = 53 ⇔ (14x + 5) + (72x + 71) = 53

Por el Teorema 1.5.5 la suma en Z73 es asociativa, por lo que

(14x + 5) + (72x + 71) = 53 ⇔ (14x + 72x) + (5 + 71) = 53.

Notando que 14 + 72 = 86 = 73 · 1 + 13 y 5 + 71 = 76 = 73 · +3, una nueva aplicación de la


ley distributiva nos permite concluir que

(14x + 72x) + (5 + 71) = 53 ⇔ (14 + 72)x + 3 = 53 ⇔ 13x + 3 = 53.

El inverso aditivo de 3 es 70 y 53+70 = 123 = 73·1+50. Entonces, de nuevo, por el Teorema


1.5.5

13x = 50

La certeza de que la ecuación anterior tiene solución, nos la da el Teorema 1.5.9, ya que 73 es
un número primo. Debe existir entonces y ∈ N con 0 < y < 73 tal que el residuo de dividir
el entero 13y entre 73 es 1. más aún, por el algoritmo de la división existe n ∈ N cumpliendo
que

13y = 73n + 1 (1.26)

Trasladamos entonces el problema de encontrar el inverso aditivo de 13 módulo 73 al de


resolver la ecuación Diofántica en (1.26). La ecuación equivale a la congruencia lineal

13y ≡ 1(mod 73)

73 = 13(5) + 8, entonces

13y ≡ 1(mod 73) ⇒ 65y ≡ 5(mod 73)

73 = 65(1) + 8

−8 ≡ 65(mod 73) ⇒ −8y ≡ 65y(mod 73)

46
Por transitividad

−8y ≡ 5(mod 73)

73 = 8(9) + 1

−72y ≡ 45(mod 73)

Como

1 ≡ −72(mod 73) ⇒ y ≡ −72y(mod 73)

de nuevo por transitividad y ≡ 45(mod 73). Es decir,

y = 73k + 45 k ∈ Z

Luego, y = 45.
Siguiendo con la ecuación

(45 · 13)x = 45 · 50

donde, 45 · 50 = 73 · 30 + 60. En consecuencia, x = 60.

1.6. Matrices
1.6.1. Sumatorias
Definición 1.6.1 (Sucesión). Sea X un conjunto no vacı́o, una sucesión en X es una fun-
ción definida en el conjunto los naturales que toma valores en el conjunto X. En sı́mbolos
escribimos

an : N → X.

Se acostumbra utilizar la notación

(an ) = {a1 , a2 , . . .} .

A partir de la sucesión (an ) creamos otra sucesión, llamada sucesión de sumas parciales
denotada por (Sn ) y definida como

Sn = a1 + a2 + · · · + an .

47
Para expresar de manera más cómoda la sucesión (Sn ) introducimos la notación sigma
P
. Con esta notación podemos expresar la sucesión Sn como sigue
n
X
Sn = ai ,
i=1

que se lee, sumatoria desde i = 1 hasta i = n. A continuación estableceremos las propiedades


fundamentales de la sumatoria.

Teorema 1.6.1 (Propiedades de la sumatoria). Sean (ai ), (bi ) sucesiones en R. Entonces


n
X n
X n
X
(a) (ai + bi ) = ai + bi . (propiedad aditiva)
i=1 i=1 i=1
Xn n
X
(b) cai = c ai . (propiedad homogénea)
i=1 i=1
Xn n−1
X
(c) ai−1 = ai .
i=1 i=0
n
X
(d) (ai − ai−1 ) = an − a0 . (propiedad telescópica)
i=1
n
X 1 − xn+1
(e) xi = x 6= 1. (sumas parciales de la serie geométrica)
i=0
1−x

Demostración. Los ı́tems (a), (b) y (c) se siguen de la definición de sumatoria. Establezcamos
la propiedad telescópica. De las propiedades (a) y (c)
n
X n
X n
X
(ai − ai−1 ) = ai − ai−1
i=1 i=1 i=1
n−1
X n
X
= an + ai − a0 − ai−1
i=1 i=2
n−1
X n−1
X
= an + ai − a0 − ai
i=1 i=1

= an − a0 .

48
Demostremos ahora el ı́tem (d). Por la propiedad (b) y la propiedad telescópica tenemos que
n
X n
X
(1 − x) xi = (1 − x)xi
i=0 i=0
n n
ai :=xi
X X
i i+1
= (x − x ) = (ai − ai+1 )
i=0 i=0

= a0 − an+1
= 1 − xn+1 .

Como x 6= 1, vemos la propiedad (d) se sigue.

Las propiedades (a) y (b) del teorema 1.6.1 se denominan propiedades de linealidad.
Con las propiedades de linealidad junto con la propiedad telescópica, podemos calcular las
siguientes sumas parciales.

Teorema 1.6.2. Para entero n ≥ 1, se cumple que


n
X n(n + 1)
(a) i=
i=1
2
n
X n(n + 1)(2n + 1)
(b) i2 =
i=1
6
n  2
X
3 n(n + 1)
(c) i =
i=1
2

Demostración. Demostraremos sólo la parte (a), las partes (b) y (c) se dejan como ejercicios.
Xn
Nótese que, 2i − 1 = i2 − (i − 1)2 , y que 1 = n. Por lo tanto, por las propiedades
i=1
de linealidad de la sumatoria (propiedades (a) y (b)) en el teorema 1.6.1 y la propiedad
telescópica tenemos que
n
X n
X n
X
2 i−n= 2i − 1
i=1 i=1 i=1
n
X
= (2i − 1)
i=1
n n
2 X
2 ai :=i
X 2 
= i − (i − 1) = (ai − ai−1 )
i=1 i=1
2
= an − a0 = n .

49
n
X
Entonces, 2 i − n = n2 , de donde
i=1

n
X n2 + n n(n + 1)
i= = .
i=1
2 2

El teorema anterior también puede ser demostrado utilizando el principio de inducción


matemática (P.I.M)

Teorema 1.6.3 (Principio de inducción matemática). Sea S un subconjunto de los naturales


que tiene las dos propiedades siguientes

(a) 1 ∈ S.

(b) Si k ∈ S, también k + 1 ∈ S.

Entonces S = N.

Demostremos usando el principio de inducción matemática el ı́tem (a) del teorema 1.6.2.

Nótese que

1 + 3 = 4 = 22 , 1 + 3 + 5 = 9 = 32 , 1 + 3 + 5 + 7 = 16 = 42 .

Si seguimos este patrón vemos que

1 + 3 + 5 + · · · 2n − 1 = n2 . (1.27)

Definamos S = {n ∈ N : 1 + 3 + 5 + · · · 2n − 1 = n2 }. Nótese que 1 ∈ S, ya que 1 = 12 .


Ahora supongamos k ∈ S (hipótesis de inducción), esto es,

1 + 3 + 5 + · · · 2k − 1 = k 2 . (1.28)

El k-ésimo impar es de la forma 2k −1, entonces k +1-ésimo impar es de la forma 2(k +1)−1.
Sumando este término en ambos lados de (1.28) obtenemos

1 + 3 + 5 + · · · 2k − 1 + 2(k + 1) − 1 = k 2 + 2(k + 1) − 1.

Como k 2 + 2(k + 1) − 1 = k 2 + 2k + 1 = (k + 1)2 , demostramos que k + 1 ∈ S. Entonces por


el Teorema 1.6.3 (principio de inducción matemática) S = N. Esto es, (1.27) se cumple para
todo número natural n.

50
Por lo tanto, por las propiedades de linealidad de la sumatoria

n2 = 1 + 3 + · · · 2n − 1
Xn
= (2i − 1)
i=1
X n n
X
=2 i− 1
i=1 i=1
n
X
=2 i − n.
i=1

De donde finalmente obtenemos que


n
X 1 n(n + 1)
i = (n2 + n) = .
i=1
2 2

Álgebra de matrices
Como ya dijimos una matriz es un arreglo rectangular de números dispuestos en m filas
y n columnas
 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
A= . (1.29)
 
.. .. 
 .. . . 
am1 am2 · · · amn
Para simplificar el manejo de las matrices usamos la notación A = [aij ]m×n , o simple-
mente, A = [aij ] para denotar una matriz tı́pica del conjunto Mm×n (R).

Definición 1.6.2 (Igualdad de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A = B si y sólo si aij = bij para todo 1 ≤ i ≤ m, y todo 1 ≤ j ≤ n. Es decir, dos
matrices son iguales si y sólo si son iguales componente a componente.

1.6.2. Suma y multiplicación por escalar de matrices


De la misma forma en la que se definió la igualdad matricial definimos la suma y la
multiplicación por escalar de matrices, esto es, en términos de las componentes.

Definición 1.6.3 (Suma de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A + B = C donde C = [cij ] y cij = aij + bij .

51
Definición 1.6.4 (Multiplicación por escalar). Sean A ∈ Mm×n (R) y k ∈ R. Definimos la
multiplicación por escalar entre el escalar k y la matriz A como kA = C donde C = [cij ] y
cij = kaij .
A continuación estableceremos las propiedades del la suma y la multiplicación por escalar
de matrices.
Teorema 1.6.4 (Propiedades de la suma matricial). Sean A, B, C ∈ Mm×n (R), con A =
[aij ], B = [bij ] y C = [cij ], α, β escalares. Entonces
(a) A + B = B + A.

(b) A + (B + C) = (A + B) + C.

(c) Existe la matriz E = 0m×n con E = [eij ] y eij = 0 para todo i y todo j tal que
A + 0m×n = A.

(d) Para toda matriz A existe −A = [−aij ] tal que A + (−A) = 0m×n .

(e) α(A + B) = αA + αB

(f) (α + β)A = αA + βA

1.6.3. Producto matricial


Una matriz de tamaño n × 1 es llamada vector fila, que escribimos en la forma
 
x1 x2 · · · xn

Una matriz de tamaño 1 × n es llamada vector columna, que escribimos en la forma


 
x1
 x2 
 
 .. 
.
xn
Definición 1.6.5 (Producto escalar). Sean
   
x1 y1
 x2   y2 
A= .  yB=.
   
..  .. 
xn yn
dos vectores. Entonces el producto escalar entre A y B denotado por A · B, está dado por

A · B = x1 y1 + x2 y2 + · · · + xn yn .

52
De la definición de producto escalar se deducen las siguientes propiedades
Teorema 1.6.5 (Propiedades del producto escalar). Sean A, B y C tres vectores y α, β
escalares. Entonces
(a) A · 0 = 0.

(b) A · B = B · A.

(c) A · (B + C) = A · B + A · C.

(d) (αA) · B = α(A · B) = A · (αB).


Definimos el producto punto también entre dos vectores fila
   
A = x1 x2 · · · xn y B = y1 y2 · · · yn
   
A · B = x1 x2 · · · xn · y1 y2 · · · yn = x1 y1 + x2 y2 + · · · + xn yn .
Con frecuencia se tomará el producto escalar de un vector fila y un vector columna.

 
y1
   y2 

A · B = x1 x2 · · · xn ·  ..  = x1 y1 + x2 y2 + · · · + xn yn .

.
yn
Definición 1.6.6 (Producto matricial). Sea A ∈ Mm×n (R) y B ∈ Mn×p (R) con A = [aij ]m×n
y B = [bij ]n×p . Entonces AB = C donde C = [cij ] y
cij = [fila i de A] · [columna j de B]
Es decir,
n
    X
cij = ai1 ai2 · · · ain · a1j a2j · · · anj = aik bkj .
k=1

Como primera consecuencia de la definición del producto matricial es que dicho producto
no es conmutativo.
Ejemplo 1.16. En ∈ M2×2 (R) consideremos
   
1 0 0 0
A= , A=
1 1 0 2
Entonces
   
0 0 0 0
AB = , BA =
0 2 2 2
Como AB 6= BA, vemos que el producto de matrices no es conmutativo

53
Se puede demostrar que el producto matricial si es asociativo y distributivo
Teorema 1.6.6 (Propiedades del producto matricial). Si todas las sumas y productos están
bien definidos, entonces

(a) A(BC) = (AB)C (Ley asociativa)


(b) A(B + C) = AB + AC, (A + B)C = AC + BC (Leyes distributivas)
(c) (αA)B = α(AB) = A(αB) y (αA)(βB) = αβ(AB), α, β ∈ R.

El espacio Mm×n (R)

Cuando m = n tenemos el espacio de las matrices cuadradas, en el existe un elemento


neutro para la multiplicación llamado matriz identidad, que se denota por In×n , o simple-
mente por I y define como I = [δij ] donde
(
1, si i = j,
δij =
0, si i 6= j,
El escalar δij es llamado delta de Kronecker. Si aplicamos la definición de matrices para
el producto AI = C, donde A = [aij ]n×n y C = [cij ]n×n obtenemos
n
X
cij = aik δkj .
k=1

Pero por definición del delta de Kronecker cij = aij , de modo que AI = A. De manera similar
tenemos que IA = A. Hemos demostrado que
Teorema 1.6.7. Sea A una matriz cuadrada de n × n. Entonces

AI = IA = A.

En todo campo F para cada elemento a 6= 0 existe b ∈ F tal que ab = 1. Esto ya no se


cumple en el espacio Mm×n (R), pues por ejemplo,
   
1 1 0 0
A := 6=
0 0 0 0
Sin embargo, no existe una matriz B tal que AB = BA = I2×2 . No basta entonces con que
la matriz sea distinta de la matriz cero, se debe pedir además, como veremos en el capı́tulo
2, que det A 6= 0. Llamamos a este tipo de matrices, matrices invertibles
Definición 1.6.7. Una matriz A ∈ Mn×n (R) es invertible si existe B ∈ Mn×n (R)

AB = BA = I

En este caso escribimos B = A−1 .

54
Nota 1.6.1. Si A ∈ Mn×n (R) es una matriz tal que existe B ∈ Mn×n (R) cumpliendo que
AB = I, entonces necesariamente tenemos que BA = I, ya que

det A det B = det(AB) = det I = 1,

lo cual implica que det A, det B 6= 0, de lo cual, a su vez concluimos que las matrices A, B,
deben ser invertibles. En particular, como la matriz A es invertible

A−1 (AB) = A−1 ⇔ (A−1 A)B = A−1


⇔ IB = A−1
⇔ B = A−1

Por lo tanto, BA = A−1 A = I.


Teorema 1.6.8. Sean A, B ∈ Mn×n (R). Entonces AB es invertible y

(AB)−1 = B −1 A−1

Potenciación de matrices
Sea A ∈ Mn×n (R). Definimos A0 = I y An = An−1 A.

En los números reales si an = 0, se tiene que a = 0. Veámos que en las matrices este
hecho en general no se cumple.
Ejemplo 1.17. Hallar todas las matrices A ∈ Mn×n (R) tales que A2 = 0.
Solución. Sea
 
a b
A= ,
c d

Como A2 = 0, det A det A = det(A2 ) = 0, entonces det A = 0, esto es, ad − bc = 0.


 2   
2 2 a + bc ab + bd 0 0
A =0⇔A = =
ac + cd d2 + bc 0 0
Por lo tanto, de esta ecuación matricial obtenemos 4 ecuaciones escalares que junto con la
ecuación ad − bc = 0, conforman el sistema

a2 + bc = 0 (1.30)
ab + bd = 0 (1.31)
ac + cd = 0 (1.32)
d2 + bc = 0 (1.33)
ad − bc = 0 (1.34)

55
Igualando las ecuaciones (1.30) y (1.33) obtenemos que a2 = d2 , de donde a = ±d. Si a = d,
de la ecuación (1.34) tenemos que a2 − bc = 0, sumando esta última ecuación con la ecuación
(1.30) nos da 2a2 = 0, de donde a = 0. Por lo tanto, bc = 0. Luego, la opción a = d genera
matrices de la forma
   
0 b 0 0
, b 6= 0 y , c 6= 0
0 0 c 0
Por ejemplo,
 
0 1
A= 6 0, y A2 = 0.
=
0 0
Ahora si a = −d, entonces a+d = 0, y las ecuaciones (1.31) y (1.32) no dan información pero
tampoco contradicción y las ecuaciones (1.30), (1.33) y (1.34) se vuelven la misma ecuación:
a2 + bc = 0. Por lo tanto, en este caso obtenemos matrices de la forma
 
a b
,
c −a
donde a, b y c satisfacen la ecuación a2 + bc = 0. Se observa que si a = 0, entonces bc = 0,
de modo que este caso también abarca el caso anterior. Concluimos que la todas la matrices
tales que A2 = 0 son de la forma
 
a b
,
c −a
con a2 + bc = 0.
Ejemplo 1.18. Sea A ∈ Mn×n (R) y α ∈ R. Usar inducción matemática para establecer que
(αA)n = αn An .
Solución. Supongamos que
(αA)n = αn An ∀n ∈ N (1.35)
Para n = 1, (αA)1 = α1 A1 , esto es, (1.35) se tiene para n = 1. Supongamos que (1.35) se
tiene para n = k, es decir
(αA)k = αk Ak ∀k ∈ N (Hipótesis de inducción)
Entonces
(αA)k+1 = (αA)(αA)k
= (αA)(αk Ak ) (Hipótesis de inducción)
= (αk α)(AAk ) (Teorema 1.6.6 inciso (c))
= αk+1Ak+1

56
Por consiguiente, (1.35) se cumple para n = k + 1. Luego por el (PIM) tenemos la validez
de (1.35).
 
1 0
Ejemplo 1.19. Sea A = . Comprobar que A2 = 2A − I y calcular A100
−1 1

Solución. Por calculo directo tenemos


    
2 1 0 1 0 1 0
A = =
−1 1 −1 1 −2 1

Por otro lado,


     
2 0 1 0 1 0
2A − I = − =
−2 2 0 1 −2 1

Con lo cual comprobamos que A2 = 2A − I. Entonces por la propiedad distributiva del


producto matricial, las propiedades (e) y (f) del Teorema 1.6.4 y el Ejemplo 1.18 tenemos

A4 = A2 A2 = (2A − I)(2A − I)
= (2A − I)(2A) − (2A − I)(I)
= (2A)2 − 2A − 2A + I
= 4A2 − 4A + I
= 4(2A − I) − 4A + I
= 8A − 4I − 4A + I
= 4A − 3I.

Siguiendo el patrón vemos que

A2n = 2nA − (2n − 1)I.

Por lo tanto, si n = 50, obtenemos

A100 = 100A − 99I.


   
100 0 −99 0
= +
−100 100 0 −99
 
1 0
= .
−100 1

La potenciación de matrices cumple las siguientes propiedades

57
Teorema 1.6.9. Sean n, m ∈ Z+ y A ∈ Mn×n (R). Entonces

An Am = An+m , (An )m = Anm .

Ejemplo 1.20. Sean A, B ∈ Mn×n (R). Entonces

(a) Si A, B son matrices triangulares, o estrictamente triangulares, A + B es una matriz


triangular, o estrictamente triangular.

(b) Si A, B son matrices triangulares, o estrictamente triangulares, AB es una matriz


triangular, o estrictamente triangular.

Solución. En el caso de la suma, es suficiente demostrar el caso en que A y B sean matrices


triangulares superiores. Sean A = [aij ] y B = [bij ] matrices triangulares superiores, esto es
aij = 0 y bij = 0 si i > j. Tenemos que C = [cij ], donde

cij = aij + bij ,

entonces cij = 0 + 0 = 0 si i > j, esto es, C es una matriz triangular superior. Ahora para
el producto tenemos que
n
X
cij = aik bkj .
k=1

Supongamos que i > j, entonces existe p ∈ N tal que i = j + p, donde p = 1, 2, . . . , n − j. Y


tenemos dos casos: k ≤ j, o k > j. Si k ≤ j, entonces k ≤ j < j + p = i, esto es, k < i, con
lo cual aik = 0, y por lo tanto cij = 0. Ahora si k > j, entonces bkj = 0, y de nuevo cij = 0.
Es decir C es triangular superior.

Ahora, supongamos que A y B son matrices estrictamente triangulares superiores, esto


es aij = 0 y bij = 0 si i ≥ j. Si i > j, estamos en el caso anterior y cij = 0. Y si i = j tenemos
que
n
X
cii = aik bki ,
k=1

si i 6= k, entonces i > k, i < k, con lo cual respectivamente tenemos que aik = 0, o bki = 0.
En ambos casos cii = 0. Alternativamente, si i = k, aik = 0, bki = 0, y de nuevo cii = 0. En
consecuencia, la matriz C es estrictamente triangular superior.

Se puede ahora utilizar inducción matemática para demostrar que

Corolario 1.6.10. La suma y el producto de n matrices estrictamente triangulares superio-


res, es una matriz estrictamente triangular superior.

58
1.7. Problemas

Sección 1.1. Campos


Problema 1.7.1 (Dificultad 3). Suponga que k un entero positivo que no es un cuadrado
perfecto. Demostrar que
n √ o
F := x + ky : x, y ∈ Q

es un campo. Sugerencia: Recuerde que k es un número irracional si k no es un cuadrado
perfecto
Problema 1.7.2 (Dificultad 2). En Z7 resolver las ecuaciones 3x + 4 = 1 y x2 + 2x + 6 = 0.
Problema 1.7.3. Muestre que la ecuación 2x + 1 = 2 no tiene solución en Z4 . Concluya
que Z4 no es un campo.
Problema 1.7.4 (Dificultad 2). Verifique que el conjunto de los números racionales con las
operaciones usuales de suma y producto de racionales es un campo. Asuma que la suma y
producto en los enteros es conmutativa, asociativa y modulativa.

Problemas que se resuelven por ecuaciones de primer


grado con una incógnita
Problema 1.7.5. Un capataz contrata un obrero ofreciéndole un sueldo anual de 3000 sucres
y una sortija. Al cabo de de 7 meses el obrero es despedido y recibe 1500 sucres y la sortija.
¿Cuál era el valor de la sortija?
Problema 1.7.6. Un conejo es perseguido por un perro. El conejo lleva una ventaja inicial
de 50 de sus saltos al perro. El conejo de 5 saltos mientras el perro da 2, pero el perro en
3 saltos avanza tanto como el conejo en 8 saltos. ¿Cuántos saltos debe dar el perro para
alcanzar la conejo?
Problema 1.7.7. Un profesor asigna 3 ejercicios. Pide a 1/4 del número de estudiantes que
está en clase que resuelva el primer ejercicio, a 3/8 el segundo y a 5/16 el tercero. Del total
de alumnos dos están ausentes. ¿Cuál es la cantidad total de alumnos?

Problemas que se resuelven por ecuaciones no lineales


Problema 1.7.8. Un joven estudiante gasta diariamente $3200 en transporte y $6400 en
el almuerzo. Para cubrir estos gastos compra bolsas de 12 paquetes de papas fritas a $8800
cada una, con el fin de vender paquetes sueltos a $1000. ¿Cuál es el mı́nimo de paquetes que
debe vender diariamente para cubrir sus gastos?

59
Problema 1.7.9. Un recipiente contiene 5000L de agua pura. Una salmuera que contiene
30g de sal por litro de agua es bombeada al recipiente a razón de 25L/min. Hallar la con-
centración de sal después de t minutos(en gramos por litro). ¿Qué sucede cuando t tiende a
infinito?

Sección 1.3. Sistemas de ecuaciones lineales de tamaño


2×2
Problema 1.7.10. (Ver, [3, pag. 7, Problema 37]). Una tienda de helados vende sólo helados
con soda y malteadas. Se pone una 1 onza de jarabe y cuatro onzas de helado en un helado
con soda, y 1 onza de jarabe y 3 onzas de helado en una malteada. Si la tienda usa 4 galones
de helado 5 cuartos de jarabe en un dı́a, ¿cuántos helados con soda y cuántas malteadas
vende? Sugerencia: 1 cuarto =32 onzas; 1 galón=128 onzas.

Problema 1.7.11. (Ver, [3, pag. 27, Problema 38]). Un viajero que acaba de regresar de
Europa gastó $30 diarios en Inglaterra, $20 diarios en Francia y $20 diarios en España por
concepto de hospedaje. En comida gasto $20 diarios en en Inglaterra, $30 diarios en Francia
y $20 en España. Sus gastos adicionales fueron $10 en cada paı́s. Los registros del viajero
indican un gasto total de $340 en hospedaje, $320 en comida y $140 en gastos adicionales
durante su viaje por estos tres paı́ses. Calcule el número de dı́as que pasó el viajero en cada
paı́s o muestre que los registros deben estar incorrectos debido a que las cantidades gastadas
no son compatibles una con la otra.

Problema 1.7.12. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.

Problema 1.7.13. (Ver, [3, pag. 27, Problema 40]). Una gente secreto sabe que 60 equipos
aéreos, que consisten en aviones de combate y bombarderos, están estacionados en cierto
campo aéreo secreto. El agente quiere determinar cuántos de los 60 equipos son aviones de
combate y cuántos son bombarderos. Existe un tipo de cohete que llevan ambos aviones; el
de combate lleva 6 de ellos y el bombardero sólo 2. El agente averigua que se requieren 250
cohetes para armar todos los aviones del campo aéreo. Aún más, escucha que se tiene el

60
doble de aviones de combate que bombarderos en al base. Calcule el número de aviones de
combate y bombarderos en el campo aéreo o muestre que la información del agente debe ser
incorrecta ya que es inconsistente.

Sección 1.5. Sistemas de ecuaciones lineales de tamaño


m×n
Problema 1.7.14. Analizar si el siguiente sistema es consistente o inconsistente. Si es
consistente dar la forma que tienen las soluciones.

 w + x − y − 6z = −4
2w + 3x + 2y + 12z = 12
2w + x + 2y + 4z = 4

Problema 1.7.15. Considere el sistema



 2x + 3y − z = a
x − y + 3z = b
3x + 7y − 5z = c

Encuentre las condiciones de a, b y c para que el sistema sea inconsistente.

Subsección 1.5.1. Ecuaciones Diofánticas


Problema 1.7.16. La entrada a cierto museo vale $900 para adultos y $375 para niños.
Cierto dı́a en que asistieron más adultos que niños se recaudaron $45000. ¿Cuántos adultos
y cuantos niños asistieron al museo?

Problema 1.7.17. Una caja contiene un total de 13 monedas distintas de 1, 5 y 10 centavos,


cuyo valor total es de 83 centavos. ¿Cuántas monedas de cada denominación hay?

Sección 1.6. Matrices


 
a −b
Problema 1.7.18 (**). Muestre que el conjunto de todas las matrices de la forma ,
b a
siendo a y b números reales es un campo.
 
n cos θ − sen θ
Problema 1.7.19 (**). Determinar A , si A := .
sen θ cos θ

61
Problema 1.7.20 (**). En los números reales, la ecuación a2 = 1, tiene dos soluciones,
a = ±1. Esto no se cumple para las matrices. Muestre que la ecuación A2 = I se satisface
para cada una de las matrices
     
1 0 1 0 1 b
, , ,
0 1 c 1 0 1

donde b y c son números reales arbitrarios. Hallar todas las matrices A ∈ M2×2 (R) tales que
A2 = I.
   
1 1 2 1 2
Problema 1.7.21 (**). Sea A = . Comprobar que A = y calcular An .
0 1 0 1
   
1 1 1 1 2 3
Problema 1.7.22 (**). Sea A = 0  1 1. Comprobar que A2 = 0 1 2. Inducir una
0 0 1 0 0 1
forma general para An y demostrarla por inducción.

Problema 1.7.23 (**). Hallar todas las matrices A ∈ M2×2 (R), tales que A2 = 0.

Problema 1.7.24. Sea A ∈ Mn×n (R) estrictamente triangular superior (es decir todas entra-
das en la diagonal y abajo de ella son cero). Demuestre que si A es una matriz estrictamente
triangular superior, entonces An es estrictamente triangular superior.

Problema 1.7.25. Sean A, B ∈ Mn×n (R). Entonces

(a) (A−1 )−1 = A si la matriz A es invertible.

(b) (AB)−1 = B −1 A−1 si A y B son matrices invertibles.

Problema 1.7.26 (***). Sea A una matriz estrictamente triangular superior. Demuestre
que I − A es invertible y exprese su inversa en función de A.

62
Capı́tulo 2

Determinantes

2.1. Definición de determinante de una matriz


 
a11 a12
Sea A = . Se define el determinante de A por
a21 a22

det A = a11 a22 − a12 a21 .

Con frecuencia se denotará det A por



a11 a12
|A| o .
a21 a22
Definición 2.1.1 (Menor de una matriz). Sea A ∈ Mn×n (R) y sea Mij la matriz de tamaño
(n − 1) × (n − 1) obtenida a partir de A al eliminar la fila i y la columna j. Mij se llama
menor ij de A.
Definición 2.1.2 (Cofactor de una matriz). Sea A ∈ Mn×n (R). El cofactor ij de A,
denotado por Aij , está dado por

Aij = (−1)i+j |Mij |.

Nótese que definición anterior tiene sentido por que ya se definió el determinante para
una matriz 2 × 2.
Definición 2.1.3 (Determinante de una matriz). Sea A ∈ Mn×n (R). Entonces el determi-
nante de A, denotado por det A o |A|, está dado por
n
X
det A = |A| = a11 A11 + a12 A12 + · · · + an1 An1 = a1k A1k . (2.1)
k=1

La expresión en lado derecho de (2.1) se llama desarrollo por cofactores o expansión por
cofactores a través de la primera fila de A.

63
Definición 2.1.4 (Matriz triangular y diagonal). Una matriz cuadrada se dice triangular
superior si todos sus componentes abajo de la diagonal son cero. Se dice estrictamente
triangular superior si todas sus entradas en la diagonal y abajo de ella son cero. Es una
matriz triangular inferior si todos sus componentes arriba de la diagonal son cero. Se
dice estrictamente triangular superior si todas sus entradas en la diagonal y arriba de
ella son cero. Es una matriz diagonal si todos los elementos que no están en la diagonal
cero.
Teorema 2.1.1 (Determinante de una matriz triangular). Sea A ∈ Mn×n (R) una matriz
triangular. Entonces
det A = a11 a22 · · · ann .

2.2. Interpretación geométrica del determinante de ta-


maño 2 × 2
En la figura 2.1 se muestra un paralelogramo de vértices OBCA. El triángulo △BP C es
rectángulo en P , además, BP = a y CP = c, de tal forma que las coordenadas del punto C
son
x = BP + OR = a + b, y = RB + CP = c + d.

C(a + b, c + d)
b

Q
b

B(b, d) b P
b A(a, c)

x
R O

Figura 2.1: Interpretación geométrica del determinante 2 × 2

Suponemos que los segmentos de recta OQ y BC son perpendiculares en Q, tal forma


que el segmento OQ es la altura del paralelogramo. Por lo tanto, su área está por
OQ · BC.

64
El segmento BC como función de a y c viene dado en la forma
p √
BC = d(B, C) = (a + b − b)2 + (c + d − d)2 = a2 + c2 .

Ahora, expresaremos el segmento OQ como función de a, b, c y d. Dado que los segmentos


OQ y BC son perpendiculares tenemos que

mOQ · mBC = −1.

Pero, mBC = mOA = c/a. Con lo cual,

mOQ = −1/mBC = −a/c.

Por lo tanto, la ecuación de la recta que contiene el segmento OQ está dada por
a
y=− x
c
Para generar otra ecuación que relacione las variables x, y, hallamos la ecuación de la recta
que contiene al segmento BC. Como esta recta pasa por B y tiene pendiente mBC = mOA =
c/a, su ecuación es
c
y = (x − b) + d.
a
Como y = −(a/c)x, obtenemos que
a c
− x = (x − b) + d.
c a
Multiplicando la ecuación anterior por el término −(c/a), nos da
 cc 
x= − (x − b) + d
a a 
 c c bc
= − x− +d
a a a
2 2
c bc cd
= − 2x + 2 −
a a a
2 2
c bc − acd
= − 2x + .
a a2
De donde obtenemos que

bc2 − acd ad − bc
x= 2 2
= −c 2 .
a +c a + c2

65
Se advierte que el numerador en la última igualdad en la ecuación anterior, es el determinante
de la matriz
 
a b
A= ,
c d

por lo que podemos expresar la variable x en términos de este determinante:


det A
x = −c .
a2 + c2
a
Dado que y = − x, obtenemos
c
 
a det A
y = − · −c 2
c a + c2
det A
=a 2 .
a + c2
De esta forma obtenemos las coordenadas del punto Q:
 
det A det A
Q = −c 2 ,a . .
a + c2 a2 + c2

En consecuencia, el área del paralelogramo es


s
a2 det2 A + c2 det2 A √ 2
OQ · BC = · a + c2
(a2 + c2 )2

det2 A √ 2
=√ · a + c2
a2 + c2
= | det A|.

2.3. Propiedades de los determinantes


Teorema 2.3.1 (Determinante de un producto). Sean A, B ∈ Mn×n (R). Entonces

det(AB) = det A det B.

Teorema 2.3.2 (Teorema fundamental de los determinantes). Sea A = (aij )n×n . Entonces
n
X
det A = aik Aik
k=1

66
para todo i = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier fila de la matriz A. Más aún,
n
X
det A = akj Akj
k=1

para todo j = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier columna de la matriz A.
El Teorema 2.3.2 le da sentido a la definición 2.1.3 y tiene las siguientes consecuencias
Corolario 2.3.3. Sea A ∈ Mn×n (R)
(a) det A = det At .

(b) A es una matriz invertible si y sólo si det A 6= 0 y det A−1 = 1/ det A.

(c) Si la matriz A tiene una fila o columna de ceros, entonces det A = 0.


Además tenemos las siguientes propiedades
Teorema 2.3.4 (Propiedad 1). Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al multiplicar su fila i o su columna j por un escalar c, entonces

det B = c det A.

Teorema 2.3.5 (Propiedad 2). Sean


   
a11 a12 · · · a1j · · · a1n a11 a12 · · · α1j · · · a1n
a a · · · a2j · · · a2n   a21 a12 · · · α2j · · · a2n 
   
A =  21 12 ,B = 
. . . . . . . . . . . . . . . . . . . . . . . . . . .  . . . . . . . . . . . . . . . . . . . . . . . . . . . 

an1 a12 · · · anj · · · ann an1 a12 · · · αnj · · · ann
y
 
a11 a12 · · · a1j + α1j · · · a1n
a a · · · a2j + α2j · · · a2n 
 
C =  21 12
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

an1 a12 · · · anj + αnj · · · ann
Entonces

det C = det A + det B.

En otras palabras, supongamos que las matrices A, B y C son idénticas excepto por la columna
j y que la columna j de C es igual a la suma de las columnas j–esimas de A y B. Entonces
det C = det A + det B.

67
Teorema 2.3.6 (Propiedad 3). Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al intercambiar dos de sus filas o sus columnas. Entonces
det B = − det A.
Teorema 2.3.7 (Propiedad 4). Si la matriz A tiene dos filas o columnas iguales, entonces
det A = 0.
Teorema 2.3.8 (Propiedad 5). Si una fila o columna de una matriz A es un múltiplo escalar
de otra fila o columna, entonces det A = 0
Teorema 2.3.9 (Propiedad 6). Si se suma un múltiplo escalar de una fila o columna o otro
fila o columna, entonces el determinante no cambia.
Problema 2.3.10. Demuestre utilizando inducción matemática que

1 + x1
x 2 · · · x n


x1 1 + x2 · · · xn
.. = 1 + x1 + x2 + · · · + xn , n = 2, 3, . . . , (2.2)

.. ..
. . .

x1 x2 · · · 1 + xn
Ahora, sea A = [aij ]n×n donde
(
1 + xi , si i = j,
aij :=
xj , si i 6= j,

y sea xi := i2 . Calcule el determinante de la matriz A.


Solución. Para encontrar la forma de proceder en el caso general, consideremos la casos
n = 2 y n = 3. Para el caso n = 2, por calculo directo tenemos que

1 + x1 x 2

= (1 + x1 )(1 + x2 ) − x1 x2 = 1 + x2 + x1 + x1 x2 − x1 x2 = 1 + x1 + x2
x1 1 + x2
Para el caso n = 3, utilizaremos las propiedades de los determinantes:

1 + x1 x 2 x3 1 x2 x3 x1 x2 x3
P2
x1
1 + x2 x3 = 0 1 + x2 x3 + x1 1 + x2 x3
x x2 1 + x3 0 x2 1 + x3 x1 x2 1 + x3
1

Ahora podemos calcular el primer determinante en el miembro derecho de la ecuación anterior


expandiendo por cofactores sobre la primera columna de la matriz y posteriormente aplicando
el caso n = 2:

1 x2 x3

0 1 + x2 = 1 + x 2 x3

= 1 + x2 + x3 .
x 3 x2

0 1 + x3

x2 1 + x3

68
Ahora,

x1 x2 x3 R2 → −R1 + R2 x1 x2 x3
   
x1 1 + x2 x3  R3 → −R1 + R3  0 1 0 
x1 x2 1 + x3 ⇐⇒ 0 0 1

Aplicando dos veces la Propiedad 6 (Teorema 2.3.9), y el Teorema 2.1.1 obtenemos



x1 x2 x3 x1 x2 x3
P6
x1 1 + x2
x3 = 0 1 0 = x1
x x2 1 + x3 0 0 1
1

En consecuencia,

1 + x1 x2 x3 1 x2 x3 x1 x2 x3

x1
1 + x2 x3 = 0 1 + x2 x3 + x1 1 + x2 x3 = 1 + x2 + x3 + x1 .
x x2 1 + x3 0 x2 1 + x3 x1 x2 1 + x3
1

Demostremos ahora el caso general. Ya demostramos que (2.2) se tiene si n = 2, supongamos


que se tiene para n = k, esta es nuestra hipótesis de inducción. Entonces, por la propiedad
2 (Teorema 2.3.5), tenemos que

1 + x1
x2 · · · xk xk+1
x1
1 + x2 · · · xk xk+1
.. .. ..
. . .

x1 x2 · · · xk 1 + xk+1


1
x 2 · · · x k xk+1
x1
x 2 · · · x k xk+1


0 1 + x2 · · · xk xk+1
x1 1 + x2 · · · xk xk+1

= . + (2.3)

.. .. .. .. .. ..
. .

. . .

0 x2 · · · xk 1 + xk+1 x1 x2 · · · xk 1 + xk+1

Ahora podemos calcular el primer determinante en el miembro derecho de la ecuación anterior


expandiendo por cofactores sobre la primera columna de la matriz y posteriormente aplicando
la hipótesis inducción:


1
x 2 · · · x k xk+1
1 + x2
x 2 · · · x k xk+1


0 1 + x2 · · · xk xk+1
x2 1 + x2 · · · x k xk+1

= = 1 + x2 + · · · + xk+1

.. .. .. .. .. ..
. . . . . .

0 x2 · · · xk 1 + xk+1 x2 x2 · · · xk 1 + xk+1

69
Para calcular el determinante en el segundo sumando en la ecuación (2.3), multiplicamos la
primera fila por (−1) y sumamos el resultado con las otras k filas, y después aplicamos el
Teorema 2.1.1 para obtener

x1
x2 · · · xk xk+1 x1 x2 · · · xk xk+1
x1 1 + x2 · · · xk xk+1 0 1 + x2 · · · xk xk+1
= .. = x1

.. .. .. .. ..
. . . . . .

x1 x2 · · · xk 1 + xk+1 0 0 ··· 0 1

Nótese que se aplico la propiedad 6, k veces. Por lo tanto tenemos que



1 + x1
x2 · · · xk xk+1
x1
1 + x2 · · · xk xk+1
.. .. ..
. . .

x1 x2 · · · xk 1 + xk+1


1
x2 · · · xk xk+1 x1 x2 · · · xk xk+1
0 1 + x2 · · · xk xk+1 x1 1 + x2 · · · xk xk+1
= . + ..

.. .. .. .. ..
. . .
. .

0 x2 · · · xk 1 + xk+1 x1 x2 · · · xk 1 + xk+1

= 1 + x2 + · · · + xk+1 + x1 .

Lo cual significa que (2.2) si tiene para n = k + 1. En consecuencia, por (P.I.M) tenemos la
valides de (2.2).

Nótese que por (2.2)

det A = 1 + x1 + · · · + xn ,

Si xi := i2 , entonces

det A = 1 + 12 + · · · + n2
n(n + 1)(2n + 1)
=1+
6
n(n + 1)(2n + 1) + 6
= .
6

70
Ejemplo 2.1. Calcule el determinante de Vardermonde de tamaño 3 × 3:


1 1 1

a1 a2 a3

a2 a2 a2
1 2 3

Solución. La matriz A3 = [aij ]3×3 , donde aij = ai−1


j con 1 ≤ i, j ≤ 3, es llamada matriz de
Vardermonde. En este ejemplo calcularemos el determinante de Vardermonde de tamaño
3 × 3; D3 = detA3 (ver el Problema 2.7.2).

Antes de aplicar las propiedades de los determinantes para calcular D3 , simplificaremos


la matriz A3 utilizando reducción por columnas:

1 1 1 C2 → −C1 + C2 1 0 0
   
a1 a2 a3  C3 → −C1 + C3 a1 a2 − a1 a3 − a1 
a21 a22 a23 ⇐⇒ a21 a22 − a21 a23 − a21

Por diferencia de cuadrados tenemos que


   
1 0 0 1 0 0
a1 a2 − a1 a3 − a1  = a1 a2 − a1 a3 − a1 
a21 a22 − a21 a23 − a21 a21 (a2 − a1 )(a2 + a1 ) (a3 − a1 )(a3 + a1 )

Ahora, aplicando dos veces la propiedad 1 (Teorema 2.3.4) obtenemos que



1 0 0 1 0 0

a1 a2 − a1 a3 − a1 = (a2 − a1 )(a3 − a1 ) a1 1 1

a2 (a − a )(a + a ) (a − a )(a + a ) a2 a + a a + a
1 2 1 2 1 3 1 3 1 1 2 1 3 1

Finalmente, desarrollando el determinante en el segundo miembro de la desigualdad anterior,


por la primera fila nos da

1 0 0

(a2 − a1 )(a3 − a1 ) a1 1 1
a2 a + a a + a
1 2 1 3 1

= (a2 − a1 )(a3 − a1 ) [(a3 + a1 ) − (a2 + a1 )]


= (a2 − a1 )(a3 − a1 )(a3 − a2 ).

Por lo tanto, D3 = (a2 − a1 )(a3 − a1 )(a3 − a2 ). Se advierte que D3 es un producto de términos


de la forma (aj − ai ), esta expresión es caso particular de lo que conoce como productoria.
Definimos este concepto de manera similar al de sumatoria, si no que en vez de sumar cada
valor que toma la variable, lo multiplicamos, esto es,

71
n
Y
ai = a1 a2 · · · an
i=1

Por ejemplo, utilizando el sı́mbolo de productoia podemos expresar D3 como sigue:


2
Y
D3 = (aj − ai )
i=1
i<j≤3

2.4. Determinantes e inversas


Definición 2.4.1 (Matriz de cofactores y matriz adjunta). Sea A ∈ Mn×n (R) y sea B la
matriz dada por
 
A11 A12 · · · A1n
 A21 A22 · · · A2n 
 
B=
. . . . . . . . . . . . . . . . . . .

An1 An2 · · · Ann

B es llamada matriz de cofactores de A. Entonces la adjunta de A denotada por adj A


es la transpuesta de la matriz de cofactores, esto es,
 
A11 A21 · · · An1
A A22 · · · An2 
 
adj A = B t =  12
. . . . . . . . . . . . . . . . . . . 

An1 A2n · · · Ann

Teorema 2.4.1 (Cálculo de la inversa de una matriz). Sea A ∈ Mn×n (R). Entonces A es
invertible si sólo si det A 6= 0. Si det A 6= 0, entonces
1
A−1 = adj A.
det A
Teorema 2.4.2 (Regla de Cramer). Sea A ∈ Mn×n (R) y suponga que det A 6= 0. Entonces
la solución única del sistema Ax = b viene dada por
D1 D2 Dn
x1 = , x2 = , . . . , xn = ,
D D D

72
donde Dj = det Aj , j = 1, . . . , n, D = det A y Aj la matriz obtenida de A al cambiar su
columna j por el vector columna
 
b1
 b2 
b=.
 
 .. 
bn
Ejemplo 2.2. Considere el triángulo de la figura 2.2

b a
h

A B
x y
c

Figura 2.2: Regla de Krammer y teorema del coseno

(a) Demuestre, usando trigonometrı́a elemental las llamadas leyes de proyección

c cos A + a cos C = b (2.4)

b cos A + a cos B = c (2.5)

c cos B + b cos C = a (2.6)

(b) Utilice la regla de Krammer y las leyes de proyección para demostrar el teorema del
coseno:

a2 = b2 + c2 − 2bc cos A (2.7)

b2 = a2 + c2 − 2ac cos B (2.8)

c2 = a2 + b2 − 2ab cos C (2.9)

Solución. Del triángulo en la figura 2.2 obtenemos


x y
cos A = , cos B = ⇒ c = x + y = b cos A + a cos B.
b a
Con lo cual tenemos (2.5).

73
Ahora, como A + B + C = π, tenemos que

cos C = cos(π − (A + B))


= − cos(A + B)
= −(cos A cos B − sen A sen B)
= sen A sen B − cos A cos B
h h y
= · − cos A.
b a a
Entonces
h h y h2
cos C = · − cos A ⇔ a cos C = − y cos A.
b a a b
Además nótese que por el Teorema de Pitagoras b2 = x2 + h2 , con lo cual
h2 h2
− (c − x) cos A = − c cos A + x cos A
b b
h2 x
= + x − c cos A
b b
h2 + x2
= − c cos A
b
b2
= − c cos A
b
= b − c cos A.

Por lo tanto, a cos C = b − c cos A, o bien, a cos C + c cos A = b. Luego (2.4) se tiene. Ahora,
cos A = x/b y sen B = y/a, entonces

c = x + y = b cos A + a sen B.

Con lo cual tenemos (2.5). De manera similar a como se demostró (2.4) tenemos que
hh x h2
cos C = sen A sen B − cos A cos B = − cos B ⇔ b cos C = − (c − y) cos B
ab b a
h2
⇔ b cos C + c cos B = + y cos B,
a
y por el Teorema de pitagoras a2 = h2 + y 2 , por consiguiente,
h2 h2 y h2 + y 2
+ y cos B = +y = = a.
a a a a
Por lo tanto,

b cos C + c cos B = a.

74
Como se querı́a demostrar. Demostremos ahora el teorema del coseno. Sean x = cos A,
y = cos B y z = cos C. Entonces el sistema conformado por las ecuaciones (2.4), (2.5) y (2.6)
expresado en forma matricial toma la forma

c 0 a x b
    
 b a 0 y  =  c 
0 c b z a

Sea
 
c 0 a
A =  b a 0 ,
0 c b

entonces det A = 2abc > 0, por lo tanto la matriz A es invertible y por la Regla de Krammer,
D1 D2 D3
x= ,y = ,z = ,
D D D
donde Dj = det Aj , j = 1, 2, 3, D = det A y Aj es la matriz obtenida de A al cambiar su
columna j por el vector columna

b
 

b = c
a

Cuando realizamos los determinantes de las matrices Aj por la primera fila obtenemos

b 0 a
det A1 = c a 0 = bab − a(c2 − a2 ) = a(b2 + c2 − a2 ).

a c b


c b a
det A2 = b c 0 = c(cb) − bb2 + a(ab) = b(c2 − b2 + a2 ).

o a b


c 0 b
det A3 = b a c = c(a2 − c2 ) = c(a2 − c2 + b2 ).

o c a

Entonces
D1 a(b2 + c2 − a2 )
cos A = x = =
D 2abc

75
Con lo cual

2bc cos A = b2 + c2 − a2 ⇔ a2 = b2 + c2 − 2bc cos A

De donde obtenemos (2.7). De manera similar

D2 b(c2 − b2 + a2 )
cos B = y = =
D 2abc
D3 c(b + c2 − a2 )
2
cos C = z = =
D 2abc
De donde se siguen (2.8) y (2.9).

2.5. Problemas

2.6. Taller 1 corte 1 parte 1


Problema 2.6.1. Sea
 
0 2 3 −4 1
0 0 2 3 4
 
A=
2 2 −5 2 4

2 0 −6 9 7

Llevar la matriz A a la (FER). Cuando la matriz ya este en esta forma ubicar la fila que
contiene el 1 que está más hacia la derecha y utilizarlo como pivote para generar ceros en
la columna que lo contiene. Posteriormente, con la fila anterior a esta, realizar el mismo
proceso. Llevar acabo estos pasos las veces que sea necesario hasta obtener la (FERR) de la
matriz A.

Problema 2.6.2. Un jugador tiene un total de 200 fichas para apostar en un casino, las
fichas son de tres colores: amarillo azul y rojo. Ganó $51 con cada ficha de color amarillo,
perdió $15 con cada ficha de color azul y ganó $4 con cada ficha de color rojo. El apostador
término con un total de $152. Si se sabe que la cantidad de fichas rojas es mayor que el
número de fichas amarillas, pero menor que el número de fichas azules, hallar el número
de fichas de cada color que tenı́a el jugador. Sugerencia: Tome como referencia el Ejem-
plo1.10. Para hallar una solución particular de la ecuación Diofántica se pueden consultar
los Ejemplos 1.12 y 1.14 y el Problema 1.5.10.

Problema 2.6.3. Una inversionista afirma a su corredor de bolsa que todas su acciones
son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y que hace 2 dı́as su valor bajó
$350 pero ayer aumentó $600. El corredor recuerda que hace 2 dı́as el precio de las acciones

76
de Delta airlines bajó $1 por acción y el de las de Hilton Hotels $1,50, pero el precio de
las acciones de McDonald’s subió $0,50. También recuerda que ayer el precio de la acciones
Delta subió $1,50 por acción, el de las de Hilton Hotels bajó otros $0,50 por acción y el de
las de McDonald’s subieron $1. Demuestre que el corredor no tiene suficiente información
para calcular el número de acciones que tiene el inversionista en cada compañı́a, pero que si
ella dice que tiene más de 305 acciones de Delta, y más de 79 acciones de Hilton Hotels el
corredor puede calcular exactamente cuantas acciones tiene en cada compañı́a. Sugerencia:
Tome como referencia el Ejemplo 1.10.

Problema 2.6.4. Sea △ el triángulo en el plano con vértices en (x1 , y1 ), (x2 , y2 ) y (x3 , y3 ).
Demuestre que el área del triángulo está dada por

1 x1 y1
1
a(△) = ± 1 x2 y2
2
1 x3 y3

Sugerencia: Con lo demostrado en la sección 2.2 se puede hallar el área de un triángulo con
uno de sus vértices en el origen. Utilice la geometrı́a de la figura 2.3 para hallar el área del
triángulo △P1 P2 P3 en términos de las coordenadas de sus vértices.

y y

P2

P(b, d) P3

Q(a, c)

β
α b b
β
α P1 R1 T1

O
b

R
b

T
x O
x

(a) Triángulo con uno de sus vértices en (b) Triángulo con vértices arbitrarios
el origen

Figura 2.3: El triángulo △OP Q se traslada de tal forma que sus correspondientes vértices
ahora son P1 , P2 y P3 cuyas coordenadas respectivamente son (x1 , y1 ), (x2 , y2 ) y (x3 , y3). El
par de triángulos rectángulos: △OP R, △P1 P2 R1 y △OQT , △P1P3 T1 comparten la misma
hipotenusa, de tal forma que se puede expresar los lados del triángulo △OP Q como función
de las coordenadas de los puntos P1 , P2 y P3 .

Problema 2.6.5. Tres rectas que no son paralelas por pares, determinan un triángulo en el

77
plano. Suponga que las tres rectas están dadas por

a11 x + a12 y + a13 = 0


a21 x + a22 y + a23 = 0
a31 x + a32 y + a33 = 0

Demuestre que área determinada por las rectas es



A11 A12 A13
±1
A21 A22 A23

2A13 A23 A13

A31 A32 A33

Sugerencia: Utilice el Problema 2.6.4.

2.7. Taller 1 corte 1 parte 2


1
Problema 2.7.1. Consideremos la sucesión (An ) donde An = [aij ]n×n con aij = i+j−1 .
llamaremos a cada término de esta sucesión matriz armonica. A partir de la sucesión
(An ) construimos la sucesión en R dada por (Dn ) con Dn = det An . Calcular Dn , y la
inversa de la matriz An .

Problema 2.7.2. Sea (An ) una sucesión de matrices definida como sigue An = [aij ]n×n ,
donde aij = ai−1
j y 1 ≤ i, j ≤ n. Llamaremos a cada elemento de esta sucesión matriz de
Vardermonde (ver el Ejemplo 2.1), y cada elemento de la sucesión en R dada por (Dn )
con Dn := det An , determinante de Vardermonde de tamaño n × n. Defina las matrices
de Vandermonde para n = 2 y n = 4 y calcule sus respectivos determinantes. Conjeture
una fórmula para calcular Dn y demuestrela utilizando inducción matemática, exprese dicha
fórmula usando el sı́mbolo de productoria.

Problema 2.7.3. Si A ∈ Mn×n (R), A = [aij ]n×n , la matriz B := [bij ]n×n donde bij = aji es
llamada matriz transpuesta de A, escribimos B = At .

Una matriz A ∈ Mn×n (R) tal que At = −A es llamada matriz antisimétrica.

Una matriz invertible A ∈ Mn×n (R) tal que At = A−1 es llamada matriz ortogonal.

Demuestre que

(a) det A = det At .

(b) det(αA) = αn det A para toda matriz A ∈ Mn×n (R), todo escalar α y n = 1, 2, . . . ,

(c) det At = (−1)n det A para todo n = 1, 2 . . . , si A es antisimétrica.

78
(d) Si A ∈ Mn×n (R) es antisimétrica y n es impar, entonces det A = 0

(e) det A = ±1 si A es ortogonal.

Problema 2.7.4. Demuestre que para cualquier matriz cuadrada A se tiene que

(a) A + At es simétrica

(b) A − At es antisimétrica

Problema 2.7.5. Demuestre que toda matriz cuadrada A se puede escribir de manera única
en la forma A = S + K donde S es simétrica y K antisimétrica.

Problema 2.7.6 (***). Sea A una matriz estrictamente triangular superior. Demuestre que
I − A es invertible y exprese su inversa en función de A.

Problema 2.7.7 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m y la
parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta completa
cada 20s, determine el vector posición de una persona que va sentada en la rueda. Suponga
que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta moviendo
la persona?

79
Capı́tulo 3

Vectores en Rn

Definición 3.0.1. Definimos el espacio Euclideo de n dimensiones como el producto


cartesiano del conjunto R de números reales con sigo mismo n veces, esto es,

Rn = R × · · · × R
= {(x1 , x2 , . . . , xn ) : xi ∈ R, 1 ≤ i ≤ n} .

Estudiaremos especialmente el plano xy, esto es

R2 = {(x, y) : x, y ∈ R} ,

y el espacio

R3 = {(x, y, z) : x, y, z ∈ R} ,

3.1. Vectores en el plano enfoque analı́tico


Definición 3.1.1. Definimos un vector de R2 como una pareja ordenada de números reales,
esto es,

A = (Ax , Ay ).

Al escalar Ax se le llama componente en x del vector A, y a Ay componente en y. La


dirección del vector se define como el ángulo θ que forma el vector con el eje x medido en
el sentido contrario de las manecillas del reloj. (Ver Figura 3.1). La magnitud del vector se
denota por kAk y está dada por
q
kAk = A2x + A2y .

80
y
A

kAk
Ay
θ
x
O Ax

Figura 3.1: Dirección y magnitud de un vector

Definición 3.1.2 (Igualdad de vectores). Dos vectores A = (Ax , Ay ) y B = (Bx , By ) son


iguales si y sólo si son iguales componente a componente, esto es,
A = B ⇔ Ax = Bx y Ay = By .
Definición 3.1.3 (Adición de vectores). Sean A = (Ax , Ay ) y B = (Bx , By ) dos vectores de
R2 . La suma vectorial entre los vectores A y B se define como
A + B = (Ax + Bx , Ay + By ).
Definición 3.1.4 (Multiplicación por escalar). Definimos la multiplicación por escalar entre
el vector A = (Ax , Ay ) y el escalar k como
kA = k(Ax , Ay ) = (kAx , kAy ).
Utilizando la suma y multiplicación por escalar de vectores tenemos que para todo vector
A = (Ax , Ay ), se cumple que
A = (Ax , Ay ) = Ax (1, 0) + Ay (0, 1).
Los vectores i := (1, 0) y j := (0, 1), son llamados vectores coordenados unitarios.
Usando estos vectores podemos expresar el vector A como una suma de sus componentes
Ax = kAk cos θ, Ay = kAk sen θ,
tenemos que
A = kAk cos θi + kAk sen θj.
La expresión anterior se conoce como forma polar del vector A.

A continuación enunciamos las propiedades la suma y multiplicación por escalar de vec-


tores

81
Teorema 3.1.1 (Propiedades de los vectores). Sean A, B y C tres vectores de R2 y α, β ∈ R.
Entonces

(a) A + B = B + A.

(b) A + (B + C) = (A + B) + C.

(c) A + 0 = A, A + (−A) = 0. Aquı́, 0 = (0, 0) es el vector cero, elemento neutro de R2 .

(d) α(A + B) = αA + αB.

(e) (α + β)A = αA + βA.

Las propiedades de la norma o magnitud de un vector se dan en el siguiente resultado

Teorema 3.1.2 (Propiedades de la norma). Sean A y B vectores de R2 y k un escalar.


Entonces

(a) kAk ≥ 0 (Positividad)


(b) kAk = 0 ⇔ A = 0
(c) kkAk = |k|kAk (Propiedad homogénea)
(d) kA + Bk ≤ kAk + kBk (Desigualdad triangular)

3.2. Vectores en el plano enfoque geométrico


3.2.1. Vector resultante
A la adicción vectorial de los vectores

A = Ax i + Ay j, B = Bx i + By j,

se le conoce como vector resultante, esto es,

R = (Rx , Ry ) = (Ax + Bx )i + (Ay + By )j.

Podemos hallar la dirección del vector resultante en términos de las componentes de los
vectores A y B con la fórmula
   
Ry Ay + By
arctan = arctan .
Rx Ax + Bx
Para graficar el vector resultante trasladamos el vector B, respetando magnitud y direc-
ción de tal forma que su punto inicial coincida con el punto final de A, luego hacemos lo
mismo con el vector A (figura 3.2) generando de esta forma un paralelogramo, cuya diagonal

82
representa el vector resultante R. Esta interpretación de la suma vectorial es conocida como
regla del paralelogramo. Si tenemos las componentes de los vectores A y B podemos
hallar la magnitud del vector resultante con la fórmula
q
kRk = (Ax + Bx )2 + (Ay + By )2 .

4
y

B
2
By R
Ry
1

Ay A
0
x
O
Ax Bx
-1

Rx
-2
-2 -1 0 1 2 3 4 5

Figura 3.2: Construcción geométrica para la suma de dos vectores

Ahora si tenemos las magnitudes y direcciones de los vectores A y B, expresando los vec-
tores en la forma polar podemos encontrar una fórmula para la magnitud de R dependiendo
de dichas magnitudes y direcciones. En efecto, si α y β son direcciones de los vectores A y
B respectivamente, tenemos que

A = kAk cos αi + kAk sen αj, B = kBk cos βi + kBk sen βj.

Con lo cual,

kRk2 = (kAk cos α + kBk cos β)2 + (kAk sen α + kBk sen β)2
= kAk2 cos2 α + 2kAkkBk cos α cos β + kBk2 cos2 β
+ kAk2 sen2 α + 2kAkkBk sen α sen β + kBk2 sen2 β
= kAk2 + kBk2 + 2kAkkBk(cos α cos β + sen α sen β)
= kAk2 + kBk2 + 2kAkkBk cos(α − β)
= kAk2 + kBk2 + 2kAkkBk cos θ.

83
Donde θ = α − β es el ángulo entre A y B.

En el problema 4.14.21 se pide encontrar esta fórmula usando el teorema del coseno.

3.3. Diferencia entre vectores y vectores geométricos


Sean A y B vectores de R2 cuyos puntos iniciales coinciden en el origen O ver (figura
3.3).

−→
A AB
B

x
O

Figura 3.3: El vector que va del punto A a el punto B es igual a B − A

El vector con punto inicial en A y punto final en B es llamado vector diferencia. Vemos
−→
que el vector B resulta de la suma entre los vectores A y AB, esto es,
−→
A+ AB= B.

Entonces por el Teorema 3.1.1 tenemos que


−→ −→
A+ AB= B ⇔ −A + (A+ AB) = −A + B
−→
⇔ (−A + A)+ AB= B − A
−→
⇔ 0+ AB= B − A
−→
⇔AB= B − A.

Una interpretación similar nos permite concluir que


−→
BA= A − B.
−→
El vector AB= B−A, también es llamado vector geométrico. Los vectores geométricos son
especialmente útiles para representar magnitudes fı́sicas tales como fuerzas, desplazamientos,

84
velocidades, y aceleraciones, las cuales poseen magnitud y dirección. Lo que mide la flecha
indica la magnitud y la punta de la flecha indica la dirección.

Supongamos que introducimos un sistema de coordenadas con origen O. En la figura 3.4


−→ −→
se muestran dos vectores geométricos AB y CD que tienen la misma dirección y magnitud.

y
D
d2 − c2
C θ
d1 − c1
B
b 2 − a2
A θ
b 1 − a1
x
O

−→ −→
Figura 3.4: AB y CD representan vectores geométricos equivalentes.

Tenemos que
b1 − a1 d 1 − c1
cos θ = = ,
kB − Ak kD − Ck

Dado que kB − Ak = kD − Ck, nos da que b1 − a1 = d1 − c1 . De manera análoga vemos que


b2 − a2 = d2 − c2 . Entonces, de acuerdo a la definición 3.1.2 encontramos que
−→ −→
AB=CD ⇔ B − A = D − C.

Llamamos a tales vectores geométricos equivalentes. En fı́sica se utiliza la noción de vectores


equivalentes para definir la igualdad entre vectores.

Cuando el punto inicial de un vector geométrico coincide con el origen y el punto final
A tiene coordenadas (a, b) tenemos que
−→
OA= A − 0 = (a, b) − (0,0) = (a, b) = A.
−→
Por es razón escribimos A en lugar de OA. Este hecho tiene importantes repercusiones, ya
que nos dice que las componentes de cualquier vector A son las mismas de cualquier vector
geométrico equivalente a el.

85
y
D
d2 − c2
C θ
d1 − c1

A = (a, b)

θ
x
O

Figura 3.5: Un vector geométrico cuyo punto inicial coincide con el origen tiene las mismas
componentes que cualquier vector que tenga la misma magnitud y dirección.

Por ejemplo, en la figura 3.5 vemos que a = d1 − c1 y b = d2 − c2 , de modo que


−→
A =CD (3.1)

Problema 3.3.1 (Velocidad verdadera de un avión). Un avión vuela por un viento que fluye
con una rapidez de 55mi/h en la dirección N 30◦ E. El avión tiene una rapidez de 765mi/h
respecto al aire, y el piloto dirige son avión en la dirección N 45◦ E.

(a) Halle la velocidad del viento, en términos de los vectores coordenados unitarios.

(b) Halle la velocidad del avión con respecto al aire, en términos de los vectores coordenados
unitarios.

(c) Halle la velocidad del avión con respecto a la tierra, en términos de los vectores coor-
denados unitarios.

(d) Determine la rapidez y dirección verdaderas del avión.

Solución. El vector A denota la velocidad del viento y el vector B, define la velocidad del
avión respecto al viento. Esta velocidad queda completamente determinada, conociendo sus
componentes, o bien su magnitud y dirección. En este contexto, la magnitud de la velocidad
define la rapidez de la partı́cula. La frase: velocidad del avión respecto al viento,
se refiere a la velocidad que mide el piloto, esta es la velocidad relativa al piloto, dicha
velocidad es distinta a la que mide una persona en tierra, lo cual tiene que contemplar el
efecto del viento sobre el avión. La velocidad del avión respecto a la tierra, también se conoce
como velocidad verdadera del avión.

86
y y B
N

A
O E

S
A

O
x O
x

(a) Viento cruzado en dirección N 30◦ E (b) Los vectores A y B coincidiendo en P

Figura 3.6: Movimiento relativo de un avión

En la figura 3.6(a) se muestran varias representaciones del vector A, con el fin de facilitar
el calculo de las componentes de este vector consideramos el vector geométrico cuyo punto
inicial coincide con el origen el cual es llamado vector de posición. Diremos que un vector
está en posición normal cuando su punto inicial coincide con el origen. En la figura 3.7(a)
se muestra la magnitud y dirección del vector A.

y y
N
kBk = 765

O E

kAk = 55

60◦ 45◦

O
x O
x

(a) Vector A en posición normal (b) Vector B en posición normal

Figura 3.7: Dado que fluye un viento en dirección N 30◦ E, la dirección del vector A es 60◦ .

Teniendo la magnitud y dirección del vector A, podemos hallar sus componentes:


Ax = kAk cos α = 55 cos 60◦ = 55/2

Ay = kAk sen α = 55 sen 60◦ = 55 3/2.
Por lo tanto, la velocidad del viento en términos de los vectores coordenados unitarios es
√ √
A = (55/2, 55 3/2) = (55/2)i + (55 3/2)j.

87
Como la rapidez del avión respecto al aire es 765mi/h, tenemos que kBk = 765, además
el piloto dirige el avión en la dirección N 45◦ E (es común, referirse a este ángulo como
enfilamiento o curso relativo del avión), por lo que la dirección del vector B es β =
90◦ − 45◦ = 45◦ (ver figura 3.7(b)). De modo que las componentes de la velocidad del avión
respecto al aire son:

Bx = kBk cos β = 765 cos 45◦ = 765 2/2

By = kBk sen β = 765 cos 45◦ = 765 2/2.

ası́, el vector en términos de los vectores coordenados unitarios viene dado por
√ √ √ √
B = (765 2/2, 765 2/2) = (765 2/2)i + (765 2/2)j.

Por efecto del viento, al avión experimenta un leve corrimiento hacia el norte (ver figura
3.8(b)) este movimiento es imperceptible para el piloto, pero puede ser detectado por una
persona en tierra, la cual registrarı́a la información que se muestra en la figura 3.8(a) sobre
el avión.

y y
R

kRk = 818, 25

46◦

O
x O
x

(a) Magnitud y dirección verdaderas de (b) Suma vectorial entre A y B


la velocidad del avión

Figura 3.8: La representación gráfica de la magnitud y dirección verdaderas del avión, se


lleva acabo mediante la ley del paralelogramo: para graficar el vector resultante de la suma
vectorial de los vectores A y B, trasladamos el vector B respetando magnitud y dirección,
de tal forma que el punto inicial coincida con el punto final de A. La resultante viene dada
entonces por el vector geométrico que va del punto en que coinciden A y B a el punto final
del vector B trasladado.

Para encontrar estas cantidades: magnitud y dirección verdaderas del avión, se deben

88
encontrar las componentes del vector resultante.

Rx = Ax + Bx = 55/2 + 765 2/2 = 568, 44
√ √
Ry = Ay + By = (55/2) 3 + 765 2/2 = 588, 57.

Con lo cual, la velocidad verdadera del avión en término de los vectores coordenados unitarios
es
 √   √ √ 
R = 55/2 + 765 2/2 i + (55/2) 3 + 765 2/2 j.

La rapidez del avión medida desde la tierra es entonces


q p
kRk = Rx2 + Ry2 = 568, 442 + 588, 572 = 818, 25mi/h.

Si denotamos por φ, a la dirección verdadera del avión, tenemos que


Ry 588, 57
tan φ = = ,
Rx 568, 44

de donde φ = arctan (588, 57/568, 44) = 45,996◦ ≈ 46◦ . La dirección, o curso verdadero del
avión, medida desde el norte es entonces N 44◦ E.
La magnitud y dirección verdaderas de la velocidad del avión, pueden ser obtenidas
directamente de los datos del problema. Con la fórmula:

kRk2 = kAk2 + kBk2 + 2kAkkBk cos θ,

donde θ = α − β es el ángulo entre A y B, obtenemos la rapidez verdadera del avión

kRk2 = 552 + 7652 + 2 · 55 · 765 cos(60 − 45) = 6,6953 · 105 ,


p
con lo cual, kRk = 6,6953 · 105 = 818,25. La dirección de R por lo general se encuentra
por medio del Teorema del seno o el coseno. Con los puntos finales de los vectores
−→ −→ −→
A =OA, B =OB y R =OR

formamos el paralelogramo OARB (ver figura 3.9(a)). Como ∠AOB = 60◦ − 45◦ = 15◦ y
los ángulos opuestos de un paralelogramo son iguales y suman 360◦ tenemos que

2∠AOB + 2∠OBR = 360◦ ⇔ 30◦ + 2∠OBR = 360◦ ⇔ ∠OBR = 165◦ .

89
y y
R R

A A

O
x O
x

(a) Paralelogramo generado por A y B (b) Triángulo generado por los vectores
A, B y R

Figura 3.9: La dirección del vector resultante puede ser obtenida mediante la aplicación del
Teorema del seno, si se conocen las magnitudes y direcciones de los vectores A y B

Al trazar la diagonal principal del paralelogramo, generamos el triángulo △OAR, cuyos


lados vienen dados por las respectivas magnitudes de los vectores A, B y R (ver figura
3.9(b)). De este triángulo tenemos además el ángulo ∠OAR = ∠OBR = 165◦ . Entonces por
el Teorema del seno
sen 165◦ sen ∠AOR
=
kRk kBk

Con lo cual,

kBk 765
sen ∠AOR = sen 165◦ = 0,25882 = 0,24198.
kRk 818,25

Ası́, ∠AOR = arc sen(0,24198) = 14,003◦. Por lo tanto, la dirección del vector R, es φ =
60◦ − 14,003◦ = 45,997◦ ≈ 46◦ .

Paralelismo y ortogonalidad de vectores


Dos vectores A y B de R2 son paralelos si el primero se puede expresar como un múltiplo
escalar del segundo, es decir

Definición 3.3.1 (Vectores paralelos). Sean A y B dos vectores de R2 . El vector A es


paralelo a el vector B lo cual se denota por A k B si y solo si existe k ∈ R tal que A = kB.

90
Para obtener un criterio que nos permita saber cuando dos vectores son ortogonales,
utilizaremos el producto punto, o producto escalar, el cual fue introducido en la subsección
1.6.3. Primero que todo debemos notar que si A = (x, y) ∈ R2 , entonces

A · A = x2 + y 2 = kAk2 .

Demostramos que
Teorema 3.3.2. Si A ∈ R2 , entonces

kAk2 = A · A.

Ahora utilizaremos el Teorema del coseno para demostrar que


Teorema 3.3.3. Sean A y B son vectores de R2 , entonces

A · B = kAkkBk cos θ, (3.2)

donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.
Demostración. Aplicando el Teorema del coseno al triángulo que se muestra en la figura 3.3

−→
A AB
B
θ

x
O

obtenemos

kB − Ak2 = kAk2 + kBk2 − 2kAkkBk cos θ, (3.3)

donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Ahora, dado que el producto punto es conmutativo y distributivo
respecto a la suma de vectores, por el Teorema 3.3.2 tenemos que

kB − Ak2 = (B − A) · (B − A)
= B · B − 2B · A + A · A
= kBk2 − 2A · B + kAk2 .

91
Por lo tanto, tenemos que

kAk2 − 2A · B + kBk2 = kAk2 + kBk2 − 2kAkkBk cos θ

Sumando el término −(kAk2 + kBk2 ) en ambos lados de la ecuación anterior y luego multi-
plicando por 1/2 obtenemos (3.2).

Nótese que (3.3) permite calcular la magnitud del vector diferencia.

Además, de (3.2) podemos concluir que

A · B = 0 ⇔ si solo si θ = π/2.

Es decir, dos vectores no nulos A y B son ortogonales si solo si A · B = 0. Tenemos entonces


el siguiente resultado

Teorema 3.3.4 (Vectores ortogonales). Dos vectores no nulos A y B son ortogonales si


solo si A · B = 0

Con lo fórmula (3.2) podemos calcular el ángulo entre vectores.

Teorema 3.3.5 (Ángulo entre vectores). Si θ denota el ángulo más pequeño que hay entre
dos vectores no nulos A y B medido en el sentido contrario de las manecillas del reloj,
entonces
A·B A B
cos θ = = · . (3.4)
kAkkBk kAk kBk
Ejemplo 3.1. Utilice el producto punto para demostrar las siguientes identidades

(a) cos(α − β) = cos α cos β + sen α sen β.

(b) cos(α + β) = cos α cos β − sen α sen β.

(c) sen(α − β) = sen α cos β − sen β cos α.

(d) sen(α + β) = sen α cos β + sen β cos α.

Solución. Sean A y B vectores unitarios cuyas direcciones están dadas por los ángulos α y
β respectivamente. Entonces para el vector A tenemos que

Ax = kAk cos α = cos α


Ay = kAk sen α = sen α,

de modo que

A = cos αi + sen αj = (cos α, sen α).

92
De la misma forma, vemos que
B = cos βi + sen βj = (cos β, sen β).

A
β

α
x

Figura 3.10: Todo vector unitario u cuya dirección está dada por un ángulo θ se puede
expresar en la forma u = cos θi + sen θj

Como se ve en la figura 3.10, el ángulo entre los vectores unitarios A y B es θ = β − α.


Por lo tanto, por la fórmula (3.2) encontramos que
(cos α, sen α) · (cos β, sen β) = 1 · 1 cos(β − α).
O de manera equivalente,
cos(β − α) = cos(α − β) = cos α cos β + sen α sen β.
Con cual, tenemos (a).

Ahora, dado que la función coseno es par, y la función seno es impar, aplicando en inciso
(a) tenemos que
cos(α + β) = cos(α − (−β)) = cos α cos(−β) + sen α sen(−β).
= cos α cos β − sen α sen β.
Para obtener (c), rotamos el vector A de la figura 3.10 un ángulo de 90 grados en dirección
contraria de las manecillas del reloj, sin cambiar su magnitud, de tal forma que generamos
un vector C que también es unitario pero cuya dirección es α + π/2 (ver figura 3.11). Por lo
tanto sus componentes son
Cx = kCk cos(α + π/2) = − sen α
Cy = kCk sen(α + π/2) = cos α,

93
Nótese que en las fórmulas anteriores para hallar la componente en x del vector C usamos
(b) con β = π/2. Y para hallar la componente en y, usamos la identidad fundamental:

p √
sen(α + π/2) = 1 − cos2 (α + π/2) = 1 − sen2 α = cos α.

B A
π/2

α
x

Figura 3.11: Utilización del propucto punto para hallar una fórmula para el seno de la suma
de la de ángulos

Ahora bien, dado que el ángulo entre los vectores B y C es θ = β−(π/2+α) = β−α−π/2,
por (3.2) tenemos que

(cos β, sen β) · (− sen α, cos α) = 1 · 1 cos(β − α − π/2).

Que equivale a

− sen α cos β + sen β cos α = sen(β − α)

Al multiplicar por (−1) la identidad anterior obtenemos (c).


La identidad (d) se deduce de la identidad (c) de manera análoga como se demostró la
identidad (b) a partir de la (a).

3.4. Desigualdad triangular


Consideremos dos vectores A y B que coinciden en un punto O como se muestra en la
figura 3.12.

94
B R

O A

−→ −→ −→
Figura 3.12: Las magnitudes de los vectores geométricos OA= A, OB= B y OR= R son los
lados del triángulo △OAR. Para que estas tres normas conformen los lados de un triángulo
se debe cumplir la relación kAk + kBk ≥ kA + Bk, conocida como desigualdad triangular

Unos de los principales postulados de la geometrı́a Euclidiana afirma que la menor dis-
tancia entre dos puntos es la recta, es decir, que toma menos tiempo ir del punto O al R,
que de el punto O al punto A y luego al R. En términos de vectores, esto se expresa con la
relación
kAk + kBk ≥ kA + Bk (3.5)
que se conoce como desigualdad triangular. La desigualdad triangular es una consecuencia
de la desigualdad de Cauchy-Schwarz (desigualdad de C-S). La cual establece que
|X · Y | ≤ kXkkY k,
para vectores X = (a1 , a2 , . . . , an ), Y = (b1 , b2 , . . . , bn ) en Rn . Este hecho se demuestra de
forma general en la sección 4.17. Para el caso de R2 , este resultado puede ser obtenido como
un consecuencia del Teorema 3.3.3, ya que, para todo θ tenemos que | cos θ| ≤ 1, con lo cual,
|A · B| = |kAkkBk cos θ| = kAkkBk| cos θ| ≤ kAkkBk.
Es decir,
|A · B| ≤ kAkkBk. (3.6)
Ahora podemos establecer que
Teorema 3.4.1. Si A y B son vectores de R2 . Entonces
kAk + kBk ≥ kA + Bk
Demostración. Como kAk2 = A · A, tenemos que
kA + Bk2 = (A + B) · (A + B)
= A · A + 2A · B + B · B (Ley conmutativa y distridutiva)
2 2
= kAk + 2A · B + kBk
≤ kAk2 + 2kAk · kBk + kBk2 (Desigualdad de C-S)
= (kAk + kBk)2

95
√ √
Se sigue la desigualdad triangular de la propiedad: 0 ≤ x ≤ y ⇒ x≤ y para números
reales x, y.

Teorema 3.4.2. Si A y B son vectores de R2 . Entonces

kAk − kBk ≤ kA − Bk

Demostración. Por la desigualdad triangular

kAk = kA − B + Bk ≤ kA − Bk + kBk

Esto es, kAk − kBk ≤ kA − Bk.

3.5. Movimiento relativo


A continuación ilustraremos con un ejemplo el uso de los vectores para describir como
están relacionadas entre sı́ las mediciones realizadas por observadores que las calculan desde
distintos marcos de referencia. Un ejemplo clásico de este tipo de movimiento, llamado
movimiento relativo es el movimiento de un avión, que puede tener una velocidad v
en relación con el aire, en este caso una persona que está en la tierra medirá una velocidad
distinta a la del piloto, dependiendo de la dirección y magnitud de v.

Problema 3.5.1. Un piloto tiene que volar hacia el este de A a B y después regresar hacia
el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto a
la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.

(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c

(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2

(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2

(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?

96
Realizar las gráficas correspondientes para ilustrar la situación.
Solución. Resolveremos solo el caso 1 del inciso (b), y el caso 1 del inciso (c). El resto se
deja como ejercicio (ver el problema 4.15.7).

Denotemos por C a el vector que representa la velocidad del avión respecto a el aire, esto
es, la velocidad que mide el piloto. Y denotemos por D el vector que representa la velocidad
del aire con respecto a la tierra, es decir la velocidad del viento que mide una persona que
está estacionaria en el tierra.
N N

Ab b
D C Bb
Ab
C b
D Bb

E E

S S
(a) Para el viaje de ida, un observador en tierra (b) Para el viaje de venida, dado que el viento es
mide la misma dirección de la velocidad del viento contrario a la dirección del movimiento del avión,
que el piloto, pero como existe un viento hacia el un observador en tierra calcula que la rapidez del
este, el observador en tierra calcula que la rapidez avión es c − v.
del avión es c + v.

Figura 3.13: Movimiento de un avión cuando prevalece un viento hacia el este

Suponemos como caso 1, que la dirección del vector D es hacia el este en el viaje de ida
y de venida. En el viaje de ida. La dirección que mide el piloto para el vector C es α = 0,
además, la magnitud es kCk = c, por lo tanto,

Cx = c cos 0 = c, Cy = c sen 0 = 0,

con lo cual,

C = (c, 0).

De forma análoga, encontramos que

D = (v, 0).

En consecuencia, la velocidad en el viaje de ida (ver figura 3.13(a)) que mide un observador
en tierra es

RAB = C + D = (c + v, 0).

97
Vemos de esta forma, que desde la perspectiva de un observador en tierra la rapidez del
avión en el viaje de ida es kRAB k = c + v. Y dado que cuando dicha rapidez es constante,
según la ecuación 4.16 con x0 = 0 es igual a distancia sobre tiempo, tenemos que el tiempo
tAB que tarda el avión en ir desde A hasta B es
l
tAB = .
c+v
Ahora, para el viaje de vuelta el vector D mantiene su dirección y magnitud (ver figura
3.13(b)). Sin embargo, el vector C a pesar de mantener su magnitud invierte su dirección,
esto es, la velocidad que mide el piloto para el viaje de vuelta es,

C = (c cos π, c sen π) = (−c, 0).

Por lo que para un observador en tierra el velocidad en el viaje de vuelta es

RBA = −C + D = (v − c, 0).

Además, Por el inciso (d) c > v, ası́, la rapidez del avión en el viaje de vuelta para un
observador en tierra es

kRBA k = |v − c| = c − v.

Con lo cual,
l
tBA = .
c−v
Concluimos de esta forma, que el tiempo necesario para completar un viaje redondo es

tE = tAB + tBA
l l
= +
c+v c−v
(c − v)l + (c + v)l
=
c2 − v 2
2cl
= 2
c − v2
2l/c
=
1 − v 2 /c2
t0
= .
1 − v 2 /c2

Ahora, supongamos que prevalece un viento hacia el norte. En este caso, si el piloto dirige
el avión en el segmento que va desde el punto A hasta el punto B, un observador en tierra

98
verı́a que el avión sigue la dirección noreste, ya que prevalece un viento hacia el norte. Por
lo tanto, el piloto debe enfilar el avión en la dirección sureste, con cierta inclinación medida
a partir del sur, que depende de la magnitud del vector D, para que un observador en tierra
vea que el avión sigue exactamente la dirección del segmento AB

N N
√ √
Ab b
c2 − v 2 B
b
Ab
c2 − v 2
b
Bb

c v v c

E E

S S
(a) El piloto debe enfilar el avión en dirección sur- (b) En el viaje de vuelta, el piloto debe enfilar el
este, para que un observador en tierra vea que el avión en dirección suroeste, para que un observador
avión sigue el segmento AB en tierra vea que el avión sigue el segmento BA

Figura 3.14: Movimiento de un avión cuando prevalece un viento hacia el norte

En la figura 3.14(a) se muestra la velocidad del avión en azul, desde el punto de vista del
piloto. La velocidad del aire se muestra en verde. La velocidad del avión calculada por un
observador en tierra es entonces

RAB = C + D.

Observese que los tres vectores el ecuación anterior se relacionan según el triángulo que
muestra en la figura 3.14(a), y dado que el vector D es ortogonal a el vector RAB , dicho
triángulo es rectángulo. Por lo tanto, por el Teorema de Pitagoras

kRAB k = c2 − v 2 .

Ahora podemos calcular el tiempo que tarda el avión en ir desde el punto A hasta el punto
B,
l
tAB = √ .
c2 − v 2
Para el viaje de vuelta, el piloto debe enfilar el avión en la dirección sur oeste (ver figura
3.14(b)), y entonces un observador en tierra verı́a que el avión sigue el segmento de recta
BA calculando que el tiempo en recorrerlo es
l
tBA = √ .
c2 − v 2

99
Con lo cual, finalmente obtenemos que
2l t0
tN = tAB + tBA = √ =p .
c2 − v 2 1 − v 2 /c2

3.5.1. Vector proyección


Sean A y B vectores no nulos de R2 . Queremos hallar un escalar t que nos permita
encontrar el vector tB, el cual tiene la misma dirección de B y es llamado proyección de
A sobre B.

y y

A A

θ
θ B
x x
O B O
tB tB

(a) t > 0, A · B > 0 (b) t < 0, A · B < 0

Figura 3.15: Vector proyección

Como se muestra en la figura 3.15 el escalar t puede ser positivo o negativo dependiendo
del ángulo θ que hay entre A y B. Supongamos primero que 0 ≤ θ ≤ π/2 de tal forma que
t > 0. En la figura 3.15(a) vemos que
ktBk
cos θ = .
kAk
Dado que t > 0, por el Teorema 3.1.2 inciso (c),

ktBk = |t|kBk = tkBk

Por lo tanto,
tkBk
cos θ = ,
kAk

100
de donde despejando t obtenemos
kAk cos θ
t= .
kBk
Por otro lado, por el Teorema 3.2

A · B = kAkkBk cos θ,

o bien,
A·B
kAk cos θ =
kBk
Por consiguiente,
A·B
t= .
kBk2
Tenemos entonces la siguiente definición
Definición 3.5.1 (Vector proyección). Sean A y B vectores no nulos de R2 . La proyección
de A sobre B se denota por ProyB A y define como el vector
A·B
ProyB A = B.
kBk2

Propiedades del vector proyección


Resumimos las propiedades del vector proyección en el siguiente resultado.
Teorema 3.5.2. Sean A, B y C vectores no nulos de R2 . Entonces
(a) ProyB A es paralelo a B.

(b) A − ProyB A es ortogonal a B.

(c) El vector proyección cumple las propiedades linealidad :

ProyB (αA) = α ProyB A


ProyC (A + B) = ProyC A + ProyC B.

(d) Proy−B A = ProyB A.

(e) La magnitud del vector proyección es llamada proyección escalar y está dada por
|A · B|
k ProyB Ak = .
kBk

101
Capı́tulo 4

Nociones de cálculo integral

4.1. Área bajo la curva


En esta sección se pretende encontrar una expresión para el área bajo la curva de la
función y = f (x) entre x = a y y = b. Consideremos primero en caso en que f (x) > 0 para
a ≤ x ≤ b, e intentemos aproximar el área bajo f por exceso por medio de rectángulos. Para
tal fin hagamos una partición regular(ver figura 4.1)

y = f (x)

x
a = x0 x1 ··· xi−1 xi ··· xn = b

Figura 4.1: Aproximación por exceso

102
del intervalo [a, b] en n subintervalos

[x0 , x1 ], [x1 , x2 ], . . . , [xn−1 , xn ],

cada rectángulo tiene por base


b−a
∆x = ,
n
por lo tanto, una aproximación del área A bajo la función f es
n
X
A ≈ ∆xf (x1 ) + ∆xf (x2 ) + · · · + ∆xf (xn ) = ∆xf (xi ).
i=1

Está claro que esta aproximación mejora cuando n → ∞. Por lo tanto tenemos
n
X
A = lı́m ∆xf (xi ). (4.1)
n→∞
i=1

Ahora observese que

x0 = a, x1 = a + ∆x, x2 = a + 2∆x, x3 = a + 3∆x, . . . ,

es decir, xi = a + i∆x, 0 ≤ i ≤ n.

El método mediante el cual se obtuvo la fórmula (4.1), es un caso particular de una


técnica desarrollada por los griegos hace más de 2000 años, conocida como método de
exhaución. Ilustramos esta técnica en el siguiente ejemplo.

Ejemplo 4.1. Sea An el área de un polı́gono de n lados iguales, inscrito un circulo de radio
r. Al dividir el polı́gono en n triángulos congruentes con un ángulo central 2π/n, demuestre
que

1 2π
(a) An = nr 2 sen
2 n
(b) lı́m An = πr 2
n→∞

Solución. Basaremos nuestra demostración en el siguiente resultado de cálculo diferencial


Teorema 4.1.1 (Continuidad secuencial). Una función f : D ⊆ R → R es continua en
x0 ∈ D si y sólo si

xn → x0 implica que f (xn ) → f (x0 ).

103
Al trazar la altura h de uno de los n triángulos que conforman el polı́gono de n lados de
longitud L, obtenemos un triángulo rectángulo de hipotenusa r y ángulo central
1 2π π
θ= · = ,
2 n n
ver la figura

L/2

r h
θ

L/2
Tenemos que cos θ = h/r y sen θ = . Por lo tanto, el área de uno de los triángulos
r
que conforman el polı́gono es
Lh 1 1 1 1 2π
A= = (r cos θ)(2r sen θ) = r 2 (2 sen θ cos θ) = r 2 sen 2θ = r 2 sen .
2 2 2 2 2 n
Con lo cual, el área An del polı́gono está dada por
1 2π
An = nr 2 sen
2 n
Ahora puesto que
sen x
→ 1 cuando x → 0,
x
la función
 sen x , si x 6= 0,

f (x) := x
1, si x = 0,

es continua en x = 0. Además, xn = → 0 cuando n → ∞. Entonces por el Teorema 4.1.1
n
f (xn ) → f (0) = 1. Lo cual implica que

n 2π sen
lı́m sen = lı́m n = 1.
n→∞ 2π n n→∞ 2π
n
Finalmente,
1 2 2π n 2π
lı́m An = lı́m nr sen = πr 2 lı́m sen = πr 2 · 1 = πr 2
n→∞ n→∞ 2 n n→∞ 2π n

104
4.2. Integral definida
En la sección 4.1 se aproximo el área bajo la gráfica de una función continua y = f (x)
desde x = a hasta x = b por exceso. Sin embargo, se puede demostrar que el valor de A en
(4.1) no cambia cuando tomamos los extremos izquierdos de cada subintervalo, esto es, la
aproximación se hace por defecto

n−1
X n
X
A = lı́m ∆xf (xi ) = lı́m ∆xf (xi−1 ). (4.2)
n→∞ n→∞
i=0 i=1

De hecho, en lugar de usar los extremos izquierdos o derechos, podrı́amos tomar la altura
del i-esimo rectángulo como el valor de f en cualquier número x∗i en el i-esimo subintervalo
[xi−1 , xi ]. A los números x∗1 , . . . , x∗n se les llama puntos de muestra. Podemos calcular el
valor del área usando estos puntos
n
X
A = lı́m ∆xf (x∗i ). (4.3)
n→∞
i=1

A el valor común del área A obtenido en (4.1), (4.2) y (4.3), se el denota por
Z b
f (x)dx,
a

que se lee, integral definida de f , desde a hasta b. En resumen

Definición 4.2.1 (Integral definida). Si f es una función continua en el intervalo [a, b],
el cual dividimos en n subintervalos de igual ancho ∆x = (b − a)/n. Denotamos con x0 =
a, x1 , . . . , xn = b los puntos extremos de estos subintervalos y elegimos los puntos de muestra
x∗1 , . . . , x∗n en cada uno de estos subintervalos, de modo que x∗i se encuentre en el i-esimo
subintervalo [xi−1 , xi ]. Entonces integral definida de f , desde a hasta b, es
Z b n
X
f (x)dx = lı́m ∆xf (x∗i ). (4.4)
a n→∞
i=1

La suma en (4.4) se conoce como suma de Riemann. Sabemos que si es f es no negativa


en [a, b], esta suma de Riemann es una aproximación del área bajo la función en [a, b]. Y la
Z b
integral definida f (x)dx da el valor exacto de esta área.
a
Z π/2
Ejemplo 4.2. Usar sumas de Riemann para calcular cos x dx.
0

105
Solución. Partamos de la identidad

2 sen B cos A = sen(A + B) − sen(A − B). (4.5)


x
Tomemos B = , A = ix. Entonces
2
x x x x x
2 sen cos ix = sen(ix + ) − sen(ix − ) = sen(2i + 1) − sen(2i − 1) .
2 2 2 2 2
x x
Definamos ai = sen(2i + 1) , entonces ai−1 = sen(2i − 1) . Por lo tanto, por las propiedades
2 2
homogénea y telescópica de las sumatorias tenemos que
n n
xX X x
2 sen cos ix = 2 sen cos ix
2 i=1 i=1
2
n
Xh x xi
= sen(2i + 1) − sen(2i − 1)
i=1
2 2
n
X
= (ai − ai−1 )
i=1

= an − a0
x x
= sen(2n + 1) − sen .
2 2
Ahora nos proponemos usar de nuevo la identidad (4.5), pero esta vez, de derecha a izquierda.
Para tal fin debemos encontrar A y B tales que
x x
A + B = (2n + 1) , A − B = .
2 2
Entonces,
x x
2A = A + B + A − B = (2n + 1) + = (n + 1)x,
2 2
x x x
de donde A = (n+1) . Con lo cual, B = A− = n . De esta forma obtenemos la identidad
2 2 2
x x x x
2 sen n cos(n + 1) = sen(2n + 1) − sen .
2 2 2 2
Lo que a su vez nos lleva a concluir que si, x 6= 2mπ, entonces
1 1
n sen nx cos (n + 1)x
2 2
X
cos ix = . (4.6)
1
i=1 sen x
2

106
Ahora por definición de integral de Riemann
Z π/2 n
X
cos xdx = lı́m ∆x cos xi ,
0 n→∞
i=1

π π π
donde ∆x = , xi = ∆xi = i. Entonces por la identidad (4.6), con x = , tenemos que
2n 2n 2n
n n
X X π π
∆x cos xi = cos i
i=1 i=1
2n 2n
n
π X π
= cos i
2n i=1 2n
hn π i  
(n + 1)π
sen cos
π 2 2n 4n
= π
2n sen
4n
π π/2n π π
= sen · cos + .
4 sen π 4 4n
4n
π n→∞
Ahora como −→ 0, por el Teorema 4.1.1,
4n
π/4n 1 n→∞ 1
2 π = 2 sen(π/4n) −→ 2 · 1 = 2,
sen
4n π/4n
y

π  n→∞ π  π
cos + −→ cos + 0 = cos .
4 4n 4 4
En conclusión
Z π/2
π π/2n π π π π π
cos xdx = lı́m sen · π cos + = sen · 2 · cos = sen = 1.
0 n→∞ 4 sen 4 4n 4 4 2
4n

En la mayorı́a de problemas que involucran sumas de Riemann se toman como puntos de


muestra los extremos izquierdos, o bien los extremos derechos de los subintervalos [xi−1 , xi ],
1 ≤ i ≤ n. Sin embargo, en ocasiones dicha elección no es útil como mostraremos en el
siguiente ejemplo.
2
1
Z
Ejemplo 4.3. Utilizar sumas de Riemann para calcular la integral dx. Sugerencia:
√ 1 x2
Tome x∗i = xi−1 xi .

107
Solución. Intentemos calcular el área pedida por exceso. Tenemos que
Z b X n
f (x)dx = lı́m ∆xf (xi ),
a n→∞
i=1

b−a 1
donde ∆x = = , xi = a + i∆x = 1 + i/n. Entonces
n n
1 n2
f (xi ) = = .
(1 + i/n)2 (n + i)2
Por lo tanto tenemos que
Z 2 n n
X X n
f (x)dx = lı́m ∆xf (xi ) = lı́m . (4.7)
1 n→∞
i=1
n→∞
i=1
(n + i)2

El lı́mite en (4.7) se puede calcular usando el teorema fundamental del cálculo, pero cier-
tamente la integral que nos plantean también. Para resolver el problema usando sumas de
Riemann, debemos definir

x∗i = xi−1 xi ,

1 ≤ i ≤ n. Primero que todo notemos que como 0 < 1 ≤ xi−1 ≤ xi para todo 1 ≤ i ≤ n,
entonces

xi−1 xi ≤ x2i y x2i−1 ≤ xi−1 xi ⇔ x2i−1 ≤ xi−1 xi ≤ x2i .



Ahora como la función h(x) := x es creciente para x > 0. Tenemos que

h(x2i−1 ) ≤ h(xi−1 xi ) ≤ h(x2i ) ⇔ xi−1 ≤ xi−1 xi ≤ xi .

Comprobando de esta forma, que los x∗i definen efectivamente puntos de muestra. Podemos
ahora calcular la integral usando estos puntos de muestra
Z 2 n n
X

X 1 1
f (x)dx = lı́m ∆xf (xi ) = lı́m · .
1 n→∞
i=1
n→∞
i=1
n xi−1 xi

Como xi = 1 + i/n. Tenemos que


1 1 1/n n
· = = .
n xi−1 xi (1 + i/n)(1 + (i − 1)/n) (n + i)(n + i − 1)
Por otro lado,
 
1 n + i − (n + i − 1) 1 1
n =n =n − .
(n + i)(n + i − 1) n + i)(n + i − 1) n+i−1 n+1

108
Entonces
n n  
X 1 1 X 1 1
· = n −
i=1
n xi−1 xi i=1
n+i−1 n+1
n  
X 1 1
=n −
i=1
n + i − 1 n+1
n
X
=n (ai−1 − ai ).
i=1

1
Donde ai := . Finalmente, por la propiedad telescópica de las sumas finitas
n+i
Z 2 Xn
f (x)dx = lı́m n (ai−1 − ai )
1 n→∞
i=1

= lı́m n(a0 − an )
n→∞

= lı́m n(1/n − 1/2n)


n→∞

= 1/2.

109
4.3. Propiedades de la integral definida
Teorema 4.3.1 (Propiedades de la integral definida). Sean f y g funciones continuas en
un intervalo [a, b] y c ∈ R. Entonces
Z b Z b Z b
(a) (f (x) ± g(x))dx = f (x)dx ± g(x)dx
a a a
Z b Z b
cf (x)dx = c f (x)dx. (Propiedades de linealidad)
a a
Z b Z c Z b
(b) f (x)dx = f (x)dx + f (x)dx (Propiedad de aditividad)
a a c
(c)
Z b
Si f (x) ≥ 0, entonces f (x)dx ≥ 0
a
Z b Z b (Propiedades de orden)
Si f (x) ≥ g(x), entonces f (x)dx ≥ g(x)dx.
a a
Z b
Si m ≤ f (x) ≤ M, entonces m(b − a) ≤ f (x)dx ≤ M(b − a)
a
Z b Z b+c
(d) f (x)dx = f (x − c)dx (Propiedad de invariancia frente a traslación)
a a+c
Z b Z a
(e) f (x)dx = − f (x)dx. (Propiedad de inversión de la orientación)
a b
b cb
1 x
Z Z
(f ) f (x)dx = f dx, c 6= 0.
a c ca c
(Propiedad de dilatación o contracción del intervalo)

Corolario 4.3.2. Si f es continua en [0, b]. Entonces


Z b Z b
(a) f (x)dx = 2 f (x)dx si f es par.
−b 0
Z b
(b) f (x)dx = 0 si f es impar.
−b

4.4. La integral indefinida


Definición 4.4.1. Una función F es una antiderivada de f en intervalo I si F ′ (x) = f (x)
para todo x ∈ I.
La antiderivada de una función no es única. Por ejemplo, si C ∈ R cada elemento de la
familia de funciones F (x) = x3 + C es un antiderivada de la función f (x) = 3x2 .

110
Un sı́mbolo especial se utiliza para denotar la colección de todas las antiderivadas de una
función f .

Definición 4.4.2 (Integral definida). la colección de todas las antiderivadas de una función
f se denomina integral indefinida de f con respecto a x, lo cual se denota mediante
Z
f (x)dx.

4.4.1. Problemas de valor inicial


La noción de antiderivada de una función es importante en relación con la ecuaciones
diferenciales, dado que la determinación de una antiderivada de la función f (x) es el mismo
problema de encontrar una función y(x) que satisface la ecuación
dy
= f (x), (4.8)
dx
la cual se denomina ecuación diferencial. La solución general de (4.8) es y(x) = F (x)+C,
donde C es una constante arbitraria y F es una antiderivada de f . Por lo tanto, la ecuación
tiene infinitas soluciones una por cada valor de C. Luego para darle unicidad al problema
pedimos a la función y = y(x) que satisfaga la condición inicial y(x0 ) = y0 . El par conformado
por la ecuación diferencial y el condición inicial y(x0 ) = y0 , se denomina problema de valor
inicial.

Ejemplo 4.4 (Movimiento en una dimensión con aceleración constante (MUA)). Cuando
una partı́cula se mueve en una dimensión con aceleración constante, podemos hallar la po-
sición de la partı́cula como una función del tiempo al resolver el par de problemas de valor
inicial

 dv
= a(t) = cte
dt (4.9)
 v(0) = v ,
0

 dx
= at + v0
dt (4.10)
 x(0) = x .
0

En efecto, de la fı́sica clásica se sabe que la velocidad v(t) de una partı́cula en el tiempo t
es la derivada de la posición de la partı́cula respecto al tiempo, a su vez, la derivada de la
velocidad de la partı́cula con respecto al tiempo es igual a la aceleración a(t) en el tiempo t.
Esto es,
d2 x
 
d dx d
a(t) = 2 = = v(t).
dt dt dt dt

111
dv
Si suponemos que a(t) = = cte = c y que velocidad en el tiempo t = 0 es v0 , esto es
dt
v(0) = v0 , obtenemos el problema de valor inicial (4.9). Resolveremos este problema por un
método usado en ecuaciones diferenciales conocido como separación de variables.
dv
Tenemos que : = a = cte. Entonces separando variables obtenemos
dt
dv = adt.

Ahora integrando respecto t y aplicando las propiedades de linealidad de la integral tenemos


que
Z Z Z
dv = a dt = a dt ⇔ v = at + C1 .

Luego obtenemos que

v(t) = at + C1 ,

donde C1 es un a constante, la cual podemos hallar usando la condición inicial v(0) = v0 .


Esto es, v(0) = C1 = v0 . De donde la velocidad de la velocidad de la partı́cula en el tiempo
t viene dada por

v(t) = at + v0 (4.11)

Aplicando de nuevo el método de separación de variables, esta vez para resolver (4.10) obte-
nemos
Z Z
dx = (at + v0 )dt ⇔ dx = (at + v0 )dt.

Entonces, por las propiedades de linealidad de la integral


Z Z Z Z
dx = (at + v0 )dt = atdt + v0 tdt = at2 /2 + v0 t + C2 .

Ahora, x(0) = C2 = x0 , de donde la posición en el tiempo t de la partı́cula está dada por

x(t) = x0 + v0 t + at2 /2. (4.12)

Ahora podemos usar las ecuaciones (4.9), (4.12) para hallar una expresión para la velocidad
final v(t) que no dependa del tiempo. De (4.9) despejando el tiempo obtenemos
vf − v0
t= (4.13)
a
donde vf = v(t).

112
Reemplazando (4.13) en (4.12) obtenemos
   2
vf − v0 1 vf − v0
x = v0 + a ,
a 2 a

donde por comodidad suponemos que x(0) = x0 = 0. Entonces tenemos que


   2
vf − v0 1 vf − v0
x = v0 + a
a 2 a
2v0 (vf − v0 ) (vf − v0 )2
= +
2a 2a
2v0 (vf − v0 ) + (vf − v0 )2
=
2a
(vf − v0 )(2v0 + vf − v0 )
=
2a
(vf − v0 )(vf + v0 )
=
2a
vf2 − v02
= .
2a
De donde obtenemos

vf2 = v02 + 2ax. (4.14)

Otro problema tı́pico de valor inicial, que se presenta en este contexto es el de una partı́cula
que se mueve en una dimensión con velocidad constante. Para este caso tenemos

 dx
= v = cte
dt (4.15)
 x(0) = x .
0

Resolviendo problema de valor inicial obtenemos

x(t) = x0 + vt. (4.16)

Ejemplo 4.5. Un automovilista viaja a 18 m/s cuando ve un venado en el camino, a una


distancia de 38 m, adelante.

(a) Si la desaceleración máxima del vehı́culo es de −4,5 m/s2 , ¿cuál es el tiempo de reac-
ción mı́nimo del automovilista que le permitirá evitar golpear al venado? .

(b) Si el tiempo de reacción es de 0,30 s, ¿Cuán rápido viajará cuando golpeé al venado?

113
Solución. Sea t0 el tiempo de reacción mı́nimo del automovilista que le permitirá evitar
golpear al venado. En este tiempo puesto que no ha empezado a frenar, el automovilista se
desplaza con una velocidad constante de v = 18m/s. Por lo tanto, la distancia recorrida en
este tiempo se halla utilizando la fórmula (4.16) con x0 = 0, si denotemos dicha distancia
por X0 tenemos que X0 = 18t0 .

Ahora pasado el tiempo t0 , el automovilista empieza a frenar y podemos calcular el tiempo


de frenado del vehı́culo con la fórmula (4.11). Para este tiempo, vf = 0, además v0 = 18 y
a = −4,5, entonces

0 = −4,5t + 18,

de donde t = 4s. Para hallar la distancia que recorrió el automóvil antes de detenerse
completamente utilizamos la fórmula (4.12) con x0 = 0, para obtener

X1 = 18 · 4 + (1/2)(−4,5)(4)2 = 36.

v0 = 18m/s
38m
X0 X1

Figura 4.2: El auotmovilista recorre la distancia X0 con velocidad cosntante de 18m/s, y la


distancia X1 con una desaceleración constante de −4,5m/s2
.

Para que el automovilista no atropelle al venado se debe tener que la distancia de reacción
X0 más la distancia de frenado X1 sea exactamente igual a 38m (ver figura 4.2). Esto es,

X0 + X1 = 38.

Tenemos entonces que 18t0 + 36 = 38, con lo cual t0 = (1/9)s ≈ 0, 1s.

Ahora, si el tiempo de reacción es de 0,3s, en este tiempo el automovilista a recorrido

x = x(0,3) = 18 · 0, 3 = 5,4m,

pasado ese tiempo empieza a frenar, y la velocidad con la que atropella al venado se calcula
con la fórmula (4.14), tomando v0 = 18, a = −4,5 y x = 38 − 5,4 = 32,6. Tenemos que
p
vf = 182 − 2(4,5)(32,6) = 5,5317m/s.

114
Ejemplo 4.6 (Difusión social). En ocasiones, los sociólogos utilizan la frase difusión social
para describir la manera en que la información se difunde en una población. La información
puede ser un rumor, una moda cultural, o una noticia de una innovación tecnológica. En una
población suficientemente grande, el número de personas x que conoce la información se trata
como una función diferenciable del tiempo t, mientras que la velocidad de difusión, dx/dt,
se supone proporcional al número de personas que conocen la información por el número de
personas que la desconocen. Lo anterior lleva a la ecuación diferencial
dx
= kx(N − x),
dt
donde N es el número de personas en la población.
Suponga que t está en dı́as, k = 1/250, y que dos personas inician un rumor en el instante
t = 0 en una población de N = 1000 personas.

(a) Determine x como una función del tiempo t.

(b) ¿Cuándo la mitad de la población a escuchado el rumor? (Esto es cuando el rumor se


propaga de la manera más rápida).

Solución. Utilizaremos un método conocido como separación de variables para resolver


la ecuación.
dx dx
= kx(N − x) ⇔ = dt.
dt kx(N − x)

Ahora integrando la última ecuación obtenemos


dx
Z
= t + C.
kx(N − x)

Ahora nótese que


 
dx 1 x+N −x 1 1 1
= · = · + .
x(N − x) N x(N − x) N N −x x

Además, del cálculo diferencial se sabe que


d 1
ln x = .
dx x
Entonces por la regla de la cadena
d 1
− ln(N − x) = .
dx N −x

115
Luego por las propiedades de linealidad de la integral.
dx 1 dx
Z Z
=
kx(N − x) k x(N − x)
 
1 1 1 1
Z
= · + dx
k N N −x x
Z  
1 1 1
= + dx
kN N −x x
Z 
1 1 1
Z
= dx + dx
kN N −x x
1
= [ln x − ln(N − x)] .
kN
Tenemos entonces que
 
1 x 1
ln = [ln x − ln(N − x)] = t + C,
kN N −x kN
donde kN = 1000/250 = 4. Por consiguiente,
x x
ln = 4t + 4C ⇔ = e4t+4C = e4t e4C
N −x N −x
⇔ x = Ne4C e4t − e4t e4C x
⇔ x + e4t e4C x = Ne4C e4t
⇔ x(1 + e4t e4C ) = Ne4C e4t
Ne4C e4t
⇔x= .
1 + e4t e4C
Esto es,
1000e4C e4t
x = x(t) = (4.17)
1 + e4t e4C
x
Además como x = 2 cuando t = 0 y = e4t e4C , tenemos que e4C = 1/499. Reempla-
N −x
zando este último valor en (4.17), obtenemos
1000e4t
x = x(t) = .
499 + e4t
Con lo cual tenemos la parte (a). Para la parte (b), debemos resolver para t, la ecuación
1000e4t
= 500.
499 + e4t
Esto es,
1000e4t 1000 4t
4t
= 500 ⇔ e = 499 + e4t ⇔ e4t = 499.
499 + e 500
Entonces t = ln 499/4 ≈ 1,55.

116
4.5. Teorema fundamental del cálculo
4.5.1. Primer teorema fundamental del cálculo
Teorema 4.5.1 (Primer teorema fundamental del cálculo). Si f e continua en [a, b], la
función F definida por
Z x
F (x) = f (t)dt a ≤ x ≤ b
a

es continua en [a, b] y diferenciable en (a, b), y F ′ (x) = f (x).


Cuando la función f es no negativa para a ≤ t ≤ x, la función F representa el área
debajo la función y = f (t) que se acumulada hasta el valor x.
Ejemplo 4.7. Si f es continua y satisface la fórmula dada para todo x ≥ 0, calcular f (2).
Z x2 (x+1)
f (t)dt = x
0
Z x
Solución. Sea F (x) = f (t)dt y h(x) = x2 (x + 1). Si
0
Z h(x) Z x2 (x+1)
z = F (h(x)) = f (t)dt = f (t)dt, (4.18)
0 0

entonces por la regla de la cadena


dz
= F ′ (h(x))h′ (x).
dx
Nótese que el primer Teorema fundamental del cálculo F es diferenciable en (0, x), más
aún, F ′ (x) = f (x), con lo cual F ′ (h(x)) = f (h(x)). Por lo tanto, derivando respecto a x la
ecuación integral (4.18) obtenemos

f (h(x))h′ (x) = f (x2 (x + 1))(3x2 + 2x) = 1.

De donde

f (x2 (x + 1))(3x2 + 2x) = 1 (4.19)

Como se quiere hallar f (2), debemos hallar x > 0 tal que h(x) = 2. Esto es,

x2 (x + 1) = 2 ⇔ x2 + x3 − 2 = 0
⇔ x2 − 1 + x3 − 1 = 0
⇔ (x − 1)(x + 1) + (x − 1)(x2 + 2x + 1) = 0
⇔ (x − 1)(x2 + 2x + 2) = 0.

117
Para y = x2 + 2x + 2, tenemos a = 1, b = c = 2, con lo cual, D = b2 − 4ac = 22 − 4(1)(2) < 0.
Entonces x2 + 2x + 2 > 0 para todo x ∈ R. Por consiguiente x − 1 = 0, esto es, x = 1.
Reemplazando este valor en (4.19) encontramos que

f (12(1 + 1))(3(1)2 + 2(1)) = 1 ⇔ f (2)5 = 1.

De donde f (2) = 1/5.

4.5.2. Segundo teorema fundamental del cálculo


Teorema 4.5.2 (Segundo teorema fundamental del cálculo). Si f es continua en [a, b],
entonces
Z b
f (t)dt = F (b) − F (a),
a

donde F es una antiderivada de f , esto es, una función tal que F ′ (x) = f (x).

Ejemplo 4.8. Sea 



0, si x < 0,


x, si 0 ≤ x ≤ 1,
f (x) =


2 − x, si 1 < x ≤ 2,

0, si x > 2.

Z x
y F (x) := f (t)dt.
0

(a) Halle F (x)

(b) Dibuje las graficas de f y F

(c) ¿En dónde f es diferenciable? ¿En dónde F es diferenciable?

Solución. Si x ≤ 0, entonces f (x) = 0, con lo cual F (x) = 0.

CasoZ 1. Si 0 ≤ x ≤ 1, como 0 ≤ t ≤ x, entonces 0 ≤ t ≤ 1, y f (t) = t, con lo cual


x
F (x) = tdt = x2 /2. El valor x2 /2 es obtenido como el área del triángulo que se muestra
0
en la figura 4.3. Por el segundo Teorema fundamental del cálculo tenemos que F1 (t) = t2 /2.
Por lo tanto,
Z x
tdt = F1 (x) − F1 (0) = x2 /2.
0

118
y

x
0 x 1 2

Z x
Figura 4.3: La integral tdt es igual a el área del triángulo de lados x y y = f (x) = x
0

Caso 2. Si 1 < x ≤ 2. Utilizando la propiedad aditiva de la integral definida tenemos


que
Z x Z 1 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt = A1 + A2 .
0 0 1

A1 A2
x
0 1 x 2

Figura 4.4: En este caso el área acumulada hasta x es igual a el área del triángulo más el
área del trapecio

Geométricamente podemos calcular el área como la suma del área del triángulo y el

119
trapecio que se muestran el la figura 4.4. Tenemos que:
Z 1 Z x
1·1 (1 + 2 − x)(x − 1)
f (t)dt = A1 = = 1/2, f (t)dt = A2 = .
0 2 1 2
Entonces
x
(3 − x)(x − 1)
Z
F (x) = f (t)dt = 1/2 + = −x2 /2 + 2x − 1.
0 2
Si queremos hallar el área acumulada hasta un valor x, utilizando el segundo teorema fun-
damental del cálculo, procedemos como sigue. Para el área A1 tenemos que 0 ≤ t ≤ 1, con
lo cual f (t) = t. Entonces
Z 1
A1 = tdt = F1 (1) − F1 (0) = 1/2 − 0 = 1/2.
0

Para el área A2 tenemos que 1 ≤ t ≤ x ≤ 2. Es decir, f (t) = 2 − t. En consecuencia,


Z x Z x Z x
A2 = (2 − t)dt = 2dt − tdt
1 1 1
= 2(x − 1) − ((F1 (x) − F1 (1))
= 2x − 2 − (x2 /2 − 1/2)
= −x2 /2 + 2x − 3/2.

Sumando estas áreas obtenemos


Z x
F (x) = f (t)dt = 1/2 + −x2 /2 + 2x − 3/2 = −x2 /2 + 2x − 1.
0

Caso 3. x > 2. En este caso ya se acumulo todo el área.


Z x Z 2 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt
0 0 2
Z 1 Z 2 Z x
= f (t)dt + f (t)dt f (t)dt
0 1 2
Z 1 Z 2 Z x
= tdt + (2 − t)dt + 0dt
0 1 2
= 1.

Ver la figura 4.5.

120
y

x
0 1 2 x

Figura 4.5: Si x > 2, ya se acumulo toda el área, la cual es igual a el área del triángulo que
se muestra

De los casos 1,2 y 3, encontramos F (x):




0, si x < 0,

x2 /2,

si 0 ≤ x ≤ 1,
F (x) =


−x2 /2 + 2x − 1, si 1 < x ≤ 2,

1, si x > 2.

De donde obtenemos la gráfica de la función

x
0 1 2

Figura 4.6: Gráfica de la función de área

121
La función f es diferenciable en R − {0, 1, 2}. Por el primer Teorema fundamental del
cálculo, la función F es diferenciable donde f es continua, esto es, en todo R.

4.6. Área entre curvas


Supongamos que y = ϕ1 (x) y y = ϕ2 (x) son funciones continuas en el intervalo [a, b],
y supongamos además que ϕ1 (x) ≤ ϕ2 (x) para todo x ∈ [a, b]. Consideremos la región R
limitada por las gráficas de estas funciones en el intervalo dado, esto es
R = (x, y) ∈ R2 : a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x) .


Observamos en la figura 4.7 que al mover la linea vertical en rojo desde x = a, hasta x = b,
barremos toda la región, y mientras hacemos esto, dicha linea siempre entra en la curva
y = ϕ1 (x) y sale en la curva y = ϕ2 (x). Un subconjunto del plano con estas caracterı́sticas
es denominado región del tipo I.
y

y = ϕ2 (x)

y = ϕ1 (x)

x
a b

Figura 4.7: Región del tipo I

Dado que 0 ≤ ϕ1 (x) ≤ ϕ2 (x), para x ∈ [a, b], podemos hallar el área de la región R
como una resta de áreas. En efecto, denotemos dicha área por a(R), utilizando la integral
de Riemann tenemos que
Z b Z b Z b
a(R) = A2 − A1 = ϕ2 (x)dx − ϕ1 (x)dx = [ϕ2 (x) − ϕ1 (x)] dx.
a a a

Además por el Teorema fundamental del cálculo


Z ϕ2 (x)
dy = ϕ2 (x) − ϕ1 (x).
ϕ1 (x)

122
Por lo tanto, podemos expresar el área de la región como
Z b
a(R) = [ϕ2 (x) − ϕ1 (x)] dx
a
" #
Z Z b ϕ2 (x)
= dy dx
a ϕ1 (x)
Z bZ ϕ2 (x)
= dydx
a ϕ1 (x)
ZZ
= dA.
R
ZZ
La expresión dA es denominada integral doble extendida sobre la región R del dife-
R
rencial de área, el diferencial de área, dA, es igual a dydx.
Ejemplo 4.9. Calcular el área de la región acotada por la hipérbola xy = 1 y las rectas
y = x y y = 2.
Solución. Hallemos los puntos de corte entre la hipérbola y = 1/x, y la recta y = 2. Esto
es, resolvemos para x la ecuación 1/x = 2, encontrando que x = 1/2. De manera similar, las
rectas y = x y y = 2 se cortan en x = 2 y la hipérbola y la recta y = x en x = 1. Con esta
información hallamos la gráfica de la región.
y

y=x

2
y=2
R

xy = 1

x
1/2 1 2

Figura 4.8: Región plana del tipo II

Vemos que trazando una linea vertical empezando en x = 1/2 y terminando en x = 1,


esta entra en la hipérbola y = 1/x y sale en la recta y = 2, pero cuando movemos esta linea

123
desde x = 1 hasta x = 2 entra en la recta y = x y sale en la recta y = 2, por lo que la región
R no puede ser del tipo I. Sin embargo, al trazar una linea horizontal vemos que cuando la
desplazamos desde y = 1 hasta y = 2, siempre entra en la hipérbola x = 1/y y sale en la
recta x = y. Un subconjunto del plano con esta propiedad es denominado región del tipo II.
De manera más general definimos una región plana del tipo II como sigue

R = (x, y) ∈ R2 : ψ1 (y) ≤ x ≤ ψ2 (y), c ≤ y ≤ d .




Análogamente como se hizo con la regiones de tipo I calculamos el área de una región del
tipo II
ZZ
a(R) = dA
R
Z "Z d
#
ψ2 (y)
= dx dy
c ψ1 (y)
Z d Z ψ2 (y)
= dxdy
c ψ1 (y)
Z d
= [ψ2 (y) − ψ1 (y)] dy.
c

En una región del tipo II, el diferencial de área está dado por dA = dxdy. Ahora para nuestro
caso tenemos que

R = (x, y) ∈ R2 : 1/y ≤ x ≤ y, 1 ≤ y ≤ 2 .


Por lo tanto,
Z 2
a(R) = (y − 1/y)dy
1
2
= y 2 /2 1 − [ln y]21


= 22 /2 − 1/2 − (ln 2 − ln 1) = 3/2 − ln 2.

Cuando aplicamos el segundo Teorema fundamental del cálculo, usamos la notación


Z b
f (x)dx = F (b) − F (a) = [F (x)]ba .
a

A pesar de que la región R no es del tipo I, se puede ver como la unión de dos regiones del
tipo I.

124
y

y=x

2
y=2
R1 R2

xy = 1

x
1/2 1 2

Figura 4.9: Región del tipo II, que puede ser vista como la unión de dos regiones del tipo I

En efecto, R = R1 ∪ R2 , donde

R1 = {(x, y) : 1/2 ≤ x ≤ 1, 1/x ≤ y ≤ 2} , R2 = {(x, y) : 1 ≤ x ≤ 2, x ≤ y ≤ 2}

Podemos entonces calcular el área pedida utilizando la propiedad aditiva de las integrales
dobles
ZZ ZZ ZZ
a(R) = dA = dA + dA = a(R1 ) + a(R2 ).
R R1 R2

Tenemos que
ZZ Z 1
a(R1 ) = dA = (2 − 1/x)dx = 1 + ln 1/2 = 1 − ln 2,
R1 1/2

y
ZZ Z 2
a(R2 ) = dA = (2 − x)dx = 1/2.
R2 1

Por la tanto, a(R) = a(R1 ) + a(R2 ) = 1 − ln 2 + 1/2 = 3/2 − ln 2.

Existen regiones planas que pueden ser del tipo I y del tipo II al mismo tiempo. Llama-
remos a estos subconjuntos del plano regiones del tipo III.

Para calcular área entre curvas debemos utilizar la propiedad aditiva de la integrales
dobles en su caso más general.

125
Teorema 4.6.1 (Propiedad aditiva de las integrales dobles). Supongamos que

R = R1 ∪ R2 ∪ · · · ∪ Rn ,

donde las regiones Ri , 1 ≤ i ≤ n, son regiones elementales en el plano de alguno de los tres
tipos definidos; tipo I, tipo II, o bien tipo III, las cuales son disyuntas dos a dos, esto es,

Ri ∩ Rj = ∅, i 6= j,

salvo quizás en sus fronteras. Entonces


ZZ
a(R) = dA
ZZ R ZZ ZZ
= dA + dA + · · · + dA
R1 R2 Rn

= a(R1 ) + a(R2 ) + · · · + a(Rn ).

4.7. Curvas en el plano


Consideremos una partı́cula que se está moviendo sobre la circunferencia C de ecuación
x + y 2 = 1 mostrada en la figura 4.10.
2

Figura 4.10: Movimiento de una partı́cula sobre una circunferencia

Es imposible describir la trayectoria C seguida por la partı́cula mediante una ecuación de


la forma y = f (x) porque C no pasa la prueba de la linea vertical. Es decir, en la ecuación
de la circunferencia no podemos determinar y de manera única como una función de x. En
vez de eso, utilizamos un par de ecuaciones de la forma

x = x(t), y = y(t).

Por ejemplo para partı́cula que describe la circunferencia de la figura 4.10,

x(t) = cos t, y(t) = sen t.

126
t x y
0 1 0
π/2 0 1
π −1 0
3π/2 0 −1
2π 1 0

Cuadro 4.1: Tiempo necesario para completar una revolución

Para este caso el parámetro t representa el tiempo, y vemos que si 0 ≤ t ≤ 2π, la partı́cula
completa una revolución pasados 2π segundos (ver cuadro 4.1)
Se observa que a medida que el parámetro crece de 0 a 2π los puntos se distribuyen sobre
la circunferencia siguiendo la dirección contraria a las manecillas del reloj.

A continuación introducimos la noción de curva en forma general.

Definición 4.7.1. Una aplicación vectorial en R2 es una función definida en un intervalo


I ⊆ R que toma valores en R2 .

En sı́mbolos escribimos

α : I ⊆ R → R2 , α(t) = (x(t), x(t)).

Las funciones x, y : I ⊆ R → R, son llamadas funciones componentes de la aplicación


vectorial α.

Definición 4.7.2. Una curva en el plano es la imagen por medio de una función vectorial
en R2 de un intervalo I de números reales.

Escribimos C = α(I) = {α(t) : t ∈ I}. A la función vectorial α se le llama parametriza-


ción de la curva C. A las funciones componentes x = x(t), y = y(t) de la función vectorial
α, también se les llama ecuaciones paramétricas.

Ejemplo 4.10 (Parametrización de una función en el plano). Sea y = f (x) una función
definida en un intervalo I de números reales. Entonces su gráfica:

C = graf (f ) = {(x, f (x)) : x ∈ I} ,

es muy sencilla de parametrizar, pues vasta definir, α(t) = (t, f (t)), t ∈ I, en tal caso
C = α(I).

127
4.7.1. Ecuación vectorial y normal de la recta
En la sección 1.2 hallamos la ecuación de la recta usando argumentos geométricos. Des-
afortunadamente, este tipo de argumentos no se pueden extender para deducir la ecuación
de una recta, por ejemplo en R3 , por lo que usaremos métodos vectoriales para encontrar la
ecuación de una recta en Rn .

Sea P0 = (x0 , y0 ) un punto dado de la recta. Supongamos además que v es el vector que
la da dirección a la recta l, nos referimos a este vector como vector director. Supongamos
además que P = (x, y) es un punto arbitrario de l ver figura 4.11.

y
l

P b

P0
b

x
O

Figura 4.11: Ecuación de la recta dados un punto y el vector director

Entonces el vector v es paralelo a el vector que va del punto P0 a el punto P , por lo


tanto, existe t ∈ R tal que
−→
P0 P = P − P0 = tv,
o bien,
P = P0 + tv. (4.20)
La ecuación (4.20) es llamada ecuación vectorial de la recta. Como veremos en la sección
4.10 el procedimiento utilizado para encontrar la ecuación (4.20) se puede extender fácilmente
a R3 .

Ahora, si expresemos (4.20) en términos de las componentes de los vectores P, P0 y v


obtenemos
(x, y) = (x0 , y0 ) + t(v1 , v2 ).

128
Aplicando la multiplicación por escalar y la suma de vectores, encontramos que

x = x(t) = x0 + tv1
(4.21)
y = y(t) = y0 + tv2
Con lo cual tenemos entonces las llamadas ecuaciones paramétricas de la recta. De
las ecuaciones (4.21) concluimos que la parametrización de la recta está dada por

α(t) = P0 + tv = (x0 + tv1 , y0 + tv2 ) = (x(t), y(t)), t ∈ R.

Si despejamos el parámetro t en la primera y segunda ecuación en el sistema (4.21) e igua-


lamos obtenemos
x − x0 y − y0
= . (4.22)
v1 v2
La cual se conoce como ecuación simétrica de la recta. Nótese que si despejamos y de
la ecuación (4.22) obtenemos la ecuación cartesiana de la recta.

De la ecuación (4.20) se hace patente que para determinar completamente una recta es
suficiente con un punto el vector director, o bien teniendo dos de sus puntos, como mostra-
remos en el siguiente ejemplo.

Ejemplo 4.11. Parametrizar la recta que pasa por los puntos P y Q.

Solución. Dado que ya tenemos un punto de la recta, por ejemplo, P0 = P , solo falta
−→
determinar el vector director, el cual podemos tomar como v =P Q ver figura 4.12.

y
l

Q
b

−→
P v =P Q
b

x
O

Figura 4.12: Ecuación de la recta dados dos de sus puntos.

129
Por lo tanto, la parametrización de la recta es
−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), t ∈ R.

Ecuación normal de la recta


Vimos en la sección 4.7.1 que para determinar completamente la ecuación de una recta
suficiente con un punto y el vector director, o bien dos puntos de la recta. Veremos a conti-
nuación que también se puede determinar completamente una recta con un punto y el vector
normal a la recta.

Sea P0 = (x0 , y0) un punto dado de la recta l y n = (a, b) el vector normal a l, esto es, el
vector n es ortogonal a cualquier vector sobre la recta l (ver figura 4.13).

vector n trasladado
l
n = (a, b)
P

P0

x
O

Figura 4.13: Ecuación de la recta dados un punto y el vector normal.


−→
Y sea P = (x, y) un punto arbitrario de la recta l. Entonces el vector P0 P está sobre la
recta l de tal forma que
−→
P0 P ·n = 0. (4.23)

La expresión anterior en términos de las componentes de los vectores toma la forma

[(x, y) − (x0 , y0 )] · (a, b) = 0.

130
Lo que equivale a
a(x − x0 ) + b(y − y0 ) = 0 ⇔ ax + by − (ax0 + by0 ) = 0.
Si llamamos c = −(ax0 + by0 ) obtenemos
ax + by + c = 0. (4.24)
La ecuación (4.24) se conoce como ecuación normal de la recta. Se observa que las
componentes del vector normal son los coeficientes de las variables x y y respectivamente.
Nota 4.7.1. En la deducción de la forma normal de la recta, hay un sutileza, en la ecuación
−→ −→
(4.23) el producto punto debe realizarse en realidad entre vectores P0 P y P0 P2 , donde P2 es
el punto final del vector n trasladado. Sin embargo, por el análisis hecho en la sección 3.3,
−→
dado que el vector n es equivalente a el vector geométrico P0 P2 tenemos que
−→
n = P0 P2 .
Por lo tanto,
−→ −→ −→
P0 P ·n =P0 P · P0 P2 = 0.
Ejemplo 4.12. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a
un punto P0 = (x0 , y0 ) que no pertenece a l está dada por
|ax0 + by0 + c|

dmı́n = .
a2 + b2
Solución. Este problema ya se soluciono de forma puramente geométrica en el ejemplo 1.5.
Ahora utilizaremos el vector proyección para resolver el problema.
y
l
P0
b

dmı́n P

P1
P2
vector normal n trasladado
x
O

n = (a, b)

Figura 4.14: La distancia entre el punto P0 y la recta l recta es igual a la proyección escalar
−→
entre vector P0 P y el vector normal n trasladado.

131
En la figura 4.14 trasladamos el vector normal n respetando dirección y magnitud, de tal
forma que su punto inicial coincida con el punto P0 , si el punto final de este vector es P2 ,
−→
entonces el vector P0 P2 es ortogonal a la recta l en el punto P1 . Si P = (x, y) es cualquier
punto de la recta l, vemos que la distancia entre P0 y la recta l; dmı́n = kP0 − P1 k es la
−→ −→
proyección escalar entre el vector P0 P y el vector P0 P2 . Por lo tanto, por el Teorema 3.5.2
inciso (e) tenemos que
−→ −→
−→ | P0 P · P0 P2 |
dmı́n = k Proy −→ P0 P k = −→ .
P0 P2
k P0 P2 k
−→
Ahora, dado que los vector n y el vector geométrico P0 P2 tienen la misma dirección y
magnitud, por (3.1) tenemos que
−→
n = P0 P2 .

De donde concluimos que


−→ −→ −→
−→ | P0 P · P0 P2 | | P0 P ·n|
k Proy −→ P0 P k = −→ = .
P0 P2
k P0 P2 k knk

Con lo cual,
−→
| P0 P ·n|
dmı́n = .
knk
Como la ecuación de la recta está en la forma normal ax + by + c = 0, las componentes
del vector normal son a y b, esto es, n = (a, b). Además dado que (x, y) ∈ l tenemos que
ax + by + c = 0, o bien, ax + by = −c. Entonces
−→
| P0 P ·n|
dmı́n =
knk
|a(x − x0 ) + b(y − y0 )|
= √
a2 + b2
|ax + by − (ax0 + by0 )|
= √
a2 + b2
| − c − ax0 − by0 |
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2

132
Parametrización de la elipse
La ecuación cartesiana de la elipse con centro en (h, k) y semiejes a y b viene dada por
(x − h)2 (y − k)2
+ = 1. (4.25)
a2 b2
Para parametrizar la elipse utilizamos la identidad fundamental
cos2 t + sen2 t = 1.
(x − h)2 2 (y − k)2
Podemos escoger = cos t y = sen2 t, de donde despejando las variables x,
a2 b2
y y obtenemos las ecuaciones paramétricas
x = x(t) = a cos t + h, y = y(t) = b sen t + k.
De lo cual obtenemos que la parametrización de la elipse es
α(t) = (a cos t + h, b sen t + k), 0 ≤ t ≤ 2π. (4.26)
Cuando a = b = R en (4.25) nos da
(x − h)2 + (y − k)2 = R2 , (4.27)
la cual es la ecuación de una circunferencia con centro en (h, k) y radio R.

Parametrización de la cicloide
Ejemplo 4.13 (Cicloide). La curva trazada por un punto en la circunferencia de un cı́rculo
que rueda sin resbalar por una recta se llama cicloide (ver figura 4.15). Si el cı́rculo tiene
radio r y rueda a lo largo del eje x, y un punto P sobre el cicloide empieza en el origen,
parametrice el cicloide.
y

b
C(rθ, r)
r θ
P
Q
y
x x
O T

Figura 4.15: Un punto P sobre la rueda de una bicicleta que se desplaza sobre plano horizontal
genera una curva llamada cicloide.

133
Solución. Elijamos el ángulo de rotación θ del cı́rculo como parámetro, cuando θ = 0,
el punto P está en el origen. Cuando el cı́rculo ha girado θ radianes, la distancia que ha
recorrido desde el origen es

OT = arc P T = rθ

Dado que el centro del cı́rculo está en C(rθ, r), si (x, y) son las coordenadas del punto P ,
entonces, según la figura 4.15

x = OT − P Q = rθ − r sen θ = r(θ − sen θ)


y = T C − QC = r − r cos θ = r(1 − cos θ).

Por lo tanto,

α(θ) = (r(θ − sen θ), r(1 − cos θ)).

La parametrización anterior contempla el caso en que 0 ≤ θ ≤ π/2. Ahora supongamos


que π/2 ≤ θ ≤ π.

P Q
α
b
C(rθ, r)
θ

x
O T

Figura 4.16: Parametrización del cicloide para π/2 ≤ θ ≤ π

En la figura 4.16 el triángulo △P QC es rectángulo en Q. Además,


QC PQ
cos α = , sen α =
PC PC
Dado que P C = r, y α + θ = π tenemos que
y−r
− cos θ = cos(π − θ) = cos α = ,
r

134
de donde

y = r(1 − cos θ).

De manera análoga,
rθ − x
sen θ = sen(π − θ) = sen α = ,
r
o bien

x = r(θ − sen θ).

Y de nuevo obtenemos que

α(θ) = (r(θ − sen θ), r(1 − cos θ)).

La misma parametrización se obtiene en los casos en que π ≤ θ ≤ 3π/2 y 3π/2 ≤ θ ≤ 2π.


Esto completa la parametrización de la cicloide, pues un arco de esta se tiene al variar el
ángulo θ entre 0 y 2π.

4.8. Continuidad y diferenciación de aplicaciones vec-


toriales
Antes de presentar la noción continuidad y diferenciabilidad de aplicaciones vectoriales
debemos especificar el significado de la expresión

lı́m α(t) = L. (4.28)


t→t0

Dado que t, t0 son números reales, la expresión t → t0 significa que |t − t0 | → 0. Para el


caso α(t) y L, puesto que estamos comparando vectores, diremos que α(t) → L si y solo si
kα(t) − (L1 , L2 )k → 0 donde L = (L1 , L2 ) y
p
kα(t) − (L1 , L2 )k = (x(t) − L1 )2 + (y(t) − L2 )2 .

Ahora podemos aclarar el significado de (4.28).

lı́mt→t0 α(t) = L significa que kα(t) − (L1 , L2 )k → 0 siempre que |t − t0 | → 0.

El siguiente resultado nos permite es establecer los conceptos de continuidad de y dife-


renciación de aplicaciones vectoriales en términos de sus funciones componentes.

135
Teorema 4.8.1. Sea α : I ⊆ R → R2 una aplicación vectorial dada por

α(t) = (x(t), y(t)).

El lı́mite lı́mt→t0 α(t) existe si solo si los lı́mites lı́mt→t0 x(t), lı́mt→t0 y(t) existen, más aún,
 
lı́m α(t) = lı́m x(t), lı́m y(t) .
t→t0 t→t0 t→t0

Teorema 4.8.2 (Continuidad de aplicaciones vectoriales). Una aplicación vectorial α : I ⊆


R → R2 , dada por

α(t) = (x(t), y(t)),

es continua en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son continuas en


t = t0 .

4.8.1. Vector tangente


Cuando el parámetro t representa el tiempo la función vectorial α(t) = (x(t), y(t)) repre-
senta el vector posición de una partı́cula que se está moviendo en dos dimensiones, de este
modo, la partı́cula describe una trayectoria C = α(I) (ver la figura 4.17).

y
α′ (t0 )

P
Q

Figura 4.17: El vector velocidad, o vector tangente es igual a el cambio de la posición de la


partı́cula respecto a el tiempo

donde las funciones paramétricas x(t) y y(t) representan la posición en x y y de la


partı́cula en el momento t respectivamente. Supongamos que la partı́cula está en el punto P
en el momento t0 , esto es, α(t0 ) = P y pasado un tiempo h > 0 se encuentra en el punto Q,

136
es decir α(t0 + h) = Q. Tenemos entonces que el cambio en la posición de la partı́cula viene
dado por
−→
P Q= Q − P = α(t0 + h) − α(t0 ).

El vector
α(t0 + h) − α(t0 )
,
h
es secante a la trayectoria C y cuando h → 0, de tal forma que los punto P y Q se aproximan,
tiende a ser el vector tangente a la trayectoria C en el punto P . Por consiguiente, el vector
tangente o vector velocidad de la partı́cula en el momento t0 , el cual se denota por α′ (t0 )
está dado por

α(t0 + h) − α(t0 )
α′ (t0 ) = lı́m , (4.29)
h→0 h
si el lı́mite en la derecha de (4.29) existe. En tal caso diremos que la función α es diferenciable
en t = t0 .

El Teorema 4.8.1 nos permite encontrar una expresión para calcular el vector tangente.

Teorema 4.8.3 (Diferenciabilidad de aplicaciones vectoriales). Una aplicación vectorial α :


I ⊆ R → R2 , dada por

α(t) = (x(t), y(t)),

es diferenciable en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son diferen-


ciables en t = t0 . Más aún, tenemos que

α′ (t0 ) = (x′ (t0 ), y ′(t0 )).

Nota 4.8.1. El Teorema 4.8.3 nos dice que la derivada de una aplicación vectorial es a su
vez una aplicación vectorial, por lo tanto podemos hablar de una aplicación vectorial cuya
derivada sea continua. Decimos que una curva C es suave si su representación vectorial

α(t) = (x(t), y(t)), t ∈ I

es diferenciable con continuidad para todo t ∈ I. Es decir, α′ (t) existe y es continua para
todo punto del intervalo I. La gráfica de una curva suave, se distingue por que no se rompe
y no tiene puntas. Decimos que una curva C, que es diferenciable en un intervalo I, salvo
por un número finito de puntos es suave a trozos.

137
y y y

R
C
x x x

(a) Curva suave (b) Suave a trozos (c) Curva que se rom-
pe

Figura 4.18: Curva suave y suave a trozos

La gráfica de una circunferencia es una curva suave, ver figura 4.18(a). La frontera de
la región R, ver figura 4.18(b), para este caso un triángulo no es una curva suave, pues no
es diferenciable en cada uno de sus vértices. Sin embargo, si es suave a trozos. La gráfica
de la figura 4.18(c) no es suave ni suave a trozos, pues al presentar un número infinito de
discontinuidades no es diferenciable un número infinito de puntos.

Como mencionamos anteriormente, si el parámetro representa el tiempo, el vector posi-


ción de la partı́cula que da determinado por una función vectorial
α(t) = (x(t), y(t)), t ∈ I
si dicha función es diferenciable en t = t0 ∈ I, vimos que el vector velocidad de la partı́cula
en el momento t = t0 está dado por
v(t0 ) = α′ (t0 ),
la magnitud de este vector define la rapidez de la partı́cula en el instante t = t0 , esto es,
v = kv(t0 )k = kα′ (t0 )k.
Si además, la función α′ es diferenciable en t = t0 , el vector aceleración de la partı́cula en
t0 , es decir el cambio de la velocidad con respecto a el tiempo en t0 , está dado por
a(t0 ) = v′ (t0 ) = α′′ (t0 ).

4.9. Movimiento en el plano


4.9.1. Movimiento rectilineo
El movimiento más sencillo que podemos analizar, es el de una partı́cula que se desplaza
sobre una linea recta. Para determinar completamente la posición de una partı́cula que sigue

138
un movimiento rectilineo es suficiente con conocer su velocidad y donde esta inicialmente.
Supongamos que la partı́cula está en el momento t = 0 en el punto P0 y que su velocidad
viene dada por un vector constante v (ver la figura 4.11), entonces el vector posición está
dado por

α(t) = P0 + tv, t ≥ 0. (4.30)

Nótese que α(0) = P0 y α′ (t) = v.

Ejemplo 4.14. Una partı́cula se desplaza en una linea recta con una rapidez constante v
desde el punto P hasta el punto Q. Determinar el vector posición de la partı́cula.

Solución. Por el ejemplo 4.11, la parametrización de la recta está dada por

α(t) = P + t(Q − P ), t ∈ R.

Si resulta que kQ − P k = v, por (4.30) el vector posición de partı́cula es


−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), 0 ≤ t ≤ 1,
−→
donde el vector velocidad está dado por v =P Q= Q − P . Se observa que la partı́cula está
inicialmente en P y pasado un segundo está en el punto Q.

Ahora, si el por el contrario tenemos que kQ − P k =


6 v, consideremos el vector unitario
en la dirección de v = Q − P (ver figura 4.19).

y
l

Q
b

w
−→
P v =P Q
b

u
x
O

Figura 4.19: Podemos determinar la posición de una partı́cula, dados dos puntos de su
trayectoria rectilinea junto con su rapidez.

139
Esto es, definimos
v
u= .
kvk
Entonces el vector w dado por

w = vu,

tiene la misma dirección de v y su magnitud es kwk = v. Por lo tanto, el vector posición de


la partı́cula es

β(t) = P + tw, 0 ≤ t ≤ t1 ,

donde t1 es el tiempo transcurrido para la partı́cula esté en el punto Q, es decir, tenemos


que β(t1 ) = Q. Lo que nos lleva a considerar la siguiente ecuación vectorial

P + t1 w = Q.

Vemos entonces que

t1 v = t1 kwk = kt1 wk = kQ − P k.

Entonces t1 = kQ − P k/v.

En conclusión, la posición en el tiempo t de la partı́cula es

β(t) = P + tw, 0 ≤ t ≤ t1 ,

v Q−P
donde w = vu, u = = y t1 = kQ − P k/v.
kvk kQ − P k

4.9.2. Movimiento circular uniforme


Consideremos ahora una partı́cula que se está moviendo sobre una circunferencia con
una rapidez constante, es decir, siguiendo un movimiento circular uniforme. Queremos
hallar el vector posición de la partı́cula. Recordemos que la ecuación cartesiana de una
circunferencia con centro en (h, k) y radio R viene dada por

(x − h)2 + (y − k)2 = R2 ,

Si escogemos R2 cos2 t = (x − h)2 y R2 sen2 t = (y − k)2 obtenemos la parametrización

α(t) = (R cos t + h, R sen t + k), 0 ≤ t ≤ 2π.

140
Ahora, nótese que la función vectorial dada por

β(t) = (x(t), y(t)),

donde x(t) = R cos [ω (t − δ)] + h y y(t) = R sen [ω (t − δ)] + k, también parametriza la


circunferencia dada. Más aún, la función β(t) representa el vector posición de una partı́cula
que se mueve sobre la circunferencia con una rapidez angular constante ω. Recordaremos la
rapidez angular ω se define como la tasa de cambio del ángulo barrido por unidad de tiempo,
esto es,

ω= .
dt
Si la rapidez angular es constante, separando variables e integrando obtenemos (ver la sección
4.4.1)

θ = θ(t) = θ0 + ωt.

Si suponemos que θ0 = 0, tenemos que


θ
ω= .
t
Denotamos por T a el periodo de la partı́cula, es decir, el tiempo en completar una revolución.
Dado que una revolución se completa cuando se barre un ángulo de 2π radianes encontramos
que

ω= ,
T
para una rapidez angular constante. La otra constante que aparece en las ecuaciones pa-
ramétricas que definen la función vectorial β es δ, la cual tiene que ver con el punto donde
la partı́cula inicia su movimiento. Nótese además que el hecho de escoger la variable x como
una función cosenosoidal o senosoidal tiene que ver con la orientación que sigue la partı́cula.
Calculemos ahora el vector velocidad y la rapidez de la partı́cula. Tenemos que el vector
velocidad viene dado por

v(t) = β ′ (t) = (−Rω sen [ω (t − δ)] , Rω cos [ω (t − δ)])

Con lo cual la rapidez lineal de la partı́cula está dada por

v = kβ ′ (t)k = Rω.

Cambio en la orientación de una curva


141
Consideremos las funciones vectoriales

α(t) = (cos t, sen t), 0 ≤ t ≤ 2π,


β(t) = (cos t, − sen t), 0 ≤ t ≤ 2π.

Ambas parametrizan la circunferencia x2 + y 2 = 1 y tienen el mismo punto inicial y final. Sin


embargo, cuando el parámetro varia entre 0 y 2π, en la primera parametrización los puntos
se distribuyen sobre la circunferencia siguiendo la dirección contraria de las manecillas del
reloj, mientras que la segunda parametrización lo hacen siguiendo las manecillas del reloj.
Como puede comprobarse ambas parametrizaciones se relacionan por la ecuación

β(t) = α(2π − t),

La cual es un caso particular de lo que denominaremos fórmula de inversión. En general,


si un función vectorial α(t) = (x(t), y(t)), a ≤ t ≤ b parametriza una curva C, entonces la
función

β(t) := α(a + b − t) (Fórmula de inversión)

también parametriza la curva C pero induciendo la dirección contraria a la que induce la


función α sobre esta. Denotamos la curva generada por la función β por −C.

Ejemplo 4.15. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en dirección


contraria a las de las manecillas del reloj con una rapidez constante de 2m/s. Encuentre el
vector posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (1, 0) y
da una revolución completa.

Solución. Tenemos que la rapidez lineal de la partı́cula está dada por v = 2m/s, y dado
que R = 1 y v = ωR tenemos que ω = 2 rad /s. Teniendo la rapidez angular podemos
hallar el periodo de la partı́cula con la fórmula ω = 2π/T , de donde T = πs. Suponemos
que la posición en x que sigue la partı́cula es una función cosenosoidal, la cual inducirá una
dirección sobre la curva, si resulta que no es la dirección que se pide en el problema, entonces
utilizamos la fórmula de inversión para obtener la dirección pedida. Además como el centro
de la circunferencia es (h, k) = (0, 0), el vector posición de la partı́cula es de la forma

α(t) = (cos 2(t − δ), sen 2(t − δ)),

donde queda por determinar la constante δ, lo cual podemos hallar con la condición inicial
α(0) = (cos 2(0 − δ), sen 2(0 − δ)) = (1, 0). Obtenemos:

cos 2δ = 1, − sen 2δ = 0.

142
El único ángulo en el intervalo [0, π] que satisface simultáneamente las ecuaciones anteriores
es 0. En consecuencia, δ = 0. Concluimos que el vector posición de la partı́cula es

α(t) = (cos 2t, sen 2t), 0 ≤ t ≤ π.

A modo de comprobación, nótese que, α(0) = (1, 0) = α(π). Ademas, la velocidad en el


instante t es

v(t) = α′ (t) = (−2 sen 2t, 2 cos 2t).

Con lo cual la rapidez de la partı́cula es

kv(t)k = k(−2 sen 2t, 2 cos 2t)k = 2m/s.

Además la parametrización encontrada induce la dirección contraria de las manecillas del


reloj en la circunferencia.

Problema 4.9.1. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en dirección


contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando su
movimiento en el punto (1, 0). Una segunda partı́cula parte del mismo punto que la primera,
pero sigue la dirección de las manecillas del reloj desplazándose con una rapidez constante
de 3m/s, ¿en que tiempo se encuentran por primera vez ambas partı́culas?

Solución. El vector posición de la primera partı́cula se encontró en el ejemplo anterior:

α1 (t) = (cos 2t, sen 2t), 0 ≤ t ≤ π.

Para hallar el vector posición de la segunda partı́cula procedemos como sigue. Como la
partı́cula se mueve sobre la circunferencia unitaria tenemos que

x = cos θ, y = sen θ,

siendo el ángulo θ la dirección del vector unitario (x, y). Ademas, como v2 = 3m/s y v2 =
ω2 R, tenemos que la rapidez angular de la segunda partı́cula es ω2 = 3 rad /s. Esta rapidez
angular se relaciona con el ángulo θ por la fórmula ω2 = θ/t, de modo que θ = 3t. Por ser
constante la rapidez angular, sabemos que ω2 = 2π/T2 , de donde el periodo de la segunda
partı́cula es T2 = 2π/3. Reuniendo la información anterior encontramos que

β2 (t) = (cos 3t, sen 3t), 0 ≤ t ≤ 2π/3.

Se advierte que la función vectorial β2 modela el movimiento de una partı́cula que se desplaza
con una rapidez de 3m/s empezando en el punto (1, 0) pero siguiendo la dirección contraria

143
a la de las manecillas del reloj. Para obtener la dirección deseada usamos la fórmula de
inversión:

α2 (t) = β2 (2π/3 − t) = (cos 3t, − sen 3t), 0 ≤ t ≤ 2π/3.

Al tener la posición de las dos partı́culas, debemos igualarlas para hallar el tiempo en que
se encuentran. Esto es, debemos encontrar un tiempo t tal que

α1 (t) = α2 (t)

o bien, igualando componente a componente

cos 2t = cos 3t y sen 2t = − sen 3t

Reescribiendo las ecuaciones anteriores en la forma

sen 3t = − sen 2t y cos 2t = cos 3t,

y multiplicando miembro a miembro obtenemos

sen 3t cos 2t = − sen 2t cos 3t,

de donde, por el seno de suma de ángulos obtenemos que

sen 5t = sen(3t + 2t) = sen 3t cos 2t + sen 2t cos 3t = 0

Como queremos hallar el tiempo en el que las partı́culas se encuentran por primera vez,
tenemos la restricción 0 ≤ t ≤ 2π/3, por lo que

5t = 0, 5t = π, o 5t = 2π.

Para t = 0, obtenemos el punto de partida; (1, 0). Y de las identidades

cos(2π − x) = cos x y sen(2π − x) = − sen x,

sustituyendo x por 2π/5 vemos que

cos(6π/5) = cos(2π − 4π/5) = cos(4π/5) y sen(6π/5) sen(2π − 4π/5) = − sen(4π/5).

Es decir, las partı́culas se encuentran por primera vez, pasado un tiempo de t = (2π/5)s.

Problema 4.9.2. Encuentre el primer punto de colisión de las partı́culas del problema 4.9.1.

144
Solución. Como el las partı́culas encuentran por primera vez, pasado un tiempo de t =
(2π/5)s, el primer punto de colisión está dado por

α1 (2π/5) = (cos 2(2π/5), sen 2(2π/5)) = (cos 3(2π/5), − sen 3(2π/5)) = α2 (2π/5)

Debemos entonces calcular el valor exacto de cos(2π/5) = cos 72◦ . En la figura 4.20 se
muestra un triángulo isósceles
R
b

36◦

T 108◦
b

72◦
36◦
72◦
Pb 36◦ b
Q
Triángulo áureo

Figura 4.20: El triángulo isósceles △P QR se denomina áureo, ya que la razón entre lados
mayor y menor es el número ϕ.

Escribamos P R = a y P Q = b. Al bisecar el ángulo ∠P QR por el segmento QT , se


observa que obtenemos de nuevo un triángulo isósceles, que además es semejante al primero
por tener los mismos ángulos. Tenemos entonces que QT = P Q = b, más aun, RT = QT = b,
ya que el △QT R, también es isósceles. Entonces como los triángulos △P QR y △P QT son
semejantes tenemos la siguiente relación de proporcionalidad
a−b b
= ,
b a
de modo que

a2 − ab = b2 ⇔ a2 − ab + b2 /4 = b2 + b2 /4
⇔ (a − b/2)2 = (5/4)b2

⇔ a − b/2 = ( 5/2)b

⇔ a = (( 5 + 1)/2)b

La constante ( 5 + 1)/2 se suele denotar por ϕ, y se denomina número de oro, o número
de áureo. Vemos entonces que
a
= ϕ,
b

145
por está razón el triángulo △P QR se denomina áureo. Ahora, aplicando el Teorema de
coseno al triángulo △P QT , tenemos que

b2 = (a − b)2 + b2 − 2(a − b)b cos 72◦ ⇔ 2(a − b)b cos 72◦ = (a − b)2
◦ 1 a 
cos 72 = −1
2 b
Por lo tanto,

◦ 1 a  1 1 √
cos 72 = − 1 = (ϕ − 1) = ( 5 − 1).
2 b 2 4
De la identidad del ángulo doble:

cos 2x = 2 cos2 x − 1,

calculamos que
1 √
cos 2(72◦ ) = 2 cos2 72◦ − 1 = − ( 5 − 1).
4
Y De la identidad fundamental, encontramos que


p √ q √
sen 2(72 ) = 1− cos2 2(72◦ ) = (1/4) 2 (5 − 5)

En consecuencia, el primer punto colisión entre las partı́culas es

1 √ √ q √
 
α1 (2π/5) = (cos 2(2π/5), sen 2(2π/5)) = − ( 5 − 1), (1/4) 2 (5 − 5) = α2 (2π/5).
4

4.9.3. Movimiento con aceleración constante


Supongamos que una partı́cula se desplaza con aceleración constante, esto es, el vector
aceleración a(t) no cambia, ni en dirección ni magnitud, esto implica que las componentes
ax (t) y ay (t) son a su vez constantes para todo tiempo t. Es decir tenemos que

x′′ (t) = ax (t) = cte, y ′′(t) = ay (t) = cte.

El movimiento con aceleración constante en una dimensión ya se analizó en la subsección


4.4.1, en donde se concluyó que

x(t) = x0 + vox t + (1/2)ax (t)t2 , y(t) = y0 + voy t + (1/2)ay (t)t2 ,

146
ver ecuación (4.12). De esta forma vemos que

α(t) = (x(t), y(t))


= (x, y)
= (x0 + vox t + (1/2)ax (t)t2 , y0 + voy t + (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox t, voy t) + ((1/2)ax (t)t2 , (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox , voy )t + (1/2)(ax (t), ay (t))t2
= x0 + v0 t + (1/2)a(t)t2 .

Concluimos entonces que el vector posición para una partı́cula que se desplaza con aceleración
constante es

α(t) = x0 + v0 t + (1/2)at2 . (4.31)

Un tipo especial de movimiento con aceleración constante lo constituye el movimiento


parabólico. Aquı́ se supone que la partı́cula se desplaza bajo única influencia de fuerza
gravitatoria. Entonces demostraremos que cuando es disparada con una velocidad inicial v0
la partı́cula sigue una trayectoria parabólica (ver figura 4.21)

y
vy = 0 vxo
b

g
v0

vyo
θ0
b b
x
O vxo

Figura 4.21: Cuando un proyectil es lanzado desde el origen con una inicial v0 describe una
trayectoria parabólica. Nótese además, que el proyectil alcanza su altura máxima cuando
vy = 0.

Para hallar el vector posición del proyectil, utilizamos (4.31) con x0 = (0, 0) y a(t) = g =

147
(0, −g) donde g = 9,8m/s2 , es la aceleración de la gravedad, con lo cual obtenemos

α(t) = (x(t), y(t)) = v0 t + (1/2)gt2


= (vox t, voy t) + (0, −(1/2)gt2)
= (vox t, voy t − (1/2)gt2)

En consecuencia, la posición en x es

x(t) = vox t = v0 cos θ0 t, (4.32)

donde v0 = kv0 k. Vemos entonces que la trayectoria seguida por el proyectil en x queda
descrita por un movimiento con velocidad constante. La posición en y está dada por

y(t) = voy t − (1/2)gt2 = v0 sen θ0 t − (1/2)gt2 , (4.33)

de modo que el movimiento en y del proyectil queda descrito por un movimiento de caı́da
libre.

De esta forma vemos que el movimiento del proyectil es un combinado entre un movi-
miento con velocidad constante y un movimiento de caı́da libre.

Ahora despejando t en (4.32) y reemplazando el resultado en (4.33) obtenemos


v0 sen θ0 x
y = y(t) = x − (1/2)g
v0 cos θ0 (v cos θ0 )2
  0
g
= (tan θ0 ) x − 2 2
x2 .
2v0 cos θ0
Es decir, al eliminar el parámetro t, obtenemos la ecuación de una parábola de la forma
 
g
y = (tan θ0 ) x − x2 . (4.34)
2v02 cos2 θ0

Alcance horizontal y altura máxima de un proyectil


En la figura 4.21 vemos que el proyectil alcanza su altura máxima cuando vy = 0. Debemos
entonces encontrar una expresión para vy como función del tiempo. Derivando (4.33) respecto
a t obtenemos
dy
vy (t) = = v0y − gt = v0 sen θ0 − gt.
dt
Por lo tanto,

vy = 0 ⇔ v0 sen θ0 − gt = 0.

148
Con lo cual el proyectil alcanza su altura máxima después de un tiempo t1 dado por
v0 sen θ0
t1 = .
g
Entonces la altura máxima del proyectil es

hmáx = h(t1 )
 2
v0 sen θ0 1 v0 sen θ0
= (v0 sen θ0 ) − g
g 2 g
2 2
v sen θ0
= 0 .
2g
Ahora, dado que el tiempo de vuelo es tv = 2t1 , el alcance horizontal está dado por

R = x(tv ) = x(2t1 )
2v0 sen θ0
= (v0 cos θ0 )
g
2
2v sen θ0 cos θ0
= 0
g
2
v sen 2θ0
= 0 .
g
Problema 4.9.3. Se lanza un proyectil desde el pie de un plano inclinado un ángulo θ
respecto a la horizontal. Si la velocidad inicial de proyectil forma un ángulo φ con el plano
inclinado, ¿qué alcance tendrá el proyectil sobre el plano inclinado?
Solución. En la figura 4.22 se muestra el plano uv con el eje u sobre la horizontal. Este
plano gira un ángulo θ en el sentido contrario de las manecillas del reloj para generar el
plano xy, el eje x de este sistema de referencia so coloca sobre el plano inclinado.

y v0 x
P
b

φ
θ
u

Figura 4.22: Se lanza un proyectil con una velocidad inicial v0 con ángulo φ medido respecto
a un plano inclinado un ángulo θ respecto a la horizontal.

149
De esta forma una observador que tiene como punto de referencia el plano uv, medirá las
componentes de la velocidad inicial en la forma

v0u = v0 cos(θ + φ), v0v = v0 sen(θ + φ).

Por lo tanto, la posición en u del proyectil respecto al tiempo, medida desde la horizontal
está dada por

u = u(t) = v0u t = v0 cos(θ + φ)t.

Ası́ mismo, la posición en v del proyectil respecto al tiempo, medida desde la horizontal viene
dada por

v = v(t) = v0v t − (1/2)gt2 = v0 sen(θ + φ)t − (1/2)gt2.

Para hallar la ecuación de la parábola que describe la trayectoria del proyectil despejamos
el tiempo de la ecuación para la posición en u, y reemplazamos el resultado en la ecuación
que nos da la posición en v.
v0 sen(θ + φ) u
v = v(t) = u − (1/2)g
v0 cos(θ + φ) (v0 cos(θ + φ))2
 
g
= (tan(θ + φ)) u − u2 .
2v02 cos2 (θ + φ)
Ahora, dado que le recta que pasa por el origen y el punto P tiene un inclinación θ sobre la
horizontal, su ecuación está dada por

v = (tan θ)u.

Al igualar las ecuaciones de esta recta y la parábola, obtenemos la componente en u del


punto P :
 
g
(tan θ)u = (tan(θ + φ)) u − 2 2
u2
2v0 cos (θ + φ)
2 2
2v cos (θ + φ)(tan(θ + φ) − tan θ)
⇔u= 0
g
La componente en u del punto P , y alcance R del proyectil sobre el eje x, se relacionan por
la ecuación

u = R cos θ.

De modo que, el alcance R del proyectil sobre el plano inclinado está dado por
2v02 cos2 (θ + φ)(tan(θ + φ) − tan θ)
R= .
g cos θ

150
4.9.4. Fuerza resultante
Una de las principales aplicaciones de los vectores, se presenta, en la solución de problemas
mediante el uso de la segunda ley Newton, la cual establece que la fuerza neta que actúa
sobre un cuerpo es igual a el producto de masa por su aceleración, en términos matemáticos
esto se expresa con una ecuación vectorial:

F = ma (Segunda ley de Newton)

La masa m de la partı́cula es una cantidad escalar, por lo tanto, lo que define la fuerza que
actúa sobre un cuerpo es la multiplicación por escalar entre su masa y su aceleración. Lo que
queremos decir con fuerza neta, es la fuerza resultante o sumatoria de fuerzas que actúan
sobre el cuerpo, por ejemplo, si n fuerzas F1 , . . . , Fn actúan sobre un cuerpo de masa m por
la segunda ley de Newton tendrı́amos que

F1 + · · · + Fn = ma.

Ahora si suponemos que la partı́cula se está moviendo en dos dimensiones, al descomponer


cada vector fuerza y el vector aceleración encontramos que

Fi = (Fix , Fiy ) , 1 ≤ i ≤ n, a = (ax , ay ) .

Por lo tanto, por la definición de igualdad y suma entre vectores tenemos que
X
Fx = F1x + · · · + Fnx = max
X
Fy = F1y + · · · + Fny = may .

Cuando la fuerza resultante es cero, la aceleración de la partı́cula también es cero, decimos


que la partı́cula está en equilibrio. En este caso
X
Fx = 0
X
Fy = 0.

Problema 4.9.4. Considere un peso de w Newtons suspendido por dos alambres como se
muestra en el diagrama, donde T1 y T2 son vectores de fuerza dirigidos a lo largo de los
alambres. Obtenga los vectores T1 y T2 y demuestre que sus magnitudes son
w cos α w cos β
kT1 k = y kT1 k =
sen(α + β) sen(α + β)

151
α β

T2 T1

α β

Figura 4.23: Una masa de peso w es suspendida por dos cables con tensiones T1 y T2

Solución. Según la gráfica de la figura 4.23 las direcciones de los vectores de fuerza T1 , T2
y w son respectivamente, β, π − α y 3π/2. En consecuencia tenemos que

T1x = kT1 k cos β,


T2x = kT2 k cos(π − α) = −kT2 k cos α
wx = kwk cos(3π/2) = 0,
T1y = kT1 k sen β,
T2y = kT2 k sen(π − α) = kT2 k sen α
wy = kwk sen(3π/2) = −w.

Ahora dado que la masa de peso w = kwk se encuentra en reposo se debe tener que
X
Fx = T1x + T2x + wx = 0
X
Fy = T1y + T2y + wy = 0.

Que equivale a
X
Fx = kT1 k cos β − kT2 k cos α + 0 = 0
X
Fy = kT1 k sen β + kT2 k sen α − w = 0.

Definamos x = kT1 k y y = kT2 k. Entonces tenemos un sistema de ecuaciones lineales de


tamaño 2 × 2 
cos βx − cos αy = 0
sen βx + sen αy = w
Que en forma matricial se expresa como
    
cos β − cos α x 0
=
sen β sen α y w

152
 
cos β − cos α
Aquı́, la matriz de coeficientes es A = , con lo cual
sen β sen α

D := det A = sen α cos β + sen β cos α = sen(α + β).

Descontamos los casos en que α + β = 0, π, de tal forma que det A = sen(α + β) 6= 0.


Entonces por la Regla de Krammer
D1 D2
x= ,y = ,
D D
donde

0 − cos α cos β 0
D1 =
= w cos α, D1 =
= w cos β.
w sen α sen β w

Por consiguiente,
D1 w cos α D2 w cos β
kT1 k = = , kT2 k = = .
D sen(α + β) D sen(α + β)
Teniendo las magnitudes y direcciones de los vectores de fuerza T1 y T2 podemos obtener
dichos vectores. Para el vector T1 tenemos
w cos α cos β
T1x = kT1 k cos β = .
sen(α + β)
w cos α sen β
T1y = kT1 k sen β = .
sen(α + β)
Por lo tanto,
w cos α cos β w cos α sen β
T1 = i+ j.
sen(α + β) sen(α + β)
Y para el vector T2 tenemos que
−w cos β cos α
T2x = kT2 k cos(π − α) = .
sen(α + β)
w cos β sen α
T2y = kT2 k sen(π − α) = .
sen(α + β)
En consecuencia,
−w cos β cos α w cos β sen α
T2 = i+ j.
sen(α + β) sen(α + β)

153
4.10. Vectores en el espacio
Se define el espacio Euclideo de tres dimensiones como el conjunto de todas la triplas
ordenadas de números reales (x, y, z), esto es,

R3 = {(x, y, z) : x, y, z ∈ R} .

En analogı́a como se definió un vector en el plano, definimos un vector de R3 como un tripla


ordenada de números reales (Ax , Ay , Az ). La noción de vector geométrico (ver el problema
4.14.25) también se puede introducir en el espacio, por lo que escribimos A = (Ax , Ay , Az )
−→
en lugar de OA para denotar el vector A. Dado que cada componente Ax , Ay , Az de A puede
ser positiva o negativa, dividimos el espacio en 8 regiones llamadas octantes, en la figura
4.24 se muestra una caja rectangular ubicada en el primer octante (x, y, z ≥ 0).

O
P b

Q y
Figura 4.24: Magnitud o norma de un vector en el espacio

La diagonal de esta caja, el segmento que va del origen a el punto A, es la magnitud del
vector A, que vendrı́a a ser la hipotenusa del triángulo rectángulo △OQA. Por el Teorema
de Pitágoras tenemos que

kAk2 = |OA|2
= |OQ|2 + |QA|2
= |OQ|2 + A2z .

Como el punto Q tiene coordenadas (Ax , Ay , 0), de nuevo por el Teorema de Pitágoras, esta
vez aplicado en el triángulo △OP Q obtenemos que

|OQ|2 = |OP |2 + |P Q|2


= A2x + A2y .

154
Por lo tanto, tenemos que la magnitud del vector A está dada por
q
kAk = A2x + A2y + A2z .

Utilizando la noción de norma de un vector junto con el concepto de vector geométrico


podemos establecer una fórmula para la distancia entre dos puntos en el espacio.

Teorema 4.10.1. Sean P = (x1 , x2 , x3 ) y Q = (y1 , y2 , y3 ) dos puntos en el espacio. Entonces


−→
la distancia entre P y Q está dada por la norma del vector geométrico P Q, esto es,
−→ p
d(P, Q) = k P Q k = kQ − P k = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 .

En el caso de R3 no se puede definir la dirección del vector A como el ángulo θ que forma
el vector con el eje x ya que, por ejemplo, si 0 < θ < π/2, existe un número infinito de
vectores con la misma magnitud que forman el mismo ángulo θ con el eje x, el conjunto de
dichos vectores forman el cono mostrado en la figura 4.25.

θ O
b
θ
y
x
Figura 4.25: Todos los vectores sobre el cono forman un ángulo θ con el eje x

La dirección de un vector en R3 , formalmente se define como sigue

Definición 4.10.1. La dirección de un vector no nulo A en R3 se define como el vector


unitario
A
u= .
kAk

Sin embargo, también podemos definir la dirección de un vector en R3 en términos de


−→
ángulos. Los ángulos α, β y γ que forma el vector A =OA con cada uno de los ejes coorde-
nados, x, y y z son llamados ángulos directores del vector A. Entonces como se muestra
en la figura 4.26 del triángulo rectángulo △OAP tenemos que
x
cos α = .
kAk

155
De manera similar, utilizando los triángulos rectángulos △OAQ y △OAR encontramos que
y z
cos β = , cos γ = .
kAk kAk

Por definición, cada uno de estos ángulos está en el intervalo [0, π]. Los cosenos de estos
ángulos son llamados cosenos directores. Podemos entonces expresar cualquier vector de
R3 en términos de estos cosenos directores

A = (x, y, z) = (kAk cos α, kAk cos β, kAk cos γ). (4.35)

b
R

γ
O A
β
α
P b

x
b
Q
y

Figura 4.26: El vector A forma un ángulo α con lado positivo del eje x, β con el lado positivo
del eje y y γ con el eje positvo del eje z

Se observa que si el vector es unitario tenemos que

A = (cos α, cos β, cos γ).

Además para todo vector A

cos2 α + cos2 β + cos2 γ = 1

4.11. Producto cruz


Como se vio en el ejemplo 4.11 dos puntos determinan completamente una recta. Como
veremos en la sección 4.12 tres puntos no colineales (que no están en la misma recta) de-
terminan completamente un plano. Otra forma de determinar completamente un plano es
teniendo un punto y su vector normal, este último vector podemos compararlo con el vector

156
director para el caso de la recta, pues en cierto sentido da la dirección al plano. Supóngase
que queremos determinar la ecuación un plano π sabiendo que conocemos tres de sus puntos
P , Q y R.

π
P
Q

Figura 4.27: El vector normal al plano π es obtenido como el producto cruz entre los vectores
−→ −→
geométricos P Q y P R

Como se ve en la figura 4.27, n es el vector normal al plano, por lo tanto ha de ser


perpendicular a cualquier vector que este sobre este, en particular debe ser perpendicular
−→ −→
a los vectores geométricos P Q y P R. Si estos vectores tienen coordenadas (a1 , b1 , c1 ) y
(a2 , b2 , c2 ) respectivamente, y las coordenadas del vector n son (a, b, c), entonces tenemos
que

(a1 , b1 , c1 ) · (a, b, c) = 0
(a1 , b1 , c1 ) · (a, b, c) = 0,

o bien

a1 a + b1 b + c1 c = 0
(4.36)
a2 a + b2 b + c2 c = 0
En el sistema (4.36) tomamos como variables las componentes del vector normal a, b y c.
Entonces por la regla de Krammer obtenemos para a y b

−c1 c b1 a1 −c1 c

−c2 c b2 c(b1 c2 − b2 c1 ) a2 −c2 c c(a2 c1 − a1 c2 )
a= = ,b = = ·
a1 b1 a1 b2 − a2 b1 a1 b1 a1 b2 − a2 b1

a2 b2 a2 b2

157
De esta forma vemos que
 
c(b1 c2 − b2 c1 ) c(a2 c1 − a1 c2 )
n = (a, b, c) = , ,c
a1 b2 − a2 b1 a1 b2 − a2 b1
c
= (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ).
a1 b2 − a2 b1
Ahora bien, como puede comprobarse las ecuaciones que conforman (4.36) se verifican si-
multáneamente si tomamos c = a1 b2 − a2 b1 . Por lo tanto, una solución del sistema (4.36)
está dada por

a = b1 c2 − b2 c1 , b = a2 c1 − a1 c2 y c = a1 b2 − a2 b1 .

Lo que significa que dados dos vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ), el vector

n := (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ),

es perpendicular a ambos, dicho vector se conoce como producto cruz o producto vec-
torial de los vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ).

El análisis hecho anteriormente justifica la siguiente definición.

Definición 4.11.1 (Producto cruz). Sean A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ) dos vectores de


R3 . El producto cruz entre A y B se denota por A × B y define como

A × B = (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ). (4.37)

Si definimos la matriz

a11 a12 a13

A = a1 b1 c1
a b2 c2
2

y desarrollamos su determinante por la primera fila obtenemos

|A| = a11 A11 + a12 A12 + a13 A13


= a11 (b1 c2 − b2 c1 ) + a12 (a2 c1 − a1 c2 ) + a13 (a1 b2 − a2 b1 ).

Vemos que las componentes del producto vectorial son precisamente los cofactores de la
matriz A en el desarrollo anterior, por lo tanto podemos expresar el producto vectorial como
sigue

A × B = (A11 , A12 , A13 ) = A11 i + A12 j + A13 k,

158
donde i, j y k son los vectores coordenados unitarios de R3 . La última expresión para el
producto cruz en términos de estos vectores nos permite escribir

i j k

A × B = a1 b1 c1 (4.38)
a b c
2 2 2

La fórmula (4.38) no solo evita la memorización de la tediosa fórmula en (4.37) si no que es


muy útil a la hora de demostrar las propiedades del producto cruz.
Teorema 4.11.1 (Propiedades del producto cruz). Sean A, B y C vectores en R3 y α
escalar, entonces
(a) A × 0 = 0.
(b) A × B = −B × A (propiedad anticonmutativa para el producto vectorial)
(c) (αA) × B = A × (αB) = α(A × B).
(d) A × (B + C) = A × B + A × C
(propiedad distributiva para el producto vectorial)
(e) (A × B) · C = A · (B × C) (triple producto escalar)
(f ) (A × B) · A = (A × B) · B = 0.
(g) A × B = 0 ⇔ A k B.
(h) kA × Bk2 = kAk2 kBk2 − (A · B)2 (identidad de Lagrange)
Utilizando la identidad de Lagrange podemos demostrar que la magnitud del producto
cruz está dada por
kA × Bk = kAkkBk sen θ (4.39)
donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.

Existe un interpretación interesante de (4.39).

h
θ A

Figura 4.28: El área del paralelogramo determinado por los vectores A y B es igual a la
magnitud del pruducto cruz entre estos vectores.

159
En la figura 4.28 el paralelogramo determinado por los vectores A y B tiene como base
la magnitud del vector A, dado que su altura es h, su área está dada por kAkh, pero

h = kBk sen θ.

Entonces el área del paralelogramo es kAkkBk sen θ, que es precisamente la magnitud del
producto cruz entre A y B. Concluimos que:

El área del paralelogramo determinado por los vectores A y B es igual a la magnitud del
producto cruz entre ellos.
Combinando (4.38) y (4.39) podemos hacer una interpretación geométrica del determi-
nante de tamaño 2 × 2 (ver sección 2.2). Supongamos que el paralelogramo de la figura 4.28
está dispuesto sobre el plano xy, y que los vectores A y B tienen componentes (a, c, 0) y
(b, d, 0) respectivamente. Entonces el producto cruz entre estos vectores es

i j k

A × B = a c 0 = i(0) − j(0) + k(ad − bc) = (0, 0, ad − bc).
b d 0

Con lo cual,

kA × Bk = |ad − bc|

La parte derecha de la ecuación anterior, es el valor absoluto del determinante de la matriz


 
a b
A :=
c d

Concluimos que el área del paralelogramo determinado por los vectores A y B es igual
al determinante de la matriz formada por estos, vistos como vectores columna.

4.12. Rectas y planos en el espacio


Como se menciono en la sección 4.7.1 mediante métodos vectoriales se puede extender
la noción de recta a Rn . En particular para el caso de R3 la ecuación vectorial de la recta
viene dada en la forma

P = P0 + tv, (4.40)

donde P = (x, y, z) es un punto arbitrario de la recta, P0 = (x0 , y0 , z0 ) un punto dado


y v = (v1 , v2 , v3 ) es el vector director. Con la ecuación vectorial podemos encontrar las
ecuaciones paramétricas y simétricas de la recta

160

 x = x(t) = x0 + tv1
y = y(t) = y0 + tv2 (Ecuaciones paramétricas de la recta)
z = z(t) = z0 + tv3

x − x0 y − y0 z − z0
= = (Ecuaciones simétricas de la recta)
v1 v2 v3
Las nociones de paralelismo y ortogonalidad entre rectas vienen dadas en términos de los
vectores directores.

Definición 4.12.1. Sean l1 y l2 rectas, con respectivos vectores directores v1 y v2 , entonces

l1 k l2 ⇔ v1 k v2 y l1 ⊥ l2 ⇔ v1 ⊥ v2 .

Ejemplo 4.16. Determine si las rectas

x = 3 + 2t, y = 4 − 3t, z = 5 + 4t y x = 1 − 2s, y = 7 + 4s, z = 1 − 3s.

son paralelas o perpendiculares, o ninguna de las dos.

Solución. Mostraremos que las rectas dadas no son paralelas, encontrando su punto de
corte. Si las rectas se cortan en un punto de coordenadas (x, y, z) se debe cumplir que

 3 + 2t = 1 − 2s
4 − 3t = 7 + 4s
5 + 4t = 1 − 3s

Despejando t en la primera ecuación obtenemos t = −(s+1), reemplazando este resultado


en la segunda ecuación nos da 4 + 3(s + 1) = 7 + 4s. De donde, s = 0, entonces t = −(0 + 1) =
−1. Si resulta que para los valores s = 0, t = −1, la tercera ecuación se satisface, quiere decir
que las rectas se cortan, lo cual en efecto ocurre, pues 5 + 4(−1) = 1 − 3(0). Concluimos que
las rectas se cortan en el punto

(x, y, z) = (1 − 2(0), 7 + 4(0), 1 − 3(0)) = (1, 7, 1).

En consecuencia, las rectas no son paralelas. Para ver si son perpendiculares, nótese que para
la recta de parámetro t el vector director es v1 = (2, −3, 4), mientras que para la recta de
parámetro s, tenemos que v2 = (−2, 4, −3) es el vector director. Dado que

v1 · v2 = (2, −3, 4) · (−2, 4, −3) = −4 − 12 − 12 6= 0,

los vectores directores no son perpendiculares, por lo tanto, las rectas no son perpendiculares.

161
Ecuación cartesiana del plano
Sea P0 = (x0 , y0, z0 ) un punto dado del plano π (ver la figura 4.29).

P0
−→

π n P0 P

x
y

Figura 4.29: Un punto y el vector normal al plano lo determinan completamente.

y P = (x, y, z) un punto arbitrario de π, si n = (a, b, c) denota el vector normal al plano,


−→
como el vector geométrico P0 P está sobre éste, tenemos que
−→
P0 P ·n = 0

Al expresar cada vector en términos de sus componentes, obtenemos


−→
P0 P ·n = (P − P0 ) · (a, b, c) ⇔ (x − x0 , y − y0 , z − z0 ) · (a, b, c) = 0
⇔ a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0
⇔ ax + by + cz = ax0 + by0 + cz0 .

Con lo cual vemos que, la ecuación de un plano π que pasa por un punto P0 = (x0 , y0 , z0 ) y
cuyo vector normal es n = (a, b, c) está dada por

ax + by + cz = ax0 + by0 + cz0 (4.41)

Lamamos a (4.41) ecuación cartesiana del plano, muchas veces esta ecuación viene dada
en la forma

ax + by + cz + d = 0,

donde d = −(ax0 + by0 + cz0 ). Definimos entonces el plano π como el subconjunto de puntos
de R3 dado por

π = (x, y, z) ∈ R3 : ax + by + cz + d = 0


162
Como se menciono en el sección 4.11, el vector normal n es el que le da la dirección al plano
π, por lo que las nociones de orgonalidad y paralelismo de planos vienen dadas en términos
de sus vectores normales.
Definición 4.12.2. Sean π1 y π2 planos, con respectivos vectores normales n1 y n2 , entonces

π1 k π2 ⇔ n1 k n2 y π1 ⊥ π2 ⇔ n1 ⊥ n2 .

Problema 4.12.1. Demuestre que las rectas

x = a1 s + b1 , y = a2 s + b2 , z = a3 s + b3 , s ∈ R,
x = c1 t + d1 , y = c2 t + d2 , z = c3 t + d3 , t ∈ R,

se cortan o son paralelas si y sólo si



a1 c1 b1 − d1

a2 c2 b2 − d2 = 0.

a c b − d
3 3 3 3

Solución. Supongamos que las rectas se cortan en un punto P .

z
n = v1 × v2

v1 v2
P
P0 Q0
L1 L2

x y

Figura 4.30: Dos rectas que se cortan en un punto P determinan un plano.

Denotemos por L1 , a la recta de parámetro s, y por L2 , a la recta de parámetro t, entonces

L1 = {α(s) : s ∈ R} y L2 = {β(t) : t ∈ R} ,

donde respectivamente tenemos que

α(s) = P0 + sv1 , β(t) = Q0 + tv2 .

Vemos que en el enunciado del problema nos dan la forma paramétrica de las rectas, a partir
de esta forma, para la recta L1 , obtenemos la forma vectorial como sigue:

α(s) = (x, y, z) = (a1 s + b1 , a2 s + b2 , a3 s + b3 ) = (b1 , b2 , b3 ) + s(a1 , a2 , a3 ) = P0 + sv1 .

163
Es decir, la recta L1 pasa por el punto P0 = (b1 , b2 , b3 ) y tiene vector director v1 = (a1 , a2 , a3 ).
De manera similar, la recta L2 pasa por el punto Q0 = (d1 , d2 , d3) y tiene vector director
v2 = (c1 , c2 , c3 ). Como las rectas se cortan, sus vectores directores determinan un plano,
cuyo vector normal está dado por n = v1 × v2 (ver la figura 4.30). Además, éste plano pasa
−→
por los puntos P0 y Q0 , por lo que, el vector geométrico Q0 P0 está sobre éste, de tal forma
que
−→
Q0 P0 ·n = 0

Ahora, expresando los vectores en términos de las componentes y realizando el producto cruz
entre los vectores v1 , v2 por la primera fila obtenemos
−→
Q0 P0 ·n = 0 ⇔ (P0 − Q0 ) · v1 × v2 = 0
⇔ (b1 − d1 , b2 − d2 , b3 − d3 ) · (A11 , A12 , A13 ) = 0
⇔ (b1 − d1 )A11 + (b2 − d2 )A12 + (b3 − d3 )A13 = 0

Nótese que el escalar (b1 − d1 )A11 + (b2 − d2 )A12 + (b3 − d3 )A13 representa la expansión por
cofactores a través de la primera fila de la matriz

b1 − d1 b2 − d2 b3 − d3
 
 a1 a2 a3  .
c1 c2 c3
−→
Por lo tanto, si Q0 P0 ·n = 0, entonces

b1 − d1 b2 − d2 b3 − d3

a1
a2 a3 = 0.
c c2 c3
1

Pero el determinante de una matriz es igual al determinante de su matriz transpuesta, por


lo que,

b1 − d1 a1 c1

b2 − d2 a2 c2 = 0.

b − d a c3
3 3 3

En consecuencia la primera parte de la primera implicación se tiene, ya que una doble


aplicación del Teorema 2.3.5 nos permite concluir que

b1 − d1 a1 c1 a1 b1 − d1 c1 a1 c1 b1 − d1

b2 − d2 a2 c2 = (−1) a2 b2 − d2 c2 = (−1)(−1) a2 c2 b2 − d2 .

b − d a c a b − d c a c b − d
3 3 3 3 3 3 3 3 3 3 3 3

164
Por lo tanto,

a1 c1 b1 − d1

a2 c2 b2 − d2 = 0.

a c b − d
3 3 3 3

Ahora supongamos que las rectas L1 y L2 son paralelas.

z
−→
n = v1 × P0 Q0

v2
−→
P0 Q0 Q0
L2
P0
v1
L1
x y

Figura 4.31: Dos rectas paralelas determinan un plano.


−→
Consideraremos los vectores v1 , y el vector geométrico P0 Q0 . Nótese que estos vectores
no pueden ser paralelos tal como se muestra en la figura 4.31, por que si ası́ fuera, tendrı́amos
−→
que v2 kP0 Q0 , ya que v1 k v2 . Esto implicarı́a que P0 ∈ L2 contradiciendo el hecho de que
−→
L1 k L2 . Entonces los vectores v1 , P0 Q0 determinan un plano cuyo vector normal está dado
por
−→
n = v1 × P0 Q0 .

Dado que el vector v2 está sobre este plano, tenemos que


−→
v2 · v1 × P0 Q0 = v2 · n = 0.

Además, en la primera parte de la primera implicación se demostró que



a1 c1 b1 − d1
−→
Q0 P0 ·v1 × v2 = a2 c2 b2 − d2 ,
a c b − d
3 3 3 3

y por la propiedad (e) del Teorema 4.11.1


−→ −→
v2 · v1 × P0 Q0 = v2 × v1 · P0 Q0

165
−→
El producto punto es conmutativo y el producto cruz anticonmutativo, además, P0 Q0 =
−→
− Q0 P0 , entonces
−→ −→  −→  −→
v2 × v1 · P0 Q0 =P0 Q0 ·v2 × v1 = − Q0 P0 · (−v1 × v2 ) =Q0 P0 ·v1 × v2 .

De esta forma, si suponemos que las rectas L1 y L2 son paralelas, tenemos que
−→ −→ −→
0 = v2 · n = v2 · v1 × P0 Q0 = v2 × v1 · P0 Q0 =Q0 P0 ·v1 × v2

a1 c1 b1 − d1

= a2 c2 b2 − d2
a c b − d
3 3 3 3

Lo cual demuestra la segunda parte la primera implicación.

Para demostrar la segunda implicación, asumamos que



a1 c1
b1 − d1
a2 c2
b2 − d2 = 0.
a c
3 3 b3 − d3

Entonces

a1 c1 b1 − d1
−→
0 = a2 c2 b2 − d2 =Q0 P0 ·v1 × v2 .
a c b − d
3 3 3 3

Ahora bien, si v1 × v2 = 0, v1 k v2 y por lo tanto L1 k L2 . Alternativamente, si v1 × v2 6= 0,


los vectores directores v1 , v2 determinan un plano π, cuyo vector normal es

n = v1 × v2 ,

estos vectores tienen como punto inicial un punto P (ver la figura 4.30), y como
−→
Q0 P0 ·v1 × v2 = 0,
−→
el vector geométrico Q0 P0 está sobre π, de tal forma que dicho plano pasa por los puntos P0
y Q0 , en consecuencia, los vectores geométricos
−→ −→
P0 P y Q0 P ,

están sobre π, por lo que


−→ −→
P0 P ·v1 × v2 = 0 y Q0 P ·v1 × v2 = 0,

166
−→
resulta entonces que P0 P ⊥ v1 × v2 , pero por las propiedades del producto cruz, v1 , v2 ⊥
−→ −→
v1 × v2 , de modo que P0 P k v1 , ya que, los tres vectores: v1 , v2 y P0 P , están sobre el mismo
plano. Pero, esto último implica que existe s1 ∈ R tal que
−→
P0 P = s1 v1 ,
−→
esto es, P = P0 + s1 v1 , lo cual significa que P ∈ L1 . De manera similar, dado que Q0 P k v2
t1 ∈ R tal que
−→
Q0 P = t1 v2 ,
significando esto que P = Q0 + t1 v2 , es decir P ∈ L2 . Se concluye que las rectas L1 , L2 se
cortan en el punto P .

Ecuación vectorial del plano


En la ecuación vectorial de una recta L:
P = α(s) = P0 + sv1 ,
el punto P0 y el vector director v1 son dados, de tal forma que al variar el parámetro s
sobre todos los números reales generamos cualquier punto P de la recta L, mostrando ası́,
que para determinar completamente una recta es suficiente con un parámetro. Como vimos
en el Problema 4.12.1 dos rectas que se cortan en un punto P determinan un plano. Vemos
entonces que para determinar completamente un plano son necesarios dos parámetros.

b
B A
P0 sA
tB
π
P
x y

Figura 4.32: Plano que pasa por P0 , generado por los vectores A y B

En la figura 4.32 el plano π pasa por el punto P0 y es generado por la vectores A y B,


−→
de modo que, si P es un arbitrario del plano, el vector geométrico P0 P es obtenido como la
suma vectorial de sA y tB. Esto es,
−→
P0 P = sA + tB,

167
o bien,

P = P0 + sA + tB (4.42)

La ecuación (4.42) llamada (ecuación vectorial, o paramétrica del plano) nos dice que
al variar los parámetros s y t sobre todos los números reales, generamos cualquier punto P
del plano π. De esta forma vemos que

π = {π(s, t) : s, t ∈ R} = (x, y, z) ∈ R3 : (x, y, z) = P0 + sA + tB : s, t ∈ R .




En consecuencia, la parametrización del plano π está dada por

P = π(s, t) = P0 + sA + tB, s, t ∈ R.

Ejemplo 4.17. Encuentre la intersección entre el plano π1 que pasa por (1, 1, 1) y es gene-
rado por los vectores (2, −1, 3) y (−1, 0, 2), y el plano π2 que pasa por (2, 3, 1) y es generado
por los vectores (1, 2, 3) y (3, 2, 1).

Solución. Las respectivas ecuaciones vectoriales para los planos π1 y π2 son

π1 (s, t) = (1, 1, 1) + s(2, −1, 3) + t(−1, 0, 2), π2 (p, q) = (2, 3, 1) + p(1, 2, 3) + q(3, 2, 1).

De tal forma que si (x, y, z) ∈ π1 , entonces

x = 1 + 2s − t, y = 1 − s, z = 1 + 3s + 2t.

Estas ecuaciones son llamadas ecuaciones paramétricas del plano. Ahora, para hallar la
ecuación cartesiana de este, una de las formas de proceder es eliminar los parámetros s y t
de las ecuaciones paramétricas. Al despejar el parámetro s en la ecuación para y obtenemos
s = 1 − y. Reemplazando este valor en la ecuación para x

x = 1 + 2(1 − y) − t.

De la ecuación anterior despejando t obtenemos t = 1 + 2(1 − y) − x. Ya tenemos los


parámetros s, t como función de y y x, al sustituirlos en la ecuación para z nos da

z = 1 + 3(1 − y) + 2(1 + 2(1 − y) − x) = 10 − 7y − 2x.

Luego la ecuación cartesiana de π1 es

2x + 7y + z = 10.

Otra forma de hallar la ecuación cartesiana de un plano dada su forma paramétrica, es la


que utilizaremos a continuación con π2 . Como el plano es generado por los vectores (1, 2, 3)

168
y (3, 2, 1) su vector normal es obtenido como el producto cruz entre estos (ver el Problema
4.12.1), es decir,

i j k

n2 = (1, 2, 3) × (3, 2, 1) = 1 2 3 = i(−4) − j(−8) + k(−4) = (−4, 8, −4) = 4(−1, 2, −1).
3 2 1

Como además, π2 pasa por (2, 3, 1), podemos utilizar la fórmula (4.41) para obtener

(−1)x + (2)y + (−1)z = (−1)2 + (2)3 + (−1)1,

de donde la ecuación cartesiana de π2 es

x − 2y + z = −3.

4.13. Aplicaciones de los vectores en el espacio


4.13.1. Movimiento en tres dimensiones
Cuando una partı́cula se desplaza en tres dimensiones su movimiento es modelado me-
diante una función vectorial

α(t) = (x(t), y(t), z(t)) = (x, y, z).

Para cada valor de t



Problema 4.13.1. Una partı́cula se lanza desde el plano x + y − 3z = 2 en el punto

(1, 1, 3) en dirección normal a este en el tiempo t = 0 con una rapidez de 10 unidades por
segundo ¿Cuándo y dónde cruza el plano xy?

4.14. Problemas

Vectores en el plano
Problema 4.14.1. De las siguientes afirmaciones, demuestre las que son verdaderas y de
un contraejemplo para las que son falsas

(a) Sean A, B vectores de Rn . Los vectores kAkB+kBkA y kAkB−kBkA son ortogonales.

(b) Los vectores A − B y A + B son ortogonales.

169
(c) Sean A, B vectores de Rn . Entonces
1 1
A · B = kA + Bk − kA − Bk
4 4

(d) Sean A, B vectores de Rn . Entonces

kA + Bk2 + kA − Bk2 = 2(kAk2 + kBk2 )

(e) Sean A, B vectores de R2 . El vector kBkA + kAkB biseca al ángulo entre A y B.

(f) Si A = (2, k) y B = (3, 5) existe valores de k tales que el ángulo entre A y B es π/4.

(g) Sean A, B vectores de R2 . Si el ángulo entre A y C es igual al ángulo entre B y C,


entonces el vector C es ortogonal al vector kBkA − kAkB.

Problema 4.14.2. Sea A = (a, b) un vector de R2 . Si la magnitud de A se define por

kAk = |a| + |b|.

Demostrar k · k define una norma. Es decir, satisface las propiedades de (a) hasta (f) del
Teorema 3.1.2.

Problema 4.14.3. Sean A = (1, 2) y B = (3, 4). Dado (x, y) en R2 , encuentre escalares α
y β, que dependan de x, y tales que

(x, y) = αA + βB

(x, y)
b

O
x

Figura 4.33: En la figura: A = (4, 1) y B = (2, 4). Si se quiere expresar (x, y) = (3, 5/2)
como combinación lineal de A y B, escogemos α = 1/2 y β = 1/2 y de esta forma vemos
que (x, y) = (1/2)A + (1/2)B.

Movimiento en una dimensión


170
Problema 4.14.4. La altura de una partı́cula en función del tiempo viene dada por la
parábola

y = y(t)

101,25

50

x
O 9 9
2

Figura 4.34: Gráfica de la posición de una partı́cula respecto al tiempo

(a) Utilizar la gráfica que se muestra el la figura 4.34 para hallar el domino de la función
que representa la altura de la partı́cula como función del tiempo, ¿qué representa este
dominio?

(b) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.

(c) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.

(d) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.

Problema 4.14.5. La altura de una partı́cula en función del tiempo viene dada por la
parábola

171
y = y(t)

500

250

x
O 10 20

(a) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.

(b) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.

(c) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.

Sección 4.9. Movimiento en el plano


Problema 4.14.6. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).

(a) Halle el vector posición de un punto de su borde, si está inicialmente en O.

(b) Halle las componentes de la velocidad y aceleración del punto.

(c) Dibuje la velocidad y la aceleración del punto.

(d) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.

Problema 4.14.7. La posición de una partı́cula en el momento t está dada por elipse

x2 y 2
+ = 1.
9 4

172
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por

x2 + y 2 + 6x − 2y = −9

Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.

(a) Halle el vector posición para ambas partı́culas.

(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.

Problema 4.14.8. La posición de una partı́cula en el momento t está dada por elipse

x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por

x2 + y 2 − 6x − 2y = −9.

Esta segunda partı́cula empieza su movimiento en el punto (4, 1) y sigue la dirección contraria
de las manecillas del reloj completando una revolución.

(a) Halle el vector posición para ambas partı́culas

(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.

Problema 4.14.9. La posición de una partı́cula en el momento t está dada por

x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π

y una segunda partı́cula tiene posición

x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π

(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

173
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión

(c) Describa la situación si la segunda partı́cula tiene la trayectoria

x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.

Problema 4.14.10 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m
y la parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta
completa cada 20s, determine el vector posición de una persona que va sentada en la rueda.
Suponga que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta
moviendo la persona?

Problema 4.14.11. Suponga que ajusta la boquilla de una manguera para que el agua salga
más rápido. La boquilla de la manguera se encuentra a 1,8m del suelo, y mientras el agua
sale rápidamente de esta, 2,5s se escucha cuando golpea el suelo. Cuál es la velocidad del
agua, cuando esta deja la boquilla?

Problema 4.14.12. Una osada nadadora se lanza desde un risco con un impulso horizontal.
Si el risco tiene una altura H0 y en la parte inferior hay una saliente de roca, cuya extensión
horizontal es de x0 , cual debe ser la velocidad inicial para que la nadadora no choque con la
roca y caiga directamente sobre el agua?

Problema 4.14.13. Una rueda de la fortuna de 14,0m de radio gira sobre un eje horizontal
en el centro. La rapidez lineal de un pasajero en el borde es constante igual a 7,00m/s. ¿Qué
magnitud y dirección tiene la aceleración del pasajero al pasar

(a) Por el punto más bajo de su movimiento circular?

(b) Por el punto más alto de su movimiento circular?

(c) ¿Cuánto tarda una revolución de la rueda?

Problema 4.14.14. Una rueda de la fortuna de 14,0m de radio que gira en sentido antiho-
rario, se acaba de poner en movimiento. En un instante dado, un pasajero en el borde de la
rueda que está pasando por el punto más bajo de su movimiento circular tiene una rapidez
de 3,00m/s, la cual está aumentando a razón de 0,500m/s2 .

(a) Calcule la magnitud y la dirección de la aceleración del pasajero en este instante.

(b) Dibuje la rueda de la fortuna y el pasajero mostrando sus vectores de velocidad y ace-
leración.

Problema 4.14.15. Remı́tase al problema 4.9.3.

174
(a) Qué ángulo φ da el alcance máximo sobre la rampa?

(b) Un arquero parado en un terreno con inclinación ascendente constante de 30◦ apunta
hacia un blanco situado 60,0m más arriba del plano. La flecha en el arco y el centro del
blanco están ambos a 1,50m sobre el suelo. Justo al salir del arco, la rapidez inicial de
la flecha es de 32,0m/s. ¿Con qué ángulo sobre la horizontal debe apuntar el arquero
para dar en el blanco? Si hay dos ángulos, calcule el menor. Tal vez necesite resolver
la ecuación del ángulo por iteración, es decir, ensayo y error. Compare el ángulo con
el que se necesita cuando el suelo está horizontal.

(c) Repita con una pendiente constante hacia abajo de 30◦ .

Problema 4.14.16. Un cohete diseñado para colocar cargas pequeñas en órbita se lleva hasta
una altitud de 12,0km sobre el nivel del mar, montado en un avión comercial convertido.
Cuando el avión está volando en lı́nea recta, con rapidez constante de 850km/h, deja caer
el cohete. Después, el avión mantiene la misma altitud y rapidez, y sigue volando en lı́nea
recta. El cohete cae durante un lapso corto, después del cual se enciende el motor. A partir
de ese momento, los efectos combinados del empuje y la gravedad imparten al cohete una
aceleración constante de magnitud 3,00g dirigida con un ángulo de 30◦ arriba de la horizontal.
Por motivos de seguridad, el cohete deberá estar por lo menos a 1,00km adelante del avión
cuando vuelva a alcanzar la altitud de éste. Hay que determinar el tiempo mı́nimo que el
cohete debe caer antes de que su motor se encienda. Se puede ignorar la resistencia del aire.
La respuesta debe incluir i) un diagrama que muestre las trayectorias de vuelo del cohete y del
avión, rotuladas en varios puntos con vectores que representen su velocidad y su aceleración;
ii) una gráfica x − t que muestre los movimientos del cohete y del avión; y iii) una gráfica
y − t que muestre los movimientos del cohete y del avión. En el diagrama y las gráficas,
indique los momentos cuando el cohete se deja caer, el motor del cohete se enciende y el
cohete en ascenso alcanza la altura del avión.

Problema 4.14.17. Dos estudiantes pasean en canoa por un rı́o. Yendo rı́o arriba, dejan
caer accidentalmente una botella vacı́a al agua, después de lo cual reman durante 60 minutos
hasta llegar a un punto a 2,0km rı́o arriba. En ese momento, se dan cuenta de que la botella
no está y, preocupados por la ecologı́a, se dan vuelta y reman rı́o abajo. Alcanzan la botella
(que se ha estado moviendo con la corriente) 5,0km rı́o abajo del punto donde se dieron la
vuelta, y la recogen. a) Suponiendo un esfuerzo de paleo constante todo el tiempo, ¿con qué
rapidez fluye el rı́o? b) ¿Qué rapidez tendrı́a la canoa en un lago tranquilo con el mismo
esfuerzo de paleo?

Problema 4.14.18. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en direc-


ción contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando

175
√ √
su movimiento en el punto (1/ 2, 1/ 2) y terminando en el punto (1, 0). Calcular el trabajo
que realiza el campo de fuerza

F(x, y) = (−2y, 2x)

sobre la partı́cula. Dibujar el vector posición, el vector tangente y el vector fuerza.

Problema 4.14.19 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en


dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa. Resuelva este problema de dos formas distintas.

Subsección 3.2.1. Vector resultante


Problema 4.14.20 (Navegación: dirección y rumbo). Un piloto parte de un aeropuerto y
se dirige en dirección N 20◦ E, volando con una rapidez de 200 mi/h. Después de una hora
hace una corrección de curso y se dirige en la dirección N 40◦ E. Media hora después, un
problema en el motor obliga a hacer un aterrizaje de emergencia.

(a) Encuentre la distancia entre el aeropuerto y su punto de aterrizaje final.

(b) Encuentre el rumbo desde aeropuerto hasta su punto final de aterrizaje.

Problema 4.14.21. Sean A y B dos vectores de R2 . Utilizar el teorema del coseno (ver
ejemplo 2.2) para demostrar que

kRk2 = kA + Bk2 = kAk2 + kBk2 + 2kAkkBk cos θ, (4.43)

donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Hacer las gráfica correspondiente.

Subsección 3.5. Movimiento relativo


Problema 4.14.22 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?

Problema 4.14.23 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.

(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.

176
(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.

(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.

(d) Determine la rapidez y dirección verdaderas del bote.

Problema 4.14.24 (Velocidad de un bote). El navegador del problema 4.14.23 quiere llegar
a un punto en la orilla norte del rı́o directamente opuesto la punto de partida. ¿En qué
dirección debe dirigir el bote?

Sección 4.10. Vectores en el espacio


Problema 4.14.25. Sean A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) y C = (c1 , c2 , c3 ), D = (d1 , d2 , d3 )
−→ −→
puntos de R3 . Demuestre que si los vectores geométricos AB y CD tienen como dirección un
vector unitario u, y además tienen la misma magnitud, entonces son equivalentes. Use este
hecho para demostrar que todo vector cuyo punto inicial coincide con el origen, y punto final
A tiene coordenadas (a, b, c) es equivalente a cualquier vector geométrico que tenga la misma
−→
magnitud y dirección que este. Es decir, si el vector geométrico CD donde C = (c1 , c2 , c3 ) y
−→
D = (d1 , d2 , d3 ) tiene la misma magnitud y dirección que el vector OA= (a, b, c), entonces
−→ −→
A =OA=CD .

Sección 4.11. Producto cruz


Problema 4.14.26 (Examen conjunto de Álgebra lineal 6 de junio de 2018 punto 10).
En la plazoleta principal de la Universidad se quiere construir en centro de descanso para
los estudiantes. La plazoleta tendrá un techo cubierto en forma triangular. El ingeniero
encargado ubicó los soportes en los puntos A = (2, 3, 3), B = (5, 6, 4) y C = (3, 6, 8) con
cada entrada medida en metros.

(a) El techo se sostendrá con alambre de acero, indique la cantidad de alambre que se
necesita para sostener el techo.

(b) El techo utilizará una lona de color blanco, indique la cantidad de metros cuadrados
empleados en el techo.

Problema 4.14.27. Demuestre que si u, v, w y r son vectores en el espacio, entonces

(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.

177
(b) u × v = (u · v × i)i + (u · v × j)j + (u · v × k)k.

u · w v · w
(c) (u × v) · (w × r) = .
u·r v ·r
Problema 4.14.28. Utilice el producto cruz para demostrar que
sen(A − B) = sen A cos B − sen B cos A.

Sección 4.12. Rectas y planos en el espacio


Problema 4.14.29. Utilice el Teorema 5.5.1 para demostrar que los tres puntos, (1, 2, 1),
(0, 1, 0) y (1, 1, 4) determinan un plano. Hallar la ecuación vectorial y cartesiana de dicho
plano.
Problema 4.14.30. Calcule la distancia entre las rectas
x − b1 y − b2 z − b3 x − d1 y − d2 z − d3
L1 : = = y L2 : = =
a1 a2 a3 c1 c2 c3
Sugerencia: La distancia se mide a lo largo del vector v que es perpendicular a L1 y a L2 .
−→
Sea P un punto de L1 y Q un punto de L2 . Entonces la longitud de la proyección de P Q
sobre v es la distancia entre las rectas, medida a lo largo del vector que es perpendicular a
ambas.
Problema 4.14.31. Demuestre que la distancia del punto P0 = (x0 , y0, z0 ) al plano
π = (x, y, z) ∈ R3 : ax + by + cz + d = 0 ,


está dada por


|ax0 + by0 + cz0 + d|
dmı́n = √ .
a2 + b2 + c2
Problema 4.14.32. Demuestre que

x1 − x y1 − y z1 − z

x2 − x y2 − y z2 − z = 0

x − x y − y z − z
3 3 3

es una ecuación del plano que pasa por los tres puntos no colineales
P1 (x1 , y1, z1 ), P2 (x2 , y2, z2 ) y P3 (x3 , y3 , z3 ).

Sección 4.13. Aplicaciones de los vectores en el espacio


Problema 4.14.33 (***). Una partı́cula se desplaza sobre la curva de intersección de las

superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.

178
4.15. Taller 2 corte 2 parte 1
Problema 4.15.1 (Velocidad de un avión respecto a la tierra). Encuentre la rapidez y
dirección verdaderas del avión del problema 3.3.1 si el piloto dirige el avión en la dirección
N 30◦ O.

Problema 4.15.2 (Velocidad de un avión respecto a la tierra). ¿En qué dirección debe
dirigir el avión el piloto del problema 3.3.1 para que el curso verdadero sea al norte?

Problema 4.15.3. De las siguientes afirmaciones, demuestre las que son verdaderas y de
un contraejemplo para las que son falsas

(a) Sean A, B vectores de Rn . Los vectores kAkB+kBkA y kAkB−kBkA son ortogonales.

(b) Los vectores A − B y A + B son ortogonales.

(c) Sean A, B vectores de Rn . Entonces


1 1
A · B = kA + Bk − kA − Bk
4 4

(d) Sean A, B vectores de Rn . Entonces

kA + Bk2 + kA − Bk2 = 2(kAk2 + kBk2 )

(e) Sean A, B vectores de R2 . El vector kBkA + kAkB biseca al ángulo entre A y B.

(f) Si A = (2, k) y B = (3, 5) existe valores de k tales que el ángulo entre A y B es π/4.

(g) Sean A, B vectores de R2 . Si el ángulo entre A y C es igual al ángulo entre B y C,


entonces el vector C es ortogonal al vector kBkA − kAkB.

Problema 4.15.4. Sea A = (a, b) un vector de R2 . Si la magnitud de A se define por

kAk = |a| + |b|.

Demostrar k · k define una norma. Es decir, satisface las propiedades de (a) hasta (f) del
Teorema 3.1.2.

Problema 4.15.5. En la figura 4.35 considere un peso suspendido por dos alambres. Obtenga
la magnitud y componentes de los vectores F1 y F2 , y los ángulos α y β. Ver el problema
4.9.4.

179
5m
α β

F1 F2
3m
4m

100N

Figura 4.35: Una masa de peso 100N es suspendida por dos alambres representados por los
vectores F1 y F2

Recuerde que 1N = 1Kg · m/s2 .


Problema 4.15.6 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?
Problema 4.15.7 (***). Un piloto tiene que volar hacia el este de A a B y después regresar
hacia el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto
a la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.

(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c

(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2

(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2

(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?

Realizar las gráficas correspondientes para ilustrar la situación.

Ver el problema 3.5.1 para solución del caso 1 del inciso (b), y el caso 1 del inciso (c).

180
Problema 4.15.8 (***). Dos nadadores, Alan y Camillé, parten desde el mismo punto en la
orilla de una corriente ancha que circula con una rapidez v. Ambos se mueven con la misma
rapidez c (donde c > v) en relación con el agua. Alan nada corriente abajo una distancia L
y luego corriente arriba la misma distancia. Camillé nada de modo que su movimiento en
relación con la Tierra es perpendicular a las orillas de la corriente. Ella nada la distancia
L y luego de vuelta la misma distancia, de modo que ambos nadadores regresan al punto de
partida. ¿Cuál nadador regresa primero? Sugerencia: Demuestre que si c > v > 0, entonces

0 < 1 − v 2 /c2 < 1. Gráfique en un mismo plano cartesiano las funciones y = 1/ x y
y = 1/x para saber que relación de orden guardan en el intervalo (0, 1). Utilice este hecho
para establecer que nadador regresa primero al punto de partida.

Problema 4.15.9 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.

(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.

(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.

(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.

(d) Determine la rapidez y dirección verdaderas del bote.

Problema 4.15.10. La posición de una partı́cula en el momento t está dada por elipse

x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por

x2 + y 2 + 6x − 2y = −9

Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.

(a) Halle el vector posición para ambas partı́culas.

(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.

181
4.16. Taller 2 corte 2 parte 2
Problema 4.16.1. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).

(a) Halle el vector posición de un punto P de su borde, si está inicialmente en O.

(b) Halle las componentes de la velocidad y aceleración del punto P .

(c) Muestre que la rapidez del punto P en el instante t está dada por
V0 t
kv(t)k = kα′ (t)k = 2V0 sen .
2R

(d) Dibuje la velocidad y la aceleración del punto.

(e) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.

Problema 4.16.2. La posición de una partı́cula en el momento t está dada por elipse

x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por

x2 + y 2 + 6x − 2y = −9

Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.

(a) Halle el vector posición para ambas partı́culas.

(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.

Problema 4.16.3. La posición de una partı́cula en el momento t está dada por

x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π

y una segunda partı́cula tiene posición

x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π

182
(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión

(c) Describa la situación si la segunda partı́cula tiene la trayectoria

x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.

Problema 4.16.4. Una partı́cula se desplaza sobre la circunferencia x2 +y 2 = 4 en dirección


contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando su
movimiento en el punto (2, 0). Una segunda partı́cula su mueve sobre la circunferencia

x2 + y 2 − 4x = 0,

en dirección contraria a las de las manecillas del reloj con una rapidez constante de 4m/s
empezando su movimiento en el punto (4, 0).

(a) Grafique las trayectorias seguidas por ambas partı́culas.

(b) Halle el vector posición de cada partı́cula.

(c) Halle los puntos, o punto de colisión de las partı́culas.

Problema 4.16.5 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en


dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa.

Problema 4.16.6. Una avión tiene una rapidez en el aire de 250mi/h, el piloto desea volar
hacia el norte. Suponiendo que prevalezca un viento de 60mi/h hacia el este,

(a) ¿cuál debe ser el enfilamiento del avión?

(b) ¿Cúal será la rapidez a tierra cuando viaja en dicho curso?.

Realizar las gráficas correspondientes para ilustrar la situación.

Problema 4.16.7. Una pelota de golf es golpeada con una rapidez inicial v0 formando un
ángulo α con respecto a la horizontal desde un punto que está al pie de una colina que forma
un ángulo de inclinación φ con la horizontal donde

0 < φ < α < π/2.

183
Demuestre que la pelota toca tierra a una distancia
2v02 cos α
sen(α − φ),
g cos2 φ
medida sobre la colina. Demuestre que el mayor alcance que se puede lograr para un v0 dado
ocurre cuando α = (φ/2) + (π/4); es decir, cuando el vector velocidad inicial biseca el ángulo
entre la vertical y la colina.

Problema 4.16.8. Sean A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) y C = (c1 , c2 , c3 ), D = (d1 , d2 , d3 )


−→ −→
puntos de R3 . Demuestre que si los vectores geométricos AB y CD tienen como dirección un
vector unitario u, y además tienen la misma magnitud, entonces son equivalentes. Use este
hecho para demostrar que todo vector cuyo punto inicial coincide con el origen, y punto final
A tiene coordenadas (a, b, c) es equivalente a cualquier vector geométrico que tenga la misma
−→
magnitud y dirección que este. Es decir, si el vector geométrico CD donde C = (c1 , c2 , c3 ) y
−→
D = (d1 , d2 , d3 ) tiene la misma magnitud y dirección que el vector OA= (a, b, c), entonces
−→ −→
A =OA=CD .

Problema 4.16.9. Demuestre que si u, v, w y r son vectores en el espacio, entonces

(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.

(b) u × v = (u · v × i)i + (u · v × j)j + (u · v × k)k.



u · w v · w
(c) (u × v) · (w × r) = .
u·r v ·r

Problema 4.16.10. Utilice el producto cruz para demostrar que

sen(A − B) = sen A cos B − sen B cos A.

Problema 4.16.11. Utilice el Teorema 5.5.1 para demostrar que los tres puntos, (1, 2, 1),
(0, 1, 0) y (1, 1, 4) determinan un plano. Hallar la ecuación vectorial y cartesiana de dicho
plano.

Problema 4.16.12. Calcule la distancia entre las rectas


x − b1 y − b2 z − b3 x − d1 y − d2 z − d3
L1 : = = y L2 : = =
a1 a2 a3 c1 c2 c3
Sugerencia: La distancia se mide a lo largo del vector v que es perpendicular a L1 y a L2 .
−→
Sea P un punto de L1 y Q un punto de L2 . Entonces la longitud de la proyección de P Q
sobre v es la distancia entre las rectas, medida a lo largo del vector que es perpendicular a
ambas.

184
Problema 4.16.13. Demuestre que

x1 − x y1 − y z1 − z

x2 − x y2 − y z2 − z = 0

x − x y − y z − z
3 3 3

es una ecuación del plano que pasa por los tres puntos no colineales

P1 (x1 , y1, z1 ), P2 (x2 , y2, z2 ) y P3 (x3 , y3 , z3 ).

Problema 4.16.14. Dos barcos maniobran en la superficie tratando de determinar el curso


y la rapidez de un submarino para preparar un ataque aéreo. El barco A está en (4, 0, 0),
mientras el barco B está en (0, 5, 0). Todas las coordenadas están dadas en miles de pies. El
barco A localiza el submarino en la dirección del vector 2i + 3j − (1/3)k, y el barco B en la
dirección del vector 18i − 6j − k. Cuatro minutos antes, el submarino estaba localizado en
(2, −1, −1/3). Se que el avión para el ataque aéreo llegue en 20 minutos. Si el submarino
se desplaza en linea recta a velocidad constante, ¿a qué posición deben dirigir los barcos el
avión?
Problema 4.16.15 (***). Una partı́cula se desplaza sobre la curva de intersección de las

superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.
Problema 4.16.16. Demuestre que la distancia de un punto (x0 , y0 , z0 ) al plano π de ecua-
ción ax + by + cz + d = 0 está dada por
|ax0 + by0 + cz0 |
d= √ .
a2 + b2 + c2
Problema 4.16.17. Una partı́cula sigue la trayectoria dada por la intersección de los planos
x + 2y + 3z = 0
2x − y − z = 0.
La partı́cula pasa por el punto (−1/5, −7/5, 1) en el tiempo t = 0 y tiene una rapidez de 2
metros por segundo. Hallar el vector posición de la partı́cula.

Problema 4.16.18. Una partı́cula se lanza desde el plano x + y − 3z = 2 en el punto

(1, 1, 3) en dirección normal a este en el tiempo t = 0 con una rapidez de 10 unidades por
segundo ¿Cuándo y dónde cruza el plano xy?
Problema 4.16.19. Una partı́cula parte desde el punto P0 = (2, 3, 4) en dirección normal
al plano x + y + z = 1. La partı́cula corta al plano en un punto P1 después de 3s. Hallar el
vector posición de la partı́cula.

185
4.17. Método de los mı́nimos cuadrados
4.17.1. Punto de vista del cálculo
Supongamos que tenemos un conjunto de n puntos distribuidos en plano xy, generando
lo que se conoce como nube de puntos, o gráfico de dispersión (ver la figura 4.36). El objetivo
es encontrar la ecuación de la recta que mejor ajuste el conjunto de datos, la cual se conoce
como recta de mı́nimos cuadrados o recta de regresión, correspondiente a los datos
(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ), con este fin en mente consideramos cada una de las diferencias,
entre el valor real, y = yi y el valor estimado correspondiente al dato xi , y = y est = axi +b:

ei = yi − y est = yi − (axi + b),

el término ei se denomina residuo y describe el error en el ajuste del modelo en el i–ésimo


punto los datos. Como lo que se quiere, es que el error ei sea el menor posible, es razonable
pensar que la recta que mejor ajusta los datos es aquella que minimiza la suma de los
cuadrados de estos errores. El problema de los mı́nimos cuadrados se puede establecer
entonces como sigue: Encontrar números a y b tales que la suma

S(a, b) = e21 + e22 + · · · + e2n = (y1 − (ax1 + b))2 + (y2 − (ax2 + b))2 + · · · + (yn − (axn + b))2

sea mı́nima.
y

(x3 , y3 ) y = ax + b
b

(x1 , y1 )
b b

(x2 , y2 ) (x3 , ax3 + b)


b

b
(x2 , ax2 + b)
b

(x1 , ax1 + b)

x
O

Figura 4.36: Gráfico de dispersión para una nube de n puntos. En rojo, la recta que mejor
ajusta esta nube puntos

El problema se reduce entonces a encontrar el mı́nimo local de la función S(a, b). Utili-

186
zando la notación sigma tenemos que
n
X
S(a, b) = (axi + b − yi )2 .
i=1

por la linealidad de la derivada y la sumatoria obtenemos que


n
∂S ∂S X
= (axi + b − yi )2
∂a ∂a i=1
n
X ∂S
= (axi + b − yi )2
i=1
∂a
Xn
= 2(axi + b − yi )xi
i=1
n
X n
X n
X
= 2a x2i + 2b xi − 2 xi yi .
i=1 i=1 i=1

Por lo tanto, cuando igualamos a cero, la derivada parcial de la función S respecto a la


variable a obtenemos
n
X Xn Xn
2
2a xi + 2b xi − 2 xi yi = 0 (4.44)
i=1 i=1 i=1

Haciendo lo mismo pero con la derivada parcial de S respecto a la variable b nos da


n
∂S ∂S X
= (axi + b − yi )2
∂b ∂b i=1
n
X ∂S
= (axi + b − yi )2
i=1
∂b
n
X
= 2(axi + b − yi )
i=1
n
X n
X
= 2a x2i + 2bn − 2 yi .
i=1 i=1

Igualando a cero
n
X n
X
2a x2i + 2bn − 2 yi = 0. (4.45)
i=1 i=1

Despejando b en (4.45) obtenemos


n n
1X aX
b= yi − xi = y − ax. (4.46)
n i=1 n i=1

187
Ahora reemplazando la expresión del medio en (4.46) en (4.44)
n
X n
X n
X
2a x2i + 2b xi − 2 xi yi = 0 ⇔
i=1
n n n
!i=1n i=1
n
X 1X aX X X
a x2i+ yi − xi xi − xi yi = 0 ⇔
i=1
n i=1 n i=1 i=1 i=1
n n
!2 n n n
X
2 a X X 1X X
a xi − xi = xi yi − xi yi ⇔
n n
 i=1 i=1
!2 
i=1 i=1 i=1
n n n n n
X
2 1 X X 1X X
a  xi − xi  = xi yi − xi yi
i=1
n i=1 i=1
n i=1 i=1

Ahora, nótese que


Problema 4.17.1. Demuestre que para una muestra de tamaño n > 1 se tiene que
P 1P P
xi yi − xi yi P
(xi − x)(yi − y)
Sxy = n = . (4.47)
n−1 n−1
Utilizando (4.47) demuestre que
1 P 2
x2i −
P
( xi )
Sxx = Sx2 = n . (4.48)
n−1
Demostración. Por la propiedad distributiva y las propiedades del linealidad de la sumatoria
tenemos que
X X
(xi − x)(yi − y) = (xi yi − xi y + xyi − xy)
X X X X
= xi yi − (xi y) − (xyi ) + xy
X X X X X
= xi yi − (1/n) xi yi − (1/n) xi yi + nxy
X X X X X
= xi yi − (2/n) xi yi + (1/n) xi yi
X X X
= xi yi − (1/n) xi yi .

Multiplicando por 1/(n − 1) obtenemos (4.47).


P P
Ahora, supongamos que yi = xi para todo i, entonces xi = yi , x = y. Por lo tanto,
(4.47) nos proporciona la identidad
1 P 2
x2i −
P
( xi ) P
(xi − x)2
n = = Sx2 .
n−1 n−1

188
Nótese, que la parte derecha en la identidad anterior es la varianza muestral, Sx2 , por lo tanto,
si denotamos la parte izquierda por Sxx obtenemos (4.48).
Por lo demostrado en el problema 4.17.1 tenemos la ecuación
a(n − 1)Sx2 = (n − 1)Sxy ,
de donde
Sxy
a= .
Sx2
Luego,
Sxy
a= , b = y − ax
Sx2
es un punto critico para la función S. Demostraremos que este punto critico es un mı́nimo
local. En efecto, la matriz Hessiana para la función S, está dada por
 
Saa Sab
HS(a, b) =
Sba Sbb ,
donde
n n
∂2S X
2 ∂2S X ∂2S
Saa = =2 xi , Sba = Sab = =2 xi , Sbb = 2 = 2n.
∂a2 i=1
∂a∂b i=1
∂b

Por lo tanto, el determinante de la matriz Hessiana viene dado por


 !2 
Pn 2 Pn n n
Saa Sab 2 i=1 xi 2 i=1 xi X X
|HS(a, b)| = = Pn = 4 n x2i − xi 
Sba Sbb , 2 i=1 xi 2n,
i=1 i=1

Entonces por identidad (4.48) demostrada en el Problema 4.17.1, tenemos que


 !2 
n
X Xn
|HS(a, b)| = 4 n x2i − xi 
i=1 i=1
 !2 
n n
X 1 X
= 4n  x2i − xi 
i=1
n i=1

= 4n(n − 1)Sx2 > 0.


Como
n
∂2S X
|HS(a, b)| > 0 y = 2 x2i > 0,
∂a2 i=1

en (a, b) hay un mı́nimo local, como se querı́a demostrar. Hemos establecido que

189
Teorema 4.17.2. La recta que mejor ajusta el conjunto de datos (x1 , y1 ), . . . , (xn , yn ) en el
sentido de los mı́nimos cuadrados, está dada por y est(x) = ax + b donde
Sxy
a= y b = y − ax,
Sx2
donde la cantidad Sxy denominada covarianza muestral de las variables

X = (x1 , x2 , . . . , xn ), Y = (y1 , y2, . . . , yn ),

está dada por


Pn 1 Pn
( i=1 xi ) ( ni=1 yi )
P
i=1 xi yi − Pn
(xi − x)(yi − y)
Sxy = n = i=1 .
n−1 n−1
Hay una forma de saber, si dadas dos variables X, Y , estás tienen una fuerte relación
lineal, introduciendo lo que se conoce como coeficiente de correlación de las variables
X, Y , el cual viene dado por
Sxy
r= .
Sx Sy
Demostraremos que el coeficiente de correlación r de las variables X, Y siempre varia
entre −1 y 1. Este hecho es una consecuencia de la desigualdad de Cauchy–Schwarz
Teorema 4.17.3 (Desigualdad de Cauchy–Schwarz). Sean

X = (a1 , a2 , . . . , an ), Y = (b1 , b2 , . . . , bn ),

vectores de Rn . Entonces

|X · Y | ≤ kXkkY k. (4.49)

La igualdad en (4.49) se tiene si, y sólo si, existe x ∈ R tal que ai x + bi = 0 para todo
i = 1, 2, . . . , n.
Demostración. Nótese que por definición de producto punto entre vectores, y de magnitud
de un vector, la desigualdad (4.49) es la misma que
v v
Xn u Xn u n
u uX
2t
ai bi ≤ ai b2i (4.50)
t


i=1 i=1 i=1

Además, como la función f (x) := x2 es creciente si x ≥ 0, la desigualdad anterior es equiva-


lente a
n
!2 n n
X X X
ai bi ≤ a2i b2i . (4.51)
i=1 i=1 i=1

190
Para todo x ∈ R tenemos que
n
X
(ai x + bi )2 ≥ 0,
i=1

y por las propiedades de linealidad de la sumatoria


n n
! n
! n
X X X X
2 2 2
(ai x + bi ) = ai x + 2x ai bi + b2i .
i=1 i=1 i=1 i=1

En consecuencia, podemos afirmar que

Ax2 + 2xB + C ≥ 0 ∀x∈R , (4.52)

donde
n
X n
X n
X
A= a2i , B = ai bi y C = b2i
i=1 i=1 i=1

Ahora nótese que si A = 0, entonces ai = 0 para todo i = 1, 2, . . . , n, con lo cual ambos


miembros de (4.49) serian cero, y el resultado se tiene. Alternativamente, si A > 0, tomando
x = −B/A en (4.52) obtenemos que

B 2 ≤ AC.

Es decir, (4.49) se tiene.

Supongamos ahora que ai x + bi = 0 para todo i = 1, 2, . . . , n, entonces Ax2 + 2xB +


C = 0, y tomando x = −B/A, obtenemos que B 2 = AC, que es la igualdad en (4.49).
Recı́procamente, si la igualdad en (4.49) se tiene, esto es, B 2 = AC. Tenemos que

B 2 = AC ⇔ B 2 /A = C
2B 2 B 2
⇔ − =C
A A
2B 2 B 2
⇔− + +C =0
A A
 2  
−B −B
⇔A +2 B + C = 0.
A A
De lo cual se concluye que Ax2 + 2xB + C = 0 con x = −B/A, o lo que es lo mismo
n
X
(ai x + bi )2 = 0,
i=1

donde x = −B/A. Pero entonces tenemos que ai x + bi = 0 para todo i = 1, 2, . . . , n con


x = −B/A.

191
Ahora en la desigualdad de Cauchy–Schwarz, expresada en la forma (4.50) tomemos
ai = xi − x y bi = yi − y, donde x y y son la medias aritméticas de las variables

X = (x1 , x2 , . . . , xn ), Y = (y1 , y2, . . . , yn ),

respectivamente. La desigualdad que resulta es


v v
Xn u Xn u n
u uX
(xi − x)(yi − y) ≤ (xi − x)2 t (yi − y)2 ,
t

i=1 i=1 i=1

La cual, equivale a
√ √
|(n − 1)Sxy | ≤ n − 1Sx n − 1Sy .

Es decir,

Sxy
|r| = ≤ 1.
Sx Sy
Lo cual implica que −1 ≤ r ≤ 1, como se querı́a demostrar. En el mejor de los casos, todos
los puntos (x1 , y1 ), . . . , (xn , yn ), están sobre la recta de regresión, con lo cual tendrı́amos que
Sxy Sxy
yi = xi + y − x ∀1≤i≤n (4.53)
Sx2 Sx2
Ahora bien, según la demostración de la desigualdad de Cauchy–Schwarz, La igualdad en
(4.49) se tiene si, y sólo si, ai x + bi = 0 para todo i = 1, 2, . . . , n, donde
P
B ai bi
x=− =− P 2 .
A ai

Como estamos suponiendo que ai = xi − x y bi = yi − y, tendrı́amos que si |Sxy | = Sx Sy ,


entonces
P
(xi − x)(yi − y)
− P (xi − x) + yi − y = 0 ∀1≤i≤n ,
(xi − x)2
que es equivalente a (4.53). Es decir, si |r| = 1 todos los puntos (x1 , y1 ), . . . , (xn , yn ), están
sobre la recta de regresión, lo cual implica que si |r| se aproxima a 1, hay una fuerte relación
lineal entre las variables X, Y . En caso contrario, si |r| se aproxima a 0, la relación lineal
entre las variables X, Y es débil. Además, como la pendiente de la recta de regresión se
puede expresar en la forma
Sxy Sy Sxy Sy
a= 2
= · = r.
Sx Sx Sx Sy Sx

192
Concluimos que si r tiende a 1, hay una fuerte relación entre las variables X, Y , y al ser
r > 0, a > 0, lo cual implica que, la variable Y es directamente proporcional a la variable
X. Alternativamente, si r tiende a −1, también hay una fuerte relación entre las variables
X, Y , pero en este caso la variable Y es inversamente proporcional a la variable X, por que
al ser r < 0, la pendiente a es negativa.

Ejemplo 4.18. Una pintura abstracta fue vendida por el autor en 1915 por 100 dólares.
Debido a su importancia histórica, su valor ha venido aumentando al correr los años. Su
valor era 4600 dólares en 1935, de 11000 en 1955, y de 20000 en 1975. Suponiendo que el
valor del cuadro siga subiendo al mismo ritmo, use el método de mı́nimos cuadrados para
estimar su valor en 1995.

Solución. Se observa que en la variable X = (x1 , x2 , x3 , x4 ) los datos están organizados en


progresión aritmética, con x1 = 1915 y razón r = 20, por lo que

xi = 1915 + 20(i − 1) = 1895 + 20i.

Para este caso X, es la variable independiente, y

Y = (y1 , y2 , y3, y4 ) = (100, 4600, 11000, 20000),

la variable dependiente. Para calcular las respectivas desviaciones de las variables X, Y ,


Sx , Sy , ası́ como la covarianza Sxy , empezamos como sigue:
4
X 4
X 4
X 4
X
xi = (1895 + 20i) = 7780, x2i = (1895 + 20i)2 = 15 134 100
i=1 i=1 i=1 i=1

4
X
yi = 100 + 4600 + 11000 + 20000 = 35 700
i=1
X4
yi2 = 1002 + 46002 + 110002 + 200002 = 542 170 000
i=1

4
X
xi yi = 1915 × 100 + 1935 × 4600 + 1955 × 11000 + 1975 × 20000 = 70 097 500
i=1

s s
77802 35 7002
15 134 100 − 4
542 170 000 − 4
Sx = = 25. 820, Sy = = 8632. 3
3 3
7780×35 700
70 097 500 −
Sxy = 4
= 2. 203 3 × 105
3

193
Ahora podemos calcular el coeficiente de correlación

Sxy 2. 203 3 × 105


r= = = 0,988 53
Sx Sy 25. 820 × 8632. 3

Vemos que r es aproximadamente 1, lo cual indica por un lado, que existe una fuerte relación
entre las variables X, Y , y por el otro, que esta relación es positiva, es decir, la variable Y
es directamente proporcional a la variable X, esto es, el precio del cuadro aumenta progre-
sivamente con los años.

La pendiente a, de la recta de regresión, ası́ como las respectivos promedios de la variables


X, Y se calculan a continuación:

2. 203 3 × 105 7780 35 700


a= 2
= 330. 49, x = = 1945,0, y = = 8925,0
25. 820 4 4
Con esto el intercepto b con el eje y de la recta de regresión está dado por

b = y − ax = 8925,0 − 330. 49 × 1945,0 = −6. 338 8 × 105

Por la tanto, la ecuación de la recta de regresión es

y est(x) = ax + b = 330. 49x − 6. 338 8 × 105 .

Para x = 1995 estimamos el valor del libro en

y est(1995) = 330. 49 × (1995) − 6. 338 8 × 105 = 25448.

194
Capı́tulo 5

Espacios vectoriales

5.1. Definición y propiedades


Definición 5.1.1 (Espacio vectorial). Sea V un conjunto no vacı́o de objetos llamados
elementos. El conjunto V es llamado espacio vectorial sobre el campo F si satisface
cada uno de los siguientes diez axiomas

Axiomas de cerradura
Axioma 5.1.1 (Cerradura respecto a la suma). Para cada par elementos x, y ∈ V corres-
ponde un único elemento de V llamado suma de x, y, denotado por x + y.
Axioma 5.1.2 (Cerradura respecto al producto por escalar). Para cada x ∈ V y cada λ ∈ F
corresponde un único elemento de V llamado producto por escalar entre λ y x, denotado
por λx.
Axiomas para la suma
Axioma 5.1.3 (Ley conmutativa). Para todo x, y ∈ V , tenemos que

x + y = y + x.

Axioma 5.1.4 (Ley asociativa). Para todo x, y, z ∈ V , tenemos que

(x + y) + z = x + (y + z).

Axioma 5.1.5 (Existencia de elemento neutro). Para cada x ∈ V existe 0 ∈ V , tal que

x + 0 = x.

Axioma 5.1.6 (Existencia de inverso aditivo). Para cada x ∈ V existe y ∈ V denotado por
(−1)x tal que

x + (−1)x = 0.

195
Axiomas para el producto por escalar

Axioma 5.1.7 (Ley asociativa). Para x ∈ V y α, β ∈ F , tenemos que

α(βx) = (αβ)x.

Axioma 5.1.8 (Ley distributiva de la suma con respecto al producto por escalar). Para
x, y ∈ V y α ∈ F , tenemos que

α(x + y) = αx + αy.

Axioma 5.1.9 (Ley distributiva de la suma de escalares con respecto al producto por
escalar). Para x ∈ V y α, β ∈ F , tenemos que

(α + β)x = αx + βx.

Axioma 5.1.10 (Existencia de elemento identidad). Para x ∈ V , tenemos que

1x = x.

Cuando F = R, decimos que V es un espacio vectorial sobre el campo de los números


reales o espacio vectorial real. Si F = C, decimos que V es un espacio vectorial sobre el
campo de los números complejos o espacio vectorial complejo. A menudo nos referiremos a
los elemento de V como vectores.

5.1.1. Ejemplos de espacios vectoriales


Cada uno de los siguientes conjuntos es un espacio vectorial sobre el campo de los números
reales

Ejemplo 5.1. (a) Sea V = R, el conjunto de los números reales y F = R

(b) V = Rn , el espacio Euclideo de n dimensiones, con F = R y la suma y el producto por


escalar definidas como sigue. Para x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) en Rn y λ ∈ R

x + y = (x1 + y2 , . . . , xn + yn ), λx = (λx1 , . . . , λxn ).

(c) Sea V el conjunto de todos los vectores en Rn que son ortogonales a un vector no nulo
dado n.

(d) Sea V el conjunto de todas las funciones definidas en un intervalo dado I, con la suma
y producto por escalar usual de funciones, esto es,

(f + g)(x) = f (x) + g(x), (λf )(x) = λf (x).

196
(e) El conjunto de todas la matrices de tamaño m × n con entradas en los reales, esto es,
V = Mm×n (R).

Ejemplo 5.2. Demuestre que el conjunto de los números reales positivos forma un espacio
vectorial bajo las operaciones x + y = xy, λx = xλ .

Solución. Lo primero que debemos hacer es verificar los axiomas de cerradura. Sean x, y ∈
R+ y λ ∈ R. Entonces xy > 0, con lo cual x + y = xy ∈ R+ . Además, λx = xλ ∈ R+ , ya que
x ∈ R+ . La suma ası́ definida es conmutativa y asociativa. En efecto

x + y = xy = yx = y + x, (x + y) + z = (xy)z = x(yz) = x + (y + z).

para todo x, y, z ∈ R+ .

Sea x ∈ R+ , entonces se cumple la ley modulativa de la suma, esto es, existe 1 ∈ R+ tal
que

x + 1 = x(1) = x.

En este caso 0 = 1, es decir. el elemento neutro es el 1. Ahora, sabiendo que el elemento


neutro para la suma es el 1, debemos demostrar que todo x ∈ R+ tiene un inverso aditivo,
lo que nos lleva a plantear la ecuación

x + y = 1 ⇔ xy = 1 ⇔ y = 1/x.

Ası́, el inverso aditivo de x es 1/x. Verifiquemos los axiomas correspondientes a la multipli-


cación por escalar. Sean α, β ∈ R y x ∈ R+ .

α(βx) = (βx)α = (xβ )α = xβα = xαβ = (αβ)x.

Si x, yR+

α(x + y) = (x + y)α = (xy)α = xα y α = (αx)(αy) = αx + αy.

(α + β)x = xα+β = xα xβ = (αx)(βx) = αx + βx.

Finalmente,

1x = x1 = x,

para cada x ∈ R+ .

De los axiomas que definen un espacio vectorial, se deducen las siguientes propiedades

197
Teorema 5.1.11. Sea V un espacio vectorial sobre el campo F . Entonces

(a) α0 = 0 para todo α ∈ F .

(b) 0x = 0 para todo x ∈ V .

(c) Si αx = 0, entonce α = 0 o x = 0, o ambos.

(d) (−1)x = −x para todo x ∈ V .

5.2. Subespacios
Definición 5.2.1 (Subespacio). Sea H un subconjunto no vacı́o de un espacio vectorial V
que es en si mismo un espacio vectorial con las operaciones de suma y producto por escalar
definidas en V es llamado subespacio de V .

El siguiente resultado caracteriza los subesapcios de un espacio vectorial

Teorema 5.2.1. Un subconjunto no vacı́o H de un espacio vectorial V es un subespacio de


V si y sólo si se cumplen los axiomas de cerradura:

(a) Si x, y ∈ H, entonces x + y ∈ H.

(b) Si λ ∈ F, x ∈ H, entonces λx ∈ H.

Nota 5.2.1. El teorema 5.2.1 se puede enunciar de forma equivalente como sigue: Un sub-
conjunto no vacı́o H de un espacio vectorial V es un subespacio de V si y sólo si

αx + βy ∈ H,

para todos los escalares α, β ∈ F y todo x, y ∈ H.

Ejemplo 5.3. Para cualquier espacio vectorial V , el subconjunto H = {0} que consta úni-
camente del cero es un subesapcio de V . Ası́ mismo, V es subepacio de si mismo. Los subes-
pacios {0} , V son llamados subespacios triviales. Los subespacios distintos de {0} y V
son llamados subespacios propios.

Ejemplo 5.4 (Subespacio propio de R2 ). Toda recta que pasa por el origen es un subespacio
propio de R2 .

Ejemplo 5.5 (Subespacios propios de R3 ). Toda recta que pasa por el origen es un subespacio
propio de R3 . Ası́ mismo, todo plano que pasa por el origen es un subespacio propio de R3 .

Teorema 5.2.2. Sean H1 , H2 subespacios de un espacio vectorial V . Entonces H1 ∩ H2 es


un subespacio de V .

198
5.3. Combinación lineal y espacio generado
Definición 5.3.1 (Combinación lineal). Sean v1 , . . . , vn vectores de un espacio vectorial V .
Entonces cualquier vector de la forma

v = α1 v1 + · · · + αn vn ,

αi ∈ F , para todo 1 ≤ i ≤ n es llamado combinación lineal de los vectores v1 , . . . , vn .

Definición 5.3.2 (Espacio generado). Sea H = {v1 , . . . , vn } un subconjunto de espacio


vectorial V . Denotamos por gen H a el conjunto de todas las combinaciones lineales que
podemos formar con los vectores de H. Esto es,

gen H = {v : v = α1 v1 + · · · + αn vn , αi ∈ F, 1 ≤ i ≤ n} .

Nos referimos a gen H como espacio generado por el conjunto de vectores v1 , . . . , vn .

Teorema 5.3.1. Sea H un subconjunto de un espacio vectorial V . Entonces el generado por


H, gen H es un subespacio de V .

Demostración. Sean v, w ∈ H y α, β ∈ F . Entonces existen escalares α1 , . . . , αn y β1 , . . . , βn


en F tales que

v = α1 v1 + · · · + αn vn , w = β1 v1 + · · · + βn vn .

Por lo tanto,

αv + βw = α(α1 v1 + · · · + αn vn ) + β(β1 v1 + · · · + βn vn )
= αα1 v1 + · · · + ααn vn + ββ1 v1 + · · · + ββn vn
= (αα1 + ββ1 )v1 + · · · + (ααn + ββn )vn .

Ahora dado que ααi + ββi ∈ F para todo 1 ≤ i ≤ n, αv + βw ∈ H. Esto es, H es un


subespacio de V .

Definición 5.3.3 (Conjunto generador). Decimos que un conjunto H = {v1 , . . . , vn } genera


un espacio vectorial V si

gen H = V.

Ejemplo 5.6. Sea V = Pn , el conjunto de todos los polinomios de grado ≤ n, y F = R.


El conjunto V es un espacio vectorial real generado por n + 1− vectores. En efecto, sea
H = {1, x, x2 , . . . , xn }. Entonces

gen H = {p ∈ Pn : p(x) = a0 (1) + a1 x + · · · + an xn , ai ∈ R, 0 ≤ i ≤ n} = V.

199
5.4. Independencia lineal
Definición 5.4.1 (Dependencia lineal e independencia lineal). Sean v1 , . . . , vn n vectores
de un espacio vectorial V . Entonces se dice que los vectores son linealmente indepen-
dientes si toda combinación lineal de ellos igualada a 0 implica que todos los vectores de la
combinación son cero. Esto es,

α1 v1 + · · · + αn vn = 0 implica que α1 = · · · = αn = 0.

Si los vectores no son linealmente independientes, se dice que son linealmente dependien-
tes. Esto es, existen n escalares no todos cero tales que

α1 v1 + · · · + αn vn = 0.

Ejemplo 5.7. Sea V el espacio vectorial de todas las funciones de R en R. Determinar si


cada uno de los siguientes subconjuntos de V es dependiente o independiente.
(a) 1, eax , ebx , a 6= b.


(b) {cos x, sen x}.

(c) {ex , e−x , (ex + e−x )/2}.

(d) {cos2 x, sen2 x, 1}.


Solución. Consideremos una combinación lineal de las funciones 1, eax , ebx igualada a la
función cero, esto es,

α1 1 + α2 eax + α3 ebx = f (x)

donde f (x) = 0 para todo x ∈ R. Por lo tanto tenemos

α1 1 + α2 eax + α3 ebx = 0,

para todo x ∈ R. En particular, si x = 0 obtenemos la ecuación

α1 + α2 + α3 = 0.

Ahora generamos otro par de ecuaciones al tomar x = 1, luego x = −1:

α1 + α2 ea + α3 eb = 0, α1 + α2 e−a + α3 e−b = 0.

Luego tenemos el sistema lineal de ecuaciones homogéneas



 α1 + α2 + α3 = 0
α + α2 ea + α3 eb = 0
 1
α1 + α2 e−a + α3 e−b = 0

200
Que en forma matricial se expresa como
    
1 1 1 α1 0
1 ea eb  α2  = 0 (5.1)
1 e−a e−b α3 0

Aplicando Gauss–Jordan podemos simplificar el determinante de la matriz A de coeficientes


del sistema

1 1 1 R2 → −R1 + R2 1 1 1

a b a b
1 e
e R3 → −R1 + R3 0 e − 1 e − 1
1 e−a e−b ⇐⇒ 0 e−a − 1 e−b − 1

En consecuencia tenemos que



1 1 1 1 1 1
e = (ea − 1)(e−b − 1) − (e−a − 1)(eb − 1)

a b a b
det A := 1 e e = 0 e
1 e−a e−b 0 e−a e−b

Ahora, si det A = 0, tendrı́amos que

(ea − 1)(e−b − 1) − (e−a − 1)(eb − 1) = 0,

o equivalentemente

(ea − 1)(1 − eb ) (1 − ea )(eb − 1)


=
eb ea
Al multiplicar por −1 esta última ecuación obtenemos

(ea − 1)(eb − 1) (ea − 1)(eb − 1)


= ,
eb ea
de donde ea = eb , es decir a = b, lo cual es una contradicción puesto que estamos suponiendo
que a 6= b. Se debe tener entonces que det A 6= 0, lo cual implica que el sistema en (5.1) tiene
sólo la solución trivial, esto es, α1 = α2 = α3 = 0, es decir el conjunto dado es linealmente
independiente. Con cual tenemos el ı́tem (a).

Sean α1 y α2 escalares tales que

α1 cos x + α2 sen x = 0 ∀ x ∈ R.

En particular, si x = 0, α1 = 0, y si x = π/2, α2 = 0. Con lo cual, las funciones son


linealmente independientes.

201
Observese que
(−1/2)ex + (−1/2)e−x + (1)(ex + e−x )/2 = 0 ∀ x ∈ R.
Con lo cual, las funciones son linealmente dependientes.

Por la identidad fundamental sabemos que

(1) cos2 x + (1) sen2 x + (−1)(1) = 0 ∀ x ∈ R.


Esto significa que las funciones son linealmente dependientes.
Ejemplo 5.8 (**). Sean v1 , v2 dos vectores linealmente independientes de R3 . Demuestre
que el gen {v1 , v2 } es un plano que pasa por el origen. Hallar la ecuación cartesiana del plano.
Solución. Debemos demostrar que
gen {v1 , v2 } = π = {(x, y, z) : ax + by + cz = 0} .
Tomemos (x, y, z) ∈ gen {v1 , v2 }. Donde v1 = (a1 , b1 , c1 ) y v2 = (a1 , b1 , c1 ). Entonces existen
escalares s, t tales que
(x, y, z) = sv1 + tv2
Definamos n = v1 × v2 . En tal caso tenemos que
n · (x, y, z) = v1 × v2 · (sv1 + tv2 )
= v1 × v2 · sv1 + v1 × v2 · tv2
= s(v1 × v2 · v1 ) + t(v1 × v2 · v2 )
= 0.
Es decir, (x, y, z) ∈ π, donde
n = (a, b, c) = v1 × v2 = iA11 + jA12 + kA13 = (A11 , A12 , A13 ),
es el vector normal al plano. Recı́procamente, si (x, y, z) ∈ π, entonces ax + by + cz = 0

donde
a = A11 , b = A12 , c = A13 ,
Al menos uno de los escalares a, b, c es distinto de cero. Por ejemplo supongamos que c =
A13 6= 0. Debemos encontrar escalares s y t tales que
x = sa1 + ta2
y = sb1 + tb2
z = sc1 + tc2

202
Si consideramos sólo la primera y segunda ecuación, podemos encontrar estos escalares usan-
do la regla de Krammer:

x a2

y b2 b2 x − a2 y b2 x − a2 y
s= = = ,
a1 a2 a1 b2 − a2 b1 A13

b1 b2


a1 x

b1 y a1 y − b1 x
t= = .
a1 a2 A13

b1 b2
Entonces
b2 x − a2 y a1 y − b1 x
sv1 + tv2 = (a1 , b1 , c1 ) + (a2 , b2 , c2 )
A13 A13
 
a1 b2 x − a1 a2 y b1 b2 x − a2 b1 y b2 c1 x − a2 c1 y
= , ,
A13 A13 A13
 
a1 a2 y − a2 b1 x a1 b2 y − b1 b2 x a1 c2 y − b1 c2 x
+ , ,
A13 A13 A13
 
(a1 b2 − a2 b1 )x (a1 b2 − a2 b1 )y (b2 c1 − b1 c2 )x + (a1 c2 − a2 c1 )y
= , ,
A13 A13 A13
 
−ax − by
= x, y,
c
= (x, y, z).

Esto es, (x, y, z) ∈ gen {v1 , v2 }.


Teorema 5.4.1. Dos vectores de un espacio vectorial son linealmente dependientes si y sólo
si uno es múltiplo escalar del otro.
Se concluye del Teorema 5.4.1 que dos vectores de un espacio vectorial son linealmente
dependientes si y sólo si son paralelos.
Teorema 5.4.2. Sean v1 = (x1 , y1) y v2 = (x2 , y2 ) dos vectores de R2 , y sea A la matriz
formada por estos vectores, esto es,
   
v1 x1 y1
A := = .
v2 x2 y2
Entonces, los vectores v1 , v2 son linealmente dependientes ⇔ det A = 0. En consecuencia,
v1 , v2 son linealmente independientes ⇔ det A 6= 0.

203
Demostración. (⇒). Supongamos que v1 , v2 son linealmente dependientes. Entonces por el
Teorema 5.4.1 existe k ∈ R tal que v1 = kv2 . Pero entonces tenemos que
   
v1 x1 y1
det A = det = det = 0.
kv1 kx1 ky1

(⇐). Ahora, supongamos que v1 , v2 son linealmente independientes y que

xv1 + yv2 = (0, 0) (5.2)

Entonces por definición de independencia lineal tenemos que x = y = 0. Pero (5.2), es


equivalente a

(x1 x + x2 y, y1x + yy2 x) = (0, 0)

Lo que a su vez se puede escribir en forma matricial como sigue


    
x1 x2 x 0
= (5.3)
y1 y2 y 0

En consecuencia, si v1 , v2 son linealmente independientes, el sistema homogéneo en (5.3)


tiene una única solución, lo cual implica que
 
x1 x2
det 6= 0.
y1 y2

Finalmente, como el determinante de una matriz es igual a el determinante de su matriz


transpuesta, tenemos que
   
x1 y1 x1 x2
det A = det = det 6= 0.
x2 y2 y1 y2

Se demostró que si v1 , v2 son linealmente independientes, entonces det A 6= 0, o equivalente-


mente, si det A = 0, entonces v1 , v2 son linealmente dependientes.

Teorema 5.4.3. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2 ) dos vectores de R2 . Entonces gen {v1 , v2 }
es una recta que pasa por el origen, si v1 , v2 son linealmente dependientes y es R2 , si v1 , v2
son linealmente independientes.

Corolario 5.4.4. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2) dos vectores de R2 y A la matriz formada
por estos vectores, entonces

(a) gen {v1 , v2 } es una recta que pasa por el origen si sólo si det A = 0.

(b) gen {v1 , v2 } es R2 si sólo si det A 6= 0.

204
5.5. Interpretación geométrica de la independencia li-
neal en R3
Sean u, v y w tres vectores de R3 . Se define el triple producto escalar de estos vectores
como

w·u×v

En la figura 5.1 se muestra que si estos vectores son linealmente independientes determinan
un paralelepı́pedo.

u×v

h v

Figura 5.1: Construcción geométrica del triple producto escalar

Demostraremos que el volumen de este paralelepı́pedo es precisamente el valor absoluto


del triple producto escalar entre ellos.

Teorema 5.5.1. Sean u = (a1 , a2 , a3 ), v = (b1 , b2 , b3 ) y w = (c1 , c2 , c3 ) vectores no nulos de


R3 y A la matriz conformada por estos vectores:

a1 a2 a3
 

A =  b1 b2 b3 
c1 c2 c3

Entonces, det A 6= 0 si y sólo si u, v y w son linealmente independientes, más aún, si


det A 6= 0, los vectores determinan un paralelepı́pedo cuyo volumen está dado por

| det A| = |w · u × v|.

Demostración. Empecemos demostrando que

det A = w · u × v.

205
En efecto,
w · u × v = (c1 , c2 , c3 ) · (A11 , A12 , A13 )
= c1 A11 + c2 A12 + c3 A13 .
Entonces,
c1 c2 c3
 

w · u × v = c1 A11 + c2 A12 + c3 A13 = a1 a2 a3 


b1 b2 b3
Ahora, por la Propiedad 3 de los determinantes, Teorema 2.3.6, tenemos que
c1 c2 c3 a1 a2 a3 a1 a2 a3
     
a1 a2 a3  = −  c1 c2 c3  =  b1 b2 b3  = det A.
b1 b2 b3 b1 b2 b3 c1 c2 c3
Supongamos que los vectores u, v y w son linealmente dependientes. Entonces existen esca-
lares α1 , β1 y γ1 no todos cero tales que

α1 u + β1 v + γ1 w = 0.
Por ejemplo, si γ1 6= 0

w = αu + βv,

donde −α = α1 /γ1 y −β = β1/γ1. Con lo cual,


det A = w · u × v = (αu + βv) · u × v
= α(u · u × v) + β(v · u × v)
= 0.

Los otros dos casos surgen al suponer que α1 6= 0, o bien β1 6= 0 (ver el problema 5.11.13).

Demostramos que si los vectores u, v y w son linealmente dependientes, entonces det A =


0, pero esto es equivalente a decir que si det A 6= 0, entonces los vectores u, v y w son
linealmente independientes.

Recı́procamente, supongamos que

det A = w · u × v = 0.

Esto significa que el vector w es ortogonal al vector u × v, pero sabemos que este último
vector es el vector normal al plano generado por u y v. Es decir, w ∈ gen {u, v}, lo que cual
implica que existen escalares α y β tales que

w = αu + βv.

206
Ahora bien, si α y β son ambos cero, resulta que w = 0, lo cual contradice la hipótesis. Se
debe tener entonces que algunos de los escalares α o β es distinto de cero. Por lo tanto la
expresión

w − αu − βv = 0,

es una combinación lineal de los vectores u, v y w en la que no todos los escalares de la


combinación son cero, lo cual quiere decir que los vectores son linealmente dependientes.

Ahora bien, si det A 6= 0, entonces los vectores u, v y w son linealmente independientes,


por lo que ninguno de ellos puede ser un múltiplo escalar del otro. Por lo tanto, forman un
paralelepı́pedo (ver figura 5.1). Como se ve en esta gráfica, la altura del paralelepı́pedo es la
proyección escalar del vector w sobre el vector u × v, esto es,

h = k Proy wu×v k
|w · u × v|
=
ku × vk

Recordemos que ku × vk es igual al área del paralelogramos determinado por los vectores u
y v. Por lo que, si denotamos por V al volumen del paralelepı́pedo, encontramos que

V = ku × vkh
= |w · u × v|
= | det A|.

5.6. Bases y dimensión


Definición 5.6.1 (Base para un espacio vectorial). Un subconjunto finito de n vectores
B = {v1 , v2 , . . . , vn } es una base para un espacio vectorial V si

(a) B es linealmente independiente.

(b) gen B = V , esto es, B genera a V .

El espacio vectorial V es dimensión finita si tiene una base finita. De otro modo, V tiene
dimensión infinita.

Definición 5.6.2 (Dimensión de un espacio vectorial). Si espacio vectorial V tiene tiene


una base n elementos, el entero n se llama dimensión de V . Escribimos n = dim V . Si
V = {0}, definimos la dimensión de V como cero.

207
Teorema 5.6.1. Sea V espacio vectorial de dimensión finita n. Tenemos

(a) Cualquier conjunto linealmente independiente de V es un subconjunto de cierta base


para V .

(b) Cualquier conjunto de n elementos linealmente independientes es una base para V .

Ejemplo 5.9. El conjunto B = {e1 , e2 , . . . , en }, donde

e1 = (1, 0, . . . , 0)
e2 = (0, 1, . . . , 0)
..
.
en = (0, 0, . . . , 1),

es una base para Rn . Los vectores e1 , e2 , . . . , en se denominan vectores coordenados uni-


tarios de Rn y el conjunto B es llamado base canónica de Rn .

Teorema 5.6.2. Sea H un subespacio de un espacio vectorial de dimensión n. Entonces


dim H ≤ n.

Teorema 5.6.3. Los únicos subespacios no triviales de R3 son las rectas y planos que pasan
por el origen.

Demostración. Por el Teorema 5.6.2 si H es un subespacio propio de R3 , entonces dim H = 1,


o bien, dim H = 2. Si dim H = 1, el subespacio H es una recta que pasa por el origen (ver el
problema 5.11.6). Ahora bien, si dim H = 2. Escogemos una base B = {v1 , v2 } de H. Como
el conjunto B es linealmente independiente, por Ejemplo 5.8 sabemos que gen B es un plano
que pasa por el origen. Como gen B = H el teorema está demostrado.

Ejemplo 5.10. Sean H y K subespacios de un espacio vectorial V . Demuestre que si H∩K =


{0}, entonces dim(H + K) = dim H + dim K.

Solución. Sea B1 = {v1 , . . . , vm } una base para H, y B2 = {w1 , . . . , wn } una base para
K. Demostraremos que B = {v1 , . . . , vm , w1 , . . . , wn } es una base para H + K. Primero que
todo nótese que como B1 ⊆ H y B2 ⊆ K, entonces B1 ∩ B2 ⊆ H ∩ K = {0}. Esto es,

B1 ∩ B2 ⊆ {0} (5.4)

Y dado que B1 , B2 son linealmente independientes ninguno de estos conjuntos contiene al


vector cero. Por lo tanto la única forma de que se mantenga la contenencia (5.4) es que
B1 ∩ B2 = ∅. Lo cual implica que los vectores que conforman la base B son todos diferentes,
es decir, el conjunto B está conformado por m + n vectores. Ahora, tomemos v ∈ H + K,

208
entonces existe h ∈ H y k ∈ K tales que v = h + k. Además, existen escalares α1 , . . . , αm
y β1 , . . . , βn que cumplen que

h = α1 v1 + · · · + αm vm , k = β1 w1 + · · · + βn wn .

Con lo cual,

v = α1 v1 + · · · + αm vm + β1 w1 + · · · + βn wn ,

Lo cual quiere decir que v ∈ gen B. Demostramos que H + K ⊆ gen B. La otra contenencia
se obtiene de manera similar para concluir que gen B = H + K .

Para demostrar la independencia lineal de B nótese que si w1 ∈ gen B1 , entonces

w1 = α1 v1 + · · · + αm vm ∈ H.

Con lo cual, w1 ∈ H ∩ K, contradiciendo de nuevo el hecho que H ∩ K = {0}. Por lo tanto,


w1 ∈
/ gen B1 , pero esto implica que el conjunto

{v1 , . . . , vm , w1 } ,

pues si

α1 v1 + · · · + αm vm + αm+1 w1 = 0,

y αm+1 6= 0, tendrı́amos que

w1 = (α1 /αm+1 )v1 + · · · + (αm /αm+1 )vm .

Contradiciendo el hecho que w1 ∈


/ gen B1 . Se debemos tener entonces que αm+1 = 0, con lo
que

α1 v1 + · · · + αm vm = 0,

y la independencia de B1 implica que α1 = · · · = αm = 0. De esta misma forma demostramos


que el conjunto

{v1 , . . . , vm , w1 , w2 } ,

es linealmente independiente, ya que w2 ∈ / gen B1 . Vemos de esta manera que podemos ex-
tender el conjunto B1 para formar el conjunto B de tal forma que este último sea linealmente
independiente, y ası́ demostrar que B es una base para H + K. Finalmente tenemos que

dim(H + K) = m + n = dim H + dim K.

Como se querı́a demostrar.

209
5.7. Espacio de los renglones y espacio de las columnas
de una matriz
Sea A ∈ Mm×n (R) y sea

ker A = {x ∈ Rn : Ax = 0}

Entonces ker A es un subespacio de Rn llamado espacio nulo de la matriz A y ν(A) :=


dim(ker A) es llamado nulidad de A.

Ejemplo 5.11. Hallar la nulidad de la matriz

1 −1
 

A = 1 1 
1 0

Solución. Si vemos el vector (x, y) como columna tenemos que

1 −1   x−y
     
0
x
Ax = 1 1
  = x + y = 0
  
y
1 0 x 0

Con lo cual, x − y = 0, x + y = 0 y x = 0. Vemos entonces que ker T = {(0, 0)}, por lo que
ν(A) = 0.

Si A ∈ Mn×n (R) es una matriz invertible el sistema homogéneo Ax = 0 tiene como única
solución la trivial, por lo que tenemos el siguiente resultado

Teorema 5.7.1. Sea A ∈ Mn×n (R). Entonces A es invertible si y sólo si ν(A) = 0.

Definición 5.7.1 (Imagen y rango de una matriz). Si A ∈ Mm×n (R). Entonces la imagen
de A denotada por Im(A) se define como

Im(A) = {y ∈ Rm /∃ x ∈ Rm : y = Ax} .

La dimensión de la imagen de A se denota por ρ(A) y escribimos ρ(A) = dim(Im(A)).

Definición 5.7.2. Si A ∈ Mm×n (R) y sean {r1 , . . . , rm } los renglones de A y {c1 , . . . , cn }


los columnas de A. Entonces

FA = Espacio de los renglones de A = gen {r1 , . . . , rm }


CA = Espacio de las columnas de A = gen {c1 , . . . , cn }

Teorema 5.7.2. Si A ∈ Mm×n (R). Entonces, CA = Im(A).

210
El Teorema 5.7.2 nos dice que el espacio de las columnas de una matriz coincide con la
imagen de la matriz. Sin embargo, el espacio de los renglones de A no coincide con el ker A.
Ejemplo 5.12 (En general FA 6= ker A). Consideremos la matriz
 
1 2 −1
A=
2 −1 3
Aplicando Gauss-Jordan simplificamos la matriz para obtener
 
1 0 1
B=
0 1 −1
como las matrices A y B son equivalentes ker A = ker B, donde
   
  x  
1 0 1   0

ker B = (x, y, z) : y = ,
0 1 −1 0 
z

lo que conduce al sistema x + z = 0, y − z = 0, que representa las ecuaciones simétricas de


una recta que pasa por el origen:

ker A = {(x, y, z) : x = −z, y = z}


= {(−z, z, z) : z ∈ R}
= gen {(−1, 1, 1)} .

Vemos que ν(A) = 1. Por otro lado,

FA = gen {(1, 2, −1), (2, −1, 3)} ,

que es un plano que pasa por el origen, ya que los vectores (1, 2, −1) y (2, −1, 3) son lineal-
mente independientes. Vemos que dim(FA ) = 2 y que FA 6= ker A.
Ejemplo 5.13. Hallar la imagen y el rango de la matriz
 
1 2 −1
A=
2 −1 3
Solución. Por el Teorema 5.7.2
     
1 2 −1
Im(A) = CA = gen , ,
2 −1 3
Dado que

1 2
2 −1 = −1 − 4 6= 0,

211
tenemos que
   
1 2
gen , = R2
2 −1
Por lo tanto,
     
1 2 −1
Im(A) = CA = gen , , = R2 .
2 −1 3
Ası́ que, ρ(A) = 2.

El ejemplo precedente, junto con el ejemplo 5.12 nos muestra que dim(FA ) = 2 =
dim(Im(A)) = dim(CA ). Esto hecho no es una coincidencia.
Teorema 5.7.3. Si A ∈ Mm×n (R), entonces dim FA = dim CA = ρ(A).
El siguiente resultado nos dice que el proceso de hallar el núcleo y la imagen de una
matriz se reduce al hecho simplificarla mediante operaciones elementales.
Teorema 5.7.4. Sean A, B ∈ Mm×n (R), donde A es equivalente por renglones a B, entonces
FA = FB , CA = CB , ρ(A) = ρ(B) y ν(A) = ν(B).
Teorema 5.7.5. El rango de una matriz es igual al número de pivotes de su FER.
Ejemplo 5.14. La FER de la matriz
1 −1 3
 

A= 2 0 4
−1 3 1
es la matriz B dada por
1 −1 3
 

B = 0 1 −1 ,
0 0 0
dado que esta matriz presenta dos pivotes, por el Teorema 5.7.5, ρ(A) = 2.
Teorema 5.7.6 (Teorema de la dimensión para matrices). Sea A ∈ Mm×n (R). Entonces
ρ(A) + ν(A) = n.
Del Teorema de la dimensión para matrices concluimos que
ν(A) = el número de columnas de la FER de A que no contienen pivotes.
Teorema 5.7.7. Sea A ∈ Mm×n (R). Entonces A es invertible si y sólo si ρ(A) = n.
Teorema 5.7.8. Sea A ∈ Mm×n (R). El sistema Ax = b tiene al menos una solución si y
sólo si b ∈ CA . Esto ocurre si y sólo si A y la matriz aumentada (A|b) tienen el mismo
rango.

212
5.8. Cambio de base

5.9. Bases ortonormales y proyecciones en Rn

5.10. Espacios con producto interno

5.11. Problemas

Sección 5.1 Definición y propiedades de un espacio


vectorial
Problema 5.11.1. Demuestre que el conjunto de todas las funciones definidas y acotadas
en R es un espacio vectorial.

Problema 5.11.2. Demuestre que el conjunto de todas las funciones que satisfacen la ecua-
ción funcional

f (x) = f (x − 1),

para toda x ∈ R es un espacio vectorial

En los siguientes problemas, determinar si cada uno de los conjuntos dados es un espacio
vectorial real.

Problema 5.11.3. El conjunto de todos los polinomios de grado igual n.

Problema 5.11.4. Sea V el conjunto de todos los pares (x, y) de números reales, con las
operaciones de suma y producto por escalar definidas como sigue:

(x, y) + (x1 , y1 ) = (x + x1 , y + y1 ), λ(x, y) = (λx, y).

Sección 5.2 Subespacios de un espacio vectorial


Problema 5.11.5. Demuestre que el espacio vectorial de los números reales no tiene subes-
pacios propios.

Problema 5.11.6. Demuestre que los únicos subespacios propios R2 son las rectas que
pasan por el origen. Hallar la ecuación cartesiana de la recta. Demuestre además que todo
subespacio de dimensión 1 de R3 es una recta que pasa por el origen. Hallar la ecuación
paramétrica de dicha recta.

213
Problema 5.11.7. Sea V = Mn×n (R), ¿cuáles de los siguientes subconjuntos de V son
subespacios.

(a) El conjunto de todas las matrices invertibles.

(b) El conjunto de todas las A ∈ V tales que AB = BA, B es una matriz fija en V .

(c) Todas las matrices A tales que A2 = A.

Problema 5.11.8. Sean H1 , H2 dos subespacios de un espacio vectorial V . Entonces

(a) H1 ∪ H2 no es un subespacio de V .

(b) H := H1 + H2 = {v : v = v1 + v2 , v1 ∈ H1 , v2 ∈ H2 },
es un subespacio de V .

Problema 5.11.9 (**). Sea V el espacio vectorial de todas las funciones de R en R, sea Ve ,
el subconjunto de las funciones pares, f (x) = f (−x); sea V0 el subconjunto de las funciones
impares, f (−x) = −f (x).

(a) Demuestre que Ve y V0 son subespacios de V .


L
(b) Demuestre que V = Ve V0 .
L
La notación V = H K, significa que V = H + K y que H ∩ K = {0}, donde H, K son
subespacios del espacio vectorial V .

Problema 5.11.10. Demuestre que


M
Mn×n (R) = Sn×n Kn×n ,

donde Sn×n denota el conjunto de todas las matrices simétricas de tamaño n × n y Kn×n el
conjunto de todas las matrices antisimétricas de tamaño n × n.

Problema 5.11.11 (***). Sea H = {x ∈ Rn : x · n = 0}, donde n es un vector fijo no nulo


de Rn .

(a) Demuestre que H es un subespacio de Rn

(b) De una interpretación geométrica para los casos n = 2 y n = 3.

(c) Si H = {(x, y, z, w) : ax + by + cz + dw = 0}, donde abcd 6= 0. Demuestre que H es


un subespacio de Rn y encuentre una base para H.

(d) Encuentre la dimensión del subespacio H = {x ∈ Rn : x · n = 0}.

214
Sección 5.3 Combinación lineal y espacio generado
Problema 5.11.12. Sean v1 , v2 vectores de R2 . Hallar, gen {v1 , v2 } si,
(a) v1 , v2 son linealmente dependientes.
(b) v1 , v2 son linealmente independientes.
(c) v1 , v2 son linealmente independientes y los escalares de la combinación varı́an entre 0 y
1. ¿Qué representan los conjuntos hallados en (a),(b) y en (c)?

Sección 5.4 Independencia lineal


Problema 5.11.13. Demuestre que si los vectores u, v y u son linealmente dependientes,
entonces w · u × v = 0.

Problema 5.11.14. Demuestre que si los vectores v1 , . . . , vn son linealmente dependientes


en Rm y si vn+1 es cualquier otro vector en Rm , entonces el conjunto v1 , . . . , vn , vn+1 es
linealmente independiente.

Problema 5.11.15. Demuestre que si dos vectores no nulos v1 , v2 son ortogonales, entonces
el conjunto {v1 , v1 } es linealmente independiente.

Problema 5.11.16. Sea V el espacio vectorial de todas las funciones de R en R. Determinar


si cada uno de los siguientes subconjuntos de V es dependiente o independiente.

(a) {eax , xeax }.

(b) {1, eax , xeax }.

(c) {eax , xeax , x2 eax }.

(d) {1, cos 2x, sen2 x}.

(e) {ex cos x, e−x sen x}.

Sección 5.6 Bases y dimension


Problema 5.11.17 (**). Hallar la dimensión del espacio Dn de las matrices diagonales.

Problema 5.11.18 (**). Demuestre que el espacio Snn de las matrices simétricas de tamaño
n × n es un subespacio de Mn×n (R) el espacio de la matrices de tamaño n × n con estradas
en los reales. Hallar la dimensión del espacio Snn .

215
Problema 5.11.19 (*). Sea {v1 , . . . , vn } una base para un espacio vectorial V . Si
n
X
un := vi .
i=1

Demuestre que el conjunto {u1 , . . . , un } también es una base para V .

Problema 5.11.20 (***). Si H es un subespacio de un espacio vectorial de dimensión finita


L
V , demuestre que existe un único subespacio K de V tal que V = H K.

216
Capı́tulo 6

Transformaciones lineales

6.1. Definición y ejemplos


Definición 6.1.1 (Transformaciones lineales). Sean V y W espacios vectoriales reales. Una
transformación lineal es una función definida en V que toma valores en W y que satisface,
para cada u, v ∈ V y cada escalar α

T (u + v) = T (u) + T (v)
(6.1)
T (αu) = αT (u)

Las ecuaciones en (6.1) reciben el nombre de propiedades de linealidad.

En la sección 6.3 se estudian las transformaciones lineales de R2 en R2 , en especial el ope-


rador rotación. A continuación estudiamos otro importante de operador lineal denominado
transformación de proyección ortogonal

Ejemplo 6.1 (Operador proyección). Sea H un subespacio de Rn , y B = {u1 , . . . , uk } una


base ortonormal para H. La transformación de proyección ortogonal P : Rn → H se denota
por Proy vH y se define como

P (v) = Proy vH = (v · u1 )u1 + · · · + (v · uk )uk .

Consideremos el caso n = 3 y supongamos que queremos proyectar un punto v = (x, y, z) de


R3 sobre por ejemplo el plano xz. Tenemos que el plano xz está dado por

H = {(x, 0, z) : x, z ∈ R} .

Dado que

(x, 0, z) = (x, 0, 0) + (0, 0, z) = xi + zk,

217
Vemos que H es generado por la base ortonormal B = {i, k}. Por lo que

P (x, y, z) = Proy vH = ((x, y, z) · i))i + ((x, y, z) · k))k


= xi + zk
= (x, 0, z).

En cálculo vectorial para aplicar el Teorema de Stokes, en ciertas ocasiones es necesario


proyectar una curva C en el espacio sobre alguno de los tres planos coordenados. En el
Ejemplo 7.6.2 se encontró que la representación paramétrica de la curva de intersección de
las superficies  2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
viene dada por la función vectorial

α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).

Γ
C

y
x

Figura 6.1: La proyección de la curva C, que es una circunferencia, sobre el plano xz es una
elipse.

Si queremos saber cuál es la proyección de la curva C sobre el plano xz, hallamos la


acción del operador T (x, y, z) = (x, 0, z) sobre la función α. Esto es,

T (α(t)) = T (1 + cos t, 1 − cos t, 2 sen t)

= (1 + cos t, 0, 2 sen t)
= β(t).

Vemos que la proyección está representada por una función vectorial



β(t) = (1 + cos t, 0, 2 sen t) = (x, y, z),

218
para hallar la ecuación cartesiana de dicha curva eliminamos el parámetro en la ecuaciones
paramétricas

x = 1 + cos t, z = 2 sen t,

de donde obtenemos

(x − 1)2 + z 2 /2 = cos2 t + sen2 t = 1

Para este caso la proyección es un elipse (ver la figura 6.1).

De forma análoga podemos demostrar que la proyección de la curva C sobre el plano yz


también es una elipse, mientras que al proyectar sobre el plano xy obtenemos una recta. (ver
el problema 6.6.2)

6.2. Núcleo e imagen de una transformación lineal


Definición 6.2.1. Sean V y W espacios vectoriales y T : V → W una transformación
lineal. Entonces el núcleo de T denotado por ker T , y la imagen de T denotada por R(T ) se
definen respectivamente por

ker T = {v ∈ V : T (v) = 0}
R(T ) = {T (v) : v ∈ V } .

Como puede demostrarse el ker T es un subespacio de V , y la imagen de T es un subes-


pacio de W . La dimensión del núcleo de T la llamamos nulidad de T , y se denota por ν(T ),
a la dimensión de la imagen de T se le llama rango de T , el cual se denota por ρ(T ).

Ejemplo 6.2. Sea T : R3 → R3 una transformación lineal tal que T (1, 0, 1) = (2, 2, 0),
T (1, 1, 1) = (1, 3, 1) y T (1, 1, 0) = (0, 2, 2).

(a) Encontrar la transformación T .

(b) Hallar la nulidad de T .

(c) Hallar la imagen de T .

Solución. Nótese que como el operador T es lineal tenemos que

T (x, y, z) = T (xi + yj + zk) = xT (i) + yT (j) + zT (k)

219
Lo que significa que la linealidad de T implica que para determinar completamente operador
es suficiente con conocer su acción sobre los elementos de una base. Pasa este caso, la base
canónica de R3 . Tenemos que

T (i) + T (k) = T (i + k) = T (1, 0, 1) = (2, 2, 0)


T (i) + T (j) + T (k) = T (i + j + k) = T (1, 1, 1) = (1, 3, 1).

De donde obtenemos que

T (j) = (1, 3, 1) − (2, 2, 0) = (−1, 1, 1).

Ahora como

T (i) + T (j) = T (i + j) = (0, 2, 2).

Podemos hallar T (i):

T (i) = (0, 2, 2) − T (j) = (0, 2, 2) − (−1, 1, 1) = (1, 1, 1).

Utilizando que

T (i) + T (j) + T (k) = (1, 3, 1),

tenemos que

T (k) = (1, 3, 1) − T (i) − T (j)


= (1, 3, 1) − (1, 1, 1) − (−1, 1, 1)
= (1, 1, −1).

De esta forma vemos que

T (x, y, z) = xT (i) + yT (j) + zT (k)


= x(1, 1, 1) + y(−1, 1, 1) + z(1, 1, −1)
= (x − y + z, x + y + z, x + y − z).

Con lo cual tenemos en inciso (a).

Tomemos (x, y, z) ∈ ker, entonces T (x, y, z) = (0, 0, 0), o bien,

(x − y + z, x + y + z, x + y − z) = (0, 0, 0).

De obtenemos el sistema

220

 x−y+z = 0
x+y+z =0
x+y−z =0

Sumando la primera y segunda ecuación nos da 2x + 2y = 0, de donde x = −y y sumando la


primera y la tercera ecuación obtenemos x = 0. Por lo tanto, la única solución del sistema
es x = y = z = 0, por lo que el núcleo de la transformación consta únicamente del (0, 0, 0).
Esto se hace evidente al ver el vector (x, y, z) como un vector columna, ya que

x x
   

T (x) = T y  = A y 
z z

donde A es la matriz

1 −1 1
 

A = 1 1 1
1 1 −1

Luego, encontrar el núcleo de la transformación T se reduce a encontrar la solución del


sistema homogéneo Ax = 0, como la matriz A es invertible, la única solución del sistema es
la trivial, en consecuencia,

ker T = {(x, y, z) : T (x, y, z) = (0, 0, 0)}


= {(x, y, z) : Ax = 0}
= {0} = {(0, 0, 0)} .

Podemos escribir la imagen de T como

Im(T ) = {w ∈ W : ∃v ∈ V, w = T (v)} .

En este ejemplo V = W = R3 . Claramente, Im(T ) ⊆ R3 , y si w ∈ R3 y definimos v = A−1 w,


entonces v ∈ R3 y

T (v) = A(A−1 w) = (AA−1 )w = Iw = w,

esto es, w ∈ Im(T ), con lo cual, R3 ⊆ Im(T ). Se concluye que la imagen de la transformación
T es todo el espacio tridimensional: Im(T ) = R3 .

221
6.3. Teorema del cambio de variables en el plano (Op-
cional)
Teorema 6.3.1 (Teorema del cambio de variables en el plano). Sea T : R2 → R2 un
operador de C 1 en una región elemental G(las funciones componentes del operador T tienen
derivadas parciales de primer orden continuas en la región G) del plano uv. En la figura 6.2
se muestran el operador T y el operador S que es el operador inverso de T .

y v

2 2
R T
G
1 S 1

x u
1/2 1 2 1 2

Figura 6.2: El operador T deforma una región G en el plano uv para convertirla en una
región R en el plano xy, una medida de dicha deformación viene dada por el Jacobiano del
operador T
.

y supongase que T mapea de manera inyectiva la región G en una región R del plano xy,
siendo
T (u, v) = (g(u, v), h(u, v)) = (x, y).
Entonces si f : R → R es integrable tenemos que
ZZ ZZ
f (x, y)dxdy = f (g(u, v), h(u, v))|J(u, v)|dudv.
R G

El número J(u, v) denota el Jacobiano del operador T , el cual se define como


∂g ∂g
 
   ∂u ∂v 
∇g
J(u, v) := det = det 
 
∇h

 ∂h ∂h 
∂u ∂v
222
Un caso particular importante del Teorema anterior se da en el siguiente resultado

Teorema 6.3.2. Sea A un matriz de tamaño 2 × 2 con det A 6= 0 y T un operador dado por
   
x x
T =A . (6.2)
y y

Entonces T transforma paralelogramos en paralelogramos y vértices en vértices. Más aún, si


T (G) es un paralelogramo, G debe ser un paralelogramo.

Nota 6.3.1. Nótese que todo operador lineal de R2 en R2 viene dado en la forma (6.2).
En efecto, puesto que el operador T es lineal es suficiente con conocer su acción sobre los
elementos de alguna base para determinarlo completamente. Por ejemplo, si tomamos la base
canónica de R2 , B = {i, j}, y suponemos que T (i) = (a, b) y T (j) = (c, d) tenemos que

T (x, y) = T (xi + yj) = xT (i) + yT (j) = x(a, b) + y(c, d) = (ax + cy, bx + dy).

a c
La expresión anterior en forma matricial es (6.2) con A = . Observese además que
b d
si, J(x, y) = det A = ad − bc 6= 0, entonces el operador T es inyectivo, por lo tanto, si
T (G) = R, por el Teorema del cambio de variables tenemos que
ZZ
a(R) = dxdy
ZZ R

= |J(u, v)|dudv
ZZ G

= | det A|dudv
G
ZZ
= | det A| dudv
G
= | det A|a(G).

Ejemplo 6.3 (Coordenadas polares). Como un caso particular del Teorema 6.3.1, damos
una fórmula para integración en coordenadas polares. En este caso el operador T del plano
rθ al plano xy está dado por

x = g(r, θ) = r cos θ, y = h(r, θ) = r sen θ,

223
θ y

T R
β
G r=a r=b
α
β
r α x
a b

Figura 6.3: En el plano xy se muestra un rectángulo polar

si θ = k = cte, entonces,
y r sen k
= = tan k.
x r cos k
Es decir, tenemos una recta que pasa por el origen ypque forma un ángulo de k grados con
el eje x. Por otro lado, si r = k = cte, entonces, x2 + y 2 = k, una circunferencia con
centro en (0, 0) y radio k. De este forma, obtenemos el rectángulo polar en el plano xy que
se muestra en la figura 6.3. Además tenemos que
∂g ∂g
 
 ∂r ∂θ   
cos θ −r sen θ
J(r, θ) = det   = det = r.
 
 ∂h ∂h  sen θ r cos θ
∂r ∂θ
Entonces por el Teorema del cambio de variables obtenemos
ZZ ZZ
f (x, y)dxdy = f (r cos θ, r sen θ)|J(r, θ)|drdθ
R G
Z βZ b
= f (r cos θ, r sen θ)rdrdθ
α a

Para el caso más general en el que tengamos una región polar R de la forma

R = {(r, θ) : h1 (θ) ≤ r ≤ h2 (θ), α ≤ θ ≤ β}

tal como se muestra el la figura

224
R r = h2 (θ)

r = h1 (θ)

β
α

Figura 6.4: Para encontrar los lı́mites de integración en un cambio a coordenadas polares,
trazamos un rayo que atraviese la región R, vemos que este entra en una función polar de
ecuación r = h1 (θ) y sale en r = h2 (θ), si movemos este rayo empezando en θ = α hasta
θ = β barremos la región.

podemos hallar el área de la región R por un cambio a coordenadas polares, utilizando el


Teorema del cambio de variables, el Teorema de Fubinni y segundo Teorema fundamental del
cálculo.

ZZ
a(R) = dxdy
R
ZZ
= |J(r, θ)|drdθ
G
Z β Z h2 (θ)
= rdrdθ
α h1 (θ)
"Z #
Z β h2 (θ)
= rdr dθ
α h1 (θ)
Z β Z h2 (θ)
2
= r /2 dθ
α h1 (θ)
β
1 2
Z
h2 (θ) − h21 (θ) dθ.

=
α 2
Por lo tanto, como un caso particular del Teorema del cambio de variables, tenemos una
fórmula para calcular el área entre curvas en coordenadas polares
Z β
1 2
h2 (θ) − h21 (θ) dθ.

a(R) = (6.3)
α 2

225
Ejemplo 6.4 (Operador rotación). Un caso particular de operador lineal de R2 en R2 es el
operador rotación, cuya fórmula deducimos a continuación. Tomemos un vector (u, v) en
el plano uv con magnitud r y dirección α y supongamos que este vector gira un ángulo de θ
radianes en dirección contraria de las manecillas del reloj como se muestra en la figura 6.5.

(x, y)

r (u, v)
θ r

α
u

Figura 6.5: El vector (u, v) gira un ángulo θ en dirección contraria de las manecillas del reloj

Entonces la magnitud del vector (x, y), sigue siendo r, pero su dirección es α + θ. En
consecuencia,

x = r cos(α + θ)
= r cos α cos θ − r sen α sen θ
= u cos θ − v sen θ.

y = r sen(α + θ)
= r sen α cos θ + r cos α sen θ
= v cos θ + u sen θ.

Lo cual expresamos en forma matricial como sigue


      
x cos θu − sen θv cos θ − sen θ u
= =
y sen θu cos θv sen θ cos θ v
Con lo cual vemos que el operador rotación está definido en el plano uv, tomando valores en
el plano xy, y está dado por
      
u cos θ − sen θ u x
T = = .
v sen θ cos θ v y

226
Dado que
 
cos θ − sen θ
det = 1 6= 0,
sen θ cos θ

si R = T (G), el Teorema del cambio de variables nos da


ZZ
a(R) = dxdy = | det A|a(G) = a(G).
R

El uso del operador rotación se ilustra en el problema 6.3.4.

Problema 6.3.3. Hallar el área del paralelogramo generado por los vectores A = (a, b) y
B = (c, d).

Solución. Este problema se puede resolver directamente, de forma cartesiana, o bien uti-
lizando el producto cruz. Para resolver el problema utilizando el Teorema del cambio de
variables la idea es definir un operador T que aplique el cuadrado unitario en el plano uv en
el paralelogramo R en el plano xy como se representa en la figura 6.6.

v y

j B
R
(x, y)
T b

G
A
u x
i

Figura 6.6: El operador T transforma el cuadrado unitario en un paralelogramo

La elección de la región G como el cuadrado unitario viene del hecho que todo punto
(x, y) en la región R se puede expresar como una combinación lineal de la forma

(x, y) = uA + vB

donde los escalares u, v pertenecen al intervalo [0, 1]. Entonces, según el Teorema 6.3.2 y lo
hecho en la Nota 6.3.1 debemos suponer que el operador T es lineal y que

T (i) = A, T (j) = B

227
Con lo cual, T (u, v) = T (ui + vj) = uT (i) + vT (j) = u(a, b) + v(c, d) = (au + cv, bu + dv).
Lo cual se expresa en forma matricial como
      
u a c u x
T = = .
v b d v y

Ahora como los vectores A y B son linealmente independientes resulta que


 
a c
det = ad − bc 6= 0,
b d

lo cual implica que el operador T es inyectivo. Más aún, demostraremos que R = T (G),
donde

T (G) = {T (u, v) : (u, v) ∈ G} ,

G = [0, 1] × [0, 1] = {(u, v) : 0 ≤ u ≤ 1, 0 ≤ v ≤ 1}

En efecto, tomemos (x, y) ∈ R, entonces existe (u, v) ∈ G tal que

(x, y) = u(a, b) + v(c, d) = T (u, v).

Esto es, (x, y) ∈ T (G). Por otro lado, si (x, y) ∈ T (G), entonces existe (u, v) ∈ G con
T (u, v) = (x, y), es decir (x, y) = u(a, b) + v(c, d), lo cual significa (x, y) ∈ R. Ahora, por lo
hecho el Nota 6.3.1 podemos podemos concluir que

a(R) = | det A|a(G) = | det A|12 = | det A|.

Problema 6.3.4. Hallar el área encerrada por la curva de ecuación

a2
x2 + xy + y 2 = , a > 0.
2
Solución. Para resolver este problema consideraremos los siguientes resultados
Teorema 6.3.5. La gráfica de la ecuación
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
es una cónica o bien una cónica degenerada. Si es una cónica entonces es

(a) Una parábola si B 2 − 4AC = 0

228
(b) Una elipse si B 2 − 4AC < 0

(c) Una hipérbola si B 2 − 4AC > 0.

Teorema 6.3.6. Si B 6= 0, la ecuación

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 (6.4)

se puede trasformar en la ecuación

Au2 + Cv 2 + Du + Ev + F = 0 (6.5)

donde A y C no son ambos cero, por una rotación de ejes en un ángulo de θ radianes para
el cual se cumple que:
A−C
cot 2θ = .
B
Para pasar de la ecuación (6.4) a la ecuación (6.5) utilizamos el operador rotación:
      
u cos θ − sen θ u x
T = = .
v sen θ cos θ v y
si queremos pasar del la ecuación (6.5) a la ecuación (6.4), utilizamos el operador inverso
      
x cos θ sen θ x u
S = = .
y − sen θ cos θ y v
Para nuestro caso tenemos que A = B = C = 1, D = E = 0 y F = −a2 /2. Con lo cual,
B 2 − 4AC = 1 − 4 < 0, luego por el Teorema 6.3.5, la cónica es una elipse. Ahora como
B = 1 6= 0, por el Teorema 6.3.6, la elipse está rotada y el ángulo de rotación satisface la
relación
A−C
cot 2θ = = 0,
B
de donde, cos 2θ = 0, esto es, θ = π/4. Por lo tanto, el operador rotación está dado por
   √ √    
u 1/ 2 −1/ 2, u x
T = √ √ = .
v 1/ 2 1/ 2 v y

De donde obtenemos las ecuaciones de transformación


1
x = √ (u − v)
2
1
y = √ (u + v).
2

229
Ahora consideremos la región

R := (x, y) : x2 + xy + y 2 ≤ a2 /2 ,

(6.6)

y supongamos que (x, y) ∈ ∂R. En tal caso tenemos que


a2 1 1 1 3 1
= x2 + xy + y 2 = (u − v)2 + (u − v)(u + v) + (u + v)2 = u2 + v 2 .
2 2 2 2 2 2
Es decir, 3u2 + v 2 = a2 . Concluimos que el operador T mapea una región G en el plano uv
en la región R en la plano xy dada por (6.6), donde

G := (x, y) : 3u2 + v 2 ≤ a2 .

(6.7)

Ver la figura de abajo.

v y

G S R
u x

Podemos ahora aplicar el Teorema de cambio de variables para concluir que


a π
Z Z Z
A(R) = dA = |J(u, v)|dudv = dudv = A(G) = π √ · a = √ a2 .
R G G 3 3
Ver el Problema 6.6.1.

6.4. Representación matricial de una transformación


lineal
Si A ∈ Mm×n (R) y definimos la función T : Rn → Rm dada por T (x) = Ax, por la ley
distributiva del producto matricial la transformación T resulta ser lineal. Recı́procamente,
si T : Rn → Rm es lineal, existe una matriz A ∈ Mm×n (R) tal que T (x) = Ax. En efecto,
sea B = {e1 , . . . , en } la base canónica de Rn , de tal forma que si x = (x1 , . . . , xn )

x = x1 e1 + · · · + xn en .

230
Como T : Rn → Rm es lineal tenemos que

T (x) = x1 T (e1 ) + · · · + xn T (en ).

Entonces, si A = [aij ]m×n es una matriz tal que sus columnas son respectivamente los vec-
tores T (e1 )t , . . . , T (en )t , tenemos que T (x) = Ax. A la matriz A se le conoce como matriz
asociada a la transformación T respecto a la base canónica, también se le llama represen-
tación matricial de T y escribimos A = [T ]B .
Las nociones presentadas en la sección 5.7 también son validas para transformaciones
lineales.

Teorema 6.4.1. Sea A = [T ]B la representación matricial de una transformación lineal T .


Entonces

(a) Im(T ) = Im(A) = CA

(b) ρ(T ) = ρ(A)

(c) ker T = ker A

(d) ν(T ) = ν(A)

Teorema 6.4.2 (Teorema de la dimensión para transformaciones lineales). Sean V y W


espacios vectoriales de dimensión finita y T : V → W una transformación lineal. Entonces

ν(T ) + ρ(T ) = dim V.

Ejemplo 6.5. Considere la función T : R3 → R2 dada por T (x, y, z) = (x+2y−z, 2x−y+3z).


Encuentre la nulidad y el rango de T y verifique el teorema de la dimensión.

Solución. Como T (e1 ) = (1, 2), T (e2 ) = (2, −1) y T (e3 ) = (−1, 3), la matriz asociada a T
respecto a la base canónica es
 
t t t
 1 2 −1
A = [T ]B = T (e1 ) T (e2 ) T (e3 ) =
2 −1 3

En el ejemplo 5.12 se encontró que ν(A) = 1 y en el ejemplo 5.13 que ρ(A) = 2. Se verifica
que

ν(T ) + ρ(T ) = ν(A) + ρ(A) = 1 + 2 = 3 = dim R3 .

231
6.5. Isomorfismos

6.6. Problemas
x2 y 2
Problema 6.6.1 (**). Halle el área encerrada por la elipse 2 + 2 = 1. Sugerencia: Use
a b
el operador

T (u, v) = (au, bv) = (x, y).

Note que este operador mapea de manera inyectiva, el interior del circulo unitario en el plano
uv en el interior de la elipse en el plano xy.

Problema 6.6.2. En el Ejemplo 7.6.2 se encontró que la representación paramétrica de la


curva de intersección de las superficies
 2
x + y 2 + z 2 = 2x + 2y
x + y = 2.

viene dada por la función vectorial



α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).

Utilizando el operador proyección demostrar que la proyección de la curva C sobre el plano


yz es una elipse, mientras que la proyección de C sobre el plano xy es una recta.

232
Capı́tulo 7

Formas canónicas elementales

7.1. Valores y vectores propios

7.2. Matrices semejantes y diagonalización

7.3. Matrices semejantes y diagonalización ortogonal

7.4. Formas cuadráticas

7.5. Problemas
Problema 7.5.1. Demostrar que

Z √
F · dα = π 3a2 ,
C

siendo F = (y, z, x) y C la curva de intersección entre la esfera x2 + y 2 + z 2 = a2 y el plano


x + y + z = 0, a > 0:

(a) Directamente,

(b) usando el teorema de Stokes.

Solución. Resolvamos primero el problema directamente. Los puntos sobre la curva de


intersección C satisfacen el sistema de ecuaciones
 2
x + y 2 + z 2 = a2
x + y + z = 0.

233
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando z en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos

a2 = x2 + y 2 + (−x − y)2 = 2x2 + 2xy + 2y 2 ,

o equivalentemente, x2 + xy + y 2 = a2 /2. Tenemos la ecuación cartesiana de una curva


proyectada sobre el plano xy y vemos que la curva es precisamente la elipse rotada del.
Demostramos en ese problema que esta elipse proviene de la elipse no rotada 3u2 + v 2 = a2
y que ambas elipses están relacionadas mediante la ecuaciones de transformación
1
x = √ (u − v)
2
(7.1)
1
y = √ (u + v).
2
a
Entonces tomemos u = √ sen t y v = a cos t, al variar t entre 0 y 2π parametrizamos
3
la frontera de la región G en dirección horaria (ver la figura al final. Ahora utilizando las
ecuaciones de transformación (7.1), obtenemos
a 1 a a
x = √ ( √ sen t − cos t) = √ sen t − √ cos t,
2 3 6 2
a 1 a a
y = √ ( √ sen t + cos t) = √ sen t + √ cos t.
2 3 6 2
Pero z = −x − y, entonces
2a
z = − √ sen t.
6
Por lo tanto,
a a a a 2a
α(t) = ( √ sen t − √ cos t, √ sen t + √ cos t, − √ sen t), 0 ≤ t ≤ 2π.
6 2 6 2 6
De este modo tenemos que C = α ([0, 2π]) = {α(t), 0 ≤ t ≤ 2π}.

234
Z

y = −x, z = 0
C

Ahora podemos empezar a calcular la integral.

dx a a
= √ cos t + √ sen t
dt 6 2
dy a a
= √ cos t − √ sen t
dt 6 2
dz 2a
= − √ cos t.
dt 6

a2 a2
  
dx a a a a
y = √ sen t + √ cos t √ cos t + √ sen t = sen 2t + √ .
dt 6 2 6 2 3 2 3
a2 a2
  
dy 2a a a
z = − √ sen t √ cos t − √ sen t = − sen 2t + √ sen2 t.
dt 6 6 2 6 3
a2 a2
  
dz a a 2a
x = √ sen t − √ cos t − √ cos t = − sen 2t + √ cos2 t.
dt 6 2 6 6 3

235
Entonces
Z Z
F · dα = ydx + zdy + xdz
C C
Z 2π
 2
a2

a
= √ + √ dt
0 2 3 3
√ 2
= π 3a .

En la gráfica de abajo se muestra la curva de intersección C, junto con su proyección Γ


sobre el plano xy.

z
Efectuaremos la integración sobre la superficie C
S del plano x + y + z = 0 encerrada por la curva C.
Esto es, S = {(x, y, z) : x + y + z = 0, (x, y) ∈ T }, Γ
siendo, T = {(x, y) : x2 + xy + y 2 ≤ a2 /2}. y
x

7.6. Soluciones a algunos de los problemas


Problema 7.6.1. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.

Solución. Sean x, y y z el número de acciones que la inversionista tiene en Delta, Hilton


Hotels y McDonald’s respectivamente. El corredor recuerda que hace dos dı́as el precio de
las acciones de Delta airlines bajó $1 por acción. Por lo tanto, hace dos dı́as el precio de las
acciones Delta bajó x pesos. De manera similar el precio de las acciones de Hilton Hotels
3 1
bajó y pesos, y el precio de las acciones de McDonald’s subió z pesos. De donde tenemos
2 2
la ecuación
3 1
−x − y + z = −350.
2 2

236
Ahora, con la información que el corredor tiene sobre el dı́a de ayer, establecemos la ecuación
3 1
x − y + z = 600.
2 2
La matriz aumentada del sistema conformado por las dos ecuaciones anteriores es:
 
−1 −3/2 1/2 | −350
3/2 −1/2 1 | 600

Ahora aplicamos eliminación Gaussiana para obtener la forma escalonada por filas de la
matriz.

  R1 → −6R1  
−1 −3/2 1/2 | −350 6 9 −3 | 2100
R1 → −4R1
3/2 −1/2 1 | 600 −6 2 −4 | −2400
⇐⇒

   
6 9 −3 | 2100 R2 → R1 + R2 6 9 −3 | 2100
−6 2 −4 | −2400 ⇐⇒ 0 11 −7 | −300

  R1 → (1/3)R1  
6 9 −3 | 2100 2 3 −1 | 700
R2 → (1/11)R2
0 11 −7 | −300 0 1 −7/11 | −300/11
⇐⇒

   
2 3 −1 | 700 R1 → −3R1 + R2 2 0 10/11 | 8600/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11

   
2 0 10/11 | 8600/11 R1 → (1/2)R1 1 0 5/11 | 4300/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11

Volviendo de nuevo al sistema encontramos que


5 4300 7 300
x+ z= , y− z=− .
11 11 11 11
Se observa que z es la variable de ligamiento, por lo tanto si z = t. Entonces
4300 5 4300 − 5t 7 300 7t − 300
x= − t= , y = t− = , t ∈ R. (7.2)
11 11 11 11 11 11

237
Es decir, el sistema tiene infinitas soluciones reales dadas en la forma

 x = (4300 − 5t)/11
y = (7t − 300)/11
z = t, t ∈ R

Ahora despejando el parámetro t de la primera ecuación obtenemos


4300 − 11x
t= ,
5
Reemplazando este valor en la segunda ecuación nos da
 
7 4300 − 11x 300
y= − ,
11 5 11

o equivalentemente,

77x + 55y = 28600. (7.3)

Luego, tenemos una ecuación Diofántica con a = 77, b = 55 y c = 28600. Además, como
(77, 55) = 11 y 11|28600 por el Teorema 1.5.1 la ecuación tiene solución. Más aún, si el
corredor sabe que la inversionista tiene z = t = 200 acciones de McDonald’s, entonces
puede determinar que además posee x0 = (4300 − 5 · 200)/11 = 300 acciones de Delta, y
y0 = (7 · 200 − 300)/11 = 100 acciones de Hilton. Nótese que x0 = 300 y y0 = 100 es una
solución particular de la ecuación Diofántica (7.3). Por lo tanto una nueva aplicación del
Teorema 1.5.1 nos permite concluir que la solución general de la ecuación Diofántica es
55 77
x = 300 + k = 300 + 5k, y = 100 − k = 100 − 7k, k ∈ Z.
11 11
Pero
4300 − 11x 4300 − 11(300 + 5k)
z= = = 200 − 11k.
5 5
Concluimos que las soluciones enteras del problema son

 x = 300 + 5k
y = 100 − 7k
z = 200 − 11k, k ∈ Z

Con la restricción x, y, z ≥ 0. Luego,


2
x = 300 + 5k ≥ 0 ⇔ k ≥ −60, y = 100 − 7k ≥ 0 ⇔ k ≤ 100/7 = 14 + .
7

238
Por lo tanto, −60 ≤ k ≤ 14. Esto es, k = −60, −59, . . . , 0, 1, 2 . . . , 14. Por consiguiente, el
problema tiene en realidad finitas soluciones, más exactamente, tenemos 75 soluciones, una
por cada valor de k. Este número de soluciones pudo haber sido obtenido sin usar ecuaciones
Diofánticas como sigue: Dado que las variables x, y deben ser no negativas, de la forma
paramétrica de las soluciones dada en (7.2) se tiene que

4300 − 5t ≥ 0, 7t − 300 ≥ 0,

de donde

860 = 4300/5 ≤ t ≤ 300/7 = 42,857.

Esto es, 43 ≤ t ≤ 860. Ahora bien, como el denominador en las expresiones paramétricas
para x y y dadas en (7.2) es 11, para saber el número de la soluciones enteras del problema,
debemos
j 860 k contar los múltiplos de 11 presentes en el intervalo de 43 a 860. De 1 a 860 hay
= 78 múltiplos de 11
11
44 858
11(1), 11(2), 11(3), 11(4), . . . , 11(78).

Entonces, de 43 a 860 hay 78 − 3 = 75 múltiplos de 11. Lo que quiere decir que hay 75
soluciones enteras positivas del problema.

Problema 7.6.2 (***). Una partı́cula se desplaza sobre la curva de intersección de las

superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.

Solución. Los puntos sobre la curva de intersección C satisfacen el sistema de ecuaciones


 2
x + y 2 + z 2 = 2x + 2y
x + y = 2.

Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando y en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos

(x − 1)2 + z 2 /2 = 1.

239
Tenemos la ecuación cartesiana de una curva proyectada sobre el plano xz, para este caso
una elipse. En la figura 7.2 se muestra esta curva en azul. Denotemos por Γ a el conjunto de
puntos en el espacio que están sobre esta elipse, esto es,

Γ = (x, y, z) : (x − 1)2 + z 2 /2 = 1, y = 0 .


plano x + y = 2

y
x

Figura 7.1: En rojo se muestra la trayectoria seguida por la partı́cula junto con su dirección.
Se advierte que desde nuestro punto de vista (opuesto al origen) se aprecia que la partı́cula
sigue la dirección de las manecillas del reloj.

Empecemos por parametrizar la curva Γ. Tomemos x−1 = cos t y y = 2 sen t. Entonces

β(t) = (1 + cos t, 0, 2 sen t), 0 ≤ t ≤ 2π.

Ası́,

Γ = β([0, 2π]) = {β(t) : t ∈ [0, 2π]} .

240
z

Γ
C

y
x

Figura 7.2: En azul se muestra la proyección Γ de la trayectoria C. Para este caso tenemos
una elipse proyectada sobre el plano xz.

Ahora para parametrizar la curva C, utilizamos el hecho de que x + y = 2 para todo


punto de C. Entonces y = 2 − x = 2 − (1 + cos t) = 1 − cos t. Con lo cual,

C = α([0, 2π]),

donde

α(t) = (1 + cos t, 1 − cos t, 2 sen t).

En la figura 7.1 vemos esta curva en rojo. Vemos que α(0) = (2, 0, 0). Esto es, la partı́cula
empieza su recorrido en el punto (2, 0, 0). Si la función α(t) representa la posición de la

partı́cula se debe cumplir que su rapidez kα′ (t)k = 2 2m/s. Sin embargo tenemos que

α′ (t) = (− sen t, sen t, 2 cos t),
√ √
de donde kα′ (t)k = 2 6= 2 2. Para encontrar el vector posición de la partı́cula debemos
hallar ω tal que

kγ ′ (t)k = 2 2.

donde γ(t) = α(ωt) = (1 + cos ωt, 1 − cos ωt, 2 sen ωt).

γ ′ (t) = (−ω sen ωt, ω sen ωt, 2ω cos ωt).

√ √ √ √
kγ ′ (t)k = 2 2 ⇔ ω 2 cos2 ωt + ω 2 cos2 ωt + 2ω 2 sen2 ωt = 2ω = 2 2.

241
Por lo tanto, ω = 2 y el vector posición de la partı́cula está dado por

γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t).


(1, 1, 2)
b C

b (0, 2, 0)
(2, 0, 0) b b

y
x
b

(1, 1, − 2)

Figura 7.3: A medida que crece el parámetro t crece de 0 a π, los puntos se distribuyen sobre
la curva de intersección C siguiendo la dirección de la opuesta a las agujas del reloj, vista
desde el origen

En el cuadro 7.1 se observa que la partı́cula tiene un periodo (tiempo en completar una
revolución) de π segundos

t x y z
0 2 0 0

π/4 1 1 2
π/2 0 2 0

3π/4 1 1 − 2
π 2 0 0

Cuadro 7.1: La partı́cula empieza su recorrido en el punto (2, 0, 0), pasado un tiempo de π
segundos regresa al mismo punto.

Conclusión: el vector posición de la partı́cula está dado por



γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t), 0 ≤ t ≤ π.

242
7.7. Solución Examen Final Conjunto de Álgebra Li-
neal 6 de Junio del 2018
Problema 7.7.1. ¿Cuál de las siguientes afirmaciones es verdadera?

(a) Las operaciones elementales entre matrices no alteran el determinante.

(b) Para toda matriz cuadrada tenemos que: det A = − det(At ).

(c) Para toda matriz cuadrada se tiene que det(A−1 ) = 1/ det A.

(d) Para cualquier par de matrices cuadradas tendremos: det(AB t ) = det A det B

Solución. A continuación mostramos las tres operaciones elementales definidas entre ma-
trices, ası́ como su efecto sobre del el determinante.

(1) Ri → cRi ⇒ det B = c det A

(2) Rj → Rj + cRi ⇒ det B = det A

(3) Ri ↔ Rj ⇒ det B = − det A

Para la primera operación elemental la matriz B es obtenida de A al cambiar i- ésima fila


por esa misma fila multiplicada por c, y vemos que el efecto sobre el determinante es que
queda multiplicado por la constante c.

Para el caso de la tercera operación elemental, vemos que el efecto sobre el determinante,
es que este cambia de signo, cuando se intercambian dos de sus filas.

La segunda operación elemental, es la única que no cambia el determinante.

Vemos que la afirmación en (a) es falsa.

En el inciso (b), nótese que si A ∈ Mn×n (R), entonces det A = det At (ver el problema
2.7.3). Por lo tanto, si suponemos que la afirmación (b) es cierta, tendrı́amos que

det A = − det At = − det A ⇒ det A = 0.

Luego, es suficiente con escoger una matriz cuyo determinante sea distinto de cero para
mostrar que la afirmación es falsa. Por ejemplo, si
 
1 0
A :=
2 3

243
entonces

1 0 1 2
det A =
= 3 6= −3 = −

2 3 0 3

Claramente, la afirmación (c) es falsa. Dado det A debe ser diferente de cero. Si A ∈
Mn×n (R) y det A 6= 0, entonces por el Teorema 2.4.1, A es invertible, por lo tanto, existe
A−1 , y AA−1 = I, de lo cual, por el Teorema 2.3.1, y el Teorema 2.1.1 obtenemos que

det A det A−1 = det(AA−1 ) = det I = 1.

Concluimos que

det A−1 = 1/ det A.

Nos queda demostrar la veracidad de la afirmación (d). De nuevo por el Teorema 2.3.1
tenemos que

det(AB t ) = det A det B t = det AB.

Problema 7.7.2. ¿Cuál de las siguientes matrices no es triangular superior?

(a) Matriz cuadrada nula.

(b) Matriz diagonal.

(c) Matriz antisimétrica no nula.

(d) Matriz identidad.

Solución. Las matrices de los incisos (a), (b) y (d) son todas casos particulares de una
matriz triangular superior. Construiremos una matriz antisimétrica no nula.

Sea
 
a b
A :=
c d

Como A es antisimétrica tenemos que At = −A, es decir


   
a c −a −b
= =
b d −c −d

de donde obtenemos el sistema

a = −a, c = −b, b = −c, d = −d.

244
De la primera y última ecuaciones nos da que a = 0 y d = 0, y de las ecuaciones del medio,
obtenemos que b = −c. En consecuencia, todas las matrices antisimétricas de tamaño 2 × 2
son de la forma
 
0 −c
,c ∈ R
c 0

Vemos que hay un número infinito de matrices antisimétricas de tamaño 2 × 2, si c = 0,


tenemos la matriz cero, y si c 6= 0, generamos un conjunto infinito de matrices antisimétricas
no nulas, que a su vez no son triangulares superiores.

Para una aplicación de las propiedades del determinante ver el problema 2.3.10 y el
ejemplo 2.1.

245
7.8. Cálculo e ingenierı́a civil
Problema 7.8.1 (Cálculo en varias variables e ingenierı́a civil). Encuentre el volumen y
área superficial del soporte para tuberı́a (columna de base elı́ptica donde se pone una
tuberı́a, por ejemplo un oleoducto, como el que se muestra en color azul en la figura 7.4(a)).
Encuentre además, el área del cilindro circular cortada por el cilindro elı́ptico. Esta es el
área encerrada por la curva de intersección C que se muestra en gris en la figura 7.4(b).
z
z
Cilindro cı́rcular

C C

b
H h

b
a y
x y x
Cilindro elı́ptico

(a) Soporte elı́ptico de una tuberı́a (b) Sólido limitado por dos cilin-
circular dros

Figura 7.4: El cilindro elı́ptico genera una curva de intersección C sobre el cilindro circular.
Denotamos con H a el punto más alto sobre la curva C y con h a su punto más bajo. Estos
valores se alcanzan respectivamente en los puntos (a, 0, 0) y (0, b, 0), donde las constantes a
y b son los semiejes de la elipse que genera el cilindro elı́ptico.

Solución. Supongamos que el cilindro elı́ptico es generado por una elipse de semiejes a y b.

246
z

p
z =R+h+ R2 − x 2 , y = 0

b b
(R, R + h)
R

y
b
(a, H)
x2 y2 h
+ = 1, z = 0 b

a2 b2 z =R+h−
p
R2 − x 2 , y = 0
b

T a
x −a
b b

a x

(a) Curva base del cilindro (b) Curva base del cilindro circular
elı́ptico

Figura 7.5: En la parte (a) se muestra la intersección del cilindro elı́ptico con el plano xy y
en la parte (b) la intersección del cilindro circular con el plano xz

Esta serı́a la base del cilindro elı́ptico, ver la figuras 7.4 y 7.5(a). Se supone además que
el eje del cilindro elı́ptico es el eje z. Por lo tanto, la ecuación de este cilindro es
x2 y 2
+ 2 = 1, z ∈ R
a2 b
Suponemos que los semiejes a y b son dados. Sobre el punto (a, 0, 0) medimos una altura
H y sobre el punto (0, b, 0) medimos una altura h donde 0 < h < H. La altura mı́nima h
es la distancia a la que está el cilindro circular del piso, y la altura máxima H es el mayor
valor permitido para las componentes en z de ambos cilindros. Ver la figura 7.4(b) y la figura
7.5(b). Las alturas h, H también las suponemos dadas.

Ahora bien, si R denota el radio del cilindro circular, según se ve en la figura 7.5(b) el
centro del cilindro es (0, 0, R + h). Estamos suponiendo que el eje de este cilindro es la recta
paralela al eje y que está a un altura h del piso, de modo que su ecuación es
x2 + (z − (R + h))2 = R2 , y ∈ R.
Para que el cilindro circular no se doble sobre si mismo, debemos tener que 0 ≤ z ≤ R + h.
Esto queda claro al observar la figura 7.5(b) donde se infiere que z varia entre 0 y R + h,
mientras x lo hace entre 0 y R. Esto, para parte del cilindro que queda por debajo de la
recta z = R + h, que es la que no interesa. Concluimos que la ecuación del cilindro circular
es

z = f (x, y) = R + h − R2 − x2 , y ∈ R.

247
De nuevo, al observar la figura 7.5(b), vemos que z = H cuando x = a. Por lo tanto, tenemos
que

H = R + h − R2 − a2 . (7.4)

Podemos despejar R de la ecuación anterior para obtener

a2 + (H − h)2
R= . (7.5)
2(H − h)

La relación (7.4) impone las siguientes restricciones

0 < h − H < R, 0 < a ≤ R.

Podemos resumir lo hecho hasta ahora como sigue: Dada una tuberı́a elı́ptica de ancho mayor
2a, y de ancho menor 2b, la cual cortamos a una altura H, en la que introducimos a una
altura h < H (medida desde el piso) un oleoducto circular de radio dado por (7.5), generando
el sólido que se muestra en la figura 7.4(b), para el queremos determinar el volumen y el
área superficial, tanto lateral como superior.

Por simetrı́a, podemos obtener el volumen del sólido al multiplicar por 4 la integral doble
ZZ
f (x, y)dA,
T

donde T es la región del tipo 2 limitada en el primer cuadrante por la elipse base del cilindro
elı́ptico y los ejes coordenados (ver la figura 7.5(a)), esto es,

b√ 2
 
T = (x, y) : 0 ≤ x ≤ a, 0 ≤ y ≤ a −x2
a

El volumen del sólido en cuestión es entonces

Z a Z b √a2 −x2  √ 
V =4 a 2 2
R + h − R − x dydx
0 0
4b
Z a  √ √
= R + h − R2 − x2 a2 − x2 dx.
a 0

Esto es,
4b
Z a  √ √
V = R+h− R2 − x2 a2 − x2 dx 0 < a ≤ R. (7.6)
a 0

Por ejemplo, si queremos saber, cuanto cemento se requiere para rellenar un soporte elı́ptico
de semiejes a = 0,4m = 15,7pulg, b = 0,3m = 11,8pulg y una altura H = 100pulg, sobre el

248
cual se coloca a una altura h = 87,3pulg un cilindro circular, primero aplicamos la fórmula
(7.5) para el radio del cilindro circular
15,72 + (100 − 87,3)2
R= = 16,054.
2(100 − 87,3)
Se observa que se cumple que 16,054 ≥ 15,7, y que 16,054 > 100 − 87,3 = 12,7. Ahora
aplicamos la fórmula (7.6) para hallar el la cantidad aproximada de cemento necesaria para
rellenar el sólido
4 · 11,8 15,7 
Z p p
V = 2
16,054 + 87,3 − 16,054 − x 2 15,72 − x2 = 52140pulg 3.
15,7 0
El área de la parte superior de la tuberı́a (área de la superficie del cilindro circular cortada
por el cilindro elı́ptico) está dada por
ZZ q
A=4 1 + fx2 + fy2 dA
T
Z √
4bR a a2 − x2
= √ dx 0 < a ≤ R.
a 0 R2 − x2
Es decir,
a

4bR a2 − x2
Z
A= √ dx 0 < a ≤ R. (7.7)
a 0 R2 − x2
Con los mismos valores usados para a, b, h y H para hallar el volumen del sólido, encontramos
que el área de la parte superior de la tuberı́a es
p
4(11,8)(16,054) 15,7 15,72 − x2
Z
A= p dx = 716,29pulg 2.
15,7 0
2
16,054 − x 2

Para hallar el área lateral de la tuberı́a (área del cilindro elı́ptico cortada por el cilindro
circular) empezamos parametrizando la curva Γ que se muestra en figura 7.6

C
b

H h

b
a Γ
y
x

Figura 7.6: La recta vertical que se muestra en verde se mueve entre las curvas Γ y C para
generar el área lateral del cilindro elı́ptico cortada por el cilindro circular

249
Sea I = [0, 2π], entonces Γ = α(I) donde

α(t) = (a cos t, b sen t) = (x, y),



con (x, y, z) ∈ C. Como z = f (x, y) = R + h − R2 − x2 . Tenemos que el área lateral del la
tuberı́a esta dada por
Z Z 2π
Al = f ds = f (α(t))kα′(t)kdt
Γ 0
Z 2π  √ √
= 2
R + h − R − a cos t 2 2 a2 sen2 t + b2 cos2 tdt.
0

Esto es,
Z 2π  √ √
Al = R + h − R2 − a2 cos2 t a2 sen2 t + b2 cos2 tdt. (7.8)
0

La fórmula (7.8) se obtuvo utilizando una integral de linea, también podemos hallar el área
lateral de la tuberı́a mediante una integral de superficie.

Si S es la superficie del cilindro elı́ptico cortada por el cilindro circular, entonces S = r(G)
donde

r(u, v) = (a cos u, b sen u, v),

y G = {(u, v) : 0 ≤ u ≤ 2π, 0 ≤ v ≤ g(u)} con



g(u) = R + h − R2 − a2 cos2 u.

Con lo cual, el área lateral de la tuberı́a está dada por


ZZ
Al = kru × rv kdvdu
G
Z 2π Z g(u) √
= a2 sen2 u + b2 cos2 udvdu
Z0 2π √0
= a2 sen2 u + b2 cos2 ug(u)du
0

Entonces
Z 2π √  √ 
Al = a2 sen2 u + b2 cos2 u R + h − R2 − a2 cos2 u du. (7.9)
0

Si comparamos esta fórmula con la fórmula (7.8) vemos que es la misma, reemplazando u
por t. El área lateral de la tuberı́a también se puede obtener con una fórmula similar a la
encontrada en (7.7).

250
Problema 7.8.2 (***). Encuentre una fórmula similar a la encontrada en (7.7) para hallar
el área lateral de la tuberı́a del problema 7.8.1. Compruebe la validez de su fórmula, com-
parando el valor encontrado para el área al sustituir a = 15,7pulg y R = 16,054pulg, en la
fórmula (7.8).

Suponga que los cilindros del problema 7.8.1 son ambos circulares y del mismo radio R.
Encuentre el volumen del sólido en cuestión como función de la altura h y el radio R. Lo
mismo, para el área lateral y superior de la tuberı́a.

251
252
Bibliografı́a

[1] T. M. Apostol, Calculus, vol. I (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1988, 813 pp.

[2] T. M. Apostol, Calculus, vol. II (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1980, 813 pp.

[3] S. I. Grossman, Álgebra lineal (5th ed.), McGraw–Hill, 1996, 634 pp.

[4] K. Hoffman and R. Kunze Linear algebra(2nd ed.), Prentice–Hall, Inc., Englewood
Cliffs, New Jersey, 1971, 407 pp.

[5] B. Kolman and D. R. Hill, Álgebra lineal (8th ed.), Pearson Educación, 2006, 643 pp.

[6] L. Leithold, El Cálculo(6a ed.), Harla, 1992, 1563 pp.

[7] J. Stewart, L. Redlin And S. Watson, Precálculo(5a ed.), Cengage Learning Editores,
2007, 933 pp.

[8] J. Stewart, Calculus(6th ed.), Thomson–Brook–cole, 2008, 1338 pp.

253

También podría gustarte