Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Ecuaciones lineales 5
1.1. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Ecuación cartesiana de la recta . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2 . . . . . . . . . . . . . . . . 18
1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3 . . . . . . . . . . . . . . . . 24
1.5. Sistemas de ecuaciones lineales tamaño m × n . . . . . . . . . . . . . . . . . 33
1.5.1. Ecuaciones Diofánticas . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.6. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.6.1. Sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.6.2. Suma y multiplicación por escalar de matrices . . . . . . . . . . . . . 51
1.6.3. Producto matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2. Determinantes 63
2.1. Definición de determinante de una matriz . . . . . . . . . . . . . . . . . . . . 63
2.2. Interpretación geométrica del determinante de tamaño 2 × 2 . . . . . . . . . 64
2.3. Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . 66
2.4. Determinantes e inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.6. Taller 1 corte 1 parte 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.7. Taller 1 corte 1 parte 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3. Vectores en Rn 80
3.1. Vectores en el plano enfoque analı́tico . . . . . . . . . . . . . . . . . . . . . . 80
3.2. Vectores en el plano enfoque geométrico . . . . . . . . . . . . . . . . . . . . 82
3.2.1. Vector resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.3. Diferencia entre vectores y vectores geométricos . . . . . . . . . . . . . . . . 84
3.4. Desigualdad triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.5. Movimiento relativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.5.1. Vector proyección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
2
4. Nociones de cálculo integral 102
4.1. Área bajo la curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.2. Integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3. Propiedades de la integral definida . . . . . . . . . . . . . . . . . . . . . . . 110
4.4. La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.4.1. Problemas de valor inicial . . . . . . . . . . . . . . . . . . . . . . . . 111
4.5. Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 117
4.5.1. Primer teorema fundamental del cálculo . . . . . . . . . . . . . . . . 117
4.5.2. Segundo teorema fundamental del cálculo . . . . . . . . . . . . . . . . 118
4.6. Área entre curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.7. Curvas en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.7.1. Ecuación vectorial y normal de la recta . . . . . . . . . . . . . . . . . 128
4.8. Continuidad y diferenciación de aplicaciones vectoriales . . . . . . . . . . . . 135
4.8.1. Vector tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.9. Movimiento en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.9.1. Movimiento rectilineo . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.9.2. Movimiento circular uniforme . . . . . . . . . . . . . . . . . . . . . . 140
4.9.3. Movimiento con aceleración constante . . . . . . . . . . . . . . . . . . 146
4.9.4. Fuerza resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.10. Vectores en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
4.11. Producto cruz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
4.12. Rectas y planos en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
4.13. Aplicaciones de los vectores en el espacio . . . . . . . . . . . . . . . . . . . . 169
4.13.1. Movimiento en tres dimensiones . . . . . . . . . . . . . . . . . . . . . 169
4.14. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
4.15. Taller 2 corte 2 parte 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.16. Taller 2 corte 2 parte 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
4.17. Método de los mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . 186
4.17.1. Punto de vista del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 186
3
5.8. Cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.9. Bases ortonormales y proyecciones en Rn . . . . . . . . . . . . . . . . . . . . 213
5.10. Espacios con producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.11. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
Bibliografı́a 253
4
Capı́tulo 1
Ecuaciones lineales
ax + b = c, (1.1)
donde a 6= 0. Para resolver una ecuación de este tipo se utilizan dos propiedades fundamen-
tales
x = y ⇔ x + c = y + c, c ∈ R (1.2)
x = y ⇔ cx = cy si c 6= 0 (1.3)
El sı́mbolo ⇔ se lee si y sólo si y significa que las ecuaciones que separa son equivalentes,
es decir, que tienen el mismo conjunto solución. Lo cual significa que podemos sumar una
constante c en ambos lados de una ecuación sin alterar su solución, lo mismo ocurre con
la multiplicación, pero la equivalencia se mantiene si la constante c 6= 0. Por ejemplo, la
siguiente expresión es falsa
x2 = 4x ⇔ x = 4,
ya que, el conjunto solución de la primera ecuación es {0, 4}, mientras que el de la segunda
es {4}. La flecha no puede ir en los sentidos indicando equivalencia, solo podemos escribir
x2 = 4x ⇐ x = 4.
5
en donde para pasar de la primera equivalencia a la segunda se supuso primero que
ax = c − b ⇔ (1/a)(ax) = (1/a)(c − b)
⇔ ((1/a)a)x = (1/a)(c − b)
⇔ 1 · x = (1/a)(c − b)
⇔ x = (1/a)(c − b)
Debemos dotar el conjunto F de una segunda operación llamada multiplicación que debe
cumplir también la propiedad asociativa, modulativa, y cada elemento en F debe tener su
inverso multiplicativo en F . Si además, requerimos que la solución x esté en F , se deben
cumplir los axiomas de cerradura, esto es, si x, y ∈ F entonces x + y, xy ∈ F . Vemos que
definidas dos operaciones de suma y producto, estas deben cumplir ciertas propiedades, que
llamaremos propiedades de campo para que las ecuaciones se puedan solucionar y para
que dicha solución exista en el conjunto F que llamaremos campo.
1.1. Campos
La evolución de los sistemas numéricos se ha dado en conexión con la búsqueda de
soluciones de ciertas ecuaciones. Por ejemplo, la ecuación lineal
x+2 =0 (1.4)
Z = {. . . , −2, −1, 0, 1, 2, . . .}
La ecuación (1.4) tiene solución en este conjunto, por que en los enteros se cumplen los
axiomas de campo para la suma, no ası́, para la multiplicación, por eso, una ecuación lineal
6
como 2x + 1 = 0 no tiene solución en los enteros. Se debe considerar una nuevo conjunto que
contenga a los fraccionarios como −1/2 que soluciona la ecuación 2x + 1 = 0. Este nuevo
conjunto se denota por Q y se define como
Q = {p/q : p, q ∈ Z}
Este conjunto es nuestro primer prototipo de campo (ver el Problema1.7.4). Aunque existen
campos más grandes en el sentido de la contenencia, ya que ecuaciones como
x2 − 2 = 0
√ √
cuyas soluciones son − 2, 2 no son racionales. Tenemos entonces el campo de los números
reales, denotado por R y definido como
R = Q ∪ Qc ,
Qc = {x ∈ R : x ∈
/ Q} ,
también se denota por I el conjunto de los números irracionales. En (1.6) se definen los
números complejos, seguidamente se demuestra que este conjunto es un campo. Los números
complejos surgieron cuando se intento solucionar la ecuación
x2 + 1 = 0 (1.5)
El conjunto de los números reales, además de tener estructura de campo, tiene un orden
definido en el, dado por los axiomas de orden, de los cuales se implica que
x2 ≥ 0 ∀ x ∈ R,
con lo cual, x2 + 1 > 0 ∀ x ∈ R, por lo que la ecuación (1.5) no tiene solución en los reales.
Definición 1.1.1. Un campo es una tripla conformada por un conjunto F y dos operaciones
de adicción y producto, que cumplen las siguientes propiedades
Axiomas de cerradura
(a) Si x, y ∈ F , entonces x + y ∈ F
(b) Si x, y ∈ F , entonces xy ∈ F .
1. La adicción es conmutativa,
x+y = y+x
para todo x, y ∈ F .
7
2. La adicción es asociativa,
x + (y + z) = (x + y) + z
para todo x, y, z ∈ F .
La adicción es modulativa
x+0 =0
para cada x ∈ F .
x + (−x) = 0
5. La multiplicación es conmutativa,
xy = yx
para todo x, y ∈ F .
6. La multiplicación es asociativa,
x(yz) = (xy)z
para todo x, y, z ∈ F .
La multiplicación es modulativa
x1 = x
para cada x ∈ F .
8. Para cada elemento x diferente de cero en F existe un único elemento x−1 (o 1/x) en
F tal que
xx−1 = 1.
x(y + z) = xy + xz
para cada x, y, z ∈ F .
8
Ejemplo 1.1 (Construcción de un campo finito). Definimos los enteros módulo 3 como
Z3 = {0, 1, 2} .
⊕ 0 1 2 ⊙ 0 1 2
0 0 1 2 0 0 0 0
1 1 2 0 1 0 1 2
2 2 0 1 2 0 2 1
De las tablas de la suma y la multiplicación se observa que se cumplen los axiomas de cerra-
dura. Además, como Z3 ⊆ Z, en particular se cumplen las leyes conmutativas y asociativas
de la suma y la multiplicación, además de la ley distributiva y las leyes modulativas de la
suma y la multiplicación. Para finalizar debemos encontrar los inversos aditivos y multipli-
cativos de cada elemento de Z3 . De la tabla vemos que el inverso aditivo del 1 es 2, ya que
1 + 2 = 0, por conmutatividad (o observando la tabla) vemos que 2 + 1 = 0, luego el inverso
aditivo de 2 es 1. El inverso multiplicativo de 1 es 1 y de 2 es 2, con lo cual cada elemento
diferente de 0 tiene un inverso multiplicativo. Concluimos que Z3 con la suma y producto
ası́ definidos es un campo. Nótese que 1 + 2 = 0, es decir, 3 es el módulo de Z3 , de ahı́ el
nombre que se le da a este conjunto.
9
√
de manera similar, para c, d ∈ Q, y = c + d 2, entonces
√
x + y = (a + c) + (b + d) 2.
√ √
xy = (a + b 2)(c + d 2)
√ √ √
= (a + b 2)c + (a + b 2)d 2
√ √
= ac + bc 2 + ad 2 + 2bd
√
= (ac + 2bd) + (bc + ad) 2
Dado que los números son racionales son un campo (ver problema 1.7.4), en particular
cumplen axiomas de cerradura, lo cual implica que a + c, b + d ∈ Q y ac + 2bd, bc + ad ∈ Q.
Lo que a su vez implica que el conjunto F cumple los axiomas de cerradura. Sólo nos queda
verificar la existencia de inversos aditivo y multiplicativo para cada elemento de F . Sea
√ √
x = a + b 2 ∈ F , entonces −x := −a − b 2 ∈ F y x + (−x) = 0. Ahora, supongamos que
√
x = a + b 2 6= 0. Tenemos que
xy = 1,
1 √
donde y = √ . Veamos que y ∈ F . En efecto, supongamos que a − b 2 = 0, como
a+b 2
x 6= 0, a y b no son simultáneamente iguales a 0. Lo cual nos lleva a considerar dos casos:
a 6= 0, o, b 6= 0. Si b 6= 0, entonces
a √
= 2.
b
Lo cual es imposible. Ahora bien, si a 6= 0 tenemos que
b 1
=√ .
a 2
√
Lo cual nos conduce de nuevo a una contradicción pues, 1/ 2 es un número irracional.
√ √
Concluimos que a − b 2 6= 0 si x = a + b 2 6= 0, y en ese caso obtenemos que
√
1 a−b 2
y= √ · √
a+b 2 a−b 2
√
a−b 2
= 2
a − 2b2
a b √
= 2 + 2.
a − 2b2 2b2 − a2
Con lo cual verificamos que y ∈ F , concluyendo de esta manera la demostración.
10
C = a + bi : a, b ∈ R, i2 = −1 .
(1.6)
Vemos que este espacio no esta contenido en los números reales, por lo tanto, debemos
demostrar cada una de las propiedades de campo de la definición 1.1.1.
z=w⇔a=c y b=d
Ahora, para recordar las fórmulas que definen la suma y el producto en los números com-
plejos, podemos asociar el término a + bi con el polinomio lineal a + bx, y entonces sumar
y multiplicar complejos tal cual como hacemos con los polinomios lineales, esto es, para la
suma de dos complejos a + bi y c + di tenemos que
y para el producto
Demostraremos que los números complejos con la suma y el producto ası́ definidas, con-
forman un campo. Lo primero que tenemos que verificar son los axiomas de cerradura.
Esto es,
1. Si z, w ∈ C, entonces z + w ∈ C
2. Si z, w ∈ C, entonces zw ∈ C.
z + w = (a + bi) + (c + di)
= (a + c) + (b + d)i
= (c + a) + (d + b)i
= (c + di) + (a + bi)
= w + z.
11
Vemos que la conmutatividad de la suma de complejos se sigue de la conmutatividad de la
suma de los números reales. La ley asociativa de la suma complejos se demuestra de manera
análoga. Ahora estableceremos la propiedad modulativa de la suma. Si definimos 0 = 0 + 0i,
tenemos que si z = a + bi ∈ C, entonces
z + 0 = (a + bi) + (0 + 0i)
= (a + 0) + (b + 0)i
= a + bi
= z.
Además, para todo z = a + bi ∈ C, si w := −a − bi, se cumple que
z + w = (a + bi) + (−a − bi)
= (a + (−a)) + (b + (−b)i
= 0 + 0i
Es decir, todo número complejo tiene un inverso aditivo. Ahora demostraremos las propie-
dades de campo de la multiplicación de números complejos.
wz = (c + di)(a + bi)
= ca + cbi + dai − db
= (ac − bd) + adi + bci
= (ac − bd) + (ad + bc)i
= zw
Como el caso de la suma de complejos, vemos la conmutatividad de la multiplicación de
complejos se hereda de la conmutatividad de la multiplicación de los números reales. Ahora,
sean x = a + bi, y = c + di y z = e + f i un números complejos, entonces
x(yz) = (a + bi) [(c + di)(e + f i)]
= (a + bi) [ce − df + (cf + de)i]
= a(ce − df ) − b(cf + de) + [a(cf + de) + b(ce − df )] i
= a(ce) − a(df ) − b(cf ) − b(de) + [a(cf ) + a(de) + b(ce) − b(df )] i
= (ac)e − (ad)f − (bc)f − (bd)e + [(ac)f + (ad)e + (bc)e − (bd)f ] i
= (ac)e − (bd)e − (ad)f − (bc)f + [(ac)f − (bd)f + (ad)e + (bc)e] i
= (ac − bd)e − (ad + bc)f + [(ac − bd)f + (ad + bc)e] i
= [(ac − bd) + (ad + bc)i] (e + f i)
= [(a + bi)(c + di)] (e + f i)
= (xy)z.
12
Demostrando de esta forma, la ley asociativa de la multiplicación. Construiremos a conti-
nuación el elemento neutro de la para multiplicación de complejos. Queremos encontrar un
complejo e = x + yi tal que para todo z = a + bi se cumpla que ze = z, esto es,
zw = 1 + 0i = 1,
1
donde w = . Demostraremos que w ∈ C.
a + bi
1 a − bi
w= ·
a + bi a − bi
a − bi
= 2
a + b2
a −b
= 2 2
+ 2 i.
a +b a + b2
Nótese que a − bi y a2 + b2 son diferentes de 0 + 0i, ya que a + bi 6= 0.
13
1.2. Ecuación cartesiana de la recta
Sean P = (x1 , y1 ) y Q = (x2 , y2 ) dos puntos dados de la recta l. Definimos la pendiente
de la recta, la cual denotaremos con la letra m como
y2 − y1
m = tan θ = (1.7)
x2 − x1
donde el ángulo θ se mide desde el eje x en el sentido contrario de las manecillas del reloj
(ver la figura 1.1). Como se ve en la la fórmula (1.7), la pendiente es una razón de cambio
de y con respecto a x y es una medida de la inclinación de la recta con respecto al eje x.
y
l
Q
b
y2 − y1
Pb θ
x2 − x1
θ x
O
Figura 1.1: Cálculo de la pendiente de una recta dados dos de sus puntos
Vemos que la hipotenusa del triángulo de la figura 1.7 nos da la distancia entre los puntos
P y Q, por el Teorema de Pitagóricas tenemos que
p
d(P, Q) = (x1 − x2 )2 + (y1 − y2 )2 (1.8)
En la figura 1.2 se muestran la diferentes inclinaciones que puede tener una recta.
14
y y y
0 < θ < 90
m = tan θ > 0
b m=0 m=∞
y=b
a θ
x x x
x=a
(a) m = 0, la recta es (b) m = ∞, la recta (c) m > 0, relación
horizontal es vertical directa
y
90 < θ < 180
m = tan θ < 0
θ
x
Ahora, fijemos el punto P sobre la recta l en la figura 1.2. Esto es, P = (x0 , y0 ) es un
punto dado de la recta. Supongamos además que Q = (x, y) es un punto arbitrario.
y
l
Q
b
y − y0
P
b θ
x − x0
θ x
O
Figura 1.3: Ecuación de una recta dados uno de sus puntos y su pendiente
15
y − y0
m = tan θ = .
x − x0
O bien,
La fórmula anterior nos dice que para, determinar completamente una recta es suficiente
con tener un punto y una dirección, la cual es dada por la pendiente m. Esta claro que dados
dos puntos de la recta, con la fórmula (1.7) podemos hallar la pendiente y escoger uno de los
puntos para con la Fórmula punto-pendiente hallar la ecuación de la recta. Concluimos que:
Nota 1.2.1. Dos puntos determinan una recta, o bien, un punto y una dirección.
y = y0 + m(x − x0 ) = mx + y0 − mx0 ,
y = mx + b (Fórmula pendiente-intercepto)
Vemos que cuando x = 0, y = b, es decir la recta corta al eje y en b, por eso este número
es llamado intercepto de la recta con eje y. Si m = 0 en la Fórmula pendiente-intercepto
obtenemos y = b que es la ecuación de una recta horizontal (ver figura 1.2(a)). Si m > 0
(figura 1.2(c)), x, y y guardan una relación directa, es decir, la variable y crece cuando x
crece. Por el contrario, si la variable y decrece cuando la variable x aumenta, tenemos que
m < 0, y la gráfica es la recta decreciente que se muestra en la figura 1.2(d). Finalmente, si
la recta es vertical, θ = π/2 = 90◦ , y m = tan(π/2) = ∞ (ver figura 1.2(b)).
Ejemplo 1.3 (Modelo de costo lineal). A una compañı́a le cuesta $75 producir 10 unidades
de cierto artı́culo al dı́a y $120 producir 25 unidades del mismo artı́culo al dı́a.
16
Solución. Denotemos con y = C(x) el costo total de producir y vender x unidades diarias
del artı́culo. Según los datos del problema y1 = 75 cuando x1 = 10, y y2 = 120 cuando
x2 = 25. Por lo tanto, por la Fórmula (1.7) obtenemos
y2 − y1 120 − 75
m= = = 3.
x2 − x1 25 − 10
Como m = 3 > 0, concluimos que entre más artı́culos se produzcan, su costo total aumentará.
Además, m = 3/1, lo que significa que por cada artı́culo de más que se produzca, el costo
total de producción de los artı́culos aumentará en $3. Ahora, utilizando la Fórmula punto-
pendiente, con (x0 , y0 ) = (25, 120), obtenemos
De donde y = C(x) = 120 + 3(x − 25) = 3x + 45. Con lo cual se tiene la parte (a). Se observa
que aunque se produzcan 0 artı́culos, se incurre en un costo de $45, dichos costos son llamados
costos fijos. Por ejemplo, cuando una empresa esta en temporada de vacaciones hay que
pagar arriendo servicios, etc.
Ejemplo 1.4. El aire seco al moverse hacia arriba se expande y enfrı́a a razón de aproxi-
madamente 1◦ C por cada 100m de elevación, hasta cerca de 12km.
(a) Si la temperatura del suelo es de 20◦ C, escriba una fórmula para la temperatura a una
altura h.
(b) ¿Qué intervalo de temperaturas puede esperarse si un avión despega y alcanza una
altura máxima de 5km?
Solución. Según la información dada en el ı́tem (a), T (0) = 20◦ C, donde T (h) representa
la temperatura a una altura h. Además, nótese que la razón cambio de la temperatura con
respecta a la altura viene dada por la pendiente
∆T 1◦ C
m=− =−
∆h 100m
1◦ C 1m
=− ·
100m (1/1000)km
1◦ C
=−
(1/10)km
= −10◦ C/km
17
Aquı́, m < 0, ya que tenemos una relación inversa; a medida que aumenta la altura disminuye
la temperatura. Como además de la pendiente tenemos el intercepto con el eje y, b = 20◦ C,
por la fórmula pendiente–intercepto tenemos que
T (h) = 20 − 10h, 0 ≤ h ≤ 12
Para el inciso (b), vemos que T (5) = 20−10(5) = −30. Por lo tanto, cuando el avión despega
la temperatura es de 20◦ C, y al alcanzar los 5km de altura, la temperatura a disminuido
hasta −30◦ C.
Esto es, mientra que h varia entre 0 y 5, T varia entre −30 y 20.
Ax + By + C = 0 (1.9)
A C
y =− x−
B B
que es la Fórmula pendiente-intercepto con m = −A/B y b = −C/A. La fórmula (1.9) es
llamada ecuación general de la recta.
18
Puesto que las variables x y y tienen exponente 1, y el sistema consta de 2 ecuaciones con
2 incógnitas (1.10) es llamado sistema de ecuaciones lineales de tamaño 2 × 2. La
primera pregunta que nos formulamos es: bajo que condiciones el sistema en (1.10) tiene
solución. Esto es, una pareja (x, y) que satisface ambas ecuaciones. Como sabemos de la
sección anterior cada una de estas ecuaciones es representada por una linea recta, y esta
claro que si estas son paralelas no existe un punto (x, y) que este en ambas rectas, es decir el
sistema no tiene solución. Supongamos entonces que las rectas de ecuaciones a11 x+ a12 y = b1
y a21 x + a22 y = b2 son paralelas. Despejando la variable y en ambas ecuaciones obtenemos
a11 b1 a21 b2
y=− x+ , y =− x+
a12 a12 a22 a22
a11 a21
en donde se identifican las pendientes de las rectas, m1 = − y m2 = − . Dado que
a12 a22
estas son paralelas tenemos que
a11 a21
m1 = m2 ⇔ − =− ⇔ a11 a22 − a21 a12 = 0.
a12 a22
Por lo tanto, si el sistema (1.10) no tiene solución entonces a11 a22 − a21 a12 = 0. Recı́proca-
mente, si a11 a22 − a21 a12 = 0 entonces m1 = m2 , y el sistema (1.10) no tiene solución. Lo
anterior lo podemos decir de manera equivalente como sigue:
El sistema (1.10) tiene una única solución si y sólo si a11 a22 − a21 a12 6= 0.
Observese que en el análisis anterior sólo se considero en caso en que a11 , a22 6= 0, (Ver, [3,
pag. 2]) en donde se consideran todos los casos.
Vemos que para este caso a11 = 1, a12 = −1, a21 = 2 y a22 = −2. Con lo cual a11 a22 −a21 a12 =
1(−2) − 2(−1) = 0, sin embargo el sistema tiene solución, por ejemplo, la pareja (2, 0) es
solución. Más aún, este sistema tiene infinitas soluciones, para verlo nótese que la primera
ecuación puede ser obtenida de la segunda al multiplicarla por 1/2. Entonces si y = t de la
primera ecuación x = t + 2, luego las soluciones del sistema (1.11) son de la forma
x = t + 2, y = t, t ∈ R.
19
y y y
l1
l1
l1 = l2
l2 l2
x x x
(b) No tiene solución o tiene infinitas soluciones si y sólo si a11 a22 − a12 a21 = 0.
|ax0 + by0 + c|
dmı́n = √ .
a2 + b2
Solución. Se pueden definir infinitas distancias del punto P0 a la recta l (ver figura 1.5),
pero sólo hay una que es la menor, precisamente la perpendicular trazada desde el punto P0
hasta la recta l. Supongamos que dicha perpendicular corta a l en un punto P1 = (x1 , y1 ).
20
y
P0
l
dmı́n
P1
l⊥
x
O
Debe notarse que las constantes a, b, c, x0 y y0 son dadas y tenemos que expresar x1 y y1
en términos de estas constantes. Para tal fin plantearemos dos ecuaciones. Empecemos por
calcular la pendiente de la recta l⊥ que une los puntos P0 y P1 . Por la fórmula 1.7 encontramos
que
y1 − y0
m⊥ =
x1 − x0
Ahora calculemos la pendiente de la recta l, tememos que ax + by + c = 0, en donde las
constantes a y b no son simultáneamente iguales a cero, por ejemplo supongamos que b 6= 0,
entonces
a c
y =− x−
b b
a
en donde vemos la pendiente de la recta l es m = − . Como las rectas l y l⊥ son perpendi-
b
culares por el Teorema 1.3.1 el producto de sus pendientes es −1, esto es,
a y − y
1 0
m · m⊥ = −1 ⇔ − · = −1.
b x1 − x0
De forma equivalente
a
x1 − x0 = (y1 − y0 ). (1.13)
b
21
Con lo cual tenemos nuestra primera ecuación
Para plantear la segunda ecuación nótese que (x1 , y1 ) ∈ l, entonces ax1 + by1 + c = 0, o bien
Con las ecuaciones (1.14) y (1.15) formamos el siguiente sistema de ecuaciones lineales de
tamaño 2 × 2
−bx1 + ay1 = ay0 − bx0
(1.16)
ax1 + by1 = −c
Aquı́ las variables x1 , y1 reemplazan a las variables x, y en (1.10), y tenemos que a11 = −b,
a12 = a, a21 = a y a22 = b, de donde
−abx1 + a2 y1 = a2 y0 − abx0
(1.17)
abx1 + b2 y1 = −bc
Decimos que los sistemas (1.16) y (1.17) son equivalentes en el sentido de ambos tienen la
misma solución. Consideremos un tercer sistema equivalente a los dos primeros reemplazando
la segunda ecuación por la suma de la primera y segunda ecuación
−abx1 + a2 y1 = a2 y0 − abx0
(1.18)
0 + (a2 + b2 )y1 = a2 y0 − abx0 − bc
22
Ası́,
−b(ax0 + by0 + c)
y1 − y0 = . (1.19)
a2 + b2
Ahora hagamos lo mismo pero con la diferencia x1 − x0 . En efecto, reemplazando (1.19) en
(1.13) obtenemos que esta diferencia es igual a
a −b(ax0 + by0 + c)
x1 − x0 = · ,
b a2 + b2
o bien,
−a(ax0 + by0 + c)
x1 − x0 = , (1.20)
a2 + b2
Finalmente, reemplazando las ecuaciones (1.19) y (1.20) en (1.12) y realizando un poco de
álgebra obtenemos
2 2
2 −b(ax0 + by0 + c) −a(ax0 + by0 + c)
dmı́n = +
a2 + b2 a2 + b2
b2 (ax0 + by0 + c)2 a2 (ax0 + by0 + c)2
= +
(a2 + b2 )2 (a2 + b2 )2
(a2 + b2 )(ax0 + by0 + c)2
=
(a2 + b2 )2
(ax0 + by0 + c)2
= .
a2 + b2
De donde
s
(ax0 + by0 + c)2
dmı́n =
a2 + b2
p
(ax0 + by0 + c)2
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2
23
Ejemplo 1.6. (Ver, [3, pag. 7, Problema 34]). La compañı́a Sunrise Porcelain fabrica tazas y
platos de cerámica. Para cada taza o plato un trabajador mide una cantidad fija de material
y la pone en una maquina que los forma, de donde pasa al secado y vidriado automático. En
promedio, un trabajador necesita 3 minutos para iniciar el proceso de una tasa y 2 minutos
para el de un plato. El material para una tasa cuesta 25c y el material para un plato cuesta
20c. Si se asignan $44 diarios para la producción de tazas y platos, ¿cuántos deben fabricarse
de cada uno en un dı́a de trabajo de 8 horas, si un trabajador se encuentra trabajando cada
minuto y se gasta exactamente $44 en materiales?
24
de plano. En esta sección se describirá un método de solución para el sistema (1.21). Es-
te método se basa en el hecho de que las soluciones, o conjunto solución de un sistema se
mantiene invariante bajo la acción de tres operaciones que llamaremos elementales. Antes de
definir dichas operaciones introduciremos la noción de matriz, que nos permitirá simplificar
la escritura de cada paso del procedimiento.
Definición 1.4.2 (Operaciones elementales con filas). Para reducir una matriz se utilizan
las siguientes operaciones elementales
El proceso de aplicar operaciones elementales con filas para simplificar una matriz au-
mentada se llama reducción por filas.
Notación
25
(a) Ri → cRi significa que la i−ésima fila se reemplaza por esa misma fila multiplicada
por c.
(b) Rj → Rj + cRi significa la j−ésima fila se reemplaza por la suma de la fila j más la
fila i multiplicada por c
(d) A ⇐⇒ B indica que las matrices aumentadas A y B son equivalentes; es decir, que los
sistemas que representan tienen la misma solución
Cuando se aplica el método de reducción por filas a una matriz se puede llegar a dos
formas equivalentes de dicha matriz: forma escalonada reducida por renglones (FERR)
y forma escalonada por renglones (FER). A continuación damos la definición general
de estas dos formas.
Definición 1.4.3 (FERR). Una matriz se encuentra en la forma escalonada reducida por
renglones (FERR) si se cumplen las siguientes condiciones
(a) Todos los renglones (si los hay) cuyos elementos son todos cero aparecen en la parte
inferior de la matriz.
(b) El primer número diferente de cero (comenzando por la izquierda) en cualquier renglón
cuyos elementos no todos son cero es 1.
(c) Si dos renglones sucesivos tienen elementos distintos de cero, entonces el primer 1 en
el renglón de abajo está más hacia la derecha que el primer 1 en el renglón de arriba.
(d) Cualquier columna que contiene el primer 1 en un renglón tiene ceros en el resto de
sus elementos.
El primer número diferente de cero en un renglón (si lo hay) es llamado pivote para este
renglón.
Si una matriz cumple sólo las condiciones (a),(b) y (c) en la definición 1.4.3 se dice que
está en la forma escalonada por renglones (FER).
26
Vemos que la matriz A se encuentra en la FER, mientras que la matriz B está en la FERR.
También notamos que la matriz A se puede reducir aún más,
1 2 3 R1 → −3R3 + R1 1 2 0 1 0 0
0 1 5 R2 → −5R3 + R2 0 1 0 R1 → −2R2 + R1 0 1 0
⇐⇒
0 0 1 ⇐⇒ 0 0 1 0 0 1
Advertimos que la última matriz en el proceso de simplificación de la matriz A está en la
FERR, lo que nos dice esta forma es más refinada que la FER. Vemos además que la FER
no es única.
El proceso de simplificación de una matriz dada para llevarla a la FER tiene un orden
determinado. Mostraremos mediante el siguiente ejemplo cada uno de estos pasos.
Ejemplo 1.8. Llevar la matriz
0 0 5
0 2 0
A=
0 3 2
0 0 3
a la FER
Solución. Se debe aclarar que para llevar esta matriz a la FER puede existir un número
menor de pasos que los que llevaremos acabo a continuación, sin embargo, esto funcionaria
para esta matriz en particular. El proceso que describe permite simplificar cualquier matriz
de tamaño m × n.
Paso 1
Determinar la primera columna de A (comenzando de izquierda a derecha), cuyos ele-
mentos no sean todos nulos. Para este caso serı́a la columna 2, que llamaremos columna
pivote.
0 0 5
0 2 0
A=
0 3 2
0 0 3
Paso 2
Identificar la primera entrada (comenzando de arriba hacia abajo) de la columna pivote
que sea distinta de cero. Este elemento es llamado pivote, para es caso es 2.
0 0 5
0 2 0
A=
0 3 2
0 0 3
27
Paso 3
Intercambiar, en caso de ser necesario, la primera fila por el reglón que contiene al pivote,
esta es ahora la llamada fila pivote. Denotamos la matriz obtenida al realizar esta operación
elemental por A1 . Esto es,
0 0 5 0 2 0
0 2 0 R1 ↔ R2 0 0 5
A= = A1
0 3 2 ⇐⇒ 0 3 2
0 0 3 0 0 3
Paso 4
Ahora se puede multiplicar por el inverso del pivote, para generar un 1 en la fila pivote.
Esta nueva matriz la denotamos por A2
0 2 0 0 1 0
0 0 5 R1 → (1/2)R1 0 0 5
A1 = = A2
0 3 2 ⇐⇒ 0 3 2
0 0 3 0 0 3
Paso 5
La nueva fila pivote es ahora la primera fila de la matriz A2 , y el nuevo pivote es 1, con
la cual podemos generar ceros en la columna que lo contiene, obteniendo una matriz A3
0 1 0 0 1 0
0 0 5 R → −3R + R 0 0 5
3 1 3
A2 = = A3
0 3 2 ⇐⇒ 0 0 2
0 0 3 0 0 3
Paso 6
28
La columna pivote es la tercera, y elemento pivote, para este caso el 5, ya está en la primera
fila, por lo que se omite el paso 3. Se empieza entonces con el paso 4, multiplicar fila 1 de la
matriz B1 , por el inverso del pivote
0 0 5 0 0 1
R1 → (1/5)R1
B = B1 = 0 0 2 0 0 2 = B2
⇐⇒
0 0 3 0 0 3
Ahora podemos generar ceros en los elementos de la columna que contiene el nuevo pivote,
que ahora es 1
0 0 1 R2 → −2R1 + R2 0 0 1
B2 = 0 0 2 R3 → −3R1 + R3 0 0 0 = B3
0 0 3 ⇐⇒ 0 0 0
Paso 7
29
Solución. Empezamos por definir las variables. sea x el número de sillas que se deben
fabricar por semana, y el número de mesas de café y z el número de mesas para comedor
que se deben fabricar por semana. Es conveniente organizar los datos del problema en una
tabla
x y z Disponibilidad semanal
Lijado (1/6)x (1/5)y (1/4)z 16
Pintado (1/10)x (2/15)y (1/5)z 11
Barnizado (1/5)x (1/5)y (3/10)z 18
este elemento ya se encuentra en la primera fila, por lo que el paso 3 del ejemplo 1.8 se omite.
El paso 4 indica que se debe multiplicar por el inverso del pivote, la fila pivote
30
El algoritmo puede continuar como en el ejemplo 1.8, sin embargo, como se genero otro cero
en la tercera fila en el último paso, es posible encontrar el valor de la variable y y hacer la
sustitución hacia atrás, para encontrar la solución del sistema
Ejemplo 1.9. Una fábrica produce tres productos A, B y C. Las ventas por cada unidad de
A, B y C son $1, $2 y $3, respectivamente. Los costos fijos son $19000 por año y los costos
de producción de cada unidad de A, B y C son $4, $5 y $7, respectivamente. El próximo
año, un total 9000 unidades de estos tres productos deben ser producidas y vendidas, y se
destina un total de $20000 para ventas. Si el costo total debe ser $71000, ¿cuántas unidades
de cada producto se deberı́an producir el próximo año?
Solución. Sea x el número de unidades del artı́culo A que se deben producir el próximo
año, y y, z, las respectivas variables que representan el número de unidades del artı́culos B
y C que se deben producir el próximo año.
x + y + z = 9000.
Se tiene un total de $20000 para las venta del próximo año, por lo que
x + 2y + 3z = 20000.
Además, como
costo total=costos fijos + costos de producción,
31
tenemos que la tercera ecuación es
71000 = 19000 + 4x + 5y + 7z.
Con lo cual formamos el sistema
x + y + z = 9000
x + 2y + 3z = 20000
4x + 5y + 7z = 52000
La matriz aumentada para este sistema es
1 1 1 | 9000
1 2 3 | 20000
4 5 7 | 52000
Al aplicar reducción por filas obtenemos
1 1 1 | 9000 R1 → −R1 + R2 1 1 1 | 9000
1 2 3 | 20000 R3 → −4R1 + R3 0 1 2 | 11000
4 5 7 | 52000 ⇐⇒ 0 1 3 | 16000
1 1 1 | 9000
R3 → −R2 + R3
0 1 2 | 11000
⇐⇒
0 0 1 | 5000
Observamos que la forma de la última matriz aumentada del sistema se encuentra en la FER
y se puede ver de inmediato que z = 5000. Después se usa la sustitución hacia atrás
para despejar primero y, y luego x. La segunda ecuación queda y + 2z = 11000, de donde,
y = 11000 − 2(5000) = 1000. Ahora reemplazando los valores de y y z en la primera ecuación
obtenemos x + 1000 + 5000 = 9000 o x = 3000. Esta es la solución única para el sistema.
Se escribe el la forma (3000, 1000, 5000). El método de solución que se acaba de emplear se
denomina eliminación Gaussiana.
32
1 1 0 | 4000 1 0 0 | 3000
0 1 0 | 1000 R1 → −R2 + R1 0 1 0 | 1000
⇐⇒
0 0 1 | 5000 0 0 1 | 5000
Vemos que la matriz aumentada del sistema está en la FERR. De inmediato se observa que
x = 3000, y = 1000 y z = 5000. Y de nuevo se encuentra que la solución del sistema es
(3000, 1000, 5000). El método descrito anteriormente se denomina eliminación de Gauss–
Jordan.
Por ahora se cuenta con dos métodos para resolver sistemas de ecuaciones
Eliminación Gaussiana
Eliminación de Gauss–Jordan
33
donde los coeficiente aij , ası́ como los términos independientes bj , son elementos de un campo
F , que por lo regular es R o C. El sistema (1.22) puede tener infinitas soluciones reales,
e infinitas soluciones enteras, pero finitas soluciones enteras positivas. Para encontrar las
soluciones enteras positivas de un sistema m × n introduciremos la noción de Ecuación
Diofántica.
ax + by = c,
Aquı́ (a, b) denota el máximo común divisor entre los enteros a y b y el sı́mbolo d|c
significa que d divide a c.
Ejemplo 1.10. Una señora compró 100 frutas por $5000. Las ciruelas le costaron a $25
cada una, las manzanas a $150 y las pitayas a $500. ¿Cuántas frutas de cada clase compro?
1 1 1 | 100
1 6 20 | 200
34
Ahora reduciremos esta matriz hasta llevarla a la F.E.R.R.
1 1 1 | 100 R2 → −R1 + R2 1 1 1 | 100
1 6 20 | 200 ⇐⇒ 0 5 19 | 100
1 1 1 | 100 R2 → (1/5)R2 1 1 1 | 100
0 5 19 | 100 ⇐⇒ 0 1 19/5 | 20
1 1 1 | 100 R1 → −R2 + R1 1 0 −14/5 | 80
0 1 19/5 | 20 ⇐⇒ 0 1 19/5 | 20
Vemos que la variable z, relaciona las otras dos variables, nos referimos a dicha variable como
variable de ligamiento. Si asignamos a la variable de ligamiento, el valor de un parámetro
t podemos expresar las variables x, y en términos de dicho parámetro, para obtener
x = 80 + (14/5)t
y = 20 − (19/5)t, t ∈ R
De esta forma encontramos lo que se conoce como forma paramétrica del sistema
x = 80 + (14/5)t
y = 20 − (19/5)t
z = t, t ∈ R
Notamos inmediatamente que hay una solución por cada valor que toma el parámetro, es
decir, el sistema tiene infinitas soluciones reales. Pero, dado que cada una de las variables
debe ser positiva, tenemos las siguientes restricciones
esto es, 0 < t < 100/19 = 5 + 5/19. Además, de las expresiones paramétricas para x, y,
advertimos, que para que estas variables representen números enteros, t debe ser un múltiplo
de 5 diferente de 1. Como el único múltiplo de 5 diferente de 1 en el intervalo (0, 100/19),
es 5, la única opción es que t = 5. De donde, la única solución entera positiva del sistema es
x = 94, y = 1 y z = 5.
35
Ahora utilicemos ecuaciones Diofánticas para hallar las soluciones enteras del sistema.
Despejando el parámetro en la primera ecuación de la forma paramétrica para el sistema
obtenemos
5
t = (x − 80),
14
reemplazando este valor en la segunda ecuación de la forma paramétrica para el sistema nos
da
19 5
y = 20 − (x − 80)
5 14
o equivalentemente,
Tenemos entonces una ecuación Diofántica con a = 19, b = 14 y c = 1800, además, como
(19, 14) = 1|1800, por el Teorema 1.5.1 la ecuación tiene solución, más aún, este mismo
resultado nos asegura que la solución viene dada por
14 19
x = x0 + k , y = y0 − k ,
1 1
donde x0 , y0 es una solución particular de la ecuación, y sea observa de la ecuación (1.23)
que x0 = 80 y y0 = 20. Por lo tanto,
x = 80 + 14k
y = 20 − 19k
Para expresar la variable z como una función de k, nótese que x + y + z = 100, con lo cual,
36
Definición 1.5.2 (congruencia lineal). Sean a y b enteros y n un entero positivo. Si n|(a−b)
decimos que a y b son congruentes módulo n y escribimos
a ≡ b(mod n).
módulo n.
Solución. En efecto, puesto que, 216 = 65536 = (102)(641) + 154. Por la de congruencia
lineal tenemos
37
por lo que por, transitividad debemos tener que
Finalmente, como 641 ≡ 0(mod 641), de nuevo por transitividad tenemos que
5
22 + 1 ≡ 0(mod 641),
5 5
lo cual implica que 641|(22 + 1), en efecto, 22 + 1 = (641)(6700417).
Además de las propiedades dadas en el teorema 1.5.2la relación ser congruente con es
transitiva, más aún, la relación de congruencia es una relación equivalencia. Recordemos
que
∀x ∈ A, (x, x) ∈ R.
R es simetrica si
(x, y) ∈ R ⇒ (y, x) ∈ R.
R es antisimetrica si
(x, y) ∈ R y (y, x) ∈ R ⇒ x = y.
R es transitiva si
38
Si a y b están relacionados escribimos aRb, o bien (a, b) ∈ R.
Definición 1.5.6. Sean A un conjunto y R una relación de equivalencia en A, para cada
a ∈ A denotamos la clase de equivalencia de a por [a] y la definimos como
[a] = {x ∈ A : (x, a) ∈ R}
A/R = {[a] : a ∈ A} .
x ≡ a(mod n)
Ejemplo 1.12. Un comerciante compró lápices y borradores por $2,490. Si cada lápiz costo
$29 y cada borrador costo $33, ¿cuántos lápices y borradores compro? Sugerencia
Solución. Sea x el número de lápices y y el número de borradores que el comerciante
compró. Tenemos entonces la ecuación Diofántica
sujeta a las condiciones x, y > 0. Para hallar la solución general de la ecuación primero
debemos hallar una solución particular. En ocasiones es fácil hallar esta solución si a|c, o b|c.
Por ejemplo, en la ecuación Diofántica
tenemos que a = 77, b = 55 y c = 28600, y observamos que 28600 = 520 · 55, esto es,
55|28600. Por lo tanto, si hacemos que la variable x sea igual a cero, obtenemos para y es
valor 28600/55 = 520. De esta forma vemos que una solución particular de la ecuación es
x0 = 0 y y0 = 520. Con lo cual, por el Teorema 1.5.1 la solución general de la ecuación es
39
Sin embargo, para la ecuación (1.24) a = 29, b = 33 y, entonces d = (29, 33) = 1 divide a
c = 2490, por lo que la ecuación tiene solución, pero ni a, ni b dividen a c, en consecuencia
al tomar x, o y igual a cero no obtenemos una solución entera. En este caso para encontrar
la solución particular podemos utilizar congruencias lineales. Procedemos como sigue.
Dado que 33y = 2490 − 29x tenemos que 29x ≡ 2490(mod 33). Por el algoritmo de la
división 2490 = 33(75) + 15, entonces 2490 ≡ 15(mod 33). Luego, por la propiedad transitiva
de la congruencia lineal
Ahora, −4 ≡ 29(mod 33), entonces por el inciso (e) del Teorema 1.5.2,
De nuevo por transitividad tenemos que −4x ≡ 15(mod33), con lo cual, −32x ≡ 120(mod33)
y 120 = 33(3) + 21 de donde 120 ≡ 21(mod 33), por consiguiente,
Por último, como 1 ≡ −32(mod 33), x ≡ −32x(mod 33), lo cual por transitividad implica
que x ≡ 21(mod 33). Esta última congruencia se satisface si x = x0 = 21, de donde y0 =
2490 − 29 · 21
= 57. En consecuencia, la solución general de la ecuación es
33
x = 21 + 33k, y = 57 − 29k, k ∈ Z.
Como x, y > 0, 21 + 33k > 0 y 57 − 29k > 0, de donde −21/33 < k < 57/29, entonces
k = 0, 1.
Si k = 0 obtenemos x = 21, y = 57.
Si k = 1 obtenemos x = 54, y = 28.
Solución. Dado que 15 ≡ −3(mod 18), por transitividad tenemos que 3x ≡ −3(mod 18).
Entonces, por la propiedad (f) del Teorema 1.5.2, x ≡ −1(mod 6) y −1 ≡ 5(mod 6), luego
de nuevo por transitivivdad x ≡ 5(mod 6). Por consiguiente, x = 5 + 6k, k ∈ Z.
Ejemplo 1.14. Un hombre cambió un cheque por cierta cantidad de dinero. El cajero equivo-
cadamente intercambio el número de pesos con el número de centavos. Al revisar la cantidad
recibida el hombre observó que tenia el doble de la cantidad por la cual habı́a girado el cheque
más dos centavos. Por que valor fue girado el cheque?
40
Solución. Sea x la variable que representa el número de pesos, y y la variable que representa
el número de centavos. La cantidad por la cual fue girado el cheque en pesos viene dada por
1
x+ y.
100
Si se intercambian el número de pesos con el número de centavos, la cantidad obtenida en
pesos está dada por
1
y+ x,
100
según los datos del problema esta cantidad el igual a el doble de la cantidad por la cual habı́a
girado el cheque más dos centavos, por lo tanto, tenemos la ecuación
1 2 1
2 x+ y + =y+ x,
100 100 100
o equivalentemente,
−199x + 98y = 2,
Ahora, −3 ≡ 196(mod 199), entonces −3y ≡ 196y(mod 199). Con lo cual por transitividad
Pero 1 ≡ −198(mod 199), entonces y ≡ −198y(mod 199), por consiguiente por transitividad
y ≡ 264(mod 199).
Finalmente, como 264 ≡ 65(mod 199), tenemos que y ≡ 65(mod 199), de lo cual deducimos
que
y = 199k + 65, k ∈ Z.
41
98(65) − 2
Si k = 0, obtenemos y = y0 = 65, de donde x0 = = 32. Por lo tanto, la solución
199
general de la ecuación es
donde x > 0 y 0 < y < 100. De las restricciones x, y > 0, obtenemos dos correspondientes
cotas inferiores para el parámetro k:
32 65
− <k y − < k,
98 199
y la restricción y < 100, nos da una cota superior para k:
100 − 65 35
k< = .
199 199
Como
65 32
− <− ,
199 98
el intervalo más pequeño que puede contener a k es
32 35
− , ,
98 199
de lo cual, k = 0, de donde x = 32, y y = 65. Luego el cheque se giró por $32, 65.
Según el Teorema 1.5.4 la relación aRb ⇔ a ≡ b(mod n) define una relación de equiva-
lencia en Z. Entonces la clase de equivalencia a de un elemento a ∈ Z está dada por
a = {x ∈ Z : x ≡ a(mod n)}
= {x ∈ Z : x = a + kn, para algún z ∈ Z} .
El conjunto cociente generado por esta relación es denotado por Zn . Ahora, si a es un entero
arbitrario como n > 0, por el algoritmo de la división podemos representarlo en la forma
a = qn + r con 0 ≤ r < n, luego a ≡ r(mod n) y en consecuencia por el Teorema 1.5.3, a = r.
Por ejemplo, en Z4 tenemos que
4 ≡ 0(mod 4) ⇒ 4 = 0
5 ≡ 1(mod 4) ⇒ 5 = 1
6 ≡ 2(mod 4) ⇒ 6 = 2
7 ≡ 3(mod 4) ⇒ 7 = 3
8 ≡ 0(mod 4) ⇒ 8 = 0
42
Por lo tanto, Z4 sólo puede estar conformado por 4 clases:
Z4 = 0, 1, 2, 3 .
llamamos a este conjunto enteros módulo n. Sobre Zn podemos definir una adición una
multiplicación mediante las siguientes fórmulas
x + y = x + y,
x · y = xy.
Los enteros módulo n con la suma ası́ definida cumplen las propiedades de campo de la
definición 1.1.1.
Axiomas de cerradura
(a) x, y ∈ Zn , entonces x + y ∈ Zn .
(b) x, y ∈ Zn , entonces x · y ∈ Zn .
(c) x + y = y + x,
(d) x + (y + z) = (x + y) + z.
x+y =x+y
=y+x
= y + x.
43
Nótese que como x + y = y + x, entonces x + y = y + x. De forma análoga demostramos la
asociatividad.
x+0 =x+0= x
La demostración del inciso (a) en el teorema anterior nos indica como construir las tablas
de suma y la multiplicación en Zn .
Solución. Por lo hecho en la demostración del inciso (a) del Teorema 1.5.5 tenemos que
+ 0 1 2 3 · 0 1 2 3
0 0 1 2 3 0 0 0 0 0
1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1
Por comodidad hemos omitido las barras. Se observa de la tabla de la multiplicación que
hay simetrı́a respecto a la diagonal principal, esto quiere decir que la multiplicación en Z4 es
conmutativa, además se advierte que el elemento neutro de la multiplicación es 1 y podemos
comprobar que dicha multiplicación es además asociativa. Finalmente notamos que
2 · 0 = 0, 2 · 1 = 2, 2 · 2 = 0 y 2 · 3 = 2,
es decir, no existe ningún elemento en Z4 que multiplicado por 2 nos de 1, esto es, el 2 no
tiene inverso multiplicativo, lo cual implica que Z4 no es campo. Esto a su vez implica que
ecuaciones tan simples como 2x + 1 = 2, no tengan solución en Z4 .
44
Teorema 1.5.6. La multiplicación en Zn tiene las siguientes propiedades
(c) x · y = y · x,
(d) x · (y · z) = (x · y) · z.
(d) x · (y + z) = x · y + x · z
45
Problema 1.5.10. Resolver la siguiente ecuación lineal en Z73
Solución. Por comodidad omitiremos las barras. Por el Teorema 1.5.6 sabemos que en Z73
se cumple la ley distributiva por lo que
13x = 50
La certeza de que la ecuación anterior tiene solución, nos la da el Teorema 1.5.9, ya que 73 es
un número primo. Debe existir entonces y ∈ N con 0 < y < 73 tal que el residuo de dividir
el entero 13y entre 73 es 1. más aún, por el algoritmo de la división existe n ∈ N cumpliendo
que
73 = 13(5) + 8, entonces
73 = 65(1) + 8
46
Por transitividad
73 = 8(9) + 1
Como
y = 73k + 45 k ∈ Z
Luego, y = 45.
Siguiendo con la ecuación
(45 · 13)x = 45 · 50
1.6. Matrices
1.6.1. Sumatorias
Definición 1.6.1 (Sucesión). Sea X un conjunto no vacı́o, una sucesión en X es una fun-
ción definida en el conjunto los naturales que toma valores en el conjunto X. En sı́mbolos
escribimos
an : N → X.
(an ) = {a1 , a2 , . . .} .
A partir de la sucesión (an ) creamos otra sucesión, llamada sucesión de sumas parciales
denotada por (Sn ) y definida como
Sn = a1 + a2 + · · · + an .
47
Para expresar de manera más cómoda la sucesión (Sn ) introducimos la notación sigma
P
. Con esta notación podemos expresar la sucesión Sn como sigue
n
X
Sn = ai ,
i=1
Demostración. Los ı́tems (a), (b) y (c) se siguen de la definición de sumatoria. Establezcamos
la propiedad telescópica. De las propiedades (a) y (c)
n
X n
X n
X
(ai − ai−1 ) = ai − ai−1
i=1 i=1 i=1
n−1
X n
X
= an + ai − a0 − ai−1
i=1 i=2
n−1
X n−1
X
= an + ai − a0 − ai
i=1 i=1
= an − a0 .
48
Demostremos ahora el ı́tem (d). Por la propiedad (b) y la propiedad telescópica tenemos que
n
X n
X
(1 − x) xi = (1 − x)xi
i=0 i=0
n n
ai :=xi
X X
i i+1
= (x − x ) = (ai − ai+1 )
i=0 i=0
= a0 − an+1
= 1 − xn+1 .
Las propiedades (a) y (b) del teorema 1.6.1 se denominan propiedades de linealidad.
Con las propiedades de linealidad junto con la propiedad telescópica, podemos calcular las
siguientes sumas parciales.
Demostración. Demostraremos sólo la parte (a), las partes (b) y (c) se dejan como ejercicios.
Xn
Nótese que, 2i − 1 = i2 − (i − 1)2 , y que 1 = n. Por lo tanto, por las propiedades
i=1
de linealidad de la sumatoria (propiedades (a) y (b)) en el teorema 1.6.1 y la propiedad
telescópica tenemos que
n
X n
X n
X
2 i−n= 2i − 1
i=1 i=1 i=1
n
X
= (2i − 1)
i=1
n n
2 X
2 ai :=i
X 2
= i − (i − 1) = (ai − ai−1 )
i=1 i=1
2
= an − a0 = n .
49
n
X
Entonces, 2 i − n = n2 , de donde
i=1
n
X n2 + n n(n + 1)
i= = .
i=1
2 2
(a) 1 ∈ S.
(b) Si k ∈ S, también k + 1 ∈ S.
Entonces S = N.
Demostremos usando el principio de inducción matemática el ı́tem (a) del teorema 1.6.2.
Nótese que
1 + 3 = 4 = 22 , 1 + 3 + 5 = 9 = 32 , 1 + 3 + 5 + 7 = 16 = 42 .
1 + 3 + 5 + · · · 2n − 1 = n2 . (1.27)
1 + 3 + 5 + · · · 2k − 1 = k 2 . (1.28)
El k-ésimo impar es de la forma 2k −1, entonces k +1-ésimo impar es de la forma 2(k +1)−1.
Sumando este término en ambos lados de (1.28) obtenemos
1 + 3 + 5 + · · · 2k − 1 + 2(k + 1) − 1 = k 2 + 2(k + 1) − 1.
50
Por lo tanto, por las propiedades de linealidad de la sumatoria
n2 = 1 + 3 + · · · 2n − 1
Xn
= (2i − 1)
i=1
X n n
X
=2 i− 1
i=1 i=1
n
X
=2 i − n.
i=1
Álgebra de matrices
Como ya dijimos una matriz es un arreglo rectangular de números dispuestos en m filas
y n columnas
a11 a12 · · · a1n
a21 a22 · · · a2n
A= . (1.29)
.. ..
.. . .
am1 am2 · · · amn
Para simplificar el manejo de las matrices usamos la notación A = [aij ]m×n , o simple-
mente, A = [aij ] para denotar una matriz tı́pica del conjunto Mm×n (R).
Definición 1.6.2 (Igualdad de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A = B si y sólo si aij = bij para todo 1 ≤ i ≤ m, y todo 1 ≤ j ≤ n. Es decir, dos
matrices son iguales si y sólo si son iguales componente a componente.
Definición 1.6.3 (Suma de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A + B = C donde C = [cij ] y cij = aij + bij .
51
Definición 1.6.4 (Multiplicación por escalar). Sean A ∈ Mm×n (R) y k ∈ R. Definimos la
multiplicación por escalar entre el escalar k y la matriz A como kA = C donde C = [cij ] y
cij = kaij .
A continuación estableceremos las propiedades del la suma y la multiplicación por escalar
de matrices.
Teorema 1.6.4 (Propiedades de la suma matricial). Sean A, B, C ∈ Mm×n (R), con A =
[aij ], B = [bij ] y C = [cij ], α, β escalares. Entonces
(a) A + B = B + A.
(b) A + (B + C) = (A + B) + C.
(c) Existe la matriz E = 0m×n con E = [eij ] y eij = 0 para todo i y todo j tal que
A + 0m×n = A.
(d) Para toda matriz A existe −A = [−aij ] tal que A + (−A) = 0m×n .
(e) α(A + B) = αA + αB
(f) (α + β)A = αA + βA
A · B = x1 y1 + x2 y2 + · · · + xn yn .
52
De la definición de producto escalar se deducen las siguientes propiedades
Teorema 1.6.5 (Propiedades del producto escalar). Sean A, B y C tres vectores y α, β
escalares. Entonces
(a) A · 0 = 0.
(b) A · B = B · A.
(c) A · (B + C) = A · B + A · C.
y1
y2
A · B = x1 x2 · · · xn · .. = x1 y1 + x2 y2 + · · · + xn yn .
.
yn
Definición 1.6.6 (Producto matricial). Sea A ∈ Mm×n (R) y B ∈ Mn×p (R) con A = [aij ]m×n
y B = [bij ]n×p . Entonces AB = C donde C = [cij ] y
cij = [fila i de A] · [columna j de B]
Es decir,
n
X
cij = ai1 ai2 · · · ain · a1j a2j · · · anj = aik bkj .
k=1
Como primera consecuencia de la definición del producto matricial es que dicho producto
no es conmutativo.
Ejemplo 1.16. En ∈ M2×2 (R) consideremos
1 0 0 0
A= , A=
1 1 0 2
Entonces
0 0 0 0
AB = , BA =
0 2 2 2
Como AB 6= BA, vemos que el producto de matrices no es conmutativo
53
Se puede demostrar que el producto matricial si es asociativo y distributivo
Teorema 1.6.6 (Propiedades del producto matricial). Si todas las sumas y productos están
bien definidos, entonces
Pero por definición del delta de Kronecker cij = aij , de modo que AI = A. De manera similar
tenemos que IA = A. Hemos demostrado que
Teorema 1.6.7. Sea A una matriz cuadrada de n × n. Entonces
AI = IA = A.
AB = BA = I
54
Nota 1.6.1. Si A ∈ Mn×n (R) es una matriz tal que existe B ∈ Mn×n (R) cumpliendo que
AB = I, entonces necesariamente tenemos que BA = I, ya que
lo cual implica que det A, det B 6= 0, de lo cual, a su vez concluimos que las matrices A, B,
deben ser invertibles. En particular, como la matriz A es invertible
(AB)−1 = B −1 A−1
Potenciación de matrices
Sea A ∈ Mn×n (R). Definimos A0 = I y An = An−1 A.
En los números reales si an = 0, se tiene que a = 0. Veámos que en las matrices este
hecho en general no se cumple.
Ejemplo 1.17. Hallar todas las matrices A ∈ Mn×n (R) tales que A2 = 0.
Solución. Sea
a b
A= ,
c d
a2 + bc = 0 (1.30)
ab + bd = 0 (1.31)
ac + cd = 0 (1.32)
d2 + bc = 0 (1.33)
ad − bc = 0 (1.34)
55
Igualando las ecuaciones (1.30) y (1.33) obtenemos que a2 = d2 , de donde a = ±d. Si a = d,
de la ecuación (1.34) tenemos que a2 − bc = 0, sumando esta última ecuación con la ecuación
(1.30) nos da 2a2 = 0, de donde a = 0. Por lo tanto, bc = 0. Luego, la opción a = d genera
matrices de la forma
0 b 0 0
, b 6= 0 y , c 6= 0
0 0 c 0
Por ejemplo,
0 1
A= 6 0, y A2 = 0.
=
0 0
Ahora si a = −d, entonces a+d = 0, y las ecuaciones (1.31) y (1.32) no dan información pero
tampoco contradicción y las ecuaciones (1.30), (1.33) y (1.34) se vuelven la misma ecuación:
a2 + bc = 0. Por lo tanto, en este caso obtenemos matrices de la forma
a b
,
c −a
donde a, b y c satisfacen la ecuación a2 + bc = 0. Se observa que si a = 0, entonces bc = 0,
de modo que este caso también abarca el caso anterior. Concluimos que la todas la matrices
tales que A2 = 0 son de la forma
a b
,
c −a
con a2 + bc = 0.
Ejemplo 1.18. Sea A ∈ Mn×n (R) y α ∈ R. Usar inducción matemática para establecer que
(αA)n = αn An .
Solución. Supongamos que
(αA)n = αn An ∀n ∈ N (1.35)
Para n = 1, (αA)1 = α1 A1 , esto es, (1.35) se tiene para n = 1. Supongamos que (1.35) se
tiene para n = k, es decir
(αA)k = αk Ak ∀k ∈ N (Hipótesis de inducción)
Entonces
(αA)k+1 = (αA)(αA)k
= (αA)(αk Ak ) (Hipótesis de inducción)
= (αk α)(AAk ) (Teorema 1.6.6 inciso (c))
= αk+1Ak+1
56
Por consiguiente, (1.35) se cumple para n = k + 1. Luego por el (PIM) tenemos la validez
de (1.35).
1 0
Ejemplo 1.19. Sea A = . Comprobar que A2 = 2A − I y calcular A100
−1 1
A4 = A2 A2 = (2A − I)(2A − I)
= (2A − I)(2A) − (2A − I)(I)
= (2A)2 − 2A − 2A + I
= 4A2 − 4A + I
= 4(2A − I) − 4A + I
= 8A − 4I − 4A + I
= 4A − 3I.
57
Teorema 1.6.9. Sean n, m ∈ Z+ y A ∈ Mn×n (R). Entonces
entonces cij = 0 + 0 = 0 si i > j, esto es, C es una matriz triangular superior. Ahora para
el producto tenemos que
n
X
cij = aik bkj .
k=1
si i 6= k, entonces i > k, i < k, con lo cual respectivamente tenemos que aik = 0, o bki = 0.
En ambos casos cii = 0. Alternativamente, si i = k, aik = 0, bki = 0, y de nuevo cii = 0. En
consecuencia, la matriz C es estrictamente triangular superior.
58
1.7. Problemas
59
Problema 1.7.9. Un recipiente contiene 5000L de agua pura. Una salmuera que contiene
30g de sal por litro de agua es bombeada al recipiente a razón de 25L/min. Hallar la con-
centración de sal después de t minutos(en gramos por litro). ¿Qué sucede cuando t tiende a
infinito?
Problema 1.7.11. (Ver, [3, pag. 27, Problema 38]). Un viajero que acaba de regresar de
Europa gastó $30 diarios en Inglaterra, $20 diarios en Francia y $20 diarios en España por
concepto de hospedaje. En comida gasto $20 diarios en en Inglaterra, $30 diarios en Francia
y $20 en España. Sus gastos adicionales fueron $10 en cada paı́s. Los registros del viajero
indican un gasto total de $340 en hospedaje, $320 en comida y $140 en gastos adicionales
durante su viaje por estos tres paı́ses. Calcule el número de dı́as que pasó el viajero en cada
paı́s o muestre que los registros deben estar incorrectos debido a que las cantidades gastadas
no son compatibles una con la otra.
Problema 1.7.12. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.
Problema 1.7.13. (Ver, [3, pag. 27, Problema 40]). Una gente secreto sabe que 60 equipos
aéreos, que consisten en aviones de combate y bombarderos, están estacionados en cierto
campo aéreo secreto. El agente quiere determinar cuántos de los 60 equipos son aviones de
combate y cuántos son bombarderos. Existe un tipo de cohete que llevan ambos aviones; el
de combate lleva 6 de ellos y el bombardero sólo 2. El agente averigua que se requieren 250
cohetes para armar todos los aviones del campo aéreo. Aún más, escucha que se tiene el
60
doble de aviones de combate que bombarderos en al base. Calcule el número de aviones de
combate y bombarderos en el campo aéreo o muestre que la información del agente debe ser
incorrecta ya que es inconsistente.
61
Problema 1.7.20 (**). En los números reales, la ecuación a2 = 1, tiene dos soluciones,
a = ±1. Esto no se cumple para las matrices. Muestre que la ecuación A2 = I se satisface
para cada una de las matrices
1 0 1 0 1 b
, , ,
0 1 c 1 0 1
donde b y c son números reales arbitrarios. Hallar todas las matrices A ∈ M2×2 (R) tales que
A2 = I.
1 1 2 1 2
Problema 1.7.21 (**). Sea A = . Comprobar que A = y calcular An .
0 1 0 1
1 1 1 1 2 3
Problema 1.7.22 (**). Sea A = 0 1 1. Comprobar que A2 = 0 1 2. Inducir una
0 0 1 0 0 1
forma general para An y demostrarla por inducción.
Problema 1.7.23 (**). Hallar todas las matrices A ∈ M2×2 (R), tales que A2 = 0.
Problema 1.7.24. Sea A ∈ Mn×n (R) estrictamente triangular superior (es decir todas entra-
das en la diagonal y abajo de ella son cero). Demuestre que si A es una matriz estrictamente
triangular superior, entonces An es estrictamente triangular superior.
Problema 1.7.26 (***). Sea A una matriz estrictamente triangular superior. Demuestre
que I − A es invertible y exprese su inversa en función de A.
62
Capı́tulo 2
Determinantes
Nótese que definición anterior tiene sentido por que ya se definió el determinante para
una matriz 2 × 2.
Definición 2.1.3 (Determinante de una matriz). Sea A ∈ Mn×n (R). Entonces el determi-
nante de A, denotado por det A o |A|, está dado por
n
X
det A = |A| = a11 A11 + a12 A12 + · · · + an1 An1 = a1k A1k . (2.1)
k=1
La expresión en lado derecho de (2.1) se llama desarrollo por cofactores o expansión por
cofactores a través de la primera fila de A.
63
Definición 2.1.4 (Matriz triangular y diagonal). Una matriz cuadrada se dice triangular
superior si todos sus componentes abajo de la diagonal son cero. Se dice estrictamente
triangular superior si todas sus entradas en la diagonal y abajo de ella son cero. Es una
matriz triangular inferior si todos sus componentes arriba de la diagonal son cero. Se
dice estrictamente triangular superior si todas sus entradas en la diagonal y arriba de
ella son cero. Es una matriz diagonal si todos los elementos que no están en la diagonal
cero.
Teorema 2.1.1 (Determinante de una matriz triangular). Sea A ∈ Mn×n (R) una matriz
triangular. Entonces
det A = a11 a22 · · · ann .
C(a + b, c + d)
b
Q
b
B(b, d) b P
b A(a, c)
x
R O
64
El segmento BC como función de a y c viene dado en la forma
p √
BC = d(B, C) = (a + b − b)2 + (c + d − d)2 = a2 + c2 .
Por lo tanto, la ecuación de la recta que contiene el segmento OQ está dada por
a
y=− x
c
Para generar otra ecuación que relacione las variables x, y, hallamos la ecuación de la recta
que contiene al segmento BC. Como esta recta pasa por B y tiene pendiente mBC = mOA =
c/a, su ecuación es
c
y = (x − b) + d.
a
Como y = −(a/c)x, obtenemos que
a c
− x = (x − b) + d.
c a
Multiplicando la ecuación anterior por el término −(c/a), nos da
cc
x= − (x − b) + d
a a
c c bc
= − x− +d
a a a
2 2
c bc cd
= − 2x + 2 −
a a a
2 2
c bc − acd
= − 2x + .
a a2
De donde obtenemos que
bc2 − acd ad − bc
x= 2 2
= −c 2 .
a +c a + c2
65
Se advierte que el numerador en la última igualdad en la ecuación anterior, es el determinante
de la matriz
a b
A= ,
c d
Teorema 2.3.2 (Teorema fundamental de los determinantes). Sea A = (aij )n×n . Entonces
n
X
det A = aik Aik
k=1
66
para todo i = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier fila de la matriz A. Más aún,
n
X
det A = akj Akj
k=1
para todo j = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier columna de la matriz A.
El Teorema 2.3.2 le da sentido a la definición 2.1.3 y tiene las siguientes consecuencias
Corolario 2.3.3. Sea A ∈ Mn×n (R)
(a) det A = det At .
det B = c det A.
En otras palabras, supongamos que las matrices A, B y C son idénticas excepto por la columna
j y que la columna j de C es igual a la suma de las columnas j–esimas de A y B. Entonces
det C = det A + det B.
67
Teorema 2.3.6 (Propiedad 3). Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al intercambiar dos de sus filas o sus columnas. Entonces
det B = − det A.
Teorema 2.3.7 (Propiedad 4). Si la matriz A tiene dos filas o columnas iguales, entonces
det A = 0.
Teorema 2.3.8 (Propiedad 5). Si una fila o columna de una matriz A es un múltiplo escalar
de otra fila o columna, entonces det A = 0
Teorema 2.3.9 (Propiedad 6). Si se suma un múltiplo escalar de una fila o columna o otro
fila o columna, entonces el determinante no cambia.
Problema 2.3.10. Demuestre utilizando inducción matemática que
1 + x1
x 2 · · · x n
x1 1 + x2 · · · xn
.. = 1 + x1 + x2 + · · · + xn , n = 2, 3, . . . , (2.2)
.. ..
. . .
x1 x2 · · · 1 + xn
Ahora, sea A = [aij ]n×n donde
(
1 + xi , si i = j,
aij :=
xj , si i 6= j,
68
Ahora,
x1 x2 x3 R2 → −R1 + R2 x1 x2 x3
x1 1 + x2 x3 R3 → −R1 + R3 0 1 0
x1 x2 1 + x3 ⇐⇒ 0 0 1
En consecuencia,
1 + x1 x2 x3 1 x2 x3 x1 x2 x3
x1
1 + x2 x3 = 0 1 + x2 x3 + x1 1 + x2 x3 = 1 + x2 + x3 + x1 .
x x2 1 + x3 0 x2 1 + x3 x1 x2 1 + x3
1
1
x 2 · · · x k xk+1
x1
x 2 · · · x k xk+1
0 1 + x2 · · · xk xk+1
x1 1 + x2 · · · xk xk+1
= . + (2.3)
.. .. .. .. .. ..
. .
. . .
0 x2 · · · xk 1 + xk+1 x1 x2 · · · xk 1 + xk+1
1
x 2 · · · x k xk+1
1 + x2
x 2 · · · x k xk+1
0 1 + x2 · · · xk xk+1
x2 1 + x2 · · · x k xk+1
= = 1 + x2 + · · · + xk+1
.. .. .. .. .. ..
. . . . . .
0 x2 · · · xk 1 + xk+1 x2 x2 · · · xk 1 + xk+1
69
Para calcular el determinante en el segundo sumando en la ecuación (2.3), multiplicamos la
primera fila por (−1) y sumamos el resultado con las otras k filas, y después aplicamos el
Teorema 2.1.1 para obtener
x1
x2 · · · xk xk+1 x1 x2 · · · xk xk+1
x1 1 + x2 · · · xk xk+1 0 1 + x2 · · · xk xk+1
= .. = x1
.. .. .. .. ..
. . . . . .
x1 x2 · · · xk 1 + xk+1 0 0 ··· 0 1
1
x2 · · · xk xk+1 x1 x2 · · · xk xk+1
0 1 + x2 · · · xk xk+1 x1 1 + x2 · · · xk xk+1
= . + ..
.. .. .. .. ..
. . .
. .
0 x2 · · · xk 1 + xk+1 x1 x2 · · · xk 1 + xk+1
= 1 + x2 + · · · + xk+1 + x1 .
Lo cual significa que (2.2) si tiene para n = k + 1. En consecuencia, por (P.I.M) tenemos la
valides de (2.2).
det A = 1 + x1 + · · · + xn ,
Si xi := i2 , entonces
det A = 1 + 12 + · · · + n2
n(n + 1)(2n + 1)
=1+
6
n(n + 1)(2n + 1) + 6
= .
6
70
Ejemplo 2.1. Calcule el determinante de Vardermonde de tamaño 3 × 3:
1 1 1
a1 a2 a3
a2 a2 a2
1 2 3
1 1 1 C2 → −C1 + C2 1 0 0
a1 a2 a3 C3 → −C1 + C3 a1 a2 − a1 a3 − a1
a21 a22 a23 ⇐⇒ a21 a22 − a21 a23 − a21
71
n
Y
ai = a1 a2 · · · an
i=1
Teorema 2.4.1 (Cálculo de la inversa de una matriz). Sea A ∈ Mn×n (R). Entonces A es
invertible si sólo si det A 6= 0. Si det A 6= 0, entonces
1
A−1 = adj A.
det A
Teorema 2.4.2 (Regla de Cramer). Sea A ∈ Mn×n (R) y suponga que det A 6= 0. Entonces
la solución única del sistema Ax = b viene dada por
D1 D2 Dn
x1 = , x2 = , . . . , xn = ,
D D D
72
donde Dj = det Aj , j = 1, . . . , n, D = det A y Aj la matriz obtenida de A al cambiar su
columna j por el vector columna
b1
b2
b=.
..
bn
Ejemplo 2.2. Considere el triángulo de la figura 2.2
b a
h
A B
x y
c
(b) Utilice la regla de Krammer y las leyes de proyección para demostrar el teorema del
coseno:
73
Ahora, como A + B + C = π, tenemos que
Por lo tanto, a cos C = b − c cos A, o bien, a cos C + c cos A = b. Luego (2.4) se tiene. Ahora,
cos A = x/b y sen B = y/a, entonces
c = x + y = b cos A + a sen B.
Con lo cual tenemos (2.5). De manera similar a como se demostró (2.4) tenemos que
hh x h2
cos C = sen A sen B − cos A cos B = − cos B ⇔ b cos C = − (c − y) cos B
ab b a
h2
⇔ b cos C + c cos B = + y cos B,
a
y por el Teorema de pitagoras a2 = h2 + y 2 , por consiguiente,
h2 h2 y h2 + y 2
+ y cos B = +y = = a.
a a a a
Por lo tanto,
b cos C + c cos B = a.
74
Como se querı́a demostrar. Demostremos ahora el teorema del coseno. Sean x = cos A,
y = cos B y z = cos C. Entonces el sistema conformado por las ecuaciones (2.4), (2.5) y (2.6)
expresado en forma matricial toma la forma
c 0 a x b
b a 0 y = c
0 c b z a
Sea
c 0 a
A = b a 0 ,
0 c b
entonces det A = 2abc > 0, por lo tanto la matriz A es invertible y por la Regla de Krammer,
D1 D2 D3
x= ,y = ,z = ,
D D D
donde Dj = det Aj , j = 1, 2, 3, D = det A y Aj es la matriz obtenida de A al cambiar su
columna j por el vector columna
b
b = c
a
Cuando realizamos los determinantes de las matrices Aj por la primera fila obtenemos
b 0 a
det A1 = c a 0 = bab − a(c2 − a2 ) = a(b2 + c2 − a2 ).
a c b
c b a
det A2 = b c 0 = c(cb) − bb2 + a(ab) = b(c2 − b2 + a2 ).
o a b
c 0 b
det A3 = b a c = c(a2 − c2 ) = c(a2 − c2 + b2 ).
o c a
Entonces
D1 a(b2 + c2 − a2 )
cos A = x = =
D 2abc
75
Con lo cual
D2 b(c2 − b2 + a2 )
cos B = y = =
D 2abc
D3 c(b + c2 − a2 )
2
cos C = z = =
D 2abc
De donde se siguen (2.8) y (2.9).
2.5. Problemas
Llevar la matriz A a la (FER). Cuando la matriz ya este en esta forma ubicar la fila que
contiene el 1 que está más hacia la derecha y utilizarlo como pivote para generar ceros en
la columna que lo contiene. Posteriormente, con la fila anterior a esta, realizar el mismo
proceso. Llevar acabo estos pasos las veces que sea necesario hasta obtener la (FERR) de la
matriz A.
Problema 2.6.2. Un jugador tiene un total de 200 fichas para apostar en un casino, las
fichas son de tres colores: amarillo azul y rojo. Ganó $51 con cada ficha de color amarillo,
perdió $15 con cada ficha de color azul y ganó $4 con cada ficha de color rojo. El apostador
término con un total de $152. Si se sabe que la cantidad de fichas rojas es mayor que el
número de fichas amarillas, pero menor que el número de fichas azules, hallar el número
de fichas de cada color que tenı́a el jugador. Sugerencia: Tome como referencia el Ejem-
plo1.10. Para hallar una solución particular de la ecuación Diofántica se pueden consultar
los Ejemplos 1.12 y 1.14 y el Problema 1.5.10.
Problema 2.6.3. Una inversionista afirma a su corredor de bolsa que todas su acciones
son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y que hace 2 dı́as su valor bajó
$350 pero ayer aumentó $600. El corredor recuerda que hace 2 dı́as el precio de las acciones
76
de Delta airlines bajó $1 por acción y el de las de Hilton Hotels $1,50, pero el precio de
las acciones de McDonald’s subió $0,50. También recuerda que ayer el precio de la acciones
Delta subió $1,50 por acción, el de las de Hilton Hotels bajó otros $0,50 por acción y el de
las de McDonald’s subieron $1. Demuestre que el corredor no tiene suficiente información
para calcular el número de acciones que tiene el inversionista en cada compañı́a, pero que si
ella dice que tiene más de 305 acciones de Delta, y más de 79 acciones de Hilton Hotels el
corredor puede calcular exactamente cuantas acciones tiene en cada compañı́a. Sugerencia:
Tome como referencia el Ejemplo 1.10.
Problema 2.6.4. Sea △ el triángulo en el plano con vértices en (x1 , y1 ), (x2 , y2 ) y (x3 , y3 ).
Demuestre que el área del triángulo está dada por
1 x1 y1
1
a(△) = ± 1 x2 y2
2
1 x3 y3
Sugerencia: Con lo demostrado en la sección 2.2 se puede hallar el área de un triángulo con
uno de sus vértices en el origen. Utilice la geometrı́a de la figura 2.3 para hallar el área del
triángulo △P1 P2 P3 en términos de las coordenadas de sus vértices.
y y
P2
P(b, d) P3
Q(a, c)
β
α b b
β
α P1 R1 T1
O
b
R
b
T
x O
x
(a) Triángulo con uno de sus vértices en (b) Triángulo con vértices arbitrarios
el origen
Figura 2.3: El triángulo △OP Q se traslada de tal forma que sus correspondientes vértices
ahora son P1 , P2 y P3 cuyas coordenadas respectivamente son (x1 , y1 ), (x2 , y2 ) y (x3 , y3). El
par de triángulos rectángulos: △OP R, △P1 P2 R1 y △OQT , △P1P3 T1 comparten la misma
hipotenusa, de tal forma que se puede expresar los lados del triángulo △OP Q como función
de las coordenadas de los puntos P1 , P2 y P3 .
Problema 2.6.5. Tres rectas que no son paralelas por pares, determinan un triángulo en el
77
plano. Suponga que las tres rectas están dadas por
Problema 2.7.2. Sea (An ) una sucesión de matrices definida como sigue An = [aij ]n×n ,
donde aij = ai−1
j y 1 ≤ i, j ≤ n. Llamaremos a cada elemento de esta sucesión matriz de
Vardermonde (ver el Ejemplo 2.1), y cada elemento de la sucesión en R dada por (Dn )
con Dn := det An , determinante de Vardermonde de tamaño n × n. Defina las matrices
de Vandermonde para n = 2 y n = 4 y calcule sus respectivos determinantes. Conjeture
una fórmula para calcular Dn y demuestrela utilizando inducción matemática, exprese dicha
fórmula usando el sı́mbolo de productoria.
Problema 2.7.3. Si A ∈ Mn×n (R), A = [aij ]n×n , la matriz B := [bij ]n×n donde bij = aji es
llamada matriz transpuesta de A, escribimos B = At .
Una matriz invertible A ∈ Mn×n (R) tal que At = A−1 es llamada matriz ortogonal.
Demuestre que
(b) det(αA) = αn det A para toda matriz A ∈ Mn×n (R), todo escalar α y n = 1, 2, . . . ,
78
(d) Si A ∈ Mn×n (R) es antisimétrica y n es impar, entonces det A = 0
Problema 2.7.4. Demuestre que para cualquier matriz cuadrada A se tiene que
(a) A + At es simétrica
(b) A − At es antisimétrica
Problema 2.7.5. Demuestre que toda matriz cuadrada A se puede escribir de manera única
en la forma A = S + K donde S es simétrica y K antisimétrica.
Problema 2.7.6 (***). Sea A una matriz estrictamente triangular superior. Demuestre que
I − A es invertible y exprese su inversa en función de A.
Problema 2.7.7 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m y la
parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta completa
cada 20s, determine el vector posición de una persona que va sentada en la rueda. Suponga
que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta moviendo
la persona?
79
Capı́tulo 3
Vectores en Rn
Rn = R × · · · × R
= {(x1 , x2 , . . . , xn ) : xi ∈ R, 1 ≤ i ≤ n} .
R2 = {(x, y) : x, y ∈ R} ,
y el espacio
R3 = {(x, y, z) : x, y, z ∈ R} ,
A = (Ax , Ay ).
80
y
A
kAk
Ay
θ
x
O Ax
81
Teorema 3.1.1 (Propiedades de los vectores). Sean A, B y C tres vectores de R2 y α, β ∈ R.
Entonces
(a) A + B = B + A.
(b) A + (B + C) = (A + B) + C.
A = Ax i + Ay j, B = Bx i + By j,
Podemos hallar la dirección del vector resultante en términos de las componentes de los
vectores A y B con la fórmula
Ry Ay + By
arctan = arctan .
Rx Ax + Bx
Para graficar el vector resultante trasladamos el vector B, respetando magnitud y direc-
ción de tal forma que su punto inicial coincida con el punto final de A, luego hacemos lo
mismo con el vector A (figura 3.2) generando de esta forma un paralelogramo, cuya diagonal
82
representa el vector resultante R. Esta interpretación de la suma vectorial es conocida como
regla del paralelogramo. Si tenemos las componentes de los vectores A y B podemos
hallar la magnitud del vector resultante con la fórmula
q
kRk = (Ax + Bx )2 + (Ay + By )2 .
4
y
B
2
By R
Ry
1
Ay A
0
x
O
Ax Bx
-1
Rx
-2
-2 -1 0 1 2 3 4 5
Ahora si tenemos las magnitudes y direcciones de los vectores A y B, expresando los vec-
tores en la forma polar podemos encontrar una fórmula para la magnitud de R dependiendo
de dichas magnitudes y direcciones. En efecto, si α y β son direcciones de los vectores A y
B respectivamente, tenemos que
A = kAk cos αi + kAk sen αj, B = kBk cos βi + kBk sen βj.
Con lo cual,
kRk2 = (kAk cos α + kBk cos β)2 + (kAk sen α + kBk sen β)2
= kAk2 cos2 α + 2kAkkBk cos α cos β + kBk2 cos2 β
+ kAk2 sen2 α + 2kAkkBk sen α sen β + kBk2 sen2 β
= kAk2 + kBk2 + 2kAkkBk(cos α cos β + sen α sen β)
= kAk2 + kBk2 + 2kAkkBk cos(α − β)
= kAk2 + kBk2 + 2kAkkBk cos θ.
83
Donde θ = α − β es el ángulo entre A y B.
En el problema 4.14.21 se pide encontrar esta fórmula usando el teorema del coseno.
−→
A AB
B
x
O
El vector con punto inicial en A y punto final en B es llamado vector diferencia. Vemos
−→
que el vector B resulta de la suma entre los vectores A y AB, esto es,
−→
A+ AB= B.
84
velocidades, y aceleraciones, las cuales poseen magnitud y dirección. Lo que mide la flecha
indica la magnitud y la punta de la flecha indica la dirección.
y
D
d2 − c2
C θ
d1 − c1
B
b 2 − a2
A θ
b 1 − a1
x
O
−→ −→
Figura 3.4: AB y CD representan vectores geométricos equivalentes.
Tenemos que
b1 − a1 d 1 − c1
cos θ = = ,
kB − Ak kD − Ck
Cuando el punto inicial de un vector geométrico coincide con el origen y el punto final
A tiene coordenadas (a, b) tenemos que
−→
OA= A − 0 = (a, b) − (0,0) = (a, b) = A.
−→
Por es razón escribimos A en lugar de OA. Este hecho tiene importantes repercusiones, ya
que nos dice que las componentes de cualquier vector A son las mismas de cualquier vector
geométrico equivalente a el.
85
y
D
d2 − c2
C θ
d1 − c1
A = (a, b)
θ
x
O
Figura 3.5: Un vector geométrico cuyo punto inicial coincide con el origen tiene las mismas
componentes que cualquier vector que tenga la misma magnitud y dirección.
Problema 3.3.1 (Velocidad verdadera de un avión). Un avión vuela por un viento que fluye
con una rapidez de 55mi/h en la dirección N 30◦ E. El avión tiene una rapidez de 765mi/h
respecto al aire, y el piloto dirige son avión en la dirección N 45◦ E.
(a) Halle la velocidad del viento, en términos de los vectores coordenados unitarios.
(b) Halle la velocidad del avión con respecto al aire, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del avión con respecto a la tierra, en términos de los vectores coor-
denados unitarios.
Solución. El vector A denota la velocidad del viento y el vector B, define la velocidad del
avión respecto al viento. Esta velocidad queda completamente determinada, conociendo sus
componentes, o bien su magnitud y dirección. En este contexto, la magnitud de la velocidad
define la rapidez de la partı́cula. La frase: velocidad del avión respecto al viento,
se refiere a la velocidad que mide el piloto, esta es la velocidad relativa al piloto, dicha
velocidad es distinta a la que mide una persona en tierra, lo cual tiene que contemplar el
efecto del viento sobre el avión. La velocidad del avión respecto a la tierra, también se conoce
como velocidad verdadera del avión.
86
y y B
N
A
O E
S
A
O
x O
x
En la figura 3.6(a) se muestran varias representaciones del vector A, con el fin de facilitar
el calculo de las componentes de este vector consideramos el vector geométrico cuyo punto
inicial coincide con el origen el cual es llamado vector de posición. Diremos que un vector
está en posición normal cuando su punto inicial coincide con el origen. En la figura 3.7(a)
se muestra la magnitud y dirección del vector A.
y y
N
kBk = 765
O E
kAk = 55
60◦ 45◦
O
x O
x
Figura 3.7: Dado que fluye un viento en dirección N 30◦ E, la dirección del vector A es 60◦ .
87
Como la rapidez del avión respecto al aire es 765mi/h, tenemos que kBk = 765, además
el piloto dirige el avión en la dirección N 45◦ E (es común, referirse a este ángulo como
enfilamiento o curso relativo del avión), por lo que la dirección del vector B es β =
90◦ − 45◦ = 45◦ (ver figura 3.7(b)). De modo que las componentes de la velocidad del avión
respecto al aire son:
√
Bx = kBk cos β = 765 cos 45◦ = 765 2/2
√
By = kBk sen β = 765 cos 45◦ = 765 2/2.
ası́, el vector en términos de los vectores coordenados unitarios viene dado por
√ √ √ √
B = (765 2/2, 765 2/2) = (765 2/2)i + (765 2/2)j.
Por efecto del viento, al avión experimenta un leve corrimiento hacia el norte (ver figura
3.8(b)) este movimiento es imperceptible para el piloto, pero puede ser detectado por una
persona en tierra, la cual registrarı́a la información que se muestra en la figura 3.8(a) sobre
el avión.
y y
R
kRk = 818, 25
46◦
O
x O
x
Para encontrar estas cantidades: magnitud y dirección verdaderas del avión, se deben
88
encontrar las componentes del vector resultante.
√
Rx = Ax + Bx = 55/2 + 765 2/2 = 568, 44
√ √
Ry = Ay + By = (55/2) 3 + 765 2/2 = 588, 57.
Con lo cual, la velocidad verdadera del avión en término de los vectores coordenados unitarios
es
√ √ √
R = 55/2 + 765 2/2 i + (55/2) 3 + 765 2/2 j.
de donde φ = arctan (588, 57/568, 44) = 45,996◦ ≈ 46◦ . La dirección, o curso verdadero del
avión, medida desde el norte es entonces N 44◦ E.
La magnitud y dirección verdaderas de la velocidad del avión, pueden ser obtenidas
directamente de los datos del problema. Con la fórmula:
formamos el paralelogramo OARB (ver figura 3.9(a)). Como ∠AOB = 60◦ − 45◦ = 15◦ y
los ángulos opuestos de un paralelogramo son iguales y suman 360◦ tenemos que
89
y y
R R
A A
O
x O
x
(a) Paralelogramo generado por A y B (b) Triángulo generado por los vectores
A, B y R
Figura 3.9: La dirección del vector resultante puede ser obtenida mediante la aplicación del
Teorema del seno, si se conocen las magnitudes y direcciones de los vectores A y B
Con lo cual,
kBk 765
sen ∠AOR = sen 165◦ = 0,25882 = 0,24198.
kRk 818,25
Ası́, ∠AOR = arc sen(0,24198) = 14,003◦. Por lo tanto, la dirección del vector R, es φ =
60◦ − 14,003◦ = 45,997◦ ≈ 46◦ .
90
Para obtener un criterio que nos permita saber cuando dos vectores son ortogonales,
utilizaremos el producto punto, o producto escalar, el cual fue introducido en la subsección
1.6.3. Primero que todo debemos notar que si A = (x, y) ∈ R2 , entonces
A · A = x2 + y 2 = kAk2 .
Demostramos que
Teorema 3.3.2. Si A ∈ R2 , entonces
kAk2 = A · A.
donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.
Demostración. Aplicando el Teorema del coseno al triángulo que se muestra en la figura 3.3
−→
A AB
B
θ
x
O
obtenemos
donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Ahora, dado que el producto punto es conmutativo y distributivo
respecto a la suma de vectores, por el Teorema 3.3.2 tenemos que
kB − Ak2 = (B − A) · (B − A)
= B · B − 2B · A + A · A
= kBk2 − 2A · B + kAk2 .
91
Por lo tanto, tenemos que
Sumando el término −(kAk2 + kBk2 ) en ambos lados de la ecuación anterior y luego multi-
plicando por 1/2 obtenemos (3.2).
A · B = 0 ⇔ si solo si θ = π/2.
Teorema 3.3.5 (Ángulo entre vectores). Si θ denota el ángulo más pequeño que hay entre
dos vectores no nulos A y B medido en el sentido contrario de las manecillas del reloj,
entonces
A·B A B
cos θ = = · . (3.4)
kAkkBk kAk kBk
Ejemplo 3.1. Utilice el producto punto para demostrar las siguientes identidades
Solución. Sean A y B vectores unitarios cuyas direcciones están dadas por los ángulos α y
β respectivamente. Entonces para el vector A tenemos que
de modo que
92
De la misma forma, vemos que
B = cos βi + sen βj = (cos β, sen β).
A
β
α
x
Figura 3.10: Todo vector unitario u cuya dirección está dada por un ángulo θ se puede
expresar en la forma u = cos θi + sen θj
Ahora, dado que la función coseno es par, y la función seno es impar, aplicando en inciso
(a) tenemos que
cos(α + β) = cos(α − (−β)) = cos α cos(−β) + sen α sen(−β).
= cos α cos β − sen α sen β.
Para obtener (c), rotamos el vector A de la figura 3.10 un ángulo de 90 grados en dirección
contraria de las manecillas del reloj, sin cambiar su magnitud, de tal forma que generamos
un vector C que también es unitario pero cuya dirección es α + π/2 (ver figura 3.11). Por lo
tanto sus componentes son
Cx = kCk cos(α + π/2) = − sen α
Cy = kCk sen(α + π/2) = cos α,
93
Nótese que en las fórmulas anteriores para hallar la componente en x del vector C usamos
(b) con β = π/2. Y para hallar la componente en y, usamos la identidad fundamental:
p √
sen(α + π/2) = 1 − cos2 (α + π/2) = 1 − sen2 α = cos α.
B A
π/2
α
x
Figura 3.11: Utilización del propucto punto para hallar una fórmula para el seno de la suma
de la de ángulos
Ahora bien, dado que el ángulo entre los vectores B y C es θ = β−(π/2+α) = β−α−π/2,
por (3.2) tenemos que
Que equivale a
94
B R
O A
−→ −→ −→
Figura 3.12: Las magnitudes de los vectores geométricos OA= A, OB= B y OR= R son los
lados del triángulo △OAR. Para que estas tres normas conformen los lados de un triángulo
se debe cumplir la relación kAk + kBk ≥ kA + Bk, conocida como desigualdad triangular
Unos de los principales postulados de la geometrı́a Euclidiana afirma que la menor dis-
tancia entre dos puntos es la recta, es decir, que toma menos tiempo ir del punto O al R,
que de el punto O al punto A y luego al R. En términos de vectores, esto se expresa con la
relación
kAk + kBk ≥ kA + Bk (3.5)
que se conoce como desigualdad triangular. La desigualdad triangular es una consecuencia
de la desigualdad de Cauchy-Schwarz (desigualdad de C-S). La cual establece que
|X · Y | ≤ kXkkY k,
para vectores X = (a1 , a2 , . . . , an ), Y = (b1 , b2 , . . . , bn ) en Rn . Este hecho se demuestra de
forma general en la sección 4.17. Para el caso de R2 , este resultado puede ser obtenido como
un consecuencia del Teorema 3.3.3, ya que, para todo θ tenemos que | cos θ| ≤ 1, con lo cual,
|A · B| = |kAkkBk cos θ| = kAkkBk| cos θ| ≤ kAkkBk.
Es decir,
|A · B| ≤ kAkkBk. (3.6)
Ahora podemos establecer que
Teorema 3.4.1. Si A y B son vectores de R2 . Entonces
kAk + kBk ≥ kA + Bk
Demostración. Como kAk2 = A · A, tenemos que
kA + Bk2 = (A + B) · (A + B)
= A · A + 2A · B + B · B (Ley conmutativa y distridutiva)
2 2
= kAk + 2A · B + kBk
≤ kAk2 + 2kAk · kBk + kBk2 (Desigualdad de C-S)
= (kAk + kBk)2
95
√ √
Se sigue la desigualdad triangular de la propiedad: 0 ≤ x ≤ y ⇒ x≤ y para números
reales x, y.
kAk − kBk ≤ kA − Bk
kAk = kA − B + Bk ≤ kA − Bk + kBk
Problema 3.5.1. Un piloto tiene que volar hacia el este de A a B y después regresar hacia
el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto a
la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.
(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c
(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2
(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2
(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?
96
Realizar las gráficas correspondientes para ilustrar la situación.
Solución. Resolveremos solo el caso 1 del inciso (b), y el caso 1 del inciso (c). El resto se
deja como ejercicio (ver el problema 4.15.7).
Denotemos por C a el vector que representa la velocidad del avión respecto a el aire, esto
es, la velocidad que mide el piloto. Y denotemos por D el vector que representa la velocidad
del aire con respecto a la tierra, es decir la velocidad del viento que mide una persona que
está estacionaria en el tierra.
N N
Ab b
D C Bb
Ab
C b
D Bb
E E
S S
(a) Para el viaje de ida, un observador en tierra (b) Para el viaje de venida, dado que el viento es
mide la misma dirección de la velocidad del viento contrario a la dirección del movimiento del avión,
que el piloto, pero como existe un viento hacia el un observador en tierra calcula que la rapidez del
este, el observador en tierra calcula que la rapidez avión es c − v.
del avión es c + v.
Suponemos como caso 1, que la dirección del vector D es hacia el este en el viaje de ida
y de venida. En el viaje de ida. La dirección que mide el piloto para el vector C es α = 0,
además, la magnitud es kCk = c, por lo tanto,
Cx = c cos 0 = c, Cy = c sen 0 = 0,
con lo cual,
C = (c, 0).
D = (v, 0).
En consecuencia, la velocidad en el viaje de ida (ver figura 3.13(a)) que mide un observador
en tierra es
RAB = C + D = (c + v, 0).
97
Vemos de esta forma, que desde la perspectiva de un observador en tierra la rapidez del
avión en el viaje de ida es kRAB k = c + v. Y dado que cuando dicha rapidez es constante,
según la ecuación 4.16 con x0 = 0 es igual a distancia sobre tiempo, tenemos que el tiempo
tAB que tarda el avión en ir desde A hasta B es
l
tAB = .
c+v
Ahora, para el viaje de vuelta el vector D mantiene su dirección y magnitud (ver figura
3.13(b)). Sin embargo, el vector C a pesar de mantener su magnitud invierte su dirección,
esto es, la velocidad que mide el piloto para el viaje de vuelta es,
RBA = −C + D = (v − c, 0).
Además, Por el inciso (d) c > v, ası́, la rapidez del avión en el viaje de vuelta para un
observador en tierra es
kRBA k = |v − c| = c − v.
Con lo cual,
l
tBA = .
c−v
Concluimos de esta forma, que el tiempo necesario para completar un viaje redondo es
tE = tAB + tBA
l l
= +
c+v c−v
(c − v)l + (c + v)l
=
c2 − v 2
2cl
= 2
c − v2
2l/c
=
1 − v 2 /c2
t0
= .
1 − v 2 /c2
Ahora, supongamos que prevalece un viento hacia el norte. En este caso, si el piloto dirige
el avión en el segmento que va desde el punto A hasta el punto B, un observador en tierra
98
verı́a que el avión sigue la dirección noreste, ya que prevalece un viento hacia el norte. Por
lo tanto, el piloto debe enfilar el avión en la dirección sureste, con cierta inclinación medida
a partir del sur, que depende de la magnitud del vector D, para que un observador en tierra
vea que el avión sigue exactamente la dirección del segmento AB
N N
√ √
Ab b
c2 − v 2 B
b
Ab
c2 − v 2
b
Bb
c v v c
E E
S S
(a) El piloto debe enfilar el avión en dirección sur- (b) En el viaje de vuelta, el piloto debe enfilar el
este, para que un observador en tierra vea que el avión en dirección suroeste, para que un observador
avión sigue el segmento AB en tierra vea que el avión sigue el segmento BA
En la figura 3.14(a) se muestra la velocidad del avión en azul, desde el punto de vista del
piloto. La velocidad del aire se muestra en verde. La velocidad del avión calculada por un
observador en tierra es entonces
RAB = C + D.
Observese que los tres vectores el ecuación anterior se relacionan según el triángulo que
muestra en la figura 3.14(a), y dado que el vector D es ortogonal a el vector RAB , dicho
triángulo es rectángulo. Por lo tanto, por el Teorema de Pitagoras
√
kRAB k = c2 − v 2 .
Ahora podemos calcular el tiempo que tarda el avión en ir desde el punto A hasta el punto
B,
l
tAB = √ .
c2 − v 2
Para el viaje de vuelta, el piloto debe enfilar el avión en la dirección sur oeste (ver figura
3.14(b)), y entonces un observador en tierra verı́a que el avión sigue el segmento de recta
BA calculando que el tiempo en recorrerlo es
l
tBA = √ .
c2 − v 2
99
Con lo cual, finalmente obtenemos que
2l t0
tN = tAB + tBA = √ =p .
c2 − v 2 1 − v 2 /c2
y y
A A
θ
θ B
x x
O B O
tB tB
Como se muestra en la figura 3.15 el escalar t puede ser positivo o negativo dependiendo
del ángulo θ que hay entre A y B. Supongamos primero que 0 ≤ θ ≤ π/2 de tal forma que
t > 0. En la figura 3.15(a) vemos que
ktBk
cos θ = .
kAk
Dado que t > 0, por el Teorema 3.1.2 inciso (c),
Por lo tanto,
tkBk
cos θ = ,
kAk
100
de donde despejando t obtenemos
kAk cos θ
t= .
kBk
Por otro lado, por el Teorema 3.2
A · B = kAkkBk cos θ,
o bien,
A·B
kAk cos θ =
kBk
Por consiguiente,
A·B
t= .
kBk2
Tenemos entonces la siguiente definición
Definición 3.5.1 (Vector proyección). Sean A y B vectores no nulos de R2 . La proyección
de A sobre B se denota por ProyB A y define como el vector
A·B
ProyB A = B.
kBk2
(e) La magnitud del vector proyección es llamada proyección escalar y está dada por
|A · B|
k ProyB Ak = .
kBk
101
Capı́tulo 4
y = f (x)
x
a = x0 x1 ··· xi−1 xi ··· xn = b
102
del intervalo [a, b] en n subintervalos
Está claro que esta aproximación mejora cuando n → ∞. Por lo tanto tenemos
n
X
A = lı́m ∆xf (xi ). (4.1)
n→∞
i=1
es decir, xi = a + i∆x, 0 ≤ i ≤ n.
Ejemplo 4.1. Sea An el área de un polı́gono de n lados iguales, inscrito un circulo de radio
r. Al dividir el polı́gono en n triángulos congruentes con un ángulo central 2π/n, demuestre
que
1 2π
(a) An = nr 2 sen
2 n
(b) lı́m An = πr 2
n→∞
103
Al trazar la altura h de uno de los n triángulos que conforman el polı́gono de n lados de
longitud L, obtenemos un triángulo rectángulo de hipotenusa r y ángulo central
1 2π π
θ= · = ,
2 n n
ver la figura
L/2
r h
θ
L/2
Tenemos que cos θ = h/r y sen θ = . Por lo tanto, el área de uno de los triángulos
r
que conforman el polı́gono es
Lh 1 1 1 1 2π
A= = (r cos θ)(2r sen θ) = r 2 (2 sen θ cos θ) = r 2 sen 2θ = r 2 sen .
2 2 2 2 2 n
Con lo cual, el área An del polı́gono está dada por
1 2π
An = nr 2 sen
2 n
Ahora puesto que
sen x
→ 1 cuando x → 0,
x
la función
sen x , si x 6= 0,
f (x) := x
1, si x = 0,
2π
es continua en x = 0. Además, xn = → 0 cuando n → ∞. Entonces por el Teorema 4.1.1
n
f (xn ) → f (0) = 1. Lo cual implica que
2π
n 2π sen
lı́m sen = lı́m n = 1.
n→∞ 2π n n→∞ 2π
n
Finalmente,
1 2 2π n 2π
lı́m An = lı́m nr sen = πr 2 lı́m sen = πr 2 · 1 = πr 2
n→∞ n→∞ 2 n n→∞ 2π n
104
4.2. Integral definida
En la sección 4.1 se aproximo el área bajo la gráfica de una función continua y = f (x)
desde x = a hasta x = b por exceso. Sin embargo, se puede demostrar que el valor de A en
(4.1) no cambia cuando tomamos los extremos izquierdos de cada subintervalo, esto es, la
aproximación se hace por defecto
n−1
X n
X
A = lı́m ∆xf (xi ) = lı́m ∆xf (xi−1 ). (4.2)
n→∞ n→∞
i=0 i=1
De hecho, en lugar de usar los extremos izquierdos o derechos, podrı́amos tomar la altura
del i-esimo rectángulo como el valor de f en cualquier número x∗i en el i-esimo subintervalo
[xi−1 , xi ]. A los números x∗1 , . . . , x∗n se les llama puntos de muestra. Podemos calcular el
valor del área usando estos puntos
n
X
A = lı́m ∆xf (x∗i ). (4.3)
n→∞
i=1
A el valor común del área A obtenido en (4.1), (4.2) y (4.3), se el denota por
Z b
f (x)dx,
a
Definición 4.2.1 (Integral definida). Si f es una función continua en el intervalo [a, b],
el cual dividimos en n subintervalos de igual ancho ∆x = (b − a)/n. Denotamos con x0 =
a, x1 , . . . , xn = b los puntos extremos de estos subintervalos y elegimos los puntos de muestra
x∗1 , . . . , x∗n en cada uno de estos subintervalos, de modo que x∗i se encuentre en el i-esimo
subintervalo [xi−1 , xi ]. Entonces integral definida de f , desde a hasta b, es
Z b n
X
f (x)dx = lı́m ∆xf (x∗i ). (4.4)
a n→∞
i=1
105
Solución. Partamos de la identidad
= an − a0
x x
= sen(2n + 1) − sen .
2 2
Ahora nos proponemos usar de nuevo la identidad (4.5), pero esta vez, de derecha a izquierda.
Para tal fin debemos encontrar A y B tales que
x x
A + B = (2n + 1) , A − B = .
2 2
Entonces,
x x
2A = A + B + A − B = (2n + 1) + = (n + 1)x,
2 2
x x x
de donde A = (n+1) . Con lo cual, B = A− = n . De esta forma obtenemos la identidad
2 2 2
x x x x
2 sen n cos(n + 1) = sen(2n + 1) − sen .
2 2 2 2
Lo que a su vez nos lleva a concluir que si, x 6= 2mπ, entonces
1 1
n sen nx cos (n + 1)x
2 2
X
cos ix = . (4.6)
1
i=1 sen x
2
106
Ahora por definición de integral de Riemann
Z π/2 n
X
cos xdx = lı́m ∆x cos xi ,
0 n→∞
i=1
π π π
donde ∆x = , xi = ∆xi = i. Entonces por la identidad (4.6), con x = , tenemos que
2n 2n 2n
n n
X X π π
∆x cos xi = cos i
i=1 i=1
2n 2n
n
π X π
= cos i
2n i=1 2n
hn π i
(n + 1)π
sen cos
π 2 2n 4n
= π
2n sen
4n
π π/2n π π
= sen · cos + .
4 sen π 4 4n
4n
π n→∞
Ahora como −→ 0, por el Teorema 4.1.1,
4n
π/4n 1 n→∞ 1
2 π = 2 sen(π/4n) −→ 2 · 1 = 2,
sen
4n π/4n
y
π
π n→∞ π π
cos + −→ cos + 0 = cos .
4 4n 4 4
En conclusión
Z π/2
π π/2n π π π π π
cos xdx = lı́m sen · π cos + = sen · 2 · cos = sen = 1.
0 n→∞ 4 sen 4 4n 4 4 2
4n
107
Solución. Intentemos calcular el área pedida por exceso. Tenemos que
Z b X n
f (x)dx = lı́m ∆xf (xi ),
a n→∞
i=1
b−a 1
donde ∆x = = , xi = a + i∆x = 1 + i/n. Entonces
n n
1 n2
f (xi ) = = .
(1 + i/n)2 (n + i)2
Por lo tanto tenemos que
Z 2 n n
X X n
f (x)dx = lı́m ∆xf (xi ) = lı́m . (4.7)
1 n→∞
i=1
n→∞
i=1
(n + i)2
El lı́mite en (4.7) se puede calcular usando el teorema fundamental del cálculo, pero cier-
tamente la integral que nos plantean también. Para resolver el problema usando sumas de
Riemann, debemos definir
√
x∗i = xi−1 xi ,
1 ≤ i ≤ n. Primero que todo notemos que como 0 < 1 ≤ xi−1 ≤ xi para todo 1 ≤ i ≤ n,
entonces
Comprobando de esta forma, que los x∗i definen efectivamente puntos de muestra. Podemos
ahora calcular la integral usando estos puntos de muestra
Z 2 n n
X
∗
X 1 1
f (x)dx = lı́m ∆xf (xi ) = lı́m · .
1 n→∞
i=1
n→∞
i=1
n xi−1 xi
108
Entonces
n n
X 1 1 X 1 1
· = n −
i=1
n xi−1 xi i=1
n+i−1 n+1
n
X 1 1
=n −
i=1
n + i − 1 n+1
n
X
=n (ai−1 − ai ).
i=1
1
Donde ai := . Finalmente, por la propiedad telescópica de las sumas finitas
n+i
Z 2 Xn
f (x)dx = lı́m n (ai−1 − ai )
1 n→∞
i=1
= lı́m n(a0 − an )
n→∞
= 1/2.
109
4.3. Propiedades de la integral definida
Teorema 4.3.1 (Propiedades de la integral definida). Sean f y g funciones continuas en
un intervalo [a, b] y c ∈ R. Entonces
Z b Z b Z b
(a) (f (x) ± g(x))dx = f (x)dx ± g(x)dx
a a a
Z b Z b
cf (x)dx = c f (x)dx. (Propiedades de linealidad)
a a
Z b Z c Z b
(b) f (x)dx = f (x)dx + f (x)dx (Propiedad de aditividad)
a a c
(c)
Z b
Si f (x) ≥ 0, entonces f (x)dx ≥ 0
a
Z b Z b (Propiedades de orden)
Si f (x) ≥ g(x), entonces f (x)dx ≥ g(x)dx.
a a
Z b
Si m ≤ f (x) ≤ M, entonces m(b − a) ≤ f (x)dx ≤ M(b − a)
a
Z b Z b+c
(d) f (x)dx = f (x − c)dx (Propiedad de invariancia frente a traslación)
a a+c
Z b Z a
(e) f (x)dx = − f (x)dx. (Propiedad de inversión de la orientación)
a b
b cb
1 x
Z Z
(f ) f (x)dx = f dx, c 6= 0.
a c ca c
(Propiedad de dilatación o contracción del intervalo)
110
Un sı́mbolo especial se utiliza para denotar la colección de todas las antiderivadas de una
función f .
Definición 4.4.2 (Integral definida). la colección de todas las antiderivadas de una función
f se denomina integral indefinida de f con respecto a x, lo cual se denota mediante
Z
f (x)dx.
Ejemplo 4.4 (Movimiento en una dimensión con aceleración constante (MUA)). Cuando
una partı́cula se mueve en una dimensión con aceleración constante, podemos hallar la po-
sición de la partı́cula como una función del tiempo al resolver el par de problemas de valor
inicial
dv
= a(t) = cte
dt (4.9)
v(0) = v ,
0
dx
= at + v0
dt (4.10)
x(0) = x .
0
En efecto, de la fı́sica clásica se sabe que la velocidad v(t) de una partı́cula en el tiempo t
es la derivada de la posición de la partı́cula respecto al tiempo, a su vez, la derivada de la
velocidad de la partı́cula con respecto al tiempo es igual a la aceleración a(t) en el tiempo t.
Esto es,
d2 x
d dx d
a(t) = 2 = = v(t).
dt dt dt dt
111
dv
Si suponemos que a(t) = = cte = c y que velocidad en el tiempo t = 0 es v0 , esto es
dt
v(0) = v0 , obtenemos el problema de valor inicial (4.9). Resolveremos este problema por un
método usado en ecuaciones diferenciales conocido como separación de variables.
dv
Tenemos que : = a = cte. Entonces separando variables obtenemos
dt
dv = adt.
v(t) = at + C1 ,
v(t) = at + v0 (4.11)
Aplicando de nuevo el método de separación de variables, esta vez para resolver (4.10) obte-
nemos
Z Z
dx = (at + v0 )dt ⇔ dx = (at + v0 )dt.
Ahora podemos usar las ecuaciones (4.9), (4.12) para hallar una expresión para la velocidad
final v(t) que no dependa del tiempo. De (4.9) despejando el tiempo obtenemos
vf − v0
t= (4.13)
a
donde vf = v(t).
112
Reemplazando (4.13) en (4.12) obtenemos
2
vf − v0 1 vf − v0
x = v0 + a ,
a 2 a
Otro problema tı́pico de valor inicial, que se presenta en este contexto es el de una partı́cula
que se mueve en una dimensión con velocidad constante. Para este caso tenemos
dx
= v = cte
dt (4.15)
x(0) = x .
0
(a) Si la desaceleración máxima del vehı́culo es de −4,5 m/s2 , ¿cuál es el tiempo de reac-
ción mı́nimo del automovilista que le permitirá evitar golpear al venado? .
(b) Si el tiempo de reacción es de 0,30 s, ¿Cuán rápido viajará cuando golpeé al venado?
113
Solución. Sea t0 el tiempo de reacción mı́nimo del automovilista que le permitirá evitar
golpear al venado. En este tiempo puesto que no ha empezado a frenar, el automovilista se
desplaza con una velocidad constante de v = 18m/s. Por lo tanto, la distancia recorrida en
este tiempo se halla utilizando la fórmula (4.16) con x0 = 0, si denotemos dicha distancia
por X0 tenemos que X0 = 18t0 .
0 = −4,5t + 18,
de donde t = 4s. Para hallar la distancia que recorrió el automóvil antes de detenerse
completamente utilizamos la fórmula (4.12) con x0 = 0, para obtener
X1 = 18 · 4 + (1/2)(−4,5)(4)2 = 36.
v0 = 18m/s
38m
X0 X1
Para que el automovilista no atropelle al venado se debe tener que la distancia de reacción
X0 más la distancia de frenado X1 sea exactamente igual a 38m (ver figura 4.2). Esto es,
X0 + X1 = 38.
x = x(0,3) = 18 · 0, 3 = 5,4m,
pasado ese tiempo empieza a frenar, y la velocidad con la que atropella al venado se calcula
con la fórmula (4.14), tomando v0 = 18, a = −4,5 y x = 38 − 5,4 = 32,6. Tenemos que
p
vf = 182 − 2(4,5)(32,6) = 5,5317m/s.
114
Ejemplo 4.6 (Difusión social). En ocasiones, los sociólogos utilizan la frase difusión social
para describir la manera en que la información se difunde en una población. La información
puede ser un rumor, una moda cultural, o una noticia de una innovación tecnológica. En una
población suficientemente grande, el número de personas x que conoce la información se trata
como una función diferenciable del tiempo t, mientras que la velocidad de difusión, dx/dt,
se supone proporcional al número de personas que conocen la información por el número de
personas que la desconocen. Lo anterior lleva a la ecuación diferencial
dx
= kx(N − x),
dt
donde N es el número de personas en la población.
Suponga que t está en dı́as, k = 1/250, y que dos personas inician un rumor en el instante
t = 0 en una población de N = 1000 personas.
115
Luego por las propiedades de linealidad de la integral.
dx 1 dx
Z Z
=
kx(N − x) k x(N − x)
1 1 1 1
Z
= · + dx
k N N −x x
Z
1 1 1
= + dx
kN N −x x
Z
1 1 1
Z
= dx + dx
kN N −x x
1
= [ln x − ln(N − x)] .
kN
Tenemos entonces que
1 x 1
ln = [ln x − ln(N − x)] = t + C,
kN N −x kN
donde kN = 1000/250 = 4. Por consiguiente,
x x
ln = 4t + 4C ⇔ = e4t+4C = e4t e4C
N −x N −x
⇔ x = Ne4C e4t − e4t e4C x
⇔ x + e4t e4C x = Ne4C e4t
⇔ x(1 + e4t e4C ) = Ne4C e4t
Ne4C e4t
⇔x= .
1 + e4t e4C
Esto es,
1000e4C e4t
x = x(t) = (4.17)
1 + e4t e4C
x
Además como x = 2 cuando t = 0 y = e4t e4C , tenemos que e4C = 1/499. Reempla-
N −x
zando este último valor en (4.17), obtenemos
1000e4t
x = x(t) = .
499 + e4t
Con lo cual tenemos la parte (a). Para la parte (b), debemos resolver para t, la ecuación
1000e4t
= 500.
499 + e4t
Esto es,
1000e4t 1000 4t
4t
= 500 ⇔ e = 499 + e4t ⇔ e4t = 499.
499 + e 500
Entonces t = ln 499/4 ≈ 1,55.
116
4.5. Teorema fundamental del cálculo
4.5.1. Primer teorema fundamental del cálculo
Teorema 4.5.1 (Primer teorema fundamental del cálculo). Si f e continua en [a, b], la
función F definida por
Z x
F (x) = f (t)dt a ≤ x ≤ b
a
De donde
Como se quiere hallar f (2), debemos hallar x > 0 tal que h(x) = 2. Esto es,
x2 (x + 1) = 2 ⇔ x2 + x3 − 2 = 0
⇔ x2 − 1 + x3 − 1 = 0
⇔ (x − 1)(x + 1) + (x − 1)(x2 + 2x + 1) = 0
⇔ (x − 1)(x2 + 2x + 2) = 0.
117
Para y = x2 + 2x + 2, tenemos a = 1, b = c = 2, con lo cual, D = b2 − 4ac = 22 − 4(1)(2) < 0.
Entonces x2 + 2x + 2 > 0 para todo x ∈ R. Por consiguiente x − 1 = 0, esto es, x = 1.
Reemplazando este valor en (4.19) encontramos que
donde F es una antiderivada de f , esto es, una función tal que F ′ (x) = f (x).
118
y
x
0 x 1 2
Z x
Figura 4.3: La integral tdt es igual a el área del triángulo de lados x y y = f (x) = x
0
A1 A2
x
0 1 x 2
Figura 4.4: En este caso el área acumulada hasta x es igual a el área del triángulo más el
área del trapecio
Geométricamente podemos calcular el área como la suma del área del triángulo y el
119
trapecio que se muestran el la figura 4.4. Tenemos que:
Z 1 Z x
1·1 (1 + 2 − x)(x − 1)
f (t)dt = A1 = = 1/2, f (t)dt = A2 = .
0 2 1 2
Entonces
x
(3 − x)(x − 1)
Z
F (x) = f (t)dt = 1/2 + = −x2 /2 + 2x − 1.
0 2
Si queremos hallar el área acumulada hasta un valor x, utilizando el segundo teorema fun-
damental del cálculo, procedemos como sigue. Para el área A1 tenemos que 0 ≤ t ≤ 1, con
lo cual f (t) = t. Entonces
Z 1
A1 = tdt = F1 (1) − F1 (0) = 1/2 − 0 = 1/2.
0
120
y
x
0 1 2 x
Figura 4.5: Si x > 2, ya se acumulo toda el área, la cual es igual a el área del triángulo que
se muestra
x
0 1 2
121
La función f es diferenciable en R − {0, 1, 2}. Por el primer Teorema fundamental del
cálculo, la función F es diferenciable donde f es continua, esto es, en todo R.
Observamos en la figura 4.7 que al mover la linea vertical en rojo desde x = a, hasta x = b,
barremos toda la región, y mientras hacemos esto, dicha linea siempre entra en la curva
y = ϕ1 (x) y sale en la curva y = ϕ2 (x). Un subconjunto del plano con estas caracterı́sticas
es denominado región del tipo I.
y
y = ϕ2 (x)
y = ϕ1 (x)
x
a b
Dado que 0 ≤ ϕ1 (x) ≤ ϕ2 (x), para x ∈ [a, b], podemos hallar el área de la región R
como una resta de áreas. En efecto, denotemos dicha área por a(R), utilizando la integral
de Riemann tenemos que
Z b Z b Z b
a(R) = A2 − A1 = ϕ2 (x)dx − ϕ1 (x)dx = [ϕ2 (x) − ϕ1 (x)] dx.
a a a
122
Por lo tanto, podemos expresar el área de la región como
Z b
a(R) = [ϕ2 (x) − ϕ1 (x)] dx
a
" #
Z Z b ϕ2 (x)
= dy dx
a ϕ1 (x)
Z bZ ϕ2 (x)
= dydx
a ϕ1 (x)
ZZ
= dA.
R
ZZ
La expresión dA es denominada integral doble extendida sobre la región R del dife-
R
rencial de área, el diferencial de área, dA, es igual a dydx.
Ejemplo 4.9. Calcular el área de la región acotada por la hipérbola xy = 1 y las rectas
y = x y y = 2.
Solución. Hallemos los puntos de corte entre la hipérbola y = 1/x, y la recta y = 2. Esto
es, resolvemos para x la ecuación 1/x = 2, encontrando que x = 1/2. De manera similar, las
rectas y = x y y = 2 se cortan en x = 2 y la hipérbola y la recta y = x en x = 1. Con esta
información hallamos la gráfica de la región.
y
y=x
2
y=2
R
xy = 1
x
1/2 1 2
123
desde x = 1 hasta x = 2 entra en la recta y = x y sale en la recta y = 2, por lo que la región
R no puede ser del tipo I. Sin embargo, al trazar una linea horizontal vemos que cuando la
desplazamos desde y = 1 hasta y = 2, siempre entra en la hipérbola x = 1/y y sale en la
recta x = y. Un subconjunto del plano con esta propiedad es denominado región del tipo II.
De manera más general definimos una región plana del tipo II como sigue
Análogamente como se hizo con la regiones de tipo I calculamos el área de una región del
tipo II
ZZ
a(R) = dA
R
Z "Z d
#
ψ2 (y)
= dx dy
c ψ1 (y)
Z d Z ψ2 (y)
= dxdy
c ψ1 (y)
Z d
= [ψ2 (y) − ψ1 (y)] dy.
c
En una región del tipo II, el diferencial de área está dado por dA = dxdy. Ahora para nuestro
caso tenemos que
R = (x, y) ∈ R2 : 1/y ≤ x ≤ y, 1 ≤ y ≤ 2 .
Por lo tanto,
Z 2
a(R) = (y − 1/y)dy
1
2
= y 2 /2 1 − [ln y]21
A pesar de que la región R no es del tipo I, se puede ver como la unión de dos regiones del
tipo I.
124
y
y=x
2
y=2
R1 R2
xy = 1
x
1/2 1 2
Figura 4.9: Región del tipo II, que puede ser vista como la unión de dos regiones del tipo I
En efecto, R = R1 ∪ R2 , donde
Podemos entonces calcular el área pedida utilizando la propiedad aditiva de las integrales
dobles
ZZ ZZ ZZ
a(R) = dA = dA + dA = a(R1 ) + a(R2 ).
R R1 R2
Tenemos que
ZZ Z 1
a(R1 ) = dA = (2 − 1/x)dx = 1 + ln 1/2 = 1 − ln 2,
R1 1/2
y
ZZ Z 2
a(R2 ) = dA = (2 − x)dx = 1/2.
R2 1
Existen regiones planas que pueden ser del tipo I y del tipo II al mismo tiempo. Llama-
remos a estos subconjuntos del plano regiones del tipo III.
Para calcular área entre curvas debemos utilizar la propiedad aditiva de la integrales
dobles en su caso más general.
125
Teorema 4.6.1 (Propiedad aditiva de las integrales dobles). Supongamos que
R = R1 ∪ R2 ∪ · · · ∪ Rn ,
donde las regiones Ri , 1 ≤ i ≤ n, son regiones elementales en el plano de alguno de los tres
tipos definidos; tipo I, tipo II, o bien tipo III, las cuales son disyuntas dos a dos, esto es,
Ri ∩ Rj = ∅, i 6= j,
x = x(t), y = y(t).
126
t x y
0 1 0
π/2 0 1
π −1 0
3π/2 0 −1
2π 1 0
Para este caso el parámetro t representa el tiempo, y vemos que si 0 ≤ t ≤ 2π, la partı́cula
completa una revolución pasados 2π segundos (ver cuadro 4.1)
Se observa que a medida que el parámetro crece de 0 a 2π los puntos se distribuyen sobre
la circunferencia siguiendo la dirección contraria a las manecillas del reloj.
En sı́mbolos escribimos
Definición 4.7.2. Una curva en el plano es la imagen por medio de una función vectorial
en R2 de un intervalo I de números reales.
Ejemplo 4.10 (Parametrización de una función en el plano). Sea y = f (x) una función
definida en un intervalo I de números reales. Entonces su gráfica:
es muy sencilla de parametrizar, pues vasta definir, α(t) = (t, f (t)), t ∈ I, en tal caso
C = α(I).
127
4.7.1. Ecuación vectorial y normal de la recta
En la sección 1.2 hallamos la ecuación de la recta usando argumentos geométricos. Des-
afortunadamente, este tipo de argumentos no se pueden extender para deducir la ecuación
de una recta, por ejemplo en R3 , por lo que usaremos métodos vectoriales para encontrar la
ecuación de una recta en Rn .
Sea P0 = (x0 , y0 ) un punto dado de la recta. Supongamos además que v es el vector que
la da dirección a la recta l, nos referimos a este vector como vector director. Supongamos
además que P = (x, y) es un punto arbitrario de l ver figura 4.11.
y
l
P b
P0
b
x
O
128
Aplicando la multiplicación por escalar y la suma de vectores, encontramos que
x = x(t) = x0 + tv1
(4.21)
y = y(t) = y0 + tv2
Con lo cual tenemos entonces las llamadas ecuaciones paramétricas de la recta. De
las ecuaciones (4.21) concluimos que la parametrización de la recta está dada por
De la ecuación (4.20) se hace patente que para determinar completamente una recta es
suficiente con un punto el vector director, o bien teniendo dos de sus puntos, como mostra-
remos en el siguiente ejemplo.
Solución. Dado que ya tenemos un punto de la recta, por ejemplo, P0 = P , solo falta
−→
determinar el vector director, el cual podemos tomar como v =P Q ver figura 4.12.
y
l
Q
b
−→
P v =P Q
b
x
O
129
Por lo tanto, la parametrización de la recta es
−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), t ∈ R.
Sea P0 = (x0 , y0) un punto dado de la recta l y n = (a, b) el vector normal a l, esto es, el
vector n es ortogonal a cualquier vector sobre la recta l (ver figura 4.13).
vector n trasladado
l
n = (a, b)
P
P0
x
O
130
Lo que equivale a
a(x − x0 ) + b(y − y0 ) = 0 ⇔ ax + by − (ax0 + by0 ) = 0.
Si llamamos c = −(ax0 + by0 ) obtenemos
ax + by + c = 0. (4.24)
La ecuación (4.24) se conoce como ecuación normal de la recta. Se observa que las
componentes del vector normal son los coeficientes de las variables x y y respectivamente.
Nota 4.7.1. En la deducción de la forma normal de la recta, hay un sutileza, en la ecuación
−→ −→
(4.23) el producto punto debe realizarse en realidad entre vectores P0 P y P0 P2 , donde P2 es
el punto final del vector n trasladado. Sin embargo, por el análisis hecho en la sección 3.3,
−→
dado que el vector n es equivalente a el vector geométrico P0 P2 tenemos que
−→
n = P0 P2 .
Por lo tanto,
−→ −→ −→
P0 P ·n =P0 P · P0 P2 = 0.
Ejemplo 4.12. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a
un punto P0 = (x0 , y0 ) que no pertenece a l está dada por
|ax0 + by0 + c|
√
dmı́n = .
a2 + b2
Solución. Este problema ya se soluciono de forma puramente geométrica en el ejemplo 1.5.
Ahora utilizaremos el vector proyección para resolver el problema.
y
l
P0
b
dmı́n P
P1
P2
vector normal n trasladado
x
O
n = (a, b)
Figura 4.14: La distancia entre el punto P0 y la recta l recta es igual a la proyección escalar
−→
entre vector P0 P y el vector normal n trasladado.
131
En la figura 4.14 trasladamos el vector normal n respetando dirección y magnitud, de tal
forma que su punto inicial coincida con el punto P0 , si el punto final de este vector es P2 ,
−→
entonces el vector P0 P2 es ortogonal a la recta l en el punto P1 . Si P = (x, y) es cualquier
punto de la recta l, vemos que la distancia entre P0 y la recta l; dmı́n = kP0 − P1 k es la
−→ −→
proyección escalar entre el vector P0 P y el vector P0 P2 . Por lo tanto, por el Teorema 3.5.2
inciso (e) tenemos que
−→ −→
−→ | P0 P · P0 P2 |
dmı́n = k Proy −→ P0 P k = −→ .
P0 P2
k P0 P2 k
−→
Ahora, dado que los vector n y el vector geométrico P0 P2 tienen la misma dirección y
magnitud, por (3.1) tenemos que
−→
n = P0 P2 .
Con lo cual,
−→
| P0 P ·n|
dmı́n = .
knk
Como la ecuación de la recta está en la forma normal ax + by + c = 0, las componentes
del vector normal son a y b, esto es, n = (a, b). Además dado que (x, y) ∈ l tenemos que
ax + by + c = 0, o bien, ax + by = −c. Entonces
−→
| P0 P ·n|
dmı́n =
knk
|a(x − x0 ) + b(y − y0 )|
= √
a2 + b2
|ax + by − (ax0 + by0 )|
= √
a2 + b2
| − c − ax0 − by0 |
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2
132
Parametrización de la elipse
La ecuación cartesiana de la elipse con centro en (h, k) y semiejes a y b viene dada por
(x − h)2 (y − k)2
+ = 1. (4.25)
a2 b2
Para parametrizar la elipse utilizamos la identidad fundamental
cos2 t + sen2 t = 1.
(x − h)2 2 (y − k)2
Podemos escoger = cos t y = sen2 t, de donde despejando las variables x,
a2 b2
y y obtenemos las ecuaciones paramétricas
x = x(t) = a cos t + h, y = y(t) = b sen t + k.
De lo cual obtenemos que la parametrización de la elipse es
α(t) = (a cos t + h, b sen t + k), 0 ≤ t ≤ 2π. (4.26)
Cuando a = b = R en (4.25) nos da
(x − h)2 + (y − k)2 = R2 , (4.27)
la cual es la ecuación de una circunferencia con centro en (h, k) y radio R.
Parametrización de la cicloide
Ejemplo 4.13 (Cicloide). La curva trazada por un punto en la circunferencia de un cı́rculo
que rueda sin resbalar por una recta se llama cicloide (ver figura 4.15). Si el cı́rculo tiene
radio r y rueda a lo largo del eje x, y un punto P sobre el cicloide empieza en el origen,
parametrice el cicloide.
y
b
C(rθ, r)
r θ
P
Q
y
x x
O T
rθ
Figura 4.15: Un punto P sobre la rueda de una bicicleta que se desplaza sobre plano horizontal
genera una curva llamada cicloide.
133
Solución. Elijamos el ángulo de rotación θ del cı́rculo como parámetro, cuando θ = 0,
el punto P está en el origen. Cuando el cı́rculo ha girado θ radianes, la distancia que ha
recorrido desde el origen es
OT = arc P T = rθ
Dado que el centro del cı́rculo está en C(rθ, r), si (x, y) son las coordenadas del punto P ,
entonces, según la figura 4.15
Por lo tanto,
P Q
α
b
C(rθ, r)
θ
x
O T
rθ
134
de donde
De manera análoga,
rθ − x
sen θ = sen(π − θ) = sen α = ,
r
o bien
135
Teorema 4.8.1. Sea α : I ⊆ R → R2 una aplicación vectorial dada por
El lı́mite lı́mt→t0 α(t) existe si solo si los lı́mites lı́mt→t0 x(t), lı́mt→t0 y(t) existen, más aún,
lı́m α(t) = lı́m x(t), lı́m y(t) .
t→t0 t→t0 t→t0
y
α′ (t0 )
P
Q
136
es decir α(t0 + h) = Q. Tenemos entonces que el cambio en la posición de la partı́cula viene
dado por
−→
P Q= Q − P = α(t0 + h) − α(t0 ).
El vector
α(t0 + h) − α(t0 )
,
h
es secante a la trayectoria C y cuando h → 0, de tal forma que los punto P y Q se aproximan,
tiende a ser el vector tangente a la trayectoria C en el punto P . Por consiguiente, el vector
tangente o vector velocidad de la partı́cula en el momento t0 , el cual se denota por α′ (t0 )
está dado por
α(t0 + h) − α(t0 )
α′ (t0 ) = lı́m , (4.29)
h→0 h
si el lı́mite en la derecha de (4.29) existe. En tal caso diremos que la función α es diferenciable
en t = t0 .
El Teorema 4.8.1 nos permite encontrar una expresión para calcular el vector tangente.
Nota 4.8.1. El Teorema 4.8.3 nos dice que la derivada de una aplicación vectorial es a su
vez una aplicación vectorial, por lo tanto podemos hablar de una aplicación vectorial cuya
derivada sea continua. Decimos que una curva C es suave si su representación vectorial
es diferenciable con continuidad para todo t ∈ I. Es decir, α′ (t) existe y es continua para
todo punto del intervalo I. La gráfica de una curva suave, se distingue por que no se rompe
y no tiene puntas. Decimos que una curva C, que es diferenciable en un intervalo I, salvo
por un número finito de puntos es suave a trozos.
137
y y y
R
C
x x x
(a) Curva suave (b) Suave a trozos (c) Curva que se rom-
pe
La gráfica de una circunferencia es una curva suave, ver figura 4.18(a). La frontera de
la región R, ver figura 4.18(b), para este caso un triángulo no es una curva suave, pues no
es diferenciable en cada uno de sus vértices. Sin embargo, si es suave a trozos. La gráfica
de la figura 4.18(c) no es suave ni suave a trozos, pues al presentar un número infinito de
discontinuidades no es diferenciable un número infinito de puntos.
138
un movimiento rectilineo es suficiente con conocer su velocidad y donde esta inicialmente.
Supongamos que la partı́cula está en el momento t = 0 en el punto P0 y que su velocidad
viene dada por un vector constante v (ver la figura 4.11), entonces el vector posición está
dado por
Ejemplo 4.14. Una partı́cula se desplaza en una linea recta con una rapidez constante v
desde el punto P hasta el punto Q. Determinar el vector posición de la partı́cula.
α(t) = P + t(Q − P ), t ∈ R.
y
l
Q
b
w
−→
P v =P Q
b
u
x
O
Figura 4.19: Podemos determinar la posición de una partı́cula, dados dos puntos de su
trayectoria rectilinea junto con su rapidez.
139
Esto es, definimos
v
u= .
kvk
Entonces el vector w dado por
w = vu,
β(t) = P + tw, 0 ≤ t ≤ t1 ,
P + t1 w = Q.
t1 v = t1 kwk = kt1 wk = kQ − P k.
Entonces t1 = kQ − P k/v.
β(t) = P + tw, 0 ≤ t ≤ t1 ,
v Q−P
donde w = vu, u = = y t1 = kQ − P k/v.
kvk kQ − P k
(x − h)2 + (y − k)2 = R2 ,
140
Ahora, nótese que la función vectorial dada por
θ = θ(t) = θ0 + ωt.
v = kβ ′ (t)k = Rω.
Solución. Tenemos que la rapidez lineal de la partı́cula está dada por v = 2m/s, y dado
que R = 1 y v = ωR tenemos que ω = 2 rad /s. Teniendo la rapidez angular podemos
hallar el periodo de la partı́cula con la fórmula ω = 2π/T , de donde T = πs. Suponemos
que la posición en x que sigue la partı́cula es una función cosenosoidal, la cual inducirá una
dirección sobre la curva, si resulta que no es la dirección que se pide en el problema, entonces
utilizamos la fórmula de inversión para obtener la dirección pedida. Además como el centro
de la circunferencia es (h, k) = (0, 0), el vector posición de la partı́cula es de la forma
donde queda por determinar la constante δ, lo cual podemos hallar con la condición inicial
α(0) = (cos 2(0 − δ), sen 2(0 − δ)) = (1, 0). Obtenemos:
cos 2δ = 1, − sen 2δ = 0.
142
El único ángulo en el intervalo [0, π] que satisface simultáneamente las ecuaciones anteriores
es 0. En consecuencia, δ = 0. Concluimos que el vector posición de la partı́cula es
Para hallar el vector posición de la segunda partı́cula procedemos como sigue. Como la
partı́cula se mueve sobre la circunferencia unitaria tenemos que
x = cos θ, y = sen θ,
siendo el ángulo θ la dirección del vector unitario (x, y). Ademas, como v2 = 3m/s y v2 =
ω2 R, tenemos que la rapidez angular de la segunda partı́cula es ω2 = 3 rad /s. Esta rapidez
angular se relaciona con el ángulo θ por la fórmula ω2 = θ/t, de modo que θ = 3t. Por ser
constante la rapidez angular, sabemos que ω2 = 2π/T2 , de donde el periodo de la segunda
partı́cula es T2 = 2π/3. Reuniendo la información anterior encontramos que
Se advierte que la función vectorial β2 modela el movimiento de una partı́cula que se desplaza
con una rapidez de 3m/s empezando en el punto (1, 0) pero siguiendo la dirección contraria
143
a la de las manecillas del reloj. Para obtener la dirección deseada usamos la fórmula de
inversión:
Al tener la posición de las dos partı́culas, debemos igualarlas para hallar el tiempo en que
se encuentran. Esto es, debemos encontrar un tiempo t tal que
α1 (t) = α2 (t)
Como queremos hallar el tiempo en el que las partı́culas se encuentran por primera vez,
tenemos la restricción 0 ≤ t ≤ 2π/3, por lo que
5t = 0, 5t = π, o 5t = 2π.
Es decir, las partı́culas se encuentran por primera vez, pasado un tiempo de t = (2π/5)s.
Problema 4.9.2. Encuentre el primer punto de colisión de las partı́culas del problema 4.9.1.
144
Solución. Como el las partı́culas encuentran por primera vez, pasado un tiempo de t =
(2π/5)s, el primer punto de colisión está dado por
α1 (2π/5) = (cos 2(2π/5), sen 2(2π/5)) = (cos 3(2π/5), − sen 3(2π/5)) = α2 (2π/5)
Debemos entonces calcular el valor exacto de cos(2π/5) = cos 72◦ . En la figura 4.20 se
muestra un triángulo isósceles
R
b
36◦
T 108◦
b
72◦
36◦
72◦
Pb 36◦ b
Q
Triángulo áureo
Figura 4.20: El triángulo isósceles △P QR se denomina áureo, ya que la razón entre lados
mayor y menor es el número ϕ.
a2 − ab = b2 ⇔ a2 − ab + b2 /4 = b2 + b2 /4
⇔ (a − b/2)2 = (5/4)b2
√
⇔ a − b/2 = ( 5/2)b
√
⇔ a = (( 5 + 1)/2)b
√
La constante ( 5 + 1)/2 se suele denotar por ϕ, y se denomina número de oro, o número
de áureo. Vemos entonces que
a
= ϕ,
b
145
por está razón el triángulo △P QR se denomina áureo. Ahora, aplicando el Teorema de
coseno al triángulo △P QT , tenemos que
b2 = (a − b)2 + b2 − 2(a − b)b cos 72◦ ⇔ 2(a − b)b cos 72◦ = (a − b)2
◦ 1 a
cos 72 = −1
2 b
Por lo tanto,
◦ 1 a 1 1 √
cos 72 = − 1 = (ϕ − 1) = ( 5 − 1).
2 b 2 4
De la identidad del ángulo doble:
cos 2x = 2 cos2 x − 1,
calculamos que
1 √
cos 2(72◦ ) = 2 cos2 72◦ − 1 = − ( 5 − 1).
4
Y De la identidad fundamental, encontramos que
◦
p √ q √
sen 2(72 ) = 1− cos2 2(72◦ ) = (1/4) 2 (5 − 5)
1 √ √ q √
α1 (2π/5) = (cos 2(2π/5), sen 2(2π/5)) = − ( 5 − 1), (1/4) 2 (5 − 5) = α2 (2π/5).
4
146
ver ecuación (4.12). De esta forma vemos que
Concluimos entonces que el vector posición para una partı́cula que se desplaza con aceleración
constante es
y
vy = 0 vxo
b
g
v0
vyo
θ0
b b
x
O vxo
Figura 4.21: Cuando un proyectil es lanzado desde el origen con una inicial v0 describe una
trayectoria parabólica. Nótese además, que el proyectil alcanza su altura máxima cuando
vy = 0.
Para hallar el vector posición del proyectil, utilizamos (4.31) con x0 = (0, 0) y a(t) = g =
147
(0, −g) donde g = 9,8m/s2 , es la aceleración de la gravedad, con lo cual obtenemos
En consecuencia, la posición en x es
donde v0 = kv0 k. Vemos entonces que la trayectoria seguida por el proyectil en x queda
descrita por un movimiento con velocidad constante. La posición en y está dada por
de modo que el movimiento en y del proyectil queda descrito por un movimiento de caı́da
libre.
De esta forma vemos que el movimiento del proyectil es un combinado entre un movi-
miento con velocidad constante y un movimiento de caı́da libre.
vy = 0 ⇔ v0 sen θ0 − gt = 0.
148
Con lo cual el proyectil alcanza su altura máxima después de un tiempo t1 dado por
v0 sen θ0
t1 = .
g
Entonces la altura máxima del proyectil es
hmáx = h(t1 )
2
v0 sen θ0 1 v0 sen θ0
= (v0 sen θ0 ) − g
g 2 g
2 2
v sen θ0
= 0 .
2g
Ahora, dado que el tiempo de vuelo es tv = 2t1 , el alcance horizontal está dado por
R = x(tv ) = x(2t1 )
2v0 sen θ0
= (v0 cos θ0 )
g
2
2v sen θ0 cos θ0
= 0
g
2
v sen 2θ0
= 0 .
g
Problema 4.9.3. Se lanza un proyectil desde el pie de un plano inclinado un ángulo θ
respecto a la horizontal. Si la velocidad inicial de proyectil forma un ángulo φ con el plano
inclinado, ¿qué alcance tendrá el proyectil sobre el plano inclinado?
Solución. En la figura 4.22 se muestra el plano uv con el eje u sobre la horizontal. Este
plano gira un ángulo θ en el sentido contrario de las manecillas del reloj para generar el
plano xy, el eje x de este sistema de referencia so coloca sobre el plano inclinado.
y v0 x
P
b
φ
θ
u
Figura 4.22: Se lanza un proyectil con una velocidad inicial v0 con ángulo φ medido respecto
a un plano inclinado un ángulo θ respecto a la horizontal.
149
De esta forma una observador que tiene como punto de referencia el plano uv, medirá las
componentes de la velocidad inicial en la forma
Por lo tanto, la posición en u del proyectil respecto al tiempo, medida desde la horizontal
está dada por
Ası́ mismo, la posición en v del proyectil respecto al tiempo, medida desde la horizontal viene
dada por
Para hallar la ecuación de la parábola que describe la trayectoria del proyectil despejamos
el tiempo de la ecuación para la posición en u, y reemplazamos el resultado en la ecuación
que nos da la posición en v.
v0 sen(θ + φ) u
v = v(t) = u − (1/2)g
v0 cos(θ + φ) (v0 cos(θ + φ))2
g
= (tan(θ + φ)) u − u2 .
2v02 cos2 (θ + φ)
Ahora, dado que le recta que pasa por el origen y el punto P tiene un inclinación θ sobre la
horizontal, su ecuación está dada por
v = (tan θ)u.
u = R cos θ.
De modo que, el alcance R del proyectil sobre el plano inclinado está dado por
2v02 cos2 (θ + φ)(tan(θ + φ) − tan θ)
R= .
g cos θ
150
4.9.4. Fuerza resultante
Una de las principales aplicaciones de los vectores, se presenta, en la solución de problemas
mediante el uso de la segunda ley Newton, la cual establece que la fuerza neta que actúa
sobre un cuerpo es igual a el producto de masa por su aceleración, en términos matemáticos
esto se expresa con una ecuación vectorial:
La masa m de la partı́cula es una cantidad escalar, por lo tanto, lo que define la fuerza que
actúa sobre un cuerpo es la multiplicación por escalar entre su masa y su aceleración. Lo que
queremos decir con fuerza neta, es la fuerza resultante o sumatoria de fuerzas que actúan
sobre el cuerpo, por ejemplo, si n fuerzas F1 , . . . , Fn actúan sobre un cuerpo de masa m por
la segunda ley de Newton tendrı́amos que
F1 + · · · + Fn = ma.
Por lo tanto, por la definición de igualdad y suma entre vectores tenemos que
X
Fx = F1x + · · · + Fnx = max
X
Fy = F1y + · · · + Fny = may .
Problema 4.9.4. Considere un peso de w Newtons suspendido por dos alambres como se
muestra en el diagrama, donde T1 y T2 son vectores de fuerza dirigidos a lo largo de los
alambres. Obtenga los vectores T1 y T2 y demuestre que sus magnitudes son
w cos α w cos β
kT1 k = y kT1 k =
sen(α + β) sen(α + β)
151
α β
T2 T1
α β
Figura 4.23: Una masa de peso w es suspendida por dos cables con tensiones T1 y T2
Solución. Según la gráfica de la figura 4.23 las direcciones de los vectores de fuerza T1 , T2
y w son respectivamente, β, π − α y 3π/2. En consecuencia tenemos que
Ahora dado que la masa de peso w = kwk se encuentra en reposo se debe tener que
X
Fx = T1x + T2x + wx = 0
X
Fy = T1y + T2y + wy = 0.
Que equivale a
X
Fx = kT1 k cos β − kT2 k cos α + 0 = 0
X
Fy = kT1 k sen β + kT2 k sen α − w = 0.
152
cos β − cos α
Aquı́, la matriz de coeficientes es A = , con lo cual
sen β sen α
Por consiguiente,
D1 w cos α D2 w cos β
kT1 k = = , kT2 k = = .
D sen(α + β) D sen(α + β)
Teniendo las magnitudes y direcciones de los vectores de fuerza T1 y T2 podemos obtener
dichos vectores. Para el vector T1 tenemos
w cos α cos β
T1x = kT1 k cos β = .
sen(α + β)
w cos α sen β
T1y = kT1 k sen β = .
sen(α + β)
Por lo tanto,
w cos α cos β w cos α sen β
T1 = i+ j.
sen(α + β) sen(α + β)
Y para el vector T2 tenemos que
−w cos β cos α
T2x = kT2 k cos(π − α) = .
sen(α + β)
w cos β sen α
T2y = kT2 k sen(π − α) = .
sen(α + β)
En consecuencia,
−w cos β cos α w cos β sen α
T2 = i+ j.
sen(α + β) sen(α + β)
153
4.10. Vectores en el espacio
Se define el espacio Euclideo de tres dimensiones como el conjunto de todas la triplas
ordenadas de números reales (x, y, z), esto es,
R3 = {(x, y, z) : x, y, z ∈ R} .
O
P b
Q y
Figura 4.24: Magnitud o norma de un vector en el espacio
La diagonal de esta caja, el segmento que va del origen a el punto A, es la magnitud del
vector A, que vendrı́a a ser la hipotenusa del triángulo rectángulo △OQA. Por el Teorema
de Pitágoras tenemos que
kAk2 = |OA|2
= |OQ|2 + |QA|2
= |OQ|2 + A2z .
Como el punto Q tiene coordenadas (Ax , Ay , 0), de nuevo por el Teorema de Pitágoras, esta
vez aplicado en el triángulo △OP Q obtenemos que
154
Por lo tanto, tenemos que la magnitud del vector A está dada por
q
kAk = A2x + A2y + A2z .
En el caso de R3 no se puede definir la dirección del vector A como el ángulo θ que forma
el vector con el eje x ya que, por ejemplo, si 0 < θ < π/2, existe un número infinito de
vectores con la misma magnitud que forman el mismo ángulo θ con el eje x, el conjunto de
dichos vectores forman el cono mostrado en la figura 4.25.
θ O
b
θ
y
x
Figura 4.25: Todos los vectores sobre el cono forman un ángulo θ con el eje x
155
De manera similar, utilizando los triángulos rectángulos △OAQ y △OAR encontramos que
y z
cos β = , cos γ = .
kAk kAk
Por definición, cada uno de estos ángulos está en el intervalo [0, π]. Los cosenos de estos
ángulos son llamados cosenos directores. Podemos entonces expresar cualquier vector de
R3 en términos de estos cosenos directores
b
R
γ
O A
β
α
P b
x
b
Q
y
Figura 4.26: El vector A forma un ángulo α con lado positivo del eje x, β con el lado positivo
del eje y y γ con el eje positvo del eje z
156
director para el caso de la recta, pues en cierto sentido da la dirección al plano. Supóngase
que queremos determinar la ecuación un plano π sabiendo que conocemos tres de sus puntos
P , Q y R.
π
P
Q
Figura 4.27: El vector normal al plano π es obtenido como el producto cruz entre los vectores
−→ −→
geométricos P Q y P R
(a1 , b1 , c1 ) · (a, b, c) = 0
(a1 , b1 , c1 ) · (a, b, c) = 0,
o bien
a1 a + b1 b + c1 c = 0
(4.36)
a2 a + b2 b + c2 c = 0
En el sistema (4.36) tomamos como variables las componentes del vector normal a, b y c.
Entonces por la regla de Krammer obtenemos para a y b
−c1 c b1 a1 −c1 c
−c2 c b2 c(b1 c2 − b2 c1 ) a2 −c2 c c(a2 c1 − a1 c2 )
a= = ,b = = ·
a1 b1 a1 b2 − a2 b1 a1 b1 a1 b2 − a2 b1
a2 b2 a2 b2
157
De esta forma vemos que
c(b1 c2 − b2 c1 ) c(a2 c1 − a1 c2 )
n = (a, b, c) = , ,c
a1 b2 − a2 b1 a1 b2 − a2 b1
c
= (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ).
a1 b2 − a2 b1
Ahora bien, como puede comprobarse las ecuaciones que conforman (4.36) se verifican si-
multáneamente si tomamos c = a1 b2 − a2 b1 . Por lo tanto, una solución del sistema (4.36)
está dada por
a = b1 c2 − b2 c1 , b = a2 c1 − a1 c2 y c = a1 b2 − a2 b1 .
n := (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ),
es perpendicular a ambos, dicho vector se conoce como producto cruz o producto vec-
torial de los vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ).
A × B = (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ). (4.37)
Si definimos la matriz
a11 a12 a13
A = a1 b1 c1
a b2 c2
2
Vemos que las componentes del producto vectorial son precisamente los cofactores de la
matriz A en el desarrollo anterior, por lo tanto podemos expresar el producto vectorial como
sigue
158
donde i, j y k son los vectores coordenados unitarios de R3 . La última expresión para el
producto cruz en términos de estos vectores nos permite escribir
i j k
A × B = a1 b1 c1 (4.38)
a b c
2 2 2
h
θ A
Figura 4.28: El área del paralelogramo determinado por los vectores A y B es igual a la
magnitud del pruducto cruz entre estos vectores.
159
En la figura 4.28 el paralelogramo determinado por los vectores A y B tiene como base
la magnitud del vector A, dado que su altura es h, su área está dada por kAkh, pero
h = kBk sen θ.
Entonces el área del paralelogramo es kAkkBk sen θ, que es precisamente la magnitud del
producto cruz entre A y B. Concluimos que:
El área del paralelogramo determinado por los vectores A y B es igual a la magnitud del
producto cruz entre ellos.
Combinando (4.38) y (4.39) podemos hacer una interpretación geométrica del determi-
nante de tamaño 2 × 2 (ver sección 2.2). Supongamos que el paralelogramo de la figura 4.28
está dispuesto sobre el plano xy, y que los vectores A y B tienen componentes (a, c, 0) y
(b, d, 0) respectivamente. Entonces el producto cruz entre estos vectores es
i j k
A × B = a c 0 = i(0) − j(0) + k(ad − bc) = (0, 0, ad − bc).
b d 0
Con lo cual,
kA × Bk = |ad − bc|
Concluimos que el área del paralelogramo determinado por los vectores A y B es igual
al determinante de la matriz formada por estos, vistos como vectores columna.
P = P0 + tv, (4.40)
160
x = x(t) = x0 + tv1
y = y(t) = y0 + tv2 (Ecuaciones paramétricas de la recta)
z = z(t) = z0 + tv3
x − x0 y − y0 z − z0
= = (Ecuaciones simétricas de la recta)
v1 v2 v3
Las nociones de paralelismo y ortogonalidad entre rectas vienen dadas en términos de los
vectores directores.
l1 k l2 ⇔ v1 k v2 y l1 ⊥ l2 ⇔ v1 ⊥ v2 .
Solución. Mostraremos que las rectas dadas no son paralelas, encontrando su punto de
corte. Si las rectas se cortan en un punto de coordenadas (x, y, z) se debe cumplir que
3 + 2t = 1 − 2s
4 − 3t = 7 + 4s
5 + 4t = 1 − 3s
En consecuencia, las rectas no son paralelas. Para ver si son perpendiculares, nótese que para
la recta de parámetro t el vector director es v1 = (2, −3, 4), mientras que para la recta de
parámetro s, tenemos que v2 = (−2, 4, −3) es el vector director. Dado que
los vectores directores no son perpendiculares, por lo tanto, las rectas no son perpendiculares.
161
Ecuación cartesiana del plano
Sea P0 = (x0 , y0, z0 ) un punto dado del plano π (ver la figura 4.29).
P0
−→
π n P0 P
x
y
Con lo cual vemos que, la ecuación de un plano π que pasa por un punto P0 = (x0 , y0 , z0 ) y
cuyo vector normal es n = (a, b, c) está dada por
Lamamos a (4.41) ecuación cartesiana del plano, muchas veces esta ecuación viene dada
en la forma
ax + by + cz + d = 0,
donde d = −(ax0 + by0 + cz0 ). Definimos entonces el plano π como el subconjunto de puntos
de R3 dado por
π = (x, y, z) ∈ R3 : ax + by + cz + d = 0
162
Como se menciono en el sección 4.11, el vector normal n es el que le da la dirección al plano
π, por lo que las nociones de orgonalidad y paralelismo de planos vienen dadas en términos
de sus vectores normales.
Definición 4.12.2. Sean π1 y π2 planos, con respectivos vectores normales n1 y n2 , entonces
π1 k π2 ⇔ n1 k n2 y π1 ⊥ π2 ⇔ n1 ⊥ n2 .
x = a1 s + b1 , y = a2 s + b2 , z = a3 s + b3 , s ∈ R,
x = c1 t + d1 , y = c2 t + d2 , z = c3 t + d3 , t ∈ R,
z
n = v1 × v2
v1 v2
P
P0 Q0
L1 L2
x y
L1 = {α(s) : s ∈ R} y L2 = {β(t) : t ∈ R} ,
Vemos que en el enunciado del problema nos dan la forma paramétrica de las rectas, a partir
de esta forma, para la recta L1 , obtenemos la forma vectorial como sigue:
163
Es decir, la recta L1 pasa por el punto P0 = (b1 , b2 , b3 ) y tiene vector director v1 = (a1 , a2 , a3 ).
De manera similar, la recta L2 pasa por el punto Q0 = (d1 , d2 , d3) y tiene vector director
v2 = (c1 , c2 , c3 ). Como las rectas se cortan, sus vectores directores determinan un plano,
cuyo vector normal está dado por n = v1 × v2 (ver la figura 4.30). Además, éste plano pasa
−→
por los puntos P0 y Q0 , por lo que, el vector geométrico Q0 P0 está sobre éste, de tal forma
que
−→
Q0 P0 ·n = 0
Ahora, expresando los vectores en términos de las componentes y realizando el producto cruz
entre los vectores v1 , v2 por la primera fila obtenemos
−→
Q0 P0 ·n = 0 ⇔ (P0 − Q0 ) · v1 × v2 = 0
⇔ (b1 − d1 , b2 − d2 , b3 − d3 ) · (A11 , A12 , A13 ) = 0
⇔ (b1 − d1 )A11 + (b2 − d2 )A12 + (b3 − d3 )A13 = 0
Nótese que el escalar (b1 − d1 )A11 + (b2 − d2 )A12 + (b3 − d3 )A13 representa la expansión por
cofactores a través de la primera fila de la matriz
b1 − d1 b2 − d2 b3 − d3
a1 a2 a3 .
c1 c2 c3
−→
Por lo tanto, si Q0 P0 ·n = 0, entonces
b1 − d1 b2 − d2 b3 − d3
a1
a2 a3 = 0.
c c2 c3
1
164
Por lo tanto,
a1 c1 b1 − d1
a2 c2 b2 − d2 = 0.
a c b − d
3 3 3 3
z
−→
n = v1 × P0 Q0
v2
−→
P0 Q0 Q0
L2
P0
v1
L1
x y
165
−→
El producto punto es conmutativo y el producto cruz anticonmutativo, además, P0 Q0 =
−→
− Q0 P0 , entonces
−→ −→ −→ −→
v2 × v1 · P0 Q0 =P0 Q0 ·v2 × v1 = − Q0 P0 · (−v1 × v2 ) =Q0 P0 ·v1 × v2 .
De esta forma, si suponemos que las rectas L1 y L2 son paralelas, tenemos que
−→ −→ −→
0 = v2 · n = v2 · v1 × P0 Q0 = v2 × v1 · P0 Q0 =Q0 P0 ·v1 × v2
a1 c1 b1 − d1
= a2 c2 b2 − d2
a c b − d
3 3 3 3
Entonces
a1 c1 b1 − d1
−→
0 = a2 c2 b2 − d2 =Q0 P0 ·v1 × v2 .
a c b − d
3 3 3 3
n = v1 × v2 ,
estos vectores tienen como punto inicial un punto P (ver la figura 4.30), y como
−→
Q0 P0 ·v1 × v2 = 0,
−→
el vector geométrico Q0 P0 está sobre π, de tal forma que dicho plano pasa por los puntos P0
y Q0 , en consecuencia, los vectores geométricos
−→ −→
P0 P y Q0 P ,
166
−→
resulta entonces que P0 P ⊥ v1 × v2 , pero por las propiedades del producto cruz, v1 , v2 ⊥
−→ −→
v1 × v2 , de modo que P0 P k v1 , ya que, los tres vectores: v1 , v2 y P0 P , están sobre el mismo
plano. Pero, esto último implica que existe s1 ∈ R tal que
−→
P0 P = s1 v1 ,
−→
esto es, P = P0 + s1 v1 , lo cual significa que P ∈ L1 . De manera similar, dado que Q0 P k v2
t1 ∈ R tal que
−→
Q0 P = t1 v2 ,
significando esto que P = Q0 + t1 v2 , es decir P ∈ L2 . Se concluye que las rectas L1 , L2 se
cortan en el punto P .
b
B A
P0 sA
tB
π
P
x y
Figura 4.32: Plano que pasa por P0 , generado por los vectores A y B
167
o bien,
P = P0 + sA + tB (4.42)
La ecuación (4.42) llamada (ecuación vectorial, o paramétrica del plano) nos dice que
al variar los parámetros s y t sobre todos los números reales, generamos cualquier punto P
del plano π. De esta forma vemos que
P = π(s, t) = P0 + sA + tB, s, t ∈ R.
Ejemplo 4.17. Encuentre la intersección entre el plano π1 que pasa por (1, 1, 1) y es gene-
rado por los vectores (2, −1, 3) y (−1, 0, 2), y el plano π2 que pasa por (2, 3, 1) y es generado
por los vectores (1, 2, 3) y (3, 2, 1).
π1 (s, t) = (1, 1, 1) + s(2, −1, 3) + t(−1, 0, 2), π2 (p, q) = (2, 3, 1) + p(1, 2, 3) + q(3, 2, 1).
x = 1 + 2s − t, y = 1 − s, z = 1 + 3s + 2t.
Estas ecuaciones son llamadas ecuaciones paramétricas del plano. Ahora, para hallar la
ecuación cartesiana de este, una de las formas de proceder es eliminar los parámetros s y t
de las ecuaciones paramétricas. Al despejar el parámetro s en la ecuación para y obtenemos
s = 1 − y. Reemplazando este valor en la ecuación para x
x = 1 + 2(1 − y) − t.
2x + 7y + z = 10.
168
y (3, 2, 1) su vector normal es obtenido como el producto cruz entre estos (ver el Problema
4.12.1), es decir,
i j k
n2 = (1, 2, 3) × (3, 2, 1) = 1 2 3 = i(−4) − j(−8) + k(−4) = (−4, 8, −4) = 4(−1, 2, −1).
3 2 1
Como además, π2 pasa por (2, 3, 1), podemos utilizar la fórmula (4.41) para obtener
x − 2y + z = −3.
4.14. Problemas
Vectores en el plano
Problema 4.14.1. De las siguientes afirmaciones, demuestre las que son verdaderas y de
un contraejemplo para las que son falsas
169
(c) Sean A, B vectores de Rn . Entonces
1 1
A · B = kA + Bk − kA − Bk
4 4
(f) Si A = (2, k) y B = (3, 5) existe valores de k tales que el ángulo entre A y B es π/4.
Demostrar k · k define una norma. Es decir, satisface las propiedades de (a) hasta (f) del
Teorema 3.1.2.
Problema 4.14.3. Sean A = (1, 2) y B = (3, 4). Dado (x, y) en R2 , encuentre escalares α
y β, que dependan de x, y tales que
(x, y) = αA + βB
(x, y)
b
O
x
Figura 4.33: En la figura: A = (4, 1) y B = (2, 4). Si se quiere expresar (x, y) = (3, 5/2)
como combinación lineal de A y B, escogemos α = 1/2 y β = 1/2 y de esta forma vemos
que (x, y) = (1/2)A + (1/2)B.
y = y(t)
101,25
50
x
O 9 9
2
(a) Utilizar la gráfica que se muestra el la figura 4.34 para hallar el domino de la función
que representa la altura de la partı́cula como función del tiempo, ¿qué representa este
dominio?
(b) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.
Problema 4.14.5. La altura de una partı́cula en función del tiempo viene dada por la
parábola
171
y = y(t)
500
250
x
O 10 20
(a) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.
(d) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.
Problema 4.14.7. La posición de una partı́cula en el momento t está dada por elipse
x2 y 2
+ = 1.
9 4
172
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por
x2 + y 2 + 6x − 2y = −9
Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.
(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.
Problema 4.14.8. La posición de una partı́cula en el momento t está dada por elipse
x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por
x2 + y 2 − 6x − 2y = −9.
Esta segunda partı́cula empieza su movimiento en el punto (4, 1) y sigue la dirección contraria
de las manecillas del reloj completando una revolución.
(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.
173
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión
Problema 4.14.10 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m
y la parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta
completa cada 20s, determine el vector posición de una persona que va sentada en la rueda.
Suponga que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta
moviendo la persona?
Problema 4.14.11. Suponga que ajusta la boquilla de una manguera para que el agua salga
más rápido. La boquilla de la manguera se encuentra a 1,8m del suelo, y mientras el agua
sale rápidamente de esta, 2,5s se escucha cuando golpea el suelo. Cuál es la velocidad del
agua, cuando esta deja la boquilla?
Problema 4.14.12. Una osada nadadora se lanza desde un risco con un impulso horizontal.
Si el risco tiene una altura H0 y en la parte inferior hay una saliente de roca, cuya extensión
horizontal es de x0 , cual debe ser la velocidad inicial para que la nadadora no choque con la
roca y caiga directamente sobre el agua?
Problema 4.14.13. Una rueda de la fortuna de 14,0m de radio gira sobre un eje horizontal
en el centro. La rapidez lineal de un pasajero en el borde es constante igual a 7,00m/s. ¿Qué
magnitud y dirección tiene la aceleración del pasajero al pasar
Problema 4.14.14. Una rueda de la fortuna de 14,0m de radio que gira en sentido antiho-
rario, se acaba de poner en movimiento. En un instante dado, un pasajero en el borde de la
rueda que está pasando por el punto más bajo de su movimiento circular tiene una rapidez
de 3,00m/s, la cual está aumentando a razón de 0,500m/s2 .
(b) Dibuje la rueda de la fortuna y el pasajero mostrando sus vectores de velocidad y ace-
leración.
174
(a) Qué ángulo φ da el alcance máximo sobre la rampa?
(b) Un arquero parado en un terreno con inclinación ascendente constante de 30◦ apunta
hacia un blanco situado 60,0m más arriba del plano. La flecha en el arco y el centro del
blanco están ambos a 1,50m sobre el suelo. Justo al salir del arco, la rapidez inicial de
la flecha es de 32,0m/s. ¿Con qué ángulo sobre la horizontal debe apuntar el arquero
para dar en el blanco? Si hay dos ángulos, calcule el menor. Tal vez necesite resolver
la ecuación del ángulo por iteración, es decir, ensayo y error. Compare el ángulo con
el que se necesita cuando el suelo está horizontal.
Problema 4.14.16. Un cohete diseñado para colocar cargas pequeñas en órbita se lleva hasta
una altitud de 12,0km sobre el nivel del mar, montado en un avión comercial convertido.
Cuando el avión está volando en lı́nea recta, con rapidez constante de 850km/h, deja caer
el cohete. Después, el avión mantiene la misma altitud y rapidez, y sigue volando en lı́nea
recta. El cohete cae durante un lapso corto, después del cual se enciende el motor. A partir
de ese momento, los efectos combinados del empuje y la gravedad imparten al cohete una
aceleración constante de magnitud 3,00g dirigida con un ángulo de 30◦ arriba de la horizontal.
Por motivos de seguridad, el cohete deberá estar por lo menos a 1,00km adelante del avión
cuando vuelva a alcanzar la altitud de éste. Hay que determinar el tiempo mı́nimo que el
cohete debe caer antes de que su motor se encienda. Se puede ignorar la resistencia del aire.
La respuesta debe incluir i) un diagrama que muestre las trayectorias de vuelo del cohete y del
avión, rotuladas en varios puntos con vectores que representen su velocidad y su aceleración;
ii) una gráfica x − t que muestre los movimientos del cohete y del avión; y iii) una gráfica
y − t que muestre los movimientos del cohete y del avión. En el diagrama y las gráficas,
indique los momentos cuando el cohete se deja caer, el motor del cohete se enciende y el
cohete en ascenso alcanza la altura del avión.
Problema 4.14.17. Dos estudiantes pasean en canoa por un rı́o. Yendo rı́o arriba, dejan
caer accidentalmente una botella vacı́a al agua, después de lo cual reman durante 60 minutos
hasta llegar a un punto a 2,0km rı́o arriba. En ese momento, se dan cuenta de que la botella
no está y, preocupados por la ecologı́a, se dan vuelta y reman rı́o abajo. Alcanzan la botella
(que se ha estado moviendo con la corriente) 5,0km rı́o abajo del punto donde se dieron la
vuelta, y la recogen. a) Suponiendo un esfuerzo de paleo constante todo el tiempo, ¿con qué
rapidez fluye el rı́o? b) ¿Qué rapidez tendrı́a la canoa en un lago tranquilo con el mismo
esfuerzo de paleo?
175
√ √
su movimiento en el punto (1/ 2, 1/ 2) y terminando en el punto (1, 0). Calcular el trabajo
que realiza el campo de fuerza
Problema 4.14.21. Sean A y B dos vectores de R2 . Utilizar el teorema del coseno (ver
ejemplo 2.2) para demostrar que
donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Hacer las gráfica correspondiente.
Problema 4.14.23 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.
(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.
176
(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.
Problema 4.14.24 (Velocidad de un bote). El navegador del problema 4.14.23 quiere llegar
a un punto en la orilla norte del rı́o directamente opuesto la punto de partida. ¿En qué
dirección debe dirigir el bote?
(a) El techo se sostendrá con alambre de acero, indique la cantidad de alambre que se
necesita para sostener el techo.
(b) El techo utilizará una lona de color blanco, indique la cantidad de metros cuadrados
empleados en el techo.
(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.
177
(b) u × v = (u · v × i)i + (u · v × j)j + (u · v × k)k.
u · w v · w
(c) (u × v) · (w × r) = .
u·r v ·r
Problema 4.14.28. Utilice el producto cruz para demostrar que
sen(A − B) = sen A cos B − sen B cos A.
es una ecuación del plano que pasa por los tres puntos no colineales
P1 (x1 , y1, z1 ), P2 (x2 , y2, z2 ) y P3 (x3 , y3 , z3 ).
178
4.15. Taller 2 corte 2 parte 1
Problema 4.15.1 (Velocidad de un avión respecto a la tierra). Encuentre la rapidez y
dirección verdaderas del avión del problema 3.3.1 si el piloto dirige el avión en la dirección
N 30◦ O.
Problema 4.15.2 (Velocidad de un avión respecto a la tierra). ¿En qué dirección debe
dirigir el avión el piloto del problema 3.3.1 para que el curso verdadero sea al norte?
Problema 4.15.3. De las siguientes afirmaciones, demuestre las que son verdaderas y de
un contraejemplo para las que son falsas
(f) Si A = (2, k) y B = (3, 5) existe valores de k tales que el ángulo entre A y B es π/4.
Demostrar k · k define una norma. Es decir, satisface las propiedades de (a) hasta (f) del
Teorema 3.1.2.
Problema 4.15.5. En la figura 4.35 considere un peso suspendido por dos alambres. Obtenga
la magnitud y componentes de los vectores F1 y F2 , y los ángulos α y β. Ver el problema
4.9.4.
179
5m
α β
F1 F2
3m
4m
100N
Figura 4.35: Una masa de peso 100N es suspendida por dos alambres representados por los
vectores F1 y F2
(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c
(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2
(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2
(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?
Ver el problema 3.5.1 para solución del caso 1 del inciso (b), y el caso 1 del inciso (c).
180
Problema 4.15.8 (***). Dos nadadores, Alan y Camillé, parten desde el mismo punto en la
orilla de una corriente ancha que circula con una rapidez v. Ambos se mueven con la misma
rapidez c (donde c > v) en relación con el agua. Alan nada corriente abajo una distancia L
y luego corriente arriba la misma distancia. Camillé nada de modo que su movimiento en
relación con la Tierra es perpendicular a las orillas de la corriente. Ella nada la distancia
L y luego de vuelta la misma distancia, de modo que ambos nadadores regresan al punto de
partida. ¿Cuál nadador regresa primero? Sugerencia: Demuestre que si c > v > 0, entonces
√
0 < 1 − v 2 /c2 < 1. Gráfique en un mismo plano cartesiano las funciones y = 1/ x y
y = 1/x para saber que relación de orden guardan en el intervalo (0, 1). Utilice este hecho
para establecer que nadador regresa primero al punto de partida.
Problema 4.15.9 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.
(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.
(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.
Problema 4.15.10. La posición de una partı́cula en el momento t está dada por elipse
x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por
x2 + y 2 + 6x − 2y = −9
Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.
(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.
181
4.16. Taller 2 corte 2 parte 2
Problema 4.16.1. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).
(c) Muestre que la rapidez del punto P en el instante t está dada por
V0 t
kv(t)k = kα′ (t)k = 2V0 sen .
2R
(e) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.
Problema 4.16.2. La posición de una partı́cula en el momento t está dada por elipse
x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por
x2 + y 2 + 6x − 2y = −9
Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.
(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.
182
(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión
x2 + y 2 − 4x = 0,
en dirección contraria a las de las manecillas del reloj con una rapidez constante de 4m/s
empezando su movimiento en el punto (4, 0).
Problema 4.16.6. Una avión tiene una rapidez en el aire de 250mi/h, el piloto desea volar
hacia el norte. Suponiendo que prevalezca un viento de 60mi/h hacia el este,
Problema 4.16.7. Una pelota de golf es golpeada con una rapidez inicial v0 formando un
ángulo α con respecto a la horizontal desde un punto que está al pie de una colina que forma
un ángulo de inclinación φ con la horizontal donde
183
Demuestre que la pelota toca tierra a una distancia
2v02 cos α
sen(α − φ),
g cos2 φ
medida sobre la colina. Demuestre que el mayor alcance que se puede lograr para un v0 dado
ocurre cuando α = (φ/2) + (π/4); es decir, cuando el vector velocidad inicial biseca el ángulo
entre la vertical y la colina.
(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.
Problema 4.16.11. Utilice el Teorema 5.5.1 para demostrar que los tres puntos, (1, 2, 1),
(0, 1, 0) y (1, 1, 4) determinan un plano. Hallar la ecuación vectorial y cartesiana de dicho
plano.
184
Problema 4.16.13. Demuestre que
x1 − x y1 − y z1 − z
x2 − x y2 − y z2 − z = 0
x − x y − y z − z
3 3 3
es una ecuación del plano que pasa por los tres puntos no colineales
185
4.17. Método de los mı́nimos cuadrados
4.17.1. Punto de vista del cálculo
Supongamos que tenemos un conjunto de n puntos distribuidos en plano xy, generando
lo que se conoce como nube de puntos, o gráfico de dispersión (ver la figura 4.36). El objetivo
es encontrar la ecuación de la recta que mejor ajuste el conjunto de datos, la cual se conoce
como recta de mı́nimos cuadrados o recta de regresión, correspondiente a los datos
(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ), con este fin en mente consideramos cada una de las diferencias,
entre el valor real, y = yi y el valor estimado correspondiente al dato xi , y = y est = axi +b:
S(a, b) = e21 + e22 + · · · + e2n = (y1 − (ax1 + b))2 + (y2 − (ax2 + b))2 + · · · + (yn − (axn + b))2
sea mı́nima.
y
(x3 , y3 ) y = ax + b
b
(x1 , y1 )
b b
b
(x2 , ax2 + b)
b
(x1 , ax1 + b)
x
O
Figura 4.36: Gráfico de dispersión para una nube de n puntos. En rojo, la recta que mejor
ajusta esta nube puntos
El problema se reduce entonces a encontrar el mı́nimo local de la función S(a, b). Utili-
186
zando la notación sigma tenemos que
n
X
S(a, b) = (axi + b − yi )2 .
i=1
Igualando a cero
n
X n
X
2a x2i + 2bn − 2 yi = 0. (4.45)
i=1 i=1
187
Ahora reemplazando la expresión del medio en (4.46) en (4.44)
n
X n
X n
X
2a x2i + 2b xi − 2 xi yi = 0 ⇔
i=1
n n n
!i=1n i=1
n
X 1X aX X X
a x2i+ yi − xi xi − xi yi = 0 ⇔
i=1
n i=1 n i=1 i=1 i=1
n n
!2 n n n
X
2 a X X 1X X
a xi − xi = xi yi − xi yi ⇔
n n
i=1 i=1
!2
i=1 i=1 i=1
n n n n n
X
2 1 X X 1X X
a xi − xi = xi yi − xi yi
i=1
n i=1 i=1
n i=1 i=1
188
Nótese, que la parte derecha en la identidad anterior es la varianza muestral, Sx2 , por lo tanto,
si denotamos la parte izquierda por Sxx obtenemos (4.48).
Por lo demostrado en el problema 4.17.1 tenemos la ecuación
a(n − 1)Sx2 = (n − 1)Sxy ,
de donde
Sxy
a= .
Sx2
Luego,
Sxy
a= , b = y − ax
Sx2
es un punto critico para la función S. Demostraremos que este punto critico es un mı́nimo
local. En efecto, la matriz Hessiana para la función S, está dada por
Saa Sab
HS(a, b) =
Sba Sbb ,
donde
n n
∂2S X
2 ∂2S X ∂2S
Saa = =2 xi , Sba = Sab = =2 xi , Sbb = 2 = 2n.
∂a2 i=1
∂a∂b i=1
∂b
en (a, b) hay un mı́nimo local, como se querı́a demostrar. Hemos establecido que
189
Teorema 4.17.2. La recta que mejor ajusta el conjunto de datos (x1 , y1 ), . . . , (xn , yn ) en el
sentido de los mı́nimos cuadrados, está dada por y est(x) = ax + b donde
Sxy
a= y b = y − ax,
Sx2
donde la cantidad Sxy denominada covarianza muestral de las variables
X = (a1 , a2 , . . . , an ), Y = (b1 , b2 , . . . , bn ),
vectores de Rn . Entonces
|X · Y | ≤ kXkkY k. (4.49)
La igualdad en (4.49) se tiene si, y sólo si, existe x ∈ R tal que ai x + bi = 0 para todo
i = 1, 2, . . . , n.
Demostración. Nótese que por definición de producto punto entre vectores, y de magnitud
de un vector, la desigualdad (4.49) es la misma que
v v
Xn u Xn u n
u uX
2t
ai bi ≤ ai b2i (4.50)
t
i=1 i=1 i=1
190
Para todo x ∈ R tenemos que
n
X
(ai x + bi )2 ≥ 0,
i=1
donde
n
X n
X n
X
A= a2i , B = ai bi y C = b2i
i=1 i=1 i=1
B 2 ≤ AC.
B 2 = AC ⇔ B 2 /A = C
2B 2 B 2
⇔ − =C
A A
2B 2 B 2
⇔− + +C =0
A A
2
−B −B
⇔A +2 B + C = 0.
A A
De lo cual se concluye que Ax2 + 2xB + C = 0 con x = −B/A, o lo que es lo mismo
n
X
(ai x + bi )2 = 0,
i=1
191
Ahora en la desigualdad de Cauchy–Schwarz, expresada en la forma (4.50) tomemos
ai = xi − x y bi = yi − y, donde x y y son la medias aritméticas de las variables
La cual, equivale a
√ √
|(n − 1)Sxy | ≤ n − 1Sx n − 1Sy .
Es decir,
Sxy
|r| = ≤ 1.
Sx Sy
Lo cual implica que −1 ≤ r ≤ 1, como se querı́a demostrar. En el mejor de los casos, todos
los puntos (x1 , y1 ), . . . , (xn , yn ), están sobre la recta de regresión, con lo cual tendrı́amos que
Sxy Sxy
yi = xi + y − x ∀1≤i≤n (4.53)
Sx2 Sx2
Ahora bien, según la demostración de la desigualdad de Cauchy–Schwarz, La igualdad en
(4.49) se tiene si, y sólo si, ai x + bi = 0 para todo i = 1, 2, . . . , n, donde
P
B ai bi
x=− =− P 2 .
A ai
192
Concluimos que si r tiende a 1, hay una fuerte relación entre las variables X, Y , y al ser
r > 0, a > 0, lo cual implica que, la variable Y es directamente proporcional a la variable
X. Alternativamente, si r tiende a −1, también hay una fuerte relación entre las variables
X, Y , pero en este caso la variable Y es inversamente proporcional a la variable X, por que
al ser r < 0, la pendiente a es negativa.
Ejemplo 4.18. Una pintura abstracta fue vendida por el autor en 1915 por 100 dólares.
Debido a su importancia histórica, su valor ha venido aumentando al correr los años. Su
valor era 4600 dólares en 1935, de 11000 en 1955, y de 20000 en 1975. Suponiendo que el
valor del cuadro siga subiendo al mismo ritmo, use el método de mı́nimos cuadrados para
estimar su valor en 1995.
4
X
yi = 100 + 4600 + 11000 + 20000 = 35 700
i=1
X4
yi2 = 1002 + 46002 + 110002 + 200002 = 542 170 000
i=1
4
X
xi yi = 1915 × 100 + 1935 × 4600 + 1955 × 11000 + 1975 × 20000 = 70 097 500
i=1
s s
77802 35 7002
15 134 100 − 4
542 170 000 − 4
Sx = = 25. 820, Sy = = 8632. 3
3 3
7780×35 700
70 097 500 −
Sxy = 4
= 2. 203 3 × 105
3
193
Ahora podemos calcular el coeficiente de correlación
Vemos que r es aproximadamente 1, lo cual indica por un lado, que existe una fuerte relación
entre las variables X, Y , y por el otro, que esta relación es positiva, es decir, la variable Y
es directamente proporcional a la variable X, esto es, el precio del cuadro aumenta progre-
sivamente con los años.
194
Capı́tulo 5
Espacios vectoriales
Axiomas de cerradura
Axioma 5.1.1 (Cerradura respecto a la suma). Para cada par elementos x, y ∈ V corres-
ponde un único elemento de V llamado suma de x, y, denotado por x + y.
Axioma 5.1.2 (Cerradura respecto al producto por escalar). Para cada x ∈ V y cada λ ∈ F
corresponde un único elemento de V llamado producto por escalar entre λ y x, denotado
por λx.
Axiomas para la suma
Axioma 5.1.3 (Ley conmutativa). Para todo x, y ∈ V , tenemos que
x + y = y + x.
(x + y) + z = x + (y + z).
Axioma 5.1.5 (Existencia de elemento neutro). Para cada x ∈ V existe 0 ∈ V , tal que
x + 0 = x.
Axioma 5.1.6 (Existencia de inverso aditivo). Para cada x ∈ V existe y ∈ V denotado por
(−1)x tal que
x + (−1)x = 0.
195
Axiomas para el producto por escalar
α(βx) = (αβ)x.
Axioma 5.1.8 (Ley distributiva de la suma con respecto al producto por escalar). Para
x, y ∈ V y α ∈ F , tenemos que
α(x + y) = αx + αy.
Axioma 5.1.9 (Ley distributiva de la suma de escalares con respecto al producto por
escalar). Para x ∈ V y α, β ∈ F , tenemos que
(α + β)x = αx + βx.
1x = x.
(c) Sea V el conjunto de todos los vectores en Rn que son ortogonales a un vector no nulo
dado n.
(d) Sea V el conjunto de todas las funciones definidas en un intervalo dado I, con la suma
y producto por escalar usual de funciones, esto es,
196
(e) El conjunto de todas la matrices de tamaño m × n con entradas en los reales, esto es,
V = Mm×n (R).
Ejemplo 5.2. Demuestre que el conjunto de los números reales positivos forma un espacio
vectorial bajo las operaciones x + y = xy, λx = xλ .
Solución. Lo primero que debemos hacer es verificar los axiomas de cerradura. Sean x, y ∈
R+ y λ ∈ R. Entonces xy > 0, con lo cual x + y = xy ∈ R+ . Además, λx = xλ ∈ R+ , ya que
x ∈ R+ . La suma ası́ definida es conmutativa y asociativa. En efecto
para todo x, y, z ∈ R+ .
Sea x ∈ R+ , entonces se cumple la ley modulativa de la suma, esto es, existe 1 ∈ R+ tal
que
x + 1 = x(1) = x.
x + y = 1 ⇔ xy = 1 ⇔ y = 1/x.
Si x, yR+
Finalmente,
1x = x1 = x,
para cada x ∈ R+ .
De los axiomas que definen un espacio vectorial, se deducen las siguientes propiedades
197
Teorema 5.1.11. Sea V un espacio vectorial sobre el campo F . Entonces
5.2. Subespacios
Definición 5.2.1 (Subespacio). Sea H un subconjunto no vacı́o de un espacio vectorial V
que es en si mismo un espacio vectorial con las operaciones de suma y producto por escalar
definidas en V es llamado subespacio de V .
(a) Si x, y ∈ H, entonces x + y ∈ H.
(b) Si λ ∈ F, x ∈ H, entonces λx ∈ H.
Nota 5.2.1. El teorema 5.2.1 se puede enunciar de forma equivalente como sigue: Un sub-
conjunto no vacı́o H de un espacio vectorial V es un subespacio de V si y sólo si
αx + βy ∈ H,
Ejemplo 5.3. Para cualquier espacio vectorial V , el subconjunto H = {0} que consta úni-
camente del cero es un subesapcio de V . Ası́ mismo, V es subepacio de si mismo. Los subes-
pacios {0} , V son llamados subespacios triviales. Los subespacios distintos de {0} y V
son llamados subespacios propios.
Ejemplo 5.4 (Subespacio propio de R2 ). Toda recta que pasa por el origen es un subespacio
propio de R2 .
Ejemplo 5.5 (Subespacios propios de R3 ). Toda recta que pasa por el origen es un subespacio
propio de R3 . Ası́ mismo, todo plano que pasa por el origen es un subespacio propio de R3 .
198
5.3. Combinación lineal y espacio generado
Definición 5.3.1 (Combinación lineal). Sean v1 , . . . , vn vectores de un espacio vectorial V .
Entonces cualquier vector de la forma
v = α1 v1 + · · · + αn vn ,
gen H = {v : v = α1 v1 + · · · + αn vn , αi ∈ F, 1 ≤ i ≤ n} .
v = α1 v1 + · · · + αn vn , w = β1 v1 + · · · + βn vn .
Por lo tanto,
αv + βw = α(α1 v1 + · · · + αn vn ) + β(β1 v1 + · · · + βn vn )
= αα1 v1 + · · · + ααn vn + ββ1 v1 + · · · + ββn vn
= (αα1 + ββ1 )v1 + · · · + (ααn + ββn )vn .
gen H = V.
199
5.4. Independencia lineal
Definición 5.4.1 (Dependencia lineal e independencia lineal). Sean v1 , . . . , vn n vectores
de un espacio vectorial V . Entonces se dice que los vectores son linealmente indepen-
dientes si toda combinación lineal de ellos igualada a 0 implica que todos los vectores de la
combinación son cero. Esto es,
α1 v1 + · · · + αn vn = 0 implica que α1 = · · · = αn = 0.
Si los vectores no son linealmente independientes, se dice que son linealmente dependien-
tes. Esto es, existen n escalares no todos cero tales que
α1 v1 + · · · + αn vn = 0.
α1 1 + α2 eax + α3 ebx = 0,
α1 + α2 + α3 = 0.
α1 + α2 ea + α3 eb = 0, α1 + α2 e−a + α3 e−b = 0.
200
Que en forma matricial se expresa como
1 1 1 α1 0
1 ea eb α2 = 0 (5.1)
1 e−a e−b α3 0
o equivalentemente
α1 cos x + α2 sen x = 0 ∀ x ∈ R.
201
Observese que
(−1/2)ex + (−1/2)e−x + (1)(ex + e−x )/2 = 0 ∀ x ∈ R.
Con lo cual, las funciones son linealmente dependientes.
donde
a = A11 , b = A12 , c = A13 ,
Al menos uno de los escalares a, b, c es distinto de cero. Por ejemplo supongamos que c =
A13 6= 0. Debemos encontrar escalares s y t tales que
x = sa1 + ta2
y = sb1 + tb2
z = sc1 + tc2
202
Si consideramos sólo la primera y segunda ecuación, podemos encontrar estos escalares usan-
do la regla de Krammer:
x a2
y b2 b2 x − a2 y b2 x − a2 y
s= = = ,
a1 a2 a1 b2 − a2 b1 A13
b1 b2
a1 x
b1 y a1 y − b1 x
t= = .
a1 a2 A13
b1 b2
Entonces
b2 x − a2 y a1 y − b1 x
sv1 + tv2 = (a1 , b1 , c1 ) + (a2 , b2 , c2 )
A13 A13
a1 b2 x − a1 a2 y b1 b2 x − a2 b1 y b2 c1 x − a2 c1 y
= , ,
A13 A13 A13
a1 a2 y − a2 b1 x a1 b2 y − b1 b2 x a1 c2 y − b1 c2 x
+ , ,
A13 A13 A13
(a1 b2 − a2 b1 )x (a1 b2 − a2 b1 )y (b2 c1 − b1 c2 )x + (a1 c2 − a2 c1 )y
= , ,
A13 A13 A13
−ax − by
= x, y,
c
= (x, y, z).
203
Demostración. (⇒). Supongamos que v1 , v2 son linealmente dependientes. Entonces por el
Teorema 5.4.1 existe k ∈ R tal que v1 = kv2 . Pero entonces tenemos que
v1 x1 y1
det A = det = det = 0.
kv1 kx1 ky1
Teorema 5.4.3. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2 ) dos vectores de R2 . Entonces gen {v1 , v2 }
es una recta que pasa por el origen, si v1 , v2 son linealmente dependientes y es R2 , si v1 , v2
son linealmente independientes.
Corolario 5.4.4. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2) dos vectores de R2 y A la matriz formada
por estos vectores, entonces
(a) gen {v1 , v2 } es una recta que pasa por el origen si sólo si det A = 0.
204
5.5. Interpretación geométrica de la independencia li-
neal en R3
Sean u, v y w tres vectores de R3 . Se define el triple producto escalar de estos vectores
como
w·u×v
En la figura 5.1 se muestra que si estos vectores son linealmente independientes determinan
un paralelepı́pedo.
u×v
h v
a1 a2 a3
A = b1 b2 b3
c1 c2 c3
| det A| = |w · u × v|.
det A = w · u × v.
205
En efecto,
w · u × v = (c1 , c2 , c3 ) · (A11 , A12 , A13 )
= c1 A11 + c2 A12 + c3 A13 .
Entonces,
c1 c2 c3
α1 u + β1 v + γ1 w = 0.
Por ejemplo, si γ1 6= 0
w = αu + βv,
Los otros dos casos surgen al suponer que α1 6= 0, o bien β1 6= 0 (ver el problema 5.11.13).
det A = w · u × v = 0.
Esto significa que el vector w es ortogonal al vector u × v, pero sabemos que este último
vector es el vector normal al plano generado por u y v. Es decir, w ∈ gen {u, v}, lo que cual
implica que existen escalares α y β tales que
w = αu + βv.
206
Ahora bien, si α y β son ambos cero, resulta que w = 0, lo cual contradice la hipótesis. Se
debe tener entonces que algunos de los escalares α o β es distinto de cero. Por lo tanto la
expresión
w − αu − βv = 0,
h = k Proy wu×v k
|w · u × v|
=
ku × vk
Recordemos que ku × vk es igual al área del paralelogramos determinado por los vectores u
y v. Por lo que, si denotamos por V al volumen del paralelepı́pedo, encontramos que
V = ku × vkh
= |w · u × v|
= | det A|.
El espacio vectorial V es dimensión finita si tiene una base finita. De otro modo, V tiene
dimensión infinita.
207
Teorema 5.6.1. Sea V espacio vectorial de dimensión finita n. Tenemos
e1 = (1, 0, . . . , 0)
e2 = (0, 1, . . . , 0)
..
.
en = (0, 0, . . . , 1),
Teorema 5.6.3. Los únicos subespacios no triviales de R3 son las rectas y planos que pasan
por el origen.
Solución. Sea B1 = {v1 , . . . , vm } una base para H, y B2 = {w1 , . . . , wn } una base para
K. Demostraremos que B = {v1 , . . . , vm , w1 , . . . , wn } es una base para H + K. Primero que
todo nótese que como B1 ⊆ H y B2 ⊆ K, entonces B1 ∩ B2 ⊆ H ∩ K = {0}. Esto es,
B1 ∩ B2 ⊆ {0} (5.4)
208
entonces existe h ∈ H y k ∈ K tales que v = h + k. Además, existen escalares α1 , . . . , αm
y β1 , . . . , βn que cumplen que
h = α1 v1 + · · · + αm vm , k = β1 w1 + · · · + βn wn .
Con lo cual,
v = α1 v1 + · · · + αm vm + β1 w1 + · · · + βn wn ,
Lo cual quiere decir que v ∈ gen B. Demostramos que H + K ⊆ gen B. La otra contenencia
se obtiene de manera similar para concluir que gen B = H + K .
w1 = α1 v1 + · · · + αm vm ∈ H.
{v1 , . . . , vm , w1 } ,
pues si
α1 v1 + · · · + αm vm + αm+1 w1 = 0,
α1 v1 + · · · + αm vm = 0,
{v1 , . . . , vm , w1 , w2 } ,
es linealmente independiente, ya que w2 ∈ / gen B1 . Vemos de esta manera que podemos ex-
tender el conjunto B1 para formar el conjunto B de tal forma que este último sea linealmente
independiente, y ası́ demostrar que B es una base para H + K. Finalmente tenemos que
209
5.7. Espacio de los renglones y espacio de las columnas
de una matriz
Sea A ∈ Mm×n (R) y sea
ker A = {x ∈ Rn : Ax = 0}
1 −1
A = 1 1
1 0
1 −1 x−y
0
x
Ax = 1 1
= x + y = 0
y
1 0 x 0
Con lo cual, x − y = 0, x + y = 0 y x = 0. Vemos entonces que ker T = {(0, 0)}, por lo que
ν(A) = 0.
Si A ∈ Mn×n (R) es una matriz invertible el sistema homogéneo Ax = 0 tiene como única
solución la trivial, por lo que tenemos el siguiente resultado
Definición 5.7.1 (Imagen y rango de una matriz). Si A ∈ Mm×n (R). Entonces la imagen
de A denotada por Im(A) se define como
Im(A) = {y ∈ Rm /∃ x ∈ Rm : y = Ax} .
210
El Teorema 5.7.2 nos dice que el espacio de las columnas de una matriz coincide con la
imagen de la matriz. Sin embargo, el espacio de los renglones de A no coincide con el ker A.
Ejemplo 5.12 (En general FA 6= ker A). Consideremos la matriz
1 2 −1
A=
2 −1 3
Aplicando Gauss-Jordan simplificamos la matriz para obtener
1 0 1
B=
0 1 −1
como las matrices A y B son equivalentes ker A = ker B, donde
x
1 0 1 0
ker B = (x, y, z) : y = ,
0 1 −1 0
z
que es un plano que pasa por el origen, ya que los vectores (1, 2, −1) y (2, −1, 3) son lineal-
mente independientes. Vemos que dim(FA ) = 2 y que FA 6= ker A.
Ejemplo 5.13. Hallar la imagen y el rango de la matriz
1 2 −1
A=
2 −1 3
Solución. Por el Teorema 5.7.2
1 2 −1
Im(A) = CA = gen , ,
2 −1 3
Dado que
1 2
2 −1 = −1 − 4 6= 0,
211
tenemos que
1 2
gen , = R2
2 −1
Por lo tanto,
1 2 −1
Im(A) = CA = gen , , = R2 .
2 −1 3
Ası́ que, ρ(A) = 2.
El ejemplo precedente, junto con el ejemplo 5.12 nos muestra que dim(FA ) = 2 =
dim(Im(A)) = dim(CA ). Esto hecho no es una coincidencia.
Teorema 5.7.3. Si A ∈ Mm×n (R), entonces dim FA = dim CA = ρ(A).
El siguiente resultado nos dice que el proceso de hallar el núcleo y la imagen de una
matriz se reduce al hecho simplificarla mediante operaciones elementales.
Teorema 5.7.4. Sean A, B ∈ Mm×n (R), donde A es equivalente por renglones a B, entonces
FA = FB , CA = CB , ρ(A) = ρ(B) y ν(A) = ν(B).
Teorema 5.7.5. El rango de una matriz es igual al número de pivotes de su FER.
Ejemplo 5.14. La FER de la matriz
1 −1 3
A= 2 0 4
−1 3 1
es la matriz B dada por
1 −1 3
B = 0 1 −1 ,
0 0 0
dado que esta matriz presenta dos pivotes, por el Teorema 5.7.5, ρ(A) = 2.
Teorema 5.7.6 (Teorema de la dimensión para matrices). Sea A ∈ Mm×n (R). Entonces
ρ(A) + ν(A) = n.
Del Teorema de la dimensión para matrices concluimos que
ν(A) = el número de columnas de la FER de A que no contienen pivotes.
Teorema 5.7.7. Sea A ∈ Mm×n (R). Entonces A es invertible si y sólo si ρ(A) = n.
Teorema 5.7.8. Sea A ∈ Mm×n (R). El sistema Ax = b tiene al menos una solución si y
sólo si b ∈ CA . Esto ocurre si y sólo si A y la matriz aumentada (A|b) tienen el mismo
rango.
212
5.8. Cambio de base
5.11. Problemas
Problema 5.11.2. Demuestre que el conjunto de todas las funciones que satisfacen la ecua-
ción funcional
f (x) = f (x − 1),
En los siguientes problemas, determinar si cada uno de los conjuntos dados es un espacio
vectorial real.
Problema 5.11.4. Sea V el conjunto de todos los pares (x, y) de números reales, con las
operaciones de suma y producto por escalar definidas como sigue:
Problema 5.11.6. Demuestre que los únicos subespacios propios R2 son las rectas que
pasan por el origen. Hallar la ecuación cartesiana de la recta. Demuestre además que todo
subespacio de dimensión 1 de R3 es una recta que pasa por el origen. Hallar la ecuación
paramétrica de dicha recta.
213
Problema 5.11.7. Sea V = Mn×n (R), ¿cuáles de los siguientes subconjuntos de V son
subespacios.
(b) El conjunto de todas las A ∈ V tales que AB = BA, B es una matriz fija en V .
(a) H1 ∪ H2 no es un subespacio de V .
(b) H := H1 + H2 = {v : v = v1 + v2 , v1 ∈ H1 , v2 ∈ H2 },
es un subespacio de V .
Problema 5.11.9 (**). Sea V el espacio vectorial de todas las funciones de R en R, sea Ve ,
el subconjunto de las funciones pares, f (x) = f (−x); sea V0 el subconjunto de las funciones
impares, f (−x) = −f (x).
donde Sn×n denota el conjunto de todas las matrices simétricas de tamaño n × n y Kn×n el
conjunto de todas las matrices antisimétricas de tamaño n × n.
214
Sección 5.3 Combinación lineal y espacio generado
Problema 5.11.12. Sean v1 , v2 vectores de R2 . Hallar, gen {v1 , v2 } si,
(a) v1 , v2 son linealmente dependientes.
(b) v1 , v2 son linealmente independientes.
(c) v1 , v2 son linealmente independientes y los escalares de la combinación varı́an entre 0 y
1. ¿Qué representan los conjuntos hallados en (a),(b) y en (c)?
Problema 5.11.15. Demuestre que si dos vectores no nulos v1 , v2 son ortogonales, entonces
el conjunto {v1 , v1 } es linealmente independiente.
Problema 5.11.18 (**). Demuestre que el espacio Snn de las matrices simétricas de tamaño
n × n es un subespacio de Mn×n (R) el espacio de la matrices de tamaño n × n con estradas
en los reales. Hallar la dimensión del espacio Snn .
215
Problema 5.11.19 (*). Sea {v1 , . . . , vn } una base para un espacio vectorial V . Si
n
X
un := vi .
i=1
216
Capı́tulo 6
Transformaciones lineales
T (u + v) = T (u) + T (v)
(6.1)
T (αu) = αT (u)
H = {(x, 0, z) : x, z ∈ R} .
Dado que
217
Vemos que H es generado por la base ortonormal B = {i, k}. Por lo que
Γ
C
y
x
Figura 6.1: La proyección de la curva C, que es una circunferencia, sobre el plano xz es una
elipse.
218
para hallar la ecuación cartesiana de dicha curva eliminamos el parámetro en la ecuaciones
paramétricas
√
x = 1 + cos t, z = 2 sen t,
de donde obtenemos
ker T = {v ∈ V : T (v) = 0}
R(T ) = {T (v) : v ∈ V } .
Ejemplo 6.2. Sea T : R3 → R3 una transformación lineal tal que T (1, 0, 1) = (2, 2, 0),
T (1, 1, 1) = (1, 3, 1) y T (1, 1, 0) = (0, 2, 2).
219
Lo que significa que la linealidad de T implica que para determinar completamente operador
es suficiente con conocer su acción sobre los elementos de una base. Pasa este caso, la base
canónica de R3 . Tenemos que
Ahora como
Utilizando que
tenemos que
(x − y + z, x + y + z, x + y − z) = (0, 0, 0).
De obtenemos el sistema
220
x−y+z = 0
x+y+z =0
x+y−z =0
x x
T (x) = T y = A y
z z
donde A es la matriz
1 −1 1
A = 1 1 1
1 1 −1
Im(T ) = {w ∈ W : ∃v ∈ V, w = T (v)} .
esto es, w ∈ Im(T ), con lo cual, R3 ⊆ Im(T ). Se concluye que la imagen de la transformación
T es todo el espacio tridimensional: Im(T ) = R3 .
221
6.3. Teorema del cambio de variables en el plano (Op-
cional)
Teorema 6.3.1 (Teorema del cambio de variables en el plano). Sea T : R2 → R2 un
operador de C 1 en una región elemental G(las funciones componentes del operador T tienen
derivadas parciales de primer orden continuas en la región G) del plano uv. En la figura 6.2
se muestran el operador T y el operador S que es el operador inverso de T .
y v
2 2
R T
G
1 S 1
x u
1/2 1 2 1 2
Figura 6.2: El operador T deforma una región G en el plano uv para convertirla en una
región R en el plano xy, una medida de dicha deformación viene dada por el Jacobiano del
operador T
.
y supongase que T mapea de manera inyectiva la región G en una región R del plano xy,
siendo
T (u, v) = (g(u, v), h(u, v)) = (x, y).
Entonces si f : R → R es integrable tenemos que
ZZ ZZ
f (x, y)dxdy = f (g(u, v), h(u, v))|J(u, v)|dudv.
R G
Teorema 6.3.2. Sea A un matriz de tamaño 2 × 2 con det A 6= 0 y T un operador dado por
x x
T =A . (6.2)
y y
Nota 6.3.1. Nótese que todo operador lineal de R2 en R2 viene dado en la forma (6.2).
En efecto, puesto que el operador T es lineal es suficiente con conocer su acción sobre los
elementos de alguna base para determinarlo completamente. Por ejemplo, si tomamos la base
canónica de R2 , B = {i, j}, y suponemos que T (i) = (a, b) y T (j) = (c, d) tenemos que
T (x, y) = T (xi + yj) = xT (i) + yT (j) = x(a, b) + y(c, d) = (ax + cy, bx + dy).
a c
La expresión anterior en forma matricial es (6.2) con A = . Observese además que
b d
si, J(x, y) = det A = ad − bc 6= 0, entonces el operador T es inyectivo, por lo tanto, si
T (G) = R, por el Teorema del cambio de variables tenemos que
ZZ
a(R) = dxdy
ZZ R
= |J(u, v)|dudv
ZZ G
= | det A|dudv
G
ZZ
= | det A| dudv
G
= | det A|a(G).
Ejemplo 6.3 (Coordenadas polares). Como un caso particular del Teorema 6.3.1, damos
una fórmula para integración en coordenadas polares. En este caso el operador T del plano
rθ al plano xy está dado por
223
θ y
T R
β
G r=a r=b
α
β
r α x
a b
si θ = k = cte, entonces,
y r sen k
= = tan k.
x r cos k
Es decir, tenemos una recta que pasa por el origen ypque forma un ángulo de k grados con
el eje x. Por otro lado, si r = k = cte, entonces, x2 + y 2 = k, una circunferencia con
centro en (0, 0) y radio k. De este forma, obtenemos el rectángulo polar en el plano xy que
se muestra en la figura 6.3. Además tenemos que
∂g ∂g
∂r ∂θ
cos θ −r sen θ
J(r, θ) = det = det = r.
∂h ∂h sen θ r cos θ
∂r ∂θ
Entonces por el Teorema del cambio de variables obtenemos
ZZ ZZ
f (x, y)dxdy = f (r cos θ, r sen θ)|J(r, θ)|drdθ
R G
Z βZ b
= f (r cos θ, r sen θ)rdrdθ
α a
Para el caso más general en el que tengamos una región polar R de la forma
224
R r = h2 (θ)
r = h1 (θ)
β
α
Figura 6.4: Para encontrar los lı́mites de integración en un cambio a coordenadas polares,
trazamos un rayo que atraviese la región R, vemos que este entra en una función polar de
ecuación r = h1 (θ) y sale en r = h2 (θ), si movemos este rayo empezando en θ = α hasta
θ = β barremos la región.
ZZ
a(R) = dxdy
R
ZZ
= |J(r, θ)|drdθ
G
Z β Z h2 (θ)
= rdrdθ
α h1 (θ)
"Z #
Z β h2 (θ)
= rdr dθ
α h1 (θ)
Z β Z h2 (θ)
2
= r /2 dθ
α h1 (θ)
β
1 2
Z
h2 (θ) − h21 (θ) dθ.
=
α 2
Por lo tanto, como un caso particular del Teorema del cambio de variables, tenemos una
fórmula para calcular el área entre curvas en coordenadas polares
Z β
1 2
h2 (θ) − h21 (θ) dθ.
a(R) = (6.3)
α 2
225
Ejemplo 6.4 (Operador rotación). Un caso particular de operador lineal de R2 en R2 es el
operador rotación, cuya fórmula deducimos a continuación. Tomemos un vector (u, v) en
el plano uv con magnitud r y dirección α y supongamos que este vector gira un ángulo de θ
radianes en dirección contraria de las manecillas del reloj como se muestra en la figura 6.5.
(x, y)
r (u, v)
θ r
α
u
Figura 6.5: El vector (u, v) gira un ángulo θ en dirección contraria de las manecillas del reloj
Entonces la magnitud del vector (x, y), sigue siendo r, pero su dirección es α + θ. En
consecuencia,
x = r cos(α + θ)
= r cos α cos θ − r sen α sen θ
= u cos θ − v sen θ.
y = r sen(α + θ)
= r sen α cos θ + r cos α sen θ
= v cos θ + u sen θ.
226
Dado que
cos θ − sen θ
det = 1 6= 0,
sen θ cos θ
Problema 6.3.3. Hallar el área del paralelogramo generado por los vectores A = (a, b) y
B = (c, d).
Solución. Este problema se puede resolver directamente, de forma cartesiana, o bien uti-
lizando el producto cruz. Para resolver el problema utilizando el Teorema del cambio de
variables la idea es definir un operador T que aplique el cuadrado unitario en el plano uv en
el paralelogramo R en el plano xy como se representa en la figura 6.6.
v y
j B
R
(x, y)
T b
G
A
u x
i
La elección de la región G como el cuadrado unitario viene del hecho que todo punto
(x, y) en la región R se puede expresar como una combinación lineal de la forma
(x, y) = uA + vB
donde los escalares u, v pertenecen al intervalo [0, 1]. Entonces, según el Teorema 6.3.2 y lo
hecho en la Nota 6.3.1 debemos suponer que el operador T es lineal y que
T (i) = A, T (j) = B
227
Con lo cual, T (u, v) = T (ui + vj) = uT (i) + vT (j) = u(a, b) + v(c, d) = (au + cv, bu + dv).
Lo cual se expresa en forma matricial como
u a c u x
T = = .
v b d v y
lo cual implica que el operador T es inyectivo. Más aún, demostraremos que R = T (G),
donde
Esto es, (x, y) ∈ T (G). Por otro lado, si (x, y) ∈ T (G), entonces existe (u, v) ∈ G con
T (u, v) = (x, y), es decir (x, y) = u(a, b) + v(c, d), lo cual significa (x, y) ∈ R. Ahora, por lo
hecho el Nota 6.3.1 podemos podemos concluir que
a2
x2 + xy + y 2 = , a > 0.
2
Solución. Para resolver este problema consideraremos los siguientes resultados
Teorema 6.3.5. La gráfica de la ecuación
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
es una cónica o bien una cónica degenerada. Si es una cónica entonces es
228
(b) Una elipse si B 2 − 4AC < 0
Au2 + Cv 2 + Du + Ev + F = 0 (6.5)
donde A y C no son ambos cero, por una rotación de ejes en un ángulo de θ radianes para
el cual se cumple que:
A−C
cot 2θ = .
B
Para pasar de la ecuación (6.4) a la ecuación (6.5) utilizamos el operador rotación:
u cos θ − sen θ u x
T = = .
v sen θ cos θ v y
si queremos pasar del la ecuación (6.5) a la ecuación (6.4), utilizamos el operador inverso
x cos θ sen θ x u
S = = .
y − sen θ cos θ y v
Para nuestro caso tenemos que A = B = C = 1, D = E = 0 y F = −a2 /2. Con lo cual,
B 2 − 4AC = 1 − 4 < 0, luego por el Teorema 6.3.5, la cónica es una elipse. Ahora como
B = 1 6= 0, por el Teorema 6.3.6, la elipse está rotada y el ángulo de rotación satisface la
relación
A−C
cot 2θ = = 0,
B
de donde, cos 2θ = 0, esto es, θ = π/4. Por lo tanto, el operador rotación está dado por
√ √
u 1/ 2 −1/ 2, u x
T = √ √ = .
v 1/ 2 1/ 2 v y
229
Ahora consideremos la región
R := (x, y) : x2 + xy + y 2 ≤ a2 /2 ,
(6.6)
G := (x, y) : 3u2 + v 2 ≤ a2 .
(6.7)
v y
G S R
u x
x = x1 e1 + · · · + xn en .
230
Como T : Rn → Rm es lineal tenemos que
Entonces, si A = [aij ]m×n es una matriz tal que sus columnas son respectivamente los vec-
tores T (e1 )t , . . . , T (en )t , tenemos que T (x) = Ax. A la matriz A se le conoce como matriz
asociada a la transformación T respecto a la base canónica, también se le llama represen-
tación matricial de T y escribimos A = [T ]B .
Las nociones presentadas en la sección 5.7 también son validas para transformaciones
lineales.
Solución. Como T (e1 ) = (1, 2), T (e2 ) = (2, −1) y T (e3 ) = (−1, 3), la matriz asociada a T
respecto a la base canónica es
t t t
1 2 −1
A = [T ]B = T (e1 ) T (e2 ) T (e3 ) =
2 −1 3
En el ejemplo 5.12 se encontró que ν(A) = 1 y en el ejemplo 5.13 que ρ(A) = 2. Se verifica
que
231
6.5. Isomorfismos
6.6. Problemas
x2 y 2
Problema 6.6.1 (**). Halle el área encerrada por la elipse 2 + 2 = 1. Sugerencia: Use
a b
el operador
Note que este operador mapea de manera inyectiva, el interior del circulo unitario en el plano
uv en el interior de la elipse en el plano xy.
232
Capı́tulo 7
7.5. Problemas
Problema 7.5.1. Demostrar que
Z √
F · dα = π 3a2 ,
C
(a) Directamente,
233
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando z en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos
234
Z
y = −x, z = 0
C
dx a a
= √ cos t + √ sen t
dt 6 2
dy a a
= √ cos t − √ sen t
dt 6 2
dz 2a
= − √ cos t.
dt 6
a2 a2
dx a a a a
y = √ sen t + √ cos t √ cos t + √ sen t = sen 2t + √ .
dt 6 2 6 2 3 2 3
a2 a2
dy 2a a a
z = − √ sen t √ cos t − √ sen t = − sen 2t + √ sen2 t.
dt 6 6 2 6 3
a2 a2
dz a a 2a
x = √ sen t − √ cos t − √ cos t = − sen 2t + √ cos2 t.
dt 6 2 6 6 3
235
Entonces
Z Z
F · dα = ydx + zdy + xdz
C C
Z 2π
2
a2
a
= √ + √ dt
0 2 3 3
√ 2
= π 3a .
z
Efectuaremos la integración sobre la superficie C
S del plano x + y + z = 0 encerrada por la curva C.
Esto es, S = {(x, y, z) : x + y + z = 0, (x, y) ∈ T }, Γ
siendo, T = {(x, y) : x2 + xy + y 2 ≤ a2 /2}. y
x
236
Ahora, con la información que el corredor tiene sobre el dı́a de ayer, establecemos la ecuación
3 1
x − y + z = 600.
2 2
La matriz aumentada del sistema conformado por las dos ecuaciones anteriores es:
−1 −3/2 1/2 | −350
3/2 −1/2 1 | 600
Ahora aplicamos eliminación Gaussiana para obtener la forma escalonada por filas de la
matriz.
R1 → −6R1
−1 −3/2 1/2 | −350 6 9 −3 | 2100
R1 → −4R1
3/2 −1/2 1 | 600 −6 2 −4 | −2400
⇐⇒
6 9 −3 | 2100 R2 → R1 + R2 6 9 −3 | 2100
−6 2 −4 | −2400 ⇐⇒ 0 11 −7 | −300
R1 → (1/3)R1
6 9 −3 | 2100 2 3 −1 | 700
R2 → (1/11)R2
0 11 −7 | −300 0 1 −7/11 | −300/11
⇐⇒
2 3 −1 | 700 R1 → −3R1 + R2 2 0 10/11 | 8600/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11
2 0 10/11 | 8600/11 R1 → (1/2)R1 1 0 5/11 | 4300/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11
237
Es decir, el sistema tiene infinitas soluciones reales dadas en la forma
x = (4300 − 5t)/11
y = (7t − 300)/11
z = t, t ∈ R
o equivalentemente,
Luego, tenemos una ecuación Diofántica con a = 77, b = 55 y c = 28600. Además, como
(77, 55) = 11 y 11|28600 por el Teorema 1.5.1 la ecuación tiene solución. Más aún, si el
corredor sabe que la inversionista tiene z = t = 200 acciones de McDonald’s, entonces
puede determinar que además posee x0 = (4300 − 5 · 200)/11 = 300 acciones de Delta, y
y0 = (7 · 200 − 300)/11 = 100 acciones de Hilton. Nótese que x0 = 300 y y0 = 100 es una
solución particular de la ecuación Diofántica (7.3). Por lo tanto una nueva aplicación del
Teorema 1.5.1 nos permite concluir que la solución general de la ecuación Diofántica es
55 77
x = 300 + k = 300 + 5k, y = 100 − k = 100 − 7k, k ∈ Z.
11 11
Pero
4300 − 11x 4300 − 11(300 + 5k)
z= = = 200 − 11k.
5 5
Concluimos que las soluciones enteras del problema son
x = 300 + 5k
y = 100 − 7k
z = 200 − 11k, k ∈ Z
238
Por lo tanto, −60 ≤ k ≤ 14. Esto es, k = −60, −59, . . . , 0, 1, 2 . . . , 14. Por consiguiente, el
problema tiene en realidad finitas soluciones, más exactamente, tenemos 75 soluciones, una
por cada valor de k. Este número de soluciones pudo haber sido obtenido sin usar ecuaciones
Diofánticas como sigue: Dado que las variables x, y deben ser no negativas, de la forma
paramétrica de las soluciones dada en (7.2) se tiene que
4300 − 5t ≥ 0, 7t − 300 ≥ 0,
de donde
Esto es, 43 ≤ t ≤ 860. Ahora bien, como el denominador en las expresiones paramétricas
para x y y dadas en (7.2) es 11, para saber el número de la soluciones enteras del problema,
debemos
j 860 k contar los múltiplos de 11 presentes en el intervalo de 43 a 860. De 1 a 860 hay
= 78 múltiplos de 11
11
44 858
11(1), 11(2), 11(3), 11(4), . . . , 11(78).
Entonces, de 43 a 860 hay 78 − 3 = 75 múltiplos de 11. Lo que quiere decir que hay 75
soluciones enteras positivas del problema.
Problema 7.6.2 (***). Una partı́cula se desplaza sobre la curva de intersección de las
√
superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando y en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos
(x − 1)2 + z 2 /2 = 1.
239
Tenemos la ecuación cartesiana de una curva proyectada sobre el plano xz, para este caso
una elipse. En la figura 7.2 se muestra esta curva en azul. Denotemos por Γ a el conjunto de
puntos en el espacio que están sobre esta elipse, esto es,
Γ = (x, y, z) : (x − 1)2 + z 2 /2 = 1, y = 0 .
plano x + y = 2
y
x
Figura 7.1: En rojo se muestra la trayectoria seguida por la partı́cula junto con su dirección.
Se advierte que desde nuestro punto de vista (opuesto al origen) se aprecia que la partı́cula
sigue la dirección de las manecillas del reloj.
√
Empecemos por parametrizar la curva Γ. Tomemos x−1 = cos t y y = 2 sen t. Entonces
√
β(t) = (1 + cos t, 0, 2 sen t), 0 ≤ t ≤ 2π.
Ası́,
240
z
Γ
C
y
x
Figura 7.2: En azul se muestra la proyección Γ de la trayectoria C. Para este caso tenemos
una elipse proyectada sobre el plano xz.
C = α([0, 2π]),
donde
√
α(t) = (1 + cos t, 1 − cos t, 2 sen t).
En la figura 7.1 vemos esta curva en rojo. Vemos que α(0) = (2, 0, 0). Esto es, la partı́cula
empieza su recorrido en el punto (2, 0, 0). Si la función α(t) representa la posición de la
√
partı́cula se debe cumplir que su rapidez kα′ (t)k = 2 2m/s. Sin embargo tenemos que
√
α′ (t) = (− sen t, sen t, 2 cos t),
√ √
de donde kα′ (t)k = 2 6= 2 2. Para encontrar el vector posición de la partı́cula debemos
hallar ω tal que
√
kγ ′ (t)k = 2 2.
√
donde γ(t) = α(ωt) = (1 + cos ωt, 1 − cos ωt, 2 sen ωt).
√
γ ′ (t) = (−ω sen ωt, ω sen ωt, 2ω cos ωt).
√ √ √ √
kγ ′ (t)k = 2 2 ⇔ ω 2 cos2 ωt + ω 2 cos2 ωt + 2ω 2 sen2 ωt = 2ω = 2 2.
241
Por lo tanto, ω = 2 y el vector posición de la partı́cula está dado por
√
γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t).
√
(1, 1, 2)
b C
b (0, 2, 0)
(2, 0, 0) b b
y
x
b
√
(1, 1, − 2)
Figura 7.3: A medida que crece el parámetro t crece de 0 a π, los puntos se distribuyen sobre
la curva de intersección C siguiendo la dirección de la opuesta a las agujas del reloj, vista
desde el origen
En el cuadro 7.1 se observa que la partı́cula tiene un periodo (tiempo en completar una
revolución) de π segundos
t x y z
0 2 0 0
√
π/4 1 1 2
π/2 0 2 0
√
3π/4 1 1 − 2
π 2 0 0
Cuadro 7.1: La partı́cula empieza su recorrido en el punto (2, 0, 0), pasado un tiempo de π
segundos regresa al mismo punto.
242
7.7. Solución Examen Final Conjunto de Álgebra Li-
neal 6 de Junio del 2018
Problema 7.7.1. ¿Cuál de las siguientes afirmaciones es verdadera?
(d) Para cualquier par de matrices cuadradas tendremos: det(AB t ) = det A det B
Solución. A continuación mostramos las tres operaciones elementales definidas entre ma-
trices, ası́ como su efecto sobre del el determinante.
Para el caso de la tercera operación elemental, vemos que el efecto sobre el determinante,
es que este cambia de signo, cuando se intercambian dos de sus filas.
En el inciso (b), nótese que si A ∈ Mn×n (R), entonces det A = det At (ver el problema
2.7.3). Por lo tanto, si suponemos que la afirmación (b) es cierta, tendrı́amos que
Luego, es suficiente con escoger una matriz cuyo determinante sea distinto de cero para
mostrar que la afirmación es falsa. Por ejemplo, si
1 0
A :=
2 3
243
entonces
1 0 1 2
det A =
= 3 6= −3 = −
2 3 0 3
Claramente, la afirmación (c) es falsa. Dado det A debe ser diferente de cero. Si A ∈
Mn×n (R) y det A 6= 0, entonces por el Teorema 2.4.1, A es invertible, por lo tanto, existe
A−1 , y AA−1 = I, de lo cual, por el Teorema 2.3.1, y el Teorema 2.1.1 obtenemos que
Concluimos que
Nos queda demostrar la veracidad de la afirmación (d). De nuevo por el Teorema 2.3.1
tenemos que
Solución. Las matrices de los incisos (a), (b) y (d) son todas casos particulares de una
matriz triangular superior. Construiremos una matriz antisimétrica no nula.
Sea
a b
A :=
c d
244
De la primera y última ecuaciones nos da que a = 0 y d = 0, y de las ecuaciones del medio,
obtenemos que b = −c. En consecuencia, todas las matrices antisimétricas de tamaño 2 × 2
son de la forma
0 −c
,c ∈ R
c 0
Para una aplicación de las propiedades del determinante ver el problema 2.3.10 y el
ejemplo 2.1.
245
7.8. Cálculo e ingenierı́a civil
Problema 7.8.1 (Cálculo en varias variables e ingenierı́a civil). Encuentre el volumen y
área superficial del soporte para tuberı́a (columna de base elı́ptica donde se pone una
tuberı́a, por ejemplo un oleoducto, como el que se muestra en color azul en la figura 7.4(a)).
Encuentre además, el área del cilindro circular cortada por el cilindro elı́ptico. Esta es el
área encerrada por la curva de intersección C que se muestra en gris en la figura 7.4(b).
z
z
Cilindro cı́rcular
C C
b
H h
b
a y
x y x
Cilindro elı́ptico
(a) Soporte elı́ptico de una tuberı́a (b) Sólido limitado por dos cilin-
circular dros
Figura 7.4: El cilindro elı́ptico genera una curva de intersección C sobre el cilindro circular.
Denotamos con H a el punto más alto sobre la curva C y con h a su punto más bajo. Estos
valores se alcanzan respectivamente en los puntos (a, 0, 0) y (0, b, 0), donde las constantes a
y b son los semiejes de la elipse que genera el cilindro elı́ptico.
Solución. Supongamos que el cilindro elı́ptico es generado por una elipse de semiejes a y b.
246
z
p
z =R+h+ R2 − x 2 , y = 0
b b
(R, R + h)
R
y
b
(a, H)
x2 y2 h
+ = 1, z = 0 b
a2 b2 z =R+h−
p
R2 − x 2 , y = 0
b
T a
x −a
b b
a x
(a) Curva base del cilindro (b) Curva base del cilindro circular
elı́ptico
Figura 7.5: En la parte (a) se muestra la intersección del cilindro elı́ptico con el plano xy y
en la parte (b) la intersección del cilindro circular con el plano xz
Esta serı́a la base del cilindro elı́ptico, ver la figuras 7.4 y 7.5(a). Se supone además que
el eje del cilindro elı́ptico es el eje z. Por lo tanto, la ecuación de este cilindro es
x2 y 2
+ 2 = 1, z ∈ R
a2 b
Suponemos que los semiejes a y b son dados. Sobre el punto (a, 0, 0) medimos una altura
H y sobre el punto (0, b, 0) medimos una altura h donde 0 < h < H. La altura mı́nima h
es la distancia a la que está el cilindro circular del piso, y la altura máxima H es el mayor
valor permitido para las componentes en z de ambos cilindros. Ver la figura 7.4(b) y la figura
7.5(b). Las alturas h, H también las suponemos dadas.
Ahora bien, si R denota el radio del cilindro circular, según se ve en la figura 7.5(b) el
centro del cilindro es (0, 0, R + h). Estamos suponiendo que el eje de este cilindro es la recta
paralela al eje y que está a un altura h del piso, de modo que su ecuación es
x2 + (z − (R + h))2 = R2 , y ∈ R.
Para que el cilindro circular no se doble sobre si mismo, debemos tener que 0 ≤ z ≤ R + h.
Esto queda claro al observar la figura 7.5(b) donde se infiere que z varia entre 0 y R + h,
mientras x lo hace entre 0 y R. Esto, para parte del cilindro que queda por debajo de la
recta z = R + h, que es la que no interesa. Concluimos que la ecuación del cilindro circular
es
√
z = f (x, y) = R + h − R2 − x2 , y ∈ R.
247
De nuevo, al observar la figura 7.5(b), vemos que z = H cuando x = a. Por lo tanto, tenemos
que
√
H = R + h − R2 − a2 . (7.4)
a2 + (H − h)2
R= . (7.5)
2(H − h)
Podemos resumir lo hecho hasta ahora como sigue: Dada una tuberı́a elı́ptica de ancho mayor
2a, y de ancho menor 2b, la cual cortamos a una altura H, en la que introducimos a una
altura h < H (medida desde el piso) un oleoducto circular de radio dado por (7.5), generando
el sólido que se muestra en la figura 7.4(b), para el queremos determinar el volumen y el
área superficial, tanto lateral como superior.
Por simetrı́a, podemos obtener el volumen del sólido al multiplicar por 4 la integral doble
ZZ
f (x, y)dA,
T
donde T es la región del tipo 2 limitada en el primer cuadrante por la elipse base del cilindro
elı́ptico y los ejes coordenados (ver la figura 7.5(a)), esto es,
b√ 2
T = (x, y) : 0 ≤ x ≤ a, 0 ≤ y ≤ a −x2
a
Z a Z b √a2 −x2 √
V =4 a 2 2
R + h − R − x dydx
0 0
4b
Z a √ √
= R + h − R2 − x2 a2 − x2 dx.
a 0
Esto es,
4b
Z a √ √
V = R+h− R2 − x2 a2 − x2 dx 0 < a ≤ R. (7.6)
a 0
Por ejemplo, si queremos saber, cuanto cemento se requiere para rellenar un soporte elı́ptico
de semiejes a = 0,4m = 15,7pulg, b = 0,3m = 11,8pulg y una altura H = 100pulg, sobre el
248
cual se coloca a una altura h = 87,3pulg un cilindro circular, primero aplicamos la fórmula
(7.5) para el radio del cilindro circular
15,72 + (100 − 87,3)2
R= = 16,054.
2(100 − 87,3)
Se observa que se cumple que 16,054 ≥ 15,7, y que 16,054 > 100 − 87,3 = 12,7. Ahora
aplicamos la fórmula (7.6) para hallar el la cantidad aproximada de cemento necesaria para
rellenar el sólido
4 · 11,8 15,7
Z p p
V = 2
16,054 + 87,3 − 16,054 − x 2 15,72 − x2 = 52140pulg 3.
15,7 0
El área de la parte superior de la tuberı́a (área de la superficie del cilindro circular cortada
por el cilindro elı́ptico) está dada por
ZZ q
A=4 1 + fx2 + fy2 dA
T
Z √
4bR a a2 − x2
= √ dx 0 < a ≤ R.
a 0 R2 − x2
Es decir,
a
√
4bR a2 − x2
Z
A= √ dx 0 < a ≤ R. (7.7)
a 0 R2 − x2
Con los mismos valores usados para a, b, h y H para hallar el volumen del sólido, encontramos
que el área de la parte superior de la tuberı́a es
p
4(11,8)(16,054) 15,7 15,72 − x2
Z
A= p dx = 716,29pulg 2.
15,7 0
2
16,054 − x 2
Para hallar el área lateral de la tuberı́a (área del cilindro elı́ptico cortada por el cilindro
circular) empezamos parametrizando la curva Γ que se muestra en figura 7.6
C
b
H h
b
a Γ
y
x
Figura 7.6: La recta vertical que se muestra en verde se mueve entre las curvas Γ y C para
generar el área lateral del cilindro elı́ptico cortada por el cilindro circular
249
Sea I = [0, 2π], entonces Γ = α(I) donde
Esto es,
Z 2π √ √
Al = R + h − R2 − a2 cos2 t a2 sen2 t + b2 cos2 tdt. (7.8)
0
La fórmula (7.8) se obtuvo utilizando una integral de linea, también podemos hallar el área
lateral de la tuberı́a mediante una integral de superficie.
Si S es la superficie del cilindro elı́ptico cortada por el cilindro circular, entonces S = r(G)
donde
Entonces
Z 2π √ √
Al = a2 sen2 u + b2 cos2 u R + h − R2 − a2 cos2 u du. (7.9)
0
Si comparamos esta fórmula con la fórmula (7.8) vemos que es la misma, reemplazando u
por t. El área lateral de la tuberı́a también se puede obtener con una fórmula similar a la
encontrada en (7.7).
250
Problema 7.8.2 (***). Encuentre una fórmula similar a la encontrada en (7.7) para hallar
el área lateral de la tuberı́a del problema 7.8.1. Compruebe la validez de su fórmula, com-
parando el valor encontrado para el área al sustituir a = 15,7pulg y R = 16,054pulg, en la
fórmula (7.8).
Suponga que los cilindros del problema 7.8.1 son ambos circulares y del mismo radio R.
Encuentre el volumen del sólido en cuestión como función de la altura h y el radio R. Lo
mismo, para el área lateral y superior de la tuberı́a.
251
252
Bibliografı́a
[1] T. M. Apostol, Calculus, vol. I (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1988, 813 pp.
[2] T. M. Apostol, Calculus, vol. II (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1980, 813 pp.
[3] S. I. Grossman, Álgebra lineal (5th ed.), McGraw–Hill, 1996, 634 pp.
[4] K. Hoffman and R. Kunze Linear algebra(2nd ed.), Prentice–Hall, Inc., Englewood
Cliffs, New Jersey, 1971, 407 pp.
[5] B. Kolman and D. R. Hill, Álgebra lineal (8th ed.), Pearson Educación, 2006, 643 pp.
[7] J. Stewart, L. Redlin And S. Watson, Precálculo(5a ed.), Cengage Learning Editores,
2007, 933 pp.
253