Está en la página 1de 93

Notas de Clase

Geometrı́a Vectorial y Analı́tica

Diego Mejı́a (Coordinador del curso)


Profesor Escuela de Matemáticas
Universidad Nacional de Colombia Sede Medellı́n
II
Índice general

1. Vectores en el plano cartesiano 1


1.1. La recta numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. El plano cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Suma de vectores y multiplicación de un vector por un escalar . . 8
1.4. Magnitud y dirección de un vector. Ángulo entre vectores. . . . . . 21
1.5. Producto escalar o producto punto . . . . . . . . . . . . . . . . . . 29

2. La lı́nea recta. Ecuación general de primer grado 35


2.1. La lı́nea recta: definición y condiciones que la determinan . . . . 35
2.2. Rectas paralelas y perpendiculares. Ángulo entre rectas. . . . . . 48
2.3. Proyección ortogonal sobre una lı́nea recta. Distancia de un pun-
to a una recta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.4. Aplicaciones geométricas. . . . . . . . . . . . . . . . . . . . . . . . . 64

3. Geometrı́a de las transformaciones lineales del plano 71


3.1. Definición de transformación lineal y primeros ejemplos. . . . . . 71
3.2. Propiedades básicas de las transformaciones lineales y conse-
cuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.3. Imágenes de lı́neas rectas, lı́neas poligonales y polı́gonos bajo
una transformación lineal . . . . . . . . . . . . . . . . . . . . . . . 87
3.3.1. Imágenes de lı́neas rectas . . . . . . . . . . . . . . . . . . . . 87

III
IV ÍNDICE GENERAL
Capı́tulo 1

Vectores en el plano cartesiano

1.1. La recta numérica

Comencemos el estudio de la geometrı́a analı́tica recordando la imagen geo-


métrica (o visual) del conjunto R de los números reales. Dibujemos una lı́nea
recta y en ella escojamos un punto cualquiera que llamamos origen denotado
por la letra O (o mayúscula). Al origen le asignamos el número real 0. A conti-
nuación seleccionamos (arbitrariamente) una unidad de medida y dibujamos
sobre la recta el punto U correspondiente a la unidad de medida. Al punto U
(que es distinto del origen) le asignamos el número real 1.
El punto U nos proporciona una orientación de la recta en el siguiente
sentido: llamamos lado positivo de la recta al rayo que sale del origen en la
dirección del punto U , y lado negativo al rayo que sale del origen en dirección
contraria al punto U .
En seguida establecemos una correspondencia biunı́voca (es decir, corres-
pondencia uno a uno) entre los números reales y los puntos sobre la recta:
si P es un punto situado del lado positivo de la recta que dista p unidades
del origen entonces le asignamos el número real p, y si está situado del lado
negativo le asignamos el número real −p. Ası́, los números reales positivos

1
2 Vectores en el plano cartesiano

U
O b

b
(1)
A (0)
(+)
b Lado positivo

(a)
(-)
Lado negativo

Figura 1.1: Recta numérica

corresponden a los puntos situados del lado positivo de la recta, y los negati-
vos a los puntos situados del otro lado de la recta. Esta imagen visual de los
números reales es lo que llamamos recta numérica o recta real o, inclusive, eje
coordenado.
La identificación anterior nos permite denotar un punto A sobre la recta
teniendo en cuenta el número real a que le corresponde, el cual llamamos la
coordenada del punto, y escribimos A = (a) (véase la Figura 1.1).
Quizá la primera inquietud que surge de forma natural es cómo expresar
la distancia entre dos puntos A = (a) y B = (b) de la recta numérica con base
en sus coordenadas. Supongamos inicialmente el caso particular en el que el
punto B es el origen O = (0). Nuestro modelo visual nos dice que si el punto
A está del lado positivo de la recta entonces la distancia entre ambos puntos
debe ser a unidades, mientras que si A está del lado negativo la distancia entre
ambos puntos es −a unidades. En otras palabras, nuestro modelo visual nos
dice que la distancia entre el punto A = (a) y el origen O = (0) es el valor
absoluto de la coordenada a del punto A.
Supongamos ahora que el punto B no es el origen y que tanto A como B se
encuentran del lado positivo de la recta. Si el punto A está a la “derecha”del
1.1. La recta numérica 3

b | A
|a − U b
(+)
O b
(a)
b
(1)
B (0)
b

(b)
(-)

Figura 1.2: Distancia entre puntos

punto B, es decir, si a > b, estaremos de acuerdo en que la distancia entre


ambos puntos es igual a la distancia entre el origen y el punto A menos la
distancia entre el origen y el punto B, esto es: a − b unidades; y si B está a la
“derecha”de A entonces esta distancia es b − a unidades. Ambas situaciones
se resumen diciendo que la distancia entre A y B es |a − b| unidades.
En seguida suponemos que el punto A está del lado positivo de la recta
mientras que el punto B está del lado negativo; es decir, a > 0 y b < 0 (véase
la Figura 1.2). En este caso estaremos de acuerdo en que la distancia entre
ambos puntos es igual a la distancia entre el punto A y el origen más la
distancia entre el punto B y el origen, es decir, dicha distancia es igual a
a + (−b) = a − b unidades. Si la situación fuera al contrario, con el punto B
del lado positivo y el punto A del lado negativo, entonces llegamos a que la
distancia entre ambos puntos es b − a unidades. Luego, cualquiera que sea
el caso, la distancia entre los puntos A y B es |a − b| unidades. Sólo falta
por considerar la situación en que ambos puntos están del lado negativo de
la recta. El lector puede convencerse que, al igual que en los casos anteriores,
nuestro modelo visual nos conduce a que la distancia entre los puntos A y B
es |a − b| unidades.
4 Vectores en el plano cartesiano

Ejercicio 1.1. Sean A = (a) y B = (b) dos puntos de la recta real con a < 0 y
b < 0. Use un argumento visual para verificar que la distancia entre A y B es
|a − b|.

La discusión anterior nos lleva de manera natural a la siguiente definición:

Definición 1.1. Sean A = (a) y B = (b) dos puntos de la recta real. Definimos
la distancia entre A y B, denotada por dist(A, B), como sigue:

dist(A, B) = |a − b|.

Puesto que |a − b| = |b − a|, vemos que dist(A, B) = dist(B, A).

Ejemplo 1.1. A manera de ejemplo, sean A = (−5) y B = (7) dos puntos de la


recta numérica. La distancia entre ambos puntos es

dist(A, B) = | − 5 − 7| = | − 12| = 12.

Ejercicio 1.2. Sean A = (a) y B = (b) dos puntos de la recta numérica y sea
a+b
M = (m) el punto medio del segmento AB. Pruebe que m = 2
. ¿Cuál es la
coordenada del punto medio del segmento AB del ejemplo anterior?

1.2. El plano cartesiano


El plano cartesiano se fundamenta en el concepto de par ordenado de
números reales. Un par ordenado es una pareja de números reales a y b en la
cual uno de los números, digamos a, se distingue como el primero mientras
 
a
que el otro, b, es el segundo, y lo escribimos en la forma  . El conjunto de
b
todos los pares ordenados de números reales se denota por R2 , es decir:
  
 a 
2
R =   : a, b ∈ R .
 b 
1.2. El plano cartesiano 5
Eje y

II I

0 Eje x

III IV

Figura 1.3: Plano cartesiano

Visualicemos R2 dibujando en una superficie plana dos ejes coordenados


perpendiculares, ambos con la misma unidad de medida y con el punto de
intersección como origen común. Uno de los ejes lo trazamos horizontalmente
y el otro, entonces, verticalmente. Al eje horizontal lo llamaremos eje x y lo
orientamos positivamente hacia la derecha. Al eje vertical lo llamamos eje y y
lo orientamos positivamente hacia arriba. Los ejes dividen la superficie plana
en cuatro regiones llamadas cuadrantes que se numeran de uno a cuatro en
sentido contrario a las manecillas del reloj (sentido antihorario) (véase la Fi-
gura 1.3).
 
x
A cada punto P del eje x le asignamos el par ordenado  , donde x es
0
 
x
la coordenada del punto P en el eje x, y escribimos P =   ; si el punto P
0
 
0
está sobre el eje y le asignamos el par ordenado  , donde y es la coordena-
y
6 y Vectores en el plano cartesiano

x

P’ = 0

0

b
P” = y
x
P= y

Figura 1.4: Coordenadas cartesianas

 
0
da del punto P en el eje y, y escribimos P =   . Si el punto P no está sobre
y
los ejes trazamos desde P dos rectas: una perpendicular al eje x que corta a
 
x
este eje en el punto P ′ =   y otra perpendicular al eje y que lo corta en
0
   
0 x
el punto P ′′ =  . Entonces, asignamos al punto P el par ordenado  
y y
 
x
y escribimos: P =   (ver Figura 1.4). Recı́procamente, el lector puede
y
 
x
verificar que cada par ordenado   determina un único punto sobre la su-
y
perficie plana .
Hemos establecido ası́ una correspondencia biunı́voca entre las parejas
de números reales y los puntos de la superficie plana. Las coordenadas x y
y se llaman coordenadas cartesianas o rectangulares del punto P ; además,
llamamos plano cartesiano o, más sencillamente, plano, a R2 con el sistema
de coordenadas rectangulares; los elementos del plano cartesiano los llama-
mos puntos o vectores; cuando empleamos la palabra vector para designar un
punto del plano cartesiano usualmente lo dibujamos con una flecha desde el
1.2. El plano cartesiano 7
y

O x

Figura 1.5: Punto como vector


y

−3

A= 4
b

−2 
B= −1

Figura 1.6: Ubicación de puntos en el plano cartesiano

 
0
origen hasta el punto (véase la Figura 1.5). Al origen O =   lo llamamos
0
también vector nulo o vector cero.

Ejemplo 1.2. La Figura 1.6 ilustra la ubicación en el plano cartesiano de los


   
−3 −2
puntos A =   y B =  .
4 −1
8 Vectores en el plano cartesiano

1.3. Suma de vectores y multiplicación de un vector por un


escalar
Comenzamos el estudio de las operaciones básicas de los vectores del plano
con la suma y la multiplicación por escalar.
   
x u
Definición 1.2. Sean X =   y U =   vectores del plano y sea r un
y v
número real al cual llamaremos escalar. Definimos la suma , X + U , y la mul-
tiplicación por escalar, rX, por:
   
x+u rx
X +U = , rX =   .
y+v ry

A continuación enunciamos las propiedades de estas operaciones las cua-


les son consecuencia de la aritmética de los números reales.
Sean X, Y y Z vectores cualesquiera del plano y r y s números reales arbi-
trarios; tenemos:
P1 (Propiedad conmutativa para suma de vectores): X + Y = Y + X.
P2 (Propiedad asociativa para suma de vectores): (X + Y ) + Z = X + (Y + Z).
P3 (Existencia de neutro aditivo): X + O = X = O + X.
P4 (Existencia de inverso aditivo) : Existe un vector W tal que W + X =
X + W = O.
P5 (Propiedad distributiva para vectores): r(X + Y ) = rX + rY .
P6 (Propiedad distributiva para escalares): (r + s)X = rX + sX.
P7 (Propiedad asociativa para escalares): r(sX) = (rs)X.
P8: 1X = X.
   
x −x
Si X =   entonces el vector W de la propiedad P4 es W =   y lo lla-
y −y
mamos el (vector) opuesto o inverso aditivo de X y lo denotamos por −X (véase
la Figura 1.7). Notemos también que −X = (−1)X. Invitamos al lector a que
1.3. Suma de vectores y multiplicación de un vector por un escalar 9
y

-X

O x

Figura 1.7: Vector opuesto

verifique las propiedades anteriores suponiendo conocidas las propiedades de


los números reales.

Ejercicio 1.3. Use la aritmética de los números reales para probar las propie-
dades anteriores.

Es útil y conveniente tener una interpretación geométrica (o visual) de la


suma y multiplicación por escalar para tener una mejor comprensión de estas
operaciones.

 
u
Definición 1.3. Supongamos que U =   es un vector no nulo, el conjunto
v
  
 ru 
X ∈ R2 : X = rU, r ∈ R =   : r ∈ R

 rv 

se llama la recta generada por el vector U .

Los puntos de la recta generada por el vector U son los múltiplos escalares
   
0 u
de U . Si r > 0 obtenemos el rayo o semirrecta que sale de   y pasa por  ,
0 v
10 Vectores en el plano cartesiano
y

ru

b
rv ,r < 0

O x

u

v
ru

rv ,r > 0 b

Figura 1.8: Recta generada por un vector

y si r < 0 obtenemos el rayo opuesto (véase la Figura 1.8).


Cualquier múltiplo escalar no nulo de U genera la misma recta como se
ilustra en el siguiente ejemplo.
 
−1
Ejemplo 1.3. La Figura 1.9 es el dibujo de la recta generada por U =  ,
3
 
1
pero esta recta también es generada por el vector (−1/2)U =  2 , en otras
− 23
palabras:
       
1
 −1  
2 

X=r   :r∈R = X=s  :s∈R .
 3   −3 
2

Usamos letras diferentes, r y s, en la igualdad anterior, para enfatizar que un


   
1
−1
mismo vector no nulo es tanto un múltiplo escalar de   como de  2 ,
3 − 23
pero los escalares son distintos. Por ejemplo,
   
−2 −1
  = 2 
6 3
1.3. Suma de vectores y multiplicación de un vector por un escalar 11

−1

b
3

x
1
 
b 2
− 23

Figura 1.9: Ejemplo de recta generada por un vector

y también    
1
−2 2
  = (−4)  .
6 − 23

Ejercicio 1.4. Sean U y V vectores no nulos tales que V = rU para algún


escalar r. Pruebe que las rectas generadas por los vectores U y V son iguales.

Definición 1.4. Si un vector U es múltiplo escalar de otro vector X, es decir, si


U = rX, para algún escalar r, decimos que los vectores U y X son linealmente
dependientes. Cuando dos vectores no son linealmente dependientes decimos
que son linealmente independientes.
   
−1 2
Ejemplo 1.4. Por ejemplo, los vectores A =   y B =   son linealmen-
3 −6
te dependientes pues B = (−2)A.

Ejemplo 1.5. Cualquiera sea el vector X, los vectores O y X son linealmete


dependientes porque O = 0X.
12 Vectores en el plano cartesiano

Comentario 1.1. Geométricamente, la dependencia lineal significa que los


dos vectores yacen en una misma recta que pasa por el origen. Observemos
además que si U = rX con r 6= 0, entonces X = (1/r)U .

La dependencia lineal de vectores se puede caracterizar en términos de las


coordenadas:
   
a c
Teorema 1.1. Sean A =   y B =   vectores del plano. A y B son lineal-
b d
mente dependientes si y sólo si ad − bc = 0.

Prueba. Supongamos inicialmente que A y B son linealmente dependientes.


Entonces existe un escalar t tal que A = tB; luego
   
a c
  = t 
b d

y por lo tanto

a = tc y b = td;

al multiplicar la primera de estas ecuaciones por d y la segunda por c obtene-


mos

ad = tcd y bc = tdc,

y por lo tanto ad − bc = tcd − tdc = 0.


Ahora supongamos que ad − bc = 0 y probemos que A y B son linealmente
dependientes. Si a = d = 0 entonces de la condición ad − bc = 0 se sigue que
bc = 0; luego o b = 0 o c = 0; en otras palabras, o A = O o B = O, y por lo tanto A
y B son linealmente dependientes. Enseguida suponemos que o a 6= 0 o d 6= 0;
tratemos el caso a 6= 0 pues el otro es muy similar. De la condición ad − bc = 0
se sigue que
bc
d= ,
a
1.3. Suma de vectores y multiplicación de un vector por un escalar 13

y por lo tanto      
c c c a c
B =   =   =   = A,
d bc a b a
a

luego B es múltiplo escalar de A y por consiguiente A y B son linealmente


dependientes.2

Ejercicio 1.5. Termine la prueba del teorema anterior probando que si ad −


bc = 0 y d 6= 0 entonces A = db B.

Ejercicio 1.6. Pruebe que dos vectores A y B son linealmente independientes


si y sólo si cualesquiera sean r y s escalares,

rA + sB = O ⇒ r = 0 y s = 0.
   
1 0
Los vectores E1 =   y E2 =   son particularmente importantes. Son
0 1
linealmente independientes (afirmaciónque
 debeprobar
 el lector) y todo vector
x 1
del eje x puede escribirse en la forma:   = x  , ası́ como todo vector del
0 0
   
0 0
eje y puede escribirse en la forma:   = y  ; es decir, los vectores E1 y E2
y 1
generan los ejes x y y, respectivamente. Puesto que
     
x 1 0
X =   = x   + y   = xE1 + yE2 , (1.1)
y 0 1

podemos expresar todo vector del plano como la suma de un vector del eje x y
un vector del eje y.

Ejemplo 1.6. Por ejemplo,


     
−1 1 0
U =   = (−1)   + 3   = (−1)E1 + 3E2 .
3 0 1
14 Vectores en el plano cartesiano

Cuando escribimos un vector como lo acabamos de hacer decimos que lo


hemos expresado como una combinación lineal de los vectores E1 y E2 . Sobre
el tema de combinaciones lineales volveremos un poco más adelante. Por el
momento agregamos que, debido a lo anterior, la pareja de vectores {E1 , E2 }
es llamada base canónica o estándar de R2 , y a la expresión (1.1) la llamamos
descomposición canónica del vector X.  
x
La descomposición canónica permite ilustrar el punto   como el cuarto
y
     
x 0 0
vértice de un rectángulo cuyos otros tres vértices son  ,   y   (véase
0 0 y
la Figura 1.4).
De manera más general podemos obtener una interpretación geométrica
     
x u x+u
de la suma de vectores   +   =   como sigue. Para simplificar
y v y+v
supongamos que las coordenadas de los vectores son todas positivas. Comen-
     
0 x x
cemos con el triángulo con vértices  ,  ,  ; lo trasladamos parale-
0 0 y
lamente a él mismo de tal manera que su primer vértice se mueve a lo largo
 
u
del segmento dirigido desde el origen al punto   hasta que coincida con es-
v
te último punto; entonces los otros dos vértices del triángulo coincidirán con
   
u+x u+x
 y , respectivamente (véase la Figura 1.10). Luego, la suma de
v v+y
   
x u
los vectores X =   y U =   puede obtenerse gráficamente trasladando
y v
el segmento dirigido desde O a X, paralelamente a él mismo de tal manera
que su punto inicial se mueve sobre el segmento dirigido desde O a U hasta
que quede superpuesto sobre el punto U . El nuevo punto final del segmento
dirigido representa al vector U + X, y éste será el cuarto vértice de un paralelo-
1.3. Suma de vectores y multiplicación de un vector por un escalar 15

y x+u

y+v
b

x

y
b

b b
u
 x+u

v v

Figura 1.10: Regla del paralelogramo

gramo cuyos otros tres vértices son U , O y X. El procedimiento descrito de


sumar vectores gráficamente se conoce como regla del paralelogramo o, tam-
bién, regla del triángulo, y es aún válido si una o ambas coordenadas de los
vectores son negativas o cero. Invitamos al lector a que verifique la regla del
paralelogramo en otros casos.
Aunque las pruebas de las propiedades de la suma y la multiplicación por
escalar son consecuencia de propiedades conocidas sobre la aritmética de los
números reales, es instructivo que el lector verifique por su cuenta tales pro-
piedades apelando a la interpretación geométrica de las operaciones.

Ejercicio 1.7. Verifique las propiedades de la suma y multiplicación por esca-


lar utilizando el procedimiento gráfico.

Es posible que el procedimiento gráfico produzca un segmento de recta


si sumamos dos múltiplos escalares de un mismo vector; inclusive, puede
resultar en el origen cuando sumamos un vector con su inverso aditivo.

Ejemplo 1.7. La Figura 1.11 ilustra diferentes situaciones que resultan de


16 Vectores en el plano cartesiano

2

4

4

3

1

2

3

1

−3

−1

Figura 1.11: Ilustración de operaciones geométricas

   
1 3
operar geométricamente con los vectores A =   y B =  ; se muestran
2 1
las sumas A + B, A + A y B + (−B).

El inverso aditivo de un vector puede usarse para definir la noción de dife-


rencia entre dos vectores (véase la Figura 1.12).

Definición 1.5. Sean X y U vectores del plano. Definimos la diferencia X − U


por:

X − U = X + (−U ).
1.3. Suma de vectores y multiplicación de un vector por un escalar 17

X-U
U

-U

Figura 1.12: Inverso aditivo y diferencia de vectores

Usando coordenadas,
         
x u x −u x−u
  −   = X − U = X + (−U ) =   +   =  .
y v y −v y−v

Puesto que (X − U ) + U = X + ((−U ) + U ) = X + O = X, vemos que X − U


es el vector que sumado a U nos da el vector X. Luego, si movemos X − U
paralelamente a él mismo hasta que su punto inicial se superponga sobre U ,
obtenemos el segmento de recta dirigido desde U hasta X.
La diferencia de vectores no es una operación conmutativa:
   
−3 2
Ejemplo 1.8. por ejemplo si A =   y B =   entonces
1 5
       
−3 2 −3 − 2 −5
A−B = − = =  y
1 5 1−5 −4
       
2 −3 2 − (−3) 5
B−A= − =  =  .
5 1 5−1 4
18 Vectores en el plano cartesiano

De hecho U − X es el opuesto de X − U pues el uso apropiado de las pro-


piedades de la suma y multiplicación por escalar justifican las igualdades
U − X = (−1)(−U ) + (−1)X = (−1)((−U ) + X) = (−1)(X + (−U )) = −(X − U ).
Finalizamos esta sección retomando los conceptos de dependencia e inde-
pendencia lineal. La afirmación fundamental es la siguiente:

Teorema 1.2. Todo vector del plano puede escribirse (o descomponerse), de


manera única, como una combinación lineal de dos vectores linealmente in-
dependientes.

“Prueba”. Preferimos explicar esta afirmación mediante un procedimiento


gráfico que ilustramos en la Figura 1.13 (una prueba rigurosa, que emplea las
coordenadas de los vectores, la dejamos como un ejercicio al lector). Supon-
gamos que los vectores X y U son linealmente independientes y sean LX y LU ,
respectivamente, las rectas generadas por ellos; sea Y cualquier otro vector
del plano. Si Y está en la recta generada por X entonces Y = rX + 0U para
algún escalar r. Similarmente, si Y está en la recta generada por U entonces
Y = 0X + sU para algún escalar s. Si Y no pertenece a ninguna de dichas rec-
tas entonces procedemos como sigue. Por el punto Y trazamos dos rectas: L′U ,
paralela a la recta LU , y L′X , paralela a la recta LX . La recta L′U corta la recta LX
en el punto W ; la recta L′X , por su parte, corta la recta LU en el punto Z. Por
lo tanto los vectores W y Z son múltiplos escalares de X y U respectivamente;
es decir, existen escalares, r y s tales que W = rX y Z = sU . Además, por la
regla del paralelogramo, Y = W + Z = rX + sU .
La unicidad de la que se habla en la afirmación radica precisamente en que
los vectores X y U son linealmente independientes: si Y = rX + sU y también
Y = r′ X + s′ U entonces rX + sU = r′ X + s′ U ; luego, (r − r′ )X = (s′ − s)Y . Si
s′ −s
tuviéramos r 6= r′ entonces X = r−r ′
U, con lo cual X y U serı́an linealmente
dependientes. Por consiguiente r = r′ . El mismo tipo de razonamiento nos per-
1.3. Suma de vectores y multiplicación de un vector por un escalar 19

y L′u

Lu
L′x

Y
Z

Lx

W
X

Figura 1.13: Ilustración de la descomposición de un vector

mite concluir que s = s′ , y entonces hay unicidad en la escritura de Y como


combinación lineal de X y U . 2
El cálculo preciso de los escalares r y s requiere manipulaciones algebrai-
cas como se muestra en el siguiente ejemplo.

     
−2 3 −1
Ejemplo 1.9. Hallemos los escalares r y s tales que   = r   + s  .
1 1 −2
La Figura 1.14 muestra el diagrama de la descomposición. Para calcular los
valores de r y s resolvemos el sistema de dos ecuaciones de primer grado con
20 Vectores en el plano cartesiano

 1

−2 2
1
3

1

−3

−1

−1

−2

Figura 1.14: Ilustración

dos incógnitas que se obtiene a partir de la igualdad anterior:

−2 = 3r − s

1 = r − 2s.

Si multiplicamos la primera de estas dos ecuaciones por −2 y el resultado lo


sumamos con la segunda ecuación obtenmos 5 = −5r; luego r = −1. Este valor
lo reemplazamos en cualquiera de las dos ecuaciones del sistema para hallar
el valor de s; éste es s = −1.

La “prueba”que hemos dado del teorema anterior nos proporciona una com-
prensión gráfica del contenido. Una prueba rigurosa requiere utilizar coorde-
nadas. En el siguiente ejercicio se pide hacer la prueba con coordenadas; el
lector debe tener presente el teorema sobre la caracterización de la dependen-
cia lineal de vectores.
1.4. Magnitud y dirección de un vector. Ángulo entre vectores. 21
   
a c
Ejercicio 1.8. Sean A =   y B =   dos vectores linealmente indepen-
b d
 
α
dientes. Sea P =   cualquier vector del plano. Demuestre que existen es-
β
calares r y s únicos tales que P = rA + sB.

1.4. Magnitud y dirección de un vector. Ángulo entre vecto-


res.
 
x
Definición 1.6. La magnitud o norma de un vector X =  , denotada por
y
kXk, es la cantidad
 
x p
kXk =   = x2 + y 2 .

y

   
2 −4
Ejemplo 1.10. Las magnitudes de los vectores A =   y B =   son:
3 1
√ √ p √
kAk = 22 + 32 = 13 y kBk = (−4)2 + 12 = 17. La magnitud del del vector

nulo es kOk = 02 + 02 = 0.

Como la raı́z cuadrada de un número es no negativa entonces la magnitud


de un vector nunca es negativa. De hecho el único vector con magnitud 0 es el
vector nulo ya que la ecuación

x2 + y 2 = 0,

tiene como única solución x = 0 y y = 0; en cualquier otro caso la magnitud es


positiva.
El Teorema de Pitágoras nos proporciona la interpretación geométrica de
     
x x 0
la magnitud de un vector. El triángulo con vértices  ,   y   es
y 0 0
22 Vectores en el plano cartesiano

|| x
||X X= y

x
0
 
x
0 0

Figura 1.15: Magnitud de un vector

 
x
rectángulo (véase la Figura 1.15); la magnitud del vector X =   es la lon-
y
gitud de la hipotenusa de dicho triángulo y representa la distancia entre el
origen y el punto X. De manera más general tenemos la siguiente definición:
   
x u
Definición 1.7. Sean X =   y U =   puntos del plano; la ecuación
y v
 
x−u p
kX − U k =  = (x − u)2 + (y − v)2 ,

y−v

define la distancia entre los puntos X y U que simbolizamos por dist(X, U ).

El paralelogramo con vértices O, X, U y X − U de la Figura 1.16 justifi-


ca geométricamente la definición: los segmentos XU y O(X − U ) tienen igual
longitud.
     
7 1 3
Ejemplo 1.11. El triángulo con vértices A =  , B =   y C =   es
−7 −5 1
isósceles pues
p p √ √
dist(A, B) = kA − Bk = (7 − 1)2 + (−7 − (−5))2 = 62 + (−2)2 = 36 + 4 = 40,
p p √ √
dist(B, C) = kB − Ck = (1 − 3)2 + (−5 − 1)2 = (−2)2 + (−6)2 = 4 + 36 = 40,
p p √ √
dist(A, C) = kA − Ck = (7 − 3)2 + (−7 − 1)2 = 42 + (−8)2 = 16 + 64 = 80.
1.4. Magnitud y dirección de un vector. Ángulo entre vectores. 23

y U

||X

U|
|
X

O
x

X-U

-U

Figura 1.16: Distancia entre puntos

La magnitud tiene las siguientes propiedades:


P1 kXk ≥ 0 y kXk = 0 si y sólo si X = O,
P2 krXk = |r|kXk,
P3 kX + U k ≤ kXk + kU k.
Ya hemos comentado acerca de la primera propiedad. En cuanto a la se-
gunda, para cualquier escalar r tenemos:
 
rx p
krXk =   = (rx)2 + (ry)2

ry
p
= r2 (x2 + y 2 )
p
= |r| x2 + y 2

= |r|kXk.
24 Vectores en el plano cartesiano

y X+U

||U ||
|
U|
+
||X
X

|
O
||X |
x

Figura 1.17: Desigualdad triangular

La tercera propiedad recibe el nombre de desigualdad triangular porque, si


los vectores X y U son linealmente independientes, los lados del triángulo con
vértices O, X y X + U tienen longitudes kXk, kU k y kX + U k (véase la Figura
1.17), y la longitud de un lado de un triángulo es menor que la suma de las
longitudes de los otros dos lados. Desde luego, podemos dar una prueba ri-
gurosa de la desigualdad triangular sin apelar a la visualización gráfica. Tal
prueba es consecuencia de la desigualdad de Cauchy-Schwarz que veremos
en la próxima sección.
En Geometrı́a Analitı́ca hay dos problemas fundamentales de los cuales nos
vamos a ocupar en este curso. El primero consiste en hallar el conjunto de los
puntos del plano cartesiano que satisfacen una o más condiciones expresadas
como igualdades y/o desigualdades en las variables x y y. El segundo pro-
blema es el recı́proco del anterior; es decir, dado un lugar geométrico, es decir,
dado un conjunto de puntos del plano cartesiano, hallar las igualdades y/o de-
sigualdades que satisfacen las coordenadas x y y de los puntos pertenecientes
a dicho lugar geométrico. Un ejemplo sencillo pero ilustrativo (e importante)
1.4. Magnitud y dirección de un vector. Ángulo entre vectores. 25

de lo anterior lo constituye el lugar geométrico de una circunferencia.

Definición 1.8. Una circunferencia es el conjunto de los puntos del plano


que equidistan de otro punto llamado centro. La distancia de los puntos de la
circunferencia al centro se llama radio.
 
x
Si X =   es un punto cualquiera de la circunferencia K con centro en
y
 
h
C =   y radio r entonces kX − Ck = r y por lo tanto
k

 
x−h p
= (x − h)2 + (y − k)2 = r.
 

y−k

 
x
Por lo tanto los puntos   pertenecientes a la circunferencia K satisfacen la
y
ecuación
(x − h)2 + (y − k)2 = r2 (1.2)
 
x
De otra parte, reversando los pasos anteriores, se puede ver que si   satis-
y
face la ecuación (1.2), entonces pertenece a la circunferencia K.

Ejemplo 1.12. La ecuación de la circunferencia con centro en el origen y radio


igual a uno es
x2 + y 2 = 1.

A esta circunferencia la llamamos circunferencia unitaria, y a sus puntos los


llamamos vectores unitarios. Los vectores canónicos E1 y E2 son ejemplos de
√ √
vectores unitarios pues: kE1 k = 12 + 02 = 1 = 02 + 12 = kE2 k.

A partir de todo vector distinto del vector cero podemos obtener un vector
1
unitario de la siguiente forma: si X 6= O entonces el vector U = kXk
X es unitario
26 Vectores en el plano cartesiano

y
X

1
U= ||X||
X
x

Figura 1.18: Normalización de un vector

ya que
1 1 kXk
kU k = X = kXk = = 1.

kXk kXk kXk
1
El proceso de obtener el vector U = kXk
X a partir del vector X 6= O se llama
normalización del vector X.
 
1 √ √
Ejemplo 1.13. Si X =   entonces kXk = 12 + 12 = 2. Luego, al normali-
1
zar el vector X obtenemos
   
1
1 1  √2 
U=√ = .
2 1 √1
2

Comentario 1.2. Observemos que el vector normalizado U es un múltiplo


escalar del vector X y por lo tanto pertenece a la recta generada por éste.
(Véase la Figura 1.18)
 
x
Supongamos que X =   es un vector no nulo. El ángulo φ ∈ [0, 2π) en
y
posición estándar cuyo lado terminal es el rayo {rX : r > 0} es denomina-
do la dirección del vector X, y escribimos dir(X) = φ (véase la Figura 1.19).
Sabemos de nuestro curso de trigonometrı́a que cualquier otro ángulo ψ en
posición estándar cuyo lado terminal sea también el rayo {rX : r > 0} es de la
forma ψ = φ + 2kπ, donde k es algún número entero. Además los valores de las
funciones trigonométricas de φ y ψ son iguales, y están relacionadas con las
1.4. Magnitud y dirección de un vector. Ángulo entre vectores. 27

y
X

φ
x

Figura 1.19: Dirección de un vector

y
cosφ 
X= ||X|| senφ

cosφ

φ senφ
x

Figura 1.20: Forma polar de un vector

coordenadas del vector X de la siguiente forma:


y x
senφ = , cosφ = .
kXk kXk
Estas relaciones nos permiten escribir el vector X en la llamada forma polar
(véase la Figura 1.20)
     
x kXkcosφ cosφ
X= =  = kXk  .
y kXksenφ senφ
 
cosφ
Observemos que el vector   es unitario pues cos2 φ + sen2 φ = 1 para
senφ
cualquier ángulo φ. Además, en la forma polar podemos usar cualquier ángulo
con lado terminal igual al del ángulo φ.
 
−2
Ejemplo 1.14. Para calcular la dirección φ del vector A =   podemos usar
−2
28 Vectores en el plano cartesiano

la función tangente ası́:


−2
tanφ = = 1;
−2
puesto que el punto A está en el cuadrante III concluimos que
π 5π
φ = π + Arctan(1) = π + = .
4 4
La forma polar del vector A es por lo tanto
     
5π 5π
cosφ p cos 4 √ cos 4
A = kAk   = (−2)2 + (−2)2   = 8 .
senφ sen 5π
4
sen 5π
4

Finalizamos la sección definiendo la noción de ángulo entre vectores. Si X y


U son dos vectores no nulos con direcciones φ y ψ respectivamente, definimos
el ángulo entre X y U , denotado ∡(X, U ), por:


|φ − ψ|,

si |φ − ψ| ≤ π,
∡(X, U ) =

2π − |φ − ψ|, si |φ − ψ| > π.

El ángulo θ entre dos vectores es entonces un valor en el intervalo cerrado


[0, π], y toma uno de los dos extremos cuando un vector es un múltiplo escalar
del otro: si U = rX con r > 0, entonces φ = ψ en cuyo caso θ = 0; en el caso
U = rX con r < 0, φ = π + ψ o ψ = π + φ, y por lo tanto θ = π. En la Figura 1.21
ilustramos el ángulo entre dos vectores. Observemos que ∡(X, U ) = ∡(U, X).

Definición 1.9. Sean X y U dos vectores del plano. Diremos que X y U son
ortogonales si el ángulo entre ellos es π/2 (90◦ ).

Los vectores canónicos E1 y E2 son un ejemplo de vectores ortogonales pues


dir(E1 ) = 0 y dir(E2 ) = π/2. En la próxima sección daremos una caracterización
de la ortogonalidad de vectores.
   
1 2
Ejemplo 1.15. Consideremos los vectores A = √  y B =  . Sean φ y ψ
3 −2

las direcciones de A y B, respectivamente. Puesto que tan φ = 3 y A está en el
1.5. Producto escalar o producto punto 29

y
X

x
θ

Figura 1.21: Ángulo entre vectores

cuadrante I, la dirección de A es φ = π3 . De otra parte, B está en el cuadrante


−2
IV y tan ψ = 2
= −1; por lo tanto ψ = 2π + arctan(−1) = 2π − π4 = 7π
4
. Se sigue que

π 7π 17π 17π
|φ − ψ| = | − |=|− |= > π,
3 4 12 12

por consiguiente
17π 7π
∡(A, B) = 2π − = .
12 12

1.5. Producto escalar o producto punto


La tercera operación entre vectores es el producto escalar que definimos a
continuación.
   
x u
Definición 1.10. Sean X =   y U =   vectores del plano. El producto
y v
escalar o producto punto entre X y U , denotado por X · U , está definido por

X · U = xu + yv.

El resultado de esta operación es un número real (o escalar) obtenido al


sumar el producto de las primeras coordenadas al producto de las segundas
coordenadas.
30 Vectores en el plano cartesiano
   
2 −4
Ejemplo 1.16. Por ejemplo, si A =   y B =   entonces A · B = 2 · (−4) +
3 1
3 · 1 = −8 + 3 = −5.

Hay varios casos especiales que debemos resaltar. Si U = E1 y U = E2


       
x 1 x 0
X · E1 =   ·   = x · 1 + y · 0 = x y X · E2 =   ·   = x · 0 + y · 1 = y,
y 0 y 1

es decir, obtenemos, respectivamente, las coordenadas x y y del vector X.


Por otra parte    
x x
X · X =   ·   = x2 + y 2 = kXk2 .
y y
A continuación listamos las propiedades del producto escalar que son con-
secuencia de la artimética de los números reales.
Sean U , X y Y vectores del plano y r un escalar cualquiera. Tenemos:
P1. (Propiedad conmutativa): X · U = U · X,
P2. (Propiedad distributiva): U · (X + Y ) = U · X + U · Y ,
P3. (Propiedad asociativa): (rX) · U = r(X · U ).
El producto escalar puede expresarse en términos geométricos involucran-
do el ángulo entre los vectores. Este resultado se utiliza a menudo como la
definición de producto escalar.
   
x u
Teorema 1.3. Sean X =   y U =   vectores no nulos del plano. Si
y v
θ = ∡(X, U ) entonces
X · U = kXkkU k cos θ.

Prueba. El caso especial en el que U es múltiplo escalar del vector X lo


dejamos al lector para que lo realice. Supongamos entonces que X y U son
linealmente independientes. Para la prueba en este caso utilizaremos un ar-
gumento geométrico en el que se emplea la Ley del coseno de la trigonometrı́a.
1.5. Producto escalar o producto punto 31

Los puntos O, X y U son los vértices de un triángulo en donde el ángulo θ


es opuesto al lado con extremos X y U . Por la Ley del coseno tenemos

kX − U k2 = kXk2 + kU k2 − 2kXkkU k cos θ;

pero

kX − U k2 = (X − U ) · (X − U )

=X ·X −X ·U −U ·X +U ·U

= kXk2 − 2X · U + kU k2 .

Por lo tanto

kXk2 − 2X · U + kU k2 = kXk2 + kU k2 − 2kXkkU k cos θ.

Después de cancelar los términos kXk2 y kU k2 obtenemos −2X·U = −2kXkkU k cos θ;


ahora dividimos por −2 ambos lados de esta última ecuación y llegamos al re-
sultado requerido.2

Ejercicio 1.9. Complete la prueba del teorema anterior demostrando el resul-


tado en el caso especial en el que el vector U es múltiplo escalar del vector
X.

Corolario 1.1. (Desigualdad de Cauchy-Schwarz) Sean X y U vectores del


plano. Entonces
|X · U | ≤ kXkkU k.

Prueba. Sea θ el ángulo entre los vectores X y U . Por el teorema anterior y


por el hecho de que | cos θ| ≤ 1 para cualquier ángulo θ, tenemos

|X · U | = kXkkU k cos θ = kXkkU k| cos θ| ≤ kXkkU k. 2

La desigualdad de Cauchy-Schwarz puede probarse sin hacer uso del teo-


rema anterior mediante un argumento netamente algebraico.
32 Vectores en el plano cartesiano

Ejercicio 1.10. Pruebe la desigualdad de Cauchy-Schwarz utilizando un ar-


gumento algebraico, sin apelar al teorema anterior.

Ejercicio 1.11. Pruebe la propiedad de la desigualdad triangular de la mag-


nitud de vectores utilizando la desigualdad de Cauchy-Schwarz.

Corolario 1.2. Dos vectores no nulos del plano, X y U , son ortogonales si sólo
si X · U = 0.

Prueba. Sea θ = ∡(X, U ). Del teorema anterior tenemos

X · U = kXkkU k cos θ.

Puesto que los vectores son no nulos entonces kXk 6= 0 6= kU k. Se sigue de la


ecuación anterior que X · U = 0 si y sólo si cos θ = 0. Pero θ ∈ [0, π], entonces la
última ecuación se verifica si y sólo si θ = π/2. 2
   
3 2
Ejemplo 1.17. Los vectores A =   y B =   (ver Figura 1.22) son
1 −6
ortogonales pues
A · B = 3 · 2 + 1 · (−6) = 6 − 6 = 0.

 
a
Ejemplo 1.18. Sean a y b números reales arbitrarios, y sean A =   y B =
b
 
−b
 . Entonces A · B = a · (−b) + b · a = −ab + ab = 0. Similarmente, A · (−B) =
a
a · b + b · (−a) = ab − ab = 0. Luego, A es ortogonal a B y (−B). La Figura 1.23
   
3 −1
ilustra este ejemplo con A =   y B =  .
1 3
1.5. Producto escalar o producto punto 33

y A= 3

1

O x

2

B= −6

Figura 1.22: Ilustración de vectores ortogonales

y
−1

B= 3

3

A= 1

O x

1

-B= −3

Figura 1.23: Ilustración de vectores ortogonales


34 Vectores en el plano cartesiano
Capı́tulo 2

La lı́nea recta. Ecuación general de primer


grado

2.1. La lı́nea recta: definición y condiciones que la determi-

nan
Excepto por la definición de “recta generada por un vector”, dada en la Sec-
ción 1.3, hasta el momento hemos usado las idea de recta en forma intuitiva
partiendo de la imagen visual que tenemos de lı́nea recta. En esta sección
abordaremos el tema en profundidad utilizando la herramienta de vectores
que hemos construido.

Definición 2.1. Una lı́nea recta en el plano cartesiano es un conjunto de pun-


 
x
tos   pertenecientes a R2 que verifican una ecuación general de primer
y
grado de la forma
ax + by + c = 0, (2.1)

donde a, b y c son números reales, con a y b no simultáneamente iguales a


cero.
 
(−b/a)t − c/a
Comentario 2.1. Podemos ver que si a 6= 0, todo punto   , t ∈ R,
t

35
36 La lı́nea recta. Ecuación general de primer grado

satisface la
ecuación (2.1), y si b 6= 0 entonces dicha ecuación se verifica para
t
los puntos   , t ∈ R; luego una lı́nea recta contiene infinidad de
(−a/b)t − c/b
puntos.
La ecuación (2.1) se acostumbra llamar forma general o ecuación general
de una lı́nea recta. Al multiplicar una ecuación general por un escalar diferen-
te de cero no se altera la lı́nea recta sino la forma de su ecuación. De hecho,
veremos más adelante que si una lı́nea recta está representada por las ecua-
ciones ax + by + c = 0 y αx + βy + γ = 0, entonces hay un único escalar r 6= 0 tal
que α = ar, β = br y γ = cr.
 
a
El vector N =  , cuyas componentes son los coeficientes de las variables
b
x y y en la ecuación general, es de gran importancia para la mejor comprensión
 
x0
de la lı́nea recta. Sea P =   un punto especı́fico de la recta L con ecuación
y0
 
x
general (2.1) y sea X =   otro punto cualquiera de dicha recta; entonces
y
ax + by + c = 0 y ax0 + by0 + c = 0. La resta de estas dos ecuaciones produce la
ecuación a(x − x0 ) + b(y − y0 ) = 0 que, escrita vectorialmente, adquiere la forma
   
a x − x0
 ·  = 0 ⇐⇒ N · (X − P ) = 0; (2.2)
b y − y0

es decir, el vector N es ortogonal a todo vector X − P con X ∈ L y L queda com-


pletamente determinada por N y P . Por lo anterior establecemos la siguiente
definción.

Definición 2.2. Sea L una lı́nea recta que pasa por un punto P . Decimos que
un vector no nulo N es normal a L si N es ortogonal a todo vector X − P con
X ∈ L.
2.1. La lı́nea recta: definición y condiciones que la determinan 37

En virtud de esta definición la ecuación (2.2) recibe el nombre de forma


normal o ecuación normal de la lı́nea recta. Es en realidad la misma ecuación
general pero escrita en un lenguaje vectorial. La forma normal no es única
pues depende del vector normal y del punto sobre la recta escogidos. Sin
embargo tenemos las siguiente proposición.

Proposición 2.1. Sea L una lı́nea recta que pasa por un punto P . Si los vec-
tores N y N ′ son ambos vectores normales a L entonces son linealmente de-
pendientes.
     

a a x0
Prueba. Escribamos N =  , N ′ =   y P =  . De acuerdo con el
b b′ y0
Teorema 1.1 debemos probar que se verifica la ecuación ab′ − ba′ = 0. Para esto
escribimos L en sus formas normales

N · (X − P ) = 0 y N ′ · (X − P ) = 0.
 

b
El punto Q =   + P está en L porque

−a
   
′ ′
a b
N ′ · (Q − P ) =   ·   = 0.
′ ′
b −a

Por lo tanto también se verifica N · (Q − P ) = 0. Pero esta última ecuación es


precisamente ab′ − ba′ = 0. 2

Comentario 2.2. De otra parte, podemos ver que si N es un vector normal a


una lı́nea recta L que pasa por un punto P , y N ′ es un vector no nulo múltiplo
escalar de N , digamos N ′ = rN , entonces N ′ también es normal a L pues,
cualquiera sea X ∈ L, N ′ · (X − P ) = (rN ) · (X − P ) = r[N · (X − P )] = r · 0 = 0.

Comentario 2.3. Se sigue de la proposición que todos los vectores normales a


una lı́nea recta con ecuación general ax + by + c = 0 son los múltiplos escalares
38 La lı́nea recta. Ecuación general de primer grado
 
a
no nulos del vector N =  .
b

Ejemplo 2.1. Hallemos una ecuación general de la recta L que pasa por el
   
−1 3
punto P =   con vector normal N =  . Esta recta tiene forma normal
3 5

     !
3 x −1
 ·   −   = 0.
5 y 3

Resolviendo el producto escalar obtenemos 3x+5y−(3·(−1)+5·3) = 3x+5y−12 =


0.
   
u 0
Ejemplo 2.2. La recta L generada por un vector U =   6=   es un
v 0
 
x
ejemplo fundamental de lı́nea recta. Recordemos que   ∈ L si y sólo si
y
   
x u
  = t   para algún escalar t. De esta igualdad vectorial se siguen las
y v
ecuaciones escalares x = ut y y = vt.
Como el vector U es distinto del vector cero entonces, o bien u 6= 0 o v 6= 0.
Por lo tanto el parámetro t puede despejarse de alguna de las dos ecuaciones
x x
escalares anteriores: si, por ejemplo, u 6= 0, entonces t = y por lo tanto y = v
u u
o, equivalentemente, vx−uy = 0, que tiene la forma de la ecuación de una lı́nea
recta con a = v, b = −u y c = 0.

En la recta generada por un vector no nulo, el origen pertenece a la recta.


Podemos ampliar esta idea fijando un punto del plano y considerando una
recta que pase por dicho punto y que sea “paralela” a un vector no nulo (véase
la Figura 2.1).
2.1. La lı́nea recta: definición y condiciones que la determinan 39

y
P+U
b
P+ 21 U
b
Pb

P-Ub
U
P-2Ub
O x

Figura 2.1: Recta dirigida

Definición 2.3. Sea P un punto del plano y sea U un vector no nulo. La recta
dirigida por el vector U que pasa por P es el conjunto de puntos
n o
X ∈ R2 : X = P + tU, t ∈ R . (2.3)
 
−1
Ejemplo 2.3. La recta L dirigida por el vector U =   y que pasa por el
2
 
3
punto P =   se ilustra en la Figura 2.2. Dicha recta es el conjunto
1
(        )
x x 3 −1
L =   ∈ R2 :   =   + t   , t ∈ R
y y 1 2
(      )
x x 3 − t
=   ∈ R2 :   =  ,t ∈ R .
y y 1 + 2t

La igualdad vectorial (2.3) equivale a dos ecuaciones escalares; de hecho,


     
x x0 u
si escribimos X =  , P =   y U =   entonces
y y0 v

X = P + tU ⇐⇒ x = x0 + ut y y = y0 + vt. (2.4)

Las ecuaciones escalares (2.4) se llaman ecuaciones paramétricas de la recta


dirigida por U y que pasa por P .
40 La lı́nea recta. Ecuación general de primer grado

−1

U= 2
3

b
P= 1

Figura 2.2: Ilustración

Un procedimiento similar al que hicimos un poco antes con la recta gene-


rada por un vector, lo podemos replicar en este caso. Si u 6= 0 y v 6= 0 entonces

x − x0 y − y0
x = x0 + ut y y = y0 + vt ⇐⇒ =
u v
⇐⇒ vx − vx0 = uy − uy0

⇐⇒ vx − uy + uy0 − vx0 = 0,

que tiene la forma general de la lı́nea recta con a = v, b = −u y c = uy0 −


vx0 . Los casos u 6= 0, v = 0 y u = 0, v 6= 0 son muy parecidos y conducen,
respectivamente, a las ecuaciones −uy + uy0 = 0 y vx − vx0 = 0. Ası́ que toda
recta que pasa por un punto y es dirigida por un vector es, en realidad, una
lı́nea recta de acuerdo con nuestra definición; dicho de otra manera, el punto
y el vector no nulo determinan una lı́nea recta.
Igualmente importante es el hecho de que toda lı́nea recta es expresable
como una recta dirigida por un vector no nulo al cual llamamos vector director
2.1. La lı́nea recta: definición y condiciones que la determinan 41

de la recta. Esta afirmación es el contenido de la siguiente proposición.

Proposición 2.2. Sea L una lı́nea recta con ecuación ax + by + c = 0, con a 6= 0.


Entonces
(        )
x x −c/a −b
L =   ∈ R2 :   =   + t ,t ∈ R .
y y 0 a
Comentario 2.4. La proposición nos dice especı́ficamente
  que L es expresable
−c/a
como la recta que pasa por el punto P =   y es dirigida por el vector
0
   
−b a
U =  , el cual es ortogonal al vector N =  . Si en la ecuación general
a b
de L, b es distinto de cero, entonces el lectorpuedeprobar que L es expresable
0
como la recta que pasa por el punto P =   y es dirigida por el vector
−c/b
 
−b
U =  .
a
Prueba. Denotemos por L′ el conjunto
(        )

x 2
x −c/a −b
L =  ∈R : =  + t ,t ∈ R ,
y y 0 a
 
x
y veamos que L = L′ . Supongamos inicialmente que   ∈ L. Puesto que
y
−c −b
a 6= 0, al despejar x de la ecuación de L obtenemos x = a
+ a
y. Entonces,
asignemos al parámetro t el valor t = ay . Se sigue que y = 0 + at y x = −c
a
− bt; es
   
x x
decir,   ∈ L′ . Recı́procamente, si   ∈ L′ , entonces y = at y x = −c a
− bt. De
y y
la primera de estas dos ecuaciones se sigue que t = ay ; este valor lo sustituimos
en la ecuación de x y obtenemos x = −c
a
− b ay , luego ax + by + c = 0 y por lo tanto
 
x
  ∈ L. 2
y
42 La lı́nea recta. Ecuación general de primer grado

Ejercicio 2.1. Sea L una lı́nea recta con ecuación ax + by + c = 0, con b 6= 0.


Pruebe que
(        )
x x 0 −b
L =   ∈ R2 :   =   + t ,t ∈ R .
y y −c/b a

Cuando una lı́nea recta se escribe en la forma de recta dirigida decimos que
está escrita en forma vectorial paramétrica. Una lı́nea recta admite múltiples
representaciones vectoriales paramétricas; veamos un ejemplo.
 
3
Ejemplo 2.4. La recta L que pasa por el punto P =   y con vector director
1
 
−1
U =   se ilustra en la Figura 2.3; es el conjunto
2
( ) (        )
x x 3 −1
X ∈ R2 : X = P + tU, t ∈ R =   ∈ R2 :   =   + t   , t ∈ R .
y y 1 2

Resolviendo de las ecuaciones paramétricas para el parámetro t obtenemos


x−3 y−1
t= −1
yt= 2
.
Al igualar estos valores obtenemos una ecuación general de
(  )
x
L, a saber: 2x + y − 7 = 0. Luego L =   ∈ R2 : 2x + y − 7 = 0 .
y
 
2
Ahora bien, el punto Q = P + U =   pertenece a L; además el vector V =
3
 
2
  es múltiplo escalar del vector U . Afirmamos que:
−4
(        )
x x 2 2
L =   ∈ R2 :   =   + s   , s ∈ R .
y y 3 −4

Para probar la afirmación basta verificar que el conjunto


(        )
x x 2 2
L′ =   ∈ R2 :   =   + s   , s ∈ R ,
y y 3 −4
2.1. La lı́nea recta: definición y condiciones que la determinan 43

2

b
Q= 3
−1

U= 2
3

b
P= 1

2

V= −4

L = L′

Figura 2.3: Ilustración

(  )
x
es igual al conjunto   ∈ R2 : 2x + y − 7 = 0 . Para esto empleamos el
y
 
x
mismo procedimiento que hicimos con la recta L: si   ∈ L′ , entonces de sus
y
ecuaciones paramétricas resolvemos para el parámetro s y obtenemos s = x−2
2
y−3
ys= −4
. Igualando estos valores llegamos a la ecuación 4x + 2y − 14 = 0, la
cual, al dividir por 2, resulta en 2x + y − 7 = 0. Los pasos son reversibles como
puede verificarlo el lector. Ası́ que L y L′ están completamente determinados
por la ecuación general 2x + y − 7 = 0 y por lo tanto, L = L′ .

La relación entre los vectores director y normal de una misma recta es de


ortogonalidad como lo muestra la siguiente proposición.

Proposición 2.3. Sea L una lı́nea recta con vector normal N y vector director
D. Entonces N y D son ortogonales.

Prueba. Sea P un punto de L. Entonces L tiene la forma vectorial paramétri-


44 La lı́nea recta. Ecuación general de primer grado

ca X = P + tD, t ∈ R y la forma normal N · (X − P ) = 0. Sustituyendo la pri-


mera de estas dos ecuaciones en la segunda, con el valor t = 1, obtenemos
0 = N · (P + D − P ) = N · D; luego N y D son ortogonales. 2

Proposición 2.4. Sea L una lı́nea recta. Si U y V son vectores directores de L


entonces son linealmente dependientes. Recı́procamente, si U y V son lineal-
mente dependientes y U es vector director de L entonces V también es vector
director de L.

Prueba. Supongamos primero que U y V son vectores directores de L. Esto


quiere decir que L puede expresarse de las formas
n o n o
X ∈ R2 : X = P + tU, t ∈ R y X ∈ R2 : X = Q + sV, s ∈ R ,

donde P y Q pertenecen a L. Consideremos el caso P 6= Q (el caso P = Q lo


dejamos al lector para que lo verifique). Entonces hay escalares t′ y s′ diferentes
de cero tales que Q = P + t′ U y P = Q + s′ V . Por lo tanto t′ U = Q − P = (−s′ )V ,
luego U = (−s′ /t′ )V y por lo tanto U y V son linealmente dependientes.
Ahora supongamos que U y V son linealmente dependientes y que U es
vector director de L. Entonces existe un escalar r 6= 0 tal que U = rV . De
la forma vectorial de L tenemos: X = P + tU = P + t(rV ) = P + (rt)V . Ahora
bien, como r es un escalar fijo, y el parámetro t toma todos lo valores reales,
entonces el producto s = rt es un parámetro que también toma todos los
valores reales. Por consiguiente L es expresable en la forma
n o
X ∈ R2 : X = P + sV, s ∈ R ,

luego V es vector director de L. 2

Comentario 2.5. Se sigue de esta proposición que todos los vectores directo-
res de una lı́nea recta con ecuación general ax + by + c = 0 son los múltiplos
 
−b
escalares no nulos del vector D =  .
a
2.1. La lı́nea recta: definición y condiciones que la determinan 45

Q
b
D= Q-P
P
x

Figura 2.4: Recta determinada por dos puntos

Podemos indagar sobre otras condiciones que determinan una lı́nea recta.
Quizá la más gráfica o intuitiva se refiere a la lı́nea recta determinada por
dos puntos distintos del plano. Si P y Q son dos puntos distintos del plano,
entonces la lı́nea recta cuya forma vectorial es
n o
2
X ∈ R : X = P + t(Q − P ), t ∈ R

pasa por los puntos P y Q. El punto Q se obtiene con t = 1 y P con t = 0. Esta


recta tiene como vector director D = Q − P y, en virtud del siguiente teorema,
la llamamos la lı́nea recta determinada por P y Q (véase la Figura 2.4).

Proposición 2.5. Sean P y Q dos puntos distintos del plano. Si L es cualquier


lı́nea recta que pasa por P y Q entonces
n o
2
L = X ∈ R : X = P + t(Q − P ), t ∈ R .
n o
Prueba. Escribamos L′ = X ∈ R2 : X = P + t(Q − P ), t ∈ R . Ya hemos visto
que P y Q pertenecen a L′ . Debemos probar que L = L′ . Supongamos que una
representación vectorial de L es
n o
L = X ∈ R2 : X = R + sD, s ∈ R ,

donde R ∈ L y D es un vector director de L. Puesto que P y Q son dos puntos


distintos pertenecientes a L existen escalares s′ y s′′ diferentes tales que P =
46 La lı́nea recta. Ecuación general de primer grado

−1
 y
P 2
b 
Q 3
1
b

Figura 2.5: Ilustración

1
R + s′ D y Q = R + s′′ D. Luego Q − P = (s′′ − s′ )D o D = (Q − P ).
− s′ s′′
Sea X = P + t(Q − P ) un punto cualquiera de L′ . Entonces

X = R + s′ D + t(s′′ − s′ )D = R + (ts′′ − ts′ + s′ )D;

por lo tanto X ∈ L. Recı́procamente, si X = R + sD es un punto cualquiera de


L, entonces
1 s − s′
X = R+sD = P −s′ D+sD = P +(s−s′ )D = P +(s−s′ ) (Q−P ) = P + (Q−P ),
s′′ − s′ s′′ − s′
luego X ∈ L′ , y por lo tanto L = L′ . 2
   
−1 3
Ejemplo 2.5. La lı́nea recta que pasa por los puntos P =   y Q =  
2 1
 
3 − (−1)
se ilustra en la Figura 2.5; tiene como vector director Q − P =  =
1−2
 
4
 , y por lo tanto una forma vectorial de la misma es
−1
(        ) (      )
x x −1 4 x x −1 + 4t
  ∈ R2 :   =   + t   , t ∈ R =   ∈ R2 :   =  ,t ∈ R .
y y 2 −1 y y 2−t
Debemos insistir que la anterior no es la única representación vectorial de
la recta que pasa por los puntos P y Q. Hay infinidad de representaciones
vectoriales de la misma que dependen del punto elegido sobre la recta y del
vector director escogido.
2.1. La lı́nea recta: definición y condiciones que la determinan 47

L
y

−1

P= 2
b

3

D= 1

Figura 2.6: Ilustración

Ejercicio 2.2. Encuentre otras tres representaciones vectoriales para la recta


del ejemplo anterior.

 
−1
Ejemplo 2.6. Consideremos la lı́nea recta L que pasa por el punto P =  
2
 
3
y con vector director D =   (ver Figura 2.6). Entonces un vector perpendi-
1
   
−1 x
cular a L es N =  . Por lo tanto X =   ∈ L si y sólo si
3 y

       
−1 x −1 −1
  ·   −   ·   = 0.
3 y 3 2

Al desarrollar las operaciones obtenemos la ecuación −x + 3y − (1 + 6) = 0, o


x − 3y + 7 = 0.

Ejercicio 2.3. Si ax + by + c = 0 y αx + βy + γ = 0 son ecuaciones generales de


una misma recta entonces existe un único escalar r 6= 0 tal que α = ra, β = rb
y γ = rc.
48 La lı́nea recta. Ecuación general de primer grado

L’
−3

4

x
b
−1

−1

Figura 2.7: Ilustración

2.2. Rectas paralelas y perpendiculares. Ángulo entre rec-


tas.
Definición 2.4. Dos lı́neas rectas diferentes L y L′ son paralelas, y escribimos
L k L′ , si sus vectores directores son linealmente dependientes.

Ejemplo 2.7. La recta L con forma vectorial


(     )
−1 −3
L = X ∈ R2 : X =   + t   t ∈ R
−1 4
 
−6
es paralela a la recta L′ con ecuación 8x+6y−12 = 0 porque el vector V =  
8
 
−3
es vector director de L′ y V = 2   (véase la Figura 2.7).
4
Las lı́neas rectas horizontales son las paralelas a la recta generada por E1
(eje x) y las verticales son las paralelas a la recta generada por E2 (eje y). Por
2.2. Rectas paralelas y perpendiculares. Ángulo entre rectas. 49

L’

b
x0 
x
P’= 0

L
b b
0
 x0 
P”= y0 P= y0

Figura 2.8: Rectas paralelas a los ejes

consiguiente, una recta L horizontal tiene una forma vectorial del tipo

( ) (        )
x x x 0 1
L= X ∈ R2 : X = P + tE1 , t ∈ R =   ∈ R2 :   =   + t   , t ∈ R ,
y y y0 0

 
x0
donde P =   ∈ L. De la forma vectorial deducimos las ecuaciones escala-
y0
res x = x0 + t y y = y0 , donde el parámetro t recorre el conjunto de los números
reales. Por lo tanto, independientemente del valor de t, la coordenada y de los
puntos de una recta horizontal permanece constante y por eso una ecuación
general de L es y = y0 o y − y0 = 0. Esta ecuación también puede obtenerse
 
0
fácilmente de la forma general con a = 0 y b = 1 porque el vector E2 =   es
1
ortogonal a cualquier lı́nea recta horizontal.

En forma completamente análoga, el lector puede verificar que una recta


 
x0
vertical L′ que pasa por el punto P =   tiene por ecuaciones paramétricas
y0
x = x0 , y = y0 + t, con t ∈ R, y por ecuación general x − x0 = 0 (véase la Figura
2.8).
50 La lı́nea recta. Ecuación general de primer grado

Comentario 2.6. Como dos lı́neas rectas tienen vectores directores linealmen-
te dependientes si y sólo si tienen vectores normales linealmente dependien-
tes entonces, la condición de paralelismo entre rectas se puede refrasear en
términos de vectores ortogonales; es decir, dos lı́neas rectas son paralelas si
sus vectores ortogonales son linealmente dependientes.

Para las lı́neas rectas no verticales tenemos, adicionalmente, el concepto


de pendiente que nos permite medir la inclinación de la recta con respecto al
eje x.
 
d1
Definición 2.5. Sea L una recta no vertical con vector director D =  . La
d2
d2
pendiente de L, denotada por m, es el cociente m = .
d1

Lo primero que debemos resaltar es que el valor de la pendiente m no de-


pende del vector director escogido porque si D′ también es vector director de
 
rd2 rd2 d2
L entonces D′ = rD =   para algún escalar r 6= 0, y por lo tanto = .
rd1 rd1 d1
Por consiguiente, si L tiene por ecuación general ax + by + c = 0, con a 6= 0, su
 
−b
pendiente es m = − ab pues D =   es vector director de L.
a

Ejemplo 2.8. La pendiente m de la lı́nea recta L con ecuación general 3x + 4y −


−3
25 = 0 es m = 4
.

m es
De otra parte, si   la pendiente de una lı́nea recta 
no   L, 
vertical con
d1 d1 d1
vector director D =   entonces m = dd12 y por lo tanto   =   =
d2 d2 d1 m
   
1 1
d1  . Por consiguiente   también es vector director de L.
m m
2.2. Rectas paralelas y perpendiculares. Ángulo entre rectas. 51

0

B= b b

1

D= m

Figura 2.9: Forma pendiente-intercepto

Comentario 2.7. De las definiciones de rectas paralelas y pendiente se deduce


de manera inmediata que dos rectas no verticales son paralelas si y sólo si sus
pendientes son iguales.
 
0
En una lı́nea recta no vertical L también destacamos su punto B =   de
b
intersección con el eje y. Al escalar b se le llama usualmente intercepto de la
 
−m
recta. Puesto que   es ortogonal a L, una ecuación general de L es enton-
1
ces −mx+ y − b = 0 o y = mx+ b, la cual es llamada la forma pendiente − intercepto
de L. Esta forma escalar de la ecuación de L es particularmente importante
porque contiene mucha información geométrica sobre la recta (véase la Figura
   
x0 x1
2.9). Si la recta no vertical L pasa por los puntos P =   y Q =   en-
y0 y1
 
x1 − x0
tonces Q − P =   es vector director de L y por lo tanto la pendiente de
y1 − y0
 
−y0
x
la recta es el cociente m = xy11 −x 0
. Más generalmente, si X =   es un punto
y
y−y0
arbitrario de L diferente de P entonces m = x−x0
. De aquı́ resulta la forma
escalar punto-pendiente de la ecuación de L, a saber: y − y0 = m(x − x0 ).

Definición 2.6. Sea L una recta no vertical con vector director D. Definimos
52 La lı́nea recta. Ecuación general de primer grado

1

D=
α m

Figura 2.10: Inclinación de un recta

el ángulo de inclinación de L, denotado α, por




dir(D), si dir(D) ≤ π,

α=

dir(−D), si π < dir(D) < 2π.

Visualmente, α es el ángulo medido en sentido antihorario desde el eje x


hasta encontrarse por vez primera la recta L; es, por definición, el ángulo de
inclinación de la recta generada por el vector director D. Ası́ que lı́neas rectas
paralelas tendrán todas el mismo ángulo de inclinación (véase la Figura 2.10).
La relación entre la pendiente y el ángulo de inclinación es el contenido de la
siguiente proposición.

Proposición 2.6. Sea L una lı́nea recta no vertical con pendiente m y ángulo
de inclinación α. Entonces m = tan α.
 
1
Prueba. El vector D =   es vector director de L. Sea θ = dir(D). Si
m
m > 0 entonces θ = α y por lo tanto m = tan θ = tan α; y si m < 0 entonces
α = dir(−D) = θ − π en cuyo caso m = tan θ = tan(θ − π) = tan α. 2

Definición 2.7. Dos lı́neas rectas L y L′ son perpendiculares, y escribimos


L ⊥ L′ , si sus vectores directores son ortogonales o, equivalentemente, si sus
vectores normales son ortogonales.
2.2. Rectas paralelas y perpendiculares. Ángulo entre rectas. 53

Ejemplo 2.9. Las lı́nea recta L con ecuación general 3x − 4y + 5 = 0 es per-


   
−1 6
pendicular a la lı́nea recta L′ con ecuación vectorial X =   + t  
2 −8
   
4 6
porque sus vectores directores D =   y D′ =   son ortogonales, pues
3 −8

D · D = 4 · 6 + 3 · (−8) = 24 − 24 = 0.

Un criterio eficiente de perpendicularidad de lı́neas rectas no verticales es


el siguiente.

Proposición 2.7. Sean L y L′ dos lı́neas rectas no verticales con pendientes m


y m′ respectivamente. Entonces L ⊥ L′ si y sólo si mm′ = −1.
   
1 1
Prueba. L y L′ tienen vectores directores D =   y D′ =   respecti-
m m′
vamente. Luego
   
1 1
L ⊥ L′ ⇐⇒ D · D′ = 0 ⇐⇒   ·   = 0
m m′

⇐⇒ 1 · 1 + m · m′ = 0

⇐⇒ 1 + mm′ = 0

⇐⇒ mm′ = −1. 2

Terminamos esta sección con el concepto de ángulo entre lı́neas rectas. Lo


que haremos es generalizar la idea de ángulo de inclinación. El lector puede
demostrar con todo rigor que dos lı́neas rectas L y L′ no paralelas concurren
en un punto, y dividen el plano en cuatro sectores o ángulos (véase la Figura
2.11). Visualmente, podemos definir el ángulo orientado desde la lı́nea recta
L hasta la lı́nea recta L′ como el ángulo barrido en sentido antihorario desde
uno cualquiera de los rayos de L hasta el primer rayo que nos encontremos de
L′ . Esta idea gráfica (que podrı́a ser suficiente en muchas de las aplicaciones)
54 La lı́nea recta. Ecuación general de primer grado

Figura 2.11: Ángulo entre rectas

y U y X

X U

x x

Figura 2.12: Ángulo orientado

puede precisarse usando los vectores directores de ambas rectas. Para este
efecto veamos primero la noción de ángulo orientado de vectores.

Definición 2.8. Sean X y U dos vectores no nulos con direcciones φ y ψ,


respectivamente. Definimos el ángulo orientado del vector X al vector U (ver
Figura 2.12), denotado por ∡hX, U i, como


ψ − φ

si ψ − φ ≥ 0,
∡hX, U i = (2.5)

2π + (ψ − φ) si ψ − φ < 0.

2.2. Rectas paralelas y perpendiculares. Ángulo entre rectas. 55

Ejemplo 2.10. El ángulo orientado del vector E1 al vector E2 es ∡hE1 , E2 i =


π/2 − 0 = π/2, mientras que el ángulo orientado del vector E2 al vector E1 es
∡hE2 , E1 i = 2π − π/2 = 3π/2.

Observación 2.1. Por lo general, el ángulo orientado del vector X al vec-


tor U es distinto al ángulo orientado del vector U al vector X. De hecho,
∡hX, U i = ∡hU, Xi si y sólo si X y U son linealmente dependientes, como lo
puede demostrar el lector. Por otro lado, a diferencia del ángulo entre dos vec-
tores que siempre está en el intervalo [0, π], el ángulo orientado de un vector a
otro puede tomar valores en el intervalo [0, 2π).

Ejercicio 2.4. Sean X y U dos vectores no nulos. Pruebe que ∡hX, U i =


∡hU, Xi = si y sólo si X y U son linealmente dependientes.

Ejercicio 2.5. Sean X y U dos vectores no nulos. Pruebe que ∡hX, U i−∡hX, −U i =
±π.

Ahora podemos definir el ángulo orientado entre dos rectas no paralelas.

Definición 2.9. Sean L y L′ dos lı́neas rectas no paralelas con vectores direc-
tores D y D′ respectivamente. Definimos el ángulo orientado de la recta L a la
recta L′ , denotado por ∡hL, L′ i, como

∡hD, D′ i si 0 < ∡hD, D′ i < π,



∡hL, L i = (2.6)
∡hD, −D′ i ′

 si π < ∡hD, D i < 2π.

Ejemplo 2.11. Consideremos las rectas L y L′ con ecuaciones generales x+y −


   
√ −1 −1
1 = 0 y 3x+y−2 = 0. Los vectores D =   y D′ = √  son, respectivamen-
1 3

te, vectores directores de L y L (véase la Figura 2.13). La dirección del vector
D es 3π/4, y la dirección del vector D′ es 2π/3. Por lo tanto el ángulo orientado
del vector D al vector D′ mide ∡hD, D′ i = 2π + (2π/3 − 3π/4) = 2π − π/12 = 23π/12,
56 La lı́nea recta. Ecuación general de primer grado

−1 

D´= 3

−1

D= 1

L

Figura 2.13: Ilustración

que es mayor que π. Luego, ∡hL, L′ i = ∡hD, −D′ i = 5π/3 − 3π/4 = 11π/12. De
otra parte, el ángulo orientado de D′ a D mide ∡hD′ , Di = 3π/4 − 2π/3 = π/12,
cantidad que es menor que π. Por lo tanto el ángulo orientado de L′ a L es
∡hL′ , Li = ∡hD′ , Di = π/12.

Comentario 2.8. El lector puede concluir de la Figura 2.11 que ∡hL, L′ i +


∡hL′ , Li = π. Lo invitamos a que haga una demostración de este hecho.

Cuando ninguna de las dos lı́neas rectas es vertical disponemos de una


fórmula que nos permite calcular el ángulo orientado de una recta a la otra, a
partir de las pendientes de las rectas.

Teorema 2.1. Sean L y L′ dos lı́neas rectas no verticales y no perpendiculares


con pendientes m y m′ , respectivamente. Si θ = ∡hL, L′ i entonces

m′ − m
tan θ = .
1 + m′ m

Prueba. Sean D y D′ vectores directores de L y L′ con direcciones φ y ψ, res-


pectivamente. Del Ejercicio 2.5, ∡hD, −D′ i = ∡hD, D′ i±π. Luego, tan(∡hD, D′ i) =
2.3. Proyección ortogonal sobre una lı́nea recta. Distancia de un punto a una recta.57

tan(∡hD, −D′ i); se sigue de la ecuación (2.6) que tan θ = tan(∡hD, D′ i). Ahora
bien, por la ecuación (2.5) tenemos que tan(∡hD, D′ i) = tan(ψ − φ), por consi-
guiente
tan ψ − tan φ m′ − m
tan θ = tan(ψ − φ) = = . 2
1 + tan ψ tan φ 1 + m′ m

Ejemplo 2.12. En las lı́neas rectas L y L′ del Ejemplo 2.11, m = −1 y m′ = − 3.
Por lo tanto, si θ es el ángulo orientado de L a L′ , tenemos
√ √
m′ − m − 3 − (−1) − 3+1
tan θ = = √ = √ .
1 + m′ m 1 + (− 3)(−1) 1+ 3

Como θ toma valores en el intervalo [0, π] concluimos que



3−1 √
θ = π − arctan √ = π − arctan(2 − 3).
3+1

Este último valor es 11π/12 de acuerdo con lo hallado en el Ejemplo 2.11. El


ángulo orientado de L′ a L es el suplemento del anterior, es decir, π/12.

2.3. Proyección ortogonal sobre una lı́nea recta. Distancia


de un punto a una recta.
Comenzamos la sección con la definición de proyección ortogonal de un
punto sobre una lı́nea recta. Está basada en el hecho de que dada una recta L
y un punto U del plano, hay una única recta que pasa por U y es perpendicular
a L.

Definición 2.10. Sea L una lı́nea recta y U un punto del plano. Definimos
la proyección ortogonal de U sobre L, denotada por PL (U ), como el punto de
intersección de L con la lı́nea recta que pasa por U y es perpendicular a L
(véase la Figura 2.14).

A continuación desarrollamos una fórmula que nos permite calcular con


relativa facilidad la proyección ortogonal de un punto sobre una recta.
58 La lı́nea recta. Ecuación general de primer grado

b U
L
b

PL (U)

Figura 2.14: Proyección ortogonal sobre una recta

Teorema 2.2. Sea L una lı́nea recta con ecuación general ax+by +c = 0 y sea U
un punto del plano. Entonces la proyección ortogonal de U sobre L está dada
por la ecuación
1   D·U −c
PL (U ) = (D · U )D − cN = D+ N, (2.7)
kDk 2 kDk2 kN k2
   
a −b
donde N =   y D =   son, respectivamente, los vectores normal y
b a
director de L dados por la ecuación general.

Prueba. La recta recta L′ que pasa por U y es perpendicular a L tiene


como vector director N y como vector normal D ya que estos vectores son,
respectivamente, los vectores normal y director de L. Por consiguiente, si
 
x
  = X = PL (U ), este punto verifica las ecuaciones normales de L y L′ , a
y
saber
N · X = −c y D · X = D · U. (2.8)

Ahora resolvemos este sistema para las componentes x y y del vector X. Mul-
tipliquemos la primera de las ecuaciones (2.8) por a y la segunda por −b, y
sumemos los resultados. Ası́,

−ac + (−b)(D · U ) = a(N · X) + (−b)(D · X)


2.3. Proyección ortogonal sobre una lı́nea recta. Distancia de un punto a una recta.59

= (aN − bD) · X
   !
a −b
= a  − b  · X
b a
   !
2 2
a b
=  +  ·X
ab −ab
 
a2 + b 2
=  ·X
0
   
2
kDk x
= · 
0 y

= kDk2 x,

Por lo tanto,
1  
x= (−b)(D · U ) − ac . (2.9)
kDk2
Análogamente, multiplicamos la primera de las ecuaciones (2.8) por b y la
segunda por a, sumamos los resultados y procedemos de manera similar para
hallar el valor de la componente y; llegamos al resultado

1  
y= a(D · U ) − bc . (2.10)
kDk2

Finalmente, las ecuaciones (2.9) y (2.10) son equivalentes a las ecuaciones


vectoriales
 
1  (−b)(D · U ) − ac
PL (U ) = 
kDk2 a(D · U ) − bc
   !
1 (−b)(D · U ) a
=   − c 
kDk2
a(D · U ) b
   !
1 −b a
= (D · U )   − c 
kDk2 a b
60 La lı́nea recta. Ecuación general de primer grado

b
U L

b
PL (U)
−c
N b
||N ||2
b
D.U
N D
||D||2
D
x

Figura 2.15: Descomposición de la proyección ortogonal

1  
= (D · U )D − cN ,
kDk2
lo cual prueba la primera igualdad en (2.7). La segunda igualdad en (2.7) se
sigue de la primera teniendo en cuenta que kN k2 = a2 + b2 = kDk2 . 2
Antes de dar un ejemplo de aplicación de esta fórmula es menester hacer
algunos comentarios sobre la misma.

Comentario 2.9. 1. La fórmula (2.7) expresa la proyección ortogonal como


una combinación lineal de los vectores D y N ; y estos vectores están
dados de acuerdo con la ecuación general con la que hemos expresado la
recta L (véase la Figura 2.15). De otra parte, si P es cualquier punto de
L entonces el escalar −c puede escribirse como N · P ya que N · P + c =
0; luego, podemos expresar la fórmula (2.7) en términos de un punto
conocido de la recta L, ası́:
D·U N ·P
PL (U ) = D + N. (2.11)
kDk2 kN k2

2. La fórmula (2.11) para la proyección ortogonal nos permite deducir la


invariancia de dicha expresión con respecto a los vectores director y nor-
mal utilizados. Más precisamente, D′ y N ′ son también vectores director
2.3. Proyección ortogonal sobre una lı́nea recta. Distancia de un punto a una recta.61

y normal de L entonces D = tD′ y N = sN ′ para algunos escalares t y s.


Reemplazando T y N en (2.11) tenemos

D·U N ·P
PL (U ) = D + N
kDk2 kN k2
(tD′ ) · U ′ (sN ′ ) · P
= (tD ) + (sN ′ )
k(tD′ )k2 k(sN ′ )k2
t(D′ · U ) s(N ′ · P )
= t 2 ′ 2 D′ + s 2 ′ 2 N ′
t kD k s kN k
D′ · U ′ N ′ · P ′
= D + N.
kD′ k2 kN ′ k2

3. En el caso particular c = 0, es decir, cuando L pasa por el origen, la


fórmula se reduce a
D·U
PL (U ) = D.
kDk2
Esta expresión suele llamarse la proyección del vector U sobre el vector D
y denotarse por PD (U ); es, en realidad, la proyección ortogonal del punto
U sobre la recta generada por el vector D (véase la Figura 2.16). Por
supuesto, no hay nada de especial con el vector D; la proyección de un
vector U con respecto a otro vector V es la proyección ortogonal de U
sobre la recta generada por V . En particular, la proyección de U sobre el
vector N , normal a L, es

N ·U
PN (U ) = N.
kN k2

4. La observación del anterior numeral y la fórmula (2.11), nos permiten


escribir la proyección ortogonal de U sobre L como

PL (U ) = PD (U ) + PN (P ),

donde D y N son, respectivamente, vectores director y normal cuales-


quiera de la recta L, y P es un punto arbitrario perteneciente a ella.
62 La lı́nea recta. Ecuación general de primer grado

b
U L

b
PN (U) b PL (U)
−c
N b
||N ||2
b
PD (U)
N
D
x

Figura 2.16: Proyección de un vector sobre otro vector

5. Todos los puntos de la lı́nea recta que pasa por U y es perpendicular a


L se proyectan ortogonalmente sobre el mismo punto, y si el punto U
está sobre la recta L entonces PL (U ) = U ; en este caso N · U + c = 0 y por
lo tanto,

1 h i D·U N ·U
U= (D · U )U + (N · U )N = U+ N = PD (U ) + PN (U ).
kDk2 kDk2 kN k2

6. Si U es ortogonal a D, D · U = 0 y por lo tanto,

−c −c
PL (U ) = N= N.
kDk 2 kN k2

Ejemplo 2.13. Hallemos de dos maneras la proyección ortogonal del punto


 
5
U =   sobre la recta L con ecuación general 2x + y + 1 = 0, primero, di-
9
rectamente de la definición, y después haciendo uso de la fórmula (2.7). Los
vectores director y normal a L que nos proporciona la ecuación general son,
   
−1 2
respectivamente, D =   y N =  . Luego, la recta L′ que pasa por U y
2 1
2.3. Proyección ortogonal sobre una lı́nea recta. Distancia de un punto a una recta.63

es perpendicular a L tiene por ecuación normal


       
−1 x −1 5
  ·   −   ·   = 0,
2 y 2 9

y por ecuación general

−x + 2y − (−5 + 18) = 0 ⇐⇒ x − 2y + 13 = 0.

Resolviendo el sistema de ecuaciones lineales

2x + y + 1 = 0 y x − 2y + 13 = 0
 
−3
obtenemos la proyección ortogonal de U sobre L, a saber, PL (U ) =  .
5
De otra parte, D · U = (−1) · (5) + 2 · 9 = −5 + 18 = 13. Luego, por la fórmula (2.7),
"    #      
1 −1 2 −13 − 2 −15 −3
PL (U ) = 13  −  = 1 = 1  =  .
(−1)2 + 22 2 1 5 26 − 1 5 25 5

Ejercicio 2.6. Sean A y B dos vectores no nulos ortogonales. Pruebe que


cualquiera sea el vector X del plano, X = PA (X) + PB (X).

Finalizamos la sección con una fórmula que nos permite calcular la distan-
cia de un punto a una lı́nea recta.

Definición 2.11. Sea L una lı́nea recta y sea U un punto del plano. Definimos
la distancia de U a L, denotada por dist(P, L), como la distancia entre U y la
proyección ortogonal de U a L; es decir,

dist(U, L) = kU − PL (U )k.

Teorema 2.3. Sea L una lı́nea recta con ecuación general ax + by + c = 0, y sea
 
u
U =  . Entonces
v
|au + bv + c|
dist(U, L) = √ .
a2 + b 2
64 La lı́nea recta. Ecuación general de primer grado
   
−b a
Prueba. Por el Ejercicio 2.6, U = PD (U )+PN (U ) donde D =   y N =  .
a b
Sea P el punto de intersección de L con la recta generada por N . Entonces,
por (2.11), PL (U ) = PD (U ) + PN (P ). Por lo tanto,

kU − PL (U )k = kPD (U ) + PN (U ) − (PD (U ) + PN (P ))k

= kPN (U ) − PN (P )k

N · U N ·P
= N− N

kN k2 kN k 2

N · U − N · P
= N

kN k2
|N · U − N · P |
= kN k
kN k2
|au + bv + c|
= √ . 2
a2 + b 2

2.4. Aplicaciones geométricas.


Aplicación 2.1. En esta aplicación vamos a precisar la noción de segmento
de recta dirigido al cual, con frecuencia, también se le denomina ((vector)), y la
vamos a utilizar para hallar el punto en el que concurren las medianas de un
triángulo.

Definición 2.12. Un segmento de recta dirigido u orientado es el conjunto de


puntos del plano situado entre dos puntos pertenecientes a una recta en el
cual uno de los puntos se denomina punto inicial y el otro punto final. Usual-
mente se ilustra con una flecha cuya punta se localiza en el punto final.

Nota 2.1. Cuando no haya lugar a confusión diremos, por simplicidad, ((segmento))
en lugar de ((segmento de recta)).

Podemos describir paramétricamente un segmento dirigido de tal forma


que la orientación del segmento se conserve a medida que el parámetro recorre
2.4. Aplicaciones geométricas. 65

O x

Figura 2.17: Segmento dirigido

todos los valores posibles: sean P y Q dos puntos distintos del plano; cualquier
−→
punto X del segmento dirigido de P a Q, denotado por P Q, queda descrito por
la ecuación vectorial paramétrica

X = P + t(Q − P ) = (1 − t)P + tQ, t ∈ [0, 1].

La palabra ((dirigido)) se captura al recorrer la recta determinada por P y


Q pero sólo desde el punto P hasta el punto Q, a medida que el parámetro
−→
t aumenta desde 0 hasta 1; gráficamente, dibujamos el segmento dirigido P Q
como la flecha con punto inicial P y punto final Q. (Véase la Figura 2.17).
El segmento de recta dirigido de Q a P puede entonces parametrizarse como

−→ n 2
o
QP = X ∈ R : X = Q + t(P − Q), t ∈ [0, 1] .

−→ −→
Como conjuntos, P Q y QP son iguales pero han sido recorridos de forma di-
ferente. Cuando el sentido del recorrido del conjunto no es relevante, simple-
mente hablamos del segmento de recta P Q.

Comentario 2.10. La parametrización que hemos dado al segmento dirigido


−→
P Q, aunque es muy utilizada, no es la única. En ocasiones es preferible usar
una parametrización diferente en la que el parámetro adquiera un significado
−→
especial. Por ejemplo, también podemos describir cualquier punto X de P Q
66 La lı́nea recta. Ecuación general de primer grado

mediante la ecuación
1
X =P +s (Q − P ),
kQ − P k
donde el parámetro s toma valores en el intervalo [0, kQ − P k]. Vemos que el
valor de s proporciona la distancia de X al origen P del segmento.

Con la parametrización inicial la distancia entre el punto P y cualquier


punto X del segmento P Q es

dist(X, P ) = kX − P k = k(P + t(Q − P )) − P k = kt(Q − P )k = tkQ − P k,

y entre los puntos X y Q,

dist(X, Q) = kX − Qk = k(1 − t)P + tQ − Qk = k(1 − t)P − (1 − t)Qk

= k(1 − t)(P − Q)k = |1 − t|kP − Qk

= (1 − t)kQ − P k.

En particular, cuanto t = 1 obtenemos la distancia entre los puntos P y Q,


−→
que, por definición, es la longitud o magnitud del segmento P Q, denotada por
−→
kP Qk, y si t = 1/2 obtenemos el llamado punto medio del segmento, a saber,
1
M = (P + Q).
2
Comentario 2.11. La razón entre las distancias dist(X, P ) y dist(X, Q) es

dist(X, P ) tkQ − P k t
= = .
dist(X, Q) (1 − t)kQ − P k 1−t
t
Cuando este cociente es un número racional lo escribimos en la forma =
1−t
m m
; ası́, t = , y por lo tanto,
n m+n
n m
X= P+ Q. (2.12)
m+n m+n

Una bonita ilustración del concepto de segmento dirigido es la que nos


permite probar que las medianas de un triángulo se cortan en un punto, y lo-
calizar dicho punto en el plano cartesiano. Las medianas del triángulo son los
2.4. Aplicaciones geométricas. 67

T b

A
X
O b
S x

Figura 2.18: Baricentro de un triángulo

segmentos de recta desde cada vértice al punto medio del lado opuesto. Si A,
B y C son los vértices de un triángulo, △ABC, y R, S y T son, respectivamente,
los puntos medios de los segmentos AB, BC y CA, entonces las medianas de
△ABC son los segmentos CR, AS y BT (véase la Figura 2.18). Notemos que
1 −→
R = (A + B). Si X es el punto del segmento dirigido RC tal que su distancia
2
al punto C es el doble de su distancia al punto R, entonces usamos (2.12) con
P = R, Q = C, m = 1 y n = 2: luego,
" #
2 1 2 1 1 1
X = R+ C = (A + B) + C = (A + B + C). (2.13)
3 3 3 2 3 3

El lado derecho de la ecuación (2.13) sólo depende de los vértices del triángulo,
1
y no de la mediana CR. Es decir, obtenemos el mismo punto, (A + B + C),
3
si razonamos con la mediana AS o con la mediana BT . Por lo tanto las tres
medianas se cortan en el punto X dado por (2.13). Este punto es llamado el
baricentro del triángulo.

Ası́ como hemos definido la magnitud de un segmento dirigido, podemos


68 La lı́nea recta. Ecuación general de primer grado

también definir su dirección.


−→ −→
Definición 2.13. Sea P Q un segmento dirigido. Definimos la dirección de P Q,
−→
denotada por dir(P Q), como
−→
dir(P Q) = dir(Q − P ).

Comentario 2.12. De nuestras definiciones podemos observar que, cualquie-


−−→ −−→
ra sea el punto X, kOXk = kXk y dir(OX) = dir(X); aunque la representación
−−→
gráfica del vector X coincide con la del segmento dirigido OX, debemos recal-
−−→
car que X es un punto del plano cartesiano mientras que OX es un segmento
−−→
de recta. Esta correspondencia entre X y OX sugiere definir otras nociones
geométricas y algebraicas para segmentos dirigidos.
−→ −→
Definición 2.14. Sean P Q y P R segmentos dirigidos desde el punto P . Defi-
−→ −→ −→ −→
nimos el ángulo entre P Q y P R, denotado por ∡(P Q, P R), como
−→ −→ −−−−→ −−−−→
∡(P Q, P R) = ∡(Q − P , R − P ).
−→ −→ −→ −→
Notemos que ∡(P Q, P R)=∡(P R, P Q). Las definiciones tienen un sentido geométri-
co muy claro, como se aprecia en la Figura 2.19. El triángulo con vértices
P , Q y R se traslada paralelamente a si mismo desde el punto P usando como
guı́a el segmento OP , hasta que el punto P coincida con el origen; entonces,
los puntos Q y R quedan superpuestos a los puntos Q − P y R − P , respectiva-
mente.
   √ 
1 −1 3+1
Ejemplo 2.14. Si P =  , Q =   y R =   entonces Q − P =
−3 −1 −2
  √ 
−2 3
  y R − P =  . Luego
2 1
  √ !
−→ −→ −2 3 3π π 7π
∡(P Q, P R) = ∡   ,   = − = .
2 1 4 6 12
2.4. Aplicaciones geométricas. 69

y R

R-P

Q-P

O x

Figura 2.19: Ángulo entre segmentos dirigidos

Comentario 2.13. Podemos sumar segmentos dirigidos que parten de un mis-


mo punto, multiplicarlos por un escalar e, inclusive, hacer el producto punto
entre ellos. La idea es siempre la misma: utilizar los puntos final e inicial de
la flecha para definir tales operaciones. Sin embargo estas operaciones no son
necesarias en nuestro curso de Geometrı́a Analı́tica y por eso no profundiza-
remos en el tema. Sólo diremos que la idea de considerar segmentos dirigidos
conduce al concepto de ((vector libre)) que es útil en Fı́sica. Más exactamen-
−→ −→
te, dos segmentos dirigidos P Q y RS se consideran equivalentes, y escribimos
−→ −→ −→ −→ −→ −→
P Q ∼ RS si y sólo si kP Qk = kP Rk y dir(P Q) = dir(RS). Esta noción de equi-
valencia nos permite agrupar los segmentos dirigidos en conjuntos disjuntos,
cada uno de los cuales se llama clase de equivalencia, y un segmento dirigido
perteneciente a una clase de equivalencia se llama representante de la clase.
Para las clases de equivalencia podemos definir operaciones algebraicas cuyo
resultado es independiente del representante de la clase.
70 La lı́nea recta. Ecuación general de primer grado
Capı́tulo 3

Geometrı́a de las transformaciones linea-


les del plano

En este capı́tulo vamos a estudiar un tipo especial de funciones cuyo do-


minio y codominio es el plano y que son de suma importancia, no solamente
en geometrı́a vectorial, sino también en otras áreas de la matemática y en sus
aplicaciones. Tales funciones son llamadas transformaciones lineales, y por la
naturaleza del curso, el énfasis del estudio lo pondremos en algunos aspectos
geométricos de estas transformaciones.

3.1. Definición de transformación lineal y primeros ejem-


plos.

En este texto utilizamos la notación estándar de matemáticas para denotar


funciones: si una función f tiene por dominio el conjunto A, y por codominio
el conjunto B, escribimos f : A → B, y decimos ((f es una función de A en B)).
Recordemos que si x es un elemento del conjunto A, el valor y perteneciente a
B que la función f le asigna a x se llama imagen de x por (o bajo) f , y se denota
mediante el sı́mbolo f (x) el cual se lee ((f de x)). El rango de f , denotado por
f (A), es el conjunto de las imágenes: f (A) = {f (x)|x ∈ A}. Cuando el dominio

71
72 Geometrı́a de las transformaciones lineales del plano

y el codominio coinciden, es decir, cuando A = B, decimos simplemente que f


es una función del conjunto A. Nosotros estamos particularmente interesados
en las funciones de R2 las cuales se acostumbran llamar transformaciones
del plano por el contenido geométrico que la palabra ((transformación)) invo-
lucra: una transformación del plano ’deforma’ subconjuntos del plano trans-
formándolos o ’convirtiéndolos’ en otros cuya naturaleza geométrica puede ser
muy distinta a la del conjunto original.

Definición 3.1. Una transformación T : R2 → R2 se llama transformación lineal


si es de la forma    
x ax + by
T = , (3.1)
y cx + dy
 
x
cualquiera sea   ∈ R2 , y donde los escalares a, b, c y d son números reales
y
fijos.
 
x
Nota 3.1. Estrictamente, en (3.1) deberı́amos escribir el vector   encerrado
y
entre paréntesis pero esto harı́a muy pesada la notación, y por eso delibera-
damente lo suprimimos. Esperamos que esto no lleve a confusión.

Ejemplo 3.1. (Transformación nula y transformación identidad.) El lector debe


notar que lo que hace diferente una transformación lineal de otra es el valor
que toman los escalares fijos. Estos pueden ser todos iguales a cero en cuyo
   
x 0
caso T tiene la forma T   =   y se denomina transformación nula que
y 0
denotaremos, al igual que el vector nulo, con la letra O. El rango de la transfor-
mación nula es por consiguiente el conjunto que sólo consta del vector nulo.
( )
0
En sı́mbolos, O(R2 ) =   . La transformación nula es un caso extremo en
0
3.1. Definición de transformación lineal y primeros ejemplos. 73

el cual todo el plano queda convertido en un punto, a saber, en el origen del


plano cartesiano. Otro ejemplo especial de transformación lineal es aquella en
   
x x
la cual a = d = 1 y b = c = 0. En este caso T toma la forma T   =  
y y
y se denomina transformación identidad la cual denotaremos con la letra I.
Notemos que la transformación identidad deja fijos todos los puntos del plano
y su rango es I(R2 ) = R2 .

Ejemplo 3.2. (Traslaciones.) Observemos que toda transformación lineal fija


   
0 0
el origen; es decir, si T es una transformación lineal entonces T   =  .
0 0
Por consiguiente una transformación del plano que convierta el origen en otro
 
x
punto no puede ser lineal. En particular, la trasformación dada por T   =
y
   
x−1 −1
  no es lineal porque el origen es enviado por T al punto  . Este
y−1 −1
ejemplo es un caso particular de transformación del tipo traslación. En gene-
ral, si X0 un vector no nulo, la transformación TX0 : R2 → R2 definida por la
ecuación vectorial

TX0 (X) = X + X0

es llamada traslación por X0 . La traslación por X0 envı́a el origen en el punto


X0 , por consiguiente no es una transformación lineal pero por su gran impor-
tancia en el curso debemos conocer sus particularidades geométricas. Para
este fin vamos a recordemos los conceptos de función inyectiva (o uno a uno)
y sobreyectiva ( o sobre).

Una función f : A → B es inyectiva si a puntos distintos del dominio le


corresponden imágenes distintas en el codominio. En sı́mbolos esto se escribe
74 Geometrı́a de las transformaciones lineales del plano

ası́: cualesquiera sean x1 y x2 en el dominio A,

x1 6= x2 ⇒ f (x1 ) 6= f (x2 ),

o, equivalentemente,
f (x1 ) = f (x2 ) ⇒ x1 = x2 .

Por ejemplo la transformación identidad es inyectiva en tanto que la trans-


formación nula no lo es (¿por qué?). Decimos también que f : A → B es so-
breyectiva si todo elemento del codominio es imagen de algún elemento del
dominio. En otras palabras f es sobre si su rango es igual a su codominio:
f (A) = B. Esta condición también puede expresarse de manera equivalente
ası́: f : A → B es sobreyectiva si para cada y ∈ B, hay un elemento x ∈ A
que verifica la ecuación y = f (x). La transformación identidad es sobreyectiva
mientras que la transformación nula no lo es (¿por qué?). Finalmente, si una
función f : A → B es al mismo tiempo inyectiva y sobreyectiva decimos que
es biyectiva o que es una biyección de A sobre B. Por consiguiente la trans-
formación identidad es una biyección del plano. ¿Qué podemos afirmar en
este sentido acerca de las traslaciones? Pedimos al lector que responda a esta
pregunta en el siguiente ejercicio.

Ejercicio 3.1. Pruebe que la traslación por X0 , TX0 , es una biyección del plano.

El resultado del ejercicio anterior no responde suficientemente por los ras-


gos geométricos de una traslación. Si queremos saber más acerca de éstos
debemos indagar por los efectos de una traslación sobre subconjuntos tı́picos
del plano; por ejemplo, sobre rectas, cı́rculos, etc.

Definición 3.2. Si f : R2 → R2 es una transformación del plano y A es un


subconjunto de R2 , la imagen de A bajo f , denotada por f (A), es el conjunto
f (A) = {f (X) ∈ R2 |X ∈ A}.
3.1. Definición de transformación lineal y primeros ejemplos. 75

Supongamos ahora que L es una recta que pasa por un punto P y con
vector director D de modo que L tiene por ecuación vectorial X = P + tD, t ∈ R.
La traslación por X0 convierte cada punto de L en el punto TX0 = X0 + P + tD;
luego T (L) es la recta que pasa por el punto X0 + P y con vector director D. Por
lo tanto L y su imagen T (L) son paralelas. Pero TX0 no sólo ha desplazado L
paralelamente a sı́ misma sino que además ha conservado la distancia entre
cualquier par de puntos de ella. Esto es consecuencia del siguiente resultado.

Teorema 3.1. La traslación por X0 , TX0 , conserva la distancia entre puntos del
plano; es decir, cualesquiera sean X y Y en R2 se tiene que kTX0 (X) − TX0 (Y )k =
kX − Y k.

Prueba. Es inmediato pues,

kTX0 (X) − TX0 (Y )k = k(X + X0 ) − (Y + X0 )k = kX + X0 − Y − X0 k = kX − Y k. 2

En virtud de este resultado decimos que las traslaciones son movimientos rı́gi-
dos, o euclidianos, del plano. La definición precisa de movimiento euclidiano
es la siguiente:

Definición 3.3. Una transformación del plano F : R2 → R2 se llama movi-


miento euclidiano si preserva la distancia entre puntos del plano; es decir, si
cualesquiera sean X y Y en R2 , se verifica la ecuación

kF (X) − F (Y )k = kX − Y k.

Observación 3.1. Es inmediato de la definición que todo movimiento eucli-


diano F es una transformación inyectiva del plano puesto que F (X) = F (Y )
implica
0 = kF (X) − F (Y )k = kX − Y k,

luego X − Y = O; es decir, X = Y .
76 Geometrı́a de las transformaciones lineales del plano

Posteriormente estudiaremos los movimientos euclidianos con más detalle.


El hecho es que las traslaciones no deforman los subconjuntos del plano; sim-
plemente los desplazan paralelamente a sı́ mismos conservando las distancias
entre sus puntos.

Ejercicio 3.2. Pruebe que la imagen de una circunferencia bajo una traslación
es otra circunferencia del mismo radio.

Ejemplo 3.3. (Homotecias.) Sea r un número real distinto de cero. La homote-


cia de razón r, denotada por Hr , es la transformación del plano definida por la
ecuación vectorial Hr (X) = rX. Notemos que H1 es la transformación identidad
I. En términos de las componentes x, y del vector X la ecuación se escribe
     
x x rx
Hr   = r   =   .
y y ry

La homotecia es por consiguiente una transformación lineal y es, a su vez,


una biyección del plano.

Ejercicio 3.3. Pruebe que toda homotecia es una biyección del plano.

Las homotecias deforman los conjuntos del plano pero lo hacen de una ma-
nera muy especial: los convierten en objetos semejantes. Esto quiere decir que
la razón de las distancias entre puntos se mantiene constante, y el ángulo en-
tre segmentos no se altera. Un descripción práctica del efecto de la homotecia
sobre los objetos es lo que hace el zoom de las cámaras fotográficas.

Ejercicio 3.4. Sea Hr una homotecia de razón r.


kHr (X) − Hr (Y )k
(a) Si X y Y son dos puntos distintos del plano pruebe que =
kX − Y k
|r|.
−→ −→ −−−−−−−−−→
(b) Pruebe que el ángulo entre P Q y P R es igual al ángulo entre Hr (P )Hr (Q)
−−−−−−−−→
y Hr (P )Hr (R).
3.1. Definición de transformación lineal y primeros ejemplos. 77

(c) Sea L una recta que pasa por un punto P0 y con vector director D. Pruebe
que Hr (L) es la lı́nea recta que pasa por el punto Hr (P0 ) y con vector
director Hr (D).

(d) Sea C la circunferencia con centro en X0 y radio ρ. Pruebe que Hr (C) es la


circunferencia con centro Hr (X0 ) y radio |r|ρ.

El literal (a) del anterior ejercicio nos muestra que ninguna homotecia con
razón r 6= 1 es un movimiento euclidiano.

Ejemplo 3.4. (Proyecciones ortogonales) Consideremos


  una lı́nea recta L que
d1
pasa por el origen y generada por el vector D =  . Hemos visto en el capı́tu-
d2
 
x
lo 2 (ver Teorema 2.2) que si X =   es cualquier punto del plano entonces la
y
proyección ortogonal de X sobre L, que hemos denotado por PL (X), está dada
X ·D
por PL (X) = D. Recordemos que este valor no depende del vector director
kDk2
de L que hallamos escogido. Podemos entonces definir una transformación del
plano, PL , en la que a cada X ∈ R2 le asignamos su proyección ortogonal sobre
L. Usando coordenads, PL (X) se escribe ası́:
     2 
d1 d1 d2
x xd1 + yd2 d1   d21 +d 2x + y
d21 +d22 
PL   = 2 2
= 2
. (3.2)
y d 1 + d 2 d2 d1 d2
x+
d22
y
d2 +d2
1 2 d21 +d22

La proyección ortogonal PL es entonces una transformación lineal que envı́a


todo el plano sobre la recta L; no es por consiguiente sobreyectiva. Invitamos
al lector a que recuerde los aspectos geométricos de la proyección ortogonal a
través de los siguientes ejercicios.

Ejercicio 3.5. Sea PL la proyección ortogonal sobre la recta L generada por


un vector D.
78 Geometrı́a de las transformaciones lineales del plano

(a) Pruebe que para todo PL (X) = X si y sólo si X ∈ L.

(b) Sea L′ cualquier recta perpendicular a L. Pruebe que la imagen de L′ bajo


PL , PL (L′ ) se reduce a un punto. Halle este punto en términos del vector
director D y los parámetros de L′ .

(c) Sea L′′ cualquier recta que no es perpendicular a L. Pruebe que PL′′ = L.

Resulta obvio del literal (b) que las proyecciones no son movimientos eu-
clidianos; las proyección PL sólo conserva las distancias cuando los puntos
están sobre L (¿por qué?).

Ejercicio 3.6. Considere la recta L con ecuación y = x y sea C la circunferencia


x2 + y 2 = 1. Halle PL (C).

Ejemplo 3.5. (Reflexiones) En este ejemplo suponemos de nuevo que L es


 
d1
una recta que pasa por el origen y con vector director D =  . Definimos
d2
la reflexión en (o con respecto a) la recta L, que denotaremos
  por SL , como la
x
transformación del plano que asigna, a cada punto X =  , el punto SL (X)
y
tal que PL (X) es el punto medio del segmento de recta con extremos X y SL (X);
es decir,

1
PL (X) = [X + SL (X)] o, equivalentemente, SL (X) = 2PL (X) − X. (3.3)
2

Usando coordenadas, un cómputo sencillo (le pedimos al lector que lo realice)


nos muestra que
   2 2 
d1 −d2 2d1 d2
x 2 2x + y
d21 +d22 
SL   = d1 +d2
 , (3.4)
2d1 d2 d22 −d21
y d2 +d2
x+ d21 +d22
y
1 2

lo cual nos muestra que SL es una trasformación lineal; más aún, es un mo-
vimiento euclidiano y como tal, es una transformación lineal inyectiva.
3.1. Definición de transformación lineal y primeros ejemplos. 79

Teorema 3.2. Si SL es la reflexión en una recta L a través del origen entonces


SL es un movimiento euclidiano.

Prueba. Le pedimos al lector que realice la prueba de este resultado uti-


lizando la ecuación (3.4). Una prueba diferente, sin hacer uso de coordena-
das, puede hacerse suponiendo los resultados de la sección siguiente. 2 Los
siguientes ejercicios nos proporcionan una compresión geométrica más com-
pleta de las reflexiones con respecto a rectas que pasan por el origen.

Ejercicio 3.7. Sea SL la reflexión en una recta L a través del origen:

(a) Pruebe que SL (X) = X si y sólo si X ∈ L.

(b) Suponga que L′ es una recta diferente a L. Pruebe que SL (L′ ) = L′ si y


sólo si L y L′ son perpendiculares.

(c) De manera más general, suponga que L′ es una recta que no es paralela
a L. Pruebe que SL (L′ ) es otra recta con la propiedad de que el ángulo
dirigido de L a L′ es igual al ángulo dirigido de SL (L′ ) a L.

(d) Finalmente, suponga que L′ es una recta paralela a L. Pruebe que SL (L′ )
es otra recta paralela a L con la propiedad de que cualesquiera sean
X ∈ L′ y Y ∈ SL (L′ ), el punto medio del segmento XY está en L. Más
aún, pruebe que si L′′ es una recta con esta última propiedad entonces
L′′ = SL (L′ ).
 
x
Ejemplo 3.6. (Rotaciones). Recordemos que si X =   es cualquier punto
y
del plano distinto del origen, y φ es la dirección de X, entonces la forma polar
de X es    
x kXk cos φ
X= = .
y kXk sen φ
80 Geometrı́a de las transformaciones lineales del plano

Rotar el punto X por un número real θ consiste en moverlo sobre la circunfe-


rencia con centro en el origen y radio kXk barriendo un ángulo θ (medido en
radianes) desde su posición inicial. La transformación del plano que hace este
movimiento la llamamos rotación por un ángulo θ y la denotamos por Rθ . Un
ángulo en posición estándar correspondiente al punto Rθ (X) es entonces φ + θ
y por consiguiente la forma polar correspondiente es
   
kXk cos(φ + θ) kXk(cos φ cos θ − sen φ sen θ)
Rθ (X) =  = ,
kXk sen(φ + θ) kXk(sen φ cos θ + cos φ sen θ)

donde la última igualdad se debe a las identidades trigonométricas para el co-


seno y el seno de la suma de ángulos. Puesto que x = kXk cos φ y y = kXk sen φ,
obtenemos:    
x cos θ x − sen θ y
Rθ (X) = Rθ   =  . (3.5)
y sen θ x + cos θ y
La ecuación (3.5) tiene sentido si x = 0 y y = 0. Por eso definimos Rθ (O) = O
lo cual coincide con nuestra evidencia de que al rotar el plano alrededor del
origen, este punto permanece fijo. La rotación Rθ es entonces una transforma-
ción lineal.

Comentario 3.1. El valor del ángulo θ puede se positivo o negativo. En el


primer caso la rotación es en sentido antihorario, mientras que en el segundo
se efectúa en sentido horario. Notemos de paso que si θ = 2kπ, es decir, si θ
es un múltiplo entero de 2π, entonces Rθ es sencillamente la transformación
identidad I.

Las rotaciones son también movimientos euclidianos y por consiguiente


son transformaciones lineales inyectivas. Éste es el contenido del siguiente
teorema cuya prueba dejamos como ejercicio al lector.

Teorema 3.3. Las rotaciones son movimientos euclidianos.


3.2. Propiedades básicas de las transformaciones lineales y consecuencias 81

Prueba. (Ejercicio). 2

Ejercicio 3.8. (a) Pruebe que si L es la recta que pasa por un punto P0 y
con vector director D entonces Rθ (L) es la recta que pasa por Rθ (P0 ) y con
vector director Rθ (D).

(b) Sean L y L′ dos rectas que pasan por un punto P0 . Pruebe que el ángulo
dirigido de L a L′ es igual al ángulo dirigido de Rθ (L) a Rθ (L′ ).

3.2. Propiedades básicas de las transformaciones lineales y


consecuencias
Para seguir adelante con el estudio de la geometrı́a de las transformaciones
lineales es útil y conveniente determinar cuáles son aquellas propiedades al-
gebraicas que sólamente las cumplen las transformaciones lineales; en otras
palabras, aquellas propiedades que caracterizan a las transformaciones linea-
les. Sabemos que toda transformación lineal envı́a el origen en el origen, pero
hay muchas otras transformaciones que hacen lo  mismo
 sin
 ser lineales;
 por
x xy
ejemplo, la trasformación F : R2 → R2 dada por F   =   convierte
2 2
y x +y
el origen en el origen; sin embargo no tiene la forma de una transformación
lineal. El siguiente ejercicio, que es meramente computacional, nos muestra
otras dos propiedades algebraicas que satisfacen todas las transformaciones
lineales.

Ejercicio 3.9. Sea T : R2 → R2 una transformación lineal dada por


   
x ax + by
T = .
y cx + dy

Pruebe que cualesquiera sean X y Y en R2 y c ∈ R tenemos

(a) T (X + Y ) = T (X) + T (Y ), y
82 Geometrı́a de las transformaciones lineales del plano

(b) T (cX) = c T (X).

Lo extraordinario es que si una transformación del plano satisface estas dos


propiedades entonces es lineal. Éste es el contenido del siguiente teorema.

Teorema 3.4. Si F : R2 → R2 es una transformación del plano que verifica las


propiedades (a) y (b) entonces F es una transformación lineal.

Prueba. Debemos hallar escalares a, b, c y d tales que


   
x ax + by
F = .
y cx + dy
 
x
Para este efecto descomponemos X =   en su forma canónica; es decir,
y
escribimos X = xE1 + yE2 . Por la propiedad (a)

F (X) = F (xE1 + yE2 ) = F (xE1 ) + F (yE2 ).

El lado derecho de la última igualdad es, por la propiedad (b), igual a xF (E1 ) +
yF (E2 ). Por consiguiente F (X) = xF (E1 )+yF (E2 ). Ahora escribimos los vectores
   
a b
F (E1 ) y F (E2 ) en forma de coordenadas: F (E1 ) =   y F (E2 ) =  . Ası́,
c d
tenemos
           
x a b ax by ax + by
F   = F (X) = x   + y   =   +   =  ,
y c d cx dy cx + dy

lo que prueba que F tiene la forma de una transformación lineal. 2

Comentario 3.2. El resultado anterior es de gran importancia teórica y compu-


tacional. Por el momento puntualicemos que los valores de los escalares que
determinan las transformación lineal se obtienen al evaluar la transforma-
ción en los vectores canónicos E1 y E2 . De manera más general, el resultado
3.2. Propiedades básicas de las transformaciones lineales y consecuencias 83

nos permite decir que una transformación lineal queda completamente deter-
minada por el valor que toma en dos vectores linealmente independientes El
siguiente ejemplo ilustra cómo usar este hecho.

Ejemplo 3.7. Supongamos que T es una transformación lineal del plano tal
         
1 10 2 −12 1
que T   =   y T   =  . Notemos que los vectores   y
−1 −8 2 4 −1
 
2
  son linealmente independientes (¿por qué?). Usando la descomposición
2
canónica las dos condiciones pueden escribirse como
   
10 −12
T (E1 ) − T (E2 ) =   y 2T (E1 ) + 2T (E2 ) =  .
−8 4

Si multiplicamos la primera de estas ecuaciones por 2 y el resultado lo suma-


mos a la segunda ecuación obtenemos
     
20 −12 8
4T (E1 ) =  + = ,
−16 4 −12
 
2
Luego T (E1 ) =  . Este resultado se sustituye en cualquiera de las dos
−3
ecuaciones originales y obtenemos, por ejemplo,
     
2 10 −8
T (E2 ) =   −   =   .
−3 −8 5
   
x 2x − 8y
Asi, T   =  .
y −3x + 5y

Desde el punto de vista teórico las consecuencias de la caracterización de


las trasformaciones lineales son notables. Prueba de ello es el siguiente resul-
tado que, sin duda, puede considerarse como un teorema fundamental de las
transformaciones lineales.
84 Geometrı́a de las transformaciones lineales del plano

Teorema 3.5. Sea T : R2 → R2 una transformación lineal. Los siguientes enun-


ciados son equivalentes

(a) T es inyectiva.


(b) El conjunto N (T ) = X ∈ R2 : T (X) = O , llamado núcleo de T , consiste
sólamente del vector nulo.

(c) Los vectores T (E1 ) y T (E2 ) son linealmente independientes.

(d) T es sobreyectiva.

Prueba. Primero probemos que los enunciados (a) y (b) son equivalentes.
Supongamos entonces que T es inyectiva y sea X ∈ N (T ). Entonces T (X) = O;
ahora, T (O) = O pues T es lineal. La inyectividad de T implica que X = O.
Recı́procamente, supongamos que N (T ) sólo consiste del vector nulo, y sean
X y Y tales que T (X) = T (Y ); esta ecuación equivale a T (X) − T (Y ) = O la cual,
por las propiedades que caracterizan las transformaciones lineales, se puede
reescribir como T (X − Y ) = O. Ahora aplicamos nuestra hipótesis de que el
núcleo sólo consiste del vector nulo y concluimos que X − Y = O o, equivalen-
temente, X = Y . Esto prueba que T es inyectiva.
En segundo lugar probemos que los enunciados (b) y (c) son equivalentes.
Primero suponemos que N (T ) sólo consiste del vector nulo y sean α y β es-
calares tales que αT (E1 ) + βT (E2 ) = O. De nuevo, por las propiedades que
caracterizan las transformaciones lineales, esta ecuación la podemos reescri-
bir como T (αE1 + βE2 ) = O. Por hipótesis, el núcleo de T sólo consiste del
vector nulo, luego αE1 + βE2 = O; ahora bien, esta ecuación y el hecho de que
los vectores E1 y E2 son linealmente independientes implican que α = β = 0,
lo cual prueba que T (E1 ) y T (E2 ) son linealmente independientes. Recı́proca-
mente, supongamos que T (E1 ) y T (E2 ) son linealmente independientes y sea
3.2. Propiedades básicas de las transformaciones lineales y consecuencias 85

X ∈ N (T ); es decir, T (X) = O. Supongamos que x y y son las coordenadas del


vector X; entonces T (xE1 + yE2 ) = O. Una vez más, aplicamos a esta última
ecuación la caracterización de las transformaciones lineales para reescribirla
como xT (E1 ) + yT (E2 ) = O; ahora usamos nuestra hipótesis de que los vectores
T (E1 ) y T (E2 ) son linealmente independientes para concluir que x = y = 0; es
decir, X = O.
Finalmente probemos
  la
equivalencia
 de los enunciados (c) y (d). Para este efec-
 
x ax + by a
to escribimos T   =  . Inicialmente suponemos que T (E1 ) =  
y cx + dy c
 
b
y T (E2 ) =   son linealmente independientes. Como ya sabemos, esto quie-
d
 
u
re decir que ad − bc 6= 0. Veamos que T es sobreyectiva. Sea   cualquier
v
 
x
punto de R2 . Nuestra meta es probar la existencia de un punto   tal que
y
   
ax + by u
  =  . Esta ecuación vectorial equivale al sistema de dos ecuacio-
cx + dy v
nes con dos incógintas


ax + by = u


cx + dy = v.

El método de eliminación nos permite verificar que la solución de este sistema


du − bv −cu + av
es x = y y = (pedimos al lector que lo compruebe), con lo
ad − bc ad − bc
cual probamos la sobreyectividad de T . En cuanto al recı́proco es más conve-
niente razonar por el método que algunas veces se llama ((contra positivo)) o
((contra recı́proco)); en nuestro caso consiste en suponer que los vectores T (E1 )
y T (E2 ) son linealmente dependientes y llegar a la conclusión de que T no es
una transformación lineal sobreyectiva. Supongamos entonces que T (E1 ) y
86 Geometrı́a de las transformaciones lineales del plano

T (E2 ) son linealmente dependientes. Esto significa que uno de los vectores es
una combinación lineal del otro. Sin que el razonamiento pierda generalidad
podemos podemos suponer que existe un escalar λ tal que T (E2 ) = λT (E1 );
cualquiera sea X = xE1 + yE2 en el plano tenemos entonces que

T (X) = T (xE1 + yE2 ) = xT (E1 ) + yT (E2 ) = xT (E1 ) + yλT (E1 ) = (x + yλ)T (E1 ),

donde la segunda igualdad se debe, una vez más, a la caracterización de las


transformaciones lineales. Ası́ hemos comprobado que si T (E1 ) y T (E2 ) son
linealmente dependientes entonces la imagen de T colapsa en el origen si
T (E1 ) = O, en cuyo caso T es la transformación nula, o está contenida en
la recta generada por el vector T (E1 ) si T (E1 ) 6= O. En cualquier caso T no es
sobreyectiva. Con esto hemos finalizado la prueba del teorema. 2
   
x x+y
Ejemplo 3.8. La transformación lineal T dada por T   =   es in-
y x−y
 
1
yectiva (y por consiguiente sobreyectiva) porque los vectores T (E1 ) =   y
1
 
1
T (E2 ) =   son linealmente independientes pues: 1 · (−1) − 1 · 1 = −2 6= 0; en
−1
   
x 2x − y
cambio, la trasformación S dada por S   =   no es inyectiva porque
y 2x − y
   
2 −1
S(E1 ) =   = (−2)   = (−2)S(E2 ). De hecho, de acuerdo con la última
2 −1
parte de la prueba del teorema anterior, el rango de S es la recta generada por
 
−1
el vector  .
−1
Ejercicio 3.10. Pruebe que una transformación lineal es inyectiva si y sólo si
envı́a todo par de vectores linealmente independientes en otro par de vectores
linealmente independientes.
3.3. Imágenes de lı́neas rectas, lı́neas poligonales y polı́gonos bajo una transformación linea

¿Cuál es la naturaleza geométrica del núcleo de una transformación lineal


no inyectiva? El siguiente ejercicio da respuesta a esta pregunta.

Ejercicio 3.11. Sea T una transformación lineal no inyectiva y no nula. Prue-


be que N (T ) es una lı́nea recta que pasa por el origen.

3.3. Imágenes de lı́neas rectas, lı́neas poligonales y polı́go-


nos bajo una transformación lineal

3.3.1. Imágenes de lı́neas rectas

En la primera sección de este capı́tulo hemos visto que las homotecias, las
reflexiones y las rotaciones, convierten rectas en rectas. Este comportamiento
lo tienen todas las transformaciones lineales inyectivas como veremos a con-
tinuación.
Supongamos que T : R2 → R2 es una transformación lineal inyectiva, y sea
L una recta que pasa por un punto P0 y con vector director D; entonces, todo
punto X de L se describe mediante la ecuación vectorial X = P0 + tD, para
algún t ∈ R. Ası́, T (X) = T (P0 + tD) = T (P0 ) + tT (D). Por ser T inyectiva y
D 6= O, el vector T (D) no es nulo, y por lo tanto la última ecuación nos dice
que T (L) está contenida en la recta L′ que pasa por el punto T (P0 ) y con vector
director T (D). Más aún, todo punto de L′ pertenece a T (L) (¿por qué?) y por
consiguiente T envı́a la recta L de manera inyectiva sobre la recta L′ .
 
x
Ejercicio 3.12. (a) Considere la transformación lineal T dada por T   =
y
 
x+y
  y sea L la recta con ecuación general 2x − 3y + 5 = 0. Halle una
x−y
ecuación general de la recta T (L).

(b) Pruebe que las imágenes de rectas paralelas bajo una transformación
88 Geometrı́a de las transformaciones lineales del plano

lineal inyectiva son también rectas paralelas.

(c) Verdadero o falso (justifique la respuesta): Si L y L′ son rectas perpendi-


culares y S es una transformación lineal inyectiva entonces S(L) y S(L′ )
son rectas perpendiculares.

La situación es diferente cuando la transformación lineal no es inyectiva.


Vale la pena que el lector revisite lo que hemos dicho sobre las proyecciones
ortogonales. Las proyecciones ortogonales con respecto a rectas que pasan por
el origen son transformaciones lineales no inyectivas. El rango de cualquiera
de estas proyecciones es la misma recta con respecto a la que proyectamos
los puntos del plano. ¿Qué podemos decir acerca de una transformación no
inyectiva cualquiera?. Sabemos por el teorema 3.5 que si T es una transfor-
mación lineal del plano no inyectiva entonces los vectores T (E1 ) y T (E2 ) son
linealmente dependientes. Si T es, además, no nula, podemos suponer, sin
que el argumento pierda generalidad, que T (E1 ) 6= O y T (E2 ) = λT (E1 ) para
algún escalar λ. Supóngase ahora que L es una recta que pasa por el punto
P0 = p1 E1 + p2 E2 y con vector director D = d1 E1 + d2 E2 , y sea X = P0 + tD, t ∈ R,
un punto cualquiera de L. Por ser T lineal tenemos: T (X) = T (P0 ) + tT (D). En
este punto pareciera que no hay diferencia con el caso inyectivo. Sin embargo,
notemos que

T (D) = T (d1 E1 + d2 E2 ) = d1 T (E1 ) + d2 T (E2 ) = d1 T (E1 ) + d2 λT (E1 ) = (d1 + d2 λ)T (E1 );

es decir, T (D) es un múltiplo escalar de T (E1 ), al igual que T (P0 ), pues

T (P0 ) = T (p1 E1 + p2 E2 ) = p1 T (E1 ) + p2 T (E2 ) = p1 T (E1 ) + p2 λT (E1 ) = (p1 + p2 λ)T (E2 );

ası́, T (X) = rT (E1 ) + tsT (E1 ) = (r + st)T (E1 ), donde r = p1 + p2 λ y s = d1 + d2 λ.


Esto quiere decir que la imagen de L bajo T , T (L), está contenida en la recta L′
generada por el vector T (E1 ), ¡cualquiera sea la recta L!, lo cual implica que el
3.3. Imágenes de lı́neas rectas, lı́neas poligonales y polı́gonos bajo una transformación linea

rango de T está contenido en la recta generada por T (E1 ); de hecho T (R2 ) = L′


(¿por qué?). Hemos comprobado que si T es una transformación lineal no nula
y no inyectiva, su rango es la lı́nea recta generada por T (E1 ) o por T (E2 ).
 
2x − 8y
Ejercicio 3.13. Sea T la transformación lineal dada por T  . Hallar
−3x + 12y
el núcleo de T , N (T ), y la imagen (o rango) de T , T (R2 ).

También podría gustarte