Está en la página 1de 5

ENFOQUE TEÓRICO

DEDUCCiÓN DE LA FÓRMULA PARA UNA RECTA DE REGRESiÓN

Suponga que queremos hallar la recta del "mejor ajuste" para algunos datos experimentales. En la sec-
ción Enfoque sobre modelado, que inicia en la página 75, usamos una computadora y una calculadora
para hallar la fórmula para esta recta. En esta sección, deducimos esta fórmula.
Mediante el siguiente criterio, determinamos cuál recta ajusta mejor los datos. Los datos se trazan
en el plano. La distancia desde una recta a los puntos de los datos se mide agregando los cuadrados de
las distancias verticales desde cada punto a la recta. Cuanto más pequeña sea la suma de cuadrados, me-
jor se ajusta la recta a los datos. La recta con la mínima suma de cuadrados de las distancias se denomi-
na recta de mínimos cuadrados o recta de regresión. Si los datos se aproximan a una línea recta, la recta
de mínimos cuadrados será un buen ajuste; de lo contrario, puede ser que no lo sea (véase la figura 9.62).

• f··, .

• ••
.."..
• • •

Los datos son casi lineales: la recta ajusta bien Los datos no son muy lineales: la recta no ajusta bien

Figura 9.62. Rectas de ajuste a puntos de datos.

Ejemplo 1 Encuentre la recta de mínimos cuadrados para los siguientes puntos de información: (1, 1), (2, 1) Y (3, 3).
Solución Supongamos que la recta tiene la ecuación y = b + mx. Si encontramos b y m entonces hemos encon-
trado la recta. Por tanto, para este problema, b y m son las dos variables. Queremos minimizar la función
j (b, m) que da la suma de los cuadrados de las tres distancias verticales de los puntos a la recta en la
figura 9.63.
y

3 y = b-s-m»

2
(2,b+2m)

1 (1,1) t L2' 1)
(l,b+m)

O x
1 2 3

Figura 9.63. La recta de mínimos cuadrados minimiza la suma de los cuadrados de estas distancias verticales.

La distancia vertical desde el punto (1, 1) a la recta es la diferencia en las ordenadas 1 - (b + m);
análogamente para los otros puntos. En consecuencia, la suma de los cuadrados es

j(b, m) = (1 - (b + m))2 + (1 - (b + 2m))2 + (3 - (b + 3m))2.

http://gratislibrospdf.com/
370 Cálculo aplicado

Para minimizar 1
Para minimizar f buscamos
buscamos los puntos
puntos críticos.
críticos. Primero derivamos 1
Primero derivamos f respecto
respecto a b:

Ib(b, m) =
fb(b, -2(1 - (b
= -2(1 + m))
m)) - 2m)) - 2(3 - (b + 3m))
2(1 - (b + 2m)) 3m))
= -- 2 + 2b + 2m - 2 + 2b + 4m
= 4m - 6 + 2b + 6m
6m
-10 + 6b + 12m.
= -10 12m.

Ahora
Ahora derivamos
derivamos respecto
respecto a m:
m:

Im(b, m)
fm(b, = 2(1 - (b + m))(
m))( --1)1) + 2(1 - (b + 2m))( -2) + 2(3 - (b + 3m))(
2m))( -2) 3m))( -3)
-3 )
= -2
= -2 + 2b + 2m - 4 + 4b + 8m -18
-18 + 6b + 18m
18m
-24 + 12b
= -24
= 12b + 28m.
28m.

Las ecuaciones lb
Las ecuaciones fb == O t; == OO dan
O Y 1m dan un sistema
sistema de dos ecuaciones lineales con
ecuaciones lineales con dos incógnitas:
incógnitas:

-10 + 6b
-10 + 12m
12m = O,
= O,
24 + 12b
--24 12b + 28m
28m = o.
= O.

La solución
.La solución a este
este par
par de ecuaciones
ecuaciones es el punto crítico b
punto crítico -1/3
= -1
b = / 3 Ym = Como
= 1. Como

y Ibb == 66
fbb > O,
hemos
hemos encontrado
encontrado un mínimo
mínimo local.
local. Este
Este mínimo
mínimo local
local también global de f.
mínimo global
también es el mínimo f. Por
Por tanto,
tanto, la
recta
recta de mínimos
mínimos cuadrados
cuadrados es
IJ
10111 y=x--3·
y=x--
1
1

1'111
'[
Ijll
Como
Como prueba,
prueba, observe
observe que recta y == x pasa
que la recta pasa por
por los puntos
puntos (1, 1) Y (3, 3). Es razonable
razonable considerar
considerar que
que
la introducción
introducción del punto
punto (2, 1) baje
baje la ordenada origen de O
ordenada en el origen -1/3.
O a -1 /3.

Deducción
Deducción de las fórmulas
fórmulas para la recta de regresión
regresión
Utilizamos
Utilizamos el método
método del del ejemplo
ejemplo 1 parapara deducir
deducir las fórmulas
fórmulas para para la rectarecta dede mínimos
mínimos cuadrados
cuadrados
= b
y = b + mx
mx generada
generada por por los puntos datos (xi'
puntos de datos y¡), (x
(xl' y¡), ... , (x
(x22,, Y2)' ... (xn'n , Y
Yn).
n ) . Observe
Observe que
que estamos
estamos bus-
bus-
cando
cando la pendiente
pendiente y la ordenada
ordenada en el origen,
origen, de modo
modo que consideramos a m y bb como
que consideramos como las variables.
variables.
Para
Para cada
cada punto
punto (xi' Yi)')' el punto
(Xi' Yi punto correspondiente
correspondiente directamente
directamente arriba arriba o abajo abajo de la
la recta
recta tiene
tiene la
ordenada, b
ordenada, b + mx mxi.i . Por
Por tanto,
tanto, el cuadrado
cuadrado de las distancias verticales desde
distancias verticales desde el punto
punto a la recta
recta es
'», -- (b + m
(Yi mxxi))2
i ))2 (véase
(véase la figura
figura 9.64).
9.64).

y
y=b+mx
y=b+mx

b+mxi
b+mXi

---r---------+-----------
~t----+I-X x
Xi
Xi

Figura 9.64.
Figura 9.64. Distancia
Distancia vertical
vertical desde punto a la recta.
desde un punto recta.

http://gratislibrospdf.com/
Capítulo 9 I Funciones de varias variables
variables 371

Encontramos
Encontramos la suma
suma de las n
n distancias
distancias al cuadrado
cuadrado desde
desde los puntos
puntos a la recta,
recta, y consideramos
consideramos a
la suma
suma como
como una
una función
función de m y b:
nn

ii=l
= l

Para
Para minimizar
minimizar esta
esta función,
función, primero
primero hallamos
hallamos las dos derivadas
derivadas parciales,
parciales, lb y 1m
lb 1m'' Usamos
Usamos la regla
regla de
la cadena
cadena y las propiedades
propiedades de la suma.
suma.

Ib(b, m)
Ib(b, =
= 8b
8(n
o(n
8(Yi - (b + mXi
ob t;(Yi ))2 =
mXi))2 = 8nno 8bob8(Yi - (b + mXi))2
)) t; mXi))2

nn 8a
=L
= ¿ 2(Yi - (b + mXi)) ob (Yi - (b + mXi))
mXi)) . 8b mXi))
"=1l
t=
nn

= ¿2(Yi - (b+mxi))' (-1)


i=l
i=l
nn
= L(Yi - (b + mXi))
= -2 ¿(Yi mXi))
i=l
i=l

nn
L 2(Yi - (b
= ¿2(Yi
= + mXi))
(b+mXi))' . (-Xi)
(-Xi)
i=
i=ll
nn
L(Yi - (b + mXi))
= -2 ¿(Yi
= mXi)) . Xi
ii=l
= l

Ahora
Ahora hacemos
hacemos iguales
iguales a cero
cero las derivadas
derivadas parciales
parciales y despejamos
despejamos m y b. Esto
Esto es más fácil
fácil de lo que
que
parece:
parece: simplificamos
simplificamos la apariencia
apariencia de las ecuaciones
ecuaciones sustituyendo
sustituyendo temporalmente
temporalmente otros
otros símbolos
símbolos para
para
las sumas: escribimos SY
sumas: escribimos por ¿
SY por u; SX
LYi' por ¿
SX por L Xi' SXY
SXY porpor ¿ v», y SXX
LYixi SXX porpor ¿
L X;' Recuerdex;.
Recuerde que Xi xi y
Yi
Yi son constantes.
constantes. Obtenemos
Obtenemos un parpar de ecuaciones
ecuaciones lineales
lineales simultáneas
simultáneas en m y en b; al resolver
resolver en m y bb
se obtienen
obtienen fórmulas términos de SX,
fórmulas en términos BY, SXYy
SX, BY, SXYy SXX. SXX. Separamos I b(b, m)
Separamos Ib(b, m) en tres sumas
sumas como
como se
muestra:
muestra:
n8nYiu. - b t;
8nn 11-- m t;8nn) z,Xi ) .
Ib(b , m) =
fb(b, = -2 (( t;
Análogamente,
Análogamente, podemos separar IIm(b,
podemos separar m) después
m (b, m) después de multiplicar
multiplicar por xi:
por Xi:

Im(b,
fm(b,m) = -2 (~YiXi
m) = (~YiXi - b ~Xi
~Xi - m ~x¡).
~x¡).

Al escribir
escribir nuevamente
nuevamente la suma
suma como
como se sugiere
sugiere y haciendo
haciendo que 81
01 y 81
01 sean
sean iguales
iguales a cero
cero tenemos:
tenemos:
ob
8b Om
oo == SY
SY -bn - mSX
mSX
O == SY
O X - bSX
SY X bSX - mSX
mSX X
Resolviendo
Resolviendo este
este par
par de ecuaciones
ecuaciones simultáneas
simultáneas obtenemos
obtenemos el resultado:
resultado:

b == ((SXX).
((SXX). (SY)
(SY) - (SX)·
(SX)· (SYX)) j (n(SXX) - (SX)2)
(SYX))j(n(SXX) (SX)2)
m == (n(SY
(n(SY X)X) - (SX)
(SX) . (SY))j(n(SXX)
(SY))j(n(SXX) - (SX)2)
(SX)2)

http://gratislibrospdf.com/
372 Cálculo aplicado

Escribiendo
Escribiendo estas
estas expresiones
expresiones con
con notación
notación de sumatoria
sumatoria llegamos
llegamos al siguiente
siguiente resultado:
resultado:

La recta
recta de mínimos
mínimos cuadrados
cuadrados para
para los puntos
puntos (x
(xl'l' y¡),
y¡), (x "', (x
(x22, , Y2)' "', Ynn) es la recta
(xn'n , Y b + mx
recta y == b mx
donde
donde

b=
b=

m=
m=

Ejemplo
Ejemplo 2
2 Utilice
Utilice estas
estas fórmulas
fórmulas para
para hallar
hallar la recta
recta de mejor
mejor ajuste
ajuste para
para el punto
punto de datos
datos (1, 5), (2, 4), (4, 3).

Solución
Solución Calculamos
Calculamos las sumas
sumas necesarias
necesarias en las fórmulas:
fórmulas:
til,1

3
LXi = 1 + 2 + 4 = 7
LXi = =
i=
i=11
3
LYi == 5 + 4 + 3 == 12
L Yi
i=1
3
L X~ = 1
L X~
2
+ 22 + 42 = 1 + 4 + 16
16 = 21
21
i=1
3
LYiXi =
LYiXi = (5)(1) + (4)(2) + (3)(4) =
= 5 + 8 + 12 =
= 25
ii=1
=1

Como n
Como n = 3, tenemos:
tenemos:

bb = (( 833 x~x~ 833 Yi - 833 833


Xi Y iXi
YiXi
)) (3
/
(3)8 2)
(33 8 x~x~ - (3)
3 Xi

2
= ((21)(12) - (7)(25)) / (3(21) - (7 2))))
=
= 77/14
= 77/14 == 5.5
y

m =
m ~ (3 t, y,x,t,
- t,x, t,y,)
y,x, -t,x, t,y,) // (3 t,x¡
t,x¡ -(t,x,)
- (t,x,) ''))
2
= (3(25) - (7)(12))
= (7)(12)) / (3(21) - (7 2))))
= -9/14
= -9/14 == -0.64
-0.64
La recta
recta de mínimos
mínimos cuadrados
cuadrados para
para estos
estos tres puntos
puntos es
= 5.5 - 0.64x.
y =

Para
Para comprobar
comprobar esta
esta ecuación,
ecuación, trace
trace la recta
recta y los puntos juntos.
puntos juntos.

Muchas
Muchas calculadoras
calculadoras tienen
tienen integradas
integradas las fórmulas
fórmulas para
para la recta
recta de mínimos
mínimos cuadrados,
cuadrados, de modo
modo
que
que cuando
cuando se marcan
marcan los datos
datos aparecen
aparecen en pantalla valores b y m.
pantalla los valores m. Al
Al mismo
mismo tiempo,
tiempo, se obtiene
obtiene el
coeficiente
coeficiente de correlación,
correlación, que
que mide
mide qué
qué tan cerca
cerca ajustan
ajustan estos datos a la recta
estos datos recta de mínimos
mínimos cuadrados.
cuadrados.

http://gratislibrospdf.com/
Capítulo 9 / Funciones de varias variables 373

Problemas de deducción de la fórmula para rectas de regresión _

En los problemas 1 y 2 utilice el método del ejemplo 1 para ha- (b) De acuerdo con el censo nacional, la población de 1990
llar la recta de mínimos cuadrados para los puntos dados. Com- era de 249 millones. ¿Qué nos dice esto acerca de la
pruebe su trabajo trazando una gráfica de los puntos con la recta. suposición referente al crecimiento exponencial?
(e) Pronostique la población para el año 2010.
1. (- 1, 2), (O, - 1), (1, 1) 2. (O, 2), (1, 4), (2, 5)
7. Una regla biológica práctica expresa que a medida que el
Para los problemas 3 al 5 aplique las fórmulas para b y m para área A de una isla aumenta diez veces, el número de espe-
comprobar que se ha obtenido el mismo resultado que en el cies animales, N, que viven en ella se duplica. La tabla
problema o ejemplo especificado. contiene datos para la isla en las Indias Occidentales. Su-
3. (-1,2), (O, -1), (1, 1). Véase el problema 1. ponga que N es una función potencial de A.
4. (0,2), (1,4), (2, 5). Véase el problema 2. (a) Utilice la regla biológica práctica para encontrar
S. (1, 1), (2, 1), (3,3). Véase el ejemplo 1. (i) N como función de A.

En los problemas 6 y 7 transformamos datos no lineales de modo (ii) In N como función de In A.


que parezcan más lineales. Por ejemplo, suponga que espera que (b) Usando los datos, tabule In N respecto a In A y en-
sus puntos (x, y) ajusten a una ecuación exponencial, cuentre la recta de mejor ajuste. ¿Su respuesta está de
y = Ce''", acuerdo con la regla biológica práctica?

donde a y e son constantes. Tomando el logaritmo natural en


ambos lados, obtenemos
In y = ax + In e. Isla Área (km-) Número de especies
Entonces, In y es una función lineal de x. Para hallar a y e, po- Redonda 3 5
demos usar mínimos cuadrados para la gráfica de In y respecto
Saba 20 9
a x.
Montserrat 192 15
6. La población de Estados Unidos era de unos 180 millones
Puerto Rico 8,858 75
en 1960, creció a 206 millones en 1970 y a 226 millones en
1980. Jamaica 10,854 70

(a) Si se supone que la población estuvo creciendo expo- Española 75,57l 130
nencialmente, utilice logaritrnos y el método de míni- Cuba 113,7l5 125
mos cuadrados para estimar la población en 1990.

http://gratislibrospdf.com/

También podría gustarte