Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Minimos Cuadrados
Minimos Cuadrados
y el mtodo de mnimos
cuadrados
AJUSTE DE CURVAS
Para determinar una ecuacin que relacione variables, un primer paso es recolectar datos
que muestran los valores correspondientes de las variables en c o n s i d e r a c i n . Por ejemplo,
s u p n g a s e que X y Y denotan la estatura y el peso de hombres adultos, respectivamente:
entonces, una muestra de N individuos revelara las estaturas X , , X , . . . , X , as como los
pesos correspondientes Y ,Y ,...,
Y.
2
A partir del diagrama de dispersin es posible visualizar una curva suave que se aproxima a los datos. Tal curva se denomina curva de aproximacin.
Por ejemplo, en la figura 13-1, los datos parecen aproximarse bien a una lnea recta, por lo que se dice que hay
una relacin lineal entre las variables. Sin embargo, en la figura 13-2, aunque existe una
relacin entre las variables, sta no es lineal, por lo que se le conoce como relacin no
lineal.
El problema general para encontrar ecuaciones de curvas de a p r o x i m a c i n que se ajusten a conjuntos de datos se denomina ajuste de curvas.
Ecuaciones
de curvas de aproximacin
285
+a
L n e a recta
Y--=
P a r b o l a o curva cuadrtica
Y---a
+ a X + aX
Curva c b i c a
y = -a
+ a X + aX
Curva curtica
y = --a
U)
2
+ a X
(3)
+ a X
(4)
a + a X + a X
a X + aX
Curva de grado n
(2)
(5)
Las partes derechas de las ecuaciones se denominan polinomios de primero, segundo, tercero, cuarto y rc-simo grados, respectivamente. Las funciones definidas por las primeras cuatro ecuaciones se llaman funciones lineal, cuadrtica,
cbica y curtica, en ese orden.
Las siguientes son algunas otras de las muchas ecuaciones usadas en la prctica con
frecuencia:
Hiprbola
Y=
a + aX
Curva exponencial
Curva g e o m t r i c a
Y = ab
Y = aX
= a + aX
0
(6)
(8)
Curva exponencial
modificada
Y = ab" + g
(9)
Curva g e o m t r i c a
modificada
Y=aX
+g
b
Curva de Gompertz
Y = pq * o
Curva de Gompertz
modificada
Y - pcf
Curva logstica
(10)
+h
Y=
o
abr + g
Y=a
+ a (logX)
0
q) = ab* + g
(11)
(12)
-l~=ab
+g
Y
+ a (\ogX)
:
(13)
(14)
C A f f f U l O 13
cuadrados
Con frecuencia puede utilizarse el j u i c i o personal para dibujar una curva de aprox
que ajuste un conjunto de datos. s t e se denomina mtodo de ajuste de curvas a mano.
conoce el tipo de ecuacin de esta curva, es posible obtener las constantes de la i
eligiendo tantos puntos de la curva como constantes haya en la e c u a c i n . Por ejemp!
curva es una lnea recta, se requieren dos puntos; si es una p a r b o l a , se necesitan tres
tos. E l m t o d o tiene la desventaja de que distintos observadores o b t e n d r n diferentes
y ecuaciones.
LA LINEA RECTA
El tipo m s simple de curva de a p r o x i m a c i n es una lnea recta, cuya e c u a c i n puede e
sarse
Y-
+ aX
x
Y-
^ =( f ^ r ) ^ - * ! )
Y-Y,=m{X-X )
x
Y Y
m =
X - X\
donde
Una medida de la "bondad de ajuste" de la curva C de los datos est proporcionada por
la cantidad D, + D\ + + D\. Si sta es p e q u e a , el ajuste es bueno; si es grande, el ajuste
es malo. Por lo tanto, se tiene la siguiente
D e f i n i c i n : De todas las curvas que se aproximan a un conjunto de datos definidos por puntos, la curva que tiene la propiedad de que D] + D\ + + D es un
m n i m o se denomina curva de ajuste
ptimo.
2
Se dice que una curva con esta propiedad se ajusta a los datos en el sentido de mnimos
cuadrados y se le llama curva de mnimos cuadrados. Entonces, una recta con esta propiedad se denomina recta de mnimos cuadrados, una p a r b o l a con esta propiedad se denomina parbola de mnimos cuadrados, etctera.
La recta de mnimos
cuadrados
287
(X ,Y ),...,
2
Y=a
+ X
(17)
E
E
+ a, E
Y = aN
Q
XY = a
X -i
a,
(18)
denominadas ecuaciones normales para la recta de mnimos cuadrados (17). Las constantes a y a, de las ecuaciones (18) pueden calcularse a partir de las f r m u l a s
0
(E
Y)(Z
X)
N Z X
- (E x)(E
XY)
- (E *)(E
E x - (E xf
XY
Y)
(19)
xf
- ( E
Las ecuaciones normales (18) son fciles de recordar si se observa que la primera ecuacin puede obtenerse sumando en ambos lados de (17), [es decir, X Y = X (a + a X) = a . V
+ a X X], mientras que la segunda e c u a c i n resulta multiplicando primero ambos lados de
(17) por Xy sumando d e s p u s [por ejemplo, X XY= X X(a + AX) = a ^.X + a _ V
O b s r v e s e que no es una consecuencia de las ecuaciones normales, sino slo un medio p o n
recordarlas. N t e s e t a m b i n que en las ecuaciones (18) y (19) se utiliz la notacin abrevada X X, X XY, etctera, en lugar de X^i X X^=i XY, etctera.
0
xy
E-v
m)
IMMMO
73
de mnimos
cuadrados
L a e c u a c i n (20) implica que y - 0 cuando JC = 0; por lo tanto, la recta de m n i m o s cuadrados pasa por el punto (X, Y), denominado centroide o centro de gravedad de los datos
Si la variable X se toma como la variable dependiente en lugar de la independiente, j .
e c u a c i n (17) se expresa como X - b + b Y. Entonces, los resultados son vlidos si X
intercambian y si a y a se sustituyen por b y >,, respectivamente. Sin embargo, la recta de
m n i m o s cuadrados resultante, por lo general, no es igual a la obtenida [vanse los problemas 13.11 y 13.15d)].
0
RELACIONES N O LINEALES
En ocasiones las relaciones no lineales pueden reducirse a relaciones lineales por medie e
una trasformacin adecuada de las variables (vase el problema 13.21).
Y = a
+ aj
+ OTX
(21
2> = N
XAT = a X x
ao
lX Y
a Xx
0
+ a,
XX
+a XX
L
+ a ZX
l
a 1*
a ^X
2
+ aIX
2
(23]
REGRESIN
Con frecuencia, basados en datos m u s t r a l e s , se busca estimar el valor de una variable Y
correspondiente a un valor dado de una variable X. Esto se puede lograr estimando el valor
de K a partir de una curva de m n i m o s cuadrados que se ajuste a los datos m u s t r a l e s . L a
curva resultante se llama curva de regresin de y sobre X, ya que Y se estima a partir de X.
Si se deseara estimar el valor de X a partir de un valor dado de Y, se utilizara una curva
de regresin de X sobre Y, que es igual que intercambiar las variables en el diagrama de
dispersin, de tal modo que X sea la variable dependiente y Y la variable independiente.
Esto es equivalente a sustituir las desviaciones verticales en la definicin de la curva de
m n i m o s cuadrados de la pgina 287 con desviaciones horizontales.
En general, la recta o curva de regresin de Y sobre X no es igual que la recta o curva de
regresin de X sobre Y.
Problemas
res.s
-;s
289
(24)
Por e x t e n s i n del m t o d o de m n i m o s cuadrados es posible hablar de un plano de mnimos cuadrados que se aproxima a los datos. Si se estima Z a partir de valores dados de X y
Y, esto se llamara plano de regresin de Z sobre XyY. Las ecuaciones normales, correspondientes al plano de m n i m o s cuadrados (24), estn dadas por
Xz
= N
+a,Xx
XXZ
=a XX
+ a, X X + a X X K
XKZ
=a I,Y
+a TXY+a *ZY
AO
a Xy
2
(25)