Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Es el estudio de la relacin funcional del tipo lineal existente entre una variable en
estudio Y (variable aleatoria dependiente) y otra variable X llamada variable
independiente o explicativa con los siguientes objetivos:
1) Estimar en promedio esta relacin lineal.
2) Probar si esta relacin funcional es significativa.
3) Realizar predicciones estimada del comportamiento de Y para valores de X de
inters.
4) Evaluar el grado de bondad de ajuste de la estimacin realizada.
Ejemplo: Los siguientes datos son mediciones de la velocidad del aire(cm/seg) y del
coeficiente de evaporacin(mm2/seg) de las gotitas de combustibles en una turbina de
propulsin:
Y . X EY / X 0 1 X
Entonces
Y Y . X
A la ecuacin
Y . X EY / X 0 1 X
Yi
Y X
Y X 0 1 X
0
Se puede observar lo siguiente:
Xi
Y . X EY / X i 0 1 X i
i
E i 0 , 2i var i 2 , E i j 0 , i j ;
para i, j 1, 2,
Para estimar los parmetros se utiliza el mtodo de los mnimos cuadrados. Este mtodo
consiste en obtener los valores de 0 y 1 , los cuales sern denotados por b0 y b1 ,
respectivamente, que minimizan la suma de cuadrados de los errores obtenidos de una
muestra aleatoria. Esto es, si para los n valores fijados de X : X 1 , X 2 , , X n , se
extraen aleatoriamente el valor de Y, se obtiene la siguiente muestra aleatoria de pares :
X 1 , Y1 , X 2 ; Y2 , , X n , Yn
Entonces bajo el modelo estadstico:
Yi 0 1 X i i ,
i 1, 2, , n
Luego,
i Yi 0 1 X i ,
i 1, 2, , n
i 1
i 1
Q i2 Yi 0 1 X i
0 b0 , 1 b1
2 Yi 0 1 X i 1
i 1
0
0 b0 , 1 b
0 b0 , 1 b1
2 Yi 0 1 X i X i
i 1
0
0 b0 , 1 b
i 1
n
i 1
n
nb0 b1 X i Yi
n
b0 X i b1 X i2 X i Yi
i 1
i 1
i 1
b1
SP X , Y
,
SC X
donde:
n
X
i 1
Xi
n
n
2
X i2 n X X i2 i 1 ,
n
i 1
i 1
, Y
Y
i 1
, SC X X i X
n
i 1
n
n
X
i Yi
n
n
n
i 1
i 1
SP X , Y X i X Yi Y X i Yi n X Y X i Yi
n
i 1
i 1
i 1
Y b0 b1 X
se le llama Lnea de Regresin Estimada o Ecuacin de Regresin Estimada.
Y b0 b1 X estima a Y . X
Residuales: A la diferencia
ei Yi Yi ,
para i 1, 2, , n
se le conoce con el nombre de residual. Estos residuales son muy importante, permite
chequear si un conjunto de pares de observaciones cumplen con los supuestos del
modelo.
En el siguiente grfico se muestra estos conceptos:
Yi
Yi
Yi b0 b1 X
ei
b0
Xi
60
100
140
180
220
260
300
340
380
0.37
0.35
0.78
0.56
0.75
1.18
1.36
1.17
1.65
a)
10
X i 20 60 380 2000 ,
i 1
10
i 1
10
i 1
2
i
20 2 60 2 380 2 532000
i i
n
Xi
i 1
10
Xi
i 1
10
2000
200 , Y
10
2
Yi
i 1
10
Y
i 1
10
0.835
Xi
2
n
2000
i 1
2
SC X X i
532000
132000
n
10
i 1
n
n
X
i Yi
n
i 1
b1
SP X , Y 505.4
0.003828788
SC X
132000
Y 0.0692424 0.003828788 X
b0 0.0692424 mm 2 / seg
Es el estimado de la media del coeficiente de evaporacin de las gotitas de combustible
cuando la velocidad del aire es cero.
b1 0.003828788 mm/cm
Cuando la velocidad del aire se incrementa en un cm/seg, se estima que en promedio de
0.003828788 mm2/seg.
b) Y 0.0692424 0.003828788(140) 0.6052727 ,
e Y Y 0.78 0.6052727 0.177273
i 1
i 1
Yi Yi
3.-
e
i 1
4.-
e
i 1
2
i
es un valor mnimo
Eb0 0 y
Eb1 1 .
Y b0 b1 X
Yi
ei Yi Yi
Yi
Yi Y
Yi Y
Xi
En este grfico se puede observar que :
Yi Y Yi Yi Yi Y
Observe que
ei Yi Yi
Y Y b
i
b1 X i Y Y b1 X b1 X i Y b1 X i X
donde:
X i de la
variable X.
i 1
n
SC Y Yi Y
i 1
i 1
n
2
2
Yi Yi Yi Y 2 Yi Yi Yi Y
i 1
i 1
i 1
Y
n
i 1
Yi Yi Y 0
Entonces
SC Y Yi Y Yi Yi Yi Y
n
i 1
i 1
i 1
Y
n
i 1
n
2
Yi ei2 y
n
i 1
n
Y Y b X
i 1
i 1
X b12 X i X b12 SC X b1 SP X , Y
n
i 1
Por tanto,
SC Y Yi Y ei2 b1 SP X , Y
n
i 1
i 1
SC Y b1 SP X , Y ei2
i 1
SCTotal =
SCReg + SCError
Donde:
SC Y Yi Y : Expresa la variacin total de los n valores observados de Y
n
i 1
Y Y
n
i 1
Y
n
i 1
2
Yi ei2 : Expresa la variacin residual o la variacin no explicada por la
n
i 1
SCReg SCReg
SCReg
GLReg
1
SCError SCError
CMError
GLError
n2
CMReg
Prueba de hiptesis
Bajo la hiptesis H 0 : 1 0 y el supuesto i se distribuye normal y en forma
independiente con media cero y variancia comn 2 , se puede demostrar que
F
CMReg
F1,n2 / H 0 es verdadera .
CMError
Fc
CMReg
F 1 , 1, n 2
CMError
SC
GL
CM
Fc
SCReg
CMReg
SCError
SCTotal
n2
n 1
CMReg
CMError
CMError
Yi 8.35 ,
i 1
10
Y
i 1
9.1097
Entonces,
2
10
Yi
10
8.352 2.13745
2
SCTotal SC Y Yi i 1 9.1097 19
10
i 1
SCReg b1 SP X , Y 0.003828788505.4 1.935069 CMReg
SCError SCTotal - SCReg 2.13745 - 1.935069 0.202381
CMError
SCError 0.202381
0.02529763
n-2
8
SC
1.935069
0.202381
2.13745
GL
1
8
9
H 0 : 1 0 , contra H a : 1 0 , 0.05
CM
Fc
1.2935069 76.4921
0.02529763
Coeficiente de Determinacin r 2
Es una medida del grado de bondad de ajuste y mide que proporcin de la variacin
total de Y es explicada por el modelo de regresin. As, el coeficiente de determinacin
muestral se define:
r2
SCReg
SCTotal
Coeficiente de No Determinacin 1 r 2
A 1 r 2 se le llama coeficiente de no determinacin muestral y expresa la proporcin
de la variacin total Y que no es explicada por la lnea de regresin estimada. Es decir,
indica la parte de la variacin total de Y que se debe a otros factores no considerado en
el modelo. De acuerdo, a esta definicin, el valor del coeficiente de no determinacin
muestral se encuentra
SCReg
SCError
1 r2 1
SCTotal SCTotal
Ejemplo: Continuando con el ejemplo de coeficiente de evaporacin de gotitas de
combustibles, se tiene:
r2
SCReg 1.935069