Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresion
Regresion
F. de Mendiburu
2
donde:
o : El valor de la ordenada donde la lnea de regresin se intersecta al eje Y.
1 : El coeficiente de regresin poblacional (pendiente de la lnea recta)
: El error.
Suposiciones de la regresin lineal
1. Los valores de la variable independiente X son "fijos".
2. La variable X se mide sin error (se desprecia el error de medicin en X)
3. Existe una subpoblacion de valores Y normalmente distribuido para cada valor de
X.
4. Las variancias de las subpoblaciones de Y son todas iguales.
5. Todas las medias de las subpoblaciones de Y estn sobre la misma recta.
6. Los valores de Y estn nomalmente distribuidos y son estadsticamente
independientes.
Los supuestos del 3 al 6 equivalen a decir que los errores son aleatorios, que se
distribuyen normalmente con media cero y variancia .
Terminologia:
Promedios
y=
yi
n
; x=
xi
n
SCY = y y ;
i
SCX = xi x
)(
; SPXY = x i x y i y
F. de Mendiburu
Q = ei2 = y i 0 1 x
)2
bo = y b1 x
b1 =
spxy
scx
Sb0 =
CMresidual. X i2
n.SCX
Sb1 =
CMresidual
SCX
F. de Mendiburu
(y y ) = (y) y )+ (y y) )
i
F. de Mendiburu
2
2
) 2
)
yi y = yi y + ( yi yi )
n-2
Diferencia
Total
n-1
SC Y
Cuadrados Medios
(CM)
b1.SPXY
SC(residual) / (n2)
F. de Mendiburu
Fc
CM(regresion)/
CM(residual)
6
Para el ejemplo del grafico (ao base 1990 = 0)
Aos (X)
0
1
2
3
4
5
6
7
8
9
Madera Aserrada (Y) 489.25 475.24 495.72 585.2 565.78 630.22 624.92 482.27 590.27 834.67
Regression
Residual
Total
Gl
1
8
9
SC
CM
F
F0.05
49223 49223 6,9941 5,31
56303 7037.8
105526
Pr>F
0,0295
F. de Mendiburu
En funcin del modelo se puede hacer estimaciones para los siguientes aos:
2000
2001
2002
711.7
736.12
760.55
Estas proyecciones son puntuales, en base al modelo; para ao 2000, X=10, resulta una
produccin de 711 mil m3 de madera aserrada.
Para obtener limites de confianza para estos valores predecidos, se debe determinar sus
desviaciones estandar correspondiente; utilice la siguiente formula:
1 x x
S _ Pr edicho = CMresidual 1 + + 0
SCX
n
)
2
Prueba de Hipotesis
Se plantea los siguientes casos:
a) Cuando 1 = 0; es decir, si la variable Y no esta relacionada linealmente con la
variable X. Esto equivale a plantear la hiptesis Hp: 1=0, y va una prueba F
comparar el valor de F calculado (Fc) con el valor F tabular (Fo), donde
Fc=CMR/CME y Fo=F(1,n-2)gl. Si Fc>Fo, se rechaza la hipteis planteada,
esto supone un valor 1 distinto de cero y se concluye que Y se puede expresar
en terminos de X linealmente.
b) Cuando 1 tiene un valor especfico distinto de cero 10; es decir, Hp: 1=10.
En este caso, para la prueba de esta hiptesis se usa el estadstico t de Student. El
valor t calculado es hallado mediante la expresin: tc = (b1-10)/Sb1
Si tc > t se rechaza la hiptesis planteada, donde t es el valor de la tabla al nivel
y n-2 gl.
F. de Mendiburu
8
Para el ejemplo planteado, se rechaza la hipotesis planteada, esto significa que existe una
relacin lineal significativa del tiempo y la produccin de madera aserrada total.
Analisis de Correlacion
El anlisis de correlacin emplea mtodos para medir la significacin del grado o
intensidad de asociacin entre dos o ms variables. El concepto de correlacin est
estrechamente vinculado al concepto de regresin, pues, para que una ecuacin de
regresin sea razonable los puntos muestrales deben estar ceidos a la ecuacin de
regresin; adems el coeficiente de correlacin debe ser:
-
SPXY
SCX .SCY
Para los datos de la produccin de madera aserrada total entre los aos 1990 a 1999,
existe una asociacin de 0.68.
r=
2015,17
= 0.68
(105525,86)(82,5)
F. de Mendiburu
9
Mide el porcentaje de variacin en la variable respuesta, explicada por la variable
independiente.
De la descomposicin de la suma de cuadrados total, se obtuvo:
SCT = SCR + SCE
SCR = Suma de cuadrados de la regresin.
SCE = Suma de cuadrados residual (error).
dividiendo ambos miembros por la SCT, se tiene:
1 = SCR/SCT + SCE/SCT
de este resultado, se define el coeficiente de determinacion como:
R = 1 - SCE/SCT = SCR/SCT
R = SC regresion / SC total
Como SCR SCT, se deduce que 0 R 1.
Interpretacin de R:
Se interpreta como una medida de ajuste de los datos observados y proporciona el
porcentaje de la variacin total explicada por la regresin.
R es un valor positivo, expresado en porcentaje es menor de 100.
Tambien, se puede obtener el R ajustado que es la relacion entre cuadrados medios, asi:
R ajustado = 1 CME / CM Total;
Este valor podria ser negativo en algunos casos.
Lo que se espera que ambos R, resulten similares, para dar una confianza al coeficiente
de determinacin.
Para el ejemplo, resulta:
R ajustado = 1 70378 / (105526 / 9 ) = 0,39 y R = 1 56302,7 / 105525,86 = 0,46
F. de Mendiburu