En este apartado se descompone la variabilidad de la variable respuesta en variabilidad explicada por el modelo ms variabilidad no explicada o residual, esto permitir contrastar si el modelo es significativo o no. Bajo la hiptesis de que existe una relacin lineal entre la variable respuesta y la regresora, se quiere realizar el siguiente contraste de hiptesis, frente a la alternativa por tanto, si se acepta H 0 , la variable regresora no influye y no hay relacin lineal entre ambas variables. En caso contrario, si existe una dependencia lineal de la variable respuesta respecto a la regresora. Para todos los datos muestrales se hace la siguiente descomposicin elevando al cuadrado y sumando se obtiene, en base a la ortagonalidad de los vectores se obtiene que los productos cruzados son cero, de donde se sigue la siguiente igualdad (Teorema de Pitgoras) que permite descomponer la variabilidad de la variable respuesta en la variabilidad explicada por la recta de regresin ms la variabilidad residual o no explicada por el modelo ajustado , 16/03/2011 6. El modelo de regresin lineal simple - dm.udc.es/asignaturas//sec6_6.html 1/2 Ahora se puede construir siguiente tabla ANOVA Tabla ANOVA del modelo de regresin simple Fuente de Variacin Suma de Cuadrados Grados de Libertad Varianzas Por la recta scE = i = 1 n 2 1
e 2 = Residual scR = i = 1 n 2 n - 2
R 2 = Global scG = i = 1 n 2 n - 1
Y 2 = Si H 0 es cierta (la variable X no influye), la recta de regresin es aproximadamente horizontal y se verifica que aproximadamente i , y por tanto scE 0. Pero scE es una medida con dimensiones y no puede utilizarse como medida de discrepancia, para resolver este inconveniente se divide por la varianza residual y como estadstico del contraste de regresin se utiliza el siguiente Por la hiptesis de normalidad y bajo H 0 se deduce que el estadstico R sigue una distribucin F (Contraste de la F) con 1 y n - 2 grados de libertad. (6.14) S el p - valor = P es grande (mayor que ) se acepta H 0 . El Contraste de la F es un contraste unilateral (de una cola) pero en este modelo proporciona exactamente el mismo resultado que se obtiene por el contraste individual de la t relativo al coeficiente de regresin 1 (Contraste de la t) estudiado en el apartado anterior. [Siguiente][Anterior][Arriba] 16/03/2011 6. El modelo de regresin lineal simple - dm.udc.es/asignaturas//sec6_6.html 2/2 [Siguiente][Anterior][Arriba] 6.7 El contraste de linealidad. Si para cada valor de la variable explicativa se dispone de varios valores de la variable respuesta (algo normal en los modelos de regresin de diseo fijo) la muestra es de la siguiente forma , que se puede ordenar como en la tabla adjunta X 1 X 2 ... X k Y 11 Y 21 ... Y k1 Y 12 Y 22 ... Y k2 Y 1n 1 Y 2n 2 ... Y kn k El tamao muestral es n 1 + n 2 + ... + n k = n, y para cada valor de X = x i , i = 1,2,...,k se puede calcular la media condicionada muestral de la variable respuesta: lo que permite descomponer los residuos de la siguiente forma Un razonamiento anlogo al realizado anteriormente permite descomponer la variabilidad no explicada como sigue,
16/03/2011 6. El modelo de regresin lineal simple - dm.udc.es/asignaturas//sec6_7.html 1/3
Ahora la descomposicin de la variabilidad total es la siguiente,
En base a esta igualdad se puede construir la siguiente tabla ANOVA, ms completa que la anterior, Tabla ANOVA del modelo de regresin simple Fuente de Variacin Suma de Cuadrados Grados de Libertad Varianzas Recta scE = i = 1 k n i 2 1 e 2 = scR(1) scR(2) scR scR(1) = i = 1 k n i 2
scR(2) = i = 1 k
j = 1 n i 2 scR = i = 1 k
j = 1 n i 2 k - 2 n - k n - 2 R,1 2 = R,2 2 =
R 2 = Global Global i = 1 n 2 n - 1
Y 2 = A partir de esta tabla ANOVA se puede contrastar la hiptesis de que la funcin de regresin es lineal frente a la alternativa de que no es lineal, esto es, 16/03/2011 6. El modelo de regresin lineal simple - dm.udc.es/asignaturas//sec6_7.html 2/3 frente a la alternativa Si H 0 es cierto, las medias condicionadas estarn prximas a la recta de regresin: i
i , y la scR(1) = i = 1 k n i 2 0. De nuevo esta medida tiene dimensiones y no es vlida para utilizar como medida de discrepancia, para resolver el problema se compara con R,2 2 y el cociente de ambas cantidades se utiliza como estadstico del contraste en estudio. Bajo la hiptesis de normalidad y H 0 (hiptesis de linealidad) se deduce que L sigue una distribucin F k - 2, n - k (Contraste de la F). Este contraste de linealidad de la F es unilateral. Si el p-valor = P es grande (mayor que ) se acepta que la curva de regresin es lineal. [Siguiente][Anterior][Arriba] 16/03/2011 6. El modelo de regresin lineal simple - dm.udc.es/asignaturas//sec6_7.html 3/3