Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicio 11
Tema 11. Predicción y análisis de residuos
Mediante el método de mínimos cuadrados se obtiene la mejor línea recta que ajusta a
los datos experimentales.
Si el ajuste es pobre, debe descartarse el modelo lineal y buscar otro. Una importante
aplicación del modelo de regresión es la predicción de nuevas observaciones de Y
correspondientes a un valor dado de X. Si X0 es el valor de interés, entonces:
Ŷ = b0 + b1X0
El primer término, S2ε, mide la dispersión de los datos sobre la línea de regresión de la
muestra (primera fuente de incertidumbre).
El segundo término:
Puesto que:
Donde X0 es el valor dado de X; además Ŷ = b0 + b1X0. Para el ejemplo anterior, si X0 =
4, entonces, un intervalo de confianza al 95% para Ŷ = 6.75 será:
t* = t0.05/2 (4 -2) = t0.025 (2) = 4.303
Entonces:
En donde:
Análisis de residuos
El hecho de ajustar un modelo por mínimos cuadrados, construir intervalos de
predicción y probar hipótesis, no completa el estudio de regresión. Estos pasos son
solamente la mitad de la historia: las inferencias que se pueden hacer cuando los
supuestos del modelo se cumplen de manera adecuada.
Independencia: Los términos de error e son independientes uno del otro. Este supuesto
implica que la muestra de datos X-Y es aleatoria. Cuando los datos X-Y son registrados
a lo largo del tiempo, a menudo se viola este supuesto. Más que ser independientes,
las observaciones consecutivas están correlacionadas serialmente.
Homogeneidad de varianzas: La dispersión de los datos poblacionales alrededor de la
línea de regresión de la población permanece constante a lo largo de la línea. La
varianza de la población no se hace ni más grande ni más pequeña, aunque los valores
X de los puntos aumenten.