Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5 de mayo de 2018
Javier Belalcazar A. ML
Análisis de Correlación
Modelo para una variable respuesta continua (con variables
predictoras continuas o categóricos), lo habitual es acudir a
modelos de regresión que permitan predecir la primera en
función de las restantes variables observadas que estén
relacionadas con ella.
Sin embargo, previamente es conveniente llevar a cabo, aparte
de la inspección gráfica, un análisis de asociación.
Cuando las variables explicativas son de tipo continuo y se
estudia si las relaciones son de tipo lineal, dicho análisis se
denomina de correlación.
Cuando disponemos de una única variable predictora, la medida
de asociación lineal es el coeficiente de correlacióon simple.
cuando tenemos varios predictores, se trabaja con los
coeficientes de correlación parcial.
Javier Belalcazar A. ML
Análisis gráfico de asociación
Javier Belalcazar A. ML
Análisis gráfico de asociación
Ejemplo
1 Parece ser que el dinero gastado en la mantenimiento de una
flota de buses es mayor a medida que aumenta los años de uso
de cada bus. Para ratificar esta hipótesis se tienen los siguientes
datos:
Javier Belalcazar A. ML
Análisis gráfico de asociación
Ejemplo
Javier Belalcazar A. ML
Análisis gráfico de asociación
Ejemplo
Javier Belalcazar A. ML
Análisis de Correlación
Javier Belalcazar A. ML
Correlación lineal simple
Cov (x, y )
ρ= p
Var (x)Var (y )
Javier Belalcazar A. ML
Correlación lineal simple
Interpretación de ρ
r = 0, no existe correlación lineal
r = −1 ó r = 1, correlación lineal perfecta
r < 0 correlación negativa, ↑ x ⇒ ↓ y
r > 0 correlación positiva, ↑ x ⇒ ↑ y
Javier Belalcazar A. ML
Contraste de Hipótesis
| rt |> tn−2;1−α/2
Javier Belalcazar A. ML
Contraste de Hipótesis
Javier Belalcazar A. ML
Modelo de Regresión Lineal Simple RLS
Javier Belalcazar A. ML
Estimación de la recta de regresión
ŷ = βˆ0 + βˆ1 x
Disponemos de dos criterios básicos de estimación, que
proporcionan la misma solución. Utilizar uno u otro depende de
nuestros intereses estadı́sticos. Si tan sólo queremos determinar
la recta, basta con considerar el criterio de Mı́nimos
Cuadrados. Si además pretendemos utilizarla con fines
inferenciales o predictivos, hablaremos de que nuestra solución es
la Máxima verosimilitud.
Javier Belalcazar A. ML
Estimación de σ 2
Javier Belalcazar A. ML
Estimación de σ 2
Javier Belalcazar A. ML
Estimación de σ 2
Ejemplo:
Variabilidad de errores en el ajuste para el ejemplo de buses.
¿Cuál es la variabilidad residual del modelo de regresión para los
datos de buses? Es posible reducir dicha variabilidad planteando
otro modelo de regresión basado en una transformación de los
datos originales?
Javier Belalcazar A. ML
IC - PH
Javier Belalcazar A. ML
IC - PH
Ejemplo:
Con el mejor modelo RLS obtenido hasta el momento para
predecir los costos en función del uso de los buses:
1 Construir intervalos de confianza al 99 % para β0 y β1 ¿Qué se
puede afirmar acerca de la de la relación entre dichas variables?
2 Concluir sobre los contrastes β0 = 0 y β1 = 0.
Javier Belalcazar A. ML
Coeficiente de Determinación
Javier Belalcazar A. ML
Anova
Javier Belalcazar A. ML
Anova
Javier Belalcazar A. ML