Está en la página 1de 1

RESÚMEN MODELACIÓN ESTADÍSTICA

COLINEALIDAD O MULTICOLINIALIDAD Para identificarlo, usamos:

La colinealidad ocurre cuando un predictor esta relacionado 1. qqnorm(modelo1$residuals)


linealmente con uno o más predictores. 2. qqline(modelo1$residuals, col = "red")

No hay un modelo concreto para determinar si hay o no y el test de hipótesis de normalidad:


colinealidad. Pero existen las siguientes reglas prácticas:
shapiro.test(modelo$residuals)
2
- Si el coeficiente R es alto y ninguno de los
H 0 : los datos siguen una distr. Normal
predictores son significativos.
Se identifica usando summary(modelo).
H 0 : los datos no siguen una distr. normal
 R2 1 buen modelo
2
 R 0 mal modelo - Si el pvalor ≤5 % rechazo H 0
- Matriz de correlación, se identifica usando cor.test(). - Si el pvalor >5 % acepto H 0
 corr ∨1∨¿ fuerte correlación
 corr 0 correlación débil/nula HOMOCEDASTICIDAD
- Hacer un modelo lineal simple entre cada uno de los
1) Gráfico de Residuos vs. Valores Predichos por el
predictores frente al resto.
modelo.
modelo ← lm(esp_vida ~…)
Si los datos se dispersan de forma aleatoria por la
summary(modelo) → ≫ R2 posible colinealid. línea horizontal, significa que la Var es constante,
- Factor de inflación de Varianza, se identifica usando con el supuesto de homoced.
VIF(modelo) 2) Prueba de bptest(modelo) y mide el pvalor
 VIF=1 : No hay colinealidad
- Si el pvalor <5 % → no homoced.
1
 1< <0.1 : Hay cierta colinealidad
VIF INDEPENDENCIA

Si se encuentra colinealidad, hay 2 soluciones: Se usa Durbin-Watson para ver si hay independencia en
mediciones temporales.
1) Excluir el predictor problemático.
2) Combinar las variables colineales en un único dwt(modelo1,alternative = "two.sided")
predictor.
VALORES ATÍPICOS O INFLUYENTES:
Predictores significativos: aportan información relevante y útil influencePlot(modelo1)
para predecir o explicar los valores de la variable de respuesta.
- StudRes: si son ¿∨2∨¿ , son valores influyentes.
PARSIMONIA - Hat: puede ser un valor atípico o influyente, si:
El mejor modelo es aquel que puede explicar con mayor ¿^ 2.5( p+1 /n)
precisión usando la menor cantidad de variables predictoras. - Cook: c ≪∨2∨¿ no es influyente.

RELACIÓN LINEAL ENTRE LOS PREDICTORES


NUMÉRICOS Y LA VARIABLE RESPUESTA

DISTRIBUCIÓN NORMAL DE LOS RESIDUOS

También podría gustarte