Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Planteamiento de Anova
Hipótesis homogeneidad de varianzas
o Hipótesis nula: existe homogeneidad de varianza
o Ha: no existe homogeneidad de varianzas
Hipótesis de Anova
o Ho: no hay diferencia de medias entre los grupos
U1=U2=U3=Un (las medias poblacionales son iguales
o Ha: al menos dos medias son distintas
Al menos dos medias poblacionales son distintas
Pasos R Generales
1. Cargo las librerías
o Library (car)
o Library(onewaytests)
o Library(userfriendlyscience)
2. Importo los datos
3. Identifico mis variable dependiente e independiente
o DEPEN= Archivo$Encabezado1
Siempre la variable de numero porque de sacarse la media
o INDEP=as.factor(Archivo $ Encabezado 2)
siempre el grupo
o DATOS= data.frame(DEPEN, INDEP)
4. Test de Levene para evaluar la homocedasticidad
o leveneTest(DEPEN, INDEP, center=mean)
P-valor< Alpha Rechazo Ho, no hay homogeneidad de varianza
P-valor> Alpha Acepto Ho, hay homogeneidad de varianza
o F-Value (valor estadístico)
Ruta A: Homocedasticidad
Aplico Anova Clásico
o CLA=aov (DEPEN ~ INDEP, data=DATOS)
o Summary (CLA)
Evalúo el p-valor
o Si P-valor>Alpha queda
o Si P-valor<Alpha continúo
Como existe diferencia de medias, realizo mi prueba post hoc-Tukey
o TukeyHSD (CLA, conf. level=0.95)
- Limite inferior del intervalo y limite superior del intervalo los datos están dentro del
intervalo o deberían estar dentro
- Diff La diferencia de medias
o Cuando es positiva seria que 2>1
o Cuando es negativo es que 2<1
- Mientras mayor es la diferencia, el p valor es mas pequeño por lo q se debe rechazar la
hipotesis
Ruta B: heteroscedasticidad
Aplico Anova Welch
o Welch.test (DEPEN~INDEP, data=DATOS)
Evalúo el p-valor
o Si P-valor>Alpha queda
o Si P-valor<Alpha continuo
Como existe diferencias de medias, realizo mi prueba post hoc- Games Howell
o PosthocTGH (DEPEN, INDEP, conf. level=0.95)
Librerías
o Dplyr: promedios por categorías
o Car: TEST DE LEVENE
o Onewaytests: Anova Welch
Visualización de boxplot
o Boxplot(DEPEN~INDEP, data=DATOS)
Calcular el promedio de cada grupo VARIABLE INDEPENDIENTE
o Summarise(group_by(datos,INDEP),promedio=mean(DEPEN)
El método de Tukey produce Intervalos de confianza para la diferencia por pares