Está en la página 1de 3

ANOVA

 Objetivo: contrastar si las medias poblacionales de una variable Y a lo largo de K grupos


(tratamientos) son iguales a partir de una muestra
o Variable Y métrica de intervalo o razón
o Los k grupos (factor)  variable cualitativa (nominal u ordinal)
 Efecto placebo= Yp − yp
 Supuestos
o La variable Y sigue una distribución normal (cumplir con normalidad)
o Cada observación de Y debe ser independientes de otra
o Homocedásticas: Las varianzas poblacionales de Y (no muestrales) para los K
grupos son iguales
o Heterocedásticas se debe utiliza una variante de la estadística
 Variables: emplearemos
o Una variable dependiente métrica
o Una variable categórica de más de dos categorías
o variable categórica dicotómica o de dos categorías: respuesta sí o no
o diferenciar la cantidad de categorías que tienen una variable

 Variables categóricas cualitativas


o Tipos:
 Nominales no tienen orden
 Ordinal, tienen orden como las escalas
o Variables dicotómicas. Tienen solo dos respuestas
 Sexo: femenino y masculino  dos categorías
o Universidad: PUC, UP, UPC, UL 4 categorías
 Variable métrica cuantitativa (discreta y continua)
 Datos: Es una generalización de un test de comparación de 2 medias, test t
 Características
o Prueba paramétrica
o Permite hacer comparación de más de tres variables categóricas
 Supuestos:
o Variable dependiente tiene que medir por escala continua
o Variable independiente deben ser grupo categóricos independientes
o Observaciones deben ser independientes
o Distribución de la variable dependiente debe ser normal
o Debe tener homogeneidad de variancia

Planteamiento de Anova
 Hipótesis homogeneidad de varianzas
o Hipótesis nula: existe homogeneidad de varianza
o Ha: no existe homogeneidad de varianzas
 Hipótesis de Anova
o Ho: no hay diferencia de medias entre los grupos
 U1=U2=U3=Un (las medias poblacionales son iguales
o Ha: al menos dos medias son distintas
 Al menos dos medias poblacionales son distintas
Pasos R Generales
1. Cargo las librerías
o Library (car)
o Library(onewaytests)
o Library(userfriendlyscience)
2. Importo los datos
3. Identifico mis variable dependiente e independiente
o DEPEN= Archivo$Encabezado1
 Siempre la variable de numero porque de sacarse la media
o INDEP=as.factor(Archivo $ Encabezado 2)
 siempre el grupo
o DATOS= data.frame(DEPEN, INDEP)
4. Test de Levene para evaluar la homocedasticidad
o leveneTest(DEPEN, INDEP, center=mean)
 P-valor< Alpha Rechazo Ho, no hay homogeneidad de varianza
 P-valor> Alpha  Acepto Ho, hay homogeneidad de varianza
o F-Value (valor estadístico)

Ruta A: Homocedasticidad
 Aplico Anova Clásico
o CLA=aov (DEPEN ~ INDEP, data=DATOS)
o Summary (CLA)
 Evalúo el p-valor
o Si P-valor>Alpha queda
o Si P-valor<Alpha continúo
 Como existe diferencia de medias, realizo mi prueba post hoc-Tukey
o TukeyHSD (CLA, conf. level=0.95)
- Limite inferior del intervalo y limite superior del intervalo los datos están dentro del
intervalo o deberían estar dentro
- Diff La diferencia de medias
o Cuando es positiva seria que 2>1
o Cuando es negativo es que 2<1
- Mientras mayor es la diferencia, el p valor es mas pequeño por lo q se debe rechazar la
hipotesis
Ruta B: heteroscedasticidad
 Aplico Anova Welch
o Welch.test (DEPEN~INDEP, data=DATOS)
 Evalúo el p-valor
o Si P-valor>Alpha queda
o Si P-valor<Alpha continuo
 Como existe diferencias de medias, realizo mi prueba post hoc- Games Howell
o PosthocTGH (DEPEN, INDEP, conf. level=0.95)

 Librerías
o Dplyr: promedios por categorías
o Car: TEST DE LEVENE
o Onewaytests: Anova Welch
 Visualización de boxplot
o Boxplot(DEPEN~INDEP, data=DATOS)
 Calcular el promedio de cada grupo VARIABLE INDEPENDIENTE
o Summarise(group_by(datos,INDEP),promedio=mean(DEPEN)
 El método de Tukey produce Intervalos de confianza para la diferencia por pares

También podría gustarte