Está en la página 1de 23

ANÁLISIS DE LA VARIANZA

(ANOVA) FUNDAMENTOS Y
SENSIBILIDAD
Nélida Mónica Cantoni Rabolini monican@infovia.com.ar
Blanca Rosa Vitale brvitale@yahoo.com
Introducción
 En el marco de la asignatura Estadística para Administradores
 Se presenta el fundamento y análisis del procedimiento de
comparación de medias de más de dos poblaciones.
 Planteamiento de los supuestos
 Tipo de Pruebas para llevar adelante el Análisis de la Varianza.
 Relaciona la inferencia estadística con la posibilidad de aplicación
en el ámbito laboral y profesional de los estudiantes.
 Desafío como docente, es encontrar un equilibrio entre los
fundamentos teóricos y el uso de tecnología
Tipos de estudio
Se realiza un experimento
para generar datos

Se identifica una variable de


interés y se controla una o
más variables que se
Experimentales
consideran que están
relacionadas con la variable
de interés

Se recaban datos de como


Estudios
influyen en ella

Mediante encuestas por


Observacionales
muestreo
Diseño de experimentos

 La estrategia de diseño de experimentos supone que los factores (tratamientos) se


asignan al azar a las unidades experimentales de modo de eliminar el sesgo y
simular mejor las condiciones presentes en el modelo. ANOVA a un criterio de
clasificación.
 Variable cualitativa es el tratamiento y el dato obtenido es una variable
cuantitativa.
 En ocasiones, se introduce una variable de bloqueo (bloques) para reducir el error
experimental. Los bloques son completamente aleatorios. Este procedimiento se
denomina ANOVA a dos criterios de clasificación.
ANOVA
 El Análisis de la Varianza (ANOVA) es un procedimiento para probar
medias poblacionales de más de dos poblaciones.
 En las aplicaciones empresariales hay situaciones que requieren de
comparación de procesos en más de dos niveles.
 También su utiliza en regresión con el fin de analizar la calidad de la
ecuación del modelo.
 En la práctica académica, esto es el test de significatividad global del
modelo de regresión múltiple.
ANOVA a un criterio de clasificación
   utiliza cuando se quiere analizar una respuesta cuantitativa (variable dependiente) medida
Se
bajo ciertas condiciones experimentales identificadas por una o varias variables categóricas
(variables independientes) denominada TRATAMIENTO.

 Hipótesis a plantear sobre igualdad de medias

 K es la cantidad de tratamientos
 Se especifica el nivel de significación
 Se utiliza el estadístico F de Snedecor
Nivel de significancia y potencia de la prueba

   nivel de significancia (denotado por alfa o ) es el nivel máximo aceptable de riesgo de


El
rechazar la hipótesis nula cuando la hipótesis nula es verdadera (error tipo 1). Por ejemplo,
si se realiza un ANOVA a un solo criterio de clasificación, utilizando las hipótesis
predeterminadas, un de 0.05 indica un riesgo de 5% de concluir que existe una
diferencia cuando en realidad no es así.

 Se utiliza el nivel de significancia para minimizar el valor de potencia de la prueba. Con


valores más altos de nivel de significancia, la prueba tiene más potencia, pero también
aumenta la probabilidad de cometer un error tipo I.
Requisitos
Independencia

• En relación al procedimiento de selección de la


muestra

Normalidad

• Kolmogorov-Smirnov
• Shapiro-Wilk

Homocedasticidad

• Levene
Hipótesis a plantear
  Normalidad

 Homocedasticidad

 Criterio de rechazo de H0 cuando p-valor <


 Se fija un = 0,05
Ejemplo 1. Ubicación de un producto en la góndola de un
supermercado y ventas.
Datos y Boxplot
Ejemplo 1. Prueba de Normalidad y
Homocedasticidad en SPSS
Gráficos de normalidad
en SPSS
Tabla ANOVA a un criterio de clasificación
Ejemplo 1 y ANOVA en SPSS
Altura del anaquel

A las rodillas A la cintura A los ojos


77 88 85
82 94 85
86 93 87
78 90 81
81 91 80
86 94 79
77 90 87
81 87 93

Fe P-valor
Ejemplo 1 y Resultados en Excel
Altura del anaquel Análisis de varianza de un factor

A las rodillas A la cintura A los ojos RESUMEN


77 88 85 Grupos Cuenta Suma Promedio Varianza
82 94 85
A las rodillas 8 648 81 13,14285714
86 93 87
78 90 81 A la cintura 8 727 90,875 6,982142857
81 91 80 A los ojos 8 677 84,625 21,125 Fc
86 94 79
77 90 87
81 87 93
ANÁLISIS DE VARIANZA
Suma de Grados de Promedio de los Valor crítico
Origen de las variaciones F Probabilidad
cuadrados libertad cuadrados para F
Nivel de
significación Entre grupos SCE 399,25 2 199,625 14,52 0,000109851 3,47

 = 0,05 Dentro de los grupos SCD 288,75 21 13,75

Total SCT 688 23        

Conclusión: Se rechaza la Ho de igualdad de medias


Fe p-valor
poblacionales. Se concluye que las poblaciones difieren entre sí.
Ejemplo 2. Métodos de fabricación de una sustancia.
Datos y Boxplot

Métodos de fabricación
M1 M2 M3 M4 M5
63 27 10 28 47
48 41 30 45 28
57 23 24 44 30
54 31 37 31 35
41 2 40 29 21
43 33 24 44 37
Ejemplo 2. Prueba de Normalidad y
Homocedasticidad en SPSS

P-valor < 0,05


Test de Kruskal-Wallis
 
 Cando las condiciones de normalidad del modelo no se cumplen y la homocedasticidad
no pueden asumirse, una alternativa no paramétrica es el test de Kruskal-Wallis.
 Se trabaja con una variable cualitativa ordinal que es el rango que le corresponde a
cada observación experimental.
 Se supone un modelo de la siguiente forma
+

Para facilitar el calculo se usa la siguiente expresión


H=

La distribución de H es libre y puede demostrarse que es asintóticamente, que bajo Ho, es una
Por tanto, La región critica es

La prueba de Kruskal-Wallis fue propuesta por William Henry Kruskal y W. Allen Wallis en el artículo "Use of
ranks in one-criterion variance analysis" publicado en el “Journal of American Statistics Association” en
1952.
Rango y suma de rangos para cada método

Rangos Métodos
M1 M2 M3 M4 M5
30 7 2 8,5 26
27 20,5 11,5 25 8,5
28 4 5,5 23,5 11,5
29 13,5 17,5 13,5 16
20,5 1 19 10 3
22 15 5,5 23,5 17,5
Suma de los rangos 156,500 61,000 61,000 104,000 82,500
Prueba de Kruskal-Wallis


Sensibilidad de la prueba
  La sensibilidad de la prueba determina la capacidad del procedimiento para detectar
diferencias entre las medias poblaciones.
 Se mide con la potencia de la prueba .
 Donde es la probabilidad de no rechazar una hipótesis nula cuando es falsa.
 En ANOVA, es la probabilidad de que el estadístico F se halle en la región crítica cuando
de hecho la hipótesis nula sea falsa y las medias del tratamiento difieren entre sí.
Sensibilidad de la prueba
 La potencia de un ANOVA de un solo factor es la probabilidad de que la prueba
determine que la diferencia máxima entre las medias de los grupos es estadísticamente
significativa cuando realmente exista esa diferencia.
 Cuando n aumenta el valor de F se aproxima a cero y aumenta la potencia de la prueba.
Bibliografía

 ANDERSON D.R., SWEENEY D.J., WILLIAMS T.A., CAMM J.D., COCHRAN J.J.;
(2015); Estadística para negocios y economía 12ª. ed.; México; Cengage Learning.
 LEVIN R.I., RUBIN D.S.; (2004) Estadística para administración y economía 7ª ed.;
México; Pearson Prentice Hall.
 NEWBOLD P., CARLSON W.L., THORNE B.; (2008) Estadística para administración y
economía 6ª. ed; Madrid; Prentice Hall.
 PEREZ LOPEZ C. (2209) Técnicas de análisis de datos con SPSS 15. Madrid; Pearson
Prentice Hall
 WALPOLE R. E., MYERS R.H., MYERS S.L., YE K.; (2007); Probabilidad y Estadística
para ingeniería y ciencias 8° ed.; México; Pearson Prentice Hall.

También podría gustarte