Está en la página 1de 2

Análisis de varianza: El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias, que es necesario

porque
cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos motivos:

En primer lugar, y como se realizarían simultánea e independientemente varios contrastes de hipótesis, la probabilidad de encontrar alguno significativo
por azar aumentaría. En cada contraste se rechaza la H0 si la t supera el nivel crítico, para lo que, en la hipótesis nula, hay una probabilidad a. Si se realizan
m contrastes independientes, la probabilidad de que, en la hipótesis nula, ningún estadístico supere el valor crítico es (1 - a)m, por lo tanto, la probabilidad
de que alguno lo supere es 1 - (1 - a)m, que para valores de a próximos a 0 es aproximadamente igual a a m. Una primera solución, denominada método de
Bonferroni, consiste en bajar el valor de a, usando en su lugar a/m, aunque resulta un método muy conservador.

Por otro lado, en cada comparación la hipótesis nula es que las dos muestras provienen de la misma población, por lo tanto, cuando se hayan realizado
todas las comparaciones, la hipótesis nula es que todas las muestras provienen de la misma población y, sin embargo, para cada comparación, la
estimación de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas.

El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método que permite comparar varias medias en diversas
situaciones; muy ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base del análisis multivariante.

El análisis de varianza, o ANOVA, es un método de modelado lineal para evaluar la relación entre campos. Para los controladores clave, ANOVA prueba si el
valor objetivo de media varía entre combinaciones de categorías de dos entradas. Si la variación es significativa, existe un efecto de interacción.

Para probar si las medias son diferentes, una prueba ANOVA compara la varianza explicada (provocada por los campos de entrada) con la varianza no
explicada (provocada por el origen del error). Si la proporción de la varianza explicada con la varianza no explicada es alta, las medias son estadísticamente
diferentes.

IBM® Watson Analytics puede calcular pruebas ANOVA unidireccionales (con una entrada) y pruebas ANOVA bidireccionales (con dos entradas). Si una
entrada es continua, la entrada se agrupa para crear grupos cuyas medias objetivo se pueden comparar con la prueba ANOVA. Una prueba ANOVA
unidireccional es una extensión de la prueba t, pero una prueba ANOVA puede comparar cualquier número de medias. La prueba t solo puede comparar
dos medias.

Aunque una prueba ANOVA revele una diferencia estadística entre medias, no indica qué medias son diferentes. Para los controladores clave,  Watson
Analytics informa de los grupos de valores altos y bajos. Estos grupos "inusuales" están provocando que las medias sean diferentes.

ANOVA unidireccional

La prueba ANOVA unidireccional utiliza un valor F. El procedimiento siguiente describe cómo se calcula el valor F.
1. Calcule la media global para el campo continuo.
2. Calcule la media cuadrática para el campo categórico (la varianza explicada).
a. Calcule la suma de cuadrados para el campo categórico.
i. Para cada categoría, reste la media global de la media de la categoría.
ii. Tome el cuadrado de cada uno de estos resultados y añádalos juntos,
b. Divida la suma de cuadrados para el campo categórico por los grados de libertad apropiados.
3. Calcule la media cuadrática para el origen de error (la varianza no explicada).
a. Calcule la suma de cuadrados para el origen del error.
i. Dentro de cada categoría, reste la media de la categoría de cada valor de registro.
ii. Tome el cuadrado de cada diferencia y añádalos juntos.
b. Divida la suma de cuadrados para el origen de error por los grados de libertad apropiados.
4. Divida la media cuadrática para el campo categórico por la media cuadrática para el origen del error. En otras palabras, calcule la proporción
de la varianza explicada con la varianza no explicada. Este es el valor F.
El valor F se compara con una distribución F teórica para determinar la probabilidad de obtener el valor F por azar.
 Esta probabilidad es el valor de significación.
 Si el valor de significación es menor que el nivel de significación, las medias son significativamente diferentes.
El tamaño del efecto para la prueba ANOVA unidireccional es eta-cuadrado.
ANOVA bidireccional
Al igual que ANOVA unidireccional, la prueba ANOVA bidireccional calcula un valor F. Sería demasiado complicado presentar aquí una descripción de texto
del cálculo. Watson Analyticsinforma del valor F para el efecto de interacción. Este valor F mide la proporción de la varianza provocada por el efecto de
interacción con la varianza no explicada.
El valor F se compara con una distribución F teórica para determinar la probabilidad de obtener el valor F por azar.
 Esta probabilidad es el valor de significación.
 Si el valor de significación es menor que el nivel de significación, las medias son significativamente diferentes.
El tamaño del efecto para la prueba ANOVA bidireccional es eta-cuadrado para el efecto de interacción. R 2 ajustado también se utiliza para estimar la
precisión del modelo.

También podría gustarte