Está en la página 1de 4

ANÁLISIS DE LA VARIANZA (ANOVA) DE UN FACTOR

Grupo: 100403_56

Gabriel Antonio Montenegro Castellanos


7317116

Tutor:
José Rodrigo González

Universidad Nacional Abierta y a Distancia


Escuela de Ciencias Básicas Tecnología e Ingeniería
Industrial
Mayo 2017
Análisis de la varianza (ANOVA) de un factor
El análisis de la varianza (ANOVA) permite comparar dos o más medias
poblacionales asociadas a tratamientos.
Se utiliza cuando existe una variable dependiente o respuesta (cuantitativa) y una
o más variables implicatorias o independientes o factores (cuali o cuantitativas)
que afectan a la variable respuesta.
La manera para determinar si existen diferencias entre dos o más medias
poblacionales es examinar la diferencia entre las medias muéstrales y compararla
con una medida de variabilidad dentro de las muestras.
La separación entre las medias es una parte de la historia; la otra parte es la
variabilidad dentro de cada grupo, el anova usa esta estrategia para comparar dos
o más medias.
Anova consiste en descomponer la variabilidad de la variable respuesta en:
Variabilidad explicada o debida a los tratamientos (variabilidad entre tratamientos)
Variabilidad no explicada por los tratamientos o variabilidad aleatoria o residual
(variabilidad dentro de los tratamientos).
El modelo estadístico es:
γij=μ+αi+εij
Donde µ es la media general o media de la población
αi es el efecto del tratamiento i y que es común a todos los individuos que
recibieron ese tratamiento
ε ij es el residuo o error aleatorio que existe dentro de cada tratamiento, entre los
individuos.
Supuestos del modelo para que las conclusiones del Anova sean válidas, se
deben verificar una serie de supuestos:
Las muestras deben ser aleatorias y las observaciones independientes entre sí.
Las observaciones de cada tratamiento deben proceder de poblaciones normales
Los tratamientos deben tener la misma variabilidad (homocedasticidad).
El Anova requiere el cumplimiento los siguientes supuestos:
Las poblaciones (distribuciones de probabilidad de la variable dependiente
correspondiente a cada factor) son normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza (homocedasticidad).
El ANOVA se basa en la descomposición de la variación total de los datos con
respecto a la media global (SCT), que bajo el supuesto de que H0 es cierta es una
estimación de   obtenida a partir de toda la información muestral, en dos partes:
Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de
los valores de cada muestra con respecto a sus correspondientes medias.
Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las
medias de las muestras con respecto a la media global.
Las expresiones para el cálculo de los elementos que intervienen en el Anova son
las siguientes:

Media Global: 

Variación Total: 

Variación Intra-grupos: 

Variación Inter-grupos: 
Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra

y  su media.

Cuando la hipótesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores


insesgados de la varianza poblacional y el cociente entre ambos se distribuye
según una F de Snedecor con K-1 grados de libertad en el numerador y N-K
grados de libertad en el denominador. Por lo tanto, si H0 es cierta es de esperar
que el cociente entre ambas estimaciones será aproximadamente igual a 1, de
forma que se rechazará H0 si dicho cociente difiere significativamente de 1.

Como vemos, ANOVA será especialmente útil en aquellos supuestos en los que
queramos analizar distintas situaciones o alternativas de actuación y donde de
alguna forma podemos intervenir en la realización del experimento. A diferencia
del análisis econométrico habitual, donde las series históricas son dadas y no
podemos repetir la situación, ni modificar alguna de las condiciones o variables
(pensemos en el P.I.B., inflación, etc.) para estudiar sus efectos, en el contexto
ANOVA y ANCOVA nos encontraremos la mayoría de las veces ante datos
experimentales (controlables y/o repetibles en mayor o menor grado).
Bibliografía
V. Abraira, A. Pérez de Vargas Métodos Multivariantes en Bioestadística. 
Ed. Centro de Estudios Ramón Areces. 1996.
Lizasoain, L., Joaristi, L. (2003). Gestión y análisis de datos con SPSS. Versión
11. Thomson: Madrid.

También podría gustarte