Está en la página 1de 12

Análisis de varianza de

un factor (ANOVA)
ANÁLISIS MULTIVARIADO
Áreas de aplicación
El análisis de varianza tiene una amplia aplicación en muchas
disciplinas; su uso es muy importante para la mejora de
procesos de manufactura, desarrollo de nuevos procesos,
productos, y la mejora de los ya existentes.
Ej. Conocer qué campaña publicitaria tiene más impacto en
las ventas de algún producto, qué tipo de aprendizaje
repercute en las calificaciones de los alumnos de ciertas
carreras o cuál dieta ayuda a bajar más de peso. Se pueden
modelar los fenómenos que surjan en los procesos
productivos, procedimientos de manufactura, métodos de
aprendizaje y sobre todo cuando a los individuos, servicios o
productos se les aplican diferentes tratamientos como en
medicina y psicología, entre otros.
Definición
El análisis de varianza es una técnica funcional que se emplea básicamente
en la experimentación; esta técnica utiliza una o más variables
independientes, todas ellas no métricas, y trata de explicar el
comportamiento de una o más variables dependientes métricas.
Se descompone el comportamiento de las variables dependientes en 3 o
más variaciones, las cuales indican qué tanto se logró explicar dicho
comportamiento.
El análisis de varianza es el estudio de la variabilidad del resultado de un
experimento y se puede dividir en dos partes.

◦ Una que se origina por los factores que influyen directamente en el resultado del
experimento
◦ Otra producida por el resto de los factores que también influyen en el resultado
del experimento con variabilidad no controlable, conocido como error muestral
Diferenciación
El análisis de varianza se diferencia
de otras técnicas porque:

◦ La variable dependiente forzosamente es


métrica y las independientes no
métricas; aunque esto último puede
variar.
◦ Hay al menos 3 variaciones
◦ Se puede llevar a cabo bajo
experimentación
Experimentación
La experimentación es un proceso que se
puede realizar en casi todas las áreas del
conocimiento.
La experimentación: es una prueba o
ensayo en el cual se inducen cambios en
los datos de entrada para observar las
causas de los cambios en los datos de
entrada para observar las causas de los
cambios en los datos de salida.
Experimentos naturales
Cuando el investigador solamente actúa como observador, sin poder seleccionar las unidades de
prueba, o participantes del experimento, en forma aleatoria y mucho menos asignar las distintas
circunstancias a analizar en el experimento.
Experimentos controlados
El investigador puede manipular el medio en el que se realiza
el experimento, así como seleccionar, manejar y asignar en
forma aleatoria a los participantes.
Todos los experimentos a partir de ahora se deberán entender
como experimentos controlados.
Diseño estadístico de experimentos: proceso de planeación de
un experimento que puede analizarse mediante métodos
estadísticos con el objeto de encontrar soluciones apropiadas.
Metodología estadística: único enfoque objetivo que analiza
problemas que involucran datos sujetos a errores
experimentales; existen 2 áreas en cualquier problema
experimental: el diseño del experimento y el análisis
estadístico.
Terminología
Cuando el objetivo de un análisis de varianza es explicar una variable dependiente a partir de “m” variables
independientes, la técnica se llama “análisis de varianza univariado” y también se conoce como ANOVA o
ANDEVA; es decir:

Cuando el objetivo del análisis de varianza es explicar “n” variables dependientes a partir de “m”
independientes, la técnica se llama “análisis de varianza multivariado” o MANOVA; en este caso sería:

Los factores o tratamientos son las variables independientes del experimento; se llaman factores porque las
variables independientes son características, y también se les llama como tratamientos por la manipulación
que se puede hacer de esas variables independientes para ver cómo afectan a la variable dependiente.
Los niveles de factor son los valores que toman las variables independientes.
Un error muestral es el error debido a la aleatoriedad en la selección de los elementos muestréales
Supuestos de análisis de varianza
◦ Homoscedasticidad

Las fuentes de variación deberán permanecer constantes o ser


iguales
◦ Normalidad

Los datos deben distribuirse normalmente


◦ Modelo aditivo

Es el que mejor explica el comportamiento de la variable


dependiente. En el que los efectos de los factores individuales se
diferencian y se agrupan para modelar los datos.
Análisis de varianza de un factor
El modelo unifactorial se presenta cuando se tiene un solo factor con diferentes niveles, que
influye sobre una variable dependiente que mide el resultado del experimento, es decir:

La hipótesis que se prueba en el análisis de varianza de un factor es que las medias poblacionales
(las medias de la variable dependiente en cada nivel de las variables independientes) son iguales.
Si las medias poblacionales son iguales, significa que el comportamiento de la variable
dependiente es el mismo en las diferentes alternativas que se manejan en el experimento y que,
por lo tanto, el factor es independiente de la variable dependiente, con lo cual se concluiría que el
factor no afecta a la dependiente.
PARA PONER A PRUEBA LA HIPÓTESIS DE IGUALDAD DE MEDIAS SE DEBE OBTENER UN
ESTADÍSTICO LLAMADO F QUE REFLEJA EL GRADO DE DIFERENCIAS ENTRE LAS MEDIAS QUE SE
COMPARAN.
Ejemplo de experimento ANOVA: explicación
de ventas de una salsa por el color del envase.
Variación total: se refiere a lo distinto que son los datos sin clasificarlos, compuesta por la
variable explicada y no explicada:

Variación explicada: también llamada variación entre grupos, se encuentra al comparar los
datos de los diferentes niveles del factor, es decir, muestra lo distinto que son los datos debido a
que pertenecen a diferentes colores de envase. Resulta de comparar cada promedio de cada
nivel con el promedio general de los datos.
Ejemplo de experimento ANOVA: explicación
de ventas de una salsa por el color del envase.
Variación no explicada: también llamada dentro de los grupos es la que existe entre los datos
dentro del mismo factor y no se considera en el experimento, es el resultado de la comparación
de cada dato de cada nivel de factor con respecto a su correspondiente promedio de nivel de
factor.

Cuadrados medios:

Prueba F:

También podría gustarte