Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de la Varianza
Ing. Erica Raña 2
El , permite probar
hipótesis referidas a los parámetros de posición
(esperanza) de dos o más distribuciones.
Análisis de la Varianza
Ing. Erica Raña 3
Las técnicas englobadas bajo la denominación de
análisis de la varianza o ANOVA (del inglés
ANalysis Of VAriance) han jugado un papel
crucial en la metodología estadística moderna,
desde que fueran ideadas por R. A. Fisher en
1925.
Análisis de la Varianza
Ing. Erica Raña 4
En el planteamiento más simple de análisis de la
varianza tenemos una variable numérica
cuantitativa (respuesta), y queremos determinar
en qué medida se puede atribuir la variabilidad de
ésta a otra variable cualitativa nominal que vamos
a denominar factor.
Análisis de la Varianza
Ing. Erica Raña 5
Estudio observacional
Sobre un proceso existente se observan (registra
información) de una o más variables aleatorias.
Finalidad: explorar, describir, confirmar hipótesis.
Estudio experimental
“Prueba o serie de pruebas en las cuales se inducen
cambios deliberados en las variables de entrada de un
proceso o sistema de manera que sea posible observar
e identificar las causas de los cambios en la respuesta o
variable de salida” (Montgomery 1991).
“Es una reproducción restringida de la realidad con el fin
de observar los efectos de su manipulación planificada”
(Casanoves y Di Rienzo, 1999).
Finalidad : confirmar hipótesis, modelar , predecir
Análisis de la Varianza
Ing. Erica Raña 6
Consisten en la aplicación de tratamientos a un
conjunto de unidades experimentales para valorar
y comparar las respuestas obtenidas.
Análisis de la Varianza
Ing. Erica Raña 7
En experimentos con fines comparativos,
usualmente se realiza la aplicación de varios
tratamientos a un conjunto de unidades
experimentales para valorar y comparar las
respuestas obtenidas bajo cada tratamiento.
Análisis de la Varianza
Ing. Erica Raña 8
Un productor quiere comparar el efecto de
tres fertilizantes (A, B y C) en el
crecimiento de sus plantas de tomate.
Para medir el efecto del fertilizante eligió la
variable “altura de las plantas”.
Seleccionó 15 plantas de tomate de una
semana y las plantó en diferentes
maceteros.
Asignó aleatoriamente los 3 fertilizantes y se
los administró a las plantas por 45 días
Análisis de la Varianza
Ing. Erica Raña 9
Seleccionar al azar 15 plantas de tomate sembradas el
mismo día y en idénticas condiciones y se distribuyen
aleatoriamente en 3 grupos.
Grupo 1: Fertilizante A
Grupo 2: Fertilizante B
Grupo 3; Fertilizante C
Análisis de la Varianza
Ing. Erica Raña 10
La altura (en cm) Fert A Fert B Fert C
de las 15 plantas 37 41 35
de tomate al
finalizar el 35 42 36
período de 36 43 36
estudio se
muestra en la 38 44 37
Tabla:
39 46 38
Análisis de la Varianza
Ing. Erica Raña 11
Qué variables intervienen en el experimento?
Análisis de la Varianza
Ing. Erica Raña 12
La técnica de análisis de la varianza presupone un
modelo para la variable respuesta.
siendo:
Yij la j-ésima observación del i-ésimo tratamiento
la media general de las observaciones
i el efecto del i-ésimo tratamiento
ij una variable aleatoria normal independientemente
distribuida con esperanza 0 y varianza 2 i,j.
Análisis de la Varianza
Ing. Erica Raña 13
Mediante el ANOVA de efectos fijos se puede
contrastar la hipótesis de que los efectos de
tratamientos son nulos vs. que al menos uno no
lo es.
En términos estadísticos:
H0: 1=...=a= 0
Análisis de la Varianza
Ing. Erica Raña 14
Otra forma de enunciar estas hipótesis es:
Siendo i = + i
Análisis de la Varianza
Ing. Erica Raña 15
4 2 3 1
2
El ANOVA permite descomponer la variación total
de las observaciones en:
Análisis de la Varianza
Ing. Erica Raña 18
2
El ANOVA se basa en la descomposición de la
variación total de los datos con respecto a la media
global (SCTot) en dos partes (bajo el supuesto de
que H0 es cierta).
Análisis de la Varianza
Ing. Erica Raña 20
El criterio es:
Hipótesis alternativa
4 2 3 1
Entonces, se plantean las hipótesis siguientes:
2 2
𝐻0 : 𝜎𝑒𝑛𝑡𝑟𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ≤ 𝜎𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
2 2
𝐻1 : 𝜎𝑒𝑛𝑡𝑟𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 > 𝜎𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
Nivel de significación: a
Análisis de la Varianza
Ing. Erica Raña 23
2 2
Cómo calcular 𝑠𝑒𝑛𝑡𝑟𝑒 y 𝑠𝑑𝑒𝑛𝑡𝑟𝑜 ?
Recordemos:
2 𝑥𝑖 −𝑥 2 𝑆𝑢𝑚𝑎 𝑑𝑒 𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠
𝜎 = =
𝑛−1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
Análisis de la Varianza
Ing. Erica Raña 24
Análisis de la Varianza
Ing. Erica Raña 25
El desvío con respecto a la media general para la
observación ij es:
Y Y Y Y Y Y
ij .. i. .. ij i.
y
y .. ni yi. y .. yij yi.
2 2 2
ij
i j i i j
Análisis de la Varianza
Ing. Erica Raña
La altura de las 15 plantas de tomate al finalizar los
tratamientos son:
Grupo
j i 1 2 3
1 37 41 35
2 35 42 36
3 36 43 36
4 38 44 37
5 39 46 38
ni yi. y ..
i
2
CMTrat
CMError
Dentro SCError = SCResidual = gld=N-k CMError
(Error SCTot - SCTrat
Experimental)
y yi .
2
ij
i j
Análisis de la Varianza
Ing. Erica Raña 28
Análisis de la Varianza
Ing. Erica Raña 29
2 𝑦 2 .. 5832
𝑆𝐶𝑇𝑜𝑡 = 𝑦
𝑖,𝑗 𝑖𝑗 − = 22831 − = 171,73
𝑛. 15
Análisis de la Varianza
Ing. Erica Raña 30
Fuente de Suma de Grados de Cuadrado F
Variación Cuadrados Libertad Medio
Entre 141,73 glTrat = k -1 141,73 / 2 =
Tratamientos 3-1 = 2 70,87
70,87 / 2,5 =
Dentro (Error 30,00 glError =N-k 30,00 / 12 =
Experimental) 15-3 = 12 2,5
28,35
Análisis de la Varianza
Ing. Erica Raña 31
El estadístico F es el cociente entre
CMTrat/CMError = 28,35.
Análisis de la Varianza
Ing. Erica Raña 32
El valor p para ésta prueba resultó 0,0001.
Decisión: Rechazar la H0
Análisis de la Varianza
Ing. Erica Raña 33
En otras palabras,
Análisis de la Varianza
Ing. Erica Raña 34
H0: Las medias de los tratamientos que se
comparan no difieren
Análisis de la Varianza
Ing. Erica Raña 35
La pregunta que el ANOVA no responde es:
¿cuál o cuáles de las medias
poblacionales en estudio son las
diferentes?
Análisis de la Varianza
Ing. Erica Raña 36
Mediante un único contraste de hipótesis, se realizan
múltiples comparaciones dos a dos.
La idea central de todas ellas es la determinación de
un umbral.
Si la diferencia entre dos de las medias de los niveles
del factor está por encima de ese umbral, se
considerará significativa.
Si esa diferencia está por debajo del umbral se
considerará no significativa.
Cada una de las pruebas de comparaciones múltiples
crea un umbral distinto según un criterio diferente.
Análisis de la Varianza
Ing. Erica Raña 37
Se debe usar para contrastes planificados
1 1
𝐷𝑀𝑆 = 𝑡 𝑎𝑙𝑓𝑎 𝐶𝑀𝐸 +
( 2 ;𝑔𝑙 𝑒𝑟𝑟𝑜𝑟) 𝑛1 𝑛2
𝑦1 − 𝑦2 > 𝐷𝑀𝑆
Análisis de la Varianza
Ing. Erica Raña 38
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo. 141,73 2 70,87 28,35 <0,0001
Fertilizante 141,73 2 70,87 28,35 <0,0001
Error 30,00 12 2,50
Total 171,73 14
Análisis de la Varianza
Ing. Erica Raña 39
Se basa en el estadístico de Tukey.
Se calculan todas las diferencias de medias
muestrales entre los niveles del factor estudiado y
se comparan con el umbral D
𝐶𝑀𝐸
∆ = 𝑞(𝑡,𝑔𝑙𝐸)
𝑛
La diferencia entre las medias de dos
tratamientos se declara significativa si
𝑦1 − 𝑦2 > ∆
Análisis de la Varianza
Ing. Erica Raña 40
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo. 141,73 2 70,87 28,35 <0,0001
Fertilizante 141,73 2 70,87 28,35 <0,0001
Error 30,00 12 2,50
Total 171,73 14
Medias con una letra común no son significativamente diferentes (p > 0,05)
Análisis de la Varianza
Ing. Erica Raña 41
Altura de plantas de Tomate
45 B
A A
36
Altura plantas
27
18
0
C A B
Fertilizante
Análisis de la Varianza
Ing. Erica Raña 42
Es parecido al test de Tukey, pero no trabaja con
un umbral fijo sino con un umbral cambiante,
que dependerá del número de medias implicadas
en el contraste.
Genera un umbral más pequeño que el de Tukey,
lo cual da una mayor capacidad de encontrar
diferencias entre las medias comparadas.
El Test de Tukey es más conservador que el de
Duncan (tiene menos potencia).
Análisis de la Varianza
Ing. Erica Raña 43
Permite comparar las (k-1)medias con el control.
Es una modificación de la prueba de t , que puede usarse en
diseños desbalanceados.