Está en la página 1de 11

ANOVA (Análisis de varianza)

Esta técnica fue desarrollada por sir. R.A. Fisher entre los años 1912 y 1062.sta técnica para
comparar más de dos medias.
Mediante esta técnica la variación total presente en el conjunto de datos se divide en varios
componentes, cada una de estas está asociada a una fuente de variación específica, de tal forma
que es posible conocer la magnitud de las contribuciones de cada fuente de variación a la
variación total. (Bejarano, L., et.al. (2006)).
El análisis de varianza se aplica en investigación está muy relacionada a diseños experimentales.
Cuando se diseña un experimento, los investigadores antes de llevar a cabo la investigación
pueden identificar las fuentes de variación que consideren importantes y seleccionar un modelo
que les permita medir la contribución de esas fuentes a la variación total (Bejarano, L., et.al.
(2006)).
En el análisis de varianza a la variable de agrupación se le suele llamar factor, a los diferentes
niveles de la variable se les denomina tratamientos.
SUPOSICIONES EN EL ANOVA
Las suposiciones básicas cuando se hacen pruebas de hipótesis son:
a).- Las observaciones son medidas por lo menos en un escala intervalo.
b).- Cada una de las poblaciones de las cuales provienen las muestras están distribuidas
normalmente.
c).- Las varianzas de cada grupo son homogéneas: Homocedasticidad.

d).- Las K muestras sobre las que se aplican los tratamientos son independientes.

MODELO ESTADÍSTICO LINEAL

Y i j= µ i + T i + E i j

Se analiza la varianza de un factor para una variable dependiente cuantitativa


Donde:
Y i j = Es la j-ésima observación en el i-ésimo tratamiento. (Respuesta, cada puntuación)
µ i = media global de la población
T i = Efecto del i-èsimo tratamiento sobre la variable respuesta.

media global de la población


E i j = Error experimental asociado a cada puntuación.
TABLA ANOVA

Suma de
Grados de
Fuente de Variación cuadrados Cuadrado medio Fcalculado Ftabla
libertad
SC

SSTr k-1 𝑪𝑴𝑻𝒓


Entre(tratamientos o
𝑺𝑺𝒕𝒓
niveles) =
(𝒌 − 𝟏) 𝑪𝑴𝑻𝒓
𝑭=
𝑪𝑴𝑹
Dentro(Residual o SSR N-k 𝑺𝑺𝑹
𝑪𝑴𝑹 =
error) (𝑵 − 𝒌)

Total SST N-1

Donde:

SUMA DE CUADRADOS ENTRE TRATAMIENTOS: SSTr

𝑻𝒊𝟐 𝑻𝟐
𝑺𝑺𝑻𝒓 = ( )−
𝒏 𝑵

SUMA DE CUADRADOS DEL TOTAL: SST


𝑻𝟐
𝑺𝑺𝑻 = 𝒚𝟐 −
𝑵

SUMA DE CUADRADOS DENTRO DEL TRATAMIENTOS: SSR

𝑺𝑺𝑹 = 𝑺𝑺𝑻 − 𝑺𝑺𝑻𝒓

SST=𝑺𝑺𝑻𝒓+ 𝑺𝑺𝑹

PRUEBA DE HIPÓTESIS:

Ho: µ1=µ2=µ3

Ha: al comparar al menos hay un µ1≠µ2 con i≠ j

Decisión:

Si sig. >0.05 No se rechaza la Ho

Si sig.<0.05 Se rechaza la Ho.

Conclusión
PRUEBA DE COMPARACIONES MÚLTIPLES

Cuando se realiza el análisis de varianza de un experimento, se aplica la prueba F la cuál indicará


si los efectos de los tratamientos son iguales o diferentes, en caso de rechazar la Hipótesis nula,
se tiene que realizar la prueba de comparaciones múltiples, a fin de conocer en que tratamientos
se presentan las diferencias, estas pruebas compararán de par en par los tratamientos, estas
son:
DIFERENCIA SIGNIFICATIVA MÍNIMA (DLS): Es una prueba que compara dos medias, para su uso
se debe tener en cuenta:
a).-La prueba F debe ser significativa.
b).-Las comparaciones deben ser planificadas antes de empezar el experimento.
PRUEBAS DE RANGOS MÚLTIPLES DE DUNCAN: Se utiliza para comparar dos medias.
PRUEBA DE RANGOS MÚLTIPLES DE TUKEY: Se le denomina también “Diferencia Significativa
Honesta”, es una prueba muy aplicada por su exigencia.
PRUEBA DE COMPARACIÓN DE DUNNET: Se aplica cuando el interés se centra en determinar
que tratamiento es diferente al control, no compara los tratamientos entre si solo el control
versus todos los tratamientos.

EJEMPLO:
1.-Se tiene tres tratamientos, y se quiere evaluar si la respuesta al tratamiento es similar en los
tres grupos. Los datos se presentan a continuación: nivel de significancia 5%
TRATAMIENTO
ID
1 2 3
1 1 4.5 1.5
2 3 6 2.5
3 1 3.5 0.5
4 1.5 7.5 1
5 0.5 7 0.9
6 3.5 6
7 5.5

SOLUCIÓN:

1.-Se tiene tres tratamientos, y se quiere evaluar si la respuesta al tratamiento es similar en los
tres grupos. Los daos se presentan a continuación:
TRATAMIENTO
ID
1 2 3
1 1 4.5 1.5
2 3 6 2.5
3 1 3.5 0.5
4 1.5 7.5 1
5 0.5 7 0.9
6 3.5 6
7 5.5
n 6 7 5
N=18
Sumar y(Tentre)= 10.5 40 6.4
T=56.9
Y2= 25.75 240 10.56
2
sumaY =276.31

SUMA DE CUADRADOS DEL TOTAL: SCT


𝑻𝟐
𝑺𝑪𝑻 = ∑ 𝒚𝟐 − =276.31-(56.92/18) =96.4428
𝑵

SUMA DE CUADRADOS ENTRE TRATAMIENTOS: SCEntre

(𝑻𝒆𝒏𝒕𝒓𝒆)𝟐 𝑻𝟐
𝑺𝑪𝑬𝒏𝒕𝒓𝒆 = ∑ − = [(10.52/6) +(402/7) +(6.42/5)] -(56.92/18) =255.1384-
𝒏 𝑵
179.8672=75.2712
=
SUMA DE CUADRADOS DENTRO DE LOS TRATAMIENTOS: SCDentro

𝑺𝑪𝑫𝒆𝒏𝒕𝒓𝒐 = 𝑺𝑪𝑻 − 𝑺𝑪𝑬𝒏𝒕𝒓𝒆 =


Fuente de Suma de Grados de Cuadrado Fcalculado Ftabla
Variación cuadrados libertad medio
SC
Entre 75.2712 T-1=3-1=2 37.6356 26.6646 3.682
Dentro 21.1716 N-T=18- 1.41144
3=15
Total 96.4428 N-1=17
En la tabla Anova, el F calculado > Ftabla, se rechaza la Ho.
Con un nivel de significación del 5%, se concluye que existe diferencia significativa en los
promedios de los tratamientos.

Una planta fisiológica investigó el efecto del estrés mecánico en las plantas de soja. Se
repartieron aleatoriamente semillas plantadas en macetas individuales, en cuatro
grupos de tratamiento con 6 semillas cada uno. Las semillas de dos grupos fueron
“estresadas” mediante 20 minutos de sacudidas dos veces al día, mientras que dos
grupos de control fueron no estresados. Además, las plantas crecieron tanto con luz baja
como con luz moderada. De esta manera, los tratamientos fueron cuatro:
Tratamiento 1 (T1): luz baja, control (Grupo control)
Tratamiento 2 (T2): luz baja, stress
Tratamiento 3 (T3): luz moderada, control
Tratamiento 4 (T4): luz moderada, stress
Después de 16 días de crecimiento, se cosecharon las plantas y se midió el área total de
las hojas de cada planta. Los resultados obtenidos para cada tratamiento fueron:

¿Hay evidencia estadística suficiente para afirmar que el tratamiento afecta al área total
de las hojas de soja?. En caso afirmativo, indicar si hay tratamientos que no pueden ser
diferenciados entre sí. Considerar =0.05
Planteamiento de las hipótesis:
𝑯𝟎 : 𝝁𝟏 = 𝝁𝟐 = ⋯ . 𝝁𝒏
𝑯𝒂 : 𝒂𝒍 𝒎𝒆𝒏𝒐𝒔 𝒉𝒂𝒚 𝒖𝒏 𝝁𝒊 𝝁𝒋 para algún i ≠ j
EN SPSS:

PRUEBA DE NORMALIDAD Y HOMOCEDASTICIDAD


Se observa los sig > 0.05, no se rechaza la Ho.
Ho: No existe diferencia significativa entre la distribución normal y la distribución de datos
Se cumple con la normalidad en los 4 tratamientos, =0.05
PLANTEAMIENTO DE LAS HIPÓTESIS PARA ANOVA
Ho: 𝝁𝟏 = 𝝁𝟐= 𝝁𝟑 = 𝝁𝟒
Ha: Al menos 𝝁𝟏 ≠ 𝝁𝑱 𝒄𝒐𝒏 𝒊 ≠ 𝒋

Se rechaza la Ho
Sig = 0.000 < 0.05 existe diferencia significativa entre los tratamientos, =0.05

Al haber diferencia significativa ir a comparaciones múltiples.


EL EFECTO
• El tamaño del efecto:
• Qué porcentaje de la varianza se explica por el modelo, es decir se explica por la
diferencias de las medias de los diferentes grupos y no por las diferencias
individuales o los factores extraños que pueda haber (la de los residuos).
𝑆𝑆𝑇𝑟
η =
𝑆𝑆𝑇

CONCLUSIONES:
• Existe un efecto estadísticamente significativo del tratamiento afecta al área
total de las hojas. (Ath), F(3, 20)=12.859, p<0.05, η =0.66
• Las comparaciones múltiples indican que existen diferencias significativas en el
Ath entre el grupo de luz moderada control y los otros 3 grupos, p<0.05.

REFERENCIAS
• Bejarano L, Mormontoy W, Tipacti C. (2006). Muestreo e Inferencia Estadística.
Primera ed. César TA, editor. Lima: Imprenta Unión.
• Córdova, I.(2014). El Informe de Investigación cuantitativa. Primera ed. Lima: Editorial
San Marcos. Recuperado de
http://stel.ub.edu/sites/default/files/agenda/documents/14anova1_spss.pdf

También podría gustarte