Está en la página 1de 13

Iesatec Virtual

Anova de un
Factor
Demetrio Mota'Iesatec 1
Porqué la Anova?

Porque no se pueden comparar más de dos medias por la prueba de


hipótesis de diferencias de medias, porque el error tipo I crece
demasiado

Por ejemplo, si usted tuviera que comparar las medias de 5 muestras,


tendría que comparar cada una de las muestras contra todas las
5
demás, esto sería una combinación = 10. Es decir que tendría
2
que hacer diez pruebas. Si cada una tuviera un α=0.05, tendríamos
un error tipo uno igual a
(1 − 0.05)10 = 0.60 = (1 − 𝛼𝑡𝑜𝑡𝑎𝑙 );

de donde el 𝛼𝑡𝑜𝑡𝑎𝑙 = 0.40; fíjese que creció de 0.05 a 0.40;

Demetrio Mota'Iesatec 2
Teorema del Límite Central, que es la base de la inferencia
estadística, que establece,
que al tomar muestras de una población, las medias de las
muestras se distribuyen como una distribución normal con
media igual a la de la población (µ) y desviación igual a la de
la población dividida entre la raíz de N ( el número de
elementos en la muestra).
𝜎
Esto es Desviación de la muestra es .
𝑁

La Anova es una prueba de hipótesis planteada como

Ho : 𝝁𝟏 = 𝝁𝟐 = ⋯ 𝝁𝒏

Ha : 𝝁𝒊 ≠ 𝝁𝒋

Demetrio Mota'Iesatec 3
Una compañía farmacéutica desea evaluar el efecto que tiene la
cantidad de almidón en la dureza de las tabletas. Se decidió
producir lotes con una cantidad determinada de almidón, y que
las cantidades de almidón a aprobar fueran 2%, 5% y 10%. La
variable de respuesta sería el promedio de la dureza de 20
tabletas de cada lote. Se hicieron 4 réplicas por tratamiento y se
obtuvieron los siguientes resultados
Porcentaje de Almidón

2% 5% 10%

4.3 6.5 9.0

5.2 7.3 7.8

4.8 6.9 8.5

4.5 6.1 8.1

(𝑥𝑖 − 𝑥 )2 𝑆𝑆 ( 𝑥𝑖 )2
𝑉= = 𝑆𝑆 = (𝑥𝑖 − 𝑥 )2 = 𝑥𝑖2 −
𝑁−1 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝐿𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑁

Demetrio Mota'Iesatec 4
El SS del total se calcula tomando cada valor y elevándolo al cuadrado y se
suman.
2
79
𝑆𝑆𝑡𝑜𝑡𝑎𝑙 = 4.32 + 5.22 + ⋯ + 8.52 + 8.12 − = 548.88 − 520.08 = 𝟐𝟖. 𝟕𝟗𝟔
12
Los Grados de libertad del Total es N-1. En este caso sería 12-1=11

18.82 26.82 33.42 792


Para el factor 𝑆𝑆𝑓𝑎𝑐𝑡𝑜𝑟 = + + − = 26.726
4 4 4 12

El número de grados de libertad del factor es igual al número de niveles


menos uno.
En este caso serían 3-1=2

Demetrio Mota'Iesatec 5
Fuente SS GL MSS F Fcritico P value

Total 28.796 11 - - - -

Factor 26.726 2 13.3633 58.10 4.2564 0

Error 2.070 9 0.23

Demetrio Mota'Iesatec 6
Demetrio Mota'Iesatec 7
La decisión se toma con uno de estos dos Criterios

Si el valor de F calculado (58.1) es mayor que el valor crítico (4.26),


decimos que se rechaza la hipótesis nula y por tanto debe haber por lo
menos dos medias que sean diferentes..

Si el P value es menor que el valor de α=0.05, se rechaza la hipótesis nula


y se acepta de que por lo menos dos medias que son diferentes entre si.

Demetrio Mota'Iesatec 8
Solución Gráfica
Boxplot of 2%; 5%; 10%
9

7
Data

4
2% 5% 10%

Demetrio Mota'Iesatec 9
Demetrio Mota'Iesatec 10
a. Método de la diferencia Mínima o Método de Fisher
Los pasos para realizarlo son los siguientes

1. Calcular el promedio de cada nivel del factor. En nuestro caso las medias son : 4.5, 6.1 y
8.1
2. Luego hallar el valor absoluto de todas las diferencia de los promedios. Como lo
mostramos a continuación

Diferencia de media Valor Absoluto


µ2%- µ5% 1.6
µ2%- µ10% 3.6
µ5%- µ10% 2

3. Calcular el LSD (Low Significative Difference), mediante la siguiente fórmula

1 1
𝐿𝑆𝐷 = 𝑡(𝛼,𝑔𝑙 𝑒𝑟𝑟𝑜𝑟) 𝑥 𝐶𝑀𝑒𝑟𝑟𝑜𝑟 ( + )
2 𝑛𝑖 𝑛𝑗

El valor de LSD nos da entonces

1 1
𝐿𝑆𝐷 = 2.26 0.23 + = 0.76640
4 4
1. Comparar cada diferencia de las medias de la tabla anterior con el valor del LSD,

Demetrio Mota'Iesatec 11
Método de Tukey
Es muy parecido al anterior exceptuando que el de Fisher es mucho más
estricto que el de Tukey.

Los pasos son los mismos que en Fisher, solo que se compara contra el valor
crítico de Tukey calculado de la siguiente forma
1
𝑇𝑎 = 𝑡𝛼(𝐾,𝑔𝑙 𝑒𝑟𝑟𝑜𝑟) 𝐶𝑀𝑒𝑟𝑟𝑜𝑟 ( )
𝑛𝑖

El 𝑡𝛼(𝐾,𝑔𝑙 𝑒𝑟𝑟𝑜𝑟) es el rango estudentizado de Tukey, donde K es número de


niveles, y 𝛼 el nivel de significación. Se obtiene en la tabla de la página 515. En
el caso nuestro el valor es 3.95

Los otros valores ya lo tenemos del cálculo anterior, por eso el valor es
1
𝑇𝑎 = 3.95 0.23 = 0.94
4
Se hace la comparación y también se concluye que todas las diferencias de
medias son diferentes, debido a que son mayores de 0.94.

Demetrio Mota'Iesatec 12
a. Método de Dunnett
En muchos casos los niveles se comparan con uno de ellos, que se
llama método de control. En estos casos se debe usar el método
de Dunnett
Diferencia de media Valor Absoluto
µ2%- µ5% 1.6
µ2%- µ10% 3.6

Se comparan con el valor crítico calculado de la siguiente manera


1 1
𝑉𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝐷𝛼(𝐾−1,𝑔𝑙 𝑒𝑟𝑟𝑜𝑟) 𝑥 𝐶𝑀𝑒𝑟𝑟𝑜𝑟 ( + )
𝑛𝑖 𝑛𝐾

El valor 𝐷𝛼(𝐾−1,𝑔𝑙 𝑒𝑟𝑟𝑜𝑟) se saca de la tabla del libro que se encuentra en la página
518, en nuestro caso da 2.61.

Los demás términos son conocidos por nosotros y la ecuación nos da:

1 1
𝑉𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 = 2.61 0.23( + ) = 0.885
4 4

Ambas diferencia exceden este valor por lo tanto se toman como diferentes.
Demetrio Mota'Iesatec 13

También podría gustarte