Documentos de Académico
Documentos de Profesional
Documentos de Cultura
condiciones de almacenamiento:
A: recientemente preparado
B: una hora en la oscuridad
C: una hora con luz tenue
D: una hora con luz fuerte
¿Son las diferencias observadas entre las medias muestrales atribuibles a variabilidad
aleatoria o son significativas y explicadas por el factor en estudio?
Hipótesis a testear
El análisis de la varianza reemplaza a los tests de t múltiples por un sólo test de F que se
realiza bajo los supuestos de igualdad de varianzas y de normalidad de las
observaciones.
Supuestos
21 = 22 = 23 = ....... = 2K= 2
Los datos correspondientes a los K niveles del factor son independientes y
tienen distribución Normal
media
muestral
nivel1 : Y11,L , Y1 2 Y1.
i.i.d N (1, )
J1
nivel 2 :
,L, Y2 J2 i.i.d N ( , 2 ) Y 2.
Y21 independientes
2
nivel K :
YK1 ,L, YK JK i.i.d N (K , 2 ) Y K.
media general Y..
2
3
Llamemos fK-1, n-K, al valor que deja a la derecha un área bajo la curva de densidad de
3
1
¿De donde surgen los grados de libertad? Se puede demostrar, que si se satisfacen los
supuestos
0
del 1análisis
2
de la3varianza
4
resulta:
5 0 1 2 3 4 5
SS
~ 2n-K ii) ~ 2K-1 Bajo H0 y además SS y SSW son independientes
xx
i)
SSW B
0.0 0.1 0.2 0.3 0.4 0.5 0.6
B
2
0.6
2
0.4
Comentarios
f f5,20
0.2
Bajo H0, todas las observaciones provienen de una misma población Normal con igual
5,5
media e igual varianza.
0.0
Bajo este supuesto, podríamos medir la variabilidad de todas las observaciones juntas
mediante la varianza muestral. Llamamos media general (o gran media) a la media
muestral
0 de1 todas2 las observaciones
3 4 5 0 1 2 3 4 5
xx
Y..
La varianza muestral usando todas las observaciones es
SST 2 2 2 2
(Y11 Y ) .... (Y1J1 Y ) Y ) (YKJK Y )
n 1 (YK1
n 1
2
S J (Y Y ) 2 J (Y Y ) 2 .... J (Y Y
1 1 2 2 K K SSB
B 2 K1
)
SST SSW SSB . K1
La variación total, medida por la suma de cuadrados total, se separa en las variaciones
provenientes de dos fuentes: entre grupos y dentro de grupos. La suma de
cuadrados dentro es también llamada suma de cuadrados del error.
SSB
Si H0 fuera cierta, SSW y deberían ser muy parecidas, por lo tanto el cociente
N k1
k
de ambas sumas estaría cercano a 1. Si las medias poblacionales no son todas
iguales, S2B es mayor que S2W y el cociente será en general mayor a 1:
2
F S 2B 1
SW
Bajo H0 y normalidad, el cociente F sigue una distribución F con K-1 y n-K grados
de libertad.
Para determinar si los datos son o no significativos o para calcular el p-valor
comparamos con la distribución FK-1,n-K.
si K=2 el estadístico F = T2 ( cuadrado del estadístico T del test de t para dos
(Y1. Y 2. )
muestras independientes ) T
1 1
S p J1J 2
TABLA DE ANÁLISIS DE LA VARIANZA
Source SS Df MS F p-valor
(fuente (suma (grados (cuadrados
de de de medios)
variació cuadrad libertad
n) os) )
Between SS K-1 SSB / (K-1)
(entre B
grupos) SSB / (K
Within SS n-K SSW / (n-K) -1)
(dentro de W SSW / (n -
grupos) K)
Total SS n-1
T
SOURCE DF SS MS F P
SAMP GROU
VARIABL MEAN LE P STD
E SIZ DEV
E
METODO DE BONFERRONI
XA 101. 4 0.8165
00
XB 102. 4 1.4142 Este método propone la construcción de
00 intervalos de confianza para todos los
XC 97.0 4 1.6330 pares de medias posibles y rechazar su
00
XD 94.0 3 2.0000 igualdad cuando el correspondiente
00 intervalo no contiene al cero. Si
TOTAL 98.8 15 1.4771 queremos que el nivel global del test
00
resultante sea a lo sumo , cada
intervalo para i-j debería tener un nivel
de confianza igual a 1-*, donde
*= / m
siendo m=K(K-1)/2 cuando realizamos todas las comparaciones posibles.
En nuestro ejemplo como K=4 tenemos que calcular m = 4.3/2=6 intervalos de confianza.
HOMOGENEOUS
VARIABLE MEAN GROUPS
XB 102.00I
XA 101.00I
XC 97.000.. I
XD 94.000.. I
El Statistix construye los intervalos de confianza y realiza el test basado en cada uno de
los intervalos de a pares. Vemos que las medias de los grupos A y B no difieren
significativamente formando un grupo homogéneo, tampoco lo hacen los grupos C y D.
Recordemos que A corresponde a las muestras recientemente preparadas y B las
almacenadas una hora en la oscuridad. Mientras que los valores de C y D son los
obtenidos luego de 1 hora de almacenamiento con luz tenue y fuerte respectivamente.
Concluimos que es la exposición a la luz lo que afecta la fluorescencia.
Consideraciones generales
Yi Y j t
n K ,*/ 2
SW2 ( 1 1 )
J iJ j
Los grados de libertad n-K del intervalo de confianza anterior
provienen del estimador de la varianza S2W que se obtiene como
parte del análisis de la varianza y utiliza todos los datos, no
únicamente los de los grupos sobre los que se está realizando la
comparación.
EJEMPLO 3
;
; ;
;
Donde
Este procedimiento implica un serio problema que debe ser tratado con cuidado, es
decir, si todos los test se ejecutan a un nivel de significación , la probabilidad
general de hacer al menos un rechazo incorrecto, indicado por , es mayor que
y su valor generalmente es desconocido. Sin embargo se puede demostrar que
siempre que se realice un conjunto de test , cada uno de ellos el nivel de
significación , es como mucho .
Para realizar los test de Bonferroni, de forma responsable, elegimos algún límite
superior razonablemente pequeño, , para la probabilidad de cometer al menos un
rechazo incorrecto. A continuación podemos realizar cada test al nivel
de significación donde indica el número actual de test a realizar, por ejemplo si
queremos que sea de como mucho , realizaremos cada una de nuestras
comparaciones por parejas al nivel de significación.
Para realizar cada test solo se necesita comparar las diferencias absolutas entre
las medias muestrales respectivas con este