Está en la página 1de 10

Ejemplo: Se realiza un estudio para evaluar la estabilidad de un reactivo en diferentes

condiciones de almacenamiento:
A: recientemente preparado
B: una hora en la oscuridad
C: una hora con luz tenue
D: una hora con luz fuerte

Señales de Fluorescencia observadas en las


diferentes condiciones de almacenamiento
YA Y YC YD
B
102 1 97 96
0
1
100 1 95 92
0
1
101 1 99 94
0
4
101 1 97
0
2
media 101 1 97 94
0
2
media general 98.8

¿Son las diferencias observadas entre las medias muestrales atribuibles a variabilidad
aleatoria o son significativas y explicadas por el factor en estudio?

Modelo Yk j   k   k j variables aleatorias independientes

Donde Ykj = j-ésima observación del k-ésimo nivel del factor 1 k  K , 1 j  Jk

k es la media poblacional de las observaciones del grupo k y  k j son variables


aleatorias independientes con varianza 2k

La cantidad total de niveles del factor o grupos a comparar es K, la cantidad de


observaciones por grupo ( Jk) depende del grupo (k). La cantidad total de observaciones
es n   K
k1 Jk .

Hipótesis a testear

H0: 1 = 2 = 3 = ...... = K vs. Ha: existe al menos una k diferente

El análisis de la varianza reemplaza a los tests de t múltiples por un sólo test de F que se
realiza bajo los supuestos de igualdad de varianzas y de normalidad de las
observaciones.
Supuestos
 21 = 22 = 23 = ....... = 2K= 2
 Los datos correspondientes a los K niveles del factor son independientes y
tienen distribución Normal
media
muestral
nivel1 : Y11,L , Y1 2 Y1. 
i.i.d N (1, )
J1

nivel 2 : 
,L, Y2 J2 i.i.d N ( , 2 ) Y 2. 
Y21  independientes
2

nivel K : 
YK1 ,L, YK JK i.i.d N (K , 2 ) Y K. 

media general Y..

Estadístico del test SS B / (K 1) ~ FK 1,nK bajo H0


F
SSW / (n  K )
donde
K 2 K Jk 2 K 2
SS B   J ( Y  Y ) SS W  
Curvas de  ( Yk  YF )   (J
Densidad 1) S
k
k k. .. k. k
, j
k 1 k 1 j1 k 1
4
2

2
3

Llamemos fK-1, n-K,  al valor que deja a la derecha un área  bajo la curva de densidad de
3
1

la distribución FK-1, n-K f1,20


f1,5
0
0

Región de rechazo de nivel  F > fK-1,n-K, 

¿De donde surgen los grados de libertad? Se puede demostrar, que si se satisfacen los
supuestos
0
del 1análisis
2
de la3varianza
4
resulta:
5 0 1 2 3 4 5
SS
~ 2n-K ii) ~ 2K-1 Bajo H0 y además SS y SSW son independientes
xx
i)
SSW B
0.0 0.1 0.2 0.3 0.4 0.5 0.6

B
2
0.6

2
0.4

Comentarios

f f5,20
0.2

 Bajo H0, todas las observaciones provienen de una misma población Normal con igual
5,5
media e igual varianza.
0.0

 Bajo este supuesto, podríamos medir la variabilidad de todas las observaciones juntas
mediante la varianza muestral. Llamamos media general (o gran media) a la media

muestral
0 de1 todas2 las observaciones
3 4 5 0 1 2 3 4 5
xx
Y..
 La varianza muestral usando todas las observaciones es
SST 2 2 2 2
 (Y11 Y ) .... (Y1J1 Y ) Y ) (YKJK Y )
n 1 (YK1
n 1

donde SST es la Suma de Cuadrados Total (Total Sum of Squares).


 2
Para cada grupo podemos obtener la varianza muestral S correspondiente. Así, para
el grupo 1 tendríamos:
2 2 2
2 (Y11Y1.) (Y12 Y1.) (Y1J1 Y1.)
S1 
J1 1
donde Y1. es la media muestral del grupo 1. Realizando los mismos cálculos en cada
grupo tendremos.Y1, Y2 ,..., YK y S21, S22,.......S2K .
 Bajo el supuesto de que todas las varianzas son iguales, podríamos estimar el 2
común mediante un promedio pesado de los S 2k (igual que en el test de t para dos
muestras independientes)
2
S  2 2 2
(J1 1)S1 (J 2 1)S2 (J K 1)SK SSW
W 
J1  J2 ... JK  K nK

el numerador SSW es la Suma de Cuadrados Dentro (Sum of Squares Within).


 También podríamos estimar la varianza a partir de los promedios muestrales Yi
SSB la Suma de Cuadrados Entre tratamientos (Sum of Squares Between).

2
S  J (Y  Y ) 2  J (Y  Y ) 2  ....  J (Y  Y
1 1 2 2 K K SSB
B 2  K1
)
 SST  SSW  SSB . K1
La variación total, medida por la suma de cuadrados total, se separa en las variaciones
provenientes de dos fuentes: entre grupos y dentro de grupos. La suma de
cuadrados dentro es también llamada suma de cuadrados del error.
SSB
 Si H0 fuera cierta, SSW y deberían ser muy parecidas, por lo tanto el cociente
N k1
k
de ambas sumas estaría cercano a 1. Si las medias poblacionales no son todas
iguales, S2B es mayor que S2W y el cociente será en general mayor a 1:
2

F  S 2B 1
SW 

 Bajo H0 y normalidad, el cociente F sigue una distribución F con K-1 y n-K grados
de libertad.
 Para determinar si los datos son o no significativos o para calcular el p-valor
comparamos con la distribución FK-1,n-K.
 si K=2 el estadístico F = T2 ( cuadrado del estadístico T del test de t para dos
(Y1.  Y 2. )
muestras independientes ) T 
1  1
S p J1J 2
TABLA DE ANÁLISIS DE LA VARIANZA

Source SS Df MS F p-valor
(fuente (suma (grados (cuadrados
de de de medios)
variació cuadrad libertad
n) os) )
Between SS K-1 SSB / (K-1)
(entre B
grupos) SSB / (K
Within SS n-K SSW / (n-K) -1)
(dentro de W SSW / (n -
grupos) K)
Total SS n-1
T

¿Con el Statistix? Statistics -> Multi-Sample Tests -> One-Way AOV

Volviendo al ejemplo del estudio para evaluar la estabilidad de un reactivo obtenemos

ONE-WAY AOV FOR: XA XB XC XD

SOURCE DF SS MS F P

BETWEEN3 142.400 47.4667 21.76 0.0001


WITHIN11 24.0000 2.18182
TOTAL14 166.400
Rechazamos la hipótesis de igualdad de medias con un p-valor = 0.0001, las medias de
las señales de fluorescencia de un reactivo almacenado en distintas condiciones de
almacenamiento difieren significativamente. ¿Cuáles son las medias diferentes?

SAMP GROU
VARIABL MEAN LE P STD
E SIZ DEV
E
METODO DE BONFERRONI
XA 101. 4 0.8165
00
XB 102. 4 1.4142 Este método propone la construcción de
00 intervalos de confianza para todos los
XC 97.0 4 1.6330 pares de medias posibles y rechazar su
00
XD 94.0 3 2.0000 igualdad cuando el correspondiente
00 intervalo no contiene al cero. Si
TOTAL 98.8 15 1.4771 queremos que el nivel global del test
00
resultante sea a lo sumo , cada
intervalo para i-j debería tener un nivel
de confianza igual a 1-*, donde
*= / m
siendo m=K(K-1)/2 cuando realizamos todas las comparaciones posibles.

En nuestro ejemplo como K=4 tenemos que calcular m = 4.3/2=6 intervalos de confianza.

BONFERRONI COMPARISON OF MEANS

HOMOGENEOUS
VARIABLE MEAN GROUPS

XB 102.00I
XA 101.00I
XC 97.000.. I
XD 94.000.. I

THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT


SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER.

CRITICAL T VALUE 3.208REJECTION LEVEL 0.050 STANDARD


ERRORS AND CRITICAL VALUES OF DIFFERENCES
VARY BETWEEN COMPARISONS BECAUSE OF UNEQUAL SAMPLE SIZES.

El Statistix construye los intervalos de confianza y realiza el test basado en cada uno de
los intervalos de a pares. Vemos que las medias de los grupos A y B no difieren
significativamente formando un grupo homogéneo, tampoco lo hacen los grupos C y D.
Recordemos que A corresponde a las muestras recientemente preparadas y B las
almacenadas una hora en la oscuridad. Mientras que los valores de C y D son los
obtenidos luego de 1 hora de almacenamiento con luz tenue y fuerte respectivamente.
Concluimos que es la exposición a la luz lo que afecta la fluorescencia.

Consideraciones generales

 El procedimiento de comparaciones múltiples que resulta por el método de Bonferroni


identifica a i y j como significativamente diferentes si el intervalo para i-j no
incluye el 0.
 El Intervalo de Confianza para la diferencia de medias i-j es de la forma

Yi  Y j  t
n  K ,*/ 2
SW2 ( 1  1 )
J iJ j
 Los grados de libertad n-K del intervalo de confianza anterior
provienen del estimador de la varianza S2W que se obtiene como
parte del análisis de la varianza y utiliza todos los datos, no
únicamente los de los grupos sobre los que se está realizando la
comparación.

EJEMPLO 3

Un ingeniero químico está estudiando un polímero recientemente desarrollado para


ser utilizado en la eliminación de los residuos tóxicos del agua. Los experimentos
se realizan a cinco temperaturas diferentes. La respuesta observada es el
porcentaje de impurezas eliminadas por el tratamiento; se han obtenido los
siguientes datos:

La tabla de ANOVA aparece a continuación en la cual se observa que la


hipótesis   se puede rechazar con  .

Supongase que se desea realizar las   comparaciones posibles por


parejas

   ;   

 ;     ; 
 ; 

Y se quiere que la probabilidad de cometer almenos un rechazo incorrecto sea


como máximo de  .

Bajo la suposición de que las varianzas poblacionales son iguales, puede


contrastarse cada una de estas hipótesis utilizando una prueba   de
varianzas conjunta de dos colas, donde la prueba estadística es:

Donde

Donde   es el estimador conjunto de   basado en muestras extraídas de las


poblacionales   y  . También se pueden disponer de otro estimador de  , es
decir de  , el cual está badado en todos los datos disponibles y de esta
manera la prueba   puede mejorarse utilizando:

como la ejecución de los   test es laboriosa se procede con el test de


Bonferroni basado en el estadístico anterior.

Este procedimiento implica un serio problema que debe ser tratado con cuidado, es
decir, si todos los test se ejecutan a un nivel de significación  , la probabilidad
general de hacer al menos un rechazo incorrecto, indicado por  , es mayor que   
y su valor generalmente es desconocido. Sin embargo se puede demostrar que
siempre que se realice un conjunto de test  , cada uno de ellos el nivel de
significación  ,   es como mucho  .

Por ejemplo, si  , entonces como se ha demostrado en el ejemplo que se está


siguiendo hay   pares posibles de medias que pueden compararse. Si cada test
se realiza al nivel  , entonces la probabilidad de efectuar al menos un
rehazo incorrecto es como mucho  . Es fácil apreciar que
a medida que   aumenta, la posibilidad general de error puede ser
inaceptablemente alta.

Para realizar los test   de Bonferroni, de forma responsable, elegimos algún límite
superior razonablemente pequeño,  , para la probabilidad de cometer al menos un
rechazo incorrecto. A continuación podemos realizar cada test   al nivel   
de significación donde   indica el número actual de test a realizar, por ejemplo si
queremos que   sea de como mucho  , realizaremos cada una de nuestras
comparaciones por parejas al nivel   de significación.

Para el ejemplo que tratamos la hipótesis nula 

puede rechazarse con 

Supongamos que se desean realizar las   comparaciones por parejas y que


queremos que la probabilidad de cometer al menos un rechazo incorrecto sea
como máximo  . Para alcanzar este objetivo, cada test   debe realizarse al
nivel  . El estadístico de contraste de dos colas es:

Puesto que todos los tamaños de muestra son iguales entonces:

En forma de contraste se tiene. rechazar   si


Como el valor de   no se encuentra en la tabla de Bonferroni al
nivel   , entonces se puede encontrar utilizando la tabla de   
con nivel de significación   Ahora de la tabla   se puede
obtener el valor crítico 

Para realizar cada test solo se necesita comparar las diferencias absolutas entre
las medias muestrales respectivas con este

valor   Si   entonces se


rechaza   y concluímos que las dos medias poblacionales   y   son
diferentes.

NOTA: Si los tamaños de muestra hubieran sido diferentes se debía haber


calculado una diferencia crítica   por separado para cada test.

También podría gustarte