EJEMPLOS

Ejemplo: Se realiza un estudio para evaluar la estabilidad de un reactivo en diferentes
condiciones de almacenamiento:
A: recientemente preparado
B: una hora en la oscuridad
C: una hora con luz tenue
D: una hora con luz fuerte
Señales de Fluorescencia observadas en las

diferentes condiciones de almacenamiento
YA Y YC YD
B
102 1 97 96
0
1
100 1 95 92
0
1
101 1 99 94
0
4
101 1 97
0
2
media 101 1 97 94
0
2
media general 98.8
¿Son las diferencias observadas entre las medias muestrales atribuibles a variabilidad
aleatoria o son significativas y explicadas por el factor en estudio?
Modelo Yk j   k   k j variables aleatorias independientes
Donde Ykj = j-ésima observación del k-ésimo nivel del factor 1 k  K , 1 j  Jk
k es la media poblacional de las observaciones del grupo k y  k j son variables

aleatorias independientes con varianza 2k
La cantidad total de niveles del factor o grupos a comparar es K, la cantidad de

observaciones por grupo ( Jk) depende del grupo (k). La cantidad total de observaciones
es n   K
k1 Jk .
Hipótesis a testear
H0: 1 = 2 = 3 = ...... = K vs. Ha: existe al menos una k diferente
El análisis de la varianza reemplaza a los tests de t múltiples por un sólo test de F que se
realiza bajo los supuestos de igualdad de varianzas y de normalidad de las
observaciones.
Supuestos
 21 = 22 = 23 = ....... = 2K= 2
 Los datos correspondientes a los K niveles del factor son independientes y
tienen distribución Normal
media
muestral
nivel1 : Y11,L , Y1 2 Y1. 
i.i.d N (1, )
J1

nivel 2 : 
,L, Y2 J2 i.i.d N ( , 2 ) Y 2. 
Y21  independientes
2

nivel K : 
YK1 ,L, YK JK i.i.d N (K , 2 ) Y K. 

media general Y..
Estadístico del test SS B / (K 1) ~ FK 1,nK bajo H0

F
SSW / (n  K )
donde
K 2 K Jk 2 K 2
SS B   J ( Y  Y ) SS W  
Curvas de  ( Yk  YF )   (J
Densidad 1) S
k
k k. .. k. k
, j
k 1 k 1 j1 k 1
4
2
2
3
Llamemos fK-1, n-K,  al valor que deja a la derecha un área  bajo la curva de densidad de
3
1
la distribución FK-1, n-K f1,20

f1,5
0
0
Región de rechazo de nivel  F > fK-1,n-K, 
¿De donde surgen los grados de libertad? Se puede demostrar, que si se satisfacen los
supuestos
0
del 1análisis
2
de la3varianza
4
resulta:
5 0 1 2 3 4 5
SS
~ 2n-K ii) ~ 2K-1 Bajo H0 y además SS y SSW son independientes
xx
i)
SSW B
0.0 0.1 0.2 0.3 0.4 0.5 0.6
B
2
0.6
2
0.4
Comentarios
f f5,20
0.2
 Bajo H0, todas las observaciones provienen de una misma población Normal con igual
5,5
media e igual varianza.
0.0
 Bajo este supuesto, podríamos medir la variabilidad de todas las observaciones juntas
mediante la varianza muestral. Llamamos media general (o gran media) a la media
muestral
0 de1 todas2 las observaciones
3 4 5 0 1 2 3 4 5
xx
Y..
 La varianza muestral usando todas las observaciones es
SST 2 2 2 2
 (Y11 Y ) .... (Y1J1 Y ) Y ) (YKJK Y )
n 1 (YK1
n 1
donde SST es la Suma de Cuadrados Total (Total Sum of Squares).

 2
Para cada grupo podemos obtener la varianza muestral S correspondiente. Así, para
el grupo 1 tendríamos:
2 2 2
2 (Y11Y1.) (Y12 Y1.) (Y1J1 Y1.)
S1 
J1 1
donde Y1. es la media muestral del grupo 1. Realizando los mismos cálculos en cada
grupo tendremos.Y1, Y2 ,..., YK y S21, S22,.......S2K .
 Bajo el supuesto de que todas las varianzas son iguales, podríamos estimar el 2
común mediante un promedio pesado de los S 2k (igual que en el test de t para dos
muestras independientes)
2
S  2 2 2
(J1 1)S1 (J 2 1)S2 (J K 1)SK SSW
W 
J1  J2 ... JK  K nK
el numerador SSW es la Suma de Cuadrados Dentro (Sum of Squares Within).

 También podríamos estimar la varianza a partir de los promedios muestrales Yi
SSB la Suma de Cuadrados Entre tratamientos (Sum of Squares Between).
2
S  J (Y  Y ) 2  J (Y  Y ) 2  ....  J (Y  Y
1 1 2 2 K K SSB
B 2  K1
)
 SST  SSW  SSB . K1
La variación total, medida por la suma de cuadrados total, se separa en las variaciones
provenientes de dos fuentes: entre grupos y dentro de grupos. La suma de
cuadrados dentro es también llamada suma de cuadrados del error.
SSB
 Si H0 fuera cierta, SSW y deberían ser muy parecidas, por lo tanto el cociente
N k1
k
de ambas sumas estaría cercano a 1. Si las medias poblacionales no son todas
iguales, S2B es mayor que S2W y el cociente será en general mayor a 1:
2
F  S 2B 1
SW 
 Bajo H0 y normalidad, el cociente F sigue una distribución F con K-1 y n-K grados
de libertad.
 Para determinar si los datos son o no significativos o para calcular el p-valor
comparamos con la distribución FK-1,n-K.
 si K=2 el estadístico F = T2 ( cuadrado del estadístico T del test de t para dos
(Y1.  Y 2. )
muestras independientes ) T 
1  1
S p J1J 2
TABLA DE ANÁLISIS DE LA VARIANZA
Source SS Df MS F p-valor
(fuente (suma (grados (cuadrados
de de de medios)
variació cuadrad libertad
n) os) )
Between SS K-1 SSB / (K-1)
(entre B
grupos) SSB / (K
Within SS n-K SSW / (n-K) -1)
(dentro de W SSW / (n -
grupos) K)
Total SS n-1
T
¿Con el Statistix? Statistics -> Multi-Sample Tests -> One-Way AOV
Volviendo al ejemplo del estudio para evaluar la estabilidad de un reactivo obtenemos
ONE-WAY AOV FOR: XA XB XC XD
SOURCE DF SS MS F P
BETWEEN3 142.400 47.4667 21.76 0.0001

WITHIN11 24.0000 2.18182
TOTAL14 166.400
Rechazamos la hipótesis de igualdad de medias con un p-valor = 0.0001, las medias de
las señales de fluorescencia de un reactivo almacenado en distintas condiciones de
almacenamiento difieren significativamente. ¿Cuáles son las medias diferentes?
SAMP GROU
VARIABL MEAN LE P STD
E SIZ DEV
E
METODO DE BONFERRONI
XA 101. 4 0.8165
00
XB 102. 4 1.4142 Este método propone la construcción de
00 intervalos de confianza para todos los
XC 97.0 4 1.6330 pares de medias posibles y rechazar su
00
XD 94.0 3 2.0000 igualdad cuando el correspondiente
00 intervalo no contiene al cero. Si
TOTAL 98.8 15 1.4771 queremos que el nivel global del test
00
resultante sea a lo sumo , cada
intervalo para i-j debería tener un nivel
de confianza igual a 1-*, donde
*= / m
siendo m=K(K-1)/2 cuando realizamos todas las comparaciones posibles.
En nuestro ejemplo como K=4 tenemos que calcular m = 4.3/2=6 intervalos de confianza.
BONFERRONI COMPARISON OF MEANS
HOMOGENEOUS
VARIABLE MEAN GROUPS
XB 102.00I
XA 101.00I
XC 97.000.. I
XD 94.000.. I
THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT

SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER.
CRITICAL T VALUE 3.208REJECTION LEVEL 0.050 STANDARD

ERRORS AND CRITICAL VALUES OF DIFFERENCES
VARY BETWEEN COMPARISONS BECAUSE OF UNEQUAL SAMPLE SIZES.
El Statistix construye los intervalos de confianza y realiza el test basado en cada uno de
los intervalos de a pares. Vemos que las medias de los grupos A y B no difieren
significativamente formando un grupo homogéneo, tampoco lo hacen los grupos C y D.
Recordemos que A corresponde a las muestras recientemente preparadas y B las
almacenadas una hora en la oscuridad. Mientras que los valores de C y D son los
obtenidos luego de 1 hora de almacenamiento con luz tenue y fuerte respectivamente.
Concluimos que es la exposición a la luz lo que afecta la fluorescencia.
Consideraciones generales
 El procedimiento de comparaciones múltiples que resulta por el método de Bonferroni

identifica a i y j como significativamente diferentes si el intervalo para i-j no
incluye el 0.
 El Intervalo de Confianza para la diferencia de medias i-j es de la forma
Yi  Y j  t
n  K ,*/ 2
SW2 ( 1  1 )
J iJ j
 Los grados de libertad n-K del intervalo de confianza anterior
provienen del estimador de la varianza S2W que se obtiene como
parte del análisis de la varianza y utiliza todos los datos, no
únicamente los de los grupos sobre los que se está realizando la
comparación.
EJEMPLO 3
Un ingeniero químico está estudiando un polímero recientemente desarrollado para

ser utilizado en la eliminación de los residuos tóxicos del agua. Los experimentos
se realizan a cinco temperaturas diferentes. La respuesta observada es el
porcentaje de impurezas eliminadas por el tratamiento; se han obtenido los
siguientes datos:
La tabla de ANOVA aparece a continuación en la cual se observa que la

hipótesis se puede rechazar con .
Supongase que se desea realizar las comparaciones posibles por

parejas
;
; ;
;
Y se quiere que la probabilidad de cometer almenos un rechazo incorrecto sea

como máximo de .
Bajo la suposición de que las varianzas poblacionales son iguales, puede

contrastarse cada una de estas hipótesis utilizando una prueba de
varianzas conjunta de dos colas, donde la prueba estadística es:
Donde
Donde es el estimador conjunto de basado en muestras extraídas de las

poblacionales y . También se pueden disponer de otro estimador de , es
decir de , el cual está badado en todos los datos disponibles y de esta
manera la prueba puede mejorarse utilizando:
como la ejecución de los test es laboriosa se procede con el test de

Bonferroni basado en el estadístico anterior.
Este procedimiento implica un serio problema que debe ser tratado con cuidado, es
decir, si todos los test se ejecutan a un nivel de significación , la probabilidad
general de hacer al menos un rechazo incorrecto, indicado por , es mayor que
y su valor generalmente es desconocido. Sin embargo se puede demostrar que
siempre que se realice un conjunto de test , cada uno de ellos el nivel de
significación , es como mucho .
Por ejemplo, si , entonces como se ha demostrado en el ejemplo que se está

siguiendo hay pares posibles de medias que pueden compararse. Si cada test
se realiza al nivel , entonces la probabilidad de efectuar al menos un
rehazo incorrecto es como mucho . Es fácil apreciar que
a medida que aumenta, la posibilidad general de error puede ser
inaceptablemente alta.
Para realizar los test de Bonferroni, de forma responsable, elegimos algún límite
superior razonablemente pequeño, , para la probabilidad de cometer al menos un
rechazo incorrecto. A continuación podemos realizar cada test al nivel
de significación donde indica el número actual de test a realizar, por ejemplo si
queremos que sea de como mucho , realizaremos cada una de nuestras
comparaciones por parejas al nivel de significación.
Para el ejemplo que tratamos la hipótesis nula
puede rechazarse con
Supongamos que se desean realizar las comparaciones por parejas y que

queremos que la probabilidad de cometer al menos un rechazo incorrecto sea
como máximo . Para alcanzar este objetivo, cada test debe realizarse al
nivel . El estadístico de contraste de dos colas es:
Puesto que todos los tamaños de muestra son iguales entonces:
En forma de contraste se tiene. rechazar si

Como el valor de no se encuentra en la tabla de Bonferroni al
nivel , entonces se puede encontrar utilizando la tabla de
con nivel de significación Ahora de la tabla se puede
obtener el valor crítico
Para realizar cada test solo se necesita comparar las diferencias absolutas entre
las medias muestrales respectivas con este
valor Si entonces se

rechaza y concluímos que las dos medias poblacionales y son
diferentes.
NOTA: Si los tamaños de muestra hubieran sido diferentes se debía haber

calculado una diferencia crítica por separado para cada test.

EJEMPLOS

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

EJEMPLOS

Cargado por

Copyright:

Formatos disponibles

Ejemplo: Se realiza un estudio para evaluar la estabilidad de un reactivo en diferentes

Señales de Fluorescencia observadas en las

Modelo Yk j   k   k j variables aleatorias independientes

Donde Ykj = j-ésima observación del k-ésimo nivel del factor 1 k  K , 1 j  Jk

k es la media poblacional de las observaciones del grupo k y  k j son variables

La cantidad total de niveles del factor o grupos a comparar es K, la cantidad de

H0: 1 = 2 = 3 = ...... = K vs. Ha: existe al menos una k diferente

Estadístico del test SS B / (K 1) ~ FK 1,nK bajo H0

la distribución FK-1, n-K f1,20

Región de rechazo de nivel  F > fK-1,n-K, 

donde SST es la Suma de Cuadrados Total (Total Sum of Squares).

el numerador SSW es la Suma de Cuadrados Dentro (Sum of Squares Within).

¿Con el Statistix? Statistics -> Multi-Sample Tests -> One-Way AOV

Volviendo al ejemplo del estudio para evaluar la estabilidad de un reactivo obtenemos

ONE-WAY AOV FOR: XA XB XC XD

BETWEEN3 142.400 47.4667 21.76 0.0001

BONFERRONI COMPARISON OF MEANS

THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT

CRITICAL T VALUE 3.208REJECTION LEVEL 0.050 STANDARD

 El procedimiento de comparaciones múltiples que resulta por el método de Bonferroni

Un ingeniero químico está estudiando un polímero recientemente desarrollado para

La tabla de ANOVA aparece a continuación en la cual se observa que la

Supongase que se desea realizar las comparaciones posibles por

Y se quiere que la probabilidad de cometer almenos un rechazo incorrecto sea

Bajo la suposición de que las varianzas poblacionales son iguales, puede

Donde es el estimador conjunto de basado en muestras extraídas de las

como la ejecución de los test es laboriosa se procede con el test de

Por ejemplo, si , entonces como se ha demostrado en el ejemplo que se está

Para el ejemplo que tratamos la hipótesis nula

puede rechazarse con

Supongamos que se desean realizar las comparaciones por parejas y que

Puesto que todos los tamaños de muestra son iguales entonces:

En forma de contraste se tiene. rechazar si

valor Si entonces se

NOTA: Si los tamaños de muestra hubieran sido diferentes se debía haber

También podría gustarte