Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Comparaciones mltiples
3.1.
Introduccin
En este captulo explicaremos algunas tcnicas para analizar con mayor detalle los
datos de un experimento, con posterioridad a la realizacin del Anlisis de la Varianza. Si
dicho anlisis conrma la existencia de diferencias signicativas entre los tratamientos, es
conveniente investigar qu medias son distintas. Para ello, emplearemos diversas tcnicas
cuyo objeto es identicar qu tratamientos son estadsticamente diferentes y en cunto
oscila el valor de esas diferencias. Consideraremos su aplicacin nicamente al modelo de
efectos jos.
El uso de estas tcnicas, en algunos casos, est supeditado al resultado del anlisis de
la varianza; en otros casos, las tcnicas pueden emplearse directamente sin haber realizado
previamente dicho anlisis. Este conjunto de tcnicas se engloba bajo la denominacin de
contrastes para comparaciones mltiples ya que su objetivo fundamental es comparar entre
s medias de tratamientos o grupos de ellas.
En primer lugar estudiamos un procedimiento intuitivo y cualitativo basado en la representacin grca de los datos del experimento1 . Depus del mtodo grco consideramos
la tcnica de comparacin por parejas introducida por Fisher en 1935. Dicha tcnica, denominada mtodo de la diferencia mnima signicativa o mtodo LSD (Least Signicant
Dierence), se basa en la construccin de tests de hiptesis para la diferencia de cualquier
par de medias.
Cuando el nmero posibles de comparaciones es elevado, la aplicacin reiterada de
este procedimiento, para un nivel de signicacin dado, puede conducir a un nmero
grande de rechazos de la hiptesis nula aunque no existan diferencias reales. El intento de
1
Comparaciones mltiples
3.2.
Al estudiar el comportamiento de los tratamientos de un factor, mediante un anlisis de la varianza, el nico objetivo es saber si, globalmente, dichos tratamientos dieren
signicativamente entre s. Ahora estamos interesados, una vez aceptada la existencia de
diferencias entre los efectos del factor, en conocer qu tratamientos concretos producen
mayor efecto o cules son los tratamientos diferentes entre s. En estas misma condiciones,
puede ser til tambin realizar comparaciones adicionales entre grupos de medias de los
tratamientos.
Antes de seguir con el desarrollo de esta seccin, remitimos al lector al Captulo 1,
seccin ??, donde presentamos el modelo de efectos jos denido por la ecuacin
yij = i + uij .
(3.1)
Antes de estudiar analticamente las distintas formas de comparar efectos, es conveniente examinar de forma cualitativa su comportamiento. Esto se efecta de forma grca
y constituye el primer mtodo que pasamos a desarrollar.
3.2.1.
Para ese ejemplo obtuvimos, vase Tabla 1-6, que el rendimiento de la semilla de algodn depende signicativamente del tipo de fertilizante utilizado. Pero esta conclusin no
nos informa nada sobre una serie de preguntas tales como: Producen algunos fertilizantes
el mismo rendimiento?, en el caso de que dos fertilizantes produzcan distinto rendimiento
entre qu valores oscila esa diferencia?, etc. Una primera respuesta a estas preguntas se
puede realizar de forma grca.
En primer lugar haremos unas consideraciones generales antes de estudiar el ejemplo
de referencia. Para ello, consideremos el modelo equilibrado con n observaciones por nivel
y sean y1. , y2. , , yI. las medias muestrales de los correspondientes tratamientos. Bajo
las hiptesis del modelo, cualquier promedio yi. de un tratamiento se distribuir alrededor
Comparaciones mltiples
factor de escala hay que multipicar las correspondientes abscisas por dicho factor de escala
y representar sus valores frente a las correspondientes ordenadas.
Este mtodo se ilustra en la Figura 2-1 donde se distinguen varios casos:
a) Las cinco medias pueden considerarse como una muestra aleatoria de la misma distribucin.
Figura 2-1a
b) Al deslizar la distribucin de referencia a lo largo del eje horizontal, nos permite
detectar grupos homogneos. As, deducimos que las medias 2, 4 y 5 son probablemente mayores que 1 y 3 y que no hay distincin entre las medias de cada uno de
los grupos.
Figura 2-1b
Figura 2-1c
1
I
i ni
Comparaciones mltiples
4,67
= 0,947 .
26/5
0
0.394
0
0.5
0.346
0.473
1.0
0.236
0.947
1.5
0.129
1.420
2.0
0.058
1.894
Para dibujar la distribucin de referencia, se elige un origen arbitrario, que debe estar prximo a las medias, nosotros hemos considerado como origen . A continuacin se
representan las ordenadas de los puntos 0, 0,473, 0,947, 1,420, 1,894
que se unen en una lnea continua, con lo que esbozamos la distribucin de referencia. El
deslizamiento de la distribucin de referencia a lo largo del eje horizontal permite obtener
las siguientes conclusiones:
Las cinco medias no son iguales entre s. No es posible situar la distribucin de
referencia en ninguna posicin de forma que las abarque a todas.
Los fertilizantes (5 y 4), (4 y 3) y (3 y 1) tienen un rendimiento similar y el fertilizante
2 tiene un rendimiento distinto de los otros cuatro.
3.2.2.
Las pruebas estadsticas para comparaciones mltiples ms frecuentemente utilizadas se basan en la distribucin t de Student. Supongamos que interesa comparar por
parejas los efectos de I tratamientos. Es decir, nos interesa contrastar cualquier hiptesis
de la forma
H0 : i = j
(3.2)
H1 : i = j
La tcnica ms antigua y popular para efectuar estas comparaciones mltiples es el
procedimiento LSD, (Least Signicant Dierence), que pasamos a estudiar a continuacin.
Contraste de la Mnima Diferencia Signicativa
Este procedimiento fu sugerido por Fisher en 1935 y es el primer mtodo de
comparaciones mltiples que vamos a utilizar. Dicho procedimiento consiste en una prueba
de hiptesis por parejas basada en la distribucin t.
Este mtodo debe aplicarse cuando previamente se haya rechazado la hiptesis nula
del test F del anlisis de la varianza. Para ello, se determina el siguiente estadstico
t=
yi. yj.
2
SR
(3.3)
1
1
+
ni nj
que, por las hiptesis del modelo de ecuacin (??), sigue una distribucin t de Student
con N I grados de libertad.
Por lo tanto, se concluye que la pareja de medias i y j son estadsticamente diferentes
si
| yi. yj. |> LSD ,
(3.4)
donde la cantidad LSD, denominada mnima diferencia signicativa, viene dada por
LSD = t/2;NI
2
SR
1
1
+
ni nj
(3.5)
Comparaciones mltiples
siendo
ni y nj el nmero de observaciones correspondiente a cada media,
N I el nmero de grados de libertad de la varianza residual,
t/2;N I el valor crtico de la distribucin t con N I grados de libertad que deja
una probabilidad a su derecha igual a /2.
Si el diseo es balanceado, el valor de LSD se reduce a
LSD = t/2;NI
2
2SR
.
n
(3.6)
El procedimiento LSD es sencillo de utilizar; se puede aplicar tanto en modelos equilibrados como no-equilibrados. Adems proporciona tambin intervalos de conanza para
diferencias de medias. Dichos intervalos son de la forma
yi. yj. ) + LSD)
((
yi. yj. ) LSD , (
(3.7)
Comentarios 3.1
C1) Un problema que presenta la aplicacin de este procedimiento, para un nmero relativamente grande de tratamientos, es que el nmero de posibles falsos rechazos de la
hiptesis nula puede ser elevado aunque no existan diferencias reales. As, por ejemplo, si I es igual a 10, hay 10
2 = 45 posibles parejas de comparaciones. Si tomamos
= 0,05, entonces el nmero esperado de falsos rechazos ser
0,05 45 = 2,25 ,
supuesta independencia estadstica entre los distintos contrastes.
Otra forma de enfocar este problema es comprobando que la utilizacin reiterada de
este procedimiento conduce a que la probabilidad de que se rechace al menos una de
las posibles comparaciones sea bastante alta. En efecto, bajo la hiptesis nula
Pr[rechazar al menos una comparacin] = 1 Pr[aceptar todas] =
1 (1 0,05)45 0,90
El intento de paliar este problema justica la introduccin de otros procedimientos
para comparaciones mltiples.
C2) Puede suceder que el mtodo LSD falle al aceptar que todas las parejas son iguales,
a pesar de que el estadstico F del anlisis de la varianza resulte signicativo; sto es
debido a que la prueba F considera simultneamente todas las posibles comparaciones
entre las medias de los tratamientos y no slo las comparaciones por parejas.
A fn de ilustrar este procedimiento, consideramos el ejemplo de referencia. As, para
un nivel de signicacin del 5 %, el valor de LSD es
LSD = t0,025;21
2
SR
1
1
+
ni nj
= 2,080 4,67
1
1
+
= 4,49
ni nj
1
1
+
ni nj
10
Comparaciones mltiples
Figura 2-3
11
Pr
Am
m=1
Pr(Am ) .
(3.8)
m=1
Consideremos que queremos realizar estimacin por intervalos para las M = I2 comparaciones posibles, cada una al nivel de signicacin = /M; esto da origen a M
intervalos de conanza que contienen a cada una de las posibles diferencias i j con
probabilidad 1 . Llamando Cm al intervalo m-simo se tiene que
Pr [1m 2m Cm ] = 1
m = 1, 2, , M
Pr
Cm
m=1
= 1 Pr
Cm
m=1
m=1
Pr(Cm ) = 1
,
m=1
.
M
12
Comparaciones mltiples
y1m. y2m. t 2M
2
SR
1
1
+
n1m n2m
(3.9)
donde y1m. , y2m. y n1m , n2m , son las medias y los tamaos muestrales correspondientes a
la comparacin m-sima.
Denotamos por m = 1m 2m , m = 1, 2, , M, una de las M comparaciones lineales
por parejas de medias, para las cuales interesa contrastar H0 : m = 0 frente H1 : m = 0.
Entonces, se rechaza H0 si
| m |> Bm ,
y se acepta en caso contrario.
Donde
Bm = t 2M
2
SR
1
1
+
n1m n2m
(3.10)
En el caso del modelo equilibrado los valores de Bm coinciden, dichos valores se denotan
por BSD y tienen la siguiente expresin
BSD = t 2M
2
SR
1
1
+
n n
(3.11)
(4,67)
10
1
1
+
n1m n2m
m = 1, 2. , 10 .
13
5 vs2 4, el valor de Bm es
B1 = t 0,025 ;21
4,67
10
1 1
+
6 4
= (3,135)(1,394) = 4,370 .
Entonces, como
| y5. y4. |= 2 < B1 ,
las medias 5 y 4 no son signicativamente distintas
5 vs 3, el valor de Bm es
B2 = t 0,025 ;21
10
4,67
1 1
+
6 5
= (3,135)(1,308) = 4,100 .
Entonces, como
| y5. y3. |= 3 < B2 ,
las medias 5 y 3 no son signicativamente distintas.
Figura 2-4
Seguidamente presentamos los contrastes de rangos mltiples. Dichos contrastes se
basan en la distribucin del rango estudentizado y se distinguen tres mtodos debidos
respectivamente a Tukey, Duncan-Newman y Keuls.
2
14
Comparaciones mltiples
3.2.3.
(3.13)
que se denota por qk, . La distribucin de este estadstico, que depende de los parmetros
k y , ha sido tabulada y los valores crticos se presentan en el Apndice C en la Tabla
VI.
Mtodo de Tukey (Honestly-signicant-dierence)
Este procedimiento se va a desarrollar considerando en primer lugar el caso del
modelo unifactorial equilibrado. En este modelo vamos a construir intervalos de conanza
con coeciente de conanza conjunto 1 para todas las posibles comparaciones por
parejas asociadas a los I niveles, es decir las I2 comparaciones por parejas.
El nivel de conanza conjunto 1 indica que de cada 100 muestras en (1 ) 100
de ellas, cada uno de los intervalos contiene a su correspondiente diferencia de medias. Por
tanto el nivel de conanza de cada uno de los intervalos ser al menos 1 .
Para construir dichos intervalos consideramos las desviaciones
(
y1. 1 ), (
y2. 2 ), , (
yI. I ) .
(3.14)
15
1/2
qI,NI ,
(3.15)
donde
2
N I es el nmero de grados de libertad asociado a SR
max(
yi. i ) es la desviacin mayor
mn(
yi. i ) es la desviacin menor.
Entonces se verica que
max(
yi. i ) mn(
yi. i )
Pr
q
=1 .
;I,NI
1/2
2
SR
(3.16)
(3.17)
Puesto que la desigualdad (3.17) se verica para todas las parejas i y j , se sigue de
(3.16) que
(
y
)
i.
j.
i
j
Pr
q
;I,NI = 1 ,
1/2
2
SR
incluye todos los pares I(I 1)/2 de comparaciones entre los I niveles del factor.
(3.18)
16
Comparaciones mltiples
2
SR
.
n
vs
H1 : i = j ,
de la siguiente manera
Si | yi. yj. | HSD =
Aceptar
H0
Rechazar
H0
2
2
i=1
(3.20)
1
ni
2
SR
= (4,22)
nh
4,67
2
1
1
+
ni nj
Con esta prueba se obtienen los mismos resultados que con el procedimiento de Bonferroni.
17
(3.21)
y sern consideradas iguales tambin todas las medias comprendidas entre ellas. En la
expresin (3.21), el valor de Rp es
Rp = qp ;p,NI
2
SR
n
p = 2, 3, , I
(3.22)
donde
qp ;p,NI es el punto crtico del rango estudentizado basado en la comparacin de la
media mayor y la menor de p medias. Los valores crticos qp ;p, , para p = 2, 3, , I,
se presentan en la Tabla VII del Apndice C para los niveles de signicacin de
comparaciones individuales = 0,01 y = 0,05.
2 es la varianza residual con N I grados de libertad.
SR
18
Comparaciones mltiples
Para la aplicacin del test de rango mltiple de Duncan, una vez que las medias estn
en orden ascendente, se calculan las diferencias entre las medias, comenzando por el valor
ms pequeo frente al ms alto de las p = I medias de los tratamientos, comparando esta
diferencia con el valor RI en la ecuacin (3.22) con un nivel de signicacin I . Si esas
dos medias no se consideran signicativamente diferentes, entonces el contraste se termina
y se concluye que ninguna de las medias son signicativamente diferentes entre s al nivel
de signicacin I . Esto es equivalente a no rechazar H0 : 1 = 2 = = I . Si las dos
medias extremas son signicativamente diferentes, el contraste contina.
En el siguiente paso se calcula la diferencia entre el valor ms pequeo y el segundo valor
ms grande y esta diferencia se compara con RI1 . Si este contraste no es estadsticamente
signicativo, la prueba cesa en esta comparacin y slo las dos medias extremas se consideran signicativamente diferentes. Si este contraste es estadsticamente signicativo, la
prueba contina hasta encontrar la primera pareja de medias que no sea signicativamente
distinta. A continuacin, se calcula la diferencia entre la segunda media ms pequea y la
ms grande y se compara con RI1 . Este proceso contina hasta que se han considerado
las diferencias entre todas las I(I 1)/2 posibles parejas.
Para modelos no-equilibrados, la expresin de Rp es
Rp = qp ;p,NI
2
SR
nh
p = 2, 3, , I ,
(3.24)
19
4 = 1 (1 0,05)41 = 0,142 .
20
Comparaciones mltiples
q5
2,33
1 1
+
6 5
5 vs 1
q4
2,33
1 1
+
6 6
> 2,793()
5 vs 3
q3
2,33
1 1
+
6 5
> 2,856()
5 vs 4
q2
2,33
1 1
+
6 4
< 2,896
4 vs 2
q4
2,33
1 1
+
4 5
4 vs 1
q3
2,33
1 1
+
4 6
< 3,044
4 vs 3
q2
2,33
1 1
+
4 5
< 3,010
3 vs 2
q3
2,33
1 1
+
5 5
> 2,983()
3 vs 1
q2
2,33
1 1
+
5 6
< 2,717
21
En el procedimiento de Newman-Keuls, los valores con los que se comparan las sucesivas
diferencias de medias vienen dados por
Kp = q;p,NI
2
SR
nh
p = 2, 3, , I ,
(3.25)
donde
q;p,NI es el punto crtico del rango estudentizado, denido en (3.13). En la Tabla
VI del Apndice C se recogen los valores crticos de dicha distribucin.
2 es la varianza residual con N I grados de libertad.
SR
nh es la media armnica, dada en la ecuacin (3.20), que se utiliza cuando los tamaos
de las muestras son desiguales. En el caso del modelo equilibrado el valor de la media
armnica nh coincide con el tamao n de las muestras.
En este mtodo las medias ms extremas de un grupo de p medias, incluidas ambas, se
comparan con Kp exactamente de la misma forma que en la prueba de intervalos mltiples
de Duncan.
Comentarios 3.2
C1) El contraste de Newman-Keuls es ms conservador que el de Duncan en el sentido
de que el error de tipo I es menor.
C2) En el contraste de Newman-Keuls el nivel de signicacin es , en cambio en el
contraste de Duncan es p , cuyo valor cambia dependiendo del nmero de medias
comprendidas entre las que se comparan. Por lo tanto, la potencia de la prueba de
Newman-Keuls es menor que la del procedimiento de Duncan porque generalmente
es menor que p . Podemos comparar los valores de las Tablas VI y VII del Apndice
C para comprobar que el procedimiento de Newman-Keuls conduce a una prueba
menos ecaz que la de los intervalos mltiples de Duncan. Se observa que para p > 2,
siempre
q;p,NI > qp ;p,N I .
(3.26)
As, por ejemplo, considerando los grados de libertad correspondientes al ejemplo de
referencia y tomando 0.05 como nivel de signicacin , tenemos la siguiente tabla
p
qp ;p,
q;p,
2
2.94
2.94
3
3.09
3.57
4
3.17
3.94
5
3.24
4.22
22
Comparaciones mltiples
H0 :
ai i = 0
i=1
I
H1 :
ai i = 0 ,
i=1
3.2.4.
Contrastes
C = a1 1 + a2 2 + + aI I =
ai i ,
i=1
(3.27)
23
ai = 0 .
(3.28)
i=1
Ejemplo de contrastes distintos a las comparaciones por parejas son, entre otros,
1
2 + 3
2
(3.29)
1 + 4 (2 + 3 ) .
(3.30)
Si se acepta que el primer contraste es cero se arma que la media del nivel 1 del
factor es igual al promedio de las medias de los niveles 2 y 3.
Si se acepta que el segundo contraste es cero se arma que las medias de los niveles
1 y 4, consideradas en grupo, son iguales a las medias de los niveles 2 y 3, tambin
consideradas en grupo.
La combinacin lineal de la forma (3.27) tambin se puede expresar en funcin de los
efectos del factor
I
C=
ai i =
i=1
ya que
I
i=1 ai
ai ( + i ) =
i=1
ai +
i=1
ai i =
i=1
ai i ,
(3.31)
i=1
= 0.
Dado que un contraste es una funcin de los parmetros del modelo, que son desconocidos, su valor se podr estimar utilizando los estimadores de los parmetros que intervienen.
Concretamente, se puede demostrar que el estimador ptimo de un contraste viene dado
por la misma combinacin lineal de los estimadores de los parmetros que intervienen; es
decir
I
C=
ai i =
i=1
ai yi. ,
i=1
que tambin se puede escribir como la misma combinacin lineal de los estimadores de los
i ; es decir,
I
C=
ai i .
i=1
(3.32)
24
Comparaciones mltiples
En efecto
I
C=
ai i =
i=1
i=1
ai (i + ) =
i=1
ai (i ) +
ai =
ai i .
i=1
(3.33)
i=1
(3.35)
E{C} = E
ai i = E
i=1
ai yi. =
i=1
ai E[
yi. ] =
i=1
ai i ,
(3.36)
i=1
a2i
. En efecto
ni
I
2
{C} = Var
ai yi.
i=1
i=1
a2i Var{
yi. }
=
i=1
a2i
ni
2
i=1
a2i
ni
(3.37)
puesto que yi. son variables aleatorias independientes con varianza 2 /ni .
Por tanto, un estimador de la varianza de C es
I
2
S {C} =
2 , es la varianza residual.
donde SR
2
SR
i=1
a2i
,
ni
(3.38)
25
3a ) C se distribuye segn una Normal al ser una combinacin lineal de variables aleatorias Normales independientes. Adems, por las propiedades 1a y 2a , su media es C
y su desviacin tpica es {C}. En otras palabras,
C
N(C, {C})
2 , se verica que el
Por tanto, al considerar la estimacin de {C} en funcin de SR
cociente
C C
tNI .
(3.39)
S{C}
(3.40)
se tiene que:
1a ) La estimacin puntual de C es
C = 2
y1. (
y2. + y3. ) = 2(50) (57 + 48) = 5 .
2a ) La estimacin de la varianza muestral de C es
I
2
S 2 {C} = SR
i=1
a2i
= 4,67(1,067) = 4,982 ,
ni
donde a1 = 2, a2 = a3 = 1 y
I
i=1
a2i
4 1 1
16
= + + =
= 1,067 .
ni
6 5 5
15
26
Comparaciones mltiples
Contrastes ortogonales
Decimos que dos contrastes3 C1 =
verican que
i.
i ai y
y C2 =
i.
i bi y
son ortogonales si
ai bi = 0 .
(3.41)
i=1
Contraste
C1
C2
C3
C4
Tabla 2-1.
Respuesta media del nivel del factor
1
2
3
4
5
1
0
-1
0
0
-1
0
-1
1
1
0
0
0
1
-1
-1
4
-1
-1
-1
Obsrvese que la suma de los coecientes de cada la es cero indicando que cada Ci
es un contraste. Adems, es inmediato comprobar que los productos dos a dos de los
3
27
coecientes de los contrastes suman cero indicando que los contrastes son mutuamente
ortogonales. En efecto, comprobemos, por ejemplo, que los contrastes C1 y C2 son ortogonales
(1)(1) + (0)(0) + (1)(1) + (0)(1) + (0)(1) = 0 .
i ai i
se le
ai yi.
1=1
I
SSC =
a2i
ni
i=1
(3.42)
ai yi.
n
1=1
I
SSC =
(3.43)
a2i
i=1
H0 :
ai i = 0
i=1
(3.44)
I
H1 :
ai i = 0 ,
i=1
basta comparar la suma de cuadrados asociada al contraste con el cuadrado medio del
2 es el estadstico de contraste que, bajo la hiptesis
error. Entonces, el cociente SSC/SR
nula, sigue una distribucin F1,NI .
A continuacin vamos a realizar las sumas de cuadrados asociadas a los contrastes para
el ejemplo de referencia. Supongamos que efectuamos los contrastes ortogonales expuestos
28
Comparaciones mltiples
en la Tabla 2-1. Dichos contrastes junto con sus estimaciones puntuales y su suma de
cuadrados asociada se muestran en la siguiente tabla
Tabla 2-2
Hiptesis
Estimaciones
H0 : 1 = 3
C1 = 2
H0 : 1 + 3 = 4 + 5
C2 = 6
H0 : 4 = 5
C3 = 2
H0 : 42 = 1 + 3 + 4 + 5 C4 = 38
S.Cuadrados
SSC1 = 10,89
SSC2 = 45,97
SSC3 = 9,61
SSC4 = 362,35
Donde
C1 = (1)(
y1. ) + (1)(
y3. ) = 50 48 = 2
C2 = (1)(
y1. + y3. ) + (1)(
y4. + y5. ) = (50 + 48) + (47 + 45) = 6
C3 = (1)(
y4. ) + (1)(
y5. ) = 47 45 = 2
SSC2 =
(1)2
(6)2
1 1
+
+ (1)2
6 5
SSC3 =
SSC4 =
(1)2
(2)2
= 10,89
12 (1)2
+
6
5
1 1
+
4 6
= 45,97
(2)2
= 9,61
12 (1)2
+
4
6
(38)2
1 1 1 1
+ + +
6 5 4 6
(4)2
+
5
= 362,35
29
F (C3 )(exp) =
F (C4 )(exp) =
SSC2
2
SR
SSC3
2
SR
SSC4
2
SR
45,97
= 9,84
4,67
9,61
= 2,05
4,67
362,35
= 77,59 .
4,67
G.L.
4
1
1
1
1
21
25
M. C.
109.97
10.89
45.97
9.61
362.35
4.67
Fexp
23.56
2.33
9.84
2.05
77.59
F
2.84
4.32
4.32
4.32
4.32
30
Comparaciones mltiples
o medias. Esencialmente indica el nivel de signicacin asociado a un solo test estadstico de la forma,
H0 : i = j
(3.45)
H1 : i = j .
Tasa de error global o del experimento, , es la probabilidad de rechazar errneamente por lo menos una hiptesis nula al realizar las I 1 comparaciones independientes relativas a I medias sobre el mismo conjunto de datos. Esta tasa de error
puede ser mucho mayor que la tasa de error individual.
Ambas tasas de error estn relacionadas por las siguientes expresiones
= 1 (1 )I1 ,
(3.46)
= 1 (1 )1/(I1) .
(3.47)
Estas frmulas no son estrictamente vlidas cuando hay implicados contrastes noortogonales. En estas situaciones, sin embargo, pueden utilizarse dichas ecuaciones obtenindose resultados aproximados. En tales casos, la tasa global puede ser mayor que la indicada
por la ecuacin (3.46).
Para la ilustracin numrica, tomemos como nivel de signicacin individual 0.05 y
como valor de I, 5. Si las 5 medias poblacionales son iguales, la probabilidad de rechazar
incorrectamente una o ms de las 4 comparaciones ortogonales es = 1 (1 0,05)4 =
0,1854. Es decir, la tasa de error global es casi 4 veces mayor que la tasa individual.
Por otra parte, si tomamos igual a 0.05, entonces = 1 (1 0,05)0,25 = 0,01274.
Observamos que una tasa de error del experimento igual a 0.05 es mucho ms exigente
que una tasa de error individual de 0.05.
Aunque el experimentador se interesa en controlar todas las tasas de error y niveles
de conanza, es importante subrayar que el objetivo principal de los procedimientos de
comparaciones mltiples es informarse lo ms posible sobre las poblaciones, procesos o
fenmenos que intervienen en el experimento. Fijar unas tasas de error pequeas no es
el nico propsito de un experimento, es slamente una medida del grado de exigencia o
rigor de la metodologa estadstica empleada.
En muchos experimentos el investigador no sabe a priori los contrastes que le interesa
realizar, siendo despus de un anlisis preliminar de los datos cuando se descubren las
comparaciones de inters.
3.2.5.
Sche (1953) propuso un mtodo para realizar cualquier contraste entre medias
de tratamientos. Dicho procedimiento no requiere que el modelo sea equilibrado.
31
ai i ,
(3.48)
el objetivo de este procedimiento es decidir, para cada uno de estos contrastes, entre las
hiptesis
H0 : C = 0
(3.49)
H1 : C = 0 .
El mtodo de Sche est basado en la construccin de intervalos de conanza para
todos los posibles contrastes de la forma (3.49). Estos intervalos tienen un nivel de conanza simultneo 1 , es decir, la probabilidad de que todos los intervalos sean correctos
simultneamente es igual a 1 . Sche demostr que dichos intervalos de conanza
tienen la siguiente expresin
C S{C} (I 1)F;I1,NI ,
(3.50)
S{C} =
2
SR
i=1
a2i
,
ni
(3.51)
(3.52)
(3.53)
32
Comparaciones mltiples
S{C2 } =
2
SR
i=1
a2i
=
ni
4,67
1 1 1 1
+ + +
6 5 4 6
= 1,912
y
5
S{C3 } =
2
SR
i=1
a2i
=
ni
4,67
1 1
+
4 6
= 1,394 .
I3 =
3.3.
33
34
Comparaciones mltiples
los otros mtodos y son menos conservadores que los procedimientos basados en la
eleccin de la tasa de global.
Si se desea controlar la tasa de error global, los mtodos ms tiles incluyen el test
de Bonferroni y procedimiento de Tukey. Ambas tcnicas tienen fuertes defensores.
El test de Bonferroni tiene la ventaja de utilizar un estadstico t, siendo su principal
desventaja, cuando se realizan un gran nmero de comparaciones, que el nivel de
signicacin individual se hace demasiado pequeo.
Existen otros procedimientos para hacer comparaciones mltiples. Algunos de ellos
estn designados para casos especiales, tales como para comparar tratamientos experimentales con un tratamiento control.
3.4.
(3.54)
i = 1, 2, , I 1 .
i = 1, 2, , I 1 .
2
SR
1
1
+
ni nI
(3.55)
35
ocupe el control es arbitraria, por ello, en este ejemplo vamos a considerar que es la primera
posicin, el tratamiento 1. En dicho ejemplo, I=5, =21 y para un nivel de signicacin
del 5 % el valor de d0,05;4,21 es 2.64. Por tanto, las diferencias crticas y observadas son,
respectivamente,
2 vs 1 : d0,05;4,21
4,67
1 1
+
5 6
= 3,454
| y2. y1. |= 7
3 vs 1 : d0,05;4,21
4,67
1 1
+
5 6
= 3,454
| y3. y1. |= 2
4 vs 1 : d0,05;4,21
4,67
1 1
+
4 6
= 3,682
| y4. y1. |= 3
5 vs 1 : d0,05;4,16
4,67
1 1
+
6 6
= 3,293
| y5. y1. |= 5
nI
I .
ni
Bibliografa utilizada
Garca Leal, J. & Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos.
Anlisis de la Varianza. Grupo Editorial Universitario.
Lara Porras, A.M. (2000). Diseo Estadstico de Experimentos, Anlisis de la Varianza y Temas Relacionados: Tratamiento Informtico mediante SPSS Proyecto Sur
de Ediciones.