Está en la página 1de 35

Captulo 3

Comparaciones mltiples
3.1. Introduccin
En este captulo explicaremos algunas tcnicas para analizar con mayor detalle los
datos de un experimento, con posterioridad a la realizacin del Anlisis de la Varianza. Si
dicho anlisis conrma la existencia de diferencias signicativas entre los tratamientos, es
conveniente investigar qu medias son distintas. Para ello, emplearemos diversas tcnicas
cuyo objeto es identicar qu tratamientos son estadsticamente diferentes y en cunto
oscila el valor de esas diferencias. Consideraremos su aplicacin nicamente al modelo de
efectos jos.
El uso de estas tcnicas, en algunos casos, est supeditado al resultado del anlisis de
la varianza; en otros casos, las tcnicas pueden emplearse directamente sin haber realizado
previamente dicho anlisis. Este conjunto de tcnicas se engloba bajo la denominacin de
contrastes para comparaciones mltiples ya que su objetivo fundamental es comparar entre
s medias de tratamientos o grupos de ellas.
En primer lugar estudiamos un procedimiento intuitivo y cualitativo basado en la rep-
resentacin grca de los datos del experimento
1
. Depus del mtodo grco consideramos
la tcnica de comparacin por parejas introducida por Fisher en 1935. Dicha tcnica, de-
nominada mtodo de la diferencia mnima signicativa o mtodo LSD (Least Signicant
Dierence), se basa en la construccin de tests de hiptesis para la diferencia de cualquier
par de medias.
Cuando el nmero posibles de comparaciones es elevado, la aplicacin reiterada de
este procedimiento, para un nivel de signicacin dado, puede conducir a un nmero
grande de rechazos de la hiptesis nula aunque no existan diferencias reales. El intento de
1
En cierto sentido, el mtodo grco ya fu comentado en el captulo anterior al dar la interpretacin
de algunas salidas grcas de S1.1on.iiic.
1
2 Comparaciones mltiples
paliar el problema de los falsos rechazos justica la introduccin de otros procedimientos
para comparaciones mltiples. Entre estos mtodos se estudia primero el basado en la de-
sigualdad de Bonferroni. A continuacin se aborda otra forma de solventar las deciencias
mencionadas anteriormente, basada en el rango estudentizado, que da lugar al mtodo de la
diferencia signicativa honesta propuesto por Tukey o mtodo HSD (Honestly Signicant
Dierence) y a los procedimientos de rangos mltiples de Newman-Keuls y Duncan.
Finalmente se estudia el procedimiento general de Sche, basado en la construccin
de intervalos de conanza simultneos para todas las posibles diferencias de medias y que
permite su extensin a comparaciones ms generales denominadas contrastes.
En la seccin 3.3 se justica qu procedimientos pueden ser adecuados para cada
situacin y cules son las condiciones experimentales que los hacen recomendables.
Otro problema de ndole diferente, tambin ligado a las comparaciones mltiples, con-
siste en las comparaciones de distintos tratamientos con un control que suele emplearse
en determinados campos de investigacin, por ejemplo en estudios epidemiolgicos. Dicho
problema se aborda mediante el contraste de Dunnett.
3.2. Comparaciones mltiples de medias
Al estudiar el comportamiento de los tratamientos de un factor, mediante un anli-
sis de la varianza, el nico objetivo es saber si, globalmente, dichos tratamientos dieren
signicativamente entre s. Ahora estamos interesados, una vez aceptada la existencia de
diferencias entre los efectos del factor, en conocer qu tratamientos concretos producen
mayor efecto o cules son los tratamientos diferentes entre s. En estas misma condiciones,
puede ser til tambin realizar comparaciones adicionales entre grupos de medias de los
tratamientos.
Antes de seguir con el desarrollo de esta seccin, remitimos al lector al Captulo 1,
seccin ??, donde presentamos el modelo de efectos jos denido por la ecuacin
y
ij
=
i
+u
ij
. (3.1)
Antes de estudiar analticamente las distintas formas de comparar efectos, es conve-
niente examinar de forma cualitativa su comportamiento. Esto se efecta de forma grca
y constituye el primer mtodo que pasamos a desarrollar.
3.2.1. Comparaciones grcas de medias
Al igual que en el captulo anterior vamos a concretar toda la explicacin sobre un
determinado ejemplo. En este caso, vamos a considerar el Ejemplo 1-1.
3.2 Comparaciones mltiples de medias 3
Para ese ejemplo obtuvimos, vase Tabla 1-6, que el rendimiento de la semilla de algo-
dn depende signicativamente del tipo de fertilizante utilizado. Pero esta conclusin no
nos informa nada sobre una serie de preguntas tales como: Producen algunos fertilizantes
el mismo rendimiento?, en el caso de que dos fertilizantes produzcan distinto rendimiento
entre qu valores oscila esa diferencia?, etc. Una primera respuesta a estas preguntas se
puede realizar de forma grca.
En primer lugar haremos unas consideraciones generales antes de estudiar el ejemplo
de referencia. Para ello, consideremos el modelo equilibrado con n observaciones por nivel
y sean y
1.
, y
2.
, , y
I.
las medias muestrales de los correspondientes tratamientos. Bajo
las hiptesis del modelo, cualquier promedio y
i.
de un tratamiento se distribuir alrededor
de su media
i
con una desviacin estndar /

n. En consecuencia, si aceptamos que


las medias de los distintos niveles de un factor son todas idnticas, entonces las medias
muestrales y
i.
, i = 1, 2, I, se comportarn como un conjunto de I observaciones tomadas
al azar de una misma distribucin normal con media y desviacin estndar /

n.
Supongamos que dibujamos la funcin de densidad de una distribucin normal deslizante
e imaginemos que situamos dicha distribucin sobre los puntos que representan las me-
dias de los tratamientos. Procediendo de esta manera y teniendo en cuenta los distintos
comportamientos de los efectos, podemos distinguir dos casos relevantes:
a) Los efectos de los tratamientos son iguales entre s.
Entonces, al deslizar la distribucin a lo largo del eje OX, es probable que exista
alguna posicin para la cual todos los valores y
i.
sean compatibles con dicha dis-
tribucin; es decir, sean una muestra aleatoria de la misma distribucin.
b) Los efectos de los tratamientos no son iguales.
Entonces al deslizar la distribucin a lo largo del eje OX, es improbable que ex-
ista alguna posicin para la cual todos los valores y
i.
sean compatibles con dicha
distribucin. En este caso, es posible que existan situaciones que permitan detectar
niveles del factor que producen respuestas medias diferentes; concretamente, stos
se identican por medio de aquellos valores y
i.
que estn muy distanciados de los
otros.
Como generalmente
2
es desconocida estimamos su valor por medio de la varianza
residual

S
2
R
y, en lugar de la distribucin normal, hay que emplear una distribucin t
deslizante con factor de escala
_

S
2
R
/n y con los grados de libertad correspondientes a dicha
varianza residual. Para dibujar dicha distribucin t utilizamos la Tabla III del Apndice
C, que muestra el valor de la funcin de densidad, para determinadas abscisas, de una
distribucin t de Student con grados de libertad dados. Para obtener la distribucin con
4 Comparaciones mltiples
factor de escala hay que multipicar las correspondientes abscisas por dicho factor de escala
y representar sus valores frente a las correspondientes ordenadas.
Este mtodo se ilustra en la Figura 2-1 donde se distinguen varios casos:
a) Las cinco medias pueden considerarse como una muestra aleatoria de la misma dis-
tribucin.
Figura 2-1a
b) Al deslizar la distribucin de referencia a lo largo del eje horizontal, nos permite
detectar grupos homogneos. As, deducimos que las medias 2, 4 y 5 son probable-
mente mayores que 1 y 3 y que no hay distincin entre las medias de cada uno de
los grupos.
Figura 2-1b
3.2 Comparaciones mltiples de medias 5
c) Podemos deslizar la distribucin de referencia de forma que abarque a las cinco
medias, pero no parece razonable concluir que las cinco medias sean compatibles con
la misma poblacin.
Figura 2-1c
En estos casos parece razonable que el resultado que proporciona el anlisis de la
varianza sea aceptar la hiptesis H
0
en el primer caso y rechazarla en los otros dos.
Este procedimiento grco se ha desarrollado para el caso en que todos los tamaos
muestrales sean iguales. Sin embargo, de forma aproximada, se puede aplicar tambin
cuando las diferencias entre los tamaos muestrales no sean muy grandes. En tal caso,
debe usarse
_

S
2
R
n
,
como factor de escala, siendo n el tamao medio de las muestras, n =
1
I

i
n
i
.
La aplicacin de este mtodo a nuestro ejemplo de referencia se muestra en la Figura
2-2
6 Comparaciones mltiples
Figura 2-2: Comparacin grca de los tratamientos del Ejemplo 1-1.
En dicho ejemplo, como la varianza es desconocida y los tamaos muestrales son dis-
tintos, el factor de escala es igual a
_

S
2
R
n
=
_
4,67
26/5
= 0,947 .
Para construir la distribucin deslizante, como el nmero de grados de libertad de la
varianza residual es 21, tomamos los valores de la correspondiente la de la Tabla III del
Apndice C, obteniendo:
Abcisa 0 0.5 1.0 1.5 2.0
Ordenada 0.394 0.346 0.236 0.129 0.058
Abcisa 0,947 0 0.473 0.947 1.420 1.894
Para dibujar la distribucin de referencia, se elige un origen arbitrario, que debe es-
tar prximo a las medias, nosotros hemos considerado como origen . A continuacin se
representan las ordenadas de los puntos 0, 0,473, 0,947, 1,420, 1,894
que se unen en una lnea continua, con lo que esbozamos la distribucin de referencia. El
deslizamiento de la distribucin de referencia a lo largo del eje horizontal permite obtener
las siguientes conclusiones:
Las cinco medias no son iguales entre s. No es posible situar la distribucin de
referencia en ninguna posicin de forma que las abarque a todas.
Los fertilizantes (5 y 4), (4 y 3) y (3 y 1) tienen un rendimiento similar y el fertilizante
2 tiene un rendimiento distinto de los otros cuatro.
3.2 Comparaciones mltiples de medias 7
Este procedimiento de comparacin grca de las medias de los tratamientos mediante
una distribucin de referencia, es un mtodo aproximado pero ecaz en muchos problemas
de comparaciones mltiples. En las siguientes secciones se describen otros mtodos estads-
ticos ms rigurosos para realizar comparaciones mltiples. En primer lugar se abordan
mtodos creados especcamente para comparar por parejas los efectos de tratamientos,
de entre ellos, comenzaremos con los basados en la distribucin t.
3.2.2. Comparaciones basadas en la distribucin t
Las pruebas estadsticas para comparaciones mltiples ms frecuentemente uti-
lizadas se basan en la distribucin t de Student. Supongamos que interesa comparar por
parejas los efectos de I tratamientos. Es decir, nos interesa contrastar cualquier hiptesis
de la forma
H
0
:
i
=
j
H
1
:
i
=
j
(3.2)
La tcnica ms antigua y popular para efectuar estas comparaciones mltiples es el
procedimiento LSD, (Least Signicant Dierence), que pasamos a estudiar a continuacin.
Contraste de la Mnima Diferencia Signicativa
Este procedimiento fu sugerido por Fisher en 1935 y es el primer mtodo de
comparaciones mltiples que vamos a utilizar. Dicho procedimiento consiste en una prueba
de hiptesis por parejas basada en la distribucin t.
Este mtodo debe aplicarse cuando previamente se haya rechazado la hiptesis nula
del test F del anlisis de la varianza. Para ello, se determina el siguiente estadstico
t =
y
i.
y
j.
_

S
2
R
_
1
n
i
+
1
n
j
_
(3.3)
que, por las hiptesis del modelo de ecuacin (??), sigue una distribucin t de Student
con N I grados de libertad.
Por lo tanto, se concluye que la pareja de medias
i
y
j
son estadsticamente diferentes
si
| y
i.
y
j.
|> LSD , (3.4)
donde la cantidad LSD, denominada mnima diferencia signicativa, viene dada por
LSD = t
/2;NI
_

S
2
R
_
1
n
i
+
1
n
j
_
, (3.5)
8 Comparaciones mltiples
siendo
n
i
y n
j
el nmero de observaciones correspondiente a cada media,
N I el nmero de grados de libertad de la varianza residual,
t
/2;NI
el valor crtico de la distribucin t con N I grados de libertad que deja
una probabilidad a su derecha igual a /2.
Si el diseo es balanceado, el valor de LSD se reduce a
LSD = t
/2;NI
_
2

S
2
R
n
. (3.6)
El procedimiento LSD es sencillo de utilizar; se puede aplicar tanto en modelos equi-
librados como no-equilibrados. Adems proporciona tambin intervalos de conanza para
diferencias de medias. Dichos intervalos son de la forma
(( y
i.
y
j.
) LSD , ( y
i.
y
j.
) +LSD) (3.7)
Comentarios 3.1
C1) Un problema que presenta la aplicacin de este procedimiento, para un nmero rela-
tivamente grande de tratamientos, es que el nmero de posibles falsos rechazos de la
hiptesis nula puede ser elevado aunque no existan diferencias reales. As, por ejem-
plo, si I es igual a 10, hay
_
10
2
_
= 45 posibles parejas de comparaciones. Si tomamos
= 0,05, entonces el nmero esperado de falsos rechazos ser
0,05 45 = 2,25 ,
supuesta independencia estadstica entre los distintos contrastes.
Otra forma de enfocar este problema es comprobando que la utilizacin reiterada de
este procedimiento conduce a que la probabilidad de que se rechace al menos una de
las posibles comparaciones sea bastante alta. En efecto, bajo la hiptesis nula
Pr[rechazar al menos una comparacin] = 1 Pr[aceptar todas] =
1 (1 0,05)
45
0,90
El intento de paliar este problema justica la introduccin de otros procedimientos
para comparaciones mltiples.
3.2 Comparaciones mltiples de medias 9
C2) Puede suceder que el mtodo LSD falle al aceptar que todas las parejas son iguales,
a pesar de que el estadstico F del anlisis de la varianza resulte signicativo; sto es
debido a que la prueba F considera simultneamente todas las posibles comparaciones
entre las medias de los tratamientos y no slo las comparaciones por parejas.
A fn de ilustrar este procedimiento, consideramos el ejemplo de referencia. As, para
un nivel de signicacin del 5 %, el valor de LSD es
LSD = t
0,025;21
_

S
2
R
_
1
n
i
+
1
n
j
_
= 2,080
_
4,67
_
1
n
i
+
1
n
j
= 4,49
_
1
n
i
+
1
n
j
Por tanto, dos medias dieren signicativamente entre s, si el valor absoluto de la
diferencia de sus promedios muestrales es mayor que el valor LSD. Recordemos que, en
este ejemplo de referencia, los valores de los cinco promedios de los tratamientos son:
y
1.
= 50, y
2.
= 57, y
3.
= 48, y
4.
= 47, y
5.
= 45 .
Para la aplicacin de este procedimiento es recomendable ordenar las medias de menor
a mayor. Una vez ordenadas se comparan la 1
a
y la 2
a
:
a) Si hay diferencia signicativa entre ellas, tambin la habr entre la 1
a
y todas las
dems.
b) Si no hay diferencia signicativa entre ellas, se compara la 1
a
con la 3
a
y siguientes
hasta encontrar la primera diferencia signicativa.
De forma similar se realiza la comparacin de la 2
a
media con todas las dems y as
sucesivamente se hara con las restantes medias.
Por lo tanto,
1
o
) Ordenamos las medias de menor a mayor.
y
5.
= 45, y
4.
= 47 y
3.
= 48, y
1.
= 50, y
2.
= 57 .
2
o
) Comparamos las medias 1
a
y 2
a
.
LSD = 4,49
_
1/6 + 1/4 = 2,898 ; | y
5.
y
4.
| =| 45 47 | = 2 .
Como no hay diferencia signicativa entre ellas, se compara la 1
a
con la 3
a
10 Comparaciones mltiples
LSD = 4,49
_
1/6 + 1/5 = 2,718 ; | y
5.
y
3.
| =| 45 48 | = 3 .
Al haber diferencia signicativa entre ellas, tambin la hay entre la 1
a
y la 4
a
y entre
la 1
a
y la 5
a
.
3
o
) Comparamos las medias 2
a
y 3
a
.
LSD = 4,49
_
1/4 + 1/5 = 3,011 ; | y
4.
y
3.
| =| 47 48 | = 1 .
Como no hay diferencia signicativa entre ellas comparamos la 2
a
y la 4
a
.
LSD = 4,49
_
1/4 + 1/6 = 2,898 ; | y
4.
y
1.
| =| 47 50 | = 3 .
Al haber diferencia signicativa entre ellas, tambin la hay entre la 2
a
y la 5
a
.
4
o
) Comparamos las medias 3
a
y 4
a
.
LSD = 4,49
_
1/5 + 1/6 = 2,718 ; | y
3.
y
1.
| =| 48 50 | = 2 .
No hay diferencia signicativa, por lo tanto comparamos la 3
a
con la 5
a
LSD = 4,49
_
1/5 + 1/5 = 2,839 ; | y
3.
y
2.
| =| 48 57 | = 9 .
Hay diferencia signicativa.
5
o
) Comparamos las medias 4
a
y 5
a
.
LSD = 4,49
_
1/6 + 1/5 = 2,718 ; | y
1.
y
2.
| =| 50 57 | = 7 .
Hay diferencia signicativa.
Normalmente el resultado de las comparaciones por parejas se suele representar en
forma grca, como se muestra a continuacin
Figura 2-3
3.2 Comparaciones mltiples de medias 11
En dicha representacin los valores de las medias de los tratamientos aparecen en
orden creciente y se subrayan aquellos grupos de medias que resultan equivalentes. Esta
representacin grca es muy fcil de interpretar y es la utilizada por la mayora de los
paquetes estadsticos.
En la siguiente seccin se describe el mtodo de Bonferroni, que presenta una solucin
al problema de los falsos rechazos planteado en el mtodo LSD.
Mtodo de Bonferroni
En este procedimiento se ja un nivel de signicacin que se reparte entre cada
una de las comparaciones consideradas y se utiliza la desigualdad de Bonferroni
Pr
_
M
_
m=1
A
m
_

m=1
Pr(A
m
) . (3.8)
Consideremos que queremos realizar estimacin por intervalos para las M =
_
I
2
_
com-
paraciones posibles, cada una al nivel de signicacin

= /M; esto da origen a M


intervalos de conanza que contienen a cada una de las posibles diferencias
i

j
con
probabilidad 1

. Llamando C
m
al intervalo m-simo se tiene que
Pr [
1m

2m
C
m
] = 1

m = 1, 2, , M
siendo
1m
y
2m
la primera y segunda media de la correspondiente comparacin, donde
supondremos que 1 1m < 2m I.
Aplicando la desigualdad de Bonferroni, (expresin (3.8)), se tendr
Pr
_
M

m=1
C
m
_
= 1 Pr
_
M
_
m=1

C
m
_
1
M

m=1
Pr(

C
m
) = 1
M

m=1

,
notamos por

C
m
al complementario del intervalo C
m
.
Teniendo en cuenta este resultado y si queremos garantizar un nivel de signicacin
para el conjunto de las M comparaciones por parejas, o un nivel de conanza 1 para
el conjunto de intervalos, basta tomar

=

M
.
12 Comparaciones mltiples
Con ello, evidentemente, la probabilidad de que todos los intervalos, C
m
, contengan
a la correspondiente diferencia de medias, ser al menos 1 . As pues, los intervalos
quedarn en la forma
y
1m.
y
2m.
t

2M
_

S
2
R
_
1
n
1m
+
1
n
2m
_
, (3.9)
donde y
1m.
, y
2m.
y n
1m
, n
2m
, son las medias y los tamaos muestrales correspondientes a
la comparacin m-sima.
Denotamos por
m
=
1m

2m
, m = 1, 2, , M, una de las M comparaciones lineales
por parejas de medias, para las cuales interesa contrastar H
0
:
m
= 0 frente H
1
:
m
= 0.
Entonces, se rechaza H
0
si
|
m
|> B
m
,
y se acepta en caso contrario.
Donde
B
m
= t

2M
_

S
2
R
_
1
n
1m
+
1
n
2m
_
. (3.10)
En el caso del modelo equilibrado los valores de B
m
coinciden, dichos valores se denotan
por BSD y tienen la siguiente expresin
BSD = t

2M
_

S
2
R
_
1
n
+
1
n
_
, (3.11)
siendo n el nmero de observaciones de cada grupo y t
/2M
el valor crtico de la distribucin
t, con el mismo nmero de grados de libertad que la varianza residual, que deja una
probabilidad /2M a su derecha.
Para ilustrar este mtodo consideramos el ejemplo de referencia. Puesto que es un
modelo no-equilibrado, los valores de los estadsticos de contraste vendrn dados por la
siguiente expresin
B
m
= t0,025
10
;21
_
(4,67)
_
1
n
1m
+
1
n
2m
_
m = 1, 2. , 10 .
As, por ejemplo, si comparamos
3.2 Comparaciones mltiples de medias 13
5 vs
2
4, el valor de B
m
es
B
1
= t0,025
10
;21
_
4,67
_
1
6
+
1
4
_
= (3,135)(1,394) = 4,370 .
Entonces, como
| y
5.
y
4.
|= 2 < B
1
,
las medias 5 y 4 no son signicativamente distintas
5 vs 3, el valor de B
m
es
B
2
= t0,025
10
;21
_
4,67
_
1
6
+
1
5
_
= (3,135)(1,308) = 4,100 .
Entonces, como
| y
5.
y
3.
|= 3 < B
2
,
las medias 5 y 3 no son signicativamente distintas.
El resultado de las comparaciones por parejas realizadas con este procedimiento se
muestra, en forma grca, a continuacin
Figura 2-4
Seguidamente presentamos los contrastes de rangos mltiples. Dichos contrastes se
basan en la distribucin del rango estudentizado y se distinguen tres mtodos debidos
respectivamente a Tukey, Duncan-Newman y Keuls.
2
Se utiliza i vs j, (i versus j), para denotar la comparacin de
i
frente a
j
.
14 Comparaciones mltiples
3.2.3. Tests de rangos mltiples
Estos contrastes se basan en la distribucin del rango estudentizado, cuya denicin
se realiza en trminos del nmero de grupos que hay que comparar y de los grados de
libertad del estimador de la varianza.
Estos procedimientos, al igual que el procedimiento de Bonferroni, permiten superar
las dicultades que surgen al aumentar el nmero de grupos a comparar y no poderse
controlar los falsos rechazos de la hiptesis nula. Los mtodos resultantes, en trminos
generales, son conservadores; es decir, la probabilidad real de rechazar la hiptesis nula
cuando es cierta es menor que el nivel de signicacin jado.
Para denir el recorrido o rango estudentizado, supongamos que disponemos de k
observaciones independientes y
1
, y
2
, , y
k
de una distribucin Normal con media y
varianza
2
. Supongamos que disponemos, tambin, de un estimador S
2
de
2
que tiene
grados de libertad y es independiente de las y
i
. Sea R el rango de este conjunto de
observaciones,
R = max(y
i
) mn(y
i
) . (3.12)
Bajo estas condiciones, se dene el rango estudentizado como el cociente
max(y
i
) mn(y
i
)
S
=
R
S
, (3.13)
que se denota por q
k,
. La distribucin de este estadstico, que depende de los parmetros
k y , ha sido tabulada y los valores crticos se presentan en el Apndice C en la Tabla
VI.
Mtodo de Tukey (Honestly-signicant-dierence)
Este procedimiento se va a desarrollar considerando en primer lugar el caso del
modelo unifactorial equilibrado. En este modelo vamos a construir intervalos de conanza
con coeciente de conanza conjunto 1 para todas las posibles comparaciones por
parejas asociadas a los I niveles, es decir las
_
I
2
_
comparaciones por parejas.
El nivel de conanza conjunto 1 indica que de cada 100 muestras en (1 ) 100
de ellas, cada uno de los intervalos contiene a su correspondiente diferencia de medias. Por
tanto el nivel de conanza de cada uno de los intervalos ser al menos 1 .
Para construir dichos intervalos consideramos las desviaciones
( y
1.

1
), ( y
2.

2
), , ( y
I.

I
) . (3.14)
3.2 Comparaciones mltiples de medias 15
Estas desviaciones son variables aleatorias independientes normalmente distribuidas
con media 0 y varianza
2
/n. Adems

S
2
R
/n es un estimador de
2
/n que es independiente
de dichas desviaciones. Entonces, de la denicin de rango estudentizado, se sigue que
max( y
i.

i
) mn( y
i.

i
)
_

S
2
R
n
_
1/2
q
I,NI
, (3.15)
donde
N I es el nmero de grados de libertad asociado a

S
2
R
max( y
i.

i
) es la desviacin mayor
mn( y
i.

i
) es la desviacin menor.
Entonces se verica que
Pr
_

_
max( y
i.

i
) mn( y
i.

i
)
_

S
2
R
n
_
1/2
q
;I,NI
_

_
= 1 . (3.16)
Consideramos, a continuacin, la siguiente desigualdad generada para todas las parejas
de medias de tratamientos i y j
| ( y
i.

i
) ( y
j.

j
) | max( y
i.

i
) mn( y
j.

j
) . (3.17)
Puesto que la desigualdad (3.17) se verica para todas las parejas
i
y
j
, se sigue de
(3.16) que
Pr
_

( y
i.

i
) ( y
j.

j
)
_

S
2
R
n
_
1/2

q
;I,NI
_

_
= 1 , (3.18)
incluye todos los pares I(I 1)/2 de comparaciones entre los I niveles del factor.
16 Comparaciones mltiples
Reordenando la desigualdad (3.18) obtenemos los lmites de conanza, al nivel de
conanza conjunto 1 , para todas las
_
I
2
_
comparaciones por parejas de las I medias,
dados por
( y
i.
y
j.
) HSD
i

j
( y
i.
y
j.
) +HSD , (3.19)
donde
HSD = q
;I,NI
_

S
2
R
n
.
Si el intervalo (3.19) no contiene el 0 se concluye que las medias
i
y
j
dieren
signicativamente entre s.
El coeciente de conanza 1 indica que de cada 100 muestras en (1 ) 100 de
ellas se determinar correctamente cuales de las
_
I
2
_
comparaciones por parejas de medias
son signicativas.
Por tanto, el mtodo de Tukey resuelve el contraste
H
0
:
i
=
j
vs H
1
:
i
=
j
,
de la siguiente manera
Si | y
i.
y
j.
| HSD = Aceptar H
0
Si | y
i.
y
j.
|> HSD = Rechazar H
0
En el caso de que el modelo no sea equilibrado se emplea el ajuste de Tukey-Kramer, que
consiste en reemplazar n por la media armnica, n
h
, de los tamaos de los grupos, es decir
n
h
=
2
2

i=1
1
n
i
. (3.20)
Para ilustrar el uso de este procedimiento consideremos el ejemplo de referencia. En
este caso hay que usar q
0,05;5,21
= 4,22 como base para determinar el valor crtico y,
en consecuencia, ningn par de medias se declara signicativamente diferente, salvo que
| y
i.
y
j.
| exceda a
HSD = (4,22)
_

S
2
R
n
h
= (4,22)
_
4,67
2
_
1
n
i
+
1
n
j
_
.
Con esta prueba se obtienen los mismos resultados que con el procedimiento de Bon-
ferroni.
3.2 Comparaciones mltiples de medias 17
El segundo procedimiento de comparaciones mltiples considerado en esta seccin es
el test de rango mltiple de Duncan. Es un procedimiento iterativo en el cual se intenta
comprobar la igualdad de medias basndose en las ms extremas. Es similar al proced-
imiento HSD de Tukey excepto que el nivel de signicacin vara de unas comparaciones
a otras.
Test de rango mltiple de Duncan
El contraste de Duncan utiliza, como el HSD de Tukey, la distribucin del recorrido
estudentizado. Se diferencia de ese test en que su aplicacin es secuencial, en el sentido de
no utilizar un nico valor crtico para todas las diferencias de medias, como el de Tukey,
sino un valor crtico que depende del nmero de medias comprendido entre las dos medias
que se comparan, habiendo ordenado previamente las medias en orden creciente.
Consideremos, en primer lugar, el modelo equilibrado y despus generalizaremos para
el caso no-equilibrado.
Se acepta que no hay diferencia signicativa entre la media mayor y la media menor
de p medias, y
i.
e y
j.
, si se verica
| y
i.
y
j.
| R
p
, (3.21)
y sern consideradas iguales tambin todas las medias comprendidas entre ellas. En la
expresin (3.21), el valor de R
p
es
R
p
= q

p
;p,NI
_

S
2
R
n
p = 2, 3, , I (3.22)
donde
q

p
;p,NI
es el punto crtico del rango estudentizado basado en la comparacin de la
media mayor y la menor de p medias. Los valores crticos q
p;p,
, para p = 2, 3, , I,
se presentan en la Tabla VII del Apndice C para los niveles de signicacin de
comparaciones individuales = 0,01 y = 0,05.

S
2
R
es la varianza residual con N I grados de libertad.

p
es el nivel de signicacin conjunto relativo a p medias consecutivas; es decir, es
la probabilidad de rechazar errneamente al menos una de las p 1 comparaciones
independientes asociadas a las medias consideradas. Dicho nivel de signicacin est
relacionado con el nivel de signicacin , de una comparacin individual, a travs
de la ecuacin

p
= 1 (1 )
p1
. (3.23)
18 Comparaciones mltiples
Para la aplicacin del test de rango mltiple de Duncan, una vez que las medias estn
en orden ascendente, se calculan las diferencias entre las medias, comenzando por el valor
ms pequeo frente al ms alto de las p = I medias de los tratamientos, comparando esta
diferencia con el valor R
I
en la ecuacin (3.22) con un nivel de signicacin
I
. Si esas
dos medias no se consideran signicativamente diferentes, entonces el contraste se termina
y se concluye que ninguna de las medias son signicativamente diferentes entre s al nivel
de signicacin
I
. Esto es equivalente a no rechazar H
0
:
1
=
2
= =
I
. Si las dos
medias extremas son signicativamente diferentes, el contraste contina.
En el siguiente paso se calcula la diferencia entre el valor ms pequeo y el segundo valor
ms grande y esta diferencia se compara con R
I1
. Si este contraste no es estadsticamente
signicativo, la prueba cesa en esta comparacin y slo las dos medias extremas se con-
sideran signicativamente diferentes. Si este contraste es estadsticamente signicativo, la
prueba contina hasta encontrar la primera pareja de medias que no sea signicativamente
distinta. A continuacin, se calcula la diferencia entre la segunda media ms pequea y la
ms grande y se compara con R
I1
. Este proceso contina hasta que se han considerado
las diferencias entre todas las I(I 1)/2 posibles parejas.
Para modelos no-equilibrados, la expresin de R
p
es
R
p
= q

p
;p,NI
_

S
2
R
n
h
p = 2, 3, , I , (3.24)
donde n
h
es la media armnica dada por la expresin (3.20).
Comentario 3.1
La probabilidad de rechazar errneamente al menos una hiptesis nula es decir, la
probabilidad de detectar incorrectamente como signicativa la diferencia entre dos medias
de un grupo de tamao p, es el nivel de signicacin conjunto
p
relacionado con el nivel
de signicacin por medio de la expresin (3.23).
Por ejemplo, si = 0,05, entonces
Si comparamos parejas de medias adyacentes, el nivel de signicacin conjunto es

2
= 1 (1 0,05)
21
= 0,05 ,
que lgicamente coincide con el nivel de signicacin .
Si comparamos parejas de medias separadas por una media, el nivel de signicacin
conjunto es

3
= 1 (1 0,05)
31
= 0,10 .
3.2 Comparaciones mltiples de medias 19
Si comparamos parejas de medias separadas por dos medias, el nivel de signicacin
conjunto es

4
= 1 (1 0,05)
41
= 0,142 .
Observamos que al aumentar p, aumenta el nivel de signicacin conjunto.
Para ilustrar la prueba de intervalos mltiples de Duncan consideramos el ejemplo de
referencia. Recurdese que

S
2
R
= 4,67 con 21 grados de libertad. Ordenando las medias de
los tratamientos en orden ascendente, se tiene
y
5.
= 45 y
4.
= 47 y
3.
= 48 y
1.
= 50 y
2.
= 57 .
Usando la Tabla de amplitudes signicativas de Duncan, Tabla VII del Apndice C,
para 21 grados de libertad y = 0,05, se obtienen los puntos crticos del rango estudenti-
zado:
q
2
= q(0,05; 2, 21) = 2,94 q
3
= q(0,05; 3, 21) = 3,09
q
4
= q(0,05; 4, 21) = 3,17 q
5
= q(0,05; 5, 21) = 3,24 .
20 Comparaciones mltiples
Al hacer las comparaciones se obtiene:
5 vs 2 q
5
_
2,33
_
1
6
+
1
5
_
= 2,994, | y
5.
y
2.
| = 12 > 2,994()
5 vs 1 q
4
_
2,33
_
1
6
+
1
6
_
= 2,793, | y
5.
y
1.
| = 5 > 2,793()
5 vs 3 q
3
_
2,33
_
1
6
+
1
5
_
= 2,856, | y
5.
y
3.
| = 3 > 2,856()
5 vs 4 q
2
_
2,33
_
1
6
+
1
4
_
= 2,896, | y
5.
y
4.
| = 2 < 2,896
4 vs 2 q
4
_
2,33
_
1
4
+
1
5
_
= 3,245, | y
4.
y
2.
| = 10 > 3,245()
4 vs 1 q
3
_
2,33
_
1
4
+
1
6
_
= 3,044, | y
4.
y
1.
| = 3 < 3,044
4 vs 3 q
2
_
2,33
_
1
4
+
1
5
_
= 3,010, | y
4.
y
3.
| = 1 < 3,010
3 vs 2 q
3
_
2,33
_
1
5
+
1
5
_
= 2,983, | y
3.
y
2.
| = 9 > 2,983()
3 vs 1 q
2
_
2,33
_
1
5
+
1
6
_
= 2,717, | y
3.
y
1.
| = 2 < 2,717
donde denota que la correspondiente diferencia de medias es signicativa.
Test de Newman-Keuls
Este contraste fu desarrollado por Newman en 1939 y ampliado por Keuls en 1952,
se suele denominar contraste de Newman-Keuls. Al igual que el contraste de Duncan, es un
procedimiento iterativo y, desde el punto de vista operacional, es similar a dicho mtodo.
3.2 Comparaciones mltiples de medias 21
En el procedimiento de Newman-Keuls, los valores con los que se comparan las sucesivas
diferencias de medias vienen dados por
K
p
= q
;p,NI
_

S
2
R
n
h
p = 2, 3, , I , (3.25)
donde
q
;p,NI
es el punto crtico del rango estudentizado, denido en (3.13). En la Tabla
VI del Apndice C se recogen los valores crticos de dicha distribucin.


S
2
R
es la varianza residual con N I grados de libertad.
n
h
es la media armnica, dada en la ecuacin (3.20), que se utiliza cuando los tamaos
de las muestras son desiguales. En el caso del modelo equilibrado el valor de la media
armnica n
h
coincide con el tamao n de las muestras.
En este mtodo las medias ms extremas de un grupo de p medias, incluidas ambas, se
comparan con K
p
exactamente de la misma forma que en la prueba de intervalos mltiples
de Duncan.
Comentarios 3.2
C1) El contraste de Newman-Keuls es ms conservador que el de Duncan en el sentido
de que el error de tipo I es menor.
C2) En el contraste de Newman-Keuls el nivel de signicacin es , en cambio en el
contraste de Duncan es
p
, cuyo valor cambia dependiendo del nmero de medias
comprendidas entre las que se comparan. Por lo tanto, la potencia de la prueba de
Newman-Keuls es menor que la del procedimiento de Duncan porque generalmente
es menor que
p
. Podemos comparar los valores de las Tablas VI y VII del Apndice
C para comprobar que el procedimiento de Newman-Keuls conduce a una prueba
menos ecaz que la de los intervalos mltiples de Duncan. Se observa que para p > 2,
siempre
q
;p,NI
> q
p;p,NI
. (3.26)
As, por ejemplo, considerando los grados de libertad correspondientes al ejemplo de
referencia y tomando 0.05 como nivel de signicacin , tenemos la siguiente tabla
p 2 3 4 5
q

p
;p,
2.94 3.09 3.17 3.24
q
;p,
2.94 3.57 3.94 4.22
,
22 Comparaciones mltiples
donde se comprueba que, efectivamente, para p > 2 se verica la desigualdad dada
en (3.26).
En otras palabras, es ms difcil declarar que dos medias son signicativamente
diferentes al utilizar la prueba de Newman-Keuls que cuando se usa el procedimiento
de Duncan.
Para ilustrar este procedimiento se utiliza el ejemplo de referencia y se comprueba que
los resultados coinciden con los obtenidos por los mtodos de Bonferroni y Tukey.
Hasta ahora hemos tratado nicamente comparaciones por parejas de niveles de un
factor; es decir, hemos considerado hiptesis del tipo
H
0
:
j
=
k
H
1
:
j
=
k
.
De forma equivalente, estas hiptesis se pueden reescribir como
H
0
:
j

k
= 0
H
1
:
j

k
= 0 ,
que son casos particulares de hiptesis de la forma
H
0
:
I

i=1
a
i

i
= 0
H
1
:
I

i=1
a
i

i
= 0 ,
donde todos los a
i
son nulos excepto a
j
= 1 y a
k
= 1. Adems, se verica la propiedad
de que

i
a
i
= 0. Todo esto nos da pie a introducir el concepto de contraste.
3.2.4. Contrastes
Se denomina contraste a toda combinacin lineal C, de los parmetros del modelo
de anlisis de la varianza, de la forma
C = a
1

1
+a
2

2
+ +a
I

I
=
I

i=1
a
i

i
, (3.27)
3.2 Comparaciones mltiples de medias 23
tal que los coecientes veriquen
I

i=1
a
i
= 0 . (3.28)
Ejemplo de contrastes distintos a las comparaciones por parejas son, entre otros,

2
+
3
2
(3.29)

1
+
4
(
2
+
3
) . (3.30)
Si se acepta que el primer contraste es cero se arma que la media del nivel 1 del
factor es igual al promedio de las medias de los niveles 2 y 3.
Si se acepta que el segundo contraste es cero se arma que las medias de los niveles
1 y 4, consideradas en grupo, son iguales a las medias de los niveles 2 y 3, tambin
consideradas en grupo.
La combinacin lineal de la forma (3.27) tambin se puede expresar en funcin de los
efectos del factor
C =
I

i=1
a
i

i
=
I

i=1
a
i
( +
i
) =
I

i=1
a
i
+
I

i=1
a
i

i
=
I

i=1
a
i

i
, (3.31)
ya que

I
i=1
a
i
= 0.
Dado que un contraste es una funcin de los parmetros del modelo, que son desconoci-
dos, su valor se podr estimar utilizando los estimadores de los parmetros que intervienen.
Concretamente, se puede demostrar que el estimador ptimo de un contraste viene dado
por la misma combinacin lineal de los estimadores de los parmetros que intervienen; es
decir

C =
I

i=1
a
i

i
=
I

i=1
a
i
y
i.
,
que tambin se puede escribir como la misma combinacin lineal de los estimadores de los

i
; es decir,

C =
I

i=1
a
i

i
. (3.32)
24 Comparaciones mltiples
En efecto

C =
I

i=1
a
i

i
=
I

i=1
a
i
(
i
+ ) =
I

i=1
a
i
(
i
) +
I

i=1
a
i
=
I

i=1
a
i

i
. (3.33)
Si consideramos el contraste (3.29), la combinacin lneal y
1.
( y
2.
+ y
3.
)/2, es el
estimador de ese contraste. Para evitar coecientes fraccionarios es comn reescribir esa
combinacin como
2 y
1.
( y
2.
+ y
3.
) . (3.34)
De la misma forma, un estimador del contraste dado en (3.30) es
( y
1.
+ y
4.
) ( y
2.
+ y
3.
) . (3.35)
Como disponemos de un estimador para cada contraste y conocemos la distribucin en
el muestreo de los estimadores de los parmetros del modelo, podemos conocer tambin la
distribucin del estimador de un contraste y realizar inferencia estadstica sobre el mismo.
Para ello, vamos a mostrar algunas propiedades de dichos estimadores.
Propiedades de los estimadores de los contrastes
1
a
)

C es un estimador insesgado de C. En efecto
E
{

C} =
E
_
I

i=1
a
i

i
_
=
E
_
I

i=1
a
i
y
i.
_
=
I

i=1
a
i E
[ y
i.
] =
I

i=1
a
i

i
, (3.36)
puesto que y
i.
son variables aleatorias con media
i
.
2
a
) La varianza de

C es
2

i
a
2
i
n
i
. En efecto

2
{

C} = Var
_
I

i=1
a
i
y
i.
_
=
I

i=1
a
2
i
Var{ y
i.
} =
I

i=1
a
2
i

2
n
i
=
2
I

i=1
a
2
i
n
i
(3.37)
puesto que y
i.
son variables aleatorias independientes con varianza
2
/n
i
.
Por tanto, un estimador de la varianza de

C es
S
2
{

C} =

S
2
R
I

i=1
a
2
i
n
i
, (3.38)
donde

S
2
R
, es la varianza residual.
3.2 Comparaciones mltiples de medias 25
3
a
)

C se distribuye segn una Normal al ser una combinacin lineal de variables aleato-
rias Normales independientes. Adems, por las propiedades 1
a
y 2
a
, su media es C
y su desviacin tpica es {

C}. En otras palabras,

C N(C, {

C})
Por tanto, al considerar la estimacin de {

C} en funcin de

S
2
R
, se verica que el
cociente

C C
S{

C}
t
NI
. (3.39)
Consecuentemente, podemos efectuar la estimacin por intervalos de un contraste C
al nivel de conanza 1 , que vienen dados por la expresin

C t
/2;NI
S{

C} . (3.40)
En el ejemplo de referencia y considerando el contraste dado en (3.29),
C = 2
1
(
2
+
3
) ,
se tiene que:
1
a
) La estimacin puntual de C es

C = 2 y
1.
( y
2.
+ y
3.
) = 2(50) (57 + 48) = 5 .
2
a
) La estimacin de la varianza muestral de

C es
S
2
{

C} =

S
2
R
I

i=1
a
2
i
n
i
= 4,67(1,067) = 4,982 ,
donde a
1
= 2, a
2
= a
3
= 1 y
I

i=1
a
2
i
n
i
=
4
6
+
1
5
+
1
5
=
16
15
= 1,067 .
Los lmites de conanza para C, al nivel conanza del 95 %, son

C t
/2;NI
_
S
2
{

C} = 5 2,08(2,23) = 5 4,63 ,
por lo tanto el intervalo de conanza correspondiente es (9,67 0,37) .
En los procedimientos de comparaciones mltiples de los efectos del factor interesa
manejar nicamente contrastes independientes. Dicha independencia se garantiza al con-
siderar la ortogonalidad entre contrastes, que pasamos a denir a continuacin.
26 Comparaciones mltiples
Contrastes ortogonales
Decimos que dos contrastes
3
C
1
=

i
a
i
y
i.
y C
2
=

i
b
i
y
i.
son ortogonales si
verican que
I

i=1
a
i
b
i
= 0 . (3.41)
De la misma forma, se dice que tres o ms contrastes son mutuamente ortogonales si
todas las posibles parejas de contrastes son ortogonales.
Los coecientes de contrates ortogonales se pueden elegir de muchas formas para un
conjunto dado de tratamientos. Generalmente la naturaleza del experimento sugiere las
comparaciones que pueden ser ms interesantes.
Para ilustrar los contrastes ortogonales, consideremos el ejemplo de referencia y recorde-
mos que los tamaos de muestras correspondientes a cada uno de los 5 tipos de fertilizantes
son: 6, 5, 5, 4, y 6. Supongamos que los contrastes ms apropiados son:
1) C
1
=
1

3
2) C
2
=
1

3
+
4
+
5
3) C
3
=
4

5
4) C
4
=
1
+ 4
2

5
.
Los coecientes en estas comparaciones expresadas en forma tabular seran
Tabla 2-1.
Respuesta media del nivel del factor
Contraste
1

2

3

4

5
C
1
1 0 -1 0 0
C
2
- 1 0 -1 1 1
C
3
0 0 0 1 -1
C
4
-1 4 -1 -1 -1
Obsrvese que la suma de los coecientes de cada la es cero indicando que cada C
i
es un contraste. Adems, es inmediato comprobar que los productos dos a dos de los
3
Aunque

C =

i
ai yi. es un estimador del contraste C =

i
ai
i
, nos referiremos a l como contraste
y lo denotaremos por C.
3.2 Comparaciones mltiples de medias 27
coecientes de los contrastes suman cero indicando que los contrastes son mutuamente
ortogonales. En efecto, comprobemos, por ejemplo, que los contrastes C
1
y C
2
son ortog-
onales
(1)(1) + (0)(0) + (1)(1) + (0)(1) + (0)(1) = 0 .
Veamos a continuacin las expresiones para las sumas de cuadrados asociadas a un
contraste cualquiera, tanto en el caso equilibrado como en el caso no-equilibrado.
En el diseo no-equilibrado se puede demostrar que al contraste C =

i
a
i

i
se le
puede asociar una suma de cuadrados dada por
SSC =
_
I

1=1
a
i
y
i.
_
2
I

i=1
a
2
i
n
i
, (3.42)
y por lo tanto, la expresin de la suma de cuadrados en el modelo equilibrado es
SSC =
n
_
I

1=1
a
i
y
i.
_
2
I

i=1
a
2
i
, (3.43)
teniendo estas sumas de cuadrados un grado de libertad.
Por tanto, para comprobar las hiptesis del contraste
H
0
:
I

i=1
a
i

i
= 0
H
1
:
I

i=1
a
i

i
= 0 ,
(3.44)
basta comparar la suma de cuadrados asociada al contraste con el cuadrado medio del
error. Entonces, el cociente SSC/

S
2
R
es el estadstico de contraste que, bajo la hiptesis
nula, sigue una distribucin F
1,NI
.
A continuacin vamos a realizar las sumas de cuadrados asociadas a los contrastes para
el ejemplo de referencia. Supongamos que efectuamos los contrastes ortogonales expuestos
28 Comparaciones mltiples
en la Tabla 2-1. Dichos contrastes junto con sus estimaciones puntuales y su suma de
cuadrados asociada se muestran en la siguiente tabla
Tabla 2-2
Hiptesis Estimaciones S.Cuadrados
H
0
:
1
=
3
C
1
= 2 SSC
1
= 10,89
H
0
:
1
+
3
=
4
+
5
C
2
= 6 SSC
2
= 45,97
H
0
:
4
=
5
C
3
= 2 SSC
3
= 9,61
H
0
: 4
2
=
1
+
3
+
4
+
5
C
4
= 38 SSC
4
= 362,35
Donde
C
1
= (1)( y
1.
) + (1)( y
3.
) = 50 48 = 2
C
2
= (1)( y
1.
+ y
3.
) + (1)( y
4.
+ y
5.
) = (50 + 48) + (47 + 45) = 6
C
3
= (1)( y
4.
) + (1)( y
5.
) = 47 45 = 2
C
4
= (1)( y
1.
+ y
3.
+ y
4.
+ y
5.
) + 4(1) y
2.
= 50 48 47 45 + 4(57) = 38
SSC
1
=
(2)
2
1
2
6
+
(1)
2
5
= 10,89
SSC
2
=
(6)
2
(1)
2
_
1
6
+
1
5
_
+ (1)
2
_
1
4
+
1
6
_ = 45,97
SSC
3
=
(2)
2
1
2
4
+
(1)
2
6
= 9,61
SSC
4
=
(38)
2
(1)
2
_
1
6
+
1
5
+
1
4
+
1
6
_
+
(4)
2
5
= 362,35
3.2 Comparaciones mltiples de medias 29
Teniendo en cuenta que el valor de la varianza residual es 4.67, con 21 grados de
libertad, obtenemos los siguientes valores para los estadsticos de contraste F(C
1
), F(C
2
),
F(C
3
) y F(C
4
),
F(C
1
)
(exp)
=
SSC
1

S
2
R
=
10,89
4,67
= 2,33
F(C
2
)
(exp)
=
SSC
2

S
2
R
=
45,97
4,67
= 9,84
F(C
3
)
(exp)
=
SSC
3

S
2
R
=
9,61
4,67
= 2,05
F(C
4
)
(exp)
=
SSC
4

S
2
R
=
362,35
4,67
= 77,59 .
Si realizamos el contraste al nivel de signicacin del 5 % y puesto que F
0,05;1,21
= 4,32, se
concluye que
1
=
3
,
4
=
5
y en los otros dos contrastes se rechaza la hiptesis nula.
Generalmente las sumas de cuadrados de los contrastes y las pruebas correspondientes
se incorporan a la Tabla ANOVA, de la siguiente forma:
Tabla 2-3.
F. V. S.C. G.L. M. C. F
exp
F

Entre grupos 439.88 4 109.97 23.56 2.84


C
1
:
1
=
3
10.89 1 10.89 2.33 4.32
C
2
:
1
+
3
=
4
+
5
45.97 1 45.97 9.84 4.32
C
3
:
4
=
5
9.61 1 9.61 2.05 4.32
C
4
: 4
2
=
1
+
3
+
4
+
5
362.35 1 362.35 77.59 4.32
Interna 98.00 21 4.67
TOTAL 537.88 25
Comentarios sobre el nivel de signicacin
Cuando se realizan comparaciones mltiples una cuestin importante es la eleccin
del nivel de signicacin de los tests o el nivel de conanza para la estimacin por inter-
valos. Puesto que varios tests o varias estimaciones por intervalos se hacen sobre el mismo
conjunto de datos, es necesario distinguir entre dos probabilidades de error. Describimos
esas tasas de error de Tipo I para contrastes de hiptesis, pero igualmente se hara para
intervalos de conanza.
Tasa de error individual o para una pareja, , es la probabilidad de rechazar er-
rneamente la hiptesis nula de una nica comparacin entre una pareja de efectos
30 Comparaciones mltiples
o medias. Esencialmente indica el nivel de signicacin asociado a un solo test es-
tadstico de la forma,
H
0
:
i
=
j
H
1
:
i
=
j
.
(3.45)
Tasa de error global o del experimento,

, es la probabilidad de rechazar errnea-


mente por lo menos una hiptesis nula al realizar las I 1 comparaciones indepen-
dientes relativas a I medias sobre el mismo conjunto de datos. Esta tasa de error
puede ser mucho mayor que la tasa de error individual.
Ambas tasas de error estn relacionadas por las siguientes expresiones

= 1 (1 )
I1
, (3.46)
= 1 (1

)
1/(I1)
. (3.47)
Estas frmulas no son estrictamente vlidas cuando hay implicados contrastes no-
ortogonales. En estas situaciones, sin embargo, pueden utilizarse dichas ecuaciones obtenin-
dose resultados aproximados. En tales casos, la tasa global puede ser mayor que la indicada
por la ecuacin (3.46).
Para la ilustracin numrica, tomemos como nivel de signicacin individual 0.05 y
como valor de I, 5. Si las 5 medias poblacionales son iguales, la probabilidad de rechazar
incorrectamente una o ms de las 4 comparaciones ortogonales es

= 1 (1 0,05)
4
=
0,1854. Es decir, la tasa de error global es casi 4 veces mayor que la tasa individual.
Por otra parte, si tomamos

igual a 0.05, entonces = 1 (1 0,05)


0,25
= 0,01274.
Observamos que una tasa de error del experimento igual a 0.05 es mucho ms exigente
que una tasa de error individual de 0.05.
Aunque el experimentador se interesa en controlar todas las tasas de error y niveles
de conanza, es importante subrayar que el objetivo principal de los procedimientos de
comparaciones mltiples es informarse lo ms posible sobre las poblaciones, procesos o
fenmenos que intervienen en el experimento. Fijar unas tasas de error pequeas no es
el nico propsito de un experimento, es slamente una medida del grado de exigencia o
rigor de la metodologa estadstica empleada.
En muchos experimentos el investigador no sabe a priori los contrastes que le interesa
realizar, siendo despus de un anlisis preliminar de los datos cuando se descubren las
comparaciones de inters.
3.2.5. Mtodo de Sche para comparaciones mltiples
Sche (1953) propuso un mtodo para realizar cualquier contraste entre medias
de tratamientos. Dicho procedimiento no requiere que el modelo sea equilibrado.
3.2 Comparaciones mltiples de medias 31
Sea una familia de contrastes de la forma
C =

i
a
i

i
, (3.48)
el objetivo de este procedimiento es decidir, para cada uno de estos contrastes, entre las
hiptesis
H
0
: C = 0
H
1
: C = 0 .
(3.49)
El mtodo de Sche est basado en la construccin de intervalos de conanza para
todos los posibles contrastes de la forma (3.49). Estos intervalos tienen un nivel de con-
anza simultneo 1 , es decir, la probabilidad de que todos los intervalos sean correctos
simultneamente es igual a 1 . Sche demostr que dichos intervalos de conanza
tienen la siguiente expresin

C S{

C}
_
(I 1)F
;I1,NI
, (3.50)
donde las cantidades que intervienen son:

C es el estimador insesgado de C.
S{

C} es el estimador de la desviacin tpica del contraste


S{

C} =

S
2
R
I

i=1
a
2
i
n
i
, (3.51)
siendo

S
2
R
la varianza residual con N I grados de libertad.
Por consiguiente, se rechaza la hiptesis H
0
sobre un contraste C si el intervalo de
conanza para C

C S{

C}
_
(I 1)F
;I1,NI
,

C +S{

C}
_
(I 1)F
;I1,NI
(3.52)
no incluye al cero, es decir, si
|

C |> S{

C}
_
(I 1)F
;I1,NI
. (3.53)
32 Comparaciones mltiples
Para ilustrar el procedimiento, consideramos el ejemplo de referencia y suponemos que
los contrastes de inters son
C
2
=
1
+
3

5
y
C
3
=
4

5
Las estimaciones numricas de estos contrastes son

C
2
= y
1.
+ y
3.
y
4.
y
5.
= 50 + 48 47 45 = 6

C
3
= y
4.
y
5.
= 47 45 = 2
y sus errores tpicos, determinados usando la ecuacin (3.51), son
S{

C
2
} =

S
2
R
5

i=1
a
2
i
n
i
=
_
4,67
_
1
6
+
1
5
+
1
4
+
1
6
_
= 1,912
y
S{

C
3
} =

S
2
R
5

i=1
a
2
i
n
i
=
_
4,67
_
1
4
+
1
6
_
= 1,394 .
Por lo tanto, los intervalos de conanza son, respectivamente
I
2
=
_

C
2
S{

C
2
}
_
(I 1)F
0,05;I1,NI
,

C
2
+S{

C
2
}
_
(I 1)F
0,05;I1,NI
_
=
_
6 1,912
_
4F
0,05;4,21
, 6 + 1,912
_
4F
0,05;4,21
_
= (0,44 , 12,44) .
I
3
=
_

C
3
S{

C
3
}
_
(I 1)F
0,05;I1,NI
,

C
3
+S{

C
3
}
_
(I 1)F
0,05;I1,NI
_
=
_
2 1,394
_
4F
0,05;4,21
, 2 + 1,394
_
4F
0,05;4,21
_
= (2,69 , 6,69) .
Puesto que los intervalos I
2
e I
3
contienen al 0, se concluye que tanto C
2
=
1
+
3

5
, como C
3
=
4

5
no son signicativamente distintos de cero. En otras palabras,
existe evidencia para concluir, por una parte que las medias de los tratamientos uno y
tres, tomadas como grupo, no dieren signicativamente de las medias de los tratamientos
cuatro y cinco, tambin tomadas como grupo y por otra parte que no existe diferencia
signicativa entre los tratamientos cuatro y cinco.
3.3 Comparaciones entre los mtodos 33
3.3. Comparaciones entre los mtodos
En diversos textos se encuentran comentarios sobre las comparaciones entre los
distintos mtodos; entre otras referencias, se recomienda consultar Neter at al. (1990) y
Mason at al. (1989). A continuacin, presentamos aqu un resumen de ambos estudios.
Cuando slo se hacen comparaciones por parejas, el mtodo de Tukey conduce a
lmites de conanza ms estrechos que el mtodo de Sche, por lo cual el mtodo
de Tukey encontrar ms diferencias signicativas, siendo en este caso el mtodo
preferido. En cambio cuando los contrastes son ms complicados que la diferencia
de medias, es el mtodo de Sche el que tiene lmites de conanza ms estrechos.
El mtodo de Bonferroni es preferido al de Sche cuando el nmero de contrastes
es igual o menor que el nmero de niveles del factor.
Cuando el nmero de comparaciones por parejas es muy grande no se debe utilizar
el mtodo de Bonferroni, ya que el nivel de signicacin de cada comparacin puede
llegar a ser demasiado pequeo para considerarse de utilidad. En estas situaciones
los tests de rangos mltiples como Tukey, Newman-Keuls y Duncan ofrecen una
solucin de compromiso entre la tasa de error global deseada y una tasa de error
individual demasiado pequea y por tanto inaceptable. Estos mtodos son preferidos
en el sentido de producir intervalos de conanza ms estrechos.
El mtodo LSD de Fisher es el que proporciona ms diferencias signicativas; a
continuacin, le siguen los mtodos de Duncan y Tukey. Eligiremos uno u otro de-
pendiendo del riesgo que estemos dispuestos a correr al aceptar ms o menos diferen-
cias signicativas. Es decir, a aceptar como signicativas diferencias que no lo sean
(situacin no conservadora), o a aceptar menos diferencias signicativas de las que
realmente existan (situacin conservadora). Cramer y Swanson (1973), realizaron
estudios de simulacin por el mtodo de Montecarlo de los que concluyeron que el
procedimiento LSD es una prueba muy eciente para detectar diferencias verdaderas
entre las medias si se aplica despus que la prueba F del anlisis de la varianza re-
sult signicativa al 5 %. Tambin concluyeron que el procedimiento de intervalos
mltiples de Duncan es un buen mtodo para detectar diferencias reales.
El procedimiento de Tukey tiene un error tipo I menor que los correspondientes
errores de los tests de Newman-Keuls y de Duncan; es decir, es un test ms con-
servador. En consecuencia, el procedimiento de Tukey tiene menos potencia que los
procedimientos de Newman-Keuls o de Duncan.
Si se desea controlar la tasa de error individual, los mtodos LSD de Fisher y de
Duncan resultan apropiados. Facilitan ms proteccin de los errores de Tipo I que
34 Comparaciones mltiples
los otros mtodos y son menos conservadores que los procedimientos basados en la
eleccin de la tasa de global.
Si se desea controlar la tasa de error global, los mtodos ms tiles incluyen el test
de Bonferroni y procedimiento de Tukey. Ambas tcnicas tienen fuertes defensores.
El test de Bonferroni tiene la ventaja de utilizar un estadstico t, siendo su principal
desventaja, cuando se realizan un gran nmero de comparaciones, que el nivel de
signicacin individual se hace demasiado pequeo.
Existen otros procedimientos para hacer comparaciones mltiples. Algunos de ellos
estn designados para casos especiales, tales como para comparar tratamientos experi-
mentales con un tratamiento control.
3.4. Comparaciones de tratamientos con un Control
Estamos ante el caso de un experimento en el que uno de los tratamientos es un
control y el experimentador puede estar interesado en comparar los restantes tratamientos
con este control. Por tanto, slo deben realizarse I 1 comparaciones. Un procedimiento
que realiza dichas comparaciones fu desarrollado por Dunnett (1964).
Supongamos que el control es el tratamiento I. Entonces se desean probar las hiptesis
H
0
:
i
=
I
H
1
:
i
=
I
i = 1, 2, , I 1 .
(3.54)
El procedimiento de Dunnett es una modicacin de la prueba t. Para cada hiptesis
se calculan las diferencias que se observan entre las medias muestrales
| y
i.
y
I.
| i = 1, 2, , I 1 .
La pareja de medias
i
y
I
se consideran diferentes, a un nivel de signicacin conjunto
asociado a las I 1 comparaciones, si
| y
i.
y
I.
|> d
;I1,NI
_

S
2
R
_
1
n
i
+
1
n
I
_
, (3.55)
en donde la cantidad d
;I1,NI
se obtiene a partir de la Tabla VIII del Apndice C.
Para ilustrar la prueba de Dunnett, consideramos el ejemplo de referencia y aunque en
el desarrollo terico hemos dicho que el control es el ltimo tratamiento, la posicin que
3.4 Comparaciones de tratamientos con un Control 35
ocupe el control es arbitraria, por ello, en este ejemplo vamos a considerar que es la primera
posicin, el tratamiento 1. En dicho ejemplo, I=5, =21 y para un nivel de signicacin
del 5 % el valor de d
0,05;4,21
es 2.64. Por tanto, las diferencias crticas y observadas son,
respectivamente,
2 vs 1 : d
0,05;4,21
_
4,67
_
1
5
+
1
6
_
= 3,454 | y
2.
y
1.
|= 7
3 vs 1 : d
0,05;4,21
_
4,67
_
1
5
+
1
6
_
= 3,454 | y
3.
y
1.
|= 2
4 vs 1 : d
0,05;4,21
_
4,67
_
1
4
+
1
6
_
= 3,682 | y
4.
y
1.
|= 3
5 vs 1 : d
0,05;4,16
_
4,67
_
1
6
+
1
6
_
= 3,293 | y
5.
y
1.
|= 5
Observamos que las parejas de medias 2 vs 1 y 5 vs 1 resultan signicativamente
diferentes.
Al comparar tratamientos con un control es conveniente tomar ms observaciones para
el tratamiento de control que para los otros tratamientos. Como norma general, se debe
vericar que la razn n
I
/n
i
sea aproximadamente igual a la raz cuadrada del nmero
total de tratamientos. Es decir,
n
I
n
i

I .
Bibliografa utilizada
Garca Leal, J. & Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos.
Anlisis de la Varianza. Grupo Editorial Universitario.
Lara Porras, A.M. (2000). Diseo Estadstico de Experimentos, Anlisis de la Vari-
anza y Temas Relacionados: Tratamiento Informtico mediante SPSS Proyecto Sur
de Ediciones.

También podría gustarte