Está en la página 1de 4

COMPARACIONES MULTIPLES

Introducción.

El análisis de varianza es un procedimiento poderoso para probar la homogeneidad


(igualdad) de un conjunto de medias de poblaciones (o grupos). Sin embargo, si se rechaza la
hipótesis nula , de igualdad de medias, la prueba … no permite establecer cuáles de las medias
poblacionales son iguales y cuáles diferentes entre ellas. Se debe reiterar que mientras la
prueba t de Student sirve para comparar dos medias poblacionales, la prueba … del ANOVA
es una prueba que compara simultáneamente dos o más medias poblacionales, de modo que
con la prueba t se comete un error tipo I al rechazar la igualdad entre las dos medias cuando
éstas son verdaderamente iguales, mientras que con la prueba … el error tipo I es la
probabilidad de tener al menos una inferencia errónea de igualdad entre todos los pares de
medias.
Generalmente , el investigador desea ir más allá de la simple conclusión de que hay
diferencias entre las medias del conjunto, pues le interesa saber entre qué poblaciones (o
grupos) están las diferencias poblacionales en término de sus medias. Si se ha rechazado H0 ,
q q
es obvio que la máxima diferencia observada entre los promedios ( Ymax  Ymin ) debe
corresponder a una diferencia verdadera entre las ., pero ¿ qué puede decirse de las
diferencias entre los promedios intermedios?.
Para responder esta interrogante se han planteado diversos procedimientos
denominados Pruebas de Comparaciones Múltiples. Dentro de este tipo de pruebas las más
utilizadas son las correspondientes a las comparaciones de a pares, que consiste en tomar
todas las parejas posibles del conjunto de las t medias y realizar cada de esas
comparaciones, en total c œ ˆ 2 ‰ comparaciones de a dos, de la forma L" À .k Á .l .
t

Procedimiento.

Las diferentes pruebas propuestas difieren en el tipo de tasa de error utilizada para las
comparaciones (ver anexo para definiciones). También difieren en si son de rango fijo (un
valor único para efectuar todas las comparaciones) o de rango múltiple (varios valores para
efectuar las diferentes comparaciones).

Básicamente las pruebas consisten en calcular cada una de las c diferencias


q q
|Y . k  Y . l | y compararla con un valor crítico K(! , / ) É CME
r
, donde K es un valor de tabla
que depende de la distribución en que se basa la prueba utilizada, / son los grados de
libertad del error , ! el nivel de significación de la prueba y r el número de repeticiones
(observaciones por grupo).

Nos referiremos a cuatro de estas pruebas :


i) Prueba de Diferencias Mínimas Significativas (DMS)
ii) Prueba de Tukey
iii) Prueba de Rango Múltiple de Duncan
iv) Prueba de Dunnett

Prueba de Diferencias Mínimas Significativas (DMS).


Esta prueba también se podría denominar prueba t de Student múltiple, ya que el valor
K(! , / ) se obtiene de las tablas de la distribución t de Student , multiplicando por È2 el valor
percentil (1-!/2) de la distribución con / grados de libertad.
Esta prueba compara , al nivel ! especificado, cada una de las c œ ˆ 2t ‰ diferencias
con el valor crítico È 2 t1-!/2 (/ ) É CME .
r
La gran desventaja de esta prueba , que la hace no recomendable cuando se realiza un
número grande de comparaciones no planeadas, es que utiliza la tasa de error por
comparación , lo que se traduce en que no controla la tasa de error por familia, la que
puede alcanzar niveles muy altos. A manera de ejemplo , al comparar sólo 3 medias con un
! œ 0,05 la tasa anterior es aproximadamente igual a 0,13, con 10 medias la tasa puede llegar
a ser 0,60 , etc. (Cochran,W.G y Cox,G.M, 1957, citado por Steel/Torrie)

Prueba de Tukey.

El procedimiento de Tukey hace uso de la distribución del recorrido estudentizado


dada en la tabla q(!, /ß >) , donde t número de medias a comparar. La prueba de Tukey hace
uso de un único valor crítico q(!, /ß >) É CME
r
para realizar cada una de las comparaciones,
siendo pues de rango fijo.

Esta prueba tiene como sus principales ventajas en ser :


i) fácil de aplicar
ii)controla la tasa de error por familia , resultando en consecuencia una prueba
muy confiable.

La razón última hace que esta prueba sea muy conservadora , lo que constituye su
principal desventaja , reflejándose en que cuesta detectar diferencias significativas, en especial
en experimentos donde es difícil tener control local, como ocurre con bastante frecuencia en
ensayos de campo.

Prueba de Rango Múltiple de Duncan.

En investigaciones silvoagropecuarias es frecuente utilizar la Prueba de Rango Múltiple


de Duncan, pero siendo una prueba que se puede justificar bajo ciertas circunstancias en
ensayos de campo es una prueba fuertemente cuestionada por algunos estadísticos.
Sigue el mismo esquema de la prueba de S-N-K con la diferencia que se hace
mediante un valor crítico Q(!, /ß : ) É CME
r
, donde Q(!,/ ,p) es el valor percentil ! de la tabla
"Valores críticos de la nueva Prueba de Rango Múltiple de Duncan" (D.H.Duncan "Multiple
Range and Multiple F test ". Biometrics11: 1-42 (1955). ). Los valores Q de Duncan son
menores que los correspondientes q del rango estudentizado para los mismos grados de
libertad y amplitud. Esto hace que con la prueba de Duncan se obtengan más diferencias
significativas que con la de S-N-K, pero menos que con la de DMS. Ello se debe a que Duncan
utiliza el concepto de un !: el que define como nivel de protección.

Prueba de Dunnett.
Otra prueba conveniente de destacar es el procedimiento de Dunnett que es un buen
método cuando sólo se necesita comparar el tratamiento testigo con el resto de los
tratamientos , de esa manera se necesita un valor crítico menor que el que utiliza Tukey. Es
una modificación de la prueba t de Student y dado que el número de comparaciones a realizar
es mucho menor que las pruebas mencionadas anteriormente, resulta ser un método poderoso
para la situación descrita. En este caso el valor crítico es tDunnett (1- !, /ß : ) É 2‡CME
r
, con el
cual se comparan las : diferencias entre el testigo y el resto de los tratamientosÞ El valor
tDunnett (1- !, /ß : ) se obtiene de la tabla A.9 de Steel/Torrie.

Ejemplo.

Aplicaremos las pruebas explicadas antes, para comparar todos los pares de medias ,
solo con fines demostrativos y comparativos, a los datos del ejemplo ilustrativo de la unidad
Análisis de Varianza. El ANOVA nos entregó la siguiente información necesaria para esta
q q q q q
etapa: CME= 108 ; Y" = 52 ; Y# = 69 ; Y$ = 82 ; Y% = 85 ; Y5 = 94 y número de repeticiones común
a todas las variedades es 5.
q q q q q
Los promedios muestrales ordenados de mayor a menor son Y5 , Y% , Y$ , Y# e Y"
respectivamente. Las 10 comparaciones a realizar de cada variedad con las restantes se
muestran en la siguiente tabla en término de las 10 diferencias entre los promedios observados
q
Y. A continuación se deben comparar estas diferencias con el(los) valor(es) crítico(s) según la
prueba utilizada.

Variedad Promedio 52 69 82 85
5 94 42 25 12 9
4 85 33 16 3 -
3 82 30 13 -
2 69 17 -
1 52 -

1. Prueba de Tukey.
Para realizar esta prueba se debe calcular el valor crítico (V.C) a partir del CME, r y
q(0Þ05, 20, 5) = 4,23, según tabla del rango studentizado, luego V.C = 4,23 ‡ É 1085 = 19,66 y
las diferencias de la tabla que resultan ser mayores son 42 , 25 , 33 y 30 que corresponden a
diferencias entre .5 y .1 , .5 y .# , .% y ." , .3 y .1 , en total 4 diferencias.

2. Prueba de DMS (no recomendable).


En esta prueba se necesita el valor tabulado >!ß*(& Ð#!Ñ = 2,086, luego el valor crítico
(V.C = 2,086‡È#‡ É 108
5
) 13,71 es superado por las diferencias 42 , 25 , 33 , 16 , 30 y 17 que
corresponden a diferencias entre .5 y .1 , .5 y .# , .% y ." , .% y .# , .$ y ." , .# y ." en total 6
diferencias.

3. Prueba de Duncan.
En este caso se necesitan Q(0.05, 20, p) para p =2,3,4,5 , cuyos valores son
respectivamente 2,95 , 3,10 , 3,18 y 3,25 , resultando V.C de 13,71 ; 14,41 ; 14,78 y 15,10,
para amplitudes 2 , 3 , 4 y 5 respectivamente. Siguiendo el procedimiento descrito en S-N-K, se
obtienen diferencias entre .5 y .1 , .5 y .# , .% y ." , .% y .# , .$ y ." , .# y ." en total 6
diferencias., las mismas que con DMS, a pesar que sólo algunas diferencias se comparan con
el V.C. de 13,71, pues las otras se comparan con V.C. mayores.

La forma anterior de expresar las diferencias encontradas es algo confusa, razón por la
cual se utiliza un método en el cual los promedios (tratamientos) unidos por letras iguales
indican igualdad entre las ., como se muestra a continuación.

q
Variedad Promedio (Y.j ) P. Tukey P. S-N-K Š P.DUNCAN
P.DMS ‹
5 94 a a a
4 85 ab ab a
3 82 ab ab ab
2 69 bc b b
1 52 c c c
Promedios unidos con letras iguales indican diferencias estadísticamente no
significativas, según la Prueba.......(p € 0,05)

También podría gustarte