Está en la página 1de 3

METODO TUKEY

El método de Tukey se utiliza en ANOVA para crear intervalos de confianza para todas las
diferencias en parejas entre las medias de los niveles de los factores mientras controla la tasa
de error por familia en un nivel especificado.

Es importante considerar la tasa de error por familia cuando se hacen comparaciones múltiples,
porque la probabilidad de cometer un error de tipo I para una serie de comparaciones es mayor
que la tasa de error para cualquier comparación individual. Para contrarrestar esta tasa de error
más elevada, el método de Tukey ajusta el nivel de confianza de cada intervalo individual para
que el nivel de confianza simultáneo resultante sea igual al valor que usted especifique.

Se basa en la distribución del rango estudentizado que es la distribución que sigue la diferencia
del máximo y del mínimo de las diferencias entre la media muestral y la media poblacional de t
variables normales N(0, 1) independientes e idénticamente distribuidas.

Se establece así un umbral, como en otros métodos, como el Test LSD (Ver Herbario de técnicas).
Se calculan todas las diferencias de medias muestrales entre los t niveles del factor estudiado.
Las diferencias que estén por encima de ese umbral se considerarán diferencias significativas, las
que no lo estén se considerarán diferencias no significativas

max( 𝑌𝑖 − 𝜇𝑖) − min(𝑌𝑗 − 𝜇𝑗)


= 𝑞𝑡,𝑁−𝑡
√𝑆2𝑒
𝑛

𝑆 2𝑒
𝐻𝑆𝐷 = 𝑞𝑡,𝑁−𝑡 (𝛼) ∗ √
𝑛

Donde :

N= numero total de observaciones

T= numero de valores del factor

n= Tamaño muestrado de cada valor del factor

𝑆2𝑒
√ = Residual
𝑛

Yi – Yj = Medias muéstrales de los valores i y j

𝑞𝑡,𝑁−𝑡 (𝛼) = Distribución de rango


Observemos que el test está diseñado para el mismo tamaño muestral por nivel, por esto aparece
esta n común. Si tenemos tamaños muestrales distintos se toma entonces como n la media
armónica de esas medias. La media armónica de dos medias es la siguiente:

Para nuestro caso debería generalizarse a t medias simplemente sustituyendo el 2 por el número
t.

Para ver cómo funciona la distribución del rango estudentizado veamos una tabla donde se
buscarían estos valores:
Observemos que en la tabla hay un valor de el número de medias, en la nomenclatura seguida
por nosotros sería la t, los t niveles del factor. En la tabla le llama k. Los grados de libertad son el
N-t nuestro. La tabla da umbrales para dos niveles de significación alfa: 0.05 y 0.01.

Finalmente, para poder comparar esta técnica de comparaciones múltiples con las otras que
suelen utilizarse leer el artículo Comparación entre técnicas de comparaciones múltiples.

También podría gustarte