Está en la página 1de 15

Capitulo 8. Pruebas estadsticas 8.

1 Introduccin Existen pruebas estadsticas que por lo general son utilizadas para verificar la homogeneidad de las varianzas y comparar pares de medias. El test de Bonferroni, los test estadsticos de igualdad de varianza, la comparacin entre medias, los mtodos de comparacin de pares de media de tratamientos, as, el test de Tukey, el test de T de Student, el test de la amplitud Mltiple de Duncan y el anlisis de varianza son los ms usados en el anlisis de experimentos. 8.2 Mtodo de Bonferroni El modelo para el estudio del anlisis de varianza con un nico factor es dado por: (8.1) Se sabe que los estimadores de la media y de los efectos de los tratamientos son dados por: (8.2)

(8.3)

Y el intervalo de confianza para la media del i-simo tratamiento es dado por:

(8.4)

El intervalo de confianza para la diferencia entre las medias de dos tratamientos, es dado por:

(8.5)

Los intervalos de confianza, expresados por las ecuaciones (8.4) y (8.5) son intervalos considerados como uno de cada vez. O sea, el nivel de confianza, una estimativa en particular. , se aplica solamente a

70

Muchas veces, es esta interesado en determinar confianza. La probabilidad de que . La probabilidad implica que a medida que

intervalos de inters, con

de

intervalos estn simultneamente correctos es en el mnimo

frecuentemente es llamada de coeficiente global de confianza. Eso aumenta, el nivel de confianza del conjunto de intervalos de confianza en las ecuaciones

disminuye. Con la finalidad de contornear ese problema, en vez de usar (8.4) y (8.5), debe usarse

. Ese procedimiento es conocido como el mtodo de Bonferroni, intervalos simultneos de confianza

permitiendo al experimentalista construir un conjunto de

para las medias de los tratamientos o para la diferencia entre las medias de los tratamientos para los cuales el nivel global de confianza es en lo mnimo Al final de cualquier planeamiento, se precisa verificar la adecuacin del modelo matemtico obtenido y la validad de las suposiciones hechas.

8.3 Test estadsticos para la igualdad de la varianza Aunque la desigualdad de varianza puede ser evaluada por el anlisis de los grficos de los residuos, existen pruebas estadsticas que son ms precisos. Una prueba bastante usada es la prueba de Bartlett. El test calcular una estadstica, cuya distribucin de la muestra es bien aproximada por la distribucin libertad, cuando las , con ( ) grados de

muestras aleatorias fueran provenientes de poblaciones normales

independientes. La estadstica de prueba es dada por:

(8.6) Donde:

(8.7)

(8.8)

71

(8.9)

Siendo,

la varianza de la muestra de la i-esima poblacin. La cantidad

es grande

cuando las varianzas mustrales fueran iguales. As, rechazamos rechazaremos distribucin , con solamente si

difieren mucho; siendo igual a cero cuando todas las si los valores de ; siendo fueran muy grandes; o sea, el punto porcentual superior de la

grados de libertad.

El inconveniente de la prueba de Bartlett es el hecho de ser muy sensible a la suposicin de la normalidad. Luego de existir alguna duda con relacin a esa suposicin, el test no debe ser usado. Existen otros test estadsticos para la igualdad de varianza, tal como el test modificado de Levene, que es un procedimiento muy bueno y robusto cuando hay desvos en la normalidad. El test usa el desvo absoluto de las observaciones del tratamiento, . Los desvos son dados por: en cada tratamiento en relacin a la mediana

(8.10) La prueba modificada de Levene evala si la media de esos desvos son o no iguales para todos los tratamientos. Si los desvos medios fueran iguales, las varianzas de las observaciones en todos los tratamientos sern las mismas. La estadstica de prueba usada en el test de Levene es una usual estadstica F, usada para testar la igualdad de medias, aplicada a los desvos absolutos.

8.4 Comparaciones entre medias Lo que se ha presentado en los puntos anteriores, en el anlisis de varianza, es determinar si hay globalmente diferencia entre las medias de los tratamientos. Eso quiere decir que no se sabe exactamente que media difiere. Los procedimientos usados para comparar grupos de medias o medias individuales es el llamado de mtodos de comparacin mltiple.

72

8.4.1 Mtodos grficos de comparacin Las medias de la resistencia pueden ser colocadas en una lnea para cada valor del tenor de algodn, conforme mostrado en la Fig. 8.1, analizando esa figura, se tiene una idea cualitativa de que medias tienen o no valores aproximadamente iguales.

Figura 8.1 Medias de las resistencias, como una funcin del tenor de algodn (Montgomery, 2001)

8.4.2 Contrastes

Como se observa, existen diferencias entre las medias de los tratamientos, pero no se sabe exactamente entre cuales ocurre esa estadstica.

Imaginemos que se quiera mostrar que no existe diferencia entre los tratamientos 4 y 5; o sea:

(8.11) O tambin: (8.12)

Y que la media de los niveles ms bajos no difiera de la media de los niveles superiores:

(8.13)

O tambin: (8.14)

En general, un contraste es una combinacin lineal de parmetros de la forma:

73

(8.15)

Donde las constantes,

,.

de los contrastes deben sumar cero, esto es:

0, de esta forma, las hiptesis anteriores pueden ser expresadas como:

(8.16)

(8.17)

Las constantes para la ecuacin (8.16) son: constantes para la ecuacin (8.17) y

; .

; y las

La prueba de hiptesis envolviendo contrastes puede ser hecho de dos maneras bsicas. El primer mtodo usa el test t.

Escriba el contraste de inters en trminos de los totales de los tratamientos:

(8.18)

La varianza de

es

cuando los tamaos de las muestras en cada

tratamiento son iguales. Si la hiptesis nula en la ecuacin (8.16) fuera verdadera, la razn:

(8.19)

Tendr una distribucin N(0,1) como la varianza su estimativa, la media cuadrtica del error:

es generalmente desconocida, se usa

resultando en la estadstica de prueba:

(8.20)

La hiptesis nula, ser entonces rechazada si

74

La segunda manera usa el test F. el cuadrado de una variable aleatoria , con libertad, es una variable aleatoria F, con grados de libertad iguales a 1 y denominador respectivamente, as: (8.21)

grados de

, para el numerador y el

La hiptesis nula ser rechazada si

; otra forma de escribir la ecuac. (8.21)

(8.22)

(8.23)

En el caso de tratamientos con diferentes tamaos de muestra, los siguientes cambios deben ser hechos: (8.24)

(8.25)

(8.26)

8.4.3 Mtodos para la comparacin de pares de medias de tratamientos

La idea ahora es comparar todos los pares de medias de tratamientos, resultando las siguientes hiptesis: ; ; Para todo

Las pruebas que sern presentadas aqu, son utilizados despus que, a travs de un anlisis de varianza, fuera verificada la existencia de una diferencia global entre los tratamientos.

75

8.4.3.1 Test de Tukey Tukey (1953) propuso un procedimiento para testar la hiptesis nula, con siendo

exactamente el nivel global de significancia, cuando las muestras tienen tamaos iguales, y en el mximo , cuando las muestras tienen tamaos diferentes. El test de Tukey utiliza la distribucin de la estadstica de amplitud en la forma de Student

(8.27)

Siendo:

, la mayor y menor media respectivamente.

(8.28)

Siendo : el numero de grados de libertad, asociado con estadsticas.

,y

se halla en las tablas

Si el valor absoluto de la diferencia entre dos medias fuera mayor de ser rechazada. Para muestras con tamaos diferentes, la ecuacin (8.28) es modificada para:

entonces

debe

(8.29)

La versin para muestras de tamaos diferentes es a veces llamada de procedimiento de TukeyKramer.

8.4.3.2 Mtodo de la mnima diferencia significativa (LSD) de Fisher

La estadstica de prueba para la hiptesis:

es:

(8.30)

76

Un par de medias ser estadsticamente diferente, si:

(8.31)

Si las muestras tuvieran el mismo tamao; entonces:

(8.32)

Note que el riesgo global

, puede ser considerablemente aumentado usando este mtodo.

Especficamente en la medida que

aumenta, el error tipo I, del experimento entre el

nmero de experimentos en el cual un error de tipo I es hecho y el nmero total de experimentos se torna grande.

8.4.3.3 Test de la amplitud mltiple de Duncan

El test, desarrollado por Duncan (1955) es largamente utilizado para comparar pares de medias. Para el test de Duncan, las medias de los tratamientos (con el mismo tamao de muestras) son colocadas en orden creciente y el error estndar de cada media es determinado por:

(8.33)

En el caso de muestras con tamao diferentes, de las , quedando con:

debe ser cambiado por la media harmnica,

(8.34)

En las tablas estadsticas, se presentan los valores de las amplitudes . En el que es el nivel de significancia y .

para

es el nmero de grados de libertad

asociado a la media cuadrtica del error

77

Un conjunto de

amplitudes de mnima significancia deber ser obtenido, a travs de:

(8.35)

Las diferencias observadas entre las medias son probadas, comenzando con la mayor versus la menor y luego entonces comparadas con .

A seguir, una nueva diferencia entre las medias es calculada, comenzando con la prxima mayor versus la prxima menor, y entonces comparada con . El proceso continua hasta el

final. Si una diferencia observada fuera mayor que la correspondiente amplitud de mnima significancia, , se concluye que el par de medias en cuestin es estadsticamente diferente.

Para evitar contradiccin, ninguna diferencia entre un par de medias ser considerada significante, si esas dos medias envolvidas estuvieran entre dos medias que no difieran significativamente.

El test de Duncan es muy efectivo en detectar diferencias entre medias, cuando diferencias reales existen. Esa es la razn por la cual el test referido es bastante popular.

8.4.3.4 Mtodos para la comparacin de pares de medias de tratamiento

El modulo ANOVA de Statistica realiza todas estas pruebas de hiptesis a respecto de la igualdad de medias de los tratamientos. Supongamos que se desea unificar el efecto porcentual de algodn en la resistencia de un tejido, los siguientes datos experimentales fueron recogidos y colocados en una planilla que se presenta en la tabla 8.1.

78

Tabla 8.1 Base de datos del porcentaje de algodn en la resistencia de un tejido


concentracion(%) resistencia 15 7 15 7 15 15 15 11 15 9 20 12 20 17 20 12 20 18 20 18 25 14 25 18 25 18 25 19 25 19 30 19 30 25 30 22 30 19 30 23 35 7 35 10 35 11 35 15 35 11

Fuente: Montgomery (2001)

Accione el modulo del ANOVA del programa de Statistica, obteniendo la siguiente ventana tal como se presenta en la Fig. 8.1

Figura 8.1 Ventana del anlisis de ANOVA

Seleccione la opcin One-way ANOVA, visto que solo existe un factor para ser analizado. Luego presione OK y si se seleccionar las variables, la siguiente ventana surgir, tal como se presenta en la Fig.8.2.

79

Figura 8.2 Ventana para seleccionar All efects

El anlisis de varianza es obtenida rpidamente al seleccionarse la opcin All effects, resultando en la Fig.8.3.

Figura 8.3 Ventana del resultado del anlisis de varianza

Esa misma diferencia, con la barra de error, puede ser vista en forma grafica, escogindose la opcin. All effects/graphs y presionndose OK. Resultando en la Fig.8.4

80

"Var1"; LS Means Current effect: F(4, 20)=14,757, p=,00001 Effective hypothesis decomposition Vertical bars denote 0,95 confidence intervals 26 24 22 20

Resistencia

18 16 14 12 10 8 6 4 15 20 25 30 35 Porcentaj e de algodon(%)

Figura 8.4 Influencia del porcentaje de algodn sobre la resistencia del tejido

La media cuadrada del error (Fig.8.3) es 8,06. El test F muestra que hay una diferencia estadsticamente significativa entre los tratamientos. No se sabe por en cuanto, donde esta esa diferencia.

Se usan, entonces los test, ya referidos, seleccionndose la opcin More results, se obtiene la siguiente ventana, tal como se muestra en la Fig. 8.5;

Figura 8.5 Ventana de Anova

81

Las pruebas que se necesitan hacer se encuentran en la pasta Post-hoc que al ser seleccionada, resulta en la Fig.8.6:

Figura 8.6 Ventana de ANOVA

A partir de aqu, se selecciona el factor que se quiere analizar y presionando el test deseado, resultando una serie de ventanas dadas a continuacin, cada una siendo referente a un mtodo, tal como mostrado los resultados en las Figuras 8.7, 8.8, 8.9 y 8.10

Figura 8.7 Ventana del resultado con el mtodo de Fisher LSD

Figura 8.8 Ventana del resultado con el mtodo de Bonferroni

82

Figura 8.9 Ventana del resultado con el mtodo de Scheffe

Figura 8.10 Ventana del resultado con el mtodo de Tukey

Como visto anteriormente, no solo existe diferencia entre las medias de los tratamientos 2y3 y 1y5. El mtodo de Scheff presenta menos diferencias significativas que los dems mtodos.

Estos mtodos son validos si la varianza se muestra homognea. Entonces las pruebas vistas anteriormente deben ser hechas a fin de verificar si esa suposicin est siendo atendida para esos datos.

El programa de Statistica, realiza esas pruebas y se selecciona la pasta Assumptions, resultado en: las pruebas de Cochran, Hartley, Bartlett y Levene resultan en las ventanas dadas a continuacin y presentadas en las figuras 8.11 y 8.12 respectivamente.

Como el valor p fue mayor que 0,05; la hiptesis de homogeneidad es aceptada.

83

Figura 8.11 Ventana del test de Hartley, Cochran y Bartlett de homogeneidad de varianza

Figura 8.12 Ventana del test de Leven de homogeneidad de varianza

Otro grafico importante es aquel que relaciona la desviacin estndar (o varianza) con las medias de los tratamientos. No puede haber cualquier correlacin entre esas dos variables.

El grafico puede ser hecho en Statistica, si al seleccionar la opcin Plot means vs Std, deviations. Por la Fig 8.13, se percibe que no hay correlacin entre la desviacin estndar y la media de los tratamientos.

Means vs. Std.Dvs: Var2 Effect: "Var1" 3,4

3,2

3,0

Standard Deviations

2,8

2,6

2,4

2,2

2,0 8 10 12 14 16 Means 18 20 22 24

Figura 8.13 Relacin entre los desvos estndares y las medias

84