Está en la página 1de 4

ANALISIS DE VARIANZA (ANOVA) Consideremos que queremos comparar las medias de k poblaciones, cada una de las cuales se supone

que tiene la misma varianza. Tomemos, para estas poblaciones, muestras aleatorias independientes de tamaos n1, n2,.,nk, respectivamente. En general, si tenemos muestras aleatorias independientes de tamao nk tomadas de k poblaciones (tratamientos). El j-esimo valor de la i-esima poblacin se denota como xij, es decir: Poblacin 1: x11, x12, ., x1n1 Poblacin 2: x21, x22, ., x2n2 . . . Poblacin k: xk1, xk2, ., xknk y supondremos que las variables aleatorias correspondientes xij son independientes, tienen distribucin normal con medias respectivas i y la varianza comn 2 El procedimiento para contrastar la hiptesis de igualdad de medias en este contexto se denomina anlisis de la varianza de un factor. H0: 1=2= . =k Ha: cuando menos alguna medias son diferentes El paso lgico entonces sera construir un estimador de dicha media comn a partir de los datos mustrales. Una posible eleccin para tal estimador sera la media global de todas las observaciones mustrales. Es decir, la suma de todas las observaciones mustrales dividida por el nmero total de observaciones mustrales. Si n es el nmero total de observaciones mustrales, entonces, n = ni
i =1 K K

La media global de todas las observaciones mustrales se puede expresar como:


ij

x=

x
i =1 j =1

ni

n x
i =1

i i

T j = xij
i =1

ni

j = 1, 2, .., k

El contraste de igualdad de medias est basado en la comparacin de dos tipos de variabilidad de los miembros de la muestra. La primera es la variabilidad en torno a las medias individuales mustrales de los k grupos de observaciones. Ser conveniente referirnos a ella como la variabilidad dentro de los grupos. La segunda es la variabilidad entre las medias de los k grupos. Esta se denomina variabilidad entre grupos.

2 La variabilidad dentro de los grupos se calcula de la siguiente forma: SCi = ( xij xi ) j =1 2 La variabilidad total dentro de los grupos, o tratamientos, que denominaremos SCT = ( xij xi ) i =1 j =1 K ni

nk

La suma de los cuadrados de las discrepancias de todas las observaciones mustrales respecto a la media global. Dicha suma se denomina la suma de cuadrados total y se expresa STC = ( xij x ) 2
i =1 j =1 K ni

La suma total de cuadrados entre grupos,(suma de cuadrados del error), SCE, ponderaremos cada diferencia al cuadrado por el nmero de observaciones mustrales en el grupo correspondiente, quedando de la siguiente manera: SCE = ni ( xi x ) 2
i =1 K

De estas tres ecuaciones se cumple: STC = SCT+SCE adems el grado de libertad de cada una de ellas es la siguiente: n-1 = (k-1)+(n-k) La media de los cuadrados de los errores se definir, CME = grupos (tratamientos) se definir: CMT = SCT k 1 CMT CME SCE y la media de los cuadrados de los nk

El estadstico de prueba que se usara ser: Fp =

Se rechazara H0 si Fp Fk 1;nk ; o p(valor) < Todo esto se puede resumir en la siguiente tabla: Fuerte de Variacin tratamientos error Total Grados de Libertad k-1 n-k n-1 Suma de Cuadrados SCT SCE=STC-SCT STC Cuadrado s medios CMT CME F CMT/CME

Las formulas reducida de SCT y STC Ti T2 SCT = ( ) n i =1 ni


K 2 2 STC = ( xij ) i =1 j =1 K ni

T2 n

Ejemplo 1: Las siguientes cantidades representan las palabras por minuto que mecanografi, en varias ocasiones, una secretaria en cuatro mquinas de escribir distintas: Mquina 1 71 75 69 77 61 72 71 78 ni 8 total 574 Ti2 329476 Mquina 2 68 71 74 66 69 67 70 62 8 485 235225 Mquina 3 75 70 81 73 78 72 Mquina 4 62 59 71 68 63 65 72 60 64 9 388 150544

6 449 201601

Demostrar si las diferencias entre las cuatro medias de la muestra se pueden atribuir al azar
One-way ANOVA: Mquina 1; Mquina 2; Mquina 3; Mquina 4
Analysis of Variance Source DF SS Factor 3 412,6 Error 27 543,1 Total 30 955,7 Level Mquina Mquina Mquina Mquina N 8 8 6 9 Mean 71,750 68,375 74,833 64,889 4,485 MS 137,5 20,1 F 6,84 P 0,001

StDev 5,365 3,583 4,070 4,595

Pooled StDev =

Individual 95% CIs For Mean Based on Pooled StDev -------+---------+---------+--------(------*-----) (------*-----) (-------*------) (-----*-----) -------+---------+---------+--------65,0 70,0 75,0

Luego se rechaza la hiptesis nula Conclusin: Hay diferencias entre las medias.

Ejemplo 2: Se desea comparar la accin de limpieza de tres detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de ropa blanca manchada con tinta de la India y despus lavada con los detergentes respectivos en una lavadora: Detergente A: 77, 81, 71, 76, 80 Detergente B: 72, 58, 74, 66, 70 Detergente C: 76, 85, 82, 80, 77 Pruebe en el nivel de significacin del 1% si las diferencias entre las medias de los registros de blancura son significativas Solucin. H0: Las medias entre los tres detergentes son iguales Ha: Cuando menos una de ellas es diferente. Fuerte de Variacin tratamientos error Total Grados de Libertad 2 12 14 Suma de Cuadrado s SCT=390 SCE=276 STC=666 Cuadrados medios CMT=360/2=195 CME=276/12=23 F CMT/CME=195/23= 8,48

p(valor)=0,0050617 es menor que = 0,01 Se rechaza H0 Conclusin: Los tres detergentes no son igualmente efectivos.