Está en la página 1de 37

Anlisis de varianza de un Factor

Marcelo Rodrguez G. Ingeniero Estadstico - Magister en Estadstica

Universidad Catlica del Maule Facultad de Ciencias Bsicas Ingeniera en Agronoma

Diseo Experimental

21 de marzo de 2011

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

1 / 37

Introduccin
Denicin (ANOVA de un Factor)
El mtodo de ANOVA de un Factor, es un mtodo de comparacin de medias que consiste en la comparacin de varios grupos (tratamientos) de una variable cuantitativa (variable dependiente).

(La hiptesis de investigacin)


Existe un efecto atribuible a los tratamientos. Estadsticamente sera,

H1 : i = j .

(La hiptesis nula)


El efecto de los tratamientos es el mismo. Estadsticamente sera,

H 0 : 1 = 2 = . . . t .
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 2 / 37

Modelo Estadstico
(Modelo completo de medias)
El modelo est dado por

yij

= + j + ij ,

i = 1, , r
donde:

j = 1, , t

r es el nmero de replicas y t el nmero de tratamientos. yij : i -sima observacin del j -simo tratamiento, j : media del j -simo tratamiento, j = j : Efecto sobre la respuesta del j -simo tratamiento, ij : i -simo error experimental del j -simo tratamiento.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 3 / 37

Modelo Estadstico

(Arreglo comn de los datos)


Tratamientos 1 2

y11 y21
. . .

y12 y22
. . .


. . .

y1t y2t
. . .

yr 1

yr 2

yrt

Considere:

yj

r i =1

yij

n =r t

yij

j =1 i =1

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

4 / 37

Ejemplo: Nociones del anlisis de varianza

Recuerde el problema de crecimiento bacterial. A cada conjunto de condiciones de empaque, se le asignaron, al azar, 5 cortes de carne. Se asume que los cortes forman un grupo homogneo. Se mide el nmero de bacterias por centmetro cuadrado.
Condiciones de empaque Al vacio (T1 ) 620 640 680 630 670 Mezcla de gases (T2 ) 730 720 690 680 670 100% CO2 (T3 ) 550 500 440 510 550

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

5 / 37

Ejemplo: Nociones del anlisis de varianza


Bacterias ( ij ) 620 640 680 630 670 730 720 690 680 670 550 500 440 510 550

Empaques Al vaco (1) Al vaco (1) Al vaco (1) Al vaco (1) Al vaco (1) Mezcla de gases (2) Mezcla de gases (2) Mezcla de gases (2) Mezcla de gases (2) Mezcla de gases (2) 100% CO2 (3) 100% CO2 (3) 100% CO2 (3) 100% CO2 (3) 100% CO2 (3)

y
618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67

yj
648 648 648 648 648 698 698 698 698 698 510 510 510 510 510 Suma

(yij y )2
1,78 455,11 3761,78 128,44 2635,11 12395,11 10268,44 5088,44 3761,78 2635,11 4715,11 14081,78 31921,78 11808,44 4715,11
108373,333

(y j y )2
860,44 860,44 860,44 860,44 860,44 6293,78 6293,78 6293,78 6293,78 6293,78 11808,44 11808,44 11808,44 11808,44 11808,44
94813,333

(yj y j )2
784,00 64,00 1024,00 324,00 484,00 1024,00 484,00 64,00 324,00 784,00 1600,00 100,00 4900,00 0,00 1600,00
13560,000

El modelo completo es

yij

= j + ij

donde

i = 1, 2, 3, 4, 5 y j = 1, 2, 3.

La variacin total sera 108373,333, este valor ser llamado SCT. El objetivo es descomponer esta variacin total es dos variaciones, una atribuible a los tratamientos y otra al error. La variacin atribuible a los tratamientos (entre grupos) sera 94813,333, este valor ser llamado SCTR. Si los al hay diferencias entre los tratamientos.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 6 / 37

y j , son muy similares y , entonces SCTR sera un valor pequeo, lo cual indicara que no

Ejemplo: Nociones del anlisis de varianza


La variacin atribuible al error (dentro del grupo) sera 13560,000, este valor ser llamado SCE. Esta es la variacin que existe entre cada dato y el promedio del tratamiento que fue aplicado (ij

= yij j ).

Note que se obtiene la siguiente descomposicin de la varianza 108373, 333 SCT

= 94813, 333 + 13560, 000 .


SCTR SCE

Para que exista un efecto atribuible a los tratamientos (promedio por tratamiento diferentes), la SCTR debera ser un valor grande en comparacin a SCT (la SCE debera ser pequea). El porcentaje que representa la SCTR de la SCT es SCTR SCT

100% = 87, 5%.

Como la SCTR representa el 87,5% de la variacin total (la SCE representa slo el 12,5% de la variacin total), entonces, al parecer, los promedios de los tratamientos son diferentes (efecto atribuible a los tratamientos).
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 7 / 37

Descomposicin de la suma de cuadrados


(Suma de cuadrados total)
t
SCT

=
j =1 i =1

(yij y )2

(Suma de cuadrados de los tratamientos)


t
SCTR

=
j =1 i =1

(y j y )2

(Suma de cuadrados de los errores)


t
SCE

=
j =1 i =1

(yij y j )2

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

8 / 37

Grados de libertad

(Relacin de la suma de cuadrados)


Las sumas de cuadrados se pueden descomponer mediante SCT

= SCTR + SCE

Ejemplo (Grados de libertad para las sumas de cuadrados)

nt Los grados de libertad para la SCT seran n 1 Los grados de libertad para la SCTR seran t 1
Los grados de libertad para la SCE seran

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

9 / 37

Media cuadrtica
Denicin (Media de cuadrtica)
Se dene como la suma de cuadrados promedio, con respecto al n grados de libertad.

o de

(Media cuadrtica de los tratamientos)


Es la variacin entre (inter-grupos) cada tratamiento. SCTR

MCTR

t 1

(Media de cuadrtica del error)


Es la variacin dentro (intra-grupos) de cada tratamiento. Tambin llamada estimacin de la varianza del error experimental. SCE

MCE
mrodriguez@ucm.cl (UCM)

nt
21/03/2011 10 / 37

ANOVA un Factor

Prueba de hiptesis
(Tabla de ANOVA)
Modelo Suma de cuadrados Tratamiento (Inter-grupos) Error (Intra-grupos) Total SCTR SCE SCT Grados de libertad Media cuadrtica MCTR MCE MCTR MCE

Fc

t 1 nt n1

(Hiptesis)
H0 : 1 = 2 = = t
v/s

H1 : i = j ,

para algn

i, j

(Reglas para el rechazo de H0 )


Fijar

y Rechace

H0

si

Fc

> F1 (t 1, n t )
donde valor-p=

Rechace

H0

si valor-p

< 0, 05,

P (F

> Fc ).
21/03/2011 11 / 37

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

Sumas de cuadrado, para diseos no balanceados


En los diseos no balanceados cada tratamiento puede tener un n

diferente de UE's asignadas ( j ). Tanto la prueba de hiptesis como la tabla ANOVA se mantiene, considerando los siguientes cambios:

(Sumas de cuadrado, para diseos no balanceados)


t
SCTR

rj

=
j =1 i =1 t rj

(y j y )2

SCT

=
j =1 i =1 t j =1

(yij y )2

donde;

yj

rj

rj i =1

yij

n=

rj

rj

yij
21/03/2011 12 / 37

j =1 i =1

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

Ejemplo de una ANOVA de un Factor en SPSS


Con

= 0, 05,

pruebe la hiptesis de que existe efecto atribuible a las v/s

condiciones de empaque. Las hiptesis seran

H0 : 1 = 2 = 3 = 4

H1 : i = j ,

para algn

i, j

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

13 / 37

Ejemplo de una ANOVA de un Factor en SPSS


Puede descargar los datos desde

http://bit.ly/carne_anova_1factor

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

14 / 37

Ejemplo de una ANOVA de un Factor en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

15 / 37

Ejemplo de una ANOVA de un Factor en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

16 / 37

Peso Segmentar archivo

<ninguno> <ninguno>

Ejemplo de una ANOVA de un Factor en SPSS


Nm. de filas del archivo de trabajo Definicin de los valores perdidos Casos utilizados 15 Tratamiento de los valores perdidos Los valores perdidos definidos por el usuario sern tratados como perdidos. Los estadsticos de cada anlisis se basan en los casos sin datos

Con
Sintaxis Recursos

= 0, 05,

perdidos para cualquier variablede en pruebe la hiptesis que existe efecto atribuible a las el anlisis. ONEWAY bacterias BY empaques

/STATISTICS condiciones de empaque. LasDESCRIPTIVES hiptesis seran /MISSING ANALYSIS.

H0 : 1 = 2 = 3 = 4
Tiempo de procesador Tiempo transcurrido Descriptivos Nmero de bacterias

v/s 00:00:00,008

00:00:00,000

H1 : i = j ,
750

para algn

i, j

[Conjunto_de_datos1] C:\Users\13865271\Desktop\carne.sav

Intervalo de confianza para la media al 95% N Al vacio Mezcla de gases 100% CO2 Total 5 5 5 15 Media 648,00 698,00 510,00 618,67 ANOVA Nmero de bacterias Suma de cuadrados Inter-grupos Intra-grupos Total 94813,333 13560,000 108373,333 gl 2 12 14 Media cuadrtica 47406,667 1130,000 Lmite inferior 615,86 665,86 453,78 569,94
95% IC Nmero de bacterias

700

Desviacin tpica 25,884 25,884 45,277 87,983

Lmite superior 680,14 730,14 566,22 667,39

650

600

550

500

F 41,953

Sig. ,000
450

Al vacio

Mezcla de gases Condiciones de empaques

100% CO2

Como

valor

Fc = 41, 953 > F0,95 (2, 12) = 3, 89 (o equivalentemente el p = 0, 000 < 0, 05) entonces, rechace H0 , en favor de H1 .
Pgina 13

Conclusin: Existe un efecto atribuible a las condiciones de empaque.


mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 17 / 37

Vericacin de Supuestos
Normalidad

Denicin (Kolmogorov-Smirnov)
Pruebas de signicacin permiten contrastar la hiptesis de que las muestras obtenidas proceden de poblaciones normales (simtricas conforma de campana). Se debe vericar que para cada tratamiento, los datos provienen de una poblacin con distribucin normal.

(Regla)
Se rechaza la hiptesis de normalidad si el valor p (sig.) es menor que 0,05.

En SPSS: Analizar -> Estadsticos Descriptivos -> Explorar -> Grcos -> Grcos con prueba de normalidad.

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

18 / 37

Ejemplo de vericacin de normalidad en SPSS


Verique si los datos de la supresin del crecimiento bacterial en carnes almacenadas, provienen de una distribucin normal (en cada condicin).

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

19 / 37

Ejemplo de vericacin de normalidad en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

20 / 37

Ejemplo de vericacin de normalidad en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

21 / 37

Ejemplo de vericacin de normalidad en SPSS


Pruebas de normalidad Condiciones de empaques Nmero de bacterias Al vacio Mezcla de gases 100% CO2 a. Correccin de la significacin de Lilliefors *. Este es un lmite inferior de la significacin verdadera. Kolmogorov-Smirnov Estadstico ,221 ,221 ,213 gl 5 5 5
a

Shapiro-Wilk Sig. ,200 ,200 ,200


* * *

Estadstico ,915 ,915 ,885

gl 5 5 5

Sig. ,501 ,501 ,332

Nmero de bacterias SPSS tambin entrega la prueba de Shapiro-Wilk, la cual se utiliza Grficos Q-Q normales cuando 50, en caso contrario se utiliza la prueba de

Kolmogorov-Smirnov. Ambos mtodos son para vericar el supuesto de normalidad. Utilizando la prueba de Kolmogorov-Smirnov, como en cada condicin de empaque el valor

p (sig.)

es 0,20 > 0,05. Entonces, no se puede

rechazar la hiptesis de normalidad. Si utilizamos la prueba de Shapiro-Wilk, la conclusin sera la misma, con la nica diferencia de que los valores
mrodriguez@ucm.cl (UCM) ANOVA un Factor

p no son los mismos.


21/03/2011

22 / 37

Vericacin de Supuestos
Homogeneidad de varianzas
Denicin (Prueba de Levene)
La prueba de Levene (1960) contrasta la hiptesis de que los grupos denidos por la variable factor proceden de poblaciones con la misma varianza (supuesto de homogeneidad de varianzas). Consiste en llevar a cabo una ANOVA de un factor utilizando como variable dependiente la diferencia en valor absoluto entre cada puntuacin individual y la media (o la mediana, o la media recortada) de su grupo.

(Regla)
Se Rechaza la hiptesis de homogeneidad, si el valor p (Sig.) es menor que 0, 05.

En SPSS: Analizar -> Estadsticos Descriptivos -> Explorar -> Grcos -> Dispersin por nivel con prueba de Levene -> No transformados.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 23 / 37

Ejemplo de vericacin de homogeneidad en SPSS


Verique si los datos de la supresin del crecimiento bacterial en carnes almacenadas, tiene varianzas iguales (entre cada condicin de empaque).

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

24 / 37

Ejemplo de vericacin de homogeneidad en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

25 / 37

Ejemplo de vericacin de homogeneidad en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

26 / 37

Ejemplo de vericacin de homogeneidad en SPSS


800

Prueba de homogeneidad de la varianza gl1 2 2 2 2 gl2 12 12 8,987 12 Sig. ,578 ,582 ,586 ,550
400

Nmero de bacterias

Basndose en la media Basndose en la mediana. Basndose en la mediana y con gl corregido Basndose en la media recortada

,573 ,567 ,567 ,628

Nmero de bacterias

Estadstico de Levene

700

600

500

Al vacio

Mezcla de gases Condiciones de empaques

100% CO2

Considere las hiptesis

2 = 2 = 2. H0 : 1 3 2

(varianzas iguales para las

distintas condiciones de empaque) Si consideramos la prueba de homogeneidad basado en la media, no podramos rechazar

H0 ,

pues el valor

p = 0, 578 > 0, 05.

Pgina 1

En el diagrama de caja, se nota esta armacin, por lo menos en el empaque al vaco y mezcla de gases.

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

27 / 37

Comparaciones Mltiples post hoc

Denicin (Comparaciones Mltiples)


Mtodo que permite comparar si existen diferencias signicativas entre un par me tratamientos

Si se asume que cada tratamiento proviene de una distribucin con la


misma varianza, comnmente se utiliza el

mtodo de Tukey (todas las comparaciones son referidas a la misma

diferencia mnima) o el
testigo.

mtodo de Dunnett (sirve para comparar todos los grupos con el

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

28 / 37

Mtodo de Tukey
Tukey (1949a) desarroll un procedimiento, para las comparaciones en pares de todas la medias de tratamiento, que se usa para obtener intervalos de conanza simultneos de 100(1

)%.

La prueba se conoce tambin

como diferencia honestamente signicativa. Todas las comparaciones son referidas a una misma diferencia mnima.

(Mtodo de Tukey para todas las comparaciones por pares)


Para un grupo de

medias de tratamiento, se calcula la diferencia

honestamente signicativa como:

DHS (t , ) = q (, t , n t )
absoluto de todas las diferencias por pares,

MCE r
para toda

Las estimaciones de los intervalos simultneos de dos lados para el valor

i j .

i <j

son:

y i y j DHS (t , ).
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 29 / 37

Mtodo de Tukey

(Mtodo de Tukey, para un nmero diferente de replicas)


Para un grupo de

medias de tratamiento, se calcula la diferencia

honestamente signicativa como:

DHS (t , ) = q (, t , n t )
absoluto de todas las diferencias por pares,

MCE
2

ri

rj

Las estimaciones de los intervalos simultneos de dos lados para el valor

i j .

para toda

i <j

son:

y i y j DHS (t , ).

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

30 / 37

Mtodo de Dunnett
(Mtodo de Dunnett para comparar todos los tratamientos con un control)
Para un grupo de tiene:

medias de tratamiento con un testigo (control), se

D (t 1, ) = d (, t 1, n t )

MCE

Las estimaciones de los intervalos de conanza simultneos bilaterales (dos colas) para las diferencias entre las medias de los tratamientos individuales y la media del tratamiento testigo

i c ,

son:

y i y c D (t 1, ).

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

31 / 37

Mtodo de Dunnett

(Mtodo de Dunnett, para un nmero diferente de replicas)


Para un grupo de

medias de tratamiento con un control, se tiene:

D (t 1, ) = d (, t 1, n t ) MCE

ri

rc

Las estimaciones de los intervalos de conanza simultneos bilaterales (dos colas) para las diferencias entre las medias de los tratamientos individuales y la media del control

i c ,

son:

y i y c D (t 1, ).

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

32 / 37

Ejemplo de la prueba comparaciones mltiples en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

33 / 37

Ejemplo de la prueba comparaciones mltiples en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

34 / 37

Ejemplo de la prueba comparaciones mltiples en SPSS

mrodriguez@ucm.cl

(UCM)

ANOVA un Factor

21/03/2011

35 / 37

Ejemplo de la prueba comparaciones mltiples en SPSS


Comparaciones mltiples Variable dependiente:Nmero de bacterias (I) Condiciones de empaques (J) Condiciones de empaques Intervalo de confianza al 95% Diferencia de medias (I-J) -50,000 138,000
*

Error tpico 21,260 21,260 21,260 21,260 21,260 21,260 21,260 21,260

Sig. ,086 ,000 ,086 ,000 ,000 ,000 ,065 ,000

Lmite inferior -106,72 81,28 -6,72 131,28 -194,72 -244,72 -3,20 -191,20

Lmite superior 6,72 194,72 106,72 244,72 -81,28 -131,28 103,20 -84,80

HSD de Tukey

Al vacio

Mezcla de gases 100% CO2

Mezcla de gases

Al vacio 100% CO2

50,000 188,000 -138,000 -188,000


* * *

100% CO2
a

Al vacio Mezcla de gases

t de Dunnett (bilateral)

Mezcla de gases 100% CO2

Al vacio Al vacio

50,000 -138,000
*

*. La diferencia de medias es significativa al nivel 0.05. a. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los dems grupos.

SPSS entrega los intervalos de conanza y valores Nmero de bacterias


N 1 2 HSD de Tukey 100% CO2 5 510,00 diferencias signicativas entre esos tratamientos. Al vacio 5 648,00
a

Subconjuntos homogneos

p. Cuando los

Condiciones de Subconjunto para alfa = 0.05 signos de los intervalos son diferentes, no se podra armar que existen empaques

Mezcla de gases 5 698,00 Por ejemplo, si consideramos el mtodo de Tukey y queremos Sig. 1,000 ,086 Se muestran las medias para los grupos en los subconjuntos homogneos. comparar el empaque al vaco con el de mezcla de gases, a. Usa el tamao muestral de la media armnica = 5,000.

IC0,95 (1 2 ) = (106, 72; 6, 72). Lo que indicara que no existen


diferencias en la cantidad de bacterias, entre estos dos empaques.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 36 / 37

Mezcla de gases t de Dunnett (bilateral)


a

-188,000

21,260 21,260 21,260

,000 ,065 ,000

-244,72 -3,20

-131,28 103,20 -84,80

Ejemplo de la prueba comparaciones mltiples en SPSS


Mezcla de gases 100% CO2 Al vacio Al vacio 50,000
*

-138,000

-191,20

*. La diferencia de medias es significativa al nivel 0.05.

a. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los dems grupos.

Subconjuntos homogneos
Nmero de bacterias Condiciones de empaques HSD de Tukey
a

Subconjunto para alfa = 0.05 N 5 5 5 1,000 1 510,00 648,00 698,00 ,086 2

100% CO2 Al vacio Mezcla de gases Sig.

Se muestran las medias para los grupos en los subconjuntos homogneos. a. Usa el tamao muestral de la media armnica = 5,000.

p H0 : 1 = 2 v/s H1 : 1 = 2 . No podramos rechazar la hiptesis nula (H0 ), pues el valorp = 0, 068 > 0, 05. Por otro lado, IC0,95 (1 3 ) = (81, 28; 194, 72), indicara que existen diferencias signicativas entre el empaque al vaco y de 100% de CO2 . (1 > 3 , pues el signo del intervalo es positivo). Equivalentemente, Deberamos rechazar la hiptesis nula (H0 : 1 = 3 ), pues el valorp = 0, 000 < 0, 05.
valor . Por ejemplo, si planteamos los hiptesis Tambin se presenta una tabla resumen, de sub-grupos homogneos (estadsticamente iguales).
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 37 / 37

La misma conclusin se obtiene si consideramos el criterio del

También podría gustarte