P. 1
5 - Diseño Factorial

5 - Diseño Factorial

|Views: 2.471|Likes:
Curso de Diseño experimental. Diseño Factorial. Para estudiantes de Ciencias Agrarias y Forestales.
Curso de Diseño experimental. Diseño Factorial. Para estudiantes de Ciencias Agrarias y Forestales.

More info:

Published by: Marcelo Rodriguez Gallardo on May 30, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

06/17/2015

pdf

text

original

Diseño Factorial: Análisis de Varianza Factorial

Marcelo Rodríguez G. Ingeniero Estadístico - Magister en Estadística
Universidad Católica del Maule Facultad de Ciencias Básicas Ingeniería en Agronomía

Diseño Experimental

21 de marzo de 2011

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

1 / 33

Introducción
Denición (Análisis de Varianza Factorial)
El objetivo es investigar, en forma simultánea, los efectos que tienen varios factores (variables independientes) sobre la variable dependiente. Todos los niveles de un factor se combinan con todos los niveles de cualquier otro para formar los tratamientos. Es posible evaluar los efectos individuales de los factores sobre la variable dependiente y determinar el efecto causado por sus interacciones. El modelo matemático sería

yijk = µ + αi + βj + (αβ)ij + εijk

Ejemplo
Suponga un diseño con dos factores el A y el B. El factor A tiene 2 niveles (a = 2) y el factor B tiene 3 niveles (b = 3). Entonces existirían 6 tratamientos, cada uno formado por las combinaciones de estos niveles.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 2 / 33

Características de los datos
(Los datos)
La variable dependiente es cuantitativa. Los factores son categóricos; pueden tener valores numéricos o valores de cadena de hasta ocho caracteres.

(Supuestos)
Los datos son una muestra aleatoria de una población normal; en la población, todas las varianzas de las casillas son iguales. El análisis de varianza es robusto a las desviaciones de la normalidad, aunque los datos deberán ser simétricos. Para comprobar los supuestos, puede utilizar la prueba de homogeneidad de varianzas y los grácos de dispersión por nivel. También puede examinar los residuos y los grácos de residuos.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 3 / 33

Ejemplo: Cantidad de trigo cosechado
Variedad de trigo 1 2 3 35 45 24 26 39 23 38 39 36 20 43 29 55 64 58 44 57 74 68 62 49 64 61 69

El objetivo es determinar si existen diferencias apreciables en la cantidad de trigo cosechado, de entre 3 variedades y 2 tipos de fertilizantes. Para el experimento se encontró una área muy grande de siembra en la que las condiciones del suelo eran, prácticamente, homogéneas.

Fertilizante 1

2

El área fue dividida en 6 zonas de igual tamaño para las 6 combinaciones de variedad de trigo y tipo de fertilizante. Para medir el error experimental, cada zona se dividió a su vez en cuatro y cada una de éstas recibió el mismo tratamiento. En el momento de la cosecha se observaron los datos que aparecen en la tabla siguiente.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 4 / 33

Notación y Arreglo de los datos
A 1 1 . . . 2 . . . B
··· ··· ···

y111 y112 y11r y 11 y211 y212 y21r y 21 ya11 ya12
. . . ya1r . . . . . .

y121 y122 y12r y 12 y221 y222 y22r y 22 ya21 ya22
. . . ya2r . . . . . .

. . .

y1b1 y1b2 y1br y 1a y2b1 y2b2 y2br y 2b yab1 yab2
. . . yabr . . . . . . . . .

b

Media

t = a · b (n◦ de tratamientos) n = t · r (tamaño de muestra) y= y n i =1 j =1 k =1 ijk
1 1
a b r

2

··· ··· ··· ···

y1

. . . . . . . . . . . .

a

. . .

··· ··· ··· ··· ··· ···
(UCM)

y ij =
y2
. . .

y r k =1 ijk
b

r

yi = yj =

y b j =1 ij
1

1

Media

y a1 y1

y a2 y2

y ab yb

ya y
Diseño Factorial

y a i =1 ij
21/03/2011 5 / 33

a

mrodriguez@ucm.cl

Descomposición de la suma de cuadrados
(Suma de cuadrados total)
SCT =
a b r i =1 j =1 k =1
(yijk − y )2

(Suma de cuadrados de los tratamientos)
SCTR =
a b r i =1 j =1 k =1
(y ij − y )2

(Suma de cuadrados del error)
SCE = SCT − SCTR
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 6 / 33

Descomposición de la suma de cuadrados
(Suma de cuadrados del factor A)
SCA =
a b r i =1 j =1 k =1
(y i − y )2

(Suma de cuadrados del factor B)
SCB =
a b r i =1 j =1 k =1
(y j − y )2

(Suma de cuadrados del factor A y B)
SCAB = SCTR − SCA − SCB
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 7 / 33

Ejemplo: Cantidad de trigo cosechado
Fertilizante (A) 1 Variedad de trigo 1 2 35 45 26 39 38 39 20 43 y 11 =29,75 y 12 =41,50 55 64 44 57 68 62 64 61 y 21 =57,75 y 22 =61,00 y 1 =43,75 y 2 =51,25 (B) 3 24 23 36 29 y 13 =28,00 58 74 49 69 y 23 =62,50 y 3 =45,25 Media

2

y 1 =33,083

Media SCT SCTR SCE SCA SCB SCAB
2 3 4

y 2 =60,416 y =46,75

=

i =1 j =1 k =1
2 3

(yijk − 46, 75)2 = (35 − 46, 75)2 + (26 − 46, 75)2 + · · · + (69 − 46, 75)2 = 6042, 5

(y ij − 46, 75)2 = 4[(29, 75 − 46, 75)2 + (57, 75 − 46, 75)2 + · · · + (62, 50 − 46, 75)2 ] = 4961 i =1 j =1 k =1 = 6042, 5 − 4961 = 1081, 5 =
2 3 4

4

=

i =1 j =1 k =1
2 3 4

(y i − 46, 75)2 = 12[(33, 083 − 46, 75)2 + (60, 416 − 46, 75)2 ] = 4482, 6

=

(y j − 46, 75)2 = 8[(43, 753 − 46, 75)2 + (51, 25 − 46, 75)2 + (45, 25 − 46, 75)2 ] = 252 i =1 j =1 k =1 = 4961 − 4482, 6 − 252 = 226, 3
(UCM) Diseño Factorial 21/03/2011 8 / 33

mrodriguez@ucm.cl

Prueba de hipótesis
(Tabla de ANOVA)
Modelo Factor A Factor B Interacción A y B Error Total Suma de cuadrados SCA SCB SCAB SCE SCT Grados de libertad Media cuadrática SCA MCA= (a − 1) SCB MCB= (b − 1) SCAB MCAB= (a − 1)(b − 1) SCE MCE=
(n − ab)

Fc
MCA FA = MCE MCB FB = MCE MCAB FAB = MCE

a−1 b−1
(a − 1)(b − 1)

n − ab n−1

(Hipótesis: Efecto atribuible al factor A)
H0 : µ1 = µ2 = · · · = µa Reglas para el rechazo de H0 :

v/s

H1 : µi = µj ,

para algún i , j

Fijar α y Rechace H0 si FA > F1−α (a − 1, n − ab) Rechace H0 si valor-p < 0, 05, donde valor-p= 1 − P (F < FA ).
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 9 / 33

Prueba de hipótesis
(Hipótesis: Efecto atribuible al factor B)
H0 : µ 1 = µ 2 = · · · = µ b Reglas para el rechazo de H0 :

v/s

H1 : µ i = µ j ,

para algún i , j

Fijar α y Rechace H0 si FB > F1−α (b − 1, n − ab) Rechace H0 si valor-p < 0, 05, donde valor-p= 1 − P (F < FB ).

(Hipótesis: Efecto atribuible a la interacción entre A y B)
H0 : µij +µ = µ j +µi

v/s H1 : µij +µ = µ j +µi , para todo i , j Reglas para el rechazo de H0 : Fijar α y Rechace H0 si FAB > F1−α ((a − 1)(b − 1), n − ab) Rechace H0 si valor-p < 0, 05, donde valor-p= 1 − P (F < FAB ).

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

10 / 33

Prueba de hipótesis
(Tabla de ANOVA)
Modelo Fertilizante (A) Variedad (B) Interacción (A y B) Error Total Suma de cuadrados 4482,667 252 226,333 1081,5 6042,5 Grados de libertad 1 2 2 18 23 Media cuadrática 4482,667 126 113,167 60,083

Fc
74,607 2,097 1,883

Valor−p
< 0, 01 [0, 10; 0, 25] [0, 10; 0, 25]

Si α = 0, 05, entonces existen diferencias atribuibles al fertilizante, pues FA = 74, 607 > F0,95 (1, 18) = 4, 41 Si α = 0, 05, entonces NO existen diferencias atribuibles a la variedad, pues FB = 2, 097 < F0,95 (2, 18) = 3, 55 Si α = 0, 05, entonces NO existen diferencias atribuibles al fertilizante y variedad, pues FAB = 1, 883 < F0,95 (2, 18) = 3, 55 Note que sólo en el caso del fertilizante, el valor−p es menor que 0,05. Esto indicaría que solo existiría un efecto atribuible a los fertilizantes.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 11 / 33

Ejemplo de un ANOVA factorial en SPSS

(Ejemplo de un ANOVA factorial en SPSS)
En SPSS, Analizar -> Modelo lineal general -> Univariante.
1

2

3

Seleccionar la variable dependiente y trasladarla al cuadro Variable dependiente. Seleccionar tanto las variables-factores y trasladarlas a la lista Factores jos. Luego, Aceptar.

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

12 / 33

Ejemplo de un ANOVA factorial en SPSS
Puede descargar los datos desde http://bit.ly/trigo_factorial.

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

13 / 33

Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

14 / 33

Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

15 / 33

Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

16 / 33

Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

17 / 33

Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

18 / 33

Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

19 / 33

Ejemplo de un ANOVA factorial en SPSS
Estadísticos descriptivos Variable dependiente:Cantidad Fertilizante 1 Variedad de trigo Media 1 2 3 Total 2 1 2 3 Total Total 1 2 3 Total 29,75 41,50 28,00 33,08 57,75 61,00 62,50 60,42 43,75 51,25 45,25 46,75 Desviación típica 8,261 3,000 5,944 8,361 10,658 2,944 11,210 8,479 17,376 10,780 20,226 16,209 N 4 4 4 12 4 4 4 12 8 8 8 24

Variable dependiente:Cantidad Se entregarán los promedios y desviaciones estándar para cada tratamiento F gl1 gl2 Sig. (combinaciones de los3,471 niveles 5de los factores), estos indicadores, nos 18 ,023 Contrasta la hipótesis nula varianza permiten tener una visiónvariablegrupos. de que laigual a comparación de las medias. error de la general de la lo dependiente es largo de todos los a. Diseño: Intersección + Fertilizante + Variedad + Fertilizante * Variedad

Contraste de Levene sobre la igualdad de a las varianzas error

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

20 / 33

2 3

61,00 62,50 60,42 43,75 51,25 45,25 46,75

2,944 11,210 8,479 17,376 10,780 20,226 16,209

4 4 12 8 8 8 24

Ejemplo de un ANOVA factorial en SPSS
Total 1 2 3 Total Total

Contraste de Levene sobre la igualdad de a las varianzas error Variable dependiente:Cantidad F 3,471 gl1 5 gl2 18 Sig. ,023

Contrasta la hipótesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseño: Intersección + Fertilizante + Variedad + Fertilizante * Variedad

Este método prueba la hipótesis de homogeneidad de varianzas, se debería rechazar la hipótesis de que las varianzas (entre los grupos), son iguales, si el valor−p es menor que 0,05. En este caso el valor−p = 0, 023, lo que indicaría es que no se está cumpliendo el supuesto de homogeneidad.

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

21 / 33

Ejemplo de un ANOVA factorial en SPSS
Pruebas de los efectos inter-sujetos Variable dependiente:Cantidad Origen Suma de cuadrados tipo III 4961,000
a

gl 5 1 1 2 2 18 24 23

Media cuadrática 992,200 52453,500 4482,667 126,000 113,167 60,083

F 16,514 873,012 74,607 2,097 1,883

Sig. ,000 ,000 ,000 ,152 ,181

Modelo corregido Intersección Fertilizante Variedad Fertilizante * Variedad Error Total Total corregida

52453,500 4482,667 252,000 226,333 1081,500 58496,000 6042,500

a. R cuadrado = ,821 (R cuadrado corregida = ,771)

Esta tablaVariedad de trigo la misma que encontramos anteriormente, note de ANOVA es que sólo en el caso del fertilizante, el valor−p = 0, 000 es menor que 0,05. Lo que indicaría que existe un efecto atribuible al fertilizante, en la cantidad de trigo cosechado (se rechaza H0 : µ1 = µ2 ).
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 22 / 33

Pruebas post hoc

Ejemplo de un ANOVA factorial en SPSS
También se han solicitado las comparaciones múltiples, entre las variedades, no se pide la comparación de los fertilizantes, pues son sólo dos y el método anterior ya se concluyó que dieren. El método de Tukey utiliza como MCE la MCE del ANOVA Factorial y no la del ANOVA un Factor.
Comparaciones múltiples Cantidad DHS de Tukey (I)Variedad de trigo (J)Variedad de trigo Diferencia de medias (I-J) 1 2 3 2 1 3 3 1 2 -7,50 -1,50 7,50 6,00 1,50 -6,00 Error típ. 3,876 3,876 3,876 3,876 3,876 3,876 Sig. ,158 ,921 ,158 ,293 ,921 ,293 Intervalo de confianza 95% Límite inferior -17,39 -11,39 -2,39 -3,89 -8,39 -15,89 Límite superior 2,39 8,39 17,39 15,89 11,39 3,89

Basadas en las medias observadas. El término de error es la media cuadrática(Error) = 60,083.

El método indicaría que cuando se hacen las comparaciones de a pares en las variedades, no existirían diferencias signicativas (valores−p >0,05). Esto es lógico, pues la ANOVA nos había dicho lo mismo.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 23 / 33

Subconjuntos homogéneos

Ejemplo de un ANOVA factorial en SPSS
Estos grácos de medias son útiles para detectar efectos de interacción, cuando la interacción es signicativa, las líneas tienden a cruzarse, de manera muy marcada (en forma de X), en este caso existe una interacción, pero no es signicativa (según el ANOVA, pues el valor−p = 0, 181).
Medias marginales estimadas de Cantidad
Medias marginales estimadas de Cantidad

Variedad de trigo
60

Fertilizante
60

Medias marginales estimadas

50

Medias marginales estimadas

1 2 3

1 2

50

40

40

30

30

1 Fertilizante

2

1

2 Variedad de trigo

3

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

24 / 33

Ejemplo de un ANOVA factorial en SPSS: Vericación de los supuestos de los residuos
Se ha solicitado que SPSS entregue los valores pronosticados (PRED1 =promedio del tratamiento) por el modelo y los Residuos (RES1 =distancia entre el valor real y el valor pronosticado).

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

25 / 33

Ejemplo de un ANOVA factorial en SPSS: Vericación de los supuestos de los residuos
Existen 6 tratamiento, se ha creado una nueva columna con los tratamientos.

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

26 / 33

Ejemplo de un ANOVA factorial en SPSS: Vericación de los supuestos de los residuos

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

27 / 33

Ejemplo de un ANOVA factorial en SPSS: Vericación de los supuestos de los residuos

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

28 / 33

Ejemplo de un ANOVA factorial en SPSS: Vericación de los supuestos de los residuos

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

29 / 33

Ejemplo de un ANOVA factorial en SPSS: Vericación de los supuestos de los residuos

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

30 / 33

Ejemplo de un ANOVA factorial en SPSS: Vericación de [Conjunto_de_datos1] C:\Users\13865271\Desktop\trigo factorial2.sav los tratamientos de los residuos supuestos
SPSS entrega la prueba de Kolmogorov-Smirnov y la prueba de Casos tratamientos Shapiro-Wilk, la cual se utiliza cuando n ≤Perdidosen caso contrario se 50, Válidos Total N Porcentaje N Porcentaje N Porcentaje utiliza la prueba de Kolmogorov-Smirnov. Ambos métodos son para Residuo para Cantidad 1 4 100,0% 0 ,0% 4 100,0% vericar el supuesto de normalidad. 2 4 100,0% 0 ,0% 4 100,0% 3 4 100,0% ,0% 4 100,0% Utilizando la prueba de Shapiro-Wilk, para 0cada tratamiento el 4 4 100,0% 0 ,0% 4 100,0% valor−p (sig.) es mayor que 0,05. Entonces, no se puede rechazar la 5 4 100,0% 0 ,0% 4 100,0% hipótesis de normalidad. 4 100,0% 6 0 ,0% 4 100,0%
Resumen del procesamiento de los casos Pruebas de normalidad tratamientos Kolmogorov-Smirnov Estadístico Residuo para Cantidad 1 2 3 4 5 6 a. Corrección de la significación de Lilliefors
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 31 / 33
a

Shapiro-Wilk Sig. Estadístico ,939 ,849 ,900 ,950 ,953 ,959 gl 4 4 4 4 4 4 Sig. ,650 ,224 ,430 ,716 ,734 ,771

gl 4 4 4 4 4 4 . . . . . .

,237 ,298 ,250 ,221 ,250 ,219

Ejemplo de un ANOVA factorial en SPSS: Vericación de los supuestos de los residuos
Esta prueba de hipótesis ya fue entregada por SPSS, es la misma prueba de hipótesis de homogeneidad de varianza (Prueba de Levene basado en la media) entregada anteriormente y la conclusión sería la misma: Rechazar el supuesto de homogeneidad (valor−p = 0, 023 < 0, 05).
15,00

Prueba de homogeneidad de la varianza gl1 5 5 5 5 gl2 18 18 11,393 18 Sig. ,023 ,039 ,059 ,023
Residuo para RES_1

10,00 5,00 0,00 -5,00 -10,00

Estadístico de Levene Residuo para Cantidad Basándose en la media Basándose en la mediana. Basándose en la mediana y con gl corregido Basándose en la media recortada 3,471 2,984 2,984 3,464

-15,00 1 2 3 4 5 6

Residuo para Cantidad

tratamiento

Hay que ser cautelosos con el supuesto de homogeneidad, pues si utilizamos Gráficos Q-Q normales el estadístico de Levene basado en la mediana con gl corregido , podríamos asumir el supuesto de homogeneidad (valores−p = 0, 059 > 0, 05).
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 32 / 33

¾Qué hacer si no se cumplen los supuestos de normalidad u homogeneidad?

Cuando no se cumplen los supuestos de normalidad u homogeneidad, se recomienda transformar la variable dependiente, algunas transformaciones clásicas son: Logarítmica (y = ln(x )), Exponencial (y = exp(x )), Inversa (y = 1/x ), etc.

mrodriguez@ucm.cl

(UCM)

Diseño Factorial

21/03/2011

33 / 33

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->