Está en la página 1de 33

Diseño Factorial: Análisis de Varianza Factorial

Marcelo Rodríguez G.
Ingeniero Estadístico - Magister en Estadística

Universidad Católica del Maule


Facultad de Ciencias Básicas
Ingeniería en Agronomía
Diseño Experimental
21 de marzo de 2011

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 1 / 33


Introducción

Denición (Análisis de Varianza Factorial)


El objetivo es investigar, en forma simultánea, los efectos que tienen varios
factores (variables independientes) sobre la variable dependiente. Todos los
niveles de un factor se combinan con todos los niveles de cualquier otro
para formar los tratamientos. Es posible evaluar los efectos individuales de
los factores sobre la variable dependiente y determinar el efecto causado
por sus interacciones. El modelo matemático sería

yijk = µ + αi + βj + (αβ)ij + εijk

Ejemplo
Suponga un diseño con dos factores el A y el B. El factor A tiene 2 niveles
(a = 2) y el factor B tiene 3 niveles (b = 3). Entonces existirían 6
tratamientos, cada uno formado por las combinaciones de estos niveles.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 2 / 33


Características de los datos

(Los datos)
La variable dependiente es cuantitativa.
Los factores son categóricos; pueden tener valores numéricos o valores
de cadena de hasta ocho caracteres.

(Supuestos)
Los datos son una muestra aleatoria de una población normal; en la
población, todas las varianzas de las casillas son iguales.
El análisis de varianza es robusto a las desviaciones de la normalidad,
aunque los datos deberán ser simétricos.
Para comprobar los supuestos, puede utilizar la prueba de
homogeneidad de varianzas y los grácos de dispersión por nivel.
También puede examinar los residuos y los grácos de residuos.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 3 / 33


Ejemplo: Cantidad de trigo cosechado

Variedad de trigo
El objetivo es determinar si existen diferencias Fertilizante 1 2 3
1 35 45 24
apreciables en la cantidad de trigo cosechado, 26 39 23
de entre 3 variedades y 2 tipos de fertilizantes. 38 39 36
Para el experimento se encontró una área muy 20 43 29
2 55 64 58
grande de siembra en la que las condiciones del 44 57 74
suelo eran, prácticamente, homogéneas. 68 62 49
64 61 69

El área fue dividida en 6 zonas de igual tamaño para las 6 combinaciones


de variedad de trigo y tipo de fertilizante. Para medir el error experimental,
cada zona se dividió a su vez en cuatro y cada una de éstas recibió el
mismo tratamiento. En el momento de la cosecha se observaron los datos
que aparecen en la tabla siguiente.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 4 / 33


Notación y Arreglo de los datos

B
A 1 2 ··· b Media t = a · b (n◦ de tratamientos)
1 y111 y121 ··· y1b1
y112 y122 ··· y1b2 n = t · r (tamaño de muestra)
.. .. .. ..
. . . . a b r
1 XXX
y11r y12r ··· y1br y= y
y 11 y 12 ··· y 1a y 1 n i =1 j =1 k =1 ijk
2 y211 y221 ··· y2b1
y212 y222 y2b2 r
.. ..
···
.. .. 1X
y ij  = y
r k =1 ijk
. . . .
y21r y22r ··· y2br
y 21 y 22 ··· y 2b y 2
.. .. .. .. .. .. b
. . . . . . 1X
y i  = y
a ya11
ya12
ya21
ya22
···
···
yab1
yab2
b j =1 ij 
.. .. .. .. a
. . . .
1X
ya1r ya2r yabr y j  = y
a i =1 ij 
···
..
y a1 y a2 . y ab y a
Media y 1 y 2 ··· y b y

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 5 / 33


Descomposición de la suma de cuadrados

(Suma de cuadrados total)


a X
b X
r
SCT = (yijk − y )2
X

i =1 j =1 k =1

(Suma de cuadrados de los tratamientos)


a X b X r
SCTR = (y ij  − y )2
X

i =1 j =1 k =1

(Suma de cuadrados del error)


SCE = SCT − SCTR

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 6 / 33


Descomposición de la suma de cuadrados

(Suma de cuadrados del factor A)


a X b X r
SCA = (y i  − y )2
X

i =1 j =1 k =1

(Suma de cuadrados del factor B)


a X b X r
SCB = (y j  − y )2
X

i =1 j =1 k =1

(Suma de cuadrados del factor A y B)


SCAB = SCTR − SCA − SCB

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 7 / 33


Ejemplo: Cantidad de trigo cosechado
Variedad de trigo (B)
Fertilizante (A) 1 2 3 Media
1 35 45 24
26 39 23
38 39 36
20 43 29
y 11 =29,75 y 12 =41,50 y 13 =28,00 y 1 =33,083
2 55 64 58
44 57 74
68 62 49
64 61 69
y 21 =57,75 y 22 =61,00 y 23 =62,50 y 2 =60,416
Media y 1 =43,75 y 2 =51,25 y 3 =45,25 y =46,75
2 X 3 X 4
SCT (yijk − 46, 75)2 = (35 − 46, 75)2 + (26 − 46, 75)2 + · · · + (69 − 46, 75)2 = 6042, 5
X
=
i =1 j =1 k =1
2 X 3 X 4
SCTR = (y ij  − 46, 75)2 = 4[(29, 75 − 46, 75)2 + (57, 75 − 46, 75)2 + · · · + (62, 50 − 46, 75)2 ] = 4961
X

i =1 j =1 k =1
SCE = 6042, 5 − 4961 = 1081, 5
2 X 3 X 4
SCA = (y i  − 46, 75)2 = 12[(33, 083 − 46, 75)2 + (60, 416 − 46, 75)2 ] = 4482, 6
X

i =1 j =1 k =1
2 X 3 X 4
SCB = (y j  − 46, 75)2 = 8[(43, 753 − 46, 75)2 + (51, 25 − 46, 75)2 + (45, 25 − 46, 75)2 ] = 252
X

i =1 j =1 k =1
SCAB = 4961 − 4482, 6 − 252 = 226, 3
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 8 / 33
Prueba de hipótesis

(Tabla de ANOVA)
Modelo Suma de Grados de Media Fc
cuadrados libertad cuadrática
SCA MCA
Factor A SCA a−1 MCA= FA =
(a − 1) MCE
SCB MCB
Factor B SCB b−1 MCB= FB =
(b − 1) MCE
SCAB MCAB
Interacción A y B SCAB (a − 1)(b − 1) MCAB= FAB =
(a − 1)(b − 1) MCE
SCE
Error SCE n − ab MCE=
(n − ab)
Total SCT n−1

(Hipótesis: Efecto atribuible al factor A)


H0 : µ1 = µ2 = · · · = µa v/s H1 : µi  6= µj  , para algún i , j
Reglas para el rechazo de H0 :
Fijar α y Rechace H0 si FA > F1−α (a − 1, n − ab)
Rechace H0 si valor-p < 0, 05, donde valor-p= 1 − P (F < FA ).
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 9 / 33
Prueba de hipótesis

(Hipótesis: Efecto atribuible al factor B)


H0 : µ1 = µ2 = · · · = µb v/s H1 : µi  6= µj  , para algún i , j
Reglas para el rechazo de H0 :
Fijar α y Rechace H0 si FB > F1−α (b − 1, n − ab)
Rechace H0 si valor-p < 0, 05, donde valor-p= 1 − P (F < FB ).

(Hipótesis: Efecto atribuible a la interacción entre A y B)


v/s
H0 : µij  +µ = µj  +µi  H1 : µij  +µ 6= µj  +µi  , para todo i , j
Reglas para el rechazo de H0 :
Fijar α y Rechace H0 si FAB > F1−α ((a − 1)(b − 1), n − ab)
Rechace H0 si valor-p < 0, 05, donde valor-p= 1 − P (F < FAB ).

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 10 / 33


Prueba de hipótesis
(Tabla de ANOVA)
Modelo Suma de Grados de Media Fc Valor−p
cuadrados libertad cuadrática
Fertilizante (A) 4482,667 1 4482,667 74,607 < 0, 01
Variedad (B) 252 2 126 2,097 [0, 10; 0, 25]
Interacción (A y B) 226,333 2 113,167 1,883 [0, 10; 0, 25]
Error 1081,5 18 60,083
Total 6042,5 23

Si α = 0, 05, entonces existen diferencias atribuibles al fertilizante,


pues FA = 74, 607 > F0,95 (1, 18) = 4, 41
Si α = 0, 05, entonces NO existen diferencias atribuibles a la variedad,
pues FB = 2, 097 < F0,95 (2, 18) = 3, 55
Si α = 0, 05, entonces NO existen diferencias atribuibles al fertilizante
y variedad, pues FAB = 1, 883 < F0,95 (2, 18) = 3, 55
Note que sólo en el caso del fertilizante, el valor−p es menor que 0,05.
Esto indicaría que solo existiría un efecto atribuible a los fertilizantes.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 11 / 33
Ejemplo de un ANOVA factorial en SPSS

(Ejemplo de un ANOVA factorial en SPSS)


En SPSS, Analizar -> Modelo lineal general -> Univariante.
1 Seleccionar la variable dependiente y trasladarla al cuadro Variable
dependiente.
2 Seleccionar tanto las variables-factores y trasladarlas a la lista
Factores jos.
3 Luego, Aceptar.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 12 / 33


Ejemplo de un ANOVA factorial en SPSS
Puede descargar los datos desde http://bit.ly/trigo_factorial.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 13 / 33


Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 14 / 33


Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 15 / 33


Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 16 / 33


Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 17 / 33


Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 18 / 33


Ejemplo de un ANOVA factorial en SPSS

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 19 / 33


Ejemplo de un ANOVA factorial en SPSS

Estadísticos descriptivos
Variable dependiente:Cantidad
Fertilizante Variedad de trigo Desviación
Media típica N
1 1 29,75 8,261 4
2 41,50 3,000 4
3 28,00 5,944 4
Total 33,08 8,361 12
2 1 57,75 10,658 4
2 61,00 2,944 4
3 62,50 11,210 4
Total 60,42 8,479 12
Total 1 43,75 17,376 8
2 51,25 10,780 8
3 45,25 20,226 8
Total 46,75 16,209 24

Contraste de Levene sobre la igualdad de


a
las varianzas error

Se entregarán los promedios y desviaciones estándar para cada tratamiento


Variable dependiente:Cantidad

(combinaciones de los3,471niveles 5de los18 factores), estos indicadores, nos


F gl1 gl2 Sig.
,023

permiten tener una visión general de laa comparación


Contrasta la hipótesis nula de que la varianza
error de la variable dependiente
largo de todos los grupos.
es igual lo de las medias.
a. Diseño: Intersección + Fertilizante +
Variedad + Fertilizante * Variedad

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 20 / 33


2 61,00 2,944 4

Ejemplo de un ANOVA factorial en SPSS


3 62,50 11,210 4
Total 60,42 8,479 12
Total 1 43,75 17,376 8
2 51,25 10,780 8
3 45,25 20,226 8
Total 46,75 16,209 24

Contraste de Levene sobre la igualdad de


a
las varianzas error
Variable dependiente:Cantidad
F gl1 gl2 Sig.
3,471 5 18 ,023
Contrasta la hipótesis nula de que la varianza
error de la variable dependiente es igual a lo
largo de todos los grupos.
a. Diseño: Intersección + Fertilizante +
Variedad + Fertilizante * Variedad

Este método prueba la hipótesis de homogeneidad de varianzas, se debería


rechazar la hipótesis de que las varianzas (entre los grupos), son iguales, si
el valor−p es menor que 0,05. En este caso el valor−p = 0, 023, lo que
indicaría es que no se está cumpliendo el supuesto de homogeneidad.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 21 / 33


Ejemplo de un ANOVA factorial en SPSS

Pruebas de los efectos inter-sujetos


Variable dependiente:Cantidad
Origen Suma de
cuadrados Media
tipo III gl cuadrática F Sig.
a
Modelo corregido 4961,000 5 992,200 16,514 ,000
Intersección 52453,500 1 52453,500 873,012 ,000
Fertilizante 4482,667 1 4482,667 74,607 ,000
Variedad 252,000 2 126,000 2,097 ,152
Fertilizante * Variedad 226,333 2 113,167 1,883 ,181
Error 1081,500 18 60,083
Total 58496,000 24
Total corregida 6042,500 23
a. R cuadrado = ,821 (R cuadrado corregida = ,771)

Pruebas post hoc


Esta tablaVariedad
de ANOVA es la misma que encontramos anteriormente, note
de trigo
que sólo en el caso del fertilizante, el valor−p = 0, 000 es menor que 0,05.
Lo que indicaría que existe un efecto atribuible al fertilizante, en la
cantidad de trigo cosechado (se rechaza H0 : µ1 = µ2 ).
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 22 / 33
Ejemplo de un ANOVA factorial en SPSS

También se han solicitado las comparaciones múltiples, entre las variedades,


no se pide la comparación de los fertilizantes, pues son sólo dos y el
método anterior ya se concluyó que dieren. El método de Tukey utiliza
como MCE la MCE del ANOVA Factorial y no la del ANOVA un Factor.
Comparaciones múltiples
Cantidad
DHS de Tukey
(I)Variedad de trigo (J)Variedad de trigo Intervalo de confianza 95%
Diferencia de Límite
medias (I-J) Error típ. Sig. Límite inferior superior
1 2 -7,50 3,876 ,158 -17,39 2,39
3 -1,50 3,876 ,921 -11,39 8,39
2 1 7,50 3,876 ,158 -2,39 17,39
3 6,00 3,876 ,293 -3,89 15,89
3 1 1,50 3,876 ,921 -8,39 11,39
2 -6,00 3,876 ,293 -15,89 3,89
Basadas en las medias observadas.
El término de error es la media cuadrática(Error) = 60,083.

Subconjuntos homogéneos
El método indicaría que cuando se hacen las comparaciones de a pares en
las variedades, no existirían diferencias signicativas (valores−p >0,05).
Esto es lógico, pues la ANOVA nos había dicho lo mismo.
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 23 / 33
Ejemplo de un ANOVA factorial en SPSS
Estos grácos de medias son útiles para detectar efectos de interacción,
cuando la interacción es signicativa, las líneas tienden a cruzarse, de
manera muy marcada (en forma de X), en este caso existe una interacción,
pero no es signicativa (según el ANOVA, pues el valor−p = 0, 181).
Medias marginales estimadas de Cantidad Medias marginales estimadas de Cantidad
Variedad Fertilizante
de trigo
1
60 1 60
2
2
Medias marginales estimadas

Medias marginales estimadas


3
50 50

40 40

30
30

1 2 1 2 3
Variedad de trigo
Fertilizante

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 24 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
los supuestos de los residuos
Se ha solicitado que SPSS entregue los valores pronosticados
(PRED1 =promedio del tratamiento) por el modelo y los Residuos
(RES1 =distancia entre el valor real y el valor pronosticado).

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 25 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
los supuestos de los residuos
Existen 6 tratamiento, se ha creado una nueva columna con los
tratamientos.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 26 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
los supuestos de los residuos

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 27 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
los supuestos de los residuos

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 28 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
los supuestos de los residuos

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 29 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
los supuestos de los residuos

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 30 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
[Conjunto_de_datos1] C:\Users\13865271\Desktop\trigo factorial2.sav
los tratamientos
supuestos de los residuos
SPSS entrega la prueba de Kolmogorov-Smirnov y la prueba de
Resumen del procesamiento de los casos
tratamientos Casos
Shapiro-Wilk, la cual se utiliza cuando n ≤Perdidos
Válidos 50, en caso contrario
Total se
utiliza la prueba de Kolmogorov-Smirnov.
N Porcentaje N
Ambos métodos
Porcentaje N
son para
Porcentaje
Residuo para Cantidad 1 4 100,0% 0 ,0% 4 100,0%
vericar el supuesto2 de normalidad. 4 100,0% 0 ,0% 4 100,0%
Utilizando la prueba 3 de Shapiro-Wilk,
4 100,0% para 0cada tratamiento
,0% 4 el100,0%
valor−p (sig.) es mayor 4
que4 0,05. Entonces,
100,0% 0
no se,0%puede 4rechazar100,0%
la
5 4 100,0% 0 ,0% 4 100,0%
hipótesis de normalidad. 6 4 100,0% 0 ,0% 4 100,0%

Pruebas de normalidad
a
tratamientos Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Residuo para Cantidad 1 ,237 4 . ,939 4 ,650
2 ,298 4 . ,849 4 ,224
3 ,250 4 . ,900 4 ,430
4 ,221 4 . ,950 4 ,716
5 ,250 4 . ,953 4 ,734
6 ,219 4 . ,959 4 ,771
a. Corrección de la significación de Lilliefors

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 31 / 33


Ejemplo de un ANOVA factorial en SPSS: Vericación de
los supuestos de los residuos
Esta prueba de hipótesis ya fue entregada por SPSS, es la misma prueba de
hipótesis de homogeneidad de varianza (Prueba de Levene basado en la
media) entregada anteriormente y la conclusión sería la misma: Rechazar el
supuesto de homogeneidad (valor−p = 0, 023 < 0, 05).
15,00

Prueba de homogeneidad de la varianza 10,00

Estadístico de

Residuo para RES_1


Levene gl1 gl2 Sig. 5,00

Residuo para Cantidad Basándose en la media 3,471 5 18 ,023


0,00
Basándose en la 2,984 5 18 ,039
mediana.
-5,00
Basándose en la mediana 2,984 5 11,393 ,059
y con gl corregido
-10,00
Basándose en la media 3,464 5 18 ,023
recortada -15,00

1 2 3 4 5 6
tratamiento
Residuo para Cantidad
Hay que
Gráficos Q-Qser cautelosos con el supuesto de homogeneidad, pues si utilizamos
normales
el estadístico de Levene basado en la mediana con gl corregido , podríamos
asumir el supuesto de homogeneidad (valores−p = 0, 059 > 0, 05).
mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 32 / 33
¾Qué hacer si no se cumplen los supuestos de normalidad u
homogeneidad?

Cuando no se cumplen los supuestos de normalidad u homogeneidad, se


recomienda transformar la variable dependiente, algunas transformaciones
clásicas son: Logarítmica (y = ln(x )), Exponencial (y = exp(x )), Inversa
(y = 1/x ), etc.

mrodriguez@ucm.cl (UCM) Diseño Factorial 21/03/2011 33 / 33

También podría gustarte