Está en la página 1de 74

Tema 2.

Modelos de dise
no de
experimentos (varios factores)

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

Introducci
on
Estudiaremos si un conjunto de factores (con dos o mas niveles
cada uno) influye sobre los valores medios de una variable
respuesta Y . Intentaremos determinar que factores influyen
realmente sobre Y .
Es importante el dise
no del experimento para asegurar la
homogeneidad dentro de cada poblaci
on y reducir el error
experimental.
Ejemplo 2.1: En 1973 la compa
na petrolfera Texaco informo al
Subcomite de Contaminaci
on Ambiental sobre la eficiencia del
filtro Octel para reducir la emisi
on de gases contaminantes en los
coches. Una de las posibles desventajas del filtro era que
aumentaba el ruido producido por los autom
oviles. La compa
na
ofreca datos del ruido (en decibelios) producido por coches
provistos del filtro Octel frente al producido por coches
desprovistos de el y deduca que no exista diferencia.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

Ejemplo 2.1 (cont.):


Nivel de ruido (en decibelios)
810 820 820 840 840 845 785 790 785 835 835 835 845 855 850 760 760 770
820 820 820 820 820 825 775 775 775 825 825 825 815 825 825 770 760 765

Nivel de ruido (en decibelios)

Sin filtro
Octel

860
840
820
800
780
760
Sin filtro

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Filtro Octel
Tema 2: Dise
no de experimentos (varios factores)

Ejemplo 2.1 (cont.): Es un problema de ANOVA con I = 2


grupos. El contraste de igualdad de medias no muestra evidencia
de que el filtro Octel sea mas ruidoso.
F.V.
Explicada
Residual
Total

S.C.
1056.3
28818.1
29874.3

g.l.
1
34
35

C.M.
1056.3
847.6

F
F = 1.24 < F1,34,0.05 = 4.13

El error experimental de estos datos es muy grande comparado con


la posible diferencia entre el ruido medio emitido por ambos
grupos, razon por la cual quiza no detectemos dicha diferencia.
El error experimental puede deberse a la influencia de otros
factores (gama de coche: alta, media o baja) sobre la respuesta.
En algunos casos quiza podamos medir y controlar estos factores
(y reducir el error) y en otros no seremos capaces de detectarlos
(pero esperamos que influyan poco en la respuesta).
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

Cuando aceptamos H0 : 1 = 2 = . . . = I , o bien es porque las


medias son todas iguales, o bien porque no podemos detectar la
diferencia entre las medias debido a que es demasiado grande.
El dise
no de experimentos intenta reducir el error experimental para
que este no oculte una diferencia significativa entre las respuestas
medias. Uno de nuestros objetivos sera realizar comparaciones
entre grupos lo mas homogeneos posible y tratar de detectar los
factores que realmente influyen sobre la variable de interes.
Estudiaremos tres casos:
Dos factores (dise
no por bloques)
Dos factores con interacci
on
Tres factores (cudrados latinos)

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

El dise
no del experimento
Llamaremos variable respuesta a la variable de interes Y (el nivel
de ruido producido por el coche). Los factores o variables
experimentales son aquellas variables que pueden afectar a los
valores de la respuesta (el que un coche lleve o no el filtro, la gama
de automovil).
Suponemos que la respuesta es continua y que los factores se
prefijan para el experimento en unos niveles determinados
(filtro/silenciador, gama alta/media/baja).
Podemos controlar o prefijar el valor que toman algunos factores y
luego observar el valor que toma Y . Pero en cualquier experimento
habra numerosos factores que no midamos ni controlemos y que
contribuyen al error experimental. Hay tres posibles maneras de
reducir este error: la aleatorizaci
on, la repetici
on y los dise
nos
factoriales.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

Aleatorizaci
on
Consiste en asignar todos los factores no controlados
aleatoriamente a las observaciones. Esto previene sesgos en las
observaciones y reduce la dependencia de estas entre s.
Ejemplo 2.1 (cont.):
Supongamos que en las pruebas se utilizaron dos marcas de coche
exclusivamente, Ford y Seat, pero que el factor marca no nos
interesa. Si los filtros Octel se instalan en los Ford y los
silenciadores en los Seat y la marca Seat es mas silenciosa que la
Ford quiza lleguemos a la conclusi
on de que el filtro hace
demasiado ruido cuando en realidad el efecto ha sido causado por
la marca Ford. Una manera de resolver este problema es, al ir a
tomar una nueva observaci
on, escoger al azar la marca de ese
coche de entre las dos disponibles.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

El principio de aleatorizaci
on tambien se utiliza para prevenir el
efecto de aprendizaje o de fatiga.
Supongamos que queremos comparar tres programas estadsticos,
A, B y C, para su posible uso en la docencia de una asignatura. Se
evaluara, entre otras cosas, si los programas son de facil manejo y
comprension. Se pide a seis estudiantes que analicen algunos
conjuntos de datos, cada uno de ellos con esos tres programas. Si
todos resuelven cada problema utilizando los programas en el orden
A, B, C, es probable que los programas B o C les parezcan mejor,
porque la utilizacion del programa A previamente les ha servido
para aprender. Para evitar este efecto se asignara aleatoriamente a
cada estudiante un orden de utilizaci
on de los programas:
estudiante
programas

1
A
B
C

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

2
B
C
A

3
C
B
A

4
B
A
C

5
C
A
B

6
A
C
B

Tema 2: Dise
no de experimentos (varios factores)

La repetici
on del experimento
Puesto que lo que deseamos es detectar las posibles diferencias
entre medias de poblaciones y la varianza de una media muestral
es 2 /n, disminuiremos el error experimental aumentando el
tama
no muestral n, es decir, repitiendo mas veces el experimento.
Dise
no factorial
Supongamos que medimos el nivel de ruido emitido por un coche
en funcion de si lleva o no un filtro, pero hay otro factor (la gama)
que influye en la respuesta. Podemos eliminar la presencia de ese
factor utilizando la misma gama de coche en todo el experimento.
En esto consiste el dise
no clasico de experimentos: eliminar el
efecto de todos los factores que puedan afectar a la respuesta,
excepto la presencia o no del filtro, manteniendo fijos sus valores a
lo largo de todo el experimento.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

Otra opcion es utilizar distintas gamas de coche tanto para la


presencia de filtro como para su ausencia. Esto es razonable si
queremos extender las conclusiones del experimento a cualquier
tipo de coche (y no solo a los de una determinada gama).
En general, trataremos de introducir en el experimento todos los
factores que puedan afectar a la respuesta y observaremos esta
para distintos niveles de los factores.
En el dise
no factorial con dos factores se cruzan todos los posibles
niveles del factor que mas nos interesa (la presencia o no de filtro)
con todos los posibles niveles del otro factor (la gama del
automovil). Las observaciones obtenidas se presentan en una tabla
de doble entrada.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

10

Ejemplo 2.1 (cont.) Texaco en realidad proporciono mas


informacion en su informe del filtro Octel:

Silenciador

Filtro Octel

Gama vehculo
Baja Media
Alta
810
840
785
820
840
790
820
845
785
835
845
760
835
855
760
835
850
770
820
820
775
820
820
775
820
825
775
825
815
770
825
825
760
825
825
765

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

11

A esa variable experimental, como la gama del coche, que a priori


no nos interesa directamente, pero que incluimos en las
observaciones para reducir el error experimental se la llama variable
bloque (o factor secundario). El factor principal tambien se
denomina tratamiento.
El dise
no experimental mas sencillo, llamado modelo en bloques
aleatorizados, cruza todos los posibles niveles del factor de interes
con todos los niveles de la variable bloque y observa la variable
respuesta al menos una vez para cada una de esas combinaciones.
El resto de factores que puedan afectar al experimento (como el
punto de instalacion del filtro en el coche) se asignaran al azar
(aleatorizacion) a cada combinaci
on del bloque con el factor.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

12

An
alisis de la varianza con dos factores
(dise
no en bloques aleatorizados)
Tambien se denomina modelo simple con dos factores. Se utiliza
cuando queremos investigar el efecto de dos atributos
independientes sobre una variable respuesta Y .
Por ejemplo, deseamos averiguar si en el crecimiento de un helecho
influyen la longitud de onda de la luz que recibe y la edad de la
planta.
Denotamos por I y J el n
umero de niveles del primer y segundo
factor respectivamente. Tenemos una u
nica observacion yij por
cada combinacion (i, j) del primer factor con el segundo y
disponemos los n = I J datos en una tabla de doble entrada.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

13

Factor 2

Factor 1

1
2
..
.

y11
y21
..
.

y12
y22

...
...

y1J
y2J
..
.

Medias por
filas
y1
y2
..
.

I
Medias por
columnas

yI 1

yI 2

...

yIJ

yI

y1

y2

yJ

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

14

Ejemplo 2.2: Se realiza un estudio del efecto de la luz sobre el


crecimiento de los helechos. Como la tasa de crecimiento depende
de la edad de la planta se utilizan cuatro plantas jovenes (plantas
crecidas en la oscuridad durante cuatro das) y cuatro plantas mas
viejas (crecidas en las oscuridad durante doce das). Se investigan
cuatro tratamientos de luz diferentes: se expone la planta a una
u
nica dosis de luz, se la pone de nuevo en la oscuridad y se mide el
area (en m2 ) de secci
on transversal del extremo del helecho
veinticuatro horas despues de administrarsele la luz. Se asigna un
helecho elegido aleatoriamente a cada cruce de los dos factores.

Edad
Joven
Adulto

Longitud de onda de la luz


420 nm 460 nm 600 nm 720 nm
1017.6
929.0
939.8
1081.5
854.7
689.9
841.5
797.4

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

15

El modelo en bloques aleatorizados


Se supone que el valor medio de la respuesta Y es un cierto , que
si el primer factor esta en el nivel i entonces el valor medio de Y se
incrementa en una cantidad i y que si el segundo factor esta en
un nivel j entonces la media de la respuesta se incrementa en j .
Imponemos la hipotesis de que no existe interacci
on entre ambos
factores, es decir, que el efecto del factor principal no depende del
nivel j de la variable bloque (y viceversa).
El modelo es
Yij = + i + j + Uij ,

i = 1, . . . , I , j = 1, . . . , J,

siendo Uij variables aleatorias independientes N(0, 2 ) que


representan el error experimental.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

16

En consecuencia, Yij N( + i + j , 2 ) para i = 1, . . . , I ,


j = 1, . . . , J, y ademas son independientes entre s.
Como los i y j representan efectos incrementales supondremos
ademas que
I

i = 0
i=1

j = 0.
j=1

Por tanto, los parametros desconocidos en el modelo son ,


1 , . . . , I 1 , 1 , . . . , J1 y , un total de I + J.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

17

Estimaci
on de los par
ametros del modelo
Estimamos , i y j mediante maxima verosimilitud:

i
j

1
n

yij = y
i=1 j=1

= yi
= yi y
= yj
= yj y

Solo I 1 de los efectos incrementales


i son independientes
I

i = 0.
i=1

Asimismo solo J 1 de los j son independientes ya que


J

j = 0.
j=1
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

18

Residuo eij

= Valor observado Valor previsto con el modelo


= yij yij
= yij (
+
i + j )
= yij + y yi yj

Ejemplo 2.2 (cont.):


Edad
Joven
Adulto
yj
j

Longitud de onda de la luz


420 nm 460 nm 600 nm 720 nm
1017.6
929.0
939.8
1081.5
854.7
689.9
841.5
797.4

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

yi

Tema 2: Dise
no de experimentos (varios factores)

19

I + J ecuaciones de restricci
on para los residuos:
I

eij = 0,

j = 1, . . . , J,

i=1

eij = 0,

i = 1, . . . , I .

j=1
I

De ellas una se puede deducir de las demas ya que

eij = 0.
i=1 j=1

Luego el n
umero de restricciones sobre los residuos es I + J 1 y
el n
umero de residuos independientes es (I 1)(J 1).
Un estimador centrado de 2 es la varianza residual
sR2

1
=
(I 1)(J 1)

eij2 .
i=1 j=1

Ejemplo 2.2 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

20

Propiedades de los estimadores de los par


ametros

N ,

i
j
(I 1)(J 1)sR2
2

2
n

2
n
2
N j , (J 1)
n

N i , (I 1)

2(I 1)(J1)

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

21

An
alisis de la varianza
Para averiguar si el primer factor influye en el nivel medio de la
respuesta contrastaremos
H0

(1)

i = 0, para todo i = 1, . . . , I

(1)
H1

i = 0, para alg
un i = 1, . . . , I .

Ejemplo 2.2 (cont.):


Crecimiento del helecho

1100
1000
900
800
700
600

Joven

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Viejo
Tema 2: Dise
no de experimentos (varios factores)

22

Tambien contrastaremos si el segundo factor influye


(2)

j = 0, para todo j = 1, . . . , J

(2)

j = 0, para alg
un j = 1, . . . , J.

H0
H1

Si alguno de los dos factores no fuera influyente quiza podramos


obviarlo y utilizar el modelo del Tema 1.
Para realizar estos contrastes descomponemos la variabilidad total
I

(yij
)2

VT =
i=1 j=1

en terminos asociados a los distintos factores. Observemos que


yij
= yij y =
i + j + eij .
Por tanto,
I

i=1
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

j2 +

i2 + I

VT = J

j=1

eij2 .
i=1 j=1

Tema 2: Dise
no de experimentos (varios factores)

23

VT = VE() + VE() + VNE ,


donde

i2

VE() = J
i=1

es la variabilidad debida al primer factor,


J

j2

VE() = I
j=1

es la variabilidad debida al segundo factor y


I

eij2 .

VNE =
i=1 j=1

es la variabilidad residual o no explicada.


Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

24

Ejemplo 2.2 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

25

Tabla ADEVA para el analisis de la varianza con dos factores:


Fuentes de
variacion

Suma de
cuadrados

Grados de
libertad

Factor 1

VE()

I 1

s2 =

VE()
I 1

Factor 2

VE()

J 1

s2 =

VE()
J 1

Residual

VNE

(I 1)(J 1)

Total

VT

n1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Varianzas

sR2
sy2 =

VT
n1

Tema 2: Dise
no de experimentos (varios factores)

26

Ejemplo 2.2 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

27

Si el primer factor no influye sobre el nivel medio de la respuesta, es


(1)
decir, si la hipotesis H0 : i = 0 para todo i es cierta, entonces
VE()
2I 1
2
y es independiente de la VNE. Entonces
F (1) =
(1)

y rechazamos H0

s2
F(I 1),(I 1)(J1)
sR2

al nivel de significaci
on si
F (1) > F(I 1),(I 1)(J1), .

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

28

Analogamente, si el segundo factor no influye y la hipotesis


(2)
H0 : j = 0 para todo j es cierta, entonces
F (2) =
(2)

y rechazamos H0

s2
sR2

F(J1),(I 1)(J1)

al nivel de significaci
on si
F (2) > F(J1),(I 1)(J1), .

Ejemplo 2.2 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

29

Observaci
on: Si alguno de los factores no influye, entonces este
dise
no en bloques aleatorizados es menos eficaz que el que vimos
en el Tema 1 (dise
no completamente aleatorizado). Entonces
deberamos obviar la clasificaci
on dada por el factor no relevante y
construir una tabla ADEVA con un solo factor.
Ejemplo 2.2 (cont.):

En cambio, si el segundo factor influye significativamente sobre el


valor medio de la respuesta, entonces el estadstico F (1) del
contraste en bloques aleatorizados es mas sensible a las diferencias
entre tratamientos que el estadstico F del contraste
completamente aleatorizado.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

30

El coeficiente de determinaci
on
El coeficiente de determinaci
on es la proporci
on de variabilidad
total explicada por el modelo en bloques aleatorizados
R2 =

VE() + VE()
VE
=
.
VT
VT

Observemos que R 2 = R2 + R2 , siendo R2 = VE()/VT el


coeficiente de determinaci
on parcial del primer factor y
2
R = VE()/VT el coeficiente de determinaci
on parcial del
segundo factor.
Ejemplo 2.2 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

31

An
alisis de las diferencias entre medias
Si el analisis de la varianza revela la influencia de uno de los
factores sobre la respuesta, debemos averiguar que niveles de este
factor son realmente distintos entre s.
Estimamos las diferencias entre los niveles i y k del primer factor
mediante
i
k = yi yk . Ademas utilizaremos que

i
k (i k )

t(I 1)(J1)
2 sR / J
Analogamente estimamos las diferencias entre los niveles j y del
segundo factor mediante j = yj y . Se cumple que
j (j )

t(I 1)(J1) .
2 sR / I
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

32

Ejemplo 2.2 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

33

Diagnosis del modelo


Se hara mediante analisis grafico de los residuos. Las hipotesis de
normalidad, homocedasticidad e independencia se comprobaran
igual que en el Tema 1.
Ejemplo 2.2: Histograma de los residuos
Histograma de los residuos no estandarizados
2,0

1,5

1,0

0,5

0,0
-50

-25

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

25

50

Tema 2: Dise
no de experimentos (varios factores)

34

Ejemplo 2.2: Curtosis y asimetra de los residuos

Estadsticos descriptivos
N
Residuo
N vlido (segn lista)

Asimetra

Estadstico
8

Estadstico
,000

Error tpico
,752

Curtosis
Estadstico
-1,706

Error tpico
1,481

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

35

Ejemplo 2.2: Diagrama de residuos frente a valores previstos


Ejemplo 2.2: Crecimiento de helechos
48,90
44,00

Residuo

21,50
16,60
-16,60
-21,50
-44,00

1037,50

1034,20

988,70

907,50

841,40

838,10

792,60

711,40

-48,90

Valor pronosticado o previsto

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

36

Modelo sin interacci


on y K replicaciones
Ejemplo 2.1 (cont.): En la pagina 11, por cada cruce del nivel i
del factor principal (con/sin filtro) con el nivel j de la variable
bloque (gama de vehculo), tenemos K = replicaciones.
Queremos ver si alguno de los dos factores influye en el nivel medio
de ruido provocado por el autom
ovil.
El modelo de Analisis de la Varianza con dos factores, sin
interaccion y K replicaciones es
Yijk = + i + j + Uijk ,
donde i = 1, . . . , I , j = 1, . . . , J, k = 1, . . . , K ,, Uijk N(0, 2 )
son independientes entre s, Ii=1 i = 0 y Jj=1 j = 0.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

37

Estimacion de los parametros del modelo:


1

= y =
IJK

i
j

yijk
i=1 j=1 k=1

= yi y
= yj y

donde
yi =

yj =

1
JK
1
IK

yijk ,

i = 1, . . . , I ,

yijk ,

j = 1, . . . , J.

j=1 k=1
J

j=1 k=1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

38

i2

Variabilidad debida al primer factor = VE() = JK


i=1
J

j2

Variabilidad debida al segundo factor = VE() = IK


j=1
I

(yijk y )2 .

Variabilidad total = VT =
i=1 j=1 k=1

Residuos del modelo con replicaciones:


eijk = yijk yijk = yijk (
+
i + j ) = yijk + y yi yj
I

K
2
.
eijk

Variabilidad residual = VNE =


i=1 j=1 k=1
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

39

Ejemplo 2.1 (cont.):


Residuos

Gama vehculo
Baja
Media Alta

VE() =

VE() =

Silenciador

VT =

VNE =

Filtro Octel

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

40

Tabla ANOVA
F.V.
S.C.

g.l.

Factor 1

VE()

I 1

Factor 2

VE()

J 1

Residual

VNE

IJK (I + J) + 1

Total

VT

IJK 1

(1)

Rechazo H0

: i = 0 para todo i = 1, . . . , I al nivel si


F (1) =

(2)

Rechazo H0

C.M.
VE()
s2 =
I 1
VE()
2
s =
J 1
VNE
2
sR =
IJK (I + J) + 1
VT
sy2 =
IJK 1

s2
> F(I 1),IJK (I +J)+1, .
sR2

: j = 0 para todo j = 1, . . . , J al nivel si


F (2) =

s2
sR2

> F(J1),IJK (I +J)+1, .

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

41

Ejemplo 2.1 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

42

Ejemplo 2.1 (cont.): Histograma y grafico probabilstico normal


de los residuos
Normal Probability Plot

0.3

0.99
0.98
0.95
0.90

0.25

0.75
Probability

0.35

0.2
0.15

0.25

0.1
0.05
0

0.50

15

10

10

15

0.10
0.05
0.02
0.01
20

10

10

Data

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

43

Ejemplo 2.1 (cont.): Diagrama de residuos frente a valores


previstos
20

10

10

20
760

780

800

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

820

840

Tema 2: Dise
no de experimentos (varios factores)

44

Modelo con dos factores e interacci


on
El modelo de efectos aditivos
Yij = + i + j + Uij ,

i = 1, . . . , I , j = 1, . . . , J,

establece que E (Yij ) = + i + j .


No existe interacci
on entre los dos factores.
Por ejemplo, se cumple que para cualquier j = 1, . . . , J,
E (Y4j ) E (Y1j ) = 4 1 .
En el Ejercicio 2.2 esto significa que la diferencia entre el consumo
medio de gasolina de un coche espa
nol y japones es la misma
independientemente de si estamos conduciendo en hora punta o en
carretera llana.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

45

En el modelo sin interacci


on, al representar las respuestas medias
para valores fijos de uno de los factores, las lneas son paralelas.
E(Yij) en modelo sin interaccin
+1+2

+1+1

+4+2

+1+3

+4+1
+3+2
+4+3

+3+1

+3+3
j=1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

j=2

j=3

Tema 2: Dise
no de experimentos (varios factores)

46

Un modelo con interacci


on sera
Yij = + i + j + ()ij + Uij ,

i = 1, . . . , I , j = 1, . . . , J

donde Uij N(0, 2 ) son independientes y ()ij son parametros


que describen la interacci
on entre los factores.
En este modelo hay IJ + 1 parametros desconocidos. Si solo
tenemos una observaci
on yij para cada (i, j), no podemos
estimarlos todos. En este caso, aunque podramos modelizar la
interaccion con una expresi
on mas simple, utilizaremos siempre el
modelo sin interaccion.
Cuando hay K 2 replicaciones por cada cruce de los dos factores
s podemos ajustar el modelo con interacci
on a nuestros datos.
Ejemplo 2.1 (cont.): En la pagina 11, por cada cruce del nivel i
del factor principal (con/sin filtro) con el nivel j de la variable
bloque (gama de vehculo), tenemos K =
replicaciones.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

47

El modelo ANOVA de dos factores con interacci


on es
Yijk = + i + j + ()ij + Uijk ,

i = 1, . . . , I
j = 1, . . . , J
k = 1, . . . , K ( 2)

donde Uijk N(0, 2 ) son independientes y


I

i = 0
i=1

j = 0
j=1

()ij = 0, j = 1, . . . , J
i=1
J

()ij = 0, i = 1, . . . , I .
j=1

()ij = E (Yij ) i j = desviaci


on de la respuesta esperada
respecto de la predicci
on dada por el modelo sin interaccion
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

48

N
umero de parametros desconocidos = IJ + 1.
Estimaciones de los parametros:

= y =

yi =
yj =

yijk
i=1 j=1 k=1

= yij yi yj + y
K

yijk
k=1
J

1
JK
1
IK

= yj y

()ij
1
K

= yi y

i
j

donde yij =

1
IJK

yijk ,

i = 1, . . . , I ,

yijk ,

j = 1, . . . , J.

j=1 k=1
J
K
j=1 k=1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

49

Ejemplo 2.1 (cont.):


Gama vehculo
Baja
Media

Sin filtro

F. Octel

Alta

810
820
820
835
835
835

840
840
845
845
855
850

785
790
785
760
760
770

y11 =

y12 =

y13 =

()11 =

()12 =

()13 =

820
820
820
825
825
825

820
820
825
815
825
825

y21 =

y22 =

y23 =

()22 =

()23 =

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

775
775
775
770
760
765

()21 =

yj
j

yi

y =

Tema 2: Dise
no de experimentos (varios factores)

50

Residuos:
eijk = yijk yijk = yijk (
+
i + j + ()ij ) = yijk yij
Tienen IJ(K 1) g.l., pues

K
k=1 eijk

Ejemplo 2.1 (cont.):


Residuos

Sin filtro

Filtro Octel

= 0 para todo (i, j).

Gama vehculo
Baja
-15,83
-5,83
-5,83
9,17
9,17
9,17
-2,50
-2,50
-2,50
2,50
2,50
2,50

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Media
-5,83
-5,83
-0,83
-0,83
9,17
4,17
-1,67
-1,67
3,33
-6,67
3,33
3,33

Alta
10,00
15,00
10,00
-15,00
-15,00
-5,00
5,00
5,00
5,00
0,00
-10,00
-5,00

Tema 2: Dise
no de experimentos (varios factores)

51

(yijk y )2

Descomposicion de la variabilidad total VT =


i=1 j=1 k=1

VT = VE() + VE() + VE() + VNE,


donde
I

i2

VE() = JK

j2

VE() = IK

i=1

j=1
I

K
2
eijk

VNE =
i=1 j=1 k=1
I

VE() = K

()ij
i=1 j=1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

52

Tabla ANOVA para dos factores con K replicaciones y con


interaccion:
FV

SC

gl

Factor

VE()

I 1

s2 =

VE()
I 1

Factor

VE()

J 1

s2 =

VE()
J 1

Interaccion

VE()

(I 1)(J 1)

Residual

VNE

IJ(K 1)

Total

VT

n1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

CM

2 =
s

VE()
(I 1)(J 1)

sR2 =

VNE
IJ(K 1)

sy2 =

VT
n1

Tema 2: Dise
no de experimentos (varios factores)

53

Posibles contrastes y sus regiones de rechazo:


(1)

H0

: i = 0, i = 1, . . . , I
R (1) =

(2)

H0

(3)

s2
> FI 1,IJ(K 1),
sR2

: j = 0, j = 1, . . . , J
R

H0

F (1) =

(2)

(2)

s2

> FJ1,IJ(K 1),

sR2

: ()ij = 0, i = 1, . . . , I , j = 1, . . . , J
R

(3)

(3)

2
s

sR2

> F(I 1)(J1),IJ(K 1),

(3)

Aunque no rechacemos H0 , no conviene unir VE() con VNE a


menos que F (3) sea muy pr
oximo a 1.
La diagnosis del modelo se realiza mediante analisis de los residuos.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

54

Ejemplo 2.1 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

55

Ejemplo 2.3: Se investiga el efecto de diferentes tipos de m


usica
sobre enfermos de Alzheimer. Se eligen enfermos con un desarrollo
bajo y medio de la enfermedad y se prueban tres tipos de m
usica:
interludios de piano, Mozart y m
usica ligera. La variable respuesta
es el nivel de agitacion del enfermo.
M
usica
Desarrollo
enfermedad
Bajo

Medio

Interludios

Mozart

Ligera

21
24
22
18
20
22
20
25
18
20

9
12
10
5
9
14
18
11
9
13

29
26
30
24
26
15
18
20
13
19

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

56

Ejemplo 2.3 (cont.):


M
usica
Desarrollo
enfermedad
Bajo

Medio

Interludios
21
24
22
18
20
y11 =
()11 =
22
20
25
18
20
y21 =
()21 =

Mozart

Ligera

9
12
10
5
9

29
26
30
24
26

14
18
11
9
13

15
18
20
13
19

yj
j
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

yi

y =
Tema 2: Dise
no de experimentos (varios factores)

57

Ejemplo 2.3 (cont.):

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

58

Ejemplo 2.3 (cont.):


Residuos eijk

Valores previstos yijk

M
usica
Des.
enf.
Bajo

Medio

M
usica

Int.

Moz.

Lig.

0
3
1
-3
-1
1
-1
4
-3
-1

0
3
1
-4
0
1
5
-2
-4
0

2
-1
3
-3
-1
-2
1
3
-4
2

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Des.
enf.
Bajo

Medio

Int.

Moz.

Lig.

21
21
21
21
21
21
21
21
21
21

9
9
9
9
9
13
13
13
13
13

27
27
27
27
27
17
17
17
17
17

Tema 2: Dise
no de experimentos (varios factores)

59

Ejemplo 2.3 (cont.):


6

Residuos

4
2
0
2
4
6
5

10

15
20
Valores previstos

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

25

30

Tema 2: Dise
no de experimentos (varios factores)

60

Ejemplo 2.3 (cont.): Histograma de los residuos

0.15

0.1

0.05

0
5

Curtosis de los residuos = 2.1683


Coeficiente de asimetra de los residuos = 0.0554
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

61

Una manera grafica de estudiar si existe interacci


on es representar
las medias muestrales yij para valores fijos de uno de los factores.
Si las lneas no son paralelas, concluimos que existe interaccion.
Ejemplo 2.3 (cont.):
30
25

D. bajo
D. medio

20
15
10
5

Interludios

Mozart
Tipo de msica

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Ligera

Tema 2: Dise
no de experimentos (varios factores)

62

Ejemplo 2.1 (cont.):


840

820

800

780

Silenciador
F. Octel
Baja

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Media
Gama

Alta

Tema 2: Dise
no de experimentos (varios factores)

63

An
alisis de la varianza con tres factores
Modelo general para tres factores sin replicaci
on
Para i = 1, . . . , I , j = 1, . . . , J, k = 1, . . . , K ,
Yijk = + i + j + k + ()ij + ()ik + ()jk + ()ijk + Uijk ,
donde Uijk N(0, 2 ) son independientes y
I

i = 0 ,

k=1

()ij =

()ij =
j=1

()ik =
i=1

()ik = . . . = 0
k=1

()ijk =
i=1

k = 0

j=1

I
i=1

j = 0 ,

i=1

()ijk =
j=1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

()ijk = 0.
k=1

Tema 2: Dise
no de experimentos (varios factores)

64

i , j , k = Efectos principales
()ij , ()jk , ()ik = Interacciones de segundo orden
()ijk = Interacciones de tercer orden
No de observaciones = IJK < No de parametros a estimar = IJK + 1
En un dise
no con tres factores a cuatro niveles cada uno y sin
replicacion se necesitan 43 = 64 observaciones. Existe un dise
no
mas restrictivo pero mas sencillo que s
olo precisa 42 = 16
observaciones: el cuadrado latino.

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

65

Cuadrado latino
Este dise
no se utiliza cuando
hay tres factores;
el n
umero de niveles de los tres factores es el mismo, I ;
no hay interaccion entre los factores.
El cuadrado latino tiene n = I 2 observaciones. Cada nivel de un
factor se cruza solo una vez con cada nivel de los otros dos
factores.
En la practica se forma una cuadrcula con I filas e I columnas y se
asignan I letras de tal manera que no haya letras repetidas en
ninguna fila ni en ninguna columna.
Por ejemplo, si I = 3, existen 12 dise
nos posibles. Uno es
A
C
B

C
B
A

B
A
C

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

y11(1)
y21(3)
y31(2)

y12(3)
y22(2)
y32(1)

y13(2)
y23(1)
y33(3)

Tema 2: Dise
no de experimentos (varios factores)

66

Ejemplo 2.4: Se desea evaluar si el tipo de riego (por goteo,


aspersion o sin riego) puede contribuir a la proteccion de cultivos
de fresas frente al fro extremo. En todos los casos se utiliza un
mantillo plastico sobre la tierra de cultivo. Por otro lado, se
supone que hay otros factores, como la humedad y el contenido en
nitrogeno del suelo, que tambien pueden influir. Cual de los
siguientes dise
nos del experimento sera mas adecuado?
Nivel de nitr
ogeno
Alto
Medio
Bajo
Nivel
Alto
No riego
Goteo
Aspersion
de
Medio No riego Aspersi
on No riego
humedad Bajo
Goteo
Goteo
Aspersion
Nivel de nitr
ogeno
Alto
Medio
Bajo
Nivel
Alto
No riego
Goteo
Aspersion
de
Medio
Goteo
Aspersi
on No riego
humedad Bajo Aspersi
on No riego
Goteo
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

67

Con I = 4 tendramos 576 posibles dise


nos. Uno de ellos es:
A
C
B
D

B
D
A
C

D
A
C
B

C
B
D
A

Un ejemplo con I = 5:
Deseamos contrastar la eficacia de 5 fertilizantes diferentes
(A,B,C,D,E) sobre un cultivo especfico. Queremos utilizar los 5
fertilizantes, esperar a que el cultivo madure y medir el resultado
de la cosecha por unidad de superficie con cada fertilizante. Pero
terrenos contiguos pueden variar en fertilidad debido a m
ultiples
causas (diferencias de humedad, uso previo del terreno, etc.). Para
reducir la variabilidad experimental dividimos el terreno en una
retcula de 5 x 5 rectangulos y en cada uno utilizamos un
fertilizante seg
un el siguiente dise
no de cuadrado latino:
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

68

Feature Column Arc

2. Agronomy experiments: Latin squares in real life.

A
B
C
D
E

B
D
E
C
A

C
A
D
E
B

D E
E C
B A
A field planted with a crop using five different treatments according to a 5 5 latin
square arrangement.
A B
Suppose we want to test the relative effectiveness of 5 different fertilizer mixtures on a crop of, say, oats. We apply the
C D
fertilizer, wait for the crop to mature, harvest it and measure the yield per unit area. But the five experiments cannot be car
x

out on the same plot of land. Even contiguous plots may vary in fertility because of a moisture gradient, different previous
of the land, or some other reason. Dividing a single plot into a 5 x 5 grid of subplots, and administering the fertilizers (labe
randomly A, B, C, D, E) according to a latin square arrangement like the one used in the figure above:

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2:

A B
B D
C E
DnC
Dise
o
E A

C D E
A E C
D B A
EdeA experimentos
B
B C D

(varios factores)

69

Modelo:
Yij(k) = + i + j + k + Uij(k) ,

i, j, k = 1, . . . , I ,

donde Uij(k) N(0, 2 ) son independientes y


I

i =
i=1

i
j
k

=
=
=

j =
j=1

k = 0.
k=1

efecto incremental de la fila


efecto incremental de la columna
efecto incremental de la letra

Parametros desconocidos: , 1 , . . . , I 1 , 1 , . . . , I 1 , 1 , . . . ,
I 1 , 2 No de parametros a estimar = 3I 1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

70

Estimacion de los parametros:


1

= y =
n

i = yi y

yij()
i=1 j=1

j = yj y

k = yk y

donde yij() es la observaci


on de la casilla (i, j) sea cual sea la letra
asociada y
yi =

1
I

yij()
j=1

yj =

1
I

yij()

yk =

i=1

1
I

yij(k)
i=1 j=1

Residuos:
eij(k) = yij(k) yij(k) = yij(k) (
+
i + j + k )
= yij(k) yi yj yk + 2
y
Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

71

Tabla ANOVA para el cuadrado latino:


FV

SC

gl

CM

Efecto fila

VE() = I

2i

I 1

2 =
s

VE()
I 1

j2

I 1

s2 =

VE()
I 1

k2

I 1

s2 =

VE()
I 1

2
eij()

(I 1)(I 2)

i=1
I

Efecto columna

VE() = I
j=1
I

Efecto letra

VE() = I
I

Residual

k=1
I

VNE =
i=1 j=1
I

Total

sR2 =

VNE
(I 1)(I 2)

(yij() y )2

VT =
i=1 j=1

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

n1

sy2 =

VT
n1

Tema 2: Dise
no de experimentos (varios factores)

72

Contrastes y sus regiones de rechazo al nivel de significacion :


(1)

H0

: i = 0, para todo i = 1, . . . , I
R (1) =

(2)

H0

(3)

s2
> FI 1,(I 1)(I 2),
sR2

: j = 0, para todo j = 1, . . . , I
R (2) =

H0

F (1) =

F (2) =

s2
sR2

> FI 1,(I 1)(I 2),

: k = 0, para todo k = 1, . . . , I
R (3) =

F (3) =

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

s2
> FI 1,(I 1)(I 2),
sR2

Tema 2: Dise
no de experimentos (varios factores)

73

Ejemplo 2.4 (cont.): El estudio sobre la proteccion del cultivo de


fresas frente al fro produjo finalmente los datos que se indican
debajo. La efectividad de los metodos de irrigaci
on se midio en
funcion del peso de los frutos congelados. Cual de los metodos
protegio mejor el cultivo?

Nivel
de
humedad

Alto
Medio
Bajo

Nivel de nitr
ogeno
Alto
Medio
Bajo
51 (G)
119 (A) 60 (NR)
98 (NR) 43 (G)
31 (A)
99 (A) 87 (NR) 49 (G)

Estadstica (CC. Ambientales). Profesora: Amparo Ballo

Tema 2: Dise
no de experimentos (varios factores)

74

También podría gustarte