Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 1
Introduccion
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 3
El modelo
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 4
Ejemplo 1.1 (cont.):
6.5
6
y
5.5
4.5
1 2 3 4
i
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 5
Suponemos que, en el nivel i del factor, la respuesta Y oscila
aleatoriamente en torno a un nivel desconocido i , la media de la
poblacion i-esima: E (Yij ) = i . Cada observacion yij resulta de
una perturbacion aleatoria uij en torno al valor medio i .
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 6
Las anteriores hipotesis equivalen a
a) E (Yij ) = i para todo i, j
b) Var(Yij ) = 2 para todo i, j
c) E (Yij Ykl ) = 0 para todo i 6= k, j 6= l
d) Yij Normal para todo i, j
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 7
Estimacion de los parametros del modelo
y
iI n I
1 XX X ni
2 = (yij yi )2 = s 2,
n n i
i=1 j=1 i=1
Pni
donde si2 = j=1 (yij yi )2 /ni es la varianza muestral en la
poblacion i-esima. Por tanto, 2 es la media de las si2 ponderada
por la proporcion de observaciones en cada nivel del factor.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 8
Ejemplo 1.1 (cont.):
i yij ni yi si2
1 4,8 5,2 5 4,7 5,1
2 6 6,2 6,1 5,8
3 5,9 6,1 6,3 6,1 6
4 6,3 6,6 6,4 6,4 6,5
n= 2 =
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 9
Ejemplo 1.1 (cont.):
i eij
1
2
3
4
n 2
2nI 2 no es centrado
2
Un estimador insesgado de 2 es la varianza residual
I ni
1 XX n
sR2 = eij2 = 2 ,
nI nI
i=1 j=1
que verifica
(n I )sR2
2nI .
2
Ejemplo 1.1 (cont.):
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 11
Usando estas propiedades obtenemos intervalos de confianza para
los parametros:
r
1
IC1 (i ) = yi tnI ;/2 sR
ni
!
2
2
(n I ) sR (n I ) sR2
IC1 ( ) = ,
2nI ;/2 2nI ;1/2
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 12
El contraste de igualdad de medias
H0 : 1 = 2 = . . . = I =
(todas las medias son iguales, el factor no influye)
H1 : i 6= j para algun par i 6= j.
(las medias difieren en al menos dos de los niveles,
el factor influye)
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 13
La descomposicion de la variabilidad
donde
i I n
1 XX
y = yij
n
i=1 j=1
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 14
De hecho, se cumple que
VT = VE + VNE,
I
X
VE = ni (yi y )2
i=1
denota la variabilidad explicada por el modelo o por las diferencias
entre niveles del factor y
ni
I X
X
VNE = eij2 = (n I )sR2
i=1 j=1
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 16
La tabla ANOVA y el contraste
Los terminos de la descomposicion de la variabilidad se disponen
en la tabla ANOVA
Fuentes de Suma de Grados de
variacion cuadrados libertad Varianzas
I
X VE
Explicada VE = ni (yi y )2 I 1 se2 =
I 1
i=1
ni
I X
X
Residual VNE = eij2 nI sR2
i=1 j=1
ni
I X
X VT
Total (yij y )2 n1 sy2 =
n1
i=1 j=1
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 17
Si la hipotesis nula de igualdad de medias H0 : 1 = 2 = . . . = I
es cierta entonces
s2
F = e2 FI 1,nI .
sR
Una region de rechazo para el contraste
H0 : 1 = 2 = . . . = I =
H1 : i 6= j para algun par i 6= j.
al nivel de significacion es
R = {F > FI 1,nI , }.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 18
Ejemplo 1.1 (cont.):
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 19
Ejemplo 1.2: Se examina el contenido de azufre en cinco
yacimientos de carbon en Texas. Se toman muestras aleatorias de
cada uno de los yacimientos y se analizan, obteniendose los
siguientes datos del porcentaje de azufre por muestra.
Yacimientos 1 2 3 4 5
Contenido 1.51 1.69 1.56 1.30 0.73
de 1.92 0.64 1.22 0.75 0.80
azufre 1.08 0.90 1.32 1.26 0.90
2.04 1.41 1.39 0.69 1.24
2.14 1.01 1.33 0.62 0.82
1.76 0.84 1.54 0.90 0.72
1.17 1.28 1.04 1.20 0.57
1.59 2.25 0.32 1.18
1.49 0.54
1.30
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 20
Ejemplo 1.2 (cont.): Contrastar la igualdad de niveles medios de
azufre en los cinco yacimientos.
1.5
y
0.5
0 1 2 3 4 5 6
i
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 21
El coeficiente de determinacion
Observacion: 0 R 2 1
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 22
Analisis de las diferencias entre medias
Si aceptamos H0 en el contraste
H0 : 1 = 2 = . . . = I =
H1 : i 6= j para algun par i 6= j.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 23
Si se rechaza H0 queremos determinar que parejas de medias son
distintas entre s y estimar las diferencias i j . Utilizando que
yi yj (i j )
q tnI ,
sR n1i + n1j
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 25
Contrastes multiples
I I!
Es posible formar c = = parejas de medias
2 2!(I 2)!
distintas i , j . Luego podemos realizar c contrastes H0 : i = j .
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 26
Cuando tomo 100 muestras de Y puedo construir 100 intervalos de
confianza para 1 2 , para 3 2 y para 1 3 :
6 j al nivel .
Se puede razonar igual con los contrastes H0 : i =
Utilizamos el metodo de Bonferroni para calcular intervalos de
confianza o contrastes multiples.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 27
Buscamos el nivel individual tal que para el 95%(=1 T =nivel
global) de las muestras se verifique simultaneamente que
1 2 IC1 (1 2 ), 3 2 IC1 (3 2 ) y
1 3 IC1 (1 3 ).
En el metodo de Bonferroni se toma = T /c = 0.05/3, pues
1 T = P {1 2 IC1 (1 2 ),
3 2 IC1 (3 2 ), 1 3 IC1 (1 3 )}
T = P {1 2
/ IC1 (1 2 )
o 3 2
/ IC1 (3 2 ) o 1 3
/ IC1 (1 3 )}
P{1 2
/ IC1 (1 2 )}
+P{3 2
/ IC1 (3 2 )}
+P{1 3
/ IC1 (1 3 )} = c
Observacion: Quiza rechacemos H0 : 1 = 2 = . . . = I en
ANOVA y no encontremos diferencias entre ningun i , j con
Bonferroni, pues es un metodo conservador si c es grande.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 28
I
Ejemplo 1.1 (cont.): Tomo T = 0.05. Como c = 2 = 6,
tenemos que = 0.05
6 = 0.0083 2 = 0.0041.
r
1 1
IC0.9917 (1 2 ) = [y1 y2 t15,0.0041 0.0266 + ]
5 4
= [1.3874, 0.7426] Rechazo H0 : 1 = 2
IC0.9917 (1 3 ) = [1.42, 0.82] Rechazo H0 : 1 = 3
IC0.9917 (1 4 ) = [1.78, 1.18] Rechazo H0 : 1 = 4
IC0.9917 (2 3 ) = [0.38, 0.27] No rechazo H0 : 2 = 3
IC0.9917 (2 4 ) = [0.74, 0.09] Rechazo H0 : 2 = 4
IC0.9917 (3 4 ) = [0.66, 0.06] Rechazo H0 : 3 = 4
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 29
Diagnosis del modelo
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 30
Ejemplo 1.1 (cont.): Histograma de los residuos
2.5
1.5
0.5
0
0.3 0.2 0.1 0 0.1 0.2 0.3
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 31
Ejemplo 1.2 (cont.): Histograma de los residuos
1.5
0.5
0
0.5 0 0.5
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 32
Ejemplo 1.2 (cont.): Si retiramos el dato atpico 2.25 de la
poblacion 3,
Fuentes de Suma de
variacion cuadrados g.l. Varianzas F
Explicada VE = 3.4855 4 se2 = 0.8714 F = 8.4958
Residual VNE = 3.7949 36 sR2 = 0.1026
Total VT = 7.2804 40
F4,36,0.05 = 2.63 Seguimos rechazando la igualdad del contenido
medio de azufre en las cinco minas de carbon.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 33
Ejemplo 1.2 (cont.): Histograma de los residuos tras retirar el
dato atpico
0.15
0.1
0.05
0
0.6 0.4 0.2 0 0.2 0.4 0.6
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 34
Un grafico que permite evaluar la normalidad de los residuos es el
diagrama probabilstico normal, en el que se representan los
residuos ordenados de menor a mayor frente a los correspondientes
estadsticos de orden normales. Bajo la hipotesis de normalidad los
puntos dibujados se ajustan aproximadamente a una lnea recta.
Ejemplo 1.1 (cont.): Grafico probabilstico normal de los residuos
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.2 0.1 0 0.1 0.2
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 35
Ejemplo 1.2 (cont.): Grafico probabilstico normal de los residuos
(sin retirar atpico)
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.5 0 0.5
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 36
Para comprobar la hipotesis de normalidad de manera mas rigurosa
tambien podemos hacer algun contraste de bondad de ajuste.
El fallo de la hipotesis de normalidad afecta al calculo de intervalos
de confianza para 2 , aunque no al contraste de igualdad de
medias ni al analisis de las diferencias entre medias. El analisis de
la varianza es robusto frente a desviaciones de la normalidad.
Para comprobar la hipotesis de homocedasticidad representamos
los residuos eij frente a los valores previstos yij = yi . As
comprobamos que la variabilidad no depende del nivel medio de la
respuesta.
La heterocedasticidad tambien influye en la estimacion de 2 .
Respecto a los contrastes de igualdad de medias, se consideran
validos si el diseno es bastante equilibrado.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 37
Ejemplo 1.1 (cont.):
0.3
0.2
0.1
Residuos
0.1
0.2
0.3
0.4
4.5 5 5.5 6 6.5
Valores previstos
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 38
Ejemplo 1.2 (cont.):
0.8
0.6
0.4
Residuos
0.2
0.2
0.4
0.6
0.8 1 1.2 1.4 1.6 1.8
Valores previstos
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 39
Si las varianzas de los residuos varan marcadamente como funcion
del nivel medio de la respuesta, o se detectan desviaciones
importantes respecto a la normalidad, se puede probar a
transformar la variable respuesta.
Algunas transformaciones frecuentes son log(y ) o y k .
Entonces se contrastara que el nivel medio de la respuesta
transformada no depende del nivel del factor, pero ya no
H 0 : 1 = . . . = I .
Ver Ejemplo 5 de ANOVA con Excel.
Estadstica (CC. Ambientales). Profesora: Amparo Ballo Tema 1: Diseno de experimentos (un factor) 40