Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diseño de Experimentos PDF
Diseño de Experimentos PDF
Experimentos y
Regresión
Laboratorio
de
Estadística
PROGRAMA
1
1. Análisis de la Varianza
Análisis de la Varianza 3
Método: 4 pasos
Análisis de la Varianza 4
Modelo
M
O
V V D
E
L
P1 P2 O
y11 y 21
D
y12 y 22 A
T
O
y1n1 y 2 n2 S
Análisis de la Varianza 5
Análisis de la Varianza 6
Modelo
0
Análisis de la Varianza 7
Estimación medias:
n1 A B
¦ y1 j 51,3
39,4
29,6
47,0
j 1
P1 : o y1x 26,3 25,9
n1 39,0 13,0
48,1 33,1
34,2 22,1
n2 69,8 34,1
¦ y2 j 31,3
45,2
19,5
43,8
j 1
P 2 : o y2x 46,4 24,9
n2 43,1 29,3
Análisis de la Varianza 8
Estimación varianza (residuos)
yij P i uij , uij o N (0, V 2 ) Residuos
A B
8,2 0,3
-3,7 17,7
uij yij P i -16,8 -3,4
-4,1 -16,3
eij yij yix 5,0 3,8
-8,9 -7,2
eij : RESIDUO 26,7 4,8
-11,8 -9,8
2 ni 2,1 14,5
¦¦ eij2 3,3
0,0
-4,4
0,0
i 1 j 1
V 2 : o sˆR2 n
n2 ¦
i
eij 2
0;sˆR 130.95
j 1
Análisis de la Varianza 9
2
ˆ
Varianza residual: R
s
V V
P1 P2
y11 ½ y21 ½
y12 °° 2 ¦ ( y1 j y1x ) 2 y22 ° ° 2 ¦ ( y2 j y2x ) 2
sˆ1 sˆ2
¾ n1 1 ¾ ° n2 1
°
y1n1 °
¿ y2 n2 °
¿
2 ni
¦¦ e
i 1 j 1
2
ij
n1 1 2 n2 1 2
sˆR2 sˆ1 sˆ2
n2 n2 n2
Análisis de la Varianza 10
Diferencia de medias: y1x y2x
V V
P1 P2
y11 ½ y21 ½
y12 °° V2 y22 ° ° V2
y1x o N ( P1 , ) y2x o N ( P 2 , )
¾ n1 ¾ ° n2
°
y1n1 °
¿ y2 n2 °
¿
V2 V2 ½
y1x y2x o N ( P1 P 2 , )
°
n1 n2 °° ( y1x y2x ) ( P1 P 2 )
( y1x y2x ) ( P1 P 2 ) o tn2
o N (0,1) ¾ 1 1
1 1 ° sˆR
V ° n1 n2
n1 n2 °¿
Análisis de la Varianza 11
H 0 : P1 P2 R.R
R.R.
H1 : P1 z P 2 tn-2
1-D
y1x y2x D/2
t0 o tn2 R. Acept. D/2
1 1
sˆR -tD/2 tD/2
n1 n2
t0 d tD / 2 No se rechaza H 0
t0 ! tD / 2 Se rechaza H 0
Análisis de la Varianza 12
Ejemplo: D = 0.05
H 0 : P1 P2 R.R
R.R. t18
H1 : P1 z P 2
0.025
43.1 29.3 0.025
t0 2.69
1 1
11.44 -2.10 2.10
10 10
Análisis de la Varianza 13
Ejemplo: D = 0.01
H 0 : P1 P2 R.R
R.R.
H1 : P1 z P 2 t18
0.99
0.005 0.005
43.1 29.3
t0 2.69 D/2
1 1
11.44 -2.88 2.88
10 10
Análisis de la Varianza 14
Nivel crítico (bilateral)
H 0 : P1 P2 t18
H1 : P1 z P 2
43.1 29.3 0.0074 0.0074
t0 2.69
1 1
11.44 -2.69 2.69
10 10
Análisis de la Varianza 15
Conclusiones (fijado D)
Análisis de la Varianza 16
No rechazar Ho, no implica que Ho sea cierta
Análisis de la Varianza 17
18
Comparación de dos tratamientos con R
19
20
Intervalo de confianza para
la diferencia de medias: P1 P 2
( y1x y2x ) ( P1 P 2 ) tn-2
o t n2
1 1
sˆR D/2
n1 n2 D/2 1-D
-tD/2 tD/2
( y1x y2x ) ( P1 P 2 )
Pr { tD / 2 d d tD / 2 } 1 D
1 1
sˆR
n1 n2
1 1
P1 P 2 ( y1x y2x ) r tD / 2 sˆR
n1 n2
Análisis de la Varianza 21
t18
0.025 0.025
-2.10 2.10
1 1
P1 P 2 ( y1x y2x ) r tD / 2 sˆR
n1 n2
1 1
P1 P 2 (43.1 29.3) r 2.10 u11.44 u
10 10
P1 P 2 13.8 r 10.74
Análisis de la Varianza 22
Hipótesis de homocedasticidad
V1 V2
P1 P2
y11 ½ y21 ½
y12 °° 2 ¦ ( y1 j y1x ) 2 y22 ° ° 2 ¦ ( y2 j y2x ) 2
sˆ1 sˆ2
¾ n1 1 ¾ ° n2 1
°
y1n1 °
¿ y2 n2 °
¿
H 0 : V 12 V 22
H1 : V 12 z V 22
Análisis de la Varianza 23
Distribución F
y11 ½ y21 ½
y12 °° 2 ¦ ( y1 j y1x ) 2 y22 ° ° 2 ¦ ( y2 j y2x ) 2
sˆ1 sˆ2
¾ n1 1 ¾ ° n2 1
°
y1n1 °
¿ y2 n2 °
¿
(n1 1) sˆ12 ( n2 1) sˆ22
o F n21 1 o F n22 1
V 12 V 22
F n2 1 sˆ12
1
(n1 1) V 12
F o Fn1 1,n2 1
F n2 12
sˆ22
(n2 1) V 22
Análisis de la varianza 24
Distribución F
F40,40
F20,40
F10,40
F5,40
Análisis de la varianza 25
Algunas distribuciones F
F10,80
F10,40
F10,20
F10,10
Análisis de la varianza 26
Contraste de igualdad de varianzas
H 0 : V 12 V 22
H1 : V 12 z V 22 RR RR
D/2 1-D D/2
Si H 0 es cierto V 12 V 22 , R.A. Ho
sˆ12 F1-D/2 FD/2
F0 2
o Fn1 1,n2 1
sˆ1
Si F0 >F1D / 2 , FD / 2 @ No se rechaza H 0
Si F0 >F1D / 2 , FD / 2 @ Se rechaza H 0
Análisis de la varianza 27
H 0 : V 12 V 22
H1 : V 12 z V 22 RR RR
0.025 0.025
sˆ12 154.02 sˆ22 111.7
154.02 0.248 1.37 4.03
F0 1.37
111.7
Análisis de la varianza 28
Tabla F FQ1 ,Q 2 ,D P( FQ 1 ,Q 2 t FQ 1 ,Q 2 ,D ) D
D=0.05
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,0 253,3 254,3 1
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,49 19,50 2
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,55 8,53 3
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,66 5,63 4
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,41 4,40 4,37 5
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,71 3,70 3,67 6
Grados de libertad del denominador: Q2
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,27 3,23 7
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,97 2,93 8
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,76 2,75 2,71 9
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,59 2,58 2,54 10
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,46 2,45 2,40 11
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,35 2,34 2,30 12
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,26 2,25 2,21 13
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,19 2,18 2,13 14
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,12 2,11 2,07 15
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,07 2,06 2,01 16
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,02 2,01 1,96 17
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,98 1,97 1,92 18
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,94 1,93 1,88 19
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,91 1,90 1,84 20
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,88 1,87 1,81 21
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,85 1,84 1,78 22
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,82 1,81 1,76 23
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,80 1,79 1,73 24
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,78 1,77 1,71 25
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,76 1,75 1,69 26
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,74 1,73 1,67 27
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,73 1,71 1,65 28
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,71 1,70 1,64 29
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,70 1,68 1,62 30
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,59 1,58 1,51 40
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,87 1,78 1,74 1,69 1,63 1,58 1,52 1,51 1,44 50
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,48 1,47 1,39 60
70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,89 1,81 1,72 1,67 1,62 1,57 1,50 1,45 1,44 1,35 70
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,88 1,79 1,70 1,65 1,60 1,54 1,48 1,43 1,41 1,32 80
90 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99 1,94 1,86 1,78 1,69 1,64 1,59 1,53 1,46 1,41 1,39 1,30 90
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,77 1,68 1,63 1,57 1,52 1,45 1,39 1,38 1,28 100
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,37 1,35 1,25 120
Inf 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,24 1,22 1,00 Inf
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
Tabla F FQ1 ,Q 2 ,D P( FQ 1 ,Q 2 t FQ 1 ,Q 2 ,D ) D
D=0.025
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,6 963,3 968,6 976,7 984,9 993,1 997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3 1
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,49 39,50 2
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,08 14,04 13,99 13,96 13,95 13,90 3
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,51 8,46 8,41 8,36 8,32 8,31 8,26 4
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,28 6,23 6,18 6,12 6,08 6,07 6,02 5
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,12 5,07 5,01 4,96 4,92 4,90 4,85 6
Grados de libertad del denominador: Q2
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,41 4,36 4,31 4,25 4,21 4,20 4,14 7
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,95 3,89 3,84 3,78 3,74 3,73 3,67 8
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,61 3,56 3,51 3,45 3,40 3,39 3,33 9
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,37 3,31 3,26 3,20 3,15 3,14 3,08 10
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,23 3,17 3,12 3,06 3,00 2,96 2,94 2,88 11
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,02 2,96 2,91 2,85 2,80 2,79 2,72 12
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 2,95 2,89 2,84 2,78 2,72 2,67 2,66 2,60 13
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,84 2,79 2,73 2,67 2,61 2,56 2,55 2,49 14
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,70 2,64 2,59 2,52 2,47 2,46 2,40 15
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,68 2,63 2,57 2,51 2,45 2,40 2,38 2,32 16
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,62 2,56 2,50 2,44 2,38 2,33 2,32 2,25 17
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,56 2,50 2,44 2,38 2,32 2,27 2,26 2,19 18
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,51 2,45 2,39 2,33 2,27 2,22 2,20 2,13 19
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,41 2,35 2,29 2,22 2,17 2,16 2,09 20
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,18 2,13 2,11 2,04 21
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,14 2,09 2,08 2,00 22
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,11 2,06 2,04 1,97 23
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,27 2,21 2,15 2,08 2,02 2,01 1,94 24
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,05 2,00 1,98 1,91 25
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2,22 2,16 2,09 2,03 1,97 1,95 1,88 26
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,00 1,94 1,93 1,85 27
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 1,98 1,92 1,91 1,83 28
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,96 1,90 1,89 1,81 29
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,14 2,07 2,01 1,94 1,88 1,87 1,79 30
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,74 1,72 1,64 40
50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,22 2,11 1,99 1,93 1,87 1,80 1,72 1,66 1,64 1,55 50
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,88 1,82 1,74 1,67 1,60 1,58 1,48 60
70 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 2,14 2,03 1,91 1,85 1,78 1,71 1,63 1,56 1,54 1,44 70
80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,11 2,00 1,88 1,82 1,75 1,68 1,60 1,53 1,51 1,40 80
90 5,20 3,84 3,26 2,93 2,71 2,55 2,43 2,34 2,26 2,19 2,09 1,98 1,86 1,80 1,73 1,66 1,58 1,50 1,48 1,37 90
100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,08 1,97 1,85 1,78 1,71 1,64 1,56 1,48 1,46 1,35 100
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,45 1,43 1,31 120
Inf 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,30 1,27 1,00 Inf
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,75 5,74 5,65 7
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,96 4,95 4,86 8
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,41 4,40 4,31 9
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,01 4,00 3,91 10
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,71 3,69 3,60 11
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,47 3,45 3,36 12
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,27 3,25 3,17 13
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,11 3,09 3,00 14
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,98 2,96 2,87 15
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,86 2,84 2,75 16
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,76 2,75 2,65 17
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,68 2,66 2,57 18
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,60 2,58 2,49 19
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,54 2,52 2,42 20
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,48 2,46 2,36 21
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,42 2,40 2,31 22
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,37 2,35 2,26 23
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,33 2,31 2,21 24
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,29 2,27 2,17 25
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,25 2,23 2,13 26
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,22 2,20 2,10 27
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,19 2,17 2,06 28
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,16 2,14 2,03 29
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,13 2,11 2,01 30
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,94 1,92 1,80 40
50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,56 2,42 2,27 2,18 2,10 2,01 1,91 1,82 1,80 1,68 50
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,75 1,73 1,60 60
70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,45 2,31 2,15 2,07 1,98 1,89 1,78 1,70 1,67 1,54 70
80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,42 2,27 2,12 2,03 1,94 1,85 1,75 1,65 1,63 1,49 80
90 6,93 4,85 4,01 3,53 3,23 3,01 2,84 2,72 2,61 2,52 2,39 2,24 2,09 2,00 1,92 1,82 1,72 1,62 1,60 1,46 90
100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,37 2,22 2,07 1,98 1,89 1,80 1,69 1,60 1,57 1,43 100
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,56 1,53 1,38 120
Inf 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,36 1,32 1,00 Inf
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 100 120 Inf.
32
Comparación de dos tratamientos con R
33
1.2 K tratamientos
Análisis de la varianza 34
¿Existen diferencias entre las cuatro semillas?
A B C D
229.1 233.4 211.1 270.4
253.7 233.0 223.1 248.6
241.3 219.2 217.5 230.0
254.7 200.0 211.8 250.7
237.2 224.3 207.6 230.0
241.3 202.0 213.7 245.8
242.9 218.7 214.1 245.9
Análisis de la varianza 35
Método: 4 pasos
Análisis de la varianza 36
Modelo
V V V
...
P1 P2 PK
Normalidad
yij N(Pi,V2)
Homocedasticidad
Var [yij] = V2
Independencia
Cov [yij, ykl] = 0
Análisis de la varianza 38
Modelo: Hipótesis y Parámetros
Hipótesis básicas: Parámetros
Normalidad P1
yij N(Pi,V2) P2
Homocedasticidad
Var [yij] = V2
Independencia
PK
Cov [yij, ykl] = 0 V2
Análisis de la varianza 39
0
Análisis de la varianza 40
Estimación medias: Máxima Verosimilitud
n1
¦ y1 j
j 1
P1 : o y1x
n1
n2 A B C D
¦ y2 j 229.1 233.4 211.1 270.4
j 1 253.7 233.0 223.1 248.6
P 2 : o y 2x 241.3 219.2 217.5 230.0
n2
254.7 200.0 211.8 250.7
237.2 224.3 207.6 230.0
nK 241.3 202.0 213.7 245.8
¦ y Kj 242.9 218.7 214.1 245.9
j 1
P K : o yK x
nK
Análisis de la varianza 41
i 1j 1
V 2 : o sˆR2
nK sˆR2 142.4
Análisis de la varianza 42
Comparación de medias
H 0 : P1 P2 P K
H1 : Al menos una es diferente
Análisis de la varianza 43
Descomposición de la
variabilidad
¦ ¦ yij
yij Pi uij yij y ix ( yij y ix ) : restando y xx ,
n
yij y xx ( y ix y xx ) ( yij y ix )
elevando al cuadrado y sumando para todo i,j
K ni
(donde ¦ ¦ ( y ix y xx )( yij y ix ) 0)
i 1j 1
K ni K ni K ni
2
¦ ¦ ( yij y xx ) ¦ ¦ ( y ix y xx ) ¦ ¦ ( yij y ix ) 2
2
i 1j 1 i 1j 1 i 1j 1
K ni K K ni
2
¦ ¦ ( yij y xx ) ¦ ni ( y ix y xx ) ¦ ¦ ( yij y ix ) 2
2
i 1j 1 i 1 i 1j 1
Análisis de la varianza 44
Variabilidades
Variabilid ades Grados de libertad
K ni
VT ¦ ¦ ( yij y xx ) 2 n-1
i 1j 1
K
VE ¦ ni ( y ix y xx ) 2 K-1
i 1
K ni K ni
2 2
VNE ¦ ¦ ( yij y ix ) ¦ ¦ eij n-K
i 1j 1 i 1j 1
VT VE VNE
n 1 ( K 1) (n K )
Análisis de la varianza 45
Descomposición: ejemplo
y xx 230.4
Datos Medias Residuos
229.1 233.4 211.1 270.4 242.9 218.7 214.1 245.9 -13.8 14.8 -3.0 24.5
253.7 233.0 223.1 248.6 242.9 218.7 214.1 245.9 10.8 14.4 9.0 2.7
241.3 219.2 217.5 230.0 242.9 218.7 214.1 245.9 -1.6 0.6 3.4 -15.9
254.7 200.0 211.8 250.7
= 242.9 218.7 214.1 245.9
+ 11.8 -18.7 -2.3 4.8
237.2 224.3 207.6 230.0 242.9 218.7 214.1 245.9 -5.7 5.7 -6.5 -15.9
241.3 202.0 213.7 245.8 242.9 218.7 214.1 245.9 -1.6 -16.7 -0.4 -0.1
-1.3 3.0 -19.3 40.0 12.5 -11.7 -16.3 15.5 -13.8 14.8 -3.0 24.5
23.3 2.6 -7.3 18.2 12.5 -11.7 -16.3 15.5 10.8 14.4 9.0 2.7
10.9 -11.2 -12.9 -0.4 12.5 -11.7 -16.3 15.5 -1.6 0.6 3.4 -15.9
24.3 -30.4 -18.6 20.3
= 12.5 -11.7 -16.3 15.5
+ 11.8 -18.7 -2.3 4.8
6.8 -6.1 -22.8 -0.4 12.5 -11.7 -16.3 15.5 -5.7 5.7 -6.5 -15.9
10.9 -28.4 -16.7 15.4 12.5 -11.7 -16.3 15.5 -1.6 -16.7 -0.4 -0.1
yij y xx yi x y xx yij y i x
Análisis de la varianza 46
Variabilidades: ejemplo
Variabilid ades Grados de libertad
K ni
VT ¦ ¦ ( yij y xx ) 2 7645.5 n-1 23
i 1j 1
K
VE ¦ ni ( y i x y xx ) 2 4798.1 K-1 3
i 1
K ni
2
VNE ¦ ¦ eij 2847.4 n-K 20
i 1j 1
Análisis de la varianza 47
Interpretación gráfica de la
descomposición
y1x
y 2x
y ix y xx yij y i x
y 3x
y 4x
y xx yij y xx
Análisis de la varianza 48
Distribución de VE
2 V2
yij o N ( Pi , V ) y i x o N ( Pi , )
ni
V
Si P1 P 2 P K que llamaremos P
V2
yix o N (P , )
Pi ni
2 2 2
§ y1x P · § y 2x P · § y P·
¨ ¸ ¨ ¸ ¨ Kx ¸ o F K2
¨V / n ¸ ¨V / n ¸ ¨V / n ¸
© 1¹ © 2 ¹ © K ¹
2 2 2
§ y1x y xx · § y 2x y xx · § y y xx ·
¨ ¸ ¨ ¸ ¨ Kx ¸ o F K2 1
¨ V/ n ¸ ¨ V/ n ¸ ¨ V/ n ¸
© 1 ¹ © 2 ¹ © K ¹
Análisis de la varianza 49
Distribución de VNE
ni
¦ ( yij y ix ) 2
j 1 (ni 1) sˆi2
yij o N ( Pi ,V 2 ) sˆi2 o o F n2 1
ni 1 V 2 i
K ni n n nK
1 2
2
¦ ¦ ( yij y ix ) ¦ ( y1 j y1x ) ¦ ( y2 j y 2x ) ¦ ( y Kj y K x ) 2
2 2
i 1j 1 j 1 j 1 j 1
sˆR2
nK nK
(n1 1) sˆ12 (n2 1) sˆ22 (nK 1) sˆK2
nK
Análisis de la varianza 50
Contraste (Análisis de la Varianza)
H 0 : P1 P2 P K
H1 : Al menos una es diferente K
¦ ni ( yi x yxx ) 2
(n K ) sˆR2
x 2
o F n2 K x Si Ho es cierto : i 1
2
o F K2 1
V V
K 2
¦ ni ( y i x y x x )
F0 i 1 o FK 1, n K
2
( K 1) sˆR
F0 d FD No se rechaza H 0
F0 ! FD Se rechaza H 0
Análisis de la varianza 51
Suma de Grados de
Fuentes Cuadrados Libertad Varianzas F
¦ ni ( y i x y xx ) 2
Tratamient os ¦ ni ( y i x y xx ) 2 K 1 ¦ ni ( y i x y xx ) 2 /( K 1)
( K 1) sˆR2
Residual ¦ ¦ ( yij y i x ) 2 nK sˆ 2
R
Total ¦ ¦ ( yij y xx ) 2 n 1
Análisis de la varianza 52
Tabla de Análisis de la Varianza
Suma de Grados de
Fuentes Cuadrados Libertad Varianzas F
Análisis de la varianza 53
Análisis de la varianza 54
Intervalos de confianza
Análisis de la varianza 55
260
250
Rendimiento
240
230
220
210
200
A B C D
Semilla
Análisis de la varianza 56
Diferencia de medias: y1x y2x
V V
P1 P2
y11 ½ y21 ½
y12 °° V2 y22 ° ° V2
y1x o N ( P1 , ) y2x o N ( P 2 , )
¾ n1 ¾ ° n2
°
y1n1 °
¿ y2 n2 °
¿
V2 V2 ½
y1x y 2x o N ( P1 P 2 , )
°
n1 n2 °° ( y1x y 2x ) ( P1 P 2 )
( y1x y 2x ) ( P1 P 2 ) o t n K
o N (0,1) ¾ 1 1
1 1 ° sˆ R
V ° n1 n2
n1 n2 °¿
Análisis de la varianza 57
Contraste multiples
H 0 : Pi Pj
R.R. R.R
H1 : P i z P j tn-K
1-D
yi x y j x D/2
R. Acept. H0
D/2
tij o tn K
1 1 -tD/2 tD/2
sˆR
ni n j
t0 d tD / 2 No se rechaza H 0
t0 ! tD / 2 Se rechaza H 0
Análisis de la varianza 58
Diagnosis del modelo
Modelo
V V V
...
P1 P2 PK
Normalidad
yij N(Pi,V2)
Homocedasticidad
Var [yij] = V2
Independencia
Cov [yij, ykl] = 0
Análisis de la varianza 61
Residuos:
Normales y homocedásticos
yij Pi uij
uij yij P i eij yij yix
uij o N (0, V 2 )
Residuos
A B C D
-13,8
10,8
14,8
14,4
-3,0
9,0
24,5
2,7
V
-1,6 0,6 3,4 -15,9
11,8 -18,7 -2,3 4,8
-5,7 5,7 -6,5 -15,9
0
-1,6 -16,7 -0,4 -0,1
0,0 0,0 0,0 0,0
Análisis de la varianza 62
Comprobación de la
normalidad
Los residuos deben de tener distribución normal.
Las observaciones originales también, pero cada
grupo con media diferente, por ello es preciso
estimar el modelo para descontar a cada
observación su media y obtener valores con la
misma distribución.
Herramientas de comprobación:
Histograma de residuos
Gráfico de probabilidad normal (Q-Q plot)
Contrastes formales (Kolmogorov-Smirnov)
Análisis de la varianza 63
Análisis de la varianza 64
Gráfico prob. Normal
(ejemplo)
Orden Resid. Probab. Percen. Percen.
i eij (i-0.5)/n N(0,1) N(0,V )
Q-Q plot
1 -18,7 0,021 -2,04 -24,30
2 -16,7 0,063 -1,53 -18,30
3 -15,9 0,104 -1,26 -15,01 30,0
4 -15,9 0,146 -1,05 -12,58
5 -13,8 0,188 -0,89 -10,58
6 -6,5 0,229 -0,74 -8,85 20,0
7 -5,7 0,271 -0,61 -7,28
8 -3,0 0,313 -0,49 -5,83 10,0
Percentiles
9 -2,3 0,354 -0,37 -4,46
10 -1,6 0,396 -0,26 -3,15
0,0
11 -1,6 0,438 -0,16 -1,88
12 -0,4 0,479 -0,05 -0,62
13 -0,1 0,521 0,05 0,62 -10,0
14 0,6 0,563 0,16 1,88
15 2,7 0,604 0,26 3,15 -20,0
16 3,4 0,646 0,37 4,46
17 4,8 0,688 0,49 5,83
-30,0
18 5,7 0,729 0,61 7,28
19 9,0 0,771 0,74 8,85 -30,0 -20,0 -10,0 0,0 10,0 20,0 30,0
20 10,8 0,813 0,89 10,58 Residuos ordenados
21 11,8 0,854 1,05 12,58
22 14,4 0,896 1,26 15,01
23 14,8 0,938 1,53 18,30
24 24,5 0,979 2,04 24,30
Análisis de la varianza 65
99.9
99
Probabilidad
95
80
50
20
5
1
0.1
-30 -20 -10 0 10 20 30
Residuos
Análisis de la varianza 66
Ejemplos
99,9 99,9
99 99
95 95
80 80
50 50
20 20
5
1
Normal 5
1
No normal
0,1 0,1
-2,6 -1,6 -0,6 0,4 1,4 2,4 3,4 0 3 6 9 12 15
99,9 99,9
99 99
95 95
80 80
50 50
20 20
5
1 No normal
5
1
No normal
0,1 0,1
0 0,4 0,8 1,2 1,6 2 -3 -1 1 3 5
Análisis de la varianza 67
Comprobación de la homocedasticidad
Herramientas:
- Gráficos de residuos:
·Frente a valores previstos
·Frente a tratamientos (o factor,etc.)
- Contrastes formales:
Bartlett, Cochran, Hartley, Levene
Análisis de la varianza 68
Residuos - Valores previstos
30
20
En este modelo los valores
10
previstos corresponden a
residuos
0
la dispersión aumenta
-10 conforme la media crece.
-20
-30
0 5 10 15
Valores previstos
Análisis de la varianza 69
15
máx.
Residuos
mín.
-5
-15
-25
A B C D
Semilla
En cada grupo los residuos aparecen esparcidos
con dispersión similar y media cero.
Análisis de la varianza 70
Residuos por tratamientos
25
15
máx.
Residuos
mín.
5
máx
-5 3
mín
-15
-25
A B C D
Semilla
En cada grupo los residuos aparecen esparcidos
con dispersión similar y media cero.
Análisis de la varianza 71
Contrastes formales
V2 VK
V1
...
P1 P2 PK
H 0 : V 12 V 22 V K2
H1 : Alguna es distinta
Análisis de la varianza 72
Contrastes formales
Análisis de la varianza 73
0,37 0,37
residuos
residuos
0,17 0,17
-0,03 -0,03
-0,23 -0,23
-0,43 -0,43
0 0,3 0,6 0,9 1,2 1 2 3
99,9
99
Homocedasticidad
probabilidad
95
80
50
20
5
1 Normalidad
0,1
-0,33 -0,13 0,07 0,27 0,47
residuos
Gráfico probabilista normal
99,9
99
probabilidad
95
80
50
20
5
1
0,1
-0,33 -0,13 0,07 0,27 0,47
residuos
Análisis de la varianza 75
· 1/x
· log(x)
· x2 (u otras transformaciones xp)
· x
Análisis de la varianza 76
Transformaciones Box-Cox
z ij1,5 p>1
p=1
1
0,5 p<1
0 yij
1
-0,5
-1
yijp 1
z ij
-1,5 p
z ij log yij si p 0
Análisis de la varianza 77
Búsqueda de la
transformación adecuada
0,57
0,37 La dispersión
aumenta al aumentar
residuos
0,17
-0,03 la media
-0,23
-0,43
0 0,3 0,6 0,9 1,2
p<1
Valores previstos
1,6
1,1
0,6
La dispersión
residuos
0,1 disminuye al
-0,4 aumentar la media
-0,9
-1,4
0 4 8 12 16 p>1
valores previstos
Análisis de la varianza 78
p
Elección de la transformación zij yij
Empezar con p=1 (datos sin transformar) y
decidir a partir de los gráficos si p>1 o
p<1.
p 1/ 2 z ij yij
°
° p 0 z ij log yij
° 1
° p 1 / 2 z ij
p 1 o ® yij
° 1
° p 1 z ij
° yij2
°
¯
Análisis de la varianza 79
Independencia
Es la hipótesis fundamental y con diferencia la más
importante de las tres, además es la más difícil de
comprobar.
Análisis de la varianza 80
Aleatorización
Análisis de la varianza 81
¿Cómo aleatorizar?
Asignar las unidades experimentales al azar a
los distintos tratamientos.
Aleatorizar el orden de ejecución de los
experimentos.
Aleatorizar respecto a cualquier otra variable
que implique diferenciar a los tratamientos.
“La aleatorización es una precaución contra distorsiones
que pueden ocurrir o no ocurrir, y que pudieran ser
serias o no si llegaran a ocurrir”
Análisis de la varianza 82
¿Cómo aleatorizar?
Análisis de la Varianza 83
Ejemplos:
Análisis de la Varianza 84
Ejemplo 1: Centeno
Análisis de la Varianza 85
Análisis de la Varianza 86
Intervalos de confianza: Centeno
> source('ICplot.R')
> ICplot(mod, ‘Sem')
250
medias
230
210
A B C D
Sem
Análisis de la Varianza 87
Análisis de la Varianza 88
Diagnosis: Centeno
Standardized residuals
19 19
2
Residuals
0 10
1
0
-1
-20
12 12
10 10
Constant Leverage:
Scale-Location Residuals vs Factor Levels
1.5
Standardized residuals
Standardized residuals
19
19
2
10
12
1.0
1
0
0.5
-1
12
0.0
10
-2
centeno$Sem :
215 220 225 230 235 240 245 C B A D
Análisis de la Varianza 89
Análisis de la Varianza 90
ANOVA Ejemplo 2: Datos de Heyl
Análisis de la Varianza 91
Análisis de la Varianza 92
Comparaciones múltiples: Datos de Heyl
Comparaciones 2 a 2
Análisis de la Varianza 93
Comparaciones 2 a 2
Análisis de la Varianza 94
Diagnosis: Datos de Heyl
Análisis de la Varianza 95
Análisis de la Varianza 96
Ejemplo 3: Combustión de distintos tipos de
fibra
Análisis de la Varianza 97
Análisis de la Varianza 98
Ejemplo 3: Combustión de distintos tipos de
fibra
Comparaciones múltiples. El mayor tiempo de combustión,
significativamente distinto a los anteriores: fibra A. En media
la C es la que tiene menor tiempo de combustión, pero no
significativamente distinta a la B y D.
Análisis de la Varianza 99
Ejemplos:
H 0 : V MICHELSON
2
V NEWCOMB
2
H1 : V MICHELSON
2
z V NEWCOMB
2
1. En una fábrica de automóviles se utiliza una misma planta para el ensamblaje de tres modelos
distintos (A, B y C). Para determinar si los modelos reciben el mismo tratamiento, se ha
realizado un control de calidad a una muestra tomada para cada modelo. El número de
defectos encontrados para cinco vehı́culos del modelo A son 5, 4, 6, 6 y 7; para seis vehı́culos
del modelo B son 7, 8, 6, 7, 6 y 5; y para ocho vehı́culos del modelo C: 9, 7, 8, 9, 10, 11, 10 y
10. Contrastar si existen diferencias en el tratamiento que se da a los distintos modelos.
1
2. Una empresa debe elegir entre cinco procedimientos para fabricar un cierto producto quı́mico.
Se sospecha que existen diferencias entre ellos aunque pequeñas. Para detectar estas diferen-
cias se pretende realizar un experimento a gran escala con el mismo número de observaciones
en cada grupo. Para determinar este tamaño muestral se ha realizado un experimento piloto
con 6 observaciones de cada método y los resultados (medias de cada grupo) han sido los
siguientes:
METODO 1 2 3 4 5
Media 425.6 423.2 418.8 430.2 422.2
y la varianza residual ŝ2R = 198.5.
(a) ¿ Cúal debe ser el tamaño muestral del experimento a gran escala para que el contraste
de análisis de la varianza sea significativo con α = 0.01 si el coeficiente de determinación
es igual al del experimento piloto?.
(b) El método A es el procedimiento habitual y el método D es el que se sospecha propor-
ciona mejor rendimiento. Una hipótesis que se pretende contrastar es H0 : µD = µA ,
frente a la hipótesis alternativa H1 : µD > µA . ¿ Qué condición debe cumplir la difer-
encia entre las medias muestrales de los dos métodos para rechazar H0 con α = 0.01?
2
(a) Contrastar (α = 0.05) la hipótesis
H0 : µA = µB = µC = µD = µE
frente a la hipótesis alternativa,
7. Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren
significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un quı́mico
hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos
han sido
Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.29 23.38
La tabla de análisis de la varianza se proporciona a continuación. Comparar las medias de
los cinco tratamientos con nivel de significación total αT = 0.10.
3
Análisis de la varianza
Fuente Variabilidad g.l. Var. Media F Nivel crı́tico
Lote 0.096976 4 0.024244 5.54 0.0036
Residuos 0.08760 20 0.00438
Total 0.184576 24
4
2. Diseño de Experimentos
Diseño de experimentos:
Diseños Factoriales
Bloques Aleatorizados
Formas de realizar un experimento
Diseño Experimentos 3
Diseño Experimentos 5
Comandos en R
ARCHIVO TEXTO: venenos.txt
Diseño Experimentos 6
Modelo
Factor 1
1 2 I
y111 y 211 y I 11 yijk P D i E j DE ij uijk
y112 y 212 y I 12
1
•Normalidad
Factor 2
y11m y 21m y I 1m
y121 y 221 y I 21 •Independencia
2
y122 y 222
y I 22 •Homocedasticidad
y12 m y 22 m y I 2m IuJ tratamientos
y1J 1 y2 J 1 y IJ 1 m replicaciones
y1J 2 y2 J 2 y IJ 2
J
n = muIuJ
y1Jm y 2 Jm y IJm
Diseño Experimentos 7
Factor 1
1 2 ... I
1
V V
... V
P D1 E1 DE11 P D 2 E1 DE 21 P D I E1 DE I 1
V V
... V
Factor 2
2
P D1 E 2 DE12 P D 2 E 2 DE 22 P D I E 2 DE I 2
J
V V
... V
P D1 E J DE1J P D 2 E J DE 2 J P D I E J DE IJ
Modelo
yijk P D i E j DE ij uijk
¦iI 1Di 0 ¦ Jj 1 E j 0 ¦i
I
1 DE ij 0, j
¦ Jj 1DE ij 0, i
P : Media global
Di : Efecto del Factor 1 i, i=1,...,I
Ej : Efecto del Factor 2 j, j=1,...,J
DEij: Interacción de niveles ij
uijk : Componente aleatoria N(0,V2), k=1,…m
Diseño Experimentos 9
m J m I m I J m
¦y ijk ¦¦ y
j 1 k 1
ijk ¦¦ y ijk ¦¦¦ y
i 1 j 1 k 1
ijk
k 1 i 1 k 1
y ij x y ixx y x jx y xxx
m mJ mI n
Diseño Experimentos 10
Estimación del modelo
yijk P D i E j DE ij uijk
g.l.=IJm-IJ=IJ(m-1)
Diseño Experimentos 11
Estimación
ANTÍDOTO
A B C D
0.31 0.82 0.43 0.45
V 0.45 1.10 0.45 0.71
I
0.46 0.88 0.63 0.66
E 0.43 0.72 0.72 0.62
0.41 0.88 0.56 0.61
N 0.36 0.92 0.44 0.56
0.29 0.61 0.35 1.02
II
E 0.40 0.49 0.31 0.71
0.23 1.24 0.40 0.38
N 0.32 0.82 0.38 0.67
0.22 0.30 0.23 0.30
O 0.21 0.37 0.25 0.36
III
0.18 0.38 0.24 0.31
S 0.23 0.29 0.22 0.33
0.21 0.34 0.24 0.33
Diseño Experimentos 12
Estimación
A
ANTÍDOTO
B C D Medias D̂ i
0,31 0,82 0,43 0,45
0,45 1,10 0,45 0,71
V I 0,46 0,88 0,63 0,66 0,615 0,136
0,43 0,72 0,72 0,62
E Medias 0,41 0,88 0,56 0,61
N
DE ij -0,038
0,36
0,067
0,92
0,032
0,44
-0,061
0,56
0,29 0,61 0,35 1,02
E II 0,40 0,49 0,31 0,71 0,544 0,066
0,23 1,24 0,40 0,38
N Medias 0,32 0,82 0,38 0,67
DE ij -0,060 0,073 -0,080 0,068
O 0,22 0,30 0,23 0,30
0,21 0,37 0,25 0,36
S III 0,18 0,38 0,24 0,31 0,276 -0,202
0,23 0,29 0,22 0,33
Medias 0,21 0,34 0,24 0,33
DE ij 0,098 -0,139 0,048 -0,007
Medias 0,314 0,677 0,389 0,534 0,479
Ê j -0,164 0,198 -0,089 0,056
Diseño Experimentos 13
Diseño Experimentos 14
Residuos
RESIDUOS
ANTÍDOTO
eijk yijk yij x
¦e
A B C D
V
I
-0.103
0.038
-0.060
0.220
-0.128
-0.108
-0.160
0.100 ijk 0
0.048 0.000 0.073 0.050
E 0.018 -0.160 0.163 0.010
k
0.00 0.00 0.00 0.00
N 0.040 0.105 0.065 -0.108
-0.030 -0.205 -0.025 0.353
II
E 0.080 -0.325 -0.065 0.043
-0.090 0.425 0.025 -0.288
Vˆ 2
sˆ 2 ¦¦¦ e 2
ijk
0,022
N 0.00 0.00 0.00 0.00 IJ (m 1)
R
Diseño Experimentos 15
Diseño Experimentos 16
Descomposición de la variabilidad
VT VE ( A) VE ( B) VE ( A u B) VNE
(n 1) ( I 1) ( J 1) ( I 1)( J 1) IJ (m 1)
DATOS MODELO
Diseño Experimentos 17
Variabilidades
I J m
VT ¦¦¦(y
i 1 j 1 k 1
ijk y xxx ) 2
I I
VE ( A) mJ ¦ ( y i xx y xxx ) 2
mJ ¦ (Dˆ i ) 2
i 1 i 1
J I
VE ( B ) mI ¦ ( y x j x y xxx ) 2 mI ¦ ( Eˆi ) 2
j 1 i 1
I J
VE ( A u B ) m¦ ¦ (DE ij ) 2
i 1 j 1
I J m I J m
VNE ¦¦¦(y
i 1 j 1 k 1
ijk y ij x ) 2
¦ ¦ ¦ (e
i 1 j 1 k 1
ijk )2
Diseño Experimentos 18
Descomposición de la
variabilidad
Diseño Experimentos 19
Análisis de la varianza
yijk P D i E j DEij uijk yijk Pˆ Dˆ i Eˆ j DE ij eijk
yijk y xxx ( y ixx y xxx ) ( y x j x y xxx ) ( y ij x y ixx y x j x y xxx ) ( yijk y ij x )
yijk y xxx ( y ixx y xxx ) ( y x j x y xxx ) ( y ij x y ixx y x j x y xxx ) eijk
I J m I J m I J m
¦¦ ¦ ( y
i 1 j 1 k 1
ijk y xxx ) 2 ¦¦¦ ( y
i 1 j 1 k 1
i xx y xxx ) 2 ¦¦¦ ( y x j x y xxx ) 2
i 1 j 1 k 1
I J m I J m
¦¦¦ ( y ij x y ixx y x j x y xxx ) 2 ¦¦¦ eijk2
i 1 j 1 k 1 i 1 j 1 k 1
I J m I J
¦¦ ¦ ( yijk y xxx )2
i 1 j 1 k 1
mJ ¦ ( y ixx y xxx ) 2 mI ¦ ( y x j x y xxx ) 2
i 1 j 1
I J I J m
m¦¦ ( y ij x y ixx y x j x y xxx ) ¦¦¦ eijk2 2
i 1 j 1 i 1 j 1 k 1
Diseño Experimentos 20
Contraste de Hipótesis
Si el Veneno no influye, los I niveles son iguales
a efectos de tiempo de supervivencia, entonces
D1 D 2 D I ¦iI 1Di 0
H 0 : D1 D 2 DI 0
H1 : Algún D i es distinto de 0
Diseño Experimentos 21
H 0 : D1 D 2 DI 0
H1 : Algún D i es distinto de 0
VNE
sˆR2 o E[ sˆR2 ] V 2
IJ (m 1)
VE ( A)
Si Ho es cierto, sˆ A2 o E[ sˆ A2 ] V 2
I 1
I
sˆ 2 mJ ¦ ( y i xx y xxx ) 2 I 1
FA A
2
i 1
2
o FI 1; IJ ( m 1)
sˆ R sˆ R
Si FA ! FD Se rechaza Ho
Diseño Experimentos 22
Contraste efecto principal de factor B
H 0 : E1 E2 E J 0
H1 : Algún E j es distinto de 0
VE ( B)
Si Ho es cierto, sˆ 2
o E[ sˆB2 ] V 2
J 1
B
J
2 mI ¦ ( y x j x y xxx ) 2 J 1
sˆ j 1
FB B
2 2
o FJ 1; IJ ( m 1)
sˆ R sˆ R
Si FB ! FD Se rechaza Ho
Diseño Experimentos 23
2
sˆ AB
FAB 2
o F( I 1)( J 1); IJ ( m 1)
sˆR
Si FAB ! FD Se
rechaza
Ho
A y B interaccio nan
Diseño Experimentos 24
Tabla de análisis de la varianza
Fuentes Suma de Grados de
Variabilid ad Cuadrados Libertad. Varianza F p valor
2
sˆ
mJ ¦ ( y ixx y xxx )
A
2 2
A I 1 sˆ A sˆR2 pA
sˆB2
B mI ¦ ( y x j x y xxx ) 2
J 1 sˆB2 sˆR2 pB
2
sˆ AB
AuB m¦¦ ( yij x y ixx y x j x y xxx ) 2
( I 1)( J 1) 2
sˆ AB sˆR2 p AB
Residual ¦¦¦ e 2
ijk IJ (m 1) sˆR2
Diseño Experimentos 25
Tabla ANOVA
Diseño Experimentos 26
Interpretación
La interacción no es significativa
Diseño Experimentos 27
H 0 : Di Dj R.R. R.R
tIJ(m-1)
H1 : D i z D j
1-D
D/2 D/2
Dˆ i y i xx y xxx ½
¾ Dˆ i Dˆ j y i xx y j xx R. Acept. H0
Dˆ j y j xx y xxx ¿
-tD/2 tD/2
V2 V2
Dˆ i Dˆ j o N (D i D j , )
mJ mJ
y i xx y j xx yixx y j xx ! tD / 2 sˆR
2
o t IJ ( m 1)
mJ
2
sˆR
LSD
mJ Se rechaza Ho
Diseño Experimentos 28
Contrastes múltiples: Factor B
H 0 : Ei Ej R.R. R.R
tIJ(m-1)
H1 : E i z E j 1-D
D/2 D/2
Eˆi y xi x y xxx ½
¾ Eˆ i Eˆ j y xi x y x j x R. Acept. H0
Eˆ j y x j x y xxx ¿
-tD/2 tD/2
V2 V2
Eˆi Eˆ j o N ( E i E j , )
mI mI
yxi x y x j x yxix yx j x ! tD / 2 sˆR
2
o t IJ ( m 1)
mI
2
sˆR LSD
mI Se rechaza Ho
Diseño Experimentos 29
Intervalos de confianza
(interacción nula)
sˆR
P D i y i xx r tD / 2
mJ
sˆR
P E i y x j x r tD / 2
mI
Diseño Experimentos 30
Intervalos de Confianza
> source('ICplot.R')
> par(mfrow = c(1,2))
> ICplot(mod_box, 'VEN')
> ICplot(mod_box, 'ANT')
0.7
0.7
0.6
0.6
0.5
medias
medias
0.5
0.4
0.4
0.3
0.3
0.2
I II III A B C D
VEN ANT
Diseño Experimentos 31
Comparaciones Múltiples
Diseño Experimentos 32
Comparaciones Múltiples
Diseño Experimentos 33
Interacción
En este ejemplo NO se debe interpretar
porque no es significativa.
¿Cómo se haría?
Diseño Experimentos 34
Diagnosis: Sobre residuos
Normalidad
Homocedasticidad
Independencia
Diseño Experimentos 35
Diagnosis
Diseño Experimentos 36
Diseño Experimentos 37
Diagnosis: homocedasticidad
Diseño Experimentos 38
Homocedasticidad
Diseño Experimentos 39
Normalidad
Diseño Experimentos 40
Conclusión:Transformar
log y
1/y
Sqrt(y)
Diseño Experimentos 41
Transformación 1/y
Diseño Experimentos 42
Diagnosis: homocedasticidad
datos transformados z=1/y
Diseño Experimentos 43
Homocedasticidad
datos transformados z=1/y
Diseño Experimentos 44
Normalidad
datos transformados z=1/y
Diseño Experimentos 45
Comparaciones múltiples
intervalos de confianza
Diseño Experimentos 46
Diseño Experimentos 47
Ejercicio
Un investigador quiere estudiar el efecto del sexo (H, M) y
tipo de formación (ciencias, letras) en el dominio del inglés
escrito en profesores universitarios. Para ello se analiza el
nº de incorrecciones gramaticales en artículos científicos
enviados a publicación. Para combinación de niveles de los
factores se han elegido al azar tres profesores. En la tabla
se proporciona el nº de fallos detectados en artículos de 15
páginas. ¿Qué conclusiones pueden extraerse?.
Letras Ciencias
Diseño Experimentos 48
Comandos en R
ARCHIVO TEXTO: ciencias.txt
> view(error)
> attach(error)
> names(error)
> error
Diseño Experimentos 49
Estimación
Diseño Experimentos 50
Descomposición variabilidad
Diseño Experimentos 51
Análisis de la Varianza
Diseño Experimentos 52
Interacción:
En este ejemplo es significativa.
Diseño Experimentos 53
Normalidad
Homocedasticidad
Independencia
Diseño Experimentos 54
Diagnosis
Diseño Experimentos 55
Diseño Experimentos 56
Bloques Aleatorizados
Ejemplo de introducción
Fluorita
0% 1% 2% 3% 4%
M 1 15.02 11.86 9.94 12.45 13.23
e 2 8.42 10.15 8.54 6.98 8.93
z 3 18.31 16.84 15.86 14.64 15.96
c 4 10.49 10.52 8.04 10.50 10.34
l 5 9.78 9.59 6.96 8.15 9.24
a 6 9.28 8.84 7.04 6.66 9.46
Diseño Experimentos 58
> fluorita = read.table('fluorita.txt', header = T)
> attach(fluorita)
> FLUO = factor(fluo)
> MEZ = factor(mez)
> fluorita
Diseño Experimentos 59
Modelo
Tratamientos
1 2 I yij P D i E j uij
1 y11 y21 y I 1
•Normalidad
Bloques
2 y12 y22 y I 2
•Independencia
J y1J y2 J y IJ •Homocedasticidad
P : Media global
Di : Efecto del tratamiento i, i=1,...,I ¦iI 1Di 0
Ej : Efecto del bloque j, j=1,2,...,J ¦ Jj 1 E j 0
uij : Componente aleatoria N(0,V2)
Diseño Experimentos 60
Tratamientos
1 2 ... I
1
V V
... V
P D1 E1 P D 2 E1 P D I E1
V V
... V
Bloques
2
P D1 E 2 P D2 E2 P D I E2
J
V V
... V
P D1 E J P D2 E J P DI EJ
Diseño Experimentos 62
Estimación
1 2 I Eˆ j
1 y11 y 21 yI1 y x1 y x1 y xx
2 y12 y 22 yI 2 y x2 y x 2 y xx
J y1J y2 J y IJ yxJ y x J y xx
y 1x y 2x yIx y xx
Dˆ i y 1x y xx y 2 x y xx y I x y xx
Diseño Experimentos 63
Estimación (ejemplo)
Fluorita
0% 1% 2% 3% 4%
M 1 15.02 11.86 9.94 12.45 13.23 12.50 1.77
e 2 8.42 10.15 8.54 6.98 8.93 8.60 -2.13
z 3 18.31 16.84 15.86 14.64 15.96 16.32 5.59 Ej
c 4 10.49 10.52 8.04 10.50 10.34 9.98 -0.76
l 5 9.78 9.59 6.96 8.15 9.24 8.74 -1.99
a 6 9.28 8.84 7.04 6.66 9.46 8.26 -2.48
11.88 11.30 9.40 9.90 11.19 10.73
1.15 0.57 -1.34 -0.84 0.46
Di
Diseño Experimentos 64
Residuos: Varianza residual
eij yij Pˆ Dˆ i Eˆ j yij y i x y x j y xx
Fluorita
0% 1% 2% 3% 4%
M 1 1.37 -1.21 -1.22 0.79 0.27
e 2 -1.33 0.98 1.27 -0.79 -0.13
z 3 0.84 -0.05 0.88 -0.84 -0.82
c 4 -0.64 -0.02 -0.60 1.36 -0.10
l 5 -0.11 0.28 -0.45 0.24 0.04
a 6 -0.13 0.02 0.12 -0.76 0.74
¦ ¦ eij2 17.51
sˆR2 0.88
( I 1)( J 1) 20
Diseño Experimentos 65
Estimación
Diseño Experimentos 66
Variabilidades
I J
VT ¦¦ ( y
i 1 j 1
ij y xx ) 2
I
VE (T ) J ¦ ( y i x y xx ) 2
i 1
J VT VE (T) VE (B) VNE
VE ( B ) I ¦ ( y x j y xx ) 2
j 1
I J (n 1) ( I 1) ( J 1) ( I 1)( J 1)
VNE ¦¦ eij2
i 1 j 1
Diseño Experimentos 67
Descomposición de la variabilidad
Diseño Experimentos 68
Análisis de la varianza
¦¦ ( y
i 1 j 1
ij y xx ) 2
¦¦ ( y
i 1 j 1
ix y xx ) ¦¦ ( y x j y xx ) ¦¦ eij2
2
i 1 j 1
2
i 1 j 1
I J I J I J
¦¦ ( y
i 1 j 1
ij y xx ) 2
J ¦ ( y ix y xx ) I ¦ ( y x j y xx ) ¦¦ eij2
i 1
2
j 1
2
i 1 j 1
Diseño Experimentos 69
Contraste de Hipótesis
Si la Fluorita no influye, los I tratamientos
son iguales a efectos de coste, entonces
D1 D 2 D I ¦iI 1Di 0
H 0 : D1 D 2 DI 0
H1 : Algún D i es distinto de 0
Diseño Experimentos 70
Contraste sobre tratamientos
H 0 : D1 D 2 DI 0
H1 : Algún D i es distinto de 0
VNE
sˆR2 o E[ sˆR2 ] V 2
( I 1)( J 1)
VE (Tratamient os)
Si Ho es cierto, sˆT2 o E[ sˆT2 ] V 2
I 1
I
J ¦ ( y i x y xx ) 2 I 1
sˆT2 i 1
FT o FI 1;( I 1)( J 1)
sˆR2 sˆR2
Si FT ! FD Se rechaza Ho
Diseño Experimentos 71
yi1 yi 2 yiJ JP ¦ Jj 1 E j
yix , E[ y i x ] P
J J
V2
y1x , y 2x ,..., y I x o N ( P , )
J
I ª I 2º
J ¦ ( y i x - y xx )2 « J ¦ ( y i x - y xx ) »
y1x y 2x y I x
y xx sˆT2 i 1
E« i 1 » V2
I I 1 « I 1 »
«¬ »¼
Diseño Experimentos 72
Contraste de bloques
H 0 : E1 E2 E J 0
H1 : Algún E j es distinto de 0
VE (Bloques)
Si Ho es cierto, sˆB2 o E[ sˆB2 ] V 2
J 1
J
I ¦ ( y x j y xx ) 2 J 1
sˆB2 j 1
FB o FJ 1;( I 1)( J 1)
sˆR2 sˆR2
Si FB ! FD Se rechaza Ho
Diseño Experimentos 73
sˆB2
2
Bloque I ¦ ( y x j y xx ) J 1 sˆB2 sˆR2 pB
Total ¦ ¦ ( yij y xx ) 2 n -1
Diseño Experimentos 74
Tabla ANOVA
Diseño Experimentos 75
Intervalos de confianza
(ejemplo)
sˆR
P D i y i x r tD / 2
J
Diseño Experimentos 76
Intervalos de Confianza (% Fluorita)
> source('ICplot.R')
> ICplot(mod_flu, "FLUO")
12
medias
11
10
9
0 1 2 3 4
FLUO
Diseño Experimentos 77
12
10
8
1 2 3 4 5 6
MEZ
Diseño Experimentos 78
Contraste multiples: tratamientos
H 0 : Di Dj R.R. R.R
t(I-1)(J-1)
H1 : D i z D j
1-D
Dˆ i y i x y xx ½ D/2 D/2
¾ Dˆ i Dˆ j yix y jx R. Acept. H0
Dˆ j y j x y xx ¿
-tD/2 tD/2
V2 V2
Dˆ i Dˆ j o N (D i D j , )
J J
yi x y j x 2
o t( I 1)( J 1) y i x y j x ! tD / 2 sˆR Se rechaza H 0
2
J
sˆR
J LSD
Diseño Experimentos 79
H 0 : Ei Ej R.R. R.R
t(I-1)(J-1)
H1 : E i z E j
1-D
Eˆi y xi y xx ½° D/2 D/2
¾ Eˆi Eˆ j y xi y x j R. Acept. H0
Eˆ j y x j y xx °¿
-tD/2 tD/2
V2 V2
Eˆi Eˆ j o N ( E i E j , )
I I
yxi yx j 2
o t( I 1)( J 1) y xi y x j ! tD / 2 sˆR Se rechaza H 0
2
I
sˆR
I LSD
Diseño Experimentos 80
Comparación de medias
Fluorita LSD = 1.13
0% 1% 2% 3% 4%
2
LSD tD / 2 sˆR 0% 0 0,58 2,49 1,99 0,69
J 1% 0 1,90 1,40 0,11
2% 0 -0,50 -1,80
2
2.085 u 0.93 u 3% 0 -1,30
6 4% 0
1.13
LSD=1.24
Mezcla 1 2 3 4 5 6
2 1 0,00 3,90 -3,82 2,52 3,76 4,24
LSD tD / 2 sˆR 2 0 6,60 -1,37 -0,14 -0,35
I 3 0 6,34 7,58 8,07
2 4 0 1,23 1,72
2.085 u 0.93 u
5 5 0 0,49
1.24 6 0
Diseño Experimentos 81
-4 -2 0 2
Diseño Experimentos 82
Comparación de medias (Tukey)
95% family-wise confidence level
2-1
4-1
6-1
4-2
6-2
5-3
5-4
6-5
-10 -5 0 5 10
Diseño Experimentos 83
Sin bloques
El % de FLUORITA no es SIGNIFICTIVO.
No se detectan diferencias
La Varianza residual es muy grande (10.6113)
Diseño Experimentos 84
Diagnosis: 2
1.5
Homocedasticidad 1
0.5
0
-0.5
Gráfico de residuos -1
-1.5
2 -2
1.5 0 1 2 3 4 5 6
1 Mezcla
0.5
0 1.6
-0.5 1.2
-1 0.8
residuos
-1.5 0.4
-2 0
0 1 2 3 4 -0.4
Fluorita -0.8
-1.2
-1.6
5 10 15 20
Valores previstos
Diagnosis: normalidad
99.9
99
probabilidad
95
80
50
20
5
1
0.1
-1.4 -0.9 -0.4 0.1 0.6 1.1 1.6
residuos
Diseño Experimentos 86
Diagnosis
Normalidad
Homocedasticidad
Diseño Experimentos 87
Apéndice
Diseño Experimentos 88
Diseños factoriales
(tres factores)
T=NAxNBxNc
B3 Efectos principales 3 A, B , C
B4 Interacciones de orden dos 3
B5 AxB, AxC, BxC
C1 Interacción de orden tres 1.
C2
C3 AxBxC
Diseño Experimentos 91
Datos Factor 1 1
Factor 3
2 ... K
11 22 ...
II
11 22 ...... K
K 11 22 ...... K
K 11 22 ...
... K
K
y1111 y1121 y11K 1 y 2111 y 2121 y11K 1 y I 111 y I 121 y I 1K 1
11 y1112 y1122 y11K 2 y 2112 y 2122 y11K 2 y I 112 y I 122 y I 1K 2
y111M y112M y11KM y 211M y 212M y11KM y I 11M y I 12M y I 1KM
Factor 2
11 22 ...... K
K 11 22 ...... K
K 11 22 ...
... KK
y1211 y1221 y12 K 1 y 2211 y 2221 y 22 K 1 y I 211 y I 221 y I 2 K1
2 y1212 y1222 y12 K 2 y 2212 y 2222 y 22 K 2 y I 212 y I 222 yI 2K 2
y121M y122M y12 KM y 221M y 222M y 22 KM y I 21M y I 22M y I 2 KM
...
11 22 ...... K
K 11 22 ...
... KK 11 22 ...... K
K
y1J 11 y1J 21 y1JK1 y 2 J 11 y 2 J 21 y 2 JK1 y IJ 11 y IJ 21 y IJK1
JJ y1J 12 y1J 22 y1JK 2 y 2 J 12 y 2 J 22 y 2 JK 2 y IJ 12 y IJ 22 y IJK 2
y1J 1M y1J 2 M y1JKM y 2 J 1M y2 J 2M y 2 JKM y IJ 1M y IJ 2 M y IJKM
Diseño Experimentos 92
Ejemplo: Proceso químico
Tres factores: Concentración
1 4% C-1
Catalizador
Ag
Temperatuta
T-1 300º C
2 6% C-2 Ag+Zn T-2 320º C
3 8% C-3 Zn
4 10%
Variable respuesta: Rendimiento del proceso químico.
CONCENTRACIÓN
1 2 3 4
T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-2
72.2 65.0 74.4 69.2 75.0 70.7 80.0 73.0
C-1 74.4 71.6 66.3 71.8 78.9 80.6 65.0 74.4
64.3 61.9 66.5 64.6 64.3 73.4 82.1 78.8
CATALIZADOR
Tres replicaciones
Diseño Experimentos 93
Modelo
yijkm P D i E j J k DE ij DJ ik EJ jk DEJ ijk uijkm
¦i 1D i
I
0 ¦ Jj 1DE ij 0, i ¦iI 1DE ij 0, j
¦i 1DJ ik 0, k
I
¦ ¦k 1DJ ik 0, i
K
j 1E j
J
0
¦k 1 EJ jk 0, j
K
¦ ¦ j 1 EJ jk 0, k
J
k 1J k
K
0
I u J u K tratamientos
•Normalidad
uijkm •Independencia M replicaciones
•Homocedasticidad n = IuJuKuM
Diseño Experimentos 94
Medias
yijkm P D i E j J k DE ij DJ ik EJ jk DEJ ijk uijkm
I J K M
¦ ¦ ¦ ¦ yijk
i 1 j 1k 1m 1
y xxxx
IJKM
J K M I K M I J M
¦¦ ¦ yijkm ¦ ¦ ¦ yijkm ¦ ¦ ¦ yijkm
j 1k 1m 1 i 1 k 1m 1 i 1 j 1m 1
y i xxx y x j xx y xx k x
JKM IKM IJM
K M J M I K
¦ ¦ yijkm ¦ ¦ yijkm ¦ ¦ yijkm
k 1m 1 j 1m 1 i 1k 1
y ijxx y ixk x y x jk x
KM JM IM
M
¦ yijkm
m 1
y ijk x
M
Diseño Experimentos 95
1 2 3 4
T-1 68.72 70.49 76.64 76.22 73.02
Temperatura T-2 70.99 77.61 83.46 80.71 78.19
69.9 74.1 80.1 78.5 75.6
T-1 T-2
C-1 71.95 71.25 71.6
C-2 72.96 80.89 76.9
C-3 74.15 82.43 78.3
73.02 78.19 75.6
1 2 3 4
T-1 T-2 T-1 T-2 T-1 T-2 T-1 T-2
C-1 70.30 66.17 69.07 68.53 72.73 74.90 75.70 75.40
C-2 66.50 75.53 70.43 78.20 81.47 85.33 73.43 84.50
C-3 69.37 71.27 71.97 86.10 75.73 90.13 79.53 82.23
Diseño Experimentos 96
Estimación del modelo
Pˆ y xxxx
Dˆ i y ixxx y xxxx o I 1
Eˆ j y x j xx y xxxx o J 1
Jˆ k y x x k x y x xx x o K 1
DE ij y ijxx y i xxx y x j xx y xxxx o ( I 1)( J 1)
DJ ik y i x k x y i x xx y xx k x y xx xx o ( I 1)( K 1)
EJ jk y x jk x y x j xx y xxk x y xxxx o ( J 1)( K 1)
DEJ ijk y ijk x y ijxx y i xk x y x jk x y i xxx y x j xx y xxk x y xxxx o ( I 1)( J 1)( K 1)
2
2 ¦ ¦ ¦ ¦ eijkm
Vˆ sˆR2 ; eijkm yijkm y ijk x
IJK ( M 1)
Diseño Experimentos 97
Modelo estimado
yijkm
y xxxx y i xxx y xxxx y x j xx y xxxx y xxk x y xxxx
y ijxx y i xxx y x j xx y xxxx
y i xk x y i xxx y xxk x y xxxx
y x jk x y x j xx y xxk x y xxxx
y ijk x y ijxx y i xk x y x jk x y i xxx y x j xx y xxk x y xxxx
yijkm y ijk x
Diseño Experimentos 98
Variabilidades
¦ ¦ ¦ ¦ yijkm y xxxx
I J K M
JKM ¦ y i xxx y xxxx
2 2
VT VE ( A)
i 1 j 1k 1m 1 i
VE ( B )
IKM ¦ y x j xx y xxxx 2 VE (C ) IJM ¦ y xxk x y xxxx
2
j k
VE ( A u B )
KM ¦ ¦ y ijxx y i xxx y x j xx y xxxx 2
i j
VE ( B u C )
IM ¦ ¦ y x jk x y x j xx y xxk x y xxxx 2
j k
VE ( A u B u C )
M ¦ ¦ ¦ y ijk x y ijxx y i xk x y x jk x y i xxx y x j xx y xxk x y xxxx 2
i j k
¦ ¦ ¦ ¦ yijkm y ijk x
2
VNE
i j k m
Diseño Experimentos 99
Grados de libertad
GRADOS DE LIBERTAD
(n 1) ( I 1) ( J 1) ( K 1)
( I 1)( J 1) ( I 1)( K 1) ( J 1)( K 1)
( I 1)( J 1)( K 1) IJK ( M 1)
¦ ¦ ¦ ¦ yijkm y ijk x
2
Residual IJK ( M 1) sˆR2
i j k m
¦ ¦ ¦ ¦ yijkm y xxxx
I J K M
2
Total IJKM 1
i 1 j 1k 1m 1
Instrucciones de R utilizadas
ARCHIVO TEXTO: quimico.txt
> quimico = read.table('quimico.txt', header = T)
> attach(quimico)
> CON = factor(con)
> class(con)
> TEMP = factor(temp)
> class(temp)
> CAT = factor(cat)
> class(cat)
> mod_qui = aov(rendim ~ CON*TEMP*CAT )
Descomposición de la
variabilidad
H 0 : D1 D 2 DI 0
H1 : Algún D i es distinto de 0
I
JKM ¦ ( y ixxx y xxxx ) 2 I 1
sˆ A2 i 1
FA o FI 1; IJK ( M 1)
sˆR2 sˆR2
FI 1; IJK ( M 1)
Si FA d FD No se rechaza Ho
RR
D Si FA ! FD Se rechaza Ho
FD
Diseño Experimentos 106
Contraste interacción AxB
H 0 : DE11 DE12 DE IJ 0
H1 : Algún DE ij es distinto de 0
2 VE ( A u B)
Si Ho es cierto, sˆ AB
( I 1)( J 1)
2
sˆ AB
FAB 2
o F( I 1)( J 1); IJK ( M 1)
sˆR
Si FAB ! FD Se
rechaza
Ho
A y B interaccio nan
Diseño Experimentos 107
Si FABC ! FD Se rechaza Ho
H 0 : Di Dj R.R. R.R
tIJK(M-1)
H1 : D i z D j
1-D
D/2 D/2
Dˆ i y i x x x y xx x x ½
Dˆ i Dˆ j y i x x x y j xx x R. Acept. H0
Dˆ j y j xxx y xxxx ¾¿
V2 V2
-tD/2 tD/2
Dˆ i Dˆ j o N (D i D j , )
JKM JKM
yixxx y j xxx 2
o t IJK ( M 1) Si yixx y j xx ! tD / 2 sˆR ,
2 JKM
sˆR
JKM se rechaza Ho
84.00
82.00
80.00
Medias
78.00 Temp - 1
76.00 Temp - 2
74.00
72.00
70.00
0 1 2 3 4
Catalizador
Selección de temperatura y
catalizador.
10
10
residuals(mod_qui)
residuals(mod_qui)
residuals(mod_qui)
5
5
0
0
-5
-5
-5
-10
-10
-10
1.0 2.0 3.0 4.0 1.0 1.4 1.8 1.0 1.5 2.0 2.5 3.0
2. Hacer un contraste de diferencia de medias y decidir el tratamiento más adecuado para conseguir
la mayor resistencia al desgaste.
2.2 En una planta piloto se obtiene un nuevo producto mediante un proceso químico. Con el …n de
mejorar el rendimiento se emplean dos catalizadores distintos y se trabaja con tres temperaturas
diferentes. Los resultados del experimento son (archivo rendimiento:txt)
Temperatura
Catalizador 200 300 400
A 115 125 130 140 110 120
B 115 105 135 145 100 110
2. ¿Qué tratamiento se debe utilizar para obtener el mayor rendimiento, si se desea garantizar una
probabilidad de error tipo I total, T = 0:03?
2.3 Un investigador quiere estudiar el efecto de sexo (hombre, mujer) y tipo de formación (ciencias,
letras) en el dominio del inglés escrito en profesores universitarios. Para ello analiza el número de
incorrecciones gramaticales en artículos cientí…cos enviados a publicación. Para cada combinación
de niveles de los factores se han elegido al azar tres profesores. En la tabla se proporciona el número
de fallos detectados en artículos de 15 páginas (archivo error:txt)
Letras Ciencias
Hombre 8, 6, 13 22, 28, 33
Mujer 5, 10, 6 12, 14, 9
1
Contrastar con nivel de signi…cación 0.05 si los efectos principales y la interacción son signi…cativos.
Tener en cuenta que P (F1;8 5:32) = 0:95, siendo F1;8 la distribución F con grados de libertad
1 y 8: Interpretar los resultados.
2.4 Un alumno, como trabajo de la asignatura de estadística, ha comparado tres marcas distintas (A,B,C)
de palomitas de maíz precocinadas. Cada marca puede prepararse friendolas en una sartén (método
1) o en el horno microondas (método 2). El alumno ha realizado un diseño factorial completo 3 2
con cinco replicaciones en cada uno de los seis tratamientos. La variable respuesta medida es el
porcentaje de granos de maíz que no se han in‡ado adecuadamente. Los resultados del experimento
se muestran en la tabla, en cada tratamiento se proporciona la media y entre paréntesis la desviación
típica corregida para las cinco replicaciones. Contrastar si la interacción entre los dos factores es
signi…cativa.
A B C
5.5 3.6 7.5
Sartén
(1,4) (1,8) (2,5)
3.8 3.4 4.3
Horno
(1,3) (0,9) (1,3)
2.5. La tabla muestra el tiempo de supervivencia de grupos de cuatro animales a los que se ha asignado
al azar tres venenos y posteriormente cuatro tratamientos. (archivo venenos:txt)
Tratamiento
A B C D
Veneno
I 0.31 0.82 0.43 0.45
0.45 1.10 0.45 0.71
0.46 0.88 0.63 0.66
0.43 0.72 0.76 0.62
II 0.36 0.92 0.44 0.56
0.29 0.61 0.35 1.02
0.40 0.49 0.31 0.71
0.23 1.24 0.40 0.38
III 0.22 0.30 0.23 0.30
0.21 0.37 0.25 0.36
0.18 0.38 0.24 0.31
0.23 0.29 0.22 0.33
1. ¿Son los venenos y tratamientos signi…cativos? ¿Existe interacción entre el veneno y el tratamiento?
2. Analice los residuos del modelo anterior. ¿Se veri…can las hipótesis básicas del modelo? ¿Qué
transformación de los datos hace que se veri…quen las hipótesis?
3. Calcule la tabla de análisis de la varianza con los datos transformados. ¿Tiene la transformación
realizada algún efecto sobre los efectos principales y la interacción?
2
2.6 Se ha realizado un experimento para estudiar el efecto de la temperatura (T) y tiempo de exposición
(E) sobre la cantidad absorbida de un compuesto químico por un material sumergido en él. En el
estudio se han empleado tres temperaturas (T1, T2, T3) y tres tiempos de exposición (E1, E2, E3):
cada tratamiento se ha replicado tres veces. La cantidad absorbida (mg) del compuesto químico en
cada uno de los 27 experimentos se muestra en la tabla 1 (archivo absorbida:txt) y las medias en
la tabla 2:
Tabla 1: Cantidad Absorbida (mg)
Tiempo de Temperatura
Exposición T1 T2 T3
Tabla 2: Medias de Cantidad Absorbida (mg)
35.5 91.2 70.1
E1 29.7 100.7 64.1
Tiempo de Temperatura
31.5 82.4 70.1
Exposición T1 T2 T3 Medias
E1 32.23 91.43 68.10 63.92
52.5 71.0 79.4
E2 53.60 74.53 77.40 68.51
E2 53.3 77.0 77.7
E3 83.76 87.06 82.83 84.56
55.0 75.6 75.1
Medias 56.53 84.34 76.11 72.33
85.9 87.0 83.0
E3 85.2 86.1 87.0
80.2 88.1 78.5
2. Realiza las comparaciones dos a dos de los nueve tratamientos y elige aquél o aquellos que propor-
cionan una absorción mayor (95%).
2.7. Se ha realizado un diseño experimental para determinar la in‡uencia de dos factores combinación
de hidrocarburos y cantidad de hidrógeno en el rendimiento de un proceso químico complejo. Se
estudiaron cuatro combinaciones de hidrocarburos (A,B, C y D) y tres niveles en el contenido de
hidrógeno (1,2 y 3). En cada tratamiento se realizaron cuatro réplicas. En la tabla 1 se presentan los
resultados: mejora en tanto por mil respecto a procedimiento estándar (archivo hidrocarburos:txt).
Los números entre paréntesis de la tabla se corresponden con las medias de cada tratamiento, de los
cuatro niveles del factor hidrocarburos y de los tres niveles de hidrógeno. En la tabla 2 se muestra
la tabla de análisis de la varianza del experimento.
3
Tabla 1. Datos y medias entre paréntesis
A B C D Medias Etapa
10.3 10.5 7.2 13.0 1
11.1 8.2 5.3 12.9 1
1 15.3 9.7 12.5 5.3 2
2.1 8.9 19.1 12.0 2
Medias (9.7) (9.325) (11.025) (10.8) (10.213)
25.8 20.6 29.7 17.6 1
25.7 17.1 26.3 12.0 1
2 28.9 21.4 22.4 24.6 2
27.8 17.3 25.9 23.1 2
Medias (27.05) (19.1) (26.075) (19.325) (22.888)
28.5 21.0 30.4 20.5 1
31.2 26.8 26.6 26.2 1
3 24.8 19.4 34.4 27.8 2
26.5 22.2 27.5 21.9 2
Medias (27.75) (22.35) (29.975) (24.1) (25.981)
Medias (21.5) (16.925) (22.275) (18.075)
Tabla 2. ANOVA -
Suma Grados
Fuentes Cuadrados Libertad Var. F p-valor
Hidrocarburos 242.5 3 80.85 5.55 .0031
Hidrógeno 2234 2 1117 76.7 .0000
Interacción 119.3 6 19.88 1.36 .2546
Residual 523.7 36 14.55
Total 3120 47
1. Comparar las medias de los cuatro niveles del factor Hidrocarburo y las de los tres niveles del factor
Hidrógeno. Indica si existen diferencias signi…cativas con nivel de signi…cación 0.05.
3. El experimento se realizó en dos etapas, en una primera etapa se recogieron las 24 observaciones
que se indican en la tabla 1 como etapa 1 y las otras 24 como etapa 2. Los resultados del análisis
de la varianza correspondientes a cada etapa se muestran en las tablas 3 y 4.
4
Tabla 4. ANOVA - Etapa 2
Suma Grados
Fuentes Cuadrados Libert. Var. F p-valor
Hidrocarburos 162.9 3 54.31 3.35 .0555
Hidrógeno 1076 2 537.9 33.19 .0000
Interacción 94.94 6 15.82 0.976 .9762
Residual 194.5 12 16.21
Total 1528 23
¿Se puede concluir que en las dos etapas la varianza del error experimental es la misma? (Realiza
el contraste con = 0:05)
2.8 Se ha estudiado el efecto de tres hornos diferentes y dos temperaturas (290 o C y 320 o C) en la
duración de cierto componente. Para cada combinación de horno y temperatura se ha replicado
el experimento 3 veces. En la tabla siguiente se proporcionan las medias y desviaciones típicas
(corregidas) de los datos de cada tratamiento.
Temperatura o C
290 o C 320 o C
Media Desv. T. Media Desv. T.
Horno 1 24.56 0.850 18.00 0.265
Horno 2 19.10 1.539 14.40 0.265
Horno 3 18.70 0.458 17.43 0.862
Contrasta si existe interacción entre los factores horno y temperatura ( = 0:05):
2.9. Cierto Organismo Público (O.P.) encargado de certi…car la composición de aleaciones de metales
preciosos, debe seleccionar entre dos Laboratorios al más capacitado para la realización de futuros
análisis de gran precisión. Para tomar la decisión les somete a la siguiente prueba: Prepara tres
aleaciones A, B y C que contienen proporciones distintas de oro. De cada una de ellas envía cu-
atro muestras a cada uno de los dos laboratorios. Así pues, cada laboratorio recibe un lote de 12
muestras (codi…cadas) ordenadas aleatoriamente sin conocer como han sido obtenidas. Los resul-
tados recibidos por el O.P. son (entre paréntesis las medias de las casillas) (archivo laboratorios:txt):
1. Determinar si existen diferencias entre los resultados de los laboratorios y si éstos han encontrado
diferencias entre las aleaciones.
2. Aceptando que los datos cumplen la hipótesis de normalidad, indicar si podemos aceptar que
veri…can el resto de las hipótesis del modelo y en caso negativo que medidas se deben adoptar para
analizar los datos.
5
3. Realizar un test de razón de varianzas para contrastar que las varianzas de los dos laboratorios son
iguales, sabiendo que las tres aleaciones tienen composición distinta. Interpretar el resultado.
4. El O.P. conoce exáctamente el porcentaje en oro de la aleación A (11 %), de la B (11.02 %) y de
la C (11.04 %). Con esta información comparar los resultados de los laboratorios.
2.10 Un laboratorio de Análisis Clínicos ha adquirido un nuevo equipo (B) para medir el colesterol en la
sangre de los enfermos. Para evaluar si el nuevo equipo está ajustado se decide analizar muestras
de 5 enfermos que previamente han sido analizadas con otro equipo (A), dando como resultado
Enfermo 1 2 3 4 5 Media
Equipo A 215 305 247 221 286 254.8
Equipo B 224 312 251 232 295 262.8
Contrastar con = 0:05 existen diferencias entre los dos equipos. (archivo colesterol :txt)
2.11. El análisis de la varianza de un diseño en bloques aleatorizados proporciona los siguientes resulta-
dos: V T = 232, V E(factor) = 156, V E(bloque) = 15 y V N E = 61. El número de niveles del factor
es 5 y el número de bloques 8. Construir la tabla ADEVA. ¿ Cuál sería el resultado del análisis si
no se tiene en cuenta el efecto de los bloques ? Indicar en qué circunstancias es preferible cada uno
de los modelos.
2.12. Se realiza un experimento para estudiar si la presencia de ‡uorita reduce el coste de fabricación
de clinker de cemento en tres tipos diferentes de mezcla. Los resultados del mismo (en miles de
pesetas por Tm) se muestran en la siguiente tabla (archivo f luorita2:txt):
5 X
X 3
e2ij = 10:2 y = 10:3
i=1 j=1
2.13 Se ha realizado un experimento con dos factores cada uno de ellos con 3 niveles. El 20% de la
variabilidad total está explicada por la interacción de los dos factores y el 40% de la variabilidad
total es debida a la variabilidad residual. Determinar el número de replicaciones necesarias en cada
tratamiento para que la interacción sea signi…cativa con = 0:01: (Explicar el procedimiento de
cálculo, dejando el resultado indicado en función de las tablas).
6
2.14 Sea un diseño factorial con 4 factores a 3, 4, 2 y 5 niveles. Calcular el número de parámetros totales
correspondientes a efectos principales e interacciones de orden 2, 3 y 4.
2.15 Un centro ha realizado un experimento para mejorar la resistencia a la tensión de ciertos muelles de
acero. En una etapa del proceso el muelle caliente se sumerge en aceite templado. Se han estudiado
tres factores, A (temperatura del acero antes de la inmersión, con tres niveles), B (temperatura del
baño de aceite, dos niveles) y C (concentración de carbono en el acero, dos niveles). El experimento
se ha replicado tres veces. En la tabla se muestra la media y la varianza (corregida) para los tres
datos de cada tratamiento.
A B C yi s^2i
1 1 1 40.2 0.25
1 1 2 61.1 2.68
1 2 1 35.9 2.43
1 2 2 57.1 4.44
2 1 1 49.0 3.49
2 1 2 70.3 7.77
2 2 1 46.7 5.08
2 2 2 67.6 1.03
3 1 1 41.9 4.27
3 1 2 62.7 11.41
3 2 1 37.1 1.33
3 2 2 60.3 6.13
1. (a) Dar un intervalo del 95 % de con…anza para la varianza del error experimental, 2.
3. Dado 2 , construir un intervalo que cumpla que la probabilidad de que s^2i (la varianza muestral
corregida de un tratamiento) esté contenido en él sea igual a 0.95. Sustituir 2 por su estimador y
con ayuda de este intervalo, discutir si se puede rechazar la hipótesis de homocedasticidad de las
observaciones.
2.16 Un estudio bioquímico ha valorado la cantidad de tres ácidos (a, b, c) en muestras extraídas a
cuatro terneras (1, 2 ,3 y 4) de la misma raza. El análisis es bastante complejo y la determinación
incluye un error de medida. ¿Se puede aceptar la hipótesis de que los tres ácidos se encuentran
en la misma proporción en cada animal? Realiza el contraste con nivel de signi…cación 0.05. (La
variabilidad total es 41.90). (archivo ultrasonidos:txt)
1.
a b c Medias
1 11.0 11.4 12.7 11:7
2 9.8 10.8 13.7 11:43
3 7.5 10.6 11.5 9:87
4 7.9 7.6 10.1 8:53
Medias 9.05 10.1 12.0 10.38
7
OTROS EJEMPLOS
2.17. Treinta y seis adultos (18 hombres y 18 mujeres) son utilizados en un estudio para comparar los
tensiómetros de tres fabricantes. Los sujetos de cada sexo son asignados de forma aleatoria en seis grupos
de tres cada uno. A tres grupos de cada sexo se les mide la presión de la sangre nada más comenzar el
experimento; a los otros tres grupos se les mide la presión después de diez minutos de descanso.
Los resultados son los siguientes:
I II III
H M H M H M
147 122 156 131 127 110
1 124 142 127 133 122 115
113 136 155 146 153 105
140 108 100 141 114 103
2 130 151 140 125 139 135
112 138 105 139 126 114
En el archivo tension.sf3 están la variable respuesta presión y las variables factores descanso, fabri-
cante y sexo.
2.18 Se desea investigar el comportamiento de dos tipos de semilla y de tres tipos diferentes de fertil-
izante. Los resultados serán los diferentes rendimientos para las combinaciones de semillas y fertilizantes.
Se pide contestar a las siguientes preguntas:
En el archivo rend.sf3 están la variable respuesta rendimiento y los factores semilla y fertilizante.
8
A B C
1 14.3 18.1 17.6
14.5 17.6 18.2
11.5 17.1 18.9
13.6 17.6 18.2
2 12.6 10.5 15.7
11.2 12.8 17.5
11.0 8.3 16.7
12.1 9.1 16.6
Temperatura
9
Medidor 1 Medidor 2 Medidor 3
¿Existen diferencias entre las resistencias dadas por los diferentes medidores? ¿y entre las probetas
generadas por cada mezclador?
¿Es signi…cativa, con nivel de signi…cación del 5%, la interacción entre medidores y mezcladores?
2.21. Se está estudiando el rendimiento de un proceso químico. Se piensa que las dos variables
más importantes pueden ser la presión y la temperatura. Se seleccionan tres niveles de cada factor. Los
resultados del experimento son los siguientes:
Presión
Temperatura 200 215 230
Baja 90.4 90.7 90.2
Baja 90.2 90.6 90.4
Media 90.1 90.5 89.9
Media 90.3 90.6 90.1
Alta 90.5 90.8 90.4
Alta 90.7 90.9 90.1
10
2.22. Se realiza un experimento para estudiar la in‡uencia de la temperatura de operación y de tres
tipos de cristal en la salida de luz de un osciloscopio medidas en lux. En el archivo lux.sf3 se encuentran
los resultados obtenidos que se presentan a continuación:
Temperatura
Cristal 100 125 150
580 1090 1392
1 568 1087 1380
570 1085 1386
550 1070 1328
2 530 1035 1312
579 1000 1299
546 1045 867
3 575 1053 904
599 1066 889
2.22 Para comprobar la diferencia de rendimientos entre las distintas variedades de avena se diseño
un experimento con ocho variedades distintas. Como el terreno donde fueron plantadas las distintas
variedades estaba en pendiente se pensó que podría afectar la situación de la planta en su rendimiento.
Los resultados obtenidos en gramos fueron los siguientes:
I II III IV V
1 296 357 340 331 348
2 402 390 431 340 320
3 437 334 426 320 296
4 303 319 310 260 242
5 469 405 442 487 394
6 345 342 358 300 308
7 324 339 357 352 220
8 488 374 401 338 320
Si no se tiene en cuenta el efecto de las diferentes condiciones del terreno, conteste a las siguientes
preguntas:
La variedad ocho es autóctona y la más empleada. La cinco es la más cara. Si tuvierá que elegir
¿cuál elegiría?
11
Conteste todas las preguntas anteriores si se introduce la variable que tiene en cuenta el efecto del
terreno.
2.23. Se desea comparar cuatro procedimientos de obtención de la penicilina (A, B, C y D); siendo
la variable respuesta producción en kg.
Una materia prima, licor de maíz, se tiene en cuenta en el experimento. Se dispone de cinco muestras
de licor de maíz. A continuación se presenta la tabla de los datos.
A B C D
1 89 88 97 94
2 84 77 92 79
3 81 87 87 85
4 87 92 89 84
5 79 81 80 88
El interés principal del experimento era el estudio de la e…cacia de los tres sistemas ¿ha resultado
adecuada la estrategia?
Realice la diagnosis del modelo y proponga posibles soluciones si detecta algún problema.
2.25 Unos alumnos de la universidad de Tu¤s (Massachussets, E.U.A.), preocupados por el estado
de corrosión de las tuberías de su universidad, decidieron realizar el siguiente experimento. Tomaron
muestras de agua corriente haciendo variar los factores Campus, Tipo de edi…cio y antigüedad del edi…cio.
12
Se midió la concentración de hierro en el agua corriente (mg=dm3 ) y para cada posible combinación de
factores se tomaron dos observaciones. En el archivo corrosio.sf3 se muestran los resultados que se
presentan en la siguiente tabla.
Factor Concentración de Fe
Antigüedad Tipo Campus
Viejo Académico Medford 0,23 0,28
Nuevo Académico Medford 0,36 0,29
Viejo Residencial Medford 0,03 0,06
Nuevo Residencial Medford 0,05 0,02
Viejo Académico Somerville 0,08 0,05
Nuevo Académico Somerville 0,03 0,08
Viejo Residencial Somerville 0,04 0,07
Nuevo Residencial Somerville 0,02 0,06
Si no se cumplieren las hipótesis del modelo indique qué podría hacerse para remediarlo.
13
Regresión
1: Regresión simple I
Regresión simple
consumo y peso de automóviles
Núm. Obs. Peso Consumo
(i) kg litros/100 km 25
1 981 11
2 878 12
3 708 8
4 1138 11
5 1064 13 20
Consumo (litros/100 Km)
6 655 6
7 1273 14
8 1485 17
9 1366 18 15
10 1351 18
11 1635 20
12 900 10
13 888 7
14 766 9
10
15 981 13
16 729 7
17 1034 12
18 1384 17 5
19 776 12
20 835 10
21 650 9
22 956 12
0
23 688 8
24 716 7 500 700 900 1100 1300 1500 1700
25 608 7
26 802 11 Peso (Kg)
27 1578 18
E 0 E 1 xi u i , u i o N (0, V 2 )
28 688 7
29
30
1461
1556
17
15
yi
Regresión Lineal 2
Regresión simple
consumo y peso de automóviles
Núm. Obs. Peso Consumo
(i) kg litros/100 km 25
1 981 11
2 878 12
3 708 8
4 1138 11
5 1064 13 20
E 0 E 1 xi u i , u i o N (0, V 2 )
28 688 7
29
30
1461
1556
17
15
yi
Regresión Lineal 3
yi E 0 E1 xi
E1
yi
1
E0
xi
Regresión Lineal 4
Modelo
yi E 0 E 1 xi u i , ui o N (0, V 2 )
yi
E 0 E1 x
xi
E 0 , E1 ,V 2 : parámetros desconocid os
Regresión Lineal 5
Modelo
yi E 0 E 1 xi u i , ui o N (0, V 2 )
yi
E 0 E1 x
xi V
E 0 E1 xi
Regresión Lineal 6
Hipótesis del modelo
Linealidad
E[yi ]= E0+E1xi
Parámetros
Normalidad
yi|xi N (E0+E1xi,V2)
E0
Homocedasticidad E1
Var [yi|xi] = V2
V2
Independencia
Cov [yi, yk] = 0
Regresión Lineal 7
Modelo
yi E 0 E 1 xi u i , ui o N (0, V 2 )
yi : Variable dependiente
xi : Variable independiente
ui : Parte aleatoria
V
Regresión Lineal 8
Estimación
n
M ( E 0 , E1 ) ¦(y
i 1
i E 0 E1 xi ) 2
n
dM
¦ ( yi Eˆ0 Eˆ1 xi ) 0 ¦y nEˆ0 Eˆ1 ¦ xi
dE 0
i
i 1
n
dM
¦ ( yi Eˆ0 Eˆ1 xi ) xi 0 ¦x y Eˆ0 ¦ xi Eˆ1 ¦ xi2
dE 0
i i
i 1
n n
y Eˆ0 Eˆ1 x ½ ¦ ( yi y )( xi x) ¦ ( xi x) 2
°i1 ˆ i1
n
¾ E
¦x y
i 1
i i n Eˆ0 x Eˆ1 ¦ xi n °
2
¿
n
1
n
cov( xi , yi )
Eˆ1 ; Eˆ0 y Eˆ1 x
var( xi )
Regresión Lineal 9
Regresión Lineal 10
Estimación V2 : máxima verosimilitud
n n 1 n
L( E 0 , E1, V ) log(2S ) log V 2 ¦ ( yi E 0 E1xi ) 2
2 2
2 2 2V i 1
dL n 1 1 n 2
¦ ( yi Eˆ0 Eˆ1xi ) 0
2 2 2 4i 1
dV Vˆ 2Vˆ
n
¦ ( yi Eˆ0 Eˆ1xi ) 2
Vˆ 2 i 1
n
ei yi Eˆ 0 Eˆ1 xi
n ½ n
¦ ei 0 °
° 2
¦ ei2
i 1 i 1
¾ sˆ R
n
n2
¦ ei xi 0°
°
i 1 ¿
Regresión Lineal 11
Estimación
Máxima verosimilitud
1 ª 1 n 2 º½
Max ® exp ¦ (
«¬ 2V 2 i 1 iy E E x ) »¼ ¾
¯ 2S V
n/2 n 0 1 i
¿
Mínimos cuadrados
n
Mín ¦ ( yi E 0 E1 xi ) 2
i 1
Eˆ0 y Eˆ1 x
cov( xi , yi ) ¦i 1 ( xi x )( yi y )
n
Eˆ1
var( xi ) ¦i 1 ( xi x ) 2
n
Regresión Lineal 12
Recta de regresión
Eˆ1
cov( xi , yi )
yˆ Eˆ 0 Eˆ1 x
var( xi )
y
Pendiente
Eˆ1
Eˆ 0 y Eˆ1 x
x
Regresión Lineal 13
Estimación
consumo y peso de automóviles
25
Núm. Obs. Peso Consumo
(i) kg litros/100 km
1 981 11
2 878 12 20
Consumo (litros/100 Km)
3 708 8
4 1138 11
5 1064 13 15
6 655 6
7 1273 14
8 1485 17
9 1366 18 10
10 1351 18
11 1635 20
12 900 10 5
13 888 7
14 766 9
15 981 13
16 729 7 0
17 1034 12 500 700 900 1100 1300 1500 1700
18 1384 17 Peso (Kg)
19 776 12
835 10
cov( xi , yi )
20
1225.2
Eˆ1
21 650 9
22 956
688
12
8
0.0117
var( xi ) 104446.6
23
24 716 7
25 608 7
802 11
Regresión Lineal 14
Residuos
,
yi Eˆ0 Eˆ1 xi ei
,
Valor observado Valor Previsto Residuo
ei
yi
yˆ i Eˆ 0 Eˆ1 xi
xi
Regresión Lineal 15
n
¦ ei2
Residuos sˆR2 i 1
; ei yi yˆ i
n2
,
yi Eˆ0 Eˆ1 xi ei
,
Valor observado Valor Previsto Residuo
ei
yi
yˆ i Eˆ 0 Eˆ1 xi
xi
Regresión Lineal 16
Ejemplo: estimación
Núm. Obs. Peso Consumo Predicción Residuos
(i) kg litros/100 km
1 981 11 11,44 -0,44 25
2 878 12 10,23 1,77
3 708 8 8,23 -0,23
4 1138 11 13,28 -2,28
5 1064 13 12,41 0,59 20
E0 E1 xi ui , V2
28 688 7 8,00 -1,00
29
30
1461
1556
17
15
17,07
18,18
-0,07
-3,18
yi
Regresión Lineal 17
Propiedades de Eˆ1
cov( xi , yi ) 1 n
Ê1 ¦ xi x yi y
s x2 ns x2 i 1 0
1 n 1 n
¦
ns x2 i 1
xi x y i ¦ xi x y
ns x2 i 1
xi x
wi
n
¦ ¨¨
§ xi x ·
¸y w1 y1 w2 y2 wn yn
nsx2
2 ¸ i
i 1 © ns x ¹
1 n
x ¦in 1 wi ¦i 1 xi x 0
ns x2
1 n 1 n
x ¦in 1 wi xi ¦i 1 xi x xi 2 ¦i 1
xi x xi 1 2 ¦in 1 xi x x 1 n
2 ¦i 1
xi x 2 1
ns x2 ns x ns x ns x
2
§ 1 · n 1
x¦ w n
i 1
2
¨¨ 2 ¸¸ ¦i 1 xi x 2
ns x2
i
© ns x ¹
Regresión Lineal 18
y, Eˆ1 son v.a. independientes
§ y1 · ½
¨ ¸ °
1 1 1 §1 1 1 ·¨ y2 ¸ T °
y y1 y2 yn ¨ ¸¨ ¸ a Y
n n n ©n n n¹ °
¨ ¸ °
¨y ¸ °
© n¹
¾
§ y1 · °
¨ ¸
¨ y2 ¸ °
Eˆ1 w1 y1 w2 y2 wn yn w1 w2 wn ¨ ¸ w Y ° T
°
¨ ¸
¨y ¸ °
© n¹ ¿
V2 n
cov( y , Eˆ1 ) a var( Y )w
T
n
¦w
i 1
i 0
Regresión Lineal 19
Distribución de Eˆ1
yi o N ( E 0 E1 xi ,V 2 )
Eˆ1 w1 y1 w2 y2 wn yn o Comb. lineal de normales
E[ Eˆ1 ] E[ w1 y1 w2 y2 wn yn ]
w1 E[ y1 ] w2 E[ y2 ] wn E[ yn ] ( E[ yi ] E 0 E1 xi )
E 0 (¦ wi ) E1 (¦ wi xi ) E1
Var[ Eˆ1 ] Var[ w1 y1 w2 y2 wn yn ]
w12Var[ y1 ] w22Var[ y2 ] wn2 [ yn ] (Var[ yi ] V 2 )
n V2
(¦ wi2 )V 2
ns x2
§ V 2
·
i 1
ˆ
E1 o N ¨¨ E1 , 2 ¸¸
© ns x ¹
Regresión Lineal 20
Parámetro E1 y estimador Eˆ1
Eˆ1 0.0117 litros cada 100km/kg
1.17 litros cada 100km/100 kg
sˆR 1.54
SE ( Eˆ1 ) 0.087
ns X 30 u 3.2 t28
sˆR
E1 Eˆ1 r tD / 2 tn-2
ns x
1-D
E1 1.17 r 2.05 u 0.08 D/2
E1 1.17 r 0.16 .
1.01 d E1 d 1.33 -tD/2 tD/2
-2.05 2.05
Simple Linear Regression 21
sˆR
SE ( Eˆ1 )
ns X
Regresión Lineal 23
Distribución de ŝR2
n
¦ ei2 2
(n 2) sˆR
i 1 o F n2 2
V2 V2
Regresión Lineal 24
Contraste principal de regresión:
¿depende y de x?
H 0 : E1 0
H 1 : E1 z 0
yi yi
yi E 0 E1 xi ui yi E 0 ui
xi xi
H0 es falso H0 es cierto
x e y están relacionados x e y no están relacionados
Regresión Lineal 25
H 1 : E1 z 0 Eˆ1 E1
o N (0,1)
Eˆ1 E1
o tn2
V sˆR
ns x ns x
R.R
Eˆ1 R.R.
t1 ; tn-2
sˆR
1-D
ns x D/2
R. Acept.
t1 ! t n 2;D / 2 Se rechaza Ho
-tD/2 tD/2
Regresión Lineal 26
Ejemplo: D = 0.05
H 0 : E1 0 yˆ i 0.071 0.0117 xi ; sˆR 1.54
R.R. t28 R.R
H 1 : E1 z 0
0.017 0.025 0.025
t0 13.4
1.54 /( 30 u 323.2) …
-2.05 2.05
27
H 0 : E1 0
P-valor H 1 : E1 z 0
H1 : E1 z 0 H 0 : E1 0
Contraste: ordenada en el origen
H0 : E0 0
yˆ i Eˆ0 Eˆ1 xi
H1 : E 0 z 0
V2 x 2
Eˆ0 o N ( E 0 , (1 2 ))
n sx
Eˆ0
t0 2
;
sˆR x
1 2
n sx
t0 ! t n2;D / 2 Se rechaza Ho
Regresión Lineal 29
Regresión Lineal 30
Descomposición de la
variabilidad en regresión
yi E 0 E1 xi ui
yi Eˆ0 Eˆ1 xi , ei
yˆ y yˆ
i i i
yi yˆ ( y yˆ ) (restando y )
i i i
( yi y ) ( yˆ y ) ( y yˆ ) (elevando al cuadrado y sumando)
i i i
n n n
¦ ( yi y ) 2
¦ ( yˆi y ) 2 ¦ ( yi yˆi ) 2
i 1 i 1 i 1
VT VE VNE
Regresión Lineal 31
Coeficiente de determinación R2
n
VE ¦ ( yˆi y ) 2 VT VE VNE
i 1
2 VE
n R
VNE ¦ ( yi yˆ i ) 2 VT
i 1
0 d R2 d 1
n
VT ¦ ( yi y ) 2 Mide el porcentaje de VT que
está explicado por el regresor
i 1
n
yˆ i y Eˆ1 ( xi x ) : VE Eˆ12 ¦ ( xi x ) 2 Eˆ12 ns x2
i 1
Regresión Lineal 32
Coef. determinación
R 2
1 R2 0.80
R2 0.50 R2 0
Regresión Lineal 33
Contraste F
H 0 : E1 0 Eˆ1
yˆ i Eˆ0 Eˆ1 xi
H 1 : E1 z 0
o F12
VE
(Si H o es cierto)
2
V VE VE
F o F1 ,n 2
2
¦in 1 ei2 VNE/(n-2 ) 2
(n 2) sˆR sˆR
o F n22
VNE
V2 V2
V2
VE VNE F ! FD Se rechaza H0
, son independie ntes
V2 V2
Regresión Lineal 34
Contraste F yˆ i Eˆ0 Eˆ1 xi
Rechazo H0
F1,n-2 Acep. H0
Fα
α = 0.05
Regresión Lineal 35
n
H 0 : E1 0 VE ¦ ( yˆ i yi ) 416.8
i 1
H 1 : E1 z 0 sˆR2 2.38
VE 416.8
F 175.1
sˆR2 2.38
F1,28
α = 0.05
175.1 ! 4.2 Se rechaza H 0
4.2
Regresión Lineal 36
Tabla de Análisis de la Varianza
Suma de Grados de
FUENTES Cuadrados Libertad Varianzas F
Explicada (VE) ¦ ( yˆ y) 2
1 ¦ ( yˆ y) 2 ¦ ( yˆ i y)2
i i
sˆR2
Residual (VNE) ¦(y i yˆ i ) 2 n2 sˆ 2
R
Total (VT) ¦(y i y)2 n 1
R2
VE ¦ i
( ˆ
y y ) 2
VT ¦(y i y)2
Análisis de la varianza 37
Suma de Grados de
FUENTES Cuadrados Libertad Varianzas F
R2 0.862
Análisis de la varianza 38
Ejemplo: R2 yˆ i 0.071 0.0117xi ;
sˆ R2
15
5
6
1064
655
13
6
12,41
7,61
0,59
-1,61
10
2.38
7 1273 14 14,86 -0,86
8 1485 17 17,35 -0,35
9 1366 18 15,95 2,05 5
10 1351 18 15,78 2,22
11 1635 20 19,11 0,89
0
12 900 10 10,49 -0,49
500 700 900 1100 1300 1500 1700
13 888 7 10,35 -3,35
Peso (Kg)
14 766 9 8,91 0,09 n
15
16
981
729
13
7
11,44
8,48
1,56
-1,48
VE ¦ ( yˆ i y ) 416.8
17 1034 12 12,06 -0,06 i 1
18 1384 17 16,16 0,84
776 12 9,03 2,97 n
¦ ( yi yˆ i ) 66.64
19
20
21
835
650
10
9
9,72
7,55
0,28
1,45
VNE
22 956 12 11,14 0,86 i 1
23
24
688
716
8
7
8,00
8,33
0,00
-1,33 VT VE VNE 483.4
25 608 7 7,06 -0,06
26 802 11 9,34 1,66
416.8
27 1578
688
18
7
18,44
8,00
-0,44
-1,00
R2 86.2%
483.4
28
29 1461 17 17,07 -0,07
30 1556 15 18,18 -3,18
Regresión Lineal 39
Regresión con R
ARCHIVO TEXTO: coches.txt
Regresión Lineal 40
Regresión con R: Estimación
Regresión Lineal 41
Gráfico en R
Regresión Lineal 42
Ejemplo 2: Pearson-Lee Data
Estimation with R
Conclusiones Principales
1. Hay una relación muy significativa entre la altura de las
hijas y la altura de la madre (p-valor es prácticamente 0)
Eˆ1 0.54
2. La relación es positiva: “A madre alta hija alta.”
La recta de regresión (línea roja) tiene pendiente menor que 1 (línea azul) , lo que significa que las
madres altas tienden a tener hijas que son más altas que la media (pues la pendiente es positiva) pero
más bajas que ellas (porque la pendiente es menor que uno). De forma similar, las madres bajas tienen
hijas más bajas , pero más altas que sus madres. Este resultado resultó sorprendente y es el origen del
término “regresión”, que indica que los valores extremos de una generación tienden a regresa o
revertir hacia la media en la siguiente.
Regresión
2: Regresión simple II (Diagnosis y
Transformaciones)
Diagnosis del Modelo
yi yˆ i
(i) kg litros/100 km
1
2
981
878
11
12
11,44
10,23
-0,44
1,77
ei
3 708 8 8,23 -0,23
4 1138 11 13,28 -2,28
25
5 1064 13 12,41 0,59
6 655 6 7,61 -1,61
7 1273 14 14,86 -0,86 20
1485 17 17,35 -0,35
Consumo (litros/100 Km)
8
9 1366 18 15,95 2,05
10 1351 18 15,78 2,22
11 1635 20 19,11 0,89 15
12 900 10 10,49 -0,49
13 888 7 10,35 -3,35
14 766 9 8,91 0,09
15 981 13 11,44 1,56 10
16 729 7 8,48 -1,48
17 1034 12 12,06 -0,06
18 1384 17 16,16 0,84 5
19 776 12 9,03 2,97
20 835 10 9,72 0,28
21 650 9 7,55 1,45
22 956 12 11,14 0,86 0
23 688 8 8,00 0,00 500 700 900 1100 1300 1500 1700
24 716 7 8,33 -1,33
25 608 7 7,06 -0,06 Peso (Kg)
26 802 11 9,34 1,66
0.071 0.0117xi ; sˆ R2
1578 18 18,44 -0,44
yˆ i
27
28
29
688
1461
7
17
8,00
17,07
-1,00
-0,07
2.38
30 1556 15 18,18 -3,18
Regresión Lineal 3
Diagnosis del Modelo
Núm. Obs. Peso Consumo Predicción Residuos
(i) kg litros/100 km
1 981 11 11,44 -0,44 25
2 878 12 10,23 1,77
3 708 8 8,23 -0,23
4 1138 11 13,28 -2,28
5 1064 13 12,41 0,59 20
Regresión Lineal 4
Regresión Lineal 5
No linealidad
Regresión Lineal 6
No homocedasticidad
Regresión Lineal 7
No homocedasticidad, ni
linealidad
Regresión Lineal 8
Observaciones atípicas
Regresión Lineal 9
Residuos Aceptables
Regresión Lineal 10
Herramientas de comprobación:
Histograma de residuos
Gráfico de probabilidad normal (Q-Q plot)
Contrastes formales (Kolmogorov-Smirnov)
Ejemplo de coches
120 99,9
99
100
probabilidad
95
80 80
60 50
20
40
5
20 1
0 0,1
-9 -6 -3 0 3 6 9 -6 -4 -2 0 2 4 6
Residuos Residuos
Regresión Lineal 11
Comprobación de la linealidad
y homocedasticidad
Ambas hipótesis se comprueban
conjuntamente mediante gráficos de los
residuos
Frente a valores previstos
Frente al regresor.
En muchas ocasiones se corrige la falta
de linealidad y la heterocedasticidad
mediante transformación de las variables.
log yi E 0 E1 x1i ui
log yi E 0 E1 log x1i ui
Regresión Lineal 12
0 0
xi xi
ei ei
0 0
Normalidad ok Linealidad ok y
Homocedasticidad ok
Regresión Lineal 14
Regresión Lineal 15
Cars: mpg ~ weight
= 0.69 ̂ = 4.34
Regresión Lineal 16
Cars: Figuras
No hay linealidad ni homocedasticidad
Regresión Lineal 17
Cars: cons ~ weight
TRANSFORMACIÓN: En lugar de medir el consumo en
millas por galón (mpg), vamos a cambiar a “litros cada
100 km (cons)”
cons = 235.1/mpg
Y X
…
Regresión Lineal 18
= 0.79 ̂ = 1.78
Regresión Lineal 19
Cars: Cambio Variable
Mejora la linealidad y homocedasticidad
Regresión Lineal 20
Cars: Normalidad
Normalidad no es problemática
Regresión Lineal 21
Cars: Instrucciones con R
> par(mfrow=c(1,2)) % DIVIDE LA PANTALLA GRÁFICA EN 1 FILA Y 2 COLUMNAS (ver FIGURAs 2.1 2.2)
Regresión Lineal 22
Tabla 2.1
Regresión Lineal 23
Cars: Instrucciones con R
Regresión Lineal 24
Tabla 2.2
Regresión Lineal 25
Forbes (Ejemplo 3)
Ejemplo “Forbes”
En un artículo de 1857 un físico escocés llamado “forbes.txt”
James D. Forbes presentó una serie de experimentos Temp Pres
realizados para estudiar la relación entre presión 1 194.5 20.79
atmosférica y punto de ebullición del agua. Forbes 2 194.3 20.79
3 197.9 22.40
sabía que la altitud podía ser determinada a partir de 4 198.4 22.67
la presión atmosférica medida con un barómetro, con 5 199.4 23.15
menores presiones a medida que aumenta la altitud. A 6 199.9 23.35
7 200.9 23.89
mediados del siglo XIX los barómetros eran 8 201.1 23.99
instrumentos muy frágiles y Forbes pensó que se 9 201.4 24.02
podía sustituir la medidas de la presión con medidas 10 201.3 24.01
11 203.6 25.14
de la temperatura de ebullición del agua. Recogió 12 204.6 26.57
datos de 17 emplazamientos en los Alpes y los 13 209.5 28.49
montes de Escocia. En cada lugar se midió con un 14 208.6 27.76
15 210.7 29.04
barómetro la presión en pulgadas de mercurio (Pres) 16 211.9 29.88
y la temperatura de ebullición del agua en grados 17 212.2 30.06
Fahrenheit (Temp) empleando un termómetro. Los
Weisberg, S. (2005). Applied Linear Regression, 3rd
datos se encuentran en el archivo “forbes.txt” edition. New York: Wiley.
Regresión Lineal 27
Forbes: Conclusiones Modelo Inicial
Regresión Lineal 28
Forbes: Diagnosis
Regresión Lineal 29
Forbes: Instrucciones R
> forbes <- read.table(“forbes.txt”,header=TRUE)
> attach(forbes)
> m <- lm(Pres ~ Temp)
> summary(m)
Regresión Lineal 30
Regresión Lineal 31
Forbes: Modelo 1
Temp Pres Lpres Pred Resid
= 100 × log 1 194.5 20.79 131.79 132.03 -0.2480225
2 194.3 20.79 131.79 131.85 -0.0688990
3 197.9 22.40 135.02 135.08 -0.0537700
4 198.4 22.67 135.55 135.53 0.0187713
5 199.4 23.15 136.46 136.42 0.0331010
6 199.9 23.35 136.83 136.87 -0.0411189
7 200.9 23.89 137.82 137.77 0.0561898
8 201.1 23.99 138.00 137.94 0.0584761
9 201.4 24.02 138.06 138.21 -0.1559337
10 201.3 24.01 138.04 138.12 -0.0844563
11 203.6 25.14 140.04 140.18 -0.1470658
12 204.6 26.57 142.44 141.08 1.3599445
13 209.5 28.49 145.47 145.47 0.0015070
14 208.6 27.76 144.34 144.66 -0.3197358
15 210.7 29.04 146.30 146.54 -0.2428181
16 211.9 29.88 147.54 147.62 -0.0791613
17 212.2 30.06 147.80 147.89 -0.0870083
= 0.995 ̂ = 0.379
Regresión Lineal 32
Forbes : modelo 1
Regresión Lineal 33
Forbes: Modelo 1
Regresión Lineal 34
Forbes: Instrucciones R
> forbes1 <- read.table(“forbes.txt”,header=TRUE)
> attach(forbes1)
> m1 <- lm(100*log10(Pres) ~ Temp)
> summary(m1)
Regresión Lineal 35
Forbes: Instrucciones R (cont)
> forbes1$Lpres <- 100*log10(Pres)
> forbes1$Pred <- predict(m1)
> forbes1$Resid <- residuals(m1)
> print(forbes1,digits=4,print.gap=3) % proporciona tabla 4.1
Regresión Lineal 36
Forbes: Modelo 2
(ELIMINANDO OBSERVACIÓN Nº 12)
Temp Pres Lpres Pred Resid
= 100 × log 1 194.5 20.79 131.79 131.99 -0.2006699
2 194.3 20.79 131.79 131.81 -0.0224480
3 197.9 22.40 135.02 135.02 0.0089107
4 198.4 22.67 135.55 135.46 0.0837061
5 199.4 23.15 136.46 136.35 0.1025441
6 199.9 23.35 136.83 136.80 0.0305783
7 200.9 23.89 137.82 137.69 0.1323953
8 201.1 23.99 138.00 137.87 0.1355832
9 201.4 24.02 138.06 138.13 -0.0774742
10 201.3 24.01 138.04 138.05 -0.0064475
11 203.6 25.14 140.04 140.10 -0.0586881
12* 204.6 26.57 142.44 140.99 1.4527324
13 209.5 28.49 145.47 145.35 0.1164833
14 208.6 27.76 144.34 144.55 -0.2088168
15 210.7 29.04 146.30 146.42 -0.1224318
16 211.9 29.88 147.54 147.49 0.0466349
17 212.2 30.06 147.80 147.76 0.0401403
Tabla 5.1
Lpres = −41.33 + 0.8911 Temp
(1.003) (0.0049)
La obs. 12 no se ha utilizado en
la estimación del modelo
= 0.9996 ̂ = 0.1136
Regresión Lineal 37
Forbes : modelo 2
Regresión Lineal 38
Forbes: Modelo 2
Regresión Lineal 39
Forbes: Instrucciones R
> # Modelo m2 de Forbes
> out <- abs(residuals(m1)) > 3*0.3792
> m2 <- lm(100*log10(Pres[!out]) ~ Temp[!out])
> summary(m2)
Regresión Lineal 40
Regresión Lineal 41
FEV (Ejemplo 4)
Ejemplo “Fev” Forced Expiratory Volume (FEV)
654 observaciones, 5 variables
Fuente:
Rosner, B. (1999), Fundamentals of Biostatistics, 5th Ed., Pacific Grove, CA: Duxbury
age fev ht sex smoke
Variables 1 9 1.708 57.0 0 0
2 8 1.724 67.5 0 0
age años del individuo 3 7 1.720 54.5 0 0
fev variable continua en litros 4 9 1.558 53.0 1 0
ht variable continua, estatura en pulgadas 5 9 1.895 57.0 1 0
6 8 2.336 61.0 0 0
sex cualitativa (mujer=0, hombre=1) ...
smoke cualitativa (No-fumador=0, fumador=1)
Tabla 6.1
Regresión Lineal 42
Regresión Lineal 43
FEV: modelo 1
log(fev) = −2.27 + 0.052 ht
(0.063) (0.0010)
= 0.7956 ̂ = 0.1508
Regresión Lineal 44
FEV: modelo 1
Regresión Lineal 45
5 ht
g( ) = −2.27 + 0.052
log(fev)
FEV: Modelo 1
((0.063)
0.063)) ((0.0010)
0.0010))
= 0.7956
0.7956 ̂ = 0.1508
0.1508
1
Regresión Lineal 46
Tabla 6.2
Regresión Lineal 47
FEV : Instrucciones de R
> # FEV (ejemplo 4)
> dat <- read.table("fev.dat",header=TRUE)
> head(fev) #tabla 6.1
> attach(dat)
> m<-lm(fev~ht) # modelo m inicial
> par(mfrow=c(1,2))
> plot(ht,fev,col="blue") # figura 6.1
> abline(m,col="red",lwd=2)
> plot(ht,residuals(m),col="blue") # figura 6.2
> abline(c(0,0),col="red",lwd=2,lty=2)
> m1 <- lm(log(fev) ~ ht)
> summary(m1) # modelo estimado tabla 6.2
> plot(ht,log(fev),col="blue") # figura 6.3
> abline(m1,col="red",lwd=2) # figura 6.3
> plot(ht,residuals(m1),col="blue") # figura 6.4
> abline(c(0,0),col="red",lty=2,lwd=2)
> par(mfrow=c(1,2)) # figura 6.5 y 6.6
> hist(residuals(m1),col="red",nclass=20,xlab="Residuos")
> qqnorm(residuals(m1),col="blue")
> qqline(residuals(m1),col="red",lty=2,lwd=2)
Regresión Lineal 48
Brains (ejemplo 5)
Ejemplo “Brains” Peso del cuerpo y cerebro de mamiferos
62 observaciones, 2 variables
Descripción:
Para 62 especies de mamíferos se proporciona el peso medio del cuerpo en kilogramos y
del cerebro en gramos BrainWt BodyWt
Arctic_fox 44.500 3.385
Owl_monkey 15.499 0.480
Variables: Beaver 8.100 1.350
BrainWt Peso del cerebro (gramos) Cow 423.012 464.983
Gray_wolf 119.498 36.328
BodyWt Peso del Cuerpo (kilogramos) Goat 114.996 27.660
Tabla 7.1
OBJETIVO: Estudiar la relación entre
peso del cerebro y peso del cuerpo.
Fuentes
Allison, T. and Cicchetti, D. (1976). Sleep in mammals: Ecology and constitutional
correlates. Science, 194, 732-734.
Weisberg, S. (2005). Applied Linear Regression, 3rd edition. New York: Wiley
Regresión Lineal 49
Brains: Transformación
• En la escala original (figura 7.1) no tiene sentido el
modelo de regresión lineal.
• Haciendo las transformación logarítmica de las dos
variables (figura 7.2) se aprecia una clara relación lineal
Regresión Lineal 50
Brains: modelo 1
log(BrainWt) = 2.13 + 0.752 log(BodyWt)
(0.096) (0.028)
= 0.9208 ̂ = 0.6943
Regresión Lineal 51
log(BrainWt) = 2.13 + 0.752 log(BodyWt)
= 0.9208 ̂ = 0.6943
Regresión Lineal 52
Tabla 7.2
Regresión Lineal 53
Brains : Instrucciones de R
> brains <- read.table("brains.txt",header=TRUE)
> head(brains) # tabla 7.1
> par(mfrow=c(1,2))
> plot(BodyWt,BrainWt,col="blue",xlim=c(-1000,9000)) # figura 7.1
> sel = BrainWt>1000 # selecciona observaciones con peso del cerebro >1000
> text(BodyWt[out],BrainWt[out]-300,labels=brains[out,1]) # etiquetas 7.1
> m <- lm(BrainWt ~ BodyWt)
> abline(m,col="red",lwd=2) # figura 7.1
> plot(log(BodyWt),log(BrainWt),col="blue") # Figura 7.2 y 7.3
> m1 <- lm(log(BrainWt) ~ log(BodyWt))
> abline(m1,col="red",lwd=2) # linea en figura 7.2 y 7.3
> summary(m1) # tabla 7.2
> plot(log(BodyWt),residuals(m1),col="blue",ylim=c(-4,4)) # figura 7.4
> abline(c(0,0),col="red",lty=2,lwd=2)
> abline(c(-2*.6943,0),col="red",lty=2,lwd=2)
> abline(c(+2*.6943,0),col="red",lty=2,lwd=2)
Regresión Lineal 54
Regresión Lineal 55
Regresión
3: Regresión Múltiple I
Regresión Lineal 2
Modelo regresión múltiple
yi E 0 E1x1i E 2 x2i E k xki ui ,
ui o N (0, V 2 )
Regresión Lineal 3
Estimación
yi E0 E1 x1i E 2 x2i E k xk i ui , ui o N (0, V 2 )
=
=
⋮
= − ̅ − ̅ −⋯− ̅
¦e 2
i
ei yi yˆ i o sˆR2 i 1
g.l. = n-k-1
n k 1
Regresión Lineal 4
Notación matricial
Y Xβ U
U o N (0, V 2 I )
Regresión Lineal 5
Estimación mínimo-cuadrática
§ y1 · §1 x11 x21 xk1 ·§ Eˆ0 · § e1 ·
¨ ¸ ¨ ¸¨ ¸ ¨ ¸
¨ y2 ¸ ¨1 x12 x22 xk 2 ¸¨ Eˆ1 ¸ ¨ e2 ¸
¨ ¸ ¨ ¨ ¸
¸¨ ¸ ¨ ¸
¨ ¸ ¨ ¸ ¨ ¸
¨y ¸ ¨1 xkn ¹© E k ¹ ¨© en ¸¹
¸¨ ˆ ¸
© n¹ © x1n x2n
Y Xβˆ e
donde el vector e cumple
2 n
e ¦ ei2 es mínimo
i 1
Regresión Lineal 6
Para que ||e||2 sea mínimo, e tiene que ser
perpendicular al espacio vectorial generado las
columnas de X
§1 x11 x21 xk1 · § e1 ·
¨1 x12 x22 xk 2 ¸, e ¨e ¸
X ¨ ¸ ¨ 2 ¸
¨ ¸ ¨ ¸
©1 x1n x2 n xkn ¹ © en ¹
¦1nei 0
° n
°
X Te 0 ® ¦1 ei x1i 0
° n
°¯ ¦1 ei xki 0
Regresión Lineal 7
Mínimos cuadrados
Y Solución MC
x1
Y
e ˆ
YY
x1
x2
ˆ
Y ˆ
Xβ
X Te 0 x2
X T Y X T Xβˆ X T e
X T Y X T Xβˆ βˆ ( X T X) 1 X T Y
Regresión Lineal 8
Matriz de proyección V
Y e (I V)Y
x1 Val. Previstos
ˆ Xβˆ
Y
ˆ
Y VY ˆ X(X T X) 1 X T Y
Y
1 ˆ VY
Y
Residuos
e Y Xβˆ Y VY V X(XT X) 1 XT
(I V)Y Simétrica V=VT
Idempotente VV=V
Regresión Lineal 9
Distribución de probabilidad
de β̂
Y o N ( Xβ, V 2I )
βˆ (X T X)1 X T Y CY (siendo C (X T X)1 X T )
βˆ o Normal
E[βˆ ] CE[Y ] CXβ (X T X)1 X T Xβ β
Var[βˆ ] Var[CY] CVar[Y ]CT
((X T X)1 X T )(V 2I )((X T X)1 X T )T
V 2 (X T X)1 X T X(XT X)1
V 2 (X T X)1
Regresión Lineal 10
Distribución de probabilidad
de β̂
βˆ o N (β, V 2 (X T X) 1 )
Eˆi o N ( E i , V 2 qii )
§ Eˆ 0 · § E0 · § q00 q01 q0 k ·
¨ ¸ ¨E ¸ ¨q
βˆ ¨ Eˆ1 ¸ β ( XT X) 1 q11 q1k ¸
¨ 1¸ Q ¨ 10 ¸
¨ ¸ ¨ ¸ ¨ ¸
¨ Eˆ ¸ © Ek ¹ © qk 0 qk1 qkk ¹
© k¹
dim(Q) (k 1) u (k 1)
Regresión Lineal 11
Residuos
Y Xβˆ e
Observados Previstos Residuos
Regresión Lineal 12
Varianza Residual
e Te ¦in 1 ei2
V2 V2
o F n2 k 1
2 ¦in 1 ei2
sˆR
¦in 1 ei2 n k 1
E[ ] n k 1 2
V2 (n k 1) sˆR
o F n2k 1
¦in 1 ei2 V2
E[ ] V2
n k 1
Regresión Lineal 13
Contraste individual Ei
H 0 : Ei 0
yi E 0 E1x1i E k xki ui
H1 : E i z 0
Eˆi o N ( E i , V 2 qii )
Eˆi E i Eˆ1 E1
o N (0,1) o t n k 1
V qii sˆR qii
Eˆi
ti ; ti ! t n k 1;D / 2 Se rechaza Ho
sˆR qii
Regresión Lineal 14
Contrastes individuales
R.R. R.R
Eˆ 1 tn-k-1
t1 ;
SE ( Eˆ ) 1
1-D D/2
t1 ! t n k 1;D / 2 Se rechaza Ho D/2
R. Acept.
-tD/2 tD/2
Regresión Lineal 15
H 0 : Ei 0
P-valor H1 : E i z 0
n-k-1
… … … … …
SE( )
=
SE( )
Regresión Lineal 17
̂ = 0.1476
Regresión Lineal 18
Modelo en diferencias a la
media
yi Eˆ0 Eˆ1x1i Eˆ k xki ei n
¦ yi
n
nEˆ0 Eˆ1 ¦ x1i Eˆ k
n n
¦ xki ¦ ei
i 1 i 1 i 1 1
Eˆ0 Eˆ1x1 Eˆ k xk
i,
y 0
ˆ Y ~ˆ ~ˆ
Y Xb YY Xb e
Regresión Lineal 19
Modelo en diferencias a la
media
~ ~
Y Xb U
§ y1 y · § y· § E1 · § Eˆ1 ·
¨ ¸ ¨ ¸ ¨ ¸ ¨ ¸
~ ¨ y2 y ¸ ¨ y¸ ¨ E2 ¸ ˆ ¨ Eˆ2 ¸
Y ¨ , Y , b ¨ ¸, b ¨ ¸
¸ ¨¸
¨¨ ¸¸ ¨¨ ¸¸ ¨¨ ¸¸ ¨¨ ¸¸
© n
y y ¹ © ¹
y © Ek ¹ © Eˆk ¹
§ x11 x1 x21 x2 xk1 xk ·
¨ ¸
~ ¨ x12 x1
X
x22 x2 xk 2 xk ¸
¨ ¸
¨¨ ¸
© x1n x1 x2n x2 xkn xk ¸¹
~ T ~ 1 ~ T ~ ~ ~
ˆb (X X) X Y bˆ o N (b, σ 2 ( XT X) 1 )
Regresión Lineal 20
Descomposición de la
variabilidad en regresión
Regresión Lineal 21
Coeficiente de determinación R2
Regresión Lineal 22
2
Coef. determinación corregido R
n
VE VT VNE VNE (n k 1) sˆR2 ¦ ( yi y ) 2
R2 1 1 sˆ 2y i 1
VT VT VT (n 1) sˆ y2 n 1
sˆR2 VNE n 1
R2 1 2 1 u
sˆ y VT n k 1
n 1
1 (1 R ) u
2
n k 1
= 1 − (1 − 0.8071) × =0.8065
Regresión Lineal 23
VE Acep. H0
Rechazo H0
2
sˆ
E oV 2 (Si H o es cierto)
k
sˆR2 o V 2 α = 0.05
sˆE2
F o Fk ,n k 1
sˆR2
F ! FD Se rechaza H0 F1,n-2 Fα
Regresión Lineal 24
Contraste F
log(fev) = −1.97 + 0.0439 ht + 0.0198 age, ̂ = 0.1476
(0.078) (0.0016) (0.0031)
VE 58.436
sˆE2 29.268
H 0 : E1 E2 0 k 2
sˆR2 0.021
H1 : algún E i z 0 sˆE2 29.268
F 1362
F2,651 sˆR2 0.021
α = 0.05
1362 ! 3.01 Se rechaza H 0
sˆE2
Explicada (VE) ¦ ( yˆ i y) 2
k sˆ 2
E sˆR2
Residual (VNE) ¦(y i yˆ i ) 2 n k 1 sˆR2
Total (VT) ¦(y i y)
2
n 1
R2
VE ¦ i
( ˆ
y y ) 2
VT ¦(y i y)2
Análisis de la varianza 26
Tabla de Análisis de la Varianza
log(fev) = −1.97 + 0.0439 ht + 0.0198 age, ̂ = 0.1476
(0.078) (0.0016) (0.0031)
Suma de Grados de
FUENTES Cuadrados Libertad Varianzas F
58.536
R2 0.8071
72.526
Análisis de la varianza 27
Regresión Lineal 28
Ejemplo 1: Cars
Depend Regresores
Y X1 X2 X3 X4
Regresión Lineal 29
Datos Resultados n
VE ¦ ( yˆ i y)2 4725.0
Y X1 X2 X3 X4 i 1
n
VNE ¦(y
i 1
i yˆ i ) 2 1037.9
n
VT ¦(y
i 1
i y)2 5762.9
2
1037.9
̂ = =
− −1 386
= 2.7
4725
= = = 81.99
5762.9
Regresión Lineal 30
DIAGNOSIS: residuos ~ regresores
Regresión Lineal 31
Diagnosis
Linealidad Normalidad
Homocedasticidad ok
ok
Regresión Lineal 32
Resumen del modelo
Regresión Lineal 33
Regresión Lineal 34
Conclusiones modelo final
= −1.05 + 0.0058 engine + 0.0369 horse + 0.0020 weight + 0.0813 accel
̂ = 1.64 = 81.99
Regresión Lineal 35
Regresión Lineal 36
CARS: Todos los modelos
Modelo
1
engine
2
horse
3
weight
4
accel ̂
1 0,032 1,874 76,28 76,22
0,0009
Regresión Lineal 37
Conclusiones Generales
1. El que la relación lineal entre dos variables sea significativa no implica que exista
relación de CAUSALIDAD entre las variables. Se debe interpretar como asociación
entre las variables: los coches con más pesos presentan mayor consumo que los
coches con menos peso.
Regresión Lineal 38
Conclusiones (cont.)
7. La selección del modelo depende del objetivo. Siempre el modelo con más
regresores tiene el mayor R2. Utilizando el “R2 corregido” hay tres modelos
muy parecidos 23, 123 y 1234. El mejor modelo con un regresor es el 3, con R2
igual al 78.55%, al incluir la pontencia (horse) como nuevo regresor tenemos el
modelo 23 cuyo R2 sólo aumenta un 3%, hasta 81.67%. El modelo 123, incluye
además los cc del motor (engine) como regresor con un aumento en R2
despreciable (ahora 81.86%). En este modelo los tres coeficientes son
significativos. Si añadimos la variable accel, llegamos al modelo completo con
R2 igual a 81.99%. El coeficiente de la última variable no es significativo.
8. Al ir incluyendo regresores en un modelo los residuos van disminuyendo y con
ello la variabilidad no explicada. La desviación típica residual también suele
disminuir (hay que tener en cuenta que el denominador de la varianza residual
también disminuye). Los modelos 23, 123 y 1234 tienen una desviación típica
residual muy parecida y próxima a 1.64 litros/100km. La interpretación
(aproximada) es la siguiente (con el modelo 1234): si nos proporcionan los datos
del peso (weight), potencia (horse), cc (engine) y aceleración (accel) del coche
la distribución de su consumo tiene media la proporcionada por el modelo y
desviación típica 1.64 litros/100km.
Regresión Lineal 39
Regresión Lineal 40
Cerezos negros: Datos
Regresión Lineal 41
Gráficos x-y
Regresión Lineal 42
Primer modelo:cerezos negros
Volumen β0 β1 Diametro β2 Altura Error
Regresión Lineal 43
Diagnosis
Regresión Lineal 44
Transformación
vol | k u altura u diámetro 2
log(vol) | E 0 E1 log(altura) E 2 log(diámetro) error
Regresión Lineal 45
Antes
Ahora
Regresión Lineal 46
Interpretación
Se comprueba gráficamente que la distribución
de los residuos es compatible con las hipótesis
de linealidad y homocedasticidad.
El volumen está muy relacionada con la altura y
el diámetro del árbol (R2= 97.77%)
El modelo estimado
log(Vol) = -6.6 + 1.12 log(Alt) + 1.98 log(Diam.) + Error
Regresión Lineal 47
Ejemplo 3: Tabaco
Ejemplo “Tabaco” Monóxido de Carbono (CO)
25 observaciones, 3 variables
Variables
alq contenido en alquitrán mg
nico contenido en nicotina mg
co monóxido de carbono CO mg
Regresión Lineal 48
CO ~ nico CO ~ alq
= 91.86 ̂ = 1.413
Regresión Lineal 49
Efecto de la multicolinealidad
(alta correlación entre nico y alq)
Regresión Lineal 50
Regresión con R
Interpretación (inicial)
Contraste F=438 (p-valor=0.0000) Alguno de
los regresores influye significativamente en el
consumo.
Contrastes individuales:
La potencia y el peso influyen significativamente (p-
valor=0.0000)
Para D=0.05, la cilindrada y la aceleración también
tienen efecto significativo (p-valor < 0.05)
El efecto de cualquier regresor es “positivo”, al
aumentar cualquiera de ellos aumenta la variable
respuesta: consumo.
Los regresores explican el 82 % de la variabilidad
del consumo (R2 = 0.8197)
Regresión Lineal 52
Multicolinealidad
Regresión Lineal 53
Identificación de la multicolinealidad:
Matriz de correlación de los regresores.
Regresión Lineal 54
Gráficos consumo - xi
24 24
20 20
consumo
consumo
16 16
12 12
8 8
4 4
0 0
500 1000 1500 2000 0 40 80 120 160 200 240
peso potencia
24 24
20 20
consumo
consumo
16 16
12 12
8 8
4 4
0 0
0 2 4 6 8 8 11 14 17 20 23 26
(X 1000)
cilindrada aceleracion
Regresión Lineal 55
Consumo y aceleración
Regresión Lineal 56
Multicolinealidad: efecto en la
varianza de los estimadores
yi E 0 E1x1i E 2 x2i ui
ª§ Eˆ ·º
var «¨¨ 1 ¸¸» X~ T X~ 1V 2 ~T X
X ~ nS XX S XX
§ s12
¨
¨s
s12 ·¸
s22 ¸¹
§ s12
¨
¨r s s
r12 s1s2 ·¸
s22 ¸¹
¬© Eˆ 2 ¹¼ © 12 © 12 1 2
§ 1 r12 ·
¨ 2 2 2 ¸
¨ s1 (1 r12 ) s1 s2 (1 r12 )¸
| S XX | s12 s22 (1 r12
2
) S XX
1
¨ ¸
r12 1
¨ ¸
¨ s s (1 r 2 ) s22 (1 r12
2
) ¸
© 1 2 12 ¹
§ V 2
r12V 2 ·
¨ ¸
ª§ Eˆ1 ·º ¨ ns12 (1 r122 ) 2 ¸
ns1 s2 (1 r12 )
var «¨¨ ¸¸» ¨ ¸
«¬© Eˆ 2 ¹»¼
2
¨ r12V V2 ¸
¨ ns s (1 r122 ) ns2 (1 r12 ) ¸¹
2 2
© 1 2
Regresión Lineal 57
Consecuencias de la
multicolinealidad
Gran varianza de los estimadores E
Cambio importante en las
estimaciones al eliminar o incluir
regresores en el modelo
Cambio de los contrastes al eliminar
o incluir regresores en el modelo.
Contradicciones entre el contraste F
y los contrastes individuales.
Regresión Lineal 58
Regresión
4. Regresión Múltiple: Variables
Cualitativas y Predicción
Regresión Lineal 2
Variables cualitativas como
regresores
°
Europa
Origen ® Japón
°̄ USA 0 si i JAPON
Z JAP i ®1 si i JAPON
¯
0 si i USA
ZUSA i ®1 si i USA
¯
0 si i EUROPA
Z EUR i ®1 si i EUROPA
¯
Regresión Lineal 3
Variables cualitativas
Consumo Cilindrada Potencia Peso Aceleración ZJAP ZUSA ZEUR
l/100Km cc CV kg segundos
15 4982 150 1144 12 0 0 1
16 6391 190 1283 9 1 0 0
24 5031 200 1458 15 0 1 0
9 1491 70 651 21 0 0 1
11 2294 72 802 19 1 0 0
17 5752 153 1384 14 0 1 0
12 2294 90 802 20 0 0 1
17 6555 175 1461 12 0 1 0
18 6555 190 1474 13 0 1 0
12 1147 97 776 14 1 0 0
16 5735 145 1360 13 0 1 0
12 1868 91 860 14 0 0 1
9 2294 75 847 17 0 1 0
... ... ... ... ... ... ... ...
Consumo = E0 + E1 CC + E2 Pot + E3 Peso +
Regresión Lineal 4
Interpretación var. cualitativa
Consumo = E0 + E1 CC + E2 Pot + E3 Peso +
Regresión Lineal 5
E0 + DJAP
xi
Regresión Lineal 6
Modelo estimado (con R)
Regresión Lineal 7
Interpretación
Se introduce en el modelo la variable cualitativa
ORIGEN del vehículo (USA=1, EUR=2,JAP=3). En el
modelo se utiliza USA como referencia.
El p-valor del coeficiente asociado a OrigenJAP es
0.1467 >.05, se concluye que no existe diferencia
significativa entre el consumo de los coches
Japoneses y Americanos (manteniendo constante el
peso, cc, pot y acel.)
La misma interpretación para OrigenEUR, no existe
diferencia en el consumo de coches EUR y USA.
Comparando R2 =0.8212 de este modelo con el
anterior R2=0.8199, se confirma que el modelo con
las variables de Origen no suponen una mejora
sensible.
Regresión Lineal 8
Body: Instrucciones con R
# ejemplo1 cars : modelo de regresión
Regresión Lineal 9
Regresión Lineal 11
Estatura Peso
Hombres 177.7cm 78.1 kg
Body Mujeres 164.9cm 60.6 kg
Diferencia 12.8 cm 17.5 kg
Regresión Lineal 12
Interpretación
8.36 kg
A igualdad de
ESTATURA, la
diferencia de
PESO entre un
hombre y una
mujer es
Figura 2.1. 8.36 kg
Regresión Lineal 13
# figura 2.1
Regresión Lineal 14
FEV (Ejemplo 3)
Ejemplo “Fev” Forced Expiratory Volume (FEV)
654 observaciones, 5 variables
Fuente:
Rosner, B. (1999), Fundamentals of Biostatistics, 5th Ed., Pacific Grove, CA: Duxbury
age fev ht sex smoke
Variables 1 9 1.708 57.0 0 0
2 8 1.724 67.5 0 0
age años del individuo 3 7 1.720 54.5 0 0
fev variable continua en litros 4 9 1.558 53.0 1 0
ht variable continua, estatura en pulgadas 5 9 1.895 57.0 1 0
6 8 2.336 61.0 0 0
sex cualitativa (mujer=0, hombre=1) ...
smoke cualitativa (No-fumador=0, fumador=1)
Tabla 6.1
Regresión Lineal 15
Modelo de regresión
Log(fev) = E0 + E1 ht + E2 age + DHOM ZHOM + DHOM ZHOM + Error
Regresión Lineal 16
Interpretación
1. Todos los coeficientes son significativamente distintos de cero.
2. A igualdad del resto de las variables, un aumento de 1cm en la
Estatura produce un incremento en fev del 4.2%
3. A igualdad del resto de las variables, un aumento de 1 año en la
Edad produce un incremento en fev del 2.3%
4. A igualdad del resto de las variables, los hombres tienen un 2.9%
más de fev que las mujeres.
5. A igualdad del resto de las variables, los fumadores tienen un
4.6% menos de fev que los no-fumadores.
Regresión Lineal 17
Regresión Lineal 18
Predicción
Media mh|xh Nueva Observ. yh|xh
mh yh
mh
xh xh
ŷ h
xh
Regresión Lineal 19
Predicción de la media mh
(Regresión simple)
mh ŷ h
xh xh
m yˆ r tD / 2 sˆR vhh
h h ŷ h
1 ( xh x ) 2
vhh (1 2
)
n sx
xh
Regresión Lineal 20
Predicción de la media mh
(Regresión multiple)
mh ŷ h
xh xh
m yˆ r tD / 2 sˆR vhh
h h ŷ h
1
vhh (1 (x h x)T S x1 (x h x))
n
xh
Regresión Lineal 21
ŷ h
xh
y yˆ r tD / 2 sˆR 1 vhh
h h
Regresión Lineal 22
Límites de predicción
m yˆ r tD / 2 sˆR vhh
yˆ Eˆ0 Eˆ1 x1 Eˆ k xk h h
y yˆ r tD / 2 sˆR 1 vhh
y h h
x
Regresión Lineal 23
Predicción
Weight = -56.9 + 0.713 Height + 8.366 ZHOM + Error
Regresión Lineal 24
Intervalos
95% confianza
Int. Confianza Previsto Lim. Inf Lim. Sup
Height=175,Sexo = 1 76.19 75.04 77.33
Height=170,Sexo = 0 64.25 63.03 65.47
Regresión Lineal 25
Predicción: Instrucciones R
# ejemplo 3: fev
> newbody <- data.frame(Height=170,Gender=0)
> predict(m.body,newbody,interval="confidence")
fit lwr upr
1 64.2563 63.03951 65.4731
Regresión Lineal 26
Otros ejemplos con R
> newcar <- data.frame(horse=130,engine=180,accel=12,Origen="USA", weight=3000)
> predict(m,newcar,interval="confidence")
fit lwr upr
1 11.84055 11.47096 12.21014
Regresión Lineal 27
APÉNDICE: PREDICCIÓN
Regresión Lineal 28
Predicción de la media mh
(Regresión simple)
mh ŷ h
xh xh
yh o N ( E 0 E1xh , V 2 ) yˆ h Eˆ0 Eˆ1xh y Eˆ1 ( xh x )
mh E 0 E1xh E[ yˆ h ] E[ Eˆ0 Eˆ1xh ] E 0 E1xh mh
var[ yˆ h ] var[ y Eˆ1 ( xh x )]
var[ y ] ( xh x ) 2 var[ Eˆ1 ]
§ ·
¨ V2¨
§
( xh x ) 2 ·¸ ¸ V2 V2
yˆ h o N ¨ mh , ¨1 ¸¸ ( xh x ) 2
¨ n ¨ 2 ¸¸
© ©
sx ¹¹ n nsx2
Regresión Lineal 29
Predicción de la media mh
(Regresión múltiple)
mh ŷ h
yh o N (mh , V 2 )
xh x'h
βˆ T x'h , x'T (1, x1h , x2h , , xkh )
E 0 E1 x1h E k xkh
yˆ h
mh h
T 1
© ¹
T
v
hh x'
h (X X) x 'h
Regresión Lineal 30
Expresión alternativa para vhh
yˆ h y bˆ T (x h x)
var[ yˆ h ] var[ y bˆ T (x h x)] var[ y ] (x h x)T var[bˆ ](x h x)
~T ~
V2 ~ ~ X X
(x h x)T ( XT X) 1 (x h x)V 2 , (S x )
n n
V2
(1 (x h x)T S x1 (x h x))
n
1 xh x vhh 1/ n
vhh (1 (x h x)T S x1 (x h x)) x h z x vhh ! 1 / n
n
Regresión Lineal 31
m yˆ r tD / 2 sˆR vhh
h h
Regresión simple
1 1 ( xh x ) 2
vhh (1 (xh x)T S x1 (xh x)) vhh (1 )
n n s x2
Regresión Lineal 32
Predicción de una nueva
observación yh (Reg.Simple)
yh
ŷ h
mh
xh xh
yˆ h Eˆ0 Eˆ1 xh yh o N (mh , V ) 2
yˆ h o N (mh , V 2 vhh ) mh E 0 E1 xh
e~ y yˆ
h h h
E[e~h ] E[ yh ] E[ yˆ h ] 0
var[ e~h ] var[ yh ] var[ yˆ h ] e~h o N ( 0, V 2 (1 vhh ))
V 2 V 2 vhh
Regresión Lineal 33
xh xh
yˆ h y bˆ T x h yˆ h o N (mh , V 2vhh )
E[e~h ] E[ yh ] E[ yˆ h ] 0
e~h yh yˆ h o ® ~ ] var[ y ] var[ yˆ ] V 2 (1 v )
¯ var[ eh h h hh
~
eh o N ( 0, V (1 vhh ))
2
Regresión Lineal 34
Intervalos de predicción para
una nueva observación yh
e~h o N 0, V 2 (1 vhh )
e~h yh yˆ h ŷ h
yh yˆ h
o N (0,1)
V 1 vhh
yh yˆ h
o tn k 1
sˆR 1 vhh
xh
y yˆ r tD / 2 sˆR 1 vhh
h h
Regresión Lineal 35
Límites de predicción
m yˆ r tD / 2 sˆR vhh
yˆ Eˆ0 Eˆ1 x1 Eˆ k xk h h
y yˆ r tD / 2 sˆR 1 vhh
y h h
x
Regresión Lineal 36
Diagnosis: Residuos
Y Xβˆ e
Observados Previstos Residuos
Regresión Lineal 37
V X(X T X) 1 X T
e o Normal
°
® E[e] (I V)E[Y] (I V)Xβ 0
°̄var[e] (I V) var(Y)(I V) V 2 (I V)
e o N (0, V 2 (I V))
ei o N (0, V 2 (1 vii ))
Regresión Lineal 38
Distancia de Mahalanobis
Di2 (x i x)T S x 1 (x i x) (Dist. de Mahalanobis)
x i x Di2 0
Mide la distancia de x i a x ®
¯x i z x Di ! 0
2
1
vii x'Ti ( XT X) 1 x'i (1 (x i x)T S x1 (x i x))
n
vii son los elementos diagonales de la matriz V
V X(X T X) 1 XT
n n n 1
vii ¦ vij v ji ¦ vij2 vii2 vii (1 vii ) ¦ vij2 t 0 d vii d 1
j 1 j 1, j z i j 1, j z i n
Regresión Lineal 39
Residuos estandarizados
ei o N (0, (1 vii )V ) 2
var(ei ) (1 vii )V 2
Residuos estandarizados
ei
ri
sˆR 1 vii
Regresión Lineal 40
Modelos de regresión lineal
REGRESION SIMPLE
1. La tabla muestra los mejores tiempos mundiales en Juegos Olı́mpicos hasta 1976 en carrera
masculina para distintas distancias.
y: tiempo (sg) 9.9 19.8 44.26 103.5 214.9 806.4 1658.4 7795
x: distancia (m) 100 200 400 800 1500 5000 10000 42196
2. Según la ecuación de los gases ideales, la presión ejercida por un gas a volumen y temperatura
constante es proporcional a la masa. Se puede utilizar el siguiente procedimiento para estimar
el peso molecular de un gas. Se almacena el gas en un recipiente de volumen constante, y se va
soltando poco a poco gas, variando la presión, pero manteniendo la temperatura constante.
En la tabla adjunta se proporcionan mediciones de la presión (con respecto a la atmosférica,
1 atm = 14.7 psi) y de la masa del gas para el árgon.
Pi = β 0 + β 1 mi + ui con ui ∼ N(0, σ 2 ).
Estimar los parámetros del modelo y contrastar si el término independiente es signi-
ficativo.
1
(b) Se considera el modelo alternativo
3. Sir Francis Galton (1877) estudió la relación entre la estatura de una persona (y) y la estatura
de sus padres (x) obteniendo las siguientes conclusiones:
Contrastar (α = 0.05) estas dos conclusiones con la ecuación ŷ = 17.8 + 0.91x resultante de
estimar un modelo de regresión lineal entre las variables (en cm.) descritas anteriormente
para una muestra de tamaño 100 si la desviación tı́pica (estimada) de β̂ 1 es 0.04.
4. La ley de Hubble sobre la expansión del universo establece que dadas dos galaxias la ve-
locidad de desplazamiento de una respecto a la otra es v = Hd, siendo d su distancia y H
la constante de Hubble. La tabla proporciona la velocidad y la distancia de varias galaxias
respecto a la Via Láctea. Se pide:
2
Nota: Obsérvese que según el modelo de Hubble la regresión debe pasar por el origen.
Tómese 1 año luz = 300 000 Km/seg x 31 536 000 seg = 9.46 1012 Km.
xi 0.20 0.50 0.60 0.70 0.90 1.00 1.20 1.50 1.60 1.70
yi 23 20 33 45 67 52 86 74 98 102
Tabla: Alargamiento yi (mm) producidos por la tensión xi (Tm/cm2 ).
unidades reparadas 1 3 4 6 7 9 10
tiempo de reparación 23 49 74 96 109 149 154
Se pide:
3
(a) Construir la recta de regresión para prever el tiempo de reparación y utilizarla para
construir un intervalo de confianza (α = 0.01) para el tiempo medio de reparación de
8 unidades.
(b) Construir un intervalo de confianza (α = 0.01) del tiempo de reparación para un lote
de 14 unidades.
(c) Si los tiempos de reparación fuesen medias de 10 datos. ¿Cual serı́a la recta de regresión?
REGRESION MULTIPLE
9. En la tabla se muestran los costes financieros mensuales en miles de euros (y) de 16 delega-
ciones de una gestora de inversiones, además se proporciona el número de nuevos préstamos
del mes (x1 ) y el número de préstamos pendientes (x2 ).
n x1 x2 y
1 80 8 2256
2 93 9 2340
3 100 10 2426
4 82 12 2293
5 90 11 2330
6 99 8 2368
7 81 8 2250
8 96 10 2409
9 94 12 2364
10 93 11 2379
11 97 13 2440
12 95 11 2364
13 100 8 2404
14 85 12 2317
15 86 9 2309
16 87 12 2328
4
10. Los fabricantes que utilizan rodamientos en sus productos tienen interés en la fiabilidad de
estos componentes. La medida básica de fiabilidad se denomina rating life, y consiste en el
número de revoluciones que soporta el 90% de los rodamientos antes de la fractura, a esto
se denota por L10. Los modelos teóricos indica que este valor está relacionado con la carga
(P) a la que se somete el rodamiento, el diámetro (D) del rodamiento y el número de bolas
(Z) del mismo, mediante la ecuación:
3
kZ a D b
L10 = .
P
5
(a) Estima el modelo
log(L10i ) = β 0 + β 1 log(Zi ) + β 2 log(Di ) + β 3 log(Pi ) + ui con ui ∼ N(0, σ 2 ),
y realiza los contrastes individuales y el contraste general.
(b) Según el modelo, β 3 = −3. Realiza el contraste
H0 : β 3 = −3
H1 : β 3 6= −3
Proporciona el p-valor del contraste.
(c) Da un intervalo de confianza para los parámetros a y b del modelo teórico.
(d) Se definen las variables ficticias T2 y T3 para identificar los rodamientos tipo 2 y 3 del
segundo fabricante (información en la variable Btype). Estima e interpreta el siguiente
modelo de regresión:
log(L10i ) = β 0 + β 1 log(Zi ) + β 2 log(Di ) + β 3 log(Pi ) +
α2 T2i + γ 2 T2i × log(Zi ) + δ 2 T2i × log(Di ) +
α3 T3i + γ 3 T3i × log(Zi ) + δ 3 T3i × log(Di ) + ui
Baterı́a 1 2 3 4 5 6 7 8
Temperatura 10 10 20 20 30 30 40 40
Voltaje 7.2 7.7 7.3 7.4 7.7 9.4 9.3 10.8
6
Se pide:
(a) Contrastar la hipótesis (α = 0.05) de que no existe relación lineal entre el voltaje y la
temperatura.
(b) Las lecturas 1,3,5 y 7 fueron realizadas con unas baterı́as de Cadmio y las 2,4, 6 y 8 con
baterı́as de Zinc. Introducir en el análisis anterior una variable cualitativa que tenga
en cuenta los dos tipos de baterı́as y contrastar si es significativa al 95%.
(c) Dar un intervalo de confianza para el voltaje de una baterı́a de Cadmio que va a trabajar
a 35◦ centı́grados. (Utilizar el modelo estimado en el apartado 2).
(d) Comprobar que se cumplen las hipótesis del modelo construido en los apartados ante-
riores.
ŷi = β̂ 0 + β̂ 1 x1i .
15. Se efectúa una regresión con dos variables explicativas E[y] = β 0 + β 1 x1 + β 2 x2 . La matriz
de varianzas de x1 y x2 es
2 1
1 3
x -2 -2 -1 -1 0 0 1 1 2 2 3 3
y 1.1 1.3 2.0 2.1 2.7 2.8 3.4 3.6 4.0 3.9 3.8 3.6
(a) Estimar un modelo de regresión simple con y como variable dependiente y x como
regresor. Indicar si el modelo es apropiado, justificando la respuesta.
(b) Estimar el modelo
yi = β 0 + β 1 xi + β 2 x2i + ui
y realizar el contraste H0 : β 2 = 0.
(c) Estimar el modelo
yi = β 0 + β 1 xi + β 2 x2i + β 3 x3i + ui
Realizar el contraste general de regresión con α = 0.01. Seleccionar entre los tres el
modelo más adecuado, justificando la respuesta.
7
17. Una de las etapas de fabricación de circuitos impresos requiere perforar las placas y recubrir
los orificios con una lámina de cobre mediante electrólisis. Una caracterı́stica esencial del
proceso es el grosor de la capa de cobre. Se han realizado 12 experimentos para evaluar
el efecto de 7 variables, X1 : Concentración de Cobre, X2 : Concentración de Cloruro, X3 :
Concentración de Ácido, X4 : Temperatura, X5 : Intensidad, X6 : Posición y X7 : Superficie
de la placa. Cada variable se ha estudiado a dos niveles. Las condiciones experimentales y
los resultados de cada experimento se muestran en la tabla.
X1 X2 X3 X4 X5 X6 X7 Y
1 1 -1 1 1 1 -1 2.13
1 -1 1 1 1 -1 -1 2.15
-1 1 1 1 -1 -1 -1 1.67
1 1 1 -1 -1 -1 1 1.53
1 1 -1 -1 -1 1 -1 1.49
1 -1 -1 -1 1 -1 1 1.78
-1 -1 -1 1 -1 1 1 1.80
-1 -1 1 -1 1 1 -1 1.93
-1 1 -1 1 1 -1 1 2.19
1 -1 1 1 -1 1 1 1.61
-1 1 1 -1 1 1 1 1.70
-1 -1 -1 -1 -1 -1 -1 1.43
H0 : β 1 = β 2 = β 3 = β 4 = β 5 = β 6 = β 7 = 0
(b) Realizar cada uno de los contrastes individuales e indicar qué variables tienen efecto
significativo.
(c) Eliminar del modelo del apartado 1 todas las variables no significativas. Estimar el
modelo y contrastar sus coeficientes. Interpretar los resultados del experimento.
18. El molibdeno se añade a los aceros para evitar su oxidación, pero en instalaciones nucleares
presenta el inconveniente de ser el causante de gran parte de los productos radioactivos. Se
ha realizado un experimento para determinar el grado de oxidación del acero en función del
porcentaje de molibdeno. Además se ha tenido en cuenta el efecto del tipo de refrigerante
utilizado (R1 , R2 ). Los resultados se muestran en la tabla.
8
Molibdeno (%)
Refrig. 0.5% 1% 1.5% 2% Medias
R1 26.2 23.4 20.3 23.3 23.3
R2 34.8 31.7 29.4 26.9 30.7
R1 33.2 31.3 28.6 29.3 30.6
R2 43.0 40.0 31.7 33.3 37.0
Media 34.3 31.6 27.5 28.2 30.4
(a) Escribir un modelo de regresión que incluya el porcentaje de molibdeno y el tipo de re-
frigerante como regresores; estimar el modelo e indicar qué parámetros son significativos
(α = 0.05)).
(b) Los experimentos relativos a las dos primeras filas se realizaron en un tipo de instalación
y los correspondientes a las dos últimas en otra distinta. Escribir un nuevo modelo que
incluya este aspecto. Comprobar que este nuevo regresor está incorrelado con los dos
anteriores. Estimar el nuevo modelo.
(c) Demostrar que en un modelo con los regresores incorrelados, la eliminación de uno
de ellos no influye en el valor de los estimadores β̂ i , (i 6= 0) restantes. ¿ Influye en
la varianza residual y en los contrastes ? Explicar este efecto en función de que el
parámetro β del regresor eliminado sea o no nulo.
19. Sea x1 la altura del tronco de un árbol y x2 el diámetro del mismo en su parte inferior. El
volumen y del tronco de árbol puede ser calculado aproximadamente con el modelo
yi = αx1i x22i + ui ,
según el cual, el volumen del tronco es proporcional al volumen de un cono con las medidas
x1i , x2i , siendo α el parámetro (desconocido) de proporcionalidad, más una componente
de error aleatorio ui . La tabla siguiente contiene los datos (en metros y metros cúbicos)
correspondientes a una muestra aleatoria de 15 troncos de una variedad de pino.
9
(a) Estimar α por máxima verosimilitud suponiendo que las variables ui tienen distribución
normal de media cero, con la misma varianza e independientes.
(b) Un tronco tiene una altura de 20 metros y un diametro de 0.25 metros, dar un intervalo
de predicción de su volumen (95% de confianza).
(c) En el análisis de los residuos se observa que la varianza de los errores crece con el
volumen del tronco. Para obtener homocedasticidad se propone el siguiente modelo
transformado utilizando logaritmos neperianos,
20. Ciertas propiedades del acero se mejoran sumergiéndolo a alta temperatura (T0 = 1525
o
F ) en un baño templado de aceite (t0 = 95 o F ). Para determinar la influencia de las
temperaturas del acero y del baño de aceite en las propiedades finales del material se han
elegido tres valores de la temperatura del acero y tres del baño de aceite,
1450 o F 70 o F
Temperatura acero (T ) 1525 o F Temperatura aceite (t) 95 o F
o
1600 F 120 o F
x1i 0 0 0 0 -1 1 -1 1 0 0 -1 1
x2i 0 0 0 0 -1 -1 1 1 -1 1 0 0
yi 49.2 49.4 47.0 49.5 28.2 88.6 54.9 31.3 59.2 43.6 41.9 58.0
Ti − 1525 ti − 95
x1i = y x2i = .
75 25
Estimar el modelo de regresión
e indicar qué parámetros son significativos para nivel de significación 0.05. Estimar y con-
trastar el modelo anterior empleando las variables originales Ti y ti .
10
FORMULARIO DE LA ASIGNATURA
2.a) Modelo: 𝑦 𝜇 𝑢 , 𝑢 → 𝑁 0, 𝜎
𝑉𝐸 ∑ 𝑛 𝑦• 𝑦••
𝑉𝑁𝐸 ∑ ∑ 𝑦 𝑦• ∑ ∑ 𝑒
∑𝑛 𝑦 • 𝑦••
Tratamientos ∑𝑛 𝑦 • 𝑦•• 𝐾 1 𝑉𝐸/ 𝐾 1
𝐾 1 𝑠̂
Residual ∑∑ 𝑦 𝑦• 𝑛 𝐾 𝑠̂ 𝑉𝑁𝐸/ 𝑛 𝐾
Total ∑∑ 𝑦 𝑦•• 𝑛 1
𝑉𝑇 ∑ ∑ 𝑦 𝑦•• 𝑉𝐸 𝑇 𝐽∑ 𝑦• 𝑦••
𝑒 𝑦 𝑦• 𝑦• 𝑦••
𝑉𝑁𝐸 ∑ ∑ 𝑒 𝑉𝐸 𝐵 𝐼∑ 𝑦• 𝑦••
2.b) Tabla de Análisis de Varianza:
Página 2 de 8
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
1.c) Contrastes:
̂ ̂ ̄
𝛽 𝛽 →𝑡 𝛽 𝛽 1 →𝑡
√ √
donde 𝑣 se calcula:
̄
- RLS: 𝑣 1
Página 3 de 8
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
4. Instrucciones Esenciales R
0) Previo
library("DisRegETSII") # Para utilizar ICplot y interIC y los datos como "maquinas.txt"
data(maquinas) # carga los datos "maquinas" en la memoria de R
maquinas = read.table( 'maquinas.txt', header=T ) # lectura del archivo de texto 'maquinas.txt'
head(maquinas) # Muestra las 6 primeras filas del 'data frame' maquinas
View(maquinas) # Abre una ventana nueva y muestra los datos
names(maquinas) # Proporciona los nombres de las variables del 'data.frame' maquinas
maquinas$maq = factor(maquinas$maq) # Transforma una variable numérica a un *factor*
?head # Con ? delante de una función nos proporciona información de la función
#‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
# Cálculo de probabilidades
dnorm(x, 0, 1) # Función densidad de una distribución normal N(0,1)
pnorm(q, 0, 1) # Función distribución de una distribución normal N(0,1)
qnorm(p, 0, 1) # Función distribución inversa de una distribución normal N(0,1)
F. distr. Inv. F. distrib. F. Densidad Números aleatorios
Binomial pbinom qbinom dbinom rbinom
Chi‐Cuadrado pchisq qchisq dchisq rchisq
Exponencial pexp qexp dexp rexp
F pf qf df rf
Geométrica pgeom qgeom dgeom rgeom
Normal pnorm qnorm dnorm rnorm
Poisson ppois qpois dpois rpois
T‐Student pt qt dt rt
#‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
Instalación del paquete DisRegETSII:
1. Instalar el paquete “devtools” y cargarlo:
install.packages("devtools")
library(devtools)
2. Instalar el paquete utilizando la funcion install_github de devtools
install_github("javiercara/DisRegETSII")
Página 4 de 8
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
TukeyHSD(m1,'ant',conf.level=0.95) # Comparaciones dos ‐ a ‐ dos por el método de Tukey
plot( TukeyHSD(m1,'ant',conf.level=0.95) ) # Gráfico de los intervalos de confianza de diferencias 2‐a‐2
5) Regresión simple
library("DisRegETSII") # carga el paquete DisRegETSII con los datos
data(cars1) # carga los datos cars1 con consumo (mpg) y potencia (horse)
m0 = lm (mpg ~ horse, data = cars1) # estima el modelo de regresión: mpg = b0 + b1 horse + u
summary(m0) # proporciona los resultados del modelo m0
plot(cars1$horse,cars1$mpg) # gráfico de dispersión entre horse (x) y mpg (y)
abline (m0,col="red",wd=2) # dibuja la recta de reg. estimada en m0 (color rojo y grosor=2)
6) Regresión múltiple
m1 = lm (mpg ~ horse + weight +
accel, data = cars1) # estima el modelo de regresión múltiple
m1a = lm (mpg ~ horse +
I(horse^2) + weight +
accel, data = cars1) # incluye el término horse al cuadrado
m1b = lm (mpg ~ horse + weight +
I(horse*weight) +
accel, data = cars1) # incluye el término horse*weight
m1c = lm (log(mpg) ~ horse + weight +
accel, data = cars1) # utiliza el log de mpg como variable respuesta
9) Predicción
xnueva = data.frame(engine=180,
horse =100,weight=3000, accel =10,
origin = "JAP", cylinders=4) # coche nuevo para hacer predicción del consumo
predict(m3,xnueva,interval = "confidence") # predicción e intervalo para la media
predict(m3,xnueva,interval = "prediction") # predicción e intervalo para una nueva observación
Página 5 de 8
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
5. Tablas
1) Distribución Normal Estándar
Página 6 de 8
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
2) Distribución 𝝌𝟐
𝛼
n 0.995 0.99 0.975 0.95 0.5 0.05 0.025 0.01 0.005
1 0.00004 0.0002 0.001 0.004 0.455 3.841 5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 1.386 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 2.366 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 3.357 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 4.351 11.070 12.833 15.086 16.750
6 0.676 0.872 1.237 1.635 5.348 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 6.346 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 7.344 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 8.343 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 9.342 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 10.341 19.675 21.920 24.725 26.757
12 3.074 3.571 4.404 5.226 11.340 21.026 23.337 26.217 28.300
13 3.565 4.107 5.009 5.892 12.340 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 13.339 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 14.339 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 15.338 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 16.338 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 17.338 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 18.338 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 19.337 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 20.337 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 21.337 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 22.337 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 23.337 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 24.337 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 25.336 38.885 41.923 45.642 48.290
27 11.808 12.879 14.573 16.151 26.336 40.113 43.195 46.963 49.645
28 12.461 13.565 15.308 16.928 27.336 41.337 44.461 48.278 50.993
29 13.121 14.256 16.047 17.708 28.336 42.557 45.722 49.588 52.336
30 13.787 14.953 16.791 18.493 29.336 43.773 46.979 50.892 53.672
40 20.707 22.164 24.433 26.509 39.335 55.758 59.342 63.691 66.766
50 27.991 29.707 32.357 34.764 49.335 67.505 71.420 76.154 79.490
60 35.534 37.485 40.482 43.188 59.335 79.082 83.298 88.379 91.952
70 43.275 45.442 48.758 51.739 69.334 90.531 95.023 100.425 104.215
80 51.172 53.540 57.153 60.391 79.334 101.879 106.629 112.329 116.321
90 59.196 61.754 65.647 69.126 89.334 113.145 118.136 124.116 128.299
100 67.328 70.065 74.222 77.929 99.334 124.342 129.561 135.807 140.169
110 75.550 78.458 82.867 86.792 109.334 135.480 140.917 147.414 151.948
120 83.852 86.923 91.573 95.705 119.334 146.567 152.211 158.950 163.648
Página 7 de 8
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
3) Distribución t-Student
𝛼
n 0.2 0.15 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1 1.376 1.963 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
2 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.768
24 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 0.851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50 0.849 1.047 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60 0.848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
70 0.847 1.044 1.294 1.667 1.994 2.381 2.648 2.899 3.211 3.435
80 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
90 0.846 1.042 1.291 1.662 1.987 2.368 2.632 2.878 3.183 3.402
100 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
Inf 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
Página 8 de 9
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
4) Distribución 𝑭 𝜶 𝟎, 𝟎𝟓
n 1 2 3 4 5 6 7 8 9 10
1 161.448 199.500 215.707 224.583 230.162 233.986 236.768 238.883 240.543 241.882
2 18.513 19.000 19.164 19.247 19.296 19.330 19.353 19.371 19.385 19.396
3 10.128 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.812 8.786
4 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.999 5.964
5 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.772 4.735
6 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.099 4.060
7 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.677 3.637
8 5.318 4.459 4.066 3.838 3.687 3.581 3.500 3.438 3.388 3.347
9 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3.179 3.137
10 4.965 4.103 3.708 3.478 3.326 3.217 3.135 3.072 3.020 2.978
11 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.896 2.854
12 4.747 3.885 3.490 3.259 3.106 2.996 2.913 2.849 2.796 2.753
13 4.667 3.806 3.411 3.179 3.025 2.915 2.832 2.767 2.714 2.671
14 4.600 3.739 3.344 3.112 2.958 2.848 2.764 2.699 2.646 2.602
15 4.543 3.682 3.287 3.056 2.901 2.790 2.707 2.641 2.588 2.544
16 4.494 3.634 3.239 3.007 2.852 2.741 2.657 2.591 2.538 2.494
17 4.451 3.592 3.197 2.965 2.810 2.699 2.614 2.548 2.494 2.450
18 4.414 3.555 3.160 2.928 2.773 2.661 2.577 2.510 2.456 2.412
19 4.381 3.522 3.127 2.895 2.740 2.628 2.544 2.477 2.423 2.378
20 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.393 2.348
21 4.325 3.467 3.072 2.840 2.685 2.573 2.488 2.420 2.366 2.321
22 4.301 3.443 3.049 2.817 2.661 2.549 2.464 2.397 2.342 2.297
23 4.279 3.422 3.028 2.796 2.640 2.528 2.442 2.375 2.320 2.275
24 4.260 3.403 3.009 2.776 2.621 2.508 2.423 2.355 2.300 2.255
25 4.242 3.385 2.991 2.759 2.603 2.490 2.405 2.337 2.282 2.236
26 4.225 3.369 2.975 2.743 2.587 2.474 2.388 2.321 2.265 2.220
27 4.210 3.354 2.960 2.728 2.572 2.459 2.373 2.305 2.250 2.204
28 4.196 3.340 2.947 2.714 2.558 2.445 2.359 2.291 2.236 2.190
29 4.183 3.328 2.934 2.701 2.545 2.432 2.346 2.278 2.223 2.177
30 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.211 2.165
40 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.124 2.077
50 4.034 3.183 2.790 2.557 2.400 2.286 2.199 2.130 2.073 2.026
60 4.001 3.150 2.758 2.525 2.368 2.254 2.167 2.097 2.040 1.993
70 3.978 3.128 2.736 2.503 2.346 2.231 2.143 2.074 2.017 1.969
80 3.960 3.111 2.719 2.486 2.329 2.214 2.126 2.056 1.999 1.951
90 3.947 3.098 2.706 2.473 2.316 2.201 2.113 2.043 1.986 1.938
100 3.936 3.087 2.696 2.463 2.305 2.191 2.103 2.032 1.975 1.927
Inf 3.841 2.996 2.605 2.372 2.214 2.099 2.010 1.938 1.880 1.831
Página 9 de 10
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
Distribución 𝑭 𝜶 𝟎, 𝟎𝟓 (continuación)
Página 10 de 11
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
5) Distribución 𝑭 𝜶 𝟎, 𝟎𝟐𝟓
n 1 2 3 4 5 6 7 8 9 10
1 647.789 799.500 864.163 899.583 921.848 937.111 948.217 956.656 963.285 968.627
2 38.506 39.000 39.165 39.248 39.298 39.331 39.355 39.373 39.387 39.398
3 17.443 16.044 15.439 15.101 14.885 14.735 14.624 14.540 14.473 14.419
4 12.218 10.649 9.979 9.605 9.364 9.197 9.074 8.980 8.905 8.844
5 10.007 8.434 7.764 7.388 7.146 6.978 6.853 6.757 6.681 6.619
6 8.813 7.260 6.599 6.227 5.988 5.820 5.695 5.600 5.523 5.461
7 8.073 6.542 5.890 5.523 5.285 5.119 4.995 4.899 4.823 4.761
8 7.571 6.059 5.416 5.053 4.817 4.652 4.529 4.433 4.357 4.295
9 7.209 5.715 5.078 4.718 4.484 4.320 4.197 4.102 4.026 3.964
10 6.937 5.456 4.826 4.468 4.236 4.072 3.950 3.855 3.779 3.717
11 6.724 5.256 4.630 4.275 4.044 3.881 3.759 3.664 3.588 3.526
12 6.554 5.096 4.474 4.121 3.891 3.728 3.607 3.512 3.436 3.374
13 6.414 4.965 4.347 3.996 3.767 3.604 3.483 3.388 3.312 3.250
14 6.298 4.857 4.242 3.892 3.663 3.501 3.380 3.285 3.209 3.147
15 6.200 4.765 4.153 3.804 3.576 3.415 3.293 3.199 3.123 3.060
16 6.115 4.687 4.077 3.729 3.502 3.341 3.219 3.125 3.049 2.986
17 6.042 4.619 4.011 3.665 3.438 3.277 3.156 3.061 2.985 2.922
18 5.978 4.560 3.954 3.608 3.382 3.221 3.100 3.005 2.929 2.866
19 5.922 4.508 3.903 3.559 3.333 3.172 3.051 2.956 2.880 2.817
20 5.871 4.461 3.859 3.515 3.289 3.128 3.007 2.913 2.837 2.774
21 5.827 4.420 3.819 3.475 3.250 3.090 2.969 2.874 2.798 2.735
22 5.786 4.383 3.783 3.440 3.215 3.055 2.934 2.839 2.763 2.700
23 5.750 4.349 3.750 3.408 3.183 3.023 2.902 2.808 2.731 2.668
24 5.717 4.319 3.721 3.379 3.155 2.995 2.874 2.779 2.703 2.640
25 5.686 4.291 3.694 3.353 3.129 2.969 2.848 2.753 2.677 2.613
26 5.659 4.265 3.670 3.329 3.105 2.945 2.824 2.729 2.653 2.590
27 5.633 4.242 3.647 3.307 3.083 2.923 2.802 2.707 2.631 2.568
28 5.610 4.221 3.626 3.286 3.063 2.903 2.782 2.687 2.611 2.547
29 5.588 4.201 3.607 3.267 3.044 2.884 2.763 2.669 2.592 2.529
30 5.568 4.182 3.589 3.250 3.026 2.867 2.746 2.651 2.575 2.511
40 5.424 4.051 3.463 3.126 2.904 2.744 2.624 2.529 2.452 2.388
50 5.340 3.975 3.390 3.054 2.833 2.674 2.553 2.458 2.381 2.317
60 5.286 3.925 3.343 3.008 2.786 2.627 2.507 2.412 2.334 2.270
70 5.247 3.890 3.309 2.975 2.754 2.595 2.474 2.379 2.302 2.237
80 5.218 3.864 3.284 2.950 2.730 2.571 2.450 2.355 2.277 2.213
90 5.196 3.844 3.265 2.932 2.711 2.552 2.432 2.336 2.259 2.194
100 5.179 3.828 3.250 2.917 2.696 2.537 2.417 2.321 2.244 2.179
Inf 5.024 3.689 3.116 2.786 2.567 2.408 2.288 2.192 2.114 2.048
Página 11 de 12
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
Página 12 de 13
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
6) Distribución 𝑭 𝜶 𝟎, 𝟎𝟏
n 1 2 3 4 5 6 7 8 9 10
1 4052.181 4999.500 5403.352 5624.583 5763.650 5858.986 5928.356 5981.070 6022.473 6055.847
2 98.503 99.000 99.166 99.249 99.299 99.333 99.356 99.374 99.388 99.399
3 34.116 30.817 29.457 28.710 28.237 27.911 27.672 27.489 27.345 27.229
4 21.198 18.000 16.694 15.977 15.522 15.207 14.976 14.799 14.659 14.546
5 16.258 13.274 12.060 11.392 10.967 10.672 10.456 10.289 10.158 10.051
6 13.745 10.925 9.780 9.148 8.746 8.466 8.260 8.102 7.976 7.874
7 12.246 9.547 8.451 7.847 7.460 7.191 6.993 6.840 6.719 6.620
8 11.259 8.649 7.591 7.006 6.632 6.371 6.178 6.029 5.911 5.814
9 10.561 8.022 6.992 6.422 6.057 5.802 5.613 5.467 5.351 5.257
10 10.044 7.559 6.552 5.994 5.636 5.386 5.200 5.057 4.942 4.849
11 9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.632 4.539
12 9.330 6.927 5.953 5.412 5.064 4.821 4.640 4.499 4.388 4.296
13 9.074 6.701 5.739 5.205 4.862 4.620 4.441 4.302 4.191 4.100
14 8.862 6.515 5.564 5.035 4.695 4.456 4.278 4.140 4.030 3.939
15 8.683 6.359 5.417 4.893 4.556 4.318 4.142 4.004 3.895 3.805
16 8.531 6.226 5.292 4.773 4.437 4.202 4.026 3.890 3.780 3.691
17 8.400 6.112 5.185 4.669 4.336 4.102 3.927 3.791 3.682 3.593
18 8.285 6.013 5.092 4.579 4.248 4.015 3.841 3.705 3.597 3.508
19 8.185 5.926 5.010 4.500 4.171 3.939 3.765 3.631 3.523 3.434
20 8.096 5.849 4.938 4.431 4.103 3.871 3.699 3.564 3.457 3.368
21 8.017 5.780 4.874 4.369 4.042 3.812 3.640 3.506 3.398 3.310
22 7.945 5.719 4.817 4.313 3.988 3.758 3.587 3.453 3.346 3.258
23 7.881 5.664 4.765 4.264 3.939 3.710 3.539 3.406 3.299 3.211
24 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.256 3.168
25 7.770 5.568 4.675 4.177 3.855 3.627 3.457 3.324 3.217 3.129
26 7.721 5.526 4.637 4.140 3.818 3.591 3.421 3.288 3.182 3.094
27 7.677 5.488 4.601 4.106 3.785 3.558 3.388 3.256 3.149 3.062
28 7.636 5.453 4.568 4.074 3.754 3.528 3.358 3.226 3.120 3.032
29 7.598 5.420 4.538 4.045 3.725 3.499 3.330 3.198 3.092 3.005
30 7.562 5.390 4.510 4.018 3.699 3.473 3.304 3.173 3.067 2.979
40 7.314 5.179 4.313 3.828 3.514 3.291 3.124 2.993 2.888 2.801
50 7.171 5.057 4.199 3.720 3.408 3.186 3.020 2.890 2.785 2.698
60 7.077 4.977 4.126 3.649 3.339 3.119 2.953 2.823 2.718 2.632
70 7.011 4.922 4.074 3.600 3.291 3.071 2.906 2.777 2.672 2.585
80 6.963 4.881 4.036 3.563 3.255 3.036 2.871 2.742 2.637 2.551
90 6.925 4.849 4.007 3.535 3.228 3.009 2.845 2.715 2.611 2.524
100 6.895 4.824 3.984 3.513 3.206 2.988 2.823 2.694 2.590 2.503
Inf 6.635 4.605 3.782 3.319 3.017 2.802 2.639 2.511 2.407 2.321
Ejemplo: 𝑃 𝐹7,8 6,18 0,01
Página 13 de 14
Formulario de “Diseño de Experimentos y Modelos de Regresión” ETSII-UPM
Página 14 de 14