Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo 4 Taller
Capitulo 4 Taller
La diferencia entre los factores de tratamiento y los de bloque radica en que estos últimos no
se incluyen en el experimento de manera explícita por que interese analizar su efecto, sino
como un medio para estudiar de manera adecuada y eficaz al factor de interés para no sesgar
la comparación. Estos entran al estudio con un nivel de importancia secundaria con respecto al
factor de interés y la inclusión de estos es un medio no un fin para lograr la comparación.
Source DF SS MS F P
Marca Atomizador 2 296.33 148.167 2.88 0.103
Día 5 281.33 56.267 1.09 0.421
Error 10 514.33 51.433
Total 17 1092.00
90 5
Residual
Percent
50 0
-5
10
1 -10
-10 -5 0 5 10 50 55 60 65 70
Residual Fitted Value
Residual
0
2.4
1.2 -5
0.0 -10
-10 -5 0 5 10 2 4 6 8 10 12 14 16 18
Residual Observation Order
11. En una empresa lechera se tienen varios silos para almacenar leche
(cisternas de 60 000 L). Un aspecto crítico para que se conserve la leche
es la temperatura de almacenamiento. Se sospecha que en algunos silos
hay problemas, por ello, durante cinco días se decide registrar la
temperatura a cierta hora crítica. Obviamente la temperatura de un día a
otro es una fuente de variabilidad que podría impactar la variabilidad total.
Aquí podemos observar que el valor-p de los silos es mayor que el valor de
significancia, es decir, que el valor-p de los silos es 0.246 y el nivel de
significancia es 0.05 y por lo tanto es mayor, lo que significa que
estadísticamente son iguales.
d) ¿La temperatura de un día a otro es diferente?
Por medio del problema anterior podemos observar que la temperatura es igual
porque el valor-p de los bloques es 0.609 y el nivel de significancia es 0.05 así
que se muestra que el valor-p del bloque es mayor que la significancia y por lo
tanto las temperaturas son iguales.
e) Revise residuos, ¿hay algún problema evidente?
En el recuadro de la grafica de probabilidad normal nos muestra que el
supuesto de normalidad se cumple porque los residuos o puntos estas más o
menos cerca de la línea recta. Por mientras que en el recuadro vs ajuste
también se cumple el supuesto de varianza porque los residuos se ubican
aleatoriamente dentro de una banda horizontal.
Y ij =μ+ τ i+ γ j +ε ij i=1,2, … , k
{ }
j=1,2 , … ,b
Hipótesis:
Tratamiento:
H 0 :μ A=μ B=μ C =μ D=μ E =μ
H A : μi ≠ μ j para algún i≠ j
Bloques:
H 0 :γ 1=γ 2=γ 3=γ 4 =γ 5=0
RESUME Promedi
N Cuenta Suma o Varianza
Fila 1 5 12.8 2.56 3.148
Fila 2 5 23.3 4.66 3.068
Fila 3 5 -3 -0.6 18.915
Fila 4 5 23.7 4.74 3.203
Fila 5 5 -9.3 -1.86 9.728
Columna
1 5 15.4 3.08 5.197
Columna
2 5 16 3.2 6.18
Columna
3 5 16.3 3.26 6.078
Columna
4 5 1 0.2 11.085
Columna
5 5 -1.2 -0.24 39.653
ANÁLISIS DE
VARIANZA
Origen Promedi
de las Suma de Grados o de los Valor
variacion cuadrad de cuadrad Probabilid crítico
es os libertad os F ad para F
8.090957 0.0009115 3.006917
Filas 182.532 4 45.633 45 9 28
Columna 2.748581 0.0648652 3.006917
s 62.008 4 15.502 56 9 28
Error 90.24 16 5.64
Total 334.78 24
En tratamiento:
Dado que F 0> F critica , la hipótesis se rechaza, esto significa que la temperatura
en los silos es diferente.
En bloque:
Como F 0< F critica , la hipótesis nula se acepta, esto se interpreta en que el día no
tiene un efecto en la medición de la temperatura.
Hipótesis:
Tratamiento:
H 0 :μ A=μ B=μ C =μ D=μ E =μ
H A : μi ≠ μ j para algún i≠ j
Bloques:
H 0 :γ 1=γ 2=γ 3=γ 4 =γ 5=0
RESUME Promedi
N Cuenta Suma o Varianza
Fila 1 5 16.5 3.3 2.95
Fila 2 5 21 4.2 2.2
Fila 3 5 17 3.4 0.925
Fila 4 5 21.5 4.3 2.075
Fila 5 5 17.5 3.5 0.75
Columna
1 5 20 4 0.875
Columna
2 5 22 4.4 0.8
Columna
3 5 20.5 4.1 2.925
Columna
4 5 13 2.6 2.675
Columna
5 5 18 3.6 0.3
ANÁLISIS DE
VARIANZA
Origen de Promedi
las Suma de Grados o de los Valor
variacion cuadrad de cuadrad Probabilid crítico
es os libertad os F ad para F
0.690402 0.6092123 3.0069172
Filas 4.46 4 1.115 48 9 8
1.510835 0.2460221 3.0069172
Columnas 9.76 4 2.44 91 2 8
Error 25.84 16 1.615
Total 40.06 24
En tratamiento:
Dado que F 0< F critica , la hipótesis se acepta, esto significa que la temperatura
en los silos no es diferente.
En bloque:
Como F 0< F critica , la hipótesis nula se acepta, esto se interpreta en que el día
no tiene un efecto en la medición de la temperatura.
Para |MER-RTD|
Día 1 Día 2 Día 3 Día 4 Día 5
Silo
Dif. Dif. Dif. Dif. Dif.
A 1.4 1.2 0 0.5 0.6
B 1.4 0.4 0.3 0.2 0
C 1.2 2.6 1.7 3.9 10.6
D 0.6 1 0.1 1.8 2.3
E 4 3.6 2.9 6 10.3
Y ij =μ+ τ i+ γ j +ε ij i=1,2, … , k
{ }
j=1,2 , … ,b
Hipótesis:
Tratamiento:
H 0 :μ A=μ B=μ C =μ D=μ E =μ
H A : μi ≠ μ j para algún i≠ j
Bloques:
H 0 :γ 1=γ 2=γ 3=γ 4 =γ 5=0
RESUME Promedi
N Cuenta Suma o Varianza
Fila 1 5 3.7 0.74 0.318
Fila 2 5 2.3 0.46 0.298
Fila 3 5 20 4 14.665
Fila 4 5 5.8 1.16 0.793
Fila 5 5 26.8 5.36 8.953
Columna
1 5 8.6 1.72 1.732
Columna
2 5 8.8 1.76 1.708
Columna
3 5 5 1 1.6
Columna
4 5 12.4 2.48 5.997
Columna
5 5 23.8 4.76 27.703
ANÁLISIS DE
VARIANZA
Origen Promedi
de las Suma de Grados o de los Valor
variacion cuadrad de cuadrad Probabilid crítico
es os libertad os F ad para F
6.659989 0.0023574 3.006917
Filas 96.8136 4 24.2034 27 4 28
Columna 2.886617 0.0563964 3.006917
s 41.9616 4 10.4904 23 3 28
Error 58.1464 16 3.63415
196.921
Total 6 24
En tratamiento:
Dado que F 0> F critica , la hipótesis nula se rechaza esto se interpreta en que, la
diferencia entre las temperaturas de los termómetros, en los silos es diferente,
es decir, hay diferencias entre cada tratamiento.
En bloque:
Como F 0< F critica , la hipótesis nula se acepta, esto se interpreta en que el día no
tiene un efecto en la medición de la temperatura.
En conclusión, se puede inferir por los resultados en los incisos anteriores, que
el termómetro Rtd es diferente al termómetro Mer, y considerando que sobre
éste último no hay duda de su funcionamiento, entonces, el termómetro Rtd,
está dañado y no registra las temperaturas correctas.
Ho: μ1 + μ2 + μ3 + μ4 + μ5= μ
Ha: μi ≠ μj para algún i ≠ j
Que también se puede expresar como:
Ho: τ1 = τ2 = τ3 = τ4 = τ5 = 0
Ha: τi ≠ 0 para algún i
c) Existen diferencias entre los tratamientos? Cuáles tratamientos son diferentes entre
si?
Total 24 206.640
De esta tabla se observa que para Catalizador se obtuvo un valor-p = 0.000 < 0.05, por lo
tanto se rechaza Ho. Es decir que al menos dos de los catalizadores son diferentes.
d) Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?
Del ANOVA se observa que para lote se obtuvo un valor-p = 0.348 > 0.05, por lo tanto se
acepta Ho. Es decir que no existe diferencia entre el tiempo de reacción de un proceso
químico de los lotes.
Por otro lado, del ANOVA se observa que para días se obtuvo un valor-p = 0.455 > 0.05, por
lo tanto se acepta Ho. Es decir que no existe diferencia entre el tiempo de reacción de un
proceso químico de los días.
e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. Cuál tratamiento es
el mejor?
Sería el tratamiento 5, puesto que tiene la media más baja respecto al tiempo de reacción
del proceso.
f) Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna
por columna, día a día.
Residual Plots for Y
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99
2
90
1
Residual
Percent
50 0
-1
10
-2
1
-3.0 -1.5 0.0 1.5 3.0 2 4 6 8 10
Residual Fitted Value
Residual
3.0 0
-1
1.5
-2
0.0
-2 -1 0 1 2 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los residuos y se
observa que estos siguen una distribución normal ya que tienden a quedar alineados en una
línea recta.
En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos contra los
residuos y se observa que los puntos se distribuyen de manera aleatoria en una banda
horizontal (sin ningún patrón claro y contundente), por lo que se cumple el supuesto de que
los tratamientos tienen igual varianza.
El nombre del diseño es uno de tipo multigrupo completamente al azar, el modelo es de tipo
unifactorial de efectos fijos, no-equilibrado y las hipótesis adecuadas son:
F)
RESPUESTA
20. Cuando se comparan varios fertilizantes o diferentes variedades de
cierto cultivo, es típico que se deba considerar el gradiente de fertilidad
del suelo (factor columna) o los efectos residuales de cultivos previos
(factor renglón). Considerando estos factores de bloque, Gomez y Gomez
(1984) plantean un experimento en cuadro latino para comparar, en
cuanto a rendimiento en toneladas por hectárea, tres variedades de maíz
híbrido (A, B, C) y una variedad control (C). Para ello, se utiliza un campo
agrícola cuadrado de 16 hectáreas, dividido en parcelas de una hectárea.
Los datos de rendimiento obtenidos en cada parcela se muestran a
continuación:
a) ¿Existen diferencias en los rendimientos de las diferentes variedades de
maíz?
Debido a que le Valor-p es menos que la significancia observada para el
modelo 0.025< 0.05 se afirma que si existen diferencias entre los tratamientos.
b) ¿Cuál de los factores de bloque tuvo efectos?
El gradiente de fertilidad del suelo
c) ¿Se habrían detectado las mismas diferencias en los tratamientos con un
diseño completamente al azar?
No, porque en este tipo de diseño en cuadro latino se controlan dos factores de
bloqueo y se tienen cuatro fuentes de variabilidad para el modelo que pueden
afectar la respuesta observada.
d) ¿Y con un diseño en bloques completos al azar?
No, ya que no contempla la posibilidad de comparar más de 1 factor
21. Se quieren comparar tres dietas (A, B, C) a base de proteínas de
origen vegetal utilizando 18 ratas de laboratorio de una misma camada.
Primero se observa por un tiempo el apetito para formar tres grupos de
seis ratas, según su voracidad; y cada uno de estos grupos se clasifica a
su vez en tres grupos de dos ratas, de acuerdo a su peso inicial. Se
plantea un experimento donde la variable de respuesta es el peso en
gramos ganado por las ratas después de cierto periodo, con los
siguientes resultados:
a) Analice los datos. ¿Cuáles de los factores influyen en el peso ganado por
las ratas?
El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:
Y ijl =μ+τ i + γ j+ δ l + ε ijl
Hipótesis:
Tratamiento:
H 0 :μ A=μ B=μ C =μ
H A : μi ≠ μ j para algún i≠ j
Bloque 1:
H 0 :γ 1=γ 2=γ 3=0
Bloque 2:
H 0 :γ 1=γ 2=γ 3=0
ANÁLISIS DE
VARIANZA
Promedio
Origen de Suma de Grados de los Valor
las cuadrado de cuadrado crítico
variaciones s libertad s F para F
99.46391 6.944271
Tratamiento 6432 2 3216 75 91
Peso inicial 232.6666 116.3333 3.597938 6.944271
(B1) 67 2 33 14 91
Voracidad 4932.666 2466.333 76.27835 6.944271
(B2) 67 2 33 05 91
64.66666 32.33333
Error 67 2 33
Total 11662 8
En tratamiento:
Dado que F 0> F critica , la hipótesis nula se rechaza, es decir, los tratamientos
(dietas) son diferentes entre sí.
En bloque 1:
Como F 0< F critica , la hipótesis nula se acepta, es decir, que el peso inicial no
tiene un efecto en el resultado.
En bloque 2:
Como F 0> F critica , la hipótesis nula se rechaza, es decir, que la voracidad de las
ratas si es un factor que influye en los resultados.
H A : μi ≠ μ j para algún i≠ j
Bloques
H 0 :γ 1=γ 2=γ 3=0
Columna
1 3 435 145 1252
Columna 172.6666 1546.333
2 3 518 67 33
Columna 202.3333 566.3333
3 3 607 33 33
ANÁLISIS DE
VARIANZA
Origen Promedio
de las Suma de Grados de los Valor
variacion cuadrado de cuadrado Probabilid crítico
es s libertad s F ad para F
43.26457 0.0019522 6.944271
Filas 6432 2 3216 4 8 91
Columna 4932.666 2466.333 33.17937 0.0032320 6.944271
s 67 2 33 22 9 91
297.3333 74.33333
Error 33 4 33
Total 11662 8
En tratamiento:
Dado que F 0> F critica , la hipótesis nula se rechaza, es decir, los tratamientos
(dietas) son diferentes entre sí.
En bloque:
Como F 0> F critica , la hipótesis nula se rechaza, es decir, que él apetito si influye
en el resultado.
Es decir los resultados siguen siendo los mismos.
W=
1
( n−1 ) s 2 [∑
I=1
a i ( x n−i+ j−x i ) ]
Coeficiente
Datos en
i s Shapiro- xn-i+j-xi ai(xn-i+j-xi)
orden
Wilks
1 50 0.5888 14 8.2432
2 51 0.3244 11 3.5684
3 53 0.1976 8 1.5808
4 55 0.0947 4 0.3788
5 58 Σ 13.7712
6 59
7 61
8 62
9 64
s2=¿ 3680.125
Entonces W =¿ 0.00644
Y de tablas W critica =¿ 0.978
Por lo tanto si W critica > W la hipótesis nula se acepta. Estos dato provienen
de una distribución normal.
Varianza constante
Como los datos tienen una distribución normal se utiliza el estadístico de
Bartlett.
H 0 :σ A 2=σ B2=σ 32
H A :σ i2 ≠ σ j2 para algún i≠ j
q
χ 02=2.3026
c
Dónde:
k
c=1+
1
3(k−1) [∑
i=1
(ni−1)−1−(N−k )−1 ]
k
q=( N−k ) log s p −∑ ( n i−1 ) log s i2
2
i=1
∑ (ni−1)s i2
s p2= i=1
N −k
Para tratamiento:
-
11370.292
χ 2= 4
De tablas χ 2=¿ 5.991
Por lo tanto, como χ 2tablas < χ 20 entonces, la hipótesis nula se rechaza, esto
quiere decir que no existe Homocedasticidad en los datos.
Para bloque:
Σ
1546.333 566.3333 3364.666
si2
1252 33 33 67
3.097604 3.189303 2.753072 9.039979
log si2
33 12 12 57
0.4537711
χ 2= 8
Por lo tanto, como χ 2tablas > χ 20 entonces, la hipótesis nula se acepta, esto quiere
decir que hay homogeneidad de varianza en los datos con respecto a los
bloques.
Independencia
El método analítico de comprobar el supuesto de independencia se realiza con
la prueba Durbin-Watson.
H 0 : ρ=0 (no hay correlación)
HA:ρ≠0
n
∑ (e i−e i−1)2
d= i=2 n
∑ (ei )2
i=1
independenci
a
Datos yi ei ei 2 (ei-ei-1)2
209.33333
-26.33 693.44
1 183 3
209.33333
7.67 58.78 1156
2 217 3
209.33333
18.67 348.44 121
3 228 3
145.33333
-32.33 1045.44 2601
4 113 3
145.33333
-3.33 11.11 841
5 142 3
145.33333
35.67 1272.11 1521
6 181 3
165.33333
139 -26.33 693.44 3844
7 3
165.33333
159 -6.33 40.11 400
8 3
9 198 165.33333 32.67 1067.11 1521
3
5230.00 12005.00
Σ
0 0
d=¿ 2.2954
De las tablas no viene el valor correspondiente, para p=2 y n=9, por lo tanto,
no se pudo concluir el método analítico.
Gráficamente: en base al valor de R2se puede concluir que no hay correlación
entre los datos.
525
500
475
Respuesta
450
425
400
375
350
1 2 3 4 5 6 7
Vaca
De tal forma, los intervalos de confianza de las vacas se traslapan por lo que
sus respuestas medias son iguales estadísticamente.
Interval Plot of Respuesta vs período
95% CI for the Mean
550
500
Respuesta
450
400
350
1 2 3 4 5 6 7
período
De tal forma, los intervalos de confianza de los períodos se traslapan por lo que
sus respuestas medias son iguales estadísticamente.
500
450
Respuesta
400
350
300
1 2 3 4 5 6 7
% lisina
550
500
Respuesta
450
400
350
300
1 2 3 4 5 6 7
% proteina
50 0
-25
10
-50
1
-50 -25 0 25 50 300 400 500 600
Residual Fitted Value
12 50
25
Frequency
9
Residual
0
6
-25
3
-50
0
-60 -30 0 30 60 1 5 10 15 20 25 30 35 40 45
Residual Observation Order
En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los
residuos y se observa que estos siguen una distribución normal ya que tienden
a quedar alineados en una línea recta.
En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los
predichos contra los residuos y se observa que los puntos se distribuyen de
manera aleatoria en una banda horizontal (sin ningún patrón claro y
contundente), por lo que se cumple el supuesto de que los tratamientos tienen
igual varianza.