Tarea6 Daniel Delgado

Diseño y Análisis de Experimentos
Cali, Colombia, Mayo 5 de de 2020
Tarea 6
1,a
Daniel Andres Delgado O (1622960)
1 Escuela de Estadística, Facultad de Ingeniería, Universidad del Valle, Cali, Colombia
1. Descripción de los Datos

La base de datos disponible tiene información sobre las mediciones del índice de monoxido de
carbono recolectados en cinco puntos estratégicos (Norte, Sur, Centro, Oeste y Este) de una
ciudad, dichas mediciones fueron tomadas en diferente horario y diferentes días de la semana.
A continuación se presentan algunos estadísticos descriptivos para realizar un primer balance del
comportamiento de los datos.
Replicas Totales Promedio Varianza C. variación Mínimo Máximo

Norte 5 652.00 130.40 15.30 2.99 124.00 134.00
Este 5 587.00 117.40 28.80 4.57 112.00 124.00
Sur 5 644.00 128.80 24.20 3.81 123.00 133.00
Oeste 5 588.00 117.60 20.80 3.87 112.00 122.00
Centro 5 583.00 116.60 216.80 12.62 100.00 133.00
Tabla 1: Descriptivas del Índice de Monoxido de Carbono por Zona
La tabla 1, nos permite observar que la zona Norte presenta un mayor índice promedio de monoxido
de carbono, y los datos presentan menor variabilidad en comparación a las otras zonas. Por otra
parte la zona Centro presenta el índice promedio mas bajo de todos y sus datos presentan la mayor
variabilidad.
130
Indice de Monoxido de Carbono
ubicacion
N
120
E
S
O
C
110
100
N E S O C
Zona de Monitoreo
Figura 1: Diagrama de cajas del índice de monoxido de carbono
a Estudiante. E-mail: daniel.andres.delgado@correounivalle.edu.co
1
2 Daniel Andres Delgado O (1622960)
Complementando lo dicho anterior mente, la figura 1 nos permite observar de manera gráfica el
comportamiento del índice de mnoxido de carbono, donde corroboramos que la zona centro es la que
presenta una mayor variabilidad de sus datos y la zona norte es la que presenta menor dispersión
de todas la zonas.
Descriptivas Por factor De Control Día de la Semana
Replicas Totales Promedio Varianza C.Variación Mínimo Máximo

Lunes 5 579.00 115.80 82.20 7.83 102.00 124.00
Miércoles 5 591.00 118.20 159.20 10.67 100.00 133.00
Viernes 5 617.00 123.40 73.80 6.96 112.00 133.00
Sábado 5 629.00 125.80 23.70 3.87 121.00 131.00
Domingo 5 638.00 127.60 74.30 6.75 114.00 134.00
Tabla 2: Días de la Semana
Observando los resultados de la tabla 2, notamos que el día domingo es quien presenta un mayor
índice promedio de monoxido de carbono en la ciudad y los datos ese día presentan menor variabilidad,
por otra parte el día lunes es quien tiene menor índice promedio del monoxido de carbono.
Finalmente el día miércoles es donde se presentan mediciones mas variables del índice de monoxido
de carbono.
Descriptivas Por factor De Control Hora del día
Replicas Totales Promedio Varianza C.Variación Mínimo Máximo

08:00 5 618.00 123.60 0.80 0.72 122.00 124.00
11:00 5 587.00 117.40 171.80 11.1 100.00 131.00
14:00 5 622.00 124.40 78.80 7.13 112.00 133.00
17:00 5 621.00 124.20 90.20 7.64 112.00 134.00
20:00 5 606.00 121.20 153.70 10.23 102.00 133.00
Tabla 3: Hora del Día
De la tabla 3, podemos observar que los horarios 14:00 y 17:00 presentan un comportamiento
promedio del índice de monoxido de carbono similar y sus valores no presentan una dispersión alta,
El horario de las 08:00 presenta un índice promedio también alto y los datos esta completamente
agrupados, dado que su coeficiente de variación es el mas bajo. Finalmente las horas 11:00 y 20:00
del día presentan un dispersión entre sus datos alta, es decir que su coeficiente de variación es alto
con respecto a las demás horas del día.
2. Análisis de varianza
• Variable de Respuesta: Índice de Monóxido de Carbono.
• Factor de Tratamiento: Puntos Estratégicos.
• Factor Bloque: Días de la Semana y Horas del Día.
• Niveles: (Lunes, Miércoles, Viernes, Sábado y Domingo) y (08:00, 11:00, 14:00, 17:00, 20:00).
• Unidad Experimental: Medicines del Índice Monoxido de Carbono .
• Tipo de Modelo: Cuadrado Latino.
Diseño y Analisis de Experimentos (2020)

Tarea 6 3
Después de haber descrito el experimento pasamos a plantear las siguientes hipótesis para el factor
de tratamiento, y los factores bloque.
Hipótesis para los Tratamientos (τ )
H0 : τ1 = τ2 = τ3 = τ4 = τ5
Ha : Alguna de estas igualdades no se cumple.
Hipótesis para el Bloque Columnas (γ)
H1 : γ1 = γ2 = γ3 = γ4 = γ5
Hipótesis para el Bloque Filas (α)
H1 : α1 = α2 = α3 = α4 = α5
Df Sum Sq Mean Sq F value Pr(>F)

ubicación 4 931.76 232.94 5.11 0.0122
días 4 502.56 125.64 2.76 0.0776
hora 4 174.16 43.54 0.96 0.4663
Residuales 12 546.88 45.57
Total 24 2155.2
Tabla 4: ANOVA del Índice de Monoxido de Carbono
La tabla 4, nos permite evidenciar que los valores-p de los factores bloque no son significativos
para nuestro experimento, por lo tanto no se rechaza la hipótesis nula. Por otra parte el valor-p
obtenido para nuestro factor de tratamiento es menor que un α establecido del 0.05, por lo tanto
se rechaza la hipótesis nula de igualdad y se puede afirmar que hay evidencia estadística suficiente
para pensar que existen diferencias entre las estaciones de monitoreo en la ciudad.
Potencia de la Prueba
CM. Residuales Lambda Potencia

45.57 10.22 0.86
Tabla 5: Calculo de la Potencia
la tabla 5 nos permite observar que la probabilidad de que la prueba rechace correctamente la
hipótesis nula es del 86 %, es decir que el análisis de varianza realizado para este experimento tiene
una probabilidad alta para detectar una diferencia entre las medias de los factores de tratamiento
cuando realmente exista esa diferencia.
3. Validación de Supuestos
Prueba de Normalidad
• H1 :Los residuales se distribuyen de forma normal.

W Valor-p
0.974 0.87
Tabla 6: Shapiro-Wilk
• Ha : Los residuales no se distribuyen de manera normal.
La tabla 6, nos permite evidencia que el valor p obtenido es mayor a un α establecido del 0.05,
por lo tanto no se rechaza la hipótesis nula y no existe suficiente evidencia estadística para afirmar
que los residuales no se distribuyen de manera normal, es decir que el supuesto de normalidad se
cumple.
Prueba de Homogeneidad de Varianza

• H1 :Existe Homogeneidad de Varianza.
• Ha : No existe Homogeneidad de Varianza .
Estadístico G.Liberad Valor-p

1.729 4 0.183
Tabla 7: Prueba Levene
en la tabla 7, podemos observar que el valor p obtenido es mayor a un α establecido de 0.05,

por lo tanto no se rechaza la hipótesis nula y se puede afirmar que no existe suficiente evidencia
estadística para decir que el supuesto de homogeneidad de varianza no se cumple.
Prueba de Independencia
• H1 : Cov(eijk , ei0 j 0 k0 ) = 0.
• Ha : Cov(eijk , ei0 j 0 k0 ) 6= 0.
Estadístico Valor-p
2.620 0.796
Tabla 8: Prueba Durbin-Watson
la tabla 6, nos permite observar que el valor p obtenido es mayor a un α establecido de 0.05, por
lo tanto no se rechaza la hipótesis nula de autocorrelacion y se puede afirmar que los errores son
independiente entre si.
Control local del Experimento

Para determinar si se ejerció un buen control local de experimento utilizaremos el coeficiente de
variación. √ √
σ̂ 2 45.57
CV: ∗ 100 = ∗ 100 = 5.52 (3.1)
µ 122.16
observando los resultados obtenidos de la ecuación 3.1 notamos que el coeficiente de variación
obtenido es pequeño, por lo tanto podemos afirmar que el experimento tubo un buen control local.

Tarea 6 5
4. Contrastes y Pruebas Pos Anova
Contrastes de Hipótesis
Para realizar los contrastes planteamos las siguientes hipótesis:
Primera Hipótesis
• H0 : τ1 − τ3 = 0
• Ha : τ1 − τ3 6= 0
[(1 ∗ 130.4) + (−1 ∗ 128.8)]2 1

F= 12 12
∗ = 0.1404 (4.1)
5 + 5
45.57
Observando los resultados, notamos que el estadístico F calculado (0.1404) es menor al F(1,20) =
4.35, entonces no rechazamos la hipótesis nula planteada y afirmamos con un nivel de significancia
del 5 % que el punto Norte no difiere al punto Sur de la ciudad, en cuento al Índice promedio de
monoxido de carbono.
Segunda Hipótesis
• H0 : τ1 + τ3 − τ2 + τ4 = 0
• Ha : τ1 + τ3 − τ2 + τ4 6= 0
[(1 ∗ 130.4) + (1 ∗ 128.8) + (−1 ∗ 117.4) + (−1 ∗ 117.6)]2 1

F= 12 12 12 12
∗ = 16.06 (4.2)
5 + 5 + 5 + 5
45.57
Observando la ecuación 4.2 tenemos que el estadístico calculado es mayor al F(1,20) = 4.35, entonces
se rechaza la hipótesis nula de igualdad de medias y con un nivel de significancia del 5 % podemos
afirmar que existe diferencia en conjuntó entre los puntos Norte y Sur frente a los punto Oeste y
este con respecto al índice promedió de monoxido de carbonó en la ciudad.
Tercera Hipótesis
• H0 : τ1 − τ5 = 0
• Ha : τ1 − τ5 6= 0
[(1 ∗ 130.4) + (−1 ∗ 116.6)]2 1

F= 12 12
∗ = 10.44 (4.3)
5 + 5
45.57
Observando la ecuación 4.3 tenemos que el estadístico calculado es mayor al F(1,20) = 4.35, entonces
se rechaza la hipótesis nula de igualdad de medias y con un nivel de significancia del 5 % podemos
afirmar que existe diferencia entre los puntos Norte y Centro con respecto al índice promedió de
monoxido de carbonó en la ciudad.

Prueba Tukey
40
Diferencias
Este − Centro
20
Norte − Centro
Valores del Intervalo
Oeste − Centro
Sur − Centro
0 Norte − Este
Oeste − Este
Sur − Este
Oeste − Norte
−20
Sur − Norte
Sur − Oeste
−40
2.5 5.0 7.5 10.0
Figura 2: Intervalos de Confianza
Observando la figura 2, notamos que para la prueba tukey solo la diferencia entre los puntos Norte
y Centro es significativa lo cual puede ser un indicio que el punto norte presenta mayor índice
de Monoxido de carbono, pero se deben realizar otras pruebas para acompañar esta afirmación y
detectar si norte es el mejor tratamiento.
Prueba Duncan y LSD
Diferencias Diferencias
20 20
Este − Centro Este − Centro
Norte − Centro Norte − Centro
Oeste − Centro Oeste − Centro

Sur − Centro Sur − Centro
0 Norte − Este 0 Norte − Este
Oeste − Este Oeste − Este
Sur − Este Sur − Este
Oeste − Norte Oeste − Norte
Sur − Norte Sur − Norte
−20 Sur − Oeste −20 Sur − Oeste
2.5 5.0 7.5 10.0 2.5 5.0 7.5 10.0
Figura 3: Prueba Duncan y Prueba LSD
La figura tres nos muestra los intervalos de confianza para las pruebas Duncan y LSD, notamos
que en las dos pruebas las comparaciones se comportan de la misma manera, es decir que puede
que el intervalo de confianza sea mas o menos pequeño, pero en la parte de detectar diferencias
significativas entre los pares de medias lo hacen de igual manera, lo que puede indicar que estas dos
pruebas tiene una mayor sensibilidad en detectar un cambio en comparación con la prueba Tukey.
Finalmente, basados en las estadísticas descriptivas donde se podía evidenciar que el tratamiento
norte presentaba un mayor índice promedio de monoxido de carbono, acompañado de los resultados
del análisis de varianza que permitió rechazar la hipótesis de igualdad, con los resultados obtenidos
de los contrastes de hipótesis y las tres pruebas aplicadas a los tratamientos, podemos afirmar que

Tarea 6 7
todas estas coinciden en que hay una diferencia significativa del tratamiento Norte frente a los
demás, lo cual puede darnos la certeza de afirmar que dicho tratamiento es el mejor.
5. Eficiencia de los Diseños

Cuadrado Latino Contra un Diseño de Bloques Completos al Azar
Para calcular la eficiencia de cada diseño tenemos las siguientes ecuaciones.
Cuadrado Medio del error de un diseño de bloques completamente al azar
glf.cotrol ∗ CMf.control + (glt + glcl )(CMerror (Cl))

CMerror (DBCA) = (5.1)
glf.control + glt + glcl
(glcl + 1) ∗ (glerror (f.control) + 3) ∗ (CMerror (DBCA))

EF (CL ∼ DBCA) = (5.2)
(glerror (cl) + 3) ∗ (glerror (f.control) + 1) ∗ CMerror (cl)
estas dos ecuaciones las realizamos primero para el factor de control Hora del día:
4(43.54)+(4+12)45.57
CMerror (DBCA) = 4+4+12 = 45.16
(12+1)∗(16+3)∗45.16)
EF (CL ∼ DBCA) = (12+3)∗(16+1)∗45.57 = 0.799
Observando los resultados obtenidos podemos afirmar que la eficiencia relativa de un diseño
cuadrado latino respecto a un diseño de bloques completamente al azar teniendo en cuenta el
factor de control Hora del día es menor ha 1, por lo tanto en este caso el diseño de bloques
completamente al azar presenta una mayor eficiencia.
Ahora lo realizamos para el factor de control Día de la semana:

4(125.64)+(4+12)45.57
CMerror (DBCA) = 4+4+12 = 61.58
(12+1)∗(16+3)∗61.58)
EF (CL ∼ DBCA) = (12+3)∗(16+1)∗45.57 = 1.30
cuadrado latino respecto a un diseño de bloques completamente al azar teniendo en cuenta el
factor de control día de la semana es mayor ha 1, por lo tanto en este caso el diseño de cuadrado
latino aporta mayor eficiencia.
Cuadrado latino contra el diseño completamente al azar

Para calcular la eficiencia de cada diseño tenemos las siguientes ecuaciones.
Cuadrado medio del error del diseño completamente al azar
glt (CMt ) + (glt + gle (cl)) ∗ (CMerror (cl))

CMerror (DCA) = (5.3)
glt + gle (cl)
Eficiencia relativa del diseño Cuadrado latino

4 ∗ (232.94) + (4 + 12) ∗ 45.57
EF (CL ∼ DCA) = = 69.20 (5.4)
4 + 12

Desarrollando las ecuaciones 5.3 y 5.4 obtenemos lo siguiente:
13 ∗ ((12 + 4 + 4) + 3) ∗ 69.20
CMerror (DCA) = = 1.441 (5.5)
15 ∗ ((12 + 4 + 4) + 1) ∗ 45.57
cuadrado latino respecto a un diseño completamente al azar es mayor ha 1, por lo tanto en este
caso el diseño de cuadrado latino aporta mayor eficiencia.
Finalmente podemos decir que para este caso y teniendo en cuenta el factor de control días de la
semana es mejor usar un diseño cuadrado latino, pero si al contrario se tiene en cuenta el factor
bloque las horas del día es mejor usar un diseño de bloques completos al azar.

Tarea6 Daniel Delgado

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea6 Daniel Delgado

Cargado por

Copyright:

Formatos disponibles

Diseño y Análisis de Experimentos

Cali, Colombia, Mayo 5 de de 2020

1. Descripción de los Datos

Replicas Totales Promedio Varianza C. variación Mínimo Máximo

a Estudiante. E-mail: daniel.andres.delgado@correounivalle.edu.co

Descriptivas Por factor De Control Día de la Semana

Replicas Totales Promedio Varianza C.Variación Mínimo Máximo

Descriptivas Por factor De Control Hora del día

Replicas Totales Promedio Varianza C.Variación Mínimo Máximo

Diseño y Analisis de Experimentos (2020)

Hipótesis para los Tratamientos (τ )

Hipótesis para el Bloque Columnas (γ)

Hipótesis para el Bloque Filas (α)

Df Sum Sq Mean Sq F value Pr(>F)

CM. Residuales Lambda Potencia

Diseño y Analisis de Experimentos (2020)

• Ha : Los residuales no se distribuyen de manera normal.

Prueba de Homogeneidad de Varianza

• Ha : No existe Homogeneidad de Varianza .

Estadístico G.Liberad Valor-p

en la tabla 7, podemos observar que el valor p obtenido es mayor a un α establecido de 0.05,

Control local del Experimento

Diseño y Analisis de Experimentos (2020)

4. Contrastes y Pruebas Pos Anova

Para realizar los contrastes planteamos las siguientes hipótesis:

[(1 ∗ 130.4) + (−1 ∗ 128.8)]2 1

[(1 ∗ 130.4) + (1 ∗ 128.8) + (−1 ∗ 117.4) + (−1 ∗ 117.6)]2 1

[(1 ∗ 130.4) + (−1 ∗ 116.6)]2 1

Diseño y Analisis de Experimentos (2020)

Figura 2: Intervalos de Confianza

Prueba Duncan y LSD

Valores del Intervalo

Oeste − Centro Oeste − Centro

2.5 5.0 7.5 10.0 2.5 5.0 7.5 10.0

Figura 3: Prueba Duncan y Prueba LSD

Diseño y Analisis de Experimentos (2020)

5. Eficiencia de los Diseños

Cuadrado Medio del error de un diseño de bloques completamente al azar

glf.cotrol ∗ CMf.control + (glt + glcl )(CMerror (Cl))

(glcl + 1) ∗ (glerror (f.control) + 3) ∗ (CMerror (DBCA))

Ahora lo realizamos para el factor de control Día de la semana:

Cuadrado latino contra el diseño completamente al azar

Cuadrado medio del error del diseño completamente al azar

glt (CMt ) + (glt + gle (cl)) ∗ (CMerror (cl))

Eficiencia relativa del diseño Cuadrado latino

Diseño y Analisis de Experimentos (2020)

Desarrollando las ecuaciones 5.3 y 5.4 obtenemos lo siguiente:

Diseño y Analisis de Experimentos (2020)

También podría gustarte