Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tarea 6
1,a
Daniel Andres Delgado O (1622960)
1 Escuela de Estadística, Facultad de Ingeniería, Universidad del Valle, Cali, Colombia
La tabla 1, nos permite observar que la zona Norte presenta un mayor índice promedio de monoxido
de carbono, y los datos presentan menor variabilidad en comparación a las otras zonas. Por otra
parte la zona Centro presenta el índice promedio mas bajo de todos y sus datos presentan la mayor
variabilidad.
130
Indice de Monoxido de Carbono
ubicacion
N
120
E
S
O
C
110
100
N E S O C
Zona de Monitoreo
Figura 1: Diagrama de cajas del índice de monoxido de carbono
1
2 Daniel Andres Delgado O (1622960)
Complementando lo dicho anterior mente, la figura 1 nos permite observar de manera gráfica el
comportamiento del índice de mnoxido de carbono, donde corroboramos que la zona centro es la que
presenta una mayor variabilidad de sus datos y la zona norte es la que presenta menor dispersión
de todas la zonas.
Observando los resultados de la tabla 2, notamos que el día domingo es quien presenta un mayor
índice promedio de monoxido de carbono en la ciudad y los datos ese día presentan menor variabilidad,
por otra parte el día lunes es quien tiene menor índice promedio del monoxido de carbono.
Finalmente el día miércoles es donde se presentan mediciones mas variables del índice de monoxido
de carbono.
De la tabla 3, podemos observar que los horarios 14:00 y 17:00 presentan un comportamiento
promedio del índice de monoxido de carbono similar y sus valores no presentan una dispersión alta,
El horario de las 08:00 presenta un índice promedio también alto y los datos esta completamente
agrupados, dado que su coeficiente de variación es el mas bajo. Finalmente las horas 11:00 y 20:00
del día presentan un dispersión entre sus datos alta, es decir que su coeficiente de variación es alto
con respecto a las demás horas del día.
2. Análisis de varianza
• Variable de Respuesta: Índice de Monóxido de Carbono.
• Factor de Tratamiento: Puntos Estratégicos.
• Factor Bloque: Días de la Semana y Horas del Día.
• Niveles: (Lunes, Miércoles, Viernes, Sábado y Domingo) y (08:00, 11:00, 14:00, 17:00, 20:00).
• Unidad Experimental: Medicines del Índice Monoxido de Carbono .
• Tipo de Modelo: Cuadrado Latino.
Después de haber descrito el experimento pasamos a plantear las siguientes hipótesis para el factor
de tratamiento, y los factores bloque.
H0 : τ1 = τ2 = τ3 = τ4 = τ5
Ha : Alguna de estas igualdades no se cumple.
H1 : γ1 = γ2 = γ3 = γ4 = γ5
Ha : Alguna de estas igualdades no se cumple.
H1 : α1 = α2 = α3 = α4 = α5
Ha : Alguna de estas igualdades no se cumple.
La tabla 4, nos permite evidenciar que los valores-p de los factores bloque no son significativos
para nuestro experimento, por lo tanto no se rechaza la hipótesis nula. Por otra parte el valor-p
obtenido para nuestro factor de tratamiento es menor que un α establecido del 0.05, por lo tanto
se rechaza la hipótesis nula de igualdad y se puede afirmar que hay evidencia estadística suficiente
para pensar que existen diferencias entre las estaciones de monitoreo en la ciudad.
Potencia de la Prueba
la tabla 5 nos permite observar que la probabilidad de que la prueba rechace correctamente la
hipótesis nula es del 86 %, es decir que el análisis de varianza realizado para este experimento tiene
una probabilidad alta para detectar una diferencia entre las medias de los factores de tratamiento
cuando realmente exista esa diferencia.
3. Validación de Supuestos
Prueba de Normalidad
• H1 :Los residuales se distribuyen de forma normal.
W Valor-p
0.974 0.87
Tabla 6: Shapiro-Wilk
La tabla 6, nos permite evidencia que el valor p obtenido es mayor a un α establecido del 0.05,
por lo tanto no se rechaza la hipótesis nula y no existe suficiente evidencia estadística para afirmar
que los residuales no se distribuyen de manera normal, es decir que el supuesto de normalidad se
cumple.
Prueba de Independencia
• H1 : Cov(eijk , ei0 j 0 k0 ) = 0.
• Ha : Cov(eijk , ei0 j 0 k0 ) 6= 0.
Estadístico Valor-p
2.620 0.796
Tabla 8: Prueba Durbin-Watson
la tabla 6, nos permite observar que el valor p obtenido es mayor a un α establecido de 0.05, por
lo tanto no se rechaza la hipótesis nula de autocorrelacion y se puede afirmar que los errores son
independiente entre si.
observando los resultados obtenidos de la ecuación 3.1 notamos que el coeficiente de variación
obtenido es pequeño, por lo tanto podemos afirmar que el experimento tubo un buen control local.
Contrastes de Hipótesis
Primera Hipótesis
• H0 : τ1 − τ3 = 0
• Ha : τ1 − τ3 6= 0
Observando los resultados, notamos que el estadístico F calculado (0.1404) es menor al F(1,20) =
4.35, entonces no rechazamos la hipótesis nula planteada y afirmamos con un nivel de significancia
del 5 % que el punto Norte no difiere al punto Sur de la ciudad, en cuento al Índice promedio de
monoxido de carbono.
Segunda Hipótesis
• H0 : τ1 + τ3 − τ2 + τ4 = 0
• Ha : τ1 + τ3 − τ2 + τ4 6= 0
Observando la ecuación 4.2 tenemos que el estadístico calculado es mayor al F(1,20) = 4.35, entonces
se rechaza la hipótesis nula de igualdad de medias y con un nivel de significancia del 5 % podemos
afirmar que existe diferencia en conjuntó entre los puntos Norte y Sur frente a los punto Oeste y
este con respecto al índice promedió de monoxido de carbonó en la ciudad.
Tercera Hipótesis
• H0 : τ1 − τ5 = 0
• Ha : τ1 − τ5 6= 0
Observando la ecuación 4.3 tenemos que el estadístico calculado es mayor al F(1,20) = 4.35, entonces
se rechaza la hipótesis nula de igualdad de medias y con un nivel de significancia del 5 % podemos
afirmar que existe diferencia entre los puntos Norte y Centro con respecto al índice promedió de
monoxido de carbonó en la ciudad.
Prueba Tukey
40
Diferencias
Este − Centro
20
Norte − Centro
Valores del Intervalo
Oeste − Centro
Sur − Centro
0 Norte − Este
Oeste − Este
Sur − Este
Oeste − Norte
−20
Sur − Norte
Sur − Oeste
−40
2.5 5.0 7.5 10.0
Observando la figura 2, notamos que para la prueba tukey solo la diferencia entre los puntos Norte
y Centro es significativa lo cual puede ser un indicio que el punto norte presenta mayor índice
de Monoxido de carbono, pero se deben realizar otras pruebas para acompañar esta afirmación y
detectar si norte es el mejor tratamiento.
Diferencias Diferencias
20 20
Este − Centro Este − Centro
Norte − Centro Norte − Centro
Valores del Intervalo
La figura tres nos muestra los intervalos de confianza para las pruebas Duncan y LSD, notamos
que en las dos pruebas las comparaciones se comportan de la misma manera, es decir que puede
que el intervalo de confianza sea mas o menos pequeño, pero en la parte de detectar diferencias
significativas entre los pares de medias lo hacen de igual manera, lo que puede indicar que estas dos
pruebas tiene una mayor sensibilidad en detectar un cambio en comparación con la prueba Tukey.
Finalmente, basados en las estadísticas descriptivas donde se podía evidenciar que el tratamiento
norte presentaba un mayor índice promedio de monoxido de carbono, acompañado de los resultados
del análisis de varianza que permitió rechazar la hipótesis de igualdad, con los resultados obtenidos
de los contrastes de hipótesis y las tres pruebas aplicadas a los tratamientos, podemos afirmar que
todas estas coinciden en que hay una diferencia significativa del tratamiento Norte frente a los
demás, lo cual puede darnos la certeza de afirmar que dicho tratamiento es el mejor.
estas dos ecuaciones las realizamos primero para el factor de control Hora del día:
4(43.54)+(4+12)45.57
CMerror (DBCA) = 4+4+12 = 45.16
(12+1)∗(16+3)∗45.16)
EF (CL ∼ DBCA) = (12+3)∗(16+1)∗45.57 = 0.799
Observando los resultados obtenidos podemos afirmar que la eficiencia relativa de un diseño
cuadrado latino respecto a un diseño de bloques completamente al azar teniendo en cuenta el
factor de control Hora del día es menor ha 1, por lo tanto en este caso el diseño de bloques
completamente al azar presenta una mayor eficiencia.
(12+1)∗(16+3)∗61.58)
EF (CL ∼ DBCA) = (12+3)∗(16+1)∗45.57 = 1.30
Observando los resultados obtenidos podemos afirmar que la eficiencia relativa de un diseño
cuadrado latino respecto a un diseño de bloques completamente al azar teniendo en cuenta el
factor de control día de la semana es mayor ha 1, por lo tanto en este caso el diseño de cuadrado
latino aporta mayor eficiencia.
13 ∗ ((12 + 4 + 4) + 3) ∗ 69.20
CMerror (DCA) = = 1.441 (5.5)
15 ∗ ((12 + 4 + 4) + 1) ∗ 45.57
Observando los resultados obtenidos podemos afirmar que la eficiencia relativa de un diseño
cuadrado latino respecto a un diseño completamente al azar es mayor ha 1, por lo tanto en este
caso el diseño de cuadrado latino aporta mayor eficiencia.
Finalmente podemos decir que para este caso y teniendo en cuenta el factor de control días de la
semana es mejor usar un diseño cuadrado latino, pero si al contrario se tiene en cuenta el factor
bloque las horas del día es mejor usar un diseño de bloques completos al azar.