Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidad y estadística
Taller de Resolución de Problemas
Elaborado por:
Gibran David Bañuelos Vega
22400735
Jorge Luis Méndez Reyes
22400794
Yaremi Adalid López Llanos
22400786
Cano Rodríguez Dahana Jamilete
22400738
Bryan Javier Ruiz Carillo 22400873
Equipo:
H
Maestro:
Albino Rodríguez Díaz
Grupo:
2A
a. ¿Los datos dan suficiente evidencia para indicar una diferencia en el contenido medio de oxigeno disuelto
para los cuatro lugares?
b. Compare el contenido medio de oxígeno disuelto a mitad del rio arriba de la planta, con el contenido medio
adyacente a la planta (lugar 2 contra lugar 3).
Elaborado: Gibran David Bañuelos Vega
Como podemos ver en el análisis de varianza el valor de p es de 0.000 y el valor de Alpha es de 0.05
por lo tanto, el factor oxígeno de los diferentes lugares es significativo y se puede asumir que la
hipótesis nula se rechaza y se concluye que las medias del oxígeno en cada lugar son diferentes.
a. ¿Los datos dan suficiente evidencia para indicar una diferencia en el contenido
medio de oxígeno disuelto para los cuatro lugares?
Hay una diferencia importante en el nivel de oxígeno de cada ubicación, lo cual es un indicador de
que, los desechos industriales disminuyen el nivel de oxígeno, dado que existe una media
significativamente diferente a la de las demás, la de la ubicación 3.
Como se puede observar existe un intervalo en las medias de entre 4.58-6.63 por lo que hay
mucha diferencia respecto a las ubicaciones estudiadas en cuanto a oxígeno se refiere, la media
que presenta menor nivel de oxígeno es la de la ubicación 3, es significativa la diferencia con un
95% de confianza.
b. Compare el contenido medio de oxígeno disuelto a mitad del rio arriba de la planta,
con el contenido medio adyacente a la planta (lugar 2 contra lugar 3).
Fischer
La grafica nos indica que el único intervalo similar es el 4 junto al 1, en cuanto al nivel de oxígeno se refiere,
todos los demás son significativamente distintos, en especial los que se comparan con la ubicación 3.
Tukey
La grafica de Tukey afirma la idea de que la ubicación 3 realmente difiere en cuanto a oxígeno se refiere
respecto a las otras ubicaciones, notamos también que las otras ubicaciones no varían tanto como
podríamos imaginar.
Dunnett
Por el mismo lado Dunnett nos indica que, con respecto a la media de control (ubicación 1), las medias 2 y 4
no son tan significativamente distintas como si lo llega a ser respecto de la media 3.
Hsu
En la gráfica nos indica que, las medias realmente son distintas entre sí comparándola con la que más
oxígeno cuenta que es la ubicación 2, por lo que esta es la ubicación menos contaminada del estudio.
4. Conclusión y análisis.
Se rechaza H0 y por lo tanto al menos algunas de las clases son diferentes entre sí (existen
diferencias en los resultados para las muestras). Es decir, existe al menos un lugar que
tiene resultados diferentes a los demás. Como lo interesante una vez comprobado H0 es
averiguar cuál o cuáles son diferentes y en qué sentido para detectar si alguno de los
lugares tiene mayores niveles de oxígeno se debe desarrollar un contraste a posteriori con
objeto de identificar las diferencias ya detectas (pero no identificadas) en el análisis de
ANOVA.
Estrategia de poyla
Ejercicio 11.15 Elaborado por: CANO RODRIGUEZ DAHANA JAMILETE
El contenido de calcio de una sustancia mineral pulverizada fue analizado cinco
veces por cada uno desviaciones estándar similares
Use una prueba adecuada para comparar los tres métodos de medición. Comente
sobre las validas suposiciones que sea necesario hacer.
METODO PORCENTAJE DE CALCIO yi yi*2
1 0.0279 0.0276 0.027 0.1381 0.01907161
0.0275 0.0281
2 0.0268 0.0274 0.0267 0.1339 0.01792921
0.0263 0.0267
3 0.028 0.0279 0.0282 0.1402 0.01965604
0.0278 0.0283
SOLUCION:
Para sacar yi se va haciendo la suma de cada uno de los porcentajes:
0.0279 + 0.0276+ 0.027+ 0.0275+ 0.0281=0.1381
0.0268 + 0.0274+ 0.0267+ 0.0263+ 0.0267=0.1339
0.028 + 0.0279+ 0.0282+0.0278 + 0.0283=0.1402
Se tiene que hacer la suma de los tres métodos:
Suma yi*2=0.05665686
Ya que se tiene la suma se hace la división entre 5, que vienen siendo las
desviaciones:
yi*2/5=0.01133137
Se hace la suma de todos los porcentajes de calcio que vienen siendo 15
y=0.4122
0.16990884
0.01132726
Población 1 2 3 4 5 6
Observaciones 10 10 10 10 10 10
Hipótesis nula
H0: μ1 = μ2 = μ3 = μ4 = μ5 = μ6
Hipótesis alternativa
H0: μi ≠ μj
540
Grados de libertad
k-1 = 6-1 = 5 n-k = 60 – 6 = 54 n-1 = 60
-1 = 59
TABLA ANOVA
Fuente DF SS MS F SIG
Tratamiento 5 300 60 13.5
Error 54 240 4.44 13.5>2.28
Totalidad 59 540
Nombre del lo realizo Jorge Luis Mendez Reyes.
Problema:
La convección es una forma de transferencia de calor por los fluidos debido a sus variaciones de
densidad por la temperatura; las partes calientes ascienden y las frías descienden formando las
corrientes de convección que hacen uniforme la temperatura del fluido. Se ha realizado un
experimento para determinar las modificaciones de la densidad de fluido al elevar la temperatura
en una determinada zona. Los resultados obtenidos han sido los siguientes:
Interpretación:
En este ejercicio se deberá calcular lo que es la temperatura de cualquier fluido sea (Líquidos o
viscosos) teniendo en cuenta las densidades de estos mismos, para esto se tomara en cuenta un
rango de temperatura de 100 a 175 grados con un total de 4 muestra y cada una de estas 4-5
pruebas de densidad cada una.
D) ¿Se puede afirmar que las temperaturas de 100 y 125 producen menos densidades de fluido en
promedio que las temperaturas de 150 y 175?
Solución:
Modelo no-equilibrado: Los niveles de los factores tienen distinto número de elementos.
En la tabla ANOVA el valor del estadístico de contrates de igualdad de medias F = 6.983, deja a su
derecha un p-valor = 0.004 inferior a 0.05, por lo que se rechaza la hipótesis nula de igualdad de
medias. Concluyendo que existen diferencias significativas en la densidad del fluido en función de
la modificación de la temperatura.
Se plantea la pregunta de si la densidad media del fluido es significativamente diferente para las 4
temperaturas analizadas o sólo para alguna de ellas. Esta cuestión se resuelve mediante los
contrastes de comparaciones múltiples. Utilizando la prueba de Tukey,se obtienen los siguientes
resultados:
La tabla de comparaciones múltiples muestra los intervalos simultáneos construidos por el método
de Tukey para cada posible combinación de temperaturas. Como se puede observar todos los
intervalos de confianza construidos para las diferencias entre las densidades medias contienen al 0,
excepto el correspondiente a la pareja de temperatura125 y 175. Lo que significa que todas las
densidades medias no pueden considerarse distintas estadísticamente excepto las densidades
medias correspondientes a las temperaturas de 125 y 175. Así mismo se observa que la significación
asociada al contraste de las densidades medias correspondientes a estas temperaturas es inferior a
0.05, lo que se traduce en que existe evidencia empírica de que ambas densidades medias son
diferentes significativamente.
Para poder analizar esta tabla más fácilmente la ponemos de la siguiente forma:
En esta tabla es más cómodo comparar cualquier pareja de temperaturas para saber si hay
diferencias significativas. Se deduce que sólo se observan diferencias significativas entre las
densidades de los fluidos cuando se ha modificado la temperatura a 125 y 175 grados (significación
inferior a 0.05).
En la tabla Subconjuntos homogéneos asociada al contraste de Tukey se muestra por columnas los
subgrupos de medias iguales. En nuestro estudio sobre las densidades de los fluidos se observan
que las densidades medias del fluido analizado pueden considerarse similares cuando las
temperaturas son 100, 125 y 150 y cuando son 100, 150 y 175 grados.
Tal y como se observa en la tabla, el p-valor asociado al primer grupo de temperaturas (100, 125 y
150) es 0.081, mayor que 0.05 lo que significa que no se puede rechazar la hipótesis de igualdad en
las densidades medias para este subgrupo. Análogamente ocurre con el otro subgrupo formado,
con un p-valor igual a 0.124. También se deduce qué subconjuntos difieren entre si, las densidades
medias del primer grupo difieren de las del segundo. Y se observa que la densidad media mayor
(21.9375) se obtiene para la temperatura de 175 y la menor (21.5) para la tremperatura de 125.
Validar el modelo propuesto consiste en estudiar si las hipótesis básicas del modelo están o no en
contradicción con los datos observados. Es decir, si se satisfacen los supuestos del modelo:
Normalidad, Independencia y Homocedasticidad.
Hipótesis de Homocedasticidad:
De donde se deduce a partir del valor de la significación, 0.585, que se puede asumir la igualdad de
varianzas entre las densidades registradas para las diferentes temperaturas.
Gráficamente, representamos las barras de error para la desviación típica seleccionando en el menú
principal Gráficos/Cuadros de diálogo antiguos/Barras de error
Se obtiene para cada grupo de temperaturas una representación gráfica de la densidad media
(círculo de cada una de las barras) y dos desviaciones típicas a izquierda y derecha del promedio. Se
observa una mayor dispersión en la densidad para las temperaturas 125 y 150. Este gráfico no aporta
evidencias sobre la homogeneidad de las varianzas, por lo que siempre habrá que recurrir al
contraste de Levene para dicha comparación.
Hipótesis de Independencia
Para comprobar que se satisface el supuesto de independencia entre los residuos, representamos
gráficamente los residuos frente a los valores pronosticados. La presencia de alguna tendencia en
el gráfico puede indicar la alteración de dicha hipótesis. Seleccionando Opciones en el cuadro de
diálogo de Análisis Univariante, se selecciona la casilla Gráfico de los residuos y se obtienen los
gráficos de residuos asociados al análisis.
Hipótesis de Normalidad
El valor del p- valor (significación = 0.637) es mayor que el nivel de significación, 0.05, por lo que se
puede confirmar la normalidad de los residuos.
D) ¿Se puede afirmar que las temperaturas de 100 y 125 producen menos densidades de
fluido en promedio que las temperaturas de 150 y 175?
El contraste de hipótesis que se debe resolver para contestar este apartado es:
Para interpretar la tabla, asumimos en todos los contrastes la homocedasticidad, observamos que
el p-valor vale 0.006 menor que el nivel de significación 0.05. Por lo tanto, se rechaza la hipótesis
nula y se deduce que las temperaturas de 100 y 125 conjuntamente producen menos densidades
de fluido en promedio que las temperaturas de 150 y 175 conjuntamente.
Bryan Javier Ruiz Carrillo
las muestras halladas en los otros tres sitios. Las muestras se analizaron para determinar su
composición química y a continuación se indica el porcentaje de óxido de hierro.
Calcule el rango.
Rango = 2.39-1.28
Rango = 1.11
R= 1.28+2.39+1.50+1.88+1.51/5
R=(1.28- 1.712)
+=(2.39- 1.712)
+=(1.50- 1.712)
+=(1.88- 1.712)
+(1.51- 1.712)
2
/5-1
R=0.186+0.459+0.044+0.028+0.40/4
R=1.117/4
R=0.279
R=
√0.279
R=0.528
c)
R= 1.11/0.279
R=3.974
R= aproximadamente 4 veces
c. ¿Le parece que algunas de las suposiciones del análisis de
El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K muestras son
iguales, frente a la hipótesis alternativa de que por lo menos una de las muestras de las demás en
cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados
experimentales.
Conclusión y análisis.
Lo que pude entender del tema fue que el análisis de la varianza o Anova, es un método para
comparar dos o más medias. Es necesario porque cuando se quiere comparar más de dos medias
es incorrecto utilizar repetidamente el contraste basado en la t de Student. El análisis de varianza
sirve para comparar si los valores de un conjunto de datos numéricos son significativamente
distintos a los valores de otro o más conjuntos de datos. El método para comparar estos valores
está basado en la varianza global observada en los grupos de datos numéricos a comparar.
Típicamente, el análisis de varianza se utiliza para asociar una probabilidad a la conclusión de que
la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones.