Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INGENIERÍA QUÍMICA
ESTADÍTICA- PRÁCTICA 2
Lucía De Lucas Álvarez
Tras representar el histograma que engloba los datos de los tres climas (frío, templado y cálido),
observamos lo siguiente:
Como podemos observar la forma que adopta el histograma se asemeja a la campana de Gauss,
lo que nos permite deducir que esta muestra cumple una distribución normal. Sin embargo, esto
no nos permite afirmar que lo sea; para ello tendremos que hacer un contraste de hipótesis y el
test de Shapiro Wilk. Éste último es el que nos determinará si cumple o no la normalidad en este
caso.
Otra forma de comprobarlo es utilizando Q-Qplot, siendo éste el método que hemos empleado
a la hora de analizar cada uno de los climas por separado.
Los siguientes gráficos de Q-Q plots se corresponden con cada uno de los climas por separado:
Observando las tres gráficas comprobamos que sólo dos de ellas cumplen una distribución
normal, siendo estas las que representan a los climas cálido y templado, ya que en ellas todos
los datos se aproximan a la recta. Por otro lado, en el caso del clima frío, esto no se cumple, los
datos se alejan de la recta, por lo que se podría decir que no cumple con la normalidad, pero al
tratarse de una muestra con muchos datos podemos estudiar sus datos aproximándola a una
distribución normal.
Aun así, el test que nos confirma y nos contrasta los datos de una normal es el test de Shapiro
Wilk. Pero primero debemos contrastar la hipótesis:
En la siguiente imagen que se adjunta, se observa el p-valor (p-value) que se ha obtenido a partir
del test de Shapiro Wilk hecho en R-commander. Para hacer esto en el programa iremos a la
pestaña de Estadisticas --> Resúmenes --> Test de normalidad --> y seleccionamos la opción del
test a realizar; en nuestro caso el Shapiro Wilk. De aquí seleccionamos nuestros datos, es decir
“Tamanyo” y nos devuelve lo siguiente:
El p-valor nos da un valor de 0,2507 y como no se aporta información de alfa(α), suponemos
que es de 0,05 y es nuestro valor de frontera para saber si debemos o no rechazar la hipótesis
nula (H0). Y con esto poder determinar si la muestra de los datos de “Tamanyo” sigue una
distribución normal.
En este caso el p-valor es superior a 0,05, por tanto, no se rechaza la hipótesis nula, con esto
podemos confirmar que sigue una distribución normal.
Primero hemos estudiado los intervalos de confianza para los tres climas en conjunto, para ello
hemos seleccionado los datos de los tres climas.
Estamos ante dos muestras independientes, por tanto, para poder compararlas debemos saber
primero si sus varianzas coinciden. Para ello hacemos nuestro contraste de hipótesis.
Si nos fijamos en el p-valor (p-value) es 0,5442 superior al 0,5 por lo que la hipótesis nula no es
rechazada y podemos afirmar que las varianzas son iguales. Esto nos permite analizar mediante
una distribución normal, t-estudent ambas muestras.
Al ver que el p-valor (p-value) es superior a 0.05, podemos concluir que la hipótesis nula no se
rechaza y, por tanto, no hay evidencia de que los altramuces que crecen en el clima frío sean
mayores que los del clima templado.
Para saber si los altramuces que crecen en un clima templado supera los 145 días como tiempo
medio de floración, hemos planteado lo siguiente:
Hemos seleccionado únicamente los datos del clima templado. La hipótesis nula se determina
como igual o menor a 145. Por ello, en el R-commander, hemos establecido que la hipótesis nula
sea igual a 145, como se observa en las siguientes imágenes:
Observamos, que el p-valor es superior a 0.05, lo que verifica que la hipótesis nula no debe ser
rechazada. Por otro lado, sí que se rechaza la alternativa, siendo esta la que afirma que el
tiempo de floración es superior a 145 días, lo cual es incompatible con esta teoría.
Para comparar las medias de los distintos climas y sabiendo que son muestras independientes
planteamos diferentes hipótesis:
Observamos que el p-valor es inferior a 0,1 lo que quiere decir que se rechaza la hipótesis nula
y por tanto, no hay relación entre las medias del clima frío y templado.
Con los casos templado y cálido y cálido y frío hacemos los mismos y planteamos la hipótesis de
igual caso. Así tenemos:
Para el caso templado- cálido ocurre lo mismo el p-valor es inferior a 0,1 por ello, no se puede
afirmar que las medias sean parecidas.
Para el caso cálido-frío también ocurre lo mismo el p-valor es inferior a 0,1 por ello, no se puede
afirmar que las medias sean parecidas.