Está en la página 1de 9

INFORME PRÁCTICA 2

INGENIERÍA QUÍMICA
ESTADÍTICA- PRÁCTICA 2
Lucía De Lucas Álvarez

Lucía Heras Ramírez

Ruth Sánchez Alonso

Raquel Vicente Ballestero


1. Contrastar si los datos de las distintas muestras proceden de una distribución normal.
En primer lugar, antes de contrastar los datos y comprobar que siguen una distribución normal,
hemos importado los datos de Excel al R-commander para poder trabajar con ellos. Una vez
hecho esto, tenemos que saber que, para comprobar si las muestras o sus correspondientes
datos siguen una distribución normal es necesario representarlos en una gráficaEsta gráfica
puede ser un histograma o bien un Q-Q plots, en nuestro caso hemos representado los datos de
los tres climas (frío, templado y cálido) en un histograma, y después se ha representado cada
uno de los climas independientes con Q-Q plots con el fin de conseguir una mejor visualización
de su distribución.

Tras representar el histograma que engloba los datos de los tres climas (frío, templado y cálido),
observamos lo siguiente:

Gráfico 1: Diagrama de barras de los tres climas

Como podemos observar la forma que adopta el histograma se asemeja a la campana de Gauss,
lo que nos permite deducir que esta muestra cumple una distribución normal. Sin embargo, esto
no nos permite afirmar que lo sea; para ello tendremos que hacer un contraste de hipótesis y el
test de Shapiro Wilk. Éste último es el que nos determinará si cumple o no la normalidad en este
caso.

Otra forma de comprobarlo es utilizando Q-Qplot, siendo éste el método que hemos empleado
a la hora de analizar cada uno de los climas por separado.
Los siguientes gráficos de Q-Q plots se corresponden con cada uno de los climas por separado:

Gráfico 2: Q-Q plots de los tres climas independientes

Observando las tres gráficas comprobamos que sólo dos de ellas cumplen una distribución
normal, siendo estas las que representan a los climas cálido y templado, ya que en ellas todos
los datos se aproximan a la recta. Por otro lado, en el caso del clima frío, esto no se cumple, los
datos se alejan de la recta, por lo que se podría decir que no cumple con la normalidad, pero al
tratarse de una muestra con muchos datos podemos estudiar sus datos aproximándola a una
distribución normal.

Aun así, el test que nos confirma y nos contrasta los datos de una normal es el test de Shapiro
Wilk. Pero primero debemos contrastar la hipótesis:

H0 = que la muestra cumpla la distribución normal


H1 = que la muestra No cumpla una distribución normal

En la siguiente imagen que se adjunta, se observa el p-valor (p-value) que se ha obtenido a partir
del test de Shapiro Wilk hecho en R-commander. Para hacer esto en el programa iremos a la
pestaña de Estadisticas --> Resúmenes --> Test de normalidad --> y seleccionamos la opción del
test a realizar; en nuestro caso el Shapiro Wilk. De aquí seleccionamos nuestros datos, es decir
“Tamanyo” y nos devuelve lo siguiente:
El p-valor nos da un valor de 0,2507 y como no se aporta información de alfa(α), suponemos
que es de 0,05 y es nuestro valor de frontera para saber si debemos o no rechazar la hipótesis
nula (H0). Y con esto poder determinar si la muestra de los datos de “Tamanyo” sigue una
distribución normal.

En este caso el p-valor es superior a 0,05, por tanto, no se rechaza la hipótesis nula, con esto
podemos confirmar que sigue una distribución normal.

2. Obtención de los Intervalos de confianza para la media, estimadores de la media, de


las distintas muestras que genera la variable categórica tipo de clima.

Primero hemos estudiado los intervalos de confianza para los tres climas en conjunto, para ello
hemos seleccionado los datos de los tres climas.

- Estudio de la muestra ‘tamaño’ de los tres climas en conjunto

El intervalo de confianza es: (2.132882, 2.260003)

- Estudio de la muestra ‘tiempo de floración’ de los tres climas en conjunto

El intervalo de confianza es: (137.7128, 140.5253)


Para estudiar cada clima por separado hemos seleccionado los datos de cada clima por
separado

- Estudio de la muestra ‘tamaño’ del clima frío.

El intervalo de confianza es: (2.474812, 2.694463)

- Estudio de la muestra ‘tiempo de floración’ del clima frío

El intervalo de confianza es: (147.1933, 150.4467)

- Estudio de la muestra ‘tamaño’ del clima templado

El intervalo de confianza es: (2.258383, 2.445444)


- Estudio de la muestra ‘tiempo de floración’ del clima templado

El intervalo de confianza es: (143.8019, 147.0602)

- Estudio de la muestra ‘tamaño’ del clima cálido

El intervalo de confianza es: (1.844005, 1.991485)

- Estudio de la muestra ‘tiempo de floración’ del clima cálido

El intervalo de confianza es: (129.4749, 132.0741)


3. En base a los datos observados, ¿existe evidencia de que los altramuces que crecen en
un clima frío tengan, por término medio, un tamaño mayor que los que crecen en un
clima templado? (comprobación de si sus varianzas poblacionales son iguales o
distintas).

Estamos ante dos muestras independientes, por tanto, para poder compararlas debemos saber
primero si sus varianzas coinciden. Para ello hacemos nuestro contraste de hipótesis.

H0: σFrío2 = σCaliente2

H1: σFrío2 = σCaliente2

Si nos fijamos en el p-valor (p-value) es 0,5442 superior al 0,5 por lo que la hipótesis nula no es
rechazada y podemos afirmar que las varianzas son iguales. Esto nos permite analizar mediante
una distribución normal, t-estudent ambas muestras.

Al ver que el p-valor (p-value) es superior a 0.05, podemos concluir que la hipótesis nula no se
rechaza y, por tanto, no hay evidencia de que los altramuces que crecen en el clima frío sean
mayores que los del clima templado.

H0: µfrío ≤ µtemplado

H1: µfrío > µtemplado


4. Un equipo de botánicos está desarrollando la teoría de que el tiempo medio
floración de los altramuces que crecen en un clima templado supera los 145 días.
¿Los datos de la muestra recogida sostienen esta teoría?

Para saber si los altramuces que crecen en un clima templado supera los 145 días como tiempo
medio de floración, hemos planteado lo siguiente:

H0: µfloración ≤ 145

H1: µfloración > 145

Hemos seleccionado únicamente los datos del clima templado. La hipótesis nula se determina
como igual o menor a 145. Por ello, en el R-commander, hemos establecido que la hipótesis nula
sea igual a 145, como se observa en las siguientes imágenes:

Observamos, que el p-valor es superior a 0.05, lo que verifica que la hipótesis nula no debe ser
rechazada. Por otro lado, sí que se rechaza la alternativa, siendo esta la que afirma que el
tiempo de floración es superior a 145 días, lo cual es incompatible con esta teoría.

5. Analizar si existen diferencias significativas entre los tiempos medios de floración de


los 3 climas.

Para comparar las medias de los distintos climas y sabiendo que son muestras independientes
planteamos diferentes hipótesis:

- Entre el clima frío y templado


H0: µfrío = µtemplado
H1: µfrío ≠ µtemplado

Observamos que el p-valor es inferior a 0,1 lo que quiere decir que se rechaza la hipótesis nula
y por tanto, no hay relación entre las medias del clima frío y templado.
Con los casos templado y cálido y cálido y frío hacemos los mismos y planteamos la hipótesis de
igual caso. Así tenemos:

Para el caso templado- cálido ocurre lo mismo el p-valor es inferior a 0,1 por ello, no se puede
afirmar que las medias sean parecidas.

Para el caso cálido-frío también ocurre lo mismo el p-valor es inferior a 0,1 por ello, no se puede
afirmar que las medias sean parecidas.

También podría gustarte