Está en la página 1de 3

Autor: Jorge Martnez Fecha: 27 de Noviembre de 2013 Correo Electrnico: jormarg9@gmail.

com OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que nos permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrn, Nicotina y Peso del cigarrillo. PARTE 1: Genere un breve informe estadstico descriptivo, a partir de la salida de ordenador que se adjunta (tmese el espacio que necesite pero sea breve), en el que seale: 1) el tamao muestral, 2) cul es la variable con mayor variabilidad, 3) cul de las medias es ms representativa de los datos y 4) cul de las medias es ms estable.

Respuesta: En los estadsticos presentados respecto a un estudio con un tamao poblacional de 25 medidas, se observa que la variable que presenta una mayor variabilidad de las cuatro estudiadas es el contenido en alquitrn, que tiene la mayor desviacin tpica. La media ms representativa de los datos presentados es la que se refiere al contenido en nicotina, ya que es la que menor error tpico presenta, mientras que la media ms estable de todas es la referida al peso, cuya varianza y desviacin tpica son prcticamente nulas.

Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece debajo. Escriba un breve informe con los resultados ms relevantes entre los que al menos debe estar la Mediana y el Recorrido intercuartlico (debe calcularlo a partir de la tabla) para todas y cada una de las variables. En el informe compare, adems, los resultados obtenidos con la Media y su dispersin y la Mediana y su dispersin.

Respuesta:
Monxido de carbono: De los percentiles expuestos, se calcula que el recorrido intercuartlico de los datos del monxido de carbono tiene un valor de 5,9 que se obtiene de la diferencia entre los valores del 75% y del 25%, siendo su mediana de 13. En la comparacin con la media obtenida en los datos del apartado anterior, vemos que la mediana de stos es un poco superior a la media. Alquitrn: De los percentiles expuestos, se calcula que el recorrido intercuartlico de los datos del alquitrn tiene un valor de 7,25 que se obtiene de la diferencia entre los valores del 75% y del 25%, siendo su mediana de 12,40. En la comparacin con la media obtenida en los datos del apartado anterior, vemos que la mediana de stos tambin es un poco superior a la media, y se aprecia que existe bastante variabilidad en los datos y un cambio grande entre los percentiles del 90% y 95%, con lo que se pueden deducir algunos datos anmalos o aberrantes. Nicotina: De los percentiles expuestos, se calcula que el recorrido intercuartlico de los datos de la nicotina tiene un valor de 0,35 que se obtiene de la diferencia entre los valores del 75% y del 25%, siendo su mediana de 0,9. En la comparacin con la media obtenida en los datos del apartado anterior, vemos que la mediana de stos es un poco superior a la media. Adems tambin apreciamos un incremento grande entre los percentiles del 90% y el 95%, lo que puede indicar valores extremos que alargan el recorrido. Peso: De los percentiles expuestos, se calcula que el recorrido intercuartlico de los datos del peso tiene un valor de 0,0963 que se obtiene de la diferencia entre los valores del 75% y del 25%, siendo su mediana de 0,9537, lo que da lugar a pensar que la variabilidad de los datos es muy baja y siguen ms o menos una distribucin uniforme.

Parte 3. Analice los Box plot (diagramas de caja) que se adjuntan y saque las conclusiones ms relevantes. Debe escribir, al menos, sobre la posible asimetra y la existencia, o no, de outliers

Respuesta: En los diagramas Box Plot que se adjuntan se observa que, por un lado, las variables de peso del cigarro y de nicotina tienen un recorrido intercuartlico inferior a las del contenido en alquitrn y en monxido de carbono (esto se ve en la diferente altura de las cajas) y por otro lado, se observa la existencia de asimetra en las distribuciones sobre todo del alquitrn, donde el bigote de la parte superior(percentil 90%) es muy corto con respecto al de la inferior, lo que indica que la campana de Gauss estara deformada hacia la izquierda. El resto de diagramas dejan entrever unas variables con distribuciones ms simtricas y en todas ellas se aprecia la existencia de outliers o datos aberrantes.

También podría gustarte