Está en la página 1de 2

Con el fin de analizar los resultados del estudio: "Using Cigarette Data for an Introduction to

Multiple Regression", publicado por Lauren Mcintyre en la revista, Journal of Statistics


Education (Volume 2, Numero 1). Se realiza el siguiente estudio descriptivo, de los datos
presentados en dicho estudio.

Teniendo en cuenta que se piensa que el incremento en el contenido de alquitrán y nicotina de


los cigarrillos produce incrementos en el monóxido de carbono emitido al fumar. Sería
interesante para el investigador presentar un modelo que permita estimar la cantidad de
monóxido de carbono emitido al fumar a partir de las otras variables consideradas. Antes de
crear dicho modelo es necesario tener claridad del comportamiento de las variables usadas en
el estudio, para con esto saber que tan adecuado será el modelo obtenido.

Se procede a desarrollar un informe estadístico descriptivo de las variables del estudio:

Luego de procesar los datos en el software especializado SPSS se obtuvo la siguiente tabla de
medidas descriptivas

A partir de dicha tabla se puede ver que los datos de la muestra de 25 observaciones para
cada una de las variables analizadas permiten concluir que la variable con mayor variabilidad
es el contenido de alquitran, que tiene un coeficiente de variación del 47,7% (√11,816/34531),
En sentido contrario la variable peso del cigarrillo, es la que tiene una media más
representativa del centro de la variable, esto porque su coeficiente de variación es del 9,2%
(√0,008/0,970284). Así mismo, la variable que tendría una media más estable en diferentes
muestras seria el peso, pues es la que tiene menor error típico para la media (0,070840).

Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece debajo.
Escriba un breve informe con los resultados más relevantes entre los que al menos debe estar
la Mediana y el Recorrido intercuartílico (debe calcularlo a partir de la tabla) para todas y cada
una de las variables. En el informe compare, además, los resultados obtenidos con la Media y
su dispersión y la Mediana y su dispersión.

Ahora al ser la mayor parte de las variables muy dispersas, se debe tener un mejor indicador
del centro, razón por la cual se calcularon algunos percentiles de las distribuciones de las
variables analizadas que se muestran en la siguiente tabla.
Parte 3. Analice los Box plot (diagramas de caja) que se adjuntan y saque las conclusiones
más relevantes. Debe escribir, al menos, sobre la posible asimetría y la existencia, o no, de
outliers

También podría gustarte