Está en la página 1de 4

MIRIADAX

UNIVERSIDAD DE SALAMANCA
Estadstica para investigadores: Todo lo que siempre quiso saber

PLANTEAMIENTO Y OBJETIVO:

Tomamos datos de la siguiente publicacin: "Using Cigarette Data for an Introduction


to Multiple Regression", by Lauren Mcintyre in Volume 2, Number 1, of the Journal of
Statistics Education. La primera parte del objetivo lo cubriremos con esta tarea P2P, y la
segunda parte, lo cubriremos en la segunda tarea P2P al finalizar el mdulo 4. Estudios
realizados con anterioridad ponen de manifiesto que incrementos en el contenido de
alquitrn y nicotina de los cigarrillos vienen acompaados por incrementos en el
monxido de carbono emitido al fumar. Partimos de estos datos y nos planteamos el
siguiente objetivo:

OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que nos
permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables
Alquitrn, Nicotina y Peso del cigarrillo.
Tarea. Hacer un estudio descriptivo de las variables que intervienen en el estudio.
La realizacin de esta tarea ir en un documento a parte que tendrs que subir en el
apartado "Fichero opcional" que se encuentra al final de la actividad p2p. Este
documento tendr 3 partes:
PARTE 1: Genere un breve informe estadstico descriptivo, a partir de la salida de
ordenador que se adjunta (tmese el espacio que necesite pero sea breve), en el que
seale:
1)
2)
3)
4)

El tamao muestral,
Cul es la variable con mayor variabilidad,
Cul de las medias es ms representativa de los datos y
Cul de las medias es ms estable.

La muestra se compone de 25 tabacos al azar, en los cuales independientemente de la


marca se analizan las concentraciones de alquitrn (11.81605.87634), nicotina
(0.876000.354201), el peso (0.9702840.0877215) y el monxido de carbono
(12.52804.73968) emitido.
Como se puede observar a partir de los resultados del error tpico, la variable con ms
variabilidad ser el contenido de alquitrn en el tabaco. La varianza y la desviacin
tpica nos informan la naturaleza de los datos de la muestra de ah que la media ms
representativa de los datos y la media ms estable es, como debera, el peso de cada
tabaco, debido a que la variable tiene tanto la varianza como la desviacin tpica ms
bajas respectivamente.
PARTE 2. Analice los percentiles a partir de la tabla correspondiente que aparece
debajo. Escriba un breve informe con los resultados ms relevantes entre los que al
menos debe estar la Mediana y el Recorrido intercuartlico (debe calcularlo a partir de la
tabla) para todas y cada una de las variables. En el informe compare, adems, los
resultados obtenidos con la Media y su dispersin y la Mediana y su dispersin.

La muestra nos indica que el monxido de carbono tiene una mediana de 13.0000
(RI=5.9), el contenido de alquitrn 12.4000 (RI=7.25), el contenido de nicotina 0.9000
(RI= 0.35) y el peso 0.9573 (RI=0.0963). Estos resultados nos indican conjuntamente
con los datos percentlicos, que para el caso del monxido de carbono la distribucin es
acumulada alrededor de la mediana, a pesar de que el cambio de percentil a percentil es
variable, el recorrido se encuentra en aproximadamente 20 unidades, el rango
intercualtlico se encuentra en 5.9, es decir el 50% de los datos se encuentran alrededor
de la mediana, con un sesgo de 5.9 unidades, por ello la mediana no debe variar mucho
con respecto a la media, y en este caso se encuentra en 12.528. Lo que sucede para el
caso del monxido tambin se repite en el caso del alquitrn, la distribucin se
concentra alrededor de la mediana, y tenemos valores parecidos para la mediana (12.4)
y la media (11.816). Se puede aplicar el mismo razonamiento en el caso de la nicotina,
su rango est en el orden de 1.5 aproximadamente y si RI en 0.35, lo que produce
valores parecidos entre la media (0.876) y la mediana (0.9). Para el caso del peso, el
rango de todos los datos est en el orden de 0.4 aproximadamente y su RI es de 0.0963,
lo cual hace que la muestra sea mucho ms concentrada, con medidas de tendencia
central casi idnticas, la mediana de 0.9573 y la media de 0.97.
PARTE 3. Analice los Box plot (diagramas de caja) que se adjuntan y saque las
conclusiones ms relevantes. Debe escribir, al menos, sobre la posible asimetra y la
existencia, o no, de outliers

Los grficos anteriores nos proporcionan informacin ms detallada acerca de la


naturaleza de la distribucin de la muestra, para el caso del monxido, se observan
valores aberrantes, que estn muy por debajo de lo esperado, sin tomarlo en cuenta se
observa que la mediana est casi en la mitad de la distribucin, sin embargo tienen una
variacin de la distribucin ideal, no tiene una perfecta simetra. En el caso del alquitrn
se presentan valores muy por encima de lo esperado, en este caso se observa mucha ms
asimetra, en los bigotes como en el los alrededores de la mediana. Para el caso de la
nicotina la distribucin es mucho ms simtrica en los bigotes como en la tendencia
central, siempre y cuando se desconsideren sus dos valores extremos aberrantes. Para el
caso el peso, se presentan de igual forma dos valores aberrantes que afectan a la
distribucin, en este caso se nota mucha ms asimetra que para la nicotina.

También podría gustarte