Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Examen Practico 2017a
Examen Practico 2017a
Estadística Descriptiva
Instrucciones: se trabajará con el programa Statdisk o Excel, según sea el caso. Realiza en el programa
las gráficas y cálculos necesarios y pégalos en este mismo archivo justo debajo de la pregunta
correspondiente. Responde o discute en el espacio correspondiente y marca las respuestas en color rojo.
1. Abre el programa Statdisk. Se trabajará con los datos de pulso (PULSE) de ratas masculinas y
femeninas, las cuales podrás encontrar en Data Sets/Elementary Statistics 12th edition/ 1a Body
Measurements Female y 2a Body Measurements Male.
Pulse
Fem.
56
60
62
62
64
64
66
68
68
72
72
72
72
72
72
72
74
74
76
76
78
78
78
78
a. Elabora un histograma con los datos de pulso de las hembras. El histograma parece describir una
distribución normal ¿por qué sí o por qué no?
Sí es una distribución normal porque se puede observar que en el histograma está una curva
simétrica la que se forma, es decir que se forma una campana.
3. Abre los datos de las estadísticas de 50 terremotos en Data Sets/Elementary Statistics 12th edition/
16. Earthquake Measurements.
a. Haz un histograma con los datos de la variable Magnitud (MAG). Ahora cambia el valor del
primer dato de magnitud de 0.70 a 7.0 y de nuevo realiza un histograma. Compara ambos
histogramas y discute cómo afecta la presencia de un dato extremo (outlier). ¿Consideras que
el outlier enmascara la verdadera distribución de los datos?
Sí en mascaró los datos del histograma verdadero, es decir que un valor que está lejos de otras
observaciones. Se observa que en el histograma uno los datos comienzan antes del cero y terminan un
poco después del tres, en cambio en el segundo los datos comienzan a partir del 0 y terminan más de la
mitad del 3. Y entre más esté la clase con un dato alto el error será más visto.
El sesgo del histograma sin el outlier es negativo (menor a 1) porque va a la izquierda, es decir que la
mayoría de los datos están separados de la media a la derecha y la curtósis es leptocúrtica porque es
mayor a 0.
c. Ahora calcula los valores de sesgo y curtosis usando las funciones de Excel e interprétalos.
Sesgo 0.640860101
Curtosis 0.822486672
Sí coincidió con lo que había puesto en el inciso b, se notaba a simple vista lo que ocurría.
e. Repite los incisos anteriores (b, c y d), pero usando la variable profundidad (DEPTH).
b) Con base en el histograma que realizaste SIN el outlier, describe la distribución y menciona cómo te
parece su sesgo y curtosis (a simple vista).
c) Ahora calcula los valores de sesgo y curtosis usando las funciones de Excel e interprétalos.
Sesgo 0.365509
Cúrtosis -1.22404
A partir de estos datos se nota que el sesgo es menor a 1 y esto con lleva que la cola está más larga a la
izquierda y la cúrtosis es menor a 0, es decir que tiene una curva platicúrtica ligera y achatada.
f. Usa las funciones de Excel para calcular el P30, D60 y el Q3. Interpreta estas medidas
de posición.
MAG DEPTH
P30 0.837 5.97
D6 1.296 9.94
Q3 1.455 14.65
En el percentil 30 dice que es una medida de posición no central entonces el 0.0837 y el 5.97 son valores
que se encuentran posicionados al total de muestra.
El decil 6 significa que los datos están en el número 6 del 10 ( 100%) y el cuartil 3 es el 75% del 100%.
Centro
Media:____177.8667_____
∑ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑥=
𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝒙 = 𝟏𝟕𝟕. 𝟖𝟔𝟔𝟕
Mediana: ___178.15______
177.5+178.8
Mediana= 2
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝟏𝟕𝟖. 𝟏𝟓
Variación
Desv.est:_6.6764______
Desviación estándar
n= 6
(169-177.86)^2 -8.866666667 78.61778
(172.4-177.86) ^2 -5.466666667 29.88444
(177.5-177.86) ^2 -0.366666667 0.134444
(178.8-177.86) ^2 0.933333333 0.871111
(181.7-177.86) ^2 3.833333333 14.69444
(187.8-177.86) ^2 9.933333333 98.67111
Suma= 222.8733
(222.8733)
𝑠= √ 𝑠 = √44.57466 𝒔 = 𝟔. 𝟔𝟕𝟔𝟒
6−1
Min: _169____
Q1: __172.4__
Q2: _178.15___
Q3:_181.7____
Max: _187.8____
Outliers: ___9.3__
Q3 Q1 181.7-172.4
181.7 172.4 9.3
Centro
Media:_165.5167________
∑ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑥=
𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
Mediana: ___164.6______
163.7 + 165.5
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =
2
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝟏𝟔𝟒, 𝟔
Desv.est:___2.91232____
Desviación estándar
n=6
(163.1-165.5176)^2 5.840439
(42.40833)
(163.6-165.5167)^2 3.673739 𝑠= √
6−1
(163.7-165.5167^2 3.300399
(165.5-165.5167)^2 0.000279
(166.3-165.5167)^2 0.613559
(170.9-165.5167)^2 28.97992 𝑠 = √8.48166
Suma= 42.40833
𝒔 = 𝟐. 𝟗𝟏𝟐𝟑𝟐
Rango: ____7.8_____
Min: __163.1___
Q1: _163.6___
Q2: _164.6___
Q3:__166.3___
Max: ___170.9__
Outliers: _2.7____
Q3 Q1 166.3-163.6
166.3 163.6 2.7
Se notó que los hombres tienen mayormente la cantidad más alta en los distintos aspectos (como por
ejemplo la media, la mediana, la desviación estándar, etc.) Es decir que en los hombres son más alto que
las mujeres.
5. Use los mismos datos de estaturas de los hombres proporcionados en el problema anterior, pero
cambie el primer dato de 178.8 a 1788 cm (este es un tipo de error común cuando se capturan los
datos y no se presiona la tecla de punto con la suficiente fuerza). El dato de 1788 es claramente un
error, pues no existen hombres de esa altura, pero es un ejemplo de lo que puede ocurrir. Otras veces
los outliers son datos reales pero muy diferentes de los demás…
Centro
Media:___446.0666______
Mediana: ___179.6______
177.5 + 181.7
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =
2
Mediana= 179.6
Variación
Desviación estándar
n= 6
(169.0-446.066) -446.0666 198975.4
(172.4-446.066) -273.6666 74893.41
(177.5-446.066) -268.5666 72128.02
(181.7-446.066) -264.3666 69889.7
(187.8-446.066) -258.2666 66701.64
(1788-446.066) 1341.9334 1800785
(2283373
𝑠= √ 6−1
𝑠 = 456674.6 𝒔 = 𝟔𝟕𝟓. 𝟕𝟕𝟕𝟎
Rango: ____1619_____
Min: __169___
Q1: __173.4675__
Q2: _179.6___
Q3:__186.275___
Max: __1788___
Outliers: _12.808____
En este caso la mediana se ve menos afectada por el outlier a comparación de la media. No varía mucho
los datos.
Se ve muy afectada la desviación estándar porque el inciso que tiene el error de outlier tiene el dato más
alto que los sin outlier.