Está en la página 1de 10

Examen Práctico

Estadística Descriptiva
Instrucciones: se trabajará con el programa Statdisk o Excel, según sea el caso. Realiza en el programa
las gráficas y cálculos necesarios y pégalos en este mismo archivo justo debajo de la pregunta
correspondiente. Responde o discute en el espacio correspondiente y marca las respuestas en color rojo.

1. Abre el programa Statdisk. Se trabajará con los datos de pulso (PULSE) de ratas masculinas y
femeninas, las cuales podrás encontrar en Data Sets/Elementary Statistics 12th edition/ 1a Body
Measurements Female y 2a Body Measurements Male.

Pulse
Fem.
56
60
62
62
64
64
66
68
68
72
72
72
72
72
72
72
74
74
76
76
78
78
78
78

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


78
78
78
80
82
82
82
88
90
90
90
96
98
98
100
104

a. Elabora un histograma con los datos de pulso de las hembras. El histograma parece describir una
distribución normal ¿por qué sí o por qué no?

Sí es una distribución normal porque se puede observar que en el histograma está una curva
simétrica la que se forma, es decir que se forma una campana.

2. Distribución de Frecuencias. Se muestra a continuación un histograma que representa la duración de


vuelos espaciales de la NASA (en horas). Use el histograma presentado para construir una distribución
de frecuencias que contenga: las clases o categorías, frecuencia absoluta, frecuencia relativa
porcentual, y frecuencia absoluta acumulativa.

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


Clase Frecuencia absoluta Frecuencia Relativa Porcentual Frecuencia Absoluta Acumulativa
[0-100) 9 7.826086957 9
[100-200) 41 35.65217391 50
[200-300) 44 38.26086957 94
[300-400) 19 16.52173913 113
[400-500) 2 1.739130435 115
Total= 115 100

3. Abre los datos de las estadísticas de 50 terremotos en Data Sets/Elementary Statistics 12th edition/
16. Earthquake Measurements.
a. Haz un histograma con los datos de la variable Magnitud (MAG). Ahora cambia el valor del
primer dato de magnitud de 0.70 a 7.0 y de nuevo realiza un histograma. Compara ambos
histogramas y discute cómo afecta la presencia de un dato extremo (outlier). ¿Consideras que
el outlier enmascara la verdadera distribución de los datos?

Sí en mascaró los datos del histograma verdadero, es decir que un valor que está lejos de otras
observaciones. Se observa que en el histograma uno los datos comienzan antes del cero y terminan un
poco después del tres, en cambio en el segundo los datos comienzan a partir del 0 y terminan más de la
mitad del 3. Y entre más esté la clase con un dato alto el error será más visto.

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


b. Con base en el histograma que realizaste SIN el outlier, describe la distribución y menciona cómo
te parece su sesgo y curtosis (a simple vista).

El sesgo del histograma sin el outlier es negativo (menor a 1) porque va a la izquierda, es decir que la
mayoría de los datos están separados de la media a la derecha y la curtósis es leptocúrtica porque es
mayor a 0.

c. Ahora calcula los valores de sesgo y curtosis usando las funciones de Excel e interprétalos.

Sesgo 0.640860101
Curtosis 0.822486672

Se observa que el sesgo va a la izquierda y es negativo, es decir que es menor a 1 y la cúrtosis es


leptocúrtica porque es mayor a 0 en forma acampanada.

d. ¿Coincidió tu apreciación visual, con la información proporcionada por los coeficientes?

Sí coincidió con lo que había puesto en el inciso b, se notaba a simple vista lo que ocurría.

e. Repite los incisos anteriores (b, c y d), pero usando la variable profundidad (DEPTH).

b) Con base en el histograma que realizaste SIN el outlier, describe la distribución y menciona cómo te
parece su sesgo y curtosis (a simple vista).

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


No tiene sesgo porque aparenta ser símetrico, es decir que es igual a 1 y la cúrtosis es igual a 0 y esto
con lleva a que sea una curva mesocúrtica porque hay igualdad de lado izquierdo y derecho.

c) Ahora calcula los valores de sesgo y curtosis usando las funciones de Excel e interprétalos.

Sesgo 0.365509
Cúrtosis -1.22404

A partir de estos datos se nota que el sesgo es menor a 1 y esto con lleva que la cola está más larga a la
izquierda y la cúrtosis es menor a 0, es decir que tiene una curva platicúrtica ligera y achatada.

d. ¿Coincidió tu apreciación visual, con la información proporcionada por los coeficientes?

Está no coincidió con lo que había puesto a simple vista en el inciso b.

f. Usa las funciones de Excel para calcular el P30, D60 y el Q3. Interpreta estas medidas
de posición.

MAG DEPTH
P30 0.837 5.97
D6 1.296 9.94
Q3 1.455 14.65

En el percentil 30 dice que es una medida de posición no central entonces el 0.0837 y el 5.97 son valores
que se encuentran posicionados al total de muestra.

El decil 6 significa que los datos están en el número 6 del 10 ( 100%) y el cuartil 3 es el 75% del 100%.

g. Un terremoto con una magnitud de 2.00, ¿en qué percentil se ubicaría?

𝑁ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑛𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑥


. 100%
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
46
. 100% = 𝟗𝟐
50
Se ubicará en el P 92

h. Un terremoto con una profundidad de 12, ¿en qué percentil se ubicaría?


𝑁ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑛𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑥
. 100%
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
32
. 100% = 64
50
Se ubicará en el P64

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


4. Comparación de las alturas de hombre y mujeres. A continuación, se proporciona una lista con las
alturas de hombre y mujeres (en cm).

Hombres 178.8 177.5 187.8 172.4 181.7 169.0


Mujeres 163.7 165.5 163.1 166.3 163.6 170.9

a. Encuentra las principales características de las alturas de los hombres.

Centro

Media:____177.8667_____

∑ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑥=
𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

Hombres 169 172.4 177.5 178.8 181.7 187.8

169 + 172.4 + 177.5 + 178.8 + 181.7 + 187.8


𝑥=
6

𝒙 = 𝟏𝟕𝟕. 𝟖𝟔𝟔𝟕

Mediana: ___178.15______
177.5+178.8
Mediana= 2
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝟏𝟕𝟖. 𝟏𝟓

Variación

Desv.est:_6.6764______

Desviación estándar
n= 6
(169-177.86)^2 -8.866666667 78.61778
(172.4-177.86) ^2 -5.466666667 29.88444
(177.5-177.86) ^2 -0.366666667 0.134444
(178.8-177.86) ^2 0.933333333 0.871111
(181.7-177.86) ^2 3.833333333 14.69444
(187.8-177.86) ^2 9.933333333 98.67111
Suma= 222.8733

(222.8733)
𝑠= √ 𝑠 = √44.57466 𝒔 = 𝟔. 𝟔𝟕𝟔𝟒
6−1

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


Rango: ___18.8______

Rango= 187.8 − 169.0


Rango = 18.8

Resumen de los 5 números

Min: _169____

Q1: __172.4__

Q2: _178.15___

Q3:_181.7____

Max: _187.8____

Outliers: ___9.3__

Q3 Q1 181.7-172.4
181.7 172.4 9.3

b. Encuentra las principales características de las alturas de las mujeres.

Centro

Media:_165.5167________
∑ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑥=
𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

Mujeres 163.1 163.6 163.7 165.5 166.3 170.9

163.1 + 163.6 + 163.7 + 165.5 + 166.3 + 170.9


𝑥=
6
X= 165.5167

Mediana: ___164.6______

163.7 + 165.5
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =
2
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝟏𝟔𝟒, 𝟔

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


Variación

Desv.est:___2.91232____

Desviación estándar
n=6
(163.1-165.5176)^2 5.840439
(42.40833)
(163.6-165.5167)^2 3.673739 𝑠= √
6−1
(163.7-165.5167^2 3.300399
(165.5-165.5167)^2 0.000279
(166.3-165.5167)^2 0.613559
(170.9-165.5167)^2 28.97992 𝑠 = √8.48166
Suma= 42.40833

𝒔 = 𝟐. 𝟗𝟏𝟐𝟑𝟐

Rango: ____7.8_____

Rango= 170.9 − 163.1


Rango = 7.8

Resumen de los 5 números

Min: __163.1___

Q1: _163.6___

Q2: _164.6___

Q3:__166.3___

Max: ___170.9__

Outliers: _2.7____

Q3 Q1 166.3-163.6
166.3 163.6 2.7

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


c. Compara los resultados de hombre y mujeres.

Se notó que los hombres tienen mayormente la cantidad más alta en los distintos aspectos (como por
ejemplo la media, la mediana, la desviación estándar, etc.) Es decir que en los hombres son más alto que
las mujeres.

5. Use los mismos datos de estaturas de los hombres proporcionados en el problema anterior, pero
cambie el primer dato de 178.8 a 1788 cm (este es un tipo de error común cuando se capturan los
datos y no se presiona la tecla de punto con la suficiente fuerza). El dato de 1788 es claramente un
error, pues no existen hombres de esa altura, pero es un ejemplo de lo que puede ocurrir. Otras veces
los outliers son datos reales pero muy diferentes de los demás…

Hombres 1788177.5 187.8 172.4 181.7 169.0


Mujeres 163.7
165.5 163.1 166.3 163.6 170.9
∑ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
𝑥=
𝑁° 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
a. Con los datos modificados encuentre:

Centro

Media:___446.0666______

Hombres 169.0 172.4 177.5 181.7 187.8 1788

169.0 + 172.4 + 177.5 + 181.7 + 187.8 + 1788


𝑥=
6
X= 446.0666

Mediana: ___179.6______

177.5 + 181.7
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =
2
Mediana= 179.6

Variación

Desv.est:__ 𝟔𝟕𝟓. 𝟕𝟕𝟕𝟎 _____

Desviación estándar
n= 6
(169.0-446.066) -446.0666 198975.4
(172.4-446.066) -273.6666 74893.41
(177.5-446.066) -268.5666 72128.02
(181.7-446.066) -264.3666 69889.7
(187.8-446.066) -258.2666 66701.64
(1788-446.066) 1341.9334 1800785

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística


Suma= 2283373

(2283373
𝑠= √ 6−1
𝑠 = 456674.6 𝒔 = 𝟔𝟕𝟓. 𝟕𝟕𝟕𝟎

Rango: ____1619_____

Rango= 1788 − 169


Rango = 1619

Resumen de los 5 números

Min: __169___

Q1: __173.4675__

Q2: _179.6___

Q3:__186.275___

Max: __1788___

Outliers: _12.808____

186.275- b. En comparación con los datos sin el outlier,


Q3 Q1 173.467 ¿cómo se ve afectada la media con el outlier?
186.275 173.467 12.808
Se ve afectada la media a comparación de los incisos
anteriores en donde no había error, ya que al tener ese error puede tener un efecto enorme sobre la
media.

c. ¿Cómo se ve afectada la mediana con el outlier?

En este caso la mediana se ve menos afectada por el outlier a comparación de la media. No varía mucho
los datos.

d. ¿Cómo se ve afectada la desviación estándar con el outlier?

Se ve muy afectada la desviación estándar porque el inciso que tiene el error de outlier tiene el dato más
alto que los sin outlier.

MICHEL ALBERTO BACAB HEREDIA | Probabilidad y estadística

También podría gustarte