Está en la página 1de 5

Prueba 1 Estadística I (P1)

1. La siguiente lista son las temperaturas, en grados celsius (°C), de un grupo de 20 ciudades de Chile
durante un día de enero.

23, 27, 19, 28, 24, 26, 27, 24, 18, 23, 15, 24, 23, 22, 24, 29, 16, 24, 22, 25

a) (6 puntos) Identifique si se trata de una población o una muestra (indique de qué tipo es) e
identifique la variable estadística (indique el tipo de variable).

R: La población es finita y corresponde a un grupo de 20 ciudades de Chile. La variable es

𝑥 = "𝑡𝑒𝑚𝑝𝑒𝑟𝑎𝑡𝑢𝑟𝑎 𝑒𝑛 𝑔𝑟𝑎𝑑𝑜𝑠 𝑐𝑒𝑙𝑠𝑖𝑢𝑠"

y esta variable es cuantitativa y además continua (la temperatura se mide y no se cuenta).

b) (7 puntos) Construya una tabla de frecuencias para estos datos (justifique su construcción) y
grafique el histograma de la frecuencia relativa. Indique una característica de este tipo de histograma.

R: Agrupamos los datos porque la variable es continua.

Construyamos la tabla de frecuencias

1. ¿Cuántos intervalos?

𝑁 = 20 = 4. 47

Aproximamos hacia arriba y tomamos 𝑘 = 5.

2. ¿De qué tamaño son los intervalos?

𝑥𝑚𝑎𝑥−𝑥𝑚𝑖𝑛 29−15
𝑘
= 5
= 2. 8

Este número siempre debe ser aproximado hacia arriba para incluir a todos los datos.

∆=3

3. ¿Cuáles son los intervalos?

𝑎1 = 14. 5
𝑎2 = 17. 5
𝑎3 = 20. 5
𝑎4 = 23. 5
𝑎5 = 26. 5
𝑎6 = 29. 5

𝐼1 = [𝑎1, 𝑎2) = [14. 5, 17. 5)


𝐼2 = [𝑎2, 𝑎3) = [17. 5, 20. 5)
𝐼3 = [𝑎3, 𝑎4) = [20. 5, 23. 5)
𝐼4 = [𝑎4, 𝑎5) = [23. 5, 26. 5)
𝐼5 = [𝑎5, 𝑎6] = [26. 5, 29. 5]

Estos intervalos cumplen dos requisitos:

1. Los intervalos propuestos incluyen todos los datos.


2. Ninguno de los extremos de los intervalos coincide con los datos porque los datos no tienen decimales pero
los extremos de los intervalos si tienen decimales.

𝑎𝑖 − 𝑎𝑖+1 𝑐𝑖 𝑛𝑖 𝑁𝑖 𝑓𝑖 𝐹𝑖

[14. 5, 17. 5) 16 2 2 2/20=0.1 0.1

[17. 5, 20. 5) 19 2 4 2/20=0.1 0.2

[20. 5, 23. 5) 22 5 9 5/20=0.25 0.45

[23. 5, 26. 5) 25 7 16 7/20=0.35 0.8

[26. 5, 29. 5] 28 4 20 4/20=0.2 1

c) (7 puntos) Calcule las medidas de tendencia central utilizando la tabla obtenida en b). Si calculamos
las medidas de tendencia central de los datos sin agrupar ¿coinciden las medidas de tendencia
central con las calculadas mediante la tabla? Justifique su respuesta.

Media

𝑥1*𝑐1+𝑥2*𝑐2+...+𝑥5*𝑐5 16*2+19*2+22*5+25*7+28*4
𝑥= 20
= 20
= 23. 35

Mediana

Moda

La frecuencia absoluta es máxima para el intervalo [𝑎4, 𝑎5) = [23. 5, 26. 5) y esta es 𝑛4 = 7. Por lo tanto, la la
moda pertenece al intervalo [23. 5, 26. 5):

𝑎𝑗 = 23. 5
𝑎𝑗+1 = 26. 5
δ1 = 𝑛𝑗 − 𝑛𝑗−1 = 7 − 5 = 2
δ2 = 𝑛𝑗 − 𝑛𝑗+1 = 7 − 4 = 3

δ1 2
𝑀𝑜 = 𝑎𝑗 + δ1+δ2
· (𝑎𝑗+1 − 𝑎𝑗) = 23. 5 + 5
* 3 = 24. 7
2. El número de personas empleadas por familia en cierto barrio está dada por la siguiente tabla de
frecuencias

𝑥𝑖 𝑓𝑖

0 0.1

1 0.4

2 0.3

3 0.2

a) (7 puntos) Calcule las medidas de variación e interprételas. ¿El barrio es homogéneo o heterogéneo
en relación al número de personas empleadas por familia? Justifique.

R: En primer lugar calculamos la media

𝑥 = 𝑥1 * 𝑓1 + 𝑥2 * 𝑓2 + 𝑥3 * 𝑓3 + 𝑥4 * 𝑓4 = 0 * 0. 1 + 1 * 0. 4 + 2 * 0. 3 + 3 * 0. 2 = 1. 6

Ahora calculamos la varianza poblacional:

2 2 2 2 2
𝑠 = (𝑥1 − 𝑥) * 𝑓1 + (𝑥2 − 𝑥) * 𝑓2 + (𝑥3 − 𝑥) * 𝑓3 + (𝑥4 − 𝑥) * 𝑓4
2 2 2 2 2
𝑠 = (0 − 1. 6) * 0. 1 + (1 − 1. 6) * 0. 4 + (2 − 1. 6) * 0. 3 + (3 − 1. 6) * 0. 2 = 0. 84

y 𝑠 ≈ 0. 917.

Por lo tanto,

𝑠
𝐶𝑉 = = 0. 917/1. 6 = 0. 57,
|𝑥|

o sea, la variación es del 57%. La desviación estándar es casi el 60% del promedio por lo que podríamos
decir que el barrio es heterogéneo en relación al número de personas empleadas por familia.

b) (7 puntos) Calcule los coeficientes de asimetría de Fisher y de Pearson ¿Qué podría decir acerca de
la asimetría de los datos?

R: Calculamos el momento de orden 3:

3 3 3 3
𝑚3 = (𝑥1 − 𝑥) * 𝑓1 + (𝑥2 − 𝑥) * 𝑓2 + (𝑥3 − 𝑥) * 𝑓3 + (𝑥4 − 𝑥) * 𝑓4
3 3 3 3
𝑚3 = (0 − 1. 6) * 0. 1 + (1 − 1. 6) * 0. 4 + (2 − 1. 6) * 0. 3 + (3 − 1. 6) * 0. 2 = 0. 072

Por lo tanto,

𝑚3 0.072
𝑔1 = 3 = 3 = 0. 093 > 0
𝑠 0.917

Por otra parte


𝑥−𝑀𝑜 1.6−1
𝐴𝑃 = 𝑠
= 0.917
= 0. 65 > 0

Tanto 𝑔1 como 𝐴𝑃 son positivos. Los datos presentan simetría hacia la derecha.

c) (6 puntos) Suponga que el número de familias en el barrio es 𝑁 = 30. Complete la tabla de


frecuencias con la frecuencia absoluta, la frecuencia absoluta acumulada y la frecuencia relativa
acumulada.

𝑥𝑖 𝑛𝑖 𝑁𝑖 𝑓𝑖 𝐹𝑖

0 0.1*30=3 3 0.1 0.1

1 0.4*30=12 15 0.4 0.5

2 0.3*30=9 24 0.3 0.8

3 0.2*30=6 30 0.2 1

Recordemos que

𝑛𝑖
𝑓𝑖 = 𝑁

Por lo tanto,

𝑛𝑖 = 𝑓𝑖 * 𝑁

3. Responda verdadero o falso. Justifique solo las falsas.

a) F Considere los siguientes datos: 5,6,7,7,7,8,8,8,8,8,8,8,8,8,8,9,9,10,10,11. Los datos son platicúrticos.


Justificación. Calculemos la curtosis

1. Calcular el promedio (𝑥).

5*1+6*1+7*3+8*10+9*2+10*2+11*1
𝑥= 20
= 8. 05

2. Calcular la desviación estándar (𝑠).

2 2
2 (𝑥1−𝑥) *𝑛1+...+(𝑥7−𝑥) *𝑛7 2 2 2 2 2 2 2
(5−8.05) *1+(6−8.05) *1+(7−8.05) *3+(8−8.05) *10+(9−8.05) *2+(10−8.05) *2+(11−8.05) *1
𝑠 = 𝑁
= 20
= 1. 75

𝑠 = 1. 75 = 1. 32

3. Calcular el momento de orden 4 (𝑚4).

4 4
(𝑥1−𝑥) *𝑛1+...+(𝑥7−𝑥) *𝑛7 4 4 4 4 4 4
(5−8.05) *1+(6−8.05) *1+(7−8.05) *3+(8−8.05) *10+(9−8.05) *2+(10−8.05) *2+(11−8.05) *1
4
𝑚4 = 𝑁
= 20
= 10. 71

4. Calculamos la curtosis (𝑔2).


𝑚4 10.71
𝑔2 = 4 = 4 = 3. 53 > 3
𝑠 1.32

Por lo tanto, los datos probablemente son leptocúrticos.

Se observa que el histograma es “puntiagudo” o sea es leptocúrtico.

b) V Si los datos son simétricos entonces coinciden las medidas de tendencia central.

c) F La mediana siempre corresponde al valor por debajo del cual se encuentra el 50% de los datos y por
sobre el cual se encuentra el 50% de los datos.

Justificación: La mediana siempre corresponde al valor por debajo del cual se encuentra al menos el 50% de
los datos y por sobre el cual se encuentra al menos 50% de los datos.

d) F Considere los siguientes datos: 1,1,2,2,2,2,3,3,3,4,4,4,5,5,6,7. Los datos presentan asimetría hacia la
izquierda o negativa.

Justificación: …

También podría gustarte