Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica 2
Estadistica 2
09 JULIO 2018
SANTANDER
PARTE 1
Tamaño de muestra
𝑋𝑚𝑖𝑛 = 0
𝑋𝑚á𝑥 = 101
Para este ejercicio se asumirán 10 número de clases. Por lo tanto, la amplitud del intervalo será:
101
𝐴= = 10,1 ≈ 10
10
De manera que 𝑘 = 10 serán el número de intervalos cada uno con una amplitud de 10.
Tabla de frecuencia
Clases 𝒙𝒊 𝒏𝒊 𝑵 𝒇𝒓 𝑭
[0 10) 5 10012 10012 16.59% 16.59%
[10 20) 15 11473 21485 19.01% 35.60%
[20 30) 25 10513 31998 17.42% 53.02%
[30 40) 35 8158 40156 13.52% 66.53%
[40 50) 45 7853 48009 13.01% 79.54%
[50 60) 55 5875 53884 9.73% 89.28%
[60 70) 65 3476 57360 5.76% 95.04%
[70 80) 75 2070 59430 3.43% 98.47%
[80 90) 85 795 60225 1.32% 99.78%
[90 101] 95 131 60356 0.22% 100%
Total 60356 100%
Histograma
DISTRIBUCIÓN DE LA VARIABLE EDAD
14000
12000 11473
10513
10012
10000
8158 7853
Frecuencias
8000
5875
6000
4000 3476
2070
2000
795
131
0
[0-10) [10-20) [20-30) [30-40) [40-50) [50-60) [60-70) [70-80) [80-90) [90-101]
Variable edad (P6040) (Marcas de clase)
Columna1
Media 30.9722314
Error típico 0.08448235
Mediana 28
Moda 11
Desviación estándar 20.7551671
Varianza de la muestra 430.776961
Curtosis -0.49818654
Coeficiente de asimetría 0.53875778
Rango 101
Mínimo 0
Máximo 101
Suma 1869360
Cuenta 60356
La curtosis de los datos es de −0.49818654 < 0, la distribución se llama platicúrtica la cual indica que hay
una menor concentración de datos entorno a la media y es evidente en el gráfico del histograma ya que la
agrupación de las frecuencias de la variable edad se concentra en mayor cantidad como una edad menor a los
30 años.
Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto
que no supere 5%=0.05.
A partir del análisis de datos de Excel se obtienen los siguientes datos para la nueva variable:
Columna1
Media 9.28791584
Error típico 0.01860084
Mediana 9.22087258
Moda 4.94608744
Desviación estándar 4.56975461
Varianza de la muestra 20.8826572
Curtosis -0.76268561
Coeficiente de asimetría 0.07297858
Rango 21.6877376
Mínimo 0
Máximo 21.6877376
Suma 560581.449
Cuenta 60356
Donde:
𝑆 = 4.56975461
𝛿 = 0,05
Como el grado de confiabilidad (1– 𝛼) = 0,95 entonces en la distribución normal el valor de 𝑍 = 1,96.
Luego,
𝑍 2 𝑆 2 1,962 ∗ 4.569754612
𝑛0 = = = 32089,12635 ≈ 32089
𝛿2 0,052
Por lo tanto
𝑛0 32089
𝑛= 𝑛0 = ≈ 20950
1+ 32089
𝑁 1 +
60356
El tamaño de la muestra utilizada con un nivel de confianza del 95% y un error máximo del 5% es de
aproximadamente 20950.