Está en la página 1de 5

ESTADISTICA II

MILDREY SLENDY ALFONSO ARDILA

09 JULIO 2018

POLITECNICO GRAN COLOMBIANO

SANTANDER
PARTE 1

Tamaño de muestra

Utilizando la variable edad (P6040), realice lo siguiente:

a. Realice un histograma y describa la información según la forma y la curtosis de los datos.

De acuerdo a la variable edad, se obtienen los siguientes datos:

𝑋𝑚𝑖𝑛 = 0

𝑋𝑚á𝑥 = 101

𝑅𝑎𝑛𝑔𝑜 = 101 − 0 = 101

Para este ejercicio se asumirán 10 número de clases. Por lo tanto, la amplitud del intervalo será:

101
𝐴= = 10,1 ≈ 10
10

De manera que 𝑘 = 10 serán el número de intervalos cada uno con una amplitud de 10.

Determinando la tabla de frecuencia para datos agrupados se obtiene:

Tabla de frecuencia

Clases 𝒙𝒊 𝒏𝒊 𝑵 𝒇𝒓 𝑭
[0 10) 5 10012 10012 16.59% 16.59%
[10 20) 15 11473 21485 19.01% 35.60%
[20 30) 25 10513 31998 17.42% 53.02%
[30 40) 35 8158 40156 13.52% 66.53%
[40 50) 45 7853 48009 13.01% 79.54%
[50 60) 55 5875 53884 9.73% 89.28%
[60 70) 65 3476 57360 5.76% 95.04%
[70 80) 75 2070 59430 3.43% 98.47%
[80 90) 85 795 60225 1.32% 99.78%
[90 101] 95 131 60356 0.22% 100%
Total 60356 100%

Histograma
DISTRIBUCIÓN DE LA VARIABLE EDAD
14000

12000 11473
10513
10012
10000
8158 7853
Frecuencias

8000

5875
6000

4000 3476

2070
2000
795
131
0
[0-10) [10-20) [20-30) [30-40) [40-50) [50-60) [60-70) [70-80) [80-90) [90-101]
Variable edad (P6040) (Marcas de clase)

Análisis de datos Excell

Columna1
Media 30.9722314
Error típico 0.08448235
Mediana 28
Moda 11
Desviación estándar 20.7551671
Varianza de la muestra 430.776961
Curtosis -0.49818654
Coeficiente de asimetría 0.53875778
Rango 101
Mínimo 0
Máximo 101
Suma 1869360
Cuenta 60356

La curtosis de los datos es de −0.49818654 < 0, la distribución se llama platicúrtica la cual indica que hay
una menor concentración de datos entorno a la media y es evidente en el gráfico del histograma ya que la
agrupación de las frecuencias de la variable edad se concentra en mayor cantidad como una edad menor a los
30 años.

b. Realice una descripción numérica y descripción como es la población.


Realizando un análisis descriptivo de los datos de la población, se evidencia que la tasa de edad de las personas
menores de 30 años supera la mitad de la población con un 53,02%. Si observamos las personas entre 30 y
40 años, alcanzan el 26,53% un poco más de un cuarto de la población y, entre 50 y 70 años, casi el 16%.
Finalmente, las personas más longevas las cuales se consideran son las mayores de 70 años representan solo
el 4,96%, una minoría con respecto al total de la población.

c. Calcule una nueva variable que sea el


Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente fórmula:

Donde, se tiene lo siguiente:

𝑍: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.

𝑆: Es la desviación estándar de la variable.

𝛿: Es el margen de error absoluto.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto
que no supere 5%=0.05.

A partir del análisis de datos de Excel se obtienen los siguientes datos para la nueva variable:

Columna1
Media 9.28791584
Error típico 0.01860084
Mediana 9.22087258
Moda 4.94608744
Desviación estándar 4.56975461
Varianza de la muestra 20.8826572
Curtosis -0.76268561
Coeficiente de asimetría 0.07297858
Rango 21.6877376
Mínimo 0
Máximo 21.6877376
Suma 560581.449
Cuenta 60356

Donde:
𝑆 = 4.56975461
𝛿 = 0,05

Como el grado de confiabilidad (1– 𝛼) = 0,95 entonces en la distribución normal el valor de 𝑍 = 1,96.

Luego,

𝑍 2 𝑆 2 1,962 ∗ 4.569754612
𝑛0 = = = 32089,12635 ≈ 32089
𝛿2 0,052

Por lo tanto

𝑛0 32089
𝑛= 𝑛0 = ≈ 20950
1+ 32089
𝑁 1 +
60356

El tamaño de la muestra utilizada con un nivel de confianza del 95% y un error máximo del 5% es de
aproximadamente 20950.

También podría gustarte