Está en la página 1de 8

Contexto

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares


(GEIH), realizada por el DANE [1]. Esta encuesta se hace en las 13 ciudades principales
del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto,
Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias
(Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta,
Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las
condiciones de empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si
tienen seguridad social en salud o si están buscando empleo), además de las
características generales de la población como sexo, edad, estado civil y nivel educativo,
se pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a
nivel nacional, cabecera - resto, regional, departamental, y para cada una de las
capitales de los departamentos.
Este trabajo colaborativo, tiene 5 actividades diferentes. Cada actividad corresponde a
un tema de los cuales se desarrolla durante el módulo. El grupo debe resolver cada
actividad e ir plasmando los resultados en el documento en línea. Los niveles de cada
actividad varían según el tema que se esté desarrollando. Sin embargo, cabe aclarar
que las actividades son independientes. Los temas que se desarrollan en este documento
van hasta la semana 7.
En el archivo de Excel (https://goo.gl/zB3Ntf ) se tiene información sobre las
características generales de las personas que respondieron en un mes en particular.
Para este trabajo colaborativo, realice lo siguiente:
Parte 1
Tamaño de muestra
Utilizando la variable edad (P6040), realice lo siguiente:
 Realice un histograma y describa la información según la forma y la curtosis de
los datos.

Histograma
1400

1200

1000
Frecuencia

800

600
Frecuencia
400

200

0
100
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95

Clase
La forma de la distribución del grafico es “Asimétrica a la Derecha”.

El tipo de curtosis es “Mesocúrtica” ya que tiene una concentración normal en la región


central de la distribución.

 Realice una descripción numérica y descripción como es la población.

DESCRIPCIÓN NUMÉRICA
MEDIDAS DE TENDENCIA CENTRAL
Media Aritmética:

∑ 𝑥𝑖
𝜇= = 30,97
𝑁
Mediana:
𝑀𝑒 = 28

Moda:
𝑀𝑜 = 11
MEDIDAS DE DISPERSION
Rango:
𝑅 = 𝐷𝑎𝑡𝑜𝑀𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜𝑀𝑒𝑛𝑜𝑟 = 101 − 0 = 101
Desviación Estándar:
∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2
𝜎= √ = √430,77 = 20,75
𝑁
La Varianza:

2
∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2
𝜎 = = 430,77
𝑁

Para la población se utiliza una variable aleatoria discreta


𝟐⁄
● Calcule una nueva variable que sea el 𝑷𝟔𝟎𝟒𝟎𝒏𝒆𝒘 = 𝑷𝟔𝟎𝟒𝟎 𝟑

Clase (P6040)^(2/3) Frecuencia

0 0,00 964

1 1,00 861

2 1,59 966

3 2,08 995

4 2,52 989

5 2,92 1044

6 3,30 1044

7 3,66 977

8 4,00 1103

9 4,33 1069

10 4,64 1102

11 4,95 1225

12 5,24 1123

13 5,53 1161

14 5,81 1140

15 6,08 1167

16 6,35 1164

17 6,61 1151

18 6,87 1162

19 7,12 1078

20 7,37 1139

21 7,61 1170

22 7,85 1132

23 8,09 1031

24 8,32 1018

25 8,55 1077

26 8,78 1016

27 9,00 1052

28 9,22 910
29 9,44 968

30 9,65 917

31 9,87 878

32 10,08 916

33 10,29 815

34 10,50 807

35 10,70 802

36 10,90 758

37 11,10 724

38 11,30 754

39 11,50 787

40 11,70 804

41 11,89 780

42 12,08 841

43 12,27 814

44 12,46 768

45 12,65 817

46 12,84 753

47 13,02 720

48 13,21 791

49 13,39 765

50 13,57 703

51 13,75 698

52 13,93 671

53 14,11 612

54 14,29 593

55 14,46 563

56 14,64 534

57 14,81 525

58 14,98 477

59 15,16 499
60 15,33 405

61 15,50 394

62 15,66 411

63 15,83 411

64 16,00 354

65 16,17 338

66 16,33 329

67 16,50 325

68 16,66 255

69 16,82 254

70 16,98 255

71 17,15 257

72 17,31 232

73 17,47 244

74 17,63 225

75 17,78 204

76 17,94 208

77 18,10 166

78 18,26 147

79 18,41 132

80 18,57 120

81 18,72 132

82 18,87 89

83 19,03 97

84 19,18 75

85 19,33 82

86 19,48 68

87 19,63 58

88 19,78 42

89 19,93 32

90 20,08 41
91 20,23 21

92 20,38 14

93 20,53 14

94 20,67 9

95 20,82 10

96 20,97 4

97 21,11 4

98 21,26 6

99 21,40 5

100 21,54 2

101 21,69 1

 Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra,


utilizando la siguiente fórmula:
𝒏𝟎
𝒏= 𝒏
𝟏 + 𝑵𝟎

𝒁𝟐 𝑺𝟐
𝒏𝟎 =
𝝈𝟐

Donde, se tiene lo siguiente:


𝒁: Es el cuantil de la distribución normal estándar al nivel de significancia que se
establezca.
𝑺: Es la desviación estándar de la variable.
𝜹: Es el margen de error absoluto.
Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un
margen de error de absoluto que no supere 0.5.
Media Aritmética:

∑ 𝑥𝑖
𝜇= = 9,28
𝑁

Desviación Estándar:
∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2
𝑆=√ = √20,88 = 4,56
𝑁

(𝟏, 𝟗𝟔)𝟐 (𝟒, 𝟓𝟔)𝟐


𝒏𝟎 = = 𝟑𝟏𝟗𝟓𝟐, 𝟐𝟕
(𝟎, 𝟎𝟓)𝟐

𝟑𝟏𝟗𝟓𝟐, 𝟐𝟕
𝒏= = 𝟐𝟎𝟖𝟗𝟐, 𝟎𝟕
𝟑𝟏𝟗𝟓𝟐, 𝟐𝟕
𝟏+
𝟔𝟎𝟑𝟓𝟔

● Teniendo en cuenta los resultados anteriores, realice una selección de elementos para
una muestra, utilizando el algoritmo del coordinado negativo.

● Compara la media poblacional, con la media muestral y determine la variación


relativa.
INTERVALO DE CONFIANZA PARA DOS VARIABLES NUMÉRICAS
Un investigador, cree determinar que existen diferencias entre los niveles de estudio de
los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar
la base de la hoja “muestra” y realizar lo siguiente:
● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para
los hombres y mujeres. Según los resultados, ¿Existen diferencias?
● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables.
Realice lectura de resultados.
● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y
determine, la escolaridad de los hombres y de las mujeres de forma individual.
● Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
la diferencia de los niveles de escolaridad para los hombres y mujeres.
PARTE 2
Prueba de hipótesis para dos variables nominales
Un investigador, cree determinar que los hombres asisten más a un colegio oficial que
las mujeres en Colombia.
Para determinar lo anterior, se sugiere utilizar la base de la hoja de “muestra” y
realizar lo siguiente:
● Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo
(P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un
solo gráfico. Según los resultados, ¿Existen diferencias?
● Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten
a un establecimiento oficial.
● Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten
a un establecimiento oficial.
● Realice una prueba de hipótesis para determinar la afirmación del investigador.
Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?
[1]