Está en la página 1de 3

Contexto

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada por el
DANE[1]. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá, Medellín, Cali, barranquilla,
Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades
intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia, Sincelejo,
San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas (si trabajan,
en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo), además de las
características generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus
fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.

Este trabajo colaborativo, tiene 5 actividades diferentes. Cada actividad corresponde a un tema de los cuales se
desarrolla durante el módulo. El grupo debe resolver cada actividad e ir plasmando los resultados en el documento
en línea. Los niveles de cada actividad varían según el tema que se esté desarrollando. Sin embargo, cabe aclarar
que las actividades son independientes. Los temas que se desarrollan en este documento van hasta la semana 7.

En el archivo de Excel ( https://goo.gl/sDSVDm ) se tiene información sobre las características generales de las
personas que respondieron en un mes en particular. Para este trabajo colaborativo, realice lo siguiente:

Parte 1

Tamaño de muestra

Utilizando la variable edad (P6040), realice lo siguiente:


● Realice un histograma y describa la información según la forma y la curtosis de los datos.
● Realice una descripción numérica y descripción como es la población.

● Calcule una nueva variable que sea el


● Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente
fórmula:
Donde, se tiene lo siguiente:
Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.
S: Es la desviación estándar de la variable.

Es el margen de error absoluto.

Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto que
no supere 0.5.
● Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra,
utilizando el algoritmo del coordinado negativo.
● Compara la media poblacional, con la media muestral y determine la variación relativa.

Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres
en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente:
● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres.
Según los resultados, ¿Existen diferencias?
● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice lectura de
resultados.
● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la
escolaridad de los hombres y de las mujeres de forma individual.
● Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los
niveles de escolaridad para los hombres y mujeres.

Parte 2

Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia.
Para determinar lo anterior, se sugiere utilizar la base de la hoja de “muestra” y realizar lo siguiente:
● Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un
diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados,
¿Existen diferencias?
● Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a un establecimiento
oficial.
● Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a un establecimiento
oficial.
● Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de
significancia del 5%. ¿Qué se puede decir de lo anterior?

[1] http://www.dane.gov.co/files/investigaciones/fichas/empleo/ficha_metodologica_GEIH-01_V10.pdf

También podría gustarte