Está en la página 1de 5

Contexto

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH),


realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades principales del
Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira,
Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja,
Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de
empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad
social en salud o si están buscando empleo), además de las características generales de
la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes
de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto,
regional, departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre


las características generales de las personas que respondieron en un mes en particular.
Para este trabajo colaborativo, realice lo siguiente:

Parte 1 (semana 3 - 5)

(semana 3) Selección de muestra

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos


los elementos de una población), se selecciona una muestra, entendiendo por tal una
parte representativa de la población. En ese sentido, escoja un tipo de muestreo y
argumente la viabilidad de esta técnica para la base de datos dada. Para seleccionar
una muestra debe tenerse en cuenta el cómo seleccionar los elementos que formarán
parte de la muestra (tipo de muestreo) y cuántos elementos debemos seleccionar
(Tamaño de muestra).

2. Utilizando la variable género P(6020) determine el tamaño de la muestra


seleccionando adecuadamente y justificando:
a. Fórmula a desarrollar
b. Estimación de la proporción de mujeres
c. Nivel de confiabilidad
d. Error de estimación
(semana 4) Intervalo de confianza para dos variables numéricas
Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los
hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para


los hombres y mujeres. Según los resultados, ¿Existen diferencias?
2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95%
para estimar, la escolaridad promedio de los hombres y de las mujeres de forma
individual, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.
3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para estimar la diferencia promedio de escolaridad para los hombres y mujeres, en
los niveles de estudio de Bachiller, Tecnólogo y Universitario.

(semana 5) Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la
semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y


sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?
2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres y
de mujeres que asisten a un establecimiento oficial.
3. Realice una prueba de hipótesis para determinar la afirmación del investigador.
Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

SOLUCION

Buenas noches
Se realiza la entrega de la semana 3.
1. el tipo de muestreo elegido por el equipo de trabajo es: Muestreo por
conglomerado, que hace parte de muestreo probabilístico, ya que es una técnica
que aprovecha la existencia de grupos en la población que representan
correctamente el total de la población en relación a la característica que queremos
medir. Dicho de otro modo, estos grupos contienen toda la variabilidad de la
población. Si esto sucede, podemos seleccionar únicamente algunos de estos
conglomerados para realizar el estudio.
Adicional es el mas utilizado para estudio de la población.
TAMAÑO DE MUESTRA
Teniendo en cuenta 5% de error y 95% NC
tamaño de la población: 60.356
Z: 1. 9600
total tamaño de la muestra : 382.
este es el número de sujetos que componen la muestra extraída de una de la
población (60.356) necesarios para que los datos obtenidos sean representativos
de la población.
Formula aplicada. }

Se observa que las imágenes no quedaron cargadas por fallas al parecer del
sistema.
Se aplica nuevamente el 1. punto
Se realiza la entrega de la semana 3.
1. el tipo de muestreo elegido por el equipo de trabajo es: Muestreo por
conglomerado, que hace parte de muestreo probabilistico, ya que es una técnica
que aprovecha la existencia de grupos en la población que representan
correctamente el total de la población en relación a la característica que queremos
medir. Dicho de otro modo, estos grupos contienen toda la variabilidad de la
población. Si esto sucede, podemos seleccionar únicamente algunos de estos
conglomerados para realizar el estudio.
Adicional es el mas utilizado para estudio de la población.
TAMAÑO DE MUESTRA
Teniendo en cuenta 5% de error y 95% NC
tamaño de la población: 60.356
Z: 1. 9600
total tamaño de la muestra : 382.
este es el número de sujetos que componen la muestra extraída de una de la
población (60.356) necesarios para que los datos obtenidos sean representativos
de la población.
Teniendo en cuenta 5% de error y 95% NC
tamaño de la población: 60.356
Z: 1. 9600
total tamaño de la muestra : 382.
este es el número de sujetos que componen la muestra extraída de una de la
población (60.356) necesarios para que los datos obtenidos sean representativos
de la población.

También podría gustarte