Está en la página 1de 7

Técnicas de Análisis de Datos I (EGOB-4104)

2019-2

TALLER 2

Integrantes del grupo:


Daniel Bustamante Fernández
Johnatan Jesús Clavijo Taborda
Cristian Camilo Sanín Camargo
Marion Restrepo

Carpeta de acceso a todos los contenidos:


https://uniandes-my.sharepoint.com/:f:/r/personal/cc_sanin_uniandes_edu_co/Documents/
2.%20Maestria%20en%20Politicas%20Publicas/3.%20MPP/1.%20Semestre/Tecnicas%20de%20A
nalisis%20de%20Datos/Taller%202?csf=1&e=YAi4nO

Parte 1
La base de datos entregada por el Ministerio del Trabajo recoge 15.992 observaciones, con 12
variables como lo son: documento de identidad, si los individuos hacen parte del grupo de
tratamiento o de control, la edad, el sexo, los años de educación, si son casados o no, si pertenecen a
la etnia afro, si abandonaron el bachillerato o no, sus ingresos en 2015 y sus ingresos en 2017
(mensual promedio) y su tipo de contrato en ambos años.

La población encuestada está conformada por un 50,21% de hombres y 49,va de los 16 a los 55
años y tiene una edad promedio de 33,22 años. El promedio de años de educación es de 12,02% y
de las 15.992 personas encuestadas, 4.731 (29,58%) abandonó el bachillerato. Respecto a
características generales de la población, el 71.71%, que corresponde a 11.382 personas, son
casados, mientras que el restante 28,83% no lo es. Por su parte, el 7,35% de esta población,
equivalente a 1.176 personas, son de raza negra, mientras que 14.816 (92,65%) no lo son.

Por último y para fines del estudio que será analizado en este documento, se especifica que en esta
población, el 46,90% corresponde al grupo de control y 53,10% hace parte del grupo de
tratamiento.

En la población encuestada, los promedios de ingresos para 2015 eran de $13.697,06 y para 2017
de $14.874,67. Esto representa una diferencia de $1.150,606 en los ingresos de ambos años, lo que
significa una variación del 7,73% entre ambos periodos. Respecto al tipo de contratación de esta
población, en 2015, el 29.33% de la población tenía contrato a término indefinido; 29,71% contrato
por prestación de servicios; 28,99% contrato informal y el 11,96% estaba desempleado. Por su
parte, para el 2017 el 29.5% de la población tenía contrato a término indefinido; 28,75% contrato
por prestación de servicios; 28,18% contrato informal y el 13,58% estaba desempleado.

En términos comparativos, con respecto al comparativo de ingresos en 2015 y el tipo de contrato,


puede encontrarse que hay...
Diagrama de caja 1. Ingresos de 2015 según tipo de contrato en 2015

Nota: para los ingresos de 2015 se encontró un dato extremo de una persona
desempleada que, para efectos de este análisis, fue descartado.

Diagrama de caja 2. Ingresos de 2017 según tipo de contrato en 2017

Diagrama de caja 3. Años de educación según sexo


Gráfico de barras 1. Media de ingresos según abandono o no del bachillerato

Gráfico de barras 2. Media de ingresos según sexo


Parte 2
PARTE II: Propiedades de las distribuciones muestrales
La segunda parte del taller tiene como objetivo explorar las propiedades de los estimadores y de sus
distribuciones muestrales. Suponga que los datos de la encuesta son datos poblacionales1 y que, a partir
de éstos, se extraerán varias muestras para revisar el comportamiento de las estimaciones.

1. Estimadores poblacionales. (Valor 10 puntos)


A. En la población, para la variable ingresos de 2015, y la variable de años de educación calcule:

i. Media
ii. Desviación estándar

B. En la población, para la variable categórica de “tipo de contrato”, calcule:

i. Proporción de personas cuyo tipo de contrato es contrato indefinido en 2015


ii. Proporción de personas cuyo tipo de contrato es contrato de prestación de servicios en 2015
iii. Proporción de personas cuyo tipo de contrato es contrato informal en 2017
iv. Proporción de personas cuyo tipo de contrato es desempleado en 2017

2. Extraiga una muestra aleatoria (muestreo aleatorio simple) de tamaño 40 y calcule los
mismos estadísticos. (Valor 10 puntos)
A. Para la variable ingresos de 2015 y la variable años de educación calcule:

v. Media
vi. Desviación estándar

B. Para la variable categórica de “tipo de contrato”:

i. Proporción de personas cuyo tipo de contrato es contrato indefinido en 2015


ii. Proporción de personas cuyo tipo de contrato es contrato de prestación de servicios en 2015
iii. Proporción de personas cuyo tipo de contrato es contrato informal en 2017
iv. Proporción de personas cuyo tipo de contrato es desempleado en 2017

1
Este es un supuesto poco realista, ya que en la práctica observar toda una población suele ser bastante complicado
en términos operacionales. Sin embargo, realizaremos esta suposición con fines educativos.
C. ¿Qué observa? ¿Las estimaciones difieren respecto a los parámetros poblacionales? ¿Por qué?

3. Extraiga una muestra aleatoria (muestreo aleatorio simple) de tamaño 325 y calcule los
mismos estadísticos. (Valor 10 puntos)
A. Para la variable ingresos de 2015 y la variable años de educación calcule:

i. Media
ii. Desviación estándar

B. Para la variable categórica de “tipo de contrato”:

i. Proporción de personas cuyo tipo de contrato es contrato indefinido en 2015


ii. Proporción de personas cuyo tipo de contrato es contrato de prestación de servicios en 2015
iii. Proporción de personas cuyo tipo de contrato es contrato informal en 2017
iv. Proporción de personas cuyo tipo de contrato es desempleado en 2017

C. ¿Qué observa? ¿Las estimaciones difieren respecto a los parámetros poblacionales? ¿Por qué?

4. Uno de sus colegas le ha pedido realizar los intervalos de confianza de algunas de las variables
para saber cómo se comportan los intervalos en relación a los parámetros de esta población.
(Suponga que las variables se distribuyen de forma normal). (Valor 10 puntos)

i. Para la variable edad, construya un intervalo de confianza al 98% para una muestra de 200
individuos. Comente la relación entre el intervalo encontrado y el parámetro.

ii. Para la variable ingreso de 2015, construya un Intervalo de confianza al 94% para el grupo de los
tratados (tratamiento=1) con una muestra de 500. Comente la relación entre el intervalo encontrado y
el parámetro.

iii. Ahora genere una muestra de 700 individuos y estime un intervalo de confianza para los años
promedio de educación con una confianza del 94%. Comente la relación entre el intervalo encontrado
y el parámetro.
5. A partir del análisis realizado en el punto anterior, ha surgido la duda sobre si la distribución
de estas variables realmente es normal. A partir de los diferentes conceptos estudiados en clase,
determine si la distribución de las variables edad y años de educación es normal. ¿Qué pruebas
habría para aceptar o refutar el supuesto sobre la distribución? Puede adicionar histogramas
para apoyar sus argumentos. (Valor 10 puntos)

6. En la literatura, diversos estudios han llegado a diferentes resultados respecto a variables


similares a las presentes en los datos provistos por el Ministerio del Trabajo. Compruebe o
refute algunas de esas hipótesis realizando pruebas sobre la media y la varianza. (Valor 20
puntos)

i. Un resultado de la literatura es que los años promedio de educación en Colombia son menores a 13.
Pruebe esta hipótesis al 95% de confianza

También podría gustarte