Está en la página 1de 2

PRÁCTICA N° 2

“ANALISIS DE DATOS Y ECONOMETRÍA APLICADA EN R”

I. PREPARACIÓN DE BASES DE DATOS

1. De la página web del INEI (http://iinei.inei.gob.pe/microdatos/), descargar el Modulo 34


Sumarias y Modulo 3 Educación y cargar ambas bases de datos.
2. Determinar la clase, dimensiones, atributos de las bases de datos.
3. Unir ambas bases de datos utilizando la función merge.data.frame()
4. Mostrar la lista de variables de la base de dados unida.
5. Seleccionar un conjunto de variables: "conglome", "vivienda", "hogar",
“mes”,"dominio.x", "estrato.x", "mieperho", “inghog2d”, "gashog2d", "linpe",
"pobreza", "estrsocial", "codperso", "codinfor", "p300a", "p301a", "p301d", "p207",
"p209", “p300A”.
6. Etiquetar la variable:
Dominio: 1 Costa Norte 2 Costa Centro 3 Costa Sur 4 Sierra Norte 5 Sierra Centro 6 Sierra
Sur 7 Selva 8 Lima Metropolitana
Estrato:
1 De 500 000 a más habitantes.
2 De 100 000 a 499 999 habitantes.
3 De 50 000 a 99 999 habitantes.
4 De 20 000 a 49 999 habitantes.
5 De 2 000 a 19 999 habitantes.
6 De 500 a 1 999 habitantes.
7 Área de Empadronamiento Rural (AER) Compuesto
8 Área de Empadronamiento Rural (AER) Simple
Estrsocial: 1 “A” 2 “B” 3 “C” 4 “D” 5 “E” 6 “RURAL”
P207 (sexo): 1 Hombre, 2 Mujer
Pobreza: 1 Pobre Extremo, 2 Pobre No Extremo, 3 No Pobre
P209 (estado civil): 1 Conviviente, 2 Casado(a), 3 Viudo(a), 4 Divorciado(a), 5
Separado(a), 6 Soltero(a)
P301d: 1 Estatal 2 No estatal 9 Missing value
7. Renombrar las variables sexo y estado civil.
8. Separar en 2 la base de datos por casos y, posteriormente, volverlas a juntarlas.
9. Crear una nueva base de datos solo de hogares (con información del jefe de hogar).
10. Generar una variable de gasto mensual percapita.
11. Crear una nueva base de datos son jefes de hogar varones.
12. Hacer tablas descriptivas de datos. Para el caso de 1 variable, 2 variables, 3 variables y
4 variables (considerar la presencia de los NA)
13. Hacer una tabla descriptiva de datos condicional o con filtros
14. Recodificar la variable idioma natal en: 1 castellano y 0 otros casos.
15. Generar variables dummies
16. Generar nuevas categorías a partir de puntos de corte
17. Hacer una transformación logarítmica, reescalamiento y estandarización de la variable
ingresos o gastos.
18. Identificar a las variables NA (utilizar la variable “estado civil”, los niños deberían tener
missing)
19. Reemplazar en la variable ingresos los NA o 0, con los valores promedios.
20. Imputar un valor conocido a los NA
21. Imputar aleatoriamente valores a los NA o 0.

1
22. Identificar gráficamente los outliers
23. Imputar valores conocidos a los outliers: máximos, mínimos, media, mediana

II. ANÁLISIS EXPLORATORIO DE LA BASE DE DATOS:

24. Hacer un gráfico de boxplot


25. Hacer un gráfico scatter básico y avanzado
26. Hacer un gráfico de barra básico y avanzado
27. Hacer una distribución de ingresos
28. Hacer un gráfico lineal
29. Hacer un gráfico de 2x2 y de 4x4

III. ANÁLISIS ESTADÍSTICO:

30. Variables cuantitativas: calcular la dependencia lineal y no lineal de las variables


cuantitativas.
31. Hacer un gráfico de correlación
32. Variables cualitativas: calcular la dependencia entre variables cualitativas.
33. Realizar un test estadístico para identificar a los outliers.

También podría gustarte