Está en la página 1de 18

INFORMTICA PARA

ECONOMISTAS
Informtica para Economistas
2011 - 1

EJERCICIOS
En la ENAHO
El archivo sumaria.dta es el mdulo de la Encuesta Nacional de Hogares
de 2010. En dicho mdulo, encontrar una amplia diversidad de variables de
inters. Para ahorrar memoria, se le pide que se quede solo con las variables mes,
conglome, vivienda, hogar, dominio, estrato, totmieho y aquellas que empiecen con
ingh, gash, lin, pob y fac.
Se le pide crear un programa que haga lo siguiente:
a)Cree una tabla que muestre el gasto per capita promedio por dominio
b)Cree una tabla cruzada que muestre el ingreso neto per cpita promedio para
nivel de pobreza y dominio

EJERCICIOS
b)

Muestre tablas cruzadas tal que se observe el ingreso per cpita promedio
segn pobreza y estrato para cada dominio precisado en la ENAHO (regin
geogrfica).

c)

Muestre cuntas personas en el pas son pobres, pobres extremos y no


pobres por dominio geogrfico
Nota: Debe usar el factor de expansin correspondiente.

ANEXANDO BASES DE DATOS


Sintaxis: append using nombase
Permite anexar bases de datos agregando observaciones. As, las
bases se juntan de forma vertical.
Si existen variables con el mismo nombre entre las bases de datos,
las observaciones se agregan a la misma variable. De lo contrario, se
crean nuevas variables en las bases anexadas.
Generalmente, se utiliza cuando se desea ampliar el tamao de
muestra de la base de datos.
Ejemplo:
use empleo2004.dta
append using empleo2003.dta
4

ANEXANDO BASES DE DATOS


Fusionando bases de datos
Sintaxis: merge [varlist] using filename
Este comando sirve para unir las series que se encuentran en la base de datos
abierta (data source) con las que se encuentran en otra base de datos (using
dataset).
Al unir las bases de datos, se crea una variable llamada _merge que se define
de la siguiente forma:
_merge = 1 si las observaciones contienen valores solo para las series de la base
de datos principal (master).
_merge==2 si las observaciones contienen valores solo para las series de la base
de datos secundaria (using).
_merge==3 si las observaciones contienen valores para las series de ambas bases
de datos
5

ANEXANDO BASES DE DATOS


Fusionando bases de datos
Asimismo, el comando merge contiene las siguientes opciones:
keep(varlist): especifica las variables de la base de datos secundaria
que se van a unir a la base de datos principal.
update: toma los valores de la variable en la base de datos secundaria si
la variable en la base de datos principal contiene observaciones en
blanco.
replace: similar a update, pero toma los valores de toda la variable que
se encuentra en la base de datos secundaria.
nokeep: elimina todas las observaciones que tienen _merge=2, es decir,
elimina las observaciones de las variables de la base de datos secundaria
6
si no existe informacin en la base de datos principal.

ANEXANDO BASES DE DATOS


Ejemplo aplicacin MERGE
clear
use base2.dta
sort pais
save base2.dta, replace
use base1.dta
sort pais
merge pais using base2.dta, keep(inflacion desempleo)

COLLAPSE
Comprimiendo o colapsando bases de datos
Sintaxis: collapse clist [, by(varlist)]
Este comando sirve para convertir a una base de datos que contiene
variables en una base que contiene estadsticos de dichas variables (medias,
medianas etc.).
Permite obtener estadsticos para unidades ms grandes, como, pasar de
datos por individuo a datos por hogar, de datos por individuo a datos por
regin geogrfica etc.
En el comando se especifican aquellas variables que se colapsan y las
condiciones que se imponen para dicha transformacin con respecto a
condicionales, a categoras de alguna variable, etc. Aquellas variables que no
se especifican desaparecen automticamente (!).
8

COLLAPSE
Comprimiendo o colapsando bases de datos
Sintaxis: collapse clist [, by(varlist)]
En clist se pone la lista de variables con los estadsticos por calcular para
cada una de ellas. Por defecto, calcula las medias. Algunos de estos
estadsticos son:
mean media
sd desviacin estndar
sum suma
rawsum suma sin tomar en cuenta las ponderaciones
count nmero de observaciones
max mximo
min mnimo

PERCENTILES
Creacin de percentiles
pctile / xtile: Crea una variable que contiene los percentiles de la
expresin que se evala, mientras que xtile crea una variable que
categoriza segn el percentil en el que se encuentra cada observacin.
pctile nuevavar=exp [if] [in] [,opciones]
xtile nuevavar=exp [if] [in] [,opciones]
Entre las opciones estn:
nquantiles(#): especifica el nmero de quantiles.
genp(nombre2): especifica la nueva variable por generar que contiene
los porcentajes de los percentiles.
10

PERCENTILES
Ejemplos
xtile gastox= gashog2d, nq(10)
Construyendo deciles segn ingreso
table gastox, c(mean gashog2d max gashog2d min gashog2d)
Muestra la tabla de indicadores por cada decil

11

USANDO EL STATA TRANSFER


Stata Transfer es un aplicativo que nos permite transformar casi
cualquier tipo de archivo de base de datos al formato *.dta, que es
el de bases de datos en Stata.
Su uso es muy sencillo y de amplia utilidad sobre todo cuando se
cuenta con archivos en SPSS o formato de texto.

OPERATIVIDAD BSICA
Seleccione el tipo de
archivo que desea
convertir
Indique la ubicacin
del archivo
Seleccione el tipo de
archivo de salida que
desea (lo usaremos
para convertir a Stata,
pero tiene ms
opciones)

Una vez selecionado todo de click en Transfer y listo!

Indique la ubicacin
de destino del archivo

ENCUESTA NACIONAL DE HOGARES


(ENAHO)
Tiene una cobertura nacional y es ejecutada por el INEI.
Se desarrolla tanto en el mbito urbano como el rural.
Cada ao se muestrean cerca de 20,000 hogares (que se distribuyen
en 4 trimestres).
Se evalan aspectos importantes como caractersticas de la vivienda,
educacin, salud, empleo, programas sociales, participacin
ciudadana, gasto de las familias, entre otros.
Los resultados se publican para cada trimestre y tienen
representatividad rural/urbana, por dominios geogrficos...
Su representatividad estadstica llega inclusive a nivel departamental si
se considera el total de informacin muestreada en 4 trimestres.

EJERCICIOS (FINAL 2011-0)


Las bases empleo2005.dta corresponde a la versin resumida del
mdulo de empleo para ese ao. Recuerde que esta base est a nivel
de hogares. Con ello, se le pide:
1. Realice la configuracin previa antes de trabajar (1 punto)
2. Elabore una vista de los principales estadsticos (observaciones
incluidas, media, varianza, mximo y mnimo) para las variables
numricas incluidas. (2 Puntos)
3. Desarrolle tablas de doble entrada que sea capaz de mostrar el estado
civil de las personas por edad, para cada dominio geogrfico (expanda
la muestra a nivel poblacin). (2 Puntos)

15

EJERCICIOS (FINAL 2011-0)


Las bases empleo2005.dta corresponde a la versin resumida del
mdulo de empleo para ese ao. Recuerde que esta base est a nivel
de hogares. Con ello, se le pide:
1. Realice la configuracin previa antes de trabajar (1 punto)
2. Elabore una vista de los principales estadsticos (observaciones
incluidas, media, varianza, mximo y mnimo) para las variables
numricas incluidas. (2 Puntos)
3. Desarrolle tablas de doble entrada que sea capaz de mostrar el estado
civil de las personas por edad, para cada dominio geogrfico (expanda
la muestra a nivel poblacin). (2 Puntos)

16

EJERCICIOS (FINAL 2011-0)


4. Sabiendo que en la base de datos sumaria2005.dta, existen datos de
ingreso y gasto, le interesa incluir en su base de datos las siguientes
variables: total miembros del hogar (mieperho), ingreso total neto
(inghog2d); gasto total (gashog2d), mbito geogrfico (urbano) y
tipociudad. (2 puntos)
5. Con los datos obtenidos, muestre una tabla que permita observar el
ingreso per cpita (que ser el ingreso familiar entre el nmero de
personas en la familia) promedio, segn el tipo de ciudad y el gnero de
las personas (3 Puntos)
6. Finalmente, usted quiere comparar el tamao promedio de las familias
para los diferentes deciles de ingresos. (2 Puntos)

17

INFORMTICA PARA
ECONOMISTAS
Informtica para Economistas
2011 - 1

También podría gustarte