Está en la página 1de 12

Combinacindefuentesanivel

intermedioconStata
EnriqueFernndezMacas
DepartamentodeSociologa
UniversidaddeSalamanca

1.Elobjetivodeinvestigacin
Evaluarsilospasesdela
UEcreanmsymejores
empleos,replicandoun
estudioquerealizaron
WrightyDwyer para
EEUU(the American
JobsMachine).
Distribucindela
creacindeempleoen
quintilas decalidad,en
funcindesusalario

2.Elproblema
Labasededatosutilizadaenelproyecto
americano(Current Population Survey)incluye
salariosydatosdeempleo.
LafuenteequivalenteenEuropa(Labour Force
Survey)noincluyedatossalariales.
Distintasfuenteseuropeasparadatossalariales,
obienincompletas(ESES)obienlimitadasensu
tamaomuestral (ECHP,SILC).

3.Lasolucin
Aprovecharqueelobjetivodelproyectoesestudiarel
cambioalniveldesectoresyocupacionesespecficospara
cambiarlaunidaddeanlisis:empleosenvezde
individuos.
Empleo:crucedeocupacinysectoradosdgitos(entotal,
entre600y1500porpas).Variablesdisponiblesen
distintasfuentes,yestandarizadasaniveleuropeo.
Construccindeunabasededatosnueva,coninformacin
agregadadedistintasfuentesparacadaempleo.
LFSparacantidadesdeempleo,sociodemogrficasylaborales.
ESES,ECHP,SILCycuentasnacionalesparasalarios.
EWCSparaindicadormultidimensionaldecalidaddelempleo

4.Ventajaseincovenientes
+Posibilidaddeutilizarmuchsimasfuentes
+Msfcilhacergrandesanlisiscomparados
+Muchamayorriquezadecontenido,
combinandoreasdistintas
Sepierdevariabilidadintragrupal (importante
evaluaresteefecto apriori)
Menosflexibilidadenelanlisis(hayquetener
muyclaroslosobjetivosaldefinirlosdatos)

5.ImplementacinenStata
Estructurabsicadelabasededatosconstruida:casosson
combinacionesdeocupacinysectoradosdgitos,variablesson
distintosaspectosdeinters.
Enlaprctica,paraganarflexibilidad,dosbasesdedatosdistintas,
combinadasenelanlisis:
Datosdeempleo,sociodemogrficosylaborales:crucedemuchas
variablesdistintasdeformarecursiva,conunpesoparacada
combinacin.
Datosdesalarioseindicadorcompuestodecalidaddelempleo:
estadsticospromedioydedispersinparacadacombinacinde
ocupacinysector.

Principalmente,sonnecesariostrescomandosnomuyusadospero
muypotentesparalamanipulacindedatos:collapse,reshape y
merge.

collapse (1)
Sintaxis:
collapse (stat)varlist [if][in][weight],by(varlist)cw

Admitelosestadsticosderesumenhabituales
Admiteponderaciones
Sustituyelosdatosenmemoriaporunabasededatos
agregados.

Ejemplo(datosdesalarios):
collapse (mean)hours (mean)wage (count)cases(rawsum)pop
[aw=pop],by(countrynace2isco2)

Resultado:
country

nace2
1
1

isco2
1
1

1
2

hours
38.78
40.64

wage
443.34
592.96

cases
37
23

pop
84.35
45.43

collapse (2)
Ejemplo(datosdeempleo):generamosuna
enormetabladefrecuenciasparacada
combinacindevariablesindependientes.
collapse (sum)pop,by(countryyear nace2
isco2sexage [etc])
Resultado:
country
1
1

nace2
isco2
year
1
1
1995
1
2
1995

age

Sex
1
1

1
1

pop
84.35
45.43

Ambasbasesdedatossemanipulanyfusionan
paraelanlisis

reshape
Sintaxis:
reshape wide/long var1,i(var2)j(var3)

var1:la(s)quedefineelcontenido
var2:la(s)quedefineloscasos
var3:la(s)quepasadefilasavariablesoviceversa

Porejemplo,parapasarlosaosdefilasacolumnas:
reshape wide pop,i(countrynace2isco2)j(year)

Resultado:
country nace2
isco2 pop1995 pop1996 pop1997 pop1998
1
1
1
89.54
88.44
84.35
85.65

Paraestetipodeanlisis,seestcontinuamente
reestructurandolosdatosconcollapse yreshape

merge

Sintaxis:
merge x:xvars using filename [,opciones]

SefusionanlosdatosabiertosenStata conlosdatosespecificadostras
using.
vars especificalasvariablescuyosvaloresseemparejan
x:xdefineelmododefusin:1:1cuandoloscasossonnicose
idnticosparalasvariablesdefusin;m:11:mcuandoenunfichero
sonnicosyenotroserepiten;m:msiserepitenenambos.

Parafusionardatosdeempleoydesalarios:
Sielaoestenformatolargo,sera:
merge m:1countrynace1isco1using wages.dta

Sielaoestenformatoancho,sera:
merge 1:1countrynace1isco1using wages.dta

Muchasgracias
efm@usal.es

También podría gustarte