Está en la página 1de 29

ECONOMETRA III

ULPGC 2002-2003
PRCTICA 1
INTRODUCIENDO STATA
QU ES STATA
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

(Versin 7).
Corre en Windows
Introduccin a Stata

Paquete estadstico-
economtrico
con posibilidad de programacin
Ayuda on-line (ojo piratera!!)
Preparados: Las ventanas Stata
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

(3) Aqu se conservan (1) Aqu


los ltimos comandos salen los
ejecutados. Usar para resultados
copiar en (2) y correr
de nuevo
(4) Aqu lista stata
las variables en
memoria
Introduccin a Stata

(2) Aqu se pueden


escribir y correr
interactivamente los
comandos
(5) Ventana del
Preparados: Las ventanas Stata
editor de datos,
para ver y
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

cambiar datos
Introduccin a Stata
Cmo corre?
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Interactivamente, escribiendo el
comando en la ventana (2)
Modo batch, editando un fichero
de comandos (.do) y corrindolo,
entero o parcialmente
Introduccin a Stata
Ficheros
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Datos:
Datos extensin .dta (formato Stata)
Comandos:
Comandos extensin .do (puede editarse con
cualquier procesador o en la ventana de stata)
Resultados:
Resultados para que escriba los resultados
en fichero hay que abrirlo, conviene usar la
extensin .log (ascii)
Introduccin a Stata

Los programas escritos en stata y ya compilados que


pueden correrse con solo escribir su nombre tienen
extensin .ado
Hoy aprenderemos a:
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

1. Leer, manipular y guardar datos


2. Comandos para algunas operaciones
estadsticas (descriptivos, tablas de
frecuencias y contingencia, ANOVA,.)
3. Combinar ficheros (unir o
desagregar ficheros de datos)
Introduccin a Stata

4. La regresin en Stata: estimacin y


contrastes
1
Leyendo
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Fichero de datos en ascii delimitado por


tabulaciones (o comas), extensin .dat
Puede escribirse con SPSS, excel, .
Para leer:
insheet using nombre fichero
Nota: crear una carpeta en c: para datos y ficheros
de comandos (datostata). Al entrar en la sesin,
Introduccin a Stata

entrar en esa carpeta:


cd ..
cd ..
cd datostata
1
Un par de aclaraciones
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Si el fichero de datos es grande, antes


de leerlo conviene reservar suficiente
memoria. Ejemplo, para reservar 10
megas:
set mem 10m
Introduccin a Stata

Stata es sensible a las maysculas (no es


lo mismo SET que set). Los comandos
van en minsculas
Caso 1: salarios en una empresa 1
(n=474+1 inventado)
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

1. Leer fichero practica1_1.sav (en SPSS).


Echar un vistazo al contenido. Datos
missing; sexo: string
2. Escribirlo en ascii como
practica1_1.dat, delimitado por
tabuladores, en la carpeta datostata
Introduccin a Stata

3. Entrar en Stata. Cambiar a la carpeta


datostata. Leerlo. Mirar su contenido en la
ventana del editor
Caso 1(cont.) 1
Manejando missing y cambiando tipos de
variables
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

4.Pedimos (interactivamente) una descripcin de las


variables:
sum sexo educ catlab salario ()
Tenemos dos problemas:
1 Las variables que tienen algun missing no las summariza
(pone numero observaciones cero)
2 Sexo es alfanumrica. Queremos convertirla en numrica
Vamos a arreglarlos, aprendiendo de paso a usar los
comandos:
Introduccin a Stata

gen (para crear una variable nueva)


replace (para reemplazar algunos valores de una variable)
tabu (para hacer tablas de frecuencias simples o dobles)
label (para etiquetar las variables y valores)
destring (para convertir una variable alfanumrica en numrica)
format (para cambiar el formato de una variable)
Nota: de momento, corremos en modo interactivoEntrar en Stata
Caso 1(cont.) 1
Ejercicio 1.
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Hacer la tabla de frecuencias de la categora


laboral (catlab)
Etiquetar esta variable (catlab) y sus valores
Cambiar los valores de catlab, reemplazando 1
por 10, 2 por 20, y declarando missing el 3. Para
no cargarse la variable catlab original, hagan los
cambios en una copia llamada borro (gen
borro=catlab).
Introduccin a Stata

Comprueben que borro tiene la informacin


correcta, y brrenla del fichero en memoria
(drop borro)
Caso 1(cont.) 1
MANIPULANDO DATOS. APRENDIENDO A LISTAR
DATOS Y A ESCRIBIR CONDICIONES (IF)
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

if define una o mas condiciones


En las asignaciones, para escribir igual a hay que poner ==
AND se indica mediante &
OR se indica mediante |
No se indica mediante !

Ejemplo: pedimos que liste (list) los valores de la edad y el salario


para las mujeres (sex =1) que hayan estudiado al menos 14 aos
y no sean directivos (catlab distinto de 3):
Introduccin a Stata

Solucin:
list edad salario if sex==1 & educa>=14 & catlab!=3

if se puede usar en casi todos los comandos (ejemplos: list, replace, sum,
tabu, regress,)
1
Grabar el fichero de datos en formato stata
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

save using nombre.dta


Puede hacerse desde los menus (fichero
guardar o guardar como)
En una sesin posterior, se puede abrir con el
menu (file open) o con el comando use
nombre.dta
Ejercicio: Guarden el fichero de datos con el
nombre practica1.dta
Introduccin a Stata
Algunas operaciones estadsticas 2

sencillas en Stata: summarize (sum)


ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Hace la descripcin de una o varias


variables:
Si no se especifican variables, describe todas
Si escriben detail da todos los estadsticos
summarize [varlist] [weight] [if exp] [in range] [, [detail|meanonly] format ]
by ... : may be used with summarize; see help by
Introduccin a Stata

Ejemplo:
1. describir el salario inicial y el salario actual de las mujeres y de los
hombres por separado
Otros comandos para describir 2

variables:
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

tabsum for making tables of means.

See help table and tabstat for making tables of means and other
statistics.

See help ci for calculating the standard error and confidence intervals of
the mean.

See help stsum for calculating summary statistics with survival-time


data.
Introduccin a Stata

See help xtsum for calculating summary statistics with cross-sectional


time-series data.

Ejemplo: haz la tabla de medias de salario por categoras laborales diferenciando


hombres y mujeres:
tabu sex catlab, sum(salario)
Tablas de frecuencias y de 2

contingencia: tabu
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

tabu hace tablas de frecuencia de una


o dos variables categricas
Ejemplos:
tabu catlab
tabu catlab sex
tabu catlab sex, ro
tabu catlab sex, ro co chi2
Introduccin a Stata

Ejercicio: Haz la tabla cruzada entre minoria


y sexo, prueba exacta de Fisher (busca en
ayuda)
Histogramas y otros grficos: graph 2

(ver help graph)


ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Ejemplo de histograma:
graph salario, histogram bin(10) freq normal

Ejercicio: Haz el histograma del salario inicial para


las mujeres y para los hombres

Ejemplo de scatterplot:
graph salario salini
Introduccin a Stata

Ejercicio: Grafica salario inicial (ordenadas) frente a


aos de educacin (abscisas)
2
Mas ejemplos de graph
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Prueba esto:
graph salario salini if salario>15000
graph salario salini edad, matrix
graph salario salini , oneway box
graph salario salini , box
Introduccin a Stata
2
Correlaciones entre variables: correlate
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Ejemplos:
Correlacin entre salario inicial y actual
Correlacin entre salario inicial y final por categoras laborales

Solucin ejemplos:
1. Correla salario salini
2. sort catlab
by catlab: correla salario salini
Introduccin a Stata
COMBINANDO FICHEROS DE DATOS 3

collapse
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Ejemplo caso 2: fichero practica1_2.dta


Datos de n=979 jvenes USA 18-24 aos
que tienen 5 o mas hermanos, CPS 1992-
99
La variable family identifica la familia,
nherman es el numero de hermanos,
smoke es la dicotomica =1 si fuma
Objetivo: crear un fichero de familias,
Introduccin a Stata

que contenga la edad media de los


hermanos y el numero de fumadores
Nota: otros comandos para combinar ficheros de datos son joinby,
merge, append
MANIPULANDO FICHEROS DE DATOS 3

collapse
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Ejemplo caso 2: fichero practica1_2.dta


Datos de n=979 jvenes USA 18-24 aos que tienen 5 o mas hermanos, CPS 1992-99
La variable family identifica la familia, nherman es el numero de hermanos, smoke es la dicotomica =1 si fuma
Objetivo: crear un fichero de familias, que contenga la edad media de los hermanos y el numero de fumadores en cada
familia

1. Abrir practica1_2.dta. Antes hacer clear para borrar el fichero de


datos en memoria y ampliar la memoria a 100megas
clear
set mem 10m
use practica1_2
2. Dentro de cada familia, creamos un identificador de Vamos
cada herma hacer
anoeste
SOLUCIN:

ejercicio con un
(de 1 al numero de hermanos), ordenando previamente el fichero
fichero do de
por familia, edad y sexo
Introduccin a Stata

comandos, llamado
sort family age mujer
icaso2.do
by family: gen i=[_n]
3. Creamos un fichero de familias con collapse:
collapse (mean) age (sum) smoke, by (family)
4. Salvamos el fichero de familias con en nombre
fami.dta:
Save fami.dta
MANIPULANDO FICHEROS DE DATOS 3

joinby
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Ejemplo caso 2 (jvenes y tabaco) , continuacin


Objetivo: aadir al fichero de datos practica1_2.dta las variables edad
media de los hermanos y nmero de hermanos que fuman (fichero fami.dta)

1. En el fichero fami, cambiar el nombre a age y smoke para


evitar confusiones
rename age hage
rename smoke hsmoke
(Estas variables contienen la media para cada
SOLUCIN:

familia)
Introduccin a Stata

Grabar el fichero fami (save fami.dta, replace)


2. Abrir practica1_2.dta
2. Asegurarse que est ordenado por familias:
sort family
3. Unirle el fichero fami.dta, usando joinby:
joinby family using fami
4. Guardar practica1_2
La regresin en Stata: estimacin y4
contrastes
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Stata tiene comandos para virtualmente


cualquier tipo de modelo economtrico
basado en regresin
Search regress
La sintaxis de esos comandos es similar.
Como ilustracin tomamos la regresin
Introduccin a Stata

lineal (comando regress)


4

Ejemplo de regress
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Sintaxis: haz help regress

Ejemplo: con caso 2. Modelo de regresin que explique


el log de la cantidad de cigarrillos fumados
diariamente (lq) en funcin del log del precio (lp),del
nmero de hermanos que fuman (hsmoke), la edad
(age), sexo (mujer), y otras variables de control (ys=
aos que lleva fumando; ys2 (aos fumando al
Introduccin a Stata

cuadrado), working, hispanic.). Para la submuestra


de fumadores (smoke=1)
regress lq lp hsmoke age mujer ys ys2 working hispanic if
smoke==1
4

Ejemplo de regress (cont.)


ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Como introducir dummies e


interacciones

Ahora queremos aadir en la regresin el efecto


tiempo, diferenciando las tres oleadas de la
encuesta (wave=1 para 1992/93, =2 1995/96; =3
1998/99) y creemos que tal vez hay interaccin
Introduccin a Stata

entre dicha oleada y hispanic (los hispanos han


cambiado de habitos en esos aos):
xi: regress lq lp hsmoke age mujer ys ys2 working
hispanic i.wave i.wave*i.hispanic if smoke==1
Ejemplo de regress (cont.) 4

Diagnstico del modelo


ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Hacer help regdiag; help postest;


1. Predecimos y guardamos las predicciones como lqest:
Predict lqestg if e(sample)
2. hettest hace el contraste de heterocedasticidad de Breusch y
Pagan
3. Si hay heterocedasticidad, podemos hacer estimacin robusta:
regress lq lp age mujer ys ys2 working hispanic if
smoke==1, robust
Si sospechamos que la heterocedasticidad es por grupos,
podemos hacer la correccin suponiendo que los individuos
del mismo grupo tienen errores correlacionados. Si el grupo
Introduccin a Stata

es la familia:
regress lq lp age mujer ys ys2 working hispanic if
smoke==1, robust cluster(family)
4. ovtest hace el contraste de especificacin de Ramsey
5. Se pueden hacer grficos parciales avplots
(..)
4

La regresin en stata permite:


ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Contrastes de hiptesis lineales (test)


y no lineales (testnl)
Disear contrastes de ratios de
verosimilitudes para comparar
modelos (lrtest)
Estimacin restringida
Introduccin a Stata

Estimacin ponderada
. Y mucho mas
4

Ejercicio de regress
ECONOMETRA III (ULPGC, 2002-3) PRCTICA 1.

Con fichero de datos del caso1


(practica1_1.dta): hacer un modelo
de regresin que explique el salario
actual y contrastar ese modelo
Introduccin a Stata

También podría gustarte