Está en la página 1de 24

Profesores:

Walter Sosa Escudero


Mariana Marchionni

Asistentes:
Maria Edo
Bruno Cardinale Lagomarsino
Organizacin de la parte prctica del
curso
Introduccin a Stata
Interface
Datos
Comandos
Grficos
Do-file
Pgina web del curso:
http://faculty.udesa.edu.ar/WalterSosa/Econometria/

Trabajos Prcticos:
Reglas:
grupos de 3 personas (mximo)
Entrega: impresa (en casillero) y por correo electrnico, en PDF. Esperar acuse de
recibo.

Monografa. Entrega: con el final.

Metodologa clases prcticas:


Introduccin a Stata
Desarrollo de ejemplos economtricos
Desarrollo de ejercicios tericos y empricos
Espacio de consulta para la realizacin de los trabajos prcticos y la
monografa.
Stataes un sistema que permite la gestin
de base de datos y la realizacin de
clculos estadsticos y economtricos.

Fuentes de informacin:
Hamilton, L., 2012, Statistics with Stata: Version 12,
Duxbury Press, New York.
Baum., C., 2006, An Introduction to Modern
Econometrics with Stata, Stata Press.
Ambos libros estn en reserva en la biblioteca.
www.stata.com
La interface de Stata comprende el entorno
de trabajo.
Las diferentes ventanas que conforman la
interface son:
Ventana Review: historial de comandos.
Ventana Variables: expone las variables que
comprenden el dataset actualmente en memoria.
Ventana Stata Results: es la ventana ms grande
color negro. Muestra los resultados obtenidos de la
aplicacin de los comandos.
Ventana Stata comand: en esta ventana el usuario
introduce comandosmediante el teclado.
Estructura: tabla, en donde cada columna representa a una variable y
cada fila a una observacin.

Observaci Variable 1 Variable 2 Variable


n K
1 Dato 1, 1 Dato 2, 1 Dato K, 1
2 Dato 1, 2 Dato 2, 2 Dato K, 2

N Dato 1, N Dato 2, N Dato K, N

En cada celda se pueden guardar datos de diferentes tipos.


El tipo de dato es el mismo para las observaciones de una misma
variable
A partir de ahora, utilizaremos una base de datos extrada de la EPH,
correspondiente al tercer trimestre de 2011 para ejemplificar.
Establecer un directorio:
cd "C:\Users\DE\Dropbox\econometra 2015\x - Tutorial
1
Archivo -> Change Working Directory

Lectura de Datos en Stata: distintas opciones


Base de datos en formato Stata (.dta): podemos abrirlo
directamente en Stata.
use eph_2011_t3.dta.

Base de datos en excel: tenemos un archivo excel con


datos, llamado eph_2011_t3.xls. Cada columna
representa una variable; la primera fila contiene los
nombres de dichas variables.
Dos mtodos:
Mtodo 1 (Copy & Paste):
Abrir el archivo eph_2011_t3.xls en Excel
Abrir Stata.
En Excel, pintar todo el rango de datos que se desea llevar a
Stata (incluyendo los nombres de las variables].
Clickear Edicion/Copiar.
Pasar a Stata, abrir el editor de Stata clickeando en el botn
Editor.
En esta ventana, clickear Edit/Paste,
Los nombres de las variables aparecern en la ventana
Variables.
Nota: Este mtodo puede tener problemas si no se dispone de
suficiente memoria RAM, por lo que es til chequear si todos
los datos han sido importado correctamente.
Nota II: Stata requiere criterios particulares para los nombres
de las variables.
Mtodo 2 (Insheet)
Grabar el archivo conteniendo los datos en Excel como CSV (separa
las columnas en comas].
Ir a Archivo, Guardar como, CSV (delimitado por comas], Guardar
Ahora tenemos el archivo eph_2011_t3.csv
El archivo est en la siguiente ruta:

c: \Users\DE\Dropbox\econometra 2015 \ x Tutorial 1\


eph_2011_t3.csv

Para leer los datos desde Stata, ingresar el siguiente comando:

insheet using "c:\Users\DE\Dropbox\Econometra 2015\x - Tutorial


1\eph_2011_t3.csv", comma

Stata crear una nueva base de datos, y los nombres de las variables
aparecern en la ventana Variables.
Una vez que la base de datos ha sido
abierta en Stata, puede grabarse en formato
Stata:
Archivo -> Guardar Como -> eph_2011_t3.dta
Una
vez grabada con la extensin .dta
puede abrirse directamente desde Stata:
Archivo -> Abrir
use eph_2011_t3.dta, clear [clear limpia la base de
datos, se usa si o si antes de abrir una nueva]
A partir de ahora, abrir directamente desde
Stata el archivo eph_2011_t3.dta original
(contiene las etiquetas de las variables)
Stata trabaja mediante la especificacin por parte
del usuario de rdenes que se denominan comandos
Existe una determinada sintaxis que debe ser
respetada. Tiene la siguiente estructura general:
[by varlist:] comando [varlist] [=exp] [if exp] [in range]
[weight] [, opciones]

Los corchetes indican elementos opcionales.


Todos los elementos que acompaan a un comando
son opciones, de hecho existen comandos que
comprenden slo una palabra.
Para conocer las opciones de los comandos:
help comando
display _N [cantidad de observaciones en la
base de datos]
describe [describe el dataset]
describe ch04 [describe una variable en
particular]
list [muestra todas las variables y
observaciones para interrumpir clickear break]
list CODUSU ch04 [muestra observaciones
para las variables seleccionadas]
sort CODUSU [ordena las observaciones en
forma ascendente de acuerdo a los valores de
CODUSU]
summarize [muestra resumen de todas las variables]
summarize CODUSU ch04 [muestra resumen
variables seleccionadas]
summarize CODUSU, detail [muestra resumen
ms detallado de variables seleccionadas]
summ
tabulate ch04 [tabula la variable seleccionada]
tab ch04 ch07 [tabula las variables seleccionadas]
tab ch04 ch07, row [tabula las variables
seleccionadas incluyendo porcentajes adems de
frecuencias]
Posibles estadsticos:
tabstat ch04 [muestra statname Definicin
la media de la variable mean promedio
seleccionada] count Cuenta las observaciones que no son
nulas
tabstat ch04,
n Igual que count
statistics (mean sum sum Suma
count max) [genera una max Mximo
tabla que muestra los min Mnimo
estadisticos descriptivos range Rango = max min
indicados entre parntesis] sd Desvo Estndar
variance Varianza
cv Coeficiente de variacin (sd/mean)
semean Desvi estndar del promedio
(sd/sqrt(n))
p1 Primer percentil
median Mediana (p50)
p99 Percentil 99
iqr Rango intercuartil= p75 - p25
generate ingreso=tot_p12/10 [genero una
variable nueva que contiene el ingreso medido en
dlares]
gen obs=_n [genera una nueva variable llamada obs que
enumera las observaciones segn su orden]
gen obs_total=_N [crea una variable cuyo valor siempre es el
mismo y ese valor es la cantidad de observaciones]
gen nulo=.
gen x=uniform()[genera una variable con nmeros aleatorios
entre 0 y 1]
gen edad2=ch06^2 [genera una variable que es el cuadrado
de la edad]
egen horas = rowtotal(pp3e_tot pp3f_tot)
[genera una variable que es la suma horizontal de las variables
seleccionadas]
Preserve and restore ctrl+Z!
En Stata no existe un comando Deshacer
preserve [guarda provisionalmente la base de datos]
restore [vuelve a la versin guardada provisionalmente]
Modificar la base de datos como en Excel
edit
label var ingreso Ingreso total en Dlares
[etiqueta la variable Ingreso]
rename ingreso ingreso_dolares
[cambia el nombre de la variable ingreso]
replace ch04=0 if ch04==2 [ahora cuando la variable es igual a 0
significa que el individuo es mujer]
drop horas [elimina la variable horas]
keep if ch06<60 [borra las observaciones de aquellos que
tienen menos de 60 aos]
La expresin if
sum horas if ch04==1 [ejecuta el comando
summarize en la submuestra seleccionada: los
hombres]
tab horas if (ch04==1 & ch06>30) [tabula la
variable horas en la submuestra seleccionada:
hombres mayores de 30 aos]
tab horas if (ch04==1 & ch06>30)|
(ch04==2 & ch06<30) [tabula la variable horas en
la submuestra seleccionada: hombres mayores de 30
aos o mujeres menores de 30 aos]
Aritmticos Lgicos Relacionados

+ adicin &y > mayor a


- resta |o < menor a
* multiplicacin ! no >= mayor o igual a

/ divisin <= menor o igual a

^ potencia == igual a
!= distinto a

Ej: sum horas if (ch04==1 & ch06>30)|(ch04==2 & ch06<30)


[resume estadsticas de la variable horas en la submuestra
seleccionada: hombres mayores de 30 aos o mujeres menores
de 30 aos]
Operador jerrquico: el parntesis determina el orden de
aplicacin de las sentencias condicionales
La expresin in: el comando solo se utiliza para
las observaciones especificadas.
sum horas in 1/10 [muestra observaciones entre
la 1era y la 10ma]
sum horas in -10/-1 [muestra observaciones entre
10ma empezando de abajo y la primera empezando
de abajo]
[, options]:
sum horas, detail
[produce estadsticas adicionales, la
asimetra, los cuatro valores menores y
mayores y varios percentiles]
sum horas, meanonly [suprime la presentacin de
los resultados y el clculo de la varianza]
Stata provee una serie de herramientas
grficas muy tiles a travs del comando
graph.
En econometra, lo ms usado son
diagramas de dispersin o lneas.
Disponibles a travs del comando twoway
(scatter or line)
Ejemplo: twoway scatter ingreso horas if
horas<500 & ingreso>0
Para
ms informacin: help graph |
help twoway
Hasta ahora, introdujimos los comandos en la ventana Stata
commands.
Es recomendable, en cambio, armar do files. Son archivos de
texto que se guardan con extension do, y que contienen
una lista de comandos de Stata.
Algunas ventajas:
Permite ejecutar una sucesin de comandos de Stata de una sola vez
Permite construir programas y rutinas elementales, que pueden ser
reutilizadas en diversas situaciones o con otras bases de datos.
Proveen una forma eficiente de progresar en el anlisis de datos, ya
que es fcil corregir errores o reproducir resultados obtenidos con
anterioridad.
Armando un Do-file
Copiar en c:\micarpeta el archivo eph_2011_t3.dta. Esta
ser nuestra carpeta de trabajo.
En Stata, clickear el botn New Do-file Editor del men
o escribir doedit en la ventana de comandos
En el archivo escribimos:
cd c:\micarpeta [Stata buscar archivos
en esa carpeta]
use eph_2011_t3.dta, clear [Stata
abrir la base de datos]
Describe
Summarize ch04
Exit
Guardar el do-file en c: \micarpeta con el nombre
eph. Se guardar como eph.do.
El do-file puede:
Ejecutarse parcialmente: abrir el do-file, pintar los
comandos a ejecutarse, clickear botn Execute (Do)
Ejecutarse totalmente: introducir el comando do eph en la
ventana de comando

Nota: pueden incorporarse comentarios dentro del


archivo DO de la siguiente manera:
/* Este es un comentario */
Tambin es un comentario una lnea iniciada con
asterisco *
Antes de empezar: existe un comando que genera un
archivo llamado log.
Son tiles para llevar un registro de todo lo que
aparece en la ventana "resultados.
Los log-file graban tanto el historial de los comandos
como los resultados.
log using "c:\Users\DE\Dropbox\Econometra
2014\x - Tutorial 1\ eph_2011_t3.smcl" [options]
replace
append
log close
Se puede abrir el log file con el Bloc de notas o
mediante la opcin File -> Log -> View".