Está en la página 1de 21

Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Aprendiendo STATA
Econometrı́a Aplicada

Juan Luis Fuentes Acosta

Facultad de Economı́a y Negocios


Universidad de Chile

Otoño 2017

1
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Introducción

Interfaz

Do Files

Manejo básico de BBDD

Sintaxis

Estadı́stica descriptiva

Manipular datos y variables

Ejercicios

2
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Introducción
I La presente ayudantı́a tiene como objetivo repasar las
funciones más básicas del software STATA. El curso será
intensivo en su uso, y por lo mismo se sugiere ampliar y
profundizar lo aquı́ señalado.
I Si bien a buenas y primeras puede parecer difı́cil de usar
para quienes no estén familiarizados con el programa, el
aprenderlo tiene mucho de autodidacta. Existe mucho
material en internet1 , además del siempre fiel comando
Help.

1
Stack Overflow, por ejemplo. Casi siempre basta con buscar en Google,
en todo caso.

3
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Introducción
Example

help summarize

4
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Introducción
I Existen múltiples versiones de STATA (13 y 14 las
últimas). Hay que estar atentos, ya que no todas las
funciones más actuales son compatibles o están habilitadas
en las versiones anteriores. Por ejemplo, si guarda una base
en Stata 13, luego no podrı́a abrirla en Stata 11 ni 12.
I Además, existen distintos tipos de STATA que se
diferencian en términos de capacidad y eficiencia en el
procesamiento de datos.

5
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Interfaz

Figura: Interfaz de STATA 13

6
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Interfaz
I En la interfaz encontramos:
1. Ventana de resultados: Aparecen todos los resultados de
los comandos que ingresemos, excepto los gráficos que
aparecen en una ventana aparte.
2. Ventana de comandos: Se ingresan los comandos de
STATA.
3. Historial de comandos: Va quedando registro de los
comandos que hemos operado durante nuestro trabajo.
4. Ventana de variables: Muestran las variables que
contiene la base de datos.
5. Menú: Distintas opciones, principalmente para ver y editar
datos.
I En la parte inferior izquierda vemos el directorio (carpeta)
en donde estamos trabajando.
C:\Program Files (x86)\Stata13

7
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Interfaz
I Tı́picamente querremos cambiar el directorio, a uno más
cómodo en donde tengamos la base de datos con la que
trabajemos, por ejemplo. Esto lo hacemos de la siguiente
forma:
cd "C:\Users\Google Drive\Econometrı́a Aplicada\"
Las comillas tienen que ir, ya que ası́ STATA lo leerá de
corrido, y no parando cuando encuentre un espacio(“ ”).
Esto es válido siempre que queramos indicarle un nombre a
STATA que contiene espacios.
I Luego pueden abrir las bases de datos. El comando
principal para la apertura de bases es use, que abre bases
con extensión “.dta”. Dado que podemos abrir sólo una
base a la vez, acompañaremos con la opción clear, que le
indicará limpiar todo lo anteriormente usado.

8
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Do Files
I Los Do Files son muy importantes. Querremos escribir una
secuencia de comandos, o un código que no cabe en una
sola lı́nea.
I Se recomienda encarecidamente el uso de Do Files, ya que
ası́ es más fácil compartir nuestro trabajo y evita que
tengamos que modificar las bases originales.
I Para abrir un do en Stata, lo más simple es ingresar el
comando doedit en la ventana de comandos.
Alternativamente, apretar Ctrl + 9.
I Un preambulo tı́pico a escribir en un Do File serı́a algo ası́:
clear all
set more off
cd "C:\Users\JuanLuis\Google Drive\Econometrı́a\data"
use "casen 2011", clear

9
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Do Files

Figura: Do File

10
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Manejo básico de BBDD


Los siguientes comandos son útiles para abrir, guardar y explorar
bases de datos:
I insheet: Importar datos que no están en formato .dta
I use
I save: Guardar base de datos.
I describe [lista de variables]: Información sobre las
variables señaladas. Si se quiere todas las variables, no
especificar ninguna.
I sort [lista de variables]: Ordena las observaciones de la
base de menor a mayor.
I drop/keep [varlist] [regla lógica]: Bota o mantiene las
variables/observaciones señaladas.
keep ingreso edad
keep if edad>21

11
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Operadores lógicos
I Hay veces en que vamos a querer realizar una operación
sólo para algunas variables que cumplan ciertas
caracterı́sticas. Ante esto, acompañamos nuestro comando
con un if (según la sintaxis que nos indique el comando,
que podemos ver en Help).
I Tenemos los operadores <, >, <=, >=, ==, ! =
que corresponden a menor que, mayor que, menor o igual
que, mayor o igual que, igual que, distinto de;
respectivamente.
I Además si queremos usar varias condiciones, tenemos
&, | que corresponden a y , o ; respectivamente.
tabulate region if edad>=18 & sexo==1

12
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Sintaxis
I Un aspecto fundamental es la sintaxis de los comandos.
Ésta varı́a según las caracterı́sticas de cada comando, y la
podemos revisar para cada uno en el Help.
I En general tendremos:
[bys varlist1:] command [varlist2] [=exp] [if] [in]
[, options]

13
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Estadı́stica descriptiva
I Al analizar datos, tı́picamente nos interesará en primera
instancia conocer frecuencias, promedios, desviaciones
estándar, etc.
I Para esto, STATA tiene múltiples comandos entre los que
contamos:
tabulate
summarize
tabstat
table

14
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Estadı́stica descriptiva
I Queda como propuesto, y se recomienda enérgicamente,
que los exploren. Para esto pueden usar una de las bases de
prueba que trae STATA, las cuales las invocamos usando
sysuse:
sysuse lifeexp, clear
sysuse auto, clear
sysuse census, clear

15
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Summarize
I Entrega estadı́stica descriptiva rápida
I Media, desviación estándar, N, mı́nimo y máximo
I Si se usa la opción , detail se puede obtener más
información
summarize [varlist] [if] [in] [weight] [, options]

16
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Tabstat
I Un poco distinto a summarize, más personalizable
I En opciones, se le puede pedir qué estadı́sticas mostrar.
Opción , stats(mean sd p50) por ejemplo.
I Se puede pedir que nos divida la consulta por otra
variable/categorı́a con , by(varname)
tabstat varlist [if] [in] [weight] [, options]

17
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Tabstat
I Un poco distinto a summarize, más personalizable
I En opciones, se le puede pedir qué estadı́sticas mostrar.
Opción , stats(mean sd p50) por ejemplo.
I Se puede pedir que nos divida la consulta por otra
variable/categorı́a con , by(varname)
tabstat varlist [if] [in] [weight] [, options]

18
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Manipular datos
I El programa nos permite crear y editar variables. Para
esto, los comandos más usados son
generate
egen
rename
recode
label

19
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Ejercicios
Utilizando la base auto.dta, obtenga estadı́stica descriptiva para
mpg y weight de acuerdo a si el tipo de auto es extranjero (fo-
reign) o no. Hint: Utilice el prefijo by foreign: . Luego regresione
mpg contra weight y foreign. Comente sus resultados y diferencias
entre autos extranjeros.

clear all
set more off
sysuse auto.dta
// ... Siga Ud.

20
Introducción Interfaz Do Files Manejo básico de BBDD Sintaxis Estadı́stica descriptiva Manipular datos y variables Ejercicios

Ejercicios
Utilizando la base de la CASEN 2013 (que debe buscar y des-
cargar) realice una descripción de la pobreza en Chile y sus re-
giones. Para esto, tenga en consideración estadı́stica descriptiva
de ingreso, pobreza, número de habitantes por región. Recuerde
que debe utilizar los factores de expansión que la encuesta trae.
Finalmente, realice un gráfico de la distribución de ingresos en
Chile. Luego realı́celo con el logaritmo del ingreso. ¿Qué cambios
ve?

21