Está en la página 1de 6

UNIVERSIDAD ALBERTO HURTADO

FACULTAD DE ECONOMA Y NEGOCIOS


Econometra Ingeniera Comercial para Profesionales
Profesores: Roci lvarez ; Gabriel Moraga
Ayudante: Joaqun Nilo Elgueta.
joaqun.nilo.e@gmail.com

Ayudanta N1
Introduccin de Stata
10 de abril de 2015

Introduccin: El objetivo de esta ayudanta es introducir a los alumnos en el manejo del software
estadstico Stata, entregando comandos y conceptos que les permitirn poder desarrollar la tarea asignada
durante el semestre en curso.
1- Qu es Stata?
Stata es un paquete estadistico, que tiene todos los elementos necesarios para realizar anlizar, manejar y
graficar datos.

2- Cmo luce Stata?


Cuando se inicia el programa podemos distinguir 4 ventanas:
-
-
-
-

Review: En esta ventana aparecen los comandos que han sido utilizados durante la seccin.
Variables: Aqu se encuentra el listado de variables que contiene la base de datos en la que se est
trabajando.
Commands: En esta ventana se introducen los comandos que queremos aplicar para obtener el
resultado deseado.
Results: Es la ventana principal, muestra los resultados de la aplicacin de comandos en la ventana
commands.

3- Reglas de trabajo
Para poder llevar un registro ordenado de todos los comandos que se utilizan y todas las instrucciones que se
quieran ejecutar, tenemos dos archivos que son de mucha utilidad, el primero es el comando log. Este
comando nos permite mantener un registro completo de cada sesion de Stata. Un archivo log es un archivo
que contiene todo lo que tipeamos y todos los resultados que obtenemos de Stata. El segundo son los
archivos do o do-file que contiene un conjunto de comandos de Stata. Este archivo puede crearse con
cualquier editor y la ventaja es que nos permite guardar nuestros comandos en sesiones anteriores y poder
reproducirlos nuevamente.
Como cargar un archivo log:
-
-

Directamente: file logbegin log y lo guardamos como ayudantia Stata.log


Tipeando en la ventana de comando o en el do.file:
log using [direccin donde se guardara]/ [ruta de acceso]/ [nombre de archivo]

Por ejemplo: Si utilizamos la segunda manera (tipiamos en la ventana de comando o escribimos en nuestro
do-file)


log using "ayudantia Stata"

En este archivo se irn guardando en formato texto, todo lo que se realice en Stata. (Sin contar los grficos)
Lo ideal es combinar la utilizacin de un do-file y un log; el primero permite tener en forma ordenada todos
los comandos que se estn utilizando y todas las instrucciones que se quieran ejecutar, el segundo guarda en
un archivo de texto todos los resultados que surgen de este archivo do-file.

4- Como trabajar en Stata


Cuando iniciamos el programa es relevante saber dnde estamos trabajando o en que carpeta se estn
guardando los resultados, donde estn las bases de datos que ocuparemos, etc. Si no se sabe dnde, en que
carpeta o directorio est Stata podemos averiguarlo con el comando:

Comando: pwd
Si queremos cambiar el directorio de trabajo, ejemplo; crearemos una carpeta llamada ayudanta
Econometra y aqu guardaremos todo lo que hagamos en Stata y la base de datos entregada.
El comando para cambiar la carpeta es:
cd ruta donde se encuentra la carpeta

Ejemplo:

cd "/Users/josenilocea/Dropbox/UAH/UAH 2015/Ayudantias 2015/Econometria_ICP/Ayudantia Stata

En este caso le estoy indicando a STATA que se ubique en la carpeta ayudantia Stata


* Es importante tener en cuenta el uso de las comillas al momento de computar el comando, siempre y
cuando el nombre de la carpeta este separado. Para evitar que les salga invalid syntax, pueden poner
el nombre de la carpeta sin espacios.

5- Que es y cmo cargar una base de datos en Stata


La base de datos es el primer paso para poder trabajar con Stata, debemos contar con ella y cargarla en el
programa para poder realizar nuestro trabajo estadstico. Una base de datos es un conjunto (matriz) de
informacin, donde se tienen filas y columnas que en conjunto forman la base de datos.
5.1 Bases de datos en extensin .dta
Las bases de datos en formato Stata tienen extensin .dta.
Ejemplo: La base de datos que ocuparemos para esta ayudanta es WAGE2.dta, lo que nos dice que nuestra
base de datos esta guardada en formato compatible con Stata.
Existen dos maneras de cargar una base de datos:
A) Utilizando una base grabada en nuestro laptop, que tenga formato .dta. En este caso, podemos
apretamos el icono

y buscar la direccin donde se ubica la base de datos.

B) La segunda opcin es abrir la base directamente con un comando (dado que anteriormente ya
establecimos la direccin donde trabajariamos con Stata).
Ejemplo: Podemos copiar la ruta completa en donde esta la base de datos:
use "/Users/josenilocea/Dropbox/UAH/UAH 2015/Ayudantias 2015/Econometria_ICP/Ayudantia Stata/WAGE2.dta

Otra opccin, es indicar directamente el comando y la base de datos que queremos ocupar. En el
apartado anterior indicamos a Stata que trabajariamos en la carpeta ayudantia de econometria.
Dentro de esta carpeta, se encuentra la base de datos que ocuparemos en esta ayudanta.
use WAGE2.dta

5.2 Bases de datos en formato EXCEL (xls, xlsx)


Los siguientes pasos muestran la forma mas simple de importar bases de datos en formato EXCEL:
-

file import Excel Spreadsheet Browse (buscamos el documento en la laptop) Import


first row as variable names (le decimos a Stata que la primera fila contiene a los nombres de las
variables) OK.

6- Principales Comandos
Este apartado se centra en entregar una descripcin de algunos de los comandos mas utilizados, luego lo
aplicamos al ejemplo de la base de datos WAGE2.dta y el do-file que hemos construido. Para una
revisin completa de los comandos vean la bibliografia.

help (h): Con este comando podemos obtener ayuda de Stata. Si computamos help comando,
obtendremos ayuda especfica para dicho comando.

Sintaxis: help command

describe (d): Nos entrega un resumen de los contenidos de la base de datos, nos da informacin
sobre todas las variables que se encuentran en la base de datos. Adems nos entrega informacin
sobre el nmero de variables, observaciones y tamao de la base de datos.
Si solo queremos obtener informacin sobre algunas de las variables de la base de datos, despus de
escribir el comando se computa tambin la(s) variable(s) de inters.

Sintaxis: describe [varlist] [,options]


Ejemplo: Utilizando la base de datos WAGE2.dta, podemos describir solamente la variable de interes, que
en este caso es married.
. describe married
storage

display

value

variable name

type

format

label

married

byte

%10.0g

variable label
married

Count: Tal como su nombre lo indica, nos sirve para contar. Si solo tecleamos el comando count
nos contara las observaciones que hay en la base de datos. Tambin, podemos utilizarlo para contar
con un condicionante, ejemplo: count if black==1, nos cuenta todos los individuos de la base de
datos que cumplan con esa condicion.

Sintaxis: count [if exp] [in range]

Summarize: Calcula y muestra cierta variedad de estadisticas univariadas.

Sintaxis: Summarize [varlist] [weight] [if exp] [in range] [,options]


Ejemplo: utilizando la base de datos WAGE2.dta. Aplicamos el comando y obtenemos, el numero de
observaciones, la media, la desviacin estandar, el mnimo y el mximo.
. summarize age
Variable

Obs

Mean

age

935

33.08021

Std. Dev.

Min

Max

3.107803

28

38

Tabulate: Permite hacer tablas de frecuencias con las variables de interes. Esta tabla nos indica el
numero de observaciones totales y de cada una de las categorias de las variables. Ademas, nos
entrega el porcentaje de cada una de las variables sobre el total y el porcentaje acumulado.

Sintaxis: Tabulate varname [weight] [if exp] [in range] [,options]


Ejemplo: Trabajando con la base de datos WAGE2.dta. Este pantallazo de Stata, nos muestra una tabla con
frecuencias de individios con distintos aos de educacin y nos cuenta la frecuencia de individuos.

Drop/keep: borra/mantiene observaciones (variables) que satisfacen cierta condicion. El ejemplo


mas claro es borrar/mantener una variable.

Sintaxis: drop/keep varlist

Generate/replace: Este comando nos permite generar una nueva variable definida en base a una
expresion numrica, la cual puede contener a otras variables. Replace reemplaza los contenidos de
una variable existente.

Sintaxis: generate newvar =exp [if exp]


A continuacion, se muestran las expresiones mas utilizadas:

Ejemplo: En la base de datos tenemos la variable edad, si estamos interesados en generar la variable edad al
cuadrado tipeamos:
gen age2=age^(2)

Otro ejemplo, en la base de datos se tienen los aos de educacin como una variable. A partir de esta,
podramos generar una nueva variable (teduc), que contenga el nivel de educacin alvanzado por cada
individuo (lo separaremos en menor que 12, igual a 12 y mayor a 12 aos)

Return list: cuando aplicamos un comando (sum, tabulate, describe, etc.), en la memoria temporal
del programa quedan guardadas las estadsticas; el nombre con el que cada una
de estas se guarda se puede saber al tipiar return list, despus de aplicado el comando.

Ejemplo: De la base de datos WAGE2.dta, aplicamos el comando sum que nos entrega estadsticas
descriptivas, luego tipiamos return list y nos entregar por escalar cada una de las estadsticas anteriores.
. sum educ
Variable

Obs

Mean

educ

935

13.46845

Std. Dev.
2.196654

Min

Max

18

. return list
scalars:
r(N) =

935

r(sum_w) =

935

r(mean) =

13.46844919786096

r(Var) =

4.825288277662632

r(sd) =

2.196653882081251

r(min) =

r(max) =

18

r(sum) =

12593

Referencias:

Apuntes: J. Vsquez, Curso Nivelacin STATA Magster en Polticas Pblicas.


http://www.microdatos.cl/doctos_apuntes/Nivelacion_Stata_MPP_2011.pdf

También podría gustarte