Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Econometra Ingeniera Comercial para Profesionales
Profesores: Roci lvarez ; Gabriel Moraga
Ayudante: Joaqun Nilo Elgueta.
joaqun.nilo.e@gmail.com
Ayudanta N1
Introduccin de Stata
10 de abril de 2015
Introduccin: El objetivo de esta ayudanta es introducir a los alumnos en el manejo del software
estadstico Stata, entregando comandos y conceptos que les permitirn poder desarrollar la tarea asignada
durante el semestre en curso.
1- Qu es Stata?
Stata es un paquete estadistico, que tiene todos los elementos necesarios para realizar anlizar, manejar y
graficar datos.
Review: En esta ventana aparecen los comandos que han sido utilizados durante la seccin.
Variables: Aqu se encuentra el listado de variables que contiene la base de datos en la que se est
trabajando.
Commands: En esta ventana se introducen los comandos que queremos aplicar para obtener el
resultado deseado.
Results: Es la ventana principal, muestra los resultados de la aplicacin de comandos en la ventana
commands.
3- Reglas de trabajo
Para poder llevar un registro ordenado de todos los comandos que se utilizan y todas las instrucciones que se
quieran ejecutar, tenemos dos archivos que son de mucha utilidad, el primero es el comando log. Este
comando nos permite mantener un registro completo de cada sesion de Stata. Un archivo log es un archivo
que contiene todo lo que tipeamos y todos los resultados que obtenemos de Stata. El segundo son los
archivos do o do-file que contiene un conjunto de comandos de Stata. Este archivo puede crearse con
cualquier editor y la ventaja es que nos permite guardar nuestros comandos en sesiones anteriores y poder
reproducirlos nuevamente.
Como cargar un archivo log:
-
-
Por ejemplo: Si utilizamos la segunda manera (tipiamos en la ventana de comando o escribimos en nuestro
do-file)
log using "ayudantia Stata"
En este archivo se irn guardando en formato texto, todo lo que se realice en Stata. (Sin contar los grficos)
Lo ideal es combinar la utilizacin de un do-file y un log; el primero permite tener en forma ordenada todos
los comandos que se estn utilizando y todas las instrucciones que se quieran ejecutar, el segundo guarda en
un archivo de texto todos los resultados que surgen de este archivo do-file.
Comando: pwd
Si queremos cambiar el directorio de trabajo, ejemplo; crearemos una carpeta llamada ayudanta
Econometra y aqu guardaremos todo lo que hagamos en Stata y la base de datos entregada.
El comando para cambiar la carpeta es:
cd ruta donde se encuentra la carpeta
Ejemplo:
cd "/Users/josenilocea/Dropbox/UAH/UAH 2015/Ayudantias 2015/Econometria_ICP/Ayudantia Stata
En este caso le estoy indicando a STATA que se ubique en la carpeta ayudantia Stata
* Es importante tener en cuenta el uso de las comillas al momento de computar el comando, siempre y
cuando el nombre de la carpeta este separado. Para evitar que les salga invalid syntax, pueden poner
el nombre de la carpeta sin espacios.
B) La segunda opcin es abrir la base directamente con un comando (dado que anteriormente ya
establecimos la direccin donde trabajariamos con Stata).
Ejemplo: Podemos copiar la ruta completa en donde esta la base de datos:
use "/Users/josenilocea/Dropbox/UAH/UAH 2015/Ayudantias 2015/Econometria_ICP/Ayudantia Stata/WAGE2.dta
Otra opccin, es indicar directamente el comando y la base de datos que queremos ocupar. En el
apartado anterior indicamos a Stata que trabajariamos en la carpeta ayudantia de econometria.
Dentro de esta carpeta, se encuentra la base de datos que ocuparemos en esta ayudanta.
use WAGE2.dta
6- Principales Comandos
Este apartado se centra en entregar una descripcin de algunos de los comandos mas utilizados, luego lo
aplicamos al ejemplo de la base de datos WAGE2.dta y el do-file que hemos construido. Para una
revisin completa de los comandos vean la bibliografia.
help (h): Con este comando podemos obtener ayuda de Stata. Si computamos help comando,
obtendremos ayuda especfica para dicho comando.
describe (d): Nos entrega un resumen de los contenidos de la base de datos, nos da informacin
sobre todas las variables que se encuentran en la base de datos. Adems nos entrega informacin
sobre el nmero de variables, observaciones y tamao de la base de datos.
Si solo queremos obtener informacin sobre algunas de las variables de la base de datos, despus de
escribir el comando se computa tambin la(s) variable(s) de inters.
display
value
variable name
type
format
label
married
byte
%10.0g
variable label
married
Count: Tal como su nombre lo indica, nos sirve para contar. Si solo tecleamos el comando count
nos contara las observaciones que hay en la base de datos. Tambin, podemos utilizarlo para contar
con un condicionante, ejemplo: count if black==1, nos cuenta todos los individuos de la base de
datos que cumplan con esa condicion.
Obs
Mean
age
935
33.08021
Std. Dev.
Min
Max
3.107803
28
38
Tabulate: Permite hacer tablas de frecuencias con las variables de interes. Esta tabla nos indica el
numero de observaciones totales y de cada una de las categorias de las variables. Ademas, nos
entrega el porcentaje de cada una de las variables sobre el total y el porcentaje acumulado.
Generate/replace: Este comando nos permite generar una nueva variable definida en base a una
expresion numrica, la cual puede contener a otras variables. Replace reemplaza los contenidos de
una variable existente.
Ejemplo: En la base de datos tenemos la variable edad, si estamos interesados en generar la variable edad al
cuadrado tipeamos:
gen age2=age^(2)
Otro ejemplo, en la base de datos se tienen los aos de educacin como una variable. A partir de esta,
podramos generar una nueva variable (teduc), que contenga el nivel de educacin alvanzado por cada
individuo (lo separaremos en menor que 12, igual a 12 y mayor a 12 aos)
Return list: cuando aplicamos un comando (sum, tabulate, describe, etc.), en la memoria temporal
del programa quedan guardadas las estadsticas; el nombre con el que cada una
de estas se guarda se puede saber al tipiar return list, despus de aplicado el comando.
Ejemplo: De la base de datos WAGE2.dta, aplicamos el comando sum que nos entrega estadsticas
descriptivas, luego tipiamos return list y nos entregar por escalar cada una de las estadsticas anteriores.
. sum educ
Variable
Obs
Mean
educ
935
13.46845
Std. Dev.
2.196654
Min
Max
18
. return list
scalars:
r(N) =
935
r(sum_w) =
935
r(mean) =
13.46844919786096
r(Var) =
4.825288277662632
r(sd) =
2.196653882081251
r(min) =
r(max) =
18
r(sum) =
12593
Referencias: