Está en la página 1de 21

INTRODUCCIÓN A STATA

Introducción a STATA
• STATA es un sistema que permite la gestión de
base de datos y la realización de cálculos
estadísticos y econométricos.
• Una ventaja de STATA es la amplia difusión del
programa y la disponibilidad de comandos
que otros programas no tiene.
• Además, admite la creación de nuevos
comandos por parte del usuario, lo que le
otorga amplias posibilidades de expansión.
Introducción a STATA
• La primera interface de STATA es un conjunto de
cuatro ventanas:
– “Review”: muestra el historial de comandos
recientemente utilizados.
– “Variables”: expone las variables que comprenden el
dataset actualmente en memoria.
– “Results”: es la ventana más grande y muestra los
resultados obtenidos de la aplicación de los
comandos.
– “Command”: en esta ventana el usuario introduce
comandos mediante el teclado
Sintaxis del entorno
• STATA funciona a partir de la especificación de
comandos por parte del usuario. Como la
mayoría de programas STATA tiene una
sintaxis específica que siguen la siguiente
estructura:
[by varlist:] comando [varlist] [=exp] [if exp] [in
range] [weight] [, opciones]
El único elemento obligatorio siempre de la
estructura es el comando.
Base de Datos
• Invocamos una base de datos que está en el
entorno programado de STATA
– sysuse auto
Este dataset tiene un conjunto de información de 74
vehículos.
Generalmente el dataset no está en el entorno
programado sino que lo tenemos en alguna parte
del disco duro del PC. El comando para invocar un
dataset que está en el escritorio y que se llama auto
es:
use C:\Users\Mauro\Desktop\auto
Se puede ver que todas las ventanas se modificaron.
Comandos Básicos
• El comando summarize indica el resumen
estadístico de todas las variables. Cuando se
indica la variable a resumir no resume el resto.
– summarize
– summarize price
• La ejecución del comando puede restringirse para
un grupo específico con el condicional if:
– summarize weight if price>4500
Con esta expresión se calcula el resumen de la
descripción estadística de la variable weight para los
automóviles con precio superior a 4500.
Comandos Básicos
• Los condicionales pueden ser utilizados con operadores
de comparación o con operadores lógicos:
– De comparación: == igual; != no igual; >, <, >=, <=, mayor,
menor, mayor o igual, menor o igual.
– Lógicos: & “y”; | “o”; ! “no”.
Ejemplo:
summarize length if price > 4500 & (length < 160 | weight
>3000).
Luego de ejecutar un comando STATA guarda información
sobre las estimaciones realizadas según sea el tipo de
comando. Para saber qué información se guarda, luego de
ejecutado el programa se invoca el comando:
return list
Con display podemos ver el valor de cada dato almacenado.
Comandos Básicos
• Para ordenar el dataset se utilizan los comandos
sort (ascendente) y gsort (descendente):
– sort weight
– gsort -weight
• Para generar una nueva variable se utiliza el
comando generate y para reemplazar el valor de
una variable se utiliza replace:
– generate var1=1000
– replace var1=price*2
Comandos Básicos
• Se pueden crear variables con valores nulos (valor
nulo diferente a cero).
– generate nullval=.
• También se pueden generar valores a partir de
datos almacenados luego de ejecutar un
comando:
– sum weight
– gen weight_prom=weight/r(mean)
• Se puede reemplazar el valor de una variable
para un rango determinado:
– replace var1=8000 if price<8000
Comandos Básicos
• Los comandos se pueden ejecutar según alguna
categoría que clasifique a los registros:
– sort foreign
– by foreign: summarize price
• Es indispensable tener ordenado el dataset antes de
dar la instrucción.
• En el ejemplo se hizo el summarize de la variable
precio según el origen extranjero o doméstico de los
autos.
• Para eliminar variable u observaciones del dataset se
utiliza el comando drop :
– drop if price<3300
– drop turn
Comandos Básicos
• Adicionalmente, STATA ejecuta los comandos
con distintas opciones que se especifican
después de la sentencia separado de una
coma.
• Con esta opción se da una información más
detallada de la variable weight. Las opciones
cambian según el comando que se busca
ejecutar.
Comandos Básicos
• Un comando bastante útil es tabulate. Este
comando permite tabular la información de una
variable según los distintos valores que toma. En
el siguiente ejemplo se tabulan los registros
según su fabricación nacional o extranjera. En la
pantalla de resultados se indica el número y
porcentaje de autos fabricados internamente y
fabricados en el exterior.
– tabulate foreign
• Se puede combinar el tabulado de dos variables:
– tabulate foreign headroom
Comandos Básicos
• Un comando con el que se puede tener un
resumen de estadísticas descriptivas más
amplio es tabstat. En la opción de este
comando se especifica qué estadísticas se
quieren obtener de cada variable. Si no se
indica nada nos calcula únicamente la media.
– tabstat price, statistics(mean sum count max min
range sd variance cv p10 median p90)
Trabajando con archivos .do y .log
• Un archivo .do se utiliza para trabajar toda la
secuencia de comandos en un solo
documento de texto.
• De otro lado, un archivo .log almacena todos
los resultados de las sentencias ejecutadas.
• Cuando trabajemos en STATA tendremos tres
tipos de archivos: .do - .dta - .log
Trabajando con archivos .do y .log
• Trabajemos de ahora en adelante con archivos
.do.
• El do-file editor tiene una barra de menú que
permite gestionar, administrar y ejecutar, la
secuencia de comandos que estemos
utilizando.
• Se pueden insertar comentarios en varias
líneas /* … */ o en una sola línea *.
• Ejecutemos el primer archivo .do.
Trabajando con archivos .do y .log
• Importante: utilizar siempre los códigos y las variables
y registros generados en letra minúnscula.
• Ejecutemos las siguientes líneas en el do file.
*Introducción a STATA - DESARROLLO ECONÓMICO
clear
sysuse auto
sort foreign
by foreign: summarize price
tabulate foreign headroom
generate nullval=.
Trabajando con archivos .do y .log
• Con la secuencia de comandos en un do file,
tendremos disponible siempre esa secuencia
cuando la guardemos (trabajando en la ventana
de comandos no!).
• Comando cd: Se utiliza para indicar la carpeta en
la que vamos a guardar toda la información y
donde se ubican los dataset y los programas .do
que utilizamos.
• En este caso: cd C:\Users\Mauro\Desktop\stata
Trabajando con archivos .do y .log
• En nuestro do file creamos un archivo .log para guardar los
resultados obtenidos en la secuencia de comandos (cada
vez que ejecutemos el do file creará el archivo .log para que
eso no sucede especificamos text replace).
*Introducción a STATA - DESARROLLO ECONÓMICO
clear
sysuse auto
log using resultado.log, text replace
sort foreign
by foreign: summarize price
tabulate foreign headroom
generate nullval=.
log close
Base de datos
• La base de datos en formatos de STATA es .dta.
• Cuando no se tienen las bases en formato .dta, se
pueden importar y transformar a ese formato.
• Por ejemplo si tenemos una base de datos en formato
.sav, la convertimos a .txt con ese formato ejecutamos
la sentencia:
– Insheet using base.txt
• Tipos de datos almacenados en las variables de la base:
– Números
– Palabras
– Fecha
Base de datos

Se recomienda trabajar con datos integer


para datos sin decimales y float para variables
con datos que tengan decimales, aunque esto
depende del tipo de variable.
Macros locales
• Una macro local asigna un valor constante a lo largo de una
secuencia de comandos o en un programa. Las macro
locales se borran cuando se deja de correr la secuencia de
comandos (a veces es más útil el uso de escalares).
• Ejemplo en texto
– local curso=“desarrollo economico”
– display “`curso’”
• Ejemplo numérico
sysuse auto
sum price
local media_p=r(mean)
gen price2=price/`media’

También podría gustarte