Está en la página 1de 26

STATA 13 para Economistas

UNIDAD 1: STATA Y SUS RECURSOS

Pontificia Universidad Católica del Perú 1


Jorge Valdivia

Contenido
UNIDAD 1: STATA Y SUS RECURSOS ................................................................................ 1

Tema 1: STATA 2013 ........................................................................................................ 3


1.1 ¿Qué puedo hacer con STATA 13? ......................................................................... 3
1.1.1 Efectos de tratamiento ...................................................................................... 3
1.1.2 Modelos multinivel ............................................................................................ 4
1.1.3 Potencia y tamaño de muestra ......................................................................... 4
1.1.4 SEM generalizado ............................................................................................ 4
1.1.5 Pronósticos ....................................................................................................... 4
1.1.6 Strings más largos ............................................................................................ 5
1.1.7 Datos panel ...................................................................................................... 5
1.1.8 Project manager ............................................................................................... 5
1.1.9 Tamaño de efecto ............................................................................................. 5
1.1.10 Más documentación .......................................................................................... 5
1.1.11 Más estadísticos ............................................................................................... 6
1.1.12 Y más ............................................................................................................... 6
1.2 Presentaciones de STATA ....................................................................................... 6
1.3 Entorno de trabajo ................................................................................................... 7
1.4 Recursos del STATA ............................................................................................. 15
1.5 Ayuda en STATA: comandos help, search y findit ................................................. 16

Tema 2: Manejo de datos ............................................................................................... 19


2.1 Iniciando una sesión de STATA ............................................................................. 19
2.1.1 Creando un log file.......................................................................................... 19
2.1.2 Abrir y guardar una base de datos .................................................................. 20
2.1.3 Principales comandos ..................................................................................... 20
2.1.4 Estructura de comandos ................................................................................. 24
2.1.5 Ingresando nuevos datos a STATA ................................................................ 25

2 INFOPUC
STATA 13 para Economistas

Tema 1: STATA 2013

1.1 ¿Qué puedo hacer con STATA 13?

STATA es un software de análisis estadístico y econométrico que sirve de herramienta


para el análisis de información en diversas disciplinas tales como las ciencias sociales,
la medicina y otras. STATA es un paquete de tratamiento de datos de apariencia
similar a otros software estadísticos, en el sentido de que se ejecutan de manera
secuencial comandos digitados por el usuario dentro de una sesión. Inicialmente se
creó con la finalidad de analizar los datos de sección cruzada. Sin embargo, en los
últimos años ha alcanzado notoriedad y potencialidad, y ha abarcado campos de la
micro y macroeconometría. A través de la permanente difusión (como en el foro no
oficial Statalist) de nuevos comandos que incorporan complejas técnicas estadísticas y
econométricas ha cautivado a muchos usuarios por su versatilidad y constante
actualización. Entre las potencialidades del STATA destaca la facilidad para manipular
y describir con grandes bases de datos en las que la principal restricción es el tamaño
de la memoria de la computadora. Posee diversas aplicaciones predefinidas:
regresiones por mco, datos de panel, logit, probit, etc. Asimismo, posee una excelente
herramienta para realizar gráficos.

En la versión 13 destacan las siguientes funcionalidades:

1.1.1 Efectos de tratamiento


 Ponderación de probabilidad-inversa
(IPW)

 Ajuste de regresión

 Puntuación de la propensión (PSM)

 Matching de covariables

 Métodos robustos doubly

 Respuestas continuas, binarias y de


conteo

 Modelos de tratamiento endógenos

Pontificia Universidad Católica del Perú 3


Jorge Valdivia

1.1.2 Modelos multinivel


 Binomial negativa

 Logística ordinal

 Probit ordinal

 Logística multinomial

 GLM

 Modelos jerárquicos y cruzados

1.1.3 Potencia y tamaño de muestra


 GARCH multivariable

 Medias, proporciones, varianzas y


correlaciones

 Estudios caso-control y cohorte

 Panel de control interactivo

 Resultados en tablas

 Gráficos automatizados

1.1.4 SEM generalizado


 Respuestas lineales generalizadas: respuestas binarias, de conteo
ordinales

 Modelos multinivel/jerárquicos: modelos anidados y cruzados

 Pendientes aleatorias e interceptos

 Rápido

1.1.5 Pronósticos
 Series de tiempo y paneles

 De uno a miles de ecuaciones

 Identidades

 Añadir factores

 Estático y dinámico

 IC por simulación estocástica

 Comparación de escenarios

4 INFOPUC
STATA 13 para Economistas

1.1.6 Strings más largos


 Dos billones de caracteres

 Strings de texto

 Objetos binarios largos (BLOB)

 Importar/Exportar/ODBC/SQL

 Trabaja como strings de Stata

1.1.7 Datos panel


 Respuesta ordinal

 Probit ordinal de efectos aleatorios

 Logistic ordinal de efectos aleatorios

 Logit multinomial de efectos aleatorios.

 Errores estándar cluster-robusto

1.1.8 Project manager


 Organización de archivos (1-
10,000)

 Múltiples proyectos

 Filtro en nombres de archivo

 Clic para abrir

 Click para ejecutar.

1.1.9 Tamaño de efecto


 Medias

 ANOVA

 Regresión lineal

 Intervalos de confianza

 d de Cohen, g de Hedges,  de Glass

1.1.10 Más documentación


 Navegación fácil y rápida

 Ejemplos totalmente trabajados

 Métodos y fórmulas

Pontificia Universidad Católica del Perú 5


Jorge Valdivia

 Más de 11,000 páginas en total

 Manual de referencia de potencia y tamaño de muestra

 Manual de referencia de tratamiento-efectos

 Manual de referencia de efectos mixtos multinivel STATA 13

1.1.11 Más estadísticos


 Probit ordinal con selección de muestra

 Poisson con covariables endógenas

 Errores estándar robustos para regresión cuantil

 Estimación ML sin programación

 Prefijo polinomio fraccional

 Correlaciones intraclase

 Siete funciones no centrales T y no centrales F.

 Efectos marginales para cambios de status quo.

1.1.12 Y más
 Variables factor ahora muestran etiquetas

 Delimitación en importación con vista previa

 Importación de Haver Analytics

 Calendario de negocios desde datos

 Creación de archivos Word y Excel

 Java plugin API

 FTP y HTTP seguros

1.2 Presentaciones de STATA

Las diferentes presentaciones de STATA se caracterizan según el tipo de usuario y


recursos del computador. Las versiones Stata/SE, Intercooled Stata y Small Stata
varían según el tamaño de la base de datos de análisis:

 Stata/MP - Stata: para computadoras multiprocesador y de núcleo dual

 Stata/SE - Stata: para grandes bases de datos

 Intercooled Stata: versión estándar de Stata

6 INFOPUC
STATA 13 para Economistas

 Small Stata: comúnmente utilizada por estudiantes

Es indiferente la interfaz para todas las presentaciones de STATA.

1.3 Entorno de trabajo

El despliegue de STATA 13 presenta cuatro ventanas diferentes:

Ventanas de STATA
Aquí aparecen los comandos que se han utilizado durante la sesión.
Review
Solo los resultados más recientes son visibles en esta pantalla.
Sirve para utilizar STATA de forma interactiva; es decir, se emplea para
Command crear las líneas de comandos y llevar a cabo las aplicaciones disponibles
en el software.
Nos informa sobre las variables que están disponibles en nuestra base
Variables
de datos para realizar las diversas aplicaciones.
Esta nos permite visualizar los resultados (outputs) de los estadísticos
Results
que pedimos calcular o de los modelos que solicitamos estimar.
Esta ventana nos permite editar las propiedades de las variables y de la
Properties
base de datos, así como ver las propiedades generales.

Pontificia Universidad Católica del Perú 7


Jorge Valdivia

Entorno/Ventanas de STATA

Review Resultados

Variables Comandos Propiedades

El tamaño y posición de las ventanas puede configurarse según las preferencias del
usuario. Estas configuraciones se pueden realizar siguiendo los siguientes pasos:
1. Se selecciona el menú Edit; en la opción Preferences, se elige General
Preferences.
2. En la pestaña Windowing se configuran e ingresan los valores que se desean.

8 INFOPUC
STATA 13 para Economistas

También podemos modificar el color de fondo o las fuentes de la ventana STATA


Results siguiendo los siguientes pasos:
1. En el menú Edit se selecciona la opción Preferences.
2. Se elige la opción General Preferences.

Pontificia Universidad Católica del Perú 9


Jorge Valdivia

3. Se elige la pestaña Result Colors y se personaliza el color que se desea en la


casilla de Color scheme.

Otras ventanas importantes son:

 Stata Editor permite navegar y modificar los datos como si fuese una hoja de
Excel.

 Stata Editor (Browser) permite visualizar los datos, mas no modificarlo.

10 INFOPUC
STATA 13 para Economistas

 Stata Viewer permite acceder a información en línea y también a la ayuda del


programa.

 Stata Graphs presenta el último gráfico realizado.

Pontificia Universidad Católica del Perú 11


Jorge Valdivia

 Stata Variables Manager es una ventana que funciona como un editor de las
variables con el que se puede modificar el nombre, la etiqueta, el formato, las
notas, etc.

 Stata Do-file Editor es una ventana separada en Windows y funciona como un


editor de textos que permite ejecutar una lista de comandos.

12 INFOPUC
STATA 13 para Economistas

Desde la versión 8 de STATA, todos los comandos (excepto los de programación) han
sido implementados con cuadros de diálogo y se puede acceder a ellos desde el menú
principal, el cual está organizado por tópicos:

Menú de comandos de STATA

Seleccionamos una opción desde los menús Data, Graphics o Statistics y llenamos
la caja o cuadro de diálogo correspondiente:

Por ejemplo, para acceder al cuadro de diálogo siguiente, el cual se encuentra en los
menús desplegables, seguimos estos pasos:

1. Seleccionar el menú Statistics y elegir la opción Linear models and related.


2. Seleccionar la opción Linear regression.

Análisis estadístico a través del menú desplegable:

Pontificia Universidad Católica del Perú 13


Jorge Valdivia

Esta forma de trabajar con el programa de manera interactiva es lo que STATA llama
GUI (Graphic User Interface), lo cual es una mejora con respecto de las versiones
anteriores (versiones anteriores a STATA 8). STATA permite trabajar de manera
interactiva y por medio de comandos (al igual que RATS 6, Eviews, SPSS, etc.) debido
a que cada ventana se encuentra asociada a un comando.

La barra de herramientas

Además, STATA presenta una barra de herramientas que permite realizar operaciones
usuales como abrir un archivo, grabarlo, imprimir o ver alguna ventana en particular.

14 INFOPUC
STATA 13 para Economistas

1.4 Recursos del STATA


STATA permite actualizar constantemente sus comandos a través de programas
escritos en un lenguaje llamado “ado-file”. Los propios usuarios realizan dichos
comandos y las nuevas técnicas, y estos se presentan a través de StataList, la lista de
STATA, de suscripción gratuita.

Desde el siguiente enlace http://www.stata.com/statalist/ se discuten las últimas


técnicas y rutinas programadas en STATA, dicha información mantiene una base de
datos desde 1997, con todos los ítems posteados en StataList, los cuales han sido
ubicados en el Boston College Statistical Software Components (SSC).

Pontificia Universidad Católica del Perú 15


Jorge Valdivia

Algunos otros recursos en la red:


http://www.stata.com/
http://www.stata.com/support/faqs/
Portal del STATALIST

1.5 Ayuda en STATA: comandos help, search y findit

Comando help
Este es uno de los comandos más importantes de STATA pues presenta la sintaxis de
los comandos, así como ejemplos de cómo se usan. Para pedirle ayuda a STATA
sobre un comando se escribe en la ventana de comandos help seguido del nombre
del comando que queramos conocer. También se puede acceder directamente a la
ayuda.

A continuación se muestran los siguientes ejemplos:

 help if

 help summarize

 help regression

 help tabulate

16 INFOPUC
STATA 13 para Economistas

La ayuda en STATA se visualiza en el viewer. Sin embargo, todas las copias del
producto cuentan con la documentación en PDF a la cual se puede acceder de la
siguiente manera:

En el menú help se debe hacer clic en el botón PDF Documentation.

Dentro de la ayuda del comando, se observa que a veces las primeras letras del
nombre del comando están subrayadas; esto indica que en lugar de escribir el
comando completo, como summarize, se puede escribir solamente su (o cualquier
forma intermedia).

Pontificia Universidad Católica del Perú 17


Jorge Valdivia

Programando y ejecutando comandos en STATA

Para poder trabajar en el entorno de STATA, se va utilizar la ventana de comandos.


En cuanto a la sintaxis, se va a utilizar la siguiente forma de ejecutar los comandos:

Notemos que todo lo que va entre corchetes es optativo y que en la sintaxis de los
comandos primero se ponen los comandos seguidos de una explicación (normalmente
las variables que queremos ejecutar o alguna explicación relativa a cómo ejecutar el
comando), luego el peso (weigths); los condicionales (if) preceden a los rangos (in) y
les siguen las opciones después de un coma:
 [varlist] Es la lista de variables.
 [if] Debe estar seguida de una expresión lógica para que solo los datos que cumplan
con la condición puedan incluirse en dicho análisis.
 [in] Permite indicar el rango de los datos que se desean analizar.
 [weight] Son los pesos o las ponderaciones.
 [options] Son las opciones de cada comando que se está utilizando. Siempre se
antepone una coma a las opciones.

18 INFOPUC
STATA 13 para Economistas

Tema 2: Manejo de datos

2.1 Iniciando una sesión de STATA

2.1.1 Creando un log file

STATA permite guardar un registro de los comandos y los resultados que van
apareciendo en la ventana de resultados. Para crear un archivo de bitácora se
usa el comando log using: log using bitácora
Por defecto se guarda en el directorio en uso y en formato SMCL (que es el que
usa STATA) para presentar los resultados.

Para parar momentáneamente el registro de


log off
la bitácora:
Para reanudar el registro de la bitácora: log on
sysuse auto
Este comando será registrado:
tab rep78
Para detener la bitácora: log close
Para reanudar una bitácora: log using bitácora, append
Para sobrescribir una bitácora: log using bitacora, replace
Para ver una bitácora: type bitacora.smcl

Nota: Si se quieren guardar los resultados en un archivo


de texto, se debe escribir la siguiente sintaxis:
log using bitácora, text

Esta se guardara automáticamente en este formato y se podrá abrir con el bloc


de notas.

Pontificia Universidad Católica del Perú 19


Jorge Valdivia

2.1.2 Abrir y guardar una base de datos

La forma como STATA carga los datos a la memoria es similar a la de un


procesador de textos o a la de una hoja de cálculo. No se realizan los cambios
hasta que el usuario los guarda explícitamente.

Cuando se emplea el comando use, los datos se cargan a la memoria del


ordenador. Para guardar los datos se debe emplear el comando save. Es
recomendable no sobrescribir los datos y trabajar en un directorio diferente a
aquel en el que se encuentran los datos originales. Los datos pueden cargarse al
programa utilizando el comando use seguido por la ruta en donde se encuentra
la base de datos.
sysuse auto
save "auto.dta”

2.1.3 Principales comandos

COMANDO DESCRIPCIÓN

help Ayuda de programa STATA para comandos


log Uso de archivos de bitácora
use Abrir una base de datos en STATA (extensión .dta)
edit Ingreso de datos por medio de ventana de STATA Editor
codebook Muestra variables con estadísticos descriptivos
describe Describe contenido de datos en memoria o sobre el disco
save Guarda los datos en disco con extensión *.dta
list Lista de valores de variable

Selecciona observaciones cumpliendo cierta condición para la


if
ejecución del comando
drop Borrar variable o dato en memoria
keep Borra variables o datos no seleccionados
label variable Comando de etiqueta de variables
label define Primer paso para etiquetar valores de una variable
label values Segundo paso para etiquetar valores de una variable

20 INFOPUC
STATA 13 para Economistas

Ejemplo:
El ejercicio consiste en abrir una base de datos de nombre auto, la cual se
puede abrir con el comando sysuse para luego guardarla en una ruta específica
y volver a abrirla. En la ventana de comandos se debe escribir lo siguiente:

sysuse auto

1. En primer lugar se indica la ruta del directorio de trabajo a través del comando
cd:1
cd “C:\Users\jvaldiviar\Desktop\STATA 13” (en el ejemplo)

2. Una vez que se ha definido la carpeta de trabajo, se guardará la base de


datos a través del comando save:
save auto.dta

3. Finalmente, cuando se tenga el archivo guardado, se invocará a la base de


datos utilizando el comando use:
use auto.dta
1
Es necesario indicar una ruta en el disco a STATA en el que se van a almacenar y ubicar los
archivos con los que se trabaje. Esto es necesario para poder abrir, guardar o utilizar archivos,
gráficos, bases de datos, etc.

Pontificia Universidad Católica del Perú 21


Jorge Valdivia

Al abrir la base de datos se cargará la ventana de variables. Para pedir ayuda


sobre el comando se deberá invocar la ayuda de STATA:
help use

Uso del comando a través del help

22 INFOPUC
STATA 13 para Economistas

4. Para conocer el contenido de la base se emplearán los comandos describe y codebook:

El comando describe se emplea Comando describe


para describir el contenido de
datos en la memoria del
computador. Brinda la siguiente
información:
 Contenido de la base de
datos de: (ruta del archivo)
 Numero de observaciones,
variables
 Fecha y tamaño de la
memoria empleada
 Nombre de la variable,
tipo de almacenaje (string
o numérica), y la etiqueta
de la variable
 El comando codebook se Comando codebook
emplea para describir el
contenido de las variables de
manera detallada, brindando
información como rango,
máximo, mínimo, media,
varianza, missings, etc. El
contenido mostrado depende
de cada variable.

5. Otras formas de abrir una base de datos:

Al digitar en la línea de comandos la siguiente sintaxis:

use auto.dta in 1/10

Se le indica a STATA la apertura de los 10 primeros registros de la base de datos.


Este tipo de órdenes se aplicará cuando se desee explorar la base de datos sin
necesidad de cargar la base completa.

Pontificia Universidad Católica del Perú 23


Jorge Valdivia

De la misma manera, es posible aplicar filtros que indiquen qué parte de la base
de datos se utilizará. En la base auto, la variable price representa el total de
miembros del hogar. Por tanto, si está interesado en conocer solo los precios
mayores a 3000, se aplicará el siguiente condicional:

use auto if price>3000

En muchas ocasiones solo serán de nuestro interés algunas de las variables


contenidas en la base de datos. Para ello se empleará la siguiente sintaxis:

use make price mpg rep78 using auto

Donde los comandos empleados son use y using; mientras que las variables de
interés son make, price, mpg y rep78. Como en los casos anteriores, la base de
datos se denomina auto. Cabe mencionar que no ha sido necesario incorporar el
nombre del directorio debido a que eso fue establecido líneas arriba a través del
comando cd.

2.1.4 Estructura de comandos

En función al análisis de datos que se desee realizar, la estructura de la sintaxis


cambiará con la finalidad de elaborar reportes según las necesidades del
investigador.

Por ejemplo, el comando summarize brinda reportes de los principales


estadísticos de la base de datos. Dicho comando se emplea de las siguientes
maneras:

summarize price if price>3500

24 INFOPUC
STATA 13 para Economistas

by foreign: summarize price if price>3500

summarize price, detail

2.1.5 Ingresando nuevos datos a STATA

Donde los comandos empleados son use y using; mientras que las variables de
interés son make, price, mpg y rep78. Como en los casos anteriores, la base de
datos se denomina auto. Cabe mencionar que no ha sido necesario incorporar el
nombre del directorio debido a que eso fue establecido líneas arriba a través del
comando cd.

Pontificia Universidad Católica del Perú 25


Jorge Valdivia

Una vez abierto, aparece la ventada Stata Editor, la que permite ingresar
información libremente. Si se escriben números, se va generar una variable
numérica que va aparecer de color negro; si se escriben palabras, la data va a
aparecer en color rojo. A este tipo de datos se les llaman variables string. Los
espacios en blanco van a estar representados por un punto (missing data).

26 INFOPUC

También podría gustarte