Está en la página 1de 8

Introducción a Stata

Manejo y Análisis de Bases de Datos


Manejo de Base de Datos con Stata
• Creación y transformación de variables
▪ generate permite crear variables
▪ egen extensión del comando generate
▪ replace permite modificar alguna de las variables

Relational
Arithmetic Logical (numeric and string)

+ addition & and > greater than


- subtraction | or < less than
* multiplication ! not >= > or equal
/ division ~ not <= < or equal
^ power == equal
- negation != not equal
+ string concatenation ~= not equal
Manejo de Base de Datos con Stata
• Filtrando las bases de datos
▪ drop elimina variables
▪ drop if elimina observaciones que cumplen una condición
▪ keep mantiene las variables listadas
▪ keep if mantiene las observaciones que cumplen una condición
▪ keep if inlist(var,1,5,8) mantiene si la variable var toma los
valores 1,5,8 (permite cadena de caracteres)
▪ sample 25 muestrea aleatoria del 25% de la base
▪ set seed # permite fijar la semilla para muestras aleatorias
Manejo de Base de Datos con Stata
• Combinando bases de datos
▪ append agrega observaciones de otra base de datos
▪ merge 1:1 id using base2.dta permite agregar variables uno a uno de la
base 2
▪ reclink permite hacer combinaciones horizontales utilizando matching
probabilístico
▪ jarowinkler permite hacer combinaciones horizontales creando una
distancia entre dos cadenas de caracteres
Análisis Estadístico
• Tablas Estadísticas
▪ summarize permite hacer estadística descriptiva, opción detail entrega más
esdatígrafos
▪ tabstat permite generer esdatígrafos por agrupaciones
▪ collapse condensa la base de datos, una forma de hacer tablas dinámicas
▪ correlate tabla de correlación entre variables que se listan
Gráficos en Stata
• Usuales
▪ histogram genera un histograma de la variable
▪ kdensity permite ilustrar un histograma suavizado
▪ La sintaxis general es:
graph <tipo gráfico> y1 y2 x [in] [if], <plot options>
by(var)
Modelación Econométrica
• Algunos modelos
▪ regress price mpg weight regresión por mínimos cuadrados ordinarios
▪ Opción vce(robust), permite errores estándar robustos
▪ probit foreign turn price, vce(robust) estima modelo probit con
errores estándar robustos
▪ bootstrap, reps(100): regress mpg weight calcula regresión
utilizando bootstrap
Herramientas que comparte la comunidad
• Trabajando con big data
– https://gtools.readthedocs.io/en/latest/usage/gcollapse/
– Para instalar
▪ ssc install gtools
▪ gtools, upgrade
▪ Contiene funciones habituales, pero se ejecutan con mayor velocidad
▪ sumup permite hacer tablas estadísticas con mayor flexibilidad (para ventana de
resultados)
▪ Revisar web de Ben Jann http://repec.sowi.unibe.ch/stata/

También podría gustarte