Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccion Al Satata
Introduccion Al Satata
17 de febrero de 2005
1.
Introducci
on
2.
Personalizando Stata
red29@cam.ac.uk
3.
Hay varias formas en que podemos introducir datos en Stata. Una de las
mas comunes es utilizando el comando insheet seguido por la ruta del
archivo, este comando premite a Stata leer archivos en formato ASCII3 que
son com
unmente realizados en Excel (separados por comas o bien por tabuladores). Otros comandos que pueden ser utilzados son: infile1, infile2 e
infix. Tambien es posible introducir datos a mano utilizando el comando
edit, el cual abre una hoja de calculo. Aunque no es muy recomendable, los
datos pueden ser introducidos a Stata cortandolos desde Excel y pegandolos
en la hoja de calculo de Stata.
Si los datos ya estan en formato de Stata (terminacion .dta), estos pueden
1
El tama
no y posicion de las ventanas puede ser ajustado seg
un las preferencias del
usuario y estas pueden ser salvadas utilizando Prefs Save Windowing Preferences.
2
Es importante se
nalar que Stata es sencible al uso de may
usculas, todos los comandos
Stata deben ser escritos utilizando solo min
usculas.
3
American Standard Code for Information Interchange
3.1.
3.2.
Para ver las observaciones en pantalla, se puede utilizar edit o bien list
seguido por el nombre de la variable o variables que se deseen visualizar.
La diferencia entre edit y list es que el primero despliega toda la hoja
de calculo mientras el segundo despliega los datos en la ventana de resultados.
Comandos: describe, edit, list
3.3.
Para guardar los datos use el comando save seguido por la ruta en donde se
quieren salvar. Para borrar una base de datos no deseada utilice el comando
erase seguido por la ruta. El comando clear descarga los datos de la memoria temporal de Stata; notese que al utilizar clear no se realizara ninguna
advertencia antes de descargar los datos y si la base de datos original ha sido
modificada sin ser salvada estos cambios se perderan.
Comandos: save, erase, clear
4.
Y (AND), O (OR)
>, <
==, ! =
Igual a, Diferente a
>=, <=
Expresiones Aritmeticas
+,
Mas, Menos
, /
Multiplicacion, Division
n, N
N
umero de observacion corriente, N
umero de
observaciones totales
Valor absoluto
cond(x; y; z)
exp()
funcion exponencial
round(x; y)
log()
logaritmo natural
min(x1; x2; : : :)
el mnimo de x1; : : : ; xn
max(x1; x2; : : :)
el maximo de x1; : : : ; xn
sqrt()
raiz cuadrada
sum()
uniform()
Genera n
umeros aleatoreos entre 0 y 1 con
una distribucion uniforme.
egen Es una extencion de generate que contiene una gran cantidad de funciones pre-establecidas con las que se pueden generar nuevas variables.
replace Cambia el contenido de una variable ya existente sustituyendola
por una expresi
on.
6
encode Cuando una variable esta en formato string (es decir no-numerico) no
se pueden obtener estadsticas sobre ella. encode y su opuesto decode
cambian el formato de una variable string a numerico y viceversa. Aletenativamente podemos utilizar los comandos tostring y destring los
cuales realizan las mismas funciones pero con mas opciones.
reshape wide, long Este comando transforma la base de datos de una formato ancho (wide) a uno largo (long) y viceversa. reshape puede transformar de una base de datos como la siguiente en formato ancho:
Cuadro 2: Datos en formato wide
Xij
id sexo
ing80
ing81
ing82
5000
5500
6000
2000
2200
3300
3000
2000
1000
Xij
id
a
no sexo
Ing
80
5500
81
5500
82
6000
80
2000
81
2200
82
3300
80
3000
81
2000
82
1000
keep Seguido por una lista de variables mantiene las variables especificadas
eliminando las no incluidas en la lista. Analogamente el comando drop
elimina las variables que le siguen al comando conservando las noincluidas.
5.
Muchas veces es necesario combinar dos o mas bases de datos para formar
una sola. Para ello se pueden utilizar los comandos merge o append. merge
une dos bases de datos utilizando una variable en com
un. Las dos bases de
datos deben estar en formato .dta (Stata) y las observaciones deben estar
ordenas (utilizando sort) de acuerdo a la variable que sirve como referencia.
El objetivo de merge es anexar variables no observaciones. Por ejemplo:
use ds2
sort recid
save ds2, replace
use ds1
sort recid
merge recid using ds2
sencilla pues solo se tiene que nombrar la base da datos que se desea anexar.
Por ejemplo:
append using ndatos
Por u
ltimo, si se desea contruir una nueva base de datos que contenga informacion condensada de la base original, esto se puede hacer utilizando el
comando collapse. Supanga que tiene una base de datos sobre hogares y que
cada hogar tiene una observacion para cada miembro que lo integra. Si cada
hogar dispone de un identificador u
nico, entonces se puede formar una base
de datos alternativa que contenga una sola observacion por hogar (en lugar
de una observacion por individuo) para cada una de las variables deseadas.
Esta observacion puede contener la media, la desviacion estandar, la suma u
otro estadstico por hogar. Por ejemplo:
collapse (mean) edad educacion ingreso, by(hogar)
El codigo anterior crea una base de datos con cuatro variables (hogar, edad,
educacion e ingreso) con una observacion por hogar, la cual contiene el promedio de cada variable por hogar.
Comandos: merge, append, collapse
6.
10
7.
Resumen
En esta primera sesion aprendimos los puntos mas basicos del funcionamiento de Stata incluyendo la importacion, tranformacion y el manejo de bases
de datos. Otros puntos clave consistieron en el procedimiento para cargar las
bases de datos en formatos diferentes a Stata, as como asignar la suficiente
memoria y tama
no de matriz para cargar los datos y llevar al cabo el analisis. La combinacion de bases de datos y la generacion de nuevas variables
utilizando las expresiones del comando generate fueron entre las tareas mas
importantes de la sesion.
red; si su conexion utiliza un proxy, tiene que configurar Stata, vea help netio.
11