Está en la página 1de 12

1.

- Introduccin a Stata

Tipos de archivo

Estructura de los comandos en general

Para construir variables se usa generate y es case sensitive (diferente


mayscula que la minuscula)
Sepuede ejecutar los comandos solo usando las tres primeras letras. Por
ejemplo del comando anterior se usara reg.

1
Configurando el directorio de trabajo en stata
Con esta opcin se le indica stata donde colocar los archivos para trabajar

Tipos de variables

2
2.- manejo de base de datos

Abrir una base de datos


Una vez que ya se definio el directorio de trabajao con el comando CD se usara
el archivo que debe estar con extensin .dta usando el comando USE.
Otra opcin es pegar los datos de un archivo Excel en el editor de datos

Asistente de importacin de archivos


Siguiendo la ruta File-import-excel spread sheet , emerger la siguiente
ventana

3
Describiendo la base de datos
Se puede visualizar la o las variables en la ventana de resultados, se
recomienda usar los comandos edit, browse y list con las opciones if in.
Ejem
*observar los datos
browse
*Describir los datos
describe make price mpg
Cuando se desea aplicar un comando para todas las variables de la base de
datos podr hacerlo
ingresando el comando sin incluir ninguna variable de esta forma Stata tomar
la instruccin para
toda la base de datos.
Creacin de variables

La creacin de las variables tambin se realiza por medio del comando


generate, los comandos en Stata no
es necesario escribirlo en su totalidad.
Ejemplos
generate suma = var1 + var2
gen resta = var1 var2
g multiplicacin = var1 * var2

4
las operaciones que se pueden efectuar las vemos en el siguiente cuadro

En algunas ocasiones se requieren algunos caracteres especiales, uno de ellos


son los caracteres _n y _N o denominadas variables del sistema, _n es un
contador del nmero de observaciones, y _N indica el total de observaciones de
la base de datos.
Para la creacin de variables con condiciones puede utilizar la opcin de la
estructura de comandos [if] [in].
Ejemplos
gen dummy = 1 if TV >5 * crea una variable con valores = 1 si TV > 5, perdido
en otro caso.
list make mpg if mpg>25
list price in 10/20 * crea una lista para las observaciones entre la 10 y 20
list price in -10/l * crea una lista con las ltimas 10 observaciones

5
Aplicando funciones
Se pueden generar variables como resultado de la aplicacin de funciones

Ordenar variables y bases de datos


Para ordenar en forma descendente se recomienda usar el comando gsort de la
siguiente forma:
gsort var1 var2 +var3
El comando anterior nos produce un ordenamiento descendente primero por la
variables VAR1,
seguido por la variable VAR2 y de forma ascendente por la variable VAR3,
indicando que se debe
ubicar un signo (-) para establecer descendente y un signo (+) para orden
ascendente, aunque este
ltimo no es necesario en el comando.
Filtros de bases de datos
Ejemplos de filtros
browse if pop > 10000000
browse if pop > 10000000 & marriage > 100000
browse if pop > 10000000 & marriage > 100000 & popurban > 10000000
browse if pop > 10000000 | marriage > 100000 & popurban > 10000000

Uso del in
browse pop in 1/10
browse pop in f/10 -> f=FIRST, 1=LAST

6
browse pop in 10/l -> HASTA EL ULTIMO
Se puede combinar con que realizar el filtro puede usar los comandos browse,
edit, keep, drop y list.
drop elimina observaciones y/o variables.
keep conserva observaciones y/o variables.
list presenta variables y/o observaciones en la ventana de resultados.
edit permite visualizar los datos en una hoja de datos y podr editar y
modificar los datos.
browse realiza las mismas opciones de edit pero no se puede modificar la
informacin.
Ejemplos
drop death divorce * Elimina las variables death y divorce
keep state pop* medage marriage * Conserva las variables indicadas
drop if medage > 30 * Elimina las observaciones donde medage sea mayor a
30
sort popurban
keep in -10/l * Conserva las ltimas 10 observaciones con mayor popurban

etiquetar variables
Para ponerle nombre o etiqueta a la variable

label var nombrevariable etiqueta variable

lable var precio Precio del auto


creacin de categoras
La forma ms sencilla de crear categoras de variables es por medio del
administrador de variables, la variable que seleccionar debe ser discreta, una
vez inicie el administrador.
debe seleccionar la variable que codificar, luego debe dar clic en Manage
que se encuentra a la derecha de la opcin Value label.

7
modificacin y transformacin de variables

RECODE
recode x (1=2), gen(nx)
se recodifica la variable x, cambiando los valores 1 por valores 2, la variable
transformada se guarda como nx.

combinacion de bases de datos


Stata nos permite realizar diferentes tipos de fusiones de bases de datos, a
continuacin
presentaremos los dos formatos ms importantes, la adicin vertical (merge) y
horizontal (append).

Combinacin Vertical Append

8
Este comando agrega filas a la base de datos, las variables deben como regla
contener los mismos
nombres, el mismo tipo de variable y adems la base de datos sus variables
deben estar ordenadas de igual forma.
En nuestro ejemplo, a la base de datos HOMBRES vamos a adicionar los casos
correspondientes la
informacin de las mujeres as:
use hombres, clear
append using MUJERES

En la nueva base de datos se ha combinado la informacin hombres y mujeres


en una nica base de datos.
Es conveniente despus de este punto salvar save PERSONAS, replace
Combinacin Horizontal Merge
Se usa cuando se quieren traer nuevas variables de una base llamada using a
una base de datos ya
existente o master, ste comando une dos bases de datos utilizando una
variable en comn
(generalmente es una ID, llave o cdigo que identifica las observaciones de la
base de datos). Las
dos bases de datos deben estar guardadas en formato .dta, y deben estar
ordenadas de acuerdo a la variable que se va a pegar. El objetivo de este
comando es agregar variables (columnas).
Para pegar dos bases de datos (A.dta y B.dta), se deben realizar los siguientes
pasos:

1. Ordenar (sort) la base de datos B de acuerdo a las variables con las que se
har la unin de
las bases, es decir de acuerdo al ID, y guardar.
2. Abrir la base A y ordenarla de acuerdo al paso 1.
3. Usar el comando merge
4. Guardar la base de datos (save)

Si la base no est ordenada y contiene datos repetidos emerge el siguiente


error:
Using data not sorted
Master data not sorted

cambio en la organizacin de los datos


Cuando una base de datos tiene ms de una observacin por unidad de estudio
(individuo, pas,

9
empresa, etc.) nos puede interesar slo trabajar con una observacin por
unidad (collapse) o
mantener las observaciones distintas para cada individuo pero que se creen
como variables o
columnas distintas (reshape).
Collapse
Si se tiene una base de datos de hogares, cada observacin es un miembro del
hogar. Si cada hogar dispone de un identificador nico, entonces se puede
formar una base de datos alternativa que contenga una sola observacin por
hogar (en lugar de una observacin por individuo) para cada una de las
variables deseadas. Esta observacin puede contener la media, desviacin
estndar, suma u otro estadstico.
Ejemplo:
collapse (mean) edad (max) educacin (p50) ingreso, by(hogar)

Lo anterior crea una base de datos con cuatro variables, hogar, edad, ingreso y
educacin.

En Stata es posible colapsar bases de datos a travs del comando collapse.


Debe tenerse en cuenta:
1) La(s) variable(s) de agregacin: Variable(s) que definen las nuevas unidades
de observacin
u observaciones agregadas.
2) El(Los) criterio(s) de agregacin: Es la(s) operacin(es) matemtica(s) que
ser(n)
aplicados a la base de datos original para obtener las nuevas unidades de
observacin colapsadas:
suma, media, mediana, cuenta, percentil, etc.
3) La base de datos original ha sido modificada. Debera salvarse con un nuevo
nombre.
Por ejemplo, a partir de la base personas.dta, se puede obtener una base de
datos agregada por
localidad y sexo as:
collapse (mean) edu007, by(localid e03)

10
ANALISIS ESTADISTICO CON STATA
Se usa el comando SUM

11
Calculo de medias con MEAN

Intervalos de confianza

Creacin de tablas

12

También podría gustarte