Está en la página 1de 19

Barrido de comandos Generar variables Ejercicio

Metodos Cuantitativos I
Ayudanta Computacional II
Eduardo Coloma
Universidad de Chile
ecoloma@fen.uchile.cl
Marzo, 2014
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Outline
1 Barrido de comandos
2 Generar variables
3 Ejercicio
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Lookfor y Help
Lookfor permite encontrar variables mediante la b usqueda entre
todos los nombres y etiquetas de las variables especicadas en la
base de datos. La sintaxis tipo de este comando es Lookfor
palabra de busqueda.
El comando help (h) despliega un cuadro de ayuda de Stata.
As tambien help otro comando, entrega ayuda especca sobre
alg un comando en particular.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Order y Rename
Un comando que no ayuda a inspeccionar la base de datos, sino
mas bien permite ordenar las variables de la manera que mas nos
acomode es order.
Por ejemplo, si computamos order folio esc sexo luego nos
entregara la base de datos de tal forma que al aplicar el comando
edit la primera variable que veremos sera folio, luego esc, luego
sexo, etc.
Rename se usa para renombrar una variable sin cambiar su
contenido denitivamente. La sintaxis tipo de este comando es
rename old varname new varname.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Drop y Keep
Estos comandos estan relacionados. El primero, drop, elimina
variables u observaciones de los datos en la memoria y conserva las
que no esten especicadas en la lista.
Keep, trabaja del mismo modo que drop excepto que se
especican las variables u observaciones que se desean conservar y
elimmina las que no esten incluidas en la lista.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Summarize
El comando summarize (sum) entrega estadsticas basicas
tales como n umero de observaciones, promedio, desviacion
estandar, mnimo y maximo, de las variables que se
especiquen.
Si solo se escribe sum en Stata Command, se muestran las
estadsticas de todas las variables en la base de datos.
Si al comando sum le agregamos , detail (, d), Stata
entregara una cantidad mas amplia de estadsticas sobre las
variables que se especiquen. Ademas de los estadsticos ya
descritos, entregara los percentiles, la varianza, la asimetra y
la kurtosis.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Summarize
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Tabulate
El comando tabulate (tab) permite hacer tablas de
frecuencia con las variables de interes. La tabla indicara el
n umero de observaciones total y de cada una de las categoras
de la variable, el porcentaje que cada uno representa sobre el
total y el porcentaje acumulado.
Por ejemplo si computamos tab x1 x2, genera todas las
posibles tabulaciones (cruces) de las dos variables.
Tab1 permite hacer esto mismo pero para varias variables
simultaneamente sin cruzar los datos.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Tabulate
Si en vez de las frecuencias, queremos ver el porcentaje . . .
- . . . que sume 100 % en forma horizontal (las) se debe agregar
, row nofreq.
- . . . que sume 100 % en forma vertical (columnas) se debe
agregar , col nofreq.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Tabulate
- . . . y ademas se busca que se muestren ambos porcentajes
(columnas y las), se debe computar tab x1 x2, row col
nofreq. Por ejemplo:
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Tabstat
El comando tabstat permite realizar tablas mas complejas con
las siguientes estadsticas:
mean promedio
count cuenta el n umero de observaciones que tiene valor
n igual que count
sum suma
max maximo
min mnimo
range rango=max-mn
sd desviacion estandar
var varianza
skewness asimetra
kurtosis kurtosis
p1 1st percentile
p50 mediana
median mediana
iqr rango interquantil= p75-p25
q equivalente a especicar p25 p50 p75
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Tabstat
Por ejemplo, si se quiere obtener el promedio, la mediana, el
maximo y el mnimo de ingreso por genero por sexo, se puede
realizar de la siguiente forma:
Al poner by(sexo09) especica que las estadsticas deben ser
entregadas separadamente para cada valor de la variable sexo09.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Replace
Replace es un comando muy util. Este cambia el contenido
de una variable existente sustituyendola por una expresion, en
otras palabras, reemplaza observaciones que cumplen con
cierta condicion que se especica.
Acompa nado del comando generate, es posible generar
variables categoricas de una manera muy sencilla.
Este comando normalmente va acompa nado de condicionales
como if.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Generate
Uno de los comandos mas relevantes en Stata es generate (gen o
g). Este comando genera una nueva variable denida en base a
una expresion numerica, la cual puede contener otras variables.
Algunas de las expresiones mas utilizadas:
+ suma >= mayor o igual & y
- resta > mayor estricto que | o
* multiplicaci on <= menor o igual que exp() exponencial
/ division < menor estricto que ln() logartmo natural
== igual != distinto que sum() suma
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Egen
Egen es una extension del anterior. Este contiene una gran
cantidad de funciones pre-establecidas con las que se pueden
generar nuevas variables. Algunos ejemplos de estas funciones:
count(x1) crea una variable que contiene el n umero de observaciones de x1
group(x . . . z) genera una variable que toma los valores 1,2, . . . para
los grupos formados por las variables entre parentesis
max(x1) genera una variable que contiene el maximo valor de x1
mean(x1) genera una variable que contiene el promedio de x1
median(x1) genera una variable que contiene la mediana de x1
min(x1) genera una variable que contiene el mnimo valor de x1
rmax(x . . . z) maximo valor entre x, . . ., z para cada observacion (la)
rmin(x . . . z) mnimo valor entre x, . . ., z para cada observacion (la)
rmiss(x . . . z) n umero de missing values entre x, . . ., z para cada observacion (la)
rsum(x . . . z) entrega la suma de x, . . ., z para cada observacion (la)
rmean(x . . . z) entrega el promedio de x, . . ., z para cada observacion (la)
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Egen
La mayora de estas funciones pueden ser combinadas con el
comando by, el que permite generar variables seg un
categoras.
Por ejemplo, si se quiere crear el promedio de la experiencia
laboral para cada a no de educacion, una opcion sera la
siguiente:
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Uso del comando tabulate para crear variables
Se puede utilizar el comando tabulate para generar variables
binarias.
Por ejemplo, si se quiere generar variables binarias para cada
categora de la variable genero (hombre y mujer), una opcion
es computar tab sexo, gen(sexo ).
- Como esta variable tiene dos categoras diferentes, se crearan
dos variables binarias o dicotomicas.
- Se generaran rapidamente las variables sexo1 y sexo2.
Es muy optimo cuando se desea generar variables binarias a
partir de una variable que posee varias categoras.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Ejercicio corto
Se le pide, utilizando la encuesta CASEN 2011, lo siguiente:
(1) Elimine el siguiente intervalo de observaciones [200303-200310].
(2) Reemplace por un . los valores 99 de la variable yopraj.
(3) Renombre a la variable secso por sexo.
(4) Tabule la variable edad Que anormalidad observa? Elimine los
valores incoherentes.
(5) Cual es el porcentaje de hombres y mujeres en la muestra?
(6) Cual es la edad promedio y la edad mediana de la muestra,
separando por genero?
(7) Que porcentaje de la muestra se encuentra trabajando, se observan
diferencias por genero? Como cambian los resultados si se acota el
analisis a los individuos entre 20 y 30 a nos de edad?
Hint: Use la variable o1.
ENMEC350/01
Metodos Cuantitativos I
Barrido de comandos Generar variables Ejercicio
Ejercicio corto
(8) Compare la media y la varianza de la variable yopraj (Ingreso
Ocupacion Principal) para hombres y mujeres. Que implicancias
tiene que la distribucion sea muy asimetrica? Calcule el porcentaje
de hombres y mujeres que se encuentran bajo el promedio de ambos
grupos.
(9) Muestre el promedio, mnimo y maximo de la variable yopraj por
tramos de edad, primero debe generar la variable tramos de edad.
(10) Tabule la mediana, media, la desviacion estandar, el mnimo, el
maximo, la curtosis y la simetra del ingreso per capita del individuo
(genere variable y llamela ypcj). Tenga presente para este calculo
la variable ytothaj (Ingreso Total del hogar) y el n umero de
integrantes del hogar numper.
(11) Guarde la base de datos con un nombre nuevo.
ENMEC350/01
Metodos Cuantitativos I

También podría gustarte