Documentos de Académico
Documentos de Profesional
Documentos de Cultura
cd “directorio/…”
, es la opción extra en stata clear limpia la memoria antes de introducir una nueva base.
replace implica reemplazar la base existente, a veces lo mejor es guardarlo con otro nombre,
sino ponemos el mismo nombre tenemos el nombre por defecto
save, replace
clear all
sys dir
EJEMPLO
Usaremos la base auto disponible en la pág. de stata para explorar los comandos de aquí en
adelante.
Nota: el punto (.) implica el comando que se usó, escríbalo sin el punto
describe
. des
describe make
. des make
3.-Resumir una variable (price) con media, desviación estándar, mínimo, máximo y numero
de observaciones
summarize price
sum price
. sum price
sum price, de
. sum price, de
Price
Percentiles Smallest
1% 3291 3291
5% 3748 3299
10% 3895 3667 Obs 74
25% 4195 3748 Sum of Wgt. 74
Resumir dos variables (price headroom) con media, desviación estándar, mínimo, máximo y
numero de observaciones
. sum price headroom , de
Price
Percentiles Smallest
1% 3291 3291
5% 3748 3299
10% 3895 3667 Obs 74
25% 4195 3748 Sum of Wgt. 74
Headroom (in.)
Percentiles Smallest
1% 1.5 1.5
5% 1.5 1.5
10% 2 1.5 Obs 74
25% 2.5 1.5 Sum of Wgt. 74
. gen var2=.
(74 missing values generated)
. gen var3=0
Var1 es una variable llena de unos, var2 es una variable sin valores (missing values), var3 es
una variable llena de ceros.
Reemplazar variables
. replace var2=1.13
(74 real changes made)
Reemplazar una variable existente con nuevos valores ejemplo 1.13
suma var1 + var2 (númericas)
. gen var4=var1+var2
. gen var5=var4-var2
. gen var6=var5/var4
. gen var9=var5/var5
. replace var1=var1*5
(74 real changes made)
. gen lprod=log(price)
. gen lprice2=ln(price)
Las dos nuevas variables tienen los mismos valores, puedes verlas usando por ejemplo una
lista
. gen price2=price*price
. gen price1=price^2
crear una variable de conteo (cuenta desde la primera observación hasta la ultima en la base)
gen conteo=_n
gen conteototal=_N
conteo conteo~l
1. 1 74
2. 2 74
3. 3 74
4. 4 74
5. 5 74
6. 6 74
7. 7 74
8. 8 74
9. 9 74
10. 10 74
.
Nota: stata identifica mayúsculas y minúsculas, por lo tanto Price y price serian dos variables
diferentes para stata.
Generar una variable como el máximo valor de otra, ejemplo una variable como el máximo
valor del precio
egen maxprice=max(price)
egen minprice=min(price)
maxprice minprice
1. 15906 3291
2. 15906 3291
3. 15906 3291
4. 15906 3291
5. 15906 3291
egen meanprice=mean(price)
. display 5/5
1
. dis 8*9
72
Por ejemplo, queremos ver la t-student de la tabla a un 5% de probabilidad con dos colas con
17 grados de libertad (n-k), tenemos
. . display invttail(17,0.025)
2.1098156
Nota: en excel podemos usar =+INV.T.2C(0.05;17), ojo la diferencia de 0.025 en stata es que
por defecto usa una cola, para dos colas dividimos 0.05/2
dis tprob(17,2.1098156)=0.05
. dis tprob(17,2.1098156)
.05
Podemos también obtener los valores de la tabla F, por ejemplo para dos grados de libertad en
el numerador y 18 en el denominador, al 5% de probabilidad, tenemos
count
price foreign
1. 4,099 Domestic
2. 4,749 Domestic
3. 3,799 Domestic
4. 4,816 Domestic
5. 7,827 Domestic
6. 5,788 Domestic
7. 4,453 Domestic
8. 5,189 Domestic
9. 10,372 Domestic
10. 4,082 Domestic
Contar si alguna variable tiene una variable especifica, por ejemplo quiero saber si la variable
rep78 tiene observaciones perdidas (missing values), escribiria
. count if rep78==.
5
Si queremos reemplazar los puntos por valores, por ejemplo con ceros, usamos el comando
replace ya que la variable rep78 ya existe
browse
Te muestra la ventana con los datos (no puedes editar solo ver)
edit
Puedes aquí editar las variables (no aconsejable)
price mpg
price 1.0000
mpg -0.4686 1.0000
Tabular una variable categórica (sexo, educación, raza, etc.) para mostrar sus frecuencias. Por
ejemplo, queremos tabular la variable foreign que es categórica para saber si el carro es
extranjero o nacional, escribimos tabulate o solo tab
. tab foreign
Total 74 100.00
Si queremos saber los valores que toman domestic y foreign ya que tienen etiquetas (nombres
puestos sobre el numero en la memoria del stata para entender mejor el código de la
variable), podemos quitarle la etiqueta
0 52 70.27 70.27
1 22 29.73 100.00
Total 74 100.00
Tabular una variable y mostrar el resumen de otra, por ejemplo, queremos tabular el tipo de
carro es extranjero o nacional (variable foreign) y mostrar su precio (price), la tabla mostraría
la media del precio para tipo de carro extranjero o nacional.
. tab foreign, sum(price)
Summary of Price
Car type Mean Std. Dev. Freq.
Si queremos por ejemplo tabular la marca del carro (make) y si es domestico o extranjero (la
variable foreign), tipiamos.
. tab make foreign
Car type
Make and Model Domestic Foreign Total
AMC Concord 1 0 1
AMC Pacer 1 0 1
AMC Spirit 1 0 1
Audi 5000 0 1 1
Audi Fox 0 1 1
BMW 320i 0 1 1
Buick Century 1 0 1
Buick Electra 1 0 1
Buick LeSabre 1 0 1
Buick Opel 1 0 1
Buick Regal 1 0 1
GRAFICOS
Un scatter (nube de puntos) entre precio (Price) y kilometraje del carro (mpg)
. scatter price mpg
adicionalmente Podemos condicionarlos, por ejemplo, foreign es una categórica que identifica
con un cero si es nacional y un 1 si es extranjero el carro, podemos hacer dos scatter (nube de
puntos separando las observaciones entre nacionales y extranjeras, es decir: