Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Str18: texto
Describe:
Cuando utilizamos una base de datos q no está en el disco duro utilizo use
Comandos:
EJ: summarize length if price > 4500 & (length < 160 | weight >3000)
-Después de ejecutar le damos return list es decir guarda información en la memoria interna
-Para ordenar le damos sort según la variable que le indiquemos
Para ordenar de maneda descendiente colocamos gsort –weight
-Para generar una nueva variable se utiliza generate y reemplaza el valor de una variable se utiliza
replace
Ó
Replace var1=Price*2
-El valor nulo no es cero, significa que no hay datos pero no puede ser 0
Generate nullval=.
También se pueden generar valores a partir de datos almacenados luego de ejecutar un comando:
Sum weight
Gen weigth_prom=weight/r(mean)
-Tambien se puede reemplazar el valor de una variable para un rango determinado:
-Los comandos se pueden ejecutar según alguna categoría que clasifique a los registros:
Sort foreign
Drop if Price<3300
Drop turn
-tabulate:
Permite tabular la información de una variable según los distintos valores que toma. Ej, nacional –
extranjera
Tabulate foreign
Tabstat
Tabstat Price, statistics( mean sum count max min range sd variance cv p10 median p90
ARCHIVOS
.do: se utiliza para trabajar archivos docx en secuencia (textos planos que tienen muchas líneas)
en el caso de stata guarda la parte de review
-Archivos en log.
Cada vez que ejecutamos el do file creara el archivo .log para que eso no suceda especificamos
text replace
-La base de datos en formatos de STATA es .dta.
-Cuando no se tienen las bases en formato .dta, se pueden importar y transformar a ese formato.
-Por ejemplo si tenemos una base de datos en formato .sav, la convertimos a .txt con ese formato
ejecutamos la sentencia:
MACROS LOCALES
Una macro local asigna un valor constante (puede ser texto o numero) a lo largo de una secuencia
de comandos o en un programa. Las macro locales se borran cuando se deja de correr la secuencia
de comandos (a veces es más útil el uso de escalares)
Ejemplo en texto:
Display ”’curso’”
Ejemplo Numérico:
Sysuse auto
Sum Price
Local media_p=r(mean)
Gen Price2=Price/’media’
26 de octubre de 2015
Abrimos stata, le colocamos set mem 1g y después ya abrimos la base en abrir y la abrimos y ya
nos salen los datos:
Ipcf: ingreso per cápita familiar
S (estadísticos a estimar)
tabstat ipcf [w= fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv) format
sort ciudad
by ciudad: tabstat ipcf [w=fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv)
histogram ipcf [w=fex_dpto_c]
histogram ipcf if ipcf<40000000 [w=fex_dpto_c]--- para saber cuantos ganan ese valor
histogram ipcf if ipcf<5000000 [w=fex_dpto_c]
gen lipcf=ln(ipcf)
tabstat ipcf [w= fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv) format
sort ciudad
by ciudad: tabstat ipcf [w=fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv)
gen lipcf=ln(ipcf)
tabstat ilaboral if oc==1 [w= fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv)
format
sort ciudad
by ciudad: tabstat ilaboral [w=fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv)
gen lilaboral=ln(ipcf)
by educativo_nivel: tabstat ilaboral if oc==1 & educativo_nivel>2 [w=fex_dpto_c], s(mean min max
range///
tabstat ipcf [w= fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv) format
sort ciudad
by ciudad: tabstat ipcf [w=fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv)
gen lipcf=ln(ipcf)
tabstat ilaboral if oc==1 [w= fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv)
format
sort ciudad
by ciudad: tabstat ilaboral [w=fex_dpto_c], s(mean min max range p25 p50 p75 p99 iqr sd cv)
by educativo_nivel: tabstat ilaboral if oc==1 & educativo_nivel>2 [w=fex_dpto_c], s(mean min max
range///
sort ipcf
drop if ipcf==.
gen decil=.
09 de noviembre de 2015
*Curva de Lorenz
drop if ipcf==0
sort ipcf
gen partpobla=sumpop/sumpop[_N]
gen partingreso=sum(fex_dpto_c*ipcf)
replace partingreso=partingreso/partingreso[_N]
sort partingreso
twoway (line partingreso partpobla) (line partingreso partingreso), title("Curva de Lorenz") ///
drop if ipcf==
by ciudad: gen partpobla2=sum(fex_dpto_c)
by ciudad: gen
partingreso2=sum(fex_dpto_c*ipcf)
sort ipcf
egen i=seq()
drop if ipcf==0
sort ipcf
local obs=r(sum_w)
local media=r(mean)
display `obs'
display `media'
sort ipcf
gen sumatoria=(ipcf)*(`obs'+1-i)
sum sumatoria
local sumatoria=r(sum)
display "gini=`gini'"
--para guardar base es preserve
FINAL CLASE
*Curva de Lorenz
drop if ipcf==0
sort ipcf
gen partpobla=sumpop/sumpop[_N]
gen partingreso=sum(fex_dpto_c*ipcf)
replace partingreso=partingreso/partingreso[_N]
sort partingreso
twoway (line partingreso partpobla) (line partingreso partingreso), title("Curva de Lorenz") ///
drop if ipcf==
by ciudad: gen
partingreso2=sum(fex_dpto_c*ipcf)
*Coeficiente de Gini
sort ipcf
egen i=seq()
drop if ipcf==0
sort ipcf
local obs=r(sum_w)
local media=r(mean)
display `obs'
display `media'
sort ipcf
gen sumatoria=(ipcf)*(`obs'+1-i)
sum sumatoria
local sumatoria=r(sum)
display "gini=`gini'"
Curva de Lorenz