Está en la página 1de 33

CENTRO DE

CIENCIAS HUMANAS
Y SOCIALES










Curso de introduccin al paquete
Stata
(versin 9.1 SE)






Jos Manuel Rojo Abun
Unidad de Anlisis Estadstico
Centro de Ciencias Humanas y Sociales
Consejo Superior de Investigaciones Cientficas (CCHS, CSIC)
Madrid




Madrid, 14 y 15 de Febrero de 2008



Contenido
I. INTRODUCCIN.................................................................................................. 2
II. EL AMBIENTE DE TRABAJ O DE STATA......................................................... 3
Descripcin del ambiente de trabajo.............................................................................. 4
Descripcin de las ventanas........................................................................................... 5
Descripcin de la barra de herramientas........................................................................ 6
Ayuda del sistema.......................................................................................................... 6
Sintaxis de las rdenes de Stata..................................................................................... 7
III. GESTION DE BASES DE DATOS....................................................................... 9
Tipos de datos.............................................................................................................. 10
Cargar un fichero de datos en formato Stata................................................................ 11
a) Desde la barra de mens..................................................................... 11
b) Instruccin en la ventana Command.................................................. 11
Introducir datos por teclado......................................................................................... 12
Cargar los datos desde un fichero de datos en formato ASCII .................................... 12
Guardar ficheros de datos............................................................................................ 13
Unir conjunto de datos................................................................................................. 14
La instruccin Merge.............................................................................. 14
La instruccin Append............................................................................ 15
IV. CREACIN Y MODIFICACIN DE VARIABLES.......................................... 18
a) Generar nuevas variables en funcin de expresiones matemticas ya existentes.... 18
Funciones aritmticas.................................................................................. 19
Funciones matemticas................................................................................ 19
b) El comando egen..................................................................................................... 20
c) Recodificacin de variables..................................................................................... 20
Generacin de retardos y diferencias........................................................................... 21
V. ESTADSTICOS DESCRIPTIVOS UNIVARIANTES....................................... 22
VI. MODELOS DE REGRESIN POR MNIMOS CUADRADOS........................ 26
Introduccin...................................................................................................................... 26
Diagnsticos sobre el modelo de regresin lineal simple................................................. 27
Contraste de homocedasticidad................................................................... 27
Contraste de multicolinealidad.................................................................... 27
Contraste RSET........................................................................................... 27
Para guardar las estimaciones en una variable............................................ 27
VII. REGRESIN LOGISTICA.................................................................................. 28
Introduccin...................................................................................................................... 28
Estudio de la capacidad de prediccin del modelo........................................................... 29
Estudio de los parmetros................................................................................................. 29
Generacin de grficos auxiliares..................................................................................... 30
VIII. LISTA DE COMANDOS..................................................................................... 31
Comandos generales.................................................................................... 31
Conjunto de datos y variables...................................................................... 31
Grficos....................................................................................................... 31
Estadsticos descriptivos.............................................................................. 31
Anlisis estadsticos habituales.................................................................... 31
Modelos de regresin................................................................................... 31

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 1 / 33

I. INTRODUCCIN

El objetivo de este manual es familiarizar al lector con el paquete Stata. La versin
utilizada en la elaboracin de este manual es Stata 9.1 SE para la familia Windows NT,
es decir Windows professional y Windows XP, en sus mltiples versiones.

Stata es una aplicacin desarrollada para realizar anlisis estadsticos sobre muestras
aleatorias de poblaciones. Hay quien seala una fuerte especializacin en problemas
asociados con la econometra.

Si bien tiene una interface grfica de usuario (GUI), en la prctica es mucho ms
cmodo utilizar el potente a la vez que sencillo lenguaje de programacin que incluye.
Este lenguaje de programacin requiere un cierto esfuerzo inicial hasta que el usuario
empiece a acostumbrarse con los comandos; tambin suministra un sistema de ayuda
realmente detallado y completo.


Nota:

En general, bajo el programa Stata trabajaremos mediante lenguaje de
programacin, y conviene recordar que es case-sensitive, es decir, diferencia
entre letras maysculas y minsculas

Genero =genero


En cuanto a la capacidad de manejar grandes volmenes de informacin, a diferencia de
otras aplicaciones como SPSS y SAS, Stata necesita hacer una copia la base de datos
que vamos a analizar en la memoria RAM de nuestro computador, por tanto, la memoria
disponible en nuestro computador deber de estar acorde con el tamao de las bases de
datos que vamos a utilizar.

Existe una limitacin en cuanto al nmero mximo de variables; en la versin 9.1 SE
el nmero mximo de variables contenidas en la base de datos est en torno a las
35.000.
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 2 / 33

II. EL AMBIENTE DE TRABAJO DE STATA

La interface de Stata consiste en un entorno de trabajo que facilita la interaccin con la
aplicacin:

El entorno de trabajo tiene el siguiente aspecto:

Este entorno puede ser configurado (hasta cierto punto) para adaptarlo a nuestras
necesidades.


Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 3 / 33

Descripcin del ambiente de trabajo

El entorno de trabajo, o ventana principal, de Stata se subdivide en cuatro ventanas
bsicas, adems de la barra de mens y la barra de herramientas.
Las ventanas bsicas reciben los siguientes nombres:
Review
Variables
Command
Result

La u









bicacin de estas ventanas es la siguiente:













Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 4 / 33

Descripcin de las ventanas
ommand En esta ventana se escriben las rdenes que se dan a la aplicacin C
Result Aparecen los resultados de las rdenes ejecutadas
Variable Listado de las variables contenidas en la base de datos cargada en la
aplicacin; si no tenemos ninguna, esta ventana aparece vaca
Review Lista completa de los comandos ejecutados desde que se inici la
aplicacin




Nota:

En la esquina inferior izquierda de la pantalla aparece el directorio de trabajo;
para cambiar de directorio basta con escribir el comando cd seguido del nuevo
directorio, exactamente igual a como se trabajaba en la consola de MS Windows.

Ejemplo:

cd d:\datos\enuesta




Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 5 / 33

Descripcin de la barra de herramientas


Abrir ficheros de datos en formato Stata
Guardar el actual fichero de datos


Imprimir resultados, grficos y rdenes
Iniciar o cerrar un archivo para guardar resultados


Abrir el visor de ayuda

Restaurar la ventana de resultados a primer plano

Restaurar la ventana de grficos de alta resolucin a primer plano
Creaf un nuevo fichero de comandos (equivalente a los ficheros de sintaxis de
SPSS)

Invocar al editor de datos, se pueden modificar datos

Invocar al visualizador de datos, no podemos modificar datos

Continuar con la ejecucin de comandos

Detener la ejecucin de la tarea que est realizando


Ayuda del sistema
a aplicacin Stata posee un sistema de ayuda realmente excelente (personalmente, es el
ejor que conozco).

Para solicitar ayuda sobre un tema, por ejemplo regresin, slo tenemos que escribir la
orden help seguida de la palabra clave. Automticamente se abre el visor de ayuda
mostrando un completsimo informe, incluso con ejemplos y temas relacionados.



L
m
Ejemplo

help probit

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 6 / 33

Resultad
las rdenes de Stata
guaje de
tata.
orden en Stata (con muy pocas excepciones) posee la siguiente sintaxis:
o (mostrado slo parcialmente):


Sintaxis de

La aplicacin Stata posee un lenguaje de programacin avanzado que respeta unas normas
de sintaxis, al igual que otros lenguajes de programacin como PASCAL o C++; quienes
estn familiarizados con estos lenguajes les resultar muy sencillo asimilar el len
S

Cualquier

[prefix :] command [varlist] [=exp] [if] [in] [weight] [using filename] [, options]

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 7 / 33

Pero la mayora de las veces vamos a utilizar la siguiente forma, mucho ms simplificada:

command [varlist] [if] [in] [weight] [, options]


[] todo lo que aparece entre corchetes es opcional
if seguida de una expresin lgica indica que slo los datos que verifiquen
dicha condicin sern incluidos en el anlisis
in sirve para indicar el rango de observaciones que deseamos analizar
weight sirve para indicar una variable de ponderacin
options son las opciones especificas del comando que estemos utilizando


Ejemplos:

table genero edad

Realiza una tabla de contingencia del gnero y la edad

table genero edad if altura > 1.70

Realiza una tabla de contingencia del gnero y la edad slo para personas de ms de 1,70
de altura

table genero edad if altura > 1.70 in 1/100

Realiza una tabla de contingencia del gnero y la edad solo para personas de ms de 1,70
de altura utilizando nicamente los 100 primeros casos de la base de datos

table genero edad if altura > 1.70 in 1/100 [weight = pondera] , chi

En este comando, adems, se indica que los datos van ponderados por la variable pondera
y se solicita que realice el test Chi cuadrado


Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 8 / 33

III. GESTION DE BASES DE DATOS

Los ficheros de datos en Stata se denominan dataset.
Un dataset es una tabla, donde las columnas representan variables y las filas
bservaciones o casos.

tenidas en el
t.
o


















La variable del sistema _N indica el nmero total de observaciones con
datase

display _N

Para conocer la naturaleza de los datos contenidos en el dataset se utiliza la instruccin

describe
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 9 / 33

Ejemplo:













Tipos de datos
a columna denominada storage type indica el formato de almacenamiento, es decir, el
mero de bytes y, por tanto, la precisin de la variable.
ipo menor valor mayor valor valor mas cercano de cero bytes
yte -127 100 +/-1 1 1

L
n

T
b
int -32,767 32,74 +/-1 2
ng -2,147,483,647 2,147,483,620 +/-1 4 lo
float
-
1.70141173319*10^38 1.70141173319*10^36 +/-10^-36 4
ouble
-
8.9884656743*10^307 8.9884656743*10^307 +/-10^-323 8 d

Precision

float 3.795x10^-8
double 1.414x10^-16


Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 10 / 33

Cargar un fichero de datos en formato Stata
ara cargar un fichero de datos en formato Stata ( extensin *.dta ) tenemos dos
pciones: bien realizar esta operacin desde la barra de mens, o bien mediante una
struccin escrita en la ventana command.
a) Desde la barra de mens

vertir de ello, permitindonos
ontinuar o abortar la operacin.
n en la and
mos u de da in no permitir cargar en
emoria pues borrara el anterior. Si este es nuestro caso, deberemos de utilizar la
pcin clear para desalojar de la memoria el anterior fichero de datos:

use nombre de fichero, clear

La sintaxis de este comando es bastante flexible, permitiendo controlar qu parte del
fichero se desea cargar.

P
o
in










Si ya tenemos un fichero en memoria, el sistema nos ad
c


b) Instrucci ventana Comm

use nombre de fichero

Si ya tene n fichero tos en memoria, la aplicac lo
m
o
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 11 / 33

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 12 / 33

use [varlist] [if] [in] using filename [, clear nolabel ]


Introducir datos por teclado

Si ejecutamos editor de datos desde el cual podemos ir
troduciendo los datos tal como haramos en una hoja de clculo Excel. Tambin
odemos realizar un copy-past aunque es poco recomendable.
Cargar los datos desde un fichero de datos en formato ASCII
l coma
a sintaxis (muy simplificada) de este comando es:
la orden edit invocamos el
in
p



E ndo para realizar la lectura de ficheros ASCII es infile

L

infile varlist using nombre de fichero [if ] [in ], options


Un ejemplo sencillo: supongamos que deseamos leer el siguiente fichero en formato
ASCII con la s ables):

iguiente estructura (sin los nombres de vari











Escribiramos:

infile obs sexo carrera edad nota horast riesgo trabajo using "C:\creditos.dat" , clear


Nota

Est disponible el programa Stat/Transfer para realizar la traduccin de bases
de datos entre distintos formatos, como por ejemplo SPSS, SAS, Stata, MS-
Excel, , etc.




os guardar el fichero de datos con las posibles modificaciones que hayamos
Guardar ficheros de datos

En principio, Stata no guarda las modificaciones realizadas en la base de datos; por ello,
si deseam
realizado, entonces utilizaremos el comando save

La sintaxis de este comando es:

save [nombre de fichero] [, opciones]


Ejemplo:

save creditos, replace

Con la opcin replace grabamos encima del fichero que ya exista.
ara ordenar el dataset en funcin a una serie de variables se utiliza el comando sort P

sort by iden
sort by hogar iden

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 13 / 33

Unir conjunto de datos
s muy comn en el trabajo diario combinar varias bases de datos. En este manual
Las
cciones asociadas a estas operaciones son merge y append.
La instruccin Merge

por
icha variable.
plo

E
vamos a mostrar dos operaciones bsicas: aadir variables y aadir casos.
instru

Merge se utiliza para aadir variables, pero no observaciones. Los ficheros de datos
deben de tener una variable de identificacin y, adems, deben de estar ordenados
d

Ejem :

Data1 Data2


La variable de identificacin es obs y los dos dataset estn ordenados de forma
scendente. a

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 14 / 33

Ejecutamos la orden

use data1
merge obs using data2

y obtenemos:




La instruccin Append
Se utiliza para aadir observaciones. La sintaxis de este comando es mucho ms
sencilla.

Dataset 1 Dataset 2









Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 15 / 33

As, para combinar estas dos bases de datos, utilizamos los siguientes comandos:

use data1
append using data2


Si deseam
odemos utilizar el comando collapse
jemplo
upongamos que tenemos una base de datos de hogares y en cada hogar se ha realizado
n muestreo de personas. Deseamos construir una base de datos donde la unidad
uestral sea el hogar, con una variable edad que represente la edad media de las
ersonas que viven en dicho hogar.













os construir una nueva base de datos que condense la informacin original,
p

E

S
u
m
p





Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 16 / 33

collapse (mean) alfabet tasa_nat tasa_mor , by (relig)














Resumen
n los captulos previos hemos visto el funcionamiento bsico de la aplicacin,
troduciendo de forma progresiva los principios ms elementales de la importacin y
estin de las bases de datos.

E
in
g



Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 17 / 33

IV. CREACIN Y MODIFICACIN DE VARIABLES
na vez cargada la base de datos que deseamos analizar es muy comn modificarla,
reando nuevas variables o bien transformado las existentes.
sicamente existen tres formas de crear y modificar las variables contenidas en la base
e datos:
) Generar nuevas variables en funcin a expresiones matemticas ya existentes.
) Reemplazar algunos o todos los valores de una variable en funcin a una regla.
) Agrupar los valores en intervalos prefijados, es decir recodificar.
a) Generar nuevas variables en funcin de expresiones
matemticas ya existentes
nuevas variables en funcin de expresiones numricas se utiliza el comando
enerate

U
c

B
d
a
b
c


Para crear
g

La sintaxis de generate es:

generate [tipo] nueva_variable [: Etiqueta] = exp [if] [in]

E

jemplo
Generate precio_pesetas =precio*166.


Nota
Si la variable a crear ya existe, el sistema dar un mensaje de error, pues este comando no
permite cambiar o alterar los valores de una variable ya existente. Si lo que deseamos es
alterar los valores, entonces deberemos utilizar el comando replace , que tiene la misma
sintaxis que generate


El nmero de funciones que podemos utilizar con el comando generate es realmente
amplio; a modo ilustrativo presentamos las ms usuales:
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 18 / 33

Funciones aritmticas
+
-
*
/
^

ticas Funciones matem
abs(x)
acos(x) arcocoseno de x; -1 <x <1
asin(x) arcoseno de x; -1 <x <1
atan(x) arcotangente de x
ceil(x) retorna el entero mas pequeo mayor que x; n-1<x<=n
comb( osibles de n elementos tomados de k en k n,k) numero de combinaciones p
cos(x) coseno de x
exp(x) exponencial de x, la function inversea es ln(x)
int(x) retorna el enetero de truncar x; int(1.2) =1, and int(-1.2) =-1
ln(x) logaritmo en base e
log10(x) logaritmo en base 10
logit(x) logit de x, logit(x) =ln(x/(1-x))
max(x1,x2,...,xn) retorna el maximo de x1, x2, ..., xn
min(x1,x2,...,xn) retorna el minimo de x1, x2, ..., xn
mod(x,y) retor y) =x - y*int(x/y) na el modulo de x respecto de y, mod(x,
sin(x) seno de x
sqrt(x) raiz cuadrada de x
sum(x) suma acumulada de x
tan(x) tangente de x


Nota
Todas las funciones trigonomtricas estn en radianes.


Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 19 / 33


b) El comando egen

El comando egen es una extensin del comando generate . El comando egen genera
variables en funcin de valores de otras variables; por ejemplo:

egen sdEdad=sd(edad) , by sexo

Genera una variable que contiene la desviacin estndar de la edad en cada gnero.

Es aplic te comando desordena el fichero de datos.


Pa s, se puede utilizar el comando
re


importante saber que la acin de es
c) Recodificacin de variables
ra recodificar variables, tanto continuas como discreta
code .
recode variable (regla la) ...] [, generate(nueva variable)] ) [(reg


Al

recode edad 0/25 =1 25/50 =2 50/ max =3, gen(edad_agrupada)
re ), gen(n_x)

gunos ejemplos
code x (1 2 3 =1) ( 4 5 6=2

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 20 / 33

Generacin de retardos y diferencias

uando se est trabajando con series temporales es habitual tener que utilizar el
n-k]
C
operador de retardos.
La forma de generar retardos de orden k es la siguiente:

gen temperatura_k=temperatura [_


Nota
Es indispensable que el dataset est correctamente ordenado


y para generar diferencias de orden k:

gen dtempk=temp-temp[_n-k]





Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 21 / 33

V. E IVARIANTES
continuacin presentamos los comandos ms utilizados.
) Para crear el libro resumen de las variables est el comando codebook .
odebook lista de variables
timos la lista de variables entonces realiza un informe de todas las variables
Ejemplo:
STADSTICOS DESCRIPTIVOS UN

En general, todo anlisis estadstico, por complejo que sea, empieza por un completo
anlisis descriptivo. A

1

c

Si omi
contenidas en el dataset.

codebook salini



2) Para solicitar estadsticos de resumen como la media, varianza, , etc., se utiliza el
comando sumaries .

Ejemplo:
sumamarize salini salario educ

Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 22 / 33



3) Para construir tablas de estadsticos resumen se puede utilizar el comando tabstat .
in median mean max n cv ) tabstat salario salini , stat (m







En la ltima fila figura el coeficiente de variacin.


4) Para solicitar tablas de frecuencias se utiliza el comando tabulate:

tabulate clima








Tambin con este comando podemos solicitar tablas de doble entrada:

tabulate clima region , chi
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 23 / 33


) Con el comando table podemos crear tablas de estadsticos resumen controlando el
ontenido de cada casilla; por ejemplo, podemos calcular una tabla de doble entrada y
tuar en cada celda el estadstico solicitado.
ble sexo minora , cont ( mean salario) col row format (%9.1f)


5
c
si

ta








6) Para calcular el coeficiente de correlacin de Pearson se utiliza el comando
orrelate:
orrelate espvidaf espvidaf alfabet pib_cap caloras)
c

c






Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 24 / 33


Combinando los comandos y ajustando los formatos podemos crear tablas de resumen
realmente atractivas:

Ejemplo:
table region , cont (mean pib_cap sd pic_cap count pib_cap) format (%8,2f)






Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 25 / 33

VI. MODELOS DE REGRESIN POR MNIMOS CUADRADOS
diferencia de otras aplicaciones, en Stata los modelos de regresin se ejecutan en dos
mente diferenciadas:
- Diagnosis del modelo estimado.
El comando para realizar una estimacin de los parmetros de un modelo de regresin
lineal es:

regress depvar [indepvars] [if] [in] [weight] [, options]

Introduccin

A
fases clara
- Estimacin de los parmetros del modelo.


Por ejemplo:
reg altura edad peso
n ejemplo un poco ms elaborado:
g altura edad peso , beta noconstant



U
re
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 26 / 33

Diagnsticos sobre el modelo de regresin lineal simple

Con l modelo estimados es habitual realizar una serie de diagnsticos
ara contrastar si se cumplen determinadas hiptesis.
estat hettest
os parmetros del
p

Contraste de homocedasticidad

Contraste d


e multicolinealidad estat vif
Nota: VIF(Xk) = ) ... 1 , ( 1
2
Xp X Xk R
Contraste RSET estat ovtest
Para guardar las estimaciones en predict nombre de variable
una variable


Ejemplo:

regres alfabet alfabfem espvidaf espvidam, beta
estat hettest
estat vif
predict alfabet_pronos



Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 27 / 33

VII.
as fases de un anlisis de regresin logstica son las siguientes:
Estimacin de los parmetros.
acida iccin del modelo.
Interpretacin de los parmetros.
Generacin de grficos

parmetros
ima modelo de regresin
git depvar [indepvars] [if] [in] [weight] [, options]
REGRESIN LOGISTICA

Introduccin

L

Estudio de la cap d de pred
auxiliares.
Estimacin de los
El comando para realizar una est
logstica es:
cin de los parmetros de un

lo

Por ejemplo:
nero ingresos estudios
rtantes son:
or: muestra los ODDS Ratio.
noconstat: suprime la constante del modelo.

Ejemplo:

Logit voto genero ingresos estudios, or

logit voto ge

Las opciones ms impo


Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 28 / 33

Este comando puede ser combinado con el procedimiento stepwise para conseguir el
ejor conjunto de variables regresoras:

epwise, pr(0.1): logit voto genero ingresos estudios
m
st


Estudio de la capacidad de prediccin del modelo

Para estud os las estimaciones
ofrecidas por el modelo con los datos reales mediante el comando:

t class
iar la capacidad de prediccin del modelo comparam
esta

As mismo podemos guardar en variables las estimaciones mediante el comando
para, posteriormente, realizar contrastes personalizados:

predict yhat, p Guarda en la variable yhat la probabilidad estimada
predict
predict lfor, xb Guarda en la variable lfor el logit


Estudio de los parmetros
l comando mfx muestra las derivadas parciales evaluadas en el centro de gravedad de
tos.
fx Muestra las derivadas parciales evaluadas en el
centro de gravedad de la distribucin

E
la distribucin o bien en puntos concre

m
mfx , at(sex=1, income=2000) Muestra las derivadas parciales calculadas en el
punto indicado


Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 29 / 33

Generacin de grficos auxiliares

Las curvas de sensibilidad y especificidad nos ayudaran a calibrar el modelo.Las
ens
podemos calcular mediante los siguientes comandos:

ls
Lroc




0
0
0
.
7
5
0
.
0
0
0
.
2
5
0
.
5
0
1
.
S
e
n
s
i
t
i
f
i
c
i
t
y
i
v
i
t
y
/
S
p
e
c
0.00 0.25 0.50 0.75 1.00
Probability cutoff
Sensitivity Specificity
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 30 / 33

VIII. LIS

Coma

clear Eliminar el fichero de datos actual
TA DE COMANDOS
ndos generales
display Mostrar valores
cd mbiar el directorio de trabajo Ca
exit la aplicacin Salir de
help a sobre el tema solicitado Ayud
cd Cambiar de directorio de trabajo
save Guardar el actual conjunto de datos
use Cargar un conjunto de datos en formato
Stata
set
memor
Reservar una cantidad de memoria
concreta para el trabajo y
dir
Mostrar el contenido del directorio de
trabajo


Conjunto de datos y variables

collapse Cambiar la unidad muestral
encode Recodificacin automtica
describe
Describir las variables del conjunto de
datos
destring
Convertir una variable cadena a
numrica
drop Eliminar variables y observaciones
by varlist Analizar por grupos
encode
Recodificar automticamente cadenas a
nmeros
format Definir un formato
generate Crear nueva variable
infile Leer datos en formato ASCII
input Introducir datos por teclado
label Aadir / cambiar etiquetas
list Listar casos
merge Combinar ficheros
move
Cambiar la secuencia de variables en el
actual dataset
log using Resultados a fichero
log close Cerrar el fichero de resultados
order Reordenar la secuencia de variables
recode Recodificar variable
rename Renombrar variable
replace Cambiar el contenido de variable
set Ajustar parmetros opcionales
sort /gsort Ordenar el dataset





Histogramas
Grficos

hbar
scatter Diagramas de dispersin


Estadsticos descriptivos

codebook Resumen de variables
hist Histograma
summarize Estadsticos muestrales
table Tablas de doble entrada
tabulate
Tablas de 1 y 2 dimensiones con
estadsticos resumen


Anlisis estadsticos habituales

anova Anlisis de varianza
correlate Correlacin
oneway Anlisis de varianza
ranksum Test de Wilcoxon
tabulate crosstables (incl. tests de homogeneidad,
gamma, exact r*c test )
table Tablas de estadsticos resumen
ttest Contraste de medias


Modelos de regresin

clogit Regresin logstica condicional
logit Regresin logstica
logistic Regresin logstica
Poisson Regresin de Poisson
predict prediction +indicator of fit
regress Regresin lineal
Variable dummy:
xi: comando i . variable





Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 31 / 33


Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 32 / 33

También podría gustarte