Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccion Stata 9
Introduccion Stata 9
CIENCIAS HUMANAS
Y SOCIALES
Curso de introduccin al paquete
Stata
(versin 9.1 SE)
Jos Manuel Rojo Abun
Unidad de Anlisis Estadstico
Centro de Ciencias Humanas y Sociales
Consejo Superior de Investigaciones Cientficas (CCHS, CSIC)
Madrid
Madrid, 14 y 15 de Febrero de 2008
Contenido
I. INTRODUCCIN.................................................................................................. 2
II. EL AMBIENTE DE TRABAJ O DE STATA......................................................... 3
Descripcin del ambiente de trabajo.............................................................................. 4
Descripcin de las ventanas........................................................................................... 5
Descripcin de la barra de herramientas........................................................................ 6
Ayuda del sistema.......................................................................................................... 6
Sintaxis de las rdenes de Stata..................................................................................... 7
III. GESTION DE BASES DE DATOS....................................................................... 9
Tipos de datos.............................................................................................................. 10
Cargar un fichero de datos en formato Stata................................................................ 11
a) Desde la barra de mens..................................................................... 11
b) Instruccin en la ventana Command.................................................. 11
Introducir datos por teclado......................................................................................... 12
Cargar los datos desde un fichero de datos en formato ASCII .................................... 12
Guardar ficheros de datos............................................................................................ 13
Unir conjunto de datos................................................................................................. 14
La instruccin Merge.............................................................................. 14
La instruccin Append............................................................................ 15
IV. CREACIN Y MODIFICACIN DE VARIABLES.......................................... 18
a) Generar nuevas variables en funcin de expresiones matemticas ya existentes.... 18
Funciones aritmticas.................................................................................. 19
Funciones matemticas................................................................................ 19
b) El comando egen..................................................................................................... 20
c) Recodificacin de variables..................................................................................... 20
Generacin de retardos y diferencias........................................................................... 21
V. ESTADSTICOS DESCRIPTIVOS UNIVARIANTES....................................... 22
VI. MODELOS DE REGRESIN POR MNIMOS CUADRADOS........................ 26
Introduccin...................................................................................................................... 26
Diagnsticos sobre el modelo de regresin lineal simple................................................. 27
Contraste de homocedasticidad................................................................... 27
Contraste de multicolinealidad.................................................................... 27
Contraste RSET........................................................................................... 27
Para guardar las estimaciones en una variable............................................ 27
VII. REGRESIN LOGISTICA.................................................................................. 28
Introduccin...................................................................................................................... 28
Estudio de la capacidad de prediccin del modelo........................................................... 29
Estudio de los parmetros................................................................................................. 29
Generacin de grficos auxiliares..................................................................................... 30
VIII. LISTA DE COMANDOS..................................................................................... 31
Comandos generales.................................................................................... 31
Conjunto de datos y variables...................................................................... 31
Grficos....................................................................................................... 31
Estadsticos descriptivos.............................................................................. 31
Anlisis estadsticos habituales.................................................................... 31
Modelos de regresin................................................................................... 31
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 1 / 33
I. INTRODUCCIN
El objetivo de este manual es familiarizar al lector con el paquete Stata. La versin
utilizada en la elaboracin de este manual es Stata 9.1 SE para la familia Windows NT,
es decir Windows professional y Windows XP, en sus mltiples versiones.
Stata es una aplicacin desarrollada para realizar anlisis estadsticos sobre muestras
aleatorias de poblaciones. Hay quien seala una fuerte especializacin en problemas
asociados con la econometra.
Si bien tiene una interface grfica de usuario (GUI), en la prctica es mucho ms
cmodo utilizar el potente a la vez que sencillo lenguaje de programacin que incluye.
Este lenguaje de programacin requiere un cierto esfuerzo inicial hasta que el usuario
empiece a acostumbrarse con los comandos; tambin suministra un sistema de ayuda
realmente detallado y completo.
Nota:
En general, bajo el programa Stata trabajaremos mediante lenguaje de
programacin, y conviene recordar que es case-sensitive, es decir, diferencia
entre letras maysculas y minsculas
Genero =genero
En cuanto a la capacidad de manejar grandes volmenes de informacin, a diferencia de
otras aplicaciones como SPSS y SAS, Stata necesita hacer una copia la base de datos
que vamos a analizar en la memoria RAM de nuestro computador, por tanto, la memoria
disponible en nuestro computador deber de estar acorde con el tamao de las bases de
datos que vamos a utilizar.
Existe una limitacin en cuanto al nmero mximo de variables; en la versin 9.1 SE
el nmero mximo de variables contenidas en la base de datos est en torno a las
35.000.
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 2 / 33
II. EL AMBIENTE DE TRABAJO DE STATA
La interface de Stata consiste en un entorno de trabajo que facilita la interaccin con la
aplicacin:
El entorno de trabajo tiene el siguiente aspecto:
Este entorno puede ser configurado (hasta cierto punto) para adaptarlo a nuestras
necesidades.
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 3 / 33
Descripcin del ambiente de trabajo
El entorno de trabajo, o ventana principal, de Stata se subdivide en cuatro ventanas
bsicas, adems de la barra de mens y la barra de herramientas.
Las ventanas bsicas reciben los siguientes nombres:
Review
Variables
Command
Result
La u
bicacin de estas ventanas es la siguiente:
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 4 / 33
Descripcin de las ventanas
ommand En esta ventana se escriben las rdenes que se dan a la aplicacin C
Result Aparecen los resultados de las rdenes ejecutadas
Variable Listado de las variables contenidas en la base de datos cargada en la
aplicacin; si no tenemos ninguna, esta ventana aparece vaca
Review Lista completa de los comandos ejecutados desde que se inici la
aplicacin
Nota:
En la esquina inferior izquierda de la pantalla aparece el directorio de trabajo;
para cambiar de directorio basta con escribir el comando cd seguido del nuevo
directorio, exactamente igual a como se trabajaba en la consola de MS Windows.
Ejemplo:
cd d:\datos\enuesta
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 5 / 33
Descripcin de la barra de herramientas
Abrir ficheros de datos en formato Stata
Guardar el actual fichero de datos
Imprimir resultados, grficos y rdenes
Iniciar o cerrar un archivo para guardar resultados
Abrir el visor de ayuda
Restaurar la ventana de resultados a primer plano
Restaurar la ventana de grficos de alta resolucin a primer plano
Creaf un nuevo fichero de comandos (equivalente a los ficheros de sintaxis de
SPSS)
Invocar al editor de datos, se pueden modificar datos
Invocar al visualizador de datos, no podemos modificar datos
Continuar con la ejecucin de comandos
Detener la ejecucin de la tarea que est realizando
Ayuda del sistema
a aplicacin Stata posee un sistema de ayuda realmente excelente (personalmente, es el
ejor que conozco).
Para solicitar ayuda sobre un tema, por ejemplo regresin, slo tenemos que escribir la
orden help seguida de la palabra clave. Automticamente se abre el visor de ayuda
mostrando un completsimo informe, incluso con ejemplos y temas relacionados.
L
m
Ejemplo
help probit
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 6 / 33
Resultad
las rdenes de Stata
guaje de
tata.
orden en Stata (con muy pocas excepciones) posee la siguiente sintaxis:
o (mostrado slo parcialmente):
Sintaxis de
La aplicacin Stata posee un lenguaje de programacin avanzado que respeta unas normas
de sintaxis, al igual que otros lenguajes de programacin como PASCAL o C++; quienes
estn familiarizados con estos lenguajes les resultar muy sencillo asimilar el len
S
Cualquier
[prefix :] command [varlist] [=exp] [if] [in] [weight] [using filename] [, options]
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 7 / 33
Pero la mayora de las veces vamos a utilizar la siguiente forma, mucho ms simplificada:
command [varlist] [if] [in] [weight] [, options]
[] todo lo que aparece entre corchetes es opcional
if seguida de una expresin lgica indica que slo los datos que verifiquen
dicha condicin sern incluidos en el anlisis
in sirve para indicar el rango de observaciones que deseamos analizar
weight sirve para indicar una variable de ponderacin
options son las opciones especificas del comando que estemos utilizando
Ejemplos:
table genero edad
Realiza una tabla de contingencia del gnero y la edad
table genero edad if altura > 1.70
Realiza una tabla de contingencia del gnero y la edad slo para personas de ms de 1,70
de altura
table genero edad if altura > 1.70 in 1/100
Realiza una tabla de contingencia del gnero y la edad solo para personas de ms de 1,70
de altura utilizando nicamente los 100 primeros casos de la base de datos
table genero edad if altura > 1.70 in 1/100 [weight = pondera] , chi
En este comando, adems, se indica que los datos van ponderados por la variable pondera
y se solicita que realice el test Chi cuadrado
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 8 / 33
III. GESTION DE BASES DE DATOS
Los ficheros de datos en Stata se denominan dataset.
Un dataset es una tabla, donde las columnas representan variables y las filas
bservaciones o casos.
tenidas en el
t.
o
La variable del sistema _N indica el nmero total de observaciones con
datase
display _N
Para conocer la naturaleza de los datos contenidos en el dataset se utiliza la instruccin
describe
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 9 / 33
Ejemplo:
Tipos de datos
a columna denominada storage type indica el formato de almacenamiento, es decir, el
mero de bytes y, por tanto, la precisin de la variable.
ipo menor valor mayor valor valor mas cercano de cero bytes
yte -127 100 +/-1 1 1
L
n
T
b
int -32,767 32,74 +/-1 2
ng -2,147,483,647 2,147,483,620 +/-1 4 lo
float
-
1.70141173319*10^38 1.70141173319*10^36 +/-10^-36 4
ouble
-
8.9884656743*10^307 8.9884656743*10^307 +/-10^-323 8 d
Precision
float 3.795x10^-8
double 1.414x10^-16
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 10 / 33
Cargar un fichero de datos en formato Stata
ara cargar un fichero de datos en formato Stata ( extensin *.dta ) tenemos dos
pciones: bien realizar esta operacin desde la barra de mens, o bien mediante una
struccin escrita en la ventana command.
a) Desde la barra de mens
vertir de ello, permitindonos
ontinuar o abortar la operacin.
n en la and
mos u de da in no permitir cargar en
emoria pues borrara el anterior. Si este es nuestro caso, deberemos de utilizar la
pcin clear para desalojar de la memoria el anterior fichero de datos:
use nombre de fichero, clear
La sintaxis de este comando es bastante flexible, permitiendo controlar qu parte del
fichero se desea cargar.
P
o
in
Si ya tenemos un fichero en memoria, el sistema nos ad
c
b) Instrucci ventana Comm
use nombre de fichero
Si ya tene n fichero tos en memoria, la aplicac lo
m
o
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 11 / 33
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 12 / 33
use [varlist] [if] [in] using filename [, clear nolabel ]
Introducir datos por teclado
Si ejecutamos editor de datos desde el cual podemos ir
troduciendo los datos tal como haramos en una hoja de clculo Excel. Tambin
odemos realizar un copy-past aunque es poco recomendable.
Cargar los datos desde un fichero de datos en formato ASCII
l coma
a sintaxis (muy simplificada) de este comando es:
la orden edit invocamos el
in
p
E ndo para realizar la lectura de ficheros ASCII es infile
L
infile varlist using nombre de fichero [if ] [in ], options
Un ejemplo sencillo: supongamos que deseamos leer el siguiente fichero en formato
ASCII con la s ables):
iguiente estructura (sin los nombres de vari
Escribiramos:
infile obs sexo carrera edad nota horast riesgo trabajo using "C:\creditos.dat" , clear
Nota
Est disponible el programa Stat/Transfer para realizar la traduccin de bases
de datos entre distintos formatos, como por ejemplo SPSS, SAS, Stata, MS-
Excel, , etc.
os guardar el fichero de datos con las posibles modificaciones que hayamos
Guardar ficheros de datos
En principio, Stata no guarda las modificaciones realizadas en la base de datos; por ello,
si deseam
realizado, entonces utilizaremos el comando save
La sintaxis de este comando es:
save [nombre de fichero] [, opciones]
Ejemplo:
save creditos, replace
Con la opcin replace grabamos encima del fichero que ya exista.
ara ordenar el dataset en funcin a una serie de variables se utiliza el comando sort P
sort by iden
sort by hogar iden
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 13 / 33
Unir conjunto de datos
s muy comn en el trabajo diario combinar varias bases de datos. En este manual
Las
cciones asociadas a estas operaciones son merge y append.
La instruccin Merge
por
icha variable.
plo
E
vamos a mostrar dos operaciones bsicas: aadir variables y aadir casos.
instru
Merge se utiliza para aadir variables, pero no observaciones. Los ficheros de datos
deben de tener una variable de identificacin y, adems, deben de estar ordenados
d
Ejem :
Data1 Data2
La variable de identificacin es obs y los dos dataset estn ordenados de forma
scendente. a
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 14 / 33
Ejecutamos la orden
use data1
merge obs using data2
y obtenemos:
La instruccin Append
Se utiliza para aadir observaciones. La sintaxis de este comando es mucho ms
sencilla.
Dataset 1 Dataset 2
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 15 / 33
As, para combinar estas dos bases de datos, utilizamos los siguientes comandos:
use data1
append using data2
Si deseam
odemos utilizar el comando collapse
jemplo
upongamos que tenemos una base de datos de hogares y en cada hogar se ha realizado
n muestreo de personas. Deseamos construir una base de datos donde la unidad
uestral sea el hogar, con una variable edad que represente la edad media de las
ersonas que viven en dicho hogar.
os construir una nueva base de datos que condense la informacin original,
p
E
S
u
m
p
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 16 / 33
collapse (mean) alfabet tasa_nat tasa_mor , by (relig)
Resumen
n los captulos previos hemos visto el funcionamiento bsico de la aplicacin,
troduciendo de forma progresiva los principios ms elementales de la importacin y
estin de las bases de datos.
E
in
g
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 17 / 33
IV. CREACIN Y MODIFICACIN DE VARIABLES
na vez cargada la base de datos que deseamos analizar es muy comn modificarla,
reando nuevas variables o bien transformado las existentes.
sicamente existen tres formas de crear y modificar las variables contenidas en la base
e datos:
) Generar nuevas variables en funcin a expresiones matemticas ya existentes.
) Reemplazar algunos o todos los valores de una variable en funcin a una regla.
) Agrupar los valores en intervalos prefijados, es decir recodificar.
a) Generar nuevas variables en funcin de expresiones
matemticas ya existentes
nuevas variables en funcin de expresiones numricas se utiliza el comando
enerate
U
c
B
d
a
b
c
Para crear
g
La sintaxis de generate es:
generate [tipo] nueva_variable [: Etiqueta] = exp [if] [in]
E
jemplo
Generate precio_pesetas =precio*166.
Nota
Si la variable a crear ya existe, el sistema dar un mensaje de error, pues este comando no
permite cambiar o alterar los valores de una variable ya existente. Si lo que deseamos es
alterar los valores, entonces deberemos utilizar el comando replace , que tiene la misma
sintaxis que generate
El nmero de funciones que podemos utilizar con el comando generate es realmente
amplio; a modo ilustrativo presentamos las ms usuales:
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 18 / 33
Funciones aritmticas
+
-
*
/
^
ticas Funciones matem
abs(x)
acos(x) arcocoseno de x; -1 <x <1
asin(x) arcoseno de x; -1 <x <1
atan(x) arcotangente de x
ceil(x) retorna el entero mas pequeo mayor que x; n-1<x<=n
comb( osibles de n elementos tomados de k en k n,k) numero de combinaciones p
cos(x) coseno de x
exp(x) exponencial de x, la function inversea es ln(x)
int(x) retorna el enetero de truncar x; int(1.2) =1, and int(-1.2) =-1
ln(x) logaritmo en base e
log10(x) logaritmo en base 10
logit(x) logit de x, logit(x) =ln(x/(1-x))
max(x1,x2,...,xn) retorna el maximo de x1, x2, ..., xn
min(x1,x2,...,xn) retorna el minimo de x1, x2, ..., xn
mod(x,y) retor y) =x - y*int(x/y) na el modulo de x respecto de y, mod(x,
sin(x) seno de x
sqrt(x) raiz cuadrada de x
sum(x) suma acumulada de x
tan(x) tangente de x
Nota
Todas las funciones trigonomtricas estn en radianes.
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 19 / 33
b) El comando egen
El comando egen es una extensin del comando generate . El comando egen genera
variables en funcin de valores de otras variables; por ejemplo:
egen sdEdad=sd(edad) , by sexo
Genera una variable que contiene la desviacin estndar de la edad en cada gnero.
Es aplic te comando desordena el fichero de datos.
Pa s, se puede utilizar el comando
re
importante saber que la acin de es
c) Recodificacin de variables
ra recodificar variables, tanto continuas como discreta
code .
recode variable (regla la) ...] [, generate(nueva variable)] ) [(reg
Al
recode edad 0/25 =1 25/50 =2 50/ max =3, gen(edad_agrupada)
re ), gen(n_x)
gunos ejemplos
code x (1 2 3 =1) ( 4 5 6=2
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 20 / 33
Generacin de retardos y diferencias
uando se est trabajando con series temporales es habitual tener que utilizar el
n-k]
C
operador de retardos.
La forma de generar retardos de orden k es la siguiente:
gen temperatura_k=temperatura [_
Nota
Es indispensable que el dataset est correctamente ordenado
y para generar diferencias de orden k:
gen dtempk=temp-temp[_n-k]
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 21 / 33
V. E IVARIANTES
continuacin presentamos los comandos ms utilizados.
) Para crear el libro resumen de las variables est el comando codebook .
odebook lista de variables
timos la lista de variables entonces realiza un informe de todas las variables
Ejemplo:
STADSTICOS DESCRIPTIVOS UN
En general, todo anlisis estadstico, por complejo que sea, empieza por un completo
anlisis descriptivo. A
1
c
Si omi
contenidas en el dataset.
codebook salini
2) Para solicitar estadsticos de resumen como la media, varianza, , etc., se utiliza el
comando sumaries .
Ejemplo:
sumamarize salini salario educ
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 22 / 33
3) Para construir tablas de estadsticos resumen se puede utilizar el comando tabstat .
in median mean max n cv ) tabstat salario salini , stat (m
En la ltima fila figura el coeficiente de variacin.
4) Para solicitar tablas de frecuencias se utiliza el comando tabulate:
tabulate clima
Tambin con este comando podemos solicitar tablas de doble entrada:
tabulate clima region , chi
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 23 / 33
) Con el comando table podemos crear tablas de estadsticos resumen controlando el
ontenido de cada casilla; por ejemplo, podemos calcular una tabla de doble entrada y
tuar en cada celda el estadstico solicitado.
ble sexo minora , cont ( mean salario) col row format (%9.1f)
5
c
si
ta
6) Para calcular el coeficiente de correlacin de Pearson se utiliza el comando
orrelate:
orrelate espvidaf espvidaf alfabet pib_cap caloras)
c
c
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 24 / 33
Combinando los comandos y ajustando los formatos podemos crear tablas de resumen
realmente atractivas:
Ejemplo:
table region , cont (mean pib_cap sd pic_cap count pib_cap) format (%8,2f)
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 25 / 33
VI. MODELOS DE REGRESIN POR MNIMOS CUADRADOS
diferencia de otras aplicaciones, en Stata los modelos de regresin se ejecutan en dos
mente diferenciadas:
- Diagnosis del modelo estimado.
El comando para realizar una estimacin de los parmetros de un modelo de regresin
lineal es:
regress depvar [indepvars] [if] [in] [weight] [, options]
Introduccin
A
fases clara
- Estimacin de los parmetros del modelo.
Por ejemplo:
reg altura edad peso
n ejemplo un poco ms elaborado:
g altura edad peso , beta noconstant
U
re
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 26 / 33
Diagnsticos sobre el modelo de regresin lineal simple
Con l modelo estimados es habitual realizar una serie de diagnsticos
ara contrastar si se cumplen determinadas hiptesis.
estat hettest
os parmetros del
p
Contraste de homocedasticidad
Contraste d
e multicolinealidad estat vif
Nota: VIF(Xk) = ) ... 1 , ( 1
2
Xp X Xk R
Contraste RSET estat ovtest
Para guardar las estimaciones en predict nombre de variable
una variable
Ejemplo:
regres alfabet alfabfem espvidaf espvidam, beta
estat hettest
estat vif
predict alfabet_pronos
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 27 / 33
VII.
as fases de un anlisis de regresin logstica son las siguientes:
Estimacin de los parmetros.
acida iccin del modelo.
Interpretacin de los parmetros.
Generacin de grficos
parmetros
ima modelo de regresin
git depvar [indepvars] [if] [in] [weight] [, options]
REGRESIN LOGISTICA
Introduccin
L
Estudio de la cap d de pred
auxiliares.
Estimacin de los
El comando para realizar una est
logstica es:
cin de los parmetros de un
lo
Por ejemplo:
nero ingresos estudios
rtantes son:
or: muestra los ODDS Ratio.
noconstat: suprime la constante del modelo.
Ejemplo:
Logit voto genero ingresos estudios, or
logit voto ge
Las opciones ms impo
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 28 / 33
Este comando puede ser combinado con el procedimiento stepwise para conseguir el
ejor conjunto de variables regresoras:
epwise, pr(0.1): logit voto genero ingresos estudios
m
st
Estudio de la capacidad de prediccin del modelo
Para estud os las estimaciones
ofrecidas por el modelo con los datos reales mediante el comando:
t class
iar la capacidad de prediccin del modelo comparam
esta
As mismo podemos guardar en variables las estimaciones mediante el comando
para, posteriormente, realizar contrastes personalizados:
predict yhat, p Guarda en la variable yhat la probabilidad estimada
predict
predict lfor, xb Guarda en la variable lfor el logit
Estudio de los parmetros
l comando mfx muestra las derivadas parciales evaluadas en el centro de gravedad de
tos.
fx Muestra las derivadas parciales evaluadas en el
centro de gravedad de la distribucin
E
la distribucin o bien en puntos concre
m
mfx , at(sex=1, income=2000) Muestra las derivadas parciales calculadas en el
punto indicado
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 29 / 33
Generacin de grficos auxiliares
Las curvas de sensibilidad y especificidad nos ayudaran a calibrar el modelo.Las
ens
podemos calcular mediante los siguientes comandos:
ls
Lroc
0
0
0
.
7
5
0
.
0
0
0
.
2
5
0
.
5
0
1
.
S
e
n
s
i
t
i
f
i
c
i
t
y
i
v
i
t
y
/
S
p
e
c
0.00 0.25 0.50 0.75 1.00
Probability cutoff
Sensitivity Specificity
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 30 / 33
VIII. LIS
Coma
clear Eliminar el fichero de datos actual
TA DE COMANDOS
ndos generales
display Mostrar valores
cd mbiar el directorio de trabajo Ca
exit la aplicacin Salir de
help a sobre el tema solicitado Ayud
cd Cambiar de directorio de trabajo
save Guardar el actual conjunto de datos
use Cargar un conjunto de datos en formato
Stata
set
memor
Reservar una cantidad de memoria
concreta para el trabajo y
dir
Mostrar el contenido del directorio de
trabajo
Conjunto de datos y variables
collapse Cambiar la unidad muestral
encode Recodificacin automtica
describe
Describir las variables del conjunto de
datos
destring
Convertir una variable cadena a
numrica
drop Eliminar variables y observaciones
by varlist Analizar por grupos
encode
Recodificar automticamente cadenas a
nmeros
format Definir un formato
generate Crear nueva variable
infile Leer datos en formato ASCII
input Introducir datos por teclado
label Aadir / cambiar etiquetas
list Listar casos
merge Combinar ficheros
move
Cambiar la secuencia de variables en el
actual dataset
log using Resultados a fichero
log close Cerrar el fichero de resultados
order Reordenar la secuencia de variables
recode Recodificar variable
rename Renombrar variable
replace Cambiar el contenido de variable
set Ajustar parmetros opcionales
sort /gsort Ordenar el dataset
Histogramas
Grficos
hbar
scatter Diagramas de dispersin
Estadsticos descriptivos
codebook Resumen de variables
hist Histograma
summarize Estadsticos muestrales
table Tablas de doble entrada
tabulate
Tablas de 1 y 2 dimensiones con
estadsticos resumen
Anlisis estadsticos habituales
anova Anlisis de varianza
correlate Correlacin
oneway Anlisis de varianza
ranksum Test de Wilcoxon
tabulate crosstables (incl. tests de homogeneidad,
gamma, exact r*c test )
table Tablas de estadsticos resumen
ttest Contraste de medias
Modelos de regresin
clogit Regresin logstica condicional
logit Regresin logstica
logistic Regresin logstica
Poisson Regresin de Poisson
predict prediction +indicator of fit
regress Regresin lineal
Variable dummy:
xi: comando i . variable
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 31 / 33
Introduccin al paquete Stata 9.1 SE
por: J os Manuel Rojo Abun
Unidad de Anlisis Estadstico, CCHS, CSIC 32 / 33