Manual de Stata Básico

ECOTRAINING
MANUAL DE STATA BSICO

POR: Eco. DAVID JOEL ESPARTA POLANCO
Contenido
CAPTULO I. INTRODUCCIN AL STATA................................................................3
1.
Entorno del Stata....................................................................................... 3
2.
Estructura de un Do-file............................................................................. 6
3.
Cargar Bases de Datos.............................................................................. 8
4.
3.1.
Cargando una base de datos del Stata................................................8
3.2.
Creando manualmente una base de datos en Stata...........................9
3.3.
Convirtiendo bases de datos...............................................................9
Guardar una Bases de Datos...................................................................11
CAPTULO II. GESTIN DE BASE DE DATOS.......................................................12

1.
Inspeccin de la base de datos................................................................12
2.
Generacin y transformacin de variables..............................................14
3.
Transformacin de bases de datos.........................................................16
4.
Fusin de bases de datos.......................................................................18
CAPTULO III. GRFICOS EN STATA.....................................................................21

1.
Introduccin al Stata Graph.....................................................................21
2.
Tipos de grficos...................................................................................... 21
2.1.
Histograma........................................................................................ 21
2.2.
Dispersin de puntos (Scatter Plot)...................................................22
2.3.
Mltiple dispersin de puntos............................................................23
2.4.
Caja y bigote..................................................................................... 24
2.5.
Pie..................................................................................................... 25
2.6.
Barras................................................................................................ 26
CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC).........................27

1.
Especificacin y supuestos del MRLC......................................................27
2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios

(MCO)............................................................................................................. 28
CAPTULO I. INTRODUCCIN AL STATA

1. Entorno del Stata
Al momento de iniciar la sesin en STATA ya sea en cualquiera de su versin
ms actualizada (versin 11 a la versin 13), esta mostrar cuatro ventanas
importantes:
En el transcurso de la capacitacin, aprenderemos a trabajar con otras

ventanas que contiene el Stata, como son:
Otras ventanas a tomar en consideracin son:
a. STATA Viewer: Podemos acceder a la informacin online y a las ayudas
que nos otorga el programa.
b. STATA Do-File Editor: Es una ventana que funciona como editor de
texto
para
programados.
poder
guardar
ejecutar
una
lista
de
comandos
c. STATA Data Editor: Nos permite digitar y modificar los datos de la

misma forma que una hoja de Excel.
d. STATA Browser: Accedemos a la ventana de datos sin poder modificar
su contenido.
e. STATA Graphs: Nos muestra una ventana con el grfico que hemos
ejecutado.
Uno de los archivos principales para comenzar a usar el Stata es el archivo de

programacin Do-file editor, para acceder a este editor podemos hacer clic en
la barra de herramientas el cono
o escribir en la ventana de lnea de
comandos lo siguiente:
A continuacin, nos aparecer una ventana de editor en blanco, donde

podemos elaborar nuestro primer archivo do-file.
Estos archivos son muy importantes por los siguientes motivos:
a. Permite registrar una de serie de comandos, la cual representa todo el

procedimiento de nuestro trabajo.
b. Permite ir corrigiendo posibles errores que se pueden generar en la
elaboracin y ejecucin de nuestro trabajo.
c. Permite
replicar
los
procedimientos
en
sesiones
posteriores
sin
necesidad de crearlo nuevamente.

d. Adems, sirve como un mecanismo de seguridad que permite regresar a
la
base
de
datos
original
despus
de
haberle
hecho
diversas
transformaciones.
Una de las primeras cosas que debemos aprender para elaborar un do-file es
escribir comentarios, para ello existen diversas maneras:
a. Una simple lnea de comentario empieza con un asterisco (*); donde
STATA ignorar tales lneas.
b. Para colocar un comentario en la misma lnea donde fue escrito el
comando utilizamos dos slash (//).
c. Para lneas con mltiples comentarios, colocamos el texto entre los
smbolos (/*) al inicio y (*/) al final.
d. En el caso de que se haga uso de un comando la cual presenta una
expresin muy larga podemos utilizar triple slash (///) en medio de la
expresin y as continuar en la siguiente lnea la parte faltante. STATA
entender como si fuera una nica lnea de comando.
e. Por ltimo, tambin se utilizan los smbolos de comentarios con fines
decorativos.
Por ejemplo, podemos comenzar escribiendo en nuestro do-file lo siguiente
2. Estructura de un Do-file
Generalmente, al momento de comenzar a programar en un do-file del Stata,
es recomendable mantener el siguiente esquema de trabajo:
Siguiendo esta estructura del do-file, procedemos como primer paso a construir
una plantilla de trabajo.
El primer comando que utilizaremos en esta plantilla de trabajo es limpiar
informacin que podra estar utilizndose (como bases de datos, etiqueta,
matrices, escalares, etc.) que se haya trabajado previamente con el comando
clear.
Con respecto a las formas de poder ejecutar los comandos, se puede hacer a
travs del icono
(execute do) ubicado en la parte superior derecha de la
barra de herramientas del archivo Do-file o presionando los teclados Ctrl+D

una vez que sombremos el comando queramos correr.
Una vez realizada esta accin, se reflejar los resultados en la ventana Result
View del Stata.
Luego, se debe cambiar la ruta o directorio de trabajo, ya que cuando se inicia

una sesin en Stata, por defecto se trabaja en la carpeta en donde se
encuentra instalado el software. Para saber cul es la ruta de trabajo activa se
puede ver la parte inferior izquierda del entorno del STATA.
Dentro de nuestra carpeta de trabajo Clase 1 existe una carpeta denominada

Bases en el cual trabajaremos esta primera sesin. Para acceder a la nueva
ruta de trabajo nos ubicamos en la carpeta Bases y copiamos la ruta que se
encuentra en la parte superior de la ventana:
Ahora, utilizamos el comando cd para cambiarnos al nuevo directorio creado,

indicando la nueva ruta entre comillas.
3. Cargar Bases de Datos

Existen diferentes de poder emplear una bases de datos en Stata y en la
presente seccin explicaremos cada una de estas formas.
3.1.
Cargando una base de datos del Stata
STATA cuenta con bases de datos dentro de su sistema como ejemplos

aplicativos, para cargarlos se utiliza el comando sysuse. Un ejemplo, es cargar
la base de datos auto.dta, donde cabe resaltar que todas las bases de datos
en formato del Stata se guardan con la versin .dta.
En la parte inferior izquierda del entorno del STATA se apreciar las variables
que contiene la base de datos auto.dta.
3.2.
Creando manualmente una base de datos en Stata
La manera de editar manualmente una base de datos a travs del dofile es a

travs del comando input.
Para realizar esta accin, hay que limpiar la base de datos utilizada en la
anterior seccin de la siguiente manera. Luego, usamos el comando input,
seguido del nombre de las variables y a partir de la siguiente lnea de comando

se comienza a digitar los datos, finalmente se debe terminar con la palabra
end.
3.3.
Convirtiendo bases de datos
STATA cuenta con una herramienta que permite convertir base de datos de
SPSS, Matlab, Gauss, SAS, Excel, etc. al formato *.dta a travs del software
STAT/TRANSFER.
Para acceder a este software basta con hacerle clic y posteriormente nos saldr
una ventana de dialogo solicitndonos la siguiente informacin:
Input File Type: Indicamos el tipo de archivo en la cual se encuentra
nuestra base de datos original.

File Specification: Indicamos la ruta donde se encuentra nuestra base
de datos original haciendo uso del botn Browse.

Output File Type: Indicamos el tipo de archivo al cual deseamos que la
base de datos se convierta.

File Specification: Indicamos la ruta donde queremos colocar la base
de datos convertida haciendo uso del botn Browse.
Para nuestro caso ilustrativo, contamos con la base de datos de la Encuesta de

Hogares (ENAHO) en formato de SPSS llamada Enaho01-2014-100.savque se
encuentra en nuestra carpeta de trabajo, el cual queremos convertirlo a un
archivo de base de datos del STATA con el mismo nombre y que se guarde en la
misma carpeta de trabajo.
Para desarrollar esta aplicacin realizamos los siguientes pasos:

a. Abrimos la ventana de dilogo del STAT/TRANSFER.
b. En la seccin Input File Type hacemos clic a la barra desplegable y
elegimos el formato SPSS Data File ya que se debe un archivo de base
de datos del SPSS.
c. En la seccin File Specification hacemos clic en el botn Browse para

definir la ruta donde se encuentra nuestra base original.
d. En la seccin Output File Type hacemos clic a la barra desplegable y

elegimos el formato Stata Version 4-5 la cual es el formato de la base de
datos que queremos obtener.
e. En la seccin File Specification hacemos clic en el botn Browse para

definir la ruta donde queremos que se guarde nuestra base convertida.
Aunque por defecto se ubica en la misma carpeta donde se ubica la base
de datos convertida.
4. Guardar una Bases de Datos

Parta guardar una base de datos que fue modificada se puede hacer usando
con el comando save. No obstante, para las versin actuales de Stata 12 y 13
se sugiere usar el comando soveold, para que las bases de datos pueda ser
reconocido por versiones del Stata anteriores a los mencionados.
Como se puede ver en la lnea de sintaxis, despus de la coma ( , ) viene las

opciones del comando, en este caso es replace lo que significa que si se
vuelve a ejecutar esta sintaxis el Stata guardar la base de datos nuevamente
de la que ya existe.
CAPTULO II. GESTIN DE BASE DE DATOS

1. Inspeccin de la base de datos
En esta seccin aprenderemos comandos que nos permitan dar una revisada a
la base de datos, es decir, saber con qu esquema de datos y tipos de
variables estamos trabajando.
Para ello, vamos a trabajar con una Encuesta de Hogares (ENAHO) del ao
2013, el mdulo de esta encuesta ser las Caractersticas de las viviendas
encuestadas. Previamente establecemos nuestra ruta de trabajo y luego
cargamos la base de datos con el comando use.
Usualmente despus de abrir una base de datos, recurrimos a la siguiente

rutina de inspeccin de una base de datos:
Observar la base de a travs del comando browse, el cual nos permite ver
la base de datos sin poder modificarla. En cambio, existe otro comando
denominado edit que nos permite ver la base de datos pudiendo
modificarlo.
Descripcin de la base de datos con el comando describe.
Generando un diccionario de variables con el comando codebook.
Realizar un cuadro estadstico resumen de diferentes variables numricas

con el comando summarize.
2. Generacin y transformacin de variables

Una primera forma de generar variables es utilizando el comando generate,
que usualmente trabaja conjuntamente con el comando replace. Este
comando nos permite generar variables haciendo uso de expresiones
matemticas, lgicas, numricas.
Si bien es cierto que STATA solamente reconoce los comandos con letras
minsculas, tambin es importante decir que hace diferenciacin de los
nombres de las variables entre si son minsculas o maysculas.
Por ejemplo, a partir de la base de datos se quiere saber el nmero de hogares
que tienen internet, esta informacin se encuentra en la pregunta p1141. Para
ello, creamos una variable dictoma denominada internet donde toma el
valor de 0 si el hogar no tiene internet y 1 cuando si tiene internet.
A esta nueva variable se puede introducir etiquetas para una mejor

descripcin. Si queremos colocar una etiqueta al nombre de la variable
utilizamos el comando label variable, y si se quiere etiquetar los valores de la
variable primero se debe definir una etiqueta con label define y luego se
utiliza el comando label value para utilizar la etiqueta creada en los valores de
la variable, tal y como se muestra a continuacin:
Una vez creada la variable internet se puede hacer una tabla simple de
frecuencia con el comando tabulate para saber cuntos hogares tienen
internet. En este caso, de un total de 39 767 hogares entrevistadas, el 15,84%

tienen internet.
Otra forma de generar variables es empleando en comando egen.
Este
comando es una extensin del anterior, que permite utilizar expresiones que
incluyan funciones ms complejas del STATA, como es el caso de: medias,
mximos,
mnimos,
desviacin
estndar,
promedios
mviles,
variables
estandarizadas, etc.
A manera de ejemplo se puede calcular una variable que capture el valor
promedio, mximo y mnimo del pago de alquiler de una vivienda (p106).
Tambin se puede generar variables a partir de la recodificacin de otras

variables con el comando recode, el cual permite modificar los valores
especficos de una variable. A manera de ejemplo se puede crear una variable

de regiones naturales del pas (costa, sierra y selva) a partir del dominio
geogrfico (dominio). Para ello se suele recomendar realizar una revisin de las
etiquetas de la variable a recodificar con el comando label list.
A partir de las etiquetas de los valores se comienza a clasificar y agrupar con el

fin de luego formas los grupos de recodificacin de la siguiente manera:
3. Transformacin de bases de datos

Hay ocasiones en que la base de datos puede requerirse para colapsarlo de tal
forma que cada grupo de individuos est representada por una observacin en
particular, ya sea por el promedio, la mediana, desviacin estndar, mximo,
mnimo, la suma, etc., de alguna variable en particular. Para hacer esta
operacin recurrimos al comando collapse.
A manera de ilustracin cargamos una nueva base de datos denominada
kids.dta que tiene informacin de nios correspondiente a un cdigo de
familia que pertenece, su nombre, orden de nacimiento, endad, peso y sexo.
A partir de esta pequea base se requiere tener informacin a nivel de familia,

donde se registre el promedio de aos de edad de los nios, el peso mximo, y
el nmero de nios hombres. As, que la lnea de sintaxis sera el siguiente:
Por otro lado, cuando se trabaje con bases de datos de forma panel (un grupo
de individuos que se recogen informacin en un periodo de tiempo), esta
puede tener dos formas: larga y ancha. El comando reshape nos permite
transponer una base de datos panel de forma larga (long) a una de forma
ancha (wide) y viceversa. Como se muestra a continuacin:
Por ejemplo, cargamos otra base de datos llamada ingfam.dta, que contiene
informacin sobre el ingreso de 3 individuos en tres aos (1996, 1997 y 1998).
Como se observar, esta base tiene formato wide, y lo que se quiere en

transponerlo a formato long. Para ello, hay que identificar bien dos cosas: la
parte del nombre de la variable que se repite y que a su vez sirve como una
semilla (ingfam), y la variable que identifique al individuo que se colocar en la
opcin i(codfam), por ltimo se coloca un nuevo nombre a la variable temporal
j(tiempo).
Si se quiere volver al formato anterior, es decir, de long a wide, se debe

ejecutar lo siguiente:
4. Fusin de bases de datos

Es comn la combinacin de varias bases de datos. Se va a mostrar dos
operaciones bsicas: aadir observaciones y aadir variables.
En el primer caso, se utiliza el comando append para fusionar bases de datos
de manera vertical. Aqu ser necesario una base activa o cargada (base
master) y una inactiva que se va a aadir a la base master (base using),
adems la base originada tendrs una forma long.
Para ello, abrimos una nueva base de datos denominada base1.dta el cual
estar activa y ser nuestra base master. Adems, en nuestra carpeta de
trabajo existe otra base llamada
base2.dtael cual estar inactiva (base
using) y ser aadida a la primera base. Ambas bases de datos contiene

informacin de las notas de alumnos (en la primera base existe 3 alumnos y en
la segunda existen 4 alumnos) en los cursos de micro, macro y economa,
adems de su sexo el turno horario.
Para fusionar ambas bases de datos e utiliza la siguiente lnea de sintaxis:
En el segundo tipo de fusin para aadir variables, se utiliza el merge para

fusionar bases de datos de manera vertical. De la misma manera que en el
primer caso, tambin existir una base master y una base using.
Para este ejemplo, se usaran dos bases de datos que ya fueron fusionados de
manera vertical base12.dta y base34.dta, el primero ser la base using y la
segunda la base master. Ambas bases contienen informacin de alumnos, por
lo cual ser un fusin de individuo contra individuo (1:1).
Como se puede observar en la fusin, automticamente se crea una variable

denominada _merge el cual toma valores dependiendo si el registro de los
datos est presente en una de las bases o en ambos. Cuando el valor de la
variable _merge es 1 quiere decir que el dato solo aparece en la base master, 2
cuando aparece en la base using y 3 cuando aparece en ambos. Usualmente,
despus de cada fusin se suele eliminar esta variable con el comando drop.
CAPTULO III. GRFICOS EN STATA

1. Introduccin al Stata Graph
Stata presenta una amplia variedad de grficos, la cual abarca figuras como:
matrices
de
ploteos,
histogramas,
reas,
lneas,
caja
bigote,
etc.
Comenzaremos demostrando siete tipos de grficos:
histogram: Histogramas
graph twoway: Scatterplot, lneas, y otros entre dos variables.
graph matrix: Matrices de Scatterplots.
graph box: Grficas de caja y bigotes.
graph bar: Grficas de barras
graph pie: Grficas de pastel o pie.
Para cada uno de estos grficos existen muchas opciones 1.

2. Tipos de grficos
Los comandos del Stata Graph empiezan con la palabra graph (aunque en
algunos casos esto es opcional) seguido por la palabra que indica el tipo de
grfico.
A continuacin describiremos los diferentes tipos de grficos que se puede
elaborar en el ambiente del Stata.
2.1.
Histograma
La funcin de densidad de una variable puede ser estimada usando un

histograma a travs del comando histogram. Para ilustrar este comando,
utilizaremos
la
base
de
la
Encuesta
Permanente
de
Empleo
(EPE)
correspondiente al trimestre mvil Enero-Febrero-Marzo del ao 2014, la cual

contiene informacin referente a la situacin de empleo que tiene un individuo
en el mercado laboral.
En esta base se tiene informacin de los ingresos laborales totales de los
trabajadores al mes (ingtot), el cual se quiere obtener su grfico de frecuencias
1
Para observa otras tipos de grficos y comandos relacionados a estos, se recomienda escribir en la venta
de comandos help graph other.
del logaritmo natural de estos ingresos con el fin de reducir la varianza.

Adems, comparamos con la distribucin para observar si se guardan
.2
Density
.4
.6
.8
caractersticas similares, tal y como se muestra a continuacin:
2.2.
6
lningtot
10
Dispersin de puntos (Scatter Plot)
Los diagramas de dispersin de puntos (scatter plot) se accede a travs del

comando graph twoway scatter. Por ejemplo, queremos ver la relacin que
lningtot
6
10
guardan el ingreso laboral total (en logaritmos) con la edad (p108).
20
40
60
edad ( en aos )
80
100
No obstante, se puede ajustar un lnea recta (lfit) a este grfico, y al mismo

tiempo ajustar por una relacin cuadrtica (qfit), para ver si existe
10
rendimientos decrecientes en los ingresos laborales.
20
40
60
edad ( en aos )
lningtot
Fitted values
2.3.
80
100
Fitted values
Mltiple dispersin de puntos
El comando graph matrix nos muestra un til anlisis multivariado. Este

comando otorga una grfica compacta de la relacin entre un nmero de
variables por pareja, permitindole al analista observar los signos de no
linealidad, outliers o cluester que puedan afectar al modelamiento estadstico.
Este tipo de grfico tambin es til si se quiere observar la influencia de una
lista de variables explicativas a una variable dependiente.
Por ejemplo, si se quiere ver grficamente la relacin de un conjunto de
factores que pueden influir en los ingresos laborales de la persona, como es el
caso de la edad (p108), las horas de trabajo (p209t) y el nivel educativo
(p109b), se puede ealizar de la siguiente manera:
50
100
10
10
lningtot
5
0
100
edad (
en aos
)
50
0
100
total de
horas
trabajadas
50
0
10
aos de
estudios
5
0
0
2.4.
10
50
100
Caja y bigote
La grfica de caja y bigote brinda informacin acerca del centro, amplitud,

simetra y outliers con solo un vistazo. Para obtener este grfico, se debe
empelar el comando graph box.
Si seguimos analizando la distribucin de los ingresos laborales con un grfico
lningtot
6
10
de caja y bigotes se programara la siguiente lnea de comando.
Si se quiere el mismo grfico pero de manera horizontal, se debera usar el

comando graph hbox.
2.5.
6
lningtot
10
Pie
Este estilo es muy popular en las presentaciones de grficas, siempre y cuando

tengan pocos valores para trabajar. El comando bsico del grfico de pastel es
graph pie.
Si se quiere saber la distribucin de las personas por nivel educativo (p109a)
que fue recodificada a una menor cantidad de niveles (sin nivel, primaria,
secundaria, superior) que lleva como nuevo nombre niveduc, se puede
obtener utilizando el comando mencionado con la opcin over() para que los
pedazos del pie lo conformen los cuatro niveles educativos:
Sin nivel
Secundaria
2.6.
Primaria
Superior
Barras
El grfico de barras provee una simple y verstil exhibicin conjunto de

resmenes estadsticos como media, mediana, suma o conteo. Para obtener
barras verticales se debe utilizar el comando graph bar.
Por ejemplo, si se desea comparar en un grfico de barras el valor de la media
y la mediana del ingreso laboral, se debera especificar los estadsticos a
utilizar, en este caso (mean) y (median). Adems, si se quiere mostrar los
1,500
valores de estos estadsticos se debe colocar la opcin blabel(bar).
1440.19
500
1,000
1083
mean of ingtot
p 50 of ingtot
S que quiere las barras de manera horizontal basta con usar el comando
graph hbar.
CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC)

1. Especificacin y supuestos del MRLC
En los modelos de regresin lineal se requiere explicar el comportamiento de
una variable (dependiente
Y ) a partir de otras (regresoras o explicativas
X ). Utilizamos el concepto de distribucin de probabilidad condicionada,

pues se busca conocer los estimadores de los parmetros de regresin con la
finalidad de estimar finalmente el
valor esperado de Y, dado que
E ( Y X =x ) , es decir buscamos conocer el

X =x
(la variable regresora toma un
x ).
determinado valor
y i= 0 + 1 x i + i
La variable
yi
es la variable dependiente, las variables
variables explicativas o regresoras, y
comnmente llamado trmino de error. Los
xi
son las
es la perturbacin aleatoria o
son los parmetros asociados
a cada una de las variables explicativas, tambin llamados coeficientes de

regresin y miden el impacto de cada variable independiente en relacin al
comportamiento de la variable endgena.
Los parmetros
son no conocidos. Sin embargo, utilizando informacin
muestral se pueden obtener estimadores de los parmetros (o coeficientes).

Dado la expresin anterior, se considera que se cumplen las siguientes
hiptesis clsicas bsicas:
Linealidad en los parmetros.
No singularidad o multicolinealidad. No existen relaciones lineales

entre las variables explicativas o regresores y estos no son variables
aleatorias.
Exogeneidad estricta o no endogeneidad. La esperanza del vector
E ( )=0 .
de la variable aleatoria es cero:
Errores esfricos. La matriz de varianzas y covarianzas del vector de

variables aleatorias es:
del vector
E ( ' )= 2 I . Es decir, todos los componentes
tienen varianza idntica (homoscedasticidad), y adems
las covarianzas son 0, es decir, los elementos del vector
no estn
correlacionados (no autocorrelacin).

Normalidad de los errores. La distribucin de probabilidad del vector
de perturbaciones aleatorias es:
N ( 0, 2 I ) , es decir, es un vector
normal esfrico. Por tanto, las perturbaciones son variables aleatorias

independientes e igualmente distribuidas, normales con media cero y
varianza
2 I . Dado que
probabilidad
del
perturbaciones
vector
X
Y
no es aleatoria, la distribucin de
se
deriva
partir
del
vector
de
Y N ( X , 2 I ) .
2. Estimacin del MRL por el mtodo de Mnimos Cuadrados

Ordinarios (MCO)
El mtodo de Mnimos Cuadrados Ordinarios (MCO) permite encontrar los
parmetros desconocidos del modelo, cuyo criterio es minimizar los errores al
cuadrado del MRLC.
A partir de este criterio, se puede estimar el valor de los parmetros de la
siguiente manera:
^=( X ' X )1 X ' Y

Y a su vez la matriz de varianza y covarianza, que servir para calcular los
errores estndar de los estimadores, se obtiene de la siguiente relacin:
Var ( ^ ) = 2 ( X ' X )
Donde el parmetro
se puede estimar de la siguiente manera:
^ ' ^ ( Y X ^ ) ' ( Y X ^ )
^2=
=
nk
nk
Siendo n el tamao de la muestra y k el nmero de parmetros.
A manera de un ejercicio aplicativo, se emplea la base del sistema del Stata
auto.dta. En esta ocasin se desea explicar el precio del auto (price) en
funcin de los millages por galn (mpg), su peso (weight) y su procedencia
(foreign). Es decir:
pricei= 0 + 1 mpg i + 2 weighti + 3 foreign i+ i

El comando en Stata para estimar un MORLC por la tcnica de MCO es
regress, tal y como se muestra a continuacin:
Los resultados ms importantes de esta regresin se detallan en el cuadro de

la parte inferior, donde en la segunda columna se encuentra los coeficientes o
parmetros estimados asociado a cada variable explicativa. Y en la columna de
a lado, se presenta los errores estndar de estos estimadores el cual servirn
como insumo para calcular el estadstico t-student, y este ltimo a su vez
servir para calcular la probabilidad acumulada.
Tanto el estadstico t-student y la probabilidad son importantes para realizar las
pruebas de significancia individual, para saber si las regresoras obtenidos
influyen significativamente o no sobre la variable dependiente. Por tanto, la
hiptesis para evaluar esta significancia individual es el siguiente:
Ho :
=0
(hiptesis nula)
Ha :
(hiptesis alternativa)
La regla de decisin es la siguiente:
Se acepta Ho si: t-calculado < 1.96. Si p-value > 0.05.

Se rechaza Ho si: t-calculado > 1.96. Si p-value < 0.05.
En el caso del ejemplo, se puede apreciar que para la variable mpg tiene un
valor de t-calculado igual a
0.29, menor a 1.96, por lo cual se rechaza la
hiptesis nula de significancia individual. La misma conclusin se obtendra por

el lado de la probabilidad ya que esta es 0.769 mayor al umbral de 0.05.
En cuanto a la significancia conjunta del modelo, es decir, si las regresoras en

conjunto explican el comportamiento de la variable dependiente, es necesario
fijarnos el cuadro superior de lado derecho donde se encuentra el estadstico
de Fisher. Para ello hay que observar el valor de la probabilidad Prob. > F y
sigue la misma regla de la significancia individual, es decir, si es mayor a 0.05
se acepta la hiptesis nula de no significancia individual, caso contrario se
rechaza esta hiptesis nula, lo cual indicar que las variables si explican
significativamente en su conjunto. Para el caso del ejemplo, esta probabilidad
es 0.0 menor al 0.05, por lo cual se rechaza la hiptesis nula, lo que significa
que son estadsticamente significativos de manera global.
Otro resultado importante es la bondad de ajuste del modelo que se mide por
el Coeficiente de Determinacin, o tambin llamado R-squared (R 2). El valor de
este estadstico es 0.4996 que es igual a decir 49.96%, lo que significa que el
49.96% de la variabilidad o varianza de Price est siendo explicada por la
varianza de las variables explicativas. Se espera que mientras ms cercano a la
unidad este estadstico es mejor el modelo.

Manual de Stata Básico

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual de Stata Básico

Cargado por

Copyright:

Formatos disponibles

ECOTRAINING

MANUAL DE STATA BSICO

Entorno del Stata....................................................................................... 3

Cargar Bases de Datos.............................................................................. 8

Cargando una base de datos del Stata................................................8

Creando manualmente una base de datos en Stata...........................9

Convirtiendo bases de datos...............................................................9

Guardar una Bases de Datos...................................................................11

CAPTULO II. GESTIN DE BASE DE DATOS.......................................................12

Inspeccin de la base de datos................................................................12

Generacin y transformacin de variables..............................................14

Transformacin de bases de datos.........................................................16

Fusin de bases de datos.......................................................................18

CAPTULO III. GRFICOS EN STATA.....................................................................21

Introduccin al Stata Graph.....................................................................21

Dispersin de puntos (Scatter Plot)...................................................22

Mltiple dispersin de puntos............................................................23

CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC).........................27

Especificacin y supuestos del MRLC......................................................27

2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios

CAPTULO I. INTRODUCCIN AL STATA

En el transcurso de la capacitacin, aprenderemos a trabajar con otras

c. STATA Data Editor: Nos permite digitar y modificar los datos de la

Uno de los archivos principales para comenzar a usar el Stata es el archivo de

o escribir en la ventana de lnea de

A continuacin, nos aparecer una ventana de editor en blanco, donde

a. Permite registrar una de serie de comandos, la cual representa todo el

necesidad de crearlo nuevamente.

(execute do) ubicado en la parte superior derecha de la

barra de herramientas del archivo Do-file o presionando los teclados Ctrl+D

Luego, se debe cambiar la ruta o directorio de trabajo, ya que cuando se inicia

Dentro de nuestra carpeta de trabajo Clase 1 existe una carpeta denominada

Ahora, utilizamos el comando cd para cambiarnos al nuevo directorio creado,

3. Cargar Bases de Datos

Cargando una base de datos del Stata

STATA cuenta con bases de datos dentro de su sistema como ejemplos

Creando manualmente una base de datos en Stata

La manera de editar manualmente una base de datos a travs del dofile es a

seguido del nombre de las variables y a partir de la siguiente lnea de comando

Convirtiendo bases de datos

Input File Type: Indicamos el tipo de archivo en la cual se encuentra

nuestra base de datos original.

de datos original haciendo uso del botn Browse.

base de datos se convierta.

Para nuestro caso ilustrativo, contamos con la base de datos de la Encuesta de

Para desarrollar esta aplicacin realizamos los siguientes pasos:

c. En la seccin File Specification hacemos clic en el botn Browse para

d. En la seccin Output File Type hacemos clic a la barra desplegable y

e. En la seccin File Specification hacemos clic en el botn Browse para

4. Guardar una Bases de Datos

Como se puede ver en la lnea de sintaxis, despus de la coma ( , ) viene las

CAPTULO II. GESTIN DE BASE DE DATOS

Usualmente despus de abrir una base de datos, recurrimos a la siguiente

Descripcin de la base de datos con el comando describe.

Generando un diccionario de variables con el comando codebook.

Realizar un cuadro estadstico resumen de diferentes variables numricas

2. Generacin y transformacin de variables

A esta nueva variable se puede introducir etiquetas para una mejor

internet. En este caso, de un total de 39 767 hogares entrevistadas, el 15,84%

Otra forma de generar variables es empleando en comando egen.

Tambin se puede generar variables a partir de la recodificacin de otras

especficos de una variable. A manera de ejemplo se puede crear una variable

A partir de las etiquetas de los valores se comienza a clasificar y agrupar con el