Está en la página 1de 8

Uso y Manejo Bsico de Bases de datos en STATA 10

Carrera: Ingeniera Industrial Asignatura: Economa General Profesor: Carlos Narvez Silva Monitores: Carlos Mungua y Francisco Mendoza

Inicialmente la interfaz del programa STATA presenta las siguientes opciones para trabajar 1

3 4

Las opciones presentadas en 1 son muy similares a la barra de opciones de un Word aunque con ciertas caractersticas especiales. File: permiten abrir/ guardar archivos Edit: Copiar/Guardar Data: Permite un mayor control en las variables utilizadas, esto es: reconocer su etiqueta, cambiar nombres, crear matrices de variables, etc. Graphics: Creacin de grficos Statistics: Opciones para anlisis de datos, estadsticos descriptivos, regresiones, pruebas estadsticas, etc.

User, Window, Help: Opciones de apoyo del programa Stata El espacio dentro de la interfaz de Stata que corresponde a Command (2) guardar por defecto todos los comandos usados El espacio dentro de la interfaz de Stata que corresponde a STATA (3), que es el espacio ms grande de la pantalla presentar todos los resultados de nuestro trabajo El espacio dentro de la interfaz de Stata que corresponde a Variables (4), presentar todas las variables a usar, es decir, al momento de abrir la base de datos sta se abrir en este espacio con el nombre de cada una de sus variables El espacio dentro de la interfaz de Stata que corresponde a Command (5) corresponde el rea donde se introducen los comandos para analizar la base de datos, por ejemplo: tab x, siendo x una variable de nuestra base de datos Indica, entre otros estadgrafos, la frecuencia y el porcentaje de las observaciones que caracterizan a la variable X.

Para abrir una base de datos

Abrir una base de datos es igual a abrir cualquier archivo en Word, o Excel. Solo se presiona en la carpetita sealada por la flecha y se busca en sus documentos el archivo de la base de datos deseado.

*Las bases de datos sern proporcionadas en el Blog de la clase o enviadas a un correo del Aula en formato SPSS, para pasarlo a archivo .dta que es el tipo de archivo que reconoce el STATA se har uso del Stat-Transfer.

Para abrir un Do-file

Un Do-File es una opcin que el Stata nos presenta en el cual se permite guardar toda la secuencia que se ha trabajado, es un registro de los comandos usados al momento de modificar o analizar la base de datos. Al momento de dar click en la pestaa sealada por la flecha se abrir una ventana nueva, de sta ventana se puede abrir desde File el archivo .do que representa nuestro do-file. El dofile puede ser

ejecutado con la pestaa Execute presentada con la flecha. Esto correr toda la secuencia guardada

Ejemplo de Uso

Utilizando label list como comando, se puede obtener el valor asignado por el digitador de datos a la variable en cuestin, aqu el digitador utiliz el valor 1 para representar el rea de residencia Urbana. Utiliz 2 para representar el rea de residencia Rural

Una vez abierto el STATA y su base de datos, en este caso Poblacin Segn la EMNV 2005, se pueden obtener datos especficos de la misma, si se quiere obtener el porcentaje y frecuencia de mujeres y hombres capturados por la encuesta se utiliza el comando tab

Ej:

tab s2p3

ENTER

Si se quiere saber el rea de residencia se utiliza el mismo proceso Ej: tab i05 ENTER

Se puede apreciar que la mayora de los encuestados son mujeres (50.6%) y que los encuestados en su mayora son rurales. Esto nos da un total de 36,612 de

encuestados.

De esta manera se pueden obtener datos an ms especficos. Si le queremos decir al software que nos proporcione a el nmero de mujeres que se encuentran en el rea rural se procede de la siguiente manera

Este comando nos dice que tabulemos la pregunta referente a sexo si sta es mujer y se encuentra en el rea rural: 9,380 mujeres habitan en zonas rurales.

Para conocer otros estadgrafos sobre una variable, se utiliza el comando sum el cual nos da el nmero de observaciones, la media, la desviacin estndar, el mnimo y el mximo de la variable.
. sum precio Variable precio Obs 5024 Mean 50.58632 Std. Dev. 59.09051 Min .8064 Max 226.8

Como podemos observar aqu se aplic el comando sum a la variable precio el cual nos indica que contamos con 5,024 observaciones en la variable; la media del precio es de 50.59 crdobas. Por otro lado la desviacin estndar es de 59.09 y que el precio mnimo es de 0.80 crdobas y el precio mximo es de 226.8 crdobas.

Los comandos gen como replace son comandos importantes a la hora de manejo de base de datos, esto es debido a que el comando gen nos permite generar una variable dentro de la base de datos, mientras que el comando replace nos ayuda a remplazar datos en una variable ya existente. Tras haber explicado esto es necesario un ejemplo para tener un mayor entendimiento por lo que se les presenta un ejemplo. Por ejemplo, queremos generar una variable que se llame rural en el cual queremos indicar que cuando sea 1 la variable indique a todas las personas que residen en el rea rural mientras que si toma valor igual a 0 es que residen en una rea urbana.
. gen rural=0 . . replace rural=1 if i06==2 (19325 real changes made) . tab rural rural 0 1 Total Freq. 17,287 19,325 36,612 Percent 47.22 52.78 100.00 Cum. 47.22 100.00

Como se puede ver en la imagen primero se gener una variable que sea igual a 0 con el comando gen. Luego se utiliza el comando replace para editar la variable rural que se ha creado y que sta tome uno (1) cuando la pregunta i06, la cual hace referencia al rea de residencia, es igual a dos (2) debido a que este es el cdigo para el rea rural asignado por el digidator de datos en la pregunta. Despus de esto utilizamos el comando tab para observar cu{ntas personas se encuentran en el rea rural y debido a que anteriormente se le haba asignado al nmero 1 como las personas que habitan en el {rea rural podemos decir que 19,325 personas pertenecen a esta y 17,287 son del rea urbana.