Está en la página 1de 14

Prof. Luis Bustos M., Juan Orellana C., y Sergio Muoz N.

es un programa estadstico implementado para Windows 95 y superior, Unix y


Stata Macintosh. Este programa provee herramientas para el manejo de bases de datos,
analizar datos utilizando estadstica descriptiva e inferencial.
Esta gua ser desarrollada para Stata sobre Windows 95 / 98 y superior
Stata es totalmente compatible con todos los software de este sistema, tiene la filosofa Win95 y
por lo tanto el sistema de men e iconos. La pantalla principal de Stata, contiene cuatro ventanas.
La ms grande es la ventana de resultados; a la derecha, de arriba hacia a bajo, estn las ventanas
comandos previos (Review) y la de variables. En la parte ms baja de la pantalla se encuentra la
ventana de comandos (Stata Command).
El propsito de esta gua es ejemplificar algunos comandos de Stata (entre muchos) y revisar
algunas herramientas que Stata dispone para el manejo de bases de datos.
Objetivos
1.1 Manejar el ambiente de Stata 9.0.
1.2 Conocer el concepto de base de datos en Stata 9.0.
1.3 Aplicar las herramientas de presentacin y resumen de datos usando el software Stata 9.0.
Partamos por lo primero!!!
I.- Creacin de una base de datos Stata.
Supongamos que estamos interesados en analizar los datos de un ESTUDIO EN UNA UNIDAD
DE CUIDADOS INTENSIVOS (Hosmer and Lemeshow, pg. 21 and Appendix). Se selecciona
una muestra de 200 pacientes que fueron parte de un estudio en adultos admitidos en una Unidad de
Cuidados Intensivos (UCI), los datos se encuentran en una base de datos excel, denominada
uci200.xls, el cuestionario utilizado para el registro de los datos fue el siguiente

Nmero de la encuesta (id): Cuestionario


Estado vital (estvital): 0: Vivo 1 Muerto

Sexo (sexo) 0: Mujer 1: Hombre

Edad (edad) En aos

Servicio de donde se hizo el ingreso (servuci) 0: Ciruga 1: Medicina

Presenta infeccin al ingreso (infecing) 0: No 1: S

Presin sistlica al ingreso (psistoli) En mmHG

Presin diastlica al ingreso (pdiastol) En mmHg

1
Pulso al ingreso (pulsoing) En minutos

Tipo de admisin (tipoadm) 0: Electiva 1 Urgencia

Base de datos uci200.xls 1ra fila se escriben las variables abreviadas

Ingresar 1era encuesta

Para crear una base de datos debemos considerar que sta ser una matriz que contendr en cada fila
el perfil de un paciente y en las columnas las variables.
En nuestro ejemplo, la matriz de datos ser de orden 200 filas (pacientes) por 10 columnas
(variables).

Para crear la base de datos anterior hay que hacer clic en datos, despus en formulario
La tecla tabulador permite avanzar de variable en variable

2
I. Convertir una base de datos Excel en una base de datos Stata.
Para crear esta matriz de datos en Stata se deben seguir los siguientes pasos:
1.- Seleccionar y Copiar los datos de la base de datos Excel.

2.- Abra Stata (obvio ), desde inicio, programas, stata o bien desde un acceso directo.
3.- Stata dispone de un editor de Datos llamado Data Editor. Con su mouse haga un click en
el icono que le corresponde.

4.- Ubique el cursor en la primera fila, primera columna. Click en Edit, luego Paste (pegar)

Editor

5.- Defina las variables. En el encabezado de cada columna haga doble click y complete los
campos Name, Label y Format con el nombre de la variable (no ms de 8 caracteres), la
etiqueta ( no mas de 23 caracteres), y el tipo de variables (Ej. %8.0g indica que la variable es
numrica de 8 dgitos y de formato general; %8.2f indica que la variable es numrica de 8
dgitos y de formato fijo con dos decimales). Para mas informacin sobre formato de

3
variables, recurra al men Help, luego Search y escriba format

Doble click para desplegar propiedades

Etiqueta del estado


vital

Definir y modificar variables

6.- Una vez escrito los label y definir las etiquetas, cerrar el editor para comenzar a utilizar el
stata
De esta forma usted ha creado su propia base de datos!!!!!!!
NO OLVIDAR GRABAR SU BASE DE DATOS.

- Tambin se dispone de un Programa de conversin de Datos, ste se llama StatTransfer y


reconvierte datos de muchos formatos (Excel, Lotus, Dbase, etc.) a Stata y viceversa.
Nota: Si se desea crear una base de datos correspondiente a un gran cuestionario, entonces se
recomienda usar un programa especializado, como el Epi Info o el Access. Estos softwares
disponen de programas de entrada de datos ms amigables y eficientes que el Excel y Stata.

4
II.- Anlisis descriptivo de una base de datos.
Si ya existe una base de datos stata, desde el men principal de Stata, click en (open) y
seleccionarla.
Inmediatamente abierta la base de datos, usted ver en la ventana de variables el listado de todas
ellas.

Comando stata que permite cargar


una base de datos

Procedamos a revisemos algunos comandos de Stata. Ellos se escriben en la "ventana de


comando" y siempre en minsculas.
Previo al anlisis se recomienda crear un archivo que guarde todos los resultados que se realicen
con la sesin activa, para esto siga las instrucciones:

4. Guardar

1. Presionar este
botn para crear
un archivo de texto
donde se guarden
todos los 2. Seleccionar Tipo 3. Asignar un nombre con
resultados de archivo log extensin *.doc o por
desplegados en la (texto) defecto asigna *.log
ventana Results

5
1. describe (desc) : Describe el contenido de la base de datos activa.

2. codebook: Describe el contenido de los datos de una variable

6
3.- list : Permite listar datos en la ventana de resultados de las variables especificadas.

El operador == se usa para asignar un


valor a una variable

. list estvital sexo edad if edad==16

+------------------------+
| estvital sexo edad |
|------------------------|
26. | Vivo Fem 16 |
142. | Vivo Masc 16 |

Veamos un poco de medidas de resumen.


4.- summerize (sum): Entrega las medidas de resumen de las variables bajo estudio.

5.- sort : Ordenar datos. Suponga que desea listar las cinco ms bajas Presiones Sistlicas
observados en la base.

sort psistoli
list id psistoli in 1/5

7
6. Preguntas y respuestas.
1.- Cul fueron los valores mnimos y mximos, el valor promedio y desviacin estndar de la
presin sistlica.
2.- Quiero ms detalles?, percentiles.
R: ok! Despus de la coma se agrega la opcin de detalles

3.- Puedo obtener algunos Estadgrafos de edad y presin sistlica en funcin del estado vital?
R: Si!!!!. bys = abreviacin del comando by sort

8
4.- Cmo puedo obtener algunas medidas de resumen de presin sistlica de los pacientes que
ingresaron a la uci y que presentaron una edad superior o igual a 65 aos?
R:
. sum psistoli if edad>=65

Variable | Obs Mean Std. Dev. Min Max


-------------+--------------------------------------------------------
psistoli | 91 135.2418 35.74737 62 212

. sum psistoli if edad>=65 & estvital==1

Variable | Obs Mean Std. Dev. Min Max


-------------+--------------------------------------------------------
psistoli | 23 115.4348 36.52997 62 190

Nota: Si desea ms informacin del comando if o cualquier otro comando de Stata, dirjase a la
opcin search del men Help y obtendr una lista completa de comandos relacionados con
el que usted indic. Debe seleccionar el comando especfico (en letras verdes) y usted
obtendr descripcin completa del comando y algunos ejemplos.

Desea hacer tablas de resumen de Datos ..... de una entrada o dos o tres ..... ?

7.- tabulate (tabu): Despliega, en su forma simple, tablas de distribucin de frecuencia.


1. Cul es el estado vital de los pacientes que ingresaron a la uci?

2. Cul es el estado vital de los pacientes que ingresaron a la uci y que tenan una edad superior o
igual a 65 aos?

9
3. Cul es la distribucin del estado vital de los pacientes segn tipo de admisin.

Fila Columna

Opciones
row = porcentajes por filas
col = porcentajes por columnas
nokey = para no desplegar los
comandos de la tabla de
contingencia.
nofreq = despliega tabla de
contingencia solamente con
porcentajes

tab sexo estvital, row nofreq nokey

Sexo | Estado Vital


| Vivo Muerto | Total
-----------+----------------------+----------
Fem | 78.95 21.05 | 100.00
Masc | 80.65 19.35 | 100.00
-----------+----------------------+----------
Total | 80.00 20.00 | 100.00

Seleccionar tabla y con botn secundario del Mouse elegir copy table
Pegar en Excel: disear tabla y graficar

10
Click en
opciones de
graficos

Seleccionar

4. De la relacin entre tipo de admisin y estado vital, encuentre el promedio, desviacin estndar y
frecuencia de presin sistlica: tabu tipoadm estvital, sum(psistoli)

11
III.- Creacin de nuevas variables.

8. generate y : Permiten la creacin de nuevas variables a partir de otras existentes o


replace mediante supuestos y expresiones matemticas. Las variables generadas
aparecen inmediatamente en la ventana de variables al final de las otras

Algunos ejemplos.
1. Es muy frecuente que en un anlisis estadstico sea necesario estandarizar variables, esto es
reducirlas y centrarlas. A cada observacin se debe restar la media y se dividir esta diferencia
por la desviacin estndar. En smbolos esto sera zi = (xi - media)/sd.
Los datos estandarizados corresponderan a una nueva variable que hay que crear:

2. Si se desea crear una nueva variable que divida la edad en 4 grupos iguales, se deben usar los
cuartiles y el siguiente procedimiento:
a) Usar comando centile para encontrar los cuartiles pedidos.
b) Usar generate y replace

Operadores lgicos:
&=y
|=o

12
Para etiquetar las respuestas y recordar la codificacin se procede de la siguiente manera:

sum edad if edad<=46.25 | edad>=72


La opcin de o (|) indica unin de los valores extremos

sum edad if sexo==1


Este comando entrega las medidas de resumen solo de los hombres,
por esa razn doble igual para poder asignar lo que se desea
evaluar

Recordar: Una forma mas fcil de etiquetar es desde el editor

9. recode : Permite tambin generar una nueva variable, mediante el siguiente procedimiento

3. Se agrupar la edad en dos categoras, utilizando el percentil 50, mediante el siguiente


procedimiento:
Opcin que considera los siguientes tramos:
16-63 y 64-92

13
4. Si deseamos convertir los missing values (.) de una variable en el valor 99, una forma sera:
recode variable .=99

5. Para eliminar una variable recin creadas, se procede as:


Drop z1

Observacin
Una vez finalizada la sesin de trabajo hay que cerrar el archivo de texto para guardar los
resultados para ello se escribe directamente en stata command

o bien

Presionar este botn para cerrar


archivo de texto con los resultados
de la sesin activa. Este se puede
Recordar de abrir con cualquier editor de texto
grabar los
cambios
realizados en la
base de datos

Esta opcin permite guardar los comandos utilizados durante la sesin de trabajo.
Se utiliza cuando se disea el plan de anlisis, escribiendo directamente los comandos que
permitan realizar el anlisis propuesto, para ejecutar el archivo de programa (*.do) hay que

presionar la siguiente opcin

14

También podría gustarte