Está en la página 1de 14

Bioestadstica

Gua para el Alumno


Stata 8.0

Bioestadstica

SEMANA I - ASPECTOS GENERALES


Review acumula comandos anteriores, los
cuales pueden ser reenviados a la ventana
de Stata command clickeando sobre ellos

Variables, presenta las variables de


base de datos en uso.

Stata Result, muestra los corridas de


aplicar comandos en Stata

Stata se maneja con comandos, los cuales


se tipean en la ventana Stata command

I. Introduccin y manejo bsico de Stata


A. Elementos bsicos (obtener ayuda, salir)
Stata 8 presenta formato de mens como de ventanas, estas cuatro ventanas llamadas
Review, Variables, Stata Results y Stata command. Si maneja Stata 8 con comandos, estos se
tipean en la ventana Stata command, y los resultados aparecen en la ventana Stata Results. La
ventana Review registra comandos utilizados previamente, los cuales pueden ser reenviados a
la ventana de Stata command clickeando sobre ellos. Para obtener ayuda, clickee en el men

Bioestadstica
la opcion Help y siga las instrucciones en pantalla. Para terminar la sesin, cierre el programa
clickeando en el botn superior derecho (como cualquier otro programa Windows).

El programa Stata 8 nos presenta una variedad de iconos, que pueden agilizar el manejo y anlisis
de una base de datos.
Para abrir un archivo, use.
Para guardar archivo que se encuentra en memoria, save
Para poder imprimir un archivo, print
Para crear un archivo que guarde bitcoras del Stata Results, log
Para crear un archivo que guarde programas de ventana Review, do
Para abrir ventana de edicin de base de datos, edit
Para visualizar base de datos en uso, browse
COMANDO

DESCRIPCION

help
log
use
edit
codebook
describe

Ayuda de programa stata, para comandos.


Uso de archivos de bitcora
Abrir una base de datos en stata (extensin .dta)
Ingreso de datos por medio de ventana de Stata Editor
Muestra variables con estadsticos descriptivos
Describe contenido de datos en memoria o sobre el disco
Copiar y pegar datos de MS Excel
Guarda los datos en disco con extensin *.dta
Lista de valores de variable
Selecciona observaciones cumpliendo cierta condicion para la
ejecucion del comando
Borrar variable o dato en memoria
Borra variables o datos no seleccionados
Comando de etiqueta de variables
Primer paso para etiquetar valores de una variable
Segundo paso para etiquetar valores de una variable

save
list
... if ...
drop
keep
label variable
label define
label values

Demostracin y explicacin de los comandos de Stata


En Stata la sintaxis de los comandos es la siguiente:

Bioestadstica
comando lista de variables [if expression] [in expression], [opciones]
help. Para obtener ayuda de parte del programa stata 8
Para opciones generales del comando
. help

Para ayuda sobre contenido general del uso en stata


. help contents

Para ayuda sobre el comando list


. help list
log. El siguiente comando nos permite guardar las bitcoras realizadas en el analisis de
datos, en un archivo con la extensin mas adecuada para el usuario.
. log using "C:\DATA\clase1.txt", text
--------------------------------------------------------------------------------------log: C:\DATA\clase1.txt
log type: text
opened on: 2 Jun 2003, 13:22:48
use
Para el uso de la base de datos cancer.dat, escribiremos el comando use, usando ademas la opcin
clear, que nos permite cargar la base de datos en memoria aun teniando en uso otra base de datos
y guardando los cambio cargados en memoria realizados en esta ultima
use "C:\Stata\cancer.dta", clear
(Patient Survival in Drug Trial)

edit
Para ingresar los datos por medio de una ventana tipo hoja de calculo utilizamos el comando edit,
el cual apertura una ventana de ingreso de datos
edit
Al terminar de ingresar
datos haga click en el icono
preserve para no perder el
ingreso de datos realizado

Bioestadstica

codebook
Este comando muestra una lista de las variables sealando el tipo de variable, su rango,
frecuencias en caso de una variable cualitativa (codificada) media, desviacin estandar y
percentiles en caso fuera una variable continua.
Use C:\Stata8\auto.dta, clear
codebook
use "C:\Stata8\auto.dta", clear
mpg
Mileage (mpg)
--------------------------------------------------------------------------------------type: numeric (int)
range: [12,41]
units: 1
unique values: 21
missing .: 0/74
mean: 21.2973
std. dev: 5.7855
percentiles:
10%
25%
50%
75%
90%
14
18
20
25
29
rep78

Repair Record 1978

--------------------------------------------------------------------------------------type: numeric (int)


range: [1,5]
unique values: 5
tabulation: Freq. Value
2 1
8 2
30 3
18 4
11 5

units: 1
missing .: 5/74

describe
Este comando muestra una lista de las variables de la base de datos en uso.
. describe
Contains data from miarchi.dta
obs:
3
vars:
3

5 Nov 2002 12:35

Bioestadstica
size:
102 (99.9% of memory free)
------------------------------------------------------------------------------storage display
value
variable name
type
format
label
variable label
------------------------------------------------------------------------------name
str20 %20s
age
float %9.0g
sex
str6
%9s
------------------------------------------------------------------------------Sorted by:

Copiar de una hoja excel datos a Stata 8


El programa Stata 8 tiene la facilidad de copiar los datos de una hoja de excell con simples
opciones de copiar y pegar que se utilizan en windows, antes teniendo la ventana de edit activada
en Stata 8.
1. Edit, stata8
2. Cambio de ventana a excell
3. Seleccionar datos a ser copiados y hacer clic en icono de copiar, ctrl. + C
4. cambiar de ventana edit de Stata 8
5. Hacer clic en icono de pegar, ctrl + V

save
Para guardar datos que se han ingresado
save miarchi

Bioestadstica
Si no se muestra el directorio donde estara el archivo, por defecto se guarda el archivo en el
directorio C:\Data. Si el archivo ya habia sido creado anteriormente y se han ingresado datos
nuevamente se utiliza la opcion replace
save miarchi, replace
list. Presenta los valores de las variables. Si no presenta variables con el comando list, se
presentaran los valores de todas las variables
use "C:\Stata\auto.dta", clear
list drug age
1.
2.
3.
4.
5.
6.
7.

drug
1
1
1
1
...
...
...

age
39
66
70
44
...
...
...

if al final de un orden significa usar slo los datos especificados. if es permitido con la mayora
de los comandos de Stata.
list drug age if age > 45
2.
3.
9.
11.
14.

drug
1
1
1
1
1

age
66
70
48
63
64

drop. Borra variables valores seleccionados.


drop variable
De inmediato desaparece de ventana de variables en memoria
keep. Borra variables o valores no seleccionados.
keep variable
label, sirve para etiquetar datos, variables y valores.

Bioestadstica
label variable age "edad del paciente"
describe age
storage display value
variable name
type
format
label
variable label
------------------------------------------------------------------------------age
int
%8.0g
edad del paciente
label define. Es utilizado como un primer paso para el etiquetar valores de variables seleccionada
label define drogas 1 Megacilina 2 Tetracicilna 3 Oxacilina 4 Penicilina
label values. Es utilizado como segundo paso para el etiquetar valores de variables seleccionada
label values drug drogas

Bioestadstica
Exploracin y presentacin de datos.
generate
replace
merge
collapse
summarize
tabulate
table
graph
scatter
boxplots
bar
lines
stacked bar
mean

Genera variable
Reemplaza valores de variable bajo alguna condicin
Ingresa variables o casos de una base patrn a otra
Calculo de estadsticos descriptivos para variables cuantitativas
Anlisis para variable cuantitativa, media, mediana, etc
Tabla de frecuencias para variables cualitativas
Tabla de frecuencias simples para variables cualitativas
Crea un grafico de cualquier variable
Genera grafico de dispersin entre 2 variables
Grafico de cajas
Grafico de barras
Grafico de lineas
Grafico de barras apiladas
Grabar y editar review.
Uso del editor de programas (archivo .do)

Variables:
Variables Cuantitativas
o Variable Discretas
o Variable continuas
Variables Cualitativas
o Variable nominal
o Variable ordinal
Demostracin y explicacin
Definicin de tipos de datos, presentacin de datos en tablas de contingencia y resumen,
presentaciones grficas diversas. Estadstica descriptiva simple: medidas de tendencia central y
dispersin. Uso de archivos de bitcora (log),
1. Para el analisis de las variables numericas tenemos el comando summarize, el cual calcula
estadisticos de tendencia central, asi como de distribucion.
Entonces trabajando con el archivo de c:\stata\cancer.dta, tenemos
generate. Genera una variable que va a ser recodificada, por ejemplo si tenemos en uso el
archivo cancer (c:\stata\cancer.dta) y queremos recodificar la variable age en una nueva variable
age1 que contenga los intervalos de edad 45-50 51-55 56-60 61a+. Entonces seguimos los pasos
correspondientes para el ejemplo

Bioestadstica
Para abrir el archivo cancer
use c:\stata\cancer.dta, clear
Generando la variable age1 con valores iguales a age
generate age1 = age
Para reemplazar valores en la nueva variable age1, utilizamos el comando replace, if y
operadores logicos y de relacion
replace age1 = 0 if age <=50
replace age1 = 1 if age > 50 & age <= 55
replace age1 = 2 if age > 55 & age <= 60
replace age1 = 3 if age > 60
. replace age1 = 0 if age <=50
(12 real changes made)
. replace age1 = 1 if age > 50 & age <= 55
(11 real changes made)
. replace age1 = 2 if age > 55 & age <= 60
(14 real changes made)
. replace age1 = 3 if age > 60
(11 real changes made)
summarize. El presente comando es una opcin para obtener estadsticos
descriptivos para variables cuantitativas.
. summarize age
Variable | Obs
Mean Std. Dev.
Min
Max
-------------+----------------------------------------------------age | 48 55.875 5.659205
47
67
. summarize studytime age
Variable | Obs
Mean Std. Dev.
Min
Max
-------------+----------------------------------------------------studytime | 48
15.5 10.25629
1
39
age | 48
55.875 5.659205
47
67

. summarize age, detail


Patient's age at start of exp.
------------------------------------------------------------Percentiles
Smallest
1%
47
47
5%
48
48

Bioestadstica
10%
25%

49
50.5

50%

56

75%
90%
95%
99%

60
65
67
67

48
49
Largest
65
67
67
67

Obs
Sum of Wgt.

48
48

Mean
Std. Dev.

55.875
5.659205

Variance
Skewness
Kurtosis

32.0266
.3161066
2.125197

Para generar estadsticos para una determinada variable cuantitativa, necesitamos colocar los
estadisticos sobre un parentecis

merge. El comando nos ayuda a unir informacin entre bases de datos relacionadas.
Ejemplo: uno a uno merge
. use ds1
. merge using ds2
collapse. Reporta estadsticas sobre tendencia central.
El siguiente ejercicio muestra como se podra solicitar las estadsticas descriptivas.
collapse (mean) age (median) systolic, by (drug)
tabulate. Para trabajar variables cualitativas como factores, sexo, grupos de edad, etc
. tabulate

drug

Drug type |
(1=placebo) |
Freq.
Percent
Cum.
------------+----------------------------------1 |
20
41.67
41.67
2 |
14
29.17
70.83
3 |
14
29.17
100.00
------------+----------------------------------Total |
48
100.00

Freq, representa al numero pacientes por tipo de droga que se reseto, percent, el porcentaje de
pacientes que fue tratado por algun tipo de droga. Cum., el porcentaje acumulado.
tabulate

died, summarize( age)

1 if |
patient |

Summary of Patient's age at start


of exp.

Bioestadstica
died |
Mean
Std. Dev.
Freq.
------------+-----------------------------------0 |
54.176471
5.4340971
17
1 |
56.806452
5.6475325
31
------------+-----------------------------------Total |
55.875
5.6592045
48

Table. Este comando calcula frecuencias simple, adems puede calcular otros estadstico
sealados por el usuario, utilizando la opcin contents
. table

drug, contents (mean age)

---------------------Drug Used | mean(age)


----------+----------1 |
46.6
2 |
45.6667
3 |
46.6667
4 |
42.1875
----------------------

Para poder realizar grficos tenemos el comando graph, y sus diferentes variedades segn el tipo
de grfico que se quiere realizar.
Histograma
Ejemplo:
histogram age

Fraction

.3125

0
47

Patient's age at start of exp.

67

Automticamente el programa Stata8 divide el grafico en 5 barras, depende del usuario el numero
de intervalos que se desean obtener, esto utilizando la opcin bi {graph age, bi(7) }.
Grafico de dispersin
scatter studytime age

Bioestadstica

Months to death or end of exp.

39

1
47

67

Patient's age at start of exp.

Grafico de cajas
graph box age, over(drug)
Patient's age at start of exp.
67

47
1

Bioestadstica

Grafico de Linea
line birthrt year

live births per 1000 women

45.1002

6.60003
194019431946194919521955195819611964196719701973197619791982198519881991
year

do.
Archivo donde se archivan los programas ejecutados en sesin de Stata, para ello debemos hacer
clic en la parte superior derecha de la ventana de Review y hacer clic en la opcin Save Review
Contents.

También podría gustarte