Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción a Stata
Alfonso Muriel
Alfonso Muriel
Unidad de Bioestadística Clínica. IRYCIS
4 de junio de 2012
STATA
• La versión básica es Stata/IC ( Intercooled Stata)
maneja hasta 2 047 variables
maneja hasta 2.047 variables
• La siguiente es Stata/SE (Special Edition ) maneja
hasta 32.766 variables (variables cadena y
matrices más grandes)
• La versión para Multicore/multiprocesadores es
Stata/MP, mucho más rápida en ordenadores con
Stata/MP, mucho más rápida en ordenadores con
dos o mas cores
• Las observaciones están limitadas por la memoria
no pudiendo exceder de 2 milllones
1
30/05/2012
Almacén de
Sintaxis
Almacén de Resultados
Almacén de Variables
Comandos
Única ventana en la que se puede escribir
Editar el
Guardar Traer al Ventana
Abrir Log fichero
Fichero frente un de Parar
activo
gráfico Variables
Abrir
Abrir Nuevo
Nuevo Sigue el
Sigue el
Abrir Ayuda fichero Ver el proceso
Imprimir
fichero ( View) do fichero
2
30/05/2012
Extensiones comunes de los ficheros
• dta: ficheros de datos en formato Stata.
• raw: ficheros de datos ASCII/Text.
• log: output de STATA.
• do: fichero de comandos.
• gph: Stata Graphic File.
• ado: Stata “Macro” files.
3
30/05/2012
Directorio de
Trabajo
Utilidades de fichero
• dir
St t t l fi h ti
– Stata muestra los ficheros que contiene ese
directorio.
• pwd
– Nos muestra la ruta donde está ubicado los
ficheros.
ficheros
– G:\CursoStata
4
30/05/2012
Ayuda
• help + ‘nombre de comando’
• help summ
Abrir base datos
• Extension.dat
• Sintaxis
. use "G:\CursoStata\VAS.dta", clear
. use VAS.dta ( igual si antes hemos cd)
. sysuse cancer.dat (ejemplos de Stata)
5
30/05/2012
Abrir base datos
• use sexo edad VAS // solamente selecciona
las variables sexo y edad
l i bl d d
• use VAS in 1/5 // selecciona sólo las cinco
primeras observaciones, todas las variables
• use sexo edad using VAS in 1/5 //
selecciona dos variables y cinco primeras
selecciona dos variables y cinco primeras
observaciones
6
30/05/2012
Ventana do
Similar a la ventana de sintaxis de SPSS
Si se pone un asterisco no ejecuta la orden
Si se pone un asterisco no ejecuta la orden
Por tanto, es útil para colocar notas aclaratorias y
comentarios.
Por ejemplo:
• *Este es el archivo do para la práctica 1
• También se pueden adjuntar comentarios al
comando poniendo /* Comentario */
• sum var1 /* Calcula un resumen de var1*/
Memoria versión 11
Stata necesita hacer una copia de la base
necesita hacer una copia de la base
de datos que vamos a analizar en la
memoria RAM de nuestro ordenador
Para ampliar la capacidad de la memoria
RAM para Stata:
set mem 512m
set mem
set memory 512m
clear, borra los datos en memoria
7
30/05/2012
Variables
• Los nombres de las variables puede tener
entre 1 y 32 caracteres
entre 1 y 32 caracteres
• No pueden empezar por un número
• No puede haber espacios
• No utilizar signos(& % $ ∙ ” !)
• Cuidado con los acentos
• Muy sensible
Sexo SEXO sexo son variables diferentes
Tipos de variables
Format
%8.0g
%8.0g
%12.0g
%9.0g
%10.0g
Format
%#s
Strings (Cadena) son guardadas como str# (,str1, str2, str3, ..., str244).
El número después de str indica la maxima extensión. Un str5 podría
valer para “varón", pero no para “masculino”.
8
30/05/2012
Variables Fecha
Crear una nueva base en STATA
9
30/05/2012
Crear etiquetas
• Archivo de datos
• Variable
• Valores
Etiqueta archivo datos
save "G:\CursoStata\VAS.dta", replace
file G:\CursoStata\VAS.dta saved
use "G:\CursoStata\VAS.dta", clear
(ESTE ES EL EJEMPLO DEL VAS)
10
30/05/2012
Variables Manager
Etiquetar valores de variables
11
30/05/2012
Crear una nueva base de datos
• Variables:
– Nº historia clínica
Nº historia clínica
– Sexo
– Fecha de nacimiento
– Fecha de visita
– Fumador(No, Si, EX fumador)
– AP Diabetes
AP Diabetes
– AP HTA
– AP IAM
– Motivo consulta(texto libre)
Utilidades
Calculadora
display 140+1.96*sqrt(15)
* ( )
147.59105
Describir la base
describe
(resumen de base datos activa)
describe using "G:\CursoStata\vas12pre.dta“
(otra base no activa)
codebook (descripción mas detallada de base datos activa)
12
30/05/2012
Sintaxis
• Signos útiles
+ suma ‐ resta *
t * producto /
d t / división
di i ió ^ potencia
^ t i
> mayor < menor >= <=
~ not ! not | or & and ~= distinto == igual
• Dos signos de igual == se usan para
comparaciones lógicas y un solo para asignar
un valor
• help operators
Sintaxis
• [quietly] [by group:] command [varlist] [weight] [if exp] [in range] [using
filename] [, options]
• Entre corchetes son opcionales
Entre corchetes son opcionales
• quietly: Evita que se imprima salidas durante la ejecución.
• by group: Ejecuta el comando para grupos ordenados.
• varlist: Lista de variables sobre las que aplica el comando.
• weight: Pesos sobre los que se pondera el estadístico
• if exp: Sólo hace el comando si cumple la condición
• in range: Sólo utiliza las observaciones que estan en ese rango
i Sól tili l b i t
• using filename: Fichero sobre el que se aplica el comando.
• , options: Opciones
13
30/05/2012
Sintaxis
.INSTRUCCCIÓN VARIABLE(S), OPCIONES
summarize edad
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
edad | 107 49.61157 15.10253 4.775542 88.4566
.
SELECCIONAR
if sexo==”hombre”
Un aspecto importante a tener en cuenta es que Stata
considera a los valores missing (“.”) como valores máximos
Ejercicio
• Realizar un listado de la base con los varones
con fiebre menores de 50 años o mujeres > 60
con fiebre menores de 50 años o mujeres > 60
con tos.(base datos tos.dta).
• Realizar un listado de los pacientes con valores
de plaquetas menores que 100 o missing.
R li
Realizar otro listado con los pacientes con
t li t d l i t
valores de colesterol por encima de 300 o
missing(base datos Cirrosis Biliar Primaria).
14
30/05/2012
Importar base datos a Stata(1)
Importar base datos a Stata(2)
15
30/05/2012
Importar base datos a Stata(3)
• Desde Spss
• cd "G:\CursoStata“(cambia directorio trabajo)
• clear(borra la base de datos)
• usespss hipertensos120.sav(no poner
nombres con espacios)
Añadir Casos
use "G:\CursoStata\vas5.dta", clear
append using "G:\CursoStata\vas7.dta"
16
30/05/2012
Añadir Variables
• Merge
• permite combinar bases de datos que tiene
una variable en común.
• Requiere que las dos bases de datos estén
ordenadas de manera ascendente por la
variable.
variable
17
30/05/2012
Añadir variables
merge 1:1 nhc using G:\CursoStata\vas12post.dta"
Transformar base datos
reshape wide, long Este comando transforma la base de datos de una
formato ancho (wide) a uno largo (long) y viceversa
Data > Create or change data > Other variable
variable- reshape long inc i(id) j(year)
reshape long inc, i(id) j(year)
transformation commands > Convert data
between wide and long reshape wide inc, i(id) j(year)
Wide
id sex inc80 inc81 inc82
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
1 0 5000 5500 6000
2 1 2000 2200 3300
Long
Long
i j x_ij
id year sex inc
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
1 80 0 5000
1 81 0 5500
1 82 0 6000
2 80 1 2000
2 81 1 2200
2 82 1 3300
18