Está en la página 1de 25

Universidad Peruana Cayetano Heredia Facultad de Ciencia y Filosofía

2022 – 2 Curso de Bioestadística Aplicada a la Investigación


Guía de práctica dirigida con STATA

Guía de uso del STATA 17

Introducción

Con el advenimiento de la tecnología informática, en la segunda mitad del siglo pasado,


se desarrollaron diversos programas orientados a asistir al usuario en el procesamiento de
datos estadísticos. Uno de ellos fue el STATA, que surgió el año 1985, con algunas ca-
racterísticas distintivas que le han permitido mantenerse vigente en un medio donde el
cambio es la norma, tales como:
• El ingreso de las instrucciones en un modo interactivo, complementario al uso de un
sistema de menú.
• La integración de las distintas utilidades en un solo paquete, destacando los procedi-
mientos para el ajuste de modelos de regresión y tratamiento de muestras complejas;
lo cual la convierte en un programa completo a relativamente bajo costo.
• Permite la incorporación de algoritmos elaborados por el propio usuario con propósi-
tos específicos.

Las funcionalidades del programa permiten realizar todas las fases del procesamiento es-
tadístico de los datos:
• Elaboración de bases de datos, incluyendo la imputación de datos.
• El análisis exploratorio.
• La presentación tabular y gráfica de los datos y de los resultados.
• La aplicación de una completa gama de técnicas descriptivas y procedimientos de
inferencia estadística paramétrica y no paramétrica.
• El análisis de regresión lineal y no lineal, multivariada y con variables de respuesta
con distintas escalas de medición (binaria, ordinal, etc.).
• El análisis de datos provenientes de diseños longitudinales, como las series de tiempo,
el análisis de sobrevida, etc.
• Análisis de datos provenientes de muestras complejas.
• Cálculo del tamaño de muestras adecuadas a distintas técnicas estadísticas.

Descargar la versión STATA 17 del Intranet

• Descargar los archivos del intranet


• Emplear el archivo de Manual de Instalación Stata, para la instalación del programa.
• En este manual en el punto 15 (pagina 9), la información de serial number, code, autho-
rization está indicada en el archivo PO 35478 STATA. Copiar y pegar cuidadosa-
mente.

Nota:

Este tutorial se acompaña con el archivo BAI facien 22 2_S01 (martes)_Tutorial de


Stata.do, el cual es un archivo de comandos (archivo con extensión do, o “archivo do”
que se comentará más abajo) que contiene las instrucciones para que Stata ejecute las
operaciones. Está escrito en un editor de texto con numeración de líneas. Para poder se-
guir los comandos que esta guía presenta se ha indicado debajo de algunos títulos y en
cursiva (y en color verde) el lugar donde se encuentran dichos comandos. Se pueden eje-
cutar los comandos desde el archivo do.
Para abrir el archivo do:
a) Clic en archivo do, en el Explorador de archivos.
b) Abrir el archivo do con la barra de comandos del Stata:
Archivo/ Abrir/ (buscar el archivo do en el Explorador de archivos)

Para ejecutar uno o más comandos del archivo do:


a) Seleccionar la línea o líneas de comandos que se desea ejecutar.
b) Clic en el comando Herramientas de la barra de comandos del archivo do.
c) Clic en la opción Ejecutar selección (run) para ejecutar

2
1) Inicio de sesión en STATA 17
(En el Do-file: línea 3)

a) Clic en el icono de Stata en el escritorio o donde esté instalado:


b) Clic en botón Inicio de la barra de tareas y clic en Stata 17.

Seguidamente a ello aparece la siguiente pantalla:

La ventana principal del STATA comprende

La barra del menú principal. Contiene los siguientes comandos:


• Archivo.
• Edición.
• Datos.
• Gráficos.
• Estadísticas.
• Usuario.
• Ventana.
• Ayuda.
Las ventanas de trabajo:
• Ventana de Resultados.
• Ventana de Variables.
• Ventana de Propiedades.
• Ventana de Revisión.
• Línea de Comando.

Nota importante: Cuando se inicia Stata para Windows, se puede establecer el directorio
de trabajo actual mediante el comando cd. Por ejemplo:

cd C:\Users\crist\OneDrive\Escritorio\clase_1\practica_2

Después del comando cd el directorio de trabajo actual será establecido según el usuario.

3
4
2) Elaboración de un archivo de datos en STATA
(En el Do-file: línea 6)

Para elaborar un archivo de datos en STATA se requiere: ingresar y almacenar los datos
en una función denominada Editor de datos; una tabla que contiene columnas y filas;
que permite guardar los datos en un archivo relacional.

a) Ingresar los datos

Abrir el editor de datos:


• Menú:
✓ Clic en Datos/ Editor de Datos.
✓ Clic en Ventana/ Editor de datos.
• Barra de íconos del menú:

• Comando: edit

Se abre el Editor de datos:

Las columnas se denominan campos. En un campo se guardan los datos de una variable.
La fila que ya contienen los datos de un caso se denomina registro.

El ingreso de datos puede hacerse directamente en el Editor de Datos, o se puede impor-


tar desde archivos externos, tal como Excel.

Los datos se pueden ingresar como número, como texto o como fecha; sin embargo, para
hacer más eficiente el ingreso de los datos de variables cualitativas se reemplaza cada
categoría por un código. Por ejemplo:
Centro de Salud (cs) 1=CS_A, 2=CS_B
Ocupación (ocup): 1=Ama de casa, 2=Independiente, 3=Dependiente

5
En el caso de variables cuantitativas, como número de hijos, colocaremos el valor de cada
registro (no emplearemos códigos).

Ingrese los siguientes datos (los nombres de las columnas aparecerán por defecto como
var#, posteriormente nombraremos cada variable)

cs ocup hijos
1 1 1
1 1 2
1 2 2
2 1 2
2 1 4
1 3 1

• Puede ingresar los datos por columna (por variable). Para ello posicione el cursor
en la celda que corresponde a la primera fila y la primera columna, digite el primer
dato y pulse la tecla Enter, luego continúe con el siguiente dato.

• También puede ingresar los datos por filas (por casos). Para ello posicione el cur-
sor en la celda que corresponde a la primera fila y primera columna, digite el
primer dato y seguidamente pulse la tecla Tab ( ); luego continúe con el primer
dato de la siguiente variable.

b) Definir los campos y códigos

Una vez que se ha terminado de ingresar los datos, el programa asigna a cada columna
(que registra las variables) el nombre de var1var2 var3. Ahora corresponde designar a
cada campo con un nombre y una etiqueta:

Nombrado y etiquetado de variables


(En el Do-file: línea 11)

• Nombre de variable: término con pocas letras que identifica a cada variable en el
archivo, como var1, var2, etc.).
Por ejemplo para la variable centro de salud (cs)
rename var1 cs
*Luego del comando rename se coloca el nombre actual de la variable y luego el
nuevo nombre

• Etiqueta de variable: término largo y descriptivo del campo.


Por ejemplo para la variable centro de salud (cs) para establecer la etiqueta de la va-
riable
label variable cs "Centro de Salud"
*Luego del comando label variable se coloca el nombre de la variable y entre comillas
la etiqueta de la misma

• Etiquetado de valores (variables cualitativas)


(En el Do-file: línea 19)

6
En el caso que la variable es cualitativa los códigos que representa una categoría deben
ser etiquetados
Por ejemplo para la variable centro de salud, debemos indicar que representa cada valor.
Para esto se establecerá una etiqueta de valores, luego se especificará que representa cada
valor
label define cs 1 "CS_A" 2 "CS_B"
*Luego del comando label define se coloca la etiqueta de valores (en este caso se ha
nombrado igual a la variable), posteriormente los valores y entre comillas el nombre de
la categoría que representa.

Para aplicar la etiqueta de valores a la variable correspondiente, se realiza mediante el


siguiente comando:
label values cs cs
*Luego del comando label values se coloca el nombre de la variable, seguido de la eti-
queta de valores

c) Guardar el archivo de datos

El STATA maneja diferentes tipos de archivos:


• Archivos con extensión *.dta: archivo de datos con formato STATA
• Archivos con extensión *. log.: archivos con reporte de los resultados
• Archivos con extensión *. do: archivos de programación de comandos
• Archivos con extensión *. gph: archivos de gráficos

Para guardar el archivo de datos:


1. Haga clic en el comando Archivo del menú principal.
2. Haga clic en la opción Guardar como del menú desplegable.
3. En la ventana emergente elija la carpeta donde desea guardar el archivo.
4. En el recuadro Nombre escriba el nombre del archivo (ejemplo1.dta)
5. Clic en el botón Guardar.

Para cerrar un archivo de datos:


(En el Do-file: línea 29)
• En la ventana de comandos escriba el comando clear

3) Importar un archivo de Excel

Si tiene una base de datos en Excel (u otros programas cuyos formatos son reconocidos
por el STATA), puede importar el archivo de EXCEL a STATA

Para generar y guardar un archivo en Excel:


1. En la primera fila escriba el nombre de las variables (campos) sin espacios.
2. Ingrese los datos a partir de la segunda fila. Cada columna representa una variable y
cada fila un registro
3. Los datos deben numéricos o tipo texto; se representan con un número o un código
(si desea lo mantiene como texto).
4. Guarde el archivo Excel.
5. Cierre el archivo de Excel. Si queda abierto no podrá ser importado.

Archivo: Encuesta_Practica.xlsx

7
Este archivo presenta el registro de niños menores de 5 años, atendidos en el servicio de
pediatría de dos centros de salud. La muestra es de 116 registros.

Variables:

Variable Etiqueta Valor Etiqueta


ID Código de identificación
Cs Centro de Salud 1 CS_A
2 CS_B
ocup Ocupación de la madre 1 Ama de casa
2 Independiente
3 Dependiente
hijos Número de hijos
peso_n Peso al nacer en kg
edad_a Años
edad_m Meses
sexo Sexo 1 Varón
2 Mujer
LM Lactancia Materna 0 No
1 Si
suplem Recibió suplemento 0 No
1 Fe jarabe
2 Fe gotas
3 Fe polvo
4 Otro
peso Peso en kg.
Talla Talla en cm.
hemog Nivel de hemoglobina

Para importar el archivo con STATA con el comando.


1. En STATA haga clic en el comando File del menú principal.
2. Clic en la opción Importar del menú desplegable.
3. Clic en la opción Archivo de Excel y siga las instrucciones.

8
4. Indique que la primera fila contiene el nombre de las variables.
5. Guarde el archivo en el formato de STATA. (Encuesta_Práctica.dta)

4) Generar un archivo Log

Un archivo Log es un tipo de archivo que registra todas las salidas de la ventana de resul-
tados.

Para generar un archivo Log:


1. Antes de empezar el análisis de los datos (para que todo quede registrado), clic en el
comando Archivo del menú principal.
2. Clic en la opción Archivo Log para guardar la salida
3. Clic en la opción Comenzar
4. Seleccione la carpeta donde guardará el archivo log, escriba el nombre del archivo y,
finalmente, haga clic en el botón Guardar.

5) Etiquetado de variables y valores


(En el Do-file: línea 39)

Para el nombrado y etiquetado de variables trabajar con los comandos:


rename
label variable

9
Para el etiquetado de valores de variables cualitativas trabajar con comandos
label define
label values

Actividad: prácticar el nombrado de variables y etiquetado de valores.


(Revisar archivo do)

6) Describir un archivo de datos


(En el Do-file: línea 89)

a) Comandodescribea [varlist]
b) Comando codebook[varlist]

Actividad 1: Describir las variables edad_a, edad_m, peso, talla, hemoglobina y suple-
mento
(Revisar archivo do)
. describe edad_a edad_m peso talla hemog suplem

storage display value


variable name type format label variable label

edad_a byte %8.0g Años


edad_m byte %8.0g Meses
peso float %8.0g Peso actual kg
talla float %8.0g Talla (cm)
hemog float %8.0g Nivel de hemoglobina.
suplem byte %8.0g Recibió suplemento

a
describe la forma abreviada es des, d

10
. codebook edad_a edad_m peso talla hemog suplem

edad_a Años

type: numeric (byte)

range: [0,4] units: 1


unique values: 5 missing .: 0/116

tabulation: Freq. Value


15 0
21 1
24 2
28 3
28 4

edad_m Meses

type: numeric (byte)

range: [0,11] units: 1


unique values: 12 missing .: 0/116

mean: 5.66379
std. dev: 3.48399

percentiles: 10% 25% 50% 75% 90%


1 2 5 9 11

peso Peso actual kg

type: numeric (float)

range: [5.3,28.3] units: .1


unique values: 57 missing .: 37/116

mean: 14.3177
std. dev: 4.68059

percentiles: 10% 25% 50% 75% 90%


8.8 11.2 14.1 17.1 20.4

11
talla Talla (cm)

type: numeric (float)

range: [16.8,120.3] units: .1


unique values: 100 missing .: 1/116

mean: 89.7687
std. dev: 15.5806

percentiles: 10% 25% 50% 75% 90%


70 79.4 92.2 101.5 107.4

hemog Nivel de hemoglobina.

type: numeric (float)

range: [1.9,14.6] units: .1


unique values: 48 missing .: 0/116

mean: 11.6664
std. dev: 1.59406

percentiles: 10% 25% 50% 75% 90%


9.9 10.7 11.8 12.75 13.3

suplem Recibió suplemento

type: numeric (byte)

range: [0,3] units: 1


unique values: 3 missing .: 0/116

tabulation: Freq. Value


53 0
61 1
2 3

7) Crear y recodificar una variable


(En el Do-file: línea 93)

a) Comando generateb(newvarc)=var

gen edad=((edad_a*12)+ edad_m)/12


gen edad2=round(((edad_a*12)+ edad_m)/12.01)

b
gen es la forma abreviada del comando generate
c
var emplearemos esta denominación para variable

12
. codebook edad edad2

edad (unlabeled)

type: numeric (float)

range: [.08333334,4.9166665] units: 1.000e-09


unique values: 51 missing .: 0/116

mean: 2.75647
std. dev: 1.3641

percentiles: 10% 25% 50% 75% 90%


.833333 1.66667 2.83333 3.91667 4.5

edad2 (unlabeled)

type: numeric (float)

range: [.08,4.92] units: .01


unique values: 51 missing .: 0/116

mean: 2.75681
std. dev: 1.36435

percentiles: 10% 25% 50% 75% 90%


.83 1.67 2.83 3.92 4.5

gen imc= peso/(( talla/100)^2)


. codebook imc

imc IMC

type: numeric (float)

range: [12.023142,25.378071] units: 1.000e-07


unique values: 78 missing .: 38/116

mean: 17.382
std. dev: 2.21717

percentiles: 10% 25% 50% 75% 90%


15.0764 15.9949 17.01 18.4199 19.983

Actividad 2: Explicar porque al generar la variable IMC se presentan valores perdidos.


Además, indicar que comando aplicaría para que el IMC presente sólo un decimal

13
. codebook imc

imc IMC

type: numeric (float)

range: [12.023142,25.378071] units: 1.000e-07


unique values: 78 missing .: 38/116

mean: 17.382
std. dev: 2.21717

percentiles: 10% 25% 50% 75% 90%


15.0764 15.9949 17.01 18.4199 19.983

gen
. ANEMIA=hemog

gen rsuplem=suplem

Actividad 3: Si se conoce que un niño menor de 6 años con una hemoglobina menor de
11.5 presenta anemia. Generar una nueva variable denominada ANEMIA que identifique
los niños con este cuadro.

Además, se desea presentar una variable que identifique si el niño recibió suplemento de
hierro.

b) Comando recode varlist rule

recode anemia min/11.4=1 11.5/max=0

recode rsuplem 0=0 1/max=1

14
. codebook anemia rsuplem

anemia Anemia

type: numeric (float)

range: [1,2] units: 1


unique values: 2 missing .: 0/116

tabulation: Freq. Value


45 1
71 2

rsuplem Recibió suplemento

type: numeric (float)

range: [0,1] units: 1


unique values: 2 missing .: 0/116

tabulation: Freq. Value


53 0
63 1

8) ESTADÍSTICAS DESCRIPTIVAS PARA VARIABLES CUANTITATIVAS


(En el Do-file: línea 121)

Para examinar el peso actual del niño:

Comando summarized

Si deseamos información de las estadísticas descriptivas de forma más detallada, agre-


gamos la opción detail

d
summarize la forma abreviada es sum

15
Otra manera es siguiendo la siguiente ruta

También puede utilizarse la siguiente ruta:

Obtendremos la siguiente ventana, donde colocamos la variable cuantitativa. Además


podemos indicar los estadisticos. Antes de terminar el proceso nos vamos a Options

Obtendremos la siguiente ventana, indicaremos que use como columnas estadísticas.


Finalmente presionamos OK

16
Obtenemos la siguiente salida

Si deseo obtener el peso del niño según sexo. Agregamos la siguiente opción en la ventana

Luego obtenemos la siguiente salida

17
Observemos que para obtener las estadísticas descriptivas de la variable cuantitativa
(peso) según otra variable en el comando se agregó by (variable de agrupación)

graph hbox peso, over(sexo)

Varón

Mujer

5 10 15 20 25 30
Peso actual kg

histogram peso, normal by(sexo)

18
Varón Mujer

.15
.1
Density
.05
0

0 10 20 30 0 10 20 30
Peso actual kg
Density
normal peso
Graphs by lactancia materna

Actividad 4:
Describa las viariables peso y hemoglobina según sexo con las medidas de resumen que
considere más adecuada de acuerdo a la distribución de datos.

9) ESTADÍSTICAS DESCRIPTIVAS PARA VARIABLE CUALITATIVA


(En el Do-file: línea 134)

a) Tabla de frecuencia
Comando tabulatee

Otra manera es haciendo el siguiente recorrido:


Estadísticas/ Sumarios, tablas y test estadísticos/ Tablas de frecuencia/ Tabla de frecuen-
cias

e
tabulate la forma abreviada es tab

19
Determinar la frecuencia de registros de niños menores de 5 años con anemia

. tab ANEMIA

ANEMIA Freq. Percent Cum.

no 70 60.34 60.34
si 46 39.66 100.00

Total 116 100.00

b) Tabla de contingencia
Determinar el porcentaje de los niños con anemia en el grupo que recibió suplementos
alimenticios

Se puede solicitar porcentaje por columna (col), fila (row) y porcentaje general (cel)

20
. tab ANEMIA rsuplem, col

Key

frequency
column percentage

recibio suplementos
ANEMIA no si Total

no 35 35 70
66.04 55.56 60.34

si 18 28 46
33.96 44.44 39.66

Total 53 63 116
100.00 100.00 100.00

Actividad 5: En el grupo de los niños que recibió suplementos alimenticios que porcen-
taje presenta anemia

c) Realizar gráficos para variables cualitativas

graph bar (count), over(anemia) blabel(bar)

21
80
60 71
frequency

45
40
20
0

no si

graph bar (count), over(anemia) over(rsuplem) blabel(bar)


40

37

34
30

26
frequency
20

19
10
0

no si no si
no si

22
graph pie, over(sexo) plabel(1 percent) plabel(2 percent)

46.55%

53.45%

Varón Mujer

Actividad 6: Determinar el porcentaje de niños registrados según el centro de salud


. tab cs, m

Centro de
Salud Freq. Percent Cum.

CS_A 74 63.79 63.79


CS_B 42 36.21 100.00

Total 116 100.00

Actividad 7: Determinar el porcentaje de varones menores de dos años del total de la


muestra
(En el Do-file: línea 155)

gen edad3=edad2
recode edad3 min/1.99=0 2/max=1
label define edad 0 "menor 2 años" 1">=2 años"
label value edad3 edad
tab sexo edad3, cell

23
. tab sexo edad3, cell

Key

frequency
cell percentage

edad3
Sexo menor 2 a >=2 años Total

Varón 16 46 62
13.79 39.66 53.45

Mujer 20 34 54
17.24 29.31 46.55

Total 36 80 116
31.03 68.97 100.00

Actividad 8: De los niños menores de dos años ¿Qué porcentaje presentaron lactancia
materna?
(En el Do-file: línea 162)

. tab edad3 lm, row col cell

Key

frequency
row percentage
column percentage
cell percentage

Lactancia materna
edad3 No Si Total

menor 2 años 1 35 36
2.78 97.22 100.00
16.67 31.82 31.03
0.86 30.17 31.03

>=2 años 5 75 80
6.25 93.75 100.00
83.33 68.18 68.97
4.31 64.66 68.97

Total 6 110 116


5.17 94.83 100.00
100.00 100.00 100.00
5.17 94.83 100.00

24
. tab edad3 lm, row

Key

frequency
row percentage

Lactancia materna
edad3 No Si Total

menor 2 años 1 35 36
2.78 97.22 100.00

>=2 años 5 75 80
6.25 93.75 100.00

Total 6 110 116


5.17 94.83 100.00

Actividad 9: Graficar la variable lactancia materna


(En el Do-file: línea 166)

graph bar (count), over(lm) blabel(bar)


110
100
frequency
50

6
0

No Si

25

También podría gustarte