Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
Las funcionalidades del programa permiten realizar todas las fases del procesamiento es-
tadístico de los datos:
• Elaboración de bases de datos, incluyendo la imputación de datos.
• El análisis exploratorio.
• La presentación tabular y gráfica de los datos y de los resultados.
• La aplicación de una completa gama de técnicas descriptivas y procedimientos de
inferencia estadística paramétrica y no paramétrica.
• El análisis de regresión lineal y no lineal, multivariada y con variables de respuesta
con distintas escalas de medición (binaria, ordinal, etc.).
• El análisis de datos provenientes de diseños longitudinales, como las series de tiempo,
el análisis de sobrevida, etc.
• Análisis de datos provenientes de muestras complejas.
• Cálculo del tamaño de muestras adecuadas a distintas técnicas estadísticas.
Nota:
2
1) Inicio de sesión en STATA 17
(En el Do-file: línea 3)
Nota importante: Cuando se inicia Stata para Windows, se puede establecer el directorio
de trabajo actual mediante el comando cd. Por ejemplo:
cd C:\Users\crist\OneDrive\Escritorio\clase_1\practica_2
Después del comando cd el directorio de trabajo actual será establecido según el usuario.
3
4
2) Elaboración de un archivo de datos en STATA
(En el Do-file: línea 6)
Para elaborar un archivo de datos en STATA se requiere: ingresar y almacenar los datos
en una función denominada Editor de datos; una tabla que contiene columnas y filas;
que permite guardar los datos en un archivo relacional.
• Comando: edit
Las columnas se denominan campos. En un campo se guardan los datos de una variable.
La fila que ya contienen los datos de un caso se denomina registro.
Los datos se pueden ingresar como número, como texto o como fecha; sin embargo, para
hacer más eficiente el ingreso de los datos de variables cualitativas se reemplaza cada
categoría por un código. Por ejemplo:
Centro de Salud (cs) 1=CS_A, 2=CS_B
Ocupación (ocup): 1=Ama de casa, 2=Independiente, 3=Dependiente
5
En el caso de variables cuantitativas, como número de hijos, colocaremos el valor de cada
registro (no emplearemos códigos).
Ingrese los siguientes datos (los nombres de las columnas aparecerán por defecto como
var#, posteriormente nombraremos cada variable)
cs ocup hijos
1 1 1
1 1 2
1 2 2
2 1 2
2 1 4
1 3 1
• Puede ingresar los datos por columna (por variable). Para ello posicione el cursor
en la celda que corresponde a la primera fila y la primera columna, digite el primer
dato y pulse la tecla Enter, luego continúe con el siguiente dato.
• También puede ingresar los datos por filas (por casos). Para ello posicione el cur-
sor en la celda que corresponde a la primera fila y primera columna, digite el
primer dato y seguidamente pulse la tecla Tab ( ); luego continúe con el primer
dato de la siguiente variable.
Una vez que se ha terminado de ingresar los datos, el programa asigna a cada columna
(que registra las variables) el nombre de var1var2 var3. Ahora corresponde designar a
cada campo con un nombre y una etiqueta:
• Nombre de variable: término con pocas letras que identifica a cada variable en el
archivo, como var1, var2, etc.).
Por ejemplo para la variable centro de salud (cs)
rename var1 cs
*Luego del comando rename se coloca el nombre actual de la variable y luego el
nuevo nombre
6
En el caso que la variable es cualitativa los códigos que representa una categoría deben
ser etiquetados
Por ejemplo para la variable centro de salud, debemos indicar que representa cada valor.
Para esto se establecerá una etiqueta de valores, luego se especificará que representa cada
valor
label define cs 1 "CS_A" 2 "CS_B"
*Luego del comando label define se coloca la etiqueta de valores (en este caso se ha
nombrado igual a la variable), posteriormente los valores y entre comillas el nombre de
la categoría que representa.
Si tiene una base de datos en Excel (u otros programas cuyos formatos son reconocidos
por el STATA), puede importar el archivo de EXCEL a STATA
Archivo: Encuesta_Practica.xlsx
7
Este archivo presenta el registro de niños menores de 5 años, atendidos en el servicio de
pediatría de dos centros de salud. La muestra es de 116 registros.
Variables:
8
4. Indique que la primera fila contiene el nombre de las variables.
5. Guarde el archivo en el formato de STATA. (Encuesta_Práctica.dta)
Un archivo Log es un tipo de archivo que registra todas las salidas de la ventana de resul-
tados.
9
Para el etiquetado de valores de variables cualitativas trabajar con comandos
label define
label values
a) Comandodescribea [varlist]
b) Comando codebook[varlist]
Actividad 1: Describir las variables edad_a, edad_m, peso, talla, hemoglobina y suple-
mento
(Revisar archivo do)
. describe edad_a edad_m peso talla hemog suplem
a
describe la forma abreviada es des, d
10
. codebook edad_a edad_m peso talla hemog suplem
edad_a Años
edad_m Meses
mean: 5.66379
std. dev: 3.48399
mean: 14.3177
std. dev: 4.68059
11
talla Talla (cm)
mean: 89.7687
std. dev: 15.5806
mean: 11.6664
std. dev: 1.59406
a) Comando generateb(newvarc)=var
b
gen es la forma abreviada del comando generate
c
var emplearemos esta denominación para variable
12
. codebook edad edad2
edad (unlabeled)
mean: 2.75647
std. dev: 1.3641
edad2 (unlabeled)
mean: 2.75681
std. dev: 1.36435
imc IMC
mean: 17.382
std. dev: 2.21717
13
. codebook imc
imc IMC
mean: 17.382
std. dev: 2.21717
gen
. ANEMIA=hemog
gen rsuplem=suplem
Actividad 3: Si se conoce que un niño menor de 6 años con una hemoglobina menor de
11.5 presenta anemia. Generar una nueva variable denominada ANEMIA que identifique
los niños con este cuadro.
Además, se desea presentar una variable que identifique si el niño recibió suplemento de
hierro.
14
. codebook anemia rsuplem
anemia Anemia
Comando summarized
d
summarize la forma abreviada es sum
15
Otra manera es siguiendo la siguiente ruta
16
Obtenemos la siguiente salida
Si deseo obtener el peso del niño según sexo. Agregamos la siguiente opción en la ventana
17
Observemos que para obtener las estadísticas descriptivas de la variable cuantitativa
(peso) según otra variable en el comando se agregó by (variable de agrupación)
Varón
Mujer
5 10 15 20 25 30
Peso actual kg
18
Varón Mujer
.15
.1
Density
.05
0
0 10 20 30 0 10 20 30
Peso actual kg
Density
normal peso
Graphs by lactancia materna
Actividad 4:
Describa las viariables peso y hemoglobina según sexo con las medidas de resumen que
considere más adecuada de acuerdo a la distribución de datos.
a) Tabla de frecuencia
Comando tabulatee
e
tabulate la forma abreviada es tab
19
Determinar la frecuencia de registros de niños menores de 5 años con anemia
. tab ANEMIA
no 70 60.34 60.34
si 46 39.66 100.00
b) Tabla de contingencia
Determinar el porcentaje de los niños con anemia en el grupo que recibió suplementos
alimenticios
Se puede solicitar porcentaje por columna (col), fila (row) y porcentaje general (cel)
20
. tab ANEMIA rsuplem, col
Key
frequency
column percentage
recibio suplementos
ANEMIA no si Total
no 35 35 70
66.04 55.56 60.34
si 18 28 46
33.96 44.44 39.66
Total 53 63 116
100.00 100.00 100.00
Actividad 5: En el grupo de los niños que recibió suplementos alimenticios que porcen-
taje presenta anemia
21
80
60 71
frequency
45
40
20
0
no si
37
34
30
26
frequency
20
19
10
0
no si no si
no si
22
graph pie, over(sexo) plabel(1 percent) plabel(2 percent)
46.55%
53.45%
Varón Mujer
Centro de
Salud Freq. Percent Cum.
gen edad3=edad2
recode edad3 min/1.99=0 2/max=1
label define edad 0 "menor 2 años" 1">=2 años"
label value edad3 edad
tab sexo edad3, cell
23
. tab sexo edad3, cell
Key
frequency
cell percentage
edad3
Sexo menor 2 a >=2 años Total
Varón 16 46 62
13.79 39.66 53.45
Mujer 20 34 54
17.24 29.31 46.55
Total 36 80 116
31.03 68.97 100.00
Actividad 8: De los niños menores de dos años ¿Qué porcentaje presentaron lactancia
materna?
(En el Do-file: línea 162)
Key
frequency
row percentage
column percentage
cell percentage
Lactancia materna
edad3 No Si Total
menor 2 años 1 35 36
2.78 97.22 100.00
16.67 31.82 31.03
0.86 30.17 31.03
>=2 años 5 75 80
6.25 93.75 100.00
83.33 68.18 68.97
4.31 64.66 68.97
24
. tab edad3 lm, row
Key
frequency
row percentage
Lactancia materna
edad3 No Si Total
menor 2 años 1 35 36
2.78 97.22 100.00
>=2 años 5 75 80
6.25 93.75 100.00
6
0
No Si
25