Está en la página 1de 56

Programa de Entrenamiento en Epidemiología de campo y Acciones de Salud

Pública (Epi-AR). Nivel inicial

Taller 1
Clase 8:
Visualización de datos
Objetivos de aprendizaje
1- Describir los datos usando tablas, gráficos, mapas
• Seleccionar una tabla, un gráfico o un mapa adecuados para los datos y para el objetivo de comunicación
• Dibujar una tabla o un gráfico a mano
Ciclo de vigilancia de la salud pública
¿Puede resumirse la edad y el sexo de los casos a simple vista?

Fecha de
Caso Número apertura Edad Sexo
1 21 Nov 9 M
2 21 Nov 39 M
3 22 Nov 29 F
¿Puede resumirse la edad y el sexo de los casos a simple vista?

Fecha de
Caso Número apertura Edad Sexo
1 21 Nov 9 M
2 21 Nov 39 M
3 22 Nov 29 F
4 21 Nov 10 M
5 22 Nov 55 F
6 22 Nov 11 M
¿Puede resumirse la edad y el sexo de los casos a simple vista?

ID Caso Edad Sexo ID Caso Edad Sexo ID Caso Edad Sexo ID Caso Edad Sexo

1 9 M 11 10 M 21 38 F 31 10 M
2 39 M 12 6 M 22 34 F 32 31 F
3 29 F 13 9 M 23 9 M 33 8 F
4 10 M 14 40 M 24 10 M 34 9 M
5 55 F 15 40 F 25 6 F 35 10 F
6 11 M 16 10 M 26 11 M 36 11 M
7 9 M 17 11 M 27 9 M 37 38 M
8 7 F 18 43 F 28 41 M 38 11 M
9 17 M 19 71 F 29 6 M 39 7 M
10 10 M 20 9 F 30 11 M 40 16 F
¿Por qué organizar/agrupar los datos?
• Sirve para obtener un resumen cuando el conjunto de datos
tiene demasiados registros para revisar individualmente
• Sirve para familiarizarse con los datos antes del análisis
• Sirve para Identificar errores
• Sirve para identificar patrones, tendencias, relaciones,
excepciones y valores atípicos
• Sirve para comunicar la información a otros
Métodos para organizar/resumir datos

Los datos se pueden organizar y mostrar usando (principalmente):

▪ Tablas

▪ Gráficos

▪ Mapas
Tablas
Matriz de datos - datos nominalizados
Casos fallecidos de neumonía, Argentina, período 2009 - 2016.

Fecha de Año de Provincia de La matriz de datos dispone los datos


N° Caso
fallecimiento fallecimiento residencia en un esquema de filas y columnas
1 5/1/2010 2010 A

2 15/9/2011 2011 A

3 21/4/2011 2011 B
Estructura tripartita del dato:
4 6/7/2013 2013 C
● Unidades de análisis
5 3/12/2015 2015 E
● Variables
● Categorías o valores
Título descriptivo (qué, dónde, cuándo)
Componentes de las tablas
Casos fallecidos de neumonía, por provincia, Argentina, periodo 2009 - 2016.
Etiquetas de las
filas

Provincia 2009 2010 2011 2012 2013 2014 2015 2016 Total
A 17 7 9 2 7 Etiquetas
4 de las
2 columnas
0 49
B 12 27 33 4 10 30 12 4 132
C 29 24 23 27 11 68 17 7 206
D 20 74 59 Celda
20 65 179 16 0 433
Filas
E 11 12 73 4 0 25 7 1 133
F 0 0 1 1 0 0 0 0 2
G 0 0 0 0 totales
0 de las
0 columnas
0 0 0
Total 89 144 198 58 93 306 54 12 955

Columnas
Fuente Totales de filas
Elaborado con base en datos de la Dirección de Estadísticas e Información de Salud (DEIS). Ministerio de Salud de la Nación. Argentina, 2022
11
Tipos de Tablas
▪ Tabla de 1 variable (distribución de frecuencias)
– Rango de valores de una sola variable
– Número de observaciones para cada valor
Tabla bivariada/bidimensional
– Recuentos mostrados para dos variables (por ejemplo, sexo y grupos de
edad).
▪ Tablas compuestas
– Se muestran múltiples valores a la vez
Distribución de frecuencias. Variables cualitativas

▪ Columna 1: todos los valores de la variable, más el total,


opcionalmente: otros, desconocidos
▪ Columna 2: Número de registros (frecuencias) para cada valor
▪ Columna 3: frecuencia relativa / porcentaje (opcional)

Número de casos de tuberculosis reportados tuberculosis por sexo, País x, 2015

Sexo No. Casos Porcentaje

Hombres 83 66,4%
Mujeres 42 33,6%
Total 125 100,0%
Distribución de frecuencias. Variables cuantitativas
▪ Columna 1: todos los valores posibles (más el total), o rango de valores (“intervalos”)
(opcional: desconocidos)
▪ Columna 2: Número de registros con cada valor o que caen en cada intervalo
▪ Columna 3: Porcentaje (opcional)

Número de casos de tuberculosis reportados, por grupo de edad (en años). País X, 2015
Grupo de edad
(años) No. Casos Porcentaje
<5 1 0.8%
5–14 5 4.0%
15–24 23 18.4%
25–44 42 33.6%
45–64 29 23.2%
≥65 10 8.0%
desconocido 15 12.0%
Total 125 100.0%
Tablas bivariadas/bidimensionales
▪ Muestra los datos de acuerdo a dos variables en forma simultánea:
– una variable con sus categorías distribuidas a lo largo de las filas
– otra variable con sus categorías distribuidas a lo largo de las columnas

▪ También llamada "tabulación cruzada"o tabla de contingencia


▪ Tabla de dos x dos = tabla de 2 variables con ambas variables que tienen solo dos categorías cada una
(variables dicotómicas)

Tabla 1. Numero de casos de tuberculosis por grupo de edad (en años) y sexo, País x, 20xx
Grupo de edad (años) Mujeres Hombres Total
<5 0 1 1
5–14 3 2 5
15–24 9 14 23
25–44 11 31 42
45–64 8 21 29
≥65 3 7 10
Sin dato 8 7 15
Total 42 83 125
Tabla de 2 x 2 : Ejemplo

Condicionales
Marginales Tasa de
Enfermos Sanos Total ataque(%)

¿Ingirió Si 61 30 91 67.0
ensalada en el
hotel? No 7 43 50 14.0

Total 68 73 141 48.2


Marginales Total
Tablas: Ejemplos
Características de personas con Covid-19, provincia x. SE 1 a 23 año 2022

Síntomas
Edad característicos n (%)
(años) n (%) Sexo n (%)
Mujer 237 (47) Fiebre 313 (63)
<1 150 (30)
Varón 270 (53) Tos 56 (11)
1–2 228 (45)
Total 507 (100) Odinofagia 47 (9)
3–4 75 (15)
Diarrea 33 (7)
5–7 36 (7)
Cefalea 15 (3)
8–10 18 (4)
Otros 33 (7)
Total 507 (100)
Total* 497 (100)

* Datos perdidos para 10


Tablas compuestas: Ejemplo
Características de personas con Covid-19, provincia x. SE 1 a 23 año 2022
Caracteristicas No. (%)
▪ Combinan datos de Sexo, mujeres 237 / 507 (47)
varias tablas edad (años) (n=507)
diferentes en una sola < 10 150 (30)
tabla. 10–19 228 (45)
▪ Muestran datos en un 20–39 75 (15)
formato eficiente. 40–59 36 (7)
60 y más 18 (4)
▪ Son un formato útil
para informes Síntomas (n=498)
fiebre 313 (63)
escritos, manuscritos
tos 56 (11)
y presentaciones odinofagia 47 (9)
orales. diarrea 33 (7)
cefalea 15 (3)
otros 33 (7)
Ejercicio 1.08-1:
Resumir y mostrar datos en una tabla - 20 min

A partir de los casos de resistencia bacteriana de la shigella en diarreas agudas


generar 4 tablas:
▪ Tabla 1: casos por edad. Usar grupos de edad de 10 años.
▪ Tabla 2 : evolución según sexo. Además: Calcular tasa de letalidad por sexo
▪ Tabla 3: especie y el serotipo de los aislamientos
▪ Tabla 4: (tabla compuesta) datos sobre edad, sexo y evolución
Gráficos
Tipos comunes de gráficos
Gráfico de línea Histograma

Gráfico de
barras
Tipo de variables
Cuantitativas (Numéricas) Datos numéricos continuos: utilizar un
▪ Medidas numéricas (discretas o continuas) gráfico de líneas o un histograma
▪ cuenta
▪ Ejemplos: edad, altura, no. de niños

Cualitativas (Nominal, ordinal, dicotómicas)


▪ Descripción Para los datos categóricos utilizar
▪ Datos no numéricos gráficos de barra o de torta
▪ Ordenar/Clasificar datos (datos no cuantitativos)
▪ Ejemplos: enfermo? (si/no), sitio del cáncer

¿Por qué es importante la distinción?


Porque resumimos diferentes tipos de variables con diferentes métodos de resumen.

22
Algunos consejos
● El mejor gráfico es el más simple.
● Todo gráfico debe llevar un título que aclare el contenido: qué, cómo, cuándo y dónde.
● La línea vertical, denominada ordenada, se utiliza para representar
la frecuencia.
● Las características cualitativas y cuantitativas (variable) van en la línea
horizontal o abscisa.
● En todo gráfico se debe explicar la fuente de donde fueron
obtenidos los datos
● Los gráficos deben ser lo bastante sencillos para ser comprendidos sin la ayuda de las
descripciones del texto.
● Los gráficos deben seguir y nunca preceder la exposición del texto.
Gráfico de línea: Ejemplo
Número de casos reportados de Leishmaniasis Visceral y Cutánea, País X, 2005–2017

Fuente de los datos: WHO Global Health Observatory Data Repository, acceso el 1 Oct 2018
Características de los gráficos de línea
Número de casos notificados de leishmaniasis visceral y cutánea, país X, 2005–2017
Título
eje y
leyenda

datos

eje x
eje y comienza
en 0; Intervalos en eje x son iguales
intervalos en eje
y son iguales
Crear un gráfico de líneas
0 Revisar los datos
1 Graficar líneas en el eje x y en el eje y
- Comenzar con 0
- Identifique el valor mayor, redondee hacia arriba para el valor máximo
- Seleccione un tamaño de intervalo razonable

2 Complete y etiquete el eje x y el eje y


3 Trazar datos
4 Añadir título: qué, dónde, cuándo
5 Agregar comentarios, notas al pie, fuentes
Ejercicio 1.08-2 (15 min):
Generar un gráfico de línea
▪ Revisar la tabla de casos de diarrea sanguinolenta reportados por dos
hospitales en un país X en 2016
▪ Cree un gráfico de líneas que muestre el número de casos reportados
por semana epidemiológica para cada hospital, utilizando la hoja
cuadriculada proporcionada. Asegúrese de incluir todas las etiquetas y
títulos apropiados.
Ejercicio 1.08-2: Respuesta
Casos de diarrea sanguinolenta reportados por dos hospitales, por semana epidemiológica. Provincia x, año
2019

Semana epidemiológica
Gráfico de línea: Resumen
▪ Gráfica la ocurrencia de casos a lo largo del tiempo
▪ El eje de la X casi siempre representa el tiempo
▪ El eje de la Y representa los datos que se cuentan, proporción, o tasas
– Empieza en 0, finaliza con el valor más alto
▪ Intervalos a lo largo del eje de la X deben ser iguales
▪ Intervalos a lo largo del eje de la Y deben ser iguales
▪ Se deben etiquetar los ejes y títulos
▪ Es bueno para comparar dos o más conjuntos de datos
Histograma: Es una herramienta importante para
los brotes
▪ Frecuencia de distribución de datos cuantitativos
▪ Comúnmente utilizado para brotes ("Curva Epidemica")
▪ El eje de la X generalmente representa un intervalo de tiempo (fecha de inicio de
los síntomas o fecha de diagnóstico)
– Sin espacios entre columnas adyacentes
– Usar intervalos de clase iguales (en el eje de la x)
▪ Eje de la Y, representa la frecuencia (número de casos)
▪ La altura de columna debe ser proporcional al número de observaciones en ese
intervalo
Histograma: Ejemplo
Casos confirmados de COVID por semana epidemiológica según grupo de edad. SE 10/2020 - SE 36/2022, Argentina

Semana epidemiológica
Generar un Histograma
1 Dividir el rango de datos cuantitativos en intervalos de igual ancho que no se
superpongan

2 Asignar una columna a cada intervalo

3 Contar el número de veces que aparece cada intervalo; completar el eje de la


Y

4 La altura de la columna debe ser igual a la frecuencia de cada intervalo

5 Incluir etiquetas de eje y un título descriptivo.


Generar un Histograma: Ejemplo
Edad
Frecuencia
(años)
0-4 12
5-9 17

Frecuencia
10-14 10
15-19 21
20-24 30
25-29 35
30-34 25
35-39 15
40-44 6
45-49 4
Edad (años)
Ejercicio 1.08-3: generar un Histograma- 15 min

▪ Dibuje un histograma. Asegúrese de etiquetar los ejes y crear un título


apropiado.
▪ Diseñar el histograma
• Grupo 1: por semana
• Grupo 2: por mes

Comparar los histogramas por semana y mes ¿Cuál preferimos? ¿Por qué?
Ejercicio 3: respuestas
Por semana Por mes
Gráfico de barras
▪ Se utiliza para variables cualitativas
▪ Pueden ser verticales (columnas) u horizontales (barras)
▪ Las barras deben tener el mismo ancho
▪ Las barras deben estar espaciadas entre ellas
▪ Existen varios tipos:
– Simples
– Agrupadas
– Apiladas
Gráfico de barras verticales: Ejemplo
Primera persona a la que le cuentan los pacientes su estado serológico de infección por VIH entre
adultos seropositivos (n=198), Hospital Especializado del Estado Gombe, Nigeria, 2011

Adaptado de Dankoli, et al. Pan Afr Med J 2014; 18 (Suppl 1): 4.


Gráfico de barras verticales: Ejemplo
Primera persona a la que le cuentan los pacientes su estado serológico de infección por VIH entre
adultos seropositivos (n=198), Hospital Especializado del Estado Gombe, Nigeria, 2011

Dankoli, et al. Pan Afr Med J 2014; 18 (Suppl 1): 4.


Gráfico de barras horizontales
Incidencia de cáncer para las principales localizaciones topográficas en varones y mujeres estimadas por la
IARC para Argentina en 2020. Tasas ajustadas por edad según población mundial por 100.000 varones y
mujeres.

Fuente: Elaborado por SIVER/INC en base a los datos de Globocan 2020.


Gráfico de barras agrupadas: Ejemplo
Distribución por edad y sexo en niños < 5años de envenenamiento por plomo, País x,
Septiembre 2010

Ajumobi, et al. Pan Afr Med J 2014; 18 (Suppl 1): 14.


Gráfico de barras apiladas
Distribución por edad y sexo en niños < 5años de envenenamiento por plomo, país x,
Septiembre 2010

Ajumobi, et al. Pan Afr Med J 2014; 18 (Suppl 1): 14.


Generar un gráfico de barras

1 Decidir qué tipo de gráfico de barras es el más apropiado para los datos;
decidir qué orientación es la más adecuada para los datos y las etiquetas

2 Asignar una barra a cada valor o categoría de la variable

3 Contar el número de veces que aparece cada valor

4 La altura o longitud de la barra es igual a la frecuencia de cada intervalo

5 Etiquetar ejes y título descriptivo


Histograma versus gráfico de barras
Histograma Gráfico de barras
▪ Variables cuantitativas ▪ Variables cualitativas
▪ Se utiliza para mostrar la ▪ Se utiliza para comparar categorías
distribución de frecuencias de la de variables cualitativas: género,
variable cuantitativa (incluido el síntomas, etc.
tiempo) ▪ ¿Reorganizar el orden de las
▪ Curva epidémica columnas?
▪ ¿Reorganizar el orden de las Recomendado
columnas? No
¿Qué pensamos de este gráfico?
¿Qué pensamos de este gráfico?
¿Qué pensamos de este gráfico?
¿Qué pensamos de este gráfico?
Ejercicio 1.08-4:
Generar un gráfico de barras

▪ Utilice los datos sobre la edad y el sexo de los casos confirmados de


difteria en el País B durante el 2017, para crear un gráfico de barras
agrupado por edad y sexo.
Ejercicio 1.08-4: respuesta
Número de casos confirmados de difteria en el País B durante el 2017
Mapas
Mapas
Los mapas describen la distribución geográfica de la enfermedad. Los dos
tipos más comunes son:
▪ Mapas de puntos
– Los símbolos representan ubicaciones de personas enfermas o eventos
de salud
– Los símbolos pueden ser proporcionales al número de casos.
▪ Mapas de coropletas o áreas
– El sombreado o el color representan variaciones en los recuentos o
tasas de enfermedades
Mapa de puntos: Ejemplo
Área Golden Square, Londres,
Agosto-septiembre 1848

CDC. Principles of Epidemiology, 3rd ed. Atlanta: CDC, 2006, after Snow.
Mapas de área: Ejemplo
Distribución de casos de rabia animal en la
provincia de Buenos Aires,
período 2018 a SE 31 de 2022.

Fuente: Elaboración del Área de Vigilancia Epidemiológica del Departamento de Zoonosis Urbanas
Resumen
▪ Los datos se pueden organizar mediante tablas, gráficos y mapas.
▪ Las visualizaciones de datos ayudan a verificar y analizar los mismos, explorar
patrones y tendencias y comunicar información a otros.
▪ Organizar los datos siempre con tablas. Utilizar títulos y etiquetas apropiados.
▪ Las tablas con una sola variable se utilizan para mostrar distribuciones de
frecuencia.
▪ Las tablas de dos variables pueden mostrar correlaciones entre dos variables.
Resumen
▪ Los gráficos de líneas son útiles para mostrar patrones o tendencias sobre
alguna variable, generalmente el tiempo.
▪ Los histogramas se usan con mayor frecuencia en epidemiología para las
curvas epidémicas (casos en el tiempo).
▪ Los gráficos de barras permiten visualizar los datos de una tabla de una
variable. Los gráficos de barras agrupadas pueden mostrar dos variables.
▪ Los mapas son útiles para mostrar la distribución geográfica de eventos o
condiciones de salud.
Gracias!

También podría gustarte