Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 8. Visualizar Los Datos
Clase 8. Visualizar Los Datos
Taller 1
Clase 8:
Visualización de datos
Objetivos de aprendizaje
1- Describir los datos usando tablas, gráficos, mapas
• Seleccionar una tabla, un gráfico o un mapa adecuados para los datos y para el objetivo de comunicación
• Dibujar una tabla o un gráfico a mano
Ciclo de vigilancia de la salud pública
¿Puede resumirse la edad y el sexo de los casos a simple vista?
Fecha de
Caso Número apertura Edad Sexo
1 21 Nov 9 M
2 21 Nov 39 M
3 22 Nov 29 F
¿Puede resumirse la edad y el sexo de los casos a simple vista?
Fecha de
Caso Número apertura Edad Sexo
1 21 Nov 9 M
2 21 Nov 39 M
3 22 Nov 29 F
4 21 Nov 10 M
5 22 Nov 55 F
6 22 Nov 11 M
¿Puede resumirse la edad y el sexo de los casos a simple vista?
ID Caso Edad Sexo ID Caso Edad Sexo ID Caso Edad Sexo ID Caso Edad Sexo
1 9 M 11 10 M 21 38 F 31 10 M
2 39 M 12 6 M 22 34 F 32 31 F
3 29 F 13 9 M 23 9 M 33 8 F
4 10 M 14 40 M 24 10 M 34 9 M
5 55 F 15 40 F 25 6 F 35 10 F
6 11 M 16 10 M 26 11 M 36 11 M
7 9 M 17 11 M 27 9 M 37 38 M
8 7 F 18 43 F 28 41 M 38 11 M
9 17 M 19 71 F 29 6 M 39 7 M
10 10 M 20 9 F 30 11 M 40 16 F
¿Por qué organizar/agrupar los datos?
• Sirve para obtener un resumen cuando el conjunto de datos
tiene demasiados registros para revisar individualmente
• Sirve para familiarizarse con los datos antes del análisis
• Sirve para Identificar errores
• Sirve para identificar patrones, tendencias, relaciones,
excepciones y valores atípicos
• Sirve para comunicar la información a otros
Métodos para organizar/resumir datos
▪ Tablas
▪ Gráficos
▪ Mapas
Tablas
Matriz de datos - datos nominalizados
Casos fallecidos de neumonía, Argentina, período 2009 - 2016.
2 15/9/2011 2011 A
3 21/4/2011 2011 B
Estructura tripartita del dato:
4 6/7/2013 2013 C
● Unidades de análisis
5 3/12/2015 2015 E
● Variables
● Categorías o valores
Título descriptivo (qué, dónde, cuándo)
Componentes de las tablas
Casos fallecidos de neumonía, por provincia, Argentina, periodo 2009 - 2016.
Etiquetas de las
filas
Provincia 2009 2010 2011 2012 2013 2014 2015 2016 Total
A 17 7 9 2 7 Etiquetas
4 de las
2 columnas
0 49
B 12 27 33 4 10 30 12 4 132
C 29 24 23 27 11 68 17 7 206
D 20 74 59 Celda
20 65 179 16 0 433
Filas
E 11 12 73 4 0 25 7 1 133
F 0 0 1 1 0 0 0 0 2
G 0 0 0 0 totales
0 de las
0 columnas
0 0 0
Total 89 144 198 58 93 306 54 12 955
Columnas
Fuente Totales de filas
Elaborado con base en datos de la Dirección de Estadísticas e Información de Salud (DEIS). Ministerio de Salud de la Nación. Argentina, 2022
11
Tipos de Tablas
▪ Tabla de 1 variable (distribución de frecuencias)
– Rango de valores de una sola variable
– Número de observaciones para cada valor
Tabla bivariada/bidimensional
– Recuentos mostrados para dos variables (por ejemplo, sexo y grupos de
edad).
▪ Tablas compuestas
– Se muestran múltiples valores a la vez
Distribución de frecuencias. Variables cualitativas
Hombres 83 66,4%
Mujeres 42 33,6%
Total 125 100,0%
Distribución de frecuencias. Variables cuantitativas
▪ Columna 1: todos los valores posibles (más el total), o rango de valores (“intervalos”)
(opcional: desconocidos)
▪ Columna 2: Número de registros con cada valor o que caen en cada intervalo
▪ Columna 3: Porcentaje (opcional)
Número de casos de tuberculosis reportados, por grupo de edad (en años). País X, 2015
Grupo de edad
(años) No. Casos Porcentaje
<5 1 0.8%
5–14 5 4.0%
15–24 23 18.4%
25–44 42 33.6%
45–64 29 23.2%
≥65 10 8.0%
desconocido 15 12.0%
Total 125 100.0%
Tablas bivariadas/bidimensionales
▪ Muestra los datos de acuerdo a dos variables en forma simultánea:
– una variable con sus categorías distribuidas a lo largo de las filas
– otra variable con sus categorías distribuidas a lo largo de las columnas
Tabla 1. Numero de casos de tuberculosis por grupo de edad (en años) y sexo, País x, 20xx
Grupo de edad (años) Mujeres Hombres Total
<5 0 1 1
5–14 3 2 5
15–24 9 14 23
25–44 11 31 42
45–64 8 21 29
≥65 3 7 10
Sin dato 8 7 15
Total 42 83 125
Tabla de 2 x 2 : Ejemplo
Condicionales
Marginales Tasa de
Enfermos Sanos Total ataque(%)
¿Ingirió Si 61 30 91 67.0
ensalada en el
hotel? No 7 43 50 14.0
Síntomas
Edad característicos n (%)
(años) n (%) Sexo n (%)
Mujer 237 (47) Fiebre 313 (63)
<1 150 (30)
Varón 270 (53) Tos 56 (11)
1–2 228 (45)
Total 507 (100) Odinofagia 47 (9)
3–4 75 (15)
Diarrea 33 (7)
5–7 36 (7)
Cefalea 15 (3)
8–10 18 (4)
Otros 33 (7)
Total 507 (100)
Total* 497 (100)
Gráfico de
barras
Tipo de variables
Cuantitativas (Numéricas) Datos numéricos continuos: utilizar un
▪ Medidas numéricas (discretas o continuas) gráfico de líneas o un histograma
▪ cuenta
▪ Ejemplos: edad, altura, no. de niños
22
Algunos consejos
● El mejor gráfico es el más simple.
● Todo gráfico debe llevar un título que aclare el contenido: qué, cómo, cuándo y dónde.
● La línea vertical, denominada ordenada, se utiliza para representar
la frecuencia.
● Las características cualitativas y cuantitativas (variable) van en la línea
horizontal o abscisa.
● En todo gráfico se debe explicar la fuente de donde fueron
obtenidos los datos
● Los gráficos deben ser lo bastante sencillos para ser comprendidos sin la ayuda de las
descripciones del texto.
● Los gráficos deben seguir y nunca preceder la exposición del texto.
Gráfico de línea: Ejemplo
Número de casos reportados de Leishmaniasis Visceral y Cutánea, País X, 2005–2017
Fuente de los datos: WHO Global Health Observatory Data Repository, acceso el 1 Oct 2018
Características de los gráficos de línea
Número de casos notificados de leishmaniasis visceral y cutánea, país X, 2005–2017
Título
eje y
leyenda
datos
eje x
eje y comienza
en 0; Intervalos en eje x son iguales
intervalos en eje
y son iguales
Crear un gráfico de líneas
0 Revisar los datos
1 Graficar líneas en el eje x y en el eje y
- Comenzar con 0
- Identifique el valor mayor, redondee hacia arriba para el valor máximo
- Seleccione un tamaño de intervalo razonable
Semana epidemiológica
Gráfico de línea: Resumen
▪ Gráfica la ocurrencia de casos a lo largo del tiempo
▪ El eje de la X casi siempre representa el tiempo
▪ El eje de la Y representa los datos que se cuentan, proporción, o tasas
– Empieza en 0, finaliza con el valor más alto
▪ Intervalos a lo largo del eje de la X deben ser iguales
▪ Intervalos a lo largo del eje de la Y deben ser iguales
▪ Se deben etiquetar los ejes y títulos
▪ Es bueno para comparar dos o más conjuntos de datos
Histograma: Es una herramienta importante para
los brotes
▪ Frecuencia de distribución de datos cuantitativos
▪ Comúnmente utilizado para brotes ("Curva Epidemica")
▪ El eje de la X generalmente representa un intervalo de tiempo (fecha de inicio de
los síntomas o fecha de diagnóstico)
– Sin espacios entre columnas adyacentes
– Usar intervalos de clase iguales (en el eje de la x)
▪ Eje de la Y, representa la frecuencia (número de casos)
▪ La altura de columna debe ser proporcional al número de observaciones en ese
intervalo
Histograma: Ejemplo
Casos confirmados de COVID por semana epidemiológica según grupo de edad. SE 10/2020 - SE 36/2022, Argentina
Semana epidemiológica
Generar un Histograma
1 Dividir el rango de datos cuantitativos en intervalos de igual ancho que no se
superpongan
Frecuencia
10-14 10
15-19 21
20-24 30
25-29 35
30-34 25
35-39 15
40-44 6
45-49 4
Edad (años)
Ejercicio 1.08-3: generar un Histograma- 15 min
Comparar los histogramas por semana y mes ¿Cuál preferimos? ¿Por qué?
Ejercicio 3: respuestas
Por semana Por mes
Gráfico de barras
▪ Se utiliza para variables cualitativas
▪ Pueden ser verticales (columnas) u horizontales (barras)
▪ Las barras deben tener el mismo ancho
▪ Las barras deben estar espaciadas entre ellas
▪ Existen varios tipos:
– Simples
– Agrupadas
– Apiladas
Gráfico de barras verticales: Ejemplo
Primera persona a la que le cuentan los pacientes su estado serológico de infección por VIH entre
adultos seropositivos (n=198), Hospital Especializado del Estado Gombe, Nigeria, 2011
1 Decidir qué tipo de gráfico de barras es el más apropiado para los datos;
decidir qué orientación es la más adecuada para los datos y las etiquetas
CDC. Principles of Epidemiology, 3rd ed. Atlanta: CDC, 2006, after Snow.
Mapas de área: Ejemplo
Distribución de casos de rabia animal en la
provincia de Buenos Aires,
período 2018 a SE 31 de 2022.
Fuente: Elaboración del Área de Vigilancia Epidemiológica del Departamento de Zoonosis Urbanas
Resumen
▪ Los datos se pueden organizar mediante tablas, gráficos y mapas.
▪ Las visualizaciones de datos ayudan a verificar y analizar los mismos, explorar
patrones y tendencias y comunicar información a otros.
▪ Organizar los datos siempre con tablas. Utilizar títulos y etiquetas apropiados.
▪ Las tablas con una sola variable se utilizan para mostrar distribuciones de
frecuencia.
▪ Las tablas de dos variables pueden mostrar correlaciones entre dos variables.
Resumen
▪ Los gráficos de líneas son útiles para mostrar patrones o tendencias sobre
alguna variable, generalmente el tiempo.
▪ Los histogramas se usan con mayor frecuencia en epidemiología para las
curvas epidémicas (casos en el tiempo).
▪ Los gráficos de barras permiten visualizar los datos de una tabla de una
variable. Los gráficos de barras agrupadas pueden mostrar dos variables.
▪ Los mapas son útiles para mostrar la distribución geográfica de eventos o
condiciones de salud.
Gracias!