Unidad 4 Parte 1 PDF

Manual de Epidemiología - Unidad 4
Unidad 4
Organización de los datos epidemiológicos
Cuando se recogen más datos de los que se pueden revisar individualmente, se pueden usar
cuadros y gráficas para organizarlos, resumirlos y mostrarlos en forma clara y efectiva. Con
cuadros y gráficas se pueden analizar grupos de datos de unas pocas docenas a varios millones.
Estas herramientas permiten identificar, explorar, entender y presentar distribuciones, tendencias
y relaciones entre los datos. Los cuadros y las gráficas son herramientas esenciales no sólo en la
epidemiología descriptiva y analítica, sino también en la comunicación de los hallazgos de las
investigaciones.
Objetivos
Después de preparar y entender esta lección y de responder a las preguntas de los ejercicios de
este módulo, el estudiante será capaz de:
* Preparar correctamente cuadros con una, dos o tres variables;
* Preparar correctamente las siguientes gráficas: una serie lineal en escala aritmética,
una serie lineal en escala semilogarítmica, histogramas, polígonos de frecuencia y
diagramas de dispersión (nube de puntos);
* Preparar correctamente gráficas de barras, pasteles, mapas de puntos, mapas de área,

y diagramas de caja y bigotes;
* Describir cuándo se usa cada tipo de cuadro, gráfica y carta.
197
Introducción a los cuadros, gráficas y cartas

El análisis de los datos es un componente importante en la práctica epidemiológica; para un
análisis efectivo de los datos, el trabajador de salud debe primero familiarizarse con ellos y
después aplicar técnicas analíticas; es importante empezar por examinar los datos individualmente
tal como aparecen en la base de datos, para rápidamente resumirlos en cuadros; algunas veces,
las cuadros resultantes son el único análisis necesario, especialmente cuando la cantidad de
datos es pequeña y las relaciones son obvias. Por otra parte, las gráficas pueden ayudar a visualizar
patrones y tendencias más generales e identificar variaciones de estas tendencias. Las variaciones
pueden representar hallazgos nuevos e importantes o pueden ser únicamente errores en la
digitación o codificación que necesitan ser corregidos. Por tanto, las cuadros y las gráficas son
esenciales para la verificación y el análisis de los datos.
Una vez que el análisis está completo, las cuadros y las gráficas pueden servir como ayudas
visuales útiles para describir los datos; cuando se preparan cuadros y gráficas, el propósito primario
es comunicar la información obtenida.
198
Cuadros
Un cuadro es la agrupación de datos dispuestos en filas y columnas. En un cuadro se puede
organizar casi cualquier información cuantitativa. Los cuadros son útiles para demostrar patrones,
excepciones a un patrón, diferencias y otras relaciones; además, sirven habitualmente como
base para la preparación de gráficas, que son más visuales pero que pueden perder algunos
detalles.
Los cuadros diseñados para presentar los datos deben ser lo más simple posible; dos o tres
pequeños cuadros, cada uno enfocado en un aspecto diferente de los datos, son más fáciles de
entender que uno solo que contenga muchos datos.
Un cuadro debe entenderse por sí mismo; si utiliza fuera de su contexto original, debe conservar
la información necesaria para que el lector entienda los datos. Para crear un cuadro que se
entienda por si mismo, realice los siguientes pasos:
* Use un título claro y conciso que describa el qué, el cuándo y el dónde de los datos en la
tabla. Inicie el título de la tabla con un número (por ejemplo, tabla 4.1);
* Encabece cada fila y cada columna e incluya las unidades de medida (por ejemplo, años,
mm Hg, mg/dl, tasas por 100.000);
* Muestre los totales de las filas y las columnas. Si se muestran porcentajes, así mismo, hay
que mostrar el total de ellos (siempre 100%);
* Explique cualquier código, abreviatura o símbolo en una nota de pie de página. (Por ejemplo,
Sifilis P&S quiere decir Sifilis primaria y secundaria);
* Anote cualquier exclusión en una nota a pie de página (1 caso y 2 controles con historia
familiar desconocida se incluyeron de este análisis);
* Anote la fuente de los datos en una nota a pie de página, si no son originales.
Cuadros de una sola variable

El cuadro básico en la epidemiología descriptiva es una distribución de frecuencias simple con
una sola variable, como el cuadro 4.1a. (Las distribuciones de Frecuencia se discuten en las
lecciones 2 y 3). En la primera columna del cuadro, se despliegan los valores o categorías de la
variable representada en los datos, tales como edad o género. La segunda columna muestra el
número de personas o eventos en cada categoría.
Con frecuencia, una tercera columna muestra el porcentaje de las personas o de los eventos
en cada categoría, como en el cuadro 4.1b. Observe que los porcentajes en el cuadro 4.1b
suman 100,1% en vez de 100%, dado que se aproximaron las cifras a una posición decimal.
Esto ocurre con frecuencia en las cuadros que muestran porcentajes; sin embargo, hay que
mostrar el total de los porcentajes como 100% y explicar la diferencia en una nota de pie de
página.
199
Cuadro 4.1 a. Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989.
Grupo de edad (años) Número de casos
£ 14 230
15-19 4.378
20-24 10.405
25-29 9.610
30-34 8.648
35-44 6.901
45-54 2.631
³55 1.278
To t a l 44.081
Fuente: 12
Cuadro 4.1 b. Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989.
Grupo de edad Casos

(años) Número Porcentaje
£ 14 230 0,5
15-19 4.378 10,0
20-24 10.405 23,6
25-29 9.610 21,8
30-34 8.648 19,6
35-44 6.901 15,7
45-54 2.631 6,0
³55 1,278 2,9
To t a l 44.081 100,0*
*Los porcentajes no suman a 100% debido a que se aproximaron al decimal.
Fuente: 12
Se puede modificar el cuadro de una sola variable para mostrar la frecuencia acumulada o el
porcentaje acumulado, como en el cuadro 4.1c, en el cual es posible ver que 75,5% de los
casos de sífilis primaria y secundaria ocurrieron en los menores de 35 años.
Cuadro 4.1 c. Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989.
Grupo de edad Casos

(Años) Número Porcentaje % acumulado
≤ 14 230 0,5 0,5

15-19 4.378 10,0 10,5
20-24 10,405 23,6 34,1
25-29 9.610 21,8 55,9
30-34 8,648 19,6 75,5
35-44 6.901 15,7 91,2
45-54 2.631 6,0 97,2
≥55 1.278 2,9 100,0
To t a l 44.081 100,0* 100,0
*Los porcentajes no suman a 100% debido a que se aproximaron al decimal.
Fuente: 12
200
Cuadros de dos o tres variables

Las tablas 4.1a, 4.1b y 4.1c muestran conteo de casos (frecuencia) por una sola variable: edad. Los
datos también se pueden tabular en cruz para mostrar conteos de una segunda variable. El cuadro
4.2 muestra los casos de sifilis por edad y género de paciente.
Cuadro 4.2. Casos nuevos de sífilis primaria y secundaria por edad y género, Estados Unidos, 1989.
Grupo de edad Número de casos por género

(años) Masculino Femenino To t a l
£ 14 40 190 230
15-19 1.710 2.668 4.378
20-24 5.120 5.285 10.405
25-29 5.304 4.306 9.610
30-34 5.537 3.111 8.648
35-44 5.004 1897 6901
45-54 2144 487 2631
³55 1.147 131 1.278
To t a l 26.006 18.075 44.081
Fuente: 12
Un cuadro de dos variables con datos tabulados en cruz también se conoce como cuadro
de contingencia. El cuadro 4.3, es un ejemplo de un tipo común de cuadro de contingencia,
que se denomina un cuadro de 2 x 2 porque cada una de las dos variables tiene dos categorías.
Los epidemiólogos usan frecuentemente los cuadros de contingencia para presentar los datos
para calcular las medidas de asociación y las pruebas de significancia estadística.
Cuadro 4.3. Estatus al seguimiento de un grupo de varones blancos con y sin diabetes, estudio de
seguimiento de la encuesta de salud por examen, 1982-84.
Defunciones Vivos To t a l % Fallecidos

Diabéticos 100 89 189 52,9
No diabéticos 811 2.340 3.151 25,7
To t a l 911 2.429 3.340
Fuente: 18
Además, los epidemiólogos usan los cuadros de 2 x 2 en estudios de asociación entre la exposición
y la enfermedad. Tales estudios comparan las personas con y sin exposición y las personas con y
sin la enfermedad. Un cuadro de dos por dos es una manera conveniente de organizar los datos
de estos tipos de estudios. El cuadro 4.4 muestra la forma general de este tipo de cuadros. Como
se demuestra, el estado de enfermedad (por ejemplo: enfermo versus sano) es el encabezado
de las dos columnas y las dos filas se etiquetan con el estado de exposición (expuesto o no). Las
letras a, b, c y d dentro de las casillas se refieren al número de personas con la enfermedad
indicada en las columnas y la exposición indicada en las filas. Por ejemplo, en el cuadro 4.4 c es
el número de personas en el estudio que tienen la enfermedad, pero que no tuvieron la
exposición. H en las totales de las filas (H1 y H2) es la abreviatura para horizontal; V en los
totales de las columnas (V1 y V2) es la abreviación de vertical. El número total de las personas se
representa por la letra T (o N).
201
Cuadro 4.4. Forma general para un cuadro de 2 x 2.

Enfermo Sanos To t a l
Expuesto a b H1
No expuesto c d H2
To t a l V1 V2 T
Cuando se muestran los datos, es preferible usar un cuadro de una sola variable o de dos variables.
A veces, se quiere incluir una tercera variable para mostrar los datos en una forma más completa.
El cuadro 4.5 muestra un cuadro de tres variables (raza/etnia, género y edad). Como se puede
ver, un cuadro de tres variables es bastante complejo; está recargado; por lo que no debe
usarse más de tres variables en un solo cuadro.
Cuadro 4.5. Morbilidad por sífilis primaria y secundaria por edad, género y raza, Estados Unidos,1989.
Raza/etnia
Edad (años) Género Blanco Negro Otras To t a l
Masculino 2 31 7 40
£14 Femenino 14 165 11 190
Total 16 196 18 230
Masculino 88 1.412 210 1.710
15-19 Femenino 253 2.257 158 2.668
Total 341 3.669 368 4.378
Masculino 407 4.059 654 5.120
20-24 Femenino 475 4.503 307 5.285
Total 882 8.562 961 10.405
Masculino 550 4.121 633 5.304
25-29 Femenino 433 3.590 283 4.306
Total 983 7.711 916 9.610
Masculino 564 4.453 520 5.537
30-34 Femenino 316 2.628 167 3.111
Total 880 7.081 687 8.648
Masculino 654 3.858 492 5.004
35-44 Femenino 243 1.505 149 1.897
Total 897 5.363 641 6.901
Masculino 323 1.619 202 2.144
45-54 Femenino 55 392 40 487
Total 378 2.011 242 2.631
Masculino 216 823 108 1.147
³55 Femenino 24 92 15 131
Total 240 915 123 1.278
Total de todas Masculino 2.804 20.376 2.826 26.006
las edades Femenino 1813 15.132 1.130 18.075
To t a l 4.617 35.508 3.956 44.081
Fuente: 12
202
Ejercicio 4.1
Los datos del cuadro 4.6, describen las características de 36 residentes de un ancianato durante
un brote de una enfermedad diarreica.
a. Construya un cuadro de enfermedad (diarrea) por tipo de menú ingerido. Utilice el tipo de
diarrea como rótulo de las columnas y los tipos de menú como rótulos de las filas.
b. Construya un cuadro 2 x 2 de la enfermedad (diarrea) por exposición al menú A.
Respuestas en la página 269
203
Cuadro 4.6. Características de los residentes del ancianato A, durante un brote de enfermedad diarreica,
enero de 1989.
Número Edad Género Habitación Menú ¿Tuvo diarrea? Fecha de

residente inicio
1 71 F 103 A Sí 15/1
2 72 F 105 A Sí 23/1
3 74 F 105 A No
4 86 F 107 B No
5 83 F 107 B No
6 68 F 109 A Sí 18/1
7 69 F 109 C No
8 64 F 111 A Sí 16/1
9 66 M 111 A Sí 18/1
10 68 M 104 A Sí 20/1
11 70 M 106 A No
12 86 M 110 A No
13 73 M 112 B No
14 82 M 219 C No
15 72 M 221 C No
16 70 M 221 B No
17 77 M 227 D No
18 80 M 227 D No
19 71 F 231 A Sí 14/1
20 68 F 231 D Sí 15/1
21 64 F 233 A No
22 73 F 235 A Sí 13/1
23 75 F 235 B No
24 78 F 222 C No
25 72 F 222 A No
26 66 M 224 B No
27 69 M 226 A Sí 16/1
28 75 M 228 E No
29 71 M 230 A Sí 13/1
30 83 M 232 F No
31 84 M 232 D No
32 79 M 234 A Sí 12/1
33 72 M 234 D Sí 14/1
34 77 M 236 A Sí 13/1
35 78 M 236 B No
36 80 M 238 D No
Cuadro de otras medidas estadísticas

Los cuadros 4.1 a 4.3, muestran números de casos (frecuencias). Además de mostrar el número
de casos, las celdas de un cuadro pueden mostrar promedios, tasas, años de vida potencial
perdidos, riesgos relativos y otras medidas estadísticas. Como en cualquier otro cuadro, hay que
identificar claramente el título y los encabezamientos de los datos. Por ejemplo, tanto el título
como en los encabezamientos del el cuadro 4.7, muestran que se están presentando tasas.
204
Cuadro 4.7. Casos nuevos notificados de sífilis primaria y secundaria por cien mil habitantes, tasas
específicas por edad y raza, Estados Unidos, 1989.
Grupo de edad Tasas por cien mil

(Años) Blancos Negros Otros To t a l
£14 0,0 2,4 0,8 0,4

15-19 2,4 131,5 51,0 24,3
20-24 5,8 323,0 139,2 55,9
25-29 5,4 270,9 117,9 44,1
30-34 4,7 256,6 83,2 38,8
35-44 2,9 135,0 47,8 19,0
45-54 1,7 76,7 29,6 10,5
³55 0,5 19,4 10,4 2,4
To t a l 2,2 115,8 45,8 17,7
Fuente:12
Tablas de salida
Aunque no se puede analizar los datos antes de recolectarlos, hay que diseñar los métodos de
análisis que se van a emplear con anticipación para facilitar el análisis cuando ya se hayan
recolectado. De hecho, la mayoría de los protocolos, escritos antes de empezar el estudio,
requieren una descripción de cómo se van a analizar los datos. Como parte del plan de análisis,
se puede desarrollar una tabla de salida para mostrar cómo se van a organizar y presentar los
datos. Un cuadro en blanco es un cuadro, con títulos, encabezamientos y categorías, pero sin
datos; cuando se desarrolla una tabla de salida que contiene variables continuas, como edad,
hay que crear más categorías de las que usualmente se requieren, para poder visualizar cualquier
comportamiento o patrón de los datos que sean de interés.
Tabla de salida 1. Características clínicas del síndrome de Kawasaki con inicio entre octubre y diciembre
de 1984.
Características clínicas No. con característica Porcentaje
1. Fiebre ³5 días -- ( )
2. Congestión conjuntival bilateral -- ( )
3. Cambios orales -- ( )
* Labios congestionados -- ( )
* Faringe congestionada -- ( )
* Labios secos y con fisuras -- ( )
* Lengua en fresa -- ( )
4. Cambios en extremidades periféricas -- ( )
* edema -- ( )
* eritema -- ( )
5. exantema -- ( )
6. Linfadenopatía cervical <1,5 cm -- ( )
To t a l ( 1 0 0 ) -- (100)
205
Tabla de salida 2. Características demográficas de los casos del síndrome de Kawasaki con fechas de
inicio entre octubre y diciembre de 1984.
Características demográficas Número Porcentaje

Edad
<1 año -- ( )
1 año -- ( )
2 años -- ( )
3 años -- ( )
4 años -- ( )
5 años -- ( )
> 5 años -- ( )
Género
Masculino -- ( )
Femenino --
Raza
Blanca -- ( )
Negra -- ( )
Asiática -- ( )
Otra -- ( )
To t a l -- (100)
Alternativamente, la tabla de salida 2 se hubiera podido dibujar como un cuadro de 3 variables

con el número de casos por edad, género y raza.
Figura 4.1. Ilustración de tablas de salida diseñados antes de conducir un estudio de casos y controles
del síndrome de Kawasaki.
Tabla de salida 3: distribución por condado de residencia.
Municipio de residencia Número %

---------- ( )
---------- ( )
---------- ( )
Tabla de salida 4: distribución por ingresos.
Ingreso del hogar $ Número %

< 10.000 ---------- ( )
10.001 - 15.000 --------- ( )
15.001 - 20.000 --------- ( )
20.001 - 30.000 --------- ( )
30.001 - 35.000 --------- ( )
> 35.000 --------- ( )
206
Tabla de salida 5: número de días de hospitalización.
Número de días de hospitalización Número %

0 ---------- ( )
1 ---------- ( )
2 --------- ( )
3 ---------- ( )
4 ---------- ( )
5+ ---------- ( )
Media =
Mediana =
Tabla de salida 6: Distribución de complicaciones graves.
Complicaciones graves Número %

Cardíaca ---------- ( )
Artritis --------- ( )
Defunción --------- ( )
To t a l -------- 100
Tabla de salida 7: Distribución de complicaciones graves.
Característica demográfica Casos Controles

Número % Número %
Edad < 1 año ---------- ( ) ---------- ( )
1 año --------- ( ) ---------- ( )
2 años --------- ( ) ---------- ( )
3 años -------- ( ) ---------- ( )
4 años ---------- ( ) ---------- ( )
5 años ---------- ( ) ---------- ( )
> 6 años ---------- ( ) ---------- ( )
Genero
Masculino ---------- ( ) ---------- ( )
Femenino ---------- ( ) ---------- ( )
Raza
Blanca ---------- ( ) ---------- ( )
Negra ---------- ( ) ---------- ( )
Asiática ---------- ( ) ---------- ( )
Otra --------- ( ) ---------- ( )
To t a l --------- 100 ---------- 100
Tabla de salida 8: ingresos.
Ingreso del hogar $ Casos Controles

Número % Número %
< 10.000 ---------- ( ) ---------- ( )
10.001 - 15.000 --------- ( ) ---------- ( )
15.001 - 20.000 --------- ( ) ---------- ( )
20.001 - 30.000 -------- ( ) ---------- ( )
30.001 - 35.000 -------- ( ) ---------- ( )
> 35.000 ------- ( ) ---------- ( )
207
Tabla de salida 9. Cararterísticas epidemiológicas de los casos de síndrome Kawasaki y sus controles
con fecha de inicio de octubre a diciembre de 1984.
Caractarísticas epidemiológicas Casos Controles

Número % Número %
Antecedentes de enfermedad Si ________ ( ) _______ ( )
No ________ ( ) _______ ( )
Razón de desigualdades (OR)= ________ Intervalo de confianza del 95%= ( )

χ 2= ______ de P=0
Exposición a shampoo de alfombras Si _______ ( ) _______ ( )

No _______ ( ) _______ ( )
Razón de desigualdades (OR)= ________ Intervalo de confianza del 95%= ( )

χ 2 = ______ de P=0
La secuencia de los cuadros de salida mostrados anteriormente y en la figura 4.1 presentan una
aproximación sistemática y lógica del análisis. Por supuesto, una vez que los datos se encuentran
disponibles y los números han sido tabulados en estos cuadros, se pueden llevar a cabo análisis
adicionales los cuales se deben llevar a feliz término.
208
Creacion de categorías
Algunas variables, tales como "género" o "¿comió ensalada de papas?" tienen un número limitado
de respuestas posibles. Tales respuestas proveen categorías útiles para incluir en un cuadro.
Cuando se estudian variables con un rango de respuestas posibles más amplio, tales como "tiempo"
o "presión arterial sistólica", hay que agrupar los datos en un número de categorías más manejable
(intervalos de clase); para crear estas categorías, hay que tener en cuenta lo siguiente:
* Elabore intervalos de clase mutuamente excluyentes que incluyan todos los datos.
Por ejemplo, si el primer intervalo es 0-5, hay que empezar el siguiente intervalo
con 6, no con 5. También hay que considerar los limites verdaderos de las nuevas
categorías. El límite superior de 0-5 es 5,4999... para la mayoría de las categorías,
pero es 5,9999 para la edad. Los límites verdaderos fueron discutidos en la unidad 3.
* Use un número relativamente grande de categorías creadas con intervalos de clase
estrechas para el análisis inicial. Es mejor combinar tales categorías posteriormente;
en general, es ideal empezar con 4-8 categorías.
* Use categorías con significado biológico o natural siempre que se pueda. Trate de
usar grupos de edad estandarizados o de uso común para el campo de estudio
específico. Si va a calcular tasas el numerador debe coincidir con las categorías de
los datos de la población que va a usar.
* Cree una categoría de "desconocido" o de "otros". Por ejemplo, en los agrupamientos
de edades mostrados en el cuadro 4.8, las categorías que se han creado para ello
son "edad no declarada", "desconocido" y "no declarada".
Cuadro 4.8. Algunas agrupaciones de edad estándares empleadas en el CDC.
Enfermedades de Mortalidad por neumonía Tabulaciones finales de VIH/sida

notificación obligatoria e influenza estadísticas de mortalidad
<1 año <28 días <1 año <5 años
1-4 28 días-<1 año 1-4 5-12
5-9 1-14 5-14 13-19
10-14 15-24 15-24 20-24
15-19 25-44 25-34 25-29
20-24 45-64 35-44 30-34
25-29 65-74 4 5-54 35-39
30-39 75-84 55-64 40-44
40-49 ³85 65-74 45-49
50-59 Desconocida 75-84 50-54
³60 ³85 55-59
Edad no declarada No declarada 60-64
³65
To t a l To t a l To t a l To t a l
Fuente: 3, 4, 21
Si hay un grupo de base natural, se debe mantener como una categoría aparte, aún cuando el
resto de la distribución no tenga distinciones naturales; por ejemplo, cuando se crean categorías
para "fumadores" en términos de "número de cigarrillos fumados en un día", hay que dejar los
no fumadores (0 cigarrillos/día) como una categoría aparte y agrupar los fumadores según
cualquier método arbitrario, como se describe más adelante.
209
Si no existen intervalos de clase naturales o estándar, hay varias estrategias para crearlos, como
se describe a continuación.
Estrategia 1: dividir los datos en grupos de tamaño similar

Con este sistema, se busca crear un número manejable de intervalos de clase, con más o menos
el mismo número de observaciones en cada uno. Al principio se pueden usar 8 intervalos, y
después reducirlos a 4 para la presentación de los datos a otras personas. En efecto, los 4 intervalos
así creados representan los cuartiles de la distribución de los datos. Este método es especialmente
adecuado para crear las categorías de los mapas de riesgo.
Para aplicar esta estrategia, hay que dividir el número total de observaciones entre el número
de intervalos que se quiera crear; luego hay que desarrollar una columna de frecuencias
acumuladas de la distribución de los datos ordenados por orden numérico para encontrar dónde
se deben ubicar los límites de cada intervalo.
Estrategia 2: construir los intervalos basados en la media y la

desviación estándar
Con esta estrategia, se pueden crear tres, cuatro o seis intervalos de clase, para lo cual es
necesario encontrar la media y la desviación estándar de la distribución; luego, se usa el promedio
más o menos los múltiplos correspondientes de la desviación estándar para establecer los límites
de los intervalos.
Límite superior del intervalo 1 = la media - 2 desviaciones estandar
Límite superior del intervalo 2 = la media - 1 desviación estandar
Límite superior del intervalo 3 = la media
Límite superior del intervalo 4 = la media + 1 desviación estandar
Límite superior del intervalo 5 = la media + 2 desviaciones estandar
Límite superior del intervalo 6 = valor máximo
Por ejemplo, si se quieren establecer seis intervalos para unos datos con una media de 50, una
desviación estándar de 10, un valor mínimo de 19 y un valor máximo de 82, se calcularán los
límites superiores de cada intervalo de la siguiente forma:
Límite superior del intervalo 1 = 50 - 20 = 30
Límite superior del intervalo 2 = 50 - 10 = 40
Límite superior del intervalo 3 = 50
Límite superior del intervalo 4 = 50 + 10 = 60
Límite superior del intervalo 5 = 50 + 20 = 70
Límite superior del intervalo 6 = 82
210
Si se añade el límite inferior obvio para cada intervalo, éstos serán:
intervalo 1 = 19 - 30
Para crear tres o cuatro intervalos, se pueden combinar algunos de los límites de los adyacentes:
Seis Intervalos Cuatro Intervalos Tres intervalos
Intervalo 1 = 19 - 30
Intervalo 1 = 19 - 40 Intervalo 1 = 19 - 40
Estrategia 3: dividir el rango entre intervalos de clase iguales

Este es el método más sencillo y común, especialmente apropiado para utilizar en gráficas. Para
desarrollarlo es necesario:
1. Encontrar el rango de valores de los datos, es decir, encontrar la diferencia entre el valor
máximo (o algún valor conveniente un poco más grande) y cero (o el valor mínimo).
2. Decidir cuántos intervalos de clase (grupos o categorías) se harán. En general, para cuadros
se usan de 4 a 8 intervalos de clase y para gráficas y mapas se usan de 3 a 6; los intervalos
dependen de las características de los datos que se quieren visualizar.
3. Dividir el rango por el número de intervalos de clase que se decidió usar para encontrar el
tamaño de los intervalos.
4. Empezar con el valor mínimo del límite inferior del primer intervalo y especificar los intervalos
de clase de cualquier tamaño que se ha calculado hasta que se llegue al valor máximo.
Ejemplos
En estos ejemplos, se demostrará cada estrategia para la creación de intervalos, usando los datos
de las tasas de mortalidad por cáncer de cérvix del útero del cuadro 4.9. En cada caso, se
crearán cuatro intervalos de clase de las tasas.
211
Cuadro 4.9. Tasas medias anuales de mortalidad por cáncer cervicouterino por 100.000 habitantes por
estados, ordenadas por rango, Estados Unidos, 1984-1986.
Rango Estado Tasa por 100.000 Rango Estado Tasa por 100.000
1 SC 5,6 26 KS 3,6
2 WV 5,6 27 AR 3,6
3 AL 5,4 28 MD 3,5
4 LA 5,4 29 IA 3,4
5 AK 5,1 30 PA 3,4
6 TN 4,9 31 FL 3,4
7 ND 4,9 32 HI 3,4
8 KY 4,8 33 OR 3,3
9 MS 4,7 34 ML 3,3
10 NC 4,6 35 CA 3,2
11 GA 4,6 36 ID 3,1
12 ME 4,6 37 AZ 3,1
13 VR 4,3 38 MA 2,9
14 DE 4,3 39 NM 2,9
15 NH 4,3 40 WA 2,8
16 IN 4,1 41 NV 2,8
17 OK 4,1 42 CT 2,8
18 IL 4,0 43 RI 2,8
19 MT 4,0 44 WI 2,7
20 VA 3,9 45 CO 2,5
21 OH 3,8 46 NE 2,4
22 MO 3,8 47 SD 2,4
23 TX 3,7 48 MN 2,2
24 NY 3,7 49 WY 1,9
25 NJ 3,7 50 UT 1,8
To t a l U.S. 3,7
Fuente: 2
Estrategia 1: dividir los datos en grupos de similar tamaño

(Nota: si el cuadro 4.9, ha sido ordenado alfabéticamente, el primer paso sería ordenarlo por
rango de tasas. Afortunadamente, esto ya se ha hecho).
1. Dividir la lista en cuatro grupos iguales de lugares:
50 estados/4 = 12,5 estados por grupo. Como no podemos cortar un estado en dos, tendremos
que usar dos grupos de 12 estados y dos grupos de 13 estados. Como Vermont (No. 13)
podría ir tanto en el primero como en el segundo grupo y Massachusetts (No. 38) podría ir
tanto en el tercero como en el cuarto grupo, crearemos los siguientes grupos:
a. Desde Carolina del Sur hasta Maine (del 1 al 12)
b. Desde Vermont hasta Nueva Jersey (del 13 al 25)
c. Desde Kansas hasta Arizona (del 26 al 37)
d. Desde Massachusetts hasta Utah (del 38 al 50)
Note que este orden sitúa a Vermont junto a Delaware (ambos tienen tasas de 4,3) y a
Massachusetts con Nuevo México (ambos con tasas de 1,8).
212
2. Identificar la tasa para el primero y el último estado de cada grupo:
Estados Tasas por 100.000

a. ME-SC 4,6-5,6
b. NJ-VT 3,7-4,3
c. AZ-KS 3,1-3,6
d. UT-MA 1,8-2,9
3. Ajustar los límites de cada intervalo de forma que no queden vacios entre el final de uno y el
comienzo del siguiente (compare los intervalos de arriba con los de abajo):
Estados Tasas por 100.000 Número de estados
a. ME-SC 4,5-5,6 12
b. NJ-VR 3,7-4,4 13
c. AZ-KS 3,0-3,6 12
d. UT-MA 1,8-2,9 13
Estrategia 2: construir los intervalos basados en la media y la

desviación estándar
1. Calcular la media y la desviación estándar (en la unidad 3 se describe cómo calcular estas
medidas):
Media = 3,70
Desviación típica = 0,96
2. Encontrar los límites superiores de cuatro intervalos (nota: demostramos cómo crear cuatro
intervalos estableciendo primero 6 y luego combinando el par más bajo y el más alto. Aquí, no
obstante, simplemente usaremos el límite superior apropiado de los pares que serán combinados).
Límite superior del intervalo 1: media - 1 desviación estandar = 2,74
Límite superior del intervalo 2: media = 3,70
Límite superior del intervalo 3: media + 1 desviación estandar = 4,66
Límite superior del intervalo 4: valor máximo = 5,6
3. Seleccionar el límite inferior de cada límite superior para definir los cuatro intervalos completos.
Especificar los estados que caen en cada intervalo de clase (nota: para situar los Estados con las
tasas mayores, primero hemos invertido el orden de los intervalos de clase):
Estados Tasas por 100,000 Número de estados

a. MS-SC 4,64-5,60 9
b. MO-NC 3,71-4,66 13
c. RI-TX 2,75-3,70 21
d. UT-WI 1,80-2,74 7
213
Estrategia 3: dividir el rango en cuatro intervalos de clase iguales

1. Dividir el rango desde cero (o el valor mínimo) hasta el máximo, entre 4:
(5,6 - 1,8) / 4 = 0,95
2. Usar múltiplos de 0,95 para crear cuatro categorías, comenzando a partir de 1,8:
de 1,80 a (1,8 + 0,95) = de 1,8 a 2,75
de 2,76 a (1,8 + 2 x 0,95) = de 2,76 a 3,70
de 3,71 a (1,8 + 3 x 0,95) = de 3,71 a 4,65
de 4,66 a (1,8 + 4 x 0,95) = de 4,66 a 5,6
3. Categorías finales:
a. MS-SC 4,66-5,60 9
b. MO-NC 3,71-4,65 13
c. RI-TX 2,76-3,70 21
d. UT-WI 1,80-2,75 7
4. Alternativamente, como 0,95 está muy cerca de 1,0, podríamos usar múltiplos de 1 para crear
las cuatro categorías. Comenzando por el valor central (5,6 + 1,8) / 2 = 3,7, sustraer 1,0
para determinar el límite superior del primer intervalo (2,7). Los límites superiores de los
intervalos tercero y cuarto serán 3,7 + 1,0 = 4,7, y 3,7 + 2 x 1,0 = 5,7.
Categorías finales:

a. KY-SC 4,71-5,70 8
b. MO-MS 3,71-4,70 21
c. RI-TX 2,71-3,70 14
d. UT-WI 1,71-2,70 7
214
Ejercicio 4.2
Con los datos de mortalidad por cáncer cervicouterino presentado en el cuadro 4.9, utilice
cada estrategia para crear tres intervalos de clase de las tasas.
Respuestas en la página 270
215
Cuadro 4.9. Tasas medias anuales de mortalidad por cáncer cervicouterino por 100.000 habitantes por
estados, ordenadas por rango, Estados Unidos, 1984-1986.
Rango Estado Tasa por Rango Estado Tasa por

100.000 100.000
1 SC 5,6 26 KS 3,6
2 WV 5,6 27 AR 3,6
3 AL 5,4 28 MD 3,5
4 LA 5,4 29 IA 3,4
5 AK 5,1 30 PA 3,4
6 TN 4,9 31 FL 3,4
7 ND 4,9 32 HI 3,4
8 KY 4,8 33 OR 3,3
9 MS 4,7 34 ML 3,3
10 NC 4,6 35 CA 3,2
11 GA 4,6 36 ID 3,1
12 ME 4,6 37 AZ 3,1
13 VR 4,3 38 MA 2,9
14 DE 4,3 39 NM 2,9
15 NH 4,3 40 WA 2,8
16 IN 4,1 41 NV 2,8
17 OK 4,1 42 CT 2,8
18 IL 4,0 43 RI 2,8
19 MT 4,0 44 WI 2,7
20 VA 3,9 45 CO 2,5
21 OH 3,8 46 NE 2,4
22 MO 3,8 47 SD 2,4
23 TX 3,7 48 MN 2,2
24 NJ 3,7 49 UT 1,8
25 NJ 3,7 50 WY 1,9
Total U.S. 3,7
Fuente: 2
216
Gráficas
Una gráfica es una forma de mostrar los datos visualmente, usando un sistema de coordenadas.
Es un tipo de fotografía estadística que ayuda a mostrar los patrones, las aberraciones, las similitudes
y las diferencias en los datos; es una forma ideal para la presentación de los datos. El público
recordará mejor los aspectos importantes de los datos cuando se presentan en una gráfica en
vez de un cuadro.
En epidemiología, es habitual usar una gráfica de coordenadas en ángulo recto que constan de
dos ejes lineales, uno horizontal y uno vertical, denominadas el eje horizontal, X o abscisas, y el
eje vertical Y, u ordenadas. En general, se usa el eje horizontal para mostrar los valores de la
variable independiente (X), que es el método de clasificación, como tiempo, por ejemplo, y el
eje vertical para mostrar la variable dependiente (Y), en epidemiología, normalmente es una
medida de frecuencia, como el número de casos o la tasa de una enfermedad. Se encabeza
cada eje para mostrar lo que se representa (tanto el nombre de la variable como sus unidades)
y se pone la escala de medida a lo largo de la línea.
El cuadro 4.10, muestra el número de casos de sarampión por año de notificación de 1950 a
1989. Hemos utilizado una porción de los datos para crear la figura 4.2. La variable independiente
años se muestra en el eje horizontal. La variable dependiente, el número de casos, se muestra
en el eje vertical. Se muestra un cuadriculado en la figura 4.2 para ilustrar cómo se grafican los
datos . Por ejemplo, para el punto de los casos en 1953 en la gráfica desde la intersección con
el nivel de 449 hacia la derecha y así utilice la figura para unir los puntos desde 1955 hasta
1959.
Cuadro 4.10. Sarampión por año de notificación, Estados Unidos, 1950-1989.
Año Casos notificados Año Casos notificados

(x 100.000) (x 100.000)
1950 319 1970 47
1951 530 1971 75
1952 683 1972 32
1953 449 1973 27
1954 683 1974 22
1955 555 1975 24
1956 612 1976 41
1957 487 1977 57
1958 763 1978 27
1959 406 1979 14
1960 442 1980 13
1961 424 1981 3
1962 482 1982 2
1963 385 1983 1
1964 458 1984 3
1965 262 1985 3
1966 204 1986 6
1967 63 1987 4
1968 22 1988 3
1969 26 1989 18
Fuente: 12
217
Figura 4.2. Gráfica parcial de sarampión por año de notificación, Estados Unidos, 1950-1959.
800
700
600
Eje y frecuencias
500
(Tasas, casos, razones,
proporciones)
400
300
Intervalos
200
iguales
100
0
1950 1951 1952 1953 1954 1955 1956 1957 1958 1959
Intervalos iguales
Eje de la X: método de clasificación (por ejemplo el tiempo de incio de la enfermedad,
en los días; año del informe; edad de los casos, en años
Fuente: 12
Gráficas lineales en escala aritmética

Una gráfica lineal en escala aritmética muestra los patrones o tendencias de una variable,
generalmente el tiempo. Normalmente, en epidemiología se usa este tipo de gráfica para mostrar
una serie grande de datos y para comparar varias series. Es el método ideal para elaborar una
curva en el tiempo.
En una gráfica lineal en escala aritmética, una distancia fija a lo largo de un eje representa la
misma cantidad en cualquier parte del eje; esto es cierto tanto en el eje de las X como en el eje
de las Y. En la figura 4.3, por ejemplo, el espacio entre las marcas que se encuentran el el eje de
la Y representa un aumento de 100.000 (100 x 1.000) casos en cualquier punto a lo largo del
eje.
Figura 4.3. Ejemplo de gráfica en escala artimética: Sarampión (rubeola) por año de notificación,
Estados Unidos, 1950-1989.
1.000
900
800
Casos X 100.000 hab.
700 Introducción de
la vacuna
600
500
400
300
200
100
0
1950 1955 1960 1965 1970 1975 1980 1985 1990
Fuente: 12
218
Se puede mostrar varias series de datos en la misma gráfica de escala aritmética. En la figura 4.4,
una línea representa el descenso de la rabia en animales domésticos desde 1955 mientras que
otra línea representa el aumento simultáneo de la rabia en animales silvestres. Una tercera línea
representa el total.
Figura 4.4. Ejemplo de gráfica en escala artimética: rabia, en animales silvestres y domésticos por año
de notificación, Puerto Rico, Estados Unidos, 1955-1989.
9.000 Total
Doméstica
8.000
Silvestre
7.000
6.000
Casos
5.000
4.000
3.000
2.000
1.000
0
1955 1960 1965 1970 1975 1980 1985 1990
Años
Fuente 12
La escala que usemos en el eje de las X depende de los intervalos que hayamos usado para la
variable independiente al recolectar los datos. Generalmente, graficamos los datos de tiempo
en las misma unidades que usamos para recolectarlos, es decir, semanal, anual, etc. Si hemos
usado intervalos muy pequeños para recolectar los datos, fácilmente podemos condensarlos en
intervalos mayores para poder mostrar los datos gráficamente.
Para seleccionar una escala para el eje Y, es necesario:
* Construir el eje de las Y más corto que el eje de las X, para que la gráfica quede
horizontal (es decir, la longitud horizontal debe ser mayor que la longitud vertical)
y mantener una buena proporción entre los dos ejes: en general, se recomienda una
relación X:Y de 5:3.
* Empezar el eje de las Y siempre con 0
* Identificar el rango de valores que desea mostrar en el eje de las Y, para lo cual encuentre
el valor mayor de la variable Y y apxoxímelo al número inmediato mayor. Por ejemplo,
el valor mayor de la figura 4.3 es 763.094 en 1958. Este valor se puede redondear a
1000.000 para determinar el rango de valores a mostrar en el eje de las Y.
* Seleccionar un tamaño de intervalo que nos dé suficientes intervalos para mostrar los
datos con el detalle que se requiere. En la figura 4.3, los intervalos de 100.000 cada
uno se consideran adecuados para mostrar los detalles importantes de los datos.
219
* Si el rango de valores para mostrar el eje de las Y incluye un período o fracción sin
datos, se debe anotar una interrupción en el eje correspondiente. Con una interrupción
en el eje de las Y, la línea se interrumpe también en donde la interrupción empieza y se
reanuda donde los datos continúan. Las interrupciones de los ejes sólo se pueden usar
con gráficas de escala lineal.
220
Ejercicio 4.3
En ambas gráficas, asegúrese de usar los intervalos adecuados para el rango de los datos en el
eje de las Y. El papel para gráficas se encuentra en el anexo D.
a. Construya una gráfica lineal en escala aritmética con los datos del sarampión del cuadro 4.11,
mostrando la tasa de 1955-1990 con una sola línea.
b. Construya una gráfica lineal en escala aritmética con los datos del sarampión de 1980-1990.
Cuadro 4.11. Tasas de sarampión (rubeola) por 100.000 habitantes por año de notificación, Estados Unidos,
1955-1990.
Año Ta s a Año Ta s a Año Ta s a
1955 336,3 1967 31,7 1979 6,2

1956 364,1 1968 11,1 1980 6,0
1957 283,4 1969 12,8 1981 1,4
1958 438,2 1970 23,2 1982 0,7
1959 229,3 1971 36,5 1983 0,6
1960 246,3 1972 15,5 1984 1,1
1961 231,6 1973 12,7 1985 1,2
1962 259,0 1974 10,5 1986 2,6
1963 240,2 1975 11,4 1987 1,5
1964 239,4 1976 19,2 1988 1,4
1965 135,1 1977 26,5 1986 7,3
1966 104,2 1978 12,3 1990 10,7
Fuente: 12
Respuesta en la página 272
221
Gráficas lineales en escala semilogarítmica

En una gráfica lineal en escala semilogarítmica (una gráfica semilog), las divisiones del eje de
las Y siguen un patrón logarítmico en vez de aritmético como en las gráficas lineales en escala
aritmética. El eje de las X sigue teniendo una escala aritmética, como las gráficas lineales de
escala aritmética.
La figura 4.5 muestra un ejemplo de una gráfica semilogarítmica. Fíjese que el eje de las Y tiene
las siguientes características:
* Hay cinco ciclos, de distancias iguales, a lo largo del eje.
* Cada ciclo representa un orden de magnitud mayor que el inmediatamente anterior,

es decir, los valores de cada ciclo son diez veces más grandes que los del ciclo que
lo precede. Notese, por ejemplo, que los valores del cuarto ciclo van de 1 a 10 y en
el quinto son de 10 a 100 pero las distancias en la escala son la misma.
* Dentro de un ciclo hay diez marcas, siendo el espacio entre cada dos marcas cada vez
más pequeño al ir subiendo en la escala. Así, la distancia entre 1 y 2 no es la misma
que la distancia entre 2 y 3.
* El eje cubre un rango de valores de Y que hubiese sido difícil o imposible mostrarlo
en una escala aritmética. Las gráficas semilog son útiles cuando se quiere mostrar
un rango muy amplio de valores en una sola gráfica.
Figura 4.5. Ejemplo de gráfica semilogarítmica: casos notificados de poliomielitis paralítica por 100.000
habitantes por año de ocurrencia, Estados Unidos, 1951-1989.
Fuente: 12
222
Con una escala logarítmica, cierta distancia en el eje de las Y representa un porcentaje igual de
cambio, no una cantidad igual de cambio como en una escala aritmética. Por eso, una gráfica
semilog es especialmente útil para mostrar tasas de cambio. Para interpretar los datos en una
gráfica semilog, hay que entender las siguientes características de la gráfica:
* Una línea recta inclinada indica una tasa (no cantidad) constante de aumento o
disminución de los valores.
* Una línea horizontal indica que no hay cambio.
* La cantidad de inclinación indica la tasa de aumento o disminución.
* Dos o más líneas paralelas muestran tasas de cambio iguales.
Cuando se construye una gráfica semilog, se usa el número de ciclos necesarios para mostrar los
valores máximos y mínimos de la variable Y. Se puede adquirir papel gráfico semilogarítmico
que, en general, incluye por lo menos tres ciclos. Para hallar el número de ciclos que se necesita,
es preciso:
1. Identificar en qué rango de múltiplos de 10 se encuentra el valor mínimo de Y. Así se establece

el rango del primer ciclo.
Por ejemplo, si el valor mínimo de Y es entre 10 y 100, el primer ciclo comenzará con 10 y
terminará con 100; si está entre 100 y 1.000, el primer ciclo comenzará con 100 y terminará
con 1.000.
2. Identificar en qué rango de múltiplos de diez se encuentra el valor máximo de Y. Así se
establece el rango del último ciclo.
Por ejemplo, si el valor máximo de Y es entre 100.000 y 200.000, el último ciclo empezará
con 100.000. Aunque un ciclo completo que comienza con 100.000 debe terminar con
1.000.000, no es necesario mostrar todo el ciclo; es suficiente con mostrar algunos marcadores
del último ciclo: 100.000, 200.000 y 300.000.
3. Identifique cuántos ciclos estan entre el primero y el último de sus ciclos. Necesitará ese
número de ciclos, más otros dos que incluyan el primero y el último ciclo.
De tal manera que si el valor mínimo de Y es 47 y el valor máximo de Y es 134.826, se
necesitarán los siguientes ciclos:
10 - 100
100 - 1.000
1.000 - 10.000
10.000 - 100.000
100.000 - 1000.000
Por tanto, con los valores de Y en un rango de 47 a 134.826, necesita cuatro ciclos y parte
del quinto.
223
La figura 4.6 muestra los rangos de los valores que se deben mostrar en el eje de las Y de cuatro
ciclos de una gráfica semilogarítmica.
El tipo de gráfica que se usa depende principalmente de si se quiere mostrar los cambios de una
serie de valores o si se quiere enfatizar las tasas de cambio. Para mostrar los cambios en una
serie de datos se usa una escala aritmética en el eje de las Y (una gráfica lineal de escala aritmética).
Para mostrar las tasas de cambio se usa una escala logarítmica en el eje de las Y (una gráfica
lineal de escala semilogarítmica). Sin embargo, se puede decidir usar una gráfica semilogarítmica
cuando el rango de valores en el eje de las Y es demasiado grande aún para mostrar cambios en
la serie de datos.
Figura 4.6. Se pueden asignar valores posibles a valores del eje de las Y en una gráfica en escala
semilogarítmica.
Valores posibles
20 2.000 20.000 200.000
10 1.000 10.000 100.000 Máximo
8 800 8.000 80.000
6 600 6.000 60.000
5 500 5.000 50.000
4 400 4.000 40.000
3 300 3.000 30.000
2 200 2.000 20.000
1,0 100 1.000 10.000
-8 80 800 8.000
Cuatro ciclos
-6 60 600 6.000
-5 50 500 5.000
-4 40 400 4.000
-3 30 300 3.000
-2 20 200 2.000
0,1 10 100 1.000
-0,8 8 80 800
-0,6 6 60 60
-0,5 5 50 500 Mínimo
-0,4 4 40 400
-0,3 3 30 300
-0,2 2 20 200
0,01 1,0 10 100
0,008 -8 8 80
0,006 -6 6 60
0,005 -5 5 50
0,004 -4 4 40
0,003 -4 4 30
0,003 -3 3 30
0,002 -2 2 20 1950 Año 1990
0,001 0,1 1 10
Fuente: 9
224
Ejercicio 4.4
Grafique los datos de sarampión del cuadro 4.11, de la página 231, en escala semilogarítmica.
225
Histogramas
Un histograma es la gráfica de la distribución de frecuencias de una variable continua, en la cual
se usan columnas adyacentes para representar el número de observaciones para cada intervalo
de clase en la distribución. El área de cada columna es proporcional al número de observaciones
en este intervalo.
Las figuras 4.7, 4.8 y 4.9 muestran los histogramas de unas distribuciones de frecuencia con
intervalos de clase iguales. Dado que el tamaño de todos los intervalos de clase es igual, la altura
de la columna es proporcional al número de observaciones. No se recomienda usar histogramas
con intervalos de clase de tamaños diferentes, porque son difíciles de construir e interpretar
con seguridad. Tampoco se debe interrumpir la escala en el eje de las Y, porque distorsionaría la
presentación de las frecuencias relativas.
La variable mostrada con más frecuencia en el eje de las X es el tiempo, como se muestra en las
figuras 4.7 y 4.8. Sin embargo, se pueden usar otras variables contínuas, como el colesterol o la
presión arterial en el eje de las X. La figura 4.8 muestra la frecuencia de las observaciones por
intervalos de clase del nivel de colesterol.
Figura 4.7. Ejemplo de un histograma: casos notificados de poliomielitis paralítica por mes de ocurrencia,
Omán, enero de 1988 a marzo de 1989.
30
= 1 caso
25
Áreas en cada Campañas de vacunación

cuadrado son oral contra el polio
20 idénticas
15
Casos
10
No hay espacio
entre las columnas
5 No es esencial mostrar
las líneas horizontales entre
los casos
0
Ene Mar May Jul Sep Nov Ene Mar
1988 1989
226
Se puede mostrar una segunda variable en un histograma sombreando la segunda variable con
un color diferente dentro de la misma columna. Por ejemplo, se puede mostrar el número de
casos de una enfermedad por el tamaño de cada columna y la consecuencia de la enfermedad
(fatal o no fatal) con diferentes colores. Sin embargo, cuando se muestran los datos de esta forma
es difícil comparar el componente de arriba de una columna con otra porque no tiene una base
plana. Una alternativa es crear un histograma separado por cada componente de la segunda
variable, como se ve en la figura 4.9.
Figura 4.8. Ejemplo de histograma: niveles de colesterol entre 4.462 individuos del Estudio de Salud de
Varones, Estados Unidos, 1985-1986.
900
800
700
Número de hombres
600
500
400
300
200
100
Nivel de colesterol (mg/dl)
Fuente: 13
Figura 4.9. Ejemplo de histograma: número de casos notificados de hepatitis A por fecha de inicio y
residencia en el municipio de Ogemaw, abril a mayo de 1968.
14
12
Residente Ogemaw
10 Residente municipio vecino
8 Residente otros municipios
Casos
6
4
2
0
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Fecha de inicio (intervalos de 2 días)
Fuente :22
227
Compare las figuras 4.9 y 4.10; muestran los mismos datos pero en formatos diferentes. ¿Cúal es
el mejor formato para la comparación de los patrones de casos entre residentes y no residentes?
Figura 4.10. Ejemplo de histograma: número de casos notificados de hepatitis A por fecha de inicio y
residencia en el municipio de Ogemaw, abril a mayo de 1968.
14
Residente Ogemaw
12
1 caso
10
Casos
6
4
2
0
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 2 4 6 8 10 12 14 16 18
Abril Mayo
Residente municipio vecino

6 Personas fuera de Ogemaw Residentes otros municipios
Casos
2
0
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 2 4 6 8 10 12 14 16 18
Fecha de inicio (intervalo de 2 días)
Fuente: 22
A veces, se puede incluir una clave para mostrar cuántos valores de Y hay en un área de la
columna. La clave consiste en un cuadro o rectángulo, tan ancho como la columna, con el
número de casos representado por el área escrita al lado.
Con frecuencia los epidemiólogos desarrollan y discuten "curvas epidémicas". Una curva
epidémica no es una curva, sino un histograma que muestra los casos de una enfermedad
durante un brote, por su fecha de inicio. Con frecuencia se dibujan las columnas como un
cuadrado apilado en las columnas, en el que cada cuadro representa un caso. La figura 4.9
muestra que una persona tuvo su fecha de inicio de síntomas entre el 27 y 28 de abril, otra mas
inició entre el 29 y 30 y cinco casos adicionales iniciaron entre el 1º y 2 de mayo. Mostramos la
duración de la epidemia en el eje de las X en períodos de tiempo equivalentes. En una curva
epidémica, cada número de las etiquetas debe estar centrado entre las marcas de cada intervalo.
Empleamos el intervalo de tiempo que sea adecuado al caso: por ejemplo, para un brote de
gastroenteritis por Clostridrium perfringens sería de horas y de 3 a 5 días para un brote de
hepatitis A. Como regla general utilizamos intervalos menores a un cuarto del período de
incubación de la enfermedad que se muestra en el histograma. Empezamos a graficar el eje de
las X antes de que hubiese ocurrido el primer caso y mostramos cualquier caso de la misma
enfermedad que hubiese ocurrido en el período pre-epidémico. Tales casos pueden representar
los mismos casos de fondo o sin relación alguna. ¡Tenga presente que pueden ser la fuente del
brote!
228
Ejercicio 4.5
Utilice los datos de la epidemia en el asilo del ejercicio 4.1 (ver página 213) para dibujar una
curva epidémica. Describa las características de esta gráfica como si estuviera hablando por
teléfono con alguien que no puede verla.
229
Polígonos de frecuencia
Un polígono de frecuencia, como un histograma, es una gráfica de distribución de frecuencias,
en el cual se traza el número de observaciones contra los intervalos del eje de las X con puntos
individuales en la mitad de los intervalos y luego se conectan los puntos con una línea recta. La
figura 4.11 muestra un ejemplo de un polígono de frecuencia sobre la línea externa de un
histograma de los mismos datos. De rutina, no se deben mostrar los dos en una sola gráfica.
Compare su construcción. Un polígono de frecuencia de una serie de datos debe incluir la
misma área que un histograma con los mismos datos. Los polígonos de frecuencia ayudan a
mostrar y comparar dos o más distribuciones en la misma serie de ejes.
Figura 4.11. Casos notificados de enfermedad semejante a influenza por inicio.
15
Histograma
Polígono de frecuencia
10
Casos
Se conectan los puntos

medios de los intervalos
5 para crear al polígono
0
1 2 3 4 5 6 7 8 9
Semana de inicio de la enfermedad
Primer punto del dato
Último punto del dato
conectado al punto
conectado al punto medio
medio del intervalo
del intervalo siguiente del
previo del eje de las X
eje de las X
Fíjese que el histograma y el polígono de frecuencia (la medida que se mueve de punto medio
a punto medio) crean una serie de pares de triángulos de tamaños iguales (uno dentro del
histograma y el otro afuera), lo cual es una característica importante de un polígono de frecuencias
debe cubrir la misma área que un histograma para los mismos datos: para cada área que queda
afuera del histograma, el polígono tiene que incluir otra área de tamaño igual.
Para mantener un área total igual, hay que fijarse bien en la manera de "cerrar" el histograma.
La figura 4.12a muestra el método correcto y la figura 4.12b el método incorrecto. Al hacerlo
correctamente, la línea de frecuencia empieza antes del primer intervalo (en el centro de éste),
fuera del histograma y continúa con el centro del primer intervalo que contiene datos, creando
un área A dentro del polígono que tiene el mismo tamaño que el área A que está dentro del
histograma pero fuera del polígono. Fíjese que en la figura 4.11, se cierra el lado derecho del
polígono de la misma forma.
230
Por el contrario, la figura 4.12b muestra el método incorrecto de cerrar el polígono. Se empieza
la línea en la base del primer intervalo, dejando el área C fuera del polígono, sin compensarla
con otra área dentro; como consecuencia, el área del polígono no es proporcional al número
total de observaciones en la serie de datos.
Figura 4.12a y 4.12b. Método coreecto para cerrar el polígono correctamente al lado derecho y método
incorrecto para cerrar un polígono al lado izquierdo.
10 10
B
8 8
6 6
4 B 4
A 2 C
2
A 0
0
25 30 35 25 30 35
A. Corecto B. Incorrecto
Con un polígono de frecuencia, es fácil mostrar una comparación de dos o más distribuciones
en los mismos ejes. La figura 4.13 muestra una gráfica de una comparación de tres polígonos de
frecuencia con la curva normal.
Figura 4.13. Antropometría de niños de dos a cuatro años de edad de Haití comparados con la población
de referencia de los CDC/OMS, departamentos septentrionales de Haití, 1990.
25 Población de referencia
Peso para la talla
Talla para la edad
Peso para la edad
20
15
Porcentaje
10
0
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 6 7
Puntuación de Z de referencia
231
Un polígono de frecuencia difiere de una gráfica lineal de escala aritmética en varias cosas. Se
usa un polígono de frecuencia (o histograma) para mostrar toda la distribución de frecuencia de
una variable continua; se usa una gráfica lineal de escala aritmética para mostrar una serie de
puntos de observaciones (números absolutos o tasas), usualmente a través del tiempo. Un polígono
de frecuencias debe cerrarse en ambos extremos porque el área por debajo de la curva es
representativa de los datos; una gráfica lineal de escala aritmética muestra solamente los puntos
que representan los datos.
Curvas de frecuencia acumulada y supervivencia

Como su nombre lo indica, una curva de frecuencia acumulada grafica la frecuencia acumulada
en vez de la frecuencia individual para cada intervalo de clase de una variable. La figura 4.14
muestra una gráfiica con cuatro curvas de frecuencia acumulada. Se usa este tipo de gráficas
para identificar medias, cuartiles y porcentajes. El eje de las X registra los intervalos de clase y el
eje de las Y muestra la frecuencia acumulada o una escala absoluta (por ejemplo, el número de
casos) o el porcentaje. Se grafica cada frecuencia acumulada en el límite superior del intervalo
que aplica, en vez del punto medio. Esta práctica permite que la gráfica represente visualmente
el número o porcentaje de observaciones por encima o por debajo de un valor particular.
Figura 4.14. Incidencia acumulada de infección por virus de hepatitis B por duración de conducta de
alto riesgo.
100
Usuarios de drogas IV
80
% infectado con VHB
Hombres homosexuales
60
40
Trabajadores de la salud
en contacto frecuente con sangre
20
Heterosexuales con
múltiples parejas
0
0 5 10 15
Años a riesgo
Fuente: 1, 17, 19, 23
Se usa una curva de supervivencia en los estudios de seguimiento, para mostrar la proporción
de uno o más grupos que estén todavía vivos (o libres de la condición de interés) en períodos
diferentes a lo largo del tiempo. De forma similar a la curva de frecuencia acumulada, el eje de
las X registra períodos de tiempo y el eje de las Y muestra porcentajes de cero a cien de los que
aún viven. La diferencia más sobresaliente entre las dos curvas es su forma misma: mientras la
curva de frecuencia acumulada empieza en cero y en la parte más baja de la esquina izquierda
de la gráfica y va hacia cien en la esquina superior derecha, una curva de supervivencia empieza
en cien por ciento en la esquina superior izquierda y va disminuyendo hacia la esquina inferior
derecha en la medida que los pacientes van muriendo o sufriendo la condición bajo estudio).
232
La curva de supervivencia de la figura 4.15 compara el porcentaje de sobrevivientes entre los

pacientes que padecían de enfermedad arterial periférica (EAP) y aquéllos que no. ¿Cuál grupo
tiene el porcentaje de supervivencia más alto? Para el décimo año, la experiencia de
supervivencia para los pacientes sin EAP era sustancialmente mejor que para aquéllos con EAP.
Figura 4.15. Curvas de supervivencia de una cohorte de pacientes con enfermedad arterial periférica
(EAP) (n=482) y sin EAP (n=262), Pittsburgh, Pennsylvania, 1977-1985.
100
90
% sobreviviente
80
Sin EAP
70
60
50
Con EAP
40
30
0 1 2 3 4 5 6 7 8 9 10
Diagramas de dispersión (nube de puntos)

Un diagrama de dispersión es una gráfica usada para detectar la relación entre dos variables
continuas representadas una en el eje de las X y la otra en el eje de las Y. Para crear un diagrama
de dispersión, se debe tener una pareja de valores para cada persona, grupo u otra entidad en
nuestra serie de datos, con un valor para cada variable; entonces, se grafica cada par de valores
colocando un punto en la gráfica donde los dos valores se interceptan; la figura 4.16 muestra un
diagrama de dispersión que grafica los niveles séricos de tetraclorodibenzo-p-dioxina (TCDD)
por años de exposición para un grupo de trabajadores.
Para interpretar un diagrama de dispersión, se debe observar el patrón general hecho por los
puntos graficados; un patrón compacto indica un alto grado de correlación; puntos muy dispersos
indican una pequeña correlación. Si se requiere una medida cuantitativa más exacta de la
relación entre las variables en un diagrama de dispersión, se puede usar un método de estadística
como una regresión lineal. Estos métodos no están incluidos en este curso.
233
Figura 4.16. Ejemplo de gráfico de dispersión: niveles séricos de tetra-cloro-dibenzo-p-dioxina (TCDD)

ajustado por lípidos y años de exposición de 253 trabajadores de 12 plantas químicas de los Estados
Unidos, 1987.
10.000
TCDD mg X g de
1.000
100
10
0
0,0005 0,005 0,05 0,5 1,0 5,0 50,0
Años de exposición
Fuente: 16
234
Gráficas
Estas gráficas ilustran información estadística usando una sola coordenada; son más apropiadas
para comparar las magnitudes de diferentes categorías de un total, pero tienen muchos otros
usos.
Gráficas de barra
La gráfica de barra más simple es usada para mostrar visualmente los datos de un cuadro de una
sola variable (vea página 207). Cada valor o categoría de una variable es representado por una
barra; la longitud de la barra es proporcional al número de personas o eventos en esta categoría;
la figura 4.17, muestra el número de muertes infantiles por causa en los Estados Unidos. La
presentaciónde los datos hace más fácil la comparación del tamaño relativo de las diferentes
causas y permite ver que los defectos congénitos son la causa más frecuente de mortalidad
infantil.
Figura 4.17. Ejemplo de gráfica de barras horizontales: número de muertes infantiles por causas
principales, Estados Unidos, 1983.
Defectos congénitos
Bajo peso/Prematurez/Síndrome de dificultad respiratoria
Muerte súbita
Hipoxia intrauterina/Asfixia neonatal
Lesiones no intencionales
Infecciones perinatales
Complicaciones de placenta/membranas/cordón
Neumonía e influenza
Complicaciones maternas Total: 34.566
0 2.000 4.000 6.000 8.000
Fuente: 6
Las variables que se muestran en una gráfica de barra pueden ser discretas y no continuas (por
ejemplo, raza o género) o se las trata como si fueran discretas y no continuas (por ejemplo,
grupos de edad en vez de intervalos de edad en el eje).
Se pueden presentar las barras en forma horizontal o vertical. La longitud o el tamaño de cada
barra es proporcional a la frecuencia del evento en esta categoría. Por tal razón, no se debe
graficar una interrupción en el eje cuando se usa una gráfica de este tipo porque puede dar
lugar a malas interpretaciones cuando se compara la magnitud de diferentes categorías.
Una gráfica de barras verticales difiere de un histograma en que las barras de la primera son
separadas, mientras que las barras del segundo son unidas; ésta distinción existe porque en un
histograma se muestra la distribución de una variable contínua en el eje de las X (por ejemplo,
colesterol sérico, edad) mientras que, en una gráfica de barras, se muestra en éste eje una
variable discreta (género o raza).
235
Gráficas de barras agrupadas

Las gráficas de barras agrupadas se usan para ilustrar los datos de cuadros de dos o tres variables,
cuando una variable tiene únicamente dos categorías; las barras en un grupo están generalmente
unidas; éstas deben ilustrarse de manera distinta y describirse en una nota a pie
de página; es mejor limitar el número de barras en un grupo a no más de tres; como se muestra
en la figura 4.18, es difícil interpretar los datos cuando hay muchas barras.
Figura 4.18. Causas básicas de defunción entre menores de un año por grupos raciales/étnicos, Estados
Unidos, 1983.
20
Definición X 1.000
15
10
0
Negros Índios Latinos Asíaticos Blancos Total
americanos Raza/Etnia
Defectos Bajo peso/prematurez S. Muerte súbita Otros
congénitos Dificultad respiratoria
Fuente: 6
La gráfica de barras en la figura 4.19 representa tres variables: edad, género y hábito de fumar
en la actualidad. El hábito de fumar es la variable dependiente y tiene dos categorías: sí o no.
Las barras representan las 10 categorías de edad-género. La altura de cada barra es proporcional
al porcentaje de fumadores actuales en cada categoría de edad-género.
Figura 4.19. Ejemplo de gráfica de barras verticales con anotación: porcentaje de adultos que fuman
cigarrillos actualmente (personas de 18 años que han fumado alguna vez en su vida, al menos, cien
cigarrillos y que actualmente fuman) por edad y género, Estados Unidos, 1988.
Hombres Mujeres
Una celda separada

40 por un espacio
El significado de cada barra
Una celda es mostrado en una leyenda
30
% Una celda puede

20 tener más de una barra
10
0
16 - 24 25 - 44 45 - 64 65 - 74 >75
Grupo de edad (años)
Fuente: 10
236
Gráficas de barras apiladas

Es posible también mostrar categorías de una segunda variable como componentes de la barra
que representan la primera variable, como en la figura 4.20. Estas barras pueden ser difíciles de
interpretar porque, excepto por el componente de la base, los componentes no están sobre la
misma línea de base.
Unidos, 1983.
Otras
20
S. de muerte súbita
Prematurez/Bajo peso/S. de dificultad respiratoria
Defectos congénitas
Def. X 1.000 nrv
15
10
0
Raza/Etnia
Fuente. 6
Gráficas de barras de desviación

También se pueden usar barras para mostrar desviaciones tanto positivas como negativas,en
una variable, desde la línea de base. La figura 4.21, muestra una gráfica de barras de desviación
para algunas enfermedades de notificación obligatoria en los Estados Unidos, se utiliza una
gráfica similar en el Informe Semanal de Morbilidad y Mortalidad (MMWR) del CDC. En esta
gráfica, se compara el número de casos de las cuatro semanas anteriores con los informados en
periodos comparables de los años anteriores. La desviación a la derecha para la rubeóla indica
un aumento por encima de los niveles históricos; las desviaciones a la izquierda indican una
Figura 4.21. Enfermedades de notificación, comparaciones de períodos epidemiológicos (4 semanas)

que terminaron el 26 de enero de 1991 con datos históricos, Estados Unidos, 1991.
Casos 4semanas
Enfermedad Decremento Incremento Actuales
Meningitis aséptica 282
Encefalitis primaria 24
Hepatitis A 1.172
Hepatitis B 749
Hepatitis no A y B 155
Hepatitis sin especificar 44
Legionelosis 57
Malaria 39
sarampíon 167
Infecciones meningocócicas 98
Parotiditis 149
Tosferina 93
Rabia animal 176
Rubéola 36
0,125 0,25 0,5 1 2 4 Por fuera de los
Razón en escala log límites históricos
237
reducción en comparación con niveles anteriores. En esta gráfica en particular, el eje de las X
tiene una escala logarítmica, que significa que una reducción o un aumento del 50% serán
representados por barras de la misma longitud, pero en direcciones diferentes. Se resaltan los
valores más allá de los límites históricos (que son equivalentes a intervalos de confianza del
95%).
Gráficas de barra de componente del 100%

Como variante de las barras apiladas, es posible construir todas las barras de la misma altura y
mostrar los componentes como un porcentaje del total en vez de mostrar sus valores reales; este
tipo de gráfica es útil para comparar la contribución de los diferentes componentes de cada
categoría de la variable principal. La figura 4.22 muestra una gráfica de componente 100%;
fíjese que no es útil para comparar el tamaño relativo de varias categorías de la variable principal;
únicamente los totales dados arriba de las barras indican que las categorías difieren en tamaño.
Unidos, 1983.
Otras
S. de muerte súbita
Prematurez/Bajo peso/S. de dificultad respiratorias
Defectos congenitos
9.261 434 2.381 725 21.590 34.391
100
60
% de la distribución
80
40
20
0
americanos
Raza/Etnia
Fuente: 6
Como construir una gráfica de barras

Para construir una gráfica de barras siga las siguientes instrucciones:
* Organice las categorías que definen las barras o grupo de barras en orden, ya sea
alfabético, por edad o en un orden que produzca barras de altura que aumenten o
disminuyan.
* Elija la posición de las barras (horizontal o vertical) como prefiera, excepto en las
barras de desviación que usualmente son horizontales.
238
* Haga todas las barras del mismo ancho.

* Establezca la longitud de las barras en proporción con la frecuencia del evento; no rompa la
escala para no distorsionar la comparación del tamaño de las diferentes categorías.
* No muestre más de tres barras en un grupo de barras.
* Deje espacios entre los grupos de barras adyacentes, pero no entre las barras de un
grupo.
* Codifique las variables por diferentes colores, matices, etc , e incluya la leyenda que permita
interpretar esta convención.
239
Ejercicio 4.6
Utilice los datos del cuadro 4.12 para dibujar una gráfica de barras apiladas, otra de barras
agrupadas y otra más de barras componentes de 100% para ilustrar la distribución por grupo de
edad de los casos de sífilis primaria, entre hombres y mujeres, blancos y negros en los Estados
Unidos. ¿Qué información es presentada mejor por cada tipo de gráfica?
Cuadro 4.12. Número de casos de sífilis primarias y secundarias por edad, género y raza, Estados
Unidos, 1989.
Grupos de Blanca Negra

edad (Años) Masculinos Femeninos Masculinos Femeninos To t a l
<20 90 267 1.443 2.422 4.222

20-29 957 908 8.180 8.093 18.138
30-39 931 478 6.893 3.676 11.978
≥40 826 160 3.860 941 5.787
To t a l 2.804 1.813 20.376 15.132 40.125
Fuente: 12
Respuesta en las páginas 274-276
240
Gráficas de pasteles
Una gráfica de pastel es simple, fácil de entender, ya que el tamaño de las pedazos es proporcional
a la contribución de cada componente; los pasteles son útiles para mostrar los componentes de
un solo grupo o variable.
Para hacer un pastel, hay que dibujar un círculo, después empezar en las 12 del reloj y organizar
los componentes desde el más grande hasta el más pequeño en el sentido de las manecillas del
reloj, generalmente se ponen las categorías de "otro" y "desconocido" al final. Se pueden usar
diferentes matices para distinguir entre los pedazos; hay que mostrar, en alguna parte de la
gráfica, los porcentajes representados por cada pedazo porque no es fácil identificarlos a simple
vista.
No se recomienda el uso de múltiples pasteles, como los de la figura 4.23 para comparar los
mismos componentes en más de un grupo de variables, porque la comparación es difícil; cuando
se quiere comparar los componentes de más de un grupo o variable, hay que usar una gráfica
de barras de componente del 100%.
Figura 4.23. Tipo de muerte traumática entre trabajadores, según género, Estados Unidos, 1980-1985.
3,2% 5,9%
3,1% 5,4%
11,6%
47,5%
41,2%
82,1%
Masculinos= 6.573 Femeninos= 427
Lesiones no intencionales
Homicidio
Suicidio
Otros
Fuente: 11
Mapas (gráficas con coordenadas geográficas)

Los mapas o las gráficas con coordenadas geográficas son usados para mostrar la localización de
eventos o atributos. Los mapas de puntos y los mapas de área son ejemplos comúnmente usados
por este tipo de gráficas. Los mapas de puntos usan cualquier símbolo para mostrar donde
ocurre un evento o existe la enfermedad. La figura 4.24 es un ejemplo de un mapa de puntos.
Para hacer un mapa de puntos, se coloca un símbolo en el sitio en donde el evento ocurríó o
existía la condición. Si los eventos están agrupados en una localización, puede ser difícil distinguir
entre puntos, entonces, es posible utilizar símbolos codificados (es decir, • = 1 caso, n= 2
casos, = 3 casos etc.) que indican la ocurrencia de más de un evento.
Un mapa de puntos es útil para mostrar la distribución geográfica de un evento pero como es
difícil la consideración del tamaño de la población no se muestra el riesgo de la ocurrencia del
evento en este sitio en particular. Aún cuando un mapa de puntos muestre un gran número de
241
símbolos en la misma área, el riesgo de adquirir la enfermedad puede no ser importante si el

área está densamente poblada. Un mapa usa áreas colocadas o codificadas para mostrar la
incidencia del evento en partes de ésta o la distribución de alguna condición en una región
geográfica.
Figura 4.24. Ejemplo de un mapa de puntos: casos de histoplasmosis por lugar de residencia, Austin,
Minnesota, octubre a noviembre de 1984.
Río Cedro
Noroeste
C
Noroeste
Calle Oakland B
Suroeste A Sureste
A - Aviario
B - Alberca Ciudad de Austin
C - Camino a la planta de carnes
Límites de la ciudad
Cuadrante
Ríos y arroyos
Vivienda caso índice
Fuente: CDC, datos sin publicar, 1985.
Se pueden mostrar las tasas o la distribución en un mapa de área. Figura 4.25; como con el mapa
de puntos, no se muestra el riesgo de un individuo de adquirir el evento; sin embargo, si se
muestran las tasas en un mapa de área, se puede ilustrar las diferencias en el riesgo de presentar
un evento en cada área.
La figura 4.25 muestra el número de casos de encefalitis de San Luis, en los diferentes condados
de Florida según municipio en 1990. Como sucede en un mapa de puntos, no se puede relacionar
con la población en riesgo. Cuando se usan tasas, se debe calcular la tasa especifica, para cada
área, es decir, hay que dividir el número de casos en cada área por la población en riesgo en
esta misma.
242
Figura 4.25. Casos sospechosos y confirmados de encefalitis de San Luis por municipio de residencia,
Florida, julio a octubre de 1990.
Lake
No presentaron casos Marion Orange
1 - 5 casos Polk
Brevard
6 - 10 casos
Hillsborough
> 10 casos Indian river
Manatee St. Lucie
Martin
Hardee
Palm Beach
Higlands
Broward
Hendry
Fuente: 7
243
Ejercicio 4.7
Utilizando los datos de mortalidad por cáncer cervicouterino del cuadro 4.9 en la página 221,
construya dos mapas de área basados en las dos primeras estrategias para categorizar los datos
en cuatro intervalos de clase como se describe en las páginas 219-223.
<
244
Diagramas de puntos y de caja y bigote

Un diagrama de puntos es similar a una gráfica de dispersión porque confronta una variable
contra otra; sin embargo, en un diagrama de puntos, la variable del eje de las X no es continua,
sino que representa las categorías discretas de una variable no continua. Como se muestra en la
figura 4.26, para ubicar una observación, hay que poner un punto sobre la categoría apropiada
de las X al nivel apropiado de las Y; hay que mostrar tantos puntos en esta posición como el
número de observaciones con los mismos valores. Notese que en la figura 4.26 las diferentes
posiciones verticales de los 12 puntos en la intersección de expuestos y 40 no indican los
niveles de los títulos: todos tienen niveles de títulos de 40. Los puntos se colocan en diferentes
líneas para facilitar el mostrarlos como una unidad. De forma similar los 25 puntos de no
expuestos todos representan un nivel de títulos de <10.
Figura 4.26. Ejemplo de diagrama de puntos: resultados de anticuerpos (Ac) inhibidores de la

hemaglutinación (IH) contra el virus de la influenza porcina (VIP) entre ganaderos asistentes a una
feria, expuestos y no expuestos, Wisconsin, 1988.
150 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
80 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
40 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
Ac IH VIP
20 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
10 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
< 10 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
No expuestos Expuestos
Fuente: 26
Se usa un diagrama de puntos para hacer una comparación visual de los puntos reales de los
datos de dos variables no continuas. Para comparar las distribuciones de dos variables no continuas
se usa un diagrama o gráfica de caja, también llamado de cajas y bigotes. Como se muestra en
la figura 4.27; la "caja" representa el 50% de la mitad o el rango intercuartílico de los datos y los
bigotes se extienden hacia los valores máximos y mínimos. Se marca la posición mediana con
una línea vertical dentro de la caja; así, se puede mostrar (y comparar) el punto central (la
< mediana), la dispersión (los cuartiles) y cualquier tendencia de desviación, como se indica cuando
la línea de la mediana no está centrada en la caja.
245
Figura 4.27. Ejemplo de diagrama de caja y bigotes: resultados de pruebas de ELISA indirecta para
anticuerpos IgG de virus para influenza tipo I en suero de pacientes en fase convaleciente de casos y
controles, Condado de Baltimore, Maryland, enero de 1990.
Fuente: CDC, datos sin publicar, 1990.
246

Unidad 4 Parte 1 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 4 Parte 1 PDF

Cargado por

Copyright:

Formatos disponibles

Manual de Epidemiología - Unidad 4

Organización de los datos epidemiológicos

* Preparar correctamente cuadros con una, dos o tres variables;

* Preparar correctamente gráficas de barras, pasteles, mapas de puntos, mapas de área,

* Describir cuándo se usa cada tipo de cuadro, gráfica y carta.

Introducción a los cuadros, gráficas y cartas

Cuadros de una sola variable

Grupo de edad (años) Número de casos

Grupo de edad Casos

Grupo de edad Casos

≤ 14 230 0,5 0,5

Cuadros de dos o tres variables

Grupo de edad Número de casos por género

Defunciones Vivos To t a l % Fallecidos

Cuadro 4.4. Forma general para un cuadro de 2 x 2.

b. Construya un cuadro 2 x 2 de la enfermedad (diarrea) por exposición al menú A.

Respuestas en la página 269

Número Edad Género Habitación Menú ¿Tuvo diarrea? Fecha de

Cuadro de otras medidas estadísticas

Grupo de edad Tasas por cien mil

£14 0,0 2,4 0,8 0,4

Características clínicas No. con característica Porcentaje

Características demográficas Número Porcentaje

Alternativamente, la tabla de salida 2 se hubiera podido dibujar como un cuadro de 3 variables

Municipio de residencia Número %

Tabla de salida 4: distribución por ingresos.

Ingreso del hogar $ Número %

Tabla de salida 5: número de días de hospitalización.

Número de días de hospitalización Número %

Tabla de salida 6: Distribución de complicaciones graves.

Complicaciones graves Número %

Tabla de salida 7: Distribución de complicaciones graves.

Característica demográfica Casos Controles

Tabla de salida 8: ingresos.

Ingreso del hogar $ Casos Controles

Caractarísticas epidemiológicas Casos Controles

Razón de desigualdades (OR)= ________ Intervalo de confianza del 95%= ( )

Exposición a shampoo de alfombras Si _______ ( ) _______ ( )

Razón de desigualdades (OR)= ________ Intervalo de confianza del 95%= ( )

Enfermedades de Mortalidad por neumonía Tabulaciones finales de VIH/sida

Estrategia 1: dividir los datos en grupos de tamaño similar

Estrategia 2: construir los intervalos basados en la media y la

Si se añade el límite inferior obvio para cada intervalo, éstos serán:

Estrategia 3: dividir el rango entre intervalos de clase iguales

Estrategia 1: dividir los datos en grupos de similar tamaño

2. Identificar la tasa para el primero y el último estado de cada grupo:

Estados Tasas por 100.000

Estados Tasas por 100.000 Número de estados

Estrategia 2: construir los intervalos basados en la media y la

Estados Tasas por 100,000 Número de estados

Estrategia 3: dividir el rango en cuatro intervalos de clase iguales

Estados Tasas por 100.000 Número de estados

Respuestas en la página 270

Rango Estado Tasa por Rango Estado Tasa por

Año Casos notificados Año Casos notificados

Gráficas lineales en escala aritmética

Año Ta s a Año Ta s a Año Ta s a

1955 336,3 1967 31,7 1979 6,2

Respuesta en la página 272

Gráficas lineales en escala semilogarítmica

* Hay cinco ciclos, de distancias iguales, a lo largo del eje.

* Cada ciclo representa un orden de magnitud mayor que el inmediatamente anterior,

1. Identificar en qué rango de múltiplos de 10 se encuentra el valor mínimo de Y. Así se establece

Exposición a shampoo de alfombras Si _ ( ) _ ( )