Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 4
Cuando se recogen más datos de los que se pueden revisar individualmente, se pueden usar
cuadros y gráficas para organizarlos, resumirlos y mostrarlos en forma clara y efectiva. Con
cuadros y gráficas se pueden analizar grupos de datos de unas pocas docenas a varios millones.
Estas herramientas permiten identificar, explorar, entender y presentar distribuciones, tendencias
y relaciones entre los datos. Los cuadros y las gráficas son herramientas esenciales no sólo en la
epidemiología descriptiva y analítica, sino también en la comunicación de los hallazgos de las
investigaciones.
Objetivos
Después de preparar y entender esta lección y de responder a las preguntas de los ejercicios de
este módulo, el estudiante será capaz de:
* Preparar correctamente las siguientes gráficas: una serie lineal en escala aritmética,
una serie lineal en escala semilogarítmica, histogramas, polígonos de frecuencia y
diagramas de dispersión (nube de puntos);
197
Manual de Epidemiología - Unidad 4
198
Manual de Epidemiología - Unidad 4
Cuadros
Un cuadro es la agrupación de datos dispuestos en filas y columnas. En un cuadro se puede
organizar casi cualquier información cuantitativa. Los cuadros son útiles para demostrar patrones,
excepciones a un patrón, diferencias y otras relaciones; además, sirven habitualmente como
base para la preparación de gráficas, que son más visuales pero que pueden perder algunos
detalles.
Los cuadros diseñados para presentar los datos deben ser lo más simple posible; dos o tres
pequeños cuadros, cada uno enfocado en un aspecto diferente de los datos, son más fáciles de
entender que uno solo que contenga muchos datos.
Un cuadro debe entenderse por sí mismo; si utiliza fuera de su contexto original, debe conservar
la información necesaria para que el lector entienda los datos. Para crear un cuadro que se
entienda por si mismo, realice los siguientes pasos:
* Use un título claro y conciso que describa el qué, el cuándo y el dónde de los datos en la
tabla. Inicie el título de la tabla con un número (por ejemplo, tabla 4.1);
* Encabece cada fila y cada columna e incluya las unidades de medida (por ejemplo, años,
mm Hg, mg/dl, tasas por 100.000);
* Muestre los totales de las filas y las columnas. Si se muestran porcentajes, así mismo, hay
que mostrar el total de ellos (siempre 100%);
* Explique cualquier código, abreviatura o símbolo en una nota de pie de página. (Por ejemplo,
Sifilis P&S quiere decir Sifilis primaria y secundaria);
* Anote cualquier exclusión en una nota a pie de página (1 caso y 2 controles con historia
familiar desconocida se incluyeron de este análisis);
* Anote la fuente de los datos en una nota a pie de página, si no son originales.
199
Manual de Epidemiología - Unidad 4
Cuadro 4.1 a. Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989.
£ 14 230
15-19 4.378
20-24 10.405
25-29 9.610
30-34 8.648
35-44 6.901
45-54 2.631
³55 1.278
To t a l 44.081
Fuente: 12
Cuadro 4.1 b. Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989.
£ 14 230 0,5
15-19 4.378 10,0
20-24 10.405 23,6
25-29 9.610 21,8
30-34 8.648 19,6
35-44 6.901 15,7
45-54 2.631 6,0
³55 1,278 2,9
To t a l 44.081 100,0*
*Los porcentajes no suman a 100% debido a que se aproximaron al decimal.
Fuente: 12
Se puede modificar el cuadro de una sola variable para mostrar la frecuencia acumulada o el
porcentaje acumulado, como en el cuadro 4.1c, en el cual es posible ver que 75,5% de los
casos de sífilis primaria y secundaria ocurrieron en los menores de 35 años.
Cuadro 4.1 c. Morbilidad por sífilis primaria y secundaria por edad, Estados Unidos, 1989.
200
Manual de Epidemiología - Unidad 4
£ 14 40 190 230
15-19 1.710 2.668 4.378
20-24 5.120 5.285 10.405
25-29 5.304 4.306 9.610
30-34 5.537 3.111 8.648
35-44 5.004 1897 6901
45-54 2144 487 2631
³55 1.147 131 1.278
To t a l 26.006 18.075 44.081
Fuente: 12
Un cuadro de dos variables con datos tabulados en cruz también se conoce como cuadro
de contingencia. El cuadro 4.3, es un ejemplo de un tipo común de cuadro de contingencia,
que se denomina un cuadro de 2 x 2 porque cada una de las dos variables tiene dos categorías.
Los epidemiólogos usan frecuentemente los cuadros de contingencia para presentar los datos
para calcular las medidas de asociación y las pruebas de significancia estadística.
Cuadro 4.3. Estatus al seguimiento de un grupo de varones blancos con y sin diabetes, estudio de
seguimiento de la encuesta de salud por examen, 1982-84.
Además, los epidemiólogos usan los cuadros de 2 x 2 en estudios de asociación entre la exposición
y la enfermedad. Tales estudios comparan las personas con y sin exposición y las personas con y
sin la enfermedad. Un cuadro de dos por dos es una manera conveniente de organizar los datos
de estos tipos de estudios. El cuadro 4.4 muestra la forma general de este tipo de cuadros. Como
se demuestra, el estado de enfermedad (por ejemplo: enfermo versus sano) es el encabezado
de las dos columnas y las dos filas se etiquetan con el estado de exposición (expuesto o no). Las
letras a, b, c y d dentro de las casillas se refieren al número de personas con la enfermedad
indicada en las columnas y la exposición indicada en las filas. Por ejemplo, en el cuadro 4.4 c es
el número de personas en el estudio que tienen la enfermedad, pero que no tuvieron la
exposición. H en las totales de las filas (H1 y H2) es la abreviatura para horizontal; V en los
totales de las columnas (V1 y V2) es la abreviación de vertical. El número total de las personas se
representa por la letra T (o N).
201
Manual de Epidemiología - Unidad 4
Cuando se muestran los datos, es preferible usar un cuadro de una sola variable o de dos variables.
A veces, se quiere incluir una tercera variable para mostrar los datos en una forma más completa.
El cuadro 4.5 muestra un cuadro de tres variables (raza/etnia, género y edad). Como se puede
ver, un cuadro de tres variables es bastante complejo; está recargado; por lo que no debe
usarse más de tres variables en un solo cuadro.
Cuadro 4.5. Morbilidad por sífilis primaria y secundaria por edad, género y raza, Estados Unidos,1989.
Raza/etnia
Edad (años) Género Blanco Negro Otras To t a l
Masculino 2 31 7 40
£14 Femenino 14 165 11 190
Total 16 196 18 230
Masculino 88 1.412 210 1.710
15-19 Femenino 253 2.257 158 2.668
Total 341 3.669 368 4.378
Masculino 407 4.059 654 5.120
20-24 Femenino 475 4.503 307 5.285
Total 882 8.562 961 10.405
Masculino 550 4.121 633 5.304
25-29 Femenino 433 3.590 283 4.306
Total 983 7.711 916 9.610
Masculino 564 4.453 520 5.537
30-34 Femenino 316 2.628 167 3.111
Total 880 7.081 687 8.648
Masculino 654 3.858 492 5.004
35-44 Femenino 243 1.505 149 1.897
Total 897 5.363 641 6.901
Masculino 323 1.619 202 2.144
45-54 Femenino 55 392 40 487
Total 378 2.011 242 2.631
Masculino 216 823 108 1.147
³55 Femenino 24 92 15 131
Total 240 915 123 1.278
Total de todas Masculino 2.804 20.376 2.826 26.006
las edades Femenino 1813 15.132 1.130 18.075
To t a l 4.617 35.508 3.956 44.081
Fuente: 12
202
Manual de Epidemiología - Unidad 4
Ejercicio 4.1
Los datos del cuadro 4.6, describen las características de 36 residentes de un ancianato durante
un brote de una enfermedad diarreica.
a. Construya un cuadro de enfermedad (diarrea) por tipo de menú ingerido. Utilice el tipo de
diarrea como rótulo de las columnas y los tipos de menú como rótulos de las filas.
203
Manual de Epidemiología - Unidad 4
Cuadro 4.6. Características de los residentes del ancianato A, durante un brote de enfermedad diarreica,
enero de 1989.
7 69 F 109 C No
8 64 F 111 A Sí 16/1
9 66 M 111 A Sí 18/1
10 68 M 104 A Sí 20/1
11 70 M 106 A No
12 86 M 110 A No
13 73 M 112 B No
14 82 M 219 C No
15 72 M 221 C No
16 70 M 221 B No
17 77 M 227 D No
18 80 M 227 D No
19 71 F 231 A Sí 14/1
20 68 F 231 D Sí 15/1
21 64 F 233 A No
22 73 F 235 A Sí 13/1
23 75 F 235 B No
24 78 F 222 C No
25 72 F 222 A No
26 66 M 224 B No
27 69 M 226 A Sí 16/1
28 75 M 228 E No
29 71 M 230 A Sí 13/1
30 83 M 232 F No
31 84 M 232 D No
32 79 M 234 A Sí 12/1
33 72 M 234 D Sí 14/1
34 77 M 236 A Sí 13/1
35 78 M 236 B No
36 80 M 238 D No
204
Manual de Epidemiología - Unidad 4
Cuadro 4.7. Casos nuevos notificados de sífilis primaria y secundaria por cien mil habitantes, tasas
específicas por edad y raza, Estados Unidos, 1989.
Tablas de salida
Aunque no se puede analizar los datos antes de recolectarlos, hay que diseñar los métodos de
análisis que se van a emplear con anticipación para facilitar el análisis cuando ya se hayan
recolectado. De hecho, la mayoría de los protocolos, escritos antes de empezar el estudio,
requieren una descripción de cómo se van a analizar los datos. Como parte del plan de análisis,
se puede desarrollar una tabla de salida para mostrar cómo se van a organizar y presentar los
datos. Un cuadro en blanco es un cuadro, con títulos, encabezamientos y categorías, pero sin
datos; cuando se desarrolla una tabla de salida que contiene variables continuas, como edad,
hay que crear más categorías de las que usualmente se requieren, para poder visualizar cualquier
comportamiento o patrón de los datos que sean de interés.
Tabla de salida 1. Características clínicas del síndrome de Kawasaki con inicio entre octubre y diciembre
de 1984.
1. Fiebre ³5 días -- ( )
2. Congestión conjuntival bilateral -- ( )
3. Cambios orales -- ( )
* Labios congestionados -- ( )
* Faringe congestionada -- ( )
* Labios secos y con fisuras -- ( )
* Lengua en fresa -- ( )
4. Cambios en extremidades periféricas -- ( )
* edema -- ( )
* eritema -- ( )
5. exantema -- ( )
6. Linfadenopatía cervical <1,5 cm -- ( )
To t a l ( 1 0 0 ) -- (100)
205
Manual de Epidemiología - Unidad 4
Tabla de salida 2. Características demográficas de los casos del síndrome de Kawasaki con fechas de
inicio entre octubre y diciembre de 1984.
206
Manual de Epidemiología - Unidad 4
207
Manual de Epidemiología - Unidad 4
Tabla de salida 9. Cararterísticas epidemiológicas de los casos de síndrome Kawasaki y sus controles
con fecha de inicio de octubre a diciembre de 1984.
La secuencia de los cuadros de salida mostrados anteriormente y en la figura 4.1 presentan una
aproximación sistemática y lógica del análisis. Por supuesto, una vez que los datos se encuentran
disponibles y los números han sido tabulados en estos cuadros, se pueden llevar a cabo análisis
adicionales los cuales se deben llevar a feliz término.
208
Manual de Epidemiología - Unidad 4
Creacion de categorías
Algunas variables, tales como "género" o "¿comió ensalada de papas?" tienen un número limitado
de respuestas posibles. Tales respuestas proveen categorías útiles para incluir en un cuadro.
Cuando se estudian variables con un rango de respuestas posibles más amplio, tales como "tiempo"
o "presión arterial sistólica", hay que agrupar los datos en un número de categorías más manejable
(intervalos de clase); para crear estas categorías, hay que tener en cuenta lo siguiente:
* Elabore intervalos de clase mutuamente excluyentes que incluyan todos los datos.
Por ejemplo, si el primer intervalo es 0-5, hay que empezar el siguiente intervalo
con 6, no con 5. También hay que considerar los limites verdaderos de las nuevas
categorías. El límite superior de 0-5 es 5,4999... para la mayoría de las categorías,
pero es 5,9999 para la edad. Los límites verdaderos fueron discutidos en la unidad 3.
* Use un número relativamente grande de categorías creadas con intervalos de clase
estrechas para el análisis inicial. Es mejor combinar tales categorías posteriormente;
en general, es ideal empezar con 4-8 categorías.
* Use categorías con significado biológico o natural siempre que se pueda. Trate de
usar grupos de edad estandarizados o de uso común para el campo de estudio
específico. Si va a calcular tasas el numerador debe coincidir con las categorías de
los datos de la población que va a usar.
* Cree una categoría de "desconocido" o de "otros". Por ejemplo, en los agrupamientos
de edades mostrados en el cuadro 4.8, las categorías que se han creado para ello
son "edad no declarada", "desconocido" y "no declarada".
Cuadro 4.8. Algunas agrupaciones de edad estándares empleadas en el CDC.
Fuente: 3, 4, 21
Si hay un grupo de base natural, se debe mantener como una categoría aparte, aún cuando el
resto de la distribución no tenga distinciones naturales; por ejemplo, cuando se crean categorías
para "fumadores" en términos de "número de cigarrillos fumados en un día", hay que dejar los
no fumadores (0 cigarrillos/día) como una categoría aparte y agrupar los fumadores según
cualquier método arbitrario, como se describe más adelante.
209
Manual de Epidemiología - Unidad 4
Si no existen intervalos de clase naturales o estándar, hay varias estrategias para crearlos, como
se describe a continuación.
210
Manual de Epidemiología - Unidad 4
intervalo 1 = 19 - 30
intervalo 2 = 31 - 40
intervalo 3 = 41 - 50
intervalo 4 = 51 - 60
intervalo 5 = 61 - 70
intervalo 6 = 71 - 82
Para crear tres o cuatro intervalos, se pueden combinar algunos de los límites de los adyacentes:
Seis Intervalos Cuatro Intervalos Tres intervalos
Intervalo 1 = 19 - 30
Intervalo 1 = 19 - 40 Intervalo 1 = 19 - 40
Intervalo 2 = 31 - 40
Intervalo 3 = 41 - 50 Intervalo 2 = 41 - 50
Intervalo 2 = 41 - 60
Intervalo 4 = 51 - 60 Intervalo 3 = 51 - 60
Intervalo 5 = 61 - 70
Intervalo 4 = 61 - 82 Intervalo 3 = 61 - 82
Intervalo 6 = 71 - 82
2. Decidir cuántos intervalos de clase (grupos o categorías) se harán. En general, para cuadros
se usan de 4 a 8 intervalos de clase y para gráficas y mapas se usan de 3 a 6; los intervalos
dependen de las características de los datos que se quieren visualizar.
3. Dividir el rango por el número de intervalos de clase que se decidió usar para encontrar el
tamaño de los intervalos.
4. Empezar con el valor mínimo del límite inferior del primer intervalo y especificar los intervalos
de clase de cualquier tamaño que se ha calculado hasta que se llegue al valor máximo.
Ejemplos
En estos ejemplos, se demostrará cada estrategia para la creación de intervalos, usando los datos
de las tasas de mortalidad por cáncer de cérvix del útero del cuadro 4.9. En cada caso, se
crearán cuatro intervalos de clase de las tasas.
211
Manual de Epidemiología - Unidad 4
Cuadro 4.9. Tasas medias anuales de mortalidad por cáncer cervicouterino por 100.000 habitantes por
estados, ordenadas por rango, Estados Unidos, 1984-1986.
Rango Estado Tasa por 100.000 Rango Estado Tasa por 100.000
1 SC 5,6 26 KS 3,6
2 WV 5,6 27 AR 3,6
3 AL 5,4 28 MD 3,5
4 LA 5,4 29 IA 3,4
5 AK 5,1 30 PA 3,4
6 TN 4,9 31 FL 3,4
7 ND 4,9 32 HI 3,4
8 KY 4,8 33 OR 3,3
9 MS 4,7 34 ML 3,3
10 NC 4,6 35 CA 3,2
11 GA 4,6 36 ID 3,1
12 ME 4,6 37 AZ 3,1
13 VR 4,3 38 MA 2,9
14 DE 4,3 39 NM 2,9
15 NH 4,3 40 WA 2,8
16 IN 4,1 41 NV 2,8
17 OK 4,1 42 CT 2,8
18 IL 4,0 43 RI 2,8
19 MT 4,0 44 WI 2,7
20 VA 3,9 45 CO 2,5
21 OH 3,8 46 NE 2,4
22 MO 3,8 47 SD 2,4
23 TX 3,7 48 MN 2,2
24 NY 3,7 49 WY 1,9
25 NJ 3,7 50 UT 1,8
To t a l U.S. 3,7
Fuente: 2
212
Manual de Epidemiología - Unidad 4
3. Ajustar los límites de cada intervalo de forma que no queden vacios entre el final de uno y el
comienzo del siguiente (compare los intervalos de arriba con los de abajo):
a. ME-SC 4,5-5,6 12
b. NJ-VR 3,7-4,4 13
c. AZ-KS 3,0-3,6 12
d. UT-MA 1,8-2,9 13
213
Manual de Epidemiología - Unidad 4
4. Alternativamente, como 0,95 está muy cerca de 1,0, podríamos usar múltiplos de 1 para crear
las cuatro categorías. Comenzando por el valor central (5,6 + 1,8) / 2 = 3,7, sustraer 1,0
para determinar el límite superior del primer intervalo (2,7). Los límites superiores de los
intervalos tercero y cuarto serán 3,7 + 1,0 = 4,7, y 3,7 + 2 x 1,0 = 5,7.
Categorías finales:
214
Manual de Epidemiología - Unidad 4
Ejercicio 4.2
Con los datos de mortalidad por cáncer cervicouterino presentado en el cuadro 4.9, utilice
cada estrategia para crear tres intervalos de clase de las tasas.
215
Manual de Epidemiología - Unidad 4
Cuadro 4.9. Tasas medias anuales de mortalidad por cáncer cervicouterino por 100.000 habitantes por
estados, ordenadas por rango, Estados Unidos, 1984-1986.
1 SC 5,6 26 KS 3,6
2 WV 5,6 27 AR 3,6
3 AL 5,4 28 MD 3,5
4 LA 5,4 29 IA 3,4
5 AK 5,1 30 PA 3,4
6 TN 4,9 31 FL 3,4
7 ND 4,9 32 HI 3,4
8 KY 4,8 33 OR 3,3
9 MS 4,7 34 ML 3,3
10 NC 4,6 35 CA 3,2
11 GA 4,6 36 ID 3,1
12 ME 4,6 37 AZ 3,1
13 VR 4,3 38 MA 2,9
14 DE 4,3 39 NM 2,9
15 NH 4,3 40 WA 2,8
16 IN 4,1 41 NV 2,8
17 OK 4,1 42 CT 2,8
18 IL 4,0 43 RI 2,8
19 MT 4,0 44 WI 2,7
20 VA 3,9 45 CO 2,5
21 OH 3,8 46 NE 2,4
22 MO 3,8 47 SD 2,4
23 TX 3,7 48 MN 2,2
24 NJ 3,7 49 UT 1,8
25 NJ 3,7 50 WY 1,9
Total U.S. 3,7
Fuente: 2
216
Manual de Epidemiología - Unidad 4
Gráficas
Una gráfica es una forma de mostrar los datos visualmente, usando un sistema de coordenadas.
Es un tipo de fotografía estadística que ayuda a mostrar los patrones, las aberraciones, las similitudes
y las diferencias en los datos; es una forma ideal para la presentación de los datos. El público
recordará mejor los aspectos importantes de los datos cuando se presentan en una gráfica en
vez de un cuadro.
En epidemiología, es habitual usar una gráfica de coordenadas en ángulo recto que constan de
dos ejes lineales, uno horizontal y uno vertical, denominadas el eje horizontal, X o abscisas, y el
eje vertical Y, u ordenadas. En general, se usa el eje horizontal para mostrar los valores de la
variable independiente (X), que es el método de clasificación, como tiempo, por ejemplo, y el
eje vertical para mostrar la variable dependiente (Y), en epidemiología, normalmente es una
medida de frecuencia, como el número de casos o la tasa de una enfermedad. Se encabeza
cada eje para mostrar lo que se representa (tanto el nombre de la variable como sus unidades)
y se pone la escala de medida a lo largo de la línea.
El cuadro 4.10, muestra el número de casos de sarampión por año de notificación de 1950 a
1989. Hemos utilizado una porción de los datos para crear la figura 4.2. La variable independiente
años se muestra en el eje horizontal. La variable dependiente, el número de casos, se muestra
en el eje vertical. Se muestra un cuadriculado en la figura 4.2 para ilustrar cómo se grafican los
datos . Por ejemplo, para el punto de los casos en 1953 en la gráfica desde la intersección con
el nivel de 449 hacia la derecha y así utilice la figura para unir los puntos desde 1955 hasta
1959.
Cuadro 4.10. Sarampión por año de notificación, Estados Unidos, 1950-1989.
217
Manual de Epidemiología - Unidad 4
Figura 4.2. Gráfica parcial de sarampión por año de notificación, Estados Unidos, 1950-1959.
800
700
600
Eje y frecuencias
500
(Tasas, casos, razones,
proporciones)
400
300
Intervalos
200
iguales
100
0
1950 1951 1952 1953 1954 1955 1956 1957 1958 1959
Intervalos iguales
Eje de la X: método de clasificación (por ejemplo el tiempo de incio de la enfermedad,
en los días; año del informe; edad de los casos, en años
Fuente: 12
1.000
900
800
Casos X 100.000 hab.
700 Introducción de
la vacuna
600
500
400
300
200
100
0
1950 1955 1960 1965 1970 1975 1980 1985 1990
Fuente: 12
218
Manual de Epidemiología - Unidad 4
Se puede mostrar varias series de datos en la misma gráfica de escala aritmética. En la figura 4.4,
una línea representa el descenso de la rabia en animales domésticos desde 1955 mientras que
otra línea representa el aumento simultáneo de la rabia en animales silvestres. Una tercera línea
representa el total.
Figura 4.4. Ejemplo de gráfica en escala artimética: rabia, en animales silvestres y domésticos por año
de notificación, Puerto Rico, Estados Unidos, 1955-1989.
9.000 Total
Doméstica
8.000
Silvestre
7.000
6.000
Casos
5.000
4.000
3.000
2.000
1.000
0
1955 1960 1965 1970 1975 1980 1985 1990
Años
Fuente 12
La escala que usemos en el eje de las X depende de los intervalos que hayamos usado para la
variable independiente al recolectar los datos. Generalmente, graficamos los datos de tiempo
en las misma unidades que usamos para recolectarlos, es decir, semanal, anual, etc. Si hemos
usado intervalos muy pequeños para recolectar los datos, fácilmente podemos condensarlos en
intervalos mayores para poder mostrar los datos gráficamente.
Para seleccionar una escala para el eje Y, es necesario:
* Construir el eje de las Y más corto que el eje de las X, para que la gráfica quede
horizontal (es decir, la longitud horizontal debe ser mayor que la longitud vertical)
y mantener una buena proporción entre los dos ejes: en general, se recomienda una
relación X:Y de 5:3.
* Empezar el eje de las Y siempre con 0
* Identificar el rango de valores que desea mostrar en el eje de las Y, para lo cual encuentre
el valor mayor de la variable Y y apxoxímelo al número inmediato mayor. Por ejemplo,
el valor mayor de la figura 4.3 es 763.094 en 1958. Este valor se puede redondear a
1000.000 para determinar el rango de valores a mostrar en el eje de las Y.
* Seleccionar un tamaño de intervalo que nos dé suficientes intervalos para mostrar los
datos con el detalle que se requiere. En la figura 4.3, los intervalos de 100.000 cada
uno se consideran adecuados para mostrar los detalles importantes de los datos.
219
Manual de Epidemiología - Unidad 4
* Si el rango de valores para mostrar el eje de las Y incluye un período o fracción sin
datos, se debe anotar una interrupción en el eje correspondiente. Con una interrupción
en el eje de las Y, la línea se interrumpe también en donde la interrupción empieza y se
reanuda donde los datos continúan. Las interrupciones de los ejes sólo se pueden usar
con gráficas de escala lineal.
220
Manual de Epidemiología - Unidad 4
Ejercicio 4.3
En ambas gráficas, asegúrese de usar los intervalos adecuados para el rango de los datos en el
eje de las Y. El papel para gráficas se encuentra en el anexo D.
a. Construya una gráfica lineal en escala aritmética con los datos del sarampión del cuadro 4.11,
mostrando la tasa de 1955-1990 con una sola línea.
b. Construya una gráfica lineal en escala aritmética con los datos del sarampión de 1980-1990.
Cuadro 4.11. Tasas de sarampión (rubeola) por 100.000 habitantes por año de notificación, Estados Unidos,
1955-1990.
Fuente: 12
221
Manual de Epidemiología - Unidad 4
* Dentro de un ciclo hay diez marcas, siendo el espacio entre cada dos marcas cada vez
más pequeño al ir subiendo en la escala. Así, la distancia entre 1 y 2 no es la misma
que la distancia entre 2 y 3.
* El eje cubre un rango de valores de Y que hubiese sido difícil o imposible mostrarlo
en una escala aritmética. Las gráficas semilog son útiles cuando se quiere mostrar
un rango muy amplio de valores en una sola gráfica.
Figura 4.5. Ejemplo de gráfica semilogarítmica: casos notificados de poliomielitis paralítica por 100.000
habitantes por año de ocurrencia, Estados Unidos, 1951-1989.
Fuente: 12
222
Manual de Epidemiología - Unidad 4
Con una escala logarítmica, cierta distancia en el eje de las Y representa un porcentaje igual de
cambio, no una cantidad igual de cambio como en una escala aritmética. Por eso, una gráfica
semilog es especialmente útil para mostrar tasas de cambio. Para interpretar los datos en una
gráfica semilog, hay que entender las siguientes características de la gráfica:
* Una línea recta inclinada indica una tasa (no cantidad) constante de aumento o
disminución de los valores.
* Una línea horizontal indica que no hay cambio.
* La cantidad de inclinación indica la tasa de aumento o disminución.
* Dos o más líneas paralelas muestran tasas de cambio iguales.
Cuando se construye una gráfica semilog, se usa el número de ciclos necesarios para mostrar los
valores máximos y mínimos de la variable Y. Se puede adquirir papel gráfico semilogarítmico
que, en general, incluye por lo menos tres ciclos. Para hallar el número de ciclos que se necesita,
es preciso:
223
Manual de Epidemiología - Unidad 4
La figura 4.6 muestra los rangos de los valores que se deben mostrar en el eje de las Y de cuatro
ciclos de una gráfica semilogarítmica.
El tipo de gráfica que se usa depende principalmente de si se quiere mostrar los cambios de una
serie de valores o si se quiere enfatizar las tasas de cambio. Para mostrar los cambios en una
serie de datos se usa una escala aritmética en el eje de las Y (una gráfica lineal de escala aritmética).
Para mostrar las tasas de cambio se usa una escala logarítmica en el eje de las Y (una gráfica
lineal de escala semilogarítmica). Sin embargo, se puede decidir usar una gráfica semilogarítmica
cuando el rango de valores en el eje de las Y es demasiado grande aún para mostrar cambios en
la serie de datos.
Figura 4.6. Se pueden asignar valores posibles a valores del eje de las Y en una gráfica en escala
semilogarítmica.
Valores posibles
20 2.000 20.000 200.000
10 1.000 10.000 100.000 Máximo
8 800 8.000 80.000
6 600 6.000 60.000
5 500 5.000 50.000
4 400 4.000 40.000
3 300 3.000 30.000
2 200 2.000 20.000
1,0 100 1.000 10.000
-8 80 800 8.000
Cuatro ciclos
-6 60 600 6.000
-5 50 500 5.000
-4 40 400 4.000
-3 30 300 3.000
-2 20 200 2.000
0,1 10 100 1.000
-0,8 8 80 800
-0,6 6 60 60
-0,5 5 50 500 Mínimo
-0,4 4 40 400
-0,3 3 30 300
-0,2 2 20 200
0,01 1,0 10 100
0,008 -8 8 80
0,006 -6 6 60
0,005 -5 5 50
0,004 -4 4 40
0,003 -4 4 30
0,003 -3 3 30
0,002 -2 2 20 1950 Año 1990
0,001 0,1 1 10
Fuente: 9
224
Manual de Epidemiología - Unidad 4
Ejercicio 4.4
Grafique los datos de sarampión del cuadro 4.11, de la página 231, en escala semilogarítmica.
225
Manual de Epidemiología - Unidad 4
Histogramas
Un histograma es la gráfica de la distribución de frecuencias de una variable continua, en la cual
se usan columnas adyacentes para representar el número de observaciones para cada intervalo
de clase en la distribución. El área de cada columna es proporcional al número de observaciones
en este intervalo.
Las figuras 4.7, 4.8 y 4.9 muestran los histogramas de unas distribuciones de frecuencia con
intervalos de clase iguales. Dado que el tamaño de todos los intervalos de clase es igual, la altura
de la columna es proporcional al número de observaciones. No se recomienda usar histogramas
con intervalos de clase de tamaños diferentes, porque son difíciles de construir e interpretar
con seguridad. Tampoco se debe interrumpir la escala en el eje de las Y, porque distorsionaría la
presentación de las frecuencias relativas.
La variable mostrada con más frecuencia en el eje de las X es el tiempo, como se muestra en las
figuras 4.7 y 4.8. Sin embargo, se pueden usar otras variables contínuas, como el colesterol o la
presión arterial en el eje de las X. La figura 4.8 muestra la frecuencia de las observaciones por
intervalos de clase del nivel de colesterol.
Figura 4.7. Ejemplo de un histograma: casos notificados de poliomielitis paralítica por mes de ocurrencia,
Omán, enero de 1988 a marzo de 1989.
30
= 1 caso
25
15
Casos
10
No hay espacio
entre las columnas
5 No es esencial mostrar
las líneas horizontales entre
los casos
0
Ene Mar May Jul Sep Nov Ene Mar
1988 1989
226
Manual de Epidemiología - Unidad 4
Se puede mostrar una segunda variable en un histograma sombreando la segunda variable con
un color diferente dentro de la misma columna. Por ejemplo, se puede mostrar el número de
casos de una enfermedad por el tamaño de cada columna y la consecuencia de la enfermedad
(fatal o no fatal) con diferentes colores. Sin embargo, cuando se muestran los datos de esta forma
es difícil comparar el componente de arriba de una columna con otra porque no tiene una base
plana. Una alternativa es crear un histograma separado por cada componente de la segunda
variable, como se ve en la figura 4.9.
Figura 4.8. Ejemplo de histograma: niveles de colesterol entre 4.462 individuos del Estudio de Salud de
Varones, Estados Unidos, 1985-1986.
900
800
700
Número de hombres
600
500
400
300
200
100
Fuente: 13
Figura 4.9. Ejemplo de histograma: número de casos notificados de hepatitis A por fecha de inicio y
residencia en el municipio de Ogemaw, abril a mayo de 1968.
14
12
Residente Ogemaw
10 Residente municipio vecino
8 Residente otros municipios
Casos
6
4
2
0
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Fuente :22
227
Manual de Epidemiología - Unidad 4
Compare las figuras 4.9 y 4.10; muestran los mismos datos pero en formatos diferentes. ¿Cúal es
el mejor formato para la comparación de los patrones de casos entre residentes y no residentes?
Figura 4.10. Ejemplo de histograma: número de casos notificados de hepatitis A por fecha de inicio y
residencia en el municipio de Ogemaw, abril a mayo de 1968.
14
Residente Ogemaw
12
1 caso
10
Casos
6
4
2
0
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 2 4 6 8 10 12 14 16 18
Abril Mayo
2
0
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 2 4 6 8 10 12 14 16 18
Fuente: 22
A veces, se puede incluir una clave para mostrar cuántos valores de Y hay en un área de la
columna. La clave consiste en un cuadro o rectángulo, tan ancho como la columna, con el
número de casos representado por el área escrita al lado.
Con frecuencia los epidemiólogos desarrollan y discuten "curvas epidémicas". Una curva
epidémica no es una curva, sino un histograma que muestra los casos de una enfermedad
durante un brote, por su fecha de inicio. Con frecuencia se dibujan las columnas como un
cuadrado apilado en las columnas, en el que cada cuadro representa un caso. La figura 4.9
muestra que una persona tuvo su fecha de inicio de síntomas entre el 27 y 28 de abril, otra mas
inició entre el 29 y 30 y cinco casos adicionales iniciaron entre el 1º y 2 de mayo. Mostramos la
duración de la epidemia en el eje de las X en períodos de tiempo equivalentes. En una curva
epidémica, cada número de las etiquetas debe estar centrado entre las marcas de cada intervalo.
Empleamos el intervalo de tiempo que sea adecuado al caso: por ejemplo, para un brote de
gastroenteritis por Clostridrium perfringens sería de horas y de 3 a 5 días para un brote de
hepatitis A. Como regla general utilizamos intervalos menores a un cuarto del período de
incubación de la enfermedad que se muestra en el histograma. Empezamos a graficar el eje de
las X antes de que hubiese ocurrido el primer caso y mostramos cualquier caso de la misma
enfermedad que hubiese ocurrido en el período pre-epidémico. Tales casos pueden representar
los mismos casos de fondo o sin relación alguna. ¡Tenga presente que pueden ser la fuente del
brote!
228
Manual de Epidemiología - Unidad 4
Ejercicio 4.5
Utilice los datos de la epidemia en el asilo del ejercicio 4.1 (ver página 213) para dibujar una
curva epidémica. Describa las características de esta gráfica como si estuviera hablando por
teléfono con alguien que no puede verla.
229
Manual de Epidemiología - Unidad 4
Polígonos de frecuencia
Un polígono de frecuencia, como un histograma, es una gráfica de distribución de frecuencias,
en el cual se traza el número de observaciones contra los intervalos del eje de las X con puntos
individuales en la mitad de los intervalos y luego se conectan los puntos con una línea recta. La
figura 4.11 muestra un ejemplo de un polígono de frecuencia sobre la línea externa de un
histograma de los mismos datos. De rutina, no se deben mostrar los dos en una sola gráfica.
Compare su construcción. Un polígono de frecuencia de una serie de datos debe incluir la
misma área que un histograma con los mismos datos. Los polígonos de frecuencia ayudan a
mostrar y comparar dos o más distribuciones en la misma serie de ejes.
Figura 4.11. Casos notificados de enfermedad semejante a influenza por inicio.
15
Histograma
Polígono de frecuencia
10
Casos
0
1 2 3 4 5 6 7 8 9
Semana de inicio de la enfermedad
Primer punto del dato
Último punto del dato
conectado al punto
conectado al punto medio
medio del intervalo
del intervalo siguiente del
previo del eje de las X
eje de las X
Fíjese que el histograma y el polígono de frecuencia (la medida que se mueve de punto medio
a punto medio) crean una serie de pares de triángulos de tamaños iguales (uno dentro del
histograma y el otro afuera), lo cual es una característica importante de un polígono de frecuencias
debe cubrir la misma área que un histograma para los mismos datos: para cada área que queda
afuera del histograma, el polígono tiene que incluir otra área de tamaño igual.
Para mantener un área total igual, hay que fijarse bien en la manera de "cerrar" el histograma.
La figura 4.12a muestra el método correcto y la figura 4.12b el método incorrecto. Al hacerlo
correctamente, la línea de frecuencia empieza antes del primer intervalo (en el centro de éste),
fuera del histograma y continúa con el centro del primer intervalo que contiene datos, creando
un área A dentro del polígono que tiene el mismo tamaño que el área A que está dentro del
histograma pero fuera del polígono. Fíjese que en la figura 4.11, se cierra el lado derecho del
polígono de la misma forma.
230
Manual de Epidemiología - Unidad 4
Por el contrario, la figura 4.12b muestra el método incorrecto de cerrar el polígono. Se empieza
la línea en la base del primer intervalo, dejando el área C fuera del polígono, sin compensarla
con otra área dentro; como consecuencia, el área del polígono no es proporcional al número
total de observaciones en la serie de datos.
Figura 4.12a y 4.12b. Método coreecto para cerrar el polígono correctamente al lado derecho y método
incorrecto para cerrar un polígono al lado izquierdo.
10 10
B
8 8
6 6
4 B 4
A 2 C
2
A 0
0
25 30 35 25 30 35
A. Corecto B. Incorrecto
Con un polígono de frecuencia, es fácil mostrar una comparación de dos o más distribuciones
en los mismos ejes. La figura 4.13 muestra una gráfica de una comparación de tres polígonos de
frecuencia con la curva normal.
Figura 4.13. Antropometría de niños de dos a cuatro años de edad de Haití comparados con la población
de referencia de los CDC/OMS, departamentos septentrionales de Haití, 1990.
25 Población de referencia
Peso para la talla
Talla para la edad
Peso para la edad
20
15
Porcentaje
10
0
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 6 7
Puntuación de Z de referencia
231
Manual de Epidemiología - Unidad 4
Un polígono de frecuencia difiere de una gráfica lineal de escala aritmética en varias cosas. Se
usa un polígono de frecuencia (o histograma) para mostrar toda la distribución de frecuencia de
una variable continua; se usa una gráfica lineal de escala aritmética para mostrar una serie de
puntos de observaciones (números absolutos o tasas), usualmente a través del tiempo. Un polígono
de frecuencias debe cerrarse en ambos extremos porque el área por debajo de la curva es
representativa de los datos; una gráfica lineal de escala aritmética muestra solamente los puntos
que representan los datos.
Figura 4.14. Incidencia acumulada de infección por virus de hepatitis B por duración de conducta de
alto riesgo.
100
Usuarios de drogas IV
80
% infectado con VHB
Hombres homosexuales
60
40
Trabajadores de la salud
en contacto frecuente con sangre
20
Heterosexuales con
múltiples parejas
0
0 5 10 15
Años a riesgo
Se usa una curva de supervivencia en los estudios de seguimiento, para mostrar la proporción
de uno o más grupos que estén todavía vivos (o libres de la condición de interés) en períodos
diferentes a lo largo del tiempo. De forma similar a la curva de frecuencia acumulada, el eje de
las X registra períodos de tiempo y el eje de las Y muestra porcentajes de cero a cien de los que
aún viven. La diferencia más sobresaliente entre las dos curvas es su forma misma: mientras la
curva de frecuencia acumulada empieza en cero y en la parte más baja de la esquina izquierda
de la gráfica y va hacia cien en la esquina superior derecha, una curva de supervivencia empieza
en cien por ciento en la esquina superior izquierda y va disminuyendo hacia la esquina inferior
derecha en la medida que los pacientes van muriendo o sufriendo la condición bajo estudio).
232
Manual de Epidemiología - Unidad 4
Figura 4.15. Curvas de supervivencia de una cohorte de pacientes con enfermedad arterial periférica
(EAP) (n=482) y sin EAP (n=262), Pittsburgh, Pennsylvania, 1977-1985.
100
90
% sobreviviente
80
Sin EAP
70
60
50
Con EAP
40
30
0 1 2 3 4 5 6 7 8 9 10
233
Manual de Epidemiología - Unidad 4
10.000
TCDD mg X g de
1.000
100
10
0
0,0005 0,005 0,05 0,5 1,0 5,0 50,0
Años de exposición
Fuente: 16
234
Manual de Epidemiología - Unidad 4
Gráficas
Estas gráficas ilustran información estadística usando una sola coordenada; son más apropiadas
para comparar las magnitudes de diferentes categorías de un total, pero tienen muchos otros
usos.
Gráficas de barra
La gráfica de barra más simple es usada para mostrar visualmente los datos de un cuadro de una
sola variable (vea página 207). Cada valor o categoría de una variable es representado por una
barra; la longitud de la barra es proporcional al número de personas o eventos en esta categoría;
la figura 4.17, muestra el número de muertes infantiles por causa en los Estados Unidos. La
presentaciónde los datos hace más fácil la comparación del tamaño relativo de las diferentes
causas y permite ver que los defectos congénitos son la causa más frecuente de mortalidad
infantil.
Figura 4.17. Ejemplo de gráfica de barras horizontales: número de muertes infantiles por causas
principales, Estados Unidos, 1983.
Defectos congénitos
Bajo peso/Prematurez/Síndrome de dificultad respiratoria
Muerte súbita
Hipoxia intrauterina/Asfixia neonatal
Lesiones no intencionales
Infecciones perinatales
Complicaciones de placenta/membranas/cordón
Neumonía e influenza
Complicaciones maternas Total: 34.566
Fuente: 6
Las variables que se muestran en una gráfica de barra pueden ser discretas y no continuas (por
ejemplo, raza o género) o se las trata como si fueran discretas y no continuas (por ejemplo,
grupos de edad en vez de intervalos de edad en el eje).
Se pueden presentar las barras en forma horizontal o vertical. La longitud o el tamaño de cada
barra es proporcional a la frecuencia del evento en esta categoría. Por tal razón, no se debe
graficar una interrupción en el eje cuando se usa una gráfica de este tipo porque puede dar
lugar a malas interpretaciones cuando se compara la magnitud de diferentes categorías.
Una gráfica de barras verticales difiere de un histograma en que las barras de la primera son
separadas, mientras que las barras del segundo son unidas; ésta distinción existe porque en un
histograma se muestra la distribución de una variable contínua en el eje de las X (por ejemplo,
colesterol sérico, edad) mientras que, en una gráfica de barras, se muestra en éste eje una
variable discreta (género o raza).
235
Manual de Epidemiología - Unidad 4
20
Definición X 1.000
15
10
0
Negros Índios Latinos Asíaticos Blancos Total
americanos Raza/Etnia
Defectos Bajo peso/prematurez S. Muerte súbita Otros
congénitos Dificultad respiratoria
Fuente: 6
La gráfica de barras en la figura 4.19 representa tres variables: edad, género y hábito de fumar
en la actualidad. El hábito de fumar es la variable dependiente y tiene dos categorías: sí o no.
Las barras representan las 10 categorías de edad-género. La altura de cada barra es proporcional
al porcentaje de fumadores actuales en cada categoría de edad-género.
Figura 4.19. Ejemplo de gráfica de barras verticales con anotación: porcentaje de adultos que fuman
cigarrillos actualmente (personas de 18 años que han fumado alguna vez en su vida, al menos, cien
cigarrillos y que actualmente fuman) por edad y género, Estados Unidos, 1988.
Hombres Mujeres
10
0
16 - 24 25 - 44 45 - 64 65 - 74 >75
Grupo de edad (años)
Fuente: 10
236
Manual de Epidemiología - Unidad 4
Otras
20
S. de muerte súbita
Prematurez/Bajo peso/S. de dificultad respiratoria
Defectos congénitas
Def. X 1.000 nrv
15
10
0
Negros Índios Latinos Asíaticos Blancos Total
Raza/Etnia
Fuente. 6
Casos 4semanas
Enfermedad Decremento Incremento Actuales
Meningitis aséptica 282
Encefalitis primaria 24
Hepatitis A 1.172
Hepatitis B 749
Hepatitis no A y B 155
Hepatitis sin especificar 44
Legionelosis 57
Malaria 39
sarampíon 167
Infecciones meningocócicas 98
Parotiditis 149
Tosferina 93
Rabia animal 176
Rubéola 36
0,125 0,25 0,5 1 2 4 Por fuera de los
Razón en escala log límites históricos
237
Manual de Epidemiología - Unidad 4
reducción en comparación con niveles anteriores. En esta gráfica en particular, el eje de las X
tiene una escala logarítmica, que significa que una reducción o un aumento del 50% serán
representados por barras de la misma longitud, pero en direcciones diferentes. Se resaltan los
valores más allá de los límites históricos (que son equivalentes a intervalos de confianza del
95%).
Figura 4.22. Causas básicas de defunción entre menores de un año por grupos raciales/étnicos, Estados
Unidos, 1983.
Otras
S. de muerte súbita
Prematurez/Bajo peso/S. de dificultad respiratorias
Defectos congenitos
9.261 434 2.381 725 21.590 34.391
100
60
% de la distribución
80
40
20
0
Negros Índios Latinos Asíaticos Blancos Total
americanos
Raza/Etnia
Fuente: 6
238
Manual de Epidemiología - Unidad 4
239
Manual de Epidemiología - Unidad 4
Ejercicio 4.6
Utilice los datos del cuadro 4.12 para dibujar una gráfica de barras apiladas, otra de barras
agrupadas y otra más de barras componentes de 100% para ilustrar la distribución por grupo de
edad de los casos de sífilis primaria, entre hombres y mujeres, blancos y negros en los Estados
Unidos. ¿Qué información es presentada mejor por cada tipo de gráfica?
Cuadro 4.12. Número de casos de sífilis primarias y secundarias por edad, género y raza, Estados
Unidos, 1989.
Fuente: 12
240
Manual de Epidemiología - Unidad 4
Gráficas de pasteles
Una gráfica de pastel es simple, fácil de entender, ya que el tamaño de las pedazos es proporcional
a la contribución de cada componente; los pasteles son útiles para mostrar los componentes de
un solo grupo o variable.
Para hacer un pastel, hay que dibujar un círculo, después empezar en las 12 del reloj y organizar
los componentes desde el más grande hasta el más pequeño en el sentido de las manecillas del
reloj, generalmente se ponen las categorías de "otro" y "desconocido" al final. Se pueden usar
diferentes matices para distinguir entre los pedazos; hay que mostrar, en alguna parte de la
gráfica, los porcentajes representados por cada pedazo porque no es fácil identificarlos a simple
vista.
No se recomienda el uso de múltiples pasteles, como los de la figura 4.23 para comparar los
mismos componentes en más de un grupo de variables, porque la comparación es difícil; cuando
se quiere comparar los componentes de más de un grupo o variable, hay que usar una gráfica
de barras de componente del 100%.
Figura 4.23. Tipo de muerte traumática entre trabajadores, según género, Estados Unidos, 1980-1985.
3,2% 5,9%
3,1% 5,4%
11,6%
47,5%
41,2%
82,1%
Lesiones no intencionales
Homicidio
Suicidio
Otros
Fuente: 11
Figura 4.24. Ejemplo de un mapa de puntos: casos de histoplasmosis por lugar de residencia, Austin,
Minnesota, octubre a noviembre de 1984.
Río Cedro
Noroeste
C
Noroeste
Calle Oakland B
Suroeste A Sureste
A - Aviario
B - Alberca Ciudad de Austin
C - Camino a la planta de carnes
Límites de la ciudad
Cuadrante
Ríos y arroyos
Vivienda caso índice
Se pueden mostrar las tasas o la distribución en un mapa de área. Figura 4.25; como con el mapa
de puntos, no se muestra el riesgo de un individuo de adquirir el evento; sin embargo, si se
muestran las tasas en un mapa de área, se puede ilustrar las diferencias en el riesgo de presentar
un evento en cada área.
La figura 4.25 muestra el número de casos de encefalitis de San Luis, en los diferentes condados
de Florida según municipio en 1990. Como sucede en un mapa de puntos, no se puede relacionar
con la población en riesgo. Cuando se usan tasas, se debe calcular la tasa especifica, para cada
área, es decir, hay que dividir el número de casos en cada área por la población en riesgo en
esta misma.
242
Manual de Epidemiología - Unidad 4
Figura 4.25. Casos sospechosos y confirmados de encefalitis de San Luis por municipio de residencia,
Florida, julio a octubre de 1990.
Lake
No presentaron casos Marion Orange
1 - 5 casos Polk
Brevard
6 - 10 casos
Hillsborough
> 10 casos Indian river
Manatee St. Lucie
Martin
Hardee
Palm Beach
Higlands
Broward
Hendry
Fuente: 7
243
Manual de Epidemiología - Unidad 4
Ejercicio 4.7
Utilizando los datos de mortalidad por cáncer cervicouterino del cuadro 4.9 en la página 221,
construya dos mapas de área basados en las dos primeras estrategias para categorizar los datos
en cuatro intervalos de clase como se describe en las páginas 219-223.
<
Respuesta en la página 277
244
Manual de Epidemiología - Unidad 4
150 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
80 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
40 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
Ac IH VIP
20 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
10 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
< 10 ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○ ○
No expuestos Expuestos
Fuente: 26
Se usa un diagrama de puntos para hacer una comparación visual de los puntos reales de los
datos de dos variables no continuas. Para comparar las distribuciones de dos variables no continuas
se usa un diagrama o gráfica de caja, también llamado de cajas y bigotes. Como se muestra en
la figura 4.27; la "caja" representa el 50% de la mitad o el rango intercuartílico de los datos y los
bigotes se extienden hacia los valores máximos y mínimos. Se marca la posición mediana con
una línea vertical dentro de la caja; así, se puede mostrar (y comparar) el punto central (la
< mediana), la dispersión (los cuartiles) y cualquier tendencia de desviación, como se indica cuando
la línea de la mediana no está centrada en la caja.
245
Manual de Epidemiología - Unidad 4
Figura 4.27. Ejemplo de diagrama de caja y bigotes: resultados de pruebas de ELISA indirecta para
anticuerpos IgG de virus para influenza tipo I en suero de pacientes en fase convaleciente de casos y
controles, Condado de Baltimore, Maryland, enero de 1990.
246