Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EPIDEMIOLOGIA I
Módulo III:
Metodologías epidemiológicas, uso de
medidas y escalas de medición.
AÑO 2020
1
Módulo III: Metodologías epidemiológicas,
uso de medidas y escalas de medición.
2
Objetivos didácticos
Contenido de aprendizaje
3
Metodologías Epidemiológicas.
Para que la investigación pueda ser considerada científica debe seguir pasos y
cumplir ciertas reglas que constituyen el método científico. Sin embargo, en
investigación, no existen modelos o formas de llevar a cabo un proceso universal
ni que éste, a pesar de haber sido eficaz para otras investigaciones, pueda ser
aplicado en forma permanente. Es por ello que las reglas no son inflexibles y que
este proceso no es lineal, como si se tratara de un conjunto de pasos o etapas
relacionadas en forma mecánica y secuencial. Cada investigación se realiza de
acuerdo a criterios generales, que son ajustados por cada investigador y en
relación al problema tratado (objeto de estudio).
4
La investigación científica requiere de fundamentos teóricos (base filosófica)
lo cual es estudiado por la epistemología y una base metodológica que es
estudiada por la metodología de la investigación. El metodólogo no pone en tela
de juicio el conocimiento ya obtenido y aceptado por la comunidad científica. Su
problema es la búsqueda de estrategias para incrementar el conocimiento.
Nos plantea por qué debemos creer en aquello que afirman los científicos. Es
una actividad crítica que se dirige a todo el campo de las ciencias.
5
Lo anterior se muestra en el siguiente esquema:
El propósito de Comte estaba más ligado a producir una reforma social para la
que resultaba necesario reformular el método del conocimiento. Es muy
conocida su ley de los tres estadios: el teológico, el metafísico y el positivo.
1
Auguste Comte (1798-1857), fundador del positivismo, es quien ha dado a la Filosofía el nombre de
positiva. El “positivismo” fue la base epistemológica dominante en la segunda mitad del siglo XIX
(coincidente con el desarrollo de la teoría bacteriológica y la unicausalidad) y sus ramificaciones
penetran en nuestra centuria y se extiende todavía, en numerosos sectores, hasta nuestros días.
6
cualquier investigación. No hay más saber, en el estricto sentido de la palabra,
que el científico y todo presunto conocimiento debe responder a la “normalidad
metodológica”.
7
planteado, estimar estadísticamente las frecuencias de eventos en una
población de interés, efectuar comparaciones y correlaciones entre las variables,
etc... Todo para arribar a leyes de regularidad que permitan explicar los hechos
del pasado y en cierta forma predecir los eventos futuros.
En las dos últimas décadas el estudio social de la ciencia ha señalado que las
“revoluciones científicas” no pueden ser explicadas por la aparición de una teoría
8
mejor, aparecen evidencias que van más allá de lo empírico. Por ello la ciencia,
los procesos culturales y la subjetividad están socialmente construidos e
interconectados.
EL MÉTODO EPIDEMIOLÓGICO
METODO
Se define como la manera de alcanzar organizadamente un objetivo. Es la manera
de reproducir en el pensar el objeto que se estudia.
El término organizado se refiere a que todos los miembros de un equipo
investigador siguen un mismo protocolo de estudio y aplican las mismas
definiciones y criterios a todos los participantes.
La palabra objetivo indica que las conclusiones obtenidas no se basan en
impresiones subjetivas, sino en hechos que se han observado, medido y
analizados.
METODO CIENTÍFICO
Es el procedimiento sistemático y riguroso que la lógica estructura como medio para
la adquisición de conocimiento de la naturaleza; que incluye las técnicas de
observación, reglas para el razonamiento y la predicción, ideas sobre la
experimentación planificada y los modos de comunicar los resultados experimentales
y teóricos.
CIENCIA
Conjunto de conocimientos que recurre al método científico para desarrollarse y dar
respuesta a 2 preguntas esenciales para abordar un problema: -Por qué. -Para qué.
Las respuestas a estas preguntas esenciales para abordar un problema, permite
prever y transformar la realidad en beneficio de la sociedad.
El termino Ciencia, equivale literalmente a CONOCIMIENTO.
9
El primer profesional sanitario que utilizó el método de manera ordenada por
fases fue John Snow2. Este médico rural inglés aplicó el método al estudio de las
epidemias de cólera que ocurrieron en Londres en 1853 y 1854. Debido a ello,
se le considera el padre del método epidemiológico (ver unidad N°1).
MÉTODO EPIDEMIOLÓGICO
Epidemiología descriptiva.
Epidemiología analítica observacional
Epidemiología analítica experimental
2
John Snow médico patólogo que en el año 1854 describe una epidemia de cólera en la ciudad de
Londres.
10
El fin último de la epidemiología es controlar los problemas de salud. Para ello la
epidemiología genera información en tres campos:
11
Ejemplo:
A. Variables de tiempo: hora del día, estaciones del año, meses, años,
fenómenos de masa en el tiempo, tendencia secular, (es decir las
variaciones en la frecuencia de enfermedad que se producen de una
generación a otra, o de un decenio o más, a otro), tendencias
estacionarias etc.
B. Variables de lugar: características demográficas, zona de residencia,
Urbano, rural, lugar de nacimiento, temperatura, humedad, suelo,
vegetación, fauna, población que la habita, etc.
C. Variables de persona: Constituyen atributos biológicos, sociales o
culturales que influyen en la presencia de enfermedad, tales como el sexo,
edad, etnia, nivel de estudios, nivel socioeconómico, estado civil,
características familiares o genéticas, características endógenas, estilos
de vida etc.
12
Desde el punto de vista de la Epidemiología, la fase de la epidemiología
descriptiva o bien el estudio o la investigación descriptiva, ha sido la gran
proveedora de hipótesis en relación con los importantes problemas de salud
con la que cuenta la epidemiología.
Este método también examina hipótesis, pero lo hace de un modo más “estricto”
aún. Es analítica porque también utiliza grupos de comparación, pero, en este
caso, el investigador no sólo observa y analiza los datos, sino que interviene
activamente en el manejo y control del evento, especificando las condiciones del
13
estudio, seleccionando los grupos de tratamiento, la naturaleza de las
intervenciones, el manejo de los pacientes durante el seguimiento, etc. En cierto
sentido “controla” el proceso de la investigación e introduce modificaciones
necesarias para su realización.
1. De prevalencia (transversales)
2. De casos y controles.
3. De cohorte.
4. Experimentales
14
Confirmación de casos similares.
Identificación de los datos existentes.
Resumen:
16
Nota: La preparación de un proyecto de investigación es frecuentemente un
proceso cíclico. Las flechas indican que el proceso no siempre es lineal. En
cualquier etapa se puede modificar o cambiar un estadio anterior que ya se daba
por definido.
Toda investigación nace a partir del planteo del problema. El mismo surge de las
preguntas que se realiza el investigador a partir de una observación sobre un
aspecto de la realidad.
Son preguntas formuladas de tal modo que las respuestas a las mismas
confirmarán, ampliarán o corregirán parte de aquello que corrientemente se da
por conocido en esa área y aunque cada problema dentro de la ciencia implica
una pregunta, o serie de preguntas, no cualquier problema puede ser tomado
como científico. Si la respuesta a la pregunta de investigación fuera obvia, se
trata entonces de un problema de gestión que puede resolverse sin ninguna
investigación ulterior.
17
El verdadero procedimiento para el hallazgo del problema consiste en obtener
una información lo más completa posible de los temas de investigación o de los
problemas estudiados por otros investigadores en el área elegida.
18
II. PROPÓSITO Y JUSTIFICACIÓN DE LA INVESTIGACION
Por último, habría que ver la viabilidad o factibilidad para poder realizar la
investigación propuesta. Hay que ver tanto la disponibilidad de recursos
financieros, humanos y materiales que se disponen como así también las
consideraciones éticas en que el proyecto se va a desenvolver.
Una vez revisada la bibliografía sobre el tema y definido el marco teórico en que
nos posicionarnos, se está en condiciones de redactar en forma clara los
objetivos a que apunta la investigación.
20
Los objetivos se van formulando a medida que se va definiendo el problema, se
insertan dentro del marco teórico conceptual elegido y guían la investigación en
un rumbo definido.
Para una mejor comprensión de lo que se quiere obtener, los objetivos se pueden
o no subdividirse en generales y específicos. Mientras que los primeros expresan
lo que se espera lograr con el estudio, los segundos tratan más analítica y
profundamente los distintos aspectos del problema.
21
Deben seguir un orden (metodológico o lógico)
Deben estar expresados en infinitivo
Veamos un ejemplo:
Objetivo general
Objetivos específicos:
V. HIPÓTESIS
22
los objetivos, surge o no la hipótesis de acuerdo al diseño metodológico que se
utilice.
23
¿Qué utilidad tiene trabajar con hipótesis?
Las hipótesis las utilizamos en los estudios analíticos cuando queremos poner a
prueba una proposición de asociación entre diversos factores que producen un
fenómeno. Debemos tener en cuenta que las hipótesis:
TIPOS DE ESTUDIOS
24
El diseño del estudio dependerá de:
Tipo de problema
Cuadro Resumen:
25
Cuadro Resumen:
VARIABLES
Los factores o cualidades que se han aislado de un fenómeno, como los más
importantes o de mayor interés para el estudio en cuestión. Es decir, son los
diferentes aspectos o características del objeto en estudio, susceptibles de
adoptar distintos valores.
La variación de los valores se puede dar no sólo entre las unidades estudiadas,
sino también en una misma unidad en distintos momentos.
26
En los estudios epidemiológicos es muy importante distinguir entre variables
dependientes e independientes.
UNIVERSO Y MUESTRA
27
los datos. Para solucionar este problema hemos visto que la estadística ha
desarrollado lo que se denomina teoría de las muestras.
- El tamaño de la muestra.
28
Estimación:
Comparación:
29
Muestreo probabilístico y no probabilístico
Otras veces puede suceder que las personas u objetos elegidos para formar la
muestra sean de difícil acceso, por ejemplo, personas que viven en zonas
inundadas. En estos casos se presenta la disyuntiva de no hacer ninguna
investigación o hacer un muestreo no probabilístico. Esto es, elegir una
muestra que no cumpla exactamente con todos los requisitos que establece la
teoría de las muestras y por lo tanto no poder cuantificar la probabilidad de
cometer un error, pero sí obtener información suficientemente útil para los fines
deseados.
Tamaño de la muestra
30
Error de muestreo
Cuando hablamos sobre precisión, decimos que toda medida muestral está
afectada por un error aleatorio.
Es necesario tener presente que cuando los estudios se realizan sobre todo el
universo, también se cometen distintos tipos de errores (sistemáticos o sesgos
de medición), especialmente los primeros no son posibles de cuantificar.
Si decidimos trabajar con una “confianza” del 95% de que nuestro intervalo de
confianza contenga al verdadero valor del Universo, estaremos aceptando una
probabilidad de error del 5% de que no sea así. Este error se puede expresar en
porcentaje, en general varía de 1 a 5% y se simboliza “p”. Significa que lo que
31
se afirma a partir de la muestra tiene una probabilidad “p” (1 a 5%) de no ser
exacto, o lo que es lo mismo, que se está afirmando algo que tiene una
probabilidad de ser cierto de 95 a 99%.
INTERVALO DE CONFIANZA
Vimos que este concepto está relacionado con la forma en que se expresan las
estimaciones obtenidas a partir de la muestra. La forma correcta de dar el
resultado, es por medio de dos valores que esperamos contengan al verdadero,
con la probabilidad de error antes mencionada.
Recuerden que todo esto está basado en las propiedades de la curva normal y
en el concepto de error standard.
32
En la medida en que se acepten ciertos niveles en la probabilidad de error, como
ser p = 5% y cierta amplitud en el intervalo de confianza, el tamaño de la muestra
disminuirá.
33
Vemos que entre las cosas importantes no figura el tamaño total de la población.
Es un error de concepto muy común creer que, si la población es mayor,
necesitamos una muestra mayor para su estudio. El tamaño de la muestra está
condicionado especialmente por la magnitud o frecuencia de hallar en la
población aquello que queremos medir.
TIPOS DE MUESTREO
Una vez fijado el tamaño de la muestra se debe especificar la forma en que debe
ser elegida.
La muestra debe ser elegida al azar. Esto significa que cada una de las personas
u objetos que componen el universo, deben tener la misma probabilidad de ser
elegidos.
Muestreo sistemático
Muestreo estratificado
Los grupos que se forman con las unidades de muestreo se llaman estratos y
cuando se procede en esta forma se está realizando un muestreo estratificado.
Otra situación que debe ser considerada, es aquélla en que las unidades de
muestreo no están disponibles como para permitir un listado de las mismas y
tampoco constituyen un archivo de formularios. Si por ejemplo se tuviera que
obtener una muestra de todos los niños menores de 10 años residentes en la
Capital Federal para estimar una característica determinada.
35
En esta situación se deben hacer visitas domiciliarias para encontrar los niños y
para la elección de los domicilios se deben cumplir algunas etapas.
Una vez elegidos los radios censales (conglomerados), en ellos se deben elegir
en forma sistemática las casas (también conglomerados) que serán visitadas
para encontrar finalmente a los niños que compondrán la muestra.
36
Utilización de métodos básicos de muestreo en investigaciones que
impliquen comparaciones
37
Al preparar los distintos aspectos de esta investigación surgen las preguntas:
Para resolver este punto será necesario contar con la ayuda de un especialista
y tener algunos conocimientos sobre el tema que se va a investigar, ya sea
basado en estudios anteriores, iguales o parecidos al que se propone realizar, o
bien sobre la base de la experiencia adquirida por el investigador.
Es lógico esperar que el investigador conozca estos datos, aunque sea en forma
aproximada, ya que de ninguna manera se haría una investigación
absolutamente a ciegas sin un probable beneficio esperado.
▪ Error tipo I.
Decidir que los antibióticos son iguales cuando en realidad son diferentes.
(Se llama poder del estudio a la diferencia: 100 - Error de Tipo II expresado
en porcentaje).
38
El investigador debe establecer cuánto de los dos tipos de errores está dispuesto
a aceptar.
En primer lugar, se debe dejar bien establecido que las muestras deben ser
iguales entre sí con respecto a las variables que pueden influir sobre los
resultados. Siguiendo con el ejemplo sobre comparación de los antibióticos, no
será importante igualar los grupos en cuanto a la estatura de los pacientes o el
color de sus cabellos, pero sí en cuanto a la edad, sexo, estado general del
paciente y toda otra característica que pueda influir en el efecto del antibiótico.
39
ejemplo en favor de uno de los tratamientos, puede decidir que los enfermos más
graves se concentren en un solo grupo.
A. A ciegas (aleatoriamente)
Es común utilizar la técnica doble ciego, donde el que administra no conoce qué
tipo de medicamento está suministrando ni el que recibe conoce qué está
recibiendo. Esto se hace para eliminar sesgos de observador y efectos
“placebos” en los enfermos. Es por ello muy importante que los medicamentos
tengan similares aspectos y dosis.
40
B. Formación de grupos de a pares (pareados)
Con este método es necesario hacer una lista de todas las variables que pueden
influir en la investigación. Al ingresar el primer paciente se decidirá al azar a cuál
de los dos grupos pertenecerá, luego se esperará otro paciente con
características similares como para componer su par y se lo adjudicará al otro
grupo.
Esta forma de proceder es más sencilla cuando por las características del estudio
se dispone desde el comienzo de todo el grupo de personas que intervendrán en
la experiencia y se pueden formar todos los pares simultáneamente. Pero
también tiene sus desventajas. Las variables que se han apareado no podrán
ser motivo de investigación en el estudio, si el estudio fuera de tipo observacional
puede aparecer el problema del “sobreapareamiento” (los grupos se hacen tan
iguales, que luego no se encuentran diferencias de exposición entre ellos) y por
último y más complicado, se necesita utilizar pruebas estadísticas especiales
para grupos pareados.
C. Otras alternativas
En algunos casos las técnicas que se desean probar permiten que a una misma
persona se la estudie con relación a dos o más alternativas. Ejemplos de estos
casos son:
41
PLAN DE RECOPILACIÓN DE DATOS
Prueba piloto
Procesamiento
Para cumplir con los objetivos establecidos es indispensable recoger datos que
informen sobre las características en estudio. Deben reunir ciertos requisitos con el fin
de evitar un gasto inútil de recursos.
Útiles a los propósitos de la investigación, que sean indispensables para ellos y no los
que “casualmente podrían servir”, como muchas veces sucede. Luego se trata de reunir
los datos estrictamente necesarios, pertinentes a la investigación.
Que sean fáciles de obtener, puesto que existen algunos que a pesar de ser útiles son
difíciles de encontrar o lograr de parte de los investigadores y sólo se pueden obtener
en algunas unidades de observación lo que conduce a errores en las conclusiones.
En lo posible exactos, sin errores, puesto que los errores de información conducen a
errores de conclusiones, por ejemplo: la declaración de la edad, ingreso económico, etc.
42
Actualizados a la investigación, es decir, datos que informan sobre hechos ocurridos
próximos al inicio de la investigación. Por ejemplo: para la distribución de recursos en
los diferentes programas de un área no nos servirán los datos recogidos hace diez años
atrás, puesto que el tamaño, condiciones de vida, la distribución por edad y otras
características de la población pueden haber variado fundamentalmente en un período
tan largo.
Perfectamente definidos: este requisito parece obvio, pero, la realidad es que muchas
veces los datos presentan dificultades respecto a su significado en un estudio y ello
redunda en la exactitud de los mismos, en la uniformidad de criterios de quienes los
recogen e indudablemente en la validez de las conclusiones.
Es recomendable hacer una lista con los datos a recoger y colocar al lado su definición
(lo que se va a entender por cada uno de ellos en la investigación).
FUENTES DE INFORMACIÓN
Las fuentes son diversas y adecuadas al tipo de investigación propuesta. Recuerde que
las fuentes principales de datos son:
43
Recopilación de la información
Observación
Entrevistas
Test
La recopilación
Documental
Otros
CONSTRUCCIÓN DE FORMULARIO
Será conveniente que el o los formularios que se utilicen, así como las correspondientes
instrucciones sean preparadas con la participación de todo el equipo interesado en el
estudio. En el diseño del formulario se tendrán en cuenta dos aspectos: Contenido y
forma.
En cuanto al contenido, nos referimos a los títulos, datos que se piden e instrucciones.
Títulos: Deben colocarse en lugar visible y especificar con claridad el punto que se está
tratando, además deben indicar la institución que los recoge y la fecha a la que
corresponden los datos.
Datos que se piden: estos datos dependerán de los objetivos de la investigación y del
tipo de cuestionario a administrar (autoadministrado o a través de encuestadores).
44
En general se requieren datos de identificación como:
Los datos a recoger deben cumplir ciertos requisitos, ser útiles, mínimos, redactados
con claridad, las preguntas no deben dar lugar a dudas sobre lo que se pregunta, en lo
posible, las respuestas deben ser cortas: SI o NO.
No se deben realizar dos preguntas en el mismo ítem. (Ej.: ¿Está vacunado contra la
difteria y poliomielitis?) En el caso que las preguntas tengan relación con el tiempo, éste
debe estar acotado. (Ej.: Ha tenido Ud. dolor de cabeza en los pasados 7 días? Es
importante colocar preguntas filtro o embudo, que permitan agilizar la toma de
información (Ej.: Trabaja Ud. en relación de dependencia? Si la respuesta es “sí”, pasa
a otras preguntas relacionadas con el tema, si es “no”, acaba en ese punto la cuestión).
En el caso que queden varias posibilidades no relevantes basta con colocar el rubro
“otros”, lo cual es indispensable porque si la persona no encuentra alternativas, puede
dejar sin marcar, hecho que lleva a errores de interpretación.
Es conveniente antes de armar el formulario, hacer una lista con todos los datos
que será necesario recoger para realizar el estudio, es decir, establecer con
claridad las variables que van a ser analizadas de acuerdo a los objetivos
planteados.
45
En cuanto a la forma deben tomarse en cuenta:
Conviene colocar las preguntas fáciles primero y la más difíciles o que pueden
preocupar al entrevistado, después:
Cuestionarios autoadministrados:
46
En todos los casos deben ser comprensibles y concisas. Del mismo modo se
debe proceder para la recolección de datos secundarios
Los puntos a evaluar son: aceptabilidad por parte de los encuestados (se evalúa
a través de la tasa de rechazo y de aceptación), facilidad de llenado del
cuestionario (muchas respuestas como: “no conozco” u “otras” pueden estar
indicando que el cuestionario es demasiado largo o complejo, validez (refiere a
que los datos realmente midan lo que se desea medir, se puede cruzar la
información reunida con la proveniente de registros previos como historias
clínicas, etc.).
47
de datos tal vez se observen que las respuestas a las preguntas o estas últimas
entre sí no guardan la coherencia que originalmente se previó.
Procedimientos de muestreo:
- Tiempo que insumirá localizar las personas que han de incluirse en el estudio
48
Revisión del cronograma y presupuesto propuesto para las actividades de
investigación.
Al iniciar los planes de procesamiento de los datos se debe decidir si éstos han
de procesarse y analizarse:
El procesamiento implica:
49
Problemas Éticos y Legales
Plan de Trabajo
En el plan pueden incluirse las tareas que han de realizarse, cuándo y quién ha
de cumplimentarlas y en cuánto tiempo se han de realizar. (Cronograma).
Informe final
50
El cómo transmitir la información requiere tener en cuenta entre otros aspectos,
los objetivos del trabajo, el propósito del mismo, el público a quien va dirigido, el
lenguaje a utilizar, etc.
Sección Preliminar: Constituye la presentación del trabajo y debe dar la idea muy
general acerca de qué trata el mismo.
51
Introducción
a- Planteamiento y significado del problema
b- Objeto de la investigación (qué y para qué)
c- Supuestos teóricos en que se apoya
Definiciones operacionales utilizadas
Revisión de la bibliografía relacionada con el tema y de estudios ya
realizados.
Esquema de investigación:
a- Breve referencia al diseño de investigación
b- Metodología y utilización
Presentación, análisis e interpretación de los datos
Resumen y conclusiones:
a- Principales hallazgos
b- Sugerencias para investigaciones ulteriores
Recomendaciones
Bibliografía
Anexos y apéndices
a- Gráficos e ilustraciones
b- Datos estadísticos
c- Material suplementario
52
La Sección Esquema de Investigación hace referencia al Diseño de
Investigación y la metodología utilizada. Es de especial importancia
explicitarlo para poder juzgar la validez científica de la investigación ya que
permitiría a otros investigadores repetir la experiencia en otro lugar y comparar
los resultados.
Los datos
El análisis de los datos, presentado en texto, cuadros, gráficos y figuras.
Autor
Título del trabajo
Tomo
Editor
Lugar de edición
Fecha de edición
Paginación (indicarla solamente si se utiliza sólo una parte del texto)
53
54
LA EPIDEMIOLOGÍA CRÍTICA: UNA NUEVA FORMA DE MIRAR LA SALUD
EN EL ESPACIO URBANO.
Como ya hemos visto, en el siglo pasado las ciencias naturales eran el modelo
o ideal científico para todas las ciencias, también para la Epidemiología. El tipo
de explicaciones era mecanicista y la determinación de naturaleza unicausal
(efecto-específico).
55
Para ello se torna necesario la comprensión de la triple inequidad de la que
forman parte los fenómenos de clase social, género y etnia.
56
aislados y estáticos en un momento determinado y perdiendo toda posibilidad de
cambio.
57
permita establecer un movimiento interdependiente entre las dimensiones de la
vida económica y las dimensiones de la vida cultural, de la vida organizativa
política y de la vida ecológica de los grupos.
58
Necesidad de uso de medidas y escalas de medición en los
procesos de cambio de los sistemas de atención de salud.
INTRODUCCIÓN
El término determinante hace referencia a las causas que provocan los eventos
observados, las preguntas en este caso ¿por qué las personas que permanecen
mayor número de días internadas tienen mayor riesgo de infectarse en un
hospital? ¿por qué en las personas que reciben más prácticas el riesgo de
Infecciones Hospitalarias es mayor?
Es importante controlar la calidad del dato (su exactitud y precisión), así como el
rigor en los procedimientos de registro y de ordenamiento de la información, ya
que influirá decisivamente en la pertinencia de los resultados de la investigación;
para ello es necesario diseñar un buen sistema de registro.
59
directas o indirectas. Los datos surgen sin organización, como una simple lista
de medidas que deben ordenarse para comprender lo que ellas expresan. Es
preciso ordenarla, condensarla y organizarla para su descripción, como una
simple lista que debe ordenarse para comprender lo que expresa.
LOS DATOS
Por ejemplo, en vez de decir el número, el cual no tiene un referente que permita
compararlo, se puede usar la proporción (en la cual dicho número es el
numerador y el denominador puede ser el total de la población y el resultado de
esta relación se multiplica por 100). Así es más probable que el ser humano
entienda.
Las variables pueden ser contestadas con datos de distintos tipos. Una forma
de clasificar a los datos puede ser la siguiente:
1. Datos cuantitativos
2. Datos cualitativos
Discretos: Los datos discretos son aquellos cuya respuesta solo puede
emplear un número entero (no permite más subdivisiones).
60
Por ejemplo, la variable casos (personas enfermas) de tal enfermedad solo
puede ser expresada con un dato como un número entero: no puede decirse que
existen 7 y media personas enfermas… Otros ejemplos pueden ser la respuesta
a la variable de número de caries en un examen bucal o la cantidad de hijos.
Por ejemplo, la altura de una persona. El dato puede ser 175 cm, si se usa un
instrumento que mide centímetros. Pero puede ser 1754 mm si se usa una escala
de referencia en milímetros. Como se observa, existe la posibilidad de continuar
con otras medidas.
Nominales: Los datos nominales son aquellos que usan respuestas que
nombran. Por ejemplo, el color de tal cosa… o cuáles son las
enfermedades más frecuentes. Algunos autores crean una subdivisión
importante por la frecuencia, denominada existencial referida a que lo
tiene o no lo tiene (existe o no).
61
Por ejemplo, ante la variable tiene o no cáncer. El dato es sí o no. Dado que la
respuesta probable es una de dos se denominan también dato dicotómico, donde
lo usual es que se mencionen las características del dato a través de la variable.
Por ejemplo, la variable tiene o no tiene cáncer del pulmón, es una variable
nominal dicotómica ya que el dato resultante es SI o NO. Por supuesto, que
existen variables que producen datos nominales donde las categorías son más
de dos.
62
De 0 a 9 años. De 10 a 19 años. De 20 a 29 años. Entonces, si la edad
es 13 años, así se expresará en el primer caso. En cambio, en el segundo
caso se colocará de 10 a 19 años. Acá no se puede saber de cuánto es
la diferencia, por ejemplo, ente 21 años y 13 años; en cambio, en el caso
en que el dato se exprese como años cumplidos, se sabe qué distancia
existe entre uno y otro dato.
Para resaltar lo anterior, observe la gráfica: la estadística usa para describir unos
referentes (medidas de tendencia central y medidas de dispersión) y también las
gráficas. En el ejemplo está el denominado histograma (gráfica esencial de la
estadística) donde se expresan las edades de un grupo de adolescentes que
participaron en una investigación. Ciertamente es fácil ver en ella: las edades
extremas (10 y 20 años), la edad media se puede aproximar visualmente (entre
63
13 y 14 años), la edad que más se repite (14 años). Incluso se puede saber cuál
es el total de población (suma de todas las casillas = 109).
1. Los datos que normalmente son publicados por los organismos encargados
de tal recolección, como las Direcciones de Estadística y Censo: censos de
población, registros vitales (nacimientos, defunciones, etc.)
“Una imagen vale más que mil palabras‟. Este refrán tiene una profunda
implicación. El lenguaje se ha construido para que las personas se entiendan.
Pues, así como se ha construido el lenguaje de las palabras, se ha construido el
lenguaje de los números y también se ha construido el lenguaje de imágenes. A
64
veces, las imágenes transmiten mejor una idea que las palabras. Precisamente
eso es lo que significan las gráficas: imágenes que muestran frecuencias de
eventos y son otro de los lenguajes que se pueden usar para hacer entender
eventos.
CUADROS / TABLAS
65
información indispensable para satisfacer dichos requisitos. Se ubica con
preferencia en la parte superior de la tabla por ser el lugar más visible.
B. Esqueleto o armazón: son rectas perpendiculares entre sí que se cortan
cerca del extremo izquierdo y superior respectivamente lo que indica que
existen en ella filas y columnas que deberán ser encabezadas por los títulos,
los cuales nunca pueden faltar ya que, de lo contrario, no se sabría a qué se
refieren las cifras contenidas en la tabla.
C. Cuerpo: constituido por los casilleros encerrados por el esqueleto y que
contendrán los datos a presentar.
D. Totales: se acostumbra colocarlos en la última fila y/o columna.
E. Porcentajes: se relacionan las cifras parciales con el total y generalmente se
colocan al lado del número absoluto. Pueden calcularse sobre los totales
verticales o los horizontales dependiendo del fin de la tabla. (No siempre son
obligatorios).
F. Fuente: debe indicarse de donde provienen los datos, citando entidad o
publicación, lugar y fecha.
G. Notas explicativas: a veces es necesario hacer alguna aclaración con
respecto a una cifra (en relación con la fuente de obtención u otra
característica). En ese caso, debe colocarse un asterisco u otra llamada que
se explicará al pie de la tabla.
Ejemplo:
66
TIPOS DE TABLAS
Así tenemos una tabla de “una sola entrada” si, por ejemplo, presentamos
Población total por sexo de la provincia de Córdoba, sexo es la única característica que
se toma en cuenta.
Siguiendo con el ejemplo anterior, la tabla será de “doble entrada” si, además,
de sexo, se presenta la clasificación según grupo de edades.
Las tablas de dos o más entradas permiten relacionar distintos fenómenos. Sin
embargo, las combinaciones de más de tres características, tornan a las tablas
complicadas y a veces incomprensibles.
A-Con una
escala
cualitativa
67
B-Con una
escala
cuantitativa
Dijimos que se hace esta clasificación cuando cada individuo es observado bajo
2 características simultáneamente e interesa analizar la relación entre ambas.
Esto da origen a las tablas de asociación si las dos características o variables
son cualitativas o una es cualitativa y la otra es cuantitativa, y a las tablas de
correlación si las dos variables son cuantitativas. En este caso los porcentajes
pueden calcularse en sentido horizontal o vertical, es decir, considerando como
100% el total de la última columna o bien de la última fila.
68
Tablas con dos escalas cualitativas
Casos especiales
69
GRÁFICOS
CONSTRUCCIÓN DE GRÁFICOS
TIPOS DE GRÁFICOS
Así como cada tabla que se elabora para presentar datos trata de contestar una
pregunta, cada gráfico tiende a responder mejor la pregunta; por lo tanto,
debemos definir ese propósito para elegir el gráfico más adecuado. El gráfico
está condicionado por el tipo de escala.
70
Gráfico de barras
71
1.3. Gráfico de Barras Proporcionales
72
2.1 Histograma
El histograma es un gráfico formado por rectángulos, uno para cada grupo, que
van unidos entre sí, debido a la característica de continuidad de la escala. Su
superficie total muestra el total de individuos que corresponde a cada grupo. Esta
superficie está dada por la altura (que representa la frecuencia de aparición del
suceso) en el caso de que la base sea igual a 1. Esto sucede cuando las
divisiones de la escala son iguales.
En este gráfico la base de cada barra corresponde a 5 años y como todos los
grupos se diferencian en cinco se dice que la base es la unidad 5 años. Luego,
la superficie de la primera barra tiene altura 41.592 (lo que representa el 9,6%
de la distribución) y base unitaria por lo que su superficie es 9,6% (niños entre 0
y 4 años).
73
2.2. Polígono de frecuencia
74
3-2 Diagrama de Caja o Boxplot
75
Otras formas de representación gráfica son:
Mapas
Pirámides de población
Pictogramas
76
Cuando deseamos representar la composición de una población por sexo y edad
usamos LA PIRÁMIDE DE POBLACIÓN que permite la comparación de cada
grupo de edad para ambos sexos. La pirámide se construye sobre dos ejes
perpendiculares. A la izquierda del eje vertical se representan los datos
correspondientes a la población masculina y a la derecha los correspondientes
a la femenina. En el eje vertical se marcan los distintos grupos de edades, en
forma reciente hacia arriba, y sobre el horizontal figuran las escalas de
frecuencia, una para los varones y otra para las mujeres; haciendo coincidir el
cero con la intersección de los dos ejes resultan una serie de rectángulos
horizontales que van disminuyendo su longitud a medida que correspondan a
edades avanzadas.
77
Tipos de pirámide poblacional
De población regresiva (llamada también bulbo): con una base más estrecha
que el cuerpo central y un porcentaje de ancianos relativamente grande. Es
propia de los países desarrollados que han terminado la transición demográfica,
pero aún están presentes sus últimas generaciones. Se trata de una población
envejecida con bajas tasas de natalidad y de mortalidad, y con un crecimiento
natural reducido.
78
PICTOGRAMAS
79
Veamos un ejemplo:
80
LAS MEDIDAS
Por supuesto, que una variable puede ser medida con distintos referentes y será
tarea del investigador el emplear como dato aquel que mejor expresa la
comparación. Por ejemplo, con la variable altura de las personas es mejor usar
variables que empleen datos cuantitativos (mucho mejor decir cuánto mide que
decir alto o bajito) e incluso de ellos son mejores los centímetros que los
milímetros.
1. Medidas de frecuencia.
2. Medidas de asociación.
3. Medidas de impacto
81
1. Medidas de frecuencia
Pueden usar distintas escalas, casi todas matemáticas y sin duda son las más
empleadas en la epidemiología. Prácticamente no existe investigación donde no
se expongan medidas de frecuencia y son las empleadas para la labor
descriptiva.
La medición que se hace con este propósito se expresa casi siempre por tres
formas básicas:
Razón
Proporción
Tasa
R=a/b
Lo principales que el numerador y el denominador no se superponen; un ejemplo
típico es la razón Varón / Mujer.
P = a / (a + b)
82
Se puede decir que relaciona el número de observaciones con una característica
respecto del total de observaciones.
Para el correcto cálculo de una tasa es necesario definir con precisión el caso o
evento de interés que se incorpora al numerador, la población bajo estudio que
se halla en el denominador, y el período de tiempo involucrado. En el cálculo de
una tasa el denominador puede o no contener al numerador.
83
INDICADORES
84
Note que si aumenta la incidencia (aparecen más casos nuevos) y el número de
muertes y recuperados se mantiene sin cambio, aumentará la prevalencia. Si
aumenta la mortalidad o más gente se recupera y la incidencia no cambia, la
prevalencia disminuirá.
La muerte
La enfermedad
La discapacidad de la población
Los factores de riesgo de la población
Aspectos intervinientes en la salud poblacional tales como prevalencia de
felicidad, calidad de vida, desarrollo humano.
85
3. Las tablas de vida (expectativa de vida y los años de vida perdidos).
4. En morbilidad se usa la letalidad o relación entre los que se mueren y los que
padecen de una enfermedad obviamente en un período de tiempo.
2. Medidas de asociación
86
La principal ventaja de estas medidas es que permiten describir en un solo
parámetro la asociación existente entre una particular exposición y el riesgo de
desarrollar un determinado evento (Los expuestos y los no expuestos).
87
Para calcular el riesgo relativo de una enfermedad con relación a una exposición,
se requiere una medida del riesgo absoluto entre los expuestos a un factor de
riesgo y una medida del riesgo absoluto entre los no expuestos a tal factor, es
decir, la incidencia en expuestos y la incidencia en no expuestos.
Ejemplo:
En síntesis
3
FR: Factor de riesgo se llama cuando la población estudiada es “sana”.
4
FP: factor pronóstico se llama cuando la población estudiada tiene una condición determinada
(enfermos).
88
Razón de Posibilidades: Odds Ratio (OR)
89
3. Medidas de impacto
Hoy sabemos que la exposición del cigarrillo es el factor causal más importante
en la génesis del cáncer del pulmón. A través del RIESGO ATRIBUIBLE se
puede calcular el porcentaje de responsabilidad del cigarrillo, el que por cierto
está en cerca de un 92%. Esta cifra se obtuvo de la aplicación del RIESGO
ATRIBUIBLE también denominado FRACCION ETIOLOGICA.
90
En síntesis:
91
¿QUÉ ENTENDEMOS POR MEDICIÓN?
Hay variables que son netamente cualitativas como sexo, lugar de residencia, a
las cuales es imposible transformar en cuantitativas porque sus características
no pueden ser medidas o contadas. En cambio, si se establecen niveles, las
variables cuantitativas pueden ser expresadas en cualitativas. Un ejemplo válido
es la edad, típica variable cuantitativa generalmente expresada en años (unidad
de medida) que puede ser expresada como cualitativa: niño, joven, adulto y
anciano.
92
Hay cuatro tipos de escalas de medición (Stevens 1958), que ordenadas en
orden creciente de potencia, según la proporción de información que contienen,
son:
Escala nominal
93
Por ejemplo, el antecedente de hábito tabáquico puede codificarse como 1 y 0
(1: fumador; 0: no fumador) o como 1 y 2 (1: fumador; 2: no fumador). Aunque
matemáticamente la presencia/ausencia de una característica se corresponde
con la codificación 1-0, es frecuente usar la codificación 1-2, para evitar que
variables vacías sean asignadas al 0 por error.
Escala ordinal
Existen escalas que serán mezcla de nominal y ordinal, porque solo algunas
categorías estén ordenadas por rango; esto ocurre en las escalas en las que un
valor representa a una categoría inclasificable (ejemplo: no sabe no contesta o
resultado indeterminado).
Escalas de intervalos
94
habitación a 22 grados centígrados y otra a 26 es la misma que la existente entre
dos a 33 y 37 grados centígrados, respectivamente.
Escalas de razones
95
¿COMO RESUMIR DATOS CLASIFICADOS EN ESCALA CUANTITATIVA?
Se simboliza: O
97
MODO: es el valor de la variable que se presenta mayor número de veces, o
sea, el valor más frecuente. Se simboliza Mdo.
DISTRIBUCIÓN DE FRECUENCIA
La tabla de frecuencia
98
Buscando ser didácticos, el ser humano aprende a través de la descripción y de
la comparación. Con base en estos dos procedimientos anhela predecir. La
investigación es la forma como el ser humano describe y compara. La estadística
ofrece referentes para aprender a describir y comparar en las investigaciones.
Para describir, la estadística utiliza una serie de presentaciones y de aspectos
referenciales (medidas de tendencia central y de dispersión). La principal forma
de presentar la información es la tabla de frecuencia que, con mucho, constituye
la principal forma de presentar información en la estadística descriptiva (no la
única y, de hecho, las gráficas le hacen algo de competencia).
Las filas en la tabla expresan las clases en que se ordenaron los datos. La
columna de frecuencia muestra el número de veces que se repiten los datos de
cada clase.
Tipos de frecuencia
99
La suma de las frecuencias absolutas corresponde al número total de datos,
representado por la letra N:
100
5.- Frecuencia relativa acumulada: Se calcula sumando la frecuencia
relativa de un dato más la frecuencia relativa del dato anterior. Así que, la
frecuencia relativa acumulada del primer dato coincide con su frecuencia relativa
y la frecuencia relativa acumulada es igual a 1.
Vamos a ver paso a paso cómo construir una tabla de frecuencias con datos
aislados con el siguiente ejemplo:
Datos (xi)
Frecuencia absoluta (fi)
Frecuencia absoluta acumulada (Fi)
Frecuencia relativa (ni)
Frecuencia relativa acumulada (Ni)
101
En la primer a columna, colocamos los valores de los datos, pero sin repetir,
ordenados de menor a mayor. En nuestro caso, tenemos varios 1, varios 2,
varios 3 y varios 4, por lo que colocamos estos valores una vez en la tabla.
Dejamos la última fila para colocar el total:
El 1 se repite 6 veces
El 2 se repite 5 veces
El 3 se repite 4 veces
El 4 se repite 5 veces
102
Vamos a obtener ahora la frecuencia absoluta acumulada de cada dato. En la
primera fila, la frecuencia absoluta acumulada coincide con la frecuencia
absoluta, es decir, ambas son 6.
103
Es decir, dividiendo cada frecuencia absoluta, entre el número total de
elementos, que es 20 para todos, en este caso.
104
También la podemos calcular la frecuencia relativa acumulada, dividiendo cada
frecuencia absoluta acumulada entre el número de elementos total:
Distribución:
105
Esta es una distribución de frecuencias simétricas y para señalar el centro se
utiliza la media aritmética o valor promedio.
106
En general la mediana es más fácil de calcular y su uso es apropiado ya sea la
distribución simétrica o asimétrica.
107
MEDIDAS DE DISPERSIÓN (EXTENSIÓN)
Hemos visto las medidas de tendencia central las cuales nos permiten ubicar el
centro de la distribución. La más utilizada de todas es la media o promedio, sin
embargo, este valor no es suficiente para describir una serie de datos.
108
habilidad de reconocerlo y evitar escoger distribuciones que tengan las
dispersiones más grandes.
Para lograr una mejor idea de la distribución de los valores obtenidos se requiere
conocimiento acerca de la dispersión o variación de las observaciones. En el
área de la salud se utilizan con frecuencia varias mediciones estadísticas para
describir la dispersión de los datos: rango, desviación estándar, coeficiente
de variación, percentilos y rango intercuartílico.
Sin embargo, los valores no están igualmente agrupados alrededor del punto de
equilibrio. Están más dispersos en el segundo caso.
Lo interesante ahora es poder medir en alguna forma esta dispersión. Para ello
podemos utilizar por ejemplo la distancia entre el valor máximo y mínimo, la cual
denominaremos amplitud.
Rango (amplitud)
109
Si observamos el ejemplo, en este caso, la amplitud es de 4.
1; 2; 3; 4; 5 1+5:4
Es la medida de dispersión más frecuente para definir datos del área de la salud,
aunque su significado y cálculo pueden ser complejos, aporta información
valiosa.
2. Se eleva al cuadrado.
Así se calcula la DS, pero es muy importante entender su concepto. Para poder
entender mejor su uso se tiene que entender el concepto de la curva de
distribución normal.
110
DISTRIBUCION NORMAL
111
Una herramienta (instrumento) muy utilizado en el ejercicio clínico es el uso de
escalas o tablas donde se puede confrontar lo que se espera con lo que los
pacientes tienen. Las tablas de crecimiento son un buen ejemplo. Se construyen
con base a las distribuciones de las poblaciones en cada edad, las que sumadas
muestran las tendencias y así permiten construir los límites donde se ubican las
poblaciones.
112
Antes de exponer el ejemplo (joven de 15 años con…) se debe describir lo que
compone la tabla de percentiles:
1. La Tabla relaciona los valores para la edad (X) con los parámetros de peso y
talla (Y). Para hacer más fácil la explicación sólo nos vamos a referir al peso.
2. De cada edad se obtiene la curva de distribución normal del peso con dos
desviaciones estándar. Por ejemplo, con los jóvenes de 15 años:
113
De acuerdo al grafico anterior; a una muestra representativa de jóvenes de 15
años sanos del mismo sexo (masculino en este ejemplo) de un país se pesó y
se obtuvo que el peso medio era de 56 kilos. Al aplicar dos desviaciones
estándar, dicho peso medio se dispersó hasta 83 kilos (límite superior del
intervalo de confianza) y hasta 42 kilos (límite inferior del intervalo de confianza).
Todos los pesos que estén dentro de 42 kilos y 83 kilos en jóvenes de 15 años,
de ese lugar, se consideran NORMALES ESTADISTICAMENTE (una manera
de decirlo) o IGUALES ESTADÍSTICAMENTE (otra manera de decirlo y según
el contexto).
4.Dado que el 95% de los datos quedará comprendido entre las dos desviaciones
estándar, los límites de esos dos intervalos son 97% (superior) y 3 % (inferior).
Ello quiere decir que el 95% de los pesos obtenidos de los jóvenes de tal edad
están comprendidos entre esos dos límites. La forma como se subdividan estos
dos límites es lo que establece:
114
CUARTILES si se dividen por proporciones del 25% los pesos
encontrados. Ello quiere decir que en el primer cuartil está el 25% de los
primeros pesos (entre 42 y 49 kilos) que, en el segundo cuartil, está ese
25% más el siguiente 25% (y con ello se ha llegado a la mitad de la
población), es decir, entre 42 kilos y 56 kilos; que en el tercer cuartil se
agrega otro 25% (entre 42 kilos y 69,5 Kilos) y en el último cuartil se
incluye el restante 25% de los pesos ubicados en la curva de
distribución.
Igualmente se puede afirmar que entre 49 kilos y 56 kilos están ubicados los
pesos de los dos cuartiles inferiores y que entre 56 y 83 están los pesos con
cuartiles superiores. En fin… lo importante es que esta medida se usa para
comparar tendiendo de referente la curva de distribución.
115
AMPLITUD INTERCUARTÍLICA (RQ): La amplitud intercuartílica es una
medida de variabilidad adecuada cuando la medida de posición central
empleada ha sido la mediana.
¿Ello qué quiere decir? En primer lugar, que el peso de este joven está dentro
de la curva de distribución normal del peso para la edad y el sexo (evidente
por estar dentro de los dos límites que establecen las líneas que miden la
superior 97 y la inferior 3). Ahora bien… dentro de la curva el percentil 50 es
aquel peso que divide a la población de esta edad en dos mitades (los pesos
ubicados ahí señalan la MEDIANA) donde una mitad puede tener más que
ese peso y la otra mitad menos. En este caso y, si la imagen permite
visualizarlo, el peso del percentil 50 a los 15 años, es 56 kilos.
116
La importancia de esta aplicación de las curvas de distribución normal ha sido
y es inmensa. Por ejemplo, al hacer seguimiento de los niños por edad,
podemos ver cómo va ocurriendo el incremento del peso en relación con la
edad y ver si se hace dentro de los límites esperados; si no es así, nos hace
sospechar que algo no está bien en el niño… y se busca.
Varianza
117
medida de dispersión alternativa expresada en las mismas unidades de los datos
de la variable objeto de estudio. La varianza tiene como valor mínimo 0.
Calcular la varianza
118
valores originales, lo que hace mucho más fácil el trabajar con ella y es más fácil
de interpretar junto con el concepto de la curva normal.
Coeficiente de variación
1, 2, 3, 4, 5 Suma = 15 n = 5 × = 3
119
CORREDOR ENDÉMICO
120
El corredor endémico expresa la tendencia estacional de una enfermedad y tiene
los siguientes elementos:
121
El corredor o canal endémico, que corresponde a la franja delimitada
por los límites inferior y superior del gráfico y representa el rango de
variación esperado de casos en cada unidad de tiempo del año
calendario.
La zona de éxito, que corresponde a la franja delimitada por la línea basal
(línea de frecuencia cero) y el límite inferior en cada unidad de tiempo del
año calendario.
La zona de seguridad, que corresponde a la franja delimitada por el límite
inferior y la curva endémica propiamente dicha en cada unidad de tiempo
del año calendario.
La zona de alarma, que corresponde a la franja delimitada por la curva
endémica propiamente dicha y el límite superior en cada unidad de tiempo
del año calendario.
La zona de epidemia, que corresponde a la zona localizada por encima
del límite superior o umbral epidémico en cada unidad de tiempo del año
calendario.
122
Existen diversos métodos para construir corredores endémicos, con distintos
grados de sofisticación y precisión, pudiendo hacerse tanto con casos como con
tasas de enfermedad.
A continuación, presentamos una técnica sencilla y útil que sigue los siguientes
tres pasos básicos:
3) Se grafican las tres medidas resumen por unidad de tiempo del paso anterior
en un eje de coordenadas en el cual el eje vertical representa la frecuencia de
casos y el eje horizontal las unidades de tiempo en que se divide el año y se
trazan los límites superior e inferior y el corredor endémico.
123
124