Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de Bioestadística J91
Manual de Bioestadística J91
Manual de
Bioestadística Jornada 91
Proyecto BioINTEC
Comité de Bioestadística
2
ITINERARIO
Fechas Temas
2da semana Introducción a la investigación
Revisiones sistemáticas, metaanálisis
y reporte de casos
Universo, población y muestra
Muestreo aplicado
Cálculo tamaño de la muestra
Diseño metodológico
Criterios de inclusión y exclusión
CONTENIDO
ITINERARIO ................................................................................................................................... 1
Introducción ............................................................................................................................... 4
El proceso de investigación científica .................................................................................... 5
Tips generales ............................................................................................................................. 6
Modelos de investigación......................................................................................................... 8
Contexto metodológico de estudios primarios ................................................................... 14
Diseño metodológico .............................................................................................................. 15
Aplicando conocimiento........................................................................................................ 15
Medidas de frecuencia de la enfermedad ......................................................................... 16
Aplicando conocimiento........................................................................................................ 17
Sesgo.......................................................................................................................................... 18
Aplicando conocimiento........................................................................................................ 22
Universo, población y muestra: .............................................................................................. 23
Aplicando conocimiento........................................................................................................ 24
Muestreo.................................................................................................................................... 25
Aplicando conocimiento........................................................................................................ 31
Estadísticos y parámetros........................................................................................................ 33
Aplicando conocimiento........................................................................................................ 36
Variables,,,.................................................................................................................................. 24
Aplicando conocimiento........................................................................................................ 26
Tamaño muestral ..................................................................................................................... 27
Aplicando conocimiento........................................................................................................ 31
Representación de los resultados .......................................................................................... 33
Algunos conceptos epidemiológicos ................................................................................... 35
Distribución de probabilidad.................................................................................................. 36
Pruebas estadísticas ................................................................................................................ 41
Intervalo de confianza ............................................................................................................ 42
4
INTRODUCCIÓN
La estadística consiste en la recogida, cuantificación, síntesis, análisis e
interpretación de la información relevante contenida en unos datos.
Cabe resaltar que este es un manual en construcción que debe ser complementado
con lo discutido en los talleres y consultado en las bibliografías de lugar. En el taller
solo se tratarán los temas del itinerario, pero se espera que tengan conocimiento de
todos los aspectos del manual.
1Martínez González MA, Sánchez-Villegas A, Toledo Atucha EA, Fajardo JF. Bioestadística Amigable, 3ra ed. Barcelona: Elsevier;
2014.
5
TIPS GENERALES
1. La muestra mínima es de 30 pacientes:
Esto es válido en la mayoría de estudios. No es estrictamente necesario en estudios
de caso, serie de casos, investigación cualitativa. Sí se quiere probar una proporción
o prevalencia es necesaria una muestra de al menos 100 sujetos de estudio.
Un tamaño n=30 se fundamenta en el Teorema Central del Límite, siendo el mínimo
tamaño en que la distribución de la media muestral se asemeja a la distribución
normal estándar.
4. Todo lo que haga con sus datos debe plasmarlo en Material y Métodos:
¿Cómo se calculó el tamaño de la muestra? Incluyendo el error, precisión,
estimaciones (y fuente usada para dicha estimación).
¿Cómo fueron seleccionados los individuos? Incluyendo la técnica de muestreo
usada y una explicación del procedimiento llevado acabo.
¿Cuál fue la tasa de respuesta? En el caso de usar fuentes primarias especificar
cuántos accedieron a responder las preguntas, mientras que si se usan fuentes
secundarias debe especificar del total de historiales evaluados, cuántos estaban
incompletos, etc. Siempre y cuando estos sujetos, que no accedieron al estudio,
cumplan con los criterios de inclusión establecidos.
¿Cómo procesó los datos? Software(s) usados, estadísticos calculados.
¿Qué pruebas estadísticas usó? Especificar prueba(s), sobre qué variables se
realizaron y el nivel de significancia elegido.
7
5. Cada prueba estadística tiene requisitos individuales que deben ser tomados en
cuenta:
De tal forma que, al elegir realizar una prueba, se debe comprobar que se cumplen
con los supuestos de dicha(s) prueba(s). Por ej, ¿La variable sigue una distribución
normal? ¿El tamaño de la muestra es el adecuado? ¿Los individuos se
seleccionaron de forma aleatoria?
8
MODELOS DE INVESTIGACIÓN
Existen distintos tipos de modelos dependiendo de investigación científica, y para
delimitarlos usaremos el concepto de nivel de evidencia, que no es más que una
heurística utilizada para clasificar la fuerza relativa de los resultados obtenidos de la
investigación científica. Existe un amplio acuerdo sobre la fuerza relativa de los estudios
epidemiológicos a gran escala, y para ello se han propuesto innumerables escalas. En
Proyecto BioINTEC utilizamos el modelo propuesto por Forrest y Miller, el cual abarca 5
niveles:
El primer nivel nos describe las guías de uso clínico, metaanálisis y revisiones sistemáticas
(conocidos como estudios secundarios), siempre y cuando la base de estos
conocimientos sean estudios primarios, controlados, aleatorizados, de tipo prospectivo
y de característica experimental. Por lo regular estos estudios son utilizados para la
aprobación de fármacos.
El segundo nivel nos habla de las cohortes, en los cuales se evalúa la frecuencia de
aparición de un evento entre dos grupos, uno que se encuentra expuesto al riesgo, y
otro que no. Son estudios primarios de tipo prospectivo, y su objetivo es observar el
resultado de la interacción.
El tercer nivel nos habla sobre los estudios de caso control. A diferencia del anterior, en
el caso control los sujetos ya tienen una cualidad que es de interés para el autor, pero
se desconoce el riesgo y es lo que se trata de probar. Es un estudio primario de tipo
retrospectivo y observacional.
En el nivel cuatro y cinco se encuentran estudios que no precisan de diseño
metodológico, como lo son los reportes de casos/series de casos, y las reseñas
narrativas, opiniones de expertos basadas en experiencia y los textos editoriales,
respectivamente.
_________________________
Forrest & Miller. EBDM in Action: Developing Competence in EB Practice. 2016
9
Por la parte metodológica nos consta que estos estudios que vamos a presentar tengan
el mismo nivel de calidad de evidencia, de esta manera se busca controlar la
variabilidad por parte de las carencias que podrían tener esos estudios primarios.
A continuación, algunos ejemplos de representación en metaanálisis.
Forest plot
Para interpretar uno de estos métodos
de interpretación, debemos tener en
cuenta cual es el significado de cada
una de su simbología. A la derecha, un
diagrama que le explica:
10
Funnel Plot
Un Funnel Plot representa en el eje X los efectos observados en los distintos estudios, y
en el eje Y alguna medida de precisión de la variable respuesta, como por ejemplo el
error estándar. Si hay un número suficiente de puntos (estudios), y en ausencia de
heterogeneidad y de sesgo de publicación, los puntos deberían adoptar
conjuntamente el aspecto de un embudo, con la parte más ancha correspondiendo
a los estudios más pequeños y menos precisos.1
12
L´ABBÉ
Tipos de estudio
Según la secuencia temporal (según las veces que se mide la variable en período de
tiempo):
Transversal: las variables son medidas en una sola ocasión y no se les da
seguimiento.
Longitudinal: las variables son medidas en más de una ocasión y se les da
seguimiento.
Según el inicio del estudio en relación a la cronología de los hechos (según el tipo de
fuente):
Prospectivo: la información obtenida es de fuente primaria, recolectada de
forma directa por los investigadores a partir de los sujetos a estudiar.
Retrospectivo: los datos recolectados son de fuentes secundarias, es decir,
se obtuvieron en otro momento diferente al período de estudio.
Según el control de la asignación de los factores a estudiar (según la intervención del
investigador):
Observacional: los investigadores se limitan a medir las variables sin ejercer
control sobre el factor de estudio.
Experimental: el investigador interviene y/o manipula el factor de estudio.
Según la finalidad del estudio:
Descriptivo: evalúa la frecuencia y tendencias de la población con respecto
a una enfermedad. Describe un problema de salud en función de las
características de persona, lugar y tiempo de aparición.
Analítico: establece relaciones de asociación o causalidad entre variables y
prueba hipótesis previas. Son estudios analíticos: estudio de cohorte, estudio
de caso control y el ensayo clínico.
No olvidar
Planteamiento del problema: realidad que motiva a realizar la investigación.
Justificación: razones por las que el problema es digno de investigar y los beneficios
que pudiesen obtenerse a partir de los resultados de la investigación.
15
DISEÑO METODOLÓGICO
Es definido como el esquema general o marco estratégico que le da unidad,
coherencia, secuencia y sentido práctico a todas las actividades que se emprenden
para buscar respuesta al problema y objetivos planteados2. Cabría preguntar ¿Por qué
un apartado de contexto metodológico y uno de diseño metodológico? El primero te
ayudará en la elección y descripción del tipo de investigación que estás realizando, sin
embargo, es una visión simplificada y adaptada al proceso de BioINTEC del conjunto
de diseños metodológicos.
APLICANDO CONOCIMIENTO
Ver vídeo “Study Design” del tópico de Epidemiología y Estadística de OnlineMedEd
https://onlinemeded.org/epidemiology-and-stats/study-design y luego conteste:
4. Compara
Estudio caso/control Estudio de cohorte
Según tipo de fuente
Relación causa-
efecto
Medida de riesgo
2 Pineda EB, De Alvarado EL. Metodología de la investigación, 3ra ed. OPS; 2008.
16
Razón o índice
Cociente entre magnitudes en la que ningún caso del numerador está incluido en el
denominador. Indican cuantas veces sucede el hecho que está en el numerador con
respecto al hecho que está en el denominador. Por ej.: indica cuántos hombres hay por
𝑁° 𝑑𝑒 ℎ𝑜𝑚𝑏𝑟𝑒𝑠
cada mujer. 𝑅𝑎𝑧ó𝑛 𝑑𝑒 𝑚𝑎𝑠𝑐𝑢𝑙𝑖𝑛𝑖𝑑𝑎𝑑 = 𝑁° 𝑑𝑒 𝑚𝑢𝑗𝑒𝑟𝑒𝑠
Proporción
Describen la fracción que una serie de sucesos representa respecto al total de sucesos
de igual índole. El numerador está incluido en el denominador. Cuando el resultado se
multiplica por 100 resulta un porcentaje.
Ejemplo: En Chile en el 2000 se controló el estado nutricional de 1,160,813 niños menores
de 6 años. En el mismo año la Región Metropolitana controló 390,464 niños de igual edad.
390,464
% 𝑑𝑒 𝑐𝑜𝑛𝑡𝑟𝑜𝑙𝑒𝑠 𝑑𝑒𝑙 𝑝𝑎í𝑠 𝑟𝑒𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑠 𝑒𝑛 𝑅𝑀 = 𝑥 100 = 33.63%
1,160,813
Tasa
Relación entre el número de casos en un período de tiempo y el total de la población.
La incidencia y la prevalencia son tasas, sus diferencias se citan en la siguiente tabla4:
Incidencia Prevalencia
Indica la probabilidad de desarrollar la Indica la probabilidad de que ya se
enfermedad padezca la enfermedad
En el numerador deben estar sólo los En el numerador están todos los casos,
casos nuevos nuevos y viejos
Para su cálculo se necesita el No necesita seguimiento
seguimiento de los individuos
Su valor no depende de la duración de Su valor depende de la duración de la
la enfermedad enfermedad
Valora y cuantifica enfermedades Valora y cuantifica enfermedades
agudas crónicas
Medida utilizada para investigar y Medida utilizada para valorar la carga y
establecer relaciones causales el coste de una enfermedad crónica
El factor puede ser 1,000 o 10,000. Se leería, por ejemplo, 50 casos por cada 1,000
habitantes o por cada 10,000 habitantes en x período de tiempo.
3 Castillo B. Indicadores en Salud. Tasas, Razones y Proporciones. Escuela de Salud Pública. Facultad de Medicina, Universidad de Chile.
Chile: 1999.
4 Mirón Canelo JA, Alonso Sardón M. Medidas de frecuencia, asociación e impacto en investigación aplicada. Med. segur. trab.
APLICANDO CONOCIMIENTO
3. ¿Por qué el cálculo de incidencia es tan riguroso? ¿En qué tipo de estudio
se calcula incidencia?
18
SESGO
Aparte de elegir una metodología correcta, hay que evitar el sesgo.
Durante el proceso de planificación de la investigación se deben identificar las fuentes
potenciales de parcialidad, sesgo y/o subjetividad. En otras palabras, «la validez del
conocimiento derivado de cualquier estudio dependerá, en gran medida, de la
ausencia de error». De tener fuentes de sesgo, el análisis estadístico posterior de los
datos estará viciado por lo que hay que evitarlo.
Se define sesgo como todo lo que afecta el resultado del estudio, pero no es lo que
estás tratando de probar/evaluar. Es cualquier error diferencial –en relación con los
grupos que se comparan– en que se puede incurrir durante el diseño, conducción o
análisis del estudio y que invariablemente resulta en una conclusión errónea, ya sea
proporcionando una estimación más baja o más alta del valor real de la asociación
que existe en la población blanco.
Fuentes de sesgo
Hay múltiples fuentes de sesgo. Según las fuentes de sesgo para un estudio primario
tenemos: los sujetos a estudiar, los investigadores y los factores inherentes al estudio.
Fuentes de
sesgo
Inherentes a
Sujetos Investigadores
investigación
Variable
Efecto Parcialidad al Sesgo a la Sesgo del Variable de
modificadora
Hawthorne recordar selección observador confusión
del efecto
19
Fuentes de sesgo
Sujetos Investigadores Inherente al estudio
_________________
21
Carlos Manterola et al. Revisiones sistemáticas de la literatura. Qué se debe saber acerca de ellas. 2011
22
APLICANDO CONOCIMIENTO
Ver vídeo “Bias” del tópico de Epidemiología y Estadística de OnlineMedEd
https://onlinemeded.org/epidemiology-and-stats/bias
Edad materna
(˃35 años)
Hábito
Edad
tabáquico
Analizando…5
Si tenemos dos cortes de tela de unos 8 metros cada uno para hacer unas
cortinas, una es lisa de color amarillo y la otra estampada con flores de diversos
colores, y necesitamos elegir unos botones adecuados para adornarlas, el color
del barral para colgarlas y el hilo para coserlas, al salir de casa para ir a buscar lo
que necesitamos no cargaríamos con toda la tela; tan solo con llevar una muestra
de cada una tendríamos idea exacta de la tela, la pregunta es:
¿La muestra a cortar de tela amarilla será del mismo tamaño que de la
estampada? Claro que NO, con un corte pequeño que hagamos en la punta de
la tela amarilla tenemos idea clara del color, sin embargo, de la estampada
necesitamos obtener un pedazo de tela más grande y así tener idea de todos los
colores que tiene y que me pudieran servir a la hora de elegir los accesorios.
APLICANDO CONOCIMIENTO
Universo
Población
Muestra
Universo
Población
Muestra
25
MUESTREO
Cuando la población contiene muchos elementos6 no es posible ni deseable medir la
variable de interés en todos ellos, ya que:
Es en estos casos, cuando no es posible evaluar a todos los elementos que constituyen
la población, que se utiliza el muestreo que no es más que una herramienta de la
investigación científica, cuya función básica es determinar qué parte de una
población debe examinarse para que la estimación de los parámetros de la población
a partir de la muestra sea correcta, es decir, insesgada.
¿Crees que los estudiantes de medicina sean una buena muestra para cualquiera de
estos casos? Responda y justifique para cada uno de los 3 estudios.
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
________________________________________________________________________________________
Es por tanto muy importante la elección de una técnica de muestreo que nos asegure
que la muestra escogida es “adecuada” para el estudio que queremos realizar7.
6Se considera una población grande, aquella con más de 1,000 elementos constitutivos.
Por lo tanto, una población que contenga menos de 1,000 elementos debería estudiarse
por completo.
7Barreiro PL, Albandoz JP. Población y muestra: Técnicas de muestreos [monografía en Internet]. Management Mathematics for
European Schools; 2001 [fecha de acceso 7 de diciembre 2014]. Disponible en: http://goo.gl/QtHqSp
26
Por ejemplo, imagina que queremos conocer el grado de satisfacción de los pacientes
de un hospital y para ello vamos a entrevistar a algunos de 10 a 12 de la mañana. Esto
quiere decir que las personas que vayan por la tarde no se verán representadas por lo
que la muestra no representaría a todos los pacientes.
Criterios de selección8
Antes de elegir la técnica de muestreo a utilizar, se debe tener claro los criterios a utilizar
para seleccionar a los sujetos.
Criterios de inclusión
Los criterios de inclusión definen las principales características de la población a
estudiar, lo que corresponde a la pregunta de investigación.
Criterios de exclusión
Los criterios de exclusión comprenden a aquellos pacientes que cumplen con
los criterios de inclusión pero que pueden interferir en alguna de las variables de
análisis.
Técnica de muestreo
El muestreo puede ser probabilístico y no probabilístico, éste último no se detallará
extensamente ya que, en su mayoría, no permite cumplir con los rigores de
representatividad y cientificidad que requieren los estudios a nivel poblacional.
8 Fuentes FS. ¿Cómo se desarrolla un protocolo? Orthotips. 11(2); 2015. Disponible en: https://goo.gl/bdFw1A
27
Muestreo casual o accidental: los individuos son elegidos de manera casual. Las
personas que realizan el estudio eligen un lugar o un medio, y desde ahí realizan el
estudio a los individuos de la población que accidentalmente se encuentren a su
disposición.
OJO.- Antes de continuar es necesario aclarar que la aplicación de los métodos que
se tratan a continuación es la más recomendada pero, de por sí, su aplicación rigurosa
es tediosa y más si existe una precaria gestión de la información del paciente; sin
embargo, asumamos el reto y hagamos nuestra recolección de datos.
9Universo fórmulas [sede Web]. Valencia; 2014 [fecha de acceso 7 de diciembre de 2014]. Requena Bernat. Muestreo. Disponible
en: http://goo.gl/3smUUt
28
Cuando utilizarlo:
Se debe utilizar cuando los individuos de la población «son»
homogéneos respecto a las características a estudiar.
Es poco recomendado cuando la población es muy grande
y heterogénea (los individuos presentan características dispares).
Homogéneo podría ser una población de adolescentes embarazadas en
determinada edad gestacional y con alguna clínica o patología específica.
Algo heterogéneo sería embarazadas de cualquier edad, no importando la
edad gestacional, y sin importar si presenta una u otra patología. En tal caso,
habría que estratificar en grupos según la edad de la madre, del
embrión/feto o de las patologías y, luego, extraer una muestra de cada
grupo. Más adelante se explica el proceso de estratificación.
Muestreo sistemático:
Una muestra sistemática es obtenida cuando los elementos son seleccionados en
una manera ordenada. La manera de la selección depende del número de
elementos incluidos en la población y el tamaño de la muestra. El número de
elementos en la población (N) es, primero, dividido por el número deseado en la
muestra (n). El cociente indicará si cada décimo, cada onceavo, o cada centésimo
elemento en la población será seleccionado. El primer elemento de la muestra es
𝑁
seleccionado al azar (un número entre 1 y ). Por lo tanto, una muestra sistemática
𝑛
puede dar la misma precisión de estimación acerca de la población, que una
muestra aleatoria simple cuando los elementos en la población están ordenados al
azar, además que brinda una cobertura de unidades de todos los tipos.
Procedimiento:
o Conseguir un listado de N elementos.
o Determinar un tamaño de muestra n.
𝑁
o Definir un intervalo de salto k; 𝑘 = .
𝑛
o Elegir un número aleatorio, i, entre 1 y k (i =arranque aleatorio).
o Seleccionar los elementos de la lista.
© Universo Fórmulas
29
Este tipo de muestreo requiere que previamente nos hayamos asegurado de que los
elementos ordenados no presentan periodicidad en las variables objeto de estudio.
Puede ser útil en el caso de que, por ejemplo, se trabaje con récords como fuente
de información, estos estén organizados por cajas o en anaqueles y se tenga la
suerte de trabajar en un hospital en donde solo atienden a pacientes con las
características o criterios de inclusión (como es el caso de «recién nacido de tal
período» en una maternidad), solo habría que buscar los récords de esa fecha y
comenzar a elegir los récords según el intervalo de clase (k) calculado.
Por otro lado, también puede utilizarse en el caso de que la información de los
pacientes esté guardada en forma digital. Solo se tendría que crear una lista de los
mismos y elegirlos según el método correspondiente. Esto aplica también si la fuente
de información es el libro de ingresos o egresos del centro médico.
Ventajas:
Podemos tener información con más precisión dentro de las subpoblaciones
sobre la característica objeto del estudio.
Podemos aumentar la precisión de los estimadores de las características de
toda la población.
30
Inconvenientes:
La elección del tamaño de las muestras dentro de cada estrato para que el
total sea n (muestra «total»).
La división en estratos en algunas poblaciones puede no ser sencilla.
Nota: Para conocer cómo se calculan los estimadores dependiendo del tipo de
muestreo puede examinar el documento «Población y muestra: Técnicas de
muestreos» de Barreiro y Albandoz.
APLICANDO CONOCIMIENTO
ESTADÍSTICOS Y PARÁMETROS 10
Parámetro:
Es una cantidad numérica calculada sobre una población.
Ej.: Altura media de los individuos o la proporción de individuos altos en un país.
La idea es resumir toda la información que hay en la población en unos pocos
números (parámetros).
Estadístico:
Es una cantidad numérica calculada sobre una muestra.
Ej.: Altura media o proporción de estudiantes altos en el aula.
Si un estadístico se usa para aproximar un parámetro se le conoce como
estimador.
Normalmente nos interesa conocer un parámetro, pero por la dificultad que conlleva
estudiar a toda la población, calculamos un estadístico/estimador sobre una muestra
y «confiamos» en que sean próximos. Más adelante veremos cómo elegir muestras para
que el error sea «confiablemente» pequeño.
Tipos de estadísticos:
Existen diferentes tipos de estadísticos dependiendo de la característica que describa
el mismo. En este material solo se enfatizarán algunos estadísticos de centralidad y
dispersión, los demás serán impartidos en las clases de Bioestadística I.
De posición
Dividen un conjunto ordenado de datos en grupos con la misma cantidad de
individuos.
Son los cuantiles, percentiles, cuartiles, deciles, etc.
De centralidad
Indican valores con respecto a los que los datos parecen agruparse (valores
centrales).
Son la media, mediana y moda.
De dispersión
Indican la mayor o menor concentración de los datos con respecto a las
medidas de centralidad.
Son la desviación típica, rango, rango intercuartílico, varianza.
De forma
Hace referencia a la configuración que posee la distribución de una variable en
la población.
Son las medidas de asimetría y apuntamiento o curtosis.
Media (𝜇/𝑥̅ )
Es la media aritmética (promedio) de los valores de una variable. En otras palabras,
si estás trabajando con una muestra es la suma de los valores dividido por el tamaño
2+2+3+7
muestral (n). Por ej.: media de 2, 2, 3, 7 es = 3,5.
4
Mediana de 1, 2, 4, 5, 6, 6, 8 es 5
Mediana de 1, 2, 4, 5, 6, 6, 8, 9 es (5+6)/2=5,5
Moda (Mo)
Es el valor donde la distribución de frecuencia alcanza un máximo. Se refiere al valor
o a los valores que más se repiten dentro del grupo en estudio. De los ejemplos
anteriores, la moda es el número 6 que se repite 2 veces.
Los factores antes citados son causas de variabilidad en el valor que toma una variable,
en este caso la puntuación del desempeño en un fogueo. La medición de la misma se
hace a través de los estadísticos siguientes.
Varianza (𝜎 2 /𝑠 2 )
Mide el promedio de las desviaciones de las observaciones con respecto a la
media.
Es sensible a valores extremos (alejados de la media).
Sus unidades son el cuadrado de las de la variable. De interpretación
difícil. Es como si mi variable estuviera en metros (distancia) y el
estadístico en m2 (área).
APLICANDO CONOCIMIENTO
VARIABLES 11,12,13,14
Se puede definir una variable estadística como cada una de las cualidades o
características susceptibles de ser medidas que poseen los sujetos de una población.
Estas pueden ser:
Variable cualitativa
Las variables cualitativas son características o cualidades que no pueden ser
medidas con números. Podemos distinguir dos tipos:
V. cualitativa nominal
Presenta modalidad no numérica, o sea, que no admiten un criterio de orden.
Pueden ser:
Dicotómicas o binarias si solo admiten dos características: sano/enfermo,
expuesto/no expuesto, hombre/mujeres, etc.
Policotómicas con varias categorías: grupo sanguíneo (A/B/AB/O…), estado
civil, etc.
V. cualitativa ordinal
Es lo contrario de la nominal, esta presenta modalidades no numéricas en las que
existe un orden. Como existe un orden, puede ser convertida a un equivalente
numérico.
Ej.: Etapificación de tumores, el Apgar, el Killip, puesto conseguido en una prueba
deportiva: 1º, 2º, 3º, interés en dejar de fumar, nivel máximo de estudios, grado de
dolor, intensidad del hábito tabáquico.
Variable cuantitativa
Una variable cuantitativa es aquella que se expresa mediante un número, con estas
se pueden realizar operaciones aritméticas. Podemos distinguir dos tipos:
V. discreta
Aquella que toma valores aislados, es decir no admite valores intermedios
(decimales) entre dos valores específicos.
Ej.: Número de hijos, episodios de infección urinaria, cantidad de intervenciones
previas, número de intentos para dejar de fumar.
V. continua
Es aquella que puede tomar valores comprendidos entre dos números
(decimales). Ej.: tensión arterial, peso, edad, talla, IMC.
11 Fernández SP. Elementos básicos en el diseño de un estudio. Cad Aten Primaria. 1996. 3:83-85.
12 Kenneth JR. Epidemiología Moderna. Ediciones Díaz de Santos, S.A. 1987.
13 U.S. Department Of Health And Human Services. Principles Of Epidemiology: An introduction to applied epidemiology and
Variable independiente
Tiene la capacidad de influir, incidir o afectar a otras variables. Se le conoce como
variable explicatoria o predictora, ya que explica o predice el valor de la variable a la
cual influye; por lo tanto, afecta al valor que toma otra variable.
Variable dependiente
Es aquella variable objeto de investigación que varía según las modificaciones de la
variable independiente. El comportamiento de la misma puede que no se conozca al
inicio de la investigación.
Ejemplo:
¿Cómo influye la música clásica en la presión arterial de los pacientes?
V. dependiente: "la presión arterial de los pacientes".
V. independiente: "la música clásica".
APLICANDO CONOCIMIENTO
IMC Volemia
Densidad Cigarrillo
TA Altura
CA pulmón Presión
TAMAÑO MUESTRAL 15
El tamaño de la muestra necesario estará condicionado por los objetivos del estudio,
que determinan el diseño, las variables que deben considerarse y todo el método
planteado para dar respuesta a dichos objetivos. Así, si el objetivo del estudio es
conocer la prevalencia de diabéticas en un grupo de mujeres embarazadas de un
determinado centro de salud, lo que se desea conocer es una proporción y, en este
caso, se habla de «estimación de parámetros».
Para lograr una correcta estimación a partir de los estadísticos de los parámetros de la
población, es necesario hacer un muestreo probabilístico y trabajar con una muestra
de tamaño adecuado. La fórmula para calcular el tamaño de la muestra dependerá
del tipo de variables a estudiar. De ahí que se distinga entre el cálculo del tamaño de
la muestra para estimar la media (𝜇) y varianza (σ2) de una variable cuantitativa, y el
cálculo del tamaño de la muestra para obtener la frecuencia o proporción (ρ) de una
variable cualitativa (es el caso de investigar prevalencia e incidencia). En la práctica,
muchos de los estudios estiman tanto variables cuantitativas (ej.: edad, peso, tensión
arterial) como variables cualitativas (ej.: sexo, grupo sanguíneo). De ahí que deba
elegirse el método que provea el mayor tamaño muestral o que utilice la variable de
mayor “peso” para el estudio.
15 Fuentelsaz Gallego C. Cálculo del tamaño de la muestra. Matronas Profesión [en línea] 2004 [fecha de acceso 21 de noviembre
de 2014]; 5(18): 5-13. Disponible en: http://goo.gl/rdi9Zx
16 Aguilar Barojas S. Fórmulas para el cálculo de la muestra en investigación de salud. Salud en Tabasco [en línea] 2005 [fecha de
Donde:
n = tamaño de la muestra.
N = tamaño de la población.
Z = valor de Z crítico a utilizar que depende del nivel de confianza que se quiera
tener. Por ejemplo, para un nivel de confianza del 95%, Z0.05 será igual a 1.96.
Ahora bien, puede que surja la pregunta ¿Cómo se puede determinar la varianza
poblacional (σ2) sin haber realizado el estudio? De ahí que se deba saber cómo estimar
el valor de σ2.
Estimación de σ2
Las fórmulas para el tamaño de la muestra requieren del conocimiento de σ 2 pero,
como ya se ha señalado, la varianza de la población casi siempre se desconoce.
Como resultado, es necesario estimar σ2. Las fuentes de estimación de σ2 que se utilizan
con más frecuencia son las siguientes:
18La letra alpha significa nivel de significancia, que es igual a 1 menos el nivel de confianza
(ej.: 1-0,95=0,05).
29
Ejemplos
Población desconocida: ¿Cuántas mujeres será necesario estudiar para estimar
la media de glucemia de las embarazadas que han acudido a control pre-natal
de un determinado hospital?
(1,96)2 (20)2
𝑛= = 61.47 ≅ 62
(5)2
Al igual que en el apartado anterior, puede que surja la pregunta ¿Cómo se puede
determinar la proporción poblacional (p) sin haber realizado el estudio? De ahí que se
deba saber cómo estimar el valor de p19.
Estimación de p
Como puede observarse, ambas fórmulas requieren que se conozca p que es la
proporción que posee la característica de interés en la población. Obviamente, dado
que este es el parámetro que se desea estimar, será desconocido. Una solución para
este problema consiste en tomar una muestra piloto y calcular una estimación (𝑝̂ ) para
utilizarla en lugar de p dentro de la fórmula para n.
Algunas veces el investigador tendrá noción de algún límite superior que podrá utilizar
en la fórmula. Por ejemplo, si se desea estimar la proporción de alguna población que
presenta cierta discapacidad, es posible que se crea que la proporción real no puede
ser mayor que, digamos, 0.30. Se sustituye entonces por 0.30 en la fórmula para n.
Si es imposible obtener una mejor estimación, se puede igualar p a 0.50 y resolver para
n. Dado que p = 0.50 proporciona el máximo valor de n, este procedimiento dará una
muestra lo suficientemente grande para alcanzar la confiabilidad y la dimensión del
intervalo deseadas. Sin embargo, puede ser más grande de lo necesario y resultar más
costosa que si se dispusiera de una mejor estimación de p. Este procedimiento se debe
utilizar solamente si no se puede llegar a una mejor estimación de p.
Ejemplos
Población desconocida: ¿Cuántas mujeres será necesario estudiar para estimar la
prevalencia de dolor lumbar en una población de embarazadas?
Con un nivel de confianza del 95% (α = 0.05; 𝑧𝛼 = 1.96), un error máximo admitido de
±8% (d) y un valor de prevalencia conocido por la bibliografía del 20% (p), el tamaño
de la muestra necesario será de 96 mujeres:
(1,96)2 (0,20)(0,80)
𝑛= = 96.04 ≅ 96
(0,08)2
Se decide trabajar con un nivel de confianza del 90% (α = 0.10; 𝑧𝛼 = 1.645), un error
máximo admitido de ±3% (d). Se asume que la prevalencia (proporción) de diabetes
mellitus en la población no puede ser mayor de 6% (p). De ahí que el tamaño de la
muestra necesario sea de:
APLICANDO CONOCIMIENTO
Epidemia
Se habla de epidemia cuando una enfermedad comienza a tener una prevalencia
(número de personas que presentan el mismo padecimiento) mayor a lo que se espera
o se puede controlar, también se considera epidemia cuando la incidencia que son
los casos nuevos de la enfermedad rebasan lo estimado. La epidemia puede estar
restringida a un área local. Ej.: la chikungunya en el 1er año de entrada al país o la
diabetes a nivel global. La primera tuvo una alta incidencia (enf. aguda), la segunda
tiene una alta prevalencia (enf. crónica).
Pandemia
Hace referencia a la presentación de la enfermedad en varios países y continentes
simultáneamente, y relacionados por un detonante común. Ej.: la influenza A H1N1,
también enfermedades como diabetes, cáncer, VIH-SIDA, han sido consideradas
pandemias.
Brote
Es el aumento del número de casos de una enfermedad o situación de salud, limitado
en el tiempo, lugar y personas. Puede convertirse en una epidemia. Ej,: intoxicación por
toxina botulínica.
Factor de riesgo
Es toda característica o circunstancia de una persona o grupo de personas que se sabe
está asociada con un incremento en la probabilidad de padecer, desarrollar o estar
en especial vulnerabilidad a un proceso mórbido.
Vigilancia epidemiológica
Se define como la utilización de los conceptos, fundamentos, categorías y
comportamiento del proceso salud-enfermedad en la sociedad, a través de una
estructura incluida en el sistema nacional de salud, la cual permite, mediante el
conjunto de actividades que le son propias, obtener la información pertinente, explicar
en todo momento el perfil de salud de la población, y detectar y prever los cambios
que puedan ocurrir para recomendar oportunamente sobre bases objetivas y
racionales los mecanismos de vigilancia epidemiológica como un instrumento de
apoyo a los servicios de atención a la salud.
DISTRIBUCIÓN DE PROBABILIDAD
Es importante que leas este apartado para que puedas entender las pruebas estadísticas a explicar
en el taller.
Conceptualización
La probabilidad, desde el punto de vista subjetivo, es el grado de certeza que se posee
de la ocurrencia de un suceso. Otros lo definen como la frecuencia de aparición de un
suceso, por ejemplo, cuántas personas contraen Influenza B por cada 100 habitantes.
Por ejemplo: Se conoce que al lanzar una moneda la probabilidad de obtener cara o
escudo es del 50% o de 0.5. Si se lanza la moneda sucesivamente 20 veces, se podrían
obtener los siguientes resultados:
Cara Escudo Cara Cara Escudo Cara Cara Escudo Escudo Cara
Escudo Cara Escudo Cara Escudo Escudo Escudo Cara Escudo Escudo
Cabe decir que las distribuciones de probabilidad Figura 2 Relación entre las dos funciones
de probabilidad (el símbolo P significa
podrán presentarse en forma de tabla, gráfica o Probabilidad)
fórmula. Conocer la distribución de probabilidad
para la variable aleatoria proporciona al médico y al investigador herramientas
poderosas para simplificar y describir un conjunto de datos, y para llegar a conclusiones
acerca de la población sobre la base de una muestra.
En la práctica hay unas cuantas leyes de probabilidad teóricas, como son, por ejemplo,
la ley binomial y la de Poisson para variables discretas o la ley normal para variables
continuas, que sirven de modelo para representar las distribuciones empíricas más
frecuentes. Sin embargo, más adelante se obviará la fundamentación estadística de
39
Orientándote un poco
Ante todo, suponemos que ya sabes que puedes conocer la probabilidad
de obtener un resultado en tu investigación. Ese resultado puede ser una
media (𝑥̅ ), una varianza (𝑠 2), una razón, una proporción (𝑝̂ ) o frecuencia.
Para lograrlo, en general, se necesita que la población siga una distribución
ya conocida, como la normal estándar o la de Fisher o, de no seguir la
distribución seleccionada, que la muestra sea suficientemente grande
(n≥30 para medias, n≥100 para proporciones).
Entonces, ¿Cómo lo hacemos? Se utilizan tablas estandarizadas que, para
una distribución específica de la variable, presentan la probabilidad de
obtener valores o intervalos de valores. Por ejemplo, la media de la
concentración de glucosa en sangre (glucemia) de tu estudio puede ser
de 143.8mg/dL. Podrías preguntarte ¿Este valor no es muy alto ya que la
población de dónde saqué la muestra tiene una media de 73.4mg/dL?
Para responder esa pregunta los estadísticos utilizan la probabilidad,
teniendo que cuando la probabilidad de obtener un valor (como el 143.8)
es muy pequeña, el evento es muy raro y, por ende, se podría considerar a
la muestra como un grupo diferente con respecto a la población. ¿Para
qué sería útil saber que mi muestra es diferente a la población? Porque
permitiría que se busque una explicación a la diferencia. Con esto se podría
conocer a qué factores están expuestos las personas de mi muestra que los
hace más propensos a tener una glucemia alta. Es importante señalar que,
como se busca saber la probabilidad de obtener cierto valor en una
población, es necesario conocer los parámetros (varianza o proporción)
que definen esa población, de ahí que, de no conocerlos deban de ser
estimados. La estimación de estos parámetros es explicada en el apartado
de Cálculo del tamaño de la muestra.
De ahí que, para conocer si el evento es raro, es decir, si la probabilidad de
que ocurra es muy pequeña, los datos que obtenemos en la recolección
de datos (por ejemplo la media de glucemia en sangre, la cantidad de
pacientes con diabetes en tu muestra, la diferencia en el tiempo durado
haciendo una laparoscopía y una cirugía abierta) son transformados en
valores estandarizados que nos permiten utilizar las tablas y conocer la
probabilidad de obtener determinado valor. Por eso, no es necesario que
construyamos la distribución de cada variable cada vez que hagamos un
estudio sino que solo debemos convertir nuestros datos en valores estándar
que ya tienen una probabilidad asociada en la distribución normal
estándar, la distribución de Fisher, etc. En la página siguiente se presenta un
esquema sobre la utilidad práctica de la teoría de la probabilidad en una
investigación (Figura 3).
40
PRUEBAS ESTADÍSTICAS
Las pruebas estadísticas son útiles para determinar la probabilidad de obtener
determinado valor de una variable aleatoria en la muestra, conociendo los parámetros
de la población. También permite comparar dos muestras para determinar si estas son
diferentes. Esto sería útil para, por ejemplo, determinar la diferencia en eficacia de dos
fármacos, o la proporción diferencial de determinada patología entre expuestos y no
expuestos a un agente patológico, etc. Aquí se hace un resumen -no meticuloso- de
las pruebas estadísticas comentadas en el taller de bioestadística para BioINTEC.
INTERVALO DE CONFIANZA
La estimación puntual aproxima mediante un número el valor de una característica
poblacional o parámetro desconocido (la altura media de los dominicanos, la
intención de voto a un partido en las próximas elecciones generales, el tiempo medio
de ejecución de un algoritmo, el número de carros públicos…) pero no nos indica el
error que se comete en dicha estimación.
Los valores más habituales del nivel de confianza 1−α son 0.9, 0.95 o 0.99 (la confianza
es del 90%,95% o 99%). En ocasiones también se emplea la terminología nivel de
significación para el valor α
_____________________
Alejandro Quintela del Rio. Estadística Básica Edulcorada. 2019