Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo
Tamaño de la muestra
143
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
144
ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |
Tabla 15.2 Tipos de error aleatorio en una prueba estadística de contraste de hipótesis
Realidad (población)
145
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
c ontrasta. Si se pretende determinar si dos fármacos de dos muestras puede ser significativa, aunque se
A y B difieren en su eficacia, sin decir cuál de ellos hayan estudiado tan sólo 20 sujetos, mientras que
ha de ser mejor o peor, se habla de hipótesis bilateral, una pequeña diferencia de 3 mg/100 ml no alcanza
o de dos colas (fig. 15.1). En cambio, si la hipótesis suficiente significación, aunque se hayan estudiado
alternativa es que el fármaco A es más eficaz que el 200 individuos en cada grupo.
B, se habla de hipótesis unilateral, o de una cola. En Para calcular el tamaño de la muestra, debe de
este caso, interesa únicamente evaluar si B es, como finirse la mínima magnitud de la diferencia o de la
mínimo, tan eficaz como A, es decir, tan sólo una asociación que se desea detectar y que se considera
de las direcciones de la comparación. de relevancia clínica. Esta diferencia debe fijarse en
Desde un punto de vista estricto, son preferi términos realistas, dentro del rango de valores es
bles las hipótesis bilaterales, ya que son más con perables. A menudo, es tentador utilizar diferencias
servadoras y requieren un mayor número de partici más amplias, ya que se obtiene un tamaño de la
pantes. muestra más reducido. Esta actitud debe evitarse,
ya que implica que diferencias menores a la es
Magnitud de la diferencia tablecida, a pesar de que pueden ser de importancia
clínica, no alcanzarán el grado de significación es
o de la asociación
tadística con el número de sujetos estudiados. Si,
La magnitud de la diferencia o de la asociación por ejemplo, se utiliza una diferencia del 50% en la
tiene una gran influencia sobre el tamaño de la eficacia de los dos fármacos en el cálculo del tamaño
muestra. Si la diferencia es muy amplia (p. ej., si de la muestra, se necesitará un número reducido de
la eficacia del fármaco A es el doble que la del B), sujetos, pero una diferencia del 40%, que puede ser
se podrá detectar con más facilidad que si es de es muy importante desde el punto de vista clínico, no
casa magnitud, y requerirá un número menor de será estadísticamente significativa, ya que el inves
sujetos. En la tabla 15.3 puede apreciarse cómo una tigador ha decidido considerar como importantes
diferencia de 40 mg/100 ml en la media de colesterol sólo las diferencias superiores al 50%.
Figura 15.1 Valores de la distribución normal tipificada (Z) correspondientes al valor a del 5% en las pruebas
estadísticas unilaterales y bilaterales.
146
ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |
Tabla 15.3 Influencia del número de sujetos estudiados y la magnitud de la diferencia sobre
la significación estadística
Muestra 1 20 260 ± 20
6,32 < 0,001
Muestra 2 20 220 ± 20
Ejemplo 2. Una diferencia de escasa magnitud no es estadísticamente significativa,
aunque se haya estudiado un elevado número de sujetos
n Colesterolemia (media ± DE) t p
147
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
148
ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |
Tabla 15.4 Valores de Za utilizados con mayor frecuencia en el cálculo del tamaño de la muestra
Za
se aceptan. Es importante destacar que una misma riesgo de cometer un error a será el convencional
diferencia del 5% entre dos porcentajes requiere el del 5% (hipótesis bilateral) y el de cometer un error
máximo número de pacientes cuando éstos se sitúan b, del 20% (potencia: 1 − b = 0,80). A partir de estos
alrededor del 50%. Ello se debe a que, si el porcentaje datos, puede calcularse el valor de P2:
del grupo de referencia es del 5%, una diferencia del
5% implica que el grupo de estudio debe pasar a P2 = P1⋅RR = 0,10⋅2 = 0,20 (o 20%)
un 10%, es decir, dobla la eficacia. En cambio, si el
porcentaje del grupo de referencia es del 50%, una Aplicando la fórmula del cuadro 15.3 o la tabla D
diferencia del 5% implica solamente un incremento del final del libro, puede determinarse que son nece
relativo del 10%, es decir, pasar del 50 al 55%. sarios 199 sujetos por grupo. Este número representa
el tamaño mínimo tanto del grupo de expuestos
como del de no expuestos. Por lo tanto, si desea es
Estimación de un riesgo relativo
tudiar una cohorte general, o si se deben identificar
Si el objetivo del estudio es determinar la magnitud los sujetos expuestos a partir de una muestra de la
de la asociación en términos relativos, la medida que población general, se deberá determinar el número
se utilizará en los estudios prospectivos (ensayos de sujetos que habrá que examinar para identificar
149
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
150
ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |
ser capaz de detectar. Sin embargo, este procedimien N: número de sujetos necesarios en cada uno
to infraestima el número de sujetos necesarios. de los grupos.
Tal como se comenta en el capítulo 5, la inter Za: valor de Z correspondiente al riesgo a fijado
pretación de los resultados de los estudios de (tabla 15.4).
equivalencia se basa en el análisis del intervalo Zb: valor de Z correspondiente al riesgo b fijado
de confianza (IC) de la diferencia observada, de mane (tabla 15.5).
ra que se considera que existe equivalencia si todo el IC P: proporción que se espera en el grupo control
se sitúa dentro de los márgenes de equivalencia (o si (en caso de una variable cualitativa)
su límite inferior está por encima de dicho margen S2: variancia de la distribución de la variable de
en los estudios de no-inferioridad). Para obtener un respuesta (en caso de una variable cuantitativa)
IC lo suficientemente estrecho es necesario estudiar d: diferencia máxima entre las respuestas
a ambos tratamientos que se tolerará para concluir
un número de sujetos sustancialmente más elevado
que son equivalentes (margen de equivalencia)
que en los estudios de superioridad. Por lo tanto, en
d*: diferencia esperada entre las respuestas
el cálculo del tamaño de la muestra en este tipo de
a ambos tratamientos
estudios debe tenerse en cuenta no solamente el
margen de equivalencia establecido, sino también
el valor esperado de la respuesta (Tamayo-Sarver
El mismo resultado se obtendría si el estudio se
et al, 2005), tal como se muestra en la fórmula del
plantease con una hipótesis de no-inferioridad, en
cuadro 15.4. La tabla G del final del libro presenta el
el que los investigadores definieran que considera
número de sujetos necesarios para estudios de equi
rían que la monodosis es mejor alternativa terapéutica
valencia en las situaciones más habituales cuando la
si no es más de un 10% inferior a la pauta de 7 días.
variable de respuesta es dicotómica.
Este procedimiento suele sobreestimar el número
de sujetos necesarios. Para obtener un cálculo más
Ejemplo 15.8. Un estudio se propone evaluar la
ajustado, puede utilizarse una fórmula basada en el
eficacia de una pauta monodosis para el tratamiento
cálculo del IC, tal como se comenta a continuación.
de las infecciones urinarias frente a la pauta habi
tual de 7 días, cuya eficacia se sitúa alrededor del
© Elsevier. Fotocopiar sin autorización es un delito.
151
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
a favor de la existencia de una diferencia clínicamente Si pensamos que la diferencia más realista entre
relevante. De modo similar, si el valor superior del IC grupos es del 14% (P1 = 20%, P2 = 34%) y desea
está por debajo del valor de la diferencia mínima, el mos que el límite inferior del IC del resultado esté
resultado es concluyente a favor de la ausencia de una por encima de la mínima diferencia clínicamente
diferencia clínicamente relevante. relevante (9,5%), la diferencia entre ambos valores
En algunas ocasiones existe desacuerdo entre el mé es del 5,5%, por lo que la amplitud del IC será del
todo del cálculo del tamaño de la muestra basado en 11% (WIC = 2 × 0,055 = 0,11). Aplicando la fórmula
el contraste estadístico de hipótesis y la interpretación anterior, se obtiene que se requieren 748 pacientes
de los resultados basada en los IC. Este desacuerdo por grupo.
es evidente cuando el investigador ha calculado el Debido a que WIC será habitualmente un valor
tamaño de la muestra necesario para detectar, con pequeño, el tamaño de la muestra será superior al
una determinada potencia estadística, una diferencia calculado con el método tradicional, el resultado
mínima entre dos tratamientos, pero el análisis del IC será más preciso y con la suficiente potencia es
del resultado muestra que valores inferiores a dicha tadística. Además, este abordaje tiene la ventaja de
diferencia son compatibles con los datos observados. facilitar la comunicación entre el clínico y el estadís
En esta situación, el investigador no puede concluir tico. Para el clínico es más difícil entender conceptos
con certeza cuál es la mejor alternativa terapéutica. como el de la potencia estadística y el contraste de
hipótesis que la interpretación de un IC.
Ejemplo 15.9. En un estudio que comparaba la Tal como hemos comentado en el apartado
cirugía convencional (P1) con la radical (P2) en anterior, este enfoque es especialmente adecua
el tratamiento del cáncer gástrico, el cálculo del do en el caso de los estudios de equivalencia y
tamaño de la muestra se basó en la asunción de no-inferioridad.
una diferencia en la supervivencia a los 5 años del
14% (P1 = 20%; P2 = 34%) (Fayers et al, 2000). Ejemplo 15.11. Retomemos el ejemplo 15.8 sobre
Tomando como base estas tasas de supervivencia, un estudio hipotético que se propone evaluar la
se requerían 400 pacientes por grupo si se deseaba eficacia de una pauta monodosis para el tratamiento
una potencia estadística del 90%. Al inicio del estu de las infecciones urinarias frente a la pauta habitual
dio, un grupo de 26 cirujanos rellenaron un cues de 7 días, cuya eficacia se sitúa alrededor del 90%
tionario en el que manifestaban que una mejora en (P = 0,90). Los investigadores habían establecido
la tasa de supervivencia del 9,5% podía considerarse el margen de equivalencia (o de no-inferioridad)
clínicamente relevante. Si los resultados del estudio en el 10%. Dado que esperaban encontrar una di
hubieran sido los de las asunciones usadas para el ferencia del 5%, su IC debería tener una amplitud
cálculo del tamaño de la muestra, y 400 pacientes máxima que permitiera descartar el valor de dicho
hubieran finalizado el estudio en cada grupo, se ob margen (un 5% por encima y por debajo del valor
tendría una diferencia del 14% con un IC 95% cuyos observado, por lo que WIC = 2 × 0,05 = 0,10. Apli
límites serían 5,4% y 22,6%. Este resultado, aunque cando la fórmula, se determina que son necesarios
es estadísticamente significativo, no descarta que la 336 sujetos por grupo, estimación inferior a los
diferencia en la supervivencia pueda ser inferior al 565 calculados por el procedimiento utilizado en
9,5%, por lo que no sería concluyente. el ejemplo 15.8.
Este problema se puede evitar basando el cálculo De hecho, si se hubieran estudiado 336 sujetos
del tamaño de la muestra en los IC mediante la por grupo y se hubiera obtenido una diferencia del
siguiente fórmula: 5% entre los grupos, los límites del IC 95% de esta
8Z2 p(1−p) diferencia serían 0,00013 y 0,09987 (es decir, 0,01%
n = _________
a 2
WIC y 9,99%), lo que permite concluir la no-inferioridad
donde n es el número de individuos por grupo, Za es de la monodosis (en caso de obtenerse estos resulta
el valor de Z correspondiente al riesgo a fijado, dos) ya que todo el IC queda por debajo del margen
P es la proporción del parámetro estimado en la pobla del 10% fijado.
ción (P = [P1 + P2]/2) y WIC es la amplitud del IC. Si se hubieran estudiado 565 sujetos por grupo,
como se había calculado anteriormente, y se hubiera
Ejemplo 15.10. Consideramos el estudio planteado encontrado una diferencia del 5%, los límites del
en el ejemplo anterior (Fayers et al, 2000). Aplican IC 95% en este caso serían del 1,2% y 8,8%. Este
do la fórmula: resultado permitiría llegar a la misma conclusión,
8⋅1,962⋅0,27⋅0,73 pero habiendo estudiado un mayor número de
n = _____________
2
WIC sujetos.
152
ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |
153
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
Bibliografía
Bland JM. The tyranny of power: missing at random. Stat Med. in clinical trials for testing
is there a better way to 2010;29(15):1572-9. differences in proportions for
calculate sample size? BMJ. Hauschke D, Kieser M, Diletti the two-sample design: a review.
2009;339:b3985. E, Burke M. Sample size Stat Med. 1996;15:1-21.
Campbell MJ, Julious SA, Altman determination for proving Schlesselman JJ. Case-control
DG. Estimating sample size equivalence based on the ratio studies: design, conduct,
for binary, ordered categorial, of two means for normally analysis. Nueva York: Oxford
and continuous outcomes in distributed data. Stat Med. University Press; 1982.
two group comparison. BMJ. 1999;18:93-105. Tamayo-Sarver JH, Albert JM,
1995;311:1145-8. Marrugat J, Vila J, Pavesi M, Sanz Tamayo-Sarver M, Cydulka
Fitzner K, Heckinger E. Sample size F. Estimación del tamaño de RK. Advanced statistics: how
calculation and power analysis: la muestra en la investigación to determine whether your
a quick review. Diabetes Educ. clínica y epidemiológica. Med intervention is different, at least
2010;36(5):701-7. Clin (Barc). 1998;111:267-76. as effective as, or equivalent:
Florey CV. Sample size for Norman GR, Streiner DL. a basic introduction. Acad
beginners. BMJ. 1993;306: Bioestadística. Madrid: Emerg Med. 2005;12:536-42.
1181-4. Mosby-Doyma; 1996. Whitehead J. Sample size
Kerry SM, Bland JM. Sample size Obuchowski NA. Sample size calculations for ordered
in cluster randomisation. BMJ. calculations in studies of test categorical data. Stat Med.
1998;316:549. accuracy. Stat Methods Med Res. 1993;12:2257-71.
Kosinski AS, Chen Y, Lyles RH. 1998;7:371-92. Wittes J. Sample size calculations
Sample size calculations for Sahai H, Khurshid A. Formulae and for randomized controlled
evaluating a diagnostic test tables for the determination trials. Epidemiol Rev.
when the gold standard is of sample sizes and power 2002;24:39-53.
154
ERRNVPHGLFRVRUJ
Capítulo | 16 |
Muestreo
El principio de representatividad implica que, para más fidedignos al estudiar una muestra que a toda
que los resultados de una investigación tengan vali- la población.
dez interna, la muestra de sujetos estudiados debe También es un problema de cantidad de informa-
ser representativa de la población de estudio. En los ción. Al poder invertir más recursos en el estudio
estudios transversales que estiman un parámetro se de cada individuo, pueden medirse otras variables,
emplean técnicas de muestreo probabilístico, que lo que no es posible hacer en toda la población. Si
aumentan la probabilidad de obtener una muestra algunas de estas variables son potenciales factores de
representativa. Cuando no se dispone de un lista- confusión, su medición posibilita su control en el
do con los miembros que forman la población de análisis, lo que aumenta la validez de los resultados
estudio o cuando ésta es dinámica, y la muestra del estudio.
de sujetos se selecciona por métodos como la in-
clusión consecutiva de los pacientes que acuden a Ejemplo 16.1. En un estudio cuyo objetivo era
la consulta y cumplen los criterios de selección, para conocer la prevalencia de factores de riesgo cardio-
poder realizar inferencias, también debe asumirse vascular en jóvenes de 16 a 19 años, se seleccionó
que la muestra seleccionada es representativa de la aleatoriamente una muestra de 1.176 estudiantes en
población de estudio. los que se evaluaron unos pocos factores de riesgo
(Andersen et al, 1989). A partir de esta muestra se
seleccionó uno de cada cuatro estudiantes, en los
Ventajas del muestreo que además se analizó su perfil lipídico, se midieron
la presión arterial, el pliegue corporal, y el pulso
La razón principal para estudiar una muestra y no en condiciones basales y después de una actividad
toda la población es el ahorro en tiempo, dinero y intensa. Con la finalidad de establecer la represen-
otros recursos. Es una cuestión de eficiencia. Si se tatividad de la segunda muestra se compararon la
ha calculado que son necesarios 300 individuos, y edad, el sexo, la talla y el peso con la primera, y no
la población de referencia la forman 3.000 personas, se encontraron diferencias significativas. El hecho
estudiarlas a todas supone desperdiciar una buena de estudiar un conjunto de variables de forma más
cantidad de recursos, ya que, si la selección de la exhaustiva en una muestra reducida persigue el ob-
muestra y la medición de las variables se realizan jetivo de alcanzar mayor exactitud y estandarización
correctamente, se obtendrá un resultado válido en las medidas llevadas a cabo.
estudiando una muestra representativa de 300 per-
sonas.
Una segunda ventaja del muestreo, también
relacionada con la validez del estudio, es que las Planificación del muestreo
mediciones tenderán a ser de mayor calidad, ya
que se pueden dedicar más esfuerzos al estudiar Las unidades de muestreo son los elementos sobre los
un menor número de individuos. Paradójicamente, que se aplicará la técnica de selección. Pueden ser
podría darse el caso de que se obtuvieran resultados personas, centros de salud o escuelas, por ejemplo.
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
Si se quiere estimar la prevalencia de hipertensión tiende a asegurar que se obtendrá una muestra re-
arterial (HTA) en una población, serán las personas; presentativa, en especial si la población y la muestra
si se pretende conocer el número de escuelas de una son de gran tamaño. Sin embargo, puede que no
provincia en las que se imparte educación sanitaria, sea así, ya que el propio azar puede conducir a una
serán las escuelas. muestra que no tenga la misma distribución de las
Las unidades de muestreo no tienen que coincidir variables de interés que la población de referencia,
necesariamente con las unidades de análisis. En un sobre todo si su tamaño es reducido. Por otro lado,
estudio para conocer la prevalencia de HTA en la po- pueden obtenerse muestras representativas utilizan-
blación escolar, las unidades de muestreo pueden ser do técnicas no probabilísticas.
las escuelas, pero se analiza en cada una la presión En todas las técnicas probabilísticas la selección
arterial de sus alumnos (unidades de análisis). de las unidades se realiza al azar y se evita la posi-
El primer paso para planificar un muestreo suele ble parcialidad, consciente o inconsciente, de los
ser la definición del marco muestral, que es esencial- investigadores. Por esta razón, es más probable que
mente una lista, o forma de identificación, de las las muestras tiendan a ser representativas, aunque
unidades de muestreo sobre las que se aplicará el ello no significa que estén exentas de error. En reali-
proceso de selección. La definición de este marco dad, la muestra seleccionada no es más que una de
debe ser cuidadosa, ya que condiciona la interpre- las muchas que podrían obtenerse de la población
tación de los resultados. de referencia. Es probable que la estimación de la
variable obtenida a partir de una muestra difiera
Ejemplo 16.2. En un estudio sobre la asociación de su verdadero valor en la población de referencia
entre la adaptación social y la depresión, Luty et al por azar (error aleatorio o debido al muestreo), y lo
(2002) comprobaron que esta asociación no varia- es más cuanto menor es el tamaño de la muestra. El
ba entre los diferentes países, pero sí dependía del uso de muestras probabilísticas permite la aplicación
marco muestral del estudio, ya que se observaron de técnicas estadísticas capaces de cuantificar este
resultados diferentes en la comunidad y en los cen- error aleatorio.
tros sanitarios.
Muestreo aleatorio simple
Ejemplo 16.3. Fuchs et al (2001) compararon la
prevalencia de HTA que se obtenía al utilizar dos Es aquella técnica en la que cada unidad del marco
marcos muestrales diferentes: los adultos residentes muestral tiene la misma probabilidad de ser esco-
en una población y los que acuden a una unidad gida y en la que cada una de las posibles muestras
de prevención de la HTA en un centro sanitario. del mismo tamaño tienen la misma probabilidad
Las diferencias en la prevalencia observada (el 24 de ser escogidas. El muestreo aleatorio simple es, pues,
frente al 42%, respectivamente) ilustran la influencia un procedimiento equiprobabilístico, pero no todo
del proceso de muestreo sobre la evaluación de los método equiprobabilístico es aleatorio simple.
factores de riesgo en la población.
Ejemplo 16.4. Silva (1993) ilustra este concepto con
El siguiente paso es decidir cómo seleccionar la el siguiente ejemplo: supongamos un grupo de 10 ni-
muestra. En líneas generales, las técnicas de mues- ños ordenados alfabéticamente, de los que se quiere
treo pueden clasificarse en probabilísticas y no seleccionar una muestra de 5 niños. Consideremos
probabilísticas. los tres siguientes procedimientos de selección:
a) tomar los 5 primeros de la lista; b) dividir el lis-
tado en dos grupos (los 5 primeros y los 5 últimos),
Técnicas de muestreo lanzar una moneda al aire y tomar como muestra
los elementos del primer grupo en caso de obtener
cara, y los del segundo en caso de obtener cruz, y
Muestreo probabilístico
c) numerar los 10 elementos y obtener 5 números
Se define como el proceso de selección en que todos aleatorios. El método a no es probabilístico, ya que
los individuos candidatos tienen una probabilidad los últimos 5 niños del listado no podrán salir en
conocida, distinta de cero, de ser incluidos en la la muestra. El método b es equiprobabilístico por-
muestra. Se utiliza alguna forma de selección aleato- que todos los niños tienen la misma probabilidad
ria para obtener las unidades que serán estudiadas. de salir en la muestra, pero no es aleatorio simple, ya
Existe una tendencia a considerar sinónimas las que sólo dos muestras pueden ser elegidas (existen
expresiones muestra probabilística y muestra representa- subconjuntos de 5 elementos que no podrían ser
tiva. El uso de una técnica de muestreo probabilístico seleccionados). El método c es aleatorio simple, ya
156
ERRNVPHGLFRVRUJ
Muestreo Capítulo | 16 |
que cualquiera de los 252 subconjuntos diferentes Los estratos deben definirse en función de varia-
de 5 niños puede ser seleccionado y con la misma bles que puedan influir sobre los resultados. Si se
probabilidad. desea determinar la prevalencia de HTA en una co-
munidad, posibles factores de confusión serían, en-
Como se deduce del ejemplo anterior, el pri- tre otros, la edad, el sexo o la presencia de obesidad,
mer paso es preparar una lista de las unidades de ya que son variables relacionadas con la presencia
muestreo, numerándolas, por ejemplo, de forma de HTA. Si se aplicara un muestreo aleatorio sim-
secuencial. Este proceso puede ser fácil y rápido ple, podría obtenerse una muestra en la que la dis-
si la población de referencia se encuentra en una tribución de estas variables no fuera la misma que
base de datos informatizada, o muy laborioso si se en la población, lo que conduciría a un sesgo en
realiza manualmente y la población es amplia. A los resultados. Un muestreo estratificado por estos
continuación, se seleccionan tantos números alea- factores garantizaría una distribución similar a la
torios como elementos debe tener la muestra. La de la población de referencia.
selección de números aleatorios suele realizarse con
un ordenador o una calculadora de mano. Ejemplo 16.5. Supongamos un marco de muestreo
Esta técnica es sencilla y de fácil comprensión, de 2.000 personas en las que se desea estimar la pre-
y permite el cálculo rápido de medias y variancias. valencia de HTA, estudiando para ello una muestra
Requiere, sin embargo, que se conozca de antemano de 250 sujetos. Se conoce que la prevalencia de HTA
la lista completa de todas las unidades de muestreo. varía en función del sexo y la presencia de obesidad.
Si la lista contiene fallos u omite segmentos de la Por tanto, los investigadores desean que la muestra
población, se perderán las ventajas propias del mues- en que se realizará el estudio refleje fielmente la dis-
treo aleatorio, ya que todas las unidades no tendrán tribución, según el sexo y la presencia de obesidad
la misma probabilidad de aparecer en la muestra. que tiene la población de referencia, que se muestra
en la tabla 16.1. Así, por ejemplo, existe un 12%
de hombres obesos, por lo que, de los 250 sujetos de
Muestreo aleatorio estratificado
la muestra, un 12% deberá tener estas características.
Se trata de una modificación del método anterior Por tanto, de los 240 hombres obesos de la pobla-
que intenta asegurar que la muestra presente la ción, deben seleccionarse aleatoriamente 30 para
misma distribución que la población en relación formar parte de la muestra. Se procede de la misma
con determinadas variables. forma con los otros estratos (tabla 16.1).
La población se divide en estratos en función de
las categorías de las variables por las que se desea La correcta aplicación de esta técnica requiere que
estratificar, formando subgrupos con alguna carac- se conozca la distribución en la población de la(s)
terística en común y mutuamente excluyentes. A variable(s) empleada(s) para la estratificación y que
continuación, se escoge una muestra aleatoria de la variabilidad entre los distintos estratos sea lo más
cada estrato, manteniendo las proporciones observa- amplia posible, mientras que dentro de cada estrato
das en la población de referencia (muestreo aleatorio debe ser lo más pequeña posible. Así, se obtendrán
estratificado proporcional). subgrupos homogéneos respecto a la posible variable
© Elsevier. Fotocopiar sin autorización es un delito.
157
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
158
ERRNVPHGLFRVRUJ
Muestreo Capítulo | 16 |
Se seleccionó una muestra representativa de escola- está ordenada siguiendo una tendencia conocida
res de la ciudad de Barcelona. La técnica de mues- (de mayor a menor, de más viejo a más joven, etc.),
treo empleada fue la de conglomerados en varias el muestreo sistemático asegura una cobertura de
etapas. Se tomó como unidad de muestreo el aula, unidades de todos los tipos. Si interesa extraer una
estratificando por las siguientes variables: curso, muestra de los médicos de una provincia y el colegio
tipo de escuela (pública, privada) y tamaño del profesional tiene las listas ordenadas por el año de
curso (número de aulas). Es importante remarcar licenciatura, podría darse el caso de que con un
que todos estos factores están relacionados con las muestreo aleatorio simple predominaran los médi-
variables estudiadas; el curso se asocia a los hábitos cos de una determinada edad. Sin embargo, con un
de vida a través de la edad, y el tipo de escuela, a muestreo sistemático, se aseguraría una muestra que
través de la clase social. La estratificación permite representara todos los años de licenciatura.
obtener estimaciones más precisas. El empleo del La limitación más importante para su uso aparece
muestreo por conglomerados es prácticamente ine- cuando la constante que se aplica está relacionada
vitable al estudiar la población escolar. El aumento con el fenómeno que se quiere medir. En este caso
de la variabilidad que acompaña a la utilización de se pueden hallar estimaciones muy distorsionadas
conglomerados se minimiza al tomar el aula, en lu- de los parámetros poblacionales.
gar del colegio, como unidad primaria de muestreo,
y se compensa parcialmente con la estratificación. Ejemplo 16.9. Supongamos que se quiere estudiar
la actividad asistencial de un equipo de atención
primaria y que la unidad de muestreo son los días
Muestreo sistemático
de la semana. Si el primer día seleccionado fuera un
Este procedimiento se basa en aplicar alguna re- lunes y se aplicara una constante (k = 7), se recoge-
gla sistemática simple, como elegir uno de cada n ría únicamente la actividad realizada los lunes de
individuos. Los pasos a seguir son los siguientes: en cada semana. Con este procedimiento se sobrestima-
primer lugar, se calcula la constante de muestreo (k), ría la media real de visitas, ya que tradicionalmente
dividiendo el total de la población candidata por el los lunes son los días de mayor actividad. Como
tamaño de la muestra deseado. A continuación, se puede deducirse, estas situaciones son muy poco
extrae la primera unidad al azar entre las k primeras frecuentes y, en todo caso, es relativamente fácil
unidades de muestreo, y se le suma la constante, intuir que la constante de muestreo está relacionada
sucesivamente, hasta completar el tamaño de la con el fenómeno de estudio.
muestra.
Las ventajas y desventajas de cada uno de los
Ejemplo 16.8. Supongamos que deseamos obtener métodos de muestreo probabilístico se encuentran
una muestra de 200 historias clínicas de un archivo en la tabla 16.2.
de 1.000 historias. La constante de muestreo es
1.000/200 = 5, lo que significa que se escoge una
Muestreo no probabilístico
de cada 5 historias. La primera se elige de forma
aleatoria entre los números del 1 al 5. Si la elegida es En el muestreo no probabilístico se desconoce la
la 2, la siguiente es la 7 (2 + 5), después la 12 (7 + 5), la probabilidad que posee cada unidad de ser incluida
© Elsevier. Fotocopiar sin autorización es un delito.
17 (12 + 5), y así sucesivamente, hasta conseguir las en la muestra, y la selección se realiza mediante
200 historias necesarias. métodos en los que no interviene el azar.
El uso de pruebas estadísticas requiere que la
La primera ventaja del muestreo sistemático muestra analizada sea aleatoria. Su aplicación en
es que es fácil de aplicar y, en ocasiones, es más muestras no obtenidas por un método aleatorio se
cómodo y práctico que el muestreo aleatorio sim- hace asumiendo que están libres de sesgos y que son
ple. Es más sencillo, por ejemplo, escoger todas las representativas de la población de referencia.
historias cuyo número termina en cero que a partir La técnica más frecuente es el muestreo consecutivo.
de un listado de números aleatorios. La segunda es Consiste en seleccionar a los pacientes que cum-
que no siempre es necesario tener de antemano una plen los criterios de selección especificados en el
lista completa y exhaustiva de toda la población. protocolo del estudio, a medida que acuden a la
Los sujetos se pueden ir seleccionando a medida consulta durante un período determinado.
que el estudio avanza, siempre y cuando lleguen
en algún orden preestablecido, como por ejemplo, Ejemplo 16.10. Lee et al (2002) compararon las
los pacientes que acuden a una consulta. La terce- características de 1.546 pacientes que acudieron
ra ventaja es que, cuando la población de referencia consecutivamente a un centro de salud con las de
159
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
Ventajas Desventajas
la población de referencia. Observaron que los pa- Otra técnica utilizada en encuestas de opinión
cientes incluidos en la muestra consultaban con y de mercado, pero muy poco en la investigación
mayor frecuencia, eran mayores, con peor estado epidemiológica, es el muestreo por cuotas, en el que
de salud (mayor prevalencia de HTA, accidente cere- la composición general de la población de referencia
brovascular y cáncer), menos fumadores y vivían en términos de características como la edad, el sexo,
solos, con mayor frecuencia. o la clase de educación se decide, o se conoce, de an-
temano. Seguidamente, se determina el número de
El muestreo consecutivo es la técnica más utilizada personas requerido, o las cuotas, para los hombres
en los ensayos clínicos. Si se evalúa la eficacia de una y las mujeres, según las diferentes edades y la clase
medida terapéutica contra la gastroenteritis, no se de educación, y el único requerimiento es conseguir
dispone al inicio del estudio de un listado de la po- el número adecuado de personas para llenar cada
blación que desarrollará la enfermedad, por lo que una de las cuotas.
no puede aplicarse un muestreo aleatorio simple. En algunas ocasiones, en especial cuando tanto
En esta situación, el equipo investigador se limita a el tamaño de la población de referencia como el de
reclutar a los individuos que cumplen los criterios la muestra son muy pequeños, la selección puede
de selección a medida que son diagnosticados. hacerse por criterios razonados. Por ejemplo, si
La inclusión de voluntarios es otra técnica de se desea conocer el funcionamiento de los centros
muestreo no probabilístico. En general, es preferi- de salud de una provincia a través de un análisis
ble rechazar su colaboración, ya que las verdaderas exhaustivo de dos de ellos, es preferible seleccionar
razones que llevan a una persona a prestarse para los dos centros que puedan considerarse los más
un estudio sin haber sido seleccionado para ello representativos, en vez de dejar la selección al azar.
suelen estar relacionadas con otras características En las técnicas adaptativas el diseño del muestreo
que afectan a la representatividad de la muestra. se adapta en función de las observaciones que se
160
ERRNVPHGLFRVRUJ
Muestreo Capítulo | 16 |
van realizando durante el estudio, por ejemplo, ganancia que suponen en términos de eficiencia en
solicitando a los participantes en un estudio sobre relación con las técnicas convencionales, pueden ser
consumo de drogas que informen al investigador la única forma operativa de obtener una muestra lo
sobre otros consumidores. Dependiendo del meca- suficientemente amplia. Su principal inconveniente
nismo de adaptación, reciben nombres como bola de es que deben aplicarse procedimientos estadísticos
nieve, paseos aleatorios o muestreo en red. Estas técnicas que tengan en cuenta su utilización.
son especialmente útiles cuando la población de La figura 16.1 presenta un algoritmo para la se-
interés es difícil de alcanzar, ya que, además de la lección de la técnica de muestreo.
161
ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio
Bibliografía
Armitage P, Berry G, Matthews 2nd ed. New York: Oxford metodológicos» núm. 1. Madrid:
JNS. Statistical methods in University Press; 1996. Centro de Investigaciones
medical research. 4th ed. Phillips CV, LaPole LM. Sociológicas; 1991.
Oxford: Blackwell Science; Quantifying errors without Thompson SK, Collins LM.
2002. random sampling. BMC Med Adaptive sampling in research
Kelsey JL, Wittemore AS, Evans A, Res Methodol. 2003;3:9. on risk-related behaviors.
Thompson WD. Methods in Rodríguez Osuna J, Métodos de Drug Alcohol Depend.
observational epidemiology. muestreo. Colección «Cuadernos 2002;68(Suppl 1):S57-67.
162
ERRNVPHGLFRVRUJ