Está en la página 1de 21

| 15 |

Capítulo

Tamaño de la muestra

El cálculo del tamaño de la muestra permite res­


ponder a las siguientes preguntas: ¿cuántos indivi­ Estudios que estiman
duos es necesario estudiar para poder estimar un un parámetro
parámetro determinado con el grado de confianza
deseado? ¿Cuántos sujetos es necesario estudiar Se trata de estudios en los que los investigadores,
para tener las mínimas garantías de poder detectar partiendo de los valores observados en la muestra es­
una determinada diferencia entre los grupos de es­ tudiada, y utilizando la inferencia estadística, buscan
tudio, en el supuesto de que esta diferencia exista estimar el valor de un parámetro en la población.
realmente?
El resultado del cálculo debe considerarse orien­ Consideraciones previas: intervalo
tativo, ya que se basa en asunciones que pueden
de confianza
ser incorrectas. Por ello, es importante realizarlo
cuidadosamente, ya que tiene implicaciones sobre Supongamos que se desea estimar el valor medio
la viabilidad del estudio y puede suponer modi­ de la colesterolemia en una población. Se escoge
ficaciones en su diseño (modificación de los cri­ una muestra de 80 sujetos en los que se observa una
terios de selección, prolongación del período de media de 180 mg/100 ml, con una desviación es­
inclusión, etc.). tándar de 20 mg/100 ml. Si se hubiera estudiado una
La inclusión de un número excesivo de sujetos muestra diferente, seguramente se habrían obtenido
encarece el estudio tanto desde el punto de vista cifras distintas aunque los criterios de selección hu­
económico como de los recursos humanos y físicos. biesen sido los mismos, si bien es probable que el
Además, puede ser considerado poco ético, ya que valor observado en esta segunda muestra hubiera
un mayor número de pacientes estará sometido estado alrededor de 180 mg/100 ml. Por lo tanto,
innecesariamente a determinadas exploraciones a partir del valor observado en una única muestra
o recibirá la intervención menos eficaz. Por otra no puede conocerse exactamente el verdadero valor
parte, un estudio con un tamaño insuficiente de la en la población de origen, ya que es tan sólo una
muestra estimará un parámetro con poca precisión o aproximación (estimación puntual). Para conocer
será incapaz de detectar diferencias entre los grupos, entre qué límites es más probable que se sitúe este
conduciendo erróneamente a la conclusión de que verdadero valor, debe calcularse el intervalo de con-
no existen. fianza (IC).
En general, puede considerarse que el objetivo El método de cálculo del IC en las situaciones más
de una investigación pertenece a uno de los dos frecuentes se desarrolla en los capítulos dedicados
tipos siguientes: estimación de un parámetro (p. ej., el al análisis de los datos. La amplitud del IC, es decir,
porcentaje de pacientes hipertensos que presentan la precisión de la estimación, depende del grado de
una determinada complicación) o contraste de hipó- confianza, la variabilidad del parámetro de interés
tesis (p. ej., evaluar cuál de dos pautas terapéuticas y el número de sujetos estudiados. Cuanto menor
consigue un mayor porcentaje de éxitos). sea la variabilidad del parámetro y mayor el número

142 © 2013. Elsevier España, S.L. Reservados todos los derechos


ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |

de sujetos, mayor precisión existirá en la estimación


para un grado de confianza determinado. Cuanta Cuadro 15.1  Fórmulas para el cálculo
más confianza se desee tener, más amplio será el IC, del número de sujetos
y menor la precisión obtenida. necesarios para la realización
de un estudio cuyo objetivo
es la estimación de una
Cálculo del tamaño de la muestra media o una proporción
Para calcular el tamaño de la muestra debe cono­
cerse: Estimación de una proporción (variable
cualitativa)
Za2 P(1−P)
• La variabilidad del parámetro que se desea es­ N = ________
​  2 
i
 ​ 
timar. Si no se conoce, puede obtenerse una
Estimación de una media (variable
aproximación a partir de datos propios o de otras cuantitativa)
investigaciones, o un estudio piloto. En el caso
​ Za2  s  
2 2
de las variables cuantitativas se mide por la va­ N = _____ ​ 
i
riancia, y en el de las cualitativas, por el producto N: número de sujetos necesarios.
P·(1 − P). Za: valor de Z correspondiente al riesgo a fijado
• La precisión con que se desea obtener la estima­ (tabla 15.4).
ción, es decir, la amplitud del IC. Cuanto más P: valor de la proporción que se supone existe
precisa se desee, más estrecho deberá ser este en la población.
intervalo, y más sujetos deberán ser estudiados. s2: variancia de la distribución de la variable
La precisión debe fijarse previamente, en función cuantitativa que se supone que existe en la
de la finalidad de la estimación. En algunos casos población.
puede requerirse una gran precisión, mientras i: precisión con que se desea estimar
que en otros, si sólo se necesita conocer apro­ el parámetro (2·i es la amplitud del intervalo
ximadamente entre qué valores se encuentra el de confianza).
parámetro, se requerirá una menor precisión y,
consecuentemente, menos sujetos.
• El nivel de confianza deseado, que habitualmente la fórmula correspondiente, se calcula que se preci­
se fija en el 95%, correspondiente a un valor a san 576 sujetos. La tabla A proporciona el mismo
de 0,05. Indica el grado de confianza que se tiene de resultado.
que el verdadero valor del parámetro en la po­
blación se sitúa en el intervalo obtenido. Cuanta Esta estimación del número de sujetos realizada
más confianza se desee, menor será el valor de a, a priori no es más que una aproximación. Si en el
y más elevado el número de sujetos necesario. ejemplo el porcentaje real de pacientes controlados
es diferente del 40%, puede alterarse el grado de
De estos tres elementos, sólo debe conocerse la precisión de la estimación.
variabilidad del parámetro, ya que tanto la precisión En la tabla 15.1 puede apreciarse cómo diferentes
como el nivel de confianza se fijan a partir de los grados de precisión y diferentes valores del porcentaje
© Elsevier. Fotocopiar sin autorización es un delito.

intereses del investigador. esperado modifican el número de sujetos necesarios.


Así, por ejemplo, para estimar el porcentaje del 40%
del ejemplo 15.1 con el mismo nivel de confianza del
Estimación de una proporción
95%, los 576 sujetos se convierten en 9.220 cuando
La fórmula para el cálculo del número de sujetos se desea una precisión muy alta (i = 0,01), o en tan
para estimar una proporción se presenta en el cua­ sólo 92 si se es menos exigente (i = 0,1). Modificando
dro 15.1. También puede utilizarse la tabla A que se cualquiera de estos valores, puede obtenerse un nú­
encuentra al final del libro. mero de individuos que se aproxime al «deseado» o
al disponible. Debe evitarse cualquier manipulación
Ejemplo 15.1.  Un estudio se propone estimar el del cálculo, ya que, al reducir el número de sujetos
porcentaje de pacientes hipertensos de un centro que se van a estudiar, también disminuye el grado
que están controlados. A partir de datos previos, se de precisión con que el parámetro va a ser estimado
estima que debe estar situado alrededor del 40% y aumenta la amplitud del IC.
(p = 0,40). Se quiere realizar la estimación con una En el cálculo del tamaño de la muestra también
precisión de ± 4% (i = 0,04) y una confianza del debe tenerse en cuenta la estrategia de análisis y
95% (1 − a = 0,95; a = 0,05; Za = 1,96). Aplicando cómo se presentarán los resultados. Así, si en el

143

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

Estimación de una media


Tabla 15.1  Influencia de la precisión
de la estimación y del valor supuesto El cálculo es similar al de la situación anterior (ver
de la proporción que se desea estimar cuadro 15.1). También deben fijarse el nivel de con­
sobre el número de sujetos necesarios fianza y la precisión de la estimación, que se traducen
en la amplitud del intervalo alrededor de la media
Influencia de la precisión
que se desea estimar. En las variables cuantitativas,
P i N la medida de la variabilidad viene proporcionada
por la variancia de su distribución en la población.
0,40 0,100 92 La tabla B del final del libro proporciona una fácil
0,40 0,075 164 solución alternativa al cálculo matemático.
0,40 0,050 369
Ejemplo 15.2.  Supongamos que se desea estimar
0,40 0,025 1.475 la tensión arterial diastólica (TAD) de los pacientes
0,40 0,010 9.220 diabéticos registrados en un centro de salud. Por
estudios previos se conoce que la desviación están­
Influencia de la proporción
dar de la TAD en sujetos diabéticos es de 25 mmHg
P i N (s = 25 mmHg; s2 = 625 mmHg2). Se quiere realizar la
estimación con una confianza del 95% (1 − a = 0,95;
0,10 0,05 138 a = 0,05) y una precisión de 5 mmHg (i = 5). Apli­
0,20 0,05 246 cando la fórmula, se puede determinar que son
necesarios 96 sujetos. Esta cifra debe aumentarse
0,30 0,05 323
en función del porcentaje de sujetos en que se prevea
0,40 0,05 369 que no podrá determinarse la TAD. El mismo resul­
0,50 0,05 384 tado se obtiene consultando la tabla B en la línea
correspondiente al valor i/s = 5/25 = 0,200.
Todos los cálculos se han realizado con el grado de
confianza del 95%. P: valor supuesto de la proporción que
se desea estimar. i: medida de la precisión de la estimación, Si no se dispone de una estimación de la variabili­
que corresponde a la mitad del intervalo de confianza. dad, puede utilizarse una regla práctica, que consiste
N: número de sujetos necesarios para realizar la estimación en determinar la diferencia entre los valores máximo
de P con la precisión deseada y el 95% de confianza. y mínimo esperables. Dado que se asume que esta
variable es de distribución normal, el intervalo m ±
(2s), siendo m la media y s la desviación estándar de la
­ejemplo 15.1 los investigadores presentan el resul­ distribución, incluye aproximadamente el 95% de los
tado principal en función del sexo, la estratificación valores posibles, por lo que, al dividir dicha amplitud
hará que la estimación se haya obtenido en un nú­ de valores entre 4, puede obtenerse una cierta aproxi­
mero menor de sujetos, por lo que la precisión será mación al valor de la desviación estándar s.
menor de la deseada.
En algunas ocasiones no se conoce el valor apro­
Corrección para poblaciones finitas
ximado del parámetro que se está buscando. Si no
existen datos de la literatura que resulten útiles, o si En los cálculos anteriores no ha intervenido el tamaño
no puede realizarse una prueba piloto para obtener de la población, ya que en ellos se ha asumido que es
una primera aproximación a dicho valor, puede infinito. Sin embargo, en muchas ocasiones es preciso
adoptarse la postura de la máxima indeterminación. obtener una muestra de una población de tamaño
Esta actitud consiste en suponer que el porcentaje conocido (finito). En esta situación puede aplicarse la
que se quiere estimar se sitúa alrededor del 50%, siguiente fórmula, que ajusta el número de individuos
ya que es el valor que requiere una mayor cantidad necesarios según el tamaño de la población:
de individuos para una precisión determinada, de
na = n[1 + (n/N)]
forma que el número obtenido supera cualquier otra
combinación de parámetros. Esta actitud también donde na es el número de sujetos necesarios, n es
es útil, por ejemplo, cuando se realizan encuestas el número de sujetos calculado para poblaciones
en las que interesa estimar múltiples parámetros. infinitas y N es el tamaño de la población.
Su inconveniente es que requiere el estudio de un
número de sujetos a veces muy superior al realmente Ejemplo 15.3.  En el ejemplo 15.1 se ha calculado
necesario. que son necesarios 576 sujetos para estimar el

144

ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |

­ orcentaje de hipertensos controlados de un centro,


p hipótesis mediante la asunción de que no existen
realizando determinadas asunciones. Si la población diferencias en la eficacia de los dos fármacos A y B
de referencia es de 1.000 hipertensos, aplicando (hipótesis nula). A partir de los resultados observados
la fórmula anterior podría determinarse que son en la muestra, el investigador utilizará las pruebas
necesarios 365 pacientes hipertensos. de significación estadística para evaluar si existe la
suficiente evidencia que le permita rechazar esta
hipótesis nula y, consecuentemente, aceptar la hi­
Estudios que comparan pótesis alternativa de que sí existen diferencias entre
dos grupos ambas terapéuticas.
El error tipo I, conocido también como error a
Muchos estudios tienen por objetivo responder (tabla 15.2), se comete cuando el investigador re­
a preguntas del siguiente tipo: ¿es más eficaz el chaza la hipótesis nula, siendo ésta verdadera en la
fármaco A que el B en el tratamiento de una en­ población. Es equivalente a encontrar un resultado
fermedad? ¿Existe un aumento del riesgo de mal­ falso positivo, ya que el investigador concluye que
formaciones congénitas en los niños nacidos de hay una diferencia, cuando en realidad no existe.
madres que han padecido cierto trastorno durante El error tipo II, o error b (ver tabla 15.2), se comete
el embarazo?, etc. en la situación contraria, cuando el investigador no
rechaza la hipótesis nula, siendo ésta falsa en la po­
blación. Es equivalente a un resultado falso negativo,
Consideraciones previas: pruebas ya que el investigador concluye que ha sido incapaz
de contraste de hipótesis de encontrar una diferencia que existe en la realidad.
Si b representa la probabilidad de un resultado falso
Bajo las preguntas que se han planteado en el pá­
negativo, su complementario 1 − b, conocido como
rrafo anterior subyace una hipótesis, por ejemplo,
poder o potencia estadística, representa la probabilidad
la de que B es más eficaz que A en el tratamiento de
de observar en la muestra una determinada diferen­
los hipertensos esenciales de edad avanzada. En la
cia o un efecto, si existen en la población.
realidad, esta hipótesis puede ser verdadera o falsa,
Para calcular el tamaño de la muestra, se fijan a
y eso es lo que se trata de averiguar. Dado que el
priori los riesgos que se está dispuesto a asumir de
investigador no puede estudiar todos los hipertensos
cometer estos errores. Lo ideal sería poder reducirlos
esenciales de edad avanzada, la hipótesis debe con­
a cero, pero ello no es posible. Una de las formas
trastarse en una muestra de esta población. A partir
para disminuirlos consiste en aumentar el número
únicamente de los datos recogidos en un estudio,
de sujetos estudiados.
no puede aceptarse o rechazarse absolutamente la
hipótesis que se contrasta. Existe cierto riesgo de
error, sea cual sea la conclusión a la que se llegue. Hipótesis unilaterales e hipótesis
bilaterales
Error a y error b
Desde el punto de vista estadístico, otro aspecto
Desde el punto de vista estadístico, el investiga­ que afecta al cálculo del tamaño de la muestra es
dor se enfrenta al problema del contraste de una el de la formulación precisa de la hipótesis que se
© Elsevier. Fotocopiar sin autorización es un delito.

Tabla 15.2  Tipos de error aleatorio en una prueba estadística de contraste de hipótesis

Realidad (población)

Existe diferencia o No existe diferencia o


asociación (Ho falsa) asociación (Ho cierta)

Resultado de la Diferencia o asociación No error Error tipo I


prueba (muestra) significativa (rechazo a
de Ho)
Diferencia o asociación Error tipo II No error
no significativa b
(no rechazo de Ho)
Ho: hipótesis nula.

145

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

c­ ontrasta. Si se pretende determinar si dos fármacos de dos muestras puede ser significativa, aunque se
A y B difieren en su eficacia, sin decir cuál de ellos hayan estudiado tan sólo 20 sujetos, mientras que
ha de ser mejor o peor, se habla de hipótesis bilateral, una pequeña diferencia de 3 mg/100 ml no alcanza
o de dos colas (fig. 15.1). En cambio, si la hipótesis suficiente significación, aunque se hayan estudiado
alternativa es que el fármaco A es más eficaz que el 200 individuos en cada grupo.
B, se habla de hipótesis unilateral, o de una cola. En Para calcular el tamaño de la muestra, debe de­
este caso, interesa únicamente evaluar si B es, como finirse la mínima magnitud de la diferencia o de la
mínimo, tan eficaz como A, es decir, tan sólo una asociación que se desea detectar y que se considera
de las direcciones de la comparación. de relevancia clínica. Esta diferencia debe fijarse en
Desde un punto de vista estricto, son preferi­ términos realistas, dentro del rango de valores es­
bles las hipótesis bilaterales, ya que son más con­ perables. A menudo, es tentador utilizar diferencias
servadoras y requieren un mayor número de partici­ más amplias, ya que se obtiene un tamaño de la
pantes. muestra más reducido. Esta actitud debe evitarse,
ya que implica que diferencias menores a la es­
Magnitud de la diferencia tablecida, a pesar de que pueden ser de importancia
clínica, no alcanzarán el grado de significación es­
o de la asociación
tadística con el número de sujetos estudiados. Si,
La magnitud de la diferencia o de la asociación por ejemplo, se utiliza una diferencia del 50% en la
tiene una gran influencia sobre el tamaño de la eficacia de los dos fármacos en el cálculo del tamaño
muestra. Si la diferencia es muy amplia (p. ej., si de la muestra, se necesitará un número reducido de
la eficacia del fármaco A es el doble que la del B), sujetos, pero una diferencia del 40%, que puede ser
se podrá detectar con más facilidad que si es de es­ muy importante desde el punto de vista clínico, no
casa magnitud, y requerirá un número menor de será estadísticamente significativa, ya que el inves­
sujetos. En la tabla 15.3 puede apreciarse cómo una tigador ha decidido considerar como importantes
diferencia de 40 mg/100 ml en la media de colesterol sólo las diferencias superiores al 50%.

Figura 15.1  Valores de la distribución normal tipificada (Z) correspondientes al valor a del 5% en las pruebas
estadísticas unilaterales y bilaterales.

146

ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |

Tabla 15.3  Influencia del número de sujetos estudiados y la magnitud de la diferencia sobre
la significación estadística

Ejemplo 1. Una diferencia de gran magnitud es estadísticamente significativa incluso


con un reducido número de sujetos
n Colesterolemia (media ± DE) t p

Muestra 1 20 260 ± 20
6,32 < 0,001
Muestra 2 20 220 ± 20
Ejemplo 2. Una diferencia de escasa magnitud no es estadísticamente significativa,
aunque se haya estudiado un elevado número de sujetos
n Colesterolemia (media ± DE) t p

Muestra 1 200 218 ± 20


1,5 0,14
Muestra 2 200 215 ± 20
n: número de sujetos de la muestra. DE: desviación estándar. t: valor de la t de Student-Fisher de comparación de dos
medidas independientes. p: probabilidad de cometer un error a. Habitualmente, valores menores de 0,05 se aceptan como
evidencia suficiente para decidir que la diferencia es estadísticamente significativa.

En función del enfoque del estudio, esta magnitud


puede fijarse como una diferencia entre grupos, o Cuadro 15.2  Elementos que intervienen
bien, en términos relativos, como una relación de en el cálculo del número de
riesgos. sujetos necesarios para la
realización de un contraste
de hipótesis
Cálculo del tamaño de la muestra
Para calcular el tamaño de la muestra deben utilizarse 1 Hipótesis uni o bilateral
los siguientes elementos principales (cuadro 15.2): 2 Riesgo aceptado de cometer un error a
3 Riesgo aceptado de cometer un error b
• Definir la hipótesis que se va a contrastar, preci­ (potencia: 1 − b)
sando si es unilateral o bilateral. 4 Magnitud mínima de la diferencia o asociación
• Establecer el riesgo de cometer un error de tipo I que se considera importante detectar
(a) que se está dispuesto a aceptar. Habitualmen­ 5 Variabilidad de la variable de respuesta en el
te suele aceptarse un riesgo a del 5%, y preferi­ grupo de referencia
© Elsevier. Fotocopiar sin autorización es un delito.

blemente con hipótesis bilaterales, ya que son 6 Otros factores:


más conservadoras. • Prueba estadística que se utilizará en el
• Establecer, así mismo, el riesgo que se acepta de análisis
• Tipos especiales de diseño del estudio
cometer un error tipo II (b). Habitualmente se
• Comparación de más de dos grupos
sitúa entre el 5 y el 20%. La elección variará en
• Grupos de tamaño diferente
función de las consecuencias que pueda tener
• Equivalencia de las intervenciones
cometer dicho error. A menudo es más fácil • Estratificación por las características basales
enfrentar esta decisión a partir del concepto de • Múltiples variables de respuesta
poder o potencia estadística (1 − b), que es la • Porcentaje de pérdidas y abandonos esperado
capacidad del estudio para detectar una deter­ durante el seguimiento
minada diferencia. Aceptar el riesgo de cometer
un error b del 20% significa que, si la diferencia
que se busca existe en la realidad, el estudio tiene de detectar. Debe basarse en datos de estudios
un 80% de probabilidades de detectarla. previos o de la literatura que definan el rango de
• Definir la mínima magnitud de la diferencia, los valores esperables, y en la mínima magnitud
el efecto o la asociación que se quiera ser capaz que se considere de relevancia clínica.

147

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

• Es necesario, también, disponer de alguna medi­ Comparación de dos proporciones


da de la variabilidad de la variable de respuesta
La comparación de dos proporciones es, proba­
en la población o el grupo de referencia.
blemente, la prueba de contraste de hipótesis más
utilizada en investigación clínica. Se trata de estudios
De estos cinco elementos, sólo debe conocerse
que comparan dos grupos, y para ello utilizan una
el último, ya que los cuatro primeros son fijados
variable de respuesta cualitativa dicotómica.
por el investigador. A continuación, se aplica la fór­
mula correspondiente, que depende de la prueba
estadística que vaya a ser utilizada en el análisis. Ejemplo 15.4.  Un estudio tiene por objetivo deter­
En el cuadro 15.3 se presentan las fórmulas de uso minar si un nuevo tratamiento T consigue un mayor
más habitual, correspondientes a la comparación porcentaje de éxitos en las sobreinfecciones res­
de dos variables dicotómicas (dos proporciones) piratorias que el tratamiento estándar E. Lo primero
o de dos variables cuantitativas (dos medias). Las que debe conocerse es el porcentaje de curaciones en
tablas 15.4 y 15.5 recogen los valores de la variable pacientes de características similares a los que van a
normal tipificada, correspondientes a los riesgos a y ser estudiados, obtenido con el tratamiento estándar
b utilizados con mayor frecuencia en dicho cálculo, E. Supongamos que esta cifra se sitúa alrededor del
respectivamente. 40% (P1 = 0,4).
Las fórmulas pueden resultar algo complicadas,
por lo que se recomienda utilizar tablas como las El siguiente paso es determinar la diferencia mí­
presentadas al final del libro (tablas C y D). nima que se quiere detectar, es decir, responder a
la pregunta: ¿a partir de qué porcentaje de éxitos
con el nuevo tratamiento se considerará que éste
es mejor que E y, por lo tanto, se estará dispuesto
Cuadro 15.3  Fórmulas para el cálculo a modificar la pauta terapéutica habitual? Es decir,
del número de sujetos si el porcentaje de individuos curados con T es del
necesarios por grupo en 41%, ¿puede considerarse que esta diferencia
un estudio cuyo objetivo del 1% es un resultado lo suficientemente importan­
es la comparación de dos te para modificar la pauta terapéutica? ¿O se exigirá
muestras del mismo tamaño un mínimo, por ejemplo, del 50% de éxitos? La
respuesta a estas preguntas depende de muchos
Comparación de dos proporciones (variable factores, tales como la seguridad del fármaco, la
cualitativa) ___________ ______________________ facilidad de administración o el coste, entre otros.
[Za​√ [2⋅P⋅(1−P)] ​​ 
+ Zb​√ [P1⋅(1−P1)+P2⋅(1−P2)]]
   2 ​​
N = _____________________________________
​            ​ Supongamos que los investigadores consideran que,
2
(P1−P2)
si se cura el 50% de pacientes con T (P2 = 0,5), se
Comparación de dos medias (variable
aceptará como la elección terapéutica.
cuantitativa)
A continuación, sólo falta determinar los niveles
2⋅(Za + Zb)2⋅s2
N = ___________
​       ​  de riesgo de cometer algún tipo de error aleatorio
2
d
N: número de sujetos necesarios en cada uno que se está dispuesto a asumir. Supongamos que se
de los grupos. acepta el nivel de riesgo a habitual del 5% con una
Za: valor de Z correspondiente al riesgo a fijado hipótesis bilateral y un riesgo b del 20% (potencia:
(tabla 15.4). 1 − b = 0,80).
Zb: valor de Z correspondiente al riesgo b fijado Aplicando la fórmula del cuadro 15.3, puede cal­
(tabla 15.5). cularse que son necesarios 387 sujetos por grupo de
P1: valor de la proporción que se supone existe estudio. Con la tabla C del final del libro se obtiene
en el grupo de referencia. la misma cifra.
P2: valor de la proporción que se supone existe Este número indica los sujetos que deben finalizar
en el grupo de estudio. el estudio para tener un 80% de probabilidades de
P2 − P1: valor mínimo de la diferencia que se detectar una diferencia igual o superior a la fijada,
desea detectar (variable cualitativa). con un nivel de error a del 5%. Por lo tanto, hay que
P: media ponderada de las proporciones P1 y P2. incrementarlo en función del número de pérdidas
s2: variancia de la distribución de la variable de seguimiento y de abandonos que se prevea que
cuantitativa que se supone que existe en el grupo ocurrirán durante el estudio.
de referencia. El tamaño de la muestra requerido es mayor
d2: valor mínimo de la diferencia que se desea
cuanto más pequeña es la diferencia que se desea
detectar (variable cuantitativa).
detectar y menos elevados son los riesgos a y b que

148

ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |

Tabla 15.4  Valores de Za utilizados con mayor frecuencia en el cálculo del tamaño de la muestra

Za

a Prueba unilateral Prueba bilateral

0,200 0,842 1,282


0,150 1,036 1,440
0,100 1,282 1,645
0,050 1,645 1,960
0,025 1,960 2,240
0,010 2,326 2,576

clínicos y estudios de cohortes) es el riesgo relativo


Tabla 15.5  Valores de Zb utilizados con mayor (RR). Lo que debe fijarse en este caso es la mínima
frecuencia en el cálculo del tamaño de la magnitud del RR que se quiere ser capaz de detec­
muestra tar. En esta situación puede utilizarse la misma
Potencia fórmula que en el caso de la comparación de dos
proporciones, teniendo en cuenta que RR = P2/P1.
b (1 − b) Zb La magnitud de la asociación que se quiere detectar
corresponde al mínimo RR que se considerará de
0,01 0,99 2,326
importancia clínica, donde P1 es el riesgo de desa­
0,05 0,95 1,645 rrollar la enfermedad en el grupo no expuesto y
0,10 0,90 1,282 P2 el riesgo de desarrollarla en el grupo expuesto
(P2 = P1·RR).
0,15 0,85 1,036
La tabla D del final del libro presenta el resultado
0,20 0,80 0,842 del cálculo del número de sujetos necesarios para
0,25 0,75 0,674 los estudios que estiman un RR en las situaciones
más habituales.
0,30 0,70 0,524
0,35 0,65 0,385 Ejemplo 15.5.  Se pretende realizar un estudio de
cohortes con el objetivo de estimar el riesgo de desa­
0,40 0,60 0,253
rrollar infarto agudo de miocardio (IAM) asociado
0,45 0,55 0,126 a la hipercolesterolemia. El riesgo esperado en la
0,50 0,50 0,000 cohorte no expuesta (P1) es del 10% a los 10 años
(incidencia acumulada). El riesgo relativo (RR) que
se considera relevante detectar es de 2. El valor del
© Elsevier. Fotocopiar sin autorización es un delito.

se aceptan. Es importante destacar que una misma riesgo de cometer un error a será el convencional
diferencia del 5% entre dos porcentajes requiere el del 5% (hipótesis bilateral) y el de cometer un error
máximo número de pacientes cuando éstos se sitúan b, del 20% (potencia: 1 − b = 0,80). A partir de estos
alrededor del 50%. Ello se debe a que, si el porcentaje datos, puede calcularse el valor de P2:
del grupo de referencia es del 5%, una diferencia del
5% implica que el grupo de estudio debe pasar a P2 = P1⋅RR = 0,10⋅2 = 0,20 (o 20%)
un 10%, es decir, dobla la eficacia. En cambio, si el
porcentaje del grupo de referencia es del 50%, una Aplicando la fórmula del cuadro 15.3 o la tabla D
diferencia del 5% implica solamente un incremento del final del libro, puede determinarse que son nece­
relativo del 10%, es decir, pasar del 50 al 55%. sarios 199 sujetos por grupo. Este número representa
el tamaño mínimo tanto del grupo de expuestos
como del de no expuestos. Por lo tanto, si desea es­
Estimación de un riesgo relativo
tudiar una cohorte general, o si se deben identificar
Si el objetivo del estudio es determinar la magnitud los sujetos expuestos a partir de una muestra de la
de la asociación en términos relativos, la medida que población general, se deberá determinar el número
se utilizará en los estudios prospectivos ­(ensayos de sujetos que habrá que examinar para identificar

149

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

el número suficiente de expuestos. Si la frecuencia de tanto, el valor de la variancia s2 es de (0,625)2 = 0,39.


la exposición en la población general (f) fuera de un A continuación, se establece que la diferencia mí­
20%, sería necesario examinar a N/f = 199/0,2 = 995 nima entre ambos grupos que se considera de rele­
sujetos para encontrar a 199 expuestos. vancia clínica es de 0,5 mmol/l (d = 0,5). El riesgo
de error a que se está dispuesto a asumir es de 0,05.
Dado que se pretende evaluar qué pauta es más efi­
Estimación de una odds ratio
caz, se trata de una hipótesis bilateral. Interesa tener
En los estudios de casos y controles, la magnitud de una capacidad del 90% para detectar la diferencia,
la asociación se estima mediante la odds ratio (OR). si existe realmente (1 − b = 0,90).
Se trata de una situación similar a la de la estimación
de un RR, en la que debe conocerse la proporción de Para utilizar la tabla F del final del libro debe cal­
exposición esperada en los controles (P1) y fijar la cularse el valor d/s, que corresponde al cociente entre
magnitud de la OR que se desea detectar. Análoga­ la diferencia que se quiere detectar y la desviación
mente a la situación anterior, la proporción esperada estándar de la variable de respuesta en el grupo de re­
de exposición entre los casos es: ferencia. En este caso, corresponde a 0,5/0,625 = 0,8.
Buscando este valor en la primera columna de las
P2 = P1⋅OR[1 + P1⋅(OR − 1)]
tablas, y leyendo la fila correspondiente al valor de
La tabla E del final del libro presenta el resultado a de 0,05 en una hipótesis bilateral, en el punto
del cálculo del número de sujetos necesarios para de intersección con la potencia de 0,90 se obtiene
los estudios que estiman una OR en las situaciones un tamaño de 33 sujetos por grupo; es decir, en
más habituales. total, debe incluirse en el estudio un mínimo de 66
personas. El mismo resultado se obtiene utilizando
Ejemplo 15.6.  Un estudio de casos y controles preten­ la fórmula del cuadro 15.3.
de evaluar el riesgo de padecer un IAM asociado al uso
de anticonceptivos orales (AO) en mujeres jóvenes.
Comparación de grupos cuando
Se estima que la proporción esperada de uso de AO
en la población candidata a ser incluida en el grupo
la variable de respuesta es ordinal
control es del 30% (P1 = 0,30). El incremento mínimo Cuando la variable de respuesta se mide en una es­
del riesgo que se quiere detectar es de 3 (OR = 3). El cala ordinal, o cuando en el análisis deben utilizarse
riesgo a es de 0,05 (hipótesis bilateral) y el riesgo b es pruebas estadísticas no paramétricas, el cálculo es más
de 0,10 (potencia: 1 − b = 0,90). Por lo tanto: complejo. Por criterios de operatividad, suele calcularse
el tamaño como si fuera a utilizarse una prueba para­
P2 = (0,3⋅3)/[1 + 0,3⋅(3 − 1)]=0,56 métrica. La estimación será tanto mejor cuanto menos
se aleje la distribución de la variable de la ley normal.
Aplicando la fórmula del cuadro 15.3, puede determi­ En el anexo 7 se presenta el cálculo del tamaño
narse que son necesarios 74 sujetos por grupo. La tabla de la muestra en otras situaciones.
E del final del libro proporciona un resultado similar.
Equivalencia de dos intervenciones
Comparación de dos medias
En ocasiones se diseña un estudio para determinar si
Para calcular el tamaño de la muestra debe cono­ una nueva intervención, que ofrece alguna ventaja so­
cerse el valor de la variancia de la distribución de bre la de comparación, como ser menos costosa o más
la variable de respuesta en el grupo de referencia, segura, es tan eficaz como ella (estudios de equivalen­
decidir la mínima diferencia que se considera de cia) o no es terapéuticamente inferior (estudios de
relevancia clínica y si interesa poder detectar y fijar ­no-inferioridad). En esta situación, la determinación
los niveles de error a y b que se aceptan. del tamaño de la muestra requiere tener en cuenta
algunas consideraciones especiales. El problema
Ejemplo 15.7.  Un estudio se propone comparar los radica en que no existe un procedimiento estadístico
niveles de fructosamina de dos grupos de diabéticos para demostrar la equivalencia de dos intervenciones.
sometidos a dos pautas terapéuticas diferentes, T1 y La ausencia de una diferencia estadísticamente signi­
T2, con la finalidad de determinar cuál de ellas con­ ficativa entre ellas no debe interpretarse como prueba
sigue un mayor control de la enfermedad. Se utiliza de que sean terapéuticamente equivalentes.
habitualmente la pauta T1, con la que se consigue La demostración de la equivalencia requiere des­
unos valores medios de fructosamina de 3 mmol/l, cartar pequeñas diferencias en la respuesta obser­
con una desviación estándar de 0,625 mmol/l. Por lo vada. Para considerar que dos intervenciones son

150

ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |

e­ quivalentes, la diferencia entre ellas debe ser tan


pequeña que pueda considerarse clínicamente irrele­ Cuadro 15.4  Fórmula para el cálculo del
vante. Por ello, debe definirse cuál es la máxima dife­ tamaño de la muestra en un
rencia que puede existir entre dos intervenciones para estudio de equivalencia
considerarlas equivalentes. Este margen de equivalen­
Equivalencia entre dos proporciones (variable
cia, conocido como delta, debe ser menor que la míni­
cualitativa)
ma diferencia clínicamente importante, que es la que 2⋅P⋅(1−P)⋅(Za+Zb)2
se utilizaría para determinar el tamaño de la muestra N = _______________
​      ​
  
(d−d*)
2

en un estudio de superioridad. En los estudios de Equivalencia entre dos medias (variable


equivalencia, una forma de calcular el tamaño cuantitativa)
de la muestra necesario es tomar el valor del mar­ 2⋅s2⋅(Za+Zb)2
gen de equivalencia como la diferencia que se desea N = ___________
​     ​ 
(d−d*)
2

ser capaz de detectar. Sin embargo, este procedimien­ N: número de sujetos necesarios en cada uno
to infraestima el número de sujetos necesarios. de los grupos.
Tal como se comenta en el capítulo 5, la inter­ Za: valor de Z correspondiente al riesgo a fijado
pretación de los resultados de los estudios de (tabla 15.4).
equivalencia se basa en el análisis del intervalo Zb: valor de Z correspondiente al riesgo b fijado
de confianza (IC) de la diferencia observada, de mane­ (tabla 15.5).
ra que se considera que existe equivalencia si todo el IC P: proporción que se espera en el grupo control
se sitúa dentro de los márgenes de equivalencia (o si (en caso de una variable cualitativa)
su límite inferior está por encima de dicho margen S2: variancia de la distribución de la variable de
en los estudios de no-inferioridad). Para obtener un respuesta (en caso de una variable cuantitativa)
IC lo suficientemente estrecho es necesario estudiar d: diferencia máxima entre las respuestas
a ambos tratamientos que se tolerará para concluir
un número de sujetos sustancialmente más elevado
que son equivalentes (margen de equivalencia)
que en los estudios de superioridad. Por lo tanto, en
d*: diferencia esperada entre las respuestas
el cálculo del tamaño de la muestra en este tipo de
a ambos tratamientos
estudios debe tenerse en cuenta no solamente el
margen de equivalencia establecido, sino también
el valor esperado de la respuesta (Tamayo-Sarver
El mismo resultado se obtendría si el estudio se
et al, 2005), tal como se muestra en la fórmula del
plantease con una hipótesis de no-inferioridad, en
cuadro 15.4. La tabla G del final del libro presenta el
el que los investigadores definieran que considera­
número de sujetos necesarios para estudios de equi­
rían que la monodosis es mejor alternativa terapéutica
valencia en las situaciones más habituales cuando la
si no es más de un 10% inferior a la pauta de 7 días.
variable de respuesta es dicotómica.
Este procedimiento suele sobreestimar el número
de sujetos necesarios. Para obtener un cálculo más
Ejemplo 15.8.  Un estudio se propone evaluar la
ajustado, puede utilizarse una fórmula basada en el
eficacia de una pauta monodosis para el tratamiento
cálculo del IC, tal como se comenta a continuación.
de las infecciones urinarias frente a la pauta habi­
tual de 7 días, cuya eficacia se sitúa alrededor del
© Elsevier. Fotocopiar sin autorización es un delito.

90% (P = 0,90). La monodosis es menos costosa y


Cálculo del tamaño
facilita el cumplimiento del paciente, por lo que
interesa determinar si la monodosis y la pauta de de la muestra basado
7-10 días pueden considerarse equivalentes. Los en intervalos de confianza
investigadores definen que considerarán que lo son
si la diferencia de eficacia entre ellas no supera el Algunos autores piensan que si los resultados de un
10% (margen de equivalencia d = 0,10). Por otro estudio se analizan, se interpretan y se presentan
lado, los investigadores esperan encontrar que la mediante IC, el cálculo del tamaño de la muestra
monodosis es ligeramente inferior, en un 5%, a la debería basarse también en IC.
pauta de 7 días (d* = 0,05). Se aceptan los niveles Al interpretar los resultados de un estudio se reco­
de error a del 0,05 (hipótesis bilateral) y b del 20% mienda tener en cuenta la diferencia mínima que se
(potencia: 1 − b = 0,80). Aplicando la fórmula del considera relevante desde el punto de vista clínico (ver
cuadro 15.4 para una variable dicotómica, puede capítulo 27). Si el límite inferior del IC se encuentra
determinarse que son necesarios 565 sujetos por por encima del valor de esta diferencia mínima, se con­
grupo. La tabla G del final del libro proporciona el sidera que el resultado del estudio es no solamente es­
mismo resultado. tadísticamente significativo, sino también concluyente

151

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

a favor de la existencia de una diferencia clínicamente Si pensamos que la diferencia más realista entre
relevante. De modo similar, si el valor superior del IC grupos es del 14% (P1 = 20%, P2 = 34%) y desea­
está por debajo del valor de la diferencia mínima, el mos que el límite inferior del IC del resultado esté
resultado es concluyente a favor de la ausencia de una por encima de la mínima diferencia clínicamente
diferencia clínicamente relevante. relevante (9,5%), la diferencia entre ambos valores
En algunas ocasiones existe desacuerdo entre el mé­ es del 5,5%, por lo que la amplitud del IC será del
todo del cálculo del tamaño de la muestra basado en 11% (WIC = 2 × 0,055 = 0,11). Aplicando la fórmula
el contraste estadístico de hipótesis y la interpretación anterior, se obtiene que se requieren 748 pacientes
de los resultados basada en los IC. Este desacuerdo por grupo.
es evidente cuando el investigador ha calculado el Debido a que WIC será habitualmente un valor
tamaño de la muestra necesario para detectar, con pequeño, el tamaño de la muestra será superior al
una determinada potencia estadística, una diferencia calculado con el método tradicional, el resultado
mínima entre dos tratamientos, pero el análisis del IC será más preciso y con la suficiente potencia es­
del resultado muestra que valores inferiores a dicha tadística. Además, este abordaje tiene la ventaja de
diferencia son compatibles con los datos observados. facilitar la comunicación entre el clínico y el estadís­
En esta situación, el investigador no puede concluir tico. Para el clínico es más difícil entender conceptos
con certeza cuál es la mejor alternativa terapéutica. como el de la potencia estadística y el contraste de
hipótesis que la interpretación de un IC.
Ejemplo 15.9.   En un estudio que comparaba la Tal como hemos comentado en el apartado
cirugía convencional (P1) con la radical (P2) en anterior, este enfoque es especialmente adecua­
el tratamiento del cáncer gástrico, el cálculo del do en el caso de los estudios de equivalencia y
tamaño de la muestra se basó en la asunción de ­no-inferioridad.
una diferencia en la supervivencia a los 5 años del
14% (P1 = 20%; P2 = 34%) (Fayers et al, 2000). Ejemplo 15.11.  Retomemos el ejemplo 15.8 sobre
Tomando como base estas tasas de supervivencia, un estudio hipotético que se propone evaluar la
se requerían 400 pacientes por grupo si se deseaba eficacia de una pauta monodosis para el tratamiento
una potencia estadística del 90%. Al inicio del estu­ de las infecciones urinarias frente a la pauta habitual
dio, un grupo de 26 cirujanos rellenaron un cues­ de 7 días, cuya eficacia se sitúa alrededor del 90%
tionario en el que manifestaban que una mejora en (P = 0,90). Los investigadores habían establecido
la tasa de supervivencia del 9,5% podía considerarse el margen de equivalencia (o de no-inferioridad)
clínicamente relevante. Si los resultados del estudio en el 10%. Dado que esperaban encontrar una di­
hubieran sido los de las asunciones usadas para el ferencia del 5%, su IC debería tener una amplitud
cálculo del tamaño de la muestra, y 400 pacientes máxima que permitiera descartar el valor de dicho
hubieran finalizado el estudio en cada grupo, se ob­ margen (un 5% por encima y por debajo del valor
tendría una diferencia del 14% con un IC 95% cuyos observado, por lo que WIC = 2 × 0,05 = 0,10. Apli­
límites serían 5,4% y 22,6%. Este resultado, aunque cando la fórmula, se determina que son necesarios
es estadísticamente significativo, no descarta que la 336 sujetos por grupo, estimación inferior a los
diferencia en la supervivencia pueda ser inferior al 565 calculados por el procedimiento utilizado en
9,5%, por lo que no sería concluyente. el ejemplo 15.8.

Este problema se puede evitar basando el cálculo De hecho, si se hubieran estudiado 336 sujetos
del tamaño de la muestra en los IC mediante la por grupo y se hubiera obtenido una diferencia del
siguiente fórmula: 5% entre los grupos, los límites del IC 95% de esta
8Z2 p(1−p) diferencia serían 0,00013 y 0,09987 (es decir, 0,01%
n = _________
​  a 2 ​  

WIC y 9,99%), lo que permite concluir la no-inferioridad
donde n es el número de individuos por grupo, Za es de la monodosis (en caso de obtenerse estos resulta­
el valor de Z correspondiente al riesgo a fijado, dos) ya que todo el IC queda por debajo del margen
P es la proporción del parámetro estimado en la pobla­ del 10% fijado.
ción (P = [P1 + P2]/2) y WIC es la amplitud del IC. Si se hubieran estudiado 565 sujetos por grupo,
como se había calculado anteriormente, y se hubiera
Ejemplo 15.10.  Consideramos el estudio planteado encontrado una diferencia del 5%, los límites del
en el ejemplo anterior (Fayers et al, 2000). Aplican­ IC 95% en este caso serían del 1,2% y 8,8%. Este
do la fórmula: ­resultado permitiría llegar a la misma conclusión,
8⋅1,962⋅0,27⋅0,73 pero habiendo estudiado un mayor número de
n = _____________
​  2     ​

WIC sujetos.

152

ERRNVPHGLFRVRUJ
Tamaño de la muestra Capítulo | 15 |

fenómeno de interés, por lo que deben aplicarse


Corrección por las no siempre que sea posible para aumentar la potencia
respuestas, las pérdidas del estudio (cuadro 15.5).
y los abandonos Algunas de estas estrategias enumeradas pueden
implicar una modificación de las hipótesis de traba­
jo. Por ello, es importante realizar, ya en fases tem­
El número de sujetos calculado debe ampliarse en
pranas del diseño, una estimación aproximada del
función del porcentaje de no respuestas, pérdidas y
número de sujetos necesario, con el fin de evaluar
abandonos durante el seguimiento y de las desvia­
la factibilidad del estudio y discutir si es necesario
ciones del protocolo que puedan esperarse, de forma
replantear o adaptar la hipótesis de trabajo o el es­
que se asegure que finalizará el estudio el número de
tudio en general.
pacientes requerido. Una fórmula para hacerlo es la
siguiente:
Na = N [1/(1−R)]
donde N representa el número de sujetos teórico; Cuadro 15.5  Estrategias para disminuir
Na, el número de sujetos ajustado, y R, la proporción el número de sujetos
esperada de pérdidas. necesarios en un estudio
Ejemplo 15.12.  Para realizar un estudio se ha cal­ 1 Al seleccionar la variable de respuesta, usar:
culado que son necesarios 300 sujetos (N = 300) y • Variables cuantitativas que aumentan la
se espera un 20% de pérdidas (R = 0,20). El número potencia de las pruebas estadísticas
de pacientes que deberían iniciar el estudio sería • Variables precisas
Na = 300 [1/(1 − 0,2)] = 375 sujetos. • Variables de presentación frecuente
2 Al medir las variables, usar:
La utilización de esta fórmula asegura que el es­ • Promedios de medidas repetidas
tudio mantenga la potencia estadística deseada, pero • Técnicas de medición precisas
no evita que se puedan producir sesgos si las no • Criterios y técnicas estandarizados
3 Seleccionar la población de estudio:
respuestas, las pérdidas o los abandonos no se han
• Homogéneas (criterios de selección
producido aleatoriamente, es decir, si los sujetos que
restrictivos)
finalizan el estudio no son representativos de los
• Poblaciones de alto riesgo, en las que es más
que lo inician (lo que suele ser habitual).
frecuente observar la respuesta
4 Al diseñar el estudio, valorar si es posible:
• Asignar aleatoriamente los sujetos a los
Estrategias para minimizar grupos
el número de sujetos • Usar como medida de la respuesta las
necesario diferencias individuales entre el inicio y el final
del estudio
Estas estrategias se basan en conseguir una pobla­ • Usar diseños especiales (p. ej., diseños
cruzados)
© Elsevier. Fotocopiar sin autorización es un delito.

ción homogénea, disminuir la variabilidad de las


• Estratificar por factores pronósticos
medidas y aumentar la frecuencia de aparición del

Bibliografía de los ejemplos


Fayers PM, Cuschieri A, Fielding J, LS. Sample size calculation for clinician beliefs. Br J Cancer.
Craven J, Uscinska B, Freedman clinical trials: the impact of 2000;82(1):213-9.

153

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

Bibliografía
Bland JM. The tyranny of power: missing at random. Stat Med. in clinical trials for testing
is there a better way to 2010;29(15):1572-9. differences in proportions for
calculate sample size? BMJ. Hauschke D, Kieser M, Diletti the two-sample design: a review.
2009;339:b3985. E, Burke M. Sample size Stat Med. 1996;15:1-21.
Campbell MJ, Julious SA, Altman determination for proving Schlesselman JJ. Case-control
DG. Estimating sample size equivalence based on the ratio studies: design, conduct,
for binary, ordered categorial, of two means for normally analysis. Nueva York: Oxford
and continuous outcomes in distributed data. Stat Med. University Press; 1982.
two group comparison. BMJ. 1999;18:93-105. Tamayo-Sarver JH, Albert JM,
1995;311:1145-8. Marrugat J, Vila J, Pavesi M, Sanz Tamayo-Sarver M, Cydulka
Fitzner K, Heckinger E. Sample size F. Estimación del tamaño de RK. Advanced statistics: how
calculation and power analysis: la muestra en la investigación to determine whether your
a quick review. Diabetes Educ. clínica y epidemiológica. Med intervention is different, at least
2010;36(5):701-7. Clin (Barc). 1998;111:267-76. as effective as, or equivalent:
Florey CV. Sample size for Norman GR, Streiner DL. a basic introduction. Acad
beginners. BMJ. 1993;306: Bioestadística. Madrid: Emerg Med. 2005;12:536-42.
1181-4. Mosby-Doyma; 1996. Whitehead J. Sample size
Kerry SM, Bland JM. Sample size Obuchowski NA. Sample size calculations for ordered
in cluster randomisation. BMJ. calculations in studies of test categorical data. Stat Med.
1998;316:549. accuracy. Stat Methods Med Res. 1993;12:2257-71.
Kosinski AS, Chen Y, Lyles RH. 1998;7:371-92. Wittes J. Sample size calculations
Sample size calculations for Sahai H, Khurshid A. Formulae and for randomized controlled
evaluating a diagnostic test tables for the determination trials. Epidemiol Rev.
when the gold standard is of sample sizes and power 2002;24:39-53.

154

ERRNVPHGLFRVRUJ
Capítulo | 16 |

Muestreo

El principio de representatividad implica que, para más fidedignos al estudiar una muestra que a toda
que los resultados de una investigación tengan vali- la población.
dez interna, la muestra de sujetos estudiados debe También es un problema de cantidad de informa-
ser representativa de la población de estudio. En los ción. Al poder invertir más recursos en el estudio
estudios transversales que estiman un parámetro se de cada individuo, pueden medirse otras variables,
emplean técnicas de muestreo probabilístico, que lo que no es posible hacer en toda la población. Si
aumentan la probabilidad de obtener una muestra algunas de estas variables son potenciales factores de
representativa. Cuando no se dispone de un lista- confusión, su medición posibilita su control en el
do con los miembros que forman la población de análisis, lo que aumenta la validez de los resultados
estudio o cuando ésta es dinámica, y la muestra del estudio.
de sujetos se selecciona por métodos como la in-
clusión consecutiva de los pacientes que acuden a Ejemplo 16.1.   En un estudio cuyo objetivo era
la consulta y cumplen los criterios de selección, para conocer la prevalencia de factores de riesgo cardio-
poder realizar inferencias, también debe asumirse vascular en jóvenes de 16 a 19 años, se seleccionó
que la muestra seleccionada es representativa de la aleatoriamente una muestra de 1.176 estudiantes en
población de estudio. los que se evaluaron unos pocos factores de riesgo
(Andersen et al, 1989). A partir de esta muestra se
seleccionó uno de cada cuatro estudiantes, en los
Ventajas del muestreo que además se analizó su perfil lipídico, se midieron
la presión arterial, el pliegue corporal, y el pulso
La razón principal para estudiar una muestra y no en condiciones basales y después de una actividad
toda la población es el ahorro en tiempo, dinero y intensa. Con la finalidad de establecer la represen-
otros recursos. Es una cuestión de eficiencia. Si se tatividad de la segunda muestra se compararon la
ha calculado que son necesarios 300 individuos, y edad, el sexo, la talla y el peso con la primera, y no
la población de referencia la forman 3.000 personas, se encontraron diferencias significativas. El hecho
estudiarlas a todas supone desperdiciar una buena de estudiar un conjunto de variables de forma más
cantidad de recursos, ya que, si la selección de la exhaustiva en una muestra reducida persigue el ob-
muestra y la medición de las variables se realizan jetivo de alcanzar mayor exactitud y estandarización
correctamente, se obtendrá un resultado válido en las medidas llevadas a cabo.
estudiando una muestra representativa de 300 per-
sonas.
Una segunda ventaja del muestreo, también
relacionada con la validez del estudio, es que las Planificación del muestreo
mediciones tenderán a ser de mayor calidad, ya
que se pueden dedicar más esfuerzos al estudiar Las unidades de muestreo son los elementos sobre los
un menor número de individuos. Paradójicamente, que se aplicará la técnica de selección. Pueden ser
podría darse el caso de que se obtuvieran resultados personas, centros de salud o escuelas, por ejemplo.

© 2013. Elsevier España, S.L. Reservados todos los derechos 155

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

Si se quiere estimar la prevalencia de hipertensión tiende a asegurar que se obtendrá una muestra re-
arterial (HTA) en una población, serán las personas; presentativa, en especial si la población y la muestra
si se pretende conocer el número de escuelas de una son de gran tamaño. Sin embargo, puede que no
provincia en las que se imparte educación sanitaria, sea así, ya que el propio azar puede conducir a una
serán las escuelas. muestra que no tenga la misma distribución de las
Las unidades de muestreo no tienen que coincidir variables de interés que la población de referencia,
necesariamente con las unidades de análisis. En un sobre todo si su tamaño es reducido. Por otro lado,
estudio para conocer la prevalencia de HTA en la po- pueden obtenerse muestras representativas utilizan-
blación escolar, las unidades de muestreo pueden ser do técnicas no probabilísticas.
las escuelas, pero se analiza en cada una la presión En todas las técnicas probabilísticas la selección
arterial de sus alumnos (unidades de análisis). de las unidades se realiza al azar y se evita la posi-
El primer paso para planificar un muestreo suele ble parcialidad, consciente o inconsciente, de los
ser la definición del marco muestral, que es esencial- investigadores. Por esta razón, es más probable que
mente una lista, o forma de identificación, de las las muestras tiendan a ser representativas, aunque
unidades de muestreo sobre las que se aplicará el ello no significa que estén exentas de error. En reali-
proceso de selección. La definición de este marco dad, la muestra seleccionada no es más que una de
debe ser cuidadosa, ya que condiciona la interpre- las muchas que podrían obtenerse de la población
tación de los resultados. de referencia. Es probable que la estimación de la
variable obtenida a partir de una muestra difiera
Ejemplo 16.2.  En un estudio sobre la asociación de su verdadero valor en la población de referencia
entre la adaptación social y la depresión, Luty et al por azar (error aleatorio o debido al muestreo), y lo
(2002) comprobaron que esta asociación no varia- es más cuanto menor es el tamaño de la muestra. El
ba entre los diferentes países, pero sí dependía del uso de muestras probabilísticas permite la aplicación
marco muestral del estudio, ya que se observaron de técnicas estadísticas capaces de cuantificar este
resultados diferentes en la comunidad y en los cen- error aleatorio.
tros sanitarios.
Muestreo aleatorio simple
Ejemplo 16.3.  Fuchs et al (2001) compararon la
prevalencia de HTA que se obtenía al utilizar dos Es aquella técnica en la que cada unidad del marco
marcos muestrales diferentes: los adultos residentes muestral tiene la misma probabilidad de ser esco-
en una población y los que acuden a una unidad gida y en la que cada una de las posibles muestras
de prevención de la HTA en un centro sanitario. del mismo tamaño tienen la misma probabilidad
Las diferencias en la prevalencia observada (el 24 de ser escogidas. El muestreo aleatorio simple es, pues,
frente al 42%, respectivamente) ilustran la influencia un procedimiento equiprobabilístico, pero no todo
del proceso de muestreo sobre la evaluación de los método equiprobabilístico es aleatorio simple.
factores de riesgo en la población.
Ejemplo 16.4.  Silva (1993) ilustra este concepto con
El siguiente paso es decidir cómo seleccionar la el siguiente ejemplo: supongamos un grupo de 10 ni-
muestra. En líneas generales, las técnicas de mues- ños ordenados alfabéticamente, de los que se ­quiere
treo pueden clasificarse en probabilísticas y no seleccionar una muestra de 5 niños. Consideremos
probabilísticas. los tres siguientes procedimientos de selección:
a) tomar los 5 primeros de la lista; b) dividir el lis-
tado en dos grupos (los 5 primeros y los 5 últimos),
Técnicas de muestreo lanzar una moneda al aire y tomar como muestra
los elementos del primer grupo en caso de obtener
cara, y los del segundo en caso de obtener cruz, y
Muestreo probabilístico
c) numerar los 10 elementos y obtener 5 números
Se define como el proceso de selección en que todos aleatorios. El método a no es probabilístico, ya que
los individuos candidatos tienen una probabilidad los últimos 5 niños del listado no podrán salir en
conocida, distinta de cero, de ser incluidos en la la muestra. El método b es equiprobabilístico por-
muestra. Se utiliza alguna forma de selección aleato- que todos los niños tienen la misma probabilidad
ria para obtener las unidades que serán estudiadas. de salir en la muestra, pero no es aleatorio simple, ya
Existe una tendencia a considerar sinónimas las que sólo dos muestras pueden ser elegidas (existen
expresiones muestra probabilística y muestra representa- subconjuntos de 5 elementos que no podrían ser
tiva. El uso de una técnica de muestreo probabilístico seleccionados). El método c es aleatorio simple, ya

156

ERRNVPHGLFRVRUJ
Muestreo Capítulo | 16 |

que cualquiera de los 252 subconjuntos diferentes Los estratos deben definirse en función de varia-
de 5 niños puede ser seleccionado y con la misma bles que puedan influir sobre los resultados. Si se
probabilidad. desea determinar la prevalencia de HTA en una co-
munidad, posibles factores de confusión serían, en-
Como se deduce del ejemplo anterior, el pri- tre otros, la edad, el sexo o la presencia de obesidad,
mer paso es preparar una lista de las unidades de ya que son variables relacionadas con la presencia
muestreo, numerándolas, por ejemplo, de forma de HTA. Si se aplicara un muestreo aleatorio sim-
secuencial. Este proceso puede ser fácil y rápido ple, podría obtenerse una muestra en la que la dis-
si la población de referencia se encuentra en una tribución de estas variables no fuera la misma que
base de datos informatizada, o muy laborioso si se en la población, lo que conduciría a un sesgo en
realiza manualmente y la población es amplia. A los resultados. Un muestreo estratificado por estos
continuación, se seleccionan tantos números alea- factores garantizaría una distribución similar a la
torios como elementos debe tener la muestra. La de la población de referencia.
selección de números aleatorios suele realizarse con
un ordenador o una calculadora de mano. Ejemplo 16.5.  Supongamos un marco de muestreo
Esta técnica es sencilla y de fácil comprensión, de 2.000 personas en las que se desea estimar la pre-
y permite el cálculo rápido de medias y variancias. valencia de HTA, estudiando para ello una muestra
Requiere, sin embargo, que se conozca de antemano de 250 sujetos. Se conoce que la prevalencia de HTA
la lista completa de todas las unidades de muestreo. varía en función del sexo y la presencia de obesidad.
Si la lista contiene fallos u omite segmentos de la Por tanto, los investigadores desean que la muestra
población, se perderán las ventajas propias del mues- en que se realizará el estudio refleje fielmente la dis-
treo aleatorio, ya que todas las unidades no tendrán tribución, según el sexo y la presencia de obesidad
la misma probabilidad de aparecer en la muestra. que tiene la población de referencia, que se muestra
en la tabla 16.1. Así, por ejemplo, existe un 12%
de hombres obesos, por lo que, de los 250 sujetos de
Muestreo aleatorio estratificado
la muestra, un 12% deberá tener estas características.
Se trata de una modificación del método anterior Por tanto, de los 240 hombres obesos de la pobla-
que intenta asegurar que la muestra presente la ción, deben seleccionarse aleatoriamente 30 para
misma distribución que la población en relación formar parte de la muestra. Se procede de la misma
con determinadas variables. forma con los otros estratos (tabla 16.1).
La población se divide en estratos en función de
las categorías de las variables por las que se desea La correcta aplicación de esta técnica requiere que
estratificar, formando subgrupos con alguna carac- se conozca la distribución en la población de la(s)
terística en común y mutuamente excluyentes. A variable(s) empleada(s) para la estratificación y que
continuación, se escoge una muestra aleatoria de la variabilidad entre los distintos estratos sea lo más
cada estrato, manteniendo las proporciones observa- amplia posible, mientras que dentro de cada estrato
das en la población de referencia (muestreo aleatorio debe ser lo más pequeña posible. Así, se obtendrán
estratificado proporcional). subgrupos homogéneos respecto a la posible variable
© Elsevier. Fotocopiar sin autorización es un delito.

Tabla 16.1  Muestreo estratificado (ejemplo 16.6)

Distribución de una población de 2.000 personas en función del sexo y la obesidad


Varones Mujeres Total

Obesidad 240 (12%) 320 (16%) 560 (28%)


No obesidad 960 (48%) 480 (24%) 1.440 (72%)
Distribución de una muestra de 250 personas que mantiene la misma distribución en función del sexo y la
obesidad que la población general
Varones Mujeres Total

Obesidad 30 (12%) 40 (16%) 70 (28%)


No obesidad 120 (48%) 60 (24%) 180 (72%)

157

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

de confusión (todos los miembros de un estrato la Muestreo en múltiples etapas


presentan o no) y heterogéneos entre sí (miembros
de distintos estratos no comparten la variable). Esta técnica consiste en seleccionar unidades de
En general, con el muestreo estratificado se obtie- muestreo de una población (unidades primarias) y,
nen estimaciones más precisas que con el muestreo en una segunda etapa, obtener una muestra de cada
aleatorio simple, porque la variancia total se basa en una de las unidades primarias (unidades secunda-
la de cada uno de los estratos, y éstos son más homo- rias). Por ejemplo, si se desea estudiar la prevalencia
géneos que la población. El aumento de precisión de escoliosis en niños de edad escolar, una manera de
que se consigue depende de las diferencias entre los seleccionar la muestra sería elegir al azar escuelas
estratos. Cuanto mayor sea esta diferencia, y menor y, dentro de cada una, una muestra de niños. Se
la variabilidad dentro de cada estrato, mayor será la pueden usar el número de etapas que sean necesarias
reducción de la variancia que se produce. Por tanto, y, en cada una de ellas, aplicar un método diferente
siempre que se utiliza un muestreo estratificado, de muestreo (simple, estratificado, sistemático).
debe tenerse en cuenta en el análisis, al realizar las Cuando en el estudio se incluyen todas las unidades
estimaciones. secundarias (es decir, la fracción de muestreo es del
Cuando alguno de los estratos tiene un tamaño 100%), se denomina muestreo en conglomerados.
reducido, puede desaparecer esta ventaja, ya que Esta técnica es útil cuando la población de referen-
disminuiría la precisión de la estimación en dicho cia es muy grande y está dispersa, como en el caso
estrato y podría afectar a la de la estimación global. de la población escolar de un país o una gran ciudad.
En esta situación, puede aplicarse un muestreo no pro- El uso de una técnica aleatoria simple sería muy
porcional que sobrerrepresente este estrato, aplicando costoso, ya que la muestra incluiría a pocos estu-
sobre él una fracción de muestreo diferente. Esta diantes de cada institución y los investigadores ten-
alternativa dificulta el análisis, ya que la estimación drían que ir a casi todas ellas para entrevistarlos o
del parámetro en el global de la muestra deberá ha- examinarlos, con lo que se rentabilizaría muy poco
cerse a partir de cada estrato por separado, y ponde- cada viaje. Además, es probable que no se disponga
rando la diferente variabilidad de cada uno de ellos. de un listado de todos los niños en edad escolar de
De hecho, el muestreo no proporcional se utiliza una ciudad, pero sí de una lista de escuelas, y que
más cuando la finalidad es realizar comparaciones cada una de ellas tenga el listado de sus alumnos.
entre los estratos, con el fin de asegurar que cada Su desventaja principal es que si las unidades pri-
uno de ellos tiene el tamaño suficiente para obtener marias contienen personas similares en relación con
estimaciones con la suficiente precisión. el fenómeno de interés, la precisión de la estimación
será menor que si se utiliza un muestreo aleatorio
Ejemplo 16.6.  Supongamos que se lleva a cabo una
simple, por ejemplo. Si se considera un estudio so-
encuesta entre los médicos de atención primaria bre los hábitos alimentarios de una comunidad y se
para conocer su opinión sobre un determinado pro- encuesta a 100 individuos obtenidos mediante un
blema de salud. La distribución de médicos según muestreo aleatorio simple, el grado de información
su ámbito de trabajo es la siguiente: 230 (56%) y la precisión de las estimaciones no será igual que
trabajan en el medio urbano, 160 (39%) en el se- si se estudian 100 individuos (unidad secundaria)
miurbano y 20 (5%) en el rural. Si se seleccionara procedentes de 25 familias (unidad primaria). Los
una muestra de 100 médicos y se mantuvieran las hábitos alimentarios son muy parecidos entre miem-
mismas proporciones, sólo se conseguirían las res- bros de una misma familia, por lo que, en realidad,
puestas de 5 médicos rurales, lo cual sería insufi- es casi como si sólo se estudiara a 25 personas. Ade-
ciente para conocer su opinión y compararla con la más, si una o varias familias son muy numerosas,
de otros grupos. Los investigadores deciden aplicar contribuirán de una forma desproporcionada al
diferentes fracciones de muestreo en cada uno de los tamaño de la muestra
estratos (urbanos, 20%; semiurbanos, 30%; rurales, Otro inconveniente es que la variabilidad es ma-
100%), con lo que la distribución de encuestados es yor que las técnicas anteriores, y su cálculo es com-
de 46, 48 y 20, respectivamente. Hay que tener en plejo. Una solución parcial es extraer una muestra de
cuenta las diferentes fracciones si se quieren realizar mayor tamaño y considerarla como aleatoria simple,
estimaciones globales de toda la muestra, lo que aña- y procurar que las unidades de muestreo sean lo más
de cierta dificultad al análisis. Si se tiene la intención pequeñas posible.
de realizar un análisis sólo de los subgrupos por se-
parado, no es necesario tener en cuenta las diferentes Ejemplo 16.7.  Un estudio tenía por objetivo conocer
fracciones de muestreo, porque cada estrato puede las creencias y opiniones de los escolares respecto al ta-
considerarse una población diferente. baco, el alcohol y el ejercicio físico (Comín et al, 1989).

158

ERRNVPHGLFRVRUJ
Muestreo Capítulo | 16 |

Se seleccionó una muestra representativa de escola- está ordenada siguiendo una tendencia conocida
res de la ciudad de Barcelona. La técnica de mues- (de mayor a menor, de más viejo a más joven, etc.),
treo empleada fue la de conglomerados en varias el muestreo sistemático asegura una cobertura de
etapas. Se tomó como unidad de muestreo el aula, unidades de todos los tipos. Si interesa extraer una
estratificando por las siguientes variables: curso, muestra de los médicos de una provincia y el colegio
tipo de escuela (pública, privada) y tamaño del profesional tiene las listas ordenadas por el año de
curso (número de aulas). Es importante remarcar licenciatura, podría darse el caso de que con un
que todos estos factores están relacionados con las muestreo aleatorio simple predominaran los médi-
variables estudiadas; el curso se asocia a los hábitos cos de una determinada edad. Sin embargo, con un
de vida a través de la edad, y el tipo de escuela, a muestreo sistemático, se aseguraría una muestra que
través de la clase social. La estratificación permite representara todos los años de licenciatura.
obtener estimaciones más precisas. El empleo del La limitación más importante para su uso aparece
muestreo por conglomerados es prácticamente ine- cuando la constante que se aplica está relacionada
vitable al estudiar la población escolar. El aumento con el fenómeno que se quiere medir. En este caso
de la variabilidad que acompaña a la utilización de se pueden hallar estimaciones muy distorsionadas
conglomerados se minimiza al tomar el aula, en lu- de los parámetros poblacionales.
gar del colegio, como unidad primaria de muestreo,
y se compensa parcialmente con la estratificación. Ejemplo 16.9.  Supongamos que se quiere estudiar
la actividad asistencial de un equipo de atención
primaria y que la unidad de muestreo son los días
Muestreo sistemático
de la semana. Si el primer día seleccionado fuera un
Este procedimiento se basa en aplicar alguna re- lunes y se aplicara una constante (k = 7), se recoge-
gla sistemática simple, como elegir uno de cada n ría únicamente la actividad realizada los lunes de
individuos. Los pasos a seguir son los siguientes: en cada semana. Con este procedimiento se sobrestima-
primer lugar, se calcula la constante de muestreo (k), ría la media real de visitas, ya que tradicionalmente
dividiendo el total de la población candidata por el los lunes son los días de mayor actividad. Como
tamaño de la muestra deseado. A continuación, se puede deducirse, estas situaciones son muy poco
extrae la primera unidad al azar entre las k primeras frecuentes y, en todo caso, es relativamente fácil
unidades de muestreo, y se le suma la constante, intuir que la constante de muestreo está relacionada
sucesivamente, hasta completar el tamaño de la con el fenómeno de estudio.
muestra.
Las ventajas y desventajas de cada uno de los
Ejemplo 16.8.  Supongamos que deseamos obtener métodos de muestreo probabilístico se encuentran
una muestra de 200 historias clínicas de un archivo en la tabla 16.2.
de 1.000 historias. La constante de muestreo es
1.000/200 = 5, lo que significa que se escoge una
Muestreo no probabilístico
de cada 5 historias. La primera se elige de forma
aleatoria entre los números del 1 al 5. Si la elegida es En el muestreo no probabilístico se desconoce la
la 2, la siguiente es la 7 (2 + 5), después la 12 (7 + 5), la probabilidad que posee cada unidad de ser incluida
© Elsevier. Fotocopiar sin autorización es un delito.

17 (12 + 5), y así sucesivamente, hasta conseguir las en la muestra, y la selección se realiza mediante
200 historias necesarias. métodos en los que no interviene el azar.
El uso de pruebas estadísticas requiere que la
La primera ventaja del muestreo sistemático muestra analizada sea aleatoria. Su aplicación en
es que es fácil de aplicar y, en ocasiones, es más muestras no obtenidas por un método aleatorio se
cómodo y práctico que el muestreo aleatorio sim- hace asumiendo que están libres de sesgos y que son
ple. Es más sencillo, por ejemplo, escoger todas las representativas de la población de referencia.
historias cuyo número termina en cero que a partir La técnica más frecuente es el muestreo consecutivo.
de un listado de números aleatorios. La segunda es Consiste en seleccionar a los pacientes que cum-
que no siempre es necesario tener de antemano una plen los criterios de selección especificados en el
lista completa y exhaustiva de toda la población. protocolo del estudio, a medida que acuden a la
Los sujetos se pueden ir seleccionando a medida consulta durante un período determinado.
que el estudio avanza, siempre y cuando lleguen
en algún orden preestablecido, como por ejemplo, Ejemplo 16.10.   Lee et al (2002) compararon las
los pacientes que acuden a una consulta. La terce- características de 1.546 pacientes que acudieron
ra ventaja es que, cuando la población de referencia consecutivamente a un centro de salud con las de

159

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

Tabla 16.2  Ventajas y desventajas de las principales técnicas de muestreo probabilístico

Ventajas Desventajas

Muestreo aleatorio simple


– Sencillo y de fácil comprensión – Requiere que se posea de antemano un listado
– Cálculo rápido de medias y variancias completo de toda la población
– Cuando se trabaja con una muestra pequeña, es
posible que no sea representativa de la población
Muestreo aleatorio estratificado
– Tiende a asegurar que la muestra representa – Se ha de conocer la distribución en la población
adecuadamente a la población en función de – Requiere que se posea de antemano un listado
unas variables determinadas completo de toda la población
– Se obtienen estimaciones más precisas – Cálculo de las estimaciones más complejo que en
– Se pueden aplicar distintas fracciones de muestreo el muestreo aleatorio simple
en cada estrato
Muestreo en etapas múltiples
– Es muy eficiente cuando la población es muy – Las estimaciones son menos precisas que con el
grande y dispersa muestreo aleatorio simple o estratificado
– La necesidad de listas de las unidades de una – El cálculo de las estimaciones es complejo
etapa se limita a aquellas unidades de muestreo
seleccionadas en la etapa anterior
Muestreo sistemático
– Fácil de aplicar – Si la constante de muestreo está asociada con
– No siempre es necesario disponer de una lista de el fenómeno de interés, se pueden obtener
toda la población estimaciones sesgadas
– Cuando la población está ordenada siguiendo una
tendencia conocida, asegura una cobertura de
unidades de todos los tipos

la población de referencia. Observaron que los pa- Otra técnica utilizada en encuestas de opinión
cientes incluidos en la muestra consultaban con y de mercado, pero muy poco en la investigación
mayor frecuencia, eran mayores, con peor estado epidemiológica, es el muestreo por cuotas, en el que
de salud (mayor prevalencia de HTA, accidente cere- la composición general de la población de referencia
brovascular y cáncer), menos fumadores y vivían en términos de características como la edad, el sexo,
solos, con mayor frecuencia. o la clase de educación se decide, o se conoce, de an-
temano. Seguidamente, se determina el número de
El muestreo consecutivo es la técnica más utilizada personas requerido, o las cuotas, para los hombres
en los ensayos clínicos. Si se evalúa la eficacia de una y las mujeres, según las diferentes edades y la clase
medida terapéutica contra la gastroenteritis, no se de educación, y el único requerimiento es conseguir
dispone al inicio del estudio de un listado de la po- el número adecuado de personas para llenar cada
blación que desarrollará la enfermedad, por lo que una de las cuotas.
no puede aplicarse un muestreo aleatorio simple. En algunas ocasiones, en especial cuando tanto
En esta situación, el equipo investigador se limita a el tamaño de la población de referencia como el de
reclutar a los individuos que cumplen los criterios la muestra son muy pequeños, la selección puede
de selección a medida que son diagnosticados. hacerse por criterios razonados. Por ejemplo, si
La inclusión de voluntarios es otra técnica de se desea conocer el funcionamiento de los centros
muestreo no probabilístico. En general, es preferi- de salud de una provincia a través de un análisis
ble rechazar su colaboración, ya que las verdaderas exhaustivo de dos de ellos, es preferible seleccionar
razones que llevan a una persona a prestarse para los dos centros que puedan considerarse los más
un estudio sin haber sido seleccionado para ello representativos, en vez de dejar la selección al azar.
suelen estar relacionadas con otras características En las técnicas adaptativas el diseño del muestreo
que afectan a la representatividad de la muestra. se adapta en función de las observaciones que se

160

ERRNVPHGLFRVRUJ
Muestreo Capítulo | 16 |

van realizando durante el estudio, por ejemplo, ganancia que suponen en términos de eficiencia en
solicitando a los participantes en un estudio sobre relación con las técnicas convencionales, pueden ser
consumo de drogas que informen al investigador la única forma operativa de obtener una muestra lo
sobre otros consumidores. Dependiendo del meca- suficientemente amplia. Su principal inconveniente
nismo de adaptación, reciben nombres como bola de es que deben aplicarse procedimientos estadísticos
nieve, paseos aleatorios o muestreo en red. Estas técnicas que tengan en cuenta su utilización.
son especialmente útiles cuando la población de La figura 16.1 presenta un algoritmo para la se-
interés es difícil de alcanzar, ya que, además de la lección de la técnica de muestreo.

Figura 16.1  Algoritmo para la selección de la técnica de muestreo.


© Elsevier. Fotocopiar sin autorización es un delito.

Bibliografía de los ejemplos


Andersen LB, Henckel P, Saltin B. LB, et al. Establishing the Luty SE, Joyce RR, Mulder
Risk factors for cardiovascular prevalence of hypertension. RT, McKenzie JM. Social
disease in 16-19 year Influence of sampling criteria. adjustment in depression:
old teenagers. Int J Med. Arq Bras Cardiol. 2001;76: the impact of depression
1989;225:157-63. 445-52. severity, personality, and
Comín E, Nebot M, Villalbí JR. Lee ML, Yano EM, Wang M, clinic versus community
Exercici i consum de tabac Simon BF, Rubenstein LV. sampling. J Affect Disord.
i alcohol dels escolars What patient population 2002;70:143-54.
de Barcelona. Gac Sanit. does visit-based sampling Silva Ayçaguer LC. Muestreo para la
1989;3:355-65. in primary care settings investigación en ciencias de la
Fuchs SC, Petter JG, Accordi MG, represent? Med Care. salud. Madrid: Díaz de Santos;
Zen VL, Pizzol Jr AD, Moreira 2002;40:761-70. 1993.

161

ERRNVPHGLFRVRUJ
Parte |3| Elaboración del protocolo de estudio

Bibliografía
Armitage P, Berry G, Matthews 2nd ed. New York: Oxford metodológicos» núm. 1. Madrid:
JNS. Statistical methods in University Press; 1996. Centro de Investigaciones
medical research. 4th ed. Phillips CV, LaPole LM. Sociológicas; 1991.
Oxford: Blackwell Science; Quantifying errors without Thompson SK, Collins LM.
2002. random sampling. BMC Med Adaptive sampling in research
Kelsey JL, Wittemore AS, Evans A, Res Methodol. 2003;3:9. on risk-related behaviors.
Thompson WD. Methods in Rodríguez Osuna J, Métodos de Drug Alcohol Depend.
observational epidemiology. muestreo. Colección «Cuadernos 2002;68(Suppl 1):S57-67.

162

ERRNVPHGLFRVRUJ

También podría gustarte