Está en la página 1de 12

9

Tcnicas de muestreo. Sesgos


ms frecuentes

Neus Canal Daz

9.1. Introduccin
Las tcnicas de muestreo son un conjunto de tcnicas estadsticas que estu-
dian la forma de seleccionar una muestra representativa de la poblacin, es
decir, que represente lo ms fielmente posible a la poblacin a la que se preten-
de extrapolar o inferir los resultados de la investigacin, asumiendo un error
mesurable y determinado.
Cuando queremos estudiar alguna caracterstica de una poblacin para obte-
ner el mximo de informacin veraz, se nos plantea un problema relacionado
con la eleccin de los individuos. Puesto que no podemos estudiar a toda la
poblacin por varias razones (proceso largo y coste elevado, entre otros), debe-
mos elegir estudiar una muestra que sea representativa y que nos permita extra-
polar los resultados que obtengamos a la poblacin de referencia. Sin embargo,
debemos considerar que el empleo de tcnicas de muestreo implica una serie
de ventajas y limitaciones.
Entre las ventajas se incluyen una mayor eficiencia en trminos econmicos y
mayor rapidez de obtencin de resultados. Por ejemplo, si para realizar nuestro

121

9-CAP 9 121 1/12/06, 13:15


estudio necesitamos una muestra de x pacientes, considerando que sta sea
representativa de la poblacin de estudio, y recogemos informacin acerca de x
+ 100, estamos derrochando ms dinero y tiempo del necesario. Si empleamos
slo el tamao muestral necesario, seleccionando la muestra de manera que
represente lo ms fielmente posible a la poblacin, podremos obtener tambin
mayor validez, puesto que el tiempo y dinero ahorrados se podrn emplear en
recoger la informacin o variables del estudio con mayor precisin y fiabilidad,
implicando una mayor validez interna final del estudio. Por otra parte, entre las
limitaciones de las tcnicas de muestreo se incluyen los errores que se pueden
cometer, como son el error aleatorio y el error sistemtico o sesgo, de los que
hablaremos en este mismo captulo.

9.2. Tcnicas de muestreo


Como ya hemos mencionado, para que las conclusiones obtenidas a partir
de una muestra sean vlidas para una poblacin, la muestra debe haberse selec-
cionado de forma que sea representativa de la poblacin a la que se pretende
aplicar la conclusin. Sin embargo, no existe un mtodo de muestreo que garan-
tice plenamente que una muestra sea representativa de la poblacin que some-
temos a estudio.
La mejor forma de asegurar la validez de las inferencias es seleccionar la
muestra mediante una tcnica aleatoria. A este tipo de muestreo se le denomi-
na muestreo probabilstico y puede definirse como aquel en que todos los
individuos de la poblacin tienen una probabilidad de entrar a formar parte de la
muestra (normalmente equiprobable, es decir, con la misma probabilidad).
Los diseos en que interviene el azar producen muestras representativas la
mayora de las veces, aunque no garantizan la representatividad de la poblacin
que sometemos a estudio. Aunque en muchos estudios no es posible obtenerla
rigurosamente de esta forma, es importante seleccionarla intentando que sea lo
ms parecida posible a la poblacin de inters. En este caso, el muestreo no
probabilstico utiliza mtodos en que no interviene el azar y por lo tanto, se
desconoce la probabilidad asociada a cada individuo para formar parte de la
muestra. Normalmente estos mtodos se utilizan en estudios exploratorios o
intencionales, en los cuales no es necesario proyectar los resultados. El inconve-
niente de este mtodo es que no puede asegurarse la representatividad de la
muestra.

122

9-CAP 9 122 1/12/06, 13:15


9.3. Clasificacin de los tipos de muestreo probabilstico
Como acabamos de explicar, el muestreo probabilstico es el que todos los
individuos de la poblacin a estudiar tienen una probabilidad conocida asociada
al hecho de entrar en el estudio. Entre los mtodos de muestreo probabilsticos
ms utilizados en investigacin encontramos los siguientes: Muestreo aleatorio
simple, estratificado, sistemtico y muestreo en etapas mltiples. A continua-
cin se describen las caractersticas de cada uno de los sistemas de muestreo.

9.3.1. Muestreo aleatorio simple


Se caracteriza porque cada elemento de la poblacin tiene la misma probabi-
lidad de ser escogido para formar parte de la muestra. Una vez censado el
marco de la poblacin, se asigna un nmero a cada individuo o elemento y se
elige aleatoriamente. La aleatorizacin puede realizarse mediante listas de n-
meros aleatorios generados por ordenador, aplicndolas para escoger de la po-
blacin los individuos o sujetos que coincidan con los nmeros obtenidos.
Este tipo de muestreo se caracteriza por su simplicidad y fcil comprensin,
aunque tambin posee algunas limitaciones, ya que no siempre es posible dispo-
ner de un listado de todos los individuos que componen la poblacin, general-
mente cuando son poblaciones grandes. Si se seleccionan muestras pequeas
mediante este mtodo pueden aparecer errores aleatorios, no representando la
muestra adecuadamente a la poblacin. Un ejemplo de muestreo aleatorio sim-
ple sera la eleccin de los individuos a travs de la eleccin realizada totalmente
al azar de un cierto nmero de DNI.

9.3.2. Muestreo estratificado


En este tipo de muestreo la poblacin de estudio se divide en subgrupos o
estratos, escogiendo posteriormente una muestra al azar de cada estrato. Esta
divisin suele realizarse segn una caracterstica que pueda influir sobre los re-
sultados del estudio. Por ejemplo, en el caso de seleccionar una muestra para
evaluar la altura, dada la heterogeneidad entre hombres y mujeres, la variable de
gnero podra ser una variable de estratificacin. Si la estratificacin se realiza
respecto un carcter se denomina muestreo estratificado simple, y si se realiza
respecto dos o ms caractersticas se denomina muestreo estratificado com-
puesto.
Si tenemos constancia o suponemos a priori que la poblacin de estudio
presenta variabilidad de respuesta con respecto a alguna caracterstica propia,
deberemos tener en cuenta este tipo de muestreo, dado que se producen esti-

123

9-CAP 9 123 1/12/06, 13:15


maciones ms precisas cuanto ms homogneos sean los elementos del estrato
y ms heterogeneidad exista entre estratos. As pues, entre las ventajas de este
tipo de muestreo es que tiende a asegurar que la muestra represente adecuada-
mente a la poblacin en funcin de la variable de estratificacin seleccionada, sin
embargo, debe conocerse la distribucin de la poblacin en las variables de
estratificacin, clara desventaja de este muestreo.
Para obtener la muestra en cada uno de los estratos pueden aplicarse dife-
rentes fracciones de muestreo, pudiendo ser proporcional al tamao en relacin
a la poblacin, es decir, la distribucin se realiza de acuerdo con el peso o tama-
o de la poblacin de cada estrato. Por ejemplo, si de los 5 millones de hipertensos
espaoles hay un 35% de pacientes que fuman, podemos estratificar de manera
que en nuestra muestra queden representados al igual que en el total de la
poblacin, la misma proporcin de hipertensos fumadores (35%) y de no fuma-
dores (65%).

9.3.3. Muestreo sistemtico


El muestreo sistemtico es muy similar al muestreo aleatorio simple. La dife-
rencia se obtiene en que en este tipo de muestreo se divide el total de la pobla-
cin de estudio entre el tamao de la muestra, obteniendo una constante de
muestreo (k). La primera unidad que formar parte de la muestra debe estar
entre 1 y k y se elige al azar; a partir de esta unidad se van seleccionando
sistemticamente uno de los k individuos siguiendo un orden determinado. Por
ejemplo, si obtenemos un valor de k=10 y seleccionamos al azar el nmero 6,
deberamos elegir todas las historias clnicas que finalizaran en 6: 006, 016,
026 .... Es un mtodo de muestreo muy sencillo de realizar y que cuando la
poblacin esta ordenada siguiendo una tendencia conocida, asegura una cober-
tura de unidades de todos los tipos. La principal limitacin es que si la constante
se asocia al fenmeno de inters puede cometerse un sesgo.

9.3.4. Muestreo en etapas mltiples


Consiste en empezar a muestrear por algo que no constituye el objeto de la
investigacin (unidades primarias), y obtener una muestra dentro de cada una de
ellas (unidades secundarias). Pueden utilizarse sucesivamente tantas etapas como
sean necesarias, y en cada una de ellas, una tcnica de muestreo diferente. Este
mtodo de muestreo se utiliza cuando la poblacin de referencia es muy amplia
y dispersa, ya que facilita la realizacin del estudio. Principalmente, el muestreo
en etapas mltiples se utiliza en estudios multicntricos, donde debemos elegir

124

9-CAP 9 124 1/12/06, 13:15


primero los hospitales y despus de haberlos seleccionado, realizamos el muestreo
de pacientes dentro del mismo.

9.3.5. Ventajas y desventajas de los distintos muestreos


probabilsticos
Como ya hemos mencionado anteriormente, los diferentes mtodos para
captar a los sujetos a constituir la muestra, presentan una serie de ventajas y
desventajas, que mostramos en resumen en la Tabla 3:
Mtodo de Ventajas Desventajas
Muestreo
Muestreo Sencillo y fcil comprensin. En muestras pequeas, puede
aleatorio Clculo rpido de medianas y no representar adecuadamente
simple varianzas. a la poblacin.

Muestreo Tiende a asegurar la


estratificado representatividad de la poblacin Debe conocerse la distribu-
para las variables de estratificacin. cin en la poblacin de las
Estimaciones ms precisas. variables de estratificacin.
Pueden aplicarse diferentes fraccio-
nes de muestreo dentro de cada
estrato.

Requiere un listado completo


De fcil aplicacin.
Muestreo de la poblacin.
SI la poblacin est ordenada
sistemtico Si la constante de muestreo
asegura una cobertura de las
est relacionada al fenmeno
unidades de todos los tipos.
de inters pueden encontrarse
estimaciones sesgadas.

Muestreo en Resulta eficiente en muestras El error estndar es superior al


etapas grandes y dispersas No es necesario cometido en el muestreo
mltiples un listado de toda la poblacin aleatorio simple o estratificado.
El clculo del error estndar es
complicado.

Tabla 3. Mtodos de muestreo. Ventajas e inconvenientes

9.4. Clasificacin de los tipos de muestreo no probabilstico


Los procedimientos no probabilsticos son aquellos en los que no conoce-
mos la probabilidad de que un elemento de la poblacin pase a formar parte de

125

9-CAP 9 125 1/12/06, 13:15


la muestra ya que la seleccin de los elementos muestrales dependen en gran
medida del criterio o juicio del investigador. La muestra, en este caso, se selec-
ciona mediante procedimientos no aleatorios. Los mtodos anteriores
(probabilsticos) no son mejores que los no probabilsticos sino que simplemen-
te nos permiten calcular el error muestral que se est cometiendo. Los tipos de
muestreo no probabilstico son: muestreo de conveniencia, muestreo discrecio-
nal y muestreo por cuotas, de los que pasaremos a explicar brevemente:

o Muestreo de conveniencia.
El investigador decide qu individuos de la poblacin pasan a formar par-
te de la muestra en funcin de la disponibilidad de los mismos (proximi-
dad con el investigador, amistad, etc.).

o Muestreo discrecional.
La seleccin de los individuos de la muestra es realizada por un experto que
indica al investigador qu individuos de la poblacin son los que ms pueden
contribuir al estudio. Este muestreo es adecuado si dentro de la poblacin
que queremos estudiar, existen individuos que no queremos que se nos esca-
pen por utilizar un mtodo totalmente aleatorio o de conveniencia.

o Muestreo por cuotas.


Si se conocen las caractersticas de la poblacin a estudiar, se elegirn los
individuos respetando siempre ciertas cuotas por edad, gnero, zona de
residencia, entre otras que habrn sido prefijadas.

9.5. Clculo del tamao muestral


Para determinar el tamao muestral necesario para que los resultados de un
estudio sean extrapolables a toda la poblacin se deben considerar diferentes
situaciones, en funcin del objetivo de nuestro estudio: determinacin de
parmetros y contraste de hiptesis.
En la determinacin de parmetros nuestro objetivo ser determinar me-
diante una muestra valores de nuestra poblacin de inters, por ejemplo, deter-
minar la proporcin de pacientes con insuficiencia renal aguda; mientras que en
el contraste de hiptesis nuestro objetivo estar encaminado a evaluar el resul-
tado obtenido en nuestra muestra con respecto a hiptesis previas establecidas,
por ejemplo, si la respuesta de un tratamiento nuevo es igual a la asociada a un
tratamiento ya conocido. Veamos dos de las situaciones ms comunes en el
clculo del tamao muestral.

126

9-CAP 9 126 1/12/06, 13:15


9.5.1. Determinacin de parmetros
Supongamos que se desea hacer inferencia sobre un valor de la poblacin
como puede ser una proporcin (por ejemplo: la prevalencia de diabetes en la
poblacin) o una media (ejemplo: la media de colesterol en la poblacin).
o Para estimar una proporcin
Para estimar una proporcin debemos tener una idea aproximada del
parmetro que queremos medir. Se puede obtener a partir de estudios
pilotos o una revisin de la literatura. Generalmente, ante la imposibili-
dad de disponer de informacin de referencia se utiliza el valor de 0,5
(50%), proporcin con la que se obtiene el tamao muestral mximo
necesario (llamado el criterio de la mxima indeterminacin). Cuando
queremos estimar una proporcin, debemos elegir la precisin (e) que se
quiere obtener para determinar el parmetro que queremos medir, de
manera que sta sea la oscilacin mnima del valor a estimar, o lo que es
lo mismo, decir su intervalo de confianza. El tamao muestral necesario
para la estimacin de una proporcin se obtendra como:
1- : nivel de confianza deseado.
Z : valor de la distribucin normal para el nivel de
confianza 1- .
p: proporcin esperada (q=1-p).
e: precisin deseada.
Cuanto mayor es la precisin deseada, mayor es el tamao muestral necesa-
rio para la estimacin del parmetro. En el caso que la poblacin que se desea
estudiar sea finita y con un tamao conocido (N) se utiliza la frmula:

Veamos un ejemplo. Pretendemos estudiar la prevalencia de Diabetes Mellitus


2 y no conocemos el valor aproximado de la proporcin de diabticos en la
poblacin. Considerando un nivel de confianza al 95% y una precisin deseada
del 6%, la muestra necesaria para nuestro objetivo sera de:

127

9-CAP 9 127 1/12/06, 13:15


Si la poblacin de la que pretendemos estudiar la prevalencia de DM en una
cierta ciudad, donde viven 20000 habitantes (poblacin finita), con el mismo
nivel de confianza y precisin deseados que en el ejemplo anterior, necesitara-
mos una muestra de:

Para poblaciones con un nmero de individuos elevado no es necesario dis-


poner del total de la poblacin, puesto que ambas frmulas proporcionan el
mismo tamao muestral.
o Para estimar una media
En el caso de la estimacin de una media, como puede ser el media del
colesterol, se debe tener una idea de la varianza (S2) de la distribucin de la
variable. Para la estimacin de una media se calcula el tamao muestral como:
1- : nivel de confianza deseado.
Z : valor de la distribucin normal para el nivel de
confianza 1- .
S: desviacin estndar estimada.
e: precisin deseada.
Como en el caso anterior, el clculo de la muestra en el caso de poblaciones
finitas debe calcularse a partir de una nueva frmula, aunque para poblaciones
elevadas proporcionan tambin el mismo tamao muestral.
N* Z 2 * S2
n=
e * (N-1)+ Z 2 * S2
2

9.5.2. Contraste de hiptesis


En el caso de analizar la muestra mediante un contraste de hiptesis, se
precisa conocer la magnitud de la diferencia a detectar, que tenga inters
clnicamente relevante (se pueden comparar dos proporciones o dos medias),
una idea aproximada de los parmetros de la variable que se quiere estudiar, el
nivel de significacin (riesgo de cometer un error tipo I), el poder estadstico (1-
el riesgo de cometer un error tipo II) y la direccin de la hiptesis alternativa
(unilateral o bilateral). Estos trminos se vern explicados en el captulo 10.
Pruebas de contraste de hiptesis. Estimacin puntual y por intervalos.
Veamos un ejemplo para la comparacin de dos proporciones. Se pretende
evaluar un nuevo tratamiento para el alivio del dolor. Sabemos por datos previos

128

9-CAP 9 128 1/12/06, 13:15


que la eficacia del tratamiento habitual est alrededor del 70% y se considerar
el nuevo frmaco clnicamente relevante si alivia el dolor en un 90%. Fijamos el
riesgo en 0,05 y deseamos un poder estadstico del 80%:

p1 : valor de la proporcin en el grupo de referencia


p2: valor de la proporcin en el grupo del nuevo tratamiento
p : media de las dos proporciones p1 y p2

9.6. Estimacin de una poblacin a partir de una muestra.


Intervalos de confianza
El hecho de trabajar con muestras introduce una fuente de variacin en los
resultados. Por ejemplo, seleccionamos una muestra representativa de 100 indi-
viduos, a partir de la cual se observa una media de edad y una desviacin estndar
(DE). Al repetir dicha experiencia en una nueva muestra de 100 individuos el
resultado probablemente no sera idntico al obtenido en la primera muestra,
aunque no debera ser muy diferente. Lo mismo pasara por cada muestra aleatoria
de 100 individuos obtenida de la poblacin. La media de la distribucin de me-
dias muestrales es la media poblacional ( ) y su desviacin estndar (conocida
como error estndar de la media EEM) tiene el valor S/ n (S desviacin estndar
de la muestra y n nmero de individuos de la muestra). No debe confundirse el
significado del EEM con el de DE. La DE corresponde a la desviacin estndar de
la distribucin de los valores individuales observados en los sujetos de la mues-
tra, mientras que EMM es una medida de dispersin de la distribucin de las
medias muestrales.
Como hemos visto con el Teorema Central del Lmite y mediante los valores
asociados a la distribucin normal estandarizada Z, aplicando las propiedades de
la distribucin Normal a la distribucin de medias muestrales, puede decirse
que el intervalo de 1,96 x EEM alrededor de la media poblacional incluye el 95%
de las medias obtenidas en muestras del mismo tamao. Dado que los valores
poblacionales y son desconocidos, puede decirse que la media poblacional
tiene aproximadamente un 95% de probabilidades de encontrarse entre los lmi-
tes de 1,96 x EMM alrededor de la media observada. Estos intervalos se les
denominan intervalos de confianza (IC) del 95%. La amplitud del intervalo ser
menor en cuanto mayor sea el tamao de la muestra.
El intervalo de confianza para una media se obtendra como X Zn x EEM y

129

9-CAP 9 129 1/12/06, 13:15


para una proporcin como siendo

Por ejemplo, supongamos que entre los 264 sujetos estudiados encontramos
un 11% de diabticos. Para estimar el verdadero porcentaje de pacientes diab-
ticos, asumiendo que la muestra es representativa de la poblacin, debemos
calcular el IC. El IC del 95% tiene por lmites 7,1% y 14,8%, encontrando el
verdadero porcentaje de diabticos en la poblacin de estudio entre el estos
valores, con el 95% de confianza.

9.7. Errores y sesgos ms frecuentes


Al seleccionar una muestra pueden cometerse dos tipos de errores: los errores
aleatorios y los errores sistemticos o sesgos. El error aleatorio corresponde
a la diferencia entre el resultado obtenido a partir de la muestra y la realidad de
la poblacin. Realmente, siempre existe una diferencia entre el resultado obteni-
do de una muestra y el resultado que deberamos haber obtenido de la pobla-
cin y es debida a no estudiar la poblacin completa. El error aleatorio se debe
en mayor parte al azar y no afecta a la validez interna del resultado, pero puede
disminuir la probabilidad de encontrar relacin entre las variables estudiadas.
Aunque el error aleatorio no puede eliminarse a no ser que, como acabamos de
citar, estudiemos toda la poblacin; aumentando el tamao de la muestra y la
precisin de las mediciones puede disminuirse dicho error.
Los errores sistemticos o sesgos son los errores que se cometen en el
procedimiento del estudio. Los sesgos no se modifican al aumentar el tamao
muestral. La definicin de los distintos tipos de sesgos se limita a los errores
relacionados con la validez interna de los estudios. La distincin entre los dife-
rentes tipos de sesgos es a menudo difcil de realizar, sin embargo se pueden
definir tres tipos segn el origen, tal como se presentan a continuacin: sesgos
de seleccin, sesgos de informacin y sesgos de confusin.

9.7.1. Sesgos de seleccin


Se refiere a la distorsin en la estimacin del efecto derivada de la forma en
que se han seleccionado los sujetos de la muestra. La muestra no refleja adecua-
damente a la poblacin, es decir, que la variable medida es diferente entre los
pacientes participantes en el estudio y los no participantes (edad, sexo,). Dentro
de los sesgos de seleccin existen algunas modalidades: sesgo de autoseleccin,
sesgo de Berkson (o de admisin),
La prevencin y el control de los sesgos deben realizarse mediante un diseo

130

9-CAP 9 130 1/12/06, 13:15


cuidadosamente planteado, se deben identificar todos los posibles orgenes de
sesgos e intentar controlarlos. El sesgo de seleccin no suele ser controlable en
la fase de anlisis.

9.7.2. Sesgos de seguimiento


Se cometen cuando no se observan por igual a ambos grupos de estudio, o si
se pierden ms sujetos de un grupo que de otro (no ocurrido al azar) a lo largo
del estudio.

9.7.3. Sesgos de informacin


Aparecen cuando existen diferencias sistemticas en la manera en que los
datos sobre la exposicin o el efecto son obtenidos en los diferentes grupos de
estudio. Un ejemplo claro, puede ser el sesgo de observacin en ensayos clni-
cos, que se evita mediante las tcnicas de enmascaramiento o de ciego. Otro
ejemplo de sesgo de informacin sera el que se comete al medir una variable
continua redondeando las cifras (presin arterial) o cuando los sujetos son cla-
sificados de forma equivocada respecto a la exposicin o el efecto (mentira
acerca el consumo de alcohol).
Los sesgos de informacin son difciles de predecir y de cuantificar. stos se
pueden reducir con unas definiciones claras y precisas de exposicin y efecto. En
el caso de producirse se debe intentar identificar la direccin y la magnitud de la
influencia que puedan producir.

9.7.4. Sesgos de confusin


Los distintos grupos de pacientes difieren sistemticamente entre ellos en el
momento de iniciar el estudio, en trminos de otras variables o factores distin-
tos a la propia intervencin del estudio (factor de confusin). Se presenta cuan-
do el efecto de la intervencin de estudio se confunde con el efecto de uno o
ms factores de confusin (edad, nivel de estudios, ). El objetivo de la asigna-
cin al azar de los tratamientos en los estudios experimentales es lograr la
formacin de grupos homogneos en lo que se refiere a todas las caractersticas
que puedan influir en desarrollar el evento.
Los sesgos de confusin pueden prevenirse mediante el muestreo estratificado,
usando el factor de confusin como variable de estratificacin. A diferencia de
los otros tipos de sesgos, stos pueden corregirse en la fase del anlisis, realizan-
do un anlisis separadamente para los diferentes subgrupos en funcin de los

131

9-CAP 9 131 1/12/06, 13:15


posibles factores de confusin o ajustando dichas diferencias en la comparacin
entre grupos.

9.8. Consideraciones importantes


La importancia de un buen diseo incluye tambin el tipo de muestreo, que
debe garantizar la seleccin de una muestra representativa de la poblacin de
estudio. El tamao muestral tiene una importancia determinante puesto que un
tamao de muestra insuficiente puede desvirtuar los resultados de un estudio y
un tamao de muestra excesivo requiere del uso de recursos innecesarios y la
posible exposicin de un grupo de pacientes a un determinado riesgo sin que
esto sea necesario.
Sin embargo, el caso del sesgo es ms complejo puesto que podemos solu-
cionarlo si nos damos cuenta a tiempo. Si ste tiene lugar durante el diseo y
funcionamiento del estudio y no puede ser eliminado, deberemos considerar
que nuestra investigacin no apunta hacia lo que queremos demostrar. Otras
veces no se han tenido en cuenta factores que podan influir en la respuesta y, sin
tiempo de reaccin, los valores obtenidos contienen un sesgo imposible de eli-
minar.
Es recomendable anticiparse a los posibles sesgos, es decir, evaluar conscien-
temente el estudio en la fase de diseo para tener en cuenta el mximo de
factores que permitan la correcta estimacin de los parmetros.

132

9-CAP 9 132 1/12/06, 13:15

También podría gustarte