Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestreo
Muestreo
• El muestreo es un método que permite a los investigadores inferir información sobre
una población basándose en los resultados de un subconjunto de la población, sin tener
que investigar a cada individuo:
• La población objetivo es todo el grupo sobre el que desea sacar conclusiones.
• La muestra o población de estudio es el grupo específico de personas del que se
recopilarán datos.
• Reducir el número de personas en un estudio reduce el costo y la carga de trabajo, pero
el tamaño muestral debe de ser lo suficientemente grande como para poder detectar
una asociación verdadera (poder estadístico).
• También es importante que los individuos seleccionados sean representativos de toda la
población.
Muestreo: tres cuestiones
or Sampling frame
Población objetivo
• Los criterios de inclusión y exclusión definen quién puede ser incluido o excluido de un estudio
y permiten a los investigadores estudiar las necesidades de un grupo relativamente
homogéneo con precisión (ej. personas con cierta enfermedad). En conjunto, se les conoce
como criterios de elegibilidad:
• Los criterios de inclusión identifican a la población de estudio de manera consistente,
confiable, uniforme y objetiva.
• Los criterios de exclusión incluyen factores o características que hacen que la población
reclutada no sea elegible para el estudio. Estos factores pueden ser factores de confusión
(la confusión ocurre cuando las variables de estudio se ven afectadas por factores que no
son directamente relevantes para la pregunta de investigación). Los criterios de exclusión
incluyen los criterios de inclusión.
or Sampling frame
Población objetivo
vs.
Ejemplo:
Ejemplo:
Ejemplo:
Muestra
• En la mayoría de casos es prácticamente imposible localizar y tener acceso a toda la
población objetivo. Por tanto, el enfoque práctico en la investigación clínica es incluir
una parte de esta población: población de muestra o población de estudio.
• El proceso de seleccionar una población muestra de la población objetivo se denomina
método de muestreo.
• Al realizar un estudio de investigación, debemos considerar que la muestra sea, en la
medida de lo posible, representativa de la población objetivo, con el menor error
posible y sin sustituciones ni carácter incompleto.
• Si la población es muy grande, demográficamente mixta y geográficamente dispersa,
puede resultar complicado garantizar que la muestra sea representativa.
Muestra
• La falta de una muestra representativa afecta a la validez de los resultados y puede dar
lugar a varios sesgos de selección, como (entre otros) sesgos de muestreo: algunos
miembros de una población tienen sistemáticamente más probabilidades de ser
seleccionados en una muestra que otros.
Sesgo de selección
https://www.youtube.com/watch?v=huVsdOZkeTc
Métodos de muestreo
Muestreo probabilístico
Muestreo probabilístico
• Comienza con un marco de muestreo completo de todos los individuos elegibles del
cual selecciona su muestra.
• Todas las personas elegibles tienen la posibilidad de ser elegidas para la muestra con lo
que se pueden generalizar mejor los resultados de su estudio.
• Los métodos de muestreo probabilístico tienden a consumir más tiempo y ser más
costosos que el muestreo no probabilístico.
• Se utiliza principalmente en investigaciones cuantitativas.
De una etapa
Estratificado Por conglomerados
Multietapa
Muestreo probabilístico: aleatorio simple
• Aleatorio simple: Para realizar este tipo de muestreo, se puede utilizar
herramientas como generadores de números aleatorios u otras técnicas que se
basan completamente en el azar.
Consecutive or sequencial
Muestreo no probabilístico: por conveniencia
• Un muestreo por conveniencia incluye a los individuos que resultan ser más accesibles para el
investigador (reclutando individuos principalmente porque están disponibles, dispuestos o son
de fácil acceso o contacto a nivel práctico).
• Probablemente es el más común de todas las técnicas de muestreo.
• Es es una forma fácil y económica de recopilar datos iniciales, pero no hay manera de saber si
la muestra es representativa de la población, por lo que no puede producir
resultados generalizables. Las muestras de conveniencia corren el riesgo de sufrir sesgos de
muestreo.
• Ejemplo: estás investigando opiniones sobre los servicios de apoyo estudiantil en tu
universidad, por lo que después de cada una de tus clases, les pides a tus compañeros que
completen una encuesta sobre el tema. Esta es una manera conveniente de recopilar datos,
pero como solo encuestó a estudiantes que tomaban las mismas clases que usted en el mismo
nivel, la muestra no es representativa de todos los estudiantes de su universidad.
Muestreo no probabilístico: por juicio
• En el muestreo intencional, crítico o por juicio: implica que el investigador utilice su
experiencia para seleccionar una muestra que sea más útil para los propósitos de la
investigación. Es decir, se seleccionan intencionalmente a los participantes en función de sus
características, conocimientos, experiencias o algún otro criterio.
• Una muestra intencional eficaz debe tener criterios y fundamentos claros para la inclusión:
asegúrese siempre de describir sus criterios de inclusión y exclusión y tenga cuidado con que
el sesgo del observador afecte sus argumentos.
• Ejemplo: desea saber más sobre las opiniones y experiencias de los estudiantes
discapacitados en su universidad, por lo que selecciona intencionalmente una cantidad de
estudiantes con diferentes necesidades de apoyo para recopilar una gama variada de datos
sobre sus experiencias con los servicios estudiantiles.
Muestreo no probabilístico: consecutivo
• El muestreo consecutivo o secuencial es una técnica de muestreo no probabilístico en
la que el investigador recolecta múltiples muestras durante un período de tiempo.
• A diferencia del muestreo probabilístico, las muestras no se seleccionan al azar y, por
tanto, pueden no ser representativas de la población. P.ej. Los pacientes que asisten a
un hospital privado pueden tener ingresos más altos que los pacientes que asisten a
un hospital público.
• Las principales ventajas son la flexibilidad (programación), mientras que la principal
desventaja es que las muestras no son verdaderamente aleatorias y es posible que los
resultados no se generalicen a la población general.
Consecutive or sequencial
Ejemplo:
Muestreo no probabilístico: de respuesta voluntaria
• El muestreo de respuesta voluntaria está basado principalmente en la facilidad de acceso
(similar a una muestra de conveniencia), pero, en lugar de que el investigador elija a los
participantes y los contacte directamente, las personas se ofrecen como voluntarias (por
ejemplo, respondiendo a una encuesta pública en línea).
• Las muestras de respuestas voluntarias siempre están sesgadas (mucho o poco) ya que
algunas personas tendrán inherentemente más probabilidades de ofrecerse como voluntarias
que otras, lo que genera un sesgo de autoselección.
• Ejemplo: envías una encuesta a todos los estudiantes de tu universidad y muchos estudiantes
deciden completarla. Sin duda, esto puede darle una idea del tema, pero es más probable
que las personas que respondieron sean aquellas que tienen opiniones firmes sobre los
servicios de apoyo estudiantil, por lo que no puedes estar seguro de que sus opiniones sean
representativas de todos los estudiantes.
Muestreo no probabilístico: “bola de nieve”
• El muestreo por bola de nieve se utiliza para reclutar participantes a través de otros
participantes, particularmente cuando resulta difícil acceder a la población.
• La cantidad de personas a las que tienes acceso aumenta a medida que te pones en
contacto con más personas. La desventaja aquí también es la representatividad, ya que
no hay forma de saber qué tan representativa es su muestra debido a que los
participantes dependen de que les recluten otros, lo cual implica un sesgo de
muestreo.
• Ejemplo: estás investigando experiencias de personas sin hogar en tu ciudad. Como no
existe una lista de todas las personas sin hogar en la ciudad, no es posible realizar un
muestreo probabilístico. Conoces a una persona que acepta participar en la
investigación y te pone en contacto con otras personas sin hogar que conoce en la
zona.
Non-probability random sampling: quota sampling
• El muestreo por cuotas se basa en la selección no aleatoria de un número o proporción
predeterminada de unidades (cuota).
• Primero se divide la población en subgrupos mutuamente excluyentes (llamados estratos)
y luego se reclutan unidades de muestra hasta alcanzar la cuota predeterminada. Estas
unidades comparten características específicas, determinadas por el investigador antes de
formar sus estratos. El objetivo del muestreo por cuotas es controlar qué o quién
constituye su muestra.
• Ejemplo: desea medir el interés de los consumidores en un nuevo servicio de entrega de
productos agrícolas en Boston, centrado en las preferencias dietéticas. Se divide la
población en consumidores de carne, vegetarianos y veganos, y se extrae una muestra de
1000 personas. Como la empresa quiere atender a todos los consumidores, establece una
cuota de 200 personas para cada grupo dietético. De esta manera, todas las preferencias
dietéticas estarán igualmente representadas en su investigación y podrá comparar
fácilmente estos grupos. Continúas reclutando hasta llegar a la cuota de 200 participantes
para cada subgrupo.
Tamaño muestral
Muestreo Recuerda la primera diapo!
H0 is true H0 is false
(thus HA is true)
Afirmo que NO
es culpable
cuando SÍ lo es
Fail to reject H0
VERDADERO FALSO
NEGATIVE NEGATIVO
or ⍺
Afirmo que SÍ es
culpable cuando
(power)
NO lo es
Reject H0
FALSO VERDADERO
POSITIVO POSITIVE
• Para los estadísticos, un falso positivo (error de tipo I) es más grave que un falso negativo (error de tipo II).
• En la práctica clínica, esto suele ser cierto: ver un efecto cuando no lo hay (por ejemplo, creer que un
fármaco ineficaz funciona) es peor que pasar por alto un efecto (por ejemplo, un fármaco eficaz no pasa
un ensayo clínico). Pero este no es siempre el caso: cualquiera de los tipos de error podría ser peor
dependiendo de la investigación.
Vamos a ver un ejemplo…
Recuerda la estadística…
H0 is true H0 is false
(thus HA is true)
or β
1-⍺ (nivel de confianza)
Fail to reject H0 FALSO
VERDADERO
NEGATIVO NEGATIVO
or ⍺
(nivel de significación) (potencia)
• Error tipo I o error alfa (falso positivo): el rechazo de la hipótesis nula cuando en realidad es cierta.
• El nivel de confianza se define como 1-⍺, y suele establecerse en 95% o 99% (por lo que ⍺ = 0,05 y
0,01 respectivamente).
Ojo que el nivel de confianza y el intérvalo
Recuerda la estadística… de confianza no son lo mismo! Estamos
simplificando conceptos para hacerlo más
sencillo.
Recuerda la estadística…
H0 is true H0 is false
(thus HA is true)
or β
1-⍺ (nivel de confianza)
Fail to reject H0 FALSO
VERDADERO
NEGATIVO NEGATIVO
or ⍺
(nivel de significación) (potencia)
• Error tipo II o error beta (falso negativo): no rechazo de la hipótesis nula cuando en realidad es falsa (ej. cuando no
vemos diferencias entre un placebo y un fármaco cuando en realidad sí hay diferencia entre los grupos).
• La potencia de un estudio se define como 1-β y es la probabilidad de rechazar correctamente la hipótesis nula cuando
esta es falsa. Es decir, es la probabilidad de hallar diferencias entre dos tratamientos que realmente son diferentes.
• La potencia se suele fijar en el 80-90% (β=0,2 y 0,1 respectivamente). Esto significa que, de cada 100 veces que
testeemos una droga que sí es efectiva, solo encontraremos diferencias estadísticamente significativas entre los grupos
en el 80-90% de las veces.
Recuerda la estadística…
https://www.statisticshowto.com/tables/z-table/