Está en la página 1de 10

SESIÓN N°7:

POBLACION, MUESTRA, MUESTREO

POBLACIÓN Y MUESTRA

Una población está determinada por sus características definitorias. Por lo tanto, el
conjunto de elementos que posea esta característica se denomina población o universo.
Población es la totalidad del fenómeno a estudiar, donde las unidades de población
poseen una característica común, la que se estudia y da origen a los datos de la
investigación.

Entonces, una población es el conjunto de todas las cosas que concuerdan con una
serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos
los elementos de una población.

Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre


una población determinada, nos referimos a este grupo de elementos como muestra.
Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la
población en su conjunto. La exactitud de la información recolectada depende en gran
manera de la forma en que fue seleccionada la muestra.

Cuando no es posible medir cada uno de los individuos de una población, se toma
una muestra representativa de la misma.

La muestra descansa en el principio de que las partes representan al todo y, por tal,
refleja las características que definen la población de la que fue extraída, lo cual nos
indica que es representativa. Por lo tanto, la validez de la generalización depende de la
validez y tamaño de la muestra.

Leyes del método de muestreo.

El método de muestreo se basa en ciertas leyes que le otorgan su fundamento


científico, las cuales son:

 Ley de los grandes números: si en una prueba, la probabilidad de un


acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la
relación entre las veces que se produce el suceso y la cantidad total de pruebas
(es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la
probabilidad P.

 Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación


entre el número de casos favorables (p) a este hecho con la cantidad de casos
posibles, suponiendo que todos los casos son igualmente posibles. El método
de establecer la probabilidad es lo que se denomina cálculo de probabilidad.
De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven
de base más directamente al método de muestreo:

 Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de


un conjunto N, es casi seguro que tenga las características del grupo más
grande.

 Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se


refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía
en una dirección, es probable que una parte igual del mismo grupo, varíe en
dirección opuesta.

 Ley de la permanencia de los números pequeños: si una muestra


suficientemente grande es representativa de la población, una segunda muestra
de igual magnitud deberá ser semejante a la primera; y, si en la primera muestra
se encuentran pocos individuos con características raras, es de esperar
encontrar igual proporción en la segunda muestra.

CONCEPTO DE MUESTREO

El muestreo es una herramienta de la investigación científica. Su función básica es


determinar que parte de una realidad en estudio (población o universo) debe examinarse
con la finalidad de hacer inferencias sobre dicha población. El error que se comete
debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la
observación de sólo una parte de ella, se denomina error de muestreo. Obtener una
muestra adecuada significa lograr una versión simplificada de la población, que
reproduzca de algún modo sus rasgos básicos.

Terminología

 Población objeto: conjunto de individuos de los que se quiere obtener una


información.
 Unidades de muestreo: número de elementos de la población, no solapados, que
se van a estudiar. Todo miembro de la población pertenecerá a una y sólo una
unidad de muestreo.
 Unidades de análisis: objeto o individuo del que hay que obtener la información.
 Marco muestral: lista de unidades o elementos de muestreo.
 Muestra: conjunto de unidades o elementos de análisis sacados del marco.

MUESTREO NO PROBABILÍSTICO

El muestreo no probabilístico es una técnica de muestreo donde las muestras se


recogen en un proceso que no brinda a todos los individuos de la población iguales
oportunidades de ser seleccionados.
Los métodos de muestreo no probabilísticos no garantizan la representatividad de la
muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.
(En algunas circunstancias los métodos estadísticos y epidemiológicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.)

Técnicas de muestreo No Probabilístico:

Muestreo por cuotas: se divide a la población en estratos o categorías, y se asigna una


cuota para las diferentes categorías y, a juicio del investigador, se selecciona las
unidades de muestreo. La muestra debe ser proporcional a la población, y en ella
deberán tenerse en cuenta las diferentes categorías. El muestreo por cuotas se presta
a distorsiones, al quedar a criterio del investigador la selección de las categorías.

Muestreo por conveniencia: Es probablemente la técnica de muestreo más común. En el


muestreo por conveniencia, las muestras son seleccionadas porque son accesibles para el
investigador. Los sujetos son elegidos simplemente porque son fáciles de reclutar. Esta
técnica es considerada la más fácil, la más barata y la que menos tiempo lleva.

Muestreo “Por bola de nieve”: Se lleva a cabo generalmente cuando hay una población
muy pequeña. En este tipo de muestreo, el investigador le pide al primer sujeto que
identifique a otro sujeto potencial que también cumpla con los criterios de la investigación.
La desventaja de usar una muestra de bola de nieve es que difícilmente sea representativa
de la población.

Muestreo Discrecional: Es más comúnmente conocido como muestreo intencional. En


este tipo de toma de muestras, los sujetos son elegidos para formar parte de la muestra
con un objetivo específico. Con el muestreo discrecional, el investigador cree que
algunos sujetos son más adecuados para la investigación que otros. Por esta razón,
aquellos son elegidos deliberadamente como sujetos.

Cuándo utilizar el muestreo no probabilístico

Este tipo de muestreo puede ser utilizado cuando se quiere mostrar que existe un rasgo
determinado en la población. También se puede utilizar cuando el investigador tiene
como objetivo hacer un estudio cualitativo, piloto o exploratorio.
Se puede utilizar cuando es imposible la aleatorización, como cuando la población es
casi ilimitada y cuando la investigación no tiene como objetivo generar resultados que
se utilicen para hacer generalizaciones respecto de toda la población.
También es útil cuando el investigador tiene un presupuesto, tiempo y mano de obra
limitados.

Esta técnica también se puede utilizar en un estudio inicial que será llevado a cabo
nuevamente utilizando un muestreo probabilístico aleatorio.
MUESTREO PROBABILÍSTICO

El método otorga una probabilidad conocida de integrar la muestra a cada elemento de


la población, y dicha probabilidad no es nula para ningún elemento.

Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

CARACTERISTICAS VENTAJAS INCONVENIENTES

Aleatorio simple Se selecciona una muestra de - Sencillo y de fácil comprensión. - Requiere que se posea de
tamaño n de una población de N antemano un listado completo
unidades, cada elemento tiene - Cálculo rápido de medias y de toda la población.
una probabilidad de inclusión varianzas.
igual y conocida de n/N. -Cuando se trabaja con
muestras pequeñas es posible
- Se basa en la teoría que no represente a la
estadística, y por tanto existen población adecuadamente.
paquetes informáticos para
analizar los datos

Sistemático Conseguir un listado de los N - Fácil de aplicar. - Si la constante de muestreo


elementos de la población está asociada con el fenómeno
- No siempre es necesario tener de interés, las estimaciones
Determinar tamaño muestral n. un listado de toda la población. obtenidas a partir de la muestra
pueden contener sesgo de
selección
Definir un intervalo k=N/n. - Cuando la población está
ordenada siguiendo una
Elegir un número aleatorio, r, tendencia conocida, asegura
entre 1 y k (r=arranque aleatorio). una cobertura de unidades de
todos los tipos.

Seleccionar los elementos de la


lista.

Estratificado En ciertas ocasiones resultará - Tiende a asegurar que la - Se ha de conocer la


conveniente estratificar la muestra represente distribución en la población de
muestra según ciertas variables adecuadamente a la población las variables utilizadas para la
de interés. Para ello debemos en función de unas variables estratificación.
conocer la composición seleccionadas.
estratificada de la población
objetivo a muestrear. Una vez - Se obtienen estimaciones más
calculado el tamaño muestral precisa
apropiado, este se reparte de
manera proporcional entre los
distintos estratos definidos en la -Su objetivo es conseguir una
población usando una simple muestra lo más semejante
regla de tres. posible a la población en lo que
a la o las variables
estratificadoras se refiere.

Conglomerados Se realizan varias fases de - Es muy eficiente cuando la - El error estándar es mayor
muestreo sucesivas (polietápico) población es muy grande y que en el muestreo aleatorio
dispersa. simple o estratificado.
La necesidad de listados de las
unidades de una etapa se limita - No es preciso tener un listado - El cálculo del error estándar
a aquellas unidades de muestreo de toda la población, sólo de las es complejo.
seleccionadas en la etapa unidades primarias de muestreo.
anterior.
EL TAMAÑO MUESTRAL

Cada estudio tiene un tamaño muestral idóneo, que permite comprobar lo que se
pretende con la seguridad y precisión fijadas por el investigador.

¿De qué depende el tamaño muestral?

 Variabilidad del parámetro a estimar: Datos previos, estudios piloto o usar


50% como peor estimación.
 Precisión: Amplitud del intervalo de confianza. Si se estima prevalencia su
formato será %.
 Nivel de confianza: Habitualmente 95% o 99%. Probabilidad complementaria al
error admitido.

Si aumentamos el tamaño muestral n, podremos mejorar la calidad de la estimación


bien aumentando la precisión (disminuye amplitud del intervalo) o bien aumentando la
seguridad (disminuye el error admitido).

CÁLCULO DEL TAMAÑO MUESTRAL

Todo estudio lleva implícito en la fase de diseño la determinación del tamaño muestral
necesario para la ejecución del mismo. El no realizar dicho proceso, puede llevarnos a
dos situaciones diferentes: primera que realicemos el estudio sin el número adecuado
de pacientes, con lo cual no podremos ser precisos al estimar los parámetros y además
no encontraremos diferencias significativas cuando en la realidad sí existen. La segunda
situación es que podríamos estudiar un número innecesario de pacientes, lo cual lleva
implícito no solo la pérdida de tiempo e incremento de recursos innecesarios sino que
además la calidad del estudio, dado dicho incremento, puede verse afectada en sentido
negativo.

Para determinar el tamaño muestral de un estudio, debemos considerar diferentes


situaciones:

A. Estudios para determinar parámetros. Es decir pretendemos hacer inferencias a


valores poblacionales (proporciones, medias) a partir de una muestra.

B. Estudios para contraste de hipótesis. Es decir pretendemos comparar si las


medias o las proporciones de las muestras son diferentes.
Tabla 1. Elementos de la Inferencia
Estadística

A. Estudios para determinar parámetros

Con estos estudios pretendemos hacer inferencias a valores poblacionales


(proporciones, medias) a partir de una muestra.
A.1. Estimar una proporción:
Si deseamos estimar una proporción, debemos saber:
a. El nivel de confianza o seguridad (1-a). El nivel de confianza prefijado da
lugar a un coeficiente (Za). Para una seguridad del 95% = 1.96, para una
seguridad del 99% = 2.58.
b. La precisión que deseamos para nuestro estudio.
c. Una idea del valor aproximado del parámetro que queremos medir (en este
caso una proporción). Esta idea se puede obtener revisando la literatura,
por estudio pilotos previos. En caso de no tener dicha información
utilizaremos el valor p = 0.5 (50%).

Ejemplo: ¿A cuántas personas tendríamos que estudiar para conocer la prevalencia?

Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser
próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor
p = 0,5 (50%) que maximiza el tamaño muestral (Criterio conservador):

donde:
 Za 2 = 1.962 (ya que la seguridad es del 95%)
 p = proporción esperada (en este caso 5% = 0.05)
 q = 1 – p (en este caso 1 – 0.05 = 0.95)
 d = precisión (en este caso deseamos un 3%)
Si la población es finita, es decir conocemos el total de la población y deseásemos
saber cuántos del total tendremos que estudiar la respuesta seria:

donde:
 N = Total de la población
 Za2 = 1.962 (si la seguridad es del 95%)
 p = proporción esperada (en este caso 5% = 0.05)
 q = 1 – p (en este caso 1-0.05 = 0.95)
 d = precisión (en este caso deseamos un 3%).

¿A cuántas personas tendría que estudiar de una población de 15 000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser
próxima al 5%; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p =
0.5 (50%) que maximiza el tamaño muestral.

Según diferentes seguridades el coeficiente de Za varía, así:

 Si la seguridad Za fuese del 90% el coeficiente sería 1.645


 Si la seguridad Za fuese del 95% el coeficiente sería 1.96
 Si la seguridad Za fuese del 97.5% el coeficiente sería 2.24
 Si la seguridad Za fuese del 99% el coeficiente sería 2.576

A.2. Estimar una media:


Si deseamos estimar una media: debemos saber:
 El nivel de confianza o seguridad (1-a). El nivel de confianza prefijado da
lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96; para una
seguridad del 99% = 2.58.

 La precisión con que se desea estimar el parámetro (2 * d es la amplitud del


intervalo de confianza).

 Una idea de la varianza S2 de la distribución de la variable cuantitativa que


se supone existe en la población.
Ejemplo 1. Para estudiar la imagen de los diferentes políticos, se pide a los encuestados
que los evalúen en una escala (continua) de 0 a 10 puntos. Si se acepta que la
desviación típica de esta variable es de 1.5 puntos, ¿cuántos casos se necesitan
considerando un intervalo de confianza al 95% de la media poblacional sea de 0.05
puntos?

𝑍. 𝜎 2 1,96 . 1,5 2
𝑛= ( ) = ( ) = 3457,44 ≈ 3457 𝑐𝑎𝑠𝑜𝑠.
𝑒 0,05

Si la población es finita, como previamente se señaló, es decir conocemos el total de


la población y desearíamos saber cuántos del total tendríamos que estudiar, la
respuesta sería:

B. Estudios para contraste de hipótesis:

Estos estudios pretenden comparar si las medias o las proporciones de las muestras
son diferentes. Habitualmente el investigador pretende comparar dos
tratamientos. Para el cálculo del tamaño muestral se precisa conocer:

a. Magnitud de la diferencia a detectar que tenga interés clínicamente relevante.


Se pueden comparar dos proporciones o dos medias.
b. Tener una idea aproximada de los parámetros de la variable que se
estudia (bibliografía, estudios previos).
c. Seguridad del estudio (riesgo de cometer un error a)
d. Poder estadístico (1 - b) (riesgo de cometer un error b)
e. Definir si la hipótesis va a ser unilateral o bilateral.
 Bilateral: Cualquiera de los dos parámetros a comparar (medias o
proporciones) puede ser mayor o menor que el otro. No se establece
dirección.
 Unilateral: Cuando se considera que uno de los parámetros debe ser
mayor que el otro, indicando por tanto una dirección de las
diferencias.

La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de


cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera).

B1. Comparación de dos proporciones:


Donde:

 n = sujetos necesarios en cada una de las muestras


 Za = Valor Z correspondiente al riesgo deseado
 Zb = Valor Z correspondiente al riesgo deseado
 p1 = Valor de la proporción en el grupo de referencia, placebo, control o
tratamiento habitual.
 p2 = Valor de la proporción en el grupo del nuevo tratamiento, intervención o
técnica.
 p = Media de las dos proporciones p1 y p2

B2. Comparación de dos medias:

Donde:

 n = sujetos necesarios en cada una de las muestras


 Za = Valor Z correspondiente al riesgo deseado
 Zb = Valor Z correspondiente al riesgo deseado
 S2 = Varianza de la variable cuantitativa que tiene el grupo control o de
referencia.
 d = Valor mínimo de la diferencia que se desea detectar (datos
cuantitativos)

Ejemplo de comparación de dos medias:

Deseamos utilizar un nuevo fármaco antidiabético y consideramos que sería


clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual
con el antidiabético estándar. Por estudios previos sabemos que la desviación típica de
la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos
un riesgo de 0.05 y deseamos un poder estadístico de 90% para detectar diferencias si
es que existen.

Precisamos 19 pacientes en cada grupo.

Ejemplo de comparación de dos proporciones:

Deseamos evaluar si el Tratamiento T 2 es mejor que el tratamiento T1 para el alivio del


dolor para lo que diseñamos un ensayo clínico. Sabemos por datos previos que la
eficacia del fármaco habitual está alrededor del 70% y consideramos clínicamente
relevante si el nuevo fármaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos
en 0.05 y deseamos un poder estadístico de un 80%.
n = 48 pacientes. En cada grupo precisamos 48 pacientes.

El tamaño muestral ajustado a las pérdidas:

En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones
diversas (pérdida de información, abandono, no respuesta….) por lo que se debe
incrementar el tamaño muestral respecto a dichas pérdidas.

El tamaño muestral ajustado a las pérdidas se puede calcular:

Muestra ajustada a las pérdidas = n (1 / 1–R)

 n = número de sujetos sin pérdidas


 R = proporción esperada de pérdidas

Así por ejemplo si en el estudio anterior esperamos tener un 15% de pérdidas el


tamaño muestral necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo.

También podría gustarte