Está en la página 1de 28

UNIVERSIDAD PEDAGOGICA DE

EL SALVADOR

ESTADISTICA II

JOSE ALBERTO REYES GUEVARA


RG 53679 18

San Salvador, 5 de marzo de 2023


TIPOS DE MUESTREO:

Al realizar la investigación, casi nunca es posible estudiar a toda la población que te


interesa. Esta es la razón por la que los investigadores utilizan diversos tipos de
muestreo cuando pretenden recopilar datos y responder las preguntas de investigación.

Una muestra es un subconjunto de la población que está siendo estudiada. Representa la


mayor población y se utiliza para sacar conclusiones de esa población. Es una técnica de
investigación ampliamente utilizada en las ciencias sociales como una manera de recopilar
información sin tener que medir a toda la población.

En este artículo te presentaremos cuáles son los diferentes tipos de muestreo que existen,

2
TIPOS DE MUESTREO
en qué consisten y cuándo es conveniente usar uno u otro.

3
TIPOS DE MUESTREO
Clasificación de los tipos de muestreo

En la investigación existen dos técnicas principales de muestreo: las que están basadas
en la probabilidad y las que no. Vamos a analizar los diferentes tipos de muestreo que
puedes crear utilizando ambas técnicas para una eficiente recolección de datos.

Tipos de muestreo no

4
TIPOS DE MUESTREO
probabilístico

El muestreo no probabilístico es una técnica de muestreo donde las muestras se


recogen por medio de un proceso que no les brinda a todos los individuos de la
población las mismas oportunidades de ser seleccionados.

Aunque seleccionar algunos de estos métodos podría resultar en datos sesgados o en


una capacidad limitada para hacer conclusiones generales basadas en los hallazgos,
también existen algunas situaciones en las que seleccionar este tipo de técnica de
muestreo es la mejor opción para cierta pregunta de investigación o para una etapa de
la investigación.

1. Muestreo por conveniencia

El muestreo por conveniencia es el que se basa en los sujetos disponibles, como


detener a las personas en la esquina de la calle mientras pasan por ahí, es un método
de muestreo, aunque es extremadamente riesgoso y debe realizarse con cautela.

Este método, también conocido como un método basado en los sujetos disponibles, no
le permite al investigador tener control sobre la representatividad de la muestra.

Sin embargo, es útil si el investigador quiere estudiar las características de las personas
que pasan por la esquina de una calle en un momento determinado, por ejemplo, o si el
tiempo y los recursos son limitados de tal forma que la investigación no sería posible de
otra manera.

Por esta razón, un muestreo de conveniencia está entre los tipos de muestreo que
comúnmente se utilizan en las fases iniciales o fase piloto de la investigación, antes de
que se lance un proyecto de investigación más grande.
5
TIPOS DE MUESTREO
Aunque este método puede resultar útil, el investigador no podrá utilizar los resultados
de una muestra de conveniencia para generalizar una población más amplia.

2.Muestreo deliberado, crítico o por juicio

El muestreo deliberado, crítico o por juicio es


aquel que se selecciona con base en el
conocimiento de una población o propósito del
estudio.

Por ejemplo, cuando sociólogos quieren


estudiar los efectos emocionales y psicológicos a largo plazo de la terminación de un
embarazo, se puede crear una muestra que incluya solamente a mujeres que se habían
sometido a un aborto.

En este caso, los investigadores pueden utilizar una muestra intencional porque los
entrevistados cumplen con una descripción o propósito específico que es necesario
para realizar la investigación.

6
TIPOS DE MUESTREO
3.Muestreo Bola de Nieve

Es adecuado utilizar un muestreo bola de nieve cuando los miembros de una población
son difíciles de localizar, como las personas sin hogar, trabajadores migrantes o
inmigrantes indocumentados.

Una muestra de bola de nieve es aquella en la que el investigador recopila datos sobre
los pocos miembros de la población objetivo que puede localizar, y luego les pide que le
proporcionen la información necesaria para localizar a otros miembros que conozcan de
esa población.

Por ejemplo, si un investigador quiere entrevistar a inmigrantes indocumentados de


México, podría entrevistar a algunos indocumentados que conozca o pueda localizar, y
luego dependerá de esos sujetos para que lo ayuden a localizar a más individuos
indocumentados.

Este proceso continúa hasta que el investigador tenga todas las entrevistas que
necesita o hasta que se hayan agotado todos los contactos.

Esta técnica es útil cuando se estudia un tema sensible en el que la gente podría no
hablar abiertamente, o si hablar sobre los temas investigados podría poner en peligro su
seguridad. Una recomendación de un amigo o conocido de que el investigador es
confiable funciona para aumentar el tamaño de la muestra.

7
TIPOS DE MUESTREO
4.Muestreo por Cuotas

El muestreo por cuotas es aquel en la que las unidades son seleccionadas en una
muestra partiendo de las características predeterminadas, de modo que la muestra total
tenga la misma distribución de características que se supone que existen en la
población que está siendo estudiada.

Por ejemplo, si un investigador está realizando una muestra por cuota nacional, podría
necesitar saber qué proporción de la población es masculina y qué proporción es
femenina. Así como también qué proporciones de los miembros de cada género
pertenecen a las diferentes categorías de edad, raza o étnicas, educativas, entre otras.
Después, el investigador recogería una muestra con las mismas proporciones que la
población nacional.

Tipos de muestreo

probabilístico
El muestreo probabilístico es una técnica en la cual las muestras son recogidas
mediante un proceso que le brinda a todos los individuos de la población la misma
oportunidad de ser seleccionados.

Muchos consideran que este es metodológicamente el enfoque más riguroso para el


muestreo, ya que elimina los sesgos sociales que podrían moldear la muestra de
investigación. Sin embargo, en última instancia la técnica de muestreo que se elija debe
ser la que permita responder mejor a la pregunta de investigación.

8
TIPOS DE MUESTREO
1.Muestreo aleatorio simple

El muestreo aleatorio simple es una técnica de muestreo en la que todos los elementos
que forman el universo - y que por lo tanto están incluídos en el marco muestral - tienen
idéntica probabilidad de ser seleccionados para la muestra. El proceso de muestreo que
emplea esta técnica es equivalente a hacer un sorteo entre los individuos del universo:
asignamos a cada persona un boleto, introducimos los boletos en una urna y
empezamos a extraer boletos al azar. Todos los individuos que tengan un boleto
extraído de la urna formarían la muestra. Obviamente, en la práctica, estos métodos
pueden automatizarse mediante el uso de programas informaticos.

Dependiendo de si los individuos del universo pueden ser seleccionados más de una
vez en la muestra o no, hablaremos de muestreo aleatorio simple con reposición o sin
reposición.
Si usamos reposición, el hecho de que seleccione un individuo al azar para la muestra
no impide que este mismo individuo pueda volver a ser seleccionado. Siguiendo con el
símil de la urna y los boletos, usar reposición equivale a reintroducir los boletos de los
individuos seleccionados para la muestra antes de extraer el siguiente boleto.

Si, por el contrario, no usamos reposición, un individuo seleccionado para la muestra ya


no entraría nuevamente en el sorteo. Un individuo solo puede aparecer una única vez
en una muestra.

La pregunta obvia que puedes plantearte es, ¿qué es mejor, usar reposición o no
usala? Responderemos esta pregunta un poco más abajo, pero antes, revisemos qué
precisión logra el muestreo aleatorio simple con reposición para un tamaño de muestra
dado y, alternativamente, qué tamaño de muestra necesito para garantizar cierta
precisión.

Error y tamaño de muestra en muestreo

aleatorio simple con reposición

Supón el siguiente caso. Tienes una población grande de N individuos (supongamos

9
TIPOS DE MUESTREO
que de más de 100,000 individuos). Pones un boleto para cada individuo en una urna.
Extraes un boleto, anotas la identidad del individuo y reintroduces el boleto en la urna.
Repites el proceso n veces, hasta obtener una muestra de tamaño n en la que un
individuo podría aparecer varias veces. Esto es poco probable si N es muy grande y n
es mucho menor que N, algo habitual ya que usamos muestras para no tener que
analizar todo el universo.

Una muestra seleccionada de esta forma tiene una propiedad muy útil: la media de
cualquier variable que midamos en la muestra se parecerá a la media calculada en el
total de la población. Y se parecerá de una forma muy concreta: la media en la muestra
seguirá una distribución normal centrada en la media poblacional y con varianza igual a
la varianza poblacional dividida por el tamaño de la muestra n. Esta relación entre
muestra y población se conoce como teorema central del límite.

Tienes una explicación detallada en este otro post, pero te lo resumimos aquí: gracias a
esta propiedad (es decir, a que sabemos cómo se relaciona la media de la muestra con
la de la población) podemos calcular la probabilidad de que la media de la muestra esté
dentro de un intervalo de valores. Y esto nos permite saber qué error máximo vamos a
tener cuando usamos la media de la muestra como estimación de la media de la
población. En concreto, se cumple que

Donde:

- e es el error máximo que vamos a tener (máxima diferencia entre la media de la


muestra y la media de la población).

- ZNC es el valor crítico de corte de una distribución de probabilidad normal para un nivel

10
TIPOS DE MUESTREO
de confianza NC.

- σ es la desviación típica (=raiz de la varianza) de la variable que nos interesa en la


población.

- n es el tamaño de muestra.

Si invertimos esta expresión, podemos calcular qué tamaño de muestra n necesito para
garantizar que el error de estimación no supera el margen de error e con un nivel de
confianza NC.

¿Y si no reponemos?

Sabemos calcular el error y el tamaño de muestra para el muestreo con reposición,


pero, ¿cómo cambian ambos resultados si no repetimos individuos en la muestra?

Si podemos considerar que el universo es infinito o, al menos, mucho más grande que
el tamaño de la muestra, no cambia absolutamente nada. Piénsalo bien: si el universo
es muy grande, aunque usemos reposición, la probabilidad de que escojamos dos
veces al azar al mismo individuo es casi nula. Por lo tanto, usar reposición o no usarla
no da resultados diferentes.

Las diferencias entre ambos métodos se producen por lo tanto en situaciones en los
que el tamaño de la población es pequeño. En este caso, el muestreo sin reposición
toma ventaja. Intuitivamente es obvio: si el tamaño de la población es muy pequeño
(digamos 30 individuos) repetir individuos en una muestra es malgastar una oportunidad
de cubrir más información. En otras palabras, es ineficiente.

Veamos de manera más formal este resultado. Es posible demostrar que en un


muestreo sin reposición, cuando el universo no se puede considerar infinito (<100,000
individuos), el tamaño de muestra necesario para un determinado margen de error es
inferior al que necesitarías si el universo es infinito. En concreto, el tamaño de muestra
para un universo finito se relaciona con el tamaño de muestra para universo infinito de
la siguiente manera

11
TIPOS DE MUESTREO
donde  ninf es el tamaño de muestra necesario para un universo infinito y N es el
tamaño del universo finito.

n)
Sabiendo que el tamaño de muestra cuando usamos reemplazo ( r es siempre igual

al tamaño necesario para universo infinito (nr=ninf), podemos concluir que:

Por lo tanto, el tamaño de muestra necesario para acotar un mismo nivel de error es
siempre más pequeño no reponemos individuos en la muestra. Y, en definitiva, tanto si
lo miramos desde el punto de vista de qué técnica genera estimaciones más precisas
como desde el punto de vista de qué técnica permite tener la misma precisión con
menor tamaño de muestra, se puede concluir que el muestreo aleatorio simple sin
reposición siempre es más eficiente.

✔ Beneficios del muestreo aleatorio simple

El desarrollo de la informática ha permitido que diseñar una muestra aleatoria simple


sea extremadamente rápido y fiable, siempre que tengamos el marco muestral
necesario para ello, claro. La generación de números aleatorios mediante software
(estrictamente son números pseudo-aleatorios) es cada vez más fiable.

De esta forma, al usar muestreo aleatorio simple nos aseguramos la obtención de


muestras representativas, de manera que la única fuente de error que va a afectar a mis

12
TIPOS DE MUESTREO
resultados va a ser el azar. Y lo que es más importante, este error debido al azar puede
calcularse de forma precisa (o al menos acotarse).

✘ Inconvenientes del muestreo aleatorio

simple

El único inconveniente es la dificultad de llevarlo a la práctica en investigaciones reales.


Recordemos: al ser una técnica probabilística, es necesario un marco muestral con
todos los individuos y que todos ellos sean seleccionables para la muestra. Un requisito
que difícilmente puede cumplirse en la mayoría de los estudios de mercado y opinión
reales, lo que nos obligará a emplear otras técnicas.

2.Muestreo sistemático

El muestreo sistemático era muy popular en el pasado, antes de que la aparición de los
ordenadores hiciese trivial un problema que siempre había dado muchos quebraderos
de cabeza a los investigadores: elegir individuos de forma aleatoria dentro de una
muestra. En la medida en que los ordenadores nos han facilitado la tarea de generar
13
TIPOS DE MUESTREO
números aleatorios, este problema ha desaparecido.

También se sigue utilizando para seleccionar individuos a lo largo del tiempo. Por
ejemplo, para estudiar la satisfacción de un servicio, podemos elegir sistemáticamente
encuestar a 1 de cada n clientes que nos visitan. En estas circunstancias, en las que
puede existir diferente varianza entre individuos en diferentes periodos de tiempo, el
muestreo sistemático puede ser incluso más preciso que el muestreo aleatorio puro.

¿En qué consiste el muestreo sistemático?

Es una técnica dentro de la categoría de muestreos probabilísticos - y que por lo tanto


requiere tener un control preciso del marco muestral de individuos seleccionables junto
con la probabilidad de que sean seleccionados - consistente en escoger un individuo
inicial de forma aleatoria entre la población y, a continuación, seleccionar para la
muestra a cada enésimo individuo disponible en el marco muestral.

El muestreo sistemático es un proceso muy simple y que sólo requiere la elección de un


individuo al azar. El resto del proceso es trivial y rápido. Los resultados que obtenemos
son representativos de la población, de forma similar al muestreo aleatorio simple,
siempre y cuando no haya algún factor intrínseco en la forma en que los individuos
están listados que haga que se reproduzcan ciertas características poblacionales cada
cierto número de individuos. Este suceso es realmente poco frecuente.

El proceso

De forma concreta, el proceso que seguiríamos en un muestreo sistemático sería el


siguiente:
1. Elaboramos una lista ordenada de los N individuos de la población, lo que sería el
marco muestral.
2. Dividimos el marco muestral en n fragmentos, donde n es el tamaño de muestra
que deseamos. El tamaño de estos fragmentos será: K=N/n, donde K recibe el nombre
de intervalo o coeficiente de elevación.
3. Número de inicio: obtenemos un número aleatorio entero A, menor o igual al
intervalo. Este número corresponderá al primer sujeto que seleccionaremos para la

14
TIPOS DE MUESTREO
muestra dentro del primer fragmento en que hemos dividido la población.
4. Selección de los n-1 individuos restantes: Seleccionamos los siguientes individuos
a partir del individuo seleccionado aleatoriamente, mediante una sucesión aritmética,
seleccionando a los individuos del resto de fragmentos en que hemos dividido la
muestra que ocupan la misma posición que el sujeto inicial. Esto equivale a decir que
seleccionaremos los individuos:
A, A + K, A + 2K, A + 3K, ...., A + (n-1)K

Ejemplo
Supongamos que tenemos un marco muestral de 5.000 individuos y deseamos obtener
una muestra de 100 de ellos. Dividimos en primer lugar el marco muestral en 100
fragmentos de 50 individuos. A continuación, seleccionamos un número aleatorio entre
1 y 50, para extraer el primer individuo al azar del primer fragmento: por ejemplo el 24.
A partir de este individuo, queda definida la muestra extrayendo los individuos de la lista
con intervalos de 50 unidades, tal y como sigue:
24, 74, 124, 174, ..., 4.974
 

✔ Ventajas 
 Obtiene buenas propiedades de representatividad, similares a la de un muestreo
aleatorio simple o incluso superiores, pero de forma más rápida y simple, al evitar
la necesidad de generar tantos números aleatorios como individuos en la
muestra.
 Respecto al muestreo aleatorio, el muestreo sistemático puede garantizarnos
una selección perfectamente equitativa de la población. Esto puede ser de
utilidad si se distinguen grupos dentro de universo, lo que nos podría evitar la
necesidad de usar estratos. Si existe diferente varianza entre los individuos de
los fragmentos, este muestreo puede ser mejor que el aleatorio. Lo veremos
luego.

✘ Desventajas
 Sólo existe la ya mencionada posibilidad de que el orden en que se han listado
15
TIPOS DE MUESTREO
los candidatos a la muestra tenga algún tipo de periodicidad oculta que coincida
con el intervalo escogido para generar la muestra sistemática. En este caso,
podríamos generar una muestra sesgada.
 

Eficiencia del muestreo sistemático


El muestreo sistemático se ideó para mejorar las propiedades del muestreo aleatorio
simple, pero el grado de mejora es variable dependiendo de las propiedades del
universo estudiado.
Para entender las propiedades de este muestreo, hay que tener en cuenta una cosa: si
fijamos el intervalo o coeficiente de elevación según el tamaño de la muestra que
necesitamos, sólo hay un elemento aleatorio dentro del proceso de muestreo: la unidad
inicial que seleccionamos del primer bloque de individuos. El resto queda fijado de
antemano. Esto equivale a decir que sólo tenemos k posibles muestras diferentes a
obtener y que el muestreo es simplemente escoger una de las k muestras disponibles.
Es posible demostrar que cuanto más supera la varianza dentro de las k posibles
muestras que podemos generar a la varianza poblacional, más precisión ganamos
usando el muestreo sistemático respecto al aleatorio simple. Lo anterior puede
interpretarse diciendo que el muestreo sistemático es más preciso que el aleatorio
simple cuando la variabilidad dentro de las posibles muestras es superior a
la variabilidad dentro de las unidades de la población. La precisión del muestreo
sistemático coincide con la del aleatorio simple cuando ambas variabilidades coinciden,
y esto se da cuando la disposición de los elementos en la población es totalmente
aleatoria.

3.Muestreo estratificado
Esta técnica, perteneciente a la familia de muestreos probabilísticos, antes de iniciar el
proceso de muestreo divide toda la población objeto de estudio en diferentes
subpoblaciones o estratos disjuntos, de manera que un individuo sólo puede pertenecer
a un estrato. Una vez definidos los estratos, la muestra se crea seleccionando por
separado individuos de cada estrato, empleando una técnica de muestreo cualquiera.
Si, por ejemplo, empleamos muestreo aleatorio simple en cada estrato, hablaremos
de muestreo aleatorio estratificado. Este es el caso más habitual, pero del mismo
modo podríamos usar otras técnicas de muestreo en cada estrato (muestreo

16
TIPOS DE MUESTREO
sistemático, aleatorio con reposición, etc.).

Los estratos suelen crearse a partir de grupos homogéneos de individuos, que a su vez
son heterogéneos entre diferentes grupos. Por ejemplo, si en un estudio esperamos
encontrar un comportamiento muy diferente entre hombres y mujeres, puede ser
conveniente definir dos estratos, uno por cada sexo. Si la selección de estos estratos es
correcta:

1. Los hombres deberían comportarse de forma parecida entre ellos.


2. Las mujeres deberían comportarse de forma muy similar entre ellas.
3. Hombres y mujeres deberían mostrar comportamientos dispares entre sí.

Si la anterior condición se cumple (estratos homogéneos internamente, heterogéneos


entre sí) el uso del muestreo aleatorio estratificado reduce el error muestral respecto
a un muestreo aleatorio convencional, mejorando la precisión de nuestros
resultados.

Es relativamente habitual definir estratos de acuerdo a algunas variables


sociodemográficas de la población como son edad, sexo, clase social o región
geográfica. Estas variables permiten dividir fácilmente la muestra en grupos
mutuamente excluyentes y, con bastante frecuencia, permiten discriminar
comportamientos diferentes dentro de la población.

Tipos de muestreo estratificado

17
TIPOS DE MUESTREO
Dependiendo del tamaño que asignamos a los estratos, hablaremos de diferentes tipos
de muestreo estratificado. También se acostumbra a hablar de diferentes formas de
"afijación" de la muestra en estratos.

1. Muestreo estratificado proporcionado

Cuando dividimos una población en estratos, es habitual que el tamaño de dichos


estratos sea diferente. Por ejemplo, si queremos estudiar el tanto por ciento de la
población que fuma en México y pensamos que la edad puede ser un buen criterio para
estratificar (es decir, pensamos que existen diferencias importantes en el hábito de
fumar dependiendo de la edad), podemos definir 3 estratos: menores de 20 años, de 20
a 44 años y mayores de 44 años. Es de esperar que al dividir toda la población
mexicana en estos 3 estratos no resulten grupos de igual tamaño. Efectivamente, si
miramos datos oficiales, obtenemos:

* Estrato 1 - Población Mexicana menor de 19 años: 42,4 millones (41,0%)

* Estrato 2 - Población Mexicana de 20 a 44 años: 37,6 millones (36,3%)

* Estrato 3 - Población Mexicana mayor de 44 años: 23,5 millones (22,7%)

Si usamos muestreo estratificado proporcionado, la muestra deberá tener estratos


que guarden las mismas proporciones observadas en la población. Si en este ejemplo
queremos crear una muestra de 1.000 individuos, los estratos deberán tener un tamaño
como sigue:

 
Muestra
Estrato Población Proporción proporcional

1 42,4M 41,0% 410

2 37,6M 36,3% 363

3 23,5M 22,7% 227

 
2. Muestreo estratificado uniforme 
18
TIPOS DE MUESTREO
Hablaremos de una afijación uniforme cuando asignamos el mismo tamaño
de muestra a todos los estratos definidos, sin importar el peso que tienen esos
estratos en la población. Siguiendo con el ejemplo anterior, un muestreo
estratificado uniforme definiría la siguiente muestra por estrato:

 
Muestra
Estrato Población Proporción uniforme

1 42,4M 41,0% 334

2 37,6M 36,3% 333

3 23,5M 22,7% 333

Como se puedes ver, el tamaño de la muestra es igual en todos los estratos (salvo
pequeñas diferencias debidas al redondeo necesario fruto de dividir 1,000 entre 3), en
lugar de seguir las proporciones de la población.

Esta técnica favorece los estratos que tienen menos peso en la población,
equiparándolos en importancia a los estratos más relevantes. Globalmente, reduce la
eficiencia de nuestra muestra (menor precisión en los resultados globales), pero, como
contrapartida, permite estudiar características particulares de todos los estratos con una
precisión mínima mayor. En nuestro ejemplo, si queremos emitir alguna afirmación
específica sobre la población del estrato 3 (mayores de 44 años), podremos hacerlo con
menos error muestral si empleamos una muestra de 333 unidades que si lo hacemos
con una muestra de 227 (como ocurriría en el muestreo estratificado proporcional).

3. Muestreo estratificado óptimo (respecto a la desviación estándar)

En este caso, el tamaño de los estratos en la muestra no guarda proporcionalidad con


la población. Por el contrario, se trata de optimizar el tamaño muestral de cada estrato
con el fin de reducir el margen de error global, teniendo en cuenta no solo el tamaño de
cada estrato en la población sino su desviación estándar.

Esta optimización lo que hace, básicamente, es dedicar más unidades de muestra de


las que corresponderían en un muestreo proporcional a aquellos estratos que tienen
19
TIPOS DE MUESTREO
más variabilidad y que por lo tanto son más difíciles de estimar.

La forma exacta en que se calcula el tamaño óptimo de muestra por estrato es un tema
un poco más técnico, pero tienes una explicación detallada en este post, por si eres de
los que les gusta la estadística.

Eficiencia de los diferentes muestreos estratificados

Las preguntas inevitables son: ¿cuándo conviene emplear la estratificación?, ¿qué tipo
de estratificación es más conveniente?

El muestreo estratificado proporcional produce siempre menor o igual error muestral


que el muestreo aleatorio simple, es decir, es más preciso. La igualdad se produce
cuando las medias o las proporciones que estamos analizando son iguales en todos los
estratos. Por lo tanto, la estratificación produce más beneficio cuanto más diferentes
sean los estratos entre sí.

El muestreo estratificado óptimo es siempre igual o más preciso que el muestreo


estratificado proporcional. Ambos métodos son igual de precisos cuando las
desviaciones típicas dentro de cada estrato son iguales, en cuyo caso ambos métodos
son totalmente equivalentes. Por lo tanto, la estratificación óptima produce más
beneficio cuanto más diferencias existan entre las desviaciones dentro de cada grupo,
situación en la que podremos reducir el tamaño muestral de los grupos más
homogéneos en beneficio de los más heterogéneos. Como contrapartida, es un método
más complejo y que requiere tener mucha información a priori de la muestra que
estudiamos, algo que normalmente no tenemos (rara vez conocemos las desviaciones
típicas de los universos que vamos a investigar).

Tamaños de muestra requeridos por cada técnica

Las técnicas de muestreo estratificado pueden emplearse para estimar de forma más
precisa parámetros de las poblaciones de interés, ya sean medias (p.e. media de
cigarrillos consumidos por los fumadores de México) o proporciones (p.e. proporción de
la población de México que fuma). Pero, inversamente, también pueden permitirnos
reducir el tamaño de muestra requerido para lograr una estimación con un nivel de error

20
TIPOS DE MUESTREO
determinado.

La siguiente tabla resume el tamaño de muestra requerido al emplear cada técnica, en


función del error máximo que estamos dispuestos a aceptar (e) y de las características
del propio universo. En estas fórmulas consideramos que el universo es de tamaño
infinito. Si fuese finito, debe aplicarse un factor de corrección.

Par
a interpretar el cuadro anterior es necesario tener en cuenta lo siguiente:

- Z es el valor crítico de corte de una distribución normal para lograr un nivel de
confianza deseado. Tienes más información sobre el significado de Z aquí. Los valores
más frecuentes son:

Nivel de confianza 90% -> Z=1,645

Nivel de confianza 95% -> Z=1,96

Nivel de confianza 99% -> Z=2,575

- L es el número de estratos en que particionamos la muestra y h es un índice que se


refiere a un estrato concreto. Por lo tanto, h puede variar entre 1 y L estratos.

- p es la proporción que buscamos en el total de la población (p.e. % de fumadores).


Por lo tanto, (1-p) es la proporción  complementaria, la que no cumple el criterio
buscado (% de no fumadores). Del mismo modo, ph es dicha proporción dentro de cada
uno de los estratos.

- σ2 es la varianza del dato buscado (en el caso de estimar medias) en el total de la
población. Asimismo, σh2 es la varianza dentro de cada estrato.

21
TIPOS DE MUESTREO
- e es el margen de error aceptado.

- Wh es el peso que el estrato tiene en la muestra


(tamaño del estrato respecto al total de la muestra).
Si hablamos de estratificación proporcional, cada
Wh es igual a la proporción que ese estrato
representa en la población. Si hablamos de
estratificación óptima, cada Wh se calcula en
función de la dispersión dentro de cada estrato.

Es posible demostrar a partir de las fórmulas anteriores que los diferentes métodos de
estratificación sólo reducen el tamaño de la muestra necesaria si los valores
de p y σ varían entre estratos. De lo contrario, todas las expresiones son equivalentes.
Veamos un ejemplo: si tomamos la expresión de tamaño de muestra requerido para
estimar una media mediante un muestreo estratificado óptimo, tenemos 

n = Z2 

(L∑h=1 wh σh )2 e2

Si consideramos que todas las varianzas de los estratos son iguales (σ h=σ) y que el
tamaño de los estratos es idéntico (Wh=1/L), el resultado que obtenemos es

n = Z2 
(L∑h=1 wh σh )2 e2
 = Z2 
(L∑h=1 (1/L)σ )2 e2
 = Z2 
((L/L)σ)2 e2
 = Z2 
σ2 e2
que coincide con el tamaño de muestra necesario para tener un error máximo e en un

22
TIPOS DE MUESTREO
muestreo aleatorio simple.

Conclusión
El muestreo estratificado es una técnica que nos permite reducir el error en nuestras
estimaciones siempre y cuando tengamos cierta información a priori sobre la existencia
de grupos homogéneos en la población.

4.Muestreo por conglomerados


El muestreo por conglomerados es una técnica que aprovecha la existencia de
grupos o conglomerados en la población que representan correctamente el total de la
población en relación a la característica que queremos medir. Dicho de otro modo,
estos grupos contienen toda la variabilidad de la población. Si esto sucede, podemos
seleccionar únicamente algunos de estos conglomerados para conocer la información
de interés del total de la población.

Podemos ver esta técnica desde otro punto de vista. Mientras que en todas las técnicas
vistas hasta ahora las unidades de muestreo coinciden con las unidades a estudiar
(individuos), en el muestreo por conglomerados las unidades de muestreo son grupos
de unidades a estudiar (grupos de individuos), algo que puede resultar muy beneficioso
en términos de coste. A cambio, es habitual obtener una menor precisión al usar esta
técnica, causada por falta de heterogeneidad dentro de los conglomerados.

El proceso de muestreo
El primer paso para aplicar esta técnica es definir los conglomerados. Se trata de
23
TIPOS DE MUESTREO
identificar una característica que permita dividir la población en grupos disjuntos (sin
solapamiento) y de forma exhaustiva (todos los individuos deben estar en un grupo), de
tal manera que los grupos no difieran entre sí en relación a aquello que queremos
medir. Una vez hemos definido estos conglomerados, seleccionaremos al azar algunos
de ellos para estudiarlos.

Un criterio habitual para definir conglomerados es el geográfico. Por ejemplo, si


queremos estudiar qué proporción de la población argentina fuma, podemos dividir el
total de la población en provincias y seleccionar algunas de ellas para ser estudiadas. Si
no tenemos razones de peso para pensar que el porcentaje de fumadores va a cambiar
de una provincia a otra, esta solución nos permitirá concentrar el esfuerzo de muestreo
en un único entorno geográfico. Si el estudio se va a hacer mediante entrevistas
personales, esto representa un importante ahorro de costes de desplazamientos.

Una vez definimos los conglomerados, el siguiente paso es seleccionar los


conglomerados a estudiar, ya sea mediante un muestreo aleatorio simple o sistemático.

Por último, una vez seleccionados los conglomerados a estudiar, podemos investigar a


todos los sujetos que forman parte de los mismos, o bien aplicar un nuevo proceso de
muestreo dentro del conglomerado, por ejemplo obteniendo una muestra mediante
muestreo aleatorio simple o sistemático. Si optamos por esta posibilidad, estaremos
hablando de un muestreo en dos etapas o bietápico: la primera etapa será la
selección del conglomerado; la segunda, la de individuos dentro del conglomerado. Si
por el contrario estudiamos todos los individuos del conglomerado, hablaremos
de muestreo por conglomerados unietápico.

Muestreo estratificado y muestreo por


conglomerados
La idea del muestreo por conglomerados recuerda a la del muestreo estratificado. En
ambos casos dividimos la población en grupos. Sin embargo, los principios detrás de
ambas técnicas son en cierto modo opuestos.

El muestreo estratificado es especialmente adecuado cuando los grupos (estratos) son


muy homogéneos internamente y muy diferentes entre sí. En ese caso, conviene
asegurar que tenemos representantes en nuestra muestra que provienen de todos los

24
estratos. Por el contrario, el muestreo por conglomerados es muy adecuado cuando los
grupos en que dividimos la población son muy similares entre sí, por lo que no hay gran
diferencia entre estudiar individuos de un grupo o de otro.

Es por ello que pese a que ambas técnicas dividen la población en estratos o
conglomerados, el proceso de selección de individuos es radicalmente diferente.

Ventajas y desventajas del muestreo por


conglomerados

✔ La principal ventaja 


Es de tipo operativa: seleccionar un conglomerado a estudiar suele ser más fácil y
económico que hacer una muestra aleatoria o sistemática. Hemos visto por ejemplo que
usar conglomerados geográficos puede representar un importante ahorro en
desplazamientos de personas.

Curiosamente, es habitual hacer estudios a través de Internet en los que se sigue


pensando en términos de estudiar sólo unas zonas geográficas, cuando en realidad a
través de Internet no obtenemos ningún beneficio operativo; al contrario, incurrimos en
mayor riesgo de tener menor precisión por diferencias entre las regiones estudiadas y el
resto de la población. Esta práctica es una herencia injustificada de técnicas que eran
buenas en entrevistas personales, pero que no lo son al usar otras metodologías.

✘ Principal inconveniente

Al usar muestreo por conglomerados corremos un riesgo importante: que los


conglomerados no sean realmente homogéneos entre ellos. En el ejemplo anterior
sobre fumadores en Argentina, podría suceder que en una de las provincias exista más
propensión a fumar, por ser una región más urbana, por razones culturales, etc.

Eficiencia del muestreo por conglomerados 


¿Cómo podemos comparar esta técnica con otras vistas con anterioridad? Lo bien o

25
TIPOS DE MUESTREO
mal que va a funcionar esta técnica va a depender, de forma similar a como ocurría en
el muestreo estratificado, de la relación entre la varianza dentro y fuera de los
conglomerados.

Esta relación se suele expresar con un coeficiente


de correlación intraconglomerados (δ), que se
define como el coeficiente de correlación lineal
entre todos los pares de valores de la variable
objeto de estudio, medidos sobre las unidades de
los conglomerados y extendido a todos los
conglomerados. En definitiva, este coeficiente
es una medida de la homogeneidad en el interior de los conglomerados.

Cuanto menor sea el coeficiente de homogeneidad intraconglomerados δ, mayor


eficiencia arrojará el muestreo por conglomerados. Recordemos que lo ideal es que los
conglomerados sean tan heterogéneos como el total de la muestra, con el fin de que la
selección de un conglomerado concreto nos de la misma información que la selección
de individuos al azar del total de la población.

Si comparamos el muestreo aleatorio simple con el muestreo por conglomerados, es


posible demostrar que si δ=0 ambos métodos son equivalentes. Esta condición implica
que los conglomerados son exactamente tan heterogéneos como el total de la
población. El peor caso sería δ=+1 , mientras que el más favorable sería el de δ=-1/(M-
1), donde M es el tamaño del conglomerado. Sin embargo, normalmente δ va a ser
siempre mayor que 0, ya que lo normal es que las unidades de un conglomerado
tengan cierto parecido entre sí.

Otra forma de ver el impacto de este problema es calcular el tamaño de muestra


necesario al emplear muestreo por conglomerados para lograr la misma precisión de un
muestreo aleatorio simple. Esta expresión es la siguiente:

nc = na (1 + (M-1) δ)

donde nc es el tamaño de muestra en muestreo por conglomerados y na  es el tamaño


de muestra que necesitaríamos en muestreo aleatorio simple. Por lo tanto, el factor  
(1+(M-1) δ)  es la variación del tamaño de muestra que necesitamos debido al uso de
conglomerados. Normalmente será un incremento. Este factor se conoce como efecto
26
TIPOS DE MUESTREO
de diseño.

27
TIPOS DE MUESTREO
BIBLIOGRAFIA

https://www.netquest.com/blog/es/blog/es/muestreo-probabilistico-
muestreo-conglomerados

https://www.questionpro.com/es/

28
TIPOS DE MUESTREO

También podría gustarte