Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El muestreo aleatorio simple es una técnica de muestreo en la que todos los elementos que forman
el universo - y que por lo tanto están incluídos en el marco muestral - tienen idéntica probabilidad
de ser seleccionados para la muestra. El proceso de muestreo que emplea esta técnica es
equivalente a hacer un sorteo entre los individuos del universo: asignamos a cada persona un
boleto, introducimos los boletos en una urna y empezamos a extraer boletos al azar. Todos los
individuos que tengan un boleto extraído de la urna formarían la muestra. Obviamente, en la
práctica, estos métodos pueden automatizarse mediante el uso de programas informáticos.
Dependiendo de si los individuos del universo pueden ser seleccionados más de una vez en la
muestra o no, hablaremos de muestreo aleatorio simple con reposición o sin reposición.
Si usamos reposición, el hecho de que seleccione un individuo al azar para la muestra no impide
que este mismo individuo pueda volver a ser seleccionado. Siguiendo con el símil de la urna y los
boletos, usar reposición equivale a reintroducir los boletos de los individuos seleccionados para la
muestra antes de extraer el siguiente boleto.
La pregunta obvia que puedes plantearte es, ¿qué es mejor, usar reposición o no usala?
Responderemos esta pregunta un poco más abajo, pero antes, revisemos qué precisión logra el
muestreo aleatorio simple con reposición para un tamaño de muestra dado y, alternativamente, qué
tamaño de muestra necesito para garantizar cierta precisión.
- e es el error máximo que vamos a tener (máxima diferencia entre la media de la muestra y la
media de la población).
- ZNC es el valor crítico de corte de una distribución de probabilidad normal para un nivel de
confianza NC.
- σ es la desviación típica (=raiz de la varianza) de la variable que nos interesa en la población.
- n es el tamaño de muestra.
Si invertimos esta expresión, podemos calcular qué tamaño de muestra n necesito para garantizar
que el error de estimación no supera el margen de error e con un nivel de confianza NC.
n ≥ZNC2
σ 2 e2
¿Y si no reponemos?
Sabemos calcular el error y el tamaño de muestra para el muestreo con reposición, pero, ¿cómo
cambian ambos resultados si no repetimos individuos en la muestra?
Si podemos considerar que el universo es infinito o, al menos, mucho más grande que el tamaño de
la muestra, no cambia absolutamente nada. Piénsalo bien: si el universo es muy grande, aunque
usemos reposición, la probabilidad de que escojamos dos veces al azar al mismo individuo es casi
nula. Por lo tanto, usar reposición o no usarla no da resultados diferentes.
Las diferencias entre ambos métodos se producen por lo tanto en situaciones en los que el
tamaño de la población es pequeño. En este caso, el muestreo sin reposición toma ventaja.
Intuitivamente es obvio: si el tamaño de la población es muy pequeño (digamos 30 individuos)
repetir individuos en una muestra es malgastar una oportunidad de cubrir más información. En
otras palabras, es ineficiente.
Veamos de manera más formal este resultado. Es posible demostrar que en un muestreo sin
reposición, cuando el universo no se puede considerar infinito (<100,000 individuos), el tamaño de
muestra necesario para un determinado margen de error es inferior al que necesitarías si el
universo es infinito. En concreto, el tamaño de muestra para un universo finito se relaciona con el
tamaño de muestra para universo infinito de la siguiente manera
n =
ninfN ninf + (N-1)
donde ninf es el tamaño de muestra necesario para un universo infinito y N es el tamaño del
universo finito.
Sabiendo que el tamaño de muestra cuando usamos reemplazo (nr) es siempre igual al tamaño
necesario para universo infinito (nr=ninf), podemos concluir que
n =
ninfN ninf + (N-1)
=
nrN nr + (N-1)
=
nr nr/N+ (N-1)/N
< nr
Por lo tanto, el tamaño de muestra necesario para acotar un mismo nivel de error es siempre más
pequeño no reponemos individuos en la muestra. Y, en definitiva, tanto si lo miramos desde el
punto de vista de qué técnica genera estimaciones más precisas como desde el punto de vista de
qué técnica permite tener la misma precisión con menor tamaño de muestra, se puede concluir
que el muestreo aleatorio simple sin reposición siempre es más eficiente.
✔ Beneficios del muestreo aleatorio simple
El desarrollo de la informática ha permitido que diseñar una muestra aleatoria simple sea
extremadamente rápido y fiable, siempre que tengamos el marco muestral necesario para ello,
claro. La generación de números aleatorios mediante software (estrictamente son números pseudo-
aleatorios) es cada vez más fiable.
De esta forma, al usar muestreo aleatorio simple nos aseguramos la obtención de muestras
representativas, de manera que la única fuente de error que va a afectar a mis resultados va a ser
el azar. Y lo que es más importante, este error debido al azar puede calcularse de forma precisa (o
al menos acotarse).