Está en la página 1de 7

L MUESTREO: QU ES Y POR

QU FUNCIONA
Escrito
por Carlos
Ochoa
Director de Marketing e Innovacin en Netquest. + info
19 de febrero 2015
Cada vez que miro las estadsticas de este modesto blog,
siempre observo la misma pauta: el trfico de visitas cumple
de forma precisa el principio de Pareto: el 20% de los posts
generan el 80% de las visitas. Y entre este 20% de posts ms
visitados destacan con mucha diferencia los posts dedicados
a cmo calcular el tamao de una muestra representativa
para hacer un estudio de opinin.
Viendo el gran inters que despierta esta cuestin, nos
proponemos inaugurar hoy una serie de posts dedicados al
muestreo: qu es, tcnicas de muestreo, cuando conviene
usar una tcnica u otra, etc. Esperamos que estos contenidos
sean de utilidad, ya sea a estudiantes de investigacin,
personas con curiosidad en estos temas o profesionales que
tengan estos conceptos un poco oxidados.

Qu es el muestreo?

El muestreo es el proceso de seleccionar un conjunto de


individuos de una poblacin con el fin de estudiarlos y poder
caracterizar el total de la poblacin.
La idea es bastante simple. Imagina que queremos saber algo
de un universo o poblacin, por ejemplo, qu porcentaje de
los habitantes de Mxico fuma habitualmente. Una forma de
obtener este dato sera contactar con todos los habitantes de
Mxico (122 millones de personas) y preguntarles si fuman.
La otra forma sera seleccionar un subconjunto de individuos
(por ejemplo, 1.000 personas), preguntarles si fuman y usar
esta informacin como una aproximacin de la informacin
que busco. Pues bien, este grupo de 1.000 personas que me
permiten conocer mejor cmo se comportan el total de
mexicanos es una muestra, y la forma en que los selecciono
es el muestreo.
En la definicin anterior hemos introducido dos trminos
fundamentales a lo largo de esta serie de posts:
Universo o poblacin: Es el total de individuos que
deseo estudiar o caracterizar. En el ejemplo anterior
es la poblacin de Mxico, pero podemos pensar en
todo tipo de universos, ms generales y ms
concretos. Por ejemplo, si quiero saber cuanto fuman
de media los fumadores de Mxico, el universo en este
caso seran los fumadores de Mxico.
Muestra: Es el conjunto de individuos del universo
que selecciono para estudiarlos, por ejemplo a travs
de una encuesta.
Por qu funciona el muestreo?
El muestreo es til gracias a que podemos acompaarlo de un
proceso inverso, que llamamos generalizacin. Es decir,
para conocer un universo lo que hacemos es (1) extraer una
muestra del mismo, (2) medir un dato u opinin y (3)
proyectar en el universo el resultado observado en la
muestra. Esta proyeccin o extrapolacin recibe el nombre de
generalizacin de resultados.
La generalizacin de resultados aade cierto error al mismo.
Imagina que tomamos una muestra al azar de 1.000 personas
de Mxico y les preguntamos si fuman. Obtengo que el 25%

de la muestra fuma. La simple lgica nos dice que si de 1.000


mexicanos elegidos al azar el 25% fuma, este dato debera
ser indicativo de lo que obtendramos si preguntsemos a los
122 millones de mexicanos. Ahora bien, el azar podra haber
hecho que haya escogido para mi muestra ms fumadores de
lo que correspondera a la proporcin exacta que hay en el
universo o, por el contrario, que en mi muestra los fumadores
estn algo infra-representados. El azar podra hacer que el
porcentaje de fumadores en la poblacin fuese algo diferente
del 25% que hemos observado en la muestra (tal vez un
25,2%, por ejemplo). Por lo tanto, la generalizacin de
resultados de un muestra a un universo conlleva aceptar que
cometemos cierto error, tal y como ilustra el siguiente
esquema.

Afortunadamente, el error que cometo al generalizar


resultados puede acotarse gracias a la estadstica. Para ello
usamos dos parmetros: el margen de error, que es la
mxima diferencia que esperamos que haya entre el dato

observado en mi muestra y el dato real en el universo, y


el nivel de confianza, que es el nivel de certeza que tengo
de que realmente el dato real est dentro del margen de
error.
Por ejemplo, en nuestro caso de fumadores mexicanos, si
selecciono una muestra de 471 individuos y les pregunto si
fuman, el resultado que obtenga tendr un margen de error
mximo de +-5% con un nivel de confianza del 97%. Esta
forma de expresar los resultados es la correcta cuando
usamos muestreo.

El tamao de la muestra
Qu tamao de muestra necesito usar para estudiar cierto
universo? Depende del tamao del universo y del nivel de
error que est dispuesto a aceptar, tal y como explicbamos
en su da en este post. Cuanta ms precisin exija, mayor
muestra necesito. Si quiero tener una certeza absoluta en mi
resultado, hasta el ltimo decimal, mi muestra tendr que ser
tan grande como mi universo.
Pero el tamao de la muestra tiene una propiedad
fundamental que explica porqu el muestreo se usa tanto en
tantos mbitos del conocimiento. Esta propiedad podra
resumirse como sigue: a medida que estudio universos
mayores, el tamao de muestra que necesito cada vez
representa un porcentaje menor de dicho universo.
Este fenmeno lo explican de forma muy didctica en
Gaussianos.com, un interesante blog dedicado a las
matemticas. Supongamos que queremos hacer una encuesta
para saber un porcentaje (podra ser el de gente que fuma)
con un nivel de error determinado, por ejemplo un margen de
error del 5% y una confianza del 95%. Si el universo a
estudiar fuese de tan slo 100 personas, mi muestra tendra
que ser de 79,5 individuos (es decir, 79,5% del universo, lo
que representa un parte muy importante del total del
universo). Si el universo fuese de 1.000 personas, mi muestra
debera ser de 277,7 personas (27,7% del universo). Y si mi
universo fuese de 100.000 personas, la muestra necesaria
sera de 382,7 personas (3,83% del universo).

Por lo tanto, a medida que trabajo con universos ms


grandes, la muestra que necesito debe ir creciendo pero de
forma no proporcional, tiende a estancarse y cada vez
representa un porcentaje ms pequeo del universo. De
hecho, a partir de cierto tamao de universo (en torno a
100.000 individuos), el tamao de la muestra ya no necesita
crecer ms. La siguiente tabla nos muestra algunos ejemplos:
Tamao de muestra necesaria para tener un error del
5% con un nivel de confianza del 95%

Universo

Muestra
necesaria

10

10

100%

100

80

80%

1.000

278

27,8%

10.000

370

3,7%

100.000

383

0,38%

1.000.000

384

0,038%

10.000.000

385

0,004%

100.000.000

385

0,0004%

Los datos anteriores nos dicen que por grande que sea el
universo, con 385 personas puedo estudiar cualquier dato con
el mismo nivel de error (margen de 5%, confianza de 95%).
Por esta razn el muestreo es tan poderoso: nos permite
hacer afirmaciones altamente precisas de una gran cantidad
de individuos a travs de un parte muy pequea de los
mismo.
Como contrapartida, el ejemplo anterior ilustra que el
muestreo no funciona bien en universos pequeos. Si tengo
una clase de 10 alumnos, la opinin de cada uno de ellos es
fundamental para conocer la opinin global, no puedo
prescindir de ninguno. Si no quiero superar el error que nos

hemos propuesto, en un universo de 10 individuos necesito


encuestar a todos ellos.

Ventajas e inconvenientes del muestreo


Resumimos a continuacin las principales ventajas e
inconvenientes de usar muestreo frente a estudiar todo un
universo.
Ventajas:
Necesitamos estudiar menos individuos, necesitamos
menos recursos (tiempo y dinero).
La manipulacin de datos es mucho ms simple. Si
con una muestra de 1.000 personas tengo suficiente,
para qu quiero analizar un fichero de millones de
registros?
Inconvenientes:
Introducimos error (controlado) en el resultado, debido
a la propia naturaleza del muestreo y a la necesidad
de generalizar resultados.
Tenemos el riesgo de introducir sesgos debido a una
mala seleccin de la muestra. Por ejemplo, si la forma
en que selecciono individuos para la muestra no es
aleatoria, mis resultados pueden verse seriamente
afectados.

La muestra aleatoria simple: definicin y alternativas


La teora del muestreo se basa en el concepto de muestra
aleatoria simple. Una muestra aleatoria simple es aquella
muestra en la que se seleccionan individuos del universo de
forma totalmente aleatoria. Esto implica que todos los
individuos deben tener idntica probabilidad (no nula) de ser
seleccionados en mi muestra.
Pero una cosa es la teora y otra la prctica. Slo en entornos
muy controlados es posible hacer muestras aleatorias. Por
otra parte, cuando tenemos universos compuestos por grupos
homogneos (entre si) de personas, podemos aprovechar esta

agrupacin para mejorar la calidad de mi muestra (o reducir


el tamao de la misma).
En los prximos posts abordaremos qu tipos de muestreo
existen, empezando por las dos grandes familias de tcnicas:
el muestreo probabilistico y el no probabilstico. Os
esperamos!