Está en la página 1de 21

MUESTREO PROBABILSTICO:

MUESTREO SISTEMTICO
Escrito
por Carlos
Ochoa
Director de Marketing e Innovacin en Netquest. + info
5 de mayo 2015
Siguiendo con nuestra serie de posts dedicados a las tcnicas de
muestreo y tras examinar el muestreo estratificado, hoy
echaremos un vistazo al muestreo sistemtico.
El muestreo sistemtico era muy popular en el pasado, antes de
que la incorporacin de la informtica hiciese trivial un problema

que siempre haba dado muchos quebraderos de cabeza a los


investigadores: elegir individuos de forma aleatoria dentro de
una muestra. En la medida en que los ordenadores nos han
facilitado la tarea de generar nmeros aleatorios, este problema
ha desaparecido.

Tambin se sigue utilizando para seleccionar individuos a lo


largo del tiempo. Por ejemplo, para estudiar la satisfaccin de un
servicio, podemos elegir sistemticamente encuestar a 1 de
cada n clientes que nos visitan. En estas circunstancias, en las
que puede existir diferente varianza entre individuos en
diferentes periodos de tiempo, el muestreo sistemtico puede
ser incluso ms preciso que el muestreo aleatorio puro.
En qu consiste el muestreo sistemtico?
Es una tcnica dentro de la categora de muestreos
probabilsticos y que por lo tanto requiere tener un control
preciso del marco muestral de individuos seleccionables junto
con la probabilidad de que sean seleccionados consistente en
escoger un individuo inicial de forma aleatoria entre la poblacin
y, a continuacin, seleccionar para la muestra a cada ensimo
individuo disponible en el marco muestral.
El muestreo sistemtico es un proceso muy simple y que slo
requiere la eleccin de un individuo al azar. El resto del proceso
es trivial y rpido. Los resultados que obtenemos son
representativos de la poblacin, de forma similar al muestreo
aleatorio simple, siempre y cuando no haya algn factor
intrnseco en la forma en que los individuos estn listados que
haga que se reproduzcan ciertas caractersticas poblacionales
cada cierto nmero de individuos. Este suceso es realmente
poco frecuente.
El proceso
De forma concreta, el proceso que seguiramos en un muestreo
sistemtico sera el siguiente:
1. Elaboramos una lista ordenada de los N individuos de la
poblacin, lo que sera el marco muestral.
2. Dividimos el marco muestral en n fragmentos, donde n es
el tamao de muestra que deseamos. El tamao de estos
fragmentos ser
K=N/n
donde K recibe
elevacin.

el

nombre

de

intervalo

coeficiente

de

3. Nmero de inicio: obtenemos un nmero aleatorio entero A,


menor o igual al intervalo. Este nmero corresponder al primer
sujeto que seleccionaremos para la muestra dentro del primer
fragmento en que hemos dividido la poblacin.
4. Seleccin de los n-1 individuos restantes: Seleccionamos
los siguientes individuos a partir del individuo seleccionado
aleatoriamente,
mediante
una
sucesin
aritmtica,
seleccionando a los individuos del resto de fragmentos en que
hemos dividido la muestra que ocupan la misma posicin que el
sujeto inicial. Esto equivale a decir que seleccionaremos los
individuos
A, A + K, A + 2K, A + 3K, ., A + (n-1)K
Ejemplo
Supongamos que tenemos un marco muestral de 5.000
individuos y deseamos obtener una muestra de 100 de ellos.
Dividimos en primer lugar el marco muestral en 100 fragmentos
de 50 individuos. A continuacin seleccionamos un nmero
aleatorio entre 1 y 50, para extraer el primer individuo al azar
del primer fragmento: por ejemplo el 24. A partir de este
individuo, queda definida la muestra extrayendo los individuos
de la lista con intervalos de 50 unidades, tal y como sigue
24, 74, 124, 174, , 4.974
Propiedades del muestreo sistemtico
Las principales ventajas son:
o Obtiene buenas propiedades de representatividad,
similares a la de un muestreo aleatorio simple o incluso
superiores, pero de forma ms rpida y simple, al evitar
la necesidad de generar tantos nmeros aleatorios como
individuos en la muestra.
o Respecto al muestreo aleatorio, el muestreo sistemtico
puede garantizarnos una seleccin perfectamente
equitativa de la poblacin. Esto puede ser de utilidad si
se distinguen grupos dentro de universo, lo que nos
podra evitar la necesidad de usar estratos. Si existe
diferente varianza entre los individuos de los fragmentos,

este muestreo puede ser mejor que el aleatorio. Lo


veremos luego.
Como desventajas, slo existe la ya mencionada posibilidad de
que el orden en que se han listado los candidatos a la muestra
tenga algn tipo de periodicidad oculta que coincida con el
intervalo escogido para generar la muestra sistemtica. En este
caso, podramos generar una muestra sesgada.
Eficiencia del muestreo sistemtico
El muestreo sistemtico se ide para mejorar las propiedades
del muestreo aleatorio simple, pero el grado de mejora es
variable dependiendo de las propiedades del universo estudiado.
Para entender las propiedades de este muestreo, hay que tener
en cuenta una cosa: si fijamos el intervalo o coeficiente de
elevacin segn el tamao de la muestra que necesitamos, slo
hay un elemento aleatorio dentro del proceso de muestreo: la
unidad inicial que seleccionamos del primer bloque de
individuos. El resto queda fijado de antemano. Esto equivale a
decir que slo tenemos k posibles muestras diferentes a obtener
y que el muestreo es simplemente escoger una de las k
muestras disponibles.
Es posible demostrar que cuanto ms supera la varianza dentro
de las k posibles muestras que podemos generar a la varianza
poblacional, ms precisin ganamos usando el muestreo
sistemtico respecto al aleatorio simple. Lo anterior puede
interpretarse diciendo que el muestreo sistemtico es
ms preciso que el aleatorio simple cuando la variabilidad
dentro de las posibles muestras es superior a la variabilidad
dentro de las unidades de la poblacin. La precisin del
muestreo sistemtico coincide con la del aleatorio simple
cuando ambas variabilidades coinciden, y esto se da cuando la
disposicin de los elementos en la poblacin es totalmente
aleatoria.

MUESTREO PROBABILSTICO:
MUESTREO ALEATORIO SIMPLE

Escrito
por Carlos
Ochoa
Director de Marketing e Innovacin en Netquest. + info
8 de abril 2015
Siguiendo con nuestra serie de posts dedicados al muestreo, hoy
revisaremos la primera de las tcnicas de muestreo
probabilstico: el muestreo aleatorio simple. Esta tcnica es una
de las ms populares y sirve de referencia a todas las dems
aunque, como ya comentamos, en la prctica difcilmente puede
utilizarse.
Definicin
El muestreo aleatorio simple (M.A.S.) es la tcnica de
muestreo en la que todos los elementos que forman el universo
y que, por lo tanto, estn descritos en el marco muestral, tienen
idntica probabilidad de ser seleccionados para la muestra.
Sera algo as como hacer un sorteo justo entre los individuos del
universo: asignamos a cada persona un boleto con un nmero
correlativo, introducimos los nmeros en una urna y empezamos
a extraer al azar boletos. Todos los individuos que tengan un
nmero extrado de la urna formaran la muestra. Obviamente,
en la prctica estos mtodos pueden automatizarse mediante el
uso de ordenadores.

Dependiendo de si los individuos del universo pueden ser


seleccionados ms de una vez en la muestra, hablaremos de
M.A.S. con reposicin o sin reposicin. Si usamos reposicin,
el hecho de que seleccione un individuo al azar para mi muestra
no impedira que este mismo individuo pudiese volver a ser
seleccionado en una siguiente seleccin. Sera equivalente a
decir que cada vez que extraigo un nmero al azar de mi urna,
vuelvo a colocar el nmero antes de la siguiente extraccin. Si
por el contrario no usamos reposicin, un individuo seleccionado
para la muestra una vez ya no entrara nuevamente en el
sorteo.
La pregunta obvia es, qu es mejor, usar reposicin o no usar
reposicin? Es un simple problema matemtico.Csar Prez
Lpez, en su libro Muestreo Estadstico (Pearson, 2005)
desarrolla de forma muy clara una comparacin entre ambas
tcnicas. Tanto si lo miramos desde el punto de vista de qu
tcnica genera estimaciones ms precisas como desde el punto

de vista de qu tcnica me permite tener la misma precisin con


menor tamao de muestra, se puede concluir que el muestreo
aleatorio simple sin reposicin siempre es ms eficiente.
Para poder observar este resultado, partimos de la siguiente
expresin para el tamao de muestra en un M.A.S. sin
reposicin. La frmula relaciona el tamao de muestra necesario
cuando el universo es finito con el tamao necesario cuando el
universo es infinito:

donde n0 es el tamao de muestra necesario para un universo


infinito y N es el tamao del universo finito. Es posible
demostrar que el tamao de muestra cuando usamos reemplazo
(nr) es siempre igual al tamao necesario para universo infinito
(nr=n0). Si eso sucede, podemos afirmar que

Por lo tanto, el tamao de muestra cuando no usamos reposicin


siempre es menor al necesario si usamos reposicin. Este
resultado coincide con la intuicin: si estamos empleando
reposicin y por azar incluimos un individuo ms de una vez en
la misma muestra, el efecto es similar a reducir el tamao de la

muestra ya que observo menor diversidad de individuos. Del


mismo modo, si el universo es infinito, ambos mtodos
coinciden, dado que la probabilidad de seleccionar al mismo
individuo dos veces en la misma muestra tiende a ser
infinitamente pequea.

Beneficios del muestreo aleatorio simple


El desarrollo de la informtica ha permitido que disear una
muestra aleatoria simple sea extremadamente rpido y fiable.
La generacin de nmeros aleatorios mediante software
estrictamente son nmeros pseudo-aleatorios es cada vez ms
fiable.
De esta forma, al usar M.A.S. nos aseguramos la obtencin
de muestras representativas, de manera que la nica fuente
de error que va a afectar a mis resultados va a ser el azar. Y lo
que es ms importante, este error debido al azar puede
calcularse de forma precisa (o al menos acotarse). Puedes
consultar el siguiente post para obtener ms informacin.

Inconvenientes del muestreo aleatorio simple


El nico inconveniente del M.A.S. es la dificultad de llevarlo a la
prctica en investigaciones reales. Recordemos: al ser una
tcnica probabilstica, necesito un marco muestral con todos los
individuos y que todos ellos sean seleccionables para mi
muestra. Un requisito que difcilmente puede cumplirse en la
mayora de estudios de mercado y opinin reales, lo que nos
obligar a emplear otras tcnicas.
En un prximo post veremos otra tcnica de muestreo
probabilstico muy popular: el muestreo estratificado. Os
esperamos!

MUESTREO PROBABILSTICO:
MUESTREO ESTRATIFICADO

Escrito
por Carlos
Ochoa
Director de Marketing e Innovacin en Netquest. + info
16 de abril 2015
Vimos en un post anterior la definicin, ventajas e
inconvenientes del muestreo aleatorio simple. Veamos ahora el
muestreo estratificado.

Esta tcnica, perteneciente a la familia de muestreos


probabilsticos, consiste en dividir toda la poblacin objeto de
estudio en diferentes subgrupos o estratos disjuntos, de manera

que un individuo slo puede pertenecer a un estrato. Una vez


definidos los estratos, para crear la muestra se seleccionan
individuos empleando una tcnica de muestreo cualquiera a
cada uno de los estratos por separado. Si por ejemplo
empleamos muestreo aleatorio simple en cada estrato,
hablaremos de muestreo aleatorio estratificado (M.A.E. en
adelante). Del mismo modo, podramos usar otras tcnicas de
muestreo en cada estrato (muestreo sistemtico, aleatorio con
reposicin, etc.).
Los estratos suelen ser grupos homogneos de individuos, que a
su vez son heterogneos entre diferentes grupos. Por ejemplo, si
en un estudio esperamos encontrar un comportamiento muy
diferente entre hombres y mujeres, puede ser conveniente
definir dos estratos, uno por cada sexo. Si la seleccin de estos
estratos es correcta (1) los hombres deberan comportarse de
forma parecida entre ellos, (2) las mujeres deberan comportarse
de forma muy similar entre ellas y (3) hombres y mujeres
deberan mostrar comportamientos dispares entre s.
Si la anterior condicin se cumple (estratos homogneos
internamente, heterogneos entre s) el uso del muestreo
aleatorio estratificado reduce el error muestral, mejorando la
precisin de nuestros resultados al realizar un estudio sobre la
muestra.
Es relativamente habitual definir estratos de acuerdo a algunas
variables caractersticas de la poblacin como son la edad, sexo,
clase social o regin geogrfica. Estas variables permiten dividir
fcilmente la muestra en grupos mutuamente excluyentes y con
bastante frecuencia, permiten discriminar comportamientos
diferentes dentro de la poblacin.

Tipos de muestreo estratificado


Dependiendo del tamao que asignamos a los estratos,
hablaremos de diferentes tipos de muestreo estratificado.
Tambin se acostumbra a hablar de diferentes formas de
afijacin de la muestra en estratos.
(1) Muestreo estratificado proporcionado

Cuando seleccionamos una caracterstica de los individuos para


definir los estratos, suele ocurrir que el tamao de las
subpoblaciones resultantes en el universo son diferentes. Por
ejemplo, queremos estudiar el % de la poblacin que fuma en
Mxico y pensamos que la edad puede ser un buen criterio para
estratificar (es decir, pensamos que existen diferencias
importantes en el hbito de fumar dependiendo de la edad).
Definimos 3 estratos: menores de 20 aos, de 20 a 44 aos y
mayores de 44 aos. Es de esperar que al dividir toda la
poblacin mexicana en estos 3 estratos no resulten grupos de
igual tamao. Efectivamente, si miramos datos oficiales,
obtenemos:
* Estrato 1 Poblacin Mexicana menor de 19 aos: 42,4
millones (41,0%)
* Estrato 2 Poblacin Mexicana de 20 a 44 aos: 37,6 millones
(36,3%)
* Estrato 3 Poblacin Mexicana mayor de 44 aos: 23,5
millones (22,7%)
Si usamos muestreo estratificado proporcionado, la
muestra deber tener estratos que guarden las mismas
proporciones observadas en la poblacin. Si en este ejemplo
queremos crear una muestra de 1.000 individuos, los estratos
tendrn que tener un tamao como sigue:
Estrato
1
2
3

Poblacin
42,4M
37,6M
23,5M

Proporcin
41,0%
36,3%
22,7%

Muestra
410
363
227

(2) Muestreo estratificado uniforme


Hablaremos de una afijacin uniforme cuando asignamos el
mismo tamao de muestra a todos los estratos definidos, sin
importar el peso que tienen esos estratos en la poblacin.
Siguiendo con el ejemplo anterior, un muestreo estratificado
uniforme definira la siguiente muestra por estrato:
Estrato
1

Poblacin
42,4M

Proporcin
41,0%

Muestra
334

2
3

37,6M
23,5M

36,3%
22,7%

333
333

Esta tcnica favorece los estratos que tienen menos peso en la


poblacin, equiparndolos en importancia a los estratos ms
relevantes. Globalmente, reduce la eficiencia de nuestra
muestra (menor precisin en los resultados), pero como
contrapartida permite estudiar caractersticas particulares de
cada estrato con mayor precisin. En nuestro ejemplo, si
queremos emitir alguna afirmacin especfica sobre la poblacin
del estrato 3 (mayores de 44 aos), podremos hacerlo con
menor nivel de error muestral si empleamos una muestra de
333 unidades que si lo hacemos con una muestra de 227 (como
ocurra en el muestreo estratificado proporcional).
(3) Muestreo estratificado ptimo
desviacin estndar)

(respecto

la

En este caso, el tamao de los estratos en la muestra no


guardar proporcionalidad con la poblacin. Por el contrario, se
define el tamao de los estratos proporcionalmente a la
desviacin estndar de las variables objeto de estudio. Es decir,
se toman estratos de mayor tamao en los estratos con mayor
variabilidad interna para representar mejor en el total de la
muestra los grupos poblacionales ms difciles de estudiar.

Eficiencia de los diferentes muestreos estratificados


Las preguntas inevitables son: cuando conviene emplear la
estratificacin?, qu tipo de estratificacin es ms
conveniente?
El muestreo estratificado proporcional produce
siempre menor o igual error muestral que el
muestreo aleatorio simple, es decir, es ms preciso.
La igualdad se produce cuando las medias o las
proporciones que estamos analizando son iguales en
todos los estratos. Por lo tanto, la estratificacin produce
ms beneficio cuanto ms diferentes sean los estratos
entre s.

El muestreo estratificado ptimo es siempre igual


o ms preciso que el muestreo estratificado
proporcional. Ambos mtodos son igual de precisos
cuando las desviaciones tpicas dentro de cada estrato
son iguales, en cuyo caso ambos mtodos son
totalmente equivalentes. Por lo tanto, la estratificacin
ptima produce ms beneficio cuanto ms diferencias
existan entre las desviaciones dentro de cada grupo,
situacin en la que podremos reducir el tamao muestral
de los grupos ms homogneos en beneficio de los ms
heterogneos. Como contrapartida, es un mtodo ms
complejo y que requiere tener mucha informacin a
priori de la muestra que estudiamos, algo que
normalmente no tenemos.

Tamaos de muestra requeridos por cada tcnica


Vemos que la estratificacin puede proporcionar beneficios. Si
estas tcnicas pueden emplearse para estimar de forma ms
precisa ya sean medias (p.e. media de cigarrillos consumidos
por los fumadores de Mxico) o proporciones (p.e. proporcin de
la poblacin de Mxico que fuma), tambin pueden permitirnos
reducir el tamao de muestra requerido para lograr una
estimacin con un nivel de error determinado.
La siguiente tabla resume el tamao de muestra requerido al
emplear cada tcnica, en funcin del error mximo que estamos
dispuestos a aceptar y de las caractersticas del propio universo,
que consideraremos de tamao infinito (si fuese finito, debe
aplicarse un factor de correccin).

Para interpretar el cuadro anterior es necesario tener en cuenta


lo siguiente:
Z = Es la desviacin del valor medio que aceptamos para
lograr el nivel de confianza deseado. En funcin del nivel
de confianza que busquemos, usaremos un valor
determinado que viene dado por la forma que tiene la
distribucin de Gauss. Los valores ms frecuentes son:
Nivel de confianza 90% -> Z=1,645
Nivel de confianza 95% -> Z=1,96
Nivel de confianza 99% -> Z=2,575
L es el nmero de estratos en que particionamos la
muestra y h es un ndice que se refiere a un estrato
concreto. Por lo tanto, h puede variar entre 1 y L
estratos.
p es la proporcin que buscamos en el total de la
poblacin (p.e. % de fumadores). Por lo tanto, (1-p) es la
proporcin de la muestra complementaria, la que no
cumple el criterio buscado (no fumadores). Del mismo
modo, ph es dicha proporcin dentro de cada uno de los
estratos.

2 es la varianza que el dato buscado (en el caso de


estimar medias) tiene en el total de la poblacin.
Asimismo, h2 es la varianza dentro de cada estrato.
e es el margen de error aceptado.
Wh es el peso que el estrato tiene en la muestra
(tamao del estrato respecto al total de la muestra). Si
hablamos de estratificacin proporcional, cada Wh es
igual a la proporcin que ese estrato representa en la
poblacin. Si hablamos de estratificacin ptima, cada
Wh se calcula en funcin de la dispersin dentro de cada
estrato.
Es posible demostrar a partir de las frmulas anteriores que los
diferentes mtodos de estratificacin slo reducen el tamao de
la muestra si los valores de p y vara entre estratos. De lo
contrario, todas las expresiones son equivalentes. Veamos un
ejemplo: si tomamos la expresin de tamao de muestra
requerido para estimar una media mediante un muestreo
estratificado ptimo (ignorando el parmetro Z en este caso)

y consideramos que todas las varianzas de los estratos son


iguales (h=) y que el tamao de los estratos es idntico
(Wh=1/L), el resultado que obtenemos es

Esperamos que este post ayude a aclarar la utilidad del


muestreo estratificado. En prximos posts abordaremos el
muestreo sistemtico.

MUESTREO PROBABILSTICO:
MUESTREO POR
CONGLOMERADOS
Escrito
por Carlos
Ochoa
Director de Marketing e Innovacin en Netquest. + info
18 de mayo 2015
Con este post dedicado al muestreo por conglomerados
cerramos el primer gran bloque de posts dedicados almuestreo
probabilstico. A partir de la prxima publicacin abordaremos
tcnicas de muestreo no probabilstico, las ms habituales
cuando hablamos de investigacin online.

El muestreo por conglomerados es una tcnica que aprovecha la


existencia de grupos o conglomerados en la poblacin que
representan correctamente el total de la poblacin en relacin a
la caracterstica que queremos medir. Dicho de otro modo, estos
grupos contienen toda la variabilidad de la poblacin. Si esto
sucede, podemos seleccionar nicamente algunos de estos
conglomerados para realizar el estudio.
Podemos ver esta tcnica desde otro punto de vista. Mientras
que en todas las tcnicas vistas hasta ahora las unidades de
muestreo coinciden con las unidades a estudiar (individuos), en
el muestreo por conglomerados las unidades de muestreo son
grupos de unidades de estudio, algo que puede resultar muy
beneficioso en relacin al coste del propio muestreo. A cambio,
es habitual obtener una menor precisin al usar esta tcnica,
causada por falta de heterogeneidad dentro de los
conglomerados.
El proceso de muestreo

El primer paso para aplicar esta tcnica es definir los


conglomerados. Se trata de identificar una caracterstica que
permita dividir la poblacin en grupos disjuntos (sin
solapamiento) y exhaustiva (todos los individuos deben estar en
un grupo), de tal manera que los grupos no difieran entre s en
relacin a aquello que queremos medir. Una vez hemos definido
estos conglomerados, seleccionaremos al azar algunos de ellos
para estudiarlos.
Un criterio habitual para definir conglomerados es el geogrfico.
Por ejemplo, si queremos estudiar que proporcin de la
poblacin argentina fuma, podemos dividir el total de la
poblacin en provincias y seleccionar algunas de ellas para ser
estudiadas. Si no tenemos razones para pensar que el % de
fumadores va a cambiar de una provincia a otra, esta solucin
nos permitir concentrar el esfuerzo de muestreo en un nico
entorno geogrfico. Si el estudio se va a hacer mediante
entrevistas personales, esto representa un importante ahorro de
costes de desplazamientos.
Una vez definimos los conglomerados, el siguiente paso es
seleccionar los conglomerados a estudiar, ya sea mediante un
muestreo aleatorio simple o sistemtico.
Por ltimo, una vez hemos seleccionado los conglomerados a
estudiar, podemos investigar a todos los sujetos que forman
parte de los mismos, o bien aplicar un nuevo proceso de
muestreo dentro del conglomerado, por ejemplo obteniendo una
muestra mediante muestreo aleatorio simple o sistemtico. Si
optamos por esta posibilidad, estaremos hablando de un
muestreo en dos etapas o bietpico: la primera etapa es la
seleccin del conglomerado, la segunda la de individuos dentro
del conglomerado. Si por el contrario estudiamos todos los
individuos del conglomerado, hablaremos de muestreo por
conglomerados unietpico.
Muestreo estratificado y muestreo por conglomerados
La idea del muestreo por conglomerados recuerda a la
del muestreo estratificado. En ambos casos dividimos la
poblacin en grupos. Sin embargo, los principios detrs de
ambas tcnicas son en cierto modo opuestos.

El muestreo estratificado es especialmente adecuado cuando los


grupos (estratos) son muy homogneos internamente y muy
diferentes entre s. En ese caso, conviene asegurar que tenemos
representantes en nuestra muestra que provienen de todos los
estratos. Por el contrario, el muestreo por conglomerados es
muy adecuado cuando los grupos en que dividimos la poblacin
son muy similares entre s, por lo que no hay gran diferencia
entre estudiar individuos de un grupo o de otro.
Es por ello que pese a que ambas tcnicas dividen la poblacin
(en estratos o conglomerados) el proceso de seleccin de
individuos es radicalmente diferente.
Ventajas y desventajas del muestreo por conglomerados
La principal ventaja de esta tcnica es de tipo operativa:
seleccionar un conglomerado a estudiar suele ser ms
fcil y econmico que hacer una muestra aleatoria o
sistemtica. Hemos visto por ejemplo que usar
conglomerados geogrficos puede representar un
importante ahorro en desplazamientos de personas.
Curiosamente, es habitual hacer estudios a travs de
Internet en los que se sigue pensando en trminos de
estudiar slo unas zonas geogrficas, cuando en realidad
a travs de Internet no obtenemos ningn beneficio
operativo; al contrario, incurrimos en mayor riesgo de
tener menor precisin por diferencias entre las regiones
estudiadas y el resto de la poblacin. Esta prctica es
una herencia injustificada de tcnicas que eran buenas
en entrevistas personales, pero que no lo son al usar
otras metodologas.
Como principal inconveniente, al usar muestreo por
conglomerados corremos un riesgo importante: que los
conglomerados no sean realmente homogneos entre
ellos. En el ejemplo anterior sobre fumadores en
Argentina, podra suceder que en una de las provincias
exista ms propensin a fumar, por ser una regin ms
urbana, por razones culturales, etc.
Eficiencia del muestreo por conglomerados

Cmo podemos comparar esta tcnica con otras vistas con


anterioridad? Lo bien o mal que va a funcionar esta tcnica va a
depender, de forma similar a como ocurra en el muestreo
estratificado, de la relacin entre varianza dentro y fuera de los
conglomerados.
Esta relacin se suele expresar con un coeficiente de
correlacin intraconglomerados (), que se define como el
coeficiente de correlacin lineal entre todos los pares de valores
de la variable en estudio medidos sobre las unidades de los
conglomerados y extendido a todos los conglomerados. En
definitiva, este coeficiente es una medida de la homogeneidad
en el interior de los conglomerados.
Cuanto
menor
sea
el coeficiente
de
homogeneidad
intraconglomerados , mayor eficiencia arrojar el muestreo por
conglomerados. Recordemos que lo ideal es que los
conglomerados sean tan heterogeneos como el total de la
muestra, con el fin de que la seleccin de un conglomerado
concreto nos de la misma informacin que la seleccin de
individuos al azar del total de la poblacin.
Si comparamos el muestreo aleatorio simple con el muestreo
por conglomerados, es posible demostrar que si =0 ambos
mtodos son equivalentes. Esta condicin implica que los
conglomerados son exactamente tan heterogeneos como el
total de la poblacin. El peor caso sera =+1 , mientras que el
ms favorable sera el de=-1/(M-1), donde M es el tamao del
conglomerado. Sin embargo, normalmente va a ser siempre
mayor que 0, ya que lo normal es que las unidades de un
conglomerado tengan cierto parecido entre s.
Otra forma de ver el impacto de este problema es calcular el
tamao de muestra necesario al emplear muestreo por
conglomerados para lograr la misma precisin de un muestreo
aleatorio simple. Esta expresin es la que sigue
nc = na (1 + (M-1) )
donde nc es el tamao de muestra en muestreo por
conglomerados y naes el tamao de muestra que necesitaramos
en muestreo aleatorio simple. Por lo tanto, el factor (1+(M-1)
es la variacin del tamao de muestra que necesitamos

debido al uso de conglomerados. Normalmente ser


incremento. Este factor se conoce como efecto de diseo.

un

También podría gustarte