Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tecnicas de Encuesta Por Muestreo PDF
Tecnicas de Encuesta Por Muestreo PDF
POR MUESTREO
Copyright © ESOMAR, 1995
Joan S. Alòs
Texto presentado en el Seminario de ESOMAR
celebrado en Caracas y México en 1990
1. EL UNIVERSO
371
de vista marketing deberá aportarnos los ingresos necesarios para nuestra
actividad y que desde el punto de vista de la investigación ha de aportar-
nos aquella información necesaria para la buena marcha del plan de
marketing.
Una vez elegido el universo será preciso cuantificarlo, tener una idea
ni que sea aproximada de cuántos cientos, miles o millones de perso-
nas se trata. Generalmente vamos a trabajar en investigación de merca-
dos con universos que estadísticamente se consideran infinitos, es de-
cir que el tamaño de la población que hemos de estudiar no tiene una
repercusión sensible sobre el tamaño de la muestra, prácticamente son
independientes. El universo suele expresarse convencionalmente con
la letra N (mayúscula) y la muestra con la letra n (minúscula), pues
bien cuando
√
(N — n)
———–— ≥ 0.95
n—1
372
mación excesivamente largos como exigiría un estudio censal, pero tam-
bién hay otro factor importante y es que difícilmente obtendríamos res-
puesta por parte de todo el universo, siempre habría personas ilocalizables
o que finalmente se negarían a facilitar información, con lo cual evidente-
mente estaríamos produciendo un sesgo en los resultados sin que pudié-
ramos precisar exactamente cuáles; consecuentemente por todo este cú-
mulo de razones debemos pensar en otras formas de representar aquellos
colectivos o universos que interesan a nuestros fines.
2. LA MUESTRA
373
Dentro de este contexto general de lo que es una muestra, debemos indi-
car también que en ocasiones se hacen estudios a muestras especialmen-
te sesgadas, es decir no representativas de un universo; es simplemente
por una similitud en cuanto al procedimiento o en cuanto al léxico que
se les llama en esta forma, podemos imaginar por ejemplo encuestas a
líderes de opinión, cuyas respuestas ciertamente no van a ser represen-
tativas del conjunto de la población pero que sin embargo pueden tener
un peso importante en sí mismas o incluso como conjunto, y es bajo esta
perspectiva que hay que verlas; en este caso, también en un sentido es-
tricto, podríamos decir que el universo que pretendemos representar no
es por ejemplo el de nuestro conjunto de consumidores sino
específicamente el de líderes de opinión que pueden afectar a nuestra
actividad o nuestros planteamientos.
374
rencias en cuanto a la precisión pero salvo que se trabaje con despropor-
ciones muy elevadas la incidencia sobre el grado de precisión es realmen-
te aceptable; en todo caso siempre existe la posibilidad, y suele hacerse,
de reequilibrar esta muestra por ordenador para dar unos resultados tota-
les, es decir dar a cada estrato teóricamente la muestra que le corresponde
aunque no se haya hecho, así por ejemplo la zona menos favorecida puede
tener un peso de reequilibraje igual a 1 y aquellas más favorecidas en que
se ha hecho proporcionalmente menos muestra, multiplicarlas precisa-
mente por el factor de desproporcionalidad.
375
nera que nos vayamos acercando hasta el último elemento de la muestra,
que en el caso que consideramos sería un individuo.
Sin embargo pese a que la teoría nos indica que el sistema de random
sampling o muestra aleatoria es el indicado, de forma creciente las mues-
tras se realizan por el sistema de cuotas.
376
nas no ha intervenido la intencionalidad, sino que dentro de cada una de
las cuotas establecidas se ha dejado la selección al azar, puede ser también
un buen método de muestreo y suficientemente representativo.
377
de muestreo estrictamente aleatorio es ciertamente grande, en tanto que
un sistema de cuotas nos va a garantizar mejor la representatividad de
la muestra.
378
universo, podemos permitirnos unas muestras menores que si aquello
que intentamos averiguar u observar es bastante más complejo; suponga-
mos que en una bolsa tenemos una variedad de frutos secos, si nosotros
pretendemos saber cuál es esta variedad desde un punto de vista cualita-
tivo, es decir qué tipo de frutos secos hay, nos bastará una extracción
relativamente pequeña, pero si además queremos saber la proporción en
que se hallan presentes estos frutos secos, sin duda necesitaremos un
tamaño de muestra mayor.
379
y que consecuentemente nos pudieran hacer variar ligeramente los resul-
tados, pero el coste de obtener esta información marginal sería ciertamen-
te caro; por poner un ejemplo, si en vez de este nivel de confianza, que así
se le llama, de 2 σ lo quisiéramos de 3 σ –que nos cubriría el 99,7% del
área de distribución normal– para ganar este 4% precisaríamos de un ta-
maño de muestra más de 2 veces superior, consecuentemente seguimos
trabajando con el nivel de confianza de 2 σ. El nivel de confianza de 2 σ
viene a decirnos que si repitiéramos la muestra con elementos distintos
100 veces, el valor promedio obtenido no diferiría significativamente del
que hemos hallado en el 95,5% de los casos, en el otro 4,5% este valor
podría diferir pero evidentemente no alejarse hasta extremos que pudie-
ran llevarnos a unas conclusiones de marketing distintas.
K2 p q
n = —————–
e2
380
√
p q
e=±2 —————
n
√
p q (N – n)
n=±2 ———————
n (N – 1)
± 10 100
± 5 400
± 2.5 1.600
± 1.25 6.400
± 0.62 25.600
381
puesto a asumir, el grado de precisión que necesita para no ir a tamaños
que acabarían siendo impagables, pero por otra parte no quedarse en unos
tamaños tan reducidos, por baratos que sean, a partir de los cuales no
pudiéramos tomar decisiones operativas.
382
Plantearnos el margen de error para el conjunto de 15 millones es poco
operativo; imaginemos que estamos dispuestos a aceptar un margen de
error de ± 5 para este total de 15 millones, el tamaño muestral sería de 400
entrevistas; si estas entrevistas se distribuyeran de forma proporcional
–como es ideal hacerlo–, la región más pequeña, con un millón de habi-
tantes, se representaría únicamente en base a 27 entrevistas, lo que nos da
un margen de error para esta región de ± 19%, es decir que ante un porcen-
taje de un 50% únicamente podemos afirmar que en 95 de cada 100 casos,
dentro de la población de esta región, este porcentaje puede oscilar entre
69% y 31%, en una proporción consecuentemente que en números redon-
dos va de 1 a 2; huelga decir por otra parte que difícilmente podríamos
lograr una buena representatividad a partir únicamente de 27 entrevistas,
ya que sería enormemente difícil poder respetar los principios de
aleatoriedad y probabilidad dentro de esta región.
383
√ Σ
p q np2
e=±2 ——— ———
n2 na
En el caso que nos ocupa el error muestral final de estas 1.000 entrevis-
tas no sería de ± 3.2% sino de ± 4.9%, es decir que los datos totales
podrían oscilarnos, en el caso del 50% entre 45 y 55, pero en vez de
hacer 1.500 entrevistas hemos hecho 1.000, lo que supone un ahorro de
coste importante.
384
profundidad; en ocasiones será preciso utilizar ambos tipos de técni-
cas, en otros nos bastará con una de ellas. Si el número de estratos es
muy amplio, en ocasiones será posible reducir este número de grupos
hasta 1 por estrato.
385
por parte de las personas entrevistadas, si las preguntas han sido
correctamente formuladas, en general vienen a compensarse por la ley
de los grandes números; estamos hablando de omisiones o equivoca-
ciones totalmente involuntarias y que tanto podían producirse en un
sentido como en otro; sin embargo en ocasiones ésto no es así y el ses-
go, cuando se produce, se produce siempre en el mismo sentido, por
ejemplo de aquel tipo de respuesta que haga quedar mejor al entrevis-
tado; en estos casos conviene tener recursos a lo largo de la entrevista
para poder verificar algunas de las respuestas. Pero generalmente el
problema no viene tanto de la respuesta en sí misma como de ésta en
relación a la pregunta que se ha efectuado; es de capital importancia
disponer de cuestionarios que sean absolutamente neutros, que permi-
tan al máximo la facilidad de expresión y de opinión por parte de los
entrevistados, y que sean formuladas de una manera estrictamente pro-
fesional por parte de los entrevistadores.
Hay algunos temas que son más difíciles de abordar que otros y que
consecuentemente producen sesgos en las respuestas, hay que ser cons-
ciente de ello y si acaso tomar las respuestas partiendo de unas mismas
preguntas en un sentido no absoluto sino relativo, viendo como han
ido evolucionando a lo largo del tiempo aún sabiendo a ciencia cierta
que la respuesta obtenida no refleja exactamente el pensamiento o for-
ma de actuar de la población.
386
llas en el caso de que hayamos obtenido unos promedios a partir de unas
puntuaciones, por ejemplo a grados de acuerdo o desacuerdo sobre algu-
nas frases que hayamos podido sugerir, puesto que podemos calcular
fácilmente la desviación típica.
Respecto a los porcentajes hay una forma sencilla de ver hasta qué punto
oscilan dentro de la muestra, que es repartir las respuestas entre los cues-
tionarios pares y los impares, entendiendo que tanto pares como impa-
res son dos submuestras representativas de la muestra realizada; si se
quiere llegar a mayor detalle y la muestra es suficientemente amplia,
pueden dividirse estos resultados entre los 10 números terminales de los
cuestionarios dando lugar consecuentemente a 10 submuestras.
7. BIBLIOGRAFÍA
387
8. FORMULARIOS
388
Otro cuadro nos dará los márgenes de error para poblaciones infinitas,
para un nivel de confianza igual a 2 y para distintas probabilidades de
p y q; en la columna de la izquierda podemos entrar por ejemplo con
una muestra de 600 entrevistas y observar que para una probabilidad
del 10% el error muestras sería de ± 2.5.
Y por último adjuntamos unos formularios de entre los más usuales que se
utilizan en investigación de mercados.
389
FORMULARIO BÁSICO
a) Muestras proporcionales
√
p q N–n
E=±2 ——— × ————
n N–1
E = error estadístico
p = probabilidad entre 1 y 100
q = complementario de p
N = tamaño del universo
n = tamaño de la muestra
√
p q
y entonces E = ± 2 ——— para N ≥ 100.000 puede
n
N–n
eliminarse ——— (universo infinito)
N–1
390
b) Muestras no proporcionales
√ Σ
p q np2
E=±2 ——— ———
n2 na
4pqN
n = ———————— (universo finito)
E2 (N–1) + 4p q
4pq
n = ———— (universo infinito)
E2
√
N
Puntos Muestrales = 30 + ———— – 150
1.000
391
b) Entre dos porcentajes de muestras independientes
Si p1 > p2 numéricamente, y
√
p1 q1 p2 q2
p1 – p 2 > 2 ——— + ——— significativo realmente
Aplicar test de X2
▼
Frecuencia absoluta de la muestra patrón
▼
id. de la muestra a comparar
392
Si el valor X2 es mayor que el de la tabla la diferencia puede ser signi-
ficativa dejando al azar únicamente el porcentaje de probabilidades
indicado en la columna de la izquierda.
grados
libertad 1 2 3 4 5 6 7 8 9 10
5% valor
máx. X2 3,84 5,99 7,81 9,49 11,07 12,6 14,1 15,5 16,9 18,3
95% valor
máx. X2 0,04 0,10 0,35 0,71 1,14 1,63 2,17 2,73 3,32 3,94
Si m 1 > m2 numéricamente, y
√
2 2
G1 G2
m1 – m2 > 2 ——— + ——— significativo realmente
n1 n2
m = media
√Σ
2
(X1 – X)
G = desviación típica = —————
n
Si m 1 > m2 numéricamente, y
G1 G2
m1 – —— > m2 + —— significativo realmente
√n √n
393