Muest Reo

TCNICAS DE ENCUESTA POR MUESTREO
Copyright ESOMAR, 1995
Joan S. Als Texto presentado en el Seminario de ESOMAR celebrado en Caracas y Mxico en 1990
Vamos a abordar en este captulo en qu forma podemos obtener informaciones representativas del mercado, especialmente en cuanto acudimos a fuentes de informacin primarias y externas a la empresa.
1.
EL UNIVERSO
Si hablramos de poblacin en general el universo consistira en el censo detallado de dicha poblacin; si hablramos de un canal de distribucin, por ejemplo de alimentacin, el censo de establecimientos que vendieran productos alimenticios constituira el universo de este canal de distribucin. Consecuentemente el universo va a ser la totalidad de elementos que deseamos investigar, es algo que siempre hay que definir puesto que rara vez el universo es toda la poblacin, incluso en sondeos de poblacin se suelen excluir sectores que por sus caractersticas o no son votantes o se considera que no estn en edad de opinar, por ejemplo las edades infantiles o las ya muy avanzadas; pero ciertamente cuando estamos hablando de una investigacin de mercado tendente a aportar informacin operativa encuadrada dentro de un plan de marketing, el universo es lo primero que hay que definir con claridad, nos estamos refiriendo a todo el pblico?, slo a los compradores?, a aquellos compradores que ya consumen nuestra marca?, a los que consumen cierta categora de producto?, a los de todo el Estado?, o slo a los que viven en algunas zonas o reas metropolitanas? La definicin del universo consecuentemente debe ser precisa ya que ello nos permitir cuantificar el potencial del mercado, abordar debidamente los medios de comunicacin, elegir asimismo un estilo de producto y de comunicacin, y en definitiva constituir aquel colectivo que desde el punto
371
de vista marketing deber aportarnos los ingresos necesarios para nuestra actividad y que desde el punto de vista de la investigacin ha de aportarnos aquella informacin necesaria para la buena marcha del plan de marketing. Los elementos ms clsicamente definitorios del universo suelen ser de tipo sociodemogrfico: sexo, edad, clase social, lugar de residencia, etc. y de consumo: ser o no consumidor de cierta categora de producto o de ciertos productos especficos o incluso de ciertas marcas o variedades especficas. Una vez elegido el universo ser preciso cuantificarlo, tener una idea ni que sea aproximada de cuntos cientos, miles o millones de personas se trata. Generalmente vamos a trabajar en investigacin de mercados con universos que estadsticamente se consideran infinitos, es decir que el tamao de la poblacin que hemos de estudiar no tiene una repercusin sensible sobre el tamao de la muestra, prcticamente son independientes. El universo suele expresarse convencionalmente con la letra N (mayscula) y la muestra con la letra n (minscula), pues bien cuando
(N n) 0.95 n1
se considera que a efectos prcticos el universo es infinito; ello sucede cuando, el nmero de elementos del universo es superior a los 100.000, pero de manera prctica tambin podemos considerar universos ya infinitos cuando N es igual a 50.000 salvo que la muestra que haya que entresacar sea proporcionalmente muy elevada. Pero podramos preguntarnos porqu entresacar una muestra y no hacer el estudio sobre la totalidad del universo, lo que si se quiere es una pregunta retrica ya que simplemente el coste econmico nos hara desistir de nuestro empeo; en efecto es enormemente costoso obtener informacin de toda la poblacin, o de todo el universo, lo cual no obstante se hace de forma regular aproximadamente cada 10 aos a travs de los censos de poblacin. Pero al margen de los motivos estrictamente econmicos hay tambin otros que nos hacen desistir de plantearnos seriamente realizar una investigacin sobre el conjunto del universo, uno es el factor tiempo: la dinmica del marketing no permite unos plazos de obtencin de infor372
macin excesivamente largos como exigira un estudio censal, pero tambin hay otro factor importante y es que difcilmente obtendramos respuesta por parte de todo el universo, siempre habra personas ilocalizables o que finalmente se negaran a facilitar informacin, con lo cual evidentemente estaramos produciendo un sesgo en los resultados sin que pudiramos precisar exactamente cules; consecuentemente por todo este cmulo de razones debemos pensar en otras formas de representar aquellos colectivos o universos que interesan a nuestros fines.
2.
LA MUESTRA
La muestra es precisamente la forma ideada para lograr representar un universo, con ello indicamos ya la cualidad fundamental de una muestra: ser representativa, es decir que nos permita tomar la parte por el todo; aquella informacin obtenida de la muestra debe ser vlida para la totalidad del universo, es decir debe ser extrapolable al universo o dicho en un lenguaje sencillo: si nosotros extraemos 400 personas de un universo estadsticamente infinito y tabulamos sus respuestas, stas dentro de unos ciertos mrgenes de error previamente conocidos, van a ser las mismas que obtendramos de otro conjunto de 400 personas de este mismo universo, en caso contrario no se tratara de una muestra sino nicamente de una visin parcial, sectorial, polarizada y definitivamente sesgada. El hecho de que la muestra deba ser representativa, puesto que es precisamente una extraccin representativa del universo, nos va a llevar a toda una sistemtica de actuacin para obtenerla y a la aplicacin de una ciertas leyes de tipo estadstico; digamos que estas premisas en investigacin de mercados hacen referencia a cualquier muestra, cualquiera que sea su tamao y cualquiera que sea la utilizacin que se hace de la misma, por lo tanto una muestra debe ser representativa tanto en un panel, que va a dar como resultado unas magnitudes al mercado, como en una encuesta, que va a dar como resultado unas determinadas proporciones o porcentajes de opiniones y hechos del mercado, como en un estudio de tipo cualitativo, descriptivo o motivacional que nos va a decir las actitudes y motivaciones que subyacen en el comportamiento de las personas; quiere ello decir que si realizamos un estudio basado en 4 dinmicas de grupo debemos tener la certeza de que caso de realizar 4 dinmicas con otras personas distintas, las conclusiones a las que llegaramos seran las mismas, pudiendo variar slo en matices pero no llevndonos en ningn caso a una toma de decisiones en marketing distinta; si ello no fuera as la investigacin de mercados no tendra sentido.
373
Dentro de este contexto general de lo que es una muestra, debemos indicar tambin que en ocasiones se hacen estudios a muestras especialmente sesgadas, es decir no representativas de un universo; es simplemente por una similitud en cuanto al procedimiento o en cuanto al lxico que se les llama en esta forma, podemos imaginar por ejemplo encuestas a lderes de opinin, cuyas respuestas ciertamente no van a ser representativas del conjunto de la poblacin pero que sin embargo pueden tener un peso importante en s mismas o incluso como conjunto, y es bajo esta perspectiva que hay que verlas; en este caso, tambin en un sentido estricto, podramos decir que el universo que pretendemos representar no es por ejemplo el de nuestro conjunto de consumidores sino especficamente el de lderes de opinin que pueden afectar a nuestra actividad o nuestros planteamientos.
3.
COMO GARANTIZAR UNA BUENA REPRESENTACIN
Este es realmente el quid del muestreo. Fundamentalmente para poder garantizar una buena representatividad hemos de tener presentes dos principios: 1. la aleatoriedad, es decir la no intencionalidad en la seleccin de un elemento determinado del universo la probabilidad, en el sentido de respetar que todos los elementos del universo tengan la misma probabilidad de entrar a formar parte de la muestra.
2.
Esta probabilidad no siempre es pareja a la proporcionalidad; nos explicamos, en ocasiones el universo viene estratificado en formas muy descompensadas, es posible que ciertas regiones de un pas o ciertas reas metropolitanas tengan una concentracin de poblacin mucho mayor que otras; consecuentemente si queremos representar las reas menos extensas y guardar la proporcionalidad en las reas con mayor proporcin, podramos irnos a unos niveles de muestra muy elevados y por otra parte innecesarios para dar respuestas vlidas sobre estas reas; por el contrario si elegimos unas muestras mnimamente representativas para las reas mayores y guardamos el principio de proporcionalidad, nos vamos a encontrar con que en las reas menores la muestra es totalmente insuficiente. Consecuentemente la probabilidad en muchas ocasiones se respeta a nivel de cada uno de los estratos en que podemos subdividir el universo pero no entre los estratos; lgicamente ello proporciona unas ciertas dife374
rencias en cuanto a la precisin pero salvo que se trabaje con desproporciones muy elevadas la incidencia sobre el grado de precisin es realmente aceptable; en todo caso siempre existe la posibilidad, y suele hacerse, de reequilibrar esta muestra por ordenador para dar unos resultados totales, es decir dar a cada estrato tericamente la muestra que le corresponde aunque no se haya hecho, as por ejemplo la zona menos favorecida puede tener un peso de reequilibraje igual a 1 y aquellas ms favorecidas en que se ha hecho proporcionalmente menos muestra, multiplicarlas precisamente por el factor de desproporcionalidad. Para garantiza la aleatoriedad hay bsicamente dos procedimientos: el procedimiento aleatorio simple, y el procedimiento aleatorio sistemtico. En el aleatorio simple todos los elementos del universo forman parte de cada una de las extracciones de elementos muestrales en cada una de las extracciones; un ejemplo ilustrativo puede ser el de un sistema de lotera en que todos los nmeros, uno por uno, estn en el bombo y cada vez se va extrayendo una bola. Para llevar a cabo este procedimiento en la prctica, lo ideal es poder disponer de un censo nominal de la poblacin y hacer unas extracciones por sorteo; este proceso aleatorio simple, sin duda el ms puro, presenta no obstante algunos problemas de consideracin que hacen que sea desestimado en la mayor parte de los casos. Por un lado puede suceder que la muestra obtenida sea enormemente dispersa territorialmente, lo que encarecera enormemente el coste de obtencin de informacin; por otra parte, salvo que el tamao muestral sea realmente muy grande, existe el riesgo de que por azar algunos estratos del universo no hayan sido cubiertos o apenas cubiertos y en otros, en cambio, haya una proporcin bastante mayor, lo que sin duda podra introducirnos unos sesgos en los resultados. El procedimiento aleatorio sistemtico se ilustra por ejemplo en el caso de la lotera, en que hay un bombo correspondiente a cada una de las cifras de unidades, decenas, centenas, millares y centenas de millar que pueden contener el nmero premiado y se extrae una bola de cada bombo. En el terreno de los estudios de mercado, el procedimiento aleatorio sistemtico pretende garantizar a priori la representatividad de todos los estratos, de manera que aseguremos la proporcionalidad, dentro de los lmites que antes hemos sealado, y dentro de cada estrato la probabilidad nos vendr garantizada ya por un procedimiento de seleccin que puede ya, si se desea, ser aleatorio simple. No obstante, dadas las dificultades existentes en la inmensa mayor parte de pases en tener unos censos nominales de los universos, se suele proceder a un sistema de seleccin polietpica de ma375
nera que nos vayamos acercando hasta el ltimo elemento de la muestra, que en el caso que consideramos sera un individuo. Una seleccin muestral polietpica pasa por las siguientes fases: 1. una reparticin de la muestra por estratos, generalmente se trata de regiones de un determinado pas o de diversos pases en estudios multinacionales. dentro de estos estratos, por zonas, se reparte tambin la muestra por niveles de hbitats, asegurando as la representatividad tanto de hbitats rurales, como semiurbanos, urbanos o metropolitanos. dentro de estas celdillas de zona hbitat, se eligen por sorteo las ciudades, o en general las poblaciones a entrevistar, participando cada poblacin con tantos nmeros en el sorteo como nmero de habitantes tenga. dentro de los pueblos y ciudades elegidos se hace una seleccin de edificios, generalmente a travs del sistema de rutas aleatorias o random route, que esencialmente consiste en recorrer una ruta en zig zag, una vez elegido aleatoriamente un punto de partida en aquella poblacin o ciudad y si el tamao de la muestra es grande, sta se subdivide en rutas que suelen oscilar entre las 5 y 10 entrevistas teniendo cada una de ellas un punto de partida y un itinerario en zig zag a seguir. consiste en la seleccin aleatoria de viviendas dentro del edificio, para lo cual el entrevistador con la ayuda de un selector sortea el piso al que debe acudir y dentro del rellano elegido la puerta concreta, o la vivienda concreta, en la que debe hacer la entrevista. se sortea el individuo a entrevistar dentro de la vivienda, sorteando entre aquellos que renen las caractersticas fijadas en el universo tales como sexo y edad por ejemplo.
2.
3.
4.
5.
6.
Sin embargo pese a que la teora nos indica que el sistema de random sampling o muestra aleatoria es el indicado, de forma creciente las muestras se realizan por el sistema de cuotas. En el muestreo por cuotas exigimos a priori unas proporciones de determinadas caractersticas, generalmente conocidas por estudios anteriores, y as podemos exigir que en la muestra formen parte determinada proporcin de hombres y de mujeres dentro de cada uno de estos grupos, unas proporciones determinadas de edades y por ejemplo dentro de estos subgrupos unas proporciones determinadas de usuarios del producto a estudiar o de algunas marcas concretas. Si en la seleccin de estas perso376
nas no ha intervenido la intencionalidad, sino que dentro de cada una de las cuotas establecidas se ha dejado la seleccin al azar, puede ser tambin un buen mtodo de muestreo y suficientemente representativo. Por qu se hacen relativamente tan pocos muestreos por un procedimiento aleatorio simple o aleatorio sistemtico? Un primer factor es el coste ya que en muchas ocasiones la persona que deberamos entrevistar en aquel momento no est presente en el hogar o en el lugar donde hayamos ido a buscarla o no dispone de tiempo; tericamente habra que hacer un segundo intento o quiz hasta un tercero y finalmente si no se logra la entrevista, hacer una sustitucin estricta por cuotas; ello ya es de por s costoso en entrevistas realizadas en grandes ciudades pero el coste ya puede ser prohibitivo cuando estas entrevistas se estn realizando en hbitats rurales, con entrevistadores desplazados, y que se veran imposibilitados de acabar su ruta, su labor en el transcurso del da, o mxime dos das, que suelen estar en cada uno de estos puntos. Adems del problema de coste est tambin el problema de tiempo, podramos tardar demasiado tiempo en obtener informacin y quiz una vez obtenida esta informacin ya no nos fuera til para la toma de decisiones. Pero existen asimismo problemas de tipo tcnico para garantizar que verdaderamente toda la labor de sistema aleatorio se est haciendo con absoluto rigor, ya que en muchas ocasiones nos faltarn datos suficientes para poder precisar estos extremos, por ejemplo podemos encontrarnos ciudades o reas en que el nmero de viviendas por edificio vare fuertemente de un edificio a otro: es justo entonces dar la misma probabilidad de contacto a todos los edificios?, podemos hallarnos tambin en ocasiones con una variacin relativamente amplia del nmero de miembros del hogar de una a otra vivienda, podemos conocer sto a priori y consecuentemente hacer un sistema de muestreo ms preciso?. Si a estos inconvenientes en coste, en tiempo y tcnicos, aadimos el conocimiento que venimos acumulando por el hecho de que la investigacin lleva aos de existencia y que generalmente es sistemtica, vamos adquiriendo una gran cantidad de conocimientos acerca de cmo est estratificado el mercado y podemos entonces ya garantizar a priori las distintas proporciones en que las personas deben aparecer en la muestra, sea en funcin de su sexo, edad, poder adquisitivo, lugar de residencia, o bien en funcin de otros aspectos referidos al consumo habitual, ocasional, o no consumo de un producto de una marca determinada, o aspectos referidos por ejemplo a su audiencia de medios, etc.; si tenemos en cuenta adems que a menudo el tamao de la muestra es bastante pequeo, casi en el lmite de lo tolerable por motivos de tipo econmico, el riesgo en un sistema
377
de muestreo estrictamente aleatorio es ciertamente grande, en tanto que un sistema de cuotas nos va a garantizar mejor la representatividad de la muestra. Consecuentemente el sistema aleatorio va a quedarnos para estudios con muestras suficientemente amplias y cuando no dispongamos de una informacin lo bastante precisa sobre aquel mercado, siendo verdaderamente difcil establecer unas cuotas a priori cuando en muchas ocasiones sto es precisamente lo que estamos intentando descubrir; de ah que el sistema de muestreo por cuotas tenga una implantacin creciente. Ciertamente en pases en donde existen unas fuentes estadsticas completas, manejables y de bajo coste, es ms fcil acudir a sistemas aleatorios, puesto que se dispone de listado de individuos, de viviendas, o se sabe en un ncleo determinado por ejemplo cuntas familias viven, cmo estn agrupadas y distribuidas en la poblacin, cul es el tamao de cada una de estas familias, etc. Pero de forma creciente se est acudiendo al muestreo por cuotas o de tipo mixto.
4.
EL TAMAO DE LA MUESTRA Y EL MARGEN DE ERROR
Sin duda cuando se habla de muestra el aspecto ms candente es el del tamao y la precisin que este tamao pueda aportarnos. Comencemos por decir de qu depende y de qu no depende el tamao de la muestra. El tamao de la muestra en general dentro de la investigacin de mercados, por lo que hemos comentado anteriormente, no depende del tamao del universo, en cambio si puede depender del grado de homogeneidad dentro de este universo o de la caracterstica que estemos buscando dentro del mismo. Pongamos un ejemplo sencillo: disponemos de dos bolsas, en una de las cuales hay naranjas y en otra limones; las naranjas debemos servirlas en el postre y los limones durante la comida, si encargamos al pinche de cocina que nos entregue la bolsa conteniendo naranjas qu nmero de extracciones tendr que hacer?, evidentemente le bastar con abrir una de las bolsas y examinar uno de sus elementos, en el supuesto evidentemente de que nuestro proveedor no nos haya hecho la jugarreta de mezclar naranjas y limones; si abre la bolsa y en ellas saca un limn, evidentemente en aquella bolsa habr limones y es la que tendremos que utilizar durante la comida, y en la otra habr naranjas y es la que tendremos que utilizar en los postres. Si aquello que intentamos averiguar es muy sencillo y viene repartido adems de forma muy homognea en todo el
378
universo, podemos permitirnos unas muestras menores que si aquello que intentamos averiguar u observar es bastante ms complejo; supongamos que en una bolsa tenemos una variedad de frutos secos, si nosotros pretendemos saber cul es esta variedad desde un punto de vista cualitativo, es decir qu tipo de frutos secos hay, nos bastar una extraccin relativamente pequea, pero si adems queremos saber la proporcin en que se hallan presentes estos frutos secos, sin duda necesitaremos un tamao de muestra mayor. Dicho sto vamos a operar como si el grado de homogeneidad nos fuera desconocido. Ello estadsticamente se expresa en la forma en que p=q=50%, es decir la probabilidad de que se de un fenmeno o su contrario son iguales; cualquier otra probabilidad, mayor o menor, nos permitira unos tamaos de muestra ms reducidos, en el caso de las naranjas o los limones, por definicin la probabilidad de que si en una bolsa sacamos un limn todos fueran limones es del 100%, con independencia del nmero de limones (universo) que pudiera haber en la bolsa, con lo que nos basta, como hemos indicado, con sacar un solo elemento. Hay otro factor que tambin nos va a influir en el tamao de la muestra y es nuestro grado de permisividad, es decir hasta qu punto nos importa que los resultados sean ms o menos exhaustivos, qu transcendencia tiene sto para nosotros; generalmente consideramos que las respuestas obtenidas se distribuyen conforme a una ley normal y la curva de la ley normal es prcticamente asinttica con el eje de abcisas, es decir que se encuentra con ella en ms infinito y en menos infinito; evidentemente en investigacin de mercados no precisamos una rigurosidad tan elevada como si de un experimento cientfico de alta tecnologa se tratara, podemos perfectamente prescindir de esta parte de la curva, que ya es muy prxima al eje de abcisas, es decir que las frecuencias que aparecen con estos valores extremos es ya evidentemente muy pequea, son lo que podramos llamar casos marginales, casos atpicos, consecuentemente que dentro de un universo la probabilidad de que aparezcan es muy reducida. Pero hasta qu punto vamos a ser permisivos en este sentido? En lneas generales se establece que para la investigacin de mercados el punto de permisividad es el de 2 a uno y otro lado, por lo tanto 2 del valor medio de la curva de distribucin normal, y ello nos cubre el 95,5% de las respuestas posibles; sabemos por lo tanto que hay 4,5% de posibilidades de que aparecieran otras respuestas distintas a las que hemos tenido
379
y que consecuentemente nos pudieran hacer variar ligeramente los resultados, pero el coste de obtener esta informacin marginal sera ciertamente caro; por poner un ejemplo, si en vez de este nivel de confianza, que as se le llama, de 2 lo quisiramos de 3 que nos cubrira el 99,7% del rea de distribucin normal para ganar este 4% precisaramos de un tamao de muestra ms de 2 veces superior, consecuentemente seguimos trabajando con el nivel de confianza de 2 . El nivel de confianza de 2 viene a decirnos que si repitiramos la muestra con elementos distintos 100 veces, el valor promedio obtenido no diferira significativamente del que hemos hallado en el 95,5% de los casos, en el otro 4,5% este valor podra diferir pero evidentemente no alejarse hasta extremos que pudieran llevarnos a unas conclusiones de marketing distintas. Y finalmente otro aspecto influyente en el tamao de la muestra es el error muestral que estemos dispuestos a asumir, el cual nos vendr muy condicionado por la gravedad de la decisin que tengamos que tomar. Finalmente pues el tamao muestral para poblaciones infinitas lo podemos expresar con esta frmula:
K2 p q n = e2
Dentro de la frmula n es el tamao muestral para una poblacin infinita, K es la constante que nos representa el nivel de confianza y que como comentbamos en la investigacin de mercados usualmente toma el valor 2; observemos que si quisiramos reducir el riesgo en cuanto al nivel de confianza y pasramos a un valor 3, el tamao de la muestra nos aumentara exactamente en 9/4 puesto que es K2 y no K la que afecta directamente al tamao de la muestra; p y q son las probabilidades complementarias de respuesta y que cuando no dispongamos de otro tipo de informacin vamos a suponer que son igual a 50%, es decir el caso ms desfavorable en que se maximiza ms la muestra; e es el error muestral que estamos dispuestos a admitir, el grado de precisin, y que viene afectado inversamente al cuadrado, consecuentemente cuanto mayor sea el error admitido menor va a ser la muestra. A partir de la frmula de tamao muestral podemos deducir fcilmente la frmula del error muestral, que tomando ya como referencia K igual a 2, la frmula sera la siguiente:
380
e=2
p q n
ello referido como siempre a poblaciones infinitas; en el caso de que la poblacin fuera finita la frmula sera la siguiente:
n=2
p q (N n) n (N 1)
Cmo hay que interpretar el margen de error? En el supuesto de que estemos examinando un porcentaje del 50% y hubiramos realizado 100 entrevistas, el valor de e (margen de error) sera de 10; ello quiere decir que el valor del 50% que hemos hallado en la muestra, dentro del universo podra oscilar entre 60 y 40 es decir entre 50 + 10 y 50 10 95,5 de cada 100 veces; para reducir este abanico la solucin es ir ampliando el tamao de la muestra. Si pretendemos reducir este margen de error de 10 a 5 observaremos que la muestra necesaria no es el doble, es decir 200 entrevistas, sino el cudruple, 400 entrevistas. Consecuentemente enseguida nos podemos construir una tabla sencilla que nos ponga en relacin los errores muestrales con el tamao muestras para el caso de mxima indeterminacin en que p=q=50% y siempre para este nivel de confianza igual a 2. Error muestral 10 5 2.5 1.25 0.62 Tamao muestral 100 400 1.600 6.400 25.600
Puede observarse que reducir drsticamente el margen de error supone un esfuerzo econmico enormemente elevado, puesto que los tamaos muestrales se van cuadriplicando cada vez. Consecuentemente hay que hilar muy fino en cuanto al margen de error, el riesgo que uno est dis381
puesto a asumir, el grado de precisin que necesita para no ir a tamaos que acabaran siendo impagables, pero por otra parte no quedarse en unos tamaos tan reducidos, por baratos que sean, a partir de los cuales no pudiramos tomar decisiones operativas. En qu forma consecuentemente hay que determinar el tamao muestral?
5.
LA ESTRATIFICACIN. EL ERROR RAZONABLE
Conocemos qu aspectos estadsticos afectan el tamao muestral y su implicacin en el grado de precisin y en el riesgo que corremos. Cmo podemos compaginar estos aspectos con una inversin en investigacin razonable? En primer lugar si disponemos ya de informacin anterior o de apreciaciones fiables respecto al valor de p, consecuentemente respecto al grado de homogeneidad, inmediatamente al calcular el tamao muestral en vez de hacer p=q=50% pondremos el valor de p que haga al caso, supongamos un valor de 75%; si siguiramos manteniendo un tamao muestras de 100 entrevistas, el error muestral nos disminuira de un 10 a un 8.7, pero podemos optar por no disminuir el margen de error y seguir aceptando el valor 10%, y consecuentemente disminuir el tamao muestral, lo que nos abarata el estudio; en este supuesto nos bastara con realizar 75 entrevistas en vez de 100, reduciendo el coste, sino de manera proporcional en un 25%, si de una forma sensible. Sin embargo en la mayor parte de ocasiones no dispondremos de estimadores previos o la variedad de objetivos a cubrir ser tan amplia que en algn caso tendremos que admitir esta indeterminacin en que p=q=50%; en estos casos que suelen ser la generalidad, no tiene sentido plantearse el error muestral que uno est dispuesto a admitir para el total del universo, sino para el estrato de universo ms pequeo sobre el que razonablemente deban tomarse decisiones. Imaginemos por un momento un pas de 15 millones de habitantes, que se divide en cuatro regiones distintas en las que es posible emprender acciones de marketing diferenciadas y que estas regiones tengan una poblacin respectivamente: Regin A: 1 milln de habitantes Regin B: 2 millones de habitantes Regin C: 4 millones de habitantes Regin D: 8 millones de habitantes Total: 15 millones de habitantes
382
Plantearnos el margen de error para el conjunto de 15 millones es poco operativo; imaginemos que estamos dispuestos a aceptar un margen de error de 5 para este total de 15 millones, el tamao muestral sera de 400 entrevistas; si estas entrevistas se distribuyeran de forma proporcional como es ideal hacerlo, la regin ms pequea, con un milln de habitantes, se representara nicamente en base a 27 entrevistas, lo que nos da un margen de error para esta regin de 19%, es decir que ante un porcentaje de un 50% nicamente podemos afirmar que en 95 de cada 100 casos, dentro de la poblacin de esta regin, este porcentaje puede oscilar entre 69% y 31%, en una proporcin consecuentemente que en nmeros redondos va de 1 a 2; huelga decir por otra parte que difcilmente podramos lograr una buena representatividad a partir nicamente de 27 entrevistas, ya que sera enormemente difcil poder respetar los principios de aleatoriedad y probabilidad dentro de esta regin. El proceso de construccin del tamao muestral consecuentemente es el contrario. Fijmonos el margen de error que estamos dispuestos a asumir en la regin ms pequea y admitamos por ejemplo que pueda ser de 10%, en cuyo caso en esta regin deberamos de realizar 100 entrevistas y si hiciramos un muestreo estrictamente proporcional representaramos la totalidad de este pas con 1.500 entrevistas; el error muestral para el conjunto consecuentemente sera fruto de esta construccin muestral, no sera un error inicialmente buscado; en este caso concreto para 1.500 entrevistas sera de 2.6%, pero de hecho nos da igual que sea este valor, como que sea un 4 un 5%; ello nos puede llevar en algunos casos en que la desproporcin entre reas es manifiesta a hacer muestras no proporcionales como anteriormente hemos indicado; una muestra razonable podra ser por ejemplo: Habitantes Regin 1 Regin 2 Regin 3 Regin 4 Total 1.000.000 2.000.000 4.000.000 8.000.000 15.000.000 Muestra 100 200 300 400 1.000 Error muestral % 10.0 7.1 5.8 5.0 ?
para el conjunto de las 1.000 entrevistas el error terico sera de 3.2%, aunque sta es slo una aproximacin puesto que el error muestral del conjunto viene algo afectado por la desproporcin; concretamente el margen de error para muestras no proporcionales nos viene dado por la siguiente frmula:
383
e=2
p q n2
np2 na
siendo np la muestra proporcional que correspondera al estrato y na la muestra aproporcional. En el caso que nos ocupa el error muestral final de estas 1.000 entrevistas no sera de 3.2% sino de 4.9%, es decir que los datos totales podran oscilarnos, en el caso del 50% entre 45 y 55, pero en vez de hacer 1.500 entrevistas hemos hecho 1.000, lo que supone un ahorro de coste importante. Como se suele decir, finalmente el tamao muestral no depende tanto del error y de la estadstica como del presupuesto disponible, sin embargo hay que coger este aserto con toda precaucin y saber hacer los nmeros, teniendo presente que en ocasiones es preferible no disponer de informacin que disponer de alguna que nos pueda llevar a tomar decisiones errneas. Este aspecto de la estratificacin y el error que estamos dispuestos a asumir para el estrato ms pequeo es como hemos comentado el bsico en la construccin del tamao muestras y de su reparto, y ello es vlido tanto para estudios de tipo cuantitativo como de tipo cualitativo. Observemos que para los estudios cualitativos el nmero de reuniones o entrevistas en profundidad a hacer, va a depender del nmero de distintos estratos del universo, entendiendo aqu los estratos desde un punto de vista cualitativo como algo ms reducido o ms segmentado, puesto que al margen de diferencias objetivas en grupos de consumidores, hay que pensar tambin en la productividad de los grupos, y esta productividad se da fundamentalmente, salvo en algunas tcnicas especficas de contraste, cuando los grupos son homogneos, quiere ello decir que en general dentro de un grupo no podremos mezclar personas de distinto sexo, de edades muy diferenciadas, de niveles sociales muy diversos y es posible que en ocasiones en ciertos pases haya otros aspectos que tambin impidan una buena comunicacin, ya sea en funcin de raza o religin, por ejemplo. El tamao muestral cualitativo para cada estrato se aconseja que sea de un mnimo de dos reuniones de grupo y de cinco entrevistas en
384
profundidad; en ocasiones ser preciso utilizar ambos tipos de tcnicas, en otros nos bastar con una de ellas. Si el nmero de estratos es muy amplio, en ocasiones ser posible reducir este nmero de grupos hasta 1 por estrato.
6.
LOS OTROS ERRORES
Podemos medir y apreciar con bastante finura los errores estrictamente estadsticos, los errores esperados; sin embargo hay otras fuentes de error o de sesgo en las encuestas que difcilmente pueden medirse en forma de tantos por ciento, por lo que la nica solucin es intentar minimizarlos al mximo. Estos errores provienen de dos tipos de fuentes distintas, por una parte de quienes no contestan a la encuesta siendo requeridos para ello y por otra parte de aquellos que han contestado. Quienes no contestan a la encuesta puede ser bien por un motivo expreso, es decir se les ha podido abordar pero se niegan a contestar, o por un motivo tcito: la persona que tericamente tenamos que entrevistar, por ejemplo en un proceso de rutas aleatorias, no ha podido ser contactada por no hallarse en el hogar o porque no hay acceso permitido a esta vivienda, ignorando cmo habran contestado estas personas si hubiramos podido convencerlas o si en vez de hacer el intento de entrevista una vez, lo hubiramos repetido en ms ocasiones. Al respecto existen algunos estudios y ciertamente los no contestan o las personas sustituidas tienen en general una opinin distinta a aquellas que han contestado y ello viene dado tanto por su posicin socioeconmica, como por su talante social, como por un distinto tamao o estructura familiar, etc., pero difcilmente se puede decir y menos prever a priori cul es exactamente el sesgo producido. En funcin del riesgo en la decisin a tomar, en ocasiones habr que exigir un segundo intento de entrevista o lograr un contacto va telefnica previo por ejemplo a un contacto personal, con el fin de asegurarse la mayor cobertura posible de gente entrevistada; tambin podr exigirse que las sustituciones de una persona que no se encuentra, o de una vivienda a la que no se puede acceder, o en la que no hay nadie, se hagan por un sistema de cuotas, es decir tomando aquellos datos mnimos del hogar que quiz un vecino nos puede contestar, o que podemos observar, y buscar una vivienda o una persona de aquellas mismas caractersticas. La otra gran posible fuente de errores proviene de aquellas personas que han contestado, bien sea porque han contestado con inexactitud, bien sea por la forma en que les hemos preguntado. Las inexactitudes
385
por parte de las personas entrevistadas, si las preguntas han sido correctamente formuladas, en general vienen a compensarse por la ley de los grandes nmeros; estamos hablando de omisiones o equivocaciones totalmente involuntarias y que tanto podan producirse en un sentido como en otro; sin embargo en ocasiones sto no es as y el sesgo, cuando se produce, se produce siempre en el mismo sentido, por ejemplo de aquel tipo de respuesta que haga quedar mejor al entrevistado; en estos casos conviene tener recursos a lo largo de la entrevista para poder verificar algunas de las respuestas. Pero generalmente el problema no viene tanto de la respuesta en s misma como de sta en relacin a la pregunta que se ha efectuado; es de capital importancia disponer de cuestionarios que sean absolutamente neutros, que permitan al mximo la facilidad de expresin y de opinin por parte de los entrevistados, y que sean formuladas de una manera estrictamente profesional por parte de los entrevistadores. Hay algunos temas que son ms difciles de abordar que otros y que consecuentemente producen sesgos en las respuestas, hay que ser consciente de ello y si acaso tomar las respuestas partiendo de unas mismas preguntas en un sentido no absoluto sino relativo, viendo como han ido evolucionando a lo largo del tiempo an sabiendo a ciencia cierta que la respuesta obtenida no refleja exactamente el pensamiento o forma de actuar de la poblacin. Tras la recogida de informacin sobre el terreno caben an algunos errores en el procesamiento de los datos puesto que algunas de las respuestas son abiertas y hay que codificarlas; puede haber aqu un error en la interpretacin o incluso un error propiamente en la codificacin poner un cdigo en vez de otro inadvertidamente y ello puede seguir en la grabacin de esta informacin en un soporte informtico que puede asimismo dar lugar a unas desviaciones indeseadas. Todo y con ello, como decamos, lo ms que se puede hacer es poner un exquisito cuidado en todos estos aspectos, no descuidarnos en ningn momento puesto que el margen de error estadstico podra ser ridculamente mnimo en relacin a los errores verdaderamente cometidos. Digamos por ltimo que el error real no siempre se corresponde con el error tericamente estimado; en lneas generales si se han cuidado todos los detalles es posible que el error real sea menor que el error terico, y ello viene influenciado sobre todo por el grado de homogeneidad que exista dentro de la poblacin en cuanto a los temas que se han investigado. Hay formas de conocer cul es este error a posteriori, frmulas que son senci386
llas en el caso de que hayamos obtenido unos promedios a partir de unas puntuaciones, por ejemplo a grados de acuerdo o desacuerdo sobre algunas frases que hayamos podido sugerir, puesto que podemos calcular fcilmente la desviacin tpica. Respecto a los porcentajes hay una forma sencilla de ver hasta qu punto oscilan dentro de la muestra, que es repartir las respuestas entre los cuestionarios pares y los impares, entendiendo que tanto pares como impares son dos submuestras representativas de la muestra realizada; si se quiere llegar a mayor detalle y la muestra es suficientemente amplia, pueden dividirse estos resultados entre los 10 nmeros terminales de los cuestionarios dando lugar consecuentemente a 10 submuestras.
7.
BIBLIOGRAFA
ORTEGA MARTNEZ, M.: Manual de investigacin comercial, Ediciones Pirmide, Madrid 1990. AZORN, F.: Curso de muestreo y aplicaciones, Aguilar, Madrid. COCHRAN, W.: Tcnicas de muestreo, Cecsa, Mxico. DAVIS, S. A.: Anlisis elemental de encuestas, Trillas, Mxico. DENING, W. E.: Sample Desing in Business Research, John Wiley and Sons, Nueva York. DESAIE, J.: Thorie et pratique des sondages, Dunod, Pars. KISH, L.: Muestreo de encuestas, Trillas, Mxico. SNCHEZ, J. L.: Muestreo de poblaciones finitas aplicado al diseo de encuestas, INE, Madrid. STEPHAN, F. F. y McCATHY, P. J.: Sampling Opinions: An Analysis of Survey Procedure, John Wiley and Sons, Nueva York.
387
8.
FORMULARIOS
La mayor parte de las realizaciones prcticas que se realizan en investigacin de mercados en cuanto al tema estadstico estn recogidos en formularios y en prontuarios que facilitan extraordinariamente las labores de clculo, asimismo las calculadoras de bolsillo o de sobremesa facilitan los clculos especialmente de los errores muestrales; por ejemplo para el caso de p=q=50% y un nivel de confianza de 2, para averiguar el error muestral de un tamao de muestra determinado basta con teclear el tamao, por ejemplo 400, sacar la raz cuadrada y el inverso: el resultado es 0.05, el error muestral sera exactamente este resultado multiplicado por 100, es decir 5.0%. En este captulo de formularios vamos a dar tambin una tabla de nmeros aleatorios, que son las que se utilizan para los procesos de seleccin muestral, por ejemplo sortear dentro de la poblacin de un estrato determinado exactamente el nmero de habitantes al que tocara hacer una entrevista lo cual salvo que dispongamos de un censo nominal de habitantes nos va a indicar el pueblo en el que vive; a partir de ah podemos aplicar una seleccin ya sistemtica e ir obteniendo el resto de puntos muestrales. Adjuntamos tambin una tabla de distribucin normal tipificada, otra de clculo de tamao muestral para un nivel de confianza de 2 y para distintas probabilidades de p y de q; basta con leer en el margen izquierdo cul es el lmite de error que uno est dispuesto a tolerar y cruzarlo con la columna de los valores p/q, obteniendo el tamao muestral necesario para que el error sea el deseado; imaginemos que estamos dispuestos a admitir un error de 5.0 y la probabilidad de respuesta que esperamos es del 30%, en este caso el tamao muestral necesario sera de 336 entrevistas. En otra tabla indicamos el tamao de la muestra en poblaciones finitas, tambin para un nivel de confianza igual a 2 y para p=q=50%; para averiguar el tamao de la muestra entramos por la columna de la izquierda que nos indica el tamao de la poblacin, supongamos 5.000, y cruzamos hasta hallar la columna del error muestral que estemos dispuestos a tolerar, supongamos un 5%, en este caso la muestra sera de 370 entrevistas; obsrvese que si el tamao de la poblacin fuera de 100.000, para un error de 5%, el tamao de la muestra necesario sera 398, en tanto que en poblaciones infinitas es de 400; incluso para una muestra de 50.000 la diferencia es de 3 entrevistas, seran necesarias 397.
388
Otro cuadro nos dar los mrgenes de error para poblaciones infinitas, para un nivel de confianza igual a 2 y para distintas probabilidades de p y q; en la columna de la izquierda podemos entrar por ejemplo con una muestra de 600 entrevistas y observar que para una probabilidad del 10% el error muestras sera de 2.5. Adjuntamos tambin una tabla de distribucin x2 de Pearson, lo que nos permitir reconocer si existen o no diferencias significativas entre dos distribuciones provenientes de muestras distintas. Y por ltimo adjuntamos unos formularios de entre los ms usuales que se utilizan en investigacin de mercados.
389
FORMULARIO BSICO 1) a) Clculo del error muestral Muestras proporcionales
E=2
p q n

N1
Nn
E p q N n
= error estadstico = probabilidad entre 1 y 100 = complementario de p = tamao del universo = tamao de la muestra
y entonces E = 2
p q para N 100.000 puede n
Nn eliminarse (universo infinito) N1
Para un nivel de confianza de 2 (95,5%)
El error muestral para universos infinitos se reduce a la mitad cada vez que se cuadruplica la muestra
E 20 10 5 2,5 1,25 0,62 (para p=q=50) n 25 100 400 1.600 6.400 25.600
390
b)
Muestras no proporcionales
E=2
p q n2
np2 na
np: muestra proporcional del estrato na: muestra aproporcional del estrato n: muestra total
2.
Clculo del tamao muestral 4pqN n = (universo finito) E2 (N1) + 4p q 4pq n = (universo infinito) E2
3.
Clculo del nmero de puntos muestrales
Puntos Muestrales = 30 +
N 150 1.000
4. a)
Clculo de diferencias significativas Entre dos porcentajes de una misma muestra
Si p1 > p2 numricamente, y p1 E1 > p2 + E2 significativo realmente
391
b)
Entre dos porcentajes de muestras independientes
Si p1 > p2 numricamente, y
p1 p 2 > 2
p1 q1
+ significativo realmente
p2 q2
c)
Entre dos distribuciones
Aplicar test de X2 grados de libertad = n. de resultados 1 Resultados A B C valor X2 Total F1 F2 F1 F 2 (F1 F2)2 (F1 F2)2 F1
Frecuencia absoluta de la muestra patrn
id. de la muestra a comparar
392
Si el valor X2 es mayor que el de la tabla la diferencia puede ser significativa dejando al azar nicamente el porcentaje de probabilidades indicado en la columna de la izquierda.
grados libertad
10
5% valor mx. X2
3,84 5,99 7,81 9,49 11,07 12,6 14,1 15,5 16,9
18,3
95% valor mx. X2
0,04 0,10 0,35 0,71 1,14 1,63 2,17 2,73 3,32
3,94
d)
Entre dos medias de muestras independientes
Si m 1 > m2 numricamente, y
m1 m2 > 2 m = media
G1 n1
+ significativo realmente
n2
G2
G = desviacin tpica =
(X1 X) n
e)
Entre dos medias de muestras dependientes
Si m 1 > m2 numricamente, y G1 G2 m1 > m2 + significativo realmente n n

393

Muest Reo

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Muest Reo

Cargado por

Copyright:

Formatos disponibles

TCNICAS DE ENCUESTA POR MUESTREO

Copyright ESOMAR, 1995

COMO GARANTIZAR UNA BUENA REPRESENTACIN

EL TAMAO DE LA MUESTRA Y EL MARGEN DE ERROR

LA ESTRATIFICACIN. EL ERROR RAZONABLE

LOS OTROS ERRORES

FORMULARIO BSICO 1) a) Clculo del error muestral Muestras proporcionales

p q para N 100.000 puede n

Nn eliminarse (universo infinito) N1

Para un nivel de confianza de 2 (95,5%)

Clculo del nmero de puntos muestrales

Clculo de diferencias significativas Entre dos porcentajes de una misma muestra

Si p1 > p2 numricamente, y p1 E1 > p2 + E2 significativo realmente

Entre dos porcentajes de muestras independientes

Entre dos distribuciones

Frecuencia absoluta de la muestra patrn

id. de la muestra a comparar

3,84 5,99 7,81 9,49 11,07 12,6 14,1 15,5 16,9

95% valor mx. X2

0,04 0,10 0,35 0,71 1,14 1,63 2,17 2,73 3,32

Entre dos medias de muestras independientes

Entre dos medias de muestras dependientes

Si m 1 > m2 numricamente, y G1 G2 m1 > m2 + significativo realmente n n

También podría gustarte