investigacin de mercados L.F.V.A. Error en los estudios Los resultados de un estudio de mercado no son precisos, el error est presente siempre.
Error muestral La muestra es usada para inferir valores de la poblacin. Caractersticas: Es mesurable Normalmente, el error disminuye con el aumento del tamao muestral
Errores en los estudios Errores no muestrales Sesgan resultados en direccin y magnitud desconocida No son mesurables
Errores en terreno Error de no respuesta (rechazo total o parcial) Error de respuesta Mala definicin del problema, del universo y del marco muestral Errores de medicin Mal diseo del cuestionario, preguntas sesgadas Sesgo del encuestado (productos de demanda y aceptabilidad social) Sesgo del encuestador
Errores de proceso Errores en procesamientos (traspasos, editing, codificaciones, digitaciones, tabulaciones, etc.) Errores de anlisis y/o de interpretacin El error puede ser destacado como componente de la investigacin de mercado, el ms importante de todos es el error total, pero tambin hay errores de una parte o en una etapa en particular. Esto se formula de la siguiente manera: Error total = error muestral + errores no muestrales Por ejemplo, un aumento en el tamao de la muestra con el fin de reducir el error muestral puede conducir a un incremento del error total de la investigacin, debido a que otros errores no muestrales pueden incrementarse ms que proporcionalmente con el tamao muestral. Asimismo, el error de una etapa puede incrementarse para reducir el error total, debido a que ello puede implicar una disminucin ms que proporcional del error en otra etapa. Error en los estudios Censo o Muestra Censo: Informacin es obtenida de todos los elementos de la poblacin (por tanto, no debera existir error muestral, solamente error de terreno o de procesamiento de informacin. En todo caso, hay diferencias entre el llamado censo de hecho con el censo de derecho). Muestra: Informacin es obtenida slo de un subgrupo de elementos de la poblacin. Caractersticas generales de censos y muestras: CENSO MUESTRA Costo Alto, solo es factible si la poblacin es pequea Bajo o menor (puede aumentar debido a filtros y nivel de incidencia) Tiempo Mayor, difcil de obtener informacin Rpido, dato a tiempo. Error Principalmente errores no muestrales, (de respuesta, procesamiento, tabulacin, etc.) Error muestral y error no muestral (incluye problemas en la seleccin del marco muestral) Puede ser ms precisa que el censo Proceso de muestreo Procedimientos probabilsticos Aleatorio simple y sistemtico Estratificado (proporcionado o desproporcionado) Por conglomerados Por conjuntos Por racimos Por reas (estado geogrfico, simple /o mltiple) Definir el Universo (parte acotada de la poblacin pasible de estudio) (N) 1. Elementos de muestreo 2. Unidades de muestreo 3. Alcance 4. Tiempo Identificacin del marco muestral Determinacin del tamao de la muestra (n) Seleccin de un procedimiento muestral (tablas de nmeros aleatorios y/o N n Seleccin de la muestra Procedimientos no probabilsticos Por conveniencia Por juicio o comparacin Por cuotas y/o cupos ) a b c e d Muestreo Definir el Universo de inters u objetivo. Conjunto de todos los elementos sujetos o entidades de las cuales se requerir informacin definido antes de la seleccin de la muestra. Se puede definir en base a: Elementos y unidades de muestreo (Elemento: el encuestado; Unidad de muestreo: personas hogares) Alcance (Lmites geogrficos) Tiempo (Lapso en consideracin)
Definir el marco muestral (lista de todas las unidades de muestreo disponibles para su seleccin (lista de los miembros de la poblacin) y de donde se PUEDE extraer la muestra). ejemplo: Poblacin de Inters: ciudadanos de Santiago. marco muestral: pginas blancas de la gua de telfonos)
Error en el marco muestral se refiere a las discrepancias existentes entre la poblacin de inters y el marco muestral, debido a las limitaciones de ste. Muestreo puede ser probabilstico y no probabilstico
Muestreo no probabilstico
Principales caractersticas del muestreo no probabilstico: Cada elemento del Universo no tiene la misma probabilidad o una conocida, de ser seleccionado desde el marco de la muestra La precisin estadstica o margen de error muestral no puede ser calculado, por tanto. La seleccin de un elemento de la poblacin se basa hasta cierto punto en el criterio y/o la experiencia del investigador. Sin embargo, no existe garanta alguna de que los resultados obtenidos con este tipo de muestreo sean menos exactos que aquellos obtenidos con una muestra probabilstica (muestreo de cuotas y/o cupos, por ejemplo). La muestra no probabilstica tiene diferentes grados de representatividad. El muestreo por conveniencia resulta menos confiable que el muestreo de cuotas y /o cupos. Muestreo No probabilstico
Muestra de conveniencia: los elementos de la muestra se seleccionan pues son convenientes/ fciles de acceder por parte del investigador o bien se auto seleccionan: Intercepcin en centros comerciales u otros sitios destacados. Muestras de estudiantes, familiares o amigos La persona elige participar voluntariamente. Tipos de muestra por conveniencia: Accidental o a la mano Callejero (periodista) Voluntarios (siclogos) Grupos escogidos Pasajeros/viajeros Bola de nieve Locacin central Muestreo no probabilstico
Muestra de Juicio o comparacin: Los elementos de la muestra son seleccionados en base al juicio de un experto quien estima la contribucin que pueden tener dichos elementos para el estudio (su conocimiento del tema estudiado o representatividad) Una muestra de consumidores clave o representativos para un focus group Una muestra de analistas de la industria para determinar futuras tendencias Ejemplo: Canasta de productos del IPC.
Estos juicios y/o comparaciones son emitidos bien por jueces conocedores, que detentan la experticia de una profesin, bien por un privado entrenado al menos temporalmente para el efecto (jurado), o un conocedor de cierto nivel (declarante) Muestreo no probabilstico
Muestra por cupos/cuotas o prorrateo: Los elementos de la muestra son seleccionados en base a cuotas prefijadas por el investigador. Su eleccin no es hecha a travs de un mtodo aleatorio. Se usan para buscar que la muestra sea similar a la poblacin en algunas caractersticas (quiebres) de control. Para seleccionar apropiadamente una muestra por cuotas, se debe: Especificar una lista de caractersticas de control relevantes, por ejemplo sexo, edad, GSE etc. (equivalentes estas caractersticas a los parmetros que representan al universo en el muestreo probabilstico). Ejemplo: Si en la poblacin hay 60% de mujeres y 40% de hombres. Una muestra de 300 personas => 180 mujeres (Cuota) y 140 hombres (Cuota) Conocer la distribucin de estas caractersticas en la poblacin de inters Las cuotas pueden seleccionarse por filtros directos o indirectos, que aseguren la idoneidad de las levas En acuerdo a algunos tericos, las cuotas o prorrateos se determinan por los cruces de las caractersticas requeridas, y se denomina cupo a la cantidad de muestra por cada cuota (se prefieren nmeros impares para llenar cada cuota) Muestreo probabilstico
Procedimientos probabilsticos Seleccin aleatoria de los elementos de la muestra de modo que cada miembro del Universo tenga una probabilidad distinta de cero, de ser incluido en la muestra. Previo al muestreo, es posible identificar todas las muestras de un determinado tamao posibles de ser seleccionadas, y la posibilidad de seleccin de c/u.
Muestreo aleatorio simple: Todas las muestras posibles de un tamao n tienen la misma probabilidad de ser seleccionadas. Todos los sujetos del universo tienen la misma probabilidad de ser seleccionados (n/N, en que n = tamao de la muestra y N = tamao del Universo) Procedimiento: Asignar un nmero de 1 a N a todos los elementos del marco muestral y seleccionar aleatoriamente n nmeros para conformar la muestra. El tamao de n se calcula, hay frmulas que establecen la relacin de n (tamao de la muestra) con N (tamao del universo de donde se extrae n) y con mrgenes de error aceptable y la incidencia de algunas variables. Muestreo probabilstico
Muestra estratificada: (Se necesitan conocer todos los elementos de la poblacin, y algunas caractersticas principales) Implica dividir a los elementos de la poblacin en subpoblaciones en base a una variable clasificatoria para luego seleccionar independientemente elementos (normalmente una muestra aleatoria simple) de cada una de esas subpoblaciones (o estratos) Utilidad: mejoramiento en la precisin por la disminucin del error estndar de los estimadores (Media muestral por ejemplo)
Muestra estratificada proporcionada: cada subpoblacin de inters est representado en la misma proporcin al tamao de dicho subgrupo en la poblacin. Representatividad Estimadores ms (o no menos) precisos
Muestra estratificada desproporcionada: Algunas subpoblaciones estn sobre o subrepresentados en la muestra en relacin a su participacin en la poblacin.
Generalmente, se busca un tamao de muestra por estrato ptimo que considera: La importancia relativa del subgrupo en la poblacin La variabilidad (S) de la variable analizada entre los elementos de dicho estrato (a mayor S mayor el tamao del estrato en la muestra) Desde el criterio del muestreo por estratos tambin el muestro probabilstico reconoce otras acepciones
Muestra por Conglomerados (no necesito conocer a todos los estratos) Primero se divide la muestra en grupos mutuamente excluyentes y colectivamente exhaustivos (cada elemento del Universo debe asignarse a un y slo a un estrato, sin que se omita ningn elemento de la poblacin) Pero a diferencia del mtodo por estratos, se busca formar grupos heterogneos Despus se selecciona una muestra aleatoria de dichos grupos Potencialmente es un procedimiento de mayor eficiencia global (S / $) Sistemtico Los elementos en el marco muestral son seleccionados de acuerdo a su posicin en la lista Ejemplo: Marco muestral es de 1000 y la muestra deseada es de 100, entonces: Se divide el marco muestral por el tamao = 1000/100= 10, y se divide el marco muestral en grupos de a 10. Despus se selecciona aleatoriamente un nmero del 1 al 10 (por ej. 3) y se seleccionan todos los elementos en la posicin 3 de los grupos antes formados (el 3, el 13, el 23, etc.) Muestreo por reas Representa una solucin al problema de no contar con una lista completa y exacta de los elementos de la poblacin Puede tener mltiples etapas. conjuntos racimos rea, estado geogrfico Tamao de la muestra, Universo inferior a 100.000 n= N 1 + ( N E ) N= Universo n= Muestra E= error mximo
5% error N 1+(N x 0,025)
4% error N 1+(N x 0,016)
3% error N 1+(N x 0,009)
Tamao de la Muestra. Universo superior a 100.00
n= Z N 2 2
E N + ( Z ) 2 2 2 n= tamao de la muestra N= Universo Z = calculo de nivel de confianza 1.96
E= error mximo permitido en la media (o,o6) 2 = Desviacin estndar (p q) Supongamos que tenemos una muestra de n observaciones procedentes de una distribucin con media . Sean X y Sx la media muestral observada y la desviacin tpica, respectivamente. Entonces, si n es grande (>30), una buena aproximacin de un intervalo de confianza del 100(1 - )% para viene dado por:
Si n>30 esta aproximacin seguir siendo adecuada incluso cuando la distribucin de la poblacin no es normal (Teorema central del lmite).
Intervalos de confianza para la media poblacional La primera desviacin ( +- ) + - 34,1% del promedio ( X ) establece un margen de confianza del 68,2% y por tanto, un nivel de error del 31,8%.
La segunda desviacin ( +-2) agrega a + - 34,1% del promedio ( X ) ms un +- 13,6% que establece un margen de confianza del 95,4%% y por tanto, establece un nivel de error del 4,6% (que es el mximo aceptable para una investigacin de mercado +-5%)
La tercera desviacin ( +-3) agrega a + - 34,1% del promedio ( X ) y al +- 13,6%, un +- 2,1%, lo que establece un margen de confianza del 99,6% y por tanto llega a un nivel de error del 0,4%
X - - - - Intervalos de confianza para la media poblacional
Si se toman muestras de tamao n en forma repetida e independiente y se calculan intervalos de confianza del X%, entonces despus de un gran nmero de extracciones, un X% de estos intervalos incluirn la verdadera media poblacional.
La amplitud del IC est determinado por el nivel de confianza, el tamao muestral y la desviacin tpica: Dado un nivel de confianza (1 - ) y un tamao muestral, cuanto mayor sea la desviacin tpica, mayor longitud tendr el intervalo de confianza para la media poblacional. Dado un nivel de significancia y una desviacin tpica, cuanto mayor sea el tamao de la muestra n, menor longitud tendr el intervalo de confianza. Dada una desviacin tpica y un tamao muestral, cuanto mayor sea el nivel de confianza (1 - ), mayor ser la longitud del intervalo de confianza. Cuando se hace una muestra probabilstica uno debe preguntarse, Dado que una poblacin N Cul es el menor nmero de unidades que necesito para conformar una muestra (n) que me asegure un error estndar menor a x? Se busca encontrar la probabilidad de la ocurrencia de y Para determinar el tamao de la muestra (inferencia acerca de la media) Determinar un nivel de precisin deseado, nivel de incertidumbre respecto de la caracterstica medida (E= diferencia entre la estimacin y el valor real de la poblacin que se desconoce) Determinar un nivel de confianza Determinar el valor de z o t asociado a dicho nivel de confianza Estimar el valor de la desviacin estndar (varianza) de la poblacin Estudios previos, datos secundarios, experiencia. Rango dividido por 6 Determinar el tamao de la muestra usando esta frmula:
Clculo del tamao de la muestra Sea la proporcin de xitos (preferencias) en una muestra aleatoria de n observaciones. Entonces: (i) La distribucin muestral de tiene media p, es decir, E( ) = p (ii) La distribucin muestral de tiene desviacin tpica
Esta cantidad recibe el nombre de error estndar de
Note que la varianza mxima de ocurre cuando p = 0.5, con lo cual se evita el problema de estimar la desviacin tpica (Supuesto de varianza mxima) Distribucin del muestreo de una proporcin muestral
Tamaos de muestra requeridos dado el margen de error deseado y nivel de confianza (para proporciones)