Está en la página 1de 38

Materia solemne: sesin 8-12

Sesin 8: Investigacin Causal

Causalidad: El estudio del impacto de una variable sobre otra.


Para inferir causalidad se deben cumplir tres condiciones:
1. variacin concomitante: X e Y deben variar conjuntamente (correlacin o asociacin entre X e Y).
2. orden de tiempo de ocurrencia: X debe preceder a Y (al menos en un nanosegundo).
3. eliminacin de otros posibles factores causales: explicaciones alternativas deben ser descartadas.
Los Experimentos proporcionan la ms convincente evidencia para verificar las tres condiciones.

Experimento: Procedimiento mediante el cual se manipula una o ms variables independientes (precio, anuncio, espacio en
la gndola) y se recoge datos sobre las variables dependientes (actitud hacia la marca, intencin de compra, ventas de la
tienda) mientras se controlan otras variables que pueden influir en la variable dependiente.

Variables Externas
Historia: eventos externos
Maduracin: cambios en las caractersticas de las unidades de prueba
Instrumentacin: cambios en el instrumento de medicin
Sesgo de seleccin: grupos difieren en caractersticas
Mortalidad: unidades de prueba abandonan
Regresin a la media: cuando las unidades de prueba con puntuaciones extremas regresan a la puntuacin promedio
durante el experimento
Efectos de la prueba: causados por el proceso de experimentacin
Efecto principal de la prueba: la medicin previa afecta la medicin posterior
Efecto interaccin de la prueba: la medicin previa afecta la respuesta a la variable independiente (e.g.,
anuncio)

Variables Externas: Control


Hay cuatro maneras de controlar las variables extraas:
Aleatoriedad: se refiere a la asignacin aleatoria de las unidades de prueba a los grupos experimentales y de control
mediante el uso de nmeros aleatorios.
Emparejamiento de las unidades de prueba: Las unidades de prueba se emparejan en base a las variables extraas
antes de asignarlas a los grupos experimentales y de control.
Control estadstico: implica la medicin de las variables extraas y ajustar sus efectos a travs de anlisis estadstico.
Control del diseo: implica el uso de experimentos diseados para manipular o eliminar las variables extraas
(experimentos en laboratorio).

Clasificacin de los diseos experimentales


Experimentos de laboratorio frente a experimentos de campo

Experimentos: Limitaciones
Tiempo
Los experimentos consumen tiempo, en particular si el investigador est interesado en medir los efectos a
largo plazo del tratamiento, como la eficacia de una campaa de publicidad.
Los experimentos deben durar lo suficiente como para que las mediciones posteriores al tratamiento
incluyan la mayora o la totalidad de los efectos de las variables independientes.
Costo
Los experimentos suelen ser costosos. Los requisitos de grupo experimental, grupo de control y mltiples
mediciones aumentan significativamente el costo de la investigacin.
Administracin
La administracin de los experimentos puede ser difcil.
Quiz resulte imposible controlar los efectos de las variables extraas, sobre todo en un ambiente de
campo.
Los experimentos de campo a menudo interfieren con las operaciones en curso de una empresa, por lo que
tal vez sea complicado obtener la cooperacin de detallistas, mayoristas y otros implicados.
Por ltimo, los competidores pueden contaminar deliberadamente los resultados de un experimento de
campo.
Sesin 9
Usos Investigacin Cuantitativa

1. Identificar caractersticas Demogrficas, Socioeconmicas o Psicogrficas.


2. Conocer Actitudes, Opiniones, Percepciones y Preferencias
3. Medir el nivel de Conocimiento y Recordacin de Marcas
4. Estimar la Intencin de Uso o Compra
5. Reconocer los motivos o razones de compra o uso.
6. Determinar el hbito de Compra, Uso y Recompra; y el nivel de Lealtad de Marca.

Muestreo

Muestreo y estadstica:
Nociones bsicas

1. Poblacin o Universo
Conjunto de todos los casos que concuerdan con determinadas especificaciones (Selltiz, 1980)
Cualquier grupo completo de entidades que comparten un conjunto de caractersticas comunes.
Deben contener parmetros muestrales o lmites: situarse claramente en torno a sus caractersticas de
contenido, lugar y tiempo

Poblacin vs muestra
La Poblacin es el conjunto de elementos sobre el cual estamos interesados en obtener conocimiento.
Generalmente es grande.
Casi-Imposible de abarcar en su totalidad (Censo).
Una muestra es un sub-conjunto de la poblacin sobre el que se llevan a cabo las observaciones.
Debe ser representativo (compartir caractersticas de la poblacin).
Ley de los grandes nmeros y el supuesto de normalidad (teorema central del lmite) permiten extrapolar
resultados de la muestra a la poblacin.
Homogeneidad/Heterogeneidad de la Poblacin, afecta la decisin de tamao y seleccin de
muestra.
Definiciones relevantes
Poblacin Objetivo: La recopilacin de elementos u objetos que poseen la informacin buscada por el investigador
y acerca de la cual se harn las deducciones. (ej.: mujeres 18+) (Elementos, Unidades, Alcance y Tiempo)
Elemento: Objetos que poseen la informacin buscada por el investigador y acerca de la cual se harn las
deducciones.
Unidad de muestreo: Unidad bsica que contiene los elementos de poblacin que sern muestreados. (ej.: hogares)
Marco de muestreo: Lista de elementos disponibles de la poblacin objetivo.
Consiste en una lista o conjunto de instrucciones donde es posible identificar a elementos de la poblacin
objetivo (ej.: lista de mujeres 18+)

Unidad de anlisis
Unidad de anlisis corresponde al nivel en el que una variable es medible
Satisfaccin del Consumidor
Rentabilidad
Industria
Firma
Unidad de negocios
Por empleado individual
Tpicamente los datos son mejor recolectados al menor nivel
Pueden ser luego agregados (resumidos) a niveles ms altos
Ejemplo: Autos vendidos en cada distribuidor individual puede ser agregado a Autos vendidos
en la regin / pais XYZ
2. Qu es una Muestra?
Una coleccin de partes de una poblacin mayor que se obtiene de algn modo.
Es un subgrupo de la poblacin del cual se recolectan los datos.
Subgrupo de elementos de la poblacion seleccionado para participar en el estudio

Confiabilidad y Validez

Modelo de Valor Verdadero


XO = XT + eS + eR
XO = el valor observado
XT = el valor verdadero
eS = componente de error sistemtico
eR = componente de error aleatoreo

Validez se refiere a si estamos midiendo lo que queremos medir (eS=0)


Confiabilidad es el grado por el cual lo que se mide est libre de error aletreo (eR=0)

Errores en la medicin
Validez: Una medicin es vlida si est libre tanto de error sistemtico como error aleatorio.
Confiabilidad: Una medicin es confiable si est libre de error aleatorio. Tiene que ver con la consistencia, precisin
y capacidad predictiva de los resultados de la investigacin.
Errores y Tamao de la Muestra
Error Muestral: Se genera al usar una muestra y no la poblacin en un estudio. Es medible.
Error No Muestral: Se genera por procedimientos incorrectos en la toma y procesamiento de los datos. (No
respuesta, respuesta, interpretacin, respuesta inducida, codificacin). No es medible.

Error Total = Error Muestral + Error No Muestral

A medida que aumenta el tamao de la muestra, tiende a crecer el error no muestral y decrece el error
muestral.
OJO: Error Muestral (de muestra total) distinto en segmentos de anlisis.

Errores de Medicin
Errores en la investigacin de mercado
Errores Muestrales
Muestra es usada para inferir valores de la poblacin
Caractersticas:
Es medible
Disminuye con el aumento del tamao muestral
Errores No Muestrales: Sesgan resultados en direccin y magnitud desconocida
Error de No Respuesta
Error de Respuesta
Mala definicin del problema, poblacin y marco muestral
Error de medicin
Mal diseo del cuestionario
Artefactos de demanda y aceptabilidad social
Error de Codificacin y Procesamiento

Error Muestral: Frmulas

Error Muestral: Frmulas con c.p.f

Tamaos Muestrales: Frmulas sin c.p.f.

Errores e intervalos de Confianza


El clculo del error muestral permite estimar Intervalos de Confianza.
Valor = 52% con error del 6% permite aseverar que la observacin real se encuentra en un intervalo, es decir, entre
46% y 58%
Empate Tcnico: Se habla de empate tcnico cuando los intervalos de confianza de dos alternativas de una variable
se interceptan.
A = 52%; B = 48% con margen de error del 3%
Intervalos de Confianza para la media poblacional
Supongamos que tenemos una muestra de n observaciones procedentes de una distribucin con media .
Sean X la media muestral observada y Sx la desviacin tpica. Entonces, si n es grande (>30), una buena aproximacin
de un intervalo de confianza del 100 (1 - ) % para viene dado por

Si n > 30 esta aproximacin seguir siendo adecuada incluso cuando la distribucin de la poblacin no es normal
(Teorema central del lmite).

La distribucin normal

Distribucin en el Muestreo de una Proporcin Muestral


Sea px la proporcin de xitos (preferencias) en una muestra aleatoria de n observaciones.
Entonces:
(i) La distribucin muestral de px tiene media p
(ii) La distribucin muestral de px tiene desviacin tpica

Note que la varianza mxima ocurre cuando p = 0.5, con lo cual se evita el problema de estimar la desviacin tpica
(Supuesto de varianza mxima)
Tamaos de muestra requeridos dado el margen de error deseado y el nivel de confianza (para proporciones)
Medicin y Escalas
Medicin: El proceso de asignar nmeros (numerales y otros smbolos) a propiedades empricas, conceptos o
variables (caractersticas de objetos) de acuerdo a Reglas.

Tres Elementos:
Variables, Conceptos o Propiedades (caractersticas) que se desean medir.
Uso de nmeros o numerales para representar dichos eventos.
Un conjunto de reglas para asignar dichos nmeros o numerales a las variables, conceptos o propiedades
(reglas de correspondencia).

La medicin utilizada refleja el tipo de concepto o constructo que representa.


Algunas mediciones realizan distinciones superficiales o crudas respecto de las entidades medidas. Otras operan a
un nivel ms elevado o ms refinado.
Una primera distincin la podemos realizar entre variables continuas y variables discretas.
Las variables discretas pueden ser medidas en el nivel Nominal u Ordinal.
Las variables continuas pueden ser medidas en como Intervalos o Razones.

Escalas de medicin
Nominal
Etiqueta la presencia / ausencia de alguna caracterstica (color del auto: azul = 1, rojo = 2, etctera)
Ordinal
Rankea orden de objetos, consumidores, etctera (no-usuarios = 0, light user = 1 y heavy user = 2)
Intervalo
Precisa las diferencias entre puntos de una escala (temperatura en Celsius/Fahrenheit)
Ratio / Razn
Precisa las diferencias entre puntos de una escala, pero con un origen natural o punto cero no-arbitrario
(ventas en USD)

Nominal: nombres (identificacin y clasificacin).


Gnero, Marca, Tipo de Tienda, Comuna, Profesin.
Porcentaje, Moda, Chi Cuadrado.
Ordinal: orden (jerarquizacin, posicin relativa).
GSE, Tipo Escolaridad, Orden de Preferencia, Intervalos de Ingresos.
Percentil, Mediana, Correlacin Jerrquica.
Intervalo: cuantificacin (cero arbitrario).
Temperatura, Percepciones, Notas.
Rango, Media (Desviacin Estndar), Correlacin (ANOVA, otros).
Ratio / Razn: cuantificacin (cero absoluto).
Longitud, Peso, Ingresos, Edad, Participacin de Mercado.
Anteriores + (Media Geomtrica, Coeficiente de Variacin).
Ejemplos de escalas
Sesin 10
Relacin entre tamao muestral y error

Tamao muestral
Corresponde al nmero mnimo necesario realizar estimaciones, asumiendo restricciones de carcter subjetivo y
objetivo.
Las restricciones subjetivas las impone el investigador.
En particular, el error mximo admisible y el nivel de confianza asociado a la estimacin.
Factores objetivos a considerar son
recursos econmicos,
heterogeneidad de la poblacin
procedimientos de anlisis a utilizar
(tamao de la poblacin).

Error mximo admisible y nivel de confianza


En principio resulta lgico elegir el mnimo error asociado a la estimacin. Por que no se hace siempre de este
modo? Porque el error esta asociado al tamao de la muestra.
Puede parecer sorprendente que muestras relativamente pequeas pueden ser increblemente precisas.
La fortaleza de las muestras proviene en parte de la manera en que es seleccionada (mtodo de muestreo)

Tamao Muestral: Recursos Econmicos


El presupuesto puede condicionar el mtodo de muestreo y el diseo muestral a utilizar.
La existencia de presupuesto limitado puede restringir fuertemente el alcance de una muestra mayor.
Debe considerarse el factor presupuestario a la hora de determinar cunta muestra es necesaria para el estudio.
Muestras ms grandes pueden mejorar la precisin de la investigacin, pero pueden ser mucho ms caras de
recolectar.
Usualmente desde cierto punto la ganancia de precisin es marginal.
Eficiencia de la inversin en Investigacin?

Tamao Muestral: Heterogeneidad de la Poblacin


El tamao de la muestra es especialmente sensible a la heterogeneidad de la poblacin.
En poblaciones heterogneas se requiere de mayor nmero de casos para estimar el parmetro poblacional que en
poblaciones con valores homogneos.
Un indicador de heterogeneidad es la varianza, por lo que poblaciones con varianzas grandes requieren muestras
mayores que poblaciones con varianzas pequeas, para inferencias de igual precisin.

Tamao Muestral: Procedimientos de anlisis a utilizar


Distintas tcnicas tienen exigencias diferentes
Anlisis Univariados: No tienen grandes exigencias en cantidad de casos.
Anlisis Bivariados: al menos 30 casos.
Anlisis Mutivariados: exigencias especficas para cada tcnica
Tambin es posible que las muestras sean a veces muy grandes, haciendo que toda posible pequea o marginal
diferencia se vuelva estadsticamente significativa.

Tamao Muestral: Tamao de la Poblacin


Contra lo que dice el sentido comn, el tamao de la muestra no se ve sustantivamente influenciado por el tamao
de la poblacin de origen.
En poblaciones superiores a 100.000 casos la influencia del tamao de la muestra es nfima en el clculo
del tamao de la muestra.
En poblaciones de tamao medio la influencia es moderada.
En poblaciones inferiores a 5.000 casos, el tamao de la muestra si se ve influenciado por el tamao de la
poblacin.

Maneras para determinar el tamao de la muestra


Conjetura - Al ojo (Blind Guess)
Presupuesto disponible
Reglas Empricas
Grupo principal n > 100
Subgrupos 20 < n < 100
Tamao estndar para estudios comparables
Enfoque Estadstico
Enfoque estadstico para determinar el tamao final de la muestra

Errores y Tamao de la Muestra


Paso 1: Especificar el nivel de precisin deseado.
El nivel de precisin deseado (e o D) es la diferencia mxima permitida entre la media (proporcin) muestral y la media
(proporcin) poblacional.
Media: = ( 10 dlares en la disposicin a pagar por un TV Sony de 40 pulgadas)
Proporcin: = ( 5% en el % de hogares que prefieren comprar el TV Sony de 40 pulgadas)

Paso 2: Especificar el nivel de confianza deseado


El nivel de confianza es la probabilidad de que un intervalo de confianza incluir la media o proporcin de la poblacin.
Media: +
Proporcin: +
Los niveles de confianza ms usados son 95%, 99% y 90.

Paso 3: Obtener el valor de Z asociado al nivel de confianza.


Z sigue una distribucin normal estandarizada (media = 0 y desviacin estndar = 1).

Nivel de confianza = 1-
Al interior de la tabla se debe buscar el . Los extremos de la tabla dirn el Z asociado a ese .
Por ejemplo, si el nivel de confianza es 95%, el es 5%. En este caso, el Z es 1,96.
Los valores Z asociados a los niveles de confianza de 90%, 95% y 99% son 1,645, 1,960 y 2,575, respectivamente.
Paso 4: Determinar la desviacin estndar de la poblacin ()
Esta puede ser conocida por
datos secundarios
estimada sobre la base del juicio del investigador.
Para el caso de las medias, el investigador puede obtener la desviacin estndar de la poblacin
dividiendo el rango (valor mximo - valor mnimo) por 6, debido a que el rango de una variable
distribuida normalmente es aproximadamente igual a 6 desviaciones estndar.
Para el caso de las proporciones, el investigador puede suponer varianza mxima, la cual ocurre
cuando = 50%.

Paso 5: Determinar el tamao de la muestra usando la frmula para el error estndar.

El tamao final de la muestra se incrementa si el investigador


requiere mayor nivel de precisin (i.e., menor D e),
requiere mayor nivel de confianza (i.e., mayor Z) o
se enfrenta a una gran varianza o heterogeneidad de la poblacin (i.e., mayor 2).

Paso 6: Verificar si el tamao de la muestra calculado es igual o mayor al 10% del tamao de la poblacin.
Si el tamao de la muestra calculado es igual o mayor al 10% del tamao de la poblacin (n 10%*N), se debe aplicar
la correccin de poblacin finita.
De lo contrario, se va a sobreestimar el error estndar si la poblacin es finita.
El tamao final de la muestra corregido se obtiene mediante la siguiente frmula:

Ejemplo 1: Suponga un investigador que estudia el gasto en comsticos (lpiz labial). El est trabajando con un 95% de
confianza, y un rango de error de menos de $2.00. La desviacin estndar estimada es $29.00

Ejemplo 2: Suponga en el mismo ejemplo anterior, que el rango de error es ahora aceptable por un valor de $4.00. Cuanto se
reduce el tamao muestral?

Algunos problemas prcticos


1. Las empresas de Investigacin de Mercados a veces presionan a sus clientes a aceptar muestras ms grandes.
Servicio (ganancia/utilidad del proyecto) tiende a depender de la cantidad de casos investigados.
2. Ciertos mtodos de muestreo (estratificado) generan grupos para realizar comparaciones. Estas comparaciones
deben tener una base de casos importante.
Si 150 casos son necesarios para determinar algn efecto en un grupo, hay que multiplicar estas
observaciones en caso que sea requerido realizar comparaciones.
3. Siempre los anlisis se realizan con Tamaos Muestrales Netos.
Debido a la no-respuesta es necesario un tamao inicial superior para controlar las prdidas de casos.
4. Antes de recolectar los datos, se debera tener una idea de
Tasa de Incidencia
Tasa de Cumplimiento
5. Ambas tasas influyen en determinar el tamao inicial de la muestra que permite lograr el tamao final deseado
Determinacin del tamao inicial de la muestra
La tasa de incidencia es el porcentaje de personas elegibles (tiles para la investigacin) sobre personas contactadas.
La tasa de cumplimiento es el porcentaje de personas elegibles que completan la entrevista.

Tamao final
Tamao inicial =
Tasa de incidencia Tasa de cumplimiento

Ejemplo 3:
Si se desean lograr 100 encuestas tiles, y
Si se espera alcanzar un 80% de respondientes identificables.
Si es probable que el 25% de ellos colabore en un estudio
Si es posible que slo el 75% de los que colaboran puedan completar un cuestionario correctamente.
Entonces solo el 15% (0,80 x 0,25 x 0,75) de los respondientes identificables es probable que entregue una respuesta
utilizable.
As se requerira realizar 100/0,15 = 667 encuestas

Reducir el error de no respuesta


1. Notificar previamente al potencial participante
2. Entregar incentivos monetarios y/o no monetarios
3. Personalizacin
4. Efectuar una adecuada administracin y elaboracin del cuestionario
5. Volver a contactar a quienes no han respondido (hasta 3 o 4 veces)

Corregir el error de no respuesta


Submuestra de quienes no responden
Es importante, dado que pueden tener caractersticas muy distintas de quienes si participan.
Reemplazo y/o Sustitucin
Por otros no-encuestados anteriores, o por otros elementos
Estimaciones Subjetivas
Pueden existir problemas de validez.
Anlisis de tendencia
Se examina la tendencia en las respuestas de quienes participan en el primer, segundo, tercer y cuarto
contacto.
Ponderacin
Se asignan pesos diferentes para los grupos respondientes
Imputacin
Usando las correlaciones obtenidas en la muestra de quienes responden (e.g., edad y satisfaccin), se
asignan las respuestas que deberan tener quienes no responden (e.g., por la edad de ellos).
Estimar los parmetros poblacionales solo con los respondientes puede inducir a error
= +
y corresponden a la tasa de respuesta y no respuesta.
La nica manera en que la estimacin es confiable, es haciendo que la tasa de no respuesta sea muy pequea.
Esto, en el entendido que el perfil de los que no responden es diferente al de los que s responden.
Sesin 11
Tipos de Muestra

Probabilsticas (Aleatorias)
Difciles de Conseguir.
Permiten asumir condicin probabilstica.
Permiten calcular error muestral.
Potencialmente deben permitir que cualquier individuo de la poblacin sea elegido en la muestra de
estudio.
No Probabilsticas (No aleatorias)
Ms fciles de conseguir.
Mayora de las muestras de estudios convencionales.
No permiten calcular error.
No todos los individuos de la poblacin pueden ser elegidos en la muestra de estudio.

Clasificacin Tcnicas de Muestreo


Muestreo No Probabilstico
Cada elemento del marco muestral no tiene una probabilidad distinta de cero de ser seleccionado. (Hay algunos que
podran no ser seleccionados)
La seleccin de un elemento de la poblacin se basa hasta cierto punto en el criterio del investigador.
La precisin estadstica o margen de error muestral no puede ser calculada. (Imposible conocer Error Muestral)
Sin embargo, no existe garanta alguna de que los resultados obtenidos bajo este tipo de muestreo sean menos
exactos que aquellos obtenidos con una muestra probabilstica.

No Probabilstico: existe elementos sin posibilidad de ser elegidos, solo criterio del investigador, no se puede estimar error
muestral.
Por Conveniencia:
Elementos se seleccionan por facilidad de acceso.
Autoseleccin, Amigos, Intercepcin en mall.
Por Juicio:
Elementos se seleccionan por juicio de experto.
Consumidores clave, Entrevistas a expertos, canasta IPC.
Por Cuotas:
Elementos se seleccionan por cuotas fijadas por el investigador.
Cuotas deben ser acorde a caractersticas de la poblacin.
Bola de Nieve:
Importancia prctica, en muestras de difcil acceso. Demanda tiempo

Muestra de conveniencia
Los elementos de la muestra se seleccionan pues son convenientes/fciles de acceder por parte del investigador o
bien se autoseleccionan:
Intercepcin en centros comerciales,
muestras de estudiantes, familiares o amigos
La persona elige participar (ej. Llamar o entregar opinin)
Encuestas de sugerencias o reclamos
Entrevistas de gente en la calle

Ejemplo: El grupo D se reuni en un momento y lugar convenientes, por lo que se seleccion a todos sus elementos.
La muestra resultante consta de los elementos 16, 17, 18, 19 y 20. Advierta que no se seleccion ningn elemento de
los grupos A, B, C y E
Muestra de juicio
Los elementos de la muestra son seleccionados en base al juicio de un
experto, quien estima la contribucin que pueden tener dichos elementos
para el estudio (su conocimiento del tema estudiado o representatividad)
una muestra de consumidores clave o representativos
una muestra de analistas de la industria para determinar futuras
tendencias
mercados de prueba seleccionados para determinar el potencial
de un nuevo producto
Ingenieros de compra seleccionados en la investigacin de
marketing industrial considerados representativos

Ejemplo: El investigador considera que los grupos B, C y E son tpicos y convenientes, por lo que se seleccionan uno o
dos elementos de cada uno de estos grupos, segn su tipicidad y conveniencia. La muestra resultante est
conformada por los elementos 8, 10, 11, 13 y 24. Advierta que no se seleccion ningn elemento de los grupos A y D

Muestra por cuotas o prorrateo: los elementos de la muestra son seleccionados en base a cuotas prefijadas por el
investigador. Su eleccin no es hecha a travs de un mtodo aleatorio. Se usan para buscar que la muestra sea similar a la
poblacin en algunas caractersticas de control.
Especificar una lista de caractersticas de control relevantes, (sexo, edad, GSE, etc)
Conocer la distribucin de estas caractersticas en la poblacin de inters
Problemas del muestreo por cuotas:
Deben seleccionarse las caractersticas de control apropiadas
Al permitir que el entrevistador seleccione al encuestado se introduce un sesgo
La proporcin de encuestados asignada a cada celda debe ser exacta y actualizada

Ejemplo: Se impone una cuota de un elemento de cada grupo, del A al E. Dentro de cada grupo, se selecciona (no
aleatoriamente) un elemento con base en un juicio o conveniencia. La muestra resultante est formada por los
elementos 3, 6, 13, 20 y 22. Advierta que se seleccion un elemento de cada columna o grupo

Muestra de Bola de Nieve:


Su objetivo es identificar casos de inters a travs de personas (elementos)
que participan previamente en la investigacin y que stos conocen.
As, permite ubicar a elementos de la muestra, de difcil acceso o imposible
de recolectar a no ser que sea por recomendacin.
Ejemplos: Indigentes, Gerentes y Directivos o cualquier poblacin
de difcil acceso para el investigador.
Gran importancia prctica, especialmente en muestras difciles.
Los primero elementos de la muestra permiten ubicar a los prximos
elementos de la muestra.
Sin embargo, demanda gran cantidad de tiempo.
Ejemplo: Se seleccionan al azar los elementos 2 y 9 de los grupos A y B. El elemento 2 refiere a los elementos 12 y 13. El
elemento 9 refiere al elemento 18. La muestra resultante est formada por los elementos 2, 9, 12, 13 y 18. Advierta que
no se seleccion ningn elemento del grupo E

Fortalezas y debilidades

Muestreo Probabistico
Seleccin aleatoria de los elementos de la muestra de modo que cada miembro del marco muestral tiene una
probabilidad distinta de cero de ser incluido en la muestra.
Previo al muestreo es posible identificar todas las muestras de un determinado tamao posible de ser seleccionadas,
y la posibilidad de seleccin de cada uno.

Probabilstico: seleccin aleatoria de individuos, todos los individuos tienen probabilidad de eleccin distinta de cero.
Aleatorio Simple:
Todos los elementos tienen la misma prob. de ser elegidos.
Se conoce a todos los individuos y se seleccionan de manera directa con un procedimiento al azar.
Sistemtico:
Los elementos son seleccionados de acuerdo a su posicin en la lista.
Se requiere tamao del marco muestral y tamao de la muestra.
Estratificado:
Antes de elegir subdivido la pob. en grupos y atribuyo cuotas.
Puede ser proporcionada o desproporcionada.
Por Conglomerados:
Divido la poblacin en grupos heterogneos y elijo individuos.
Puede ser Sistemtico o por reas (en etapas).
Fortalezas y debilidades

Muestra Aleatoria Simple:


Todas las muestras posibles de un tamao n tienen la misma
probabilidad de ser seleccionadas.
Todos los sujetos en el marco muestral tienen la misma probabilidad
de ser seleccionados (n/N, en que n = tamao de la muestra y N =
tamao del marco muestral)
Procedimiento: asignar un nmero de 1 a N a todos los elementos del
marco muestral y seleccionar aleatoriamente n nmeros para
conformar la muestra.

Ejemplo: Seleccione cinco nmeros aleatorios del 1 al 25. La muestra resultante consta de los elementos de la poblacin
3, 7, 9, 16 y 24. Note que no hay elementos del grupo C.

Muestreo Sistemtico
Los elementos en el marco muestral son seleccionados de acuerdo a su posicin en la lista
Ejemplo: Marco muestral es de 1000 y la muestra deseada es de 100, entonces:
Se divide el marco muestral por el tamao = 1000/100= 10, y se divide el marco muestral en grupos de a 10
Despus se selecciona aleatoriamente un nmero del 1 al 10 (por ej. 3) y se seleccionan todos los elementos en la
posicin 3 de los grupos antes formados (el 3, el 13, el 23, etc.)

i=N/n
i = 12 / 4
i=3
Ejemplo: Elija un nmero aleatorio entre 1 y i (5), digamos 2 (arranque aleatorio). Salto Sistemtico: i = 25 / 5 = 5
La muestra resultante consta de la poblacin en la segunda posicin. Note que todos los elementos terminan siendo
seleccionados desde una sola fila.

Muestra Estratificada: implica dividir a los elementos de la poblacin en


subpoblaciones en base a una variable clasificatoria para luego seleccionar
independientemente elementos (normalmente una muestra aleatoria simple)
de cada una de esas subpoblaciones (o estratos)
Muestra Estratificada Proporcionada: cada subpoblacin de inters
est representado en la misma proporcin al tamao de dicho
subgrupo en la poblacin.
Representatividad
Estimadores ms (o no menos) precisos
Es autoponderado
Muestra Estratificada Desproporcionada: algunas subpoblaciones
estn sobre o sub-representados en la muestra en relacin a su
participacin en la poblacin.
Generalmente se busca un tamao de muestra por estrato ptimo que considera:
La importancia relativo del subgrupo en la poblacin
la variabilidad (S) de la variable analizada entre los elementos de dicho estrato (a mayor S mayor el
tamao del estrato en la muestra)
Requiere el clculo de coeficientes de ponderacin

Ejemplo: Seleccione al azar un nmero del 1 al 5 de cada estrato, A a E. La muestra resultante consta de los elementos
de la poblacin 4, 7, 13, 19 y 21. Advierta que se tom un elemento de cada columna

Muestra por Conglomerados:


Primero se divide la muestra en grupos mutuamente excluyentes y
colectivamente exhaustivos. Pero a diferencia del mtodo por estratos, se
busca formar grupos heterogneos.
Despus se selecciona una muestra aleatoria de dichos grupos
Potencialmente es un procedimiento de mayor eficiencia global (S / $)
Muestreo por reas
Representa una solucin al problema de no contar con una lista
completa y exacta de los elementos de la poblacin
Puede tener mltiples etapas

Ejemplo: Seleccione al azar tres conglomerados, B, D y E. Dentro de cada conglomerado seleccionado, elija al azar uno o dos
elementos. La muestra resultante consta de los elementos de la poblacin 7, 18, 20, 21 y 23. Note que finalmente no se
seleccion ningn elemento de los conglomerados A y C
Otros temas relevantes
Cunto asignar a cada entrevistador?

A cada entrevistador no se le debe asignar una cuota grande de elementos.


Si este no opera aleatoriamente, generara un sesgo en la muestra.
Las cuotas se forman proporcionales a la distribucin de las variables en la muestra.

Ponderacin
Una muestra es autoponderada cuando todos los elementos tienen la misma probabilidad de pertenecer a la
muestra.
Siempre cuando esta condicin no se cumple, o cuando no hay certeza, se debe realizar un procedimiento de
Ponderacin.
Para ponderar se calcula el Peso Muestral de cada elemento de la muestra
O mejor dicho a cuantas unidades de la poblacin representa
Se requieren ponderadores para devolver a cada estrato su proporcionalidad real.

Si N = 2.000.000 y n = 1.000
N/n = 2.000.000 / 1.000 = 2.000
Por lo tanto, cada elemento de la muestra representa a 2.000 elementos de la poblacin

De esta manera, hay elementos que pueden estar subrepresentados o sobrerepresentados, respecto a su
distribucin relativa en la poblacin.
Ayudanta pre-solemne

1. Escalas bsicas de medicin

a. Nominal
Esquema de etiquetado (o rotulado) figurado, en el cual los nmeros slo sirven como etiquetas para
identificar o clasificar objetos.
Ejemplos: Gnero, marca, rut.
b. Ordinal
Una escala ordinal es una escala de clasificacin donde se asignan nmeros a objetos para indicar la
magnitud relativa en la cual stos poseen una caracterstica. La clave es el orden (jerarquizacin, posicin
relativa).
Ejemplos: GSE, escolaridad, orden de preferencia, intervalos de ingreso.
c. De Intervalo
Precisa las diferencias entre puntos de una escala. Aqu lo clave es que las variables son cuantificadas, pero
existe un cero arbitrario (la respuesta 0 o neutral no implica ausencia del atributo)
Ejemplos: Notas, Temperatura (el 0 no es igual en C que En Fahrenheit)
d. De razn/Ratio
Precisa las diferencias entre puntos de una escala, pero con un cero absoluto (la respuesta 0 o neutral
significa ausencia del atributo
Ejemplos: Ingresos, Participacin de Mercado, Edad, Estatura.

2. Tcnicas de Escalamiento
a. Escalas Comparativas
Son aquellas que hacen una comparacin directa entre objetos. Pueden ser:
- Comparacin pareada: presentacin de pares de objetos y se debe elegir uno de ellos en base a
algn criterio especfico.
- Orden de clasificacin: presentacin de varios objetos y se pide que los ordenen o clasifiquen, de
acuerdo a algn criterio o caracterstica.
- Suma Constante: asignar unas cantidades de unidades (moneda, puntos, etc.) entre un grupo de
objetos, de acuerdo a algn criterio o caracterstica.

b. Escalas No Comparativas
No hacen comparacin directa sino que evaluacin particular.
- Escala de Clasificacin continua: cundo las personas evalan objetos haciendo una marca en una
lnea continua, la cual tiene en sus polos extremos las caractersticas que se estn evaluando.
- Escala de clasificacin por tem: se presenta una escala que tiene una descripcin breve o un
nmero o smbolo en cada categora y se les pide que seleccionen la categora que mejor describe
al objeto. *Pueden ser: Likert, Diferencial Semntico o Stapel.
Escala de Likert: escala numrica de 5 o 7 puntos que indican el nivel de acuerdo o
desacuerdo con cierta afirmacin.
Escala de Diferencial Semntico: escala numrica de 7 puntos de -3 a +3, delimitada en
los extremos por adjetivos bipolares.
Escala de Stapel: escala numrica unipolar de 10 puntos, va desde -5 a +5, sin punto
neutral. Suele presentarse de manera vertical.
Decisiones clave a considerar en ls escalas de clasificacin por tem:
N de categoras de la escala
Esalas balanceadas vs no balanceadas
N par o impar de categoras
Escalas forzadas vs no forzadas
Naturaleza y grado de las descripciones de las categoras
Forma fsica y configuracin
Exactitud de la medicin

Evaluacin de una escala

Error de la medicin: variacin en la informacin buscada por el investigador y la nformacin generada por
el proceso de medicin empleado.

Modelo de clasificacin verdadera:

XO = XT + eS + eR
XO = el valor observado
XT = el valor verdadero
eS = componente de error sistemtico
eR = componente de error aleatoreo

- Error sistemtico: representa factores estables que afectan la clasificacin observada de la misma
manera cada vez que se hace la medicin.
- Error aleatorio: representa factores transitorios que afectan de diferentes maneras la clasificacin
observada cada vez que se haca la medicin.
- Confiabilidad: grado en que la escala produce resultados consistentes si se hacen mediciones
repetidas. Libre de error aleatorio.
Puede ser: confiabilidad test-retest, confiabilidad de formas alternativas, confiabilidad de
consistencia interna.
- Validez: grado en que las diferencias en las puntuaciones obtenidas refleja diferencias verdaderas
entre los objetos en la carecterstica medida, en lugar de error sistemtico o aleatorio. Estoy
midiendo lo que realmente quiero medir? Libre de ambos errores.
Puede ser: validez de contenido, validez de criterio, validez de constructo.
3. Diseo de cuestionario
Un buen cuestionario debe ayudar a extraer la mejor informacin posible de los respondientes.
Ahora, se deben considerar ciertos aspectos en el diseo de cuestionarios.

En cuanto al orden:

I. Informacin bsica (filtro bsico que vaya en lnea con el problema de investigacin).
II. Infomacin de clasificacin (caractersticas de las personas a responder).
III. Informacin de identificacin.

Importante: Superar la incapacidad a responder:

El encuestado es informado? Preguntas filtro aseguran que cumplen los requisitos de la muestra.
El encuestado puede recordar? Es comn que existan fenmenos como la abreviacin (El otro da vi a
cuando en realidad fue hace meses).
El encuestado puede expresarse? Alternativa: brindar fotografas, mapas y/o descripciones que los ayuden
a responder.

i. El cuestionario debe ir de lo general a lo particular o especfico.


ii. El cuestionario debe ser corto. Eliminar las preguntas innecesarias para el objetivo de la investigacin.
iii. Se debe utilizar palabras simples: no usar palabras confusas, no usar palabras con diferente significado o
interpretacin.
iv. No hacer preguntas tendenciosas o sesgadas. No se debe guiar a una respuesta determinada.
v. No hacer preguntas dobles. Por ejemplo: Usted cree que los cereales son sabrosos y demasiado
dulces?
vi. Preguntas sobre datos personales o sobre temas difciles o sensibles, deben ir al final del cuestionario.
vii. Evitar supuestos implcitos o estimaciones en las preguntas.

4. Muestreo
Muestreo: diseo y procedimientos
Algunas definiciones:
- Poblacin meta: conjunto de elementos u objetos que poseen la informacin buscada por el
investigador y acerca de la cual se harn inferencias.
- Muestra: subconjunto de la poblacin sobre el cual se llevan a cabo las observaciones. Debe ser
representativa.
- Elemento: objeto sobre el cual se desea informacin. En una investigacin por encuesta, el
elemento suele ser el entrevistado.
- Unidad de muestreo: unidad bsica que contiene los elementos de la poblacin sobre la que se
tomar la muestra.
- Extensin: lmites geogrficos y factor tiempo (perodo considerado).

Tcnicas:
a. Muestreo no probabilstico
Por conveniencia: seleccin de elementos se deja al entrevistador. Lugar y momento
adecuado
Por juicio: los elementos se seleccionan de forma deliberada (luego de haberlo pensado)
con base en el juicio del investigador.
Por cuotas: se desarrollan categoras de control (cuotas) de elementos de la poblacin.
Luego, se seleccionan los elementos de la muestra en base a conveniencia o juicio.
Ejemplo: si el criterio de control es sexo, adems en la poblacin el 52% son mujeres y el
48% hombres y se quiere entrevistar a 1000 personas, entonces se entrevistan a 520
mujeres y 480 hombres.
Por bola de nieve: se selecciona un grupo inicial y posteriormente se selecciona de
acuerdo a las referencias de los primeros.
b. Muestre probabilstico
Aleatorio simple: cada elemento tiene la misma probabilidad de seleccin.
Sistemtico: punto de inicio aleatorio, y luego se elige cada n elementos en sucesin
del marco de muestreo.
Estratificado: la poblacin se divide en subpoblaciones o estratos y luego se seleccionan
los elementos de cada estrato, generalmente con MAS (Muestreo Aleatorio Simple). En el
muestreo estratificado proporcionado, el tamao de la muestra que se toma de cada
estrato es relativo de ese estrato en la poblacin total. En el no proporcionado se ajusta
por la desviacin estndar.
Por conglomerados: se forman conglomerados (heterogneos entre s, homogneos con
los dems) y luego se selecciona una muestra aleatoria de conglomerados.

Muestreo: determinacin del tamao inicial y final de la muestra

Tips: Cundo usar media o proporcin?

- Media: se utiliza cuando hay un nmero al que se quiere llegar.


Ejemplo: la administracin de un restaurante quiere determinar el promedio mensual gastado por
los hogares de Santiago en restaurantes. Algunos hogares en el mercado objetivo no gastan nada
en absoluto, en tanto que otros hogares gastan hasta $150000 al mes. La administracin quiere
tener una confianza de 95% de los resultados y no quiere que el error exceda de ms o menos
$2500.
- Proporcin: se utiliza cuando hay %, proporcin o grado de satisfaccin
Ejemplo: se le pide a usted realizar una investigacin de mercado para determinar el porcentaje
de los clientes que estaran dispuestos a pagar por el servicio X. La empresa cuenta con 10000
clientes y posee la direccin de contacto de todos sus clientes. Qu tamao muestral utilizara
para obtener estimaciones con un margen de error muestral +/-3% y nivel de confianza de 99%?

Tips: Smbolos y Frmulas


i. Especificar el nivel de precisin deseado
Nivel de precisin deseado (D): mxima diferencia permitida entre la media (o
proporcin) muestral y la media (o proporcin) poblacional.

Media:

Proporcin:
ii. Especificar el nivel de confianza deseado
Nivel de confianza: probabilidad de que un intervalo de confianza incluya la media (o
proporcin) de la poblacin.

Media:

Proporcin:
iii. Obtener el valor Z asociado al nivel de confianza
Z sigue una distribucin normal estandarizada (Media=0 y desviacin estndar=1)

Cmo encontrar el valor Z?: Al interior de la tabla se debe buscar el alfa. Los extremos
de la tabla dirn el Z asociado a ese alfa.
Cul es el alfa asociado a los niveles de confianza de 92% y 96%?
Cul es el Z asociado a los alfa?
iv. Determinar la desviacin estndar de la poblacin (o)
Puede conocerse por:
a. Datos secundarios
b. Estimaciones en base al juicio del investigado

Media:

Proporcin:
v. Determinar el tamao de la muestra usando frmula para el error estndar
Con la desviacin estndar calculada en el paso 4 se puede determinar ahora el tamao
de la muestra

vi. Verificar si el tamao de la muestra calculado es igual o mayor al 10% del tamao de la poblacin
Si n=>10% de N, se debe aplicar la correccin de pobacin finita. De no corregirse,
se estara sobreestimando el error estndar.
Para corregir la poblacin finita se debe aplicar la siguiente frmula:
5. Ejercicios