Está en la página 1de 37

Muestreo Estadístico

Profesor
Juan Manuel Romero Padilla
juan.romero@cide.edu
Objetivo
Que el participante comprenda y aplique los conceptos del
diseño de muestreo estadístico para encuestas en la planeación
y análisis de datos en temas de investigación particulares.
Que establezca estimaciones válidas sobre parámetros de
interés y obtenga conclusiones bien fundamentadas,
considerando la estructura del diseño de muestreo en el
proceso

Conocimientos previos
Se requiere al menos un curso de estadística
Estar familiarizado con notación sumatoria y algunos aspectos
de matemáticas
Introducción
 Dependemos de los datos para tomar decisiones inteligentes
 Profesionales que generan y analizan datos de manera seria deben
conocer como funcionan las encuestas, como se diseñan buenas
encuestas y como analizar correctamente los datos de las encuestas.
 La información obtenida de las encuestas por muestreo afecta a casi
todos los aspectos de nuestra vida cotidiana
 Políticas de gobierno respecto, por ejemplo, a la promoción de
programas sociales
 Las encuestas de opinión son la base de muchas de las noticias que
divulgan los diversos medios informativos
 El numero de personas que ven los programas de televisión
determina que programas estarán disponibles en el futuro
 Varias empresas usan el muestreo como principal herramienta para
generar información, AC Nielsen, Gallup, Ibope, WPP,
KantarWorldPanel, etc.
Conveniencia del muestro
Puesto que la inferencia supone un riesgo, es útil resumir en qué casos
conviene obtener muestras, en lugar de censos o investigaciones
exhaustivas de todos los elementos de la población

 Resulta mas económica la muestra que una enumeración completa.


 El tiempo para obtener los resultados a través de una muestra es
sustancialmente mas pequeño que para obtenerlo por la vía del censo.
 Cuando el proceso de medida o examen de las características de cada
elemento sea destructivo o disminuya su valor, por ejemplo, si se desea
determinar la vida útil promedio de focos.
 Cuando la población sea considerada como infinita o tan grande que el
tratamiento total exceda las posibilidades del investigador.
 Cuando los elementos de la población sean suficientemente
homogéneos. Un buen ejemplo de esto lo constituye un análisis de
sangre, ya que los componentes de la sangre son los mismos en cualquier
parte del cuerpo donde se encuentre ubicada.
Elementos de muestreo
 El objetivo de las encuestas por muestro
consiste en realizar inferencias acerca de
una población a partir de la información
contenida en una muestra
• Estimar una media de la población (como los
ingresos medios por vivienda)
• Estimar una proporción (como la proporción
de votantes favorables a determinado tema)
Tipos de muestra estadística
Definiciones importantes
Población: Colección de elementos acerca de los
cuales se desea realizar inferencias.
Unidades de muestreo: Colecciones no traslapadas
de elementos que cubren la población completa.
Marco muestral: Lista de unidades de muestreo.
Muestra: Una colección de unidades seleccionadas
de uno o de varios marcos muestrales.
Error de Muestreo: El error que se comete debido
al hecho de que se obtienen conclusiones sobre
cierta realidad a partir de la observación de sólo una
parte de ella.
Definiciones importantes
Variables: Rasgos o magnitudes que varían de unos
individuos a otros. Se refiere a las características particulares
que podría presentarse en uno o varios elementos de los que
componen la población estudiada
Características Poblacionales (parámetros): Las más
habituales como la media poblacional, el total poblacional y
la proporción poblacional, entre otras características de la
población se podrían citar la varianza, la mediana, la moda,
entre otros
Estadísticos: Son funciones de los valores muestrales.
Algunos de ellos se utilizan para estimar los parámetros (en
general desconocidos), partiendo de los datos recabados en
una investigación por muestreo
Planificación de una encuesta
Los principales aspectos a considerar a la hora de planificar una
encuesta son:

1) Objetivos: Es importante tener claros los objetivos de la


investigación a la hora de confeccionar el cuestionario, para
cumplirlos todos y para no realizar preguntas innecesarias.
2) Población Objetivo: Es importante definir la Población de forma
que sea posible extraer la muestra a partir de ella, que se cuente con un
marco muestral.
3) Marco Muestral: Se construye un marco muestral que sea lo más
parecido posible a la población.
4) Diseño del Muestreo: Se decide el tipo de muestreo óptimo y se
obtiene el tamaño de muestra requerido.
5) Métodos de Medición: Se escoge el tipo de encuesta o entrevista a
realizar, de acuerdo al tipo de individuos y a los objetivos.
Planificación de una encuesta
6) Instrumentos de Medición: Se construye con mucho cuidado el instrumento
(encuesta, entrevista).
7) Selección y adiestramiento de investigadores de campo: Se debe instruir a
los encuestadores sobre qué información recopilar y cómo hacerlo.
8) Prueba Piloto: La utilización de una muestra piloto permite revisar el proceso
de muestreo diseñado, las habilidades de los encuestadores, las preguntas del
instrumento, etc. Todo esto permite modificaciones antes de aplicar la encuesta
final. Por otra parte, esta Prueba Piloto también permite estimar la variabilidad
existente, con el fin de definir más claramente el tamaño muestral.
9) Organización del Trabajo de Campo: Se debe confeccionar un protocolo que
incluya todos los pasos que se deben dar para recolectar, almacenar, controlar,
codificar, procesar y analizar la información.
10) Análisis de Datos: Se debe listar, en el protocolo, el detalle de todos los
análisis estadísticos a realizar, y los aspectos que serán incluidos en el reporte
final. Esto se debe planificar antes de recolectar la información, ya que el tipo de
datos recolectados, las técnicas estadísticas a utilizar y los objetivos de la
investigación están íntimamente vinculados.
Diseño de un Cuestionario
El diseño cuidadoso del instrumento (cuestionario) permitirá disminuir las
potenciales fuentes de error de medición. Algunos factores a considerar son:

1) Orden de las Preguntas: Si las preguntas están relacionadas entre sí, y están
presentadas en un orden específico, éste puede incidir en las respuestas de los
individuos, ya que a medida que se responde puede ir generando en ellos un
estado anímico (inducido por las preguntas) que produzca percepciones distintas
a las que se hubieran manifestado al enfrentarse a ellas en forma individual.
Finalmente, ciertas preguntas tienen un orden lógico, debido a la información
que proveen, y existen preguntas de filtro que permiten indicar a un individuo
que no se requiere que responda a algún grupo de ellas.

2) Preguntas cerradas y abiertas: En general las preguntas abiertas se usan en


estudios exploratorios, cuando aún no se han detectado las posibles respuestas
que darán los encuestados. Las ventajas de las preguntas cerradas se relacionan
con un menor tiempo de codificación de la información, y con una lectura más
objetiva de las respuestas.
Diseño de un Cuestionario
3) Redacción ambigua:
 Es importante que las preguntas sean claras para todos los
encuestados. Por ejemplo: “años de educación” puede llevar a
algunos encuestados a responder sobre los años de estudios superiores
y a otros sobre la escolaridad completa.
 Si la encuesta será respondida por personas de cierto grupo, el
lenguaje debe ser el adecuado a ellos (niños, personas sin educación,
etc).
 Las preguntas deben redactarse de forma que no induzcan a una
respuesta particular.
 La forma en que se plantea la pregunta debe hacer sentir al
encuestado que toda respuesta es admisible. Por ejemplo, “¿con qué
frecuencia se emborracha usted? a) más de dos veces a la semana b)
máximo dos veces a la semana c) muy rara vez e) nunca”, hace sentir
que emborracharse es normal, no así “¿se emborracha usted
frecuentemente? a) si b) no.
Fuentes de Error en Encuestas y
Posibles Soluciones:
Como se mencionó antes, existe el error de muestreo, que se debe
únicamente a que no es posible medir la población completa, y el
error de medición, que se refiere a errores provenientes no de la
selección de individuos sino de la medición misma. Respecto de estos
últimos podemos mencionar algunos subtipos:

1) Omisión: Muchas veces las personas que no responden a una


encuesta corresponden a un grupo con características diferentes,
las cuales motivan que no respondan.

Soluciones:
Los incentivos son una forma de evitar omisiones, sin embargo, estos
deben ser ofrecidos a la muestra seleccionada al azar, ya que una
muestra basada en aquellas personas que, al saber que habían
incentivos, decidieron responder, sería sesgada.
Fuentes de Error en Encuestas y
Posibles Soluciones:
2) Respuestas inexactas: En este caso nos referimos tanto a las
respuestas inexactas que son entregadas con la intención de
mentir u ocultar la verdad, como a aquellas que se responden en
forma equivocada porque la pregunta no es clara para quien la
responde.

Soluciones:
Un adecuado adiestramiento de los encuestadores permitirá
obtener respuestas difíciles o sobre temas incómodos.
Por otra parte, la revisión pronta de la planilla de datos permitirá
verificación de información extraña (valores imposibles por
ejemplo), y recuperación de datos mientras los encuestados aún
están disponibles.
Fuentes de Error en Encuestas y
Posibles Soluciones

3) Sesgo de selección: Es una práctica común y


muy inconveniente, reemplazar en forma más o
menos arbitraria a los individuos muestreados
ausentes por sus vecinos.

Soluciones:
Las reentrevistas programadas en diferentes
horarios y días de la semana son una forma de
minimizar las omisiones en una encuesta que se
realiza en terreno.
Métodos de recolección de datos

1) Entrevista Personal: Se tiende a tener menos omisión


cuando el individuo es confrontado en forma personal.
El lenguaje no verbal es considerado, se puede explicar las
preguntas evitando omisiones.
Se puede provocar sesgo por las actitudes o gestos del
entrevistador, si el entrevistador no es experimentado puede
cohibir al encuestado o perder información.

2) Entrevista Telefónica: Las entrevistas telefónicas resultan


más económicas que las personales, sin embargo deben ser más
cortas, ya que el encuestado tiende a impacientarse. Por otra
parte, generalmente utilizar la guía telefónica como marco
muestral produce sesgo, ya que no todas las casas tienen teléfono
Métodos de recolección de datos
3) Cuestionarios Autoaplicados: Las encuestas en que no se
cuenta con un entrevistador, sino que el individuos las responde por
sí mismo, son más económicas. En ocasiones se hacen en un lugar
específico al cual concurren los encuestados; pero la mayoría de las
veces se hacen llegar por correo, postal o electrónico, este tipo de
encuestas tiene muy bajo porcentaje de respuesta. En cualquiera de
los casos, la encuesta debe redactarse de forma muy cuidadosa, para
evitar errores u omisiones.

4) Observación Directa: Un muestreo en el cual no se realiza


mediciones a las personas puede ser obtenido de primera fuente
(número de vehículos que pasan por cierta intersección, por
ejemplo). En general este tipo de muestreo es demoroso pero
económico.
Diseño de muestreo
El objetivo del muestreo es la estimación de
parámetros de la población.
La estimación se basa en la información muestral.
La precisión de esta estimación es determinada
por el investigador como el error máximo de
estimación B.
E = |θ – | ≤ B.
La probabilidad 1 – α de que la estimación tenga
un error que no supere a esta cota se denomina
nivel de confianza.
P( E ≤ B) = P(|θ – | ≤ B) = 1 – α.
Diseño de muestreo
Normalmente se seleccionara un valor de B de dos
desviaciones estándar del estimador y por tanto (1 – α )
será aproximadamente de 0.95, para las distribuciones en
forma de campana
B = 2·σ()
Note que la cantidad 2·σ, corresponde al error de
muestreo, lo cual es muy diferente del error de medición
Intervalos de Confianza:
Una forma general de escribir un Intervalo de Confianza
de probabilidad o nivel 1 – α para θ, es la siguiente:
[– 2·σ(); + 2·σ() ]
Parámetros de interés
 En general, los parámetros de interés o a estimar
en estos casos, son
 1) Si la variable de interés X es continua:
• Media μ (promedio de la variable en la población),
por ejemplo, ingreso familiar mensual promedio.
• Total τ (suma de los valores X de los individuos en la
población), número total de infracciones en 2007 a
conductores taxi en el DF.
• 2) Si la variable X es dicotómica:
• Proporción p (proporción o porcentaje de individuos
en la población con la característica de interés), por
ejemplo, proporción de taxis pirata en el Df.
Parámetros de interés
 Media, varianza y desviación estándar de
un conjunto de datos
Muestreo Aleatorio Simple
 Este diseño es adecuado cuando la población es homogénea
respecto de la característica de interés, o bien no se puede a priori
obtener información sobre eventuales grupos en ella.
 Si el diseño del proceso de muestreo asegura que cada posible
muestra tiene la misma probabilidad de resultar elegida, se habla
de Muestreo Aleatorio Simple.
 Para asegurar la condición de muestras equiprobables, se deben
escoger todos los individuos en la muestra en forma aleatoria
desde la población sin reemplazo
 La selección se hace mediante un sorteo en el cual se seleccionan
n individuos de los N existentes en la población. En primer lugar
los N individuos de la población son numerados y posteriormente
se eligen n individuos utilizando una tómbola, una tabla de
números aleatorios, números aleatorios de la calculadora o del
computador, o cualquier otro método que preserve el azar.
Muestreo Aleatorio Simple (MAS)
 Cuantas posibles muestras existen

 N!=N(N-1)(N-2)…(2)(1)
 se se lee Combinatoria de N sobre n y se
interpreta como “de cuántas formas se pueden
seleccionar n elementos de un grupo de N
elementos”

La probabilidad de que una muestra de tamaño n


sea obtenida es
Estimador de la media poblacional
 Estimador de la media

 Varianza estimada

 Error de estimación
Estimador de la media poblacional
 Intervalo de confianza (aprox. 95%)

 Tamaño de muestra para estimar la media


poblacional con un error de estimación B
Ejemplo
Ejemplo

La cantidad promedio de deuda es $40.89 y el error de


estimación es menor a $3.94
Ejemplo

Solución
Estimador del total poblacional
 Estimador de la población total

 Varianza estimada

 Error de estimación
Estimador del total poblacional
 Intervalo de confianza (aprox. 95%)

 Tamaño de muestra para estimar el total


poblacional con un error de estimación B
Ejemplo

Solución
Estimador de una proporción poblacional
 Estimador de una proporción

 Donde si el elemento i-esimo elemento de la muestra tiene la


característica deseada, si no la tiene

 Varianza estimada

Donde

 Error de estimación
Estimador de una proporción poblacional
 Intervalo de confianza de aprox. 95%

 Tamaño de muestra para estimar una


proporción poblacional con un error de
estimación B

 Si no se tiene información previa de p, usar p=0.5


Estimador de una proporción poblacional
 Ejemplo
 Se tomo una muestra aleatoria simple de n=100 de estudiantes
próximos a graduarse de un total de 300, para conocer el porcentaje
de estudiantes que estudiarían un postgrado (y) y el porcentaje de
estudiantes que tenían un empleo de medio tiempo (x)
Estimador de una proporción poblacional
 Solución

Estimamos que el 15% estudiara un postgrado con un error de estimación de 5.9%,


también que el 65% tiene un empleo de medio tiempo con un error de estimación
de 7.8%
Estimador de una proporción poblacional
Ejemplo
Se desea realizara una encuesta en una universidad para determinar la proporción de estudiantes a
favor de una propuesta de código de honor. La universidad tiene 2000 estudiantes. Cual es el
tam;o de muestra para estimar o con un error de estimación de 0.05 (5%).
Solución
Aproximamos el tam;o de muestra cuando no se tiene información para la proporción usando
p=0.5

Es necesario entrevistar 334 estudiantes para estimar la proporción de estudiantes a favor de


la propuesta con un error de estimación de B=0.05
Estimador de una proporción poblacional
Ejemplo (continuación)
Si adicionalmente se desea conocer si los estudiantes sienten que el comité estudiantil esta realizando un
buen trabajo. Determine el tamaño de muestra combinado para estimar las dos proporciones con errores
de estimación B1=0.05 y B2=0.07. Considere que en un estudio previo aprox. 60% de los estudiantes
creían que el comité estudiantil estaba realizando un buen trabajo

Solucion
Ahora estimamos el tamaño de muestra necesario para estimar el sentir sobre el trabajo del comite

Asi, Es necesario entrevistar 179 estudiantes para estimar la proporción de estudiantes que sienten
que el comité esta realizando un buen trabajo con un error de estimación de B=0.07. El tamaño de
muestra necesario para alcanzar ambos objetivos es 334, la mayor de las dos muestras

También podría gustarte