Está en la página 1de 52

Introducción al Muestreo

Ignacio Méndez Gómez-Humarán


imendez@cimat.mx
3.1 Introducción

Las técnicas del muestreo se utilizan


frecuentemente cuando se quiere conocer las
características generales de una población
particular.
Ejemplos:

Aspectos demográficos y sociales:

• Cuáles son los ingresos medios de las personas que trabajan en


una ciudad o país.
• Prevalencia de alguna enfermedad en una ciudad o país.
• Niveles de escolaridad en los habitantes de una ciudad o país.
• Intención de voto para una elección presidencial.
Ciencias biológicas:

• Cantidad en toneladas de Thunnus albacares capturado en


barcos de cerco en el Océano Pacífico mexicano.
• Proporción arboles de encino con plaga en la Serra Madre
Occidental.
• Contenido de proteína en alimento para pollos.
• Producción de caña de azúcar a nivel nacional.
Industria:
• Control de calidad, muestreo de los lotes de producción para
determinar si se cumple con las especificaciones requeridas en el
producto o proceso.
• Muestreo para aceptación de lotes de materias primas adquiridas.
• Niveles de productividad por unidad de tiempo en una línea de
producción.
 Los estudios por muestreo son un tipo de investigaciones que
tienen como propósito conocer algo respecto a una determinada
población, de la cual se estudia sólo una parte de ésta.
 La Demoscopía, es la disciplina o grupo de ellas que pretende
conocer algún aspecto de una población o conjunto de seres
humanos. Ahí se originó la teoría del muestreo.
 Para esto se requiere un trabajo interdisciplinario entre:
demógrafos, economistas, sociólogos, administradores,
psicólogos, estadísticos, etcétera.
 Las formas de obtener información en la Demoscopía son a
través de censos, registros administrativos y encuestas por
muestreo.
En una encuesta por muestreo se debe hacer un trabajo conceptual
que determine entre otras cosas ¿qué se quiere conocer?

Ejemplos:
a) Niveles de desempleo.
b) Estado de salud de la población.
c) Calidad y demanda de servicios de educación.
d) La opinión sobre aspectos o programas políticos.
e) La capacidad de compra de un sector de la población, etcétera.
3.2. DEFINICIONES
3.2.1 Población Objetivo
Es el conjunto de individuos, objetos, mediciones, etc. acerca de las cuales
queremos conocer sus características a través de inferencias.

Es un concepto flexible que se determina en función de los intereses de la


investigación.

Tendrá ciertas características que dependen de factores constantes, y su


variabilidad dependerá de factores no constantes.
Ejemplos de Población Objetivo

Eso que se quiere conocer se refiere a conjunto con cierta


ubicación en tiempo y espacio. Como son:

 Viviendas particulares habitadas del municipio de


Aguascalientes.
 Empresas de la construcción en México.
 Niños de 6 a 11 años que viven en el Estado de México.
La población se define al especificar qué elementos son y qué
características deben tener éstos.

Ejemplos:

• Personas mayores de 18 años que residen (por más de 6


meses) en el Distrito Federal;
• Escuelas primarias que dependen del sector público y ubicadas
en el estado de Sonora;
• Empresas de la industria alimenticia registradas ante la
Secretaría de Comercio, que están al corriente en el pago de
impuestos y se ubican en el estado de México.
Si se denota una población por A, B, C, y D, las condiciones constantes y E, F, G, H,
etc. las no constantes (siempre infinitas), de tal manera que la población quede
definida por :

ABCD/EFGH... o simplemente ABCD.

Si disminuimos el número de condiciones constantes, se tiene una población más


general,

ABC/DEFGH...

En esta última se espera mayor variabilidad, ya que el factor D no es constante,


aumentando la variación de las mediciones.
3.2.2 Criterios de inclusión y exclusión

Criterios de inclusión: La descripción de las unidades estadísticas


(elementos muestrales) que conforman la población objetivo está
dada por los que son las características esenciales para considerar a
una unidad como parte de la población.
Criterios de exclusión: son las características que permiten eliminar
a una unidad de la población objetivo.
 Los elementos pueden ser entidades como: familias,
personas, fábricas, comercios, escuelas, etc.
 Para su estudio se consideran varios aspectos: tiempo de
residencia, edad, actividad, tamaño de empresas, etcétera.
 Para el estudio se debe determinar el proceso de captación
de información. Ésto es, la forma de aplicación y el tipo de
instrumentos de medición a utilizar.
Entre los instrumentos se encuentran:
i. La observación directa o con equipos de medición,
ii. Los cuestionarios,
iii. Las entrevistas directas o telefónicas, etc.

Es necesario conocer y aplicar correctamente los


instrumentos de medición, lo que permite evitar errores en el
proceso de captación de información.
Muestra

Una muestra es una colección o subconjunto de unidades


muestrales seleccionadas de uno o más marcos muestrales.

Existen diversas formas de selección de la muestra de una


población, de esto dependerá su validez estadística y
representatividad.
3.2.3 Tipos de muestras

Las formas de tomar muestras de una población son:

1.- A Juicio, cuando se usa la experiencia subjetiva del muestrista.

2.- Por Cuotas, cuando se pide que la muestra cumpla con las
proporciones conocidas de ciertas variables en la población.
3.- Probabilístico, se toman los elementos con probabilidades
conocidas y mayores de cero para todos y cada uno de los
elementos de la población.
Si son probabilidades de selección iguales se llama muestra
autoponderada y si es de tamaño “grande”, la muestra resultará
con elevada probabilidad representativa.
Si no se toma con probabilidades iguales, se hacen ajustes en la
forma de estimar promedios o proporciones para recobrar la
representatividad.
4.- Combinación de probabilístico con cuotas.

5.- Probabilístico con ajustes, que podríamos llamar


“cuotas a posteriori”, un caso elemental es el de
estimadores de Razón.
Criterios para el tamaño de muestra probabilística

El tamaño de la muestra dependerá de la variabilidad del


fenómeno en estudio (varianza), el nivel de precisión o exactitud
deseado y los recursos económicos disponibles para la
obtención de la o las muestras.
Para cada diseño que se revisará en el curso, se presentarán
los procedimientos para el cálculo del tamaño de muestra.
3.2.4 Marco de Muestreo
La población debe contar con un medio físico que
identifique directa o indirectamente a todos los elementos
de la población. Ese medio físico se llama marco de
muestreo.

Ejemplos:
a) un directorio de empresas,
b) un registro de embarcaciones,
c) un mapa, etcétera.
 El Marco de Muestreo es el medio físico que identifica a
todos los elementos de la población.

 Se pueden tener varias situaciones según el tipo de marco y


población, y se especifican en las siguientes figuras.
población

marco

Figura 1. Marco y población coinciden.


marco

población

Figura 2. El marco incluye otros elementos adicionales.


Población

marco

Figura 3. El marco no cubre a todos los elementos.


población

marcos

Figura 4. Marcos complementarios.


población

marcos

Figura 4. Marcos traslapados.


3.3 Tipos de Diseños de Muestra

El diseño de la muestra son los procedimientos de selección de la


muestra y de estimación que serán utilizados.
Existen diversos esquemas muestrales como son:
 Muestreo aleatorio simple
 Muestreo estratificado aleatorio
 Muestreo por conglomerados
 Muestreo en varias etapas, etcétera.
Muestreo Aleatorio Simple (mas)

Población
N Muestra
n

Selección aleatoria de los elementos muestrales


con probabilidades de selección iguales.
Muestreo Sistemático

Población
N Muestra
n

Muestreo Sistemático (uno de cada k), si el orden es


aleatorio, equivale al irrestricto, si hay un orden con
cambios suaves, no periódicos en el intervalo de
muestreo k = N / n , entonces es mas eficiente (mas
representativo) que el irrestricto
Muestreo con probabilidad proporcional al
tamaño (PPT)

Población
N Muestra
n

Selección con probabilidad Pi = xi / X de n de los elementos


muestrales con reemplazo.
Si se tiene que hay buena proporcionalidad entre Xi y Yi, es
decir Yi ≈ RXi entonces los elementos con valores mayores de
Yi , tienen más probabilidades de estar en muestra.
Muestreo Estratificado

Población
N = N1 + N2 + N3
N1 N3 Muestra
n = n1 + n 2 + n 3
N2
n1 n3
n2
Muestreo Estratificado

Selección aleatoria, sistemática o con probabilidades


proporcionales al tamaño de los elementos muestrales en
cada estrato por separado.
Es decir la selección es independiente de un estrato a otro.
Con tamaños de muestra nh proporcionales al tamaño de los
estratos, o proporcionales a las desviaciones estándar o
inversamente a los costos por unidad en cada estrato.
Muestreo Bietápico (Conglomerados)

M1 M2 Población:
N Unidades Primarias de Muestreo, UPM
con Mi unidades secundarias (USM) cada
M3 M4 una.
M5

M6
M7
Muestreo Bietápico

Selección aleatoria o sistemática de n


UPM con probabilidades de
selección iguales o proporcionales al
tamaño. m1 m2

Selección de mi USM sólo en las n


que se tienen en muestra en primera m3

etapa.
Muestreo Bietápico

Muestra:
n UPM y mi USM en cada una
M1 M2

M3 M4 M5

M6 M7
m1 m4

m6
VENTAJAS Y DESVENTAJAS DE LOS DISTITNOS TIPOS DE MUESTREO PROBABILÍSTICO
CARACTERISTICAS VENTAJAS DESVENTAJAS

Se selecciona con algún


mecanismo de aleatorización, una Cuando se trabaja con
muestra de tamaño n de una muestras pequeñas es
Sencillo y de fácil comprensión.
Aleatorio simple población de N unidades, cada posible que no
elemento tiene una probabilidad represente a la población
de inclusión igual y conocida de adecuadamente.
n/N.

En función del tamaño de la Fácil de aplicar.


población N y el tamaño de Si el intervalo de
muestra n, se define un intervalo No siempre es necesario tener selección k está asociada
de selección de unidades k= N/n. un listado de toda la población. con el fenómeno de
interés, las estimaciones
Sistemático Se elige un número aleatorio, r, Cuando la población está obtenidas a partir de la
entre el intervalo 1 y k (r= ordenada siguiendo una muestra pueden contener
arranque aleatorio). tendencia conocida, asegura sesgo de selección y se
una cobertura de unidades de subestima el error de
Se selecciona una unidad a partir todos los tipos. estimación.
de r cada k unidades.
VENTAJAS Y DESVENTAJAS DE LOS DISTITNOS TIPOS DE MUESTREO PROBABILÍSTICO

CARACTERISTICAS VENTAJAS DESVENTAJAS


Tiende a asegurar que la
Se requiere dividir la población Se debe conocer la
muestra represente
objetivo en L estratos homogéneos distribución en las unidades
adecuadamente a la población
al interior. o elementos de muestreo en
en función de las variables
la población sobre las
seleccionadas.
Una vez calculado el tamaño variables utilizadas para la
muestral apropiado, se reparte en estratificación.
Estratificado Su objetivo es conseguir una
los estratos de manera
muestra lo más semejante
proporcional, considerando los Elevados costos de
posible a la población acorde a
tamaños de estratos, las varianzas aplicación.
la estratificación utilizada.
dentro de los estratos y costos por
unidad entre los distintos estratos Dificultad para asignar las
Tiende a minimizar el error de
definidos en la población. muestras en la practica
estimación.

Se realizan varias fases de Es muy eficiente cuando la


muestreo sucesivas población es muy grande y
(conglomerados o polietápico). dispersa.
El error de estimación tiende
a ser mayor.
Se necesitan listados de las Bajos costos de aplicación
Conglomerados
unidades primarias o
El cálculo del error estándar
conglomerados. No es preciso tener un listado
es complejo.
de toda la población, sólo de
Se espera máxima heterogeneidad las unidades primarias de
al interior de las unidades. muestreo.
Muestreo Trietápico

M2 Población:
N UPM
M1 con Mi USM
en cada UPM, y con Bij unidades últimas
(UUM)
en cada USM.
M3
M4
M5

M6
M7
Muestreo Trietápico

Selección aleatoria o sistemática de n UPM con probabilidades de selección iguales o


proporcionales al tamaño.
Selección de mi USM en las n que se tienen en primera etapa; selección de bij unidades
últimas en cada USM en muestra.
b21
b12
b22
m1
m2
UUM en la
USM32
m3
USM
b32
Muestreo Trietápico
Muestra:
n UPM y mi USM en cada UPM y con bij unidades últimas
M1 M2 en cada USM

M3 M4 M5

UPM
M6
M7
b21
b12
m1 m2 b22

UUM
m3
en la
USM b32 USM32
Muestreos Complejos.
Polietápicos estratificados

Población:
M2 N UPM, con Mi USM en cada UPM y con Bij UUM
en cada USM. Las UPM en estratos y/o las USM
M1 estratificadas dentro de cada UPM

M3
M4
M5

M6
M7
Muestreos Complejos.
Polietápicos estratificados

Selección aleatoria o sistemática de nh UPM con probabilidades de


selección iguales o proporcionales al tamaño en cada estrato.
Selección de mi USM en las nh que se tienen en primera etapa.
Selección de bij UUS en cada USM en muestra.
b21
b12
b22
m1
m2
UUM en la
USM32
m3
USM
b32
Muestreos Complejos.
Polietápicos estratificados

Muestra: n UPM y mi USM en cada UPM y


M1 con bij UUM
M2
en cada USMij

M3 M4 M5

UPM
M6
M7
b21
b12
m1 m2 b22
UUM
en la
m3
USM32
USM b32
 El diseño de la muestra es la forma en que se toman los
elementos de esta y su tamaño; y la forma de construir el
estimador es la función de los datos de la muestra que lo
determinan.
 A ambos, diseño y forma del estimador, le podemos llamar
“estrategia de muestreo”.
3.4 Tipos de Errores
Los errores se pueden clasificar en dos grandes tipos:
1. Los errores aleatorios, ocurren cuando las mediciones, ya sean
repetidas en un mismo elemento o en diferentes elementos, varían
de manera no predecible y

2. los errores sistemáticos o no aleatorios, ocurren cuando las


mediciones varían de manera predecible y se tiende a sobre o
subestimar el valor verdadero, lo que se conoce como sesgo.
3.5 Tipos de Sesgos
Dependiendo de la etapa del estudio en que se originan, los sesgos que
interfieren con la validez interna de un estudio se han clasificado en tres
grandes grupos:

a) sesgos de selección, que se refieren a los errores que se introducen durante la


selección o el seguimiento de los elementos en estudio;
b) sesgos de información, que son errores generados por los procesos de
medición, y
c) sesgos de confusión, que se originan por la existencia de características
diferenciales de los elementos en los grupos a comparar.
3.6 Validez externa
La validez externa o representatividad quiere decir que la muestra es representativa de la
población, por lo que las inferencias o extrapolaciones realizadas serán correctas.

La validez externa de la muestra depende de:


a) La definición de la población objetivo, las definiciones operacionales de los factores en
estudio (variables) y las características inherentes de los individuos.

b) Los procesos de medición.

c) Los procesos de selección de la o las muestras, donde comúnmente se introducen


diferentes tipos de sesgos.
3.7 Procedimientos de selección de la muestra
Existen tres procedimientos básicos de selección probabilística de la
muestra.

 Aleatoria
 Sistemática
 Probabilidad Proporcional
Procedimientos de selección aleatoria
Una muestra aleatoria es aquella en la cual todos los elementos de la
población tienen la misma probabilidad de estar en la muestra.
Se utilizan comúnmente números aleatorios por computadora, pero los
procedimientos de sorteo es igualmente válidos.
Procedimientos de selección sistemática
Una muestra sistemática también considera que todos los elementos de la
población tienen la misma probabilidad de estar en la muestra.
En éste procedimiento se elige un arranque aleatorio de los k primeras
unidades muestrales y después se seleccionan sistemáticamente cada k
unidades.
Procedimientos de selección con probabilidad
proporcional
Una muestra con probabilidad proporcional establece un procedimiento
en el cual se asigna una probabilidad en función de ciertas características
de interés, lo más común es el tamaño de las unidades, en cuyo caso se
le llama: Probabilidad Proporcional al Tamaño (PPT).
Para ilustrar los tres procedimientos, se realizará una practica simple con
Excel.

También podría gustarte