Está en la página 1de 55

TEORIA

DE MUESTREO
MUESTREO
 Procedimiento estadístico para seleccionar
la muestra a partir de la población, con el
objeto de estudiar en ella alguna
característica, y generalizar los resultados
a la población de origen
MUESTREO
 Ventajas:
 Bajo costo en relación a la enumeración
completa de la población.
 Menor consumo de tiempo.
 Permite obtener mayor detalle de los datos
 Menor cantidad de personal requerido
 Mejor entrenamiento de quienes participan
 Puede ser la única opción para estudiar un
problema
CONCEPTOS BÁSICOS DE
MUESTREO
Conjunto total de elementos objeto de estudio.
También se denomina universo o colectivo. La
POBLACIÓN población puede estar formada por personas,
hogares, instituciones u objetos.
Conjunto de elementos de la población total
disponibles para la selección de la muestra. En
MARCO ocasiones todos los elementos de la población están
disponibles y, por tanto, el marco es igual a la
población. En otros casos no se produce esa igualdad.
UNIDAD Unidad seleccionada de la población para la aplicación
de la técnica de investigación. Puede ser un elemento
MUESTRAL poblacional único o un conjunto de elementos.
Conjunto de unidades muéstrales seleccionadas para
MUESTRA la aplicación de la técnica.
MÉTODO DE Procedimiento utilizado para seleccionar de forma
representativa las unidades muéstrales.
MUESTREO
CONCEPTOS BÁSICOS DE
MUESTREO

Número de unidades muéstrales que componen la


TAMAÑO DE
muestra seleccionada. Es un factor determinante
LA MUESTRA
del nivel de validez de las respuestas
Error cometido al no tratar toda la población. Es un
ERROR DE error admitido y controlado al generalizar los
MUESTREO resultados de una muestra obtenida aleatoriamente
a la población total.
Medida estadística del nivel de variación de la
DISPERSIÓN opinión del colectivo total sobre el tema analizado
respecto al valor medio.
Valor muestral utilizado para inferir un valor
ESTIMADOR
poblacional
POBLACIÓN Y MUESTRA

Población Muestra

(Parámetros) (Estadísticos)
EJEMPLOS

Población o universo: Conjunto de todos los elementos


sobre los cuales se desea hacer
una inferencia en un ámbito y un
momento dado.

Ejemplo: Todos los trabajadores de las empresas


comercializadoras de café en la provincia de Jaén.
Marco muestral: Listado de todas las unidades de
muestreo.

Empresa Huancaruna
Empresa OVM
Empresa
. COINCA
.
.
Empresa Louis Dreyfus
Empresa Comercio & Cia
Unidad de muestreo: Elemento disponible para su
selección en alguna etapa del
proceso de selección.

Ejemplo: Trabajadores de la
empresa Comercio & Cia

Muestra: Parte del marco muestral seleccionada para


representar a la población
PROCESO DE MUESTREO
1ER. PASO
DEFINIR LA POBLACIÓN CON PRECISIÓN

2DO. PASO
DEFINIR EL MARCO MUESTRAL

3ER. PASO
ESCOGER EL MÉTODO DE MUESTREO

4TO. PASO
DETERMINAR EL TAMAÑO DE MUESTRA

5TO. PASO
SELECCIONAR FISICAMENTE LA MUESTRA
MÉTODOS DE MUESTEO

Muestreo no Muestreo
probabilístico probabilístico

No se conoce la
La probabilidad de que un
probabilidad de seleccionar
elemento de la población
un elemento para que
sea seleccionado es
forme parte de la muestra.
conocida. En este tipo de
En este tipo de muestreo
muestreo se puede calcular
las estimaciones no pueden
la precisión de la
proyectarse a la totalidad
estimación.
de la población.
TIPOS DE MUESTREO

Muestreo no Muestreo
probabilístico probabilístico

 Muestreo por  Muestreo aleatorio


conveniencia simple
 Muestreo por  Muestreo sistemático
intencional  Muestreo
 Muestreo por cuotas estratificado
 Muestreo de bola de
nieve
MUESTREO NO
PROBABILISTICO
MUESTREO POR
CONVENIENCIA
Se usa en los casos en no es posible
seleccionar los elementos, y deben sacarse
conclusiones con los elementos que estén
disponibles. El entrevistador selecciona a la
muestra por su fácil disponibilidad (está en
el lugar y momento adecuado) Por ejemplo:
en el caso de voluntarios para pruebas de
medicamentos de enfermedades como el
corazón, cáncer, etc.
MUESTREO INTENCIONAL O
JUICIO
Este tipo de muestreo se caracteriza por un
esfuerzo deliberado de obtener muestras
“representativas” mediante la inclusión en la
muestra de grupos supuestamente típicos.
Es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.
Los elementos se seleccionan con base al
criterio o experiencia del investigador.
MUESTREO POR CUOTAS
Se utiliza en estudios de opinión de
mercado. Los enumeradores, reciben
instrucciones de obtener cuotas especificas a
partir de las cuales se constituye una
muestra relativamente proporcional a la
población.
Las unidades de muestran se seleccionan
según la distribución de la población
definidas por la características de control:
sexo, edad, nivel socioeconómico y otro.
MUESTREO DE BOLA DE NIEVE
Se localiza a algunos individuos, los cuales
conducen a otros, y estos a otros, y así
hasta conseguir una muestra suficiente. Este
tipo se emplea muy frecuentemente cuando
se hacen estudios con poblaciones
“marginales”, delincuentes, sectas, clase
alta, etc.
USO DEL MUESTREO NO
PROBABILÍSTICO
 En estudios cualitativos en donde no hay
necesidad de proyectar los resultados
obtenidos.
 Cuando no se cuenta con un marco
muestral apropiado.
 Cuando el costo de una muestra
probabilística es prohibitivo.
MUESTREO
PROBABILÍSTICO
MUESTREO ALEATORIO
SIMPLE
Cada elemento de la
población tiene la
misma probabilidad de
ser incluido en la
muestra.
Por lo anterior, se
requiere enumerar a
cada uno, de 1 hasta
N.
Se requiere de listado
completo.
EJEMPLO:
Cuando el tamaño de la muestra es 1000, es
necesario obtener 1000 números por sorteo
o por tablas aleatorias que nos permitan
seleccionar 1000 unidades muéstrales del
censo poblacional numerado previamente. Si
utilizamos un libro de tablas de números
aleatorios y la hoja seleccionada al azar es
la siguiente:
TABLAS DE NÚMEROS
ALEATORIOS
3690 2492 7171 7720 6509 7549 2330 5733 4730
0813 6790 6858 1489 2669 3743 1901 4971 8280
6477 5289 4092 4223 6454 7632 7577 2816 9002
0772 2160 7236 0812 4195 5589 0830 8261 9232
5692 9870 3583 8997 1533 6466 8830 7271 3809
2080 3828 7880 0586 8482 7811 6807 3309 2729
1039 3382 7600 1077 4455 8806 1822 1669 7501
7227 0104 4141 1521 9104 5563 1392 8238 4882
.... …. …. …. …. …. …. …. …. …. …. …. …. …. …. ….

1ª unidad muestral: la correspondiente al primer


número de la tabla 0813.
2ª unidad muestral: segundo número de la tabla
0772.
MUETREO SISTEMÁTICO
Supone en primer lugar enumerar los
elementos de la población entre 1 y N, y
en seguida, calcular el espaciamiento de
muestreo (k), dividiendo N entre n.
El tercer paso es elegir al azar un número
comprendido entre 1 y k, denominado
punto de arranque, a partir del cual se
obtendrán todos los demás, sumándo el
valor de k de manera consecutiva.
EJEMPLO:
Listado de trabajadores 
de empresa Comercio &  m.a.s
Cía en el distrito de 
Jaén. 

Tenemos como 
población 120 y como 
muestra 30; por lo 
tanto: 

K= 120/30=4 

MUESTREO ESTRATIFICADO
Implica la identificación de características que
dan lugar a la conformación de subgrupos
homogéneos al interior pero heterogéneos
entre sí. Los elementos dentro de cada
estrato se seleccionan al azar. Cada estrato
funciona independientemente, pudiendo
aplicarse dentro de ellos el muestreo
aleatorio simple o el estratificado para elegir
los elementos concretos que formarán parte
de la muestra. En ocasiones las dificultades
que plantean son demasiado grandes, pues
MUESTREO ESTRATIFICADO
exige un conocimiento detallado de la
población (tamaño geográfico, sexos,
edades,...).
La distribución de la muestra en función de
los diferentes estratos se denomina
afijación, y puede ser de diferentes tipos:
 Afijación Simple: A cada estrato le
corresponde igual número de elementos
muestrales.
MUESTREO ESTRATIFICADO
 Afijación Proporcional: La distribución
se hace de acuerdo con el peso (tamaño)
de la población en cada estrato.
 Afijación Óptima: Se tiene en cuenta la
previsible dispersión de los resultados, de
modo que se considera la proporción y la
desviación típica. Tiene poca aplicación ya
que no se suele conocer la desviación.
Representación gráfica del muestreo
estratificado

Proporcionada Desproporcionada

 Se muestrea cada estrato como si fuese una población


independiente.
 Requiere información sobre la población para definir los
estratos.
EJEMPLO:
 Universo: 10000 habitantes de un pueblo
 Tamaño de muestra: 600 personas
 Distribución del universo por edades:

• Grupo A: 1500 habitantes menores de


18 años.
• Grupo B: 6500 habitantes con edades
comprendidas entre los 18 y los 60 años.
• Grupo C: 2000 habitantes mayores de 60
años.
EJEMPLO
AFIJACIÓN SIMPLE:
• Grupo A: 600/3 = 200
• Grupo B: 600/3 = 200
• Grupo C: 600/3 = 200

AFIJACIÓN PROPORCIONAL:
• Grupo A: 600 x (1500/10000) = 90
• Grupo B: 600 x (6500/10000) = 390
• Grupo C: 600 x (2000/10000) = 120
EJEMPLO:
Supongamos que estamos interesados en
estudiar el grado de satisfacción laboral de
trabajadores en una determinada provincia. A
tal efecto seleccionamos una muestra de 450
sujetos. Conocemos por los datos del
ministerio que de los 10000 trabajadores en
las edades que nos interesan, 6000 están en
el sector público, 3000 a empresas privadas y
1000 a empresas privados no formalizadas.
Como estamos interesados en que en nuestra
muestra estén representados todos los tipos
EJEMPLO:
de instituciones, realizamos un muestreo
estratificado empleando como variable de
estratificación el sector de trabajo.
Si empleamos una afijación simple
elegiríamos 450 trabajadores de cada tipo,
pero en este caso parece más razonable
utilizar una afijación proporcional pues hay
bastante diferencia en el tamaño de los
estratos.
EJEMPLO:
Por consiguiente, calculamos que proporción
supone cada uno de los estratos respecto de
la población para poder reflejarlo en la
muestra.
 Instituciones públicas: 6000/10000=0.60
 Instituciones privados : 3000/10000=0.30
 Instituciones privados no formalizadas:
1000/10000=0.10
EJEMPLO:
Para conocer el tamaño de cada estrato en la
muestra no tenemos más que multiplicar esa
proporción por el tamaño muestral.
 Instituciones públicas: 0.60x450=270
sujetos.
 Instituciones privados : 0.30x450=135
sujetos.
 Instituciones privados no formalizados:
0.10x450= 45 sujetos
VENTAJAS INCONVENIENTES

Sencillo y de fácil comprensión. Cálculo Requiere que se posea de antemano


rápido de medias y varianzas. Se basa en un listado completo de toda la
la teoría estadística, y por tanto existen población. Cuando se trabaja con
Aleatorio simple
paquetes informáticos para analizar los muestras pequeñas es posible que no
datos represente a la población
adecuadamente.
Fácil de aplicar. No siempre es necesario Si la constante de muestreo está
tener un listado de toda la población. asociada con el fenómeno de interés,
Cuando la población está ordenada las estimaciones obtenidas a partir de
Sistemático
siguiendo una tendencia conocida, la muestra pueden contener sesgo de
asegura una cobertura de unidades de selección
todos los tipos.
Tiende a asegurar que la muestra Se ha de conocer la distribución en la
represente adecuadamente a la población de las variables utilizadas
población en función de unas variables para la estratificación.
seleccionadas. Se obtienen estimaciones
Estratificado
más precisa Su objetivo es conseguir una
muestra lo mas semejante posible a la
población en lo que a la o las variables
estratificadoras se refiere.
DETERMINACION DEL
TAMAÑO DE MUESTRA
PARA ESTIMAR LA PROPORCION
POBLACIONAL (P)
 Cuando se conoce el tamaño de la población de estudio N.
El modelo es:
2

n 2
Z pqN
2
Z pq  e ( N  1)
Z: Valor normal estándar a un nivel de confiabilidad fijado o
elegido por el investigador.

p: proporción de casos. q: 1-p complemento del valor de “p”.

e: tolerancia máxima de error, expresado en % o en función de


uno, tal como esté expresado “p”.

N: tamaño de la población en estudio.

n: tamaño de la muestra.
PARA ESTIMAR LA PROPORCION
POBLACIONAL (P)
El valor de “p” puede obtenerse con cualquiera de los 3 procedimientos
siguientes con prioridad en el orden que se indica:

 Estudio piloto: llamado también rastreo o screennig


esta opción tiene la ventaja de estimar un valor de “p”
que corresponde con la propia realidad donde el
investigador realiza su investigación. El tamaño de la
muestra piloto varia dependiendo del objetivo. Se puede
afirmar que cuanto más grande es el tamaño de la
población de estudio, más grande es la muestra piloto,
por lo que puede variar desde 5 hasta 60 elementos. Sin
embargo su tamaño siempre será arbitrario.
PARA ESTIMAR LA PROPORCION
POBLACIONAL (P)
 De la bibliografía: sólo en el caso que el investigador
no pueda realizar un estudio piloto, por ejemplo, porque
la dirección de la institución donde va a realizar la
investigación no le otorgó el permiso o no le dió las
facilidades, o por que aún no llegan los recursos
financieros, tecnológicos o humanos; el investigador
tiene la opción de acudir a la bibliografía para tomar un
valor de “p” con igual definición que la ha dado en su
investigación.
El estudio elegido de la bibliografía debe ser de una realidad
con características socio-económicas, biológicas, nutricionales,
educativas, etc. similares a la realidad donde el investigador
realiza su investigación; además la investigación elegida no
debe tener más de 5 años de antigüedad, otros autores
sugieren que no debe tener una antigüedad superior a los 10
años.
PARA ESTIMAR LA PROPORCION
POBLACIONAL (P)
 Criterio Estadístico: sólo después cuando el
investigador no pueda realizar el estudio piloto y no haya
encontrado en la bibliografía en valor par se “p”, tiene
una tercera y definitiva opción, la cual consiste en
asignarle a “p” el valor de 0.5 por lo tanto a “q” también
el valor de 0.5. Este criterio se basa en el hecho que para
esos valores “pq” es máximo, por lo que el tamaño de la
muestra “n” es máximo.
La tolerancia máxima de error (E) también lo fija el
investigador de tal manera que si “” es el nivel de
confiabilidad elegido por este, entonces existe una
probabilidad “” de que el error de la estimación de P no
exceda a E.
PARA ESTIMAR LA PROPORCION
POBLACIONAL (P)
 Cuando no se conoce el tamaño de la población de estudio N.
El modelo es:

n Z pq
2
e
Z: Valor normal estándar a un nivel de confiabilidad fijado o
elegido por el investigador.

p: proporción de casos. q: 1-p complemento del valor de


“p”.

t: tolerancia máxima de error.


EJEMPLO:
 La Consejería de Trabajo planea un
estudio con el interés de conocer la
proporción de mujeres que trabajan
diariamente 10 horas o más. De un
estudio piloto se dedujo que P=0.30,
fijamos el nivel de confianza en 0.95 y el
error máximo 0.02. De un total de 10000
mujeres.

1.96 2  0.3  1  0.3 10000


n  1678
1.96  0.3  1  0.3  0.02  10000  1
2 2
PARA ESTIMAR LA MEDIA
POBLACIONAL ()
 Cuando se conoce (o se puede estimar) el tamaño
de la población de estudio
2 2
Z s N
n 2 2 2
Z s  e ( N  1)

Z: Valor normal estándar a un nivel de confiabilidad fijado o elegido


por el investigador.

S2: Varianza muestral de los valores observados de la variable de


estudio respecto al promedio (s2 = 2)

Si la variable de estudio tiene distribución normal y se conoce el


máximo y mínimo valor, entonces:
PARA ESTIMAR LA MEDIA
POBLACIONAL ()
S = máx - mín
6
El valor de s2 se puede estimar a través de la realización de
un estudio piloto o de la bibliografía.
e: Error de precisión, es la diferencia que quisiéramos
exista entre la media poblacional que vamos a estimar y el
promedio que calcularemos en la muestra. Es elegido o fijado
por el investigador y tiene las mismas unidades que la
variable.
N: tamaño de la población en estudio.
Si “” es el nivel de confiabilidad elegido por el investigador,
entonces “” es la probabilidad de que el error de estimación
de  no exceda a “e”.
PARA ESTIMAR LA MEDIA
POBLACIONAL ()
 Cuando no se conoce el tamaño de la población de
estudio N.

2 2
Z s
n 2
e
Z: Valor normal estándar a un nivel de confiabilidad 
elegido por el investigador.

S2: Varianza muestral

e: Error de precisión
EJEMPLO:
Siguiendo con el estudio planteado en el punto
anterior, supongamos que tratamos de conocer
el promedio de horas semanales trabajadas por
las mujeres del servicio doméstico. La muestra
será extraída de una población de 10000
mujeres que figuran en los registros de la
Seguridad Social y de las cuales se conoce a
través de un estudio piloto que su varianza es
de 9.648 horas.
EJEMPLO:
Trabajando con un nivel de confianza de
0.95 y estando dispuestos a admitir un error
máximo de 0,1 horas, ¿cuál debe ser el
tamaño muestral que empleemos?

1.96 2  9.648  10000


n  2704
1.96  9.648  0.1  10000  1
2 2
DETERMINACIÓN DEL
TAMAÑO DE MUESTRA
CASO PRÁCTICO
Usted es un reconocido asesor de la ciudad
y por tal motivo le han solicitado que
determine:
 La población objetivo, el elemento y unidad
muestral.
 El marco muestral y el estrato
 La técnica de muestreo más adecuada
 La distribución y el tamaño de muestra a utilizar

Los datos con las que cuenta son las


siguientes:
CASO PRÁCTICO
 La población objetivo estará compuesta
por solo varones mayores de 18 años .
En este caso, coincide que cada persona
de sexo masculino de la ciudad de Chiclayo
será el elemento muestral y la unidad de
muestra.
 El marco muestral para obtener los datos
de la población, será el listado actual de
distribución poblacional que emite el
Instituto Nacional de Estadística e
Informática (INEI).
CASO PRÁCTICO
El estrato estará formado por los varones
mayores de 18 años de los niveles
socioeconómicos A, B, y C.
2

n  Z pq 2
e
Edades Nivel A Nivel B Nivel C
De 18 a 25 años 5 800 8 900 11 300
De 26 a 30 años 12 300 23 400 56 700
Más de 30 años 21 500 45 000 60 000
Total 39 600 77 300 128 000
SOLUCIÓN
 La técnica de muestreo más conveniente es la
de Muestreo No Probabilístico por Cuota,
por ser el de uso más frecuente cuando
queremos una primera aproximación de
mercado. A través de ella podremos
seleccionar las unidades de muestra al azar
según la distribución poblacional, definida por
las características de control. Es decir
estableceremos cuotas según sexo, edad y
nivel socio económico. Variables básicas por
la naturaleza de la investigación
SOLUCIÓN
 Para empezar sumamos las columnas de cada
nivel socioeconómico, para luego obtener los
porcentajes de cada una en base al total neto de
varones.

Edades Nivel A Nivel B Nivel C Total Neto


De 18 a 25 años 5 800 8 900 11 300 26000
De 26 a 30 años 12 300 23 400 56 700 92400
Más de 30 años 21 500 45 000 60 000 126500
Total 39 600 77 300 128 000 244 900
SOLUCIÓN
Edades Nivel A Nivel B Nivel C Total Neto
De 18 a 25 años 2.37% 3.63% 4.61% 10.61%
De 26 a 30 años 5.02% 9.55% 23.15% 37.72%
Más de 30 años 8.78% 18.37% 24.5% 51.65%
Total 16.17% 31.56% 52.27% 100%

 Una vez obtenido los porcentajes, se establece


la cantidad de encuestas a realizar en cada
grupo de edad y nivel socioeconómico.
SOLUCIÓN
Ahora se procederá a calcular el tamaño de
muestra de acuerdo con los datos y la formula
mostrada
Grado de Confianza  0.95

Distribución normal Z 1.96


estandarizada
Si tiene característica P 0.6
de interés
No tiene característica q 0.4
de interés
Error E 0.05

Tamaño de la Población N 24 4900


SOLUCIÓN
(1.92) 2 (0.6)(0.4)(244900
n  368
(1.96) (0.6)(0.4)  (0.05) (244900  1)
2 2

El tamaño de muestra será igual a 368 personas. Así


entonces, con este resultado se pasa a determinar el
número de encuestados en cada segmento
Edades Nivel A Nivel B Nivel C Total
Neto
De 18 a 25 años 9 13 17 39
De 26 a 30 años 19 35 85 139
Más de 30 años 32 68 90 190
Total 60 116 192 368

También podría gustarte