Está en la página 1de 45

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERIA ECONOMICA

UN IVERS IDAD
A LT I P L A N O

TÉCNICAS DE MUESTREO
M.Sc. Sabino Edgar Mamani Choque
El objetivo del muestreo es contar con el mayor número de
unidades, con la mayor cantidad de información, pero al
menor costo posible. Para el diseño de la muestra y cálculo
del tamaño se debe considerar lo siguiente:

1. Planteamiento del problema. Determinar con claridad la


necesidad de realizar un trabajo de investigación, para lo
cual se debe revisar toda la información necesaria que
permita conocer con mayor profundidad el problema.
2. Establecer el (los) objetivos de manera clara y precisa,
los mismos que no se deben perder de vista a lo largo
del proceso de investigación.

3. Determinar la población objetivo, que debe estar


claramente definida y plenamente identificada al inicio
del proceso de selección y entrevista. Significa
identificar la unidad o el elemento en forma clara,
mensurable, adecuada y comparable.
4. Formulación de hipótesis. Ejemplos: Se observan
variaciones en las cantidades consumidas, frente a
variaciones de precios y marcas; El consumo de ... es bajo en
comparación con el mínimo nutricional recomendable.

5. Elaboración del marco de referencia, que es un listado de


todas las unidades que constituyen la población objetivo, y
deben estar relacionados con un mapa o croquis que indique
la localización de las unidades.
Población. Conjunto total de individuos o
elementos objeto de una investigación.
Debe estar definido en términos de:
Características físicas
Cobertura (geográfica o institucional)
Tiempo.

Muestra. Cualquier sub conjunto de la población en


referencia
Muestras determinísticas (no expandible)
Muestras probabilísticas (teoría de muestreo)
Probabilidad de selección.
Valor entre 0 y 1 que mide la posibilidad de que un
elemento de la población pertenezca a la muestra.

Parámetro.
Expresión numérica que sintetiza los valores de una
característica de la población en estudio.
La media 
La varianza 2
La proporción P
Estimador.
Valor aproximado del parámetro y se obtiene de la
información recolectada en la muestra.
La media muestral 𝑋
La varianza muestral S2
La proporción muestral p

Alternativas para estudiar una población


Sondeos. Método para caracterizar sistemas, identificar situación de productores
Censos
Muestreos
Ventajas del muestreo
Costo
Oportunidad  Rapidez  tiempo
Precisión
Estudios en el tiempo
Profundidad de temas
Procesamiento y producción de resultados
Inferencia

Desventajas.
Identificación individual
Fenómenos de baja frecuencia
Muestreo de elementos
El elemento o individuo es la unidad de muestreo.
El marco de referencia es la lista de los elementos como base
para la selección de la muestra.
No es recomendable en poblaciones muy grandes.

Problemas de marco de referencia.


Elementos faltantes  Cobetura
Elementos duplicados
Elementos extraños
Tamaño óptimo de la muestra (n).

Debe ser pequeña para que el costo de la investigación

se suficientemente bajo, y bastante grande para que el

error de muestreo sea admisible.


Componentes en el proceso de cálculo (factores determinantes).

a. Error muestral (E).


Diferencia entre el valor poblacional
(parámetro) y la estimación de la misma
(estimador), obtenida por muestra aleatoria.

±E = X - 
=X±E

El error es determinado por el investigador, y requiere


conocimiento sobre las características de la población en
estudio.
Resulta práctico determinar el error como un porcentaje
(la mayoría de la veces no mayor del 10%) respecto de la
media aritmética E = (%) (𝑋).

El porcentaje podría considerarse como complemento


del nivel de confianza: una confianza del 95% daría
supuestamente un error del 5%.
Pero no siempre debe ser el complemento, porque
dependerá del grado de precisión con que se desea
hacer la estimación.
Existe otro tipo de error ajeno al muestreo: medición incorrecta,
cuestionarios mal definidos, errores del entrevistador en preguntas
/ interpretación de respuestas, etc.
b. La varianza.
El tamaño de la muestra depende en gran
medida de la variabilidad (ejemplo, muestreo de
sangre, fumadores).

Cuando no se conoce la varianza (no existe


información sobre la población y no se hicieron
investigaciones previas en lugares similares) se
debe realizar una encuesta piloto, cuyo tamaño lo
fija el investigador (arbitrario; ejm. 5%) en base al
tamaño de la población, tiempo y costo.
Permite determinar fallas de encuesta, familiaridad con
encuestas, tiempo de entrevista, etc
Importancia del formato de encuesta
c. Nivel de confianza
Fijado por el investigador. Generalmente se trabaja con Z=1.96
correspondiente a un nivel de confianza del 95.%. Otros valores:

Valor de Z Nivel de confianza (%)


1.64 90
2.00 95.5
2.57 99
MUESTREO ALEATORIO SIMPLE

Técnica sencilla y conocida


Aplicable en poblaciones homogéneas
Técnica complementaria en otros diseños
La población debe estar enumerada o codificada
consecutivamente
Seleccionar n elementos aleatoriamente
Probabilidad de selección f = n / N
Ejemplo.
El proceso de planificación de una determinada región ganadera
requiere de diferentes trabajos de investigación. Cuenta con una
población de 2,500 productores. Determine el tamaño óptimo de
muestra sobre la base de: a) número de vacas lecheras por hato,
b) el rendimiento promedio de leche por hato, c) la proporción de
hatos con un rendimiento promedio mayor a 250 litros; para
todos los casos considere un error del 7% y un nivel de confianza
del 99%.
Los resultados de una encuesta preliminar de tamaño 50,
fueron los siguientes:
a) Promedio de vacas por hato, 25 y desviación estándar,
18.
b) Rendimiento promedio del leche por hato, 225 litros y
varianza 4,225.
c) 70% de los hatos tienen rendimiento promedio mayor
a 250 litros.

Cual es el n optimo ?
a) Promedio de vacas por hato:

𝑋 : 25
D.E : 18
N : 2,500
Error : 7%
P : 99% , asociado a un valor Z = 2.57
n1 : 50
E = 0.07 x 25 = 1.75

𝑍2𝑆2 2 𝑛0
𝑛0 = 2 1 + 𝑛= 𝑛0
𝐸 𝑛1 1+
𝑁

2.572 324 2
𝑛0 = 1+ = 726.72
1.752 50

726.72
𝑛= = 563.72
726.72
1+
2500
b) Rendimiento promedio de leche por hato.

𝑋 : 225
S2 : 4225
N : 2,500
Error : 7%
P : 99% esta asociado a un valor Z = 2.57
n1 : 50
E = 0.07 x 225 = 15.75

2.572 4225 2
𝑛0 = 1+ = 116.99
15.752 50

116.99
𝑛= = 111.76
116.99
1+
2500
c) 70% de los hatos tienen rendimiento promedio
mayor a 250 litros

P = 0.7, Q = 0.3
𝑆𝑃2 : PQ = 0.7 x 0.3 = 0.21

N : 2,500
Error : 7%
P : 99% , asociado a un valor Z = 2.57
n1 : 50
2
𝑍 𝑃𝑄 2
𝑛0 = 2
1+
𝐸 𝑛1

𝑛0
𝑛= 𝑛0
1+
𝑁
2.572 0.21 2
𝑛0 = 1+ = 294.39
0.072 50

294.39
𝑛= = 263.38
294.39
1+
2500

Si la investigación de la ganadería en la mayoría


de aspectos, el n optimo es (a).

Si E y P toman otros valores?


Muestreo Aleatorio Simple

Cuando no se conoce la varianza poblacional


(es muy frecuente)

Se debe tomar en cuenta las investigaciones similares


realizadas con anterioridad, de lo contrario
realizar encuesta preliminar (piloto).
Ejemplo.
N = 300 familias
Error 5%
P : 99% esta asociado a un valor Z = 2.57
n se puede determinar de tres formas:

a). b). 𝑛=
𝑁𝑍 2 𝑆 2
.
𝑍2𝑆2 𝑁𝐸 2 +𝑍 2 𝑆 2
𝑛0 = .
𝐸2

𝑛0
𝑛= 𝑆2
𝑛
1+ 𝑁0 c). 𝑛=
𝐸 𝑍 2 +𝑆 2 𝑁
Encuesta piloto (5% de la población)
npiloto = 0.05(300) = 15
Resulatdos de encuesta piloto
Ingreso Vivienda Número total Con Consumo diario
No. (S/.) propia de personas M F empleo de carne (gr)
1 850 Si 4 2 2 1 750
2 260 Si 4 1 3 1 745
3 990 Si 3 2 1 2 490
4 810 No 4 2 2 1 470
5 390 No 6 3 3 3 550
6 870 Si 5 2 3 2 580
7 670 Si 2 1 1 1 590
8 355 No 3 1 2 1 500
9 680 Si 2 1 1 1 520
10 385 Si 2 1 1 1 480
11 335 No 2 1 1 2 440
12 620 Si 5 2 3 2 680
13 780 Si 4 2 2 1 780
14 605 No 3 1 2 2 820
15 675 Si 3 2 1 1 600
Promedio 618.33 p=10 599.67
Desv. Est. 225.59 q=5 125.11
a). Basado en el ingreso.

a.1

E = 0.05 (618.33) = 30.92

2.572 50890.85
𝑛0 = 2
= 351.58
30.92

351.58
𝑛= = 161.87 ≈ 162
351.58
1+
300
a). Basado en el ingreso.

a.2
300 2.57 2 50890.85
𝑛= 2 2
= 161.87 ≈ 162
300 30.92 + 2.57 50890.85

a.3
50890.85
𝑛= 2 = 161.87 ≈ 162
30.92 + 50890.85 300
2.57

Nota. El coeficiente de variabilidad para esta variable es :

CV = S/X = (225.59/618.33)x100 = 36.48%


b). Basado en el consumo promedio de carne
por día por familia.

E = 0.05 (599.67) = 29.98


n= NZ2S2 .
NE2 + Z2S2

300 2.572 15652.51


𝑛= 2 2
= 83.14
300 29.98 + 2.57 15652.51

Nota. El coeficiente de variabilidad para esta variable es :

CV = S/X = (125.11/599.67)x100 = 20.86%


c) Basado en la proporción de familias con
vivienda propia.
Con vivienda propia 10,
P = 10 / 15 = 0.67 Q = 5/15 = 0.33
Sp2 = PQ = 0.67 (0.33) = 0.2211

n= NZ2 PQ .
NE2 + Z2 PQ

300 2.572 0.2211


𝑛= 2 2
= 198.21
300 0.05 + 2.57 0.2211
Muestreo Aleatorio Estratificado.
Cuando la característica que se investiga tienen alta
variabilidad

Este tipo de muestreo permite:


a. Mayor precisión de los estimadores, pese a que el
número de unidades seleccionadas es menor respecto
del M.A.S.
b. Garantiza la representatividad y una reducción del
error de la muestra, por agrupación de elementos que
se parecen mas por característica que se investiga que
por pertenecer a la población.
c. Agrupar a la población por estratos homogéneos,
pero heterogéneos entre estratos.
Simbología.

N : Población

Nh : Población de cada estrato.

h : Identifica a cada estrato h = 1,2, ...

Nh = N = N1 + N2 + ... NM

𝑋ℎ : Media aritmética poblacional de cada estrato

𝑋𝑠𝑡 : Media aritmética poblacional ponderada por estrato

𝑋ℎ 𝑁ℎ
𝑋𝑠𝑡 = = 𝑋ℎ 𝑊ℎ
𝑁
Wh : Proporción de elementos en cada estrato

Wh = Nh / N

Wh = W1 + W2 + ... WM = 1

𝑆ℎ2 : Varianza poblacional en cada estrato

2
𝑋ℎ𝑖 − 𝑁ℎ 𝑋ℎ
𝑆ℎ2 =
𝑁ℎ − 1

n : No. de unidades de la muestra total

ni : No. de unidades de la muestra en cada estrato


a). Asignación igual.
Ejemplo.
Estrato I Ingresos menores a S/ 850 N1 250 familias
Estrato II Ingresos entre S/851 y S/ 1700 N2 180 familias
Estrato III Ingresos mayores a S/1700 N3 70 familias
N 500 familias

Proporción de unidades en cada estrato:

Estrato I N1 = 250 W1 = N1/N W1 = 250/500 = 0.50


Estrato II N2 =180 W2 = N2/N W2 = 180/500 = 0.36
Estrato III N3 = 70 W3 = N3/N W3 = 70 /500 = 0.14
N = 500
Encuesta piloto al 4% de la población:

npiloto = 0.04 (500) = 20 familias

nh = npiloto / L = 20/3 = 6.67  7

donde L : Número de estratos

n1 = n2 = n3 = 7  npiloto = 21 familias
Resultados de encuesta piloto.

Media aritmética Desviación estándar Varianza

_
X1 = 420 S1 = 133.90 S12 = 17,929.21
_
X2 = 695 S2 = 25.40 S22 = 645.16
_
X3 = 1100 S3 = 165.50 S32 = 27,390.25
Media aritmética ponderada por estrato.
𝑋𝑠𝑡 = 𝑊ℎ 𝑋ℎ = (0.50 x 420) + (0.36 x 695) + ( 0.14 x 1,100) = 614.20

Error = 7% de Xst
E = 0.07 (614.2) = 42.99

P = 99%, nivel de confianza (Z=2.57)

Se puede determinar de dos formas:


a. n0 = (1/V) WhSh2

donde V = (E/Z)2

𝑛0
𝑛0 = 𝑛0
1+
𝑁

b.
𝑁𝑍 2 𝑊ℎ 𝑆ℎ2
𝑛=
𝑁𝐸 2 + 𝑍 2 𝑊ℎ 𝑆ℎ2
a. V = (42.99/2.57)2 = 279.81

n0 = (1/279.81) [ (0.5 x 17,929.21) + (0.36 x 645.16) + ( 0.14 x 27,390.25) ] = 46.57

n= 20.38 . = 42.60  43
1 + (20.38/500)

b.
n= 500(2.572) [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)] .
500(42.992) +2.572 [ (0.5 x 17929.21) + (0.36 x 645.16) + (0.14 x 27390.25)]

. n = 42.60  43
Asignación igual
nh = n / 3 = 43 / 3 = 14.3 familias por estrato

Asignación proporcional
n1 = nW1 = 43 (0.50) = 21.5  22 familias
n2 = nW2 = 43 (0.36) = 15.5  16 familias
n3 = nW3 = 43 (0.14) = 6.02  6 familias
n = 44 familias
Determinación de n en base a proporciones.

Ejemplo.
En base a la información anterior y:

Estrato I N1 = 250 W1 = 0.50


Estrato II N2 = 180 W2 = 0.36
Estrato III N3 = 70 W3 = 0.14
N = 500
Error 9%
P = 99%, nivel de confianza (Z = 2.57)
Se conoce que la proporción de familias con
vivienda propia en cada estrato es:
Encuesta piloto = 18 familias
P1 = 3/6 = 0.50 Q1 = 0.50
P2 = 4/6 = 0.67 Q1 = 0.33
P3 = 5/6 = 0.83 Q1 = 0.17

𝑁𝑍 2 𝑊ℎ 𝑃ℎ 𝑄ℎ
𝑛=
𝑁𝐸 2 + 𝑍 2 𝑊ℎ 𝑃ℎ 𝑄ℎ

n = 500(2.572) [ (0.5 x 0.5 x 0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)] .
500 (0.092) + 2.572 [(0.5x0.5x0.5) + (0.36 x 0.67 x 0.33) + ( 0.14 x 0.83 x 0.17)]

n = 133.94  134
Asignación igual
n1 = n2 = n3 = n / L = 134 / 3 = 45  n = 135

Asignación proporcional.

n1 = n W1 = 134 (0.50) = 67
n2 = n W2 = 134 (0.36) = 48.24  48
n1 = n W1 = 134 (0.14) = 18.76  19

n = 134 familias

También podría gustarte