Está en la página 1de 9

METODOS DE MUESTREO

Conceptos importantes

Elemento: Es la unidad acerca de la cual se solicita información. Éste suministra la base del
análisis que se llevará a cabo. Los elementos más comunes del muestreo en investigación de
mercados son los individuos. En otros casos, los elementos podrían ser productos, almacenes,
empresas, familias, etc. Los elementos de cualquier muestra específica dependerán de los
objetivos del estudio.

Población: Una población o universo, como también se llama, es el conjunto de todos los
elementos definidos antes de la selección de la muestra.

Muestra: Es un subconjunto representativo de la población.

Unidad de muestreo: Una unidad de muestreo es el elemento o los elementos disponibles para
su selección en alguna etapa del proceso de muestreo. En el tipo de muestreo más simple, el de
una sola etapa, las unidades y los elementos de muestreo son los mismos.

Marco muestral: Es una lista de todas las unidades de muestreo disponibles para su selección en
una etapa del proceso de muestreo. En la etapa final, la muestra real se saca de una lista como
ésta. Un marco puede ser una lista de alumnos, una lista de votantes inscritos, un directorio
telefónico, una lista de empleados o incluso un mapa.

Población del estudio: La población del estudio es el conjunto de elementos del cual se saca la
muestra. Infortunadamente surgen dificultades prácticas que hacen que la muestra real se tome
de una población un tanto diferente de la que se definió a priori. Lo que sucede es que los
elementos de la población se omiten del marco muestral. Por ejemplo una lista de los miembros
de un club puede estar incompleta, algunas personas tienen números telefónicos no registrados, es
posible que un mapa no incluya una calle nueva.

Existen muchos procedimientos diferentes mediante los cuales los investigadores pueden
seleccionar sus muestras, pero al principio debe establecerse un concepto fundamental, la
diferencia entre 1) una muestra no probabilística y 2) una muestra probabilística.

En el muestreo no probabilístico, la selección de un elemento de la población que va a formar


parte de la muestra se basa hasta cierto punto en el criterio del investigador o entrevistador de
campo. No existe una posibilidad conocida de que se seleccione cualquier elemento particular de
la población.

En el muestreo probabilístico cada elemento de la población tiene una posibilidad conocida de


ser seleccionado para la muestra. El muestreo se hace mediante reglas de decisión matemáticas
que no permiten discreción al investigador.

Métodos de muestreo no probabilístico

Muestreo por conveniencia: Se seleccionan con base a la conveniencia del investigador, por
ejemplo, pedir a las personas en la calle que den su opinión sobre un producto. No se sabe de qué
población se obtiene la muestra real.
Muestreo por juicios: Se seleccionan con base en lo que algún experto considera acerca de la
contribución que esas unidades o elementos de muestreo en particular harán para responder la
pregunta de investigación inmediata.

Muestreo por prorrateo: Son un tipo especial de muestras intencionales. En este caso, el
investigador emprende pasos explícitos para obtener una muestra que sea similar a la población
en algunas características de control anteriormente especificadas, por ejemplo, la edad, el sexo, la
raza.

Métodos de muestreo probabilístico

Muestreo Aleatorio Simple: Muestra formulada de manera que cada integrante de la población
tenga la misma probabilidad de quedar incluido.

Muestreo Aleatorio Estratificado: Una población se divide primero en subgrupos,


denominados estratos, y se selecciona una muestra de cada estrato. Después se combina esta
información para hacer una inferencia acerca de toda la población. Esto permite ahorrar costos.
El muestreo aleatorio estratificado tiene otra ventaja. No solamente puede combinar la
información de las muestras de los estratos para obtener inferencias acerca de la población
completa, sino también utilizar la información de la muestra acerca de las características de cada
estrato. Por ejemplo, esto permitiría comparar las opiniones de los dueños de casa de una
subregión con las opiniones en otra.

Muestreo por Conglomerados: Un conglomerado es una colección de elementos. A veces es


menos costoso elaborar un marco y muestrear conglomerados en vez de elementos individuales
de la población. Por ejemplo, supóngase que se quiere estimar la cantidad media, en dólares, que
los adultos en un área residencial grande planean gastar mensualmente en artículos
fundamentales. Una manera sencilla de realizar esta estimación es muestrear aleatoriamente
algunas manzanas de casas y, después, examinar las intenciones de compra de todos los adultos
dentro de cada una de las manzanas muestreadas. Así, cada una contendrá un conglomerado de
elementos, y el número de elementos variará de un conglomerado a otro. Se puede construir
fácilmente un marco utilizando un mapa del área residencial y tomando cada manzana como un
conglomerado. Los costos de transporte para comunicarse con los adultos que residen en una
manzana de casas será mínimo. Por consiguiente, podrá entrevistarse más gente, a un costo
menor, que si se utilizará una muestra aleatoria simple de todos los adultos residentes en el área.

Muestreo Aleatorio Sistemático: Los integrantes de la población se ordenan alfabéticamente,


en un archivo según la fecha en que se reciben, o por algún otro método. Se selecciona al azar un
punto de inicio y después se elige cada k-ésimo elemento de la población para la muestra.

Uso de la tabla de números aleatorios


La manera más sencilla y segura para obtener una muestra aleatoria de n unidades muestrales de
una población grande es utilizar una tabla de números aleatorios. En la tabla los números enteros
aparecen al azar. Se parte con un número de la tabla seleccionado aleatoriamente, escogiendo el
número apropiado de dígitos según los datos, y luego secuencialmente se van obteniendo los
números siguientes.
La tecnología ha hecho que programas de computación tengan la posibilidad de generar números
aleatorios y facilite aún más el trabajo del investigador.
ESTIMACIONES EN EL MUESTREO PROBABILISTICO

N = número de unidades en la población


n = número de unidades en la muestra
 = media poblacional
 = total poblacional
N
   x i  N
i 1

p = proporción poblacional

Intervalos de confianza en el muestreo aleatorio simple

Para la media poblacional  de una población finita

s N n
x  z / 2
n N
donde
n n

x i  ( x  x) i
2

x i 1
s i 1
n n 1

Para el total poblacional  de una población finita

Ns N n
ˆ  z / 2
n N

donde
n

 ( x  x) i
2

ˆ  N x s i 1
n 1

Para la proporción poblacional p de una población finita

pˆ qˆ N n
pˆ  z / 2
n 1 N

donde
x
ˆ 
p qˆ  1  p
ˆ
n
Intervalos de confianza en el muestreo aleatorio estratificado

Para la media poblacional 

1 L
 N  ni  si2
x st  z / 2
N2
 N i2  i 
i 1  Ni  ni

donde

L
1 1
x st 
N
( N1 x1      N L x L ) 
N
N x
i 1
i i

Para el total poblacional 

L
 N  ni  si2
ˆ  z / 2  N i2  i 
i 1  Ni  ni

donde
L
ˆ  N x st ˆ   N i xi
i 1

1 1 L
x st 
N
[ N 1 x1  N 2 x 2      NL x L ] 
N
 Ni xi
i 1

Para la proporción poblacional p

1 L
 N i  ni  pˆ i qˆ i
pˆ st  z / 2 N i
2
 
N2 i 1  Ni  ni  1

donde

L
1 1
pˆ st 
N
[ N1 pˆ1  N 2 pˆ 2      N L pˆ L ] 
N
 N pˆ
i 1
i i

Intervalos de confianza en el muestreo por conglomerados

N = número de conglomerados en la población


n = número de conglomerados en la muestra
mi = número de elementos en el conglomerado i, siendo i = 1, 2, …, n
n

m i
tamaño medio del conglomerado en la muestra
m i 1

n
N
M   mi  número de elementos en la población
i 1
M
M   tamaño medio del conglomerado para la población
N
xi = total de todas las observaciones en el i-esimo conglomerado, donde i = 1, 2, …, n
n

x i
x i 1
n

m
i 1
i

ai = número de éxitos en el i-esimo conglomerado, donde i = 1, 2, …, n


n

a i
pˆ  i 1
n

m
i 1
i

ˆ  Mx

Para la media poblacional 

 N n 
( xi  xmi ) 2
x  z / 2   i 1
 2 
n 1
 Nn M 

donde

n n n 2 n
 ( xi  xmi ) 2   xi2  2 x xi mi  x  mi2
i 1 i 1 i 1 i 1

Para el total poblacional 

 N n
 (x i  xmi ) 2
ˆ  z / 2 N 2  
i 1

 Nn  n 1

donde

n n n 2 n
 ( xi  xmi ) 2   xi2  2 x xi mi  x  mi2
i 1 i 1 i 1 i 1

Para la proporción poblacional p


n

 N n 
(ai  pˆ mi ) 2
pˆ  z / 2   i 1
 2 
n 1
 Nn M 

donde
n n n n
 (ai  pˆ mi )2   ai2  2 pˆ  ai mi  pˆ 2  mi2
i 1 i 1 i 1 i 1

Nota: se utiliza m para estimar M cuando se desconoce el número M de elementos en la


población.

Ejercicios

1. El gerente de una compañía rentadora de autos quiere estimar el número total de kilómetros que
recorren mensualmente sus coches. Se seleccionó una muestra aleatoria de n = 30 vehículos del
grupo de la compañía formado por 280 coches, y se registró el kilometraje de recorrido para cada
auto al principio y al final de un mes en particular. La media y la desviación estándar de la
muestra fueron x = 1342 y s = 227. a) Obtener un intervalo de confianza aproximado de 95%
para el kilometraje total registrado para la flotilla de autos durante un mes. b) Obtener un
intervalo de confianza aproximado de 95% para el kilometraje promedio registrado para la flotilla
de autos durante un mes.

2. Una agencia de coches en una pequeña ciudad quiso tener información acerca del mercado de
autos nuevos para el próximo año. El comerciante obtuvo una lista de las 8746 personas en la
ciudad de 18 años de edad o más y seleccionó una muestra aleatoria de 500. El número de
personas en la muestra que planeaban comprar un automóvil nuevo durante el próximo año era
igual a 29. Halle un intervalo de confianza aproximado de 95% para la proporción de todas las
personas, de 18 años o más, en la ciudad que planean comprar un coche nuevo durante el año
próximo.

3. Una estación de televisión, que da servicio a un área de tres distritos, quiso estimar el número
promedio de horas diarias pasadas frente al televisor por familia en su zona de difusión. La
estación decidió seleccionar aleatoriamente una muestra de 1%, es decir, el 1% del número total
de familias en cada distrito. Se presenta un resumen de los datos en la tabla siguiente. Encuentre
un intervalo de confianza aproximado de 95% para el tiempo que en promedio pasa cada familia
frente al televisor en la zona de captación de señales de los tres distritos.
Número de familias Tamaño muestral Media muestral Varianza muestral
En el estrato i del estrato del estrato del estrato
Distrito Ni ni xi si2
1 12473 125 2.92 1.96
2 35241 352 2.14 1.21
3 23178 232 3.63 3.24
N = 70892

4. Un comerciante al por menor, que da servicio a dos pequeñas ciudades, realizó una encuesta para
determinar la cantidad total de dinero que las familias en esa área planean gastar en
electrodomésticos caros durante el año próximo. Se seleccionaron muestras aleatorias de 200
familias de cada ciudad. Se indican en la siguiente tabla los números de familias en cada ciudad
junto con la media muestral y la varianza de los gastos familiares planeados. Hallar un intervalo
de confianza aproximado de 95% para el total de los gastos previstos para las dos ciudades.

Número de familias Media muestral


Por ciudad Tamaño muestral (en dólares) Varianza muestral
Ciudad Ni ni xi si2
1 2149 200 134 40122
2 1872 200 168 37104
N = 4021

5. Refiérase al ejercicio 3. Estimar la proporción de todas las familias en la zona de los tres distritos
que prefieren los programas de la estación televisora, si las proporciones muestrales de quienes
tienen preferencia por los programas citados se dan en la tabla siguiente.

Número de familias Tamaño muestral Proporción muestral


en el estrato i del estrato del estrato
Distrito Ni ni p̂i
1 12473 125 0.21
2 35241 352 0.17
3 23178 232 0.34
N = 70892
6. Entre cuatro estratos se seleccionó una muestra aleatoria estratificada. Los datos pertinentes se
tienen a continuación. Encuentre un intervalo de confianza aproximado de 95% para la media
poblacional.

Número de Media muestral


unidades Tamaño muestral del estrato Varianza muestral
Estrato muestrales por del estrato xi del estrato
estrato ni si2
Ni
1 1000 200 421 2410
2 3000 200 502 2938
3 2000 200 325 2047
4 1000 200 280 2214

7. Se seleccionaron al azar veinte familias de una ciudad para estimar el ingreso medio por persona.
La ciudad tiene 12205 familias, con un total de 19200 asalariados. Los datos se encuentran en la
tabla siguiente. Obtener un intervalo de confianza aproximado de 95% para salario o sueldo
anual promedio por persona en la ciudad. Xi2 m i2

Número de asalariados Ingreso total


Familia Por familia por familia
i mi Ingreso anual ($) xi
1 2 12100; 27000 39100
2 1 23000 23000
3 2 18200; 12800 31000
4 2 20900; 14400 35300
5 1 29000 29000
6 1 26200 26200
7 2 14500; 18300 32800
8 2 16900; 19400 36300
9 1 48000 48000
10 3 19100; 12000; 7500 38600
11 1 26300 26300
12 1 35100 35100
13 3 17400; 18900; 12200 48500
14 2 16200; 19900 36100
15 1 13200 13200
16 1 18400 18400
17 2 13100; 14700 27800
18 1 21500 21500
19 2 22000; 8000 30000
20 2 14000; 7500 21500
20 20
 mi  33  xi  617700
i 1 i 1
8. Una gran cadena de tiendas de menudeo, compra camisas para hombres en lotes de una
docena cada uno. Después de recibir un cargamento de 1000 lotes, el comerciante seleccionó
aleatoriamente 21 de ellos y contó el número de camisas defectuosas por lote. Encuentre un
intervalo de confianza aproximado de 95% para la proporción p de camisas defectuosas en el
cargamento de 1000 lotes, basándose en los datos de la tabla a continuación.

Número de Número de Número de


Lote Defectuosas Lote Defectuosas Lote Defectuosas
i ai i ai i ai
1 0 8 1 15 1
2 1 9 6 16 1
3 0 10 0 17 0
4 1 11 0 18 2
5 2 12 2 19 8
6 0 13 1 20 0
7 0 14 0 21 0

9. Halle un intervalo de confianza aproximado de 95% para la media poblacional µ que se basa
en los datos de un muestreo por conglomerados que se indican en la tabla siguiente.
Supóngase que el número total de conglomerados en la población es N = 2000 y que el
tamaño medio conglomerados en la población en M = 3.2.

Conglomerados Conglomerados
i mi xi i mi xi
1 3 15 6 4 20
2 5 34 7 3 18
3 3 18 8 6 41
4 2 11 9 1 5
5 2 15 10 2 13

10. Refiérase al ejercicio anterior y encuentre un intervalo de confianza aproximado de 95% para
el total poblacional .

También podría gustarte