Está en la página 1de 40

Universidad de Lima

Escuela de Negocios

CURSO: ESTADÍSTICA APLICADA I

APUNTES DEL CURSO No. 4

TEMA: INTRODUCCIÓN AL MUESTREO


Muestreo
"Por una muestra pequeña
podemos juzgar la pieza entera".
-- Cervantes Saavedra
¿Qué es el Muestreo?
 El Muestreo es el método que se utiliza para diseñar y seleccionar una muestra.
 El muestreo es un proceso que consiste en extraer un conjunto de datos de un marco o de varios marcos de muestreo. El objetivo del muestreo es estimar
los parámetros de la población (µ, , p) utilizando la información contenida en la muestra.
 La población puede ser finita, infinita numerable o infinita no numerable.
 El muestreo puede hacerse con o sin reemplazo. Si la población es finita pero muy grande, entonces es factible aplicar los conceptos de poblaciones infinitas.
Variable (X): Característica
de
La población que se
analiza en un estudio.
Objetivo Población Pueden ser:
de Estudio -Cuantitativas o
cualitativas.
(N) Muestra (n) -Discretas o continuas
X1, X2, X3,…Xn

Colección completa de todas


Porción representativa de la
las observaciones de interés
población que se selecciona
para el investigador.
para su estudio porque la
población es demasiado
grande para analizarla en su
totalidad.
MUESTRA

Sea una característica de la población en estudio con distribución de


probabilidad f (x,). Se dice que las v.a. X1, X2...... Xn, conforman una
muestra aleatoria (m.a.) de tamaño n si:

Cada Xi, i= 1,2, ...., n es una variable aleatoria con distribución idéntica-
Las variables aleatorias X1 .... Xn son independientes.

Muestra (n)
X1, X2, X3,…Xn
Razones para Muestrear
 La imposibilidad física de revisar todos los
integrantes de la población (casos).
 La naturaleza destructiva de algunas pruebas.
 Menor costo.
 Menor tiempo empleado y por tanto mayor rapidez
en la recolección y análisis (para tomar decisiones
oportunas).
 Datos disponibles limitados.
 Lo adecuado de los resultados de una muestra.
Requisitos
 La muestra debe ser representativa de la totalidad de la población en
cuanto a características importantes para el problema en estudio. Se
deben reflejat todos los elementos de la población en la muestra
(MUESTRA REPRESENTATIVA).

 El número de miembros seleccionados debe ser lo suficientemente


elevado para que las estimaciones tengan el grado de precisión
adecuado (MUESTRA ADECUADA).

 El método de selección debe permitir el cálculo de una medida del error


de muestreo.

 La muestra ha de ser lo más eficiente posible en cuanto a tiempo y


costo.

 El proceso de muestreo ha de tener el mínimo de errores no muestrales.


La Investigación por Muestreo - Etapas
 Establecimiento de Objetivos.
 Población Objetivo y Marco de Muestreo.
 Diseño de la muestra.
 Método de medición.
 Instrumento de medición.
 Capacitación de investigadores de campo.
 Prueba piloto.
 Organización del trabajo de campo.
 Análisis de los datos.
Términos técnicos en el Muestreo
• Población

Muestra
Términos usados en el muestreo
Unidad de muestreo (grupo)
Ejemplo: Un área / una sección

Unidad elemental
Ejemplo: Un trabajador / una
familia / un alumno
Unidad reportante
(proporciona los datos)
Términos usados en el muestreo

 Parámetro: Es un número que resume y describe información de una


variable poblacional.Describe el comportamiento de una característica de la
población. Es una valor constante y para calcularlo se deben tener todos los
datos de la población (µ, , p).

 Estadística o estadígrafo: Es una función de las n observaciones de una


muestra aleatoria. Sirve de base a todos los métodos estadísticos para hacer
inferencias con relación a poblaciones y sus parámetros.
Es una variable porque su valor puede cambiar de una muestra a otra
(ejemplo: la media muestral, la varianza muestral y la proporción muestral).
Tiene una distribución de probabilidad y se le llama distribución muestral.

 Datos: Son mediciones que son recolectadas de una población (tomando


una muestra). Ejemplo: precio, costo, ingresos, etc.
Términos usados en el muestreo
 Variable: Característica de la población o muestra que se
observa.

 Estadística descriptiva: Proceso de recopilación, organización y


presentación de un conjunto de datos.

 Estadística inferencial: Utilización de un conjunto de datos


muestrales para extraer inferencias o conclusiones sobre una
población.

 Muestreo sin reemplazo: Cuando una vez incluído en la


muestra un elemento de la población, sale de ésta y ya no se
puede seleccionar por segunda vez. Se usa con mayor
frecuencia que el muestreo con reemplazo.

 Muestreo con reemplazo: Cuando al seleccionar cada elemento


para la muestra, se regresa a la población. Un elemento que ya
se seleccionó se puede volver a seleccionar y, en consecuencia,
puede aparecer más de una vez en la muestra.
Términos usados en el muestreo
• Marco de muestreo

Base de datos (Registros)


El Marco Muestral
 Un marco muestral es una lista de las unidades a ser muestreadas
(registros).
 Se espera que la diferencia entre el marco y la población sea pequeña.
 Ejemplos:
- Si tomamos un hogar como unidad de muestreo, la guía telefónica o una
lista obtenida de los datos del censo podrían ser el marco muestral.
- Saga / Ripley: Base de datos de sus clientes.
- Para elaborar un estudio de los socios de un Club: Base de datos de los
socios.
 Todos los marcos presentan inconveniencias.
 Definición de muestra: Es una colección de unidades seleccionada de un
marco o de varios marcos muestrales.
 Observación: La información de la muestra será tan buena como lo es la
información contenida en el marco muestral.
Error Muestral
• Definición: Es el error natural que se origina por el
hecho de trabajar con una muestra. Diferencia entre el
estadístico de la muestra que sirve como estimación
del parámetro desconocido de la población y el propio
valor real del parámetro.
• Ejemplo: Se realizó una encuesta para determinar el
porcentaje de usuarios de un producto y los resultados
mostraron que el 61% usaban el producto. El análisis
mostró que el error muestral era de más o menos 3%.
Esto significa que el verdadero valor de la proporción
de usuarios estaría entre 58% (61-3) y 64% (61+3).
Error Muestral y Tamaño
de la Muestra

 Las muestras más grandes proporcionan errores de muestreo


más pequeños.

 Un aumento en el tamaño de la muestra, será siempre más


beneficioso en una muestra pequeña que en una grande, si
se trata de reducir el error muestral.

 El tamaño de la muestra se refiere siempre al número entero


real de unidades extraídas de la población, y no a un
porcentaje de la misma.
Error no Muestral
• Son errores metodológicos y/o de procedimiento.
• Normalmente, aumentan con el tamaño de la
muestra.
• Una muestra más grande no necesariamente
significa que es mejor.
• Ejemplos:
– Errores de los entrevistadores.
– Errores en el instrumento.
– Errores en el trabajo de campo o ejecución.
– Errores en el marco muestral.
Clasificación del Muestreo

Muestreo

Probabilístico No probabilístico
(Probabilidad)
Muestreo Probabilístico
 Los miembros de la muestra se seleccionan aplicando
un proceso aleatorio (no subjetivo).
 Los elementos de la población tienen una probabilidad
conocida de ser incluídos en la muestra.
 Se pueden usar fórmulas para determinarlas
propiedades de la distribución muestral. Ésta se puede
usar para establecer afirmaciones probabilísticas acerca
de posibles errores de muestreo asociados con los
resultados de la muestra. Permite estimar objetivamente
el error.
 Es superior a los métodos de muestreo no
probabilísticopara estimar las características de la
población.
 Permite determinar matemáticamente el tamaño de la
muestra.
Muestreo No Probabilístico
 Incluye aquellos métodos en los que algunos elementos del
juicio ó criterio humano está involucrado en las decisiones
a fin de lograr lo más conveniente.
 Se incorporan los elementos muestrales sin probabilidades
preespecificadas o conocidas de selección.
 La selección y recolección de los datos es fácil.
 No permiten estimar el error muestral.
 No podemos estar seguros de que la muestra sea
representativa.
 Ejemplos:
-Un profesor escoge a los primeros alumnos del registro de asistencia.
- Un supervisor recluta a los vendedores voluntarios que se ofrecen a efectuar una tarea.
- Un periodista puede formar una muestra de los tres congresistas que considera que reflejan
la opinión de la mayoría.
Técnicas de Muestreo
• Técnicas No probabilísticas
 Muestreo por conveniencia.
 Muestreo por juicio.
 Muestreo por cuotas.
 Muestreo bola de nieve.

• Técnicas probabilísticas
 Muestreo Aleatorio Simple.
 Muestreo Sistemático.
 Muestreo Estratificado.
 Muestreo de Conglomerados (racimos).
 Muestreo Multietápico.
El Muestreo Aleatorio Simple
 Es el proceso en el que las unidades de la muestra son
escogidas individual y directamente por un proceso aleatorio de
manera que cada unidad de población tiene la misma
probabilidad de ser seleccionada.
 Esto sólo se logra cuando se tienen listas disponibles que
puedan servir como un inventario de los elementos de la
población.
 En la práctica requiere que cada unidad pueda ser identificada y
nemrada antes de que se realice la selección.
 Se utiliza cuando la población no es muy grande.
 Se eligen al azar los elementos de la muestra.
 Se requiere emplear tablas de números aleatorios, urnas con
bolas u generación de números aleatorios por computadora, etc.
Muestreo Aleatorio Simple
Ejemplo:
Si se desea elegir una muestra de 50 clientes a partir de una población de
500 clientes de una tienda. La muestra se elige a partir de una lista de
los clientes inscritos en los archivos de la tienda, a cada uno de los
cuales se les asigna un número de identificación consecutivo.

Dos formas de elegir la muestra por el muestreo aleatorio simple:


1) Poner en una urna 500 papeles con la numeración correlativa de 1 a 500
y seleccionar en forma aleatoria 50 papeles. Los números seleccionados
corresponderán a los 50 clientes que conformarán la muestra (puesto
que cada cliente posee un número de identificación).
2) Emplear una tabla de números aleatorios, en la cual los números son
seleccionados por un proceso aleatorio con ayuda de la computadora.
Se puede elegir cualquier punto de inicio de la tabla y dirección; se debe
emplear el número de dígitos conforme el tamaño de la población.
50525 57454 28455 68226 34656 38884 39018
72507 53380 53827 42486 54465 71819 11999
Muestreo Sistemático
 En algunos casos, en especial cuando la población es grande, puede
llevar mucho tiempo la selección de una muestra aleatoria simple
(numerar los elementos de la población, seleccionar aleatoriamente
los números y luego identificar a los elementos de la población que
corresponden a dichos números).

 Una alternativa eficiente sería el muestreo sistemático.

 Los elementos de la población se ordenan de alguna forma


(aleatoriamente, alfabéticamente, según la fecha en que ingresaron a
la base de datos, etc.). Se selecciona al azar un punto de partida, y
después se elige para la muestra cada k-ésimo elemento de la
población (K=N/n).
Muestreo Sistemático
Ejemplo:
si se desea una muestra de 50 (n) de una población de 5,000 (N)
elementos, podríamos seleccionar un elemento de cada 100 (K)
elementos de la población (5,000/50). Si parto del elemento No. 5,
eligiremos posteriormente el elemento No. 105, 205, 305, etc, hasta
completar la muestra de 50.

No requiere tabla de números aleatorios, ni urnas, ni generación de


números aleatorios por computadora.

Es eficiente en poblaciones homogéneas.

No debe utilizarse este método si hay un patrón predeterminado en la


población pues se podría obtener una muestra sesgada.

No siempre se necesita un listado de unidades numerado en forma


correlativa (por ejemplo la elección de una de cada 10 facturas tomadas de
un archivador que contiene 200 facturas hasta completar una muestra de
20 facturas).
Muestreo Estratificado
 Por lo general se emplea cuando la población es heterogénea pero
contiene determinados grupos homogéneos.
 Primero se divide a los elementos de la población en grupos llamados
estratos. Cada elemento de la población debe pertenecer a un sólo
estrato.
 Después de formar los estratos se toma una muestra de cada uno de
ellos (proporcional o no proporcional).
 Si los elementos de cada estrato son homogéneos, el muestreo
estratificado producirá, empleando un menor tamaño muestral, resultados
tan precisos como el muestreo aleatorio simple.
 Reduce el costo del muestreo al reducir los tamaños de muestra sin
perder precisión.
 El criterio para la formación de los estratos queda a discreción del
investigador (por ubicación, edad, giro de negocio, estrato
socioeconómico, profesión, Facultad en la que estudia un alumno, etc.).
 Se requiere información para estratificar la población.
Muestreo Estratificado
Criterios
 HOMOGENEIDAD (Dentro):
Entre elementos de un mismo estrato.
 HETEROGENEIDAD (Entre):
Entre estratos.
 INDEPENDENCIA:
Entre estratos al seleccionar la muestra.
Muestreo Estratificado
Ejemplo:
Si se desea estudiar la inversión en maquinaria y equipos de las 1,000
(N) medianas empresas que han presentado las mayores utilidades el
año pasado en determinados sectores económicos. Para ello de divide a
las empresas por dichos sectores económicos (estratos) y se decide
obtener una muestra proporcional de 100 empresas empleando el
muestreo estratificado; es decir se requiere que en la muestra
seleccionada el número de elementos de cada estrato tenga la
misma proporción que se encuentra en la población.
Si se emplea el muestreo aleatorio simple se corre el riesgo de no
seleccionar ningún elemento del sector confecciones.

========================================================================
Estrato Sector Económico No. de empresas en N Porcentaje de N No. de empresas (n)
========================================================================
1 Confecciones 70 7% 7
2 Art. de cuero 130 13 % 13
3 Agro industria 500 50 % 50
4 Artesanía 100 10 % 10
5 Servicios 200 20 % 20
Total 1,000 100% 100
PROBLEMA: Heterogeneidad de las unidades
SOLUCIÓN: Estratificación de la población
ESTRATOS

POBLACIÓN

MUESTRA
Muestreo Estratificado
Población

.......
.

n1 n2 n3 nL

n = n1 + n2 + n3 +.........+ nL
Muestreo por Conglomerados
 Se divide a los elementos de la población en conjuntos o grupos
separados denominados conglomerados, unidades primarias o racimos.
 Cada elemento de la población debe pertenercer a un sólo conglomerado.
 Luego se toma una muestra aleatoria simple de los conglomerados.
Conforman la muestra todos los elementos dentro de cada conglomerado
muestreado.
 La medición se realiza a todos los elementos del conglomerado seleccionado.
 Cada uno de los conglomerados puede tener diferente número de elementos.
 Los conglomerados deben ser homogeneos pero los elementos dentro de los
conglomerados deben ser heterogéneos.
 En el caso ideal, cada conglomerado es una versión representativa, en pequeña
escala, de toda la población.
 Mientras más semejantes sean los conglomerados entre sí, al muestrear una
pequeña cantidad de conglomerados se obtendrán buenas estimaciones.
 El marco de muestreo es una lista de conglomerados.
 Se puede obtener un mayor tamaño de muestra con un costo bastante menort por
elemento y, por ende, un costo toal menor.
 Se utiliza en las investigaciones por muestreo a gran escala.
 Reduce el tiempo de la organización y ejecución del trabajo de campo.
Muestreo por Conglomerados
 Una de las principales aplicaciones del muestreo por Conglomerados
es el muestreo de áreas (cuando la población se encuentra dispersa
en un área geográfica grande), en las que los conglomerados son
distritos, manzanas urbanas u áreas bien definidas.

Ejemplo:
Se desea obtener información sobre el consumo de cierto producto de todas las
familias residentes en Miraflores. Con el propósito de subdividir una region extensa
en áreas menores, se divide la zona de Miraflores en manzanas; es decir se forman
70 conglomerados (manzanas) y se eligen 10 manzanas a fin de entrevistar a todas
las familias que conforman estas 10 manzanas. La muestra total estaría dada por
todas las familias residentes en las 10 manzanas elegidas.

 Por lo general se requiere un tamaño muestral total mayor que el muestreo aleatorio
o el muestreo estratificado. Sin embargo, se origina ahorro porque cuando se envía
al entrevistador a aplicar una encuesta a todos los elementos del conglomerado
(manzanas en el ejemplo) se podrán obtener muchas observaciones muestrales en
un tiempo relativamente corto y con mayor facilidad.
Muestreo por Conglomerados
Criterios

• Homogeneidad: (Entre)
Entre elementos de diferentes conglomerados.

• Heterogeneidad: (Dentro)
Entre elementos del mismo conglomerado.
Esquema gráfico de una muestra por
conglomerados
Conglomerado seleccionado

Conglomerado no
seleccionado
CONGLOMERADOS MUESTRA

POBLACIÓN

.
.
.

.
.
.

MUESTRA
Muestreo multietápico
 Selecciona primero una muestre de conglomerados. Luego,
selecciona una submuestra de elementos en cada
conglomerado seleccionado. Este tipo de muestreo se le
denomina muestreo en dos etapas o bietápico.

 La generalización de este muestreo a más etapas se llama


muestreo Multietápico o Polietápico.

 Ofrece las mismas ventajas del muestreo de


conglomerados, es decir, reducción del costo y tiempo.

 La muestra se distribuye mejor que en el muestreo de


conglomerados.
Esquema gráfico de una muestra
Unidad Primaria de bietápica Uidad Secundaria de
Muestreo (UPM) Muestreo (USM)
seleccionada seleccionada
UMS no seleccionada

Unidad Primaria de
Muestreo (USM) no
seleccionada