Introducción Al Muestreo

INTRODUCCIÓN AL MUESTREO
DEFINICIÓN.
La teoría del muestreo es el estudio de las relaciones existente entre una población y muestras
extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística.
IMPORTANCIA.
• Obtener alguna conclusión de una población

• Coste económico
• Tiempo empleado
TERMINOLOGÍA BÁSICA
Muestreo: La técnica para la selección de una muestra a partir de una población.
Unidad de análisis: Elemento del que se obtiene información
Variable: Se denomina variable estadística a una característica definida en la población

por la tarea o investigación estadística, que puede tomar dos o mas valores o
modalidades
Dato: Es el resultado de medir una característica observable de una unidad de

análisis.
Información: Es el resultado que se obtiene al procesar un conjunto de datos.
Error de estimación: Es la diferencia entre un estadístico y su parámetro

correspondiente. Siempre se comete un error, pero la naturaleza de la investigación nos
indicará hasta qué medida podemos cometerlo
Error de muestreo: Este error se debe a que una muestra no produce información
completa sobre una población. Estos errores se controlan con una buena selección del
diseño muestral.
Error de no muestreo: son los errores que se introducen imperceptiblemente y son

difíciles de controlar. Estos errores no se pueden medir fácilmente y aumentan a medida
que se aumenta el tamaño de la muestra.
TIPOS DE MUESTREO.
Aunque no existe una única forma de clasificar las técnicas de muestreo, es frecuente
clasificarlas en probabilísticas y no probabilísticas.
MUESTREO PROBABILÍSTICO.
Conocido también como muestreo de selección aleatoria, utiliza el azar como instrumento
de selección, pudiéndose calcular de antemano la probabilidad de que cada elemento sea
incluido en la muestra. El muestreo por azar o probabilístico presenta varias modalidades:
1. MUESTREO ALEATORIO SIMPLE.

Es la modalidad de muestreo más conocida y que alcanza mayor rigor científico.
Garantiza la equiprobabilidad de elección de cualquier elemento y la independencia
de selección de cualquier otro. En este procedimiento se extraen al azar un número
determinado de elementos, ‘n’, del conjunto mayor ‘N’ o población.
El M.A.S. puede ser de 2 formas: sin reposición (muestreo irrestricto aleatorio) y con
reposición.
CARACTERÍSTICAS
• Asigna probabilidades iguales de selección
• Necesita listado de unidades elementales (Marco de muestreo)

• Utiliza tabla de números aleatorios, urnas con bolas, generación de números
aleatorios por computadora, etc.
• Eficiente sólo en poblaciones homogéneas
• Aplicable en encuestas de pequeña escala
• Forma parte de diseños de muestra más complejos
PROCEDIMIENTO DE SELECCIÓN:
El procedimiento de selección de una muestra aleatoria simple consiste en:
• Enumerar las unidades de la población, desde 1 hasta N.
• Usando la tabla de números aleatorios seleccionar la primera unidad para la

muestra.
• Continuar la selección excluyendo las unidades repetidas (si es sin reposición) o

incluyendo las unidades repetidas (si es con reposición) hasta completar el tamaño
de muestra n.
EJEMPLO
Se tiene un listado de 270 pacientes con cierta enfermedad cuyas edades están entre 20 y
45 años. Supongamos que los 270 pacientes constituyen un universo de N=270 unidades
muestrales. Se desea seleccionar una MIA de n = 35 pacientes, utilizando números
aleatorios entre 1 y 270.
En Excel con el comando: ALEATORIO()*(270-1)+1, se obtiene:
041,145, 066, 253, 002, 208, 259, 183, 170, 257
244, 045, 219, 091, 167, 229, 035, 164, 086, 138
067, 0.59, 206, 267, 081, 172, 169, 135, 046, 119
075, 022, 095, 065, 139.
TAMAÑO DE MUESTRA
El tamaño de la muestra, un tema que siempre preocupa, no tiene fácil solución y va

estrechamente unido a la representatividad. En principio hay que rechazar la idea,
demasiado extendida, de que la muestra debe ser proporcional a la población. Para
calcular el tamaño de la muestra se debe tener en cuenta tres factores:
- El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra
hacia la población.
- El porcentaje de error que se pretende aceptar al momento de hacer la generalización
- El nivel de variabilidad que se calcula para comprobar la hipótesis.
TAMAÑO DE MUESTRA PARA ESTIMAR 𝛍
Si se quiere estimar 𝛍, con precisión, e es fijada por el investigador, el tamaño de la

muestra necesario es:
Z02 ∙ N ∙ σ2
n= 2 2 Poblacion finita.
Z0 ∙ σ + (N − 1) ∙ e2
Z02 ∙ σ2
n= Poblacion infinita
e2
Donde:
σ2 : Es la varianza poblacional. (En la practica σ2 es estimado por S 2 a partir de una

encuesta anterior o de una muestra piloto.
Z0 : Se calcula utilizando el nivel de confianza, si esta es 95% entonces Z0 = 1.96
e : Porcentaje de error.
TAMAÑO DE MUESTRA PARA ESTIMAR p
De manera similar, la fórmula del amaño de muestra n para la estimación de p con un

error máximo de e y un nivel de confianza dado es:
Z02 ∙ N ∙ p ∙ (1 − p)
n= 2 Poblacion finita.
Z0 ∙ p ∙ (1 − p) + (N − 1) ∙ e2
Z02 ∙ p ∙ (1 − p)
n= Poblacion infinita
e2
En el caso de que el valor de p sea desconocido, se debe sustituir por 0.5 o estimado
preliminarmente de una muestra anterior, o de una muestra piloto.
2. MUESTREO ALEATORIO SISTEMÁTICO.

Es una técnica de muestreo que requiere de una selección aleatoria inicial de
observaciones seguida de otra selección de observaciones obtenida usando algún
sistema o regla
CARACTERÍSTICAS
• Asigna probabilidades iguales de selección
• No siempre necesita listado de unidades
• No requiere tabla de números aleatorios, ni urnas con bolas, ni generación de

números aleatorios por computadora, etc.
• Eficiente en poblaciones homogéneas

• La muestra se distribuye uniformemente en toda la población, siempre que exista
una “buena” ordenación en el marco de muestreo
• Aplicable en encuestas de pequeña escala y en la selección en campo
• Forma parte de diseños de muestra más complejos
PROCEDIMIENTO DE SELECCIÓN:
El procedimiento de selección de un muestreo sistemático consiste en:
• Las unidades del marco deben ser adecuadamente ordenadas. Luego se enumera
desde 1 hasta N
• Determinar el intervalo de selección k (k debe ser un número entero)
𝑁
𝑘=
𝑛
• Seleccionar un numero aleatorio entre 1 y k llamado arranque aleatorio (a),

entonces los elementos de la muestra sistemática, son los que ocupan las posiciones
en el marco: a, k+a, 2k+a, 3k+a,......(n-1)k+a , etc
EJEMPLO:
EJEMPLO
De la población de 270 pacientes, se desea seleccionar una muestra sistemática de 30

pacientes. Antes de realizar la selección, se ordenó el listado en función a sus
edades, de menor a mayor.
Se tiene, N = 270 y n = 30, entonces el intervalo de selección es:
k = 9, es exactamente entero.
Luego, el arranque aleatorio es a=5. Por lo tanto, los pacientes elegidos para la
muestra son los que ocupan la posición:
005, 014, 023, 032, 041, 050, 059, 068, 077, 086
095, 104, 113, 122, 131, 140, 149, 158, 167, 176
185, 194, 203, 212, 221, 230, 239, 248, 257, 266
3. MUESTREO ESTRATIFICADO.
Este muestreo se utiliza cuando la población está constituida en estratos o conjuntos
de la población homogéneos con respecto a la característica que se estudia. Dentro de
cada estrato se puede aplicar el muestreo aleatorio o sistemático. Consiste en
subdividir la población en subgrupos o estratos con arreglo a la/s característica/s que
se consideren y en elegir la muestra de modo que estén representados los diferentes
estratos. Para la obtención de la muestra estratificada se siguen los siguientes pasos:
- se divide la población en estratos.

- de cada estrato se extrae una muestra por algún procedimiento de muestreo.
- el número de individuos de cada estrato se puede decidir por paridad o
proporcionalidad.
- la suma de las muestras de cada estrato forma la muestra total ‘n’
Dentro del muestreo estratificado suele distinguirse:

Muestreo estratificado constante. La muestra se obtiene seleccionando un número igual
de individuos de cada estrato en que se ha dividido la población, con independencia del
tamaño y variabilidad de los mismos dentro de la población. Es decir
n
ni = con i: 1,2, … , k estratos
k
M. Estratificado proporcional. En este caso se selecciona de cada estrato un número de

elementos proporcional a su tamaño en el conjunto de la población.
Es decir:
Ni
ni = n ( ) con i: 1,2, … , k estratos
N
4. MUESTREO POR CONGLOMERADO
Una muestra por conglomerados es una muestra aleatoria en la que cada unidad
de muestreo es un conjunto o conglomerado de elementos.
El proceso es elegir en forma aleatoria uno o varios conglomerados y la muestra

estará formada por todos los elementos de los conglomerados seleccionados.
Es la selección de grupos de estudio o colecciones de elementos llamados

conglomerados en lugar de unidades de estudio individuales (generalmente son
unidades geográficas)
Los conglomerados pueden ser del mismo tamaño y han de ser lo más
heterogéneos posibles dentro de ellos y lo más homogéneos posibles entre ellos.
En el muestreo por conglomerados no se necesita un marco muy específico como
en el caso del muestreo aleatorio simple en el que era necesario disponer de un
listado de unidades de la población, o como en el muestreo estratificado, donde
era necesario disponer de listados de unidades por estratos. Para este muestreo
sólo es necesario un marco de conglomerados que será más fácil de conseguir y
más barato.
La eficiencia de este tipo de muestreo disminuye al aumentar el tamaño de los
conglomerados, cuando en realidad este tipo de muestreo es más útil en caso de
poblaciones muy numerosas en las que se puedan construir conglomerados
grandes.
EJEMPLO:
En las encuestas de opinión durante las elecciones generales, los conglomerados
pueden ser las mesas de votación, y lo que se hace es seleccionar en forma
aleatoria o sistemática algunas mesas, y considerar a todos los votos de las mesas
seleccionadas
MUESTREO NO PROBABILÍSTICO
El muestreo no probabilístico es aquél para el que no puede calcularse la probabilidad

de extracción de una determinada muestra. Se busca seleccionar a individuos que se
juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo
tanto, se considera que la información aportada por esas personas es vital para la
toma de decisiones.
Dentro de los métodos de muestreo no probabilísticos encontramos los siguientes

tipos:
1. Muestreo accidental: Es un muestreo no probabilístico donde el investigador elige

a aquellos individuos que están a mano. Por ejemplo, un periodista que va por la calle
preguntando a las personas que salen a su paso, sin atender ningún criterio especial de
elección. No es probabilística porque aquellas personas que no pasan por ese sitio no
tienen la posibilidad de entrar en la muestra.
2. Muestreo por cuotas: Se aplica en la última fase del muestreo, y consiste en facilitar
al entrevistador el perfil de las personas que tiene que entrevistar dejando su criterio,
la elección de las mismas, siempre y cuando cumplan con el perfil.
3. Muestreo por juicio: se busca seleccionar a individuos que se juzga de antemano

tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que
la información aportada por esas personas es vital para la toma de decisiones.
DISTRIBUCIONES MUÉSTRALES
Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de
comportamiento (predecible) en repetidas muestras. Este patrón es llamado la distribución
muestral de la estadística.
Si conocemos la distribución muestral podemos hacer inferencia. Las distribuciones muéstrales

adoptan diferentes formas según las estadísticas investigadas y las características de la población
estudiada.
Es la distribución de probabilidades de un estimador o estadístico, la cual se genera con todas

las muestras posibles de tamaño “n” que se pueda extraer de una población, con o sin reemplazo
Todo lo que estudiaremos a continuación está pensado para poblaciones infinitas (muy grandes)
y con muestreo aleatorio simple. El muestreo aleatorio simple garantiza una muestra
representativa de la población y la obtención de observaciones independientes.
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
La distribución muestral de la media es la distribución de los valores de las medias

muéstrales de todas las posibles muestras del mismo tamaño n tomadas de la misma población
Si sacamos muestras aleatorias de tamaño n de una población con media 𝜇 y desviación estándar
σ, entonces la distribución muestral de la media muestral tiene las siguientes propiedades:
1. El promedio de todos los valores posibles de medias muestrales es igual al parámetro μ.

En otras palabras, la media muestral𝑥̅ es un estimador insesgado de μ.
𝜇𝑥̅ = 𝜇
2. Error estándar de la media muestral: Es la desviación estándar de las posibles medias

muestrales.
𝜎
𝜎𝑥̅ =
√𝑛
El error estándar disminuye si el tamaño de la muestra aumenta.
Se puede interpretar como el grado de variabilidad que tiene la media muestral con
respecto a la media poblacional. En otras palabras es una medida de la incertidumbre que
existe al estimarla media poblacional a partir de la media muestral
3. Si la muestra es obtenida sin remplazo de una población finita de tamaño 𝑁, entonces el

error estándar es
𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁 − 1
𝑁−𝑛
El coeficiente es denominado factor de corrección para población finita. Se observa
𝑁−1
que cuando 𝑁 → +∞ el factor de corrección tiende a uno.
4. Si la población original tiene distribución Normal, entonces para cualquier tamaño

muestral"n" la distribución de la media muestral es también Normal
𝜎
𝑆𝑖 𝑋 ~ 𝑁(𝜇, 𝜎) ⇒ 𝑥̅ ~ 𝑁 (𝜇, )
√𝑛
5. Si la población de origen no es Normal pero podemos calcular su media y desviación
estándar y el tamaño muestral (n) es “suficientemente” grande la distribución de la media
muestral es aproximadamente Normal
σ
Aun si X no es N(μ, σ) ⇒ x̅ ~ N (μ, )
√n
Este resultado se conoce como el Teorema del Límite Central.
TEOREMA DEL LÍMITE CENTRAL

Este es uno de los teoremas más importantes en probabilidad y en general en estadística.
Si 𝑥̅ es la media de una muestra de tamaño n que se toma de una población normal con
𝑥̅ −𝜇
media 𝜇 y varianza 𝜎 2 entonces la variable 𝑍 = 𝜎 tiende a la distribución normal
⁄ 𝑛
√
estándar a medida que n tiende a infinito. Es decir:
𝑥̅ − 𝜇 (𝑥̅ − 𝜇)√𝑛
𝑍=𝜎 = ~ 𝑁(0,1)
⁄ 𝑛 𝜎
√
Observación: cuando se desconoce la varianza poblacional y se tiene que estimar a partir de

∑(𝑋𝑖 −𝑋̅)2 𝑥̅ −𝜇
los datos de la muestra como 𝑆 2 = entonces la estadística 𝑇 = 𝑠 tiene una
𝑛−1 ⁄ 𝑛
√
distribución t de Student con n –1 grado de libertad
EJEMPLOS:
1. Una empresa de investigación llevo a cabo una encuesta para determinar la cantidad
media que los fumadores gastan en cigarrillos durante una semana. La empresa encontró
que la distribución de cantidades gastadas por semana tendía a seguir la distribución
normal, con una desviación estándar de s/8. Una muestra aleatoria de 126 fumadores
revelo que en promedio gastan s/45 por semana
a) Con el nivel de confianza del 95%

Datos:
𝑛 = 126 (Para 𝑛 > 30 se elige Z de una muestra)
𝜎=8
𝑥̅ = 45
Nivel de confianza = 1 − 𝛼 = 95% = 0.95
Media o promedio ( 𝑥̅ ) 𝑥̅ = 45
Desviación estándar (𝜎) 𝜎=8
𝜎 𝜎𝑥̅ = 0.713
Error estándar (𝜎𝑥̅ = )
√𝑛
Nivel de confianza (1 − 𝛼) Al 95 % 1 − 𝛼 = 0.95
𝑍0 = 𝑍1−𝛼 𝑍0 = 1.96
2
𝜎
𝑒 = 𝑍0 ∗ 𝜎𝑥̅ = 𝑍0 ∗ = 1.96 ∗ 0.713 = 1.39748
Error máximo (𝑒 = 𝑍0 ∗ 𝜎𝑥̅ ) √𝑛

Introducción Al Muestreo

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Introducción Al Muestreo

Cargado por

Copyright:

Formatos disponibles

INTRODUCCIÓN AL MUESTREO

• Obtener alguna conclusión de una población

Muestreo: La técnica para la selección de una muestra a partir de una población.

Unidad de análisis: Elemento del que se obtiene información

Variable: Se denomina variable estadística a una característica definida en la población

Dato: Es el resultado de medir una característica observable de una unidad de

Información: Es el resultado que se obtiene al procesar un conjunto de datos.

Error de estimación: Es la diferencia entre un estadístico y su parámetro

Error de no muestreo: son los errores que se introducen imperceptiblemente y son

1. MUESTREO ALEATORIO SIMPLE.

• Asigna probabilidades iguales de selección

• Necesita listado de unidades elementales (Marco de muestreo)

• Eficiente sólo en poblaciones homogéneas

• Aplicable en encuestas de pequeña escala

• Forma parte de diseños de muestra más complejos

El procedimiento de selección de una muestra aleatoria simple consiste en:

• Enumerar las unidades de la población, desde 1 hasta N.

• Usando la tabla de números aleatorios seleccionar la primera unidad para la

• Continuar la selección excluyendo las unidades repetidas (si es sin reposición) o

En Excel con el comando: ALEATORIO()*(270-1)+1, se obtiene:

041,145, 066, 253, 002, 208, 259, 183, 170, 257

075, 022, 095, 065, 139.

El tamaño de la muestra, un tema que siempre preocupa, no tiene fácil solución y va

TAMAÑO DE MUESTRA PARA ESTIMAR 𝛍

Si se quiere estimar 𝛍, con precisión, e es fijada por el investigador, el tamaño de la

σ2 : Es la varianza poblacional. (En la practica σ2 es estimado por S 2 a partir de una

Z0 : Se calcula utilizando el nivel de confianza, si esta es 95% entonces Z0 = 1.96

De manera similar, la fórmula del amaño de muestra n para la estimación de p con un

2. MUESTREO ALEATORIO SISTEMÁTICO.

• Asigna probabilidades iguales de selección

• No siempre necesita listado de unidades

• No requiere tabla de números aleatorios, ni urnas con bolas, ni generación de

• Eficiente en poblaciones homogéneas

• Aplicable en encuestas de pequeña escala y en la selección en campo

• Forma parte de diseños de muestra más complejos

El procedimiento de selección de un muestreo sistemático consiste en:

• Determinar el intervalo de selección k (k debe ser un número entero)

• Seleccionar un numero aleatorio entre 1 y k llamado arranque aleatorio (a),

De la población de 270 pacientes, se desea seleccionar una muestra sistemática de 30

Se tiene, N = 270 y n = 30, entonces el intervalo de selección es:

- se divide la población en estratos.

Dentro del muestreo estratificado suele distinguirse:

M. Estratificado proporcional. En este caso se selecciona de cada estrato un número de

4. MUESTREO POR CONGLOMERADO

El proceso es elegir en forma aleatoria uno o varios conglomerados y la muestra

Es la selección de grupos de estudio o colecciones de elementos llamados

El muestreo no probabilístico es aquél para el que no puede calcularse la probabilidad

Dentro de los métodos de muestreo no probabilísticos encontramos los siguientes

1. Muestreo accidental: Es un muestreo no probabilístico donde el investigador elige

3. Muestreo por juicio: se busca seleccionar a individuos que se juzga de antemano

Si conocemos la distribución muestral podemos hacer inferencia. Las distribuciones muéstrales

Es la distribución de probabilidades de un estimador o estadístico, la cual se genera con todas

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

La distribución muestral de la media es la distribución de los valores de las medias

1. El promedio de todos los valores posibles de medias muestrales es igual al parámetro μ.

2. Error estándar de la media muestral: Es la desviación estándar de las posibles medias

3. Si la muestra es obtenida sin remplazo de una población finita de tamaño 𝑁, entonces el

4. Si la población original tiene distribución Normal, entonces para cualquier tamaño

TEOREMA DEL LÍMITE CENTRAL

Observación: cuando se desconoce la varianza poblacional y se tiene que estimar a partir de

a) Con el nivel de confianza del 95%

Desviación estándar (𝜎) 𝜎=8