Está en la página 1de 14

INTRODUCCIÓN AL MUESTREO

DEFINICIÓN.

La teoría del muestreo es el estudio de las relaciones existente entre una población y muestras
extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística.

IMPORTANCIA.

• Obtener alguna conclusión de una población


• Coste económico
• Tiempo empleado

TERMINOLOGÍA BÁSICA

Muestreo: La técnica para la selección de una muestra a partir de una población.

Unidad de análisis: Elemento del que se obtiene información

Variable: Se denomina variable estadística a una característica definida en la población


por la tarea o investigación estadística, que puede tomar dos o mas valores o
modalidades

Dato: Es el resultado de medir una característica observable de una unidad de


análisis.

Información: Es el resultado que se obtiene al procesar un conjunto de datos.

Error de estimación: Es la diferencia entre un estadístico y su parámetro


correspondiente. Siempre se comete un error, pero la naturaleza de la investigación nos
indicará hasta qué medida podemos cometerlo

Error de muestreo: Este error se debe a que una muestra no produce información
completa sobre una población. Estos errores se controlan con una buena selección del
diseño muestral.

Error de no muestreo: son los errores que se introducen imperceptiblemente y son


difíciles de controlar. Estos errores no se pueden medir fácilmente y aumentan a medida
que se aumenta el tamaño de la muestra.
TIPOS DE MUESTREO.

Aunque no existe una única forma de clasificar las técnicas de muestreo, es frecuente
clasificarlas en probabilísticas y no probabilísticas.

MUESTREO PROBABILÍSTICO.

Conocido también como muestreo de selección aleatoria, utiliza el azar como instrumento
de selección, pudiéndose calcular de antemano la probabilidad de que cada elemento sea
incluido en la muestra. El muestreo por azar o probabilístico presenta varias modalidades:

1. MUESTREO ALEATORIO SIMPLE.


Es la modalidad de muestreo más conocida y que alcanza mayor rigor científico.
Garantiza la equiprobabilidad de elección de cualquier elemento y la independencia
de selección de cualquier otro. En este procedimiento se extraen al azar un número
determinado de elementos, ‘n’, del conjunto mayor ‘N’ o población.

El M.A.S. puede ser de 2 formas: sin reposición (muestreo irrestricto aleatorio) y con
reposición.

CARACTERÍSTICAS

• Asigna probabilidades iguales de selección

• Necesita listado de unidades elementales (Marco de muestreo)


• Utiliza tabla de números aleatorios, urnas con bolas, generación de números
aleatorios por computadora, etc.

• Eficiente sólo en poblaciones homogéneas

• Aplicable en encuestas de pequeña escala

• Forma parte de diseños de muestra más complejos

PROCEDIMIENTO DE SELECCIÓN:

El procedimiento de selección de una muestra aleatoria simple consiste en:

• Enumerar las unidades de la población, desde 1 hasta N.

• Usando la tabla de números aleatorios seleccionar la primera unidad para la


muestra.

• Continuar la selección excluyendo las unidades repetidas (si es sin reposición) o


incluyendo las unidades repetidas (si es con reposición) hasta completar el tamaño
de muestra n.

EJEMPLO

Se tiene un listado de 270 pacientes con cierta enfermedad cuyas edades están entre 20 y
45 años. Supongamos que los 270 pacientes constituyen un universo de N=270 unidades
muestrales. Se desea seleccionar una MIA de n = 35 pacientes, utilizando números
aleatorios entre 1 y 270.

En Excel con el comando: ALEATORIO()*(270-1)+1, se obtiene:

041,145, 066, 253, 002, 208, 259, 183, 170, 257

244, 045, 219, 091, 167, 229, 035, 164, 086, 138

067, 0.59, 206, 267, 081, 172, 169, 135, 046, 119

075, 022, 095, 065, 139.

TAMAÑO DE MUESTRA

El tamaño de la muestra, un tema que siempre preocupa, no tiene fácil solución y va


estrechamente unido a la representatividad. En principio hay que rechazar la idea,
demasiado extendida, de que la muestra debe ser proporcional a la población. Para
calcular el tamaño de la muestra se debe tener en cuenta tres factores:

- El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra
hacia la población.
- El porcentaje de error que se pretende aceptar al momento de hacer la generalización
- El nivel de variabilidad que se calcula para comprobar la hipótesis.

TAMAÑO DE MUESTRA PARA ESTIMAR 𝛍

Si se quiere estimar 𝛍, con precisión, e es fijada por el investigador, el tamaño de la


muestra necesario es:

Z02 ∙ N ∙ σ2
n= 2 2 Poblacion finita.
Z0 ∙ σ + (N − 1) ∙ e2

Z02 ∙ σ2
n= Poblacion infinita
e2
Donde:

σ2 : Es la varianza poblacional. (En la practica σ2 es estimado por S 2 a partir de una


encuesta anterior o de una muestra piloto.

Z0 : Se calcula utilizando el nivel de confianza, si esta es 95% entonces Z0 = 1.96

e : Porcentaje de error.
TAMAÑO DE MUESTRA PARA ESTIMAR p

De manera similar, la fórmula del amaño de muestra n para la estimación de p con un


error máximo de e y un nivel de confianza dado es:

Z02 ∙ N ∙ p ∙ (1 − p)
n= 2 Poblacion finita.
Z0 ∙ p ∙ (1 − p) + (N − 1) ∙ e2

Z02 ∙ p ∙ (1 − p)
n= Poblacion infinita
e2
En el caso de que el valor de p sea desconocido, se debe sustituir por 0.5 o estimado
preliminarmente de una muestra anterior, o de una muestra piloto.

2. MUESTREO ALEATORIO SISTEMÁTICO.


Es una técnica de muestreo que requiere de una selección aleatoria inicial de
observaciones seguida de otra selección de observaciones obtenida usando algún
sistema o regla

CARACTERÍSTICAS

• Asigna probabilidades iguales de selección

• No siempre necesita listado de unidades

• No requiere tabla de números aleatorios, ni urnas con bolas, ni generación de


números aleatorios por computadora, etc.

• Eficiente en poblaciones homogéneas


• La muestra se distribuye uniformemente en toda la población, siempre que exista
una “buena” ordenación en el marco de muestreo

• Aplicable en encuestas de pequeña escala y en la selección en campo

• Forma parte de diseños de muestra más complejos

PROCEDIMIENTO DE SELECCIÓN:

El procedimiento de selección de un muestreo sistemático consiste en:

• Las unidades del marco deben ser adecuadamente ordenadas. Luego se enumera
desde 1 hasta N

• Determinar el intervalo de selección k (k debe ser un número entero)

𝑁
𝑘=
𝑛

• Seleccionar un numero aleatorio entre 1 y k llamado arranque aleatorio (a),


entonces los elementos de la muestra sistemática, son los que ocupan las posiciones
en el marco: a, k+a, 2k+a, 3k+a,......(n-1)k+a , etc

EJEMPLO:
EJEMPLO

De la población de 270 pacientes, se desea seleccionar una muestra sistemática de 30


pacientes. Antes de realizar la selección, se ordenó el listado en función a sus
edades, de menor a mayor.

Se tiene, N = 270 y n = 30, entonces el intervalo de selección es:

k = 9, es exactamente entero.

Luego, el arranque aleatorio es a=5. Por lo tanto, los pacientes elegidos para la
muestra son los que ocupan la posición:

005, 014, 023, 032, 041, 050, 059, 068, 077, 086

095, 104, 113, 122, 131, 140, 149, 158, 167, 176

185, 194, 203, 212, 221, 230, 239, 248, 257, 266

3. MUESTREO ESTRATIFICADO.
Este muestreo se utiliza cuando la población está constituida en estratos o conjuntos
de la población homogéneos con respecto a la característica que se estudia. Dentro de
cada estrato se puede aplicar el muestreo aleatorio o sistemático. Consiste en
subdividir la población en subgrupos o estratos con arreglo a la/s característica/s que
se consideren y en elegir la muestra de modo que estén representados los diferentes
estratos. Para la obtención de la muestra estratificada se siguen los siguientes pasos:

- se divide la población en estratos.


- de cada estrato se extrae una muestra por algún procedimiento de muestreo.
- el número de individuos de cada estrato se puede decidir por paridad o
proporcionalidad.
- la suma de las muestras de cada estrato forma la muestra total ‘n’

Dentro del muestreo estratificado suele distinguirse:


Muestreo estratificado constante. La muestra se obtiene seleccionando un número igual
de individuos de cada estrato en que se ha dividido la población, con independencia del
tamaño y variabilidad de los mismos dentro de la población. Es decir
n
ni = con i: 1,2, … , k estratos
k

M. Estratificado proporcional. En este caso se selecciona de cada estrato un número de


elementos proporcional a su tamaño en el conjunto de la población.
Es decir:
Ni
ni = n ( ) con i: 1,2, … , k estratos
N

4. MUESTREO POR CONGLOMERADO

Una muestra por conglomerados es una muestra aleatoria en la que cada unidad
de muestreo es un conjunto o conglomerado de elementos.

El proceso es elegir en forma aleatoria uno o varios conglomerados y la muestra


estará formada por todos los elementos de los conglomerados seleccionados.

Es la selección de grupos de estudio o colecciones de elementos llamados


conglomerados en lugar de unidades de estudio individuales (generalmente son
unidades geográficas)
Los conglomerados pueden ser del mismo tamaño y han de ser lo más
heterogéneos posibles dentro de ellos y lo más homogéneos posibles entre ellos.
En el muestreo por conglomerados no se necesita un marco muy específico como
en el caso del muestreo aleatorio simple en el que era necesario disponer de un
listado de unidades de la población, o como en el muestreo estratificado, donde
era necesario disponer de listados de unidades por estratos. Para este muestreo
sólo es necesario un marco de conglomerados que será más fácil de conseguir y
más barato.
La eficiencia de este tipo de muestreo disminuye al aumentar el tamaño de los
conglomerados, cuando en realidad este tipo de muestreo es más útil en caso de
poblaciones muy numerosas en las que se puedan construir conglomerados
grandes.

EJEMPLO:
En las encuestas de opinión durante las elecciones generales, los conglomerados
pueden ser las mesas de votación, y lo que se hace es seleccionar en forma
aleatoria o sistemática algunas mesas, y considerar a todos los votos de las mesas
seleccionadas
MUESTREO NO PROBABILÍSTICO

El muestreo no probabilístico es aquél para el que no puede calcularse la probabilidad


de extracción de una determinada muestra. Se busca seleccionar a individuos que se
juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo
tanto, se considera que la información aportada por esas personas es vital para la
toma de decisiones.

Dentro de los métodos de muestreo no probabilísticos encontramos los siguientes


tipos:

1. Muestreo accidental: Es un muestreo no probabilístico donde el investigador elige


a aquellos individuos que están a mano. Por ejemplo, un periodista que va por la calle
preguntando a las personas que salen a su paso, sin atender ningún criterio especial de
elección. No es probabilística porque aquellas personas que no pasan por ese sitio no
tienen la posibilidad de entrar en la muestra.

2. Muestreo por cuotas: Se aplica en la última fase del muestreo, y consiste en facilitar
al entrevistador el perfil de las personas que tiene que entrevistar dejando su criterio,
la elección de las mismas, siempre y cuando cumplan con el perfil.

3. Muestreo por juicio: se busca seleccionar a individuos que se juzga de antemano


tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que
la información aportada por esas personas es vital para la toma de decisiones.
DISTRIBUCIONES MUÉSTRALES

Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de
comportamiento (predecible) en repetidas muestras. Este patrón es llamado la distribución
muestral de la estadística.

Si conocemos la distribución muestral podemos hacer inferencia. Las distribuciones muéstrales


adoptan diferentes formas según las estadísticas investigadas y las características de la población
estudiada.

Es la distribución de probabilidades de un estimador o estadístico, la cual se genera con todas


las muestras posibles de tamaño “n” que se pueda extraer de una población, con o sin reemplazo

Todo lo que estudiaremos a continuación está pensado para poblaciones infinitas (muy grandes)
y con muestreo aleatorio simple. El muestreo aleatorio simple garantiza una muestra
representativa de la población y la obtención de observaciones independientes.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

La distribución muestral de la media es la distribución de los valores de las medias


muéstrales de todas las posibles muestras del mismo tamaño n tomadas de la misma población

Si sacamos muestras aleatorias de tamaño n de una población con media 𝜇 y desviación estándar
σ, entonces la distribución muestral de la media muestral tiene las siguientes propiedades:

1. El promedio de todos los valores posibles de medias muestrales es igual al parámetro μ.


En otras palabras, la media muestral𝑥̅ es un estimador insesgado de μ.
𝜇𝑥̅ = 𝜇

2. Error estándar de la media muestral: Es la desviación estándar de las posibles medias


muestrales.
𝜎
𝜎𝑥̅ =
√𝑛
El error estándar disminuye si el tamaño de la muestra aumenta.
Se puede interpretar como el grado de variabilidad que tiene la media muestral con
respecto a la media poblacional. En otras palabras es una medida de la incertidumbre que
existe al estimarla media poblacional a partir de la media muestral

3. Si la muestra es obtenida sin remplazo de una población finita de tamaño 𝑁, entonces el


error estándar es
𝜎 𝑁−𝑛
𝜎𝑥̅ = √
√𝑛 𝑁 − 1
𝑁−𝑛
El coeficiente es denominado factor de corrección para población finita. Se observa
𝑁−1
que cuando 𝑁 → +∞ el factor de corrección tiende a uno.

4. Si la población original tiene distribución Normal, entonces para cualquier tamaño


muestral"n" la distribución de la media muestral es también Normal
𝜎
𝑆𝑖 𝑋 ~ 𝑁(𝜇, 𝜎) ⇒ 𝑥̅ ~ 𝑁 (𝜇, )
√𝑛
5. Si la población de origen no es Normal pero podemos calcular su media y desviación
estándar y el tamaño muestral (n) es “suficientemente” grande la distribución de la media
muestral es aproximadamente Normal
σ
Aun si X no es N(μ, σ) ⇒ x̅ ~ N (μ, )
√n
Este resultado se conoce como el Teorema del Límite Central.

TEOREMA DEL LÍMITE CENTRAL


Este es uno de los teoremas más importantes en probabilidad y en general en estadística.
Si 𝑥̅ es la media de una muestra de tamaño n que se toma de una población normal con
𝑥̅ −𝜇
media 𝜇 y varianza 𝜎 2 entonces la variable 𝑍 = 𝜎 tiende a la distribución normal
⁄ 𝑛

estándar a medida que n tiende a infinito. Es decir:
𝑥̅ − 𝜇 (𝑥̅ − 𝜇)√𝑛
𝑍=𝜎 = ~ 𝑁(0,1)
⁄ 𝑛 𝜎

Observación: cuando se desconoce la varianza poblacional y se tiene que estimar a partir de


∑(𝑋𝑖 −𝑋̅)2 𝑥̅ −𝜇
los datos de la muestra como 𝑆 2 = entonces la estadística 𝑇 = 𝑠 tiene una
𝑛−1 ⁄ 𝑛

distribución t de Student con n –1 grado de libertad
EJEMPLOS:

1. Una empresa de investigación llevo a cabo una encuesta para determinar la cantidad
media que los fumadores gastan en cigarrillos durante una semana. La empresa encontró
que la distribución de cantidades gastadas por semana tendía a seguir la distribución
normal, con una desviación estándar de s/8. Una muestra aleatoria de 126 fumadores
revelo que en promedio gastan s/45 por semana

a) Con el nivel de confianza del 95%


Datos:
𝑛 = 126 (Para 𝑛 > 30 se elige Z de una muestra)
𝜎=8
𝑥̅ = 45
Nivel de confianza = 1 − 𝛼 = 95% = 0.95

Media o promedio ( 𝑥̅ ) 𝑥̅ = 45

Desviación estándar (𝜎) 𝜎=8

𝜎 𝜎𝑥̅ = 0.713
Error estándar (𝜎𝑥̅ = )
√𝑛

Nivel de confianza (1 − 𝛼) Al 95 % 1 − 𝛼 = 0.95

𝑍0 = 𝑍1−𝛼 𝑍0 = 1.96
2

𝜎
𝑒 = 𝑍0 ∗ 𝜎𝑥̅ = 𝑍0 ∗ = 1.96 ∗ 0.713 = 1.39748
Error máximo (𝑒 = 𝑍0 ∗ 𝜎𝑥̅ ) √𝑛

También podría gustarte