Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestreo
❑ Población y muestra
Parámetros y estadísticos
❑ Probabilidades en el muestreo con y sin reposición
Población general
Población dividida en categorías
❑ Muestreo para variables cuantitativas
Estadísticos como estimadores de los parámetros poblacionales (Inferencia)
Distribución en el muestreo de un estadístico
Teorema central del límite
Selección del tamaño muestral
Error aleatorio y error sistemático (sesgo) en el muestreo. Precisión y exactitud
❑ Estrategias de muestreo
Muestreos aleatorias y no aleatorios
Población y muestra
Población:
Conjunto de individuos Muestra:
bajo estudio
1 2 … n
1
2
… N
3
5
4
Muestra ordenada: 𝑥1 , 𝑥2 , … 𝑥𝑛
Muestreo CON reposición (MCR)
Muestra sin ordenar: 𝑥1 . 𝑥2 … 𝑥𝑛
Población:
𝑥1 , 𝑥2 , 𝑥3 … 𝑥𝑁 Muestra ordenada: 𝑥1 , 𝑥2 , … 𝑥𝑛
Muestreo SIN reposición (MSR)
Muestra sin ordenar: 𝑥1 . 𝑥2 … 𝑥𝑛
Probabilidades en el Muestreo
𝑀𝑂
1 1 1 1 1
𝑃𝑀𝐶𝑅 𝑥1 , 𝑥2 … 𝑥𝑛 = · … = 𝑛 = 𝑛
𝑁 𝑁 𝑁 𝑁 𝑉𝑅𝑁
𝑀𝐶𝑅
𝑀𝑁𝑂
1
𝑃𝑀𝐶𝑅 𝑥1 . 𝑥2 … 𝑥𝑛 = 𝑃𝑛 · 𝑛
𝑉𝑅𝑁
𝑀𝑂
1 1 1 1 1
𝑃𝑀𝑆𝑅 𝑥1 , 𝑥2 … 𝑥𝑛 = · … = = 𝑛
𝑁 𝑁 − 1 𝑁 − 𝑛 + 1 𝑁!Τ(𝑁 − 𝑛)! 𝑉𝑁
𝑀𝑆𝑅 1 1
𝑀𝑁𝑂
𝑃𝑀𝑆𝑅 𝑥1 . 𝑥2 … 𝑥𝑛 = 𝑃𝑛 · 𝑛 =
𝑉𝑁 𝑁
𝑛
Probabilidades en el Muestreo
𝑛1 𝑛2 𝑛3 𝑛 𝑛 𝑛
𝑁1 𝑁2 𝑁3 𝑉𝑅𝑁11 · 𝑉𝑅𝑁22 · 𝑉𝑅𝑁33
𝑀𝑂
𝑃𝑀𝐶𝑅 𝑛1 , 𝑛2 , 𝑛3 = · · = 𝑛
𝑁 𝑁 𝑁 𝑉𝑅𝑁
𝑀𝐶𝑅 𝑛 𝑛 𝑛
𝑛 ,𝑛2 ,𝑛3
𝑉𝑅𝑁11 · 𝑉𝑅𝑁22 · 𝑉𝑅𝑁33
𝑀𝑁𝑂
𝑃𝑀𝐶𝑅 𝑛1 . 𝑛2 . 𝑛3 = 𝑃𝑅𝑛 1 · 𝑛
𝑉𝑅𝑁
𝑛
𝑀𝑂
𝑁1 𝑁1 − 1 𝑁1 − 𝑛1 + 1 ς3𝑖=1 𝑁𝑖 !Τ 𝑁𝑖 − 𝑛𝑖 ! ς31 𝑉𝑁𝑖𝑖
𝑃𝑀𝑆𝑅 𝑛1 , 𝑛2 , 𝑛3 = · … ⋯= =
𝑁 𝑁−1 𝑁−𝑛+1 𝑁!Τ 𝑁 − 𝑛 ! 𝑉𝑁𝑛
𝑀𝑆𝑅 𝑁1 𝑁 𝑁 𝑁
· 2 · 3 ς3𝑖=1 𝑖
𝑛 𝑛2 𝑛3 𝑛𝑖
𝑀𝑁𝑂
𝑃𝑀𝑆𝑅 𝑛1 . 𝑛2 . 𝑛3 = 1 =
𝑁 𝑁
𝑛 𝑛
Probabilidades en el Muestreo
MO MNO
1 𝑛!
MCR 𝑛 𝑛
𝑉𝑅𝑁 𝑉𝑅𝑁
1 1
MSR 𝑁
𝑉𝑁𝑛
𝑛
❑ En una población dividida en dos (o más categorías). Distribución del número de elementos que
pertenecen a una cierta categoría en una muestra de tamaño “n” (o de la proporción de elementos
que pertenecen a esa categoría) (Distribución Binomial)
Población dividida en dos clases (A y B), se toma una muestra de tamaño “n”:
𝐴~ℬ(𝑛, 𝑝) n=1
P(A) = NA/N = p
P(B) = NB/N = q = 1 - p
Extracciones
n > 1 (p.ej. n = 3) sucesivas con
“A” = nº azules reemplazamiento
A=3 P(A=3) = p3
❑ Inferencia estadística
La Inferencia Estadística persigue determinar los parámetros de una población a
partir de los estadísticos calculados en una muestra de esa población.
Para que una muestra se pueda emplear adecuadamente para estimar los
parámetros de la población, debe ser una Muestra aleatoria (cualquier individuo
de la población tiene la misma P de ser elegido)
❑ Estimadores
Un estadístico [𝑇(𝑥𝑖)] que se puede utilizar para estimar un parámetro poblacional
[θ] es un estimador de ese parámetro, escribimos que 𝑇 = 𝜃
Propiedades (deseables) de los estimadores:
➢ Suficiente: T(xi) utiliza la mayor información posible de la muestra
➢ No sesgado (centrado): E(T) = θ [𝑆𝑒𝑠𝑔𝑜 = 𝐵𝑖𝑎𝑠 = 𝜃 − 𝐸(𝑇)]
➢ Consistente: lim 𝑇(𝑥1 , 𝑥2 ,…𝑥𝑛 ) = 𝜃
𝑛՜∞
➢ Eficiente: 𝑇(𝑥𝑖) tiene un sesgo y una varianza lo más bajos posibles
❑ Distribución en el muestreo
Cualquier estadístico es una variable aleatoria (toma un valor real según el
resultado del proceso aleatorio del muestreo). A diferentes muestras, cada una
con su probabilidad, les corresponde un valor dado del estadístico
La distribución de la V.A. de un determinado estadístico se llama Distribución en
el muestreo de ese estadístico
Distribución en el muestreo
Población:
Conjunto de individuos Muestra:
bajo estudio
1 2 … n
1
2
… N Estadísticos de la muestra:
3 𝑛
5 1
4 𝑥ҧ = 𝑥𝑖 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑛
𝑖=1
𝑛
1
𝑆2 = (𝑥𝑖 − 𝑥)ҧ 2 𝐶𝑢𝑎𝑠𝑖 − 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Parámetros de la población: 𝑛−1
𝑁 𝑖=1
1
𝜇= 𝑥𝑖 𝑀𝑒𝑑𝑖𝑎 (𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙)
𝑁
𝑁
𝑖=1 Estimadores:
1 𝑥 ՜ 𝜇 ∵ 𝐸 𝑥ҧ = 𝜇 𝑦 𝑥 = 𝜇Ƹ
𝜎2 = (𝑥𝑖 − 𝜇)2 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙)
𝑁
𝑖=1 𝑆2 ՜ 𝜎2 ∵ 𝐸 𝑆2 = 𝜎2 𝑦 𝑆 2 = 𝜎ො 2
Distribución en el muestreo
ഥ~𝓝 𝝁, 𝝈𝟐 Τ𝒏
𝒙 ―distribución en el muestreo de 𝑥ҧ
20
18
Población 16
𝐸 𝑥ҧ = 𝜇 = 4
14
𝑥𝑖 𝑛𝑖 𝜎2
Frecuencia
12
10 𝑉 𝑥ҧ = = 2/3
2 5 Muestreo C.R.
8
𝑛
3 5 n=3 6
4 5
4
2
𝑥ҧ ~ 𝒩 (4, 2Τ3)
0
5 5 2.00 2.33 2.67 3.00 3.33 3.67 4.00 4.33 4.67 5.00 5.33 5.67 6.00
Media muestral
6 5
30
25
Parámetros:
20
𝐸(𝑠 2 ) = 𝜎 2 = 2
Frecuencia
15
μ=4 10
Pero la distribución
de s2 no es
σ2 = 2 5 normal…
N = 25 0
0.00 0.33 1.00 1.33 2.33 3.00 4.00 4.33 5.33
Varianza muestral
Elección el tamaño de la muestra
❑ Elección del tamaño de la muestra para que la estima de la media (𝑥) se encuentre tan
cerca de la media poblacional (𝜇) como queramos, con un error inferior a un cierto valor “d”
𝜎 1 1
Error estándar del estadístico 𝑥 : 𝑠. 𝑒. = 𝜎 𝑥 = ≈ · σ𝑛𝑖=1(𝑥𝑖 − 𝑥)2 es la desviación típica
𝑛 𝑛 𝑛−1
de la distribución en el muestreo de 𝑥 𝑥~𝒩(𝜇, 𝜎 2 Τ𝑛)
En una población dada ¿cuál debe ser el tamaño n de la muestra para que tengamos una
seguridad α de que la estima de la media 𝑥 se encuentra más cerca de la verdadera media
poblacional μ que un cierto valor d fijado de antemano?
❑ Elección del tamaño de la muestra para que la estima de la media (𝑥) se encuentre tan
cerca de la media poblacional (𝜇) como queramos, con un error inferior a un cierto valor “d”
Margen de error (error absoluto) prefijado:
𝑠 · 𝑧1−𝛼Τ2 2
𝑃 𝑥−𝜇 <𝑑 >1−𝛼 ֞ 𝑛≥
𝑑
Error relativo prefijado:
2
𝑥−𝜇 (𝑠Τ𝑥) · 𝑧1−𝛼Τ2
𝑃 <𝜀 >1−𝛼 ֞ 𝑛≥
𝜇 𝜀
Ejemplo: Dada la muestra 12,14,13,9,6,10,16,15,13 calcular el número de elementos necesarios
para que una muestra de esa población dé como resultado una estima de la media poblacional
con un error absoluto inferior a d=2 con a) una probabilidad del 95%; b) una probabilidad del 99%.
Hacer los mismos cálculos para un error relativo (ε) inferior c) al 10%, d) al 5%.
2
𝑀𝑢𝑒𝑠𝑡𝑟𝑎 12,14,13,9,6,10,16,15,13 𝑠·𝑧1−𝛼Τ2 2 (𝑠Τ𝑥)·𝑧1−𝛼Τ2
a) y b) 𝑛 ≥ c) y d) 𝑛 ≥
𝑑 𝑑
𝑥 = 𝜇Ƹ = 6 ՜ 𝑏1 = −2
𝑀é𝑡𝑜𝑑𝑜 1: 5,6,6,6,7 Preciso, inexacto
𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 0. 3162
𝑥 = 𝜇Ƹ = 8 ՜ 𝑏2 = 0
𝑀é𝑡𝑜𝑑𝑜 2: 2,4,6,8,10 Impreciso, exacto
Población 𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 1.4142
𝜇=8
𝑥 = 𝜇Ƹ = 6 ՜ 𝑏3 = −2
𝑀é𝑡𝑜𝑑𝑜 3: 4,6,8,10,12 Impreciso, inexacto
𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 1.4142
𝑥 = 𝜇Ƹ = 8 ՜ 𝑏4 = 0
𝑀é𝑡𝑜𝑑𝑜 4: 7,8,8,8,9 Preciso, exacto
𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 0. 3162
Error aleatorio y error sistemático
❑ Métodos de muestreo
Muestreos no aleatorios
➢ Muestreo casual (haphazard sampling): población completamente
homogénea, elegimos cualquier elemento
➢ Muestreo experto (judgement sampling): a criterio de un buen conocedor
del tema (se introduce un sesgo de elección)
Muestreos aleatorios
➢ Muestreo aleatorio simple (simple random sampling)
Procedimiento para elegir una muestra aleatoria
➢ Muestreo por conglomerados (cluster sampling)
➢ Muestreo bi-etápico (two-stage sampling): seleccionamos unidades
primarias al azar y dentro de ellas tomamos muestras al azar
➢ Muestreo aleatorio estratificado (stratified sampling): dividimos la
población en estratos y muestreamos dentro de cada estrato
➢ Muestreo doble (double sampling): podemos medir 2 características de la
población cuyos resultados están muy bien relacionados: solo medimos la
más barata o más sencilla.
➢ Muestreo sistemático (systematic sampling)
Estrategias de muestreo (aleatorio)
❑ Muestreo no aleatorio
Muestreo casual (haphazard sampling)
En una población que se asume que es completamente homogénea podemos elegir cualquier
conjunto de elementos como muestras, sin preocuparnos de que la elección sea aleatoria
Muestreo experto (judgement sampling)
La elección e la muestra se deja a criterio de un buen conocedor del tema que juzga que la
muestra elegida sea representativa de la población (se introduce un sesgo de elección)
Población (N=16)
g a h Muestra (n=4)
c i
k j
ñ
d l n
b m
o f e