Está en la página 1de 22

Curso 2022-23

Administración y Dirección de Empresas


Programa conjunto en Ingeniería Informática-Administración y Dirección de Empresas
Estadística II - 27310
Estadística II - 39814

Muestreo

Profesor: Daniel Isidoro Ramírez


Email: disidoro66@unizar.es
Departamento de Métodos Estadísticos
Universidad de Zaragoza
BLOQUE 2: INTRODUCCIÓN A LA TEORÍA DE MUESTRAS
Tema 3. Introducción a la teoría de muestras

❑ Población y muestra
 Parámetros y estadísticos
❑ Probabilidades en el muestreo con y sin reposición
 Población general
 Población dividida en categorías
❑ Muestreo para variables cuantitativas
 Estadísticos como estimadores de los parámetros poblacionales (Inferencia)
 Distribución en el muestreo de un estadístico
 Teorema central del límite
 Selección del tamaño muestral
 Error aleatorio y error sistemático (sesgo) en el muestreo. Precisión y exactitud
❑ Estrategias de muestreo
 Muestreos aleatorias y no aleatorios
Población y muestra

❑ POBLACIÓN (o Universo): es el conjunto de todos los elementos (individuos o unidades


de muestreo) que queremos estudiar. Pueden estar caracterizados por variables
cualitativas (sexo, estado de desarrollo, país de origen…) o cuantitativas (edad, ingresos,
tamaño, peso…)
 Tamaño de la población: N
 Variables cuantitativas:
 Interesa caracterizar los valores de la variable X y su distribución, mediante
métodos numéricos (cálculo de medidas) y gráficos (histogramas, etc.)
 Las medidas (media, desviación estándar…) de la población reciben el nombre
de parámetros (letras griegas: μ, σ, σ2 …)
 Variables cualitativas:
 Interesa conocer el número de elementos (o porcentaje) en cada nivel de la
variable (cuántos hombres y cuántas mujeres, e.g.)
❑ MUESTRA: es una fracción (generalmente mucho menor) del conjunto de los elementos
de la población, seleccionada al azar, para caracterizar la población, es decir, para conocer
los parámetros de la población
 Tamaño de la muestra: n
 Estadístico es cualquier función de los valores de la variable X en los elementos de la
muestra (letras latinas: x, s, s2 …)
 Muestreo aleatorio (elección de la muestras al azar)
 La elección de las unidades de muestreo debe ser aleatoria
Probabilidades en el Muestreo

❑ MUESTREO: es el proceso de obtener una muestra de una población


❑ Muestreo CON y SIN reposición (probabilidades)
 Muestreo con reposición: Una vez elegido un elemento se devuelve a la población y puede volver
a ser muestreado; las probabilidades de elegir cualquier elemento son las mismas después de
haberlo elegido. Si la población en muy grande (Población infinita, 𝑁 = ∞) el muestreo se puede
considerar siempre como muestreo con reposición
 Muestreo sin reposición: Una vez que se elige un elemento no se puede volver a elegir, las
probabilidades de extraer cualquier elemento varían después de cada extracción

Población:
Conjunto de individuos Muestra:
bajo estudio
1 2 … n
1
2
… N
3
5
4

Muestra ordenada: 𝑥1 , 𝑥2 , … 𝑥𝑛
Muestreo CON reposición (MCR)
Muestra sin ordenar: 𝑥1 . 𝑥2 … 𝑥𝑛
Población:
𝑥1 , 𝑥2 , 𝑥3 … 𝑥𝑁 Muestra ordenada: 𝑥1 , 𝑥2 , … 𝑥𝑛
Muestreo SIN reposición (MSR)
Muestra sin ordenar: 𝑥1 . 𝑥2 … 𝑥𝑛
Probabilidades en el Muestreo

❑ Muestreo CON y SIN reposición (probabilidades)


 Población NO dividida en categorías
Población:
Conjunto de individuos Muestra:
bajo estudio
1 2 … n
1
2
… N
3 La probabilidad de obtener UNA muestra concreta de entre todas las
5 posibles en MCR/MSR y considerando la muestra ordenada (MO) y
4
no ordenada (MNO)

𝑀𝑂
1 1 1 1 1
𝑃𝑀𝐶𝑅 𝑥1 , 𝑥2 … 𝑥𝑛 = · … = 𝑛 = 𝑛
𝑁 𝑁 𝑁 𝑁 𝑉𝑅𝑁
𝑀𝐶𝑅
𝑀𝑁𝑂
1
𝑃𝑀𝐶𝑅 𝑥1 . 𝑥2 … 𝑥𝑛 = 𝑃𝑛 · 𝑛
𝑉𝑅𝑁

𝑀𝑂
1 1 1 1 1
𝑃𝑀𝑆𝑅 𝑥1 , 𝑥2 … 𝑥𝑛 = · … = = 𝑛
𝑁 𝑁 − 1 𝑁 − 𝑛 + 1 𝑁!Τ(𝑁 − 𝑛)! 𝑉𝑁
𝑀𝑆𝑅 1 1
𝑀𝑁𝑂
𝑃𝑀𝑆𝑅 𝑥1 . 𝑥2 … 𝑥𝑛 = 𝑃𝑛 · 𝑛 =
𝑉𝑁 𝑁
𝑛
Probabilidades en el Muestreo

❑ Muestreo CON y SIN reposición (probabilidades)


 Población dividida en categorías
Población:
Conjunto de individuos Muestra: n
bajo estudio
𝑛1 , 𝑛2 , 𝑛3
𝑛 = 𝑛1 + 𝑛2 + 𝑛3
𝑁1 𝑁2 𝑁3 𝐶𝑙𝑎𝑠𝑒 1 𝐶𝑙𝑎𝑠𝑒 2 𝐶𝑙𝑎𝑠𝑒 3

𝐶𝑙𝑎𝑠𝑒 1 𝐶𝑙𝑎𝑠𝑒 2 𝐶𝑙𝑎𝑠𝑒 3 𝑁 = 𝑁1 + 𝑁2 + 𝑁3 1 2 … 𝑛1 1 2 … 𝑛2 1 2 … 𝑛3

𝑛1 𝑛2 𝑛3 𝑛 𝑛 𝑛
𝑁1 𝑁2 𝑁3 𝑉𝑅𝑁11 · 𝑉𝑅𝑁22 · 𝑉𝑅𝑁33
𝑀𝑂
𝑃𝑀𝐶𝑅 𝑛1 , 𝑛2 , 𝑛3 = · · = 𝑛
𝑁 𝑁 𝑁 𝑉𝑅𝑁
𝑀𝐶𝑅 𝑛 𝑛 𝑛
𝑛 ,𝑛2 ,𝑛3
𝑉𝑅𝑁11 · 𝑉𝑅𝑁22 · 𝑉𝑅𝑁33
𝑀𝑁𝑂
𝑃𝑀𝐶𝑅 𝑛1 . 𝑛2 . 𝑛3 = 𝑃𝑅𝑛 1 · 𝑛
𝑉𝑅𝑁
𝑛
𝑀𝑂
𝑁1 𝑁1 − 1 𝑁1 − 𝑛1 + 1 ς3𝑖=1 𝑁𝑖 !Τ 𝑁𝑖 − 𝑛𝑖 ! ς31 𝑉𝑁𝑖𝑖
𝑃𝑀𝑆𝑅 𝑛1 , 𝑛2 , 𝑛3 = · … ⋯= =
𝑁 𝑁−1 𝑁−𝑛+1 𝑁!Τ 𝑁 − 𝑛 ! 𝑉𝑁𝑛
𝑀𝑆𝑅 𝑁1 𝑁 𝑁 𝑁
· 2 · 3 ς3𝑖=1 𝑖
𝑛 𝑛2 𝑛3 𝑛𝑖
𝑀𝑁𝑂
𝑃𝑀𝑆𝑅 𝑛1 . 𝑛2 . 𝑛3 = 1 =
𝑁 𝑁
𝑛 𝑛
Probabilidades en el Muestreo

❑ Muestreo CON y SIN reposición (probabilidades)


 Población NO dividida en categorías

MO MNO
1 𝑛!
MCR 𝑛 𝑛
𝑉𝑅𝑁 𝑉𝑅𝑁
1 1
MSR 𝑁
𝑉𝑁𝑛
𝑛

 Población dividida en categorías


➢ En el caso de MNO con 2 categorías:
MO MNO
X=nº elementos en la categoría “éxito”
𝑛𝑖
ς𝑘1 𝑁𝑖𝑛𝑖 𝑛! ς𝑘1 𝑁𝑖 𝑝=
𝑁1
,𝑞 =
𝑁2 𝑁 − 𝑁1
= =1−𝑝
MCR 𝑛 · 𝑛 𝑁 𝑁 𝑁
𝑉𝑅𝑁 ς𝑘1 𝑛𝑖 ! 𝑉𝑅𝑁
𝑀𝑁𝑂 𝑛 𝑘 𝑛−𝑘
𝑁 𝑃𝑀𝐶𝑅 𝑘, 𝑛 − 𝑘 = 𝑃 𝑋 = 𝑘 = 𝑝 ·𝑞
ς𝑘1 𝑉𝑁𝑛𝑖 ς𝑘1 𝑖 𝑘
𝑖 𝑛𝑖 ՜ 𝑋~ℬ(𝑛, 𝑝)
MSR
𝑉𝑁𝑛 𝑁
𝑁1 𝑁
𝑛 · 2
𝑛 𝑛2
𝑀𝑁𝑂
𝑃𝑀𝑆𝑅 𝑘, 𝑛 − 𝑘 = 𝑃 𝑋 = 𝑘 = 1
𝑁
𝑛
՜ 𝑋~ℋ(𝑁, 𝑛, 𝑝)
Probabilidades en el Muestreo

❑ En una población dividida en dos (o más categorías). Distribución del número de elementos que
pertenecen a una cierta categoría en una muestra de tamaño “n” (o de la proporción de elementos
que pertenecen a esa categoría) (Distribución Binomial)

 Población dividida en dos clases (A y B), se toma una muestra de tamaño “n”:

𝑿~𝓑 𝒏, 𝒑 --distribución en el muestreo de 𝑋, nº de elementos de la categoría A

𝐴~ℬ(𝑛, 𝑝) n=1
P(A) = NA/N = p
P(B) = NB/N = q = 1 - p

Extracciones
n > 1 (p.ej. n = 3) sucesivas con
“A” = nº azules reemplazamiento

A=3 P(A=3) = p3

A=2 P(A=2) = 3·p2·q


NA bolas azules
NB bolas blancas A=1 P(A=1) = 3·p·q2
NA + NB = N
A=0 P(A=0) = q3
Estadísticos

❑ MUESTREO: es el proceso de obtener una muestra aleatoria de una población


 Estadístico es cualquier función de los valores de la variable X en los elementos de la
muestra (letras latinas: x, s, s2 …)

𝑀𝑢𝑒𝑠𝑡𝑟𝑎: 𝑥1 , 𝑥2 … 𝑥𝑛 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜: 𝑇(𝑥1 , 𝑥2 … 𝑥𝑛 )


𝑛
1
𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎: 𝑥 = ෍ 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑐𝑢𝑎𝑠𝑖 − 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙: 𝑆 2 = ෍ 𝑥𝑖 − 𝑥 2
𝑛−1
𝑖=1
𝑀𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚é𝑡𝑟𝑖𝑐𝑎, 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑎𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑜 𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠, 𝑒𝑡𝑐.

𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎: 𝑥(1) , 𝑥(2) … 𝑥(𝑛) /𝑥(1) ≤ 𝑥(2) ≤ ⋯ ≤ 𝑥(𝑛)

𝑀á𝑥𝑖𝑚𝑜: 𝑥(𝑛) 𝑦 𝑚í𝑛𝑖𝑚𝑜: 𝑥(1)


𝑀𝑒 = 𝑥0.5 = 𝑥(𝑛+1)Τ2 𝑠𝑖 𝑥 = 𝑖𝑚𝑝𝑎𝑟
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙: ቐ 𝑥(𝑛) + 𝑥(𝑛+1)
𝑀𝑒 = 𝑥0.5 = 𝑠𝑖 𝑥 = 𝑝𝑎𝑟
2
𝛼 · 𝑥(𝑗) + 1 − 𝛼 · 𝑥(𝑗+1)
𝐶𝑢𝑎𝑛𝑡𝑖𝑙𝑒𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠: 𝑥𝛼 = ; 𝑗 ≤𝛼·𝑛 <𝑗+1
2
Estadísticos

❑ Inferencia estadística
 La Inferencia Estadística persigue determinar los parámetros de una población a
partir de los estadísticos calculados en una muestra de esa población.
 Para que una muestra se pueda emplear adecuadamente para estimar los
parámetros de la población, debe ser una Muestra aleatoria (cualquier individuo
de la población tiene la misma P de ser elegido)
❑ Estimadores
 Un estadístico [𝑇(𝑥𝑖)] que se puede utilizar para estimar un parámetro poblacional
[θ] es un estimador de ese parámetro, escribimos que 𝑇 = 𝜃෠
 Propiedades (deseables) de los estimadores:
➢ Suficiente: T(xi) utiliza la mayor información posible de la muestra
➢ No sesgado (centrado): E(T) = θ [𝑆𝑒𝑠𝑔𝑜 = 𝐵𝑖𝑎𝑠 = 𝜃 − 𝐸(𝑇)]
➢ Consistente: lim 𝑇(𝑥1 , 𝑥2 ,…𝑥𝑛 ) = 𝜃
𝑛՜∞
➢ Eficiente: 𝑇(𝑥𝑖) tiene un sesgo y una varianza lo más bajos posibles
❑ Distribución en el muestreo
 Cualquier estadístico es una variable aleatoria (toma un valor real según el
resultado del proceso aleatorio del muestreo). A diferentes muestras, cada una
con su probabilidad, les corresponde un valor dado del estadístico
 La distribución de la V.A. de un determinado estadístico se llama Distribución en
el muestreo de ese estadístico
Distribución en el muestreo

❑ Estimar los parámetros de la población a partir de “estadísticos” de una muestra:


INFERENCIA ESTADÍSTICA
 Queremos conocer los datos reales de la distribución de una cierta variable (x) en
toda la población (parámetros: μ, σ2…) pero no medimos “x” en los “N” elementos de
la población, sino solo en los “n” elementos de la muestras (n << N) y usamos los
valores de ciertos estadísticos {T(x1, x2, xn)} como estimadores de los valores de la
población

Población:
Conjunto de individuos Muestra:
bajo estudio
1 2 … n
1
2
… N Estadísticos de la muestra:
3 𝑛
5 1
4 𝑥ҧ = ෍ 𝑥𝑖 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑛
𝑖=1
𝑛
1
𝑆2 = ෍(𝑥𝑖 − 𝑥)ҧ 2 𝐶𝑢𝑎𝑠𝑖 − 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Parámetros de la población: 𝑛−1
𝑁 𝑖=1
1
𝜇= ෍ 𝑥𝑖 𝑀𝑒𝑑𝑖𝑎 (𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙)
𝑁
𝑁
𝑖=1 Estimadores:
1 𝑥 ՜ 𝜇 ∵ 𝐸 𝑥ҧ = 𝜇 𝑦 𝑥 = 𝜇Ƹ
𝜎2 = ෍(𝑥𝑖 − 𝜇)2 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙)
𝑁
𝑖=1 𝑆2 ՜ 𝜎2 ∵ 𝐸 𝑆2 = 𝜎2 𝑦 𝑆 2 = 𝜎ො 2
Distribución en el muestreo

❑ Estimar los parámetros de la población a partir de “estadísticos” de una


muestra: INFERENCIA ESTADÍSTICA
 Los estadísticos {T(x1, x2, xn)} calculados a partir de la muestra
tomada al azar pueden tomar diferentes resultados con una cierta
probabilidad, son VARIABLES ALEATORIAS
 Ciertos estadísticos se distribuyen según ciertos modelos bien
conocidos, siguen una cierta distribución estadística, es su
distribución en el muestreo
 Los valores que tomen los estadísticos nos servirán para estimar los
parámetros poblacionales y como sabemos cuál es la distribución
teórica de los estadísticos, podremos fijar no solo los valores
paramétricos, sino también la probabilidad con que los verdaderos
valores poblacionales se encuentran en un cierto intervalo de la
estimas
 Dos ejemplos fundamentales:
𝑥 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑦 𝑆 2 (𝑐𝑢𝑎𝑠𝑖 − 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙)
Distribución en el muestreo

❑ La media (𝑥)ҧ y la cuasi-


varianza (s2) muestrales Población: Parámetros:
son estimadores de la 2, 4, 6, 8 μ=5
media (μ) y varianza
poblacionales (σ2) [N=4] σ2 = 5

Muestreo con reposición Muestreo sin reposición


Muestra (i) 𝑛𝑖 𝑥ҧ 𝑠2 Muestra (i) 𝑛𝑖 𝑥ҧ 𝑠2
(2,2) 1 2 0 (2,4) 1 3 2
(2,4),(4,2) 2 3 2 (2,6) 1 4 8
(2,6),(6,2) 2 4 8 (2,8) 1 5 18
(2,8),(8,2) 2 5 18 (4,6) 1 5 2
(4,4) 1 4 0 (4,8) 1 6 8
(4,6),(6,4) 2 5 2 (6,8) 1 7 2
(4,8),(8,4) 2 6 8 4
=6 𝐸 𝑥ҧ = 5 𝐸 𝑠 2 = 20/3
2
(6,6) 1 6 0
𝑉 𝑥ҧ = 5/3
(6,8),(8,6) 2 7 2
(8,8) 1 8 0 ഥ
𝒙 𝒔𝟐
𝑉𝑅42 = 16 𝐸 𝑥ҧ = 5 𝐸 𝑠2 = 5 𝑬 ഥ
𝒙 𝑽 ഥ
𝒙 𝑬 𝒔𝟐
𝑉 𝑥ҧ = 5/2
Muestreo CON 𝝈𝟐
reposición 𝝁 𝝈𝟐
𝒏
Muestreo SIN 𝑵 − 𝒏 𝝈𝟐 𝑵
reposición 𝝁 𝑵−𝟏
𝝈𝟐
𝑵−𝟏 𝒏
Teorema Central del Límite

❑ Distribución en el muestreo de la media muestral (Teorema Central del Límite)


 La media ( 𝑥ҧ ) de una muestra de “n” elementos sigue una distribución normal de media μ y
varianza σ2/n [sea cual sea la distribución de la variable “x” en la población]:

ഥ~𝓝 𝝁, 𝝈𝟐 Τ𝒏
𝒙 ―distribución en el muestreo de 𝑥ҧ

20

18

Población 16
𝐸 𝑥ҧ = 𝜇 = 4
14
𝑥𝑖 𝑛𝑖 𝜎2
Frecuencia
12

10 𝑉 𝑥ҧ = = 2/3
2 5 Muestreo C.R.
8
𝑛
3 5 n=3 6

4 5
4

2
𝑥ҧ ~ 𝒩 (4, 2Τ3)
0
5 5 2.00 2.33 2.67 3.00 3.33 3.67 4.00 4.33 4.67 5.00 5.33 5.67 6.00

Media muestral
6 5
30

25

Parámetros:
20
𝐸(𝑠 2 ) = 𝜎 2 = 2
Frecuencia

15

μ=4 10
Pero la distribución
de s2 no es
σ2 = 2 5 normal…
N = 25 0
0.00 0.33 1.00 1.33 2.33 3.00 4.00 4.33 5.33

Varianza muestral
Elección el tamaño de la muestra

❑ Elección del tamaño de la muestra para que la estima de la media (𝑥) se encuentre tan
cerca de la media poblacional (𝜇) como queramos, con un error inferior a un cierto valor “d”
𝜎 1 1
 Error estándar del estadístico 𝑥 : 𝑠. 𝑒. = 𝜎 𝑥 = ≈ · σ𝑛𝑖=1(𝑥𝑖 − 𝑥)2 es la desviación típica
𝑛 𝑛 𝑛−1
de la distribución en el muestreo de 𝑥 𝑥~𝒩(𝜇, 𝜎 2 Τ𝑛)
 En una población dada ¿cuál debe ser el tamaño n de la muestra para que tengamos una
seguridad α de que la estima de la media 𝑥 se encuentra más cerca de la verdadera media
poblacional μ que un cierto valor d fijado de antemano?

𝑃 −𝑑 < 𝑥 − 𝜇 < 𝑑 > 1 − 𝛼


𝜎
Muestra / 𝑛: 𝑃 𝑥 − 𝜇 < 𝑑 > 1 − 𝛼 𝑃 −𝑑 < z · <𝑑 >1−𝛼
𝑛
Población
𝜎
𝑥−𝜇 =z·
𝑛
𝒙−𝝁
𝒛= ~𝓝(𝟎, 𝟏)
𝝈Τ 𝒏 z
𝑥−𝜇
𝑃 𝑧𝛼Τ2 < < 𝑧1−𝛼Τ2 = 1 − 𝛼 𝟏−𝜶
𝜎Τ 𝑛
𝛼/2 𝛼/2
𝑧1−𝛼Τ2

−𝑑 𝑑 𝑑 𝜎 · 𝑧1−𝛼Τ2 2 Como no conocemos μ y σ de la


𝑃 <z< >1−𝛼 ֞ > 𝑧1−𝛼Τ2 ֞ 𝑛≥ población original, las sustituimos
𝜎Τ 𝑛 𝜎Τ 𝑛 𝜎Τ 𝑛 𝑑
por 𝑥 y s de la muestra (inexacto)
Elección el tamaño de la muestra

❑ Elección del tamaño de la muestra para que la estima de la media (𝑥) se encuentre tan
cerca de la media poblacional (𝜇) como queramos, con un error inferior a un cierto valor “d”
 Margen de error (error absoluto) prefijado:
𝑠 · 𝑧1−𝛼Τ2 2
𝑃 𝑥−𝜇 <𝑑 >1−𝛼 ֞ 𝑛≥
𝑑
 Error relativo prefijado:
2
𝑥−𝜇 (𝑠Τ𝑥) · 𝑧1−𝛼Τ2
𝑃 <𝜀 >1−𝛼 ֞ 𝑛≥
𝜇 𝜀
 Ejemplo: Dada la muestra 12,14,13,9,6,10,16,15,13 calcular el número de elementos necesarios
para que una muestra de esa población dé como resultado una estima de la media poblacional
con un error absoluto inferior a d=2 con a) una probabilidad del 95%; b) una probabilidad del 99%.
Hacer los mismos cálculos para un error relativo (ε) inferior c) al 10%, d) al 5%.

2
𝑀𝑢𝑒𝑠𝑡𝑟𝑎 12,14,13,9,6,10,16,15,13 𝑠·𝑧1−𝛼Τ2 2 (𝑠Τ𝑥)·𝑧1−𝛼Τ2
a) y b) 𝑛 ≥ c) y d) 𝑛 ≥
𝑑 𝑑

P d<2 ε < 10% ε < 5%


𝑥 = 12 1 − 𝛼 = 0.95 ՜ 𝑧1−𝛼Τ2 = 1.96 0.95 17 47 185
𝑠 = 3.1623 1 − 𝛼 = 0.99 ՜ 𝑧1−𝛼Τ2 = 2.58
0.99 10 27 107
𝑠Τ𝑥 = 0.2635
 En Excel: =redondear.mas(;0)
Error aleatorio y error sistemático

❑ Error sistemático (sesgo, bias) [𝑏]


 Si la esperanza del estadístico 𝑇 (en un determinado muestreo) no coincide con el parámetro a
estimar 𝜃, se dice que el estadístico está sesgado. Llamamos “sesgo” o “error sistemático” del
estadístico 𝑇 a la diferencia: 𝑏 𝑇 = 𝜃 − 𝐸 𝑇
 El sesgo se puede deber a múltiples factores: un muestreo mal diseñado, imposibilidad de
acceder a ciertos elementos de la población, que el estadístico en sí sea sesgado, etc.
❑ Error aleatorio [𝑠, 𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑒𝑙 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜]
 Puesto que el estadístico es una VA, sigue una cierta distribución con una varianza dada, en el
resultado de un muestreo concreto no tiene porque coincidir 𝑇 = 𝜃, sino que T se distribuirá
alrededor de 𝜃 con un cierto error propio de su distribución
❑ Precisión (s↓) y exactitud (b↓) —Precision and Accuracy

Métodos de muestreo (o estimadores):

𝑥 = 𝜇Ƹ = 6 ՜ 𝑏1 = −2
𝑀é𝑡𝑜𝑑𝑜 1: 5,6,6,6,7 Preciso, inexacto
𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 0. 3162

𝑥 = 𝜇Ƹ = 8 ՜ 𝑏2 = 0
𝑀é𝑡𝑜𝑑𝑜 2: 2,4,6,8,10 Impreciso, exacto
Población 𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 1.4142
𝜇=8
𝑥 = 𝜇Ƹ = 6 ՜ 𝑏3 = −2
𝑀é𝑡𝑜𝑑𝑜 3: 4,6,8,10,12 Impreciso, inexacto
𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 1.4142

𝑥 = 𝜇Ƹ = 8 ՜ 𝑏4 = 0
𝑀é𝑡𝑜𝑑𝑜 4: 7,8,8,8,9 Preciso, exacto
𝜎(𝑥)
ො = 𝑠Τ 𝑛 = 0. 3162
Error aleatorio y error sistemático

❑ Precisión de un estadístico en un muestreo —Precision


 Es el grado de acuerdo de los valores posibles del estimador entre sí, cuanto más agrupados
están esos valores (cuanto menor es la varianza de la distribución en el muestreo de 𝑇), mayor es
la exactitud
 El sesgo se puede deber a múltiples factores: un muestreo mal diseñado, imposibilidad de
acceder a ciertos elementos de la población, etc.
❑ Exactitud de un estadístico en un muestreo —Accuracy
 Se refiere a la concordancia entre los valores posibles del estimador con el valor paramétrico que
se quiere estimar. Cuanto más cerca está 𝑇 de 𝜃, (i.e. cuanto menor es el sesgo) mayor es la
exactitud
❑ Precisión (s↓) y exactitud (b↓)

Sesgo alto (b↑) Sesgo bajo (b↓)

Alta Precisión (s↑)

Baja Precisión (s↓)


Estrategias de muestreo (aleatorio)

❑ Métodos de muestreo
 Muestreos no aleatorios
➢ Muestreo casual (haphazard sampling): población completamente
homogénea, elegimos cualquier elemento
➢ Muestreo experto (judgement sampling): a criterio de un buen conocedor
del tema (se introduce un sesgo de elección)
 Muestreos aleatorios
➢ Muestreo aleatorio simple (simple random sampling)
 Procedimiento para elegir una muestra aleatoria
➢ Muestreo por conglomerados (cluster sampling)
➢ Muestreo bi-etápico (two-stage sampling): seleccionamos unidades
primarias al azar y dentro de ellas tomamos muestras al azar
➢ Muestreo aleatorio estratificado (stratified sampling): dividimos la
población en estratos y muestreamos dentro de cada estrato
➢ Muestreo doble (double sampling): podemos medir 2 características de la
población cuyos resultados están muy bien relacionados: solo medimos la
más barata o más sencilla.
➢ Muestreo sistemático (systematic sampling)
Estrategias de muestreo (aleatorio)

❑ Muestreo no aleatorio
 Muestreo casual (haphazard sampling)
En una población que se asume que es completamente homogénea podemos elegir cualquier
conjunto de elementos como muestras, sin preocuparnos de que la elección sea aleatoria
 Muestreo experto (judgement sampling)
La elección e la muestra se deja a criterio de un buen conocedor del tema que juzga que la
muestra elegida sea representativa de la población (se introduce un sesgo de elección)

❑ Muestreo probabilístico o aleatorio


 Muestreo aleatorio simple MAS (simple random sampling)
Debe asegurar que cualquier elemento tiene la misma probabilidad de ser elegido
 Cómo se elige una muestra aleatoria simple
Si se tiene acceso a todos los N elementos de la población (si no con todos los elementos a los
que se tiene acceso:
 Se numeran todos los elementos por cualquier procedimiento (del 1 al N)
 Se elige un punto al azar en una TABLA DE NÚMEROS ALEATORIOS y
 Se van eligiendo los individuos numerados con los números siguientes al punto elegido en
la tabla, en cualquier dirección; se descartan los números que no estén en la lista y se eligen
hasta llegar al número de elementos de la muestra
 En EXCEL: =aleatorio() [distribución uniforme entre 0 y 1]
 En Rcmdr: Distribuciones / Generador de números aleatorios
Estrategias de muestreo (aleatorio)

❑ Elegir una muestra aleatoria simple (MAS): ejemplo

Población (N=16)

g a h Muestra (n=4)
c i
k j
ñ
d l n
b m
o f e

1º Numeración (en 2º Tabla de nos aleatorios


cualquier orden) a) Elegir punto de inicio y cualquier
A 1 dirección
B 2 b) Números de dos cifras (porque así
C 3 son en nuestra población)
D 4 c) Ir eligiendo los elementos: se
O 5 descartan los nos mayores que el
Ñ 6 máximo en la población hasta llegar
N 7 a los “n” elementos
M 8
L 9 3º Muestra:
K 10
I 11 14 F
J 12 01 A
E 13 12 J
F 14
G 15 08 M
H 16
Estrategias de muestreo (aleatorio)

❑ Muestreo probabilístico o aleatorio


 Muestreo por conglomerados (cluster sampling)
En una población objetivo dividida en grupos, se elige un grupo (o o varios) que se considera
“medio” o representativo de la población (e.g.: manadas de animales, núcleos de población)
 Muestreo bi-etápico (two stage sampling) ―también multi-etápico
En una población dividida en grupos, como en el muestreo por conglomerados, primero se
eligen al azar algunos grupos (MAS) y dentro de cada uno de ellos se eligen al azar algunos
elementos (MAS), todos los cuales formarán la muestra
 Muestreo estratificado (stratified sampling)
La población se divide en grupos más o menos homogéneos (estratos, con menor varianza que
la población total) y en cada uno de ellos se elija una muestra aleatoria (MAS). El número de
elementos a elegir dentro de cada estrato puede ser el mismo o más comúnmente se elige de
acuerdo al número de elementos de cada estrato o a la varianza dentro de cada estrato (más
peso del estrato o más variabilidad dentro del mismo requieren muestras mayores)
 Muestreo doble (double sampling)
Cuando la población presenta dos características numéricas (variables X e Y) muy
estrechamente relacionadas ( 𝑟𝑥𝑦 próximo a 1), una fácil de determinar (X) y otra más
complicada (Y), se muestrea para determinar X y se obtienen los resultados para Y a partir de
los de X por regresión
 Muestreo sistemático (systematic sampling)
En el muestro de series lineales de datos (a lo largo del tiempo, por ejemplo: medidas diarias de
concentración de un contaminante, número de accidentes…) se elige un punto inicial de
muestreo al azar y luego se muestra a intervalos fijos. Precaución: en su caso, los intervalos no
pueden coincidir con el periodo de la serie de datos. Para muestreos en el territorio: se divide en
cuadrículas sistemáticamente y se seleccionan puntos al azar en cada cuadrícula

También podría gustarte