Muestreo Econometria 2 2020

Bases técnicas del muestreo.
Rodrigo Ortega Blu, PhD
Econometría Ingeniería Comercial
Introducción
Conocer los conceptos estadísticos detrás

del muestreo de variables sociales,
económicas, físicas, químicas, etc. desde
una población de interés, es esencial para
un correcto análisis econométrico.
1
Pasos del análisis econométrico
• Diseño del muestreo

• Recolección de datos
• Entrada de datos
• Procesamiento de datos a través de
métodos econométricos apropiados.
• Interpretación de los resultados.
• Informe
Datos versus información
información
datos análisis
2
Muestreo
• Objetivo: hacer inferencias acerca de una

población de interés.
Porque muestrear la
población?
• Imposibilidad física de chequear
todos los ítems en la población.
• El costo de estudiar todos los
elementos en la población.
• La naturaleza destructiva de ciertos
muestreos (costo económico).
• Los resultados del muestreo son
normalmente adecuados.
3
Objetivo del muestreo
• Estimar los parámetros de la población:

• Parámetros: promedio, desviación
estándar, betas, rho, etc.
– Variable: lo que se desea medir en la muestra.
Ej. Nivel de educación, nivel de ingresos, etc.
– Estadístico: calculado sobre la muestra.
– Parámetro: normalmente desconocido,
estimado a través del estadístico.
Variable, estadístico, parámetro
Variable
respuesta
Estadístico Promedio=3,75
muestra
Parámetro Promedio=3,72
población
4
Parámetros vs estadísticos
Parámetro Estadístico
µ
σ s
β
ρ r
Tipos de muestreo
• Probabilístico
• No probabilístico (arbitrario)
10
10
5
Métodos de muestreo
• Muestreo aleatorio simple: muestra

seleccionada de manera que cada elemento o
individuo de la población tenga las mismas
posibilidades de que se le incluya.
• Muestreo aleatorio sistemático: Los elementos o

individuos de la población se ordenan de alguna
manera. Se selecciona un punto aleatorio de
inicio y posteriormente se elige cada k-ésimo
miembro de la población.
11
11
• Muestreo aleatorio estratificado: La

población se divide en subgrupos
denominados estratos y se selecciona al
azar una muestra de cada estrato.
• Muestreo por conglomerados (cluster): La
población se divide en conglomerados a
partir de límites geográficos o de otra
clase. Luego se seleccionan los
conglomerados al azar y se toma una
muestra aleatoria con elementos de cada
grupo.
12
12
6
• En muestreo no probabilístico inclusion en
la muestra es basada en el juicio de la
persona que selecciona los individuos o
elementos.
• El error de muestreo es la diferencia entre
el estadístico de la muestra y su
correspondiente parámetro de la
población.
13
13
Muestreo simple al azar-espacial
Ventaja: sesgo de selección de lugares de muestreo es menor

Desventaja: lugares dentro del área de interés quedan sin muestrear
14
7
Muestreo estratificado al azar-
espacial
C
A
Ventaja: aumenta precisión de los estimados
Desventajas:
•mayor dificultad de implementación
•Dificultad para determinar por que variable estratificar
15
Muestreo sistemático-espacial
16
8
Dependencia espacial
sill Variograma
Mapeo: Muestras a distancias
< al rango (dependientes)
V Solo estimación de
parámetros: Muestras a
nugget distancias > rango
(independientes)
rango
Distancia
17
Mapa de la propiedad de
interés
18
9
Distribución muestreal del
promedio.
• La distribución muestreal del
promedio es la distribución de
probabilidad de todos las
posibles promedios de
muestras de un determinado
tamaño, seleccionadas desde
una población.
19
19
Distribución muestreal del promedio.
muestra muestra muestra
Promedio Promedio Promedio
Distribución Es la distribución de
muestreal del un estadístico (ej.
promedio promedio) a través
de un número
infinito de muestras.
20
10
Teorema del límite central
• Para una población con media μ y

varianza σ2 la distribución muestreal de
los promedios de todas las posibles
muestras de tamaño n generadas desde
la población serán, aproximadamente,
normalmente distribuidas.
• La media de la distribución muestreal
será igual a μ y la varianza igual a σ2/n.
21
21
Número de muestras de tamaño n

desde una población de tamaño N
N N!
  =
 n  n !( N − n )!
N!
1
n !( N − n )!
22
11
23
23
Población
• Definida por el investigador:

– Habitantes del gran Santiago
– Alumnos de la USM
– Alumnos de Ing. Comercial ICV
– Alumnos de Econometría 2-2020
– Conjunto de lotes de producción
24
12
Población
Conjunto de volúmenes de
suelo (tomados con un
barreno tipo tubo) en un
área determinada (ej.
31.830.989 barrenos de 2
cm de diam./ha) que
serán analizados para
cadmio (Cd) total de
acuerdo a procedimientos
estándar.
25
Estadísticos
n
y i
y= i
promedio
n
n 2
 (y i − y)
s2 = i
Varianza
n −1
s2
sy = Error estándar
n
s
CV = *100 Coeficient e de variación
y
ls = y + t0.025 * s y Límite de confianza superior
li = y − t0.025 * s y Límite de confianza inferior
26
13
Algunos estadísticos para
variables seleccionadas.
27
Medida simple de variabilidad.
• Varianza (s2) o desviación estándar(s)

• Coeficiente de variación
s
CV(%) = ·100
x
28
14
Número de muestras necesarias
en un muestreo simple al azar
t 2s2
n= 2
e En condiciones de completa
Donde : independencia de las muestras
n = número de observaciones
2
S = varianza de la muestra
e = nivel de exactitud (error) permitido
31
Determinación del tamaño de la

muestra.
• Para obtener el tamaño de la muestra para una variable:
 zs 
2
n= 
 e 
donde :
e - el error permitido
z - el valor de z correspondiente al nivel de confianza definido
s - la desviación estándar de la muestra (desde muestra piloto)
32
15
Número de muestras
33
Corrección para poblaciones

finitas.
34
16
Determinación del número de
muestras en función del CV.
160
y = 0.0381x2 + 0.0098x + 2.5832
R2 = 0.9997
140
120
100
nº
80
60
40
20
0
0 10 20 30 40 50 60 70
CV (%)
35
Ejemplo
Se desea estimar el promedio del

peso de la población de estudiantes
del campus Vitacura, con una
probabilidad del 95 % y un nivel de
exactitud de 5 kg. El rango de pesos
estimados es de 40 a 100 kg.
36
17
Desarrollo
• Primero se elige un valor de t desde la tabla usando n =20
(valor arbitrario) gl= 19, p =0,05, t = 2,0930
• Se calcula la varianza S2 =( (100-40)/4)2 = 225 kg2
• D = 5 kg
• Así n = (2,0930)2 225/(5)2 = 39
• Debido a que n = 39 es mucho mayor que n = 20, se debe hacer

el calculo nuevamente, hasta que el n de entrada sea igual al de
salida.
• n final es 37
37
Tabla de t en Excel (dos colas)
=DISTR.T.INV(prob,gl)
=DISTR.T.INV(0.05,9)
=2.26215889
=INV.T.2C(prob,gl)
=INV.T.2C(0.05,9)
=2.26215889
38
18
Ejemplo en Excel
39
Efecto del nivel de exactitud

requerido sobre el n.
40
19
41
Selección de muestras
• Excel
• Análisis de datos>muestra
• Análisis de datos>generación de números
aleatorios
42
20
Precisión versus exactitud
Baja exactitud Baja exactitud Alta exactitud

Baja precisión Alta precisión Alta precisión
43
Estimación de la precisión y exactitud
• Precisión: se requiere el uso de duplicados

o triplicados. Estimación del CV (%). A <
CV>precisión del método.
• Exactitud: se requiere el uso de un
estándar de concentración conocida.
Grado de desviación respecto al valor
“real”. Estándares se pueden comprar (ej.
NIST)
44
21

Muestreo Econometria 2 2020

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Muestreo Econometria 2 2020

Cargado por

Copyright:

Formatos disponibles

Bases técnicas del muestreo.

Rodrigo Ortega Blu, PhD

Econometría Ingeniería Comercial

Conocer los conceptos estadísticos detrás

• Diseño del muestreo

Datos versus información

• Objetivo: hacer inferencias acerca de una

• Estimar los parámetros de la población:

Variable, estadístico, parámetro

• Muestreo aleatorio simple: muestra

• Muestreo aleatorio sistemático: Los elementos o

• Muestreo aleatorio estratificado: La

Muestreo simple al azar-espacial

Ventaja: sesgo de selección de lugares de muestreo es menor

Distribución muestreal del promedio.

muestra muestra muestra

Promedio Promedio Promedio

• Para una población con media μ y

Número de muestras de tamaño n

• Definida por el investigador:

li = y − t0.025 * s y Límite de confianza inferior

Medida simple de variabilidad.

• Varianza (s2) o desviación estándar(s)

Determinación del tamaño de la

Corrección para poblaciones

Se desea estimar el promedio del

• Se calcula la varianza S2 =( (100-40)/4)2 = 225 kg2

• Así n = (2,0930)2 225/(5)2 = 39

• Debido a que n = 39 es mucho mayor que n = 20, se debe hacer

Tabla de t en Excel (dos colas)

Efecto del nivel de exactitud

Baja exactitud Baja exactitud Alta exactitud

Estimación de la precisión y exactitud

• Precisión: se requiere el uso de duplicados

También podría gustarte