Está en la página 1de 21

Bases técnicas del muestreo.

Rodrigo Ortega Blu, PhD

Econometría Ingeniería Comercial

Introducción

Conocer los conceptos estadísticos detrás


del muestreo de variables sociales,
económicas, físicas, químicas, etc. desde
una población de interés, es esencial para
un correcto análisis econométrico.

1
Pasos del análisis econométrico

• Diseño del muestreo


• Recolección de datos
• Entrada de datos
• Procesamiento de datos a través de
métodos econométricos apropiados.
• Interpretación de los resultados.
• Informe

Datos versus información

información
datos análisis

2
Muestreo

• Objetivo: hacer inferencias acerca de una


población de interés.

Porque muestrear la
población?
• Imposibilidad física de chequear
todos los ítems en la población.
• El costo de estudiar todos los
elementos en la población.
• La naturaleza destructiva de ciertos
muestreos (costo económico).
• Los resultados del muestreo son
normalmente adecuados.

3
Objetivo del muestreo

• Estimar los parámetros de la población:


• Parámetros: promedio, desviación
estándar, betas, rho, etc.
– Variable: lo que se desea medir en la muestra.
Ej. Nivel de educación, nivel de ingresos, etc.
– Estadístico: calculado sobre la muestra.
– Parámetro: normalmente desconocido,
estimado a través del estadístico.

Variable, estadístico, parámetro

Variable

respuesta

Estadístico Promedio=3,75

muestra

Parámetro Promedio=3,72

población

4
Parámetros vs estadísticos

Parámetro Estadístico
µ
σ s
β
ρ r

Tipos de muestreo

• Probabilístico
• No probabilístico (arbitrario)

10

10

5
Métodos de muestreo

• Muestreo aleatorio simple: muestra


seleccionada de manera que cada elemento o
individuo de la población tenga las mismas
posibilidades de que se le incluya.

• Muestreo aleatorio sistemático: Los elementos o


individuos de la población se ordenan de alguna
manera. Se selecciona un punto aleatorio de
inicio y posteriormente se elige cada k-ésimo
miembro de la población.

11

11

Métodos de muestreo

• Muestreo aleatorio estratificado: La


población se divide en subgrupos
denominados estratos y se selecciona al
azar una muestra de cada estrato.
• Muestreo por conglomerados (cluster): La
población se divide en conglomerados a
partir de límites geográficos o de otra
clase. Luego se seleccionan los
conglomerados al azar y se toma una
muestra aleatoria con elementos de cada
grupo.

12

12

6
Métodos de muestreo
• En muestreo no probabilístico inclusion en
la muestra es basada en el juicio de la
persona que selecciona los individuos o
elementos.
• El error de muestreo es la diferencia entre
el estadístico de la muestra y su
correspondiente parámetro de la
población.

13

13

Muestreo simple al azar-espacial

Ventaja: sesgo de selección de lugares de muestreo es menor


Desventaja: lugares dentro del área de interés quedan sin muestrear

14

7
Muestreo estratificado al azar-
espacial

C
A
Ventaja: aumenta precisión de los estimados
Desventajas:
•mayor dificultad de implementación
•Dificultad para determinar por que variable estratificar

15

Muestreo sistemático-espacial

16

8
Dependencia espacial

sill Variograma
Mapeo: Muestras a distancias
< al rango (dependientes)
V Solo estimación de
parámetros: Muestras a
nugget distancias > rango
(independientes)

rango

Distancia

17

Mapa de la propiedad de
interés

18

9
Distribución muestreal del
promedio.
• La distribución muestreal del
promedio es la distribución de
probabilidad de todos las
posibles promedios de
muestras de un determinado
tamaño, seleccionadas desde
una población.

19

19

Distribución muestreal del promedio.

muestra muestra muestra

Promedio Promedio Promedio

Distribución Es la distribución de
muestreal del un estadístico (ej.
promedio promedio) a través
de un número
infinito de muestras.

20

10
Teorema del límite central

• Para una población con media μ y


varianza σ2 la distribución muestreal de
los promedios de todas las posibles
muestras de tamaño n generadas desde
la población serán, aproximadamente,
normalmente distribuidas.
• La media de la distribución muestreal
será igual a μ y la varianza igual a σ2/n.

21

21

Número de muestras de tamaño n


desde una población de tamaño N

N N!
  =
 n  n !( N − n )!
N!
1
n !( N − n )!

22

11
23

23

Población

• Definida por el investigador:


– Habitantes del gran Santiago
– Alumnos de la USM
– Alumnos de Ing. Comercial ICV
– Alumnos de Econometría 2-2020
– Conjunto de lotes de producción

24

12
Población

Conjunto de volúmenes de
suelo (tomados con un
barreno tipo tubo) en un
área determinada (ej.
31.830.989 barrenos de 2
cm de diam./ha) que
serán analizados para
cadmio (Cd) total de
acuerdo a procedimientos
estándar.

25

Estadísticos
n

y i
y= i
promedio
n
n 2

 (y i − y)
s2 = i
Varianza
n −1
s2
sy = Error estándar
n
s
CV = *100 Coeficient e de variación
y
ls = y + t0.025 * s y Límite de confianza superior

li = y − t0.025 * s y Límite de confianza inferior

26

13
Algunos estadísticos para
variables seleccionadas.

27

Medida simple de variabilidad.

• Varianza (s2) o desviación estándar(s)


• Coeficiente de variación

s
CV(%) = ·100
x

28

14
Número de muestras necesarias
en un muestreo simple al azar
t 2s2
n= 2
e En condiciones de completa
Donde : independencia de las muestras

n = número de observaciones
2
S = varianza de la muestra
e = nivel de exactitud (error) permitido

31

Determinación del tamaño de la


muestra.
• Para obtener el tamaño de la muestra para una variable:

 zs 
2

n= 
 e 

donde :
e - el error permitido
z - el valor de z correspondiente al nivel de confianza definido
s - la desviación estándar de la muestra (desde muestra piloto)

32

15
Número de muestras

33

Corrección para poblaciones


finitas.

34

16
Determinación del número de
muestras en función del CV.
160
y = 0.0381x2 + 0.0098x + 2.5832
R2 = 0.9997
140

120

100

80

60

40

20

0
0 10 20 30 40 50 60 70
CV (%)

35

Ejemplo

Se desea estimar el promedio del


peso de la población de estudiantes
del campus Vitacura, con una
probabilidad del 95 % y un nivel de
exactitud de 5 kg. El rango de pesos
estimados es de 40 a 100 kg.

36

17
Desarrollo
• Primero se elige un valor de t desde la tabla usando n =20
(valor arbitrario) gl= 19, p =0,05, t = 2,0930

• Se calcula la varianza S2 =( (100-40)/4)2 = 225 kg2

• D = 5 kg

• Así n = (2,0930)2 225/(5)2 = 39

• Debido a que n = 39 es mucho mayor que n = 20, se debe hacer


el calculo nuevamente, hasta que el n de entrada sea igual al de
salida.
• n final es 37

37

Tabla de t en Excel (dos colas)

=DISTR.T.INV(prob,gl)
=DISTR.T.INV(0.05,9)
=2.26215889
=INV.T.2C(prob,gl)
=INV.T.2C(0.05,9)
=2.26215889

38

18
Ejemplo en Excel

39

Efecto del nivel de exactitud


requerido sobre el n.

40

19
41

Selección de muestras

• Excel
• Análisis de datos>muestra
• Análisis de datos>generación de números
aleatorios

42

20
Precisión versus exactitud

Baja exactitud Baja exactitud Alta exactitud


Baja precisión Alta precisión Alta precisión

43

Estimación de la precisión y exactitud

• Precisión: se requiere el uso de duplicados


o triplicados. Estimación del CV (%). A <
CV>precisión del método.
• Exactitud: se requiere el uso de un
estándar de concentración conocida.
Grado de desviación respecto al valor
“real”. Estándares se pueden comprar (ej.
NIST)

44

21

También podría gustarte