Documentos de Académico
Documentos de Profesional
Documentos de Cultura
muestreo
Estimadores
puntuales y
por intervalos
Distribuciones
Técnicas de muestreo
importantes
asociadas al Enfoques basados en el diseño y el modelo.
muestreo
2016
Técnicas de
muestreo
Suponga que un Banco desea estimar el ingreso medio de las
N familias de un distrito y para ello considera un muestreo
Estimadores probabilı́stico seleccionando al azar y con reemplazamiento una
puntuales y
por intervalos
por una a las familias del padrón de la municipalidad del
Distribuciones distrito hasta un número n < N para conseguir una muestra
importantes
asociadas al
muestreo
Y1 , Y 2 , . . . , Y n , (1)
donde Yi denota al valor (aleatorio) que podrı́a tomar la
variable estadı́stica y =Ingreso en la i-ésima selección de la
muestra. Note aquı́ que toda familia tiene la misma
n
probabilidad N de ser escogida. Realizada las observaciones, el
ingreso medio buscado podrá estimarse mediante
1 n
ȳ = ∑ yj ,
n i=1 i
siendo yji el valor observado de la v.a. Yi , y ji ∈ {1, 2, . . . , N }.
Dr. Luis Valdivieso FACI PUCP 2 / 22
Técnicas de
muestreo
Note que en el esquema anterior la aleatoriedad es introducida
Estimadores por el esquema de selección en el diseño de la muestra. Ası́,
puntuales y
por intervalos
podrı́amos escribir indistintamente a la variable aleatoria
Distribuciones correspondiente a la estimación anterior como
importantes
asociadas al
muestreo 1 n 1 N
Ȳ = ∑ Yi ó Ȳ = ∑ yi δ i , (2)
n i=1 n i=1
1 n
Ȳ = ∑ Yi .
n i=1
Estimadores
puntuales y
por intervalos
En efecto, uno puede integrar ambos enfoques pensando que si
Distribuciones
la población fuera hipotéticamente grande y atemporal
importantes
asociadas al
(N → ∞), entonces la distribución empı́rica de los números
muestreo
y1 , y2 , . . . , yN (piense por simplicidad en el polı́gono de
frecuencias relativas del histograma de estos datos) deberı́a de
converger (si el modelo es correcto) a la curva normal. Luego
podrı́amos pensar en la colección dada en (1) como una
muestra aleatoria de la variable aleatoria Y .
Técnicas de
muestreo En todo diseño, existen 3 caracterı́sticas primordiales a tomarse
en cuenta. Ellos son, el tamaño de la muestra, el nivel de
Estimadores confianza y el error de estimación. Todos estos conceptos están
puntuales y
por intervalos ı́ntimamente ligados a la teorı́a de la estimación puntual y por
Distribuciones intervalos, puntos que revisaremos brevemente.
importantes
asociadas al
muestreo
Técnicas de
muestreo En todo diseño, existen 3 caracterı́sticas primordiales a tomarse
en cuenta. Ellos son, el tamaño de la muestra, el nivel de
Estimadores confianza y el error de estimación. Todos estos conceptos están
puntuales y
por intervalos ı́ntimamente ligados a la teorı́a de la estimación puntual y por
Distribuciones intervalos, puntos que revisaremos brevemente.
importantes
asociadas al Sea X una variable aleatoria (v.a.) cuya distribución depende
muestreo
de un parámetro poblacional desconocido θ (Notación: X ∼ θ).
Dada una muestra aleatoria (m.a.) de tamaño n de X: una
colección X1 , X2 , . . . , Xn de n v.a’s independientes con la
misma distribución que X, estaremos interesados en un
estimador θ̂n = g(X1 , X2 , . . . , Xn ) de θ. Si bien este puede ser
cualquier estadı́stica, es claro que nos interesarán sólo buenos
estimadores en el sentido que de observarse la muestra,
podamos garantizar que el valor observado de θ̂n , al que
llamaremos una estimación, se encuentre cerca de θ.
Dr. Luis Valdivieso FACI PUCP 7 / 22
Técnicas de
muestreo Dado que no conocemos θ, esta cercanı́a debe evaluarse a
través de métodos probabilı́sticos. En general un buen
Estimadores
puntuales y
estimador θ̂n de θ, debe de verificar en lo posible las siguientes
por intervalos tres propiedades básicas:
Distribuciones
importantes
asociadas al
muestreo
Distribuciones P (L1 ≤ θ ≤ L2 ) = 1 − α.
importantes
asociadas al
muestreo
Distribuciones P (L1 ≤ θ ≤ L2 ) = 1 − α.
importantes
asociadas al
muestreo Una técnica para obtener IC’s es utilizar alguna estadı́stica o
variable pivote que tenga distribución conocida y que dependa
tan solo de θ como valor desconocido. Por ejemplo, si deseamos
estimar la media de una v.a. X ∼ N (µ, σ 2 ) con varianza
conocida; podrı́amos utilizar como variable pivote la estadı́stica
X̄ − µ
Z= √ ∼ N (0, 1).
σ/ n
X
con p̄ = n, como variable pivote para la construcción del IC
para p.
Distribuciones
distribución B(n, N1 ). De manera más general, si se tuviera
importantes
asociadas al
interés, por ejemplo, en las frecuencias de los elementos i ≠ j
muestreo de la población, entonces no es difı́cil verificar que
1 1 2
(δi , δj , δ0 ) ∼ M ul(n, , , 1 − ),
N N N
donde f0 denota a la frecuencia de selecciones de otras
unidades distintas a i y j. Note que estas v.a´s no son
independientes, desde que por ejemplo:
Estimadores
puntuales y La función de probabilidad (conjunta) del vector anterior viene
por intervalos
dada por:
Distribuciones
importantes
asociadas al
muestreo
CxM1 1 CxM2 2 . . . CxMkk
P (X1 = x1 , X2 = x2 , . . . , Xk = xk ) = ,
CnN
Estimadores
Proposición
puntuales y
por intervalos Xi ∼ H(N, Mi , n), ∀i = 1, 2, . . . , k.
Distribuciones nMi Mj N −n
importantes
Cov(Xi , Xj ) = − N2
( N −1 ), ∀i ≠ j ∈ {1, 2, . . . , k}.
asociadas al
muestreo Si la muestra fuera con reemplazamiento, entonces
M1 M2 Mk
(X1 , X2 , . . . , Xk ) ∼ M ul(n, , ,..., ).
N N N
Note finalmente que las v.a´s δi discutidas en (2) tienen una
naturaleza completamente distinta en caso la muestra se tome
sin reemplazamiento.