Está en la página 1de 50

Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Encuestas Continuas:
Estimación de Parámetros
en Muestreo Sucesivo
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Encuestas Continuas:
Estimación de Parámetros
en Muestreo Sucesivo

Amelía Victoria García Luengo


Inmaculada Oña Casado
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Encuestas Continuas: Estimación de Parámetros en Muestreo Sucesivo
© del texto: Amelía Victoria García Luengo, Inmaculada Oña Casado
Editorial Universidad de Almería, 2014
publicac@ual.es
www.ual.es/editorial
Telf/Fax: 950 015182
¤
ISBN: 978–84–16027–38–5
Depósito legal: Al 655–2014
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Prólogo

Las técnicas indirectas de estimación en muestreo de poblaciones


finitas tratan de mejorar, en la fase de estimación, mediante el co-
nocimiento de información suplementaria aportada por una o varias
variables auxiliares, la precisión de los estimadores directos que no
utilizan más que la información que proporciona la observación de la
variable de interés en la muestra seleccionada.
En encuestas organizadas es común estimar en intervalos de tiem-
po regulares algún parámetro poblacional, los cuales varían con el
tiempo. Con objeto de usar la información muestral sobre la ocasión
anterior es necesario muestrear la población de modo tal que las mues-
tras referidas a diferentes instantes en el tiempo tengan algunos ele-
mentos en común. Es decir, se refiere al proceso organizado que elimi-
na algunos de los elementos de la muestra y añade otros nuevos cuando
el tiempo avanza. Este método de muestreo es el llamado muestreo en
ocasiones sucesivas con reemplazamiento parcial de unidades.
Desde finales de los 40 hasta la década de los 60, nos encontramos
con un desarrollo extenso de los métodos del muestreo en ocasiones
sucesivas, justificado por la necesidad de realizar encuestas continuas,
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

llevadas a cabo por los organismos de los países más adelantados en


el campo estadístico.
En este manual se presenta una visión conjunta de las técnicas
indirectas de estimación y el método del muestreo en ocasiones suce-
sivas, diseño muestral que es utilizado en gran cantidad de encuestas
continuas elaboradas por el Instituto Nacional de Estadística, como
es el caso de la Encuesta de Población Activa.
Bajo un diseño de muestreo en dos ocasiones se aborda el problema
de la estimación de parámetros poblacionales, tales como la media,
la varianza, la mediana, la razón y el producto de medias. Para los
estimadores propuestos se obtiene la fracción óptima de la muestra
que debe solaparse, así como las condiciones bajo las cuales, dichos

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
8

estimadores mejoran en precisión al correspondiente estimador directo


y a estimadores indirectos propuestos por otros autores.
El libro se estructura en cuatro capítulos, con un enfoque ase-
quible a los alumnos, profesionales o investigadores interesados en
aplicar estas técnicas de muestreo estadístico en poblaciones finitas y
su posterior utilización para el diseño de encuestas en campos como
la Economía, el Marketing Directo, la Investigación de Mercados, las
Ciencias Ambientales, el Control de Calidad, la Estadística Pública,
etc.
Además, se ha incluido una extensa bibliografía, que recoge los
trabajos de los últimos años, así como una serie de publicaciones de
las propias autoras.
Por último, esperamos que el contenido del libro despierte el in-
terés del lector y permita consolidar conceptos manejados en la ma-
teria que nos ocupa.

Amelia Victoria García


Inmaculada Oña
Almería, Marzo 2007.
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Índice general

1. Introducción 11

2. Estimación de la varianza poblacional en el muestreo


en ocasiones sucesivas 15
2.1. Estimación de la varianza poblacional . . . . . . . . . 15
2.1.1. Muestreo doble . . . . . . . . . . . . . . . . . . 16
2.2. Muestreo en dos ocasiones . . . . . . . . . . . . . . . . 19
2.2.1. Estimación de la varianza poblacional en la se-
gunda ocasión. Estimador lineal . . . . . . . . 24
2.2.2. Estimación de la varianza poblacional en la se-
gunda ocasión. Estimador lineal generalizado . 40
2.2.3. Estimación de la varianza poblacional en la se-
gunda ocasión. Estimador combinado . . . . . . 46
2.2.4. Una alternativa al estimador de la varianza pobla-
cional. Estimador combinado . . . . . . . . . . 47

3. Estimación de la mediana poblacional en el muestreo


Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

en ocasiones sucesivas 51
3.1. Estimación de la mediana poblacional . . . . . . . . . 51
3.1.1. Muestreo doble . . . . . . . . . . . . . . . . . . 61
3.2. Muestreo en dos ocasiones. . . . . . . . . . . . . . . . . 64
3.2.1. Estimación de la mediana poblacional en la se-
gunda ocasión. Estimador lineal . . . . . . . . . 64
3.2.2. Estimación de la mediana poblacional en la se-
gunda ocasión. Estimador combinado . . . . . . 69

4. Estimación de otros parámetros 73


4.1. Estimación de la media en el muestreo en ocasiones
sucesivas . . . . . . . . . . . . . . . . . . . . . . . . . . 73

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
10 ÍNDICE GENERAL

4.2. Estimación del coeficiente de regresión en el muestreo


en ocasiones sucesivas . . . . . . . . . . . . . . . . . . 80
4.3. Estimación de la razón y el producto . . . . . . . . . . 82
4.3.1. Muestreo doble . . . . . . . . . . . . . . . . . . 84
4.3.2. Estimación de la razón en la segunda ocasión . 87
4.3.3. Estimación del producto en la segunda ocasión 115

Bibliografía 141
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Capítulo 1

Introducción

El muestreo de una población está dirigido a obtener información


acerca de alguna o algunas características de ésta a partir, no de la
población entera sino de una parte de ella llamada muestra, debido a
la imposibilidad de obtener información de todas las unidades pobla-
cionales, ya sea por falta de recursos económicos, porque la población
es excesivamente grande, o simplemente por conveniencia. Apoyán-
dose en las unidades muestrales se proponen estimadores sobre dichas
características de forma que proporcionen la información más efi-
ciente.
Los métodos de muestreo más conocidos y utilizados consideran
estimadores que utilizan sólo los valores observados de la característica
en estudio. Sin embargo es frecuente que la variable objeto de estu-
dio esté altamente relacionada con una característica auxiliar cuyos
datos están disponibles o son muy fáciles de obtener para todos los
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

elementos de la población. En esta situación es muy útil considerar


métodos de estimación que utilizan información auxiliar o suplemen-
taria, relativa a una variable o característica correlacionada con la
que es objeto de estudio, para modificar la forma de los estimadores
directos o expandidos (los usuales cuando no existe dicha informa-
ción suplementaria) consiguiendo estimadores más precisos que los
calculados a partir de la muestra.
El Capítulo 2, Estimación de la varianza poblacional en
el muestreo en ocasiones sucesivas, lo dedicamos a estudiar la
estimación de la varianza poblacional bajo un diseño de muestreo en
dos ocasiones. Primeramente exponemos las contribuciones de Sud,
Srivastava y Sharma (2001) dedicadas a esta materia. A continuación

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
12 Introducción

aplicando la metodología de Hansen, Hurwitz y Madow (1953) cons-


truimos un estimador lineal insesgado para la varianza poblacional en
la segunda ocasión. Determinando los valores que minimizan la varian-
za de este estimador, obtenemos el estimador de la varianza, junto con
la expresión de su varianza y la fracción óptima que debe aparearse. Se
obtiene también la curva que da la ganancia en precisión del estimador
propuesto sobre el estimador simple que no utiliza la información so-
bre la primera ocasión. Sin embargo, utilizando la proporción óptima
de apareamiento, obtenida al estimar la media poblacional, en la ex-
presión de la varianza del estimador propuesto, la pérdida en precisión
para dicho estimador de la varianza poblacional es despreciable. Esto
sugiere que, el problema de la estimación de la varianza poblacional
puede ser simultáneamente considerado con la estimación de la media
poblacional. También obtenemos los estimadores para el cambio y la
suma de las varianzas poblacionales.
Seguidamente tratamos el caso de estimar cualquier combinación
lineal entre las varianzas. Para dos ocasiones, consideramos el pará-
metro de interés como una función ponderada de las varianzas de las
dos ocasiones. Se estudian los casos particulares de la estimación de la
varianza poblacional en la segunda ocasión, la estimación del cambio
de las varianzas en las dos ocasiones y la estimación de la media de
las varianzas en las dos ocasiones.
A continuación, presentamos la construcción de otro estimador
de la varianza poblacional en la ocasión actual, utilizando la técni-
ca que combina dos estimadores independientes de la varianza: un
estimador de regresión de doble muestreo de la parte apareada de la
muestra y un estimador simple de la parte no apareada. Para terminar
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

construimos un estimador alternativo de la varianza poblacional en


la segunda ocasión, considerando como información complementaria,
una variable de la primera ocasión. Para la parte común utilizamos el
estimador de doble muestreo para la varianza poblacional propuesto
por Sarjinder Singh (1991) y para la parte no común utilizamos un
estimador simple de la varianza.
En el Capítulo 3, Estimación de la mediana poblacional en
el muestreo en ocasiones sucesivas, abordamos el problema de
estimar la mediana de una población finita, en la segunda ocasión.
Mientras que la literatura dedicada a la estimación de medias y to-
tales es extensa, no ocurre lo mismo cuando el parámetro a estimar
es la mediana de una población finita. Además, la mayor parte de

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Introducción 13

los trabajos (como por ejemplo Gross 1980, Sedransk y Meyer 1978,
Smith y Sedransk 1983) sólo observan el comportamiento de la va-
riable objeto de estudio para realizar la estimación. Así, continuamos
revisando los trabajos en los que se estudia cómo incorporar en la fase
de estimación puntual de un cuantil poblacional, la información pro-
porcionada por una variable adicional. En lo que resta de capítulo nos
centramos en el estudio de la técnica del muestreo doble, con objeto
de estimar, bajo un diseño de muestreo en dos ocasiones, la mediana
poblacional mediante un estimador lineal insesgado. Determinando
los valores que minimizan la varianza de dicho estimador, obtenemos
el estimador de la mediana, junto con la expresión de su varianza, la
fracción óptima que debe aparearse y la curva que da la ganancia en
precisión del estimador propuesto sobre el estimador simple que no
utiliza la información sobre la primera ocasión. Para terminar com-
probamos que la varianza de este estimador lineal insesgado, coincide
con la que obtenemos cuando estimamos, bajo un diseño de muestreo
en dos ocasiones, la mediana poblacional mediante un estimador com-
binado formado por dos estimadores independientes: un estimador de
regresión de doble muestreo para la parte apareada de la muestra y
un estimador simple de la mediana para la parte no apareada.
En el Capítulo 4, Estimación de otros parámetros, el obje-
tivo se centra en mejorar la precisión en la estimación del parámetro
media poblacional. Utilizamos un estimador indirecto bivariante para
la parte apareada de la muestra, empleando dos variables auxiliares,
por ser el caso de aplicación más frecuente. En concreto, presentamos
el método de razón para estimar la media en la segunda ocasión.
Si el interés recae en estudiar una relación entre dos variables para
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

una determinada ocasión y el cambio en los parámetros que explique


dicha conexión a través del tiempo, Singh y Talwar (1991), estiman
el coeficiente de regresión para la ocasión actual.
En muchas encuestas continuas, la estimación de la razón pobla-
cional de dos características, para la ocasión actual, resulta de interés
práctico, así como el producto poblacional de dichas características.
Tripathi y Sinha (1976), Das (1982), Okafor (1992), Artés y García
(2001) dedujeron estimadores de la razón poblacional para la ocasión
actual, utilizando el muestreo en ocasiones sucesivas. A continuación,
proponemos otra alternativa para construir un estimador óptimo de la
razón de dos medias en la segunda ocasión, considerando dos variables
auxiliares de la primera ocasión. Comparamos con otras estrategias,

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
14 Introducción

y obtenemos las condiciones bajo las cuales, se mejora la precisión.


También hemos obtenido los estimadores para el cambio y la suma
de productos poblacionales y además construimos un estimador ópti-
mo del producto de dos medias en la segunda ocasión, considerando
sólo una variable auxiliar de la primera ocasión. Para la parte aparea-
da utilizamos el estimador de doble muestreo para el producto pro-
puesto por Khare (1991). Por último introducimos una modificación
al estimador de producto, desarrollando la teoría en muestreo sucesi-
vo para construir el estimador óptimo del producto de las medias en
la segunda ocasión combinando un estimador del producto tipo razón
de doble muestreo, para la parte común de la muestra, y para la no
común utilizamos un estimador directo del producto.
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Capítulo 2

Estimación de la varianza
poblacional en el muestreo
en ocasiones sucesivas

2.1. Estimación de la varianza poblacional


El uso de información auxiliar proporcionada por una variable x alta-
mente correlada con la variable principal y es común, como ya hemos
comentado, en la estimación de medias o totales poblacionales. Los
estimadores de razón y regresión utilizan la información que propor-
ciona la variable x para modificar los estimadores directos, consigu-
iendo estimadores más precisos del parámetro en cuestión.
De una forma similar, es razonable suponer que estas técnicas de
estimación se pueden utilizar, bajo las condiciones adecuadas, para
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

proporcionar estimadores eficientes de la varianza.


Fuller (1970)[23] propone un estimador de regresión de la varianza
del estimador de Horvitz-Thompson del total poblacional usando co-
mo variable auxiliar x, las cantidades πi πj − πij y (πi πj − πij )(i − j)2 ,
siendo πi , πj y πij , las probabilidades de inclusión individual y con-
junta de cada unidad, respectivamente.
Ogus y Clark (1971)[56] proponen el uso de estimadores de razón
y diferencia de la varianza bajo un diseño de muestreo de Poisson,
con el propósito de reducir el efecto del tamaño muestral aleatorio,
en la estimación de la varianza.
Bajo un diseño muestral en el que se selecciona una unidad en
cada estrato con probabilidad proporcional al tamaño (PPS), Hansen,

15

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
16 sucesivas

Hurwitz y Madow (1953)[35] proponen el uso de una variable correlada


junto con la técnica de estratos colapsados, para estimar la varianza,
y prueban que el estimador está positivamente sesgado.
Bajo el mismo diseño muestral, Hartley, Rao y Kiefer (1969)[36]
proponen un estimador de la varianza basado en suponer una buena
regresión entre las verdaderas medias de los estratos y algunas varia-
bles auxiliares. Sus ejemplos, que utilizan una sola variable, indican
una mejora considerable en términos del sesgo absoluto respecto al
estimador propuesto por Hansen, Hurwitz y Madow. No obstante,
el primer método es más sencillo de aplicar. Además el estimador
de Hartley no se ha comprobado que sea no negativo bajo todas las
condiciones.
Posteriormente, Shapire y Baterman (1978)[86] consideran la re-
ducción del sesgo del estimador de la varianza en un diseño con una
unidad por estrato, utilizando como estimador de la varianza el esti-
mador de Yates-Grundy, para un diseño con dos unidades por estrato
con probabilidades πij calculadas en base a un esquema de muestreo
de Durbin (1967)[19].

2.1.1. Muestreo doble


Srivastava y Jhajj (1980)[102] consideraron esta clase general de esti-
madores para estimar la varianza poblacional

x̄ s2x
th = s2y h( , )
X̄ Sx2

donde h(., .) es una función paramétrica tal que h(1, 1) = 1 y que


Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

cumple ciertas condiciones de regularidad. x̄, s2y , s2x denotan la media


muestral de x, varianza muestral de y y la varianza muestral de x. X̄ y
Sx2 , son la media poblacional y la varianza poblacional de x y se asume
que son conocidas. Sarjinder Singh (1991)[91] presenta una clase de
estimadores para doble muestreo análoga a la definida por Srivastava
y Jhajj (1980)[102]. Sarjinder Singh (1991)[91] hace el siguiente desar-
rollo sobre el sesgo y la varianza de la clase de estimadores propuesto.

Notación

En una primera fase se obtiene una muestra (x∗1 , x∗2 . . . x∗n ) de una
población N unidades y se mide una variable auxiliar x.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional 17

Para el estudio de la variable y y la variable auxiliar x, en una se-


gunda fase se obtiene (y1 , y2 . . . ym ) y (x1 , x2 . . . xm ), (m < n), una
muestra obtenida de la muestra anterior, que ahora se comporta como
población.
Por simplicidad, se asume que el tamaño de la población es suficien-
temente grande para poder prescindir del factor de corrección por
finitud y se denota por
n n
∗ −1
x∗i ; s∗2 −1
(x∗i − x̄∗ )2
X X
x̄ = n x = (n − 1)
i=1 i=1

m m
x̄ = m−1 s2x = (m − 1)−1
X X
xi ; (xi − x̄)2
i=1 i=1

m m
ȳ = m−1 s2y = (m − 1)−1
X X
yi ; (yi − ȳ)2
i=1 i=1

s2y s2x x̄
ε = 2 − 1, η= − 1, δ= −1
σy s∗2
x x̄∗
con
E(ε) = E(η) = E(δ) = 0
y
2 −1 2 n−m
E(ε ) = m (λ40 − 1), E(η ) = (λ40 − 1)
mn
2 n−m 2 n−m
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

E(δ ) = C , E(εη) = (λ22 − 1)


mn x mn
n−m n−m
E(εδ) = Cx λ21 , E(ηδ) = Cx λ03
mn mn
donde
N
µrs
µrs = (N − 1)−1
X
(Yi − Ȳ )r (Xi − X̄)s , λrs = r/2 s/2
i=1 µ20 µ02

µ11
Cx2 = Sx2 /X̄ 2 = µ02 /X̄ 2 , ρ=
Sy Sx
Estos valores pueden consultarse en Sukhatme et al. (1984)[104].

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
18 sucesivas

Clase de estimadores
Se asume que la X̄ y Sx2 , son desconocidas y se define una clase
general de estimadores

Sh2 = s2y {h[W, Z]}

donde W = x̄/x̄∗ , Z = s2x /s∗2


x y h(., .) es una función paramétrica y
satisface algunas condiciones de regularidad con h(1, 1) = 1.
Desarrollando h(W, Z) alrededor del punto (1, 1), con la ayuda de la
Serie de Taylor se tiene

Sh2 = σy2 (1 + ε)[1 + δh1 (1, 1) + ηh2 (1, 1) + 0(n−1 )]

= σy2 [1 + ε + δh1 (1, 1) + ηh2 (1, 1) + 0(n−1 )]39Y


donde h1 (1, 1) y h2 (1, 1) denotan las derivadas parciales de h en el
punto (1, 1).
Tomando esperanzas en la expresión anterior, se tiene
2 2 −1
E(Sh ) = σy + 0(n )

que implica que el sesgo de Sh2 es de orden n−1 . Se asume que el


tamaño de las muestras n y m son grandes, por lo que el sesgo se
considera despreciable y la expresión de la varianza se considera en
términos de orden 0n−1 .
2 2 2 2
V(Sh ) = E[Sh − σy ] =
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

n−m 2 2
= σy4 [m−1 (λ40 − 1) + {Cx h1 (1, 1) + (λ40 − 1)h22 (1, 1)
mn
+2h1 (1, 1)Cx λ21 + 2h2 (1, 1)(λ22 − 1) + 2h1 (1, 1)h2 (1, 1)Cx λ03 }]
Esta varianza es mínima para

λ03 (λ22 − 1) − λ21 (λ04 − 1) λ03 λ21 − (λ22 − 1)


h1 (1, 1) = , h2 (1, 1) =
Cx (λ04 − 1 − λ203 ) λ04 − 1 − λ203

y la varianza mínima de Sh2 viene dada por


" !#
2 λ40 − 1 n − m (λ22 − 1 − λ03 λ21 )2
Vmin (Sh ) = σy4 − λ221 +
m mn λ04 − 1 − λ203

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 19

2.2. Muestreo en dos ocasiones


Sud, Srivastava y Sharma (2001)[103] consideran una población finita
U = (U1 , U2 , . . . , UN ) de unidades. Sea y la variable bajo estudio que
toma valores yi sobre Ui , i = 1, 2, . . . , N . El parámetro donde recae el
interés es
N N
1 X 1 X
σ2 = (yk − ȲN )2 ; donde ȲN = yk
N k N k

Para estimar σ 2 toman una muestra de n unidades, asumiendo que el


muestreo se hace sobre una población suficientemente grande. Con-
sideran el estimador
n X
n
T̂Q = y 0 Ay =
X
lkj yk yj
k i

donde y es un vector columna (n × 1) con elementos


y = (y1 , y2 , . . . , yn )0
y A es una matriz simétrica definida semi-positiva de orden (n × n)
compuesta de los elementos lkj , k = 1, 2, . . . , n; j = 1, 2, . . . , n. La
suposición de que la matriz A es simétrica no afecta a la generalidad
de los resultados, ya que cualquier forma cuadrática y 0 By = y 0 Ay,
donde
1
A = (B + B 0 )
2
es simétrica. La suposición de que la matriz A es definida semi-positiva
asegura la no negatividad del estimador, lo cual es una propiedad
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

deseable para estimar la varianza.


Sud, Srivastava y Sharma (2001)[103] demuestran que T̂Q es un
estimador insesgado de mínima varianza de σ 2 si y solo si
Cov(yi2 , T̂Q ) = λ1 ; Cov(yi yj , T̂Q ) = λ2
donde λ1 y λ2 son los multiplicadores de Lagrangian.
De acuerdo con esto y dentro del contexto del muestreo en oca-
siones sucesivas con reemplazamiento parcial de unidades, dividen las
variables en diferentes conjuntos. Denotan la varianza poblacional en
el conjunto m-ésimo por
N
2 1 X
σm = (yim − Ȳm )2
N i

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
20 sucesivas

y su estimador por
m
yi0 Ai yi
X
T̂Qm =
i

donde yi es un vector columna (n × 1) dado por

yi = (yi1 , yi2 , . . . , yin )0

y Ai es una matriz simétrica definida semi-positiva de orden (n × n)


compuesta de los elementos ξikj , k = 1, 2, . . . , n; j = 1, 2, . . . , n tales
que
n
X n X
X n
ξikk = 1; ξikj = −1, ∀i
k k j6=k

A continuación Sud, Srivastava y Sharma (2001)[103] demuestran


que T̂Qm es un estimador insesgado de mínima varianza de σm 2 si y

solo si
2
Cov(yim , T̂Qm ) = λ1m ; Cov(yim yjm , T̂Qm ) = λ2m

donde λ1m y λ2m son los multiplicadores de Lagrangian.


0 , T̂
Además, si T̂Qm Qm son estimadores insesgados de mínima va-
2
rianza de σm , entonces
0
Cov(T̂Qm , T̂Qm ) = λ1mopt − λ2mopt = Vmin (T̂Qm )

Teniendo en cuenta estos resultados, consideran una muestra, que


dividen en un número finito de submuestras, que forman una matriz
de valores yij , con r filas y c columnas. En estas condiciones los c
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

2 y y y en cada una
pesos ξikk , ξikj asociados con los valores de yik ik ij
de las filas son iguales, es decir

ξ111 = ξ122 = . . . = ξ1cc ; ξ211 = ξ222 = . . . = ξ2cc ; . . . ξr11 = ξr22 = . . . =

= ξrcc ; y ξ112 = ξ113 = . . . = ξ1c,c−1 ; ξ212 = ξ213 = . . . = ξ2c,c−1 ; . . . ;


ξr12 = ξr13 = . . . = ξrc,c−1
Centrándose en el muestreo en dos ocasiones, consideran (xi , yi ; i =
1, . . . , N ) los valores de las características en la primera y segunda
ocasión respectivamente. En la primera ocasión obtienen una muestra
aleatoria simple (con reemplazamiento) de n unidades. En la segunda
ocasión se retiene una submuestra de m = nλ unidades. Por último

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 21

se selecciona una muestra independiente de u = n − m = nµ unidades


(no común con la primera ocasión).
Consideran X̄, Ȳ y σx2 , σy2 , las medias y varianzas poblacionales
en la primera y segunda ocasión
N N
1 X 1 X
X̄ = xk ; Ȳ = yk
N k N k

N N
1 X 1 X
σx2 = (xk − X̄)2 ; σy2 = (yk − Ȳ )2
N k N k

El parámetro de interés es σy2 , y en vista de los resultados anteriores


proponen el siguiente estimador de σy2 como
u u X u
aX b X
T̂2y = x2k + xk xj
u k u(u − 1) k j6=k

m m Xm m
c X d X e X
+ x2k + xk xj + y2
m k m(m − 1) k j6=k m k k
m Xm u u X u
f X gX h X
+ y k yj + yk2 + yk y j
m(m − 1) k j6=k u k u(u − 1) k j6=k

Asumen que a + b = 0, c + d = 0, e + f = 0 y h + g = 0, es decir los


grupos individuales de estimadores son insesgados, entonces
 
2 2
E T̂2y = (a + c)σx + (e + g)σy
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Además, para la insesgadez de T̂2y , es necesario que a + c = 0 y


e + g = 1. Por lo tanto, T̂2y se reduce a
u u X u
aX 2 a X
T̂2y = x − xk xj
u k k u(u − 1) k j6=k

m m Xm m
a X a X e X
− x2k + xk xj + y2
m k m(m − 1) k j6=k m k k
m Xm u u X u
e X (1 − e) X (1 − e) X
− yk y j + yk2 − y k yj
m(m − 1) k j6=k u k
u(u − 1) k j6=k

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
22 sucesivas

Determinan los coeficientes a y e usando los resultados anteriores


h i
Cov (x0u Au xu − x0m Am xm ), T̂2y = 0
h i
Cov (yu0 Au yu − ym
0
Am ym ), T̂2y = 0
donde xu es un vector columna de orden u × 1 dado por
[x1 x2 . . . xu ]0
Además demuestran que
  
u u X u
aX a X
Cov  x2k − xk xj  , T̂2y  =
u k u(u − 1) k j6=k
a
= [µ4x − (σx2 )2 ] + 0(u−2 )
u
  
m m Xm
a X a X
Cov  x2k − xk xj  , T̂2y  =
m k m(m − 1) k j6=k
a e
=− [µ4x − (σx2 )2 ] + [µ2x,2y − σx2 σy2 ] + 0(m−2 )
m m

  
u u X u
(1 − e) X (1 − e) X
Cov  yk2 − yk yj  , T̂2y  =
u k
u(u − 1) k j6=k

(1 − e)
= [µ4y − (σy2 )2 ] + 0(u−2 )
u
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

y   
m m Xm
e X e X
Cov  yk2 − yk yj  , T̂2y  =
m k m(m − 1) k j6=k
e a
= [µ4y − (σy2 )2 ] − [µ2x,2y − σx2 σy2 ] + 0(m−2 )
m m
donde
N
1 X
µrx,sy = (xk − X̄)r (yk − Ȳ )s
N k
Despejando a y e obtenemos

σy2 k1 k0
a=e ; e = mn
nσx2 (β2x − 1)µ k 0 n2 − u2 k12

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 23

donde k 0 = (β2x − 1)(β2y − 1);


p
k1 = ρx2 y2 β2x β2y − 1
µ4x µ4y
β2x = ; β2y =
(σx2 )2 (σy2 )2

y ρx2 y2 es el coeficiente de correlación entre x2 y y 2 . Puede compro-


barse que k 0 tendrá un valor positivo para

(β2x , β2y ) > (1, 1)

Igualmente k1 será positiva para


q 1
β2x β2y >
ρx 2 y 2

Sustituyendo los valores de a y e, obtenemos

σy2 k1 µ
"
k 0 nm
T̂2y = 0 2
(k n − u2 k12 ) nσx2 (β2x − 1)

 
u u X u m m Xm
1X 1 X 1 X 1 X
 x2k − xk xj − x2k + xk xj 
u k u(u − 1) k j6=k m k m(m − 1) k j6=k

m m Xm
1 X 1 X
+ yk2 − yk y j 
m k m(m − 1) k j6=k
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

 
u u X u
k 0 nm 1X 1
 X 
2
+ 1− 0 2 y − y k yj 
u k k u(u − 1) k j6=k

(k n − u2 k12 )

La varianza de T̂2y viene dada por

0 k 0 − µk12 (σy2 )2
Vmin (T̂2y ) = Cov(yu Au yu , T̂2y ) = (β2y − 1)
k 0 − µ2 k12 n

Los valores óptimos de λ y µ en el sentido de mínima varianza son


q
k 0 2 − k 0 k12 k0
λopt = q ; µopt = q
k0 + k 0 2 − k 0 k12 k0 + k 0 2 − k 0 k12

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
24 sucesivas

y la mínima varianza es
q
k0 + k 0 2 − k 0 k12 (σy2 )2
Vmin (T̂2y )opt = (β2y − 1)
2k 0 n
Puede comprobarse que λ y µ tendrán valores reales solamente si
k 0 > k12 .
Si se toma una muestra independiente en la segunda ocasión, en-
tonces el estimador viene dado por
n n X n
0 1X 2 1 X
T̂2y = y − yk yj
n k k n(n − 1) k j6=k

y la varianza es
(σy ) 2 2
V(T̂2y ) ∼
0
= (β2y − 1)
n
0
Luego, el porcentaje de ganancia en precisión de (T̂2y )opt sobre T̂2y
viene dado por q
k 0 − k 0 2 − k 0 k12
G= q × 100
k 0 + k 0 2 − k 0 k12

2.2.1. Estimación de la varianza poblacional en la se-


gunda ocasión. Estimador lineal
García, Artés y Oña (2004)[29] consideran una población finita de
unidades U = (U1 , . . . , UN ), donde se extrae una muestra aleatoria
simple (suponiendo grande el tamaño de la población para poder pres-
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

cindir del factor de corrección por finitud) o una muestra aleatoria con
reemplazo.
Sea N el tamaño de la población, de la que se extrae en la primera
ocasión una muestra aleatoria simple de tamaño n. Sea una muestra
aleatoria simple de tamaño m = pn (muestra apareada) submuestrea-
da de las n unidades, que se retiene para la segunda ocasión. Además,
sea una muestra aleatoria simple de tamaño u = qn tomada en la
segunda ocasión del Universo N − m que queda después de omitir las
m unidades.
Sean X̄, Ȳ , las medias poblacionales en la primera y segunda ocasión.
N N
1 X 1 X
X̄ = xi ; Ȳ = yi
N i=1 N i=1

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 25

Sean x̄, ȳ, las medias muestrales en la primera y segunda ocasión.


n n
1X 1X
x̄ = xi ; ȳ = yi
n i=1 n i=1

Sean Sx2 , Sy2 , las varianzas poblacionales en la primera y segunda


ocasión.
N N
1 X 1 X
Sx2 = (xi − X̄)2 ; Sy2 = (yi − Ȳ )2
N i=1 N i=1

Sean s2x , s2y , las varianzas muestrales en la primera y segunda ocasión.


n n
1 X 1 X
s2x = (xi − x̄)2 ; s2y = (yi − ȳ)2
n − 1 i=1 n − 1 i=1

El parámetro de interés es Sy2 . Proponemos el siguiente estimador


lineal de S 2 , Sˆ2 ,
y y

Sˆy2 = as2xu + bs2xm + cs2ym + ds2yu

donde
s2xm (s2ym ), es la varianza muestral en la primera (segunda) ocasión
correspondiente a las unidades que son comunes en las dos ocasiones
(apareadas).
s2xu (s2yu ), es la varianza muestral en la primera (segunda) ocasión co-
rrespondiente a las unidades no apareadas.
Teniendo en cuenta que las varianzas muestrales son estimadores in-
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

sesgados de la varianza poblacional para cada ocasión


       
2 2 2 2 2 2
E sxu = E sxm = Sx ; E syu = E sym = Sy

se tiene que
 
E Sˆy2 = (a + b)Sx + (c + d)Sy
2 2

Para que Sˆy2 , sea un estimador insesgado de Sy2 , deben ser

a+b=0 y c+d=1
luego
a = −b; d=1−c

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
26 sucesivas

Por lo tanto
 
Sˆy2 = a s2xu − s2xm + cs2ym + (1 − c)s2yu

La varianza de Sˆy2 , es

2 1 1 Sx4 c2 Sy4
   
V Sˆy2 = a + (β2 (x) − 1) + (β2 (y) − 1)
q p n p n

(1 − c)2 Sy4 2ac Sy2 Sx2


+ (β2 (y) − 1) − (θ − 1) (2.1)
q n p n
Donde en un primer grado de aproximación (véase Kendall y Stuart
(1977)[41]):

2 1 4 2 1 4
V(sy ) ' S (β2 (y) − 1); V(sx ) ' S (β2 (x) − 1)
n y n x
y
Sy2 Sx2
Cov(s2y , s2x ) ' (θ − 1)
n
siendo
N N
1 X 1 X
Sx2 = (xi − X̄)2 ; Sy2 = (yi − Ȳ )2 .
N i=1 N i=1

µ40 µ04 µ22


β2 (y) = ; β2 (x) = ; θ=
µ220 µ202 µ20 µ02
1 X
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

(yj − Ȳ )r (xj − X̄)s


µrs =
N
Los valores óptimos de a y c, que minimizan la varianza son

(β2 (y) − 1)pq(θ − 1) Sy2 pK


aopt = ; copt =
K − q 2 (θ − 1)2 Sx2 K − q 2 (θ − 1)2

donde K = (β2 (x) − 1)(β2 (y) − 1)


Entonces, la expresión para el estimador de la varianza en la segunda
ocasión viene dada por

(β2 (y) − 1)pq(θ − 1) Sy2  2 


Sˆy2 = sxu − s2
xm + (2.2)
K − q 2 (θ − 1)2 Sx2

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 27

pK 2 q(K − q(θ − 1)2 ) 2


+ s + s
K − q 2 (θ − 1)2 ym K − q 2 (θ − 1)2 yu
Si los valores de aopt y copt se sustituyen en (2.1), obtenemos la si-
guiente expresión para la varianza del estimador
2

ˆ

 S4
2 = y (β (y)−1)
K − q(θ − 1)2 Sy4 1 − q (θ−1)
K
Vmin y S 2 = (β2 (y)−1) (θ−1)2
n K − q 2 (θ − 1)2 n 1−q K2

  (2.3)
ˆ2
Si igualamos a cero la derivada de Vmin Sy respecto de q, encon-
traremos, para una determinada muestra de tamaño n, el valor de
q que hace mínima la varianza. Por tanto tenemos que la fracción
óptima de reemplazamiento es
p
K− K 2 − K(θ − 1)2
qopt =
(θ − 1)2
y por tanto, la fracción óptima de la muestra total que debe aparearse
en la parte común es
p
K 2 − K(θ − 1)2
popt = p
K + K 2 − K(θ − 1)2
Cuando el óptimo de q se sustituye en (2.3) se obtiene el valor mínimo
de la varianza del estimador,
Sy4
p

2
 K+ K 2 − K(θ − 1)2
Vmin Ŝy(opt) = (β2 (y) − 1) (2.4)
n 2K
Puede comprobarse que p y q tendrán valores reales solamente si
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

(θ − 1)2
<1
K
Por otra parte, si sólo se considera la información proporcionada por
la segunda ocasión, la varianza del estimador sería
  Sy4
V s2y = (β2 (y) − 1)
n
2
Comprobamos que el estimador Ŝy(opt) es más preciso que el estimador
2
sy , comparando sus respectivas varianzas.
q
(θ−1) 2

2
   Sy4 −1 + 1 − K
Vmin Ŝy(opt) −V s2y ' ≤0
n β2 (x) − 1

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
28 sucesivas

Casos particulares del estimador de la varianza poblacional


en la segunda ocasión
1. Si p = 0 no existe parte común y será q = 1. El estimador de la
varianza dado por (2.2) se convertirá en
K − (θ − 1)2 2
Sˆy2 = s = s2yu
K − (θ − 1)2 yu
y la varianza del estimador será
  Sy4 K − (θ − 1)2 Sy4
Vmin Sˆy2 = (β2 (y) − 1) = (β2 (y) − 1)
n K − (θ − 1)2 n
que coincide, con la varianza de la varianza muestral.
2. Si p = 1, q = 0, el apareamiento de la muestra es completo. El
estimador de la varianza dado por (2.2) quedará de la forma
K
Sˆy2 = s2
K − 0 ym
y la varianza del estimador será
  Sy4
Vmin Sˆy2 = (β2 (y) − 1)
n
que coincide, con la varianza de la varianza muestral.
3. Si Sy2 = Sx2 , la expresión del estimador (2.2) resulta algo simpli-
ficada
(β2 (y) − 1)pq(θ − 1)  2 
Sˆy2 = sxu − s2
xm
K − q 2 (θ − 1)2
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

pK 2 q(K − q(θ − 1)2 ) 2


+ sym + s
K − q 2 (θ − 1)2 K − q 2 (θ − 1)2 yu
pero su varianza no experimenta alteración, pues seguirá siendo
  Sy4 K − q(θ − 1)2
Vmin Sˆy2 = (β2 (y) − 1)
n K − q 2 (θ − 1)2

4. Un estimador de la varianza poblacional de la primera ocasión


se obtiene de la fórmula (2.2) cambiando los valores de las oca-
siones 1 por la 2 y la 2 por la 1, obteniendo
(β2 (y) − 1)pq(θ − 1) Sx2  2 
Sˆx2 = s − s2
K − q 2 (θ − 1)2 Sy2 yu ym

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 29

pK 2 q(K − q(θ − 1)2 ) 2


+ s + s
K − q 2 (θ − 1)2 xm K − q 2 (θ − 1)2 xu
Este estimador podría utilizarse si se puede esperar el tiempo
necesario hasta que se disponga de los datos de ambas ocasiones.
La varianza del estimador se obtendría cambiando Sy4 por Sx4 .
  Sx4 K − q(θ − 1)2
Vmin Sˆx2 = (β2 (x) − 1)
n K − q 2 (θ − 1)2

Ganancia en precisión.
A continuación obtenemos la ganancia en precisión del estimador, Sˆy2 ,
que utiliza información sobre la primera ocasión, sobre el estimador
de la varianza, que sólo utiliza información sobre la ocasión actual.
   
V s2y − Vmin Sˆy2 p(1 − p)(θ − 1)2
G=   =
Vmin Sˆ2 K − (1 − p)(θ − 1)2
y

K será positiva si
(β2 (y), β2 (x)) > (1, 1)
Por definición p ≤ 1. Si p = 1 (apareamiento total) ó p = 0 (reem-
plazamos toda la muestra), la ganancia vale cero. Para cualquier valor
de p, obtendremos una ganancia positiva siempre que se verifique
(θ − 1)2
>0
K
donde
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

µ22 µ22 q µ22


θ= =q µ40
q
µ04
= β2 (y)β2 (x) √ √
µ20 µ02 µ40 µ04
β2 (y) β2 (x)
q
θ = ρx2 y2 β2 (y)β2 (x)
siendo ρx2 y2 el coeficiente de correlación entre y 2 y x2 .
1
(yj − Ȳ )2 (xj − X̄)2
P
N
ρx 2 y 2 = q q
1 1
(yj − Ȳ )4 (xj − X̄)4
P P
N N

θ − 1 será positiva si
1
ρx 2 y 2 > p
β2 (y)β2 (x)

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
30 sucesivas

Si consideramos el valor mínimo de la varianza del estimador, la


ganancia en este caso es
   
2
V s2y − Vmin Ŝy(opt)
p
K − K 2 − K(θ − 1)2
Gopt =   = p (2.5)
2
Vmin Ŝy(opt) K + K 2 − K(θ − 1)2

Las figuras 2.1, 2.2, 2.3 y el cuadro 2.1 indican el porcentaje de


ganancia en precisión para distintos valores de ρx2 y2 y β2 (x), β2 (y),
obtenidos al sustituir en la expresión
" p #
K − K 2 − K(θ − 1)2
p × 100
K + K 2 − K(θ − 1)2

En el cuadro 2.1 podemos observar que el porcentaje de ganancia


en precisión para valores particulares de β2 (x) y β2 (y), inicialmente
decrece al incrementarse el valor de ρx2 y2 , hasta alcanzar su valor
mínimo, y a partir de este punto la ganancia crece al incrementarse el
valor de ρx2 y2 . También podemos observar en el cuadro que la ganan-
cia para valores bajos de ρx2 y2 decrece al incrementarse el valor de
β2 (x) y β2 (y), sin embargo para valores altos de ρx2 y2 crece al incre-
mentarse el valor de β2 (x) y β2 (y). En general se observa que obten-
dremos la mayor ganancia en precisión cuando el grado de correlación
entre la variable auxiliar y la principal sea alto y también lo sean los
valores de sus coeficientes de curtosis. Además vemos también que la
variación que se produce en la fracción óptima de reemplazamiento
para distintos valores de ρx2 y2 y 2(x), β2 (x), β2 (y), es similar a la
observada para la ganancia en precisión.
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Por otro lado en las figuras 2.1, 2.2 y 2.3, todo esto se puede ob-
servar gráficamente. Si analizamos las gráficas situadas a la izquierda
vemos que, en todos los casos, se alcanza el 100 % de ganancia en pre-
cisión cuando ρx2 y2 es igual a 1. En cuanto a las gráficas de la derecha
observamos que la parte común de la muestra no debe superar un valor
en torno al 50 %.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 31

Cuadro 2.1: Porcentaje de la ganancia en precisión, Gopt , para distin-


tos valores de ρx2 y2 y β2 (x), β2 (y).

ρx 2 y 2 ↓ β2 (x), β2 (y)

2, 2 2, 3 2, 4 3, 3 3, 4

0.1 q 0.625 0.5418 0.5235 0.5163 0.5092


Gopt 25 8.3690 4.6981 3.2658 1.8462
0.2 q 0.5556 0.5174 0.5081 0.5051 0.5020
Gopt 11.1111 3.4831 1.6234 1.0205 0.3963
0.3 q 0.5218 0.5045 0.5010 0.5003 0.5000
Gopt 4.3561 0.8946 0.1919 0.0626 0.0064
0.4 q 0.5051 0.5000 0.5007 0.5013 0.5031
Gopt 1.0205 0.0051 0.1442 0.5513 0.6275
0.5 q 0.500 0.5032 0.5074 0.5081 0.5117
Gopt 0 0.6395 1.4722 1.6133 2.3386
0.6 q 0.5051 0.5146 0.5221 0.5218 0.5269
Gopt 1.0205 2.9211 4.4144 4.3561 5.3818
0.7 q 0.5218 0.5368 0.5481 0.5449 0.5514
Gopt 4.3561 7.3579 9.6142 8.9820 10.2899
0.8 q 0.5556 0.5765 0.5937 0.5834 0.5915
Gopt 11.1111 15.3024 18.732 16.6764 18.2928
0.9 q 0.6250 0.6562 0.6890 0.6550 0.6655
Gopt 25 31.2365 37.8021 30.9944 33.1064
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Figura 2.1: Ganancia en precisión y fracción óptima de apareamiento,


en función de ρx2 y2 y β2 (x) = 2, β2 (y) = 2
1 0.5

0.8 0.4

0.6 0.3

0.4 0.2

0.2 0.1

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
32 sucesivas

Figura 2.2: Ganancia en precisión y fracción óptima de apareamiento,


en función de ρx2 y2 y β2 (x) = 3, β2 (y) = 3
1 0.5

0.8 0.4

0.6 0.3

0.4 0.2

0.2 0.1

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Figura 2.3: Ganancia en precisión y fracción óptima de apareamiento,


en función de ρx2 y2 y β2 (x) = 4, β2 (y) = 4
1 0.5

0.8 0.4

0.6 0.3

0.4 0.2

0.2 0.1

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Sabemos que en el caso de estimar la media poblacional, el valor


óptimo de q es
0 1
qopt = p
1 + 1 − ρ2
donde ρ es el coeficiente de correlación entre y y x. 
Sustituyendo
 este
0 ˆˆ2
valor qopt en (2.3) obtenemos la expresión de Vmin S y(opt)
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Sy4
p
q
K − (θ − 1)2 + K 1 − ρ2
(β2 (y) − 1)(1 + 1 − ρ2 ) p
n (2 − ρ2 )K + 2K 1 − ρ2 (θ − 1)2

Suponiendo que ρx2 y2 = ρ, el cuadro 2.2 indica el tanto por ciento de


ˆ
la pérdida en precisión de Sˆ2 y(opt) sobre Ŝy(opt)
2 , obtenido a partir de
la expresión
" p #
K 2 − K(θ − 1)2 )(2 − ρ2 ) + 2K 1 − ρ2 − (θ − 1)2
p
(K +
p p − 1 ×100
2K(K − (θ − 1)2 + K 1 − ρ2 )(1 + 1 − ρ2 )

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 33

Cuadro 2.2: Porcentaje de la pérdida en precisión, G0 , para distintos


valores de ρ y β2 (x), β2 (y).

ρ↓ 0
qopt β2 (x), β2 (y)

2, 2 2, 3 2, 4 3, 3 3, 4

0.1 0.501 -1.1543 -0.0506 -0.0089 -0.0029 -0.0005


0.2 0.505 -0.1008 -0.0020 -0.0001 0 0
0.3 0.512 -0.0017 -0.0002 -0.0001 0 0
0.4 0.522 -0.0011 0 -0.0003 -0.0004 -0.0009
0.5 0.536 0 -0.0027 -0.0047 -0.0049 -0.0054
0.6 0.556 -0.0103 -0.0191 -0.0191 -0.0192 -0.0169
0.7 0.583 -0.0642 -0.0607 -0.0448 -0.0499 -0.0390
0.8 0.625 -0.2016 -0.1318 -0.0658 -0.1048 -0.0738
0.9 0.696 -0.4713 -0.1810 -0.0072 -0.1908 -0.1118

Como observamos el porcentaje de pérdida en precisión es desprecia-


ble para los valores de ρ y β2 (x), β2 (y). Esto sugiere que, el problema
de la estimación de la varianza poblacional puede ser simultáneamente
considerado con la estimación de la media poblacional.

Precisión en caso de normalidad.


Si los momentos de la distribución (y, x) son los mismos de una normal
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

bivariante hasta el orden cuatro se tiene


µ22 µ04 µ40
θ= = 1 + 2ρ2 ; β2 (x) = 2 = 3; β2 (y) = 2 = 3
µ20 µ02 µ02 µ20
En este caso la fracción óptima de apareamiento y la ganancia en
precisión, tienen la siguiente expresión, evaluados en el cuadro 2.3 y
figura 2.4.
p p
1 − ρ4 1 − 1 − ρ4
popt = p ; Gopt = p × 100
1 + 1 − ρ4 1 + 1 − ρ4
En el cuadro 2.3 vemos que a medida que crece la correlación
entre la variable auxiliar y la principal el porcentaje de ganancia

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
34 sucesivas

en precisión aumenta, a la vez que disminuye la fracción óptima de


apareamiento. También observamos que la ganancia que se produce
para valores de p distintos del óptimo es menor, no alcanzando en
ningún caso el 100 % al que se llega cuando utilizamos dicha frac-
ción de apareamiento óptima. Por otro lado para valores altos de ρ la
ganancia es mayor cuanto menor es p.
Estas conclusiones también podemos obsérvalas gráficamente en
las figuras 2.4 y 2.5. Cabe destacar que en caso de normalidad la curva
de la ganancia es una función estrictamente creciente y que la parte
común de la muestra no debe superar el 50 %, también en este caso.

Cuadro 2.3: Porcentajes de la fracción óptima de apareamiento y la


ganancia en precisión para distintos valores de ρ

ρ↓ % óptimo % ganancia % de ganancia % de ganancia


apareado óptima para p = 1/3 para p = 1/4
0.5 49 1.6 1.4 1.2
0.6 48 3.5 3.1 2.7
0.7 46 6.9 6.3 5.5
0.8 43 7.3 12.5 11.1
0.9 37 26.1 25.9 24.2
0.95 28 39.8 39.6 39.2
1.0 0 100 66.6 75
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Figura 2.4: Fracción óptima de apareamiento y ganancia en precisión,


en función de ρ
0.5 1

0.4 0.8

0.3 0.6

0.2 0.4

0.1 0.2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Si la fracción de apareamiento, toma los valores 1/3 y 1/4 la ganancia


en precisión, tiene estas expresiones, evaluados en el cuadro 2.3 y

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 35

figura 2.5.
8 4 3 4
9ρ 4ρ
Gp=1/3 = ; Gp=1/4 =
4 − 83 ρ4 4 − 3ρ4

Figura 2.5: Ganancia en precisión, en función de ρ, para p = 1/3 y


p = 1/4
0.08
0.15

0.06
0.1
0.04

0.05
0.02

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

2
Notar que si hay "normalidad", Ŝy(opt) y s2y son igual de precisos en
caso de independencia de las variables puesto que

Sy4
    q  
2 2
Vmin Ŝy(opt) − V sy = −1 + 1 − ρ4 = 0
2n

Estimador del cambio. Un sencillo estimador del cambio

Oña, García y Artés (2006)[61] estudian un estimador del cambio, ∆,


que utiliza la información contenida en la muestra en las ocasiones
primera y segunda
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

   
∆ = p s2ym − s2xm + q s2yu − s2xu

Este estimador es insesgado

E(∆) = p[E(s2ym ) − E(s2xm )] + q[E(s2yu ) − E(s2xu )] =

= p[Sy2 − Sx2 ] + q[Sy2 − Sx2 ] = Sy2 (p + q) − Sx2 (p + q) = Sy2 − Sx2

La varianza del estimador es

1 4 1 Sy2 Sx2
V(∆) = Sy (β2 (y) − 1) + Sx4 (β2 (x) − 1) − 2p (θ − 1) (2.6)
n n n

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
36 sucesivas

Un estimador más general del cambio


Podemos considerar un estimador más general del cambio

∆2 = as2xu + bs2xm + cs2ym + ds2yu

al que imponen las condiciones de insesgamiento y varianza mínima.


Si tomamos esperanzas en la expresión anterior

E(∆2 ) = aE(s2xu ) + bE(s2xm ) + cE(s2ym ) + dE(s2yu ) =

= aSx2 + bSx2 + cSy2 + dSy2 = (a + b)Sx2 + (c + d)Sy2 = Sy2 − Sx2


que implica las siguientes condiciones

a + b = −1 y c+d=1

luego
b = −(a + 1) y d=1−c
El estimador será

∆2 = a s2xu −(a + 1)s2xm + cs2ym + (1 − c)s2yu

Tomando varianzas en ∆2

V(∆2 ) = a2 V(s2xu ) + (a + 1)2 V(s2xm ) + c2 V(s2ym )+

+(1 − c)2 V(s2yu ) − 2(a + 1)c Cov(s2xm , s2ym )


Hallaremos a y c para que V(∆2 ) sea mínima, para lo cual igualaremos
a cero las respectivas derivadas parciales, respecto de a y c, obteniendo
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

−q(β2 (x) − 1)(K − q(θ − 1)2 ) Kpq(θ − 1) Sy2


aopt = +
(β2 (x) − 1)(K − q 2 (θ − 1)2 ) (β2 (x) − 1)(K − q 2 (θ − 1)2 ) Sx2

pq(θ − 1)(β2 (x) − 1) Sx2 Kp


copt = 2 2 2
+
K − q (θ − 1) Sy K − q 2 (θ − 1)2
Sustituyendo en ∆2

q(K − q(θ − 1)2 ) 2 2 pK(s2ym − s2xm ) pq(θ − 1)2


(s − s ) + +
K − q 2 (θ − 1)2 yu xu
K − q 2 (θ − 1)2 K − q 2 (θ − 1)2

Sy2
" #
S2
(β2 (y) − 1) 2 (s2xu − s2xm ) − (β2 (x) − 1) x2 (s2yu − s2ym )
Sx Sy

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 37

Si en la fórmula anterior suponemos (β2 (x) − 1) = (β2 (y) − 1) y


Sx2 = Sy2 , nos queda que ∆2 tiene la siguiente expresión

p(β2 (y) − 1) q((β2 (y) − 1) − (θ − 1)) 2


(s2ym −s2xm )+ (s −s2 )
(β2 (y) − 1) − q(θ − 1) (β2 (y) − 1) − q(θ − 1) yu xu
(2.7)
Esta fórmula fue establecida por Yates (1960)[109] y equivale a una
media aritmética ponderada de los estimadores, s2ym − s2xm , s2yu − s2xu ,
con pesos

p(β2 (y) − 1) q((β2 (y) − 1) − (θ − 1))


,
(β2 (y) − 1) − q(θ − 1) (β2 (y) − 1) − q(θ − 1)

que evidentemente suman la unidad.


Si tomamos varianzas en la fórmula del estimador (2.7), tenemos

2 4 (β2 (y) − 1) − (θ − 1)
V(∆2 ) = Sy (β2 (y) − 1)
n (β2 (y) − 1) − q(θ − 1)

Se observa que, para (θ − 1)/(β2 (y) − 1) > 0, la varianza del esti-


mador del cambio es mínima si q = 0, o sea, la varianza será mínima
si las muestras en ambas ocasiones contienen las mismas unidades
muestrales. En este caso
2 4
V(∆2 ) = S ((β2 (y) − 1) − (θ − 1))
n y

Comparación de la precisión de los estimadores del cambio


Si en la fórmula (2.6) suponemos (β2 (x) − 1) = (β2 (y) − 1) y
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Sx2 = Sy2 , la varianza del estimador, ∆, será

2 4
V(∆) = S ((β2 (y) − 1) − p(θ − 1)) (2.8)
n y
Por otra parte la varianza del estimador, ∆2 , es

2 4 (β2 (y) − 1) − (θ − 1)
V(∆2 ) = Sy (β2 (y) − 1)
n (β2 (y) − 1) − q(θ − 1)

Dividiendo esta última por (2.8), tenemos

V(∆2 ) (β2 (y) − 1)((β2 (y) − 1) − (θ − 1))


=
V(∆) (β2 (y) − 1)2 − (β2 (y) − 1)(θ − 1) + (θ − 1)2 pq

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
38 sucesivas

Si p = 0, evidentemente q = 1, no existe parte común en las muestras


de las ocasiones primera y segunda, y la precisión de ambos esti-
madores es idéntica. Análoga conclusión se obtiene si q = 0, p = 1,
en cuyo caso el apareamiento de la muestra es completo.
Sin embargo, si p y q no toman estos valores extremos pueden
obtenerse ganancias importantes en precisión empleando el estimador
∆2 siempre que la correlación de los valores muestrales en la parte
común sea intensa.
La expresión

V(∆2 ) (β2 (y) − 1)((β2 (y) − 1) − (θ − 1))


=
V(∆) (β2 (y) − 1)2 − (β2 (y) − 1)(θ − 1) + (θ − 1)2 pq

en caso de normalidad tiene la forma


V(∆2 ) 1 − ρ2
=
V(∆) 1 − ρ2 + ρ4 pq

Así, por ejemplo, cuando


3 1
ρ = 0,80, p= , q=
4 4

V(∆2 ) 1 − ρ2
= = 0,82
V(∆) 1 − ρ2 + ρ4 pq
es decir, la varianza del estimador ∆2 es el 82 por 100 de la de ∆.
Por el contrario, si ρ = 0, cualesquiera que sean p y q, el cociente
anterior es igual a la unidad y la misma precisión se obtiene con ambos
estimadores.
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Estimador de la suma de varianzas


Consideremos el estimador

z = as2xu + bs2xm + cs2ym + ds2yu

e imponemos la condición de que sea un estimador insesgado de la


suma de las varianzas poblacionales.

E(z) = aE(s2xu ) + bE(s2xm ) + cE(s2ym ) + dE(s2yu ) =

(a + b)Sx2 + (c + d)Sy2 = Sx2 + Sy2

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 39

que implica las siguientes condiciones

a + b = 1 y c + d = 1 luego b = 1 − a y d = 1 − c

El estimador será

z = a s2xu +(1 − a)s2xm + cs2ym + (1 − c)s2yu

Tomando varianzas en z

V(z) = a2 V(s2xu ) + (1 − a)2 V(s2xm ) + c2 V(s2ym )+

+(1 − c)2 V(s2yu ) + 2(1 − a)c Cov(s2xm , s2ym )


Hallaremos a y c para que V(z) sea mínima, para lo cual igualaremos a
cero las respectivas derivadas parciales, respecto de a y c, obteniendo

q(β2 (x) − 1)(K − q(θ − 1)2 ) Kpq(θ − 1) Sy2


aopt = +
(β2 (x) − 1)(K − q 2 (θ − 1)2 ) (β2 (x) − 1)(K − q 2 (θ − 1)2 ) Sx2

−pq(θ − 1)(β2 (x) − 1) Sx2 Kp


copt = 2 2 2
+
K − q (θ − 1) Sy K − q 2 (θ − 1)2
Sustituyendo en z

q(K − q(θ − 1)2 ) 2 2 pK(s2ym + s2xm ) pq(θ − 1)2


(s + s ) + +
K − q 2 (θ − 1)2 yu xu
K − q 2 (θ − 1)2 K − q 2 (θ − 1)2

Sy2
" #
S2
(β2 (y) − 1) 2 (s2xu − s2xm ) + (β2 (x) − 1) x2 (s2yu − s2ym )
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Sx Sy
Si en la fórmula anterior suponemos (β2 (x) − 1) = (β2 (y) − 1) y
Sx2 = Sy2 , nos queda que z tiene la siguiente expresión

p(β2 (y) − 1) q((β2 (y) − 1) + (θ − 1)) 2


(s2ym +s2xm )+ (s +s2 )
(β2 (y) − 1) + q(θ − 1) (β2 (y) − 1) + q(θ − 1) yu xu
(2.9)
Esta fórmula fue establecida por Yates (1960)[109] y equivale a una
media aritmética ponderada de los estimadores, s2ym + s2xm , s2yu + s2xu ,
con pesos

p(β2 (y) − 1) q((β2 (y) − 1) + (θ − 1))


,
(β2 (y) − 1) + q(θ − 1) (β2 (y) − 1) + q(θ − 1)

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
40 sucesivas

que evidentemente suman la unidad. Si tomamos varianzas en la fór-


mula del estimador (2.9), tenemos
2 4 (β2 (y) − 1) + (θ − 1)
V (z) = Sy (β2 (y) − 1)
n (β2 (y) − 1) + q(θ − 1)
Se observa que, para (θ −1)/(β2 (y)−1) > 0, la varianza del estimador
de la suma de varianzas es mínima si q = 1, o sea, la varianza será
mínima si las muestras son independientes en ambas ocasiones. En
este caso
2 4
V (z) = Sy (β2 (y) − 1)
n

2.2.2. Estimación de la varianza poblacional en la se-


gunda ocasión. Estimador lineal generalizado
García y Oña (2005)[31] tratan el caso de estimar cualquier combi-
nación lineal entre las varianzas. Para dos ocasiones, consideramos el
parámetro de interés como una función ponderada de las varianzas de
las dos ocasiones, de la siguiente manera
γ = ASx2 + BSy2
donde A y B son pesos.
Consideramos el estimador
Sˆy2 = as2xm + bs2xu + cs2ym + ds2yu
Se supone un tamaño de la población suficientemente grande como
para poder omitir el factor de corrección por finitud y la varianza
es la misma en ambas ocasiones. Los valores de a, b, c y d serán
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

calculados de manera que

E(Sˆy2 ) = ASx + BSy


2 2

En este caso
b = A − a; d=B−c
El estimador se reduce a esta expresión
Sˆy2 = as2xm + (A − a)s2xu + cs2ym + (B − c)s2yu

La varianza de Sˆy2 , es
4 4 4
2 Sy 2 Sy 2 Sy
 
ˆ2
V Sy = a (β2 (y) − 1) + (A − a) (β2 (y) − 1) + c (β2 (y) − 1)
np nq np

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 41

Sy4 Sy4
+(B − c)2 (β2 (y) − 1) + 2ac (θ − 1) (2.10)
nq np

4 Sy4
2 Sy
 
V Sˆy2 = a (β2 (y) − 1) + (A2 + a2 − 2Aa) (β2 (y) − 1)+
np nq

Sy4 Sy4 Sy4


c2 (β2 (y) − 1) + (B 2 + c2 − 2Bc) (β2 (y) − 1) + 2ac (θ − 1)
np nq np

Sy4 Sy4 Sy4


! !
 
V Sˆy2
2 2
= a (β2 (y) − 1) + + (A − 2Aa)(β2 (y) − 1) +
np nq nq

Sy4 Sy4 Sy4 Sy4


! ! !
2
c (β2 (y)−1) + +(B 2 −2Bc)(β2 (y)−1) +2ac (θ−1)
np nq nq np
Para hacer mínima la varianza, igualamos a cero las derivadas par-
ciales respecto de a y c y los valores óptimos que minimizan la varianza
son
−pq(θ − 1)(B(β2 (y) − 1) − A(θ − 1)q)
aopt = + Ap
(β2 (y) − 1)2 − q 2 (θ − 1)2
p(β2 (y) − 1)(B(β2 (y) − 1) − A(θ − 1)q)
copt =
(β2 (y) − 1)2 − q 2 (θ − 1)2
Sustituyendo los valores de a y c en la expresión de la varianza

Sy4 (β2 (y) − 1)3 p2 ((β2 (y) − 1)B − Aq(θ − 1))2


"
 
ˆ
S
V y 2 =
pqn ((β2 (y) − 1)2 − q 2 (θ − 1)2 )2
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

2(β2 (y) − 1)Bp((β2 (y) − 1)B − Aq(θ − 1))


+(β2 (y) − 1)p(B 2 − )
(β2 (y) − 1)2 − q 2 (θ − 1)2
2(β2 (y) − 1)pq(θ − 1)((β2 (y) − 1)B − Aq(θ − 1))F
+
(β2 (y) − 1)2 − q 2 (θ − 1)2
pq(θ − 1)((β2 (y) − 1)B − Aq(θ − 1)) 2
+(β2 (y) − 1)(Ap − )
(β2 (y) − 1)2 − q 2 (θ − 1)2
pq(θ − 1)((β2 (y) − 1)B − Aq(θ − 1))

+(β2 (y) − 1)p(A2 − 2A(Ap − ))
(β2 (y) − 1)2 − q 2 (θ − 1)2
pq(θ−1)((β2 (y)−1)B−Aq(θ−1))
F = (Ap − (β2 (y)−1)2 −q 2 (θ−1)2
)

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
42 sucesivas

Valor óptimo de q
Para obtener el valor óptimo de q, derivamos la expresión anterior
de la varianza con respecto a q e igualamos a cero. Obtenemos
Sy4 (β2 (y) − 1)
− [(β2 (y) − 1)(θ − 1)(2AB(β2 (y) − 1)
n ((β2 (y) − 1)2 − q 2 (θ − 1)2 )2
((β2 (y) − 1)2 + (−2 + q)q(θ − 1)2 ) + A2 (θ − 1)((β2 (y) − 1)2 (1 − 2q)+
q 2 (θ − 1)2 ) + B 2 (θ − 1)((β2 (y) − 1)2 (1 − 2q) + q 2 (θ − 1)2 ))] = 0
En caso de normalidad,
θ = 1 + 2ρ2 ; β2 (y) = 3
tenemos esta expresión
Sy4 2
− [2ρ2 (A2 ρ2 (1 − 2q + q 2 ρ4 )
n (−1 + q 2 ρ4 )2
+B 2 ρ2 (1 − 2q + q 2 ρ4 ) + 2AB(1 − 2qρ4 + q 2 ρ4 ))] = 0

Casos particulares
1. Para estimar la varianza poblacional, Sy2 , en la segunda ocasión
se toman A = 0 y B = 1. En este caso, los valores óptimos de
a, c, de la varianza y el valor óptimo de q vienen dados por

−pq(θ − 1)(β2 (y) − 1)


a=
(β2 (y) − 1)2 − q 2 (θ − 1)2
p(β2 (y) − 1)2
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

c=
(β2 (y) − 1)2 − q 2 (θ − 1)2

ˆ
 S4
2 = y (β (y) − 1)
(β2 (y) − 1)2 − q(θ − 1)2
S
V y 2
n (β2 (y) − 1)2 − q 2 (θ − 1)2

(β2 (y) − 1)2 − (β2 (y) − 1) (β2 (y) − 1)2 − (θ − 1)2


p
qopt =
(θ − 1)2

En caso de normalidad, el valor óptimo de q, es

1
qopt = p
1 + 1 − ρ4

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 43

2. Si lo que se quiere estimar es el cambio de las varianzas en las


dos ocasiones, entonces A = 1 y B = −1, y los valores óptimos
para a, c, y la varianza son

p(β2 (y) − 1)(q(θ − 1) + (β2 (y) − 1))


a=
(β2 (y) − 1)2 − q 2 (θ − 1)2
−p(β2 (y) − 1)((β2 (y) − 1) + (θ − 1)q)
c=
(β2 (y) − 1)2 − q 2 (θ − 1)2
  2 4 (β2 (y) − 1) − (θ − 1)
V Sˆy2 = Sy (β2 (y) − 1)
n (β2 (y) − 1) − q(θ − 1)

3. Para estimar la media de las varianzas de las dos ocasiones,


serán A = B = 21 , y

p(β2 (y) − 1)(−(1/2)q(θ − 1) + (1/2)(β2 (y) − 1))


a=
(β2 (y) − 1)2 − q 2 (θ − 1)2
−p(β2 (y) − 1)((1/2)(β2 (y) − 1) − (1/2)(θ − 1)q)
c=
(β2 (y) − 1)2 − q 2 (θ − 1)2

ˆ
  S4
2 = y (β (y) − 1)
(β2 (y) − 1) + (θ − 1)
S
V y 2
2n (β2 (y) − 1) + q(θ − 1)

Las tablas 2.4 y 2.5 muestran los valores óptimos de q para diferentes
valores de

(θ − 1)2
A, B y
(β2 (y) − 1)2
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
44 sucesivas

Cuadro 2.4: Valores óptimos de q para diferentes valores de A, B y


(θ − 1)2
(β2 (y) − 1)2

(θ − 1)2 (θ − 1)2
A B q A B q
(β2 (y) − 1)2 (β2 (y) − 1)2
0.0 1.0 0.7 0.6 0.6 1.0 0.7 1.0
0.8 0.6 0.8 1.0
0.9 0.7 0.9 1.0
1.0 0.0 0.7 0.6 0.7 1.0 0.7 1.0
0.8 0.6 0.8 1.0
0.9 0.7 0.9 1.0
0.1 0.9 0.6 0.7 0.8 1.0 0.7 1.0
0.7 0.7 0.8 1.0
0.8 0.7 0.9 1.0
0.9 0.8
0.9 0.1 0.6 0.7 0.9 0.1 0.7 1.0
0.7 0.7 0.8 1.0
0.8 0.7 0.9 1.0
0.9 0.8
0.5 0.5 0.7 1.0 1.0 0.1 0.7 0.7
0.8 1.0 0.8 0.7
0.9 1.0 0.9 0.8
0.3 0.7 0.7 1.0 1.0 0.2 0.7 0.8
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

0.8 1.0 0.8 0.8


0.9 1.0 0.9 0.8
0.7 0.3 0.7 1.0 1.0 0.3 0.7 1.0
0.8 1.0 0.8 1.0
0.9 1.0 0.9 1.0
0.1 1.0 0.6 0.7 1.0 0.4 0.7 1.0
0.7 0.7 0.8 1.0
0.8 0.7 0.9 1.0
0.9 0.8

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 45

Cuadro 2.5: Valores óptimos de q para diferentes valores de A, B y


(θ − 1)2
(β2 (y) − 1)2

(θ − 1)2 (θ − 1)2
A B q A B q
(β2 (y) − 1)2 (β2 (y) − 1)2
1.0 -1.0 0.7 0.0 -0.9 1.0 0.7 0.0
0.8 0.0 0.8 0.0
0.9 0.0 0.9 0.0
-1.0 1.0 0.7 0.0 -0.1 1.0 0.7 0.0
0.8 0.0 0.8 0.0
0.9 0.0 0.9 0.0
-0.1 1.0 0.6 0.4 1.0 -0.2 0.7 0.3
0.7 0.5 0.8 0.4
0.8 0.5 0.9 0.5
0.9 0.6
-0.2 1.0 0.6 0.2 1.0 -0.3 0.7 0.2
0.7 0.3 0.8 0.3
0.8 0.4 0.9 0.4
0.9 0.5
-0.3 1.0 0.6 0.0 1.0 -0.4 0.7 0.0
0.7 0.2 0.8 0.2
0.8 0.3 0.9 0.3
0.9 0.4
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

-0.4 1.0 0.7 0.0 1.0 -0.5 0.7 0.0


0.8 0.2 0.8 0.0
0.9 0.3 0.9 0.2
-0.5 1.0 0.7 0.0 1.0 -0.6 0.7 0.0
0.8 0.0 0.8 0.0
0.9 0.2 0.9 0.0
-0.6 1.0 0.7 0.0 1.0 -0.7 0.7 0.0
0.8 0.0 0.8 0.0
0.9 0.0 0.9 0.0

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
46 sucesivas

2.2.3. Estimación de la varianza poblacional en la se-


gunda ocasión. Estimador combinado
En la sección 2.2.1 construimos un estimador lineal de la varian-
za poblacional en la ocasión actual. A continuación, presentamos la
construcción de otro estimador, pero utilizando la técnica de combi-
nar dos estimadores independientes de la varianza: un estimador de
regresión de doble muestreo de la parte apareada de la muestra, s02
ym

s02 2 2 2
ym = sym + b(sx − sxm )

y un estimador simple de la varianza de la parte no apareada, s2yu ,


como se muestra en el cuadro 2.6.

Cuadro 2.6: Estimaciones de las partes apareada y no apareada

Ŝy2 varianza
 2 
1 (β (y) − 1) − 1 − 1 (θ − 1) (β2 (y) − 1)
 
s02
ym Sy4 m 2 m n K
s2yu 4 1
Sy u (β2 (y) − 1)

La combinación de los dos estimadores independientes de la va-


rianza, s02 2
ym y syu , se lleva a cabo mediante una media aritmética
ponderada, con pesos Q y 1 − Q, inversamente proporcionales a las
varianzas de los estimadores independientes y suma igual a la unidad.
Ŝy2 = Qs2yu + (1 − Q)s02
ym
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Así
2 2 2 2 02
V(Ŝy ) = Q V(syu ) + (1 − Q) V(sym )
Luego, el valor de Q que minimice V(Ŝy2 ) es

V(s2yu )
Qopt =
V(s2yu ) + V(s02
ym )

Teniendo en cuenta que


2 41
V(syu ) = Sy (β2 (y) − 1)
u
Sy4
!
02 (θ − 1)2
V(sym ) = (β2 (y) − 1) 1 − q
m K

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 47

Sustituyendo en la expresión de la varianza se tiene que


(θ − 1)2
  Sy4 K − q(θ − 1) 2 S 4 1 − q
V Sˆy2 = (β2 (y)−1) =
y
(β2 (y)−1) K
K − q 2 (θ − 1)2 2
n n 2 (θ − 1)
1−q
K
Luego esta expresión coincide con la obtenida en (2.3), de manera que
se obtendrían todos los estudios realizados en la sección 2.2.1.

2.2.4. Una alternativa al estimador de la varianza pobla-


cional. Estimador combinado
Construimos un estimador óptimo de la varianza poblacional en la se-
gunda ocasión, considerando como información complementaria, una
variable de la primera ocasión. Para la parte común utilizamos el esti-
mador de doble muestreo para la varianza poblacional propuesto por
Sarjinder Singh (1991)[91], y definido en la sección 2.1.1.
s002 2 −1
ym = Sy (1 + ε)[1 + δh1 (1, 1) + ηh2 (1, 1) + 0(n )]

Para la parte no común utilizamos un estimador simple de la varianza,


s2yu , como se muestra en el cuadro 2.7.

Cuadro 2.7: Estimaciones de las partes apareada y no apareada

Ŝy2 varianza
  2 
s002 Sy4 λ40 − 1 − n − m λ2 + (λ22 − 1 − λ03 λ21 )
ym m mn 21
λ04 − 1 − λ203
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

s2yu 1 (β (y) − 1)
Sy4 u 2

Combinamos los dos estimadores independientes s002 2


ym y syu , con
pesos Q y 1 − Q, respectivamente.
Ŝy02 = Qs2yu + (1 − Q)s002
ym

Operando adecuadamente
  
(λ22 − 1 − λ03 λ21 )2
 λ221 +
−1 λ04 − 1 − λ203
 
002 4 λ40
 
V(sym ) = Sy 1 − q  
m 

 λ40 − 1 


García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
48 sucesivas

Sustituyendo en la expresión de la varianza se tiene que


 
(λ22 − 1 − λ03 λ21 )2
 λ221 +
λ04 − 1 − λ203

 
1−q 

 λ40 − 1 

02
  λ40 − 1
V Ŝy = Sy4  
n (λ22 − 1 − λ03 λ21 )2
 λ221 +
λ04 − 1 − λ203

1 − q2 
 


 λ40 − 1 

Caso particular
Para el caso en que λ03 = 0 la expresión de la varianza es
!
λ221 (λ04 − 1) + (λ22 − 1)2
1−q
  λ40−1 (λ40 − 1)(λ04 − 1)
V Ŝy02 = Sy4 !
n 2 λ221 (λ04 − 1) + (λ22 − 1)2
1−q
(λ40 − 1)(λ04 − 1)
Reescribiendo la expresión de la varianza en términos de la nomen-
clatura empleada en la sección 2.2.3 tenemos
!
(θ − 1)2 (λ21 )2 (β2 (x) − 1)
1−q +
  Sy4 K K
V Ŝy02 = (β2 (y) − 1) !
n 2 (θ − 1)2 (λ21 )2 (β2 (x) − 1)
1−q +
K K
µ21 q
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

λ21 = 1/2
; θ = ρx 2 y 2 β2 (y)β2 (x); K = (β2 (x)−1)(β2 (y)−1)
µ20 µ02
(β2 (y), β2 (x)) > (1, 1)
Las figuras 2.6 y 2.7 indican el porcentaje de ganancia en precisión del
estimador propuesto sobre el estimador directo y la fracción óptima de
apareamiento para distintos valores de ρ, β2 (x), β2 (y) y λ21 obtenidos
al sustituir en las expresiones.
√ √
1− 1−Z 1−Z
Gopt = √ ; popt = √
1+ 1−Z 1+ 1−Z
(θ − 1)2 (λ21 )2 (β2 (x) − 1)
Z= +
K K

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Muestreo en dos ocasiones 49

Figura 2.6: Ganancia en precisión y fracción óptima de apareamiento,


en función de ρ, λ21 y β2 (x) = 2, β2 (y) = 2

1
0.6
0.75 1 1
0.5 0.4
0.8 0.8
0.25 0.2
0 0.6 0 0.6
0 0
0.2 0.4 0.2 0.4
0.4 0.4
0.6 0.2 0.6 0.2
0.8 0.8
10 10

Figura 2.7: Ganancia en precisión y fracción óptima de apareamiento,


en función de ρ, λ21 y β2 (x) = 3, β2 (y) = 3

0.6 0.75
0.4 1 0.7 1
0.2 0.8 0.65 0.8
0 0.6 0.6 0.6
0 0
0.2 0.4 0.2 0.4
0.4 0.4
0.6 0.2 0.6 0.2
0.8 0.8
10 10

Comparación de los estimadores Ŝy2 y Ŝy02


Hemos comparado la precisión del estimador combinado que uti-
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

liza para la parte común el estimador de doble muestreo de Sarjinder


Singh (1991)[91], Ŝy02 , con aquel que emplea para la parte apareada un
estimador de regresión de doble muestreo, Ŝy2 , a partir de sus varianzas
   
2 02
V Ŝy − V Ŝy > 0

siempre que se verifique

(λ21 )2 (β2 (x) − 1) µ21


< 0; λ21 = 1/2
; K = (β2 (x)−1)(β2 (y)−1)
K µ20 µ02

es decir (β2 (y), β2 (x)) < (1, 1).

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice
Estimación de la varianza poblacional en el muestreo en ocasiones
50 sucesivas

Luego considerando el caso particular de λ03 = 0, es decir cuando


la variable auxiliar sea simétrica, si comparamos la varianza de los
dos estimadores, se obtiene que si los coeficientes de curtosis de las
variables auxiliar y principal son menores que 1, el estimador Ŝy02 sería
más eficiente que el Ŝy2 , es decir solamente en el caso en que exista
baja concentración de valores en la zona central de la distribución de
ambas variables, el estimador Ŝy02 sería preferible. Esto quiere decir que
dicho estimador, viene a cubrir el rango de valores de los coeficientes
de curtosis, para el que no se obtiene ganancia en precisión sobre el
estimador directo con el estimador Ŝy2 .
Las figuras 2.8 y 2.9 indican el porcentaje de ganancia en precisión
y la fracción óptima de apareamiento para distintos valores de ρ,
β2 (x), β2 (y) y λ21 .

Figura 2.8: Ganancia en precisión y fracción óptima de apareamiento,


en función de ρ, λ21 y β2 (x) = 0,2, β2 (y) = 0,2

0.4
0.75
1 0.2 1
0.5
0.8 0 0.8
0.25
0 0.6 -0.2 0.6
0 0
0.2 0.4 0.2 0.4
0.4 0.4
0.6 0.2 0.6 0.2
0.8 0.8
10 10
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Figura 2.9: Ganancia en precisión y fracción óptima de apareamiento,


en función de ρ, λ21 y β2 (x) = 0,1, β2 (y) = 0,1

1 0.4
0.75 1 1
0.5 0.2
0.8 0.8
0.25 0
0 0.6 0.6
0 0
0.2 0.4 0.2 0.4
0.4 0.4
0.6 0.2 0.6 0.2
0.8 0.8
10 10

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:51:09.
Volver al índice

También podría gustarte