Está en la página 1de 10

Capítulo 3

Estimación de la mediana
poblacional en el muestreo
en ocasiones sucesivas

3.1. Estimación de la mediana poblacional

Es conocido que cuando se quiere dar una medida de posición cen-


tral que proporcione información resumida sobre la tendencia central
de determinada variable observada en una población finita, la me-
diana puede ser una medida que refleje mejor esta tendencia que la
media aritmética. Tal es el caso de variables, como los ingresos, que
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

pueden presentar valores extremos que alteran en gran medida el va-


lor obtenido para la media, mientras que la mediana permanece in-
alterable pues sólo usa la información proporcionada por los valores
centrales. En estos casos, el utilizar la media por aprovechar toda la
información puede conducir a resultados poco representativos, pues
al verse afectada por los valores extremos hace que cuando éstos sean
altos, aunque sean pocos, se desplace en el sentido de la asimetría, per-
diendo representatividad a la vez que aumenta la representatividad
de la mediana, pues habrá más valores entorno a ella. Sin embargo,
mientras que la literatura dedicada a la estimación de medias y totales
es extensa (Cochran 1977[16], Thompson 1992[105], . . . ) no ocurre lo
mismo cuando el parámetro a estimar es la mediana de una población
finita.

51

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional en el muestreo en ocasiones
52 sucesivas

Estimadores directos
Como es usual, sean y1 , y2 , . . . , yN los valores de la variable ob-
jeto de estudio y en las unidades U1 , U2 , . . . , UN que componen la
población finita. Para cada número real y (−∞ < y < ∞), la función
de distribución FY (y) se define como la proporción de elementos en la
población menores o iguales que y. De forma más precisa, la función
FY (y) puede escribirse como
1
FY (y) = card (Ay )
N
donde Ay = {k; k ∈ U | yk ≤ y} y card (Ay ) denota el número de
elementos del conjunto Ay .
La mediana poblacional (con respecto a la variable y) es un valor
MY que divide la población por la mitad, de manera que la mitad
de los elementos poblacionales tienen valores más pequeños que MY ,
mientras que la otra mitad tienen valores mayores que MY .
Por tanto, se define la mediana poblacional como MY = FY−1 (0,5),
donde FY−1 es la función inversa de FY , es decir,

MY = inf {yk | FY (yk ) ≥ 0,5}

El problema que se plantea es estimar la mediana poblacional MY


usando los datos yk para k ∈ s, donde s es una muestra aleatoria
simple.
El procedimiento general opera de la siguiente forma: en primer
lugar, se obtiene una estimación de la función de distribución FbY (y),
y a continuación, se estima MY = FY−1 (0,5) mediante
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

cY = Fb −1 (0,5)
M Y

donde FbY−1 es la inversa definida de la misma forma que FY−1 pero


ahora en la muestra.
Este método ha sido utilizado durante largo tiempo; la primera
publicación destacada fue seguramente Woodruff (1952)[108]. Pos-
teriormente, otros autores como Francisco y Fuller (1986)[21], Kuk
(1988)[46], y Rao, Kovar y Mantel (1990)[69] consideraron la esti-
mación de funciones de distribución y medianas para poblaciones fini-
tas.
El procedimiento para estimar MY usando los datos yk , k ∈ s, de
una muestra s, consiste en obtener un estimador de la función de

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional 53

distribución FbY (y) y estimar MY = FY−1 (0,5) por M cY = Fb −1 (0,5),


Y
donde la inversa se obtiene ahora de la muestra.
Ya que se considera un diseño de muestreo aleatorio simple, con
tamaño muestral n = f N , entonces, FbY (MY ) es simplemente la pro-
porción de elementos de una muestra s con yk ≤ MY. Por tanto, 
nFbY (MY ) sigue una distribución hipergeométrica con E FbY (MY ) =
FY (MY ) = 0,5 y
  N −n1 1−f
V FbY (MY ) = FY (MY ) (1 − FY (MY )) ' 0,5(1 − 0,5)
N −1n n

Estimadores indirectos
La mayor parte de los trabajos (Gross 1980[34], Sedransk y Meyer
1978[84], Smith y Sedransk 1983[98]) sólo observan el comportamiento
de la variable objeto de estudio para realizar la estimación.
En gran número de estudios económicos se dispone de información
de una población similar, de información acerca de una variable rela-
cionada con la variable de interés en la misma población, o incluso de
la misma variable estudiada para toda las unidades de la población
en una ocasión anterior. En estos casos el incorporar esta información
auxiliar en la fase de estimación puede producir estimaciones más
precisas del parámetro de interés.
En este sentido, son numerosos los trabajos (ver Cochran 1977[16])
que consiguen ese fín a través de estimadores tipo razón, diferencia o
regresión, cuando el parámetro a estimar es una media o un total.
Sin embargo, estas técnicas estándar no tienen siempre una ex-
tensión obvia, como ocurre con la estimación de regresión, cuando el
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

parámetro que interesa estimar es la mediana o cualquier otro cuantil


de una población finita.
En trabajos como los de Chambers y Dunstan (1986)[14], Rao,
Kovar y Mantel (1990)[69], Kuk y Mak (1989,94)[47, 48], Mak y Kuk
(1993)[50] se pone de manifiesto el interés que recientemente ha recibido
la estimación de la mediana de una población finita en presencia de
información auxiliar.
Presentamos en esta sección, sin profundizar demasiado, las téc-
nicas estudiadas por dichos autores sobre estimación de la mediana y
los cuantiles de una población finita, usando información auxiliar en
la fase de estimación.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional en el muestreo en ocasiones
54 sucesivas

Definición del estimador de Chambers y Dunstan


Chambers y Dunstan (1986)[14] sugieren estimar cuantiles invir-
tiendo estimadores modificados de las funciones de distribución en
presencia de información auxiliar.
Definen la función de distribución de la población como

FY (y) = N −1
X
∆(y − yi )
i∈U

donde ∆(a) = 1 cuando a ≥ 0 y ∆(a) = 0 en otro caso, y U denota la


población. Si se selecciona una muestra s, siguiendo un determinado
plan de muestreo p(s) con probabilidades de inclusión πj , entonces
el estimador clásico de FY (y) basado en el diseño viene dado por la
expresión
−1
i∈s πi ∆(y − yi )
P
Fbd (y) = P −1
i∈s πi

Chambers y Dunstan (1986)[14] proponen un estimador basado en


el modelo como una alternativa para estimar la función de distribución
poblacional FY (y). Estos autores suponen que la variable de interés
y y la variable auxiliar x están relacionadas de la siguiente manera

yi = βxi + v(xi )ui (i = 1, . . . , N )


donde N es el tamaño de la población, β es un parámetro desconoci-
do, v(x) es una función estrictamente positiva conocida y las ui son
variables aleatorias independientes e idénticamente distribuidas con
media cero. Para el modelo anterior, el estimador propuesto de FY (y)
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

viene dado por

 ( )
1 X 1 X y − bn xj
Fbm (y) = ∆(y − yi ) + ∆ − uni 
N i∈s n j∈s̄,i∈s v(xj )

donde
!−1
X yi xi X x2i
bn = ,
i∈s
v 2 (xi ) i∈s
2
v (xi )
yi − bn xi
uni = ,
v(xi )

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional 55

y s̄ = U − s es el conjunto de unidades no muestrales.

Ventajas
1. El estimador Fbm (y) verifica la propiedad de ser Fbm (y) = FY (y)
cuando yi es proporcional a xi para todo i ∈ U , pero es inde-
pendiente del diseño muestral.

2. El estimador propuesto Fbm (y) es superior al estimador clásico.

Chambers y Dunstan (1986)[14] utilizan Fbm (y) para proponer un


estimador del cuantil β de una población finita, QY (β), de la forma

b m (β) = inf{y | Fbm (y) ≥ β}


Q

Inconvenientes
1. Los estimadores propuestos por Chambers y Dunstan (1986)[14]
no son robustos para modelos que no están bien definidos.

2. No incluyeron en su estudio de simulación el estimador del cuan-


til obtenido al invertir el estimador propuesto de la función de
distribución, ya que ésto implicaba un excesivo esfuerzo com-
putacional.

Kuk (1988)[46] y Rao, Kovar y Mantel (1990)[69] proponen esti-


madores basados en el diseño, como alternativas opuestas a los esti-
madores basados en el modelo. El primero no utilizaba información
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

auxiliar en la etapa de estimación, por lo que no profundizaremos en


su trabajo.
Rao, Kovar y Mantel (1990)[69] construyeron estimadores de razón
y diferencia para estimar los cuantiles de una población finita. Se va a
denotar por FbY (y) y FbX (x) a los estimadores clásicos de las funciones
de distribución FY (y) y FX (x) respectivamente.
Un estimador de razón de QY (β) viene dado por

Q
b Y (β)
Q
b r (β) = QX (β)
Q
b X (β)

donde

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional en el muestreo en ocasiones
56 sucesivas

b Y (β) = inf{y | FbY (y) ≥ β},


Q b X (β) = inf{x | FbX (x) ≥ β}
Q

y QX (β) = inf{x | FX (x) ≥ β} es el cuantil β poblacional de x


conocido.
Análogamente, definen un estimador diferencia para Q(β)
n o
Q
b d (β) = Q b QX (β) − Q
b Y (β) + R b X (β)

donde R b es una estimador consistente de la razón poblacional R =


Y
X . Mediante un estudio de simulación, demuestran la ganancia en
eficiencia producida por estos estimadores sobre el estimador clásico,
cuando yi es proporcional a xi para todo i ∈ U .
Además, también sugieren estimar los cuantiles invirtiendo esti-
madores modificados de las funciones de distribución en presencia de
información auxiliar (como hicieron Chambers y Dunstan, 1986[14]).

Definición del estimador de Rao, Kovar y Mantel


Rao, Kovar y Mantel (1990)[69] proponen un estimador diferen-
cia modificado para la función de distribución F (t), y demuestran
numéricamente que es superior al estimador basado en el modelo de
Chambers y Dunstan (1986)[14], dado por

( !)
1
πi−1 ∆(t πi−1 G
X X X
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

Fbdm = − yi ) + bi −
G b ic
N i∈s i∈U i∈s

donde
 −1  
X 1 − 1
πj−1 ∆{xi 2 (t − Rx
X
G
bi =    b i) − u
b j }
j∈s
πj j∈s

 −1  
X πi X πi − 1
G
b ic =   ∆{xi 2 (t − Rx
b i) − u
bj }
j∈s
πij j∈s
πij

−1
bj = xj 2 (yj − Rx
u b j)

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional 57

y
πij
πi
es la probabilidad condicional de seleccionar los elementos i y j dado
que i ∈ s.

Ventajas
1. Numéricamente, Fbdm es superior al estimador basado en el mo-
delo de Chambers y Dunstan (1986)[14], Fbm (y).

2. El estimador Fbdm es asintóticamente insesgado tanto en el mo-


delo como en el diseño para FY (y), bajo un modelo de super-
población.

Inconvenientes
1. Ellos no tienen en cuenta que se está estimando una función
de distribución entera, como resultado los estimadores propues-
tos no son necesariamente monótonos. Esto causa complica-
ciones, sobretodo cuando queramos invertir la función para la
estimación de cuantiles.

2. No incluyeron en su estudio de simulación el estimador del cuan-


til obtenido al invertir el estimador propuesto de la función de
distribución, ya que ésto implicaba un excesivo esfuerzo com-
putacional.
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

3. Su aproximación también supone que el valor de la variable au-


xiliar es conocido para todas las unidades de la población. Mien-
tras que esta suposición es válida en algunas aplicaciones, tam-
poco resulta extraño que, especialmente cuando la información
sobre la variable auxiliar sea extraída de informes estadísticos u
otras fuentes secundarias, se disponga sólo de una cierta medida
de posición o de una distribución de frecuencias agrupadas de
la variable auxiliar.

Rao et. al. (1990)[69] también sugieren construir otros estimadores


para los cuantiles de una población finita a partir de Fbdm , convirtién-
dola primero en nodecreciente e invirtiéndola posteriormente.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional en el muestreo en ocasiones
58 sucesivas

Mak y Kuk (1993)[50] proponen un método alternativo basado en


el diseño para estimar cuantiles de una población finita. También cons-
truyen un algoritmo para implementar aproximaciones relacionadas
con la estimación de cuantiles, obtenidas al invertir estimadores tipo
diferencia de la función de distribución.

Ventajas

1. El estimador obtenido es computacionalmente más simple.

2. El método propuesto proporciona una forma simple y eficiente


de aproximar el estimador de Rao et. al. (1990)[69]. El algo-
ritmo resuelve el problema computacional con el que se encon-
traron estos autores.

Los estimadores de Rao et. al. (1990)[69] no son necesariamente


monótonos, por lo que sufren de una debilidad teórica importante.
Este inconveniente lleva a que Kuk y Mak (1994)[48] adopten una
aproximación funcional al problema y propongan dos estimadores
basados en composiciones de funciones.

Definición de los estimadores de Kuk y Mak

Kuk y Mak (1989)[47] consideran la estimación de la mediana de


una población finita bajo muestreo aleatorio simple. Proponen distin-
tos modos de incorporar la información auxiliar que proporciona una
variable x, en la fase de estimación de la mediana de una característica
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

de interés, MY .
En su trabajo, Kuk y Mak (1989)[47] suponen una muestra aleato-
ria simple extraída de una población finita. Además, suponen que la
mediana poblacional de la variable auxiliar, MX , es conocida.
El primer estimador para MY propuesto es un estimador tipo
razón:

MX
M
cY R = M
cY
M
cX

donde M
cY y M
cX son los estimadores directos de MY y MX , respec-
tivamente.

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional 59

El segundo estimador propuesto lo denominan estimador de posi-


ción. Lo obtienen de la siguiente forma: suponiendo los valores ordena-
dos de la variable de interés Y en la población, la mediana poblacional
MY sería aproximadamente el cuantil correspondiente a la proporción
de elementos en la población con valores de Y menores o iguales que
MY . En la fase de estimación de esta proporción, p, es donde incor-
poran la información auxiliar estimando p mediante

1 p11 p12 2 1
    
pb = nX + (n − nX ) ' nX p11 + (n − nX ) − p11
n p·1 p·2 n 2

basada en la clasificación a dos vías en la muestra

x ≤ MX x > MX
y ≤ MY p11 p12 p1·
y > MY p21 p22 p2·
p·1 p·2
donde por ejemplo p11 denota la proporción de unidades en la muestra
con x ≤ MX e y ≤ MY ; y nX es el número de unidades en la muestra
con x ≤ MX .
El tercer estimador lo denominan estimador estratificación. En
este caso la mediana poblacional, MY , se estima incorporando la in-
formación auxiliar a la hora de estimar FY (y) , de la forma

NX N − NX 1 
F̃Y (y) = F̃1 (y) + F̃2 (y) ' F̃1 (y) + F̃2 (y)
N N 2
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

donde NX es el número de unidades en la población con x ≤ MX ,


y F̃1 (y) y F̃2 (y) son las proporciones de unidades en la muestra con
valores de la variable Y menores o iguales que y para x ≤ MX y
x > MX , respectivamente.
Kuk y Mak (1989)[47] comprueban que, si la distribución bivarian-
te de (x, y) se aproxima a una distribución continua cuando N → ∞
con densidades marginales fX (x) y fY (y), y si fX (x) y fY (y) son po-
sitivas, entonces M
cY es consistente y asintóticamente normal (Gross,
1980[34])

1 1
 
N MY , (1 − f )
4n [fY (MY )]2

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice
Estimación de la mediana poblacional en el muestreo en ocasiones
60 sucesivas

Y demuestran que M cY R −MY es también asintóticamente normal,


con media 0 y desviación típica

P11 − 41
" #
1 1 1 MY2 1 MY
(1 − f ) + 2 f (M )2 − 2
n 4fY (MY )2 4 MX X X MX fY (MY )fX (MX )

donde P11 es la proporción análoga a p11 en una clasificación a dos


vías de toda la población.
También se demuestra que M
cY P y M
cY S tienen la misma distribu-
ción asintótica que es

2(1 − f ) 1
 
N MY , P11 (1 − 2P11 )
fY (MY )2 n
De la distribución asintótica de los estimadores M
cY , M
cY R , M
cY P
yM
cY S deducen que M cY R es más eficiente que M
cY si

1 1 fY (MY )MY
 
4 P11 − >
4 2 fX (MX )MX
y que M
cY P y M
cY S son más eficientes que M
cY siempre.

Para mostrar la eficiencia de los métodos propuestos con tamaño


de muestra moderados, Kuk y Mak (1989)[47] analizan la eficiencia
relativa de los estimadores McY R , M
cY P y M
cY S respecto al estimador
directo MY , mediante un estudio de simulación sobre cuatro pobla-
c
ciones descritas en Royall y Cumberland (1981)[73]. En cada una de
ellas, la eficiencia la computan en base a 500 muestras aleatorias in-
Copyright © 2014. Editorial Universidad de Almería. All rights reserved.

dependientes si n > 30 (1000 si n ≤ 30) para distintos tamaños de


muestra.

Observaciones
1. El estimador M
cY R no está definido para variables no numéricas.

2. Las varianzas asintóticas de los estimadores M


cY , M
cY R , M
cY P y
MY S se han obtenido bajo condiciones restrictivas.
c

3. Las varianzas asintóticas dependen de las densidades marginales


en general desconocidas (que deberán estimarse si han de ser
utilizadas para la construcción de intervalos de confianza por el
método pivotal).

García, L. A. V., & Oña, C. I. (2014). Encuestas continuas : Estimación de parámetros en muestreo sucesivo. Retrieved from http://ebookcentral.proquest.com
Created from bibliotecacentralupchsp on 2019-11-14 01:54:00.
Volver al índice

También podría gustarte