Documentos de Académico
Documentos de Profesional
Documentos de Cultura
por
MONSERRAT HERRADOR
Instituto Nacional de Estadstica
y
DAVID SALGADO
Instituto Nacional de Estadstica
Universidad Antonio de Nebrija
RESUMEN
1. INTRODUCCIN
2. RESULTADOS PRELIMINARES
1
y U yk y s , donde nh es el tamao de la muestra sh seleccionada
h nh ksh h
L
JK ( )
(n
h 1
h 1)( (h) ), [1]
1
donde (h) (hk ) , siendo (hk ) el estimador aplicado a la pseudomuestra
nh ksh
L
nh 1
(1)
JK () =
h =1
n h ks
( (hk ) (h) ) 2 [2]
h
L
nh 1
(2)
JK( ) =
h =1
n h ks
( (hk ) (h) ) 2 , [3]
h
(1) En Jones (1974) aparecen estas frmulas para muestreo sin reemplazamiento. Tan
slo es necesario eliminar el factor de correccin de poblaciones finitas para obtener las
relaciones equivalentes con reemplazamiento.
SOBRE EL COMPORTAMIENTO ASINTTICO DE LA ESTIMACIN DEL ERROR CUADRTICO 201
donde se define
n 2 nh 2
(hk ) 1 h (hk ) (hk )(h),
nh nh
1
(h) (hk )
nh ks
h
1
(hk )(h) (hk )(hl),
nh 1 ls
h(k )
Wh
max O(1) cuando n [4]
1h L nh / n
W
h 1
2
h Uh O(1) cuando n [5]
Rao y Wu (Rao y Wu, 1985) formulan ms hiptesis que no son necesarias para
nuestros propsitos, pero que se encuentran en el empleo habitual de este diseo.
En particular, indican cmo en el caso en el que los tamaos muestrales de los
estratos permanezcan acotados ( maxhnh O(1) ), entonces [4] equivale a
1
maxWh O(n ) [6]
1h L
O(1)
2
1
(yk yU )6 O(n3 )
N kU
SOBRE EL COMPORTAMIENTO ASINTTICO DE LA ESTIMACIN DEL ERROR CUADRTICO 203
3. Regularidad de g:
Existe un entorno cerrado y acotado B de yU tal que las derivadas de tercer
orden de g son continuas y acotadas en B .
1 2
g(yU ) y U yU g(yU ) y U yU Op (n3 / 2 )
2
g( ) Op (1) .
204 ESTADSTICA ESPAOLA
Lema 3.2
1 Wh2 2
( ) g(yU ) U O(n3 / 2 ) . [7]
2 h 1
nh
h
Lema 3.3
( ) O(n1 ) .
Lema 3.4 Sea (hk ) el estimador que resulta de aplicar a la muestra con la
unidad k del estrato h sustrada. Entonces
1 Wh
Wh 2
(hk ) g(y U ) y s yhk
g(yU ) y sh yhk Op (n3 )
nh 1 h 2 nh 1
y s yhk
y U(hk ) y U Wh h
[8]
nh 1
W 3
1 2
(hk) g(y U ) y U(hk) y U g(y U ) y U(hk) y U Op h
[9]
2 nh 1
SOBRE EL COMPORTAMIENTO ASINTTICO DE LA ESTIMACIN DEL ERROR CUADRTICO 205
max | y U(hk) yU | ,| y U yU | 1 para todo 0
hk
que Krewski y Rao demostraron en Krewski y Rao (1981) bajo una condicin tipo
L W
Lyapunov(2), es decir, h
(yhk yU )2 O(1) para algn 0 . Sustituimos
h 1 n h
[8] en [9] y empleamos las condiciones asintticas para llegar a la relacin pedida.
Lema 3.5
JK ( ) 1 Wh2
g(yU )Ss2 Op (n3 / 2 ) [10]
2 h 1
nh h
1 1 Wh2
(h) (hk) g(y U )Ss2 Op (n3 )
nh ks 2 nh (nh 1) h
h
(2) Se asume que se cumple esta condicin en la poblacin, lo que no resta generali-
dad.
206 ESTADSTICA ESPAOLA
1
con Ss2 (yhk ys )2 , de donde
h nh 1 ksh h
L L
(n n
JK ( ) 1 Wh2
h 1)( (h) ) g(y U )Ss2 Op (n2 ) .
2 h
h 1 h 1 h
n
JK ( ) 1 Wh2
g(yU )Ss2 Op (n3 / 2 ) .
2 h
h 1 h
JK ( ) = O (n1 ) .
p
( )
( ) O(n3 / 2 ) .
JK
L
2 ( ) (nh 1)2 ( (h) )2 . Advirtase que la diferencia radica en los trminos
h 1
cruzados del desarrollo del cuadrado del sumatorio del primero, que han sido elimi-
nados del segundo.
Los resultados que siguen se deducen de la aplicacin elemental de las
propiedades de los operadores O() y Op () a los resultados obtenidos en el
apartado anterior y recordando que y U yU Op (n1/ 2 ) .
Corolario 3.3
2
1 L
Wh2 2
( ) g(yU )
2
2
h 1
nh
U O(n5 / 2 ) .
h
[11]
Corolario 3.4. Sea 2 ( ) = (
JK ( )) 2 , entonces
2
1 L
Wh2
2 ( ) g(yU )Ss2 Op (n5 / 2 ) .
2 nh h
h 1
Corolario 3.5
L L
W h2 Wh2
n h n h
g yU Ss2 Ss2 Op n 2 .
2
h h'
h 1 h 1
h h
2 ( ) . El corolario 3.5 implica que a orden O n 2 , que es el mayor orden en
p
W
h 1
h 4Uh O(1) cuando n
y
1 4
donde 4U h k yUh .
Nh kUh
Corolario 3.6. Sea 2 ( ) = (
JK ( )) 2 , entonces
3 n h3 5 n h 3
n
L
W 4h
2 2
1
4 2
n h 1 n h2 2 nh 3
g yU U4 h O n 5 / 2 .
h 1 h
Demostracin. En primer lugar, teniendo en cuenta que estamos ante muestreo con
reemplazamiento(3), tenemos
2
y .
2
1
donde sh
4
k ys h
k s h
nh
14 n
L
2 W 4h n h3
g yU U4 +
2
JK
h 1
2
h n h 1 n h2 2n h 3 h
L L
W 2h W h2
1
4 n g yU U2 U2 O n5 / 2 .
n h h h
2
h 1 h 1 h
h h
(3) Por tanto, pueden rescatarse resultados de la inferencia estadstica. Vase Srndal,
Swensson and Wretman (1992).
SOBRE EL COMPORTAMIENTO ASINTTICO DE LA ESTIMACIN DEL ERROR CUADRTICO 209
Tan slo hay que restar la expresin [11] del desarrollo del sesgo elevada al
cuadrado para llegar a la relacin enunciada.
Finalmente,
Corolario 3.7. Sea 2 ( ) cualquiera de los dos estimadores del sesgo al cuadrado
considerados, entonces
2 ( ) O p n2 .
f : L a la funcin tal que f yU 1 ,..., yU L
y f y s 1 ,..., ys L , con las
propiedades expuestas igualmente en la primera seccin(4). Las demostraciones de
esta seccin son las mismas de Jones (Jones, 1974), en las que se tiene en cuenta
y s h y U h O p n1 / 2
(4) Los resultados que siguen son para muestreo con reemplazamiento. En Jones
(1974) aparecen estos mismos resultados para muestreo sin reemplazamiento. Los rdenes
no cambian al pasar a muestreo sin reemplazamiento puesto que el factor de correccin de
poblaciones finitas es O(1) .
210 ESTADSTICA ESPAOLA
Lema 4.1
n1 f y
L
2
h U 1 ,..., yU L U2 h
h 1 h
L
n
1
2
h f yU 1 ,..., yU L h2 f yU 1 ,..., yU L 3U h O n2
h 1 h
1
y
3
donde 3U h hk yU h .
Nh k Uh
(JK
O n1 .
1)
E
(JK
O n3 / 2 .
2)
n 2 n 2
(h k ) 1 h (hk ) h (h k ) (h) ,
nh nh
1
(hk )(h) (hk ) (hl) .
nh 1 l sh(k )
Corolario 4.1
(1) O n1 / 2 .
JK p
Corolario 4.2
( 2 ) O n1 / 2 .
JK p
g yU . Entonces
y
2
( )2 g(yU ) Op (n3 / 2 ) Op (n1 ) ,
2
U yU [12]
L
U2 h
MSE( ) g(yU ) O(n3 / 2 ) O(n1 ) .
2
Wh2 [13]
h 1
nh
( y U ) = yU . Para establecer [13] tan slo hay que aplicar el teorema de Fuller
Es fcil convencerse de que cada factor que se incluya en el desarrollo del error
cuadrtico medio disminuye en 1/2 el orden del resto que se obtiene.
Para llegar al comportamiento asinttico del estimador del error cuadrtico
medio debemos recordar la relacin MSE ( ) = ( ) 2 ( ) , por lo que empleando
212 ESTADSTICA ESPAOLA
MSE
(1) O n 1 .
JK
MSE
( 2 ) O n 3 / 2 .
JK
MSE
( 3) O n 2 .
JK
MSE 2
( 4 )
JK
O n 5/ 2
(4) ( ) debe encontrarse con las tcnicas descritas en (Jones,
donde la expresin JK
1974).
(r ) ( ) tiene la expresin dadas en los teoremas 4.1 y 4.2 para
Advirtase que JK
r = 1, 2, respectivamente, mientras que para r = 3, 4, slo se ha indicado cmo
encontrarlas. El clculo de estas expresiones conlleva un largo ejercicio de
manipulaciones algebraicas y la imposicin de algunos requisitos sobre el tamao
muestral de los estratos, como n h 3 y, n h 4 respectivamente (Jones, 1974).
SOBRE EL COMPORTAMIENTO ASINTTICO DE LA ESTIMACIN DEL ERROR CUADRTICO 213
CONCLUSIONES
(n
2
h 1)( (h) ) ,
h
adems de olvidar los trminos cruzados que son positivos y del mismo orden, se
est empleando una estimacin sesgada al orden mayor de la componente del
sesgo. No obstante, obsrvese que el sesgo introducido de este modo es muy
pequeo dado el orden del estimador del sesgo al cuadrado respecto al de la
varianza.
4. Para muestras pequeas, ninguna de las relaciones aqu tratadas tiene utilidad
porque no pueden despreciarse los trminos que aqu se desprecian. Anlogamen-
te, las componentes del sesgo y de la varianza ya no sern tan diferentes en sus
aportaciones a la estimacin del error cuadrtico medio.
Los resultados anteriores han sido demostrados para muestreo aleatorio simple
monoetpico con reemplazamiento, pero son vlidos tambin para el caso de
muestreo polietpico. Para ello, si N denota el tamao de la poblacin U estratifica-
da en primera etapa en L estratos U h de tamaos respectivos N h , esto es,
U Lh 1 Uh , observemos que un estimador de la media poblacional
L L 1
yU W h yU h Wh Yh i , donde Yhi denota el total de la
h 1 h 1 Nh i U h
L Y hi
L
W y
ish
y U Wh h sh
h 1
nh h 1
W S
h 1
h yi y jUh O(1) i, j 1,,p cuando n
W
h 1
h 4 yi y jUh O(1) i, j 1,,p cuando n
1
donde S y y U (yhki yiU )(yhkj y jU ) y
i j h Nh kUh h h
1
4 y y U (yhki yiU )2 (yhkj y jU )2
i j h Nh kUh h h
SOBRE EL COMPORTAMIENTO ASINTTICO DE LA ESTIMACIN DEL ERROR CUADRTICO 215
REFERENCIAS
COCHRAN, W.G. (1977). Sampling Techniques, 3rd edition. Wiley, New York.
FULLER, W.A. (1976). Introduction to Time Statistical Series. Wiley, New York.
INSTITUTO NACIONAL DE ESTADSTICA (2007). Encuesta Industrial de Empresas.
Metodologa, Instituto Nacional de Estadstica, http://www.ine.es/daco/da-
co42/encindem/metoeiae2007.pdf.
ISAKI, C.T. AND FULLER, W.A. (1982). Survey design under the regression super-
population model. Journal of the American Statistical Association 77, 89-96.
JONES, H.L. (1974). Jackknife estimation of functions of stratum means. Bio-
metrika 61, 343-348.
KREWSKI, D. AND RAO, J.N.K. (1981). Inference from stratified samples: properties
of the linearization, jackknife and balanced repeated replication methods. The
Annals of Statistics 9, 1010-1019.
MANN, H.B. AND WALD, A. (1943). On stochastic limit and order relationships. The
Annals of Mathematical Statistics 14, 217-226.
MILLER, R.P. (1974). The jackknife- a review. Biometrika 61, 1-15.
RAO, J.N.K. AND WU, C.F.J. (1985). Inferences from stratified samples: Second-
order analysis of three methods for nonlinear statistics. Journal of the Ameri-
can Statistical Association 80, 620-630.
RAO, J.N.K., WU, C.F.J. AND YUE, K. (1992). Some recent work on resampling
methods for complex surveys. Survey Methodology 18, 209-217.
SRNDAL, C.-E. SWENSSON, B. AND WRETMAN, J.H. (1992). Model assisted survey
sampling. Springer, New York.
SHAO, J. AND TU, D. (1995). The jackknife and bootstrap. Springer, New York.
SMITH, T.M.F. (1976). The foundations of survey sampling: a review. Journal of
the Royal Statistical Society Series A 139, 183-204.
WOLTER, K. (2007). Introduction to variance estimation, 2nd edition. Springer, New
York.
216 ESTADSTICA ESPAOLA
ABSTRACT