Documentos de Académico
Documentos de Profesional
Documentos de Cultura
806 617 143 - 1 PDF
806 617 143 - 1 PDF
por
GONZALO SNCHEZ-CRESPO BENITEZ
Delegacin del INE en Cantabria
Telfono: 942-216638
Correo electrnico: gsanchez@ine.es
RESUMEN
1 1
=
k 3
// 1 2 3 // // 4 5 6 // // 7 8 9 // // 10 11 12 //
zc= i+ (j-1) k
Donde
zc = Valor que identifica las unidades seleccionadas con intervalo constante
i = Nmero aleatorio de seleccin. Entre 1 y k
j = Nmero correlativo entre 1 y n. Donde n es el tamao de muestra.
k = Tamao de los grupos formados para la seleccin. k= N/ n
8 ESTADSTICA ESPAOLA
n S2
V( x sr ) = 1 = 2.16
N n
k
( x i X)
2
V( x sis ) = i = 1 = 0.67
k
N n S2st
V( x str ) = = 0,16
N n
Donde
( )
1 n k 2
S2st = xij x j
n(k 1) j = 1i = 1
zv= i+ (j-1)(k+1) - c k
Figura 1
MDULO PARA EL CLCULO DE ESTRUCTURAS DE POBLACIN EN
POSDEM. MODELOS DE SUPERPOBLACIN
En primer lugar vamos a obtener los valores de los parmetros y del trmino de
error que mejor se ajustan a la poblacin que estamos estudiando. As tendremos:
Tabla 1
ESPERANZA DEL ERROR CUADRTICO MEDIO
Grfico 1
ESPERANZA RESPECTO DEL MODELO DEL ERRROR CUADRTICO MEDIO
En segundo lugar vamos a observar la varianza respecto del modelo del error
cuadrtico medio. En la siguiente tabla tenemos el error cuadrtico medio obtenido
en cada poblacin finita, su valor esperado, su varianza y un indicador de la cota
superior del error que hemos definido como la esperanza mas dos veces la desvia-
cin respecto del modelo.
Tabla 2
ESPERANZA Y VARIANZA DEL ERROR CUADRTICO MEDIO PARA UNA DES-
VIACIN DE LA PERTURBACIN ALEATORIA IGUAL A DOS Y UN TAMAO DE
MUESTRA IGUAL A CUATRO
Grfico 2
ERROR CUADRTICO MEDIO SOBRE UN CONJUNTO DE 200 POBLACIONES
FINITAS REALIZADAS ALEATORIAMENTE CON LA MISMA ESTRUCTURA POBLA-
CIONAL BASADA EN UN MODELO POLINMICO DE GRADO TRES
Grfico 3
POBLACIN HIPOTTICA DE HOTELES SEGN CAPACIDAD ORDENADOS
POR NMERO DE HABITACIONES
Aqu podemos observar como a pesar de que el valor esperado respecto del
modelo permite definir como preferibles los mtodos centrados al mtodo de Yates,
si bien la varianza respecto del modelo de los primeros provoca que en un gran
nmero de poblaciones el error cuadrtico medio del estimador obtenido este por
encima del obtenido con el mtodo de Yates. En la siguiente tabla podemos obser-
var estos valores.
Tabla 3
ESPERANZA Y VARIANZA DEL ERROR CUADRTICO MEDIO PARA UNA DES-
VIACIN DE LA PERTURBACIN ALEATORIA IGUAL A SIETE, HETEROCEDSTI-
CIDAD Y UN TAMAO DE MUESTRA IGUAL A CUATRO
E V I=E+2*D Pf1 Pf2 ... Pf200
C_isc 74.27154 5014.4383 215.89694 1.975495 132.91205 ... 75.702003
C_isv 69.72824 4525.6562 204.27424 13.19773 151.38329 ... 73.30413
Corr_extr. 81.82519 216.88261 111.27906 89.037626 109.44578 ... 106.28774
Grfico 4
ERROR CUADRTICO MEDIO SOBRE UN CONJUNTO DE 200 POBLACIONES
FINITAS GENERADAS ALEATORIAMENTE CON LA MISMA ESTRUCTURA POBLA-
CIONAL BASADA EN UN MODELO POLINMICO DE GRADO TRES, TRMINO DE
ERROR ALEATORIO DE DESVIACIN SIETE Y HETEROCEDASTCIDAD 0.01
Grfico 5
DISTINTOS MODELOS DE SUPERPOBLACIN AJUSTADOS
Nm. De
plazas entre 10
y 150
Hoteles
Tabla 4
COEFICIENTES ESTIMADOS PARA CADA MODELO
a0 a1 a3 a4
Modelo 1 -4.19E+00 +3.91E-01
Modelo 2 +2.07E+01 -1.71E-01 +2.12E-03
Modelo 3 +7.39E-00 +4.28E-01 -3.51E-03 +1.42E-05
Hemos comprobado los clculos que lleva a cabo el proceso de simulacin con
POSDEM mediante las ecuaciones siguientes:
Los resultados obtenidos al aplicar estos modelos en la generacin de poblacio-
nes aleatorias pueden comprobarse, para el caso lineal, con los siguientes resulta-
dos tericos:
1) Muestreo sistemtico:
Em Vp ( x sis ) = a1 2 (k2 - 1)/12 + 2
con 2 = 2 (k - 1)/nk
20 ESTADSTICA ESPAOLA
Tabla 5
ESPERANZA RESPECTO DE DIFERENTES MODELOS -P1,P2 Y P3- DEL ERROR
CUADRTICO MEDIO
En esta tabla podemos observar que los mtodos equilibrado y modificado son
sensibles a las especificaciones del modelo, tanto al orden del polinomio como a si
el tamao de muestra es par o impar. Los resultados para un modelo de ajuste
polinmico de grado tres se han presentado en la tabla 1. La principal conclusin
de este apartado es que, para este ejemplo con datos del marco de la encuesta de
establecimientos hoteleros, el muestreo centrado con intervalo de seleccin varia-
ble reduce el error cuadrtico medio, en trminos generales, frente a otros mtodos
sistemticos considerados. Esta reduccin se lleva a cabo con robustez sobre
parmetros que influyen decisivamente en el comportamiento de los otros mtodos
como son: el tamao de muestra, el nmero de grupos en la poblacin y sobre si
estos son pares o impares.
Tambin hemos observado en este apartado la relacin acusada entre el trmi-
no de error aleatorio del modelo y el comportamiento errtico del mtodo centrado.
Por ello se ha propuesto un indicador de la cota superior del error, que incorpora la
informacin relativa a la representatividad del valor esperado, mediante la desvia-
cin respecto del modelo del error cuadrtico medio.
22 ESTADSTICA ESPAOLA
(3) Existe en este momento una versin de evaluacin de este programa en internet.
MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE 23
Figura 2
DOS PANTALLAS DE LA APLICACIN POSDEM(4)
(4) La aplicacin POSDEM tiene ms de cien opciones diferentes. Aqu slo se representan dos
de las pantallas ms significativas.
MUESTREO SISTEMTICO CON INTERVALO DE SELECCIN VARIABLE 25
En resumen y desde esa triple ptica, este programa ser de utilidad: a alum-
nos de un curso de teora y prctica de muestreo en poblaciones finitas en sus dos
posibles versiones de bsico o avanzado; a profesores que deseen disponer de un
instrumento para la investigacin emprica del rea de las encuestas por muestreo;
y a empresas, oficinas centrales de estadstica o profesionales de investigaciones
por muestreo que deseen disear encuestas con una seleccin ptima de las
unidades muestrales. Este instrumento, la aplicacin POSDEM, permite realizar
diseos de una manera personalizada a cada investigacin e incorpora el conoci-
miento que el experto en muestreo tiene, no siendo necesario que la persona que
efectivamente realiza el diseo tenga estos conocimientos.
Vamos a resumir lo que permite hacer POSDEM:
1. El programa permite trabajar con bases de datos procedentes de ficheros
externos en formatos Dbase, Paradox, Foxpro y Acces. Tambin permite generar
variables definidas a medida y generar poblaciones aleatorias bajo una amplia
gama de posibilidades: aleatoriedad, dispersin, heterocedastcidad, tendencia y
ciclo. De forma que es posible modelar una gran variedad de poblaciones que se
pueden encontrar en la prctica de las encuestas por muestreo. Esta posibilidad se
utiliza sobre todo dentro del enfoque de modelos de superpoblacin.
2. El programa tiene incorporados diecisiete mtodos de seleccin y veinte
mtodos de estimacin distintos. Una vez elegido el mtodo y obtenidas las mues-
tras, calcula para cada muestra, el estimador del total, de la media, o de la propor-
cin, segn se trate de datos cualitativos o cuantitativos; la varianza del estimador,
su desviacin tpica, los lmites de confianza al 95% y el coeficiente de variacin.
Calcula tambin, para ciertas opciones, los momentos de segundo, tercer y cuarto
orden. Todos estos clculos se realizan para cada muestra obtenida, y se pueden
listar bajo diferentes formatos, con salidas a pantalla, a impresora, a disco o al
portapapeles de Windows. Para una poblacin tipo de 800 unidades, calcula como
resultado final y en una sola realizacin, sin tener en cuenta procesos intermedios o
clculos definidos especficamente, un total de 11.298 estimaciones diferentes.
Dispone adems de cien opciones especficas, todas ellas accesibles desde men.
Las ms utilizadas dispuestas en teclas de funcin y teclas abreviadas (combina-
cin de ctrl+letra). Presenta tambin una ayuda en lnea de cada pantalla con su
correspondiente glosario y ejemplos. Esta ayuda se presenta en formato hipertexto.
3. De los procedimientos de seleccin que utiliza la aplicacin, tenemos un pri-
mer grupo con doce procedimientos que tienen en comn que la seleccin se
realiza con probabilidades iguales, y un segundo grupo de tres mtodos con
probabilidades desiguales, proporcionales al valor de una variable auxiliar,
generalmente el tamao.
26 ESTADSTICA ESPAOLA
10. Permite, por ltimo realizar diseos polietpicos. As, en primer lugar es
posible obtener las unidades que formarn la muestra de unidades primarias sobre
las que a su vez se realizar un nuevo muestreo, hasta conseguir determinar las
unidades ltimas de estudio. La aplicacin tiene implementado un procedimiento
para obtener el error de muestreo en diseos bietpicos.
7. CONCLUSIONES
LIMITE SUPERIOR
LIMITE INFERIOR 6,09 0,33 0,65 3,89 7,67 10% 9,58 3,10 12,77 3,58 54% 48,36 399,50 3299,13
POBLACION (Orden aleatorio) 6,50 2,17 1,47 1,21 1,10 23% 11,92 3,45 13,00 3,61 55% 54,17 507,00 5059,17
(1) MED Estimador de la media. (8) DES Desviacin muestral.
(2) VARM Varianza del estimador media. (9) CUA Cuasivarianza.
(3) DESM Desviacin del estimador. (10) CUD Cuasidesviacin.
(4) LIM.I Lmite inferior del intervalo de confianza al 95%. (11) CVS Coeficiente de variacin.
(5) LIM.S Lmite superior. (12) M2 Momento de segundo orden respecto al origen.
(6) CVSM Coeficiente de variacin por el estimador medio en %. (13) M3 tercer .
(7) VAR Varianza muestral. (14) M4 cuarto .
29
30 ESTADSTICA ESPAOLA
Anexo 2
1 2 3 2 1 3 0 (*) 2+(1-1)(3+1)-(0)(3)= 2
4 5 6 2 6 0 2+(2-1)(3+1)-(0)(3)= 6
7 8 9 3 9 1 (**) 2+(3-1)(3+1)-(1)(3)= 7
10 11 12 4 12 1 2+(4-1)(3+1)-(1)(3)= 11
13 14 15 5 15 1 2+(5-1)(3+1)-(1)(3)= 15
16 17 18 6 18 2 (***) 2+(6-1)(3+1)-(2)(3)= 16
19 20 21 7 21 2 2+(7-1)(3+1)-(2)(3)= 20
REFERENCIAS
SUMMARY