Documentos de Académico
Documentos de Profesional
Documentos de Cultura
806 617 143 1 PDF
806 617 143 1 PDF
por
GONZALO SÁNCHEZ-CRESPO BENITEZ
Delegación del INE en Cantabria
Teléfono: 942-216638
Correo electrónico: gsanchez@ine.es
RESUMEN
1 1
=
k 3
// 1 2 3 // // 4 5 6 // // 7 8 9 // // 10 11 12 //
zc= i+ (j-1) k
Donde
zc = Valor que identifica las unidades seleccionadas con intervalo constante
i = Número aleatorio de selección. Entre 1 y k
j = Número correlativo entre 1 y n. Donde n es el tamaño de muestra.
k = Tamaño de los grupos formados para la selección. k= N/ n
8 ESTADÍSTICA ESPAÑOLA
n S2
V( x̂ sr ) = 1 − = 2.16
N n
k
∑ ( x̂i − X)
2
V( x̂ sis ) = i = 1 = 0.67
k
N − n S2st
V( x̂ str ) = = 0,16
N n
Donde
( )
1 n k 2
S2st = ∑ ∑ xij − x⋅ j
n(k − 1) j = 1i = 1
zv= i+ (j-1)(k+1) - c k
Figura 1
MÓDULO PARA EL CÁLCULO DE ESTRUCTURAS DE POBLACIÓN EN
POSDEM. MODELOS DE SUPERPOBLACIÓN
En primer lugar vamos a obtener los valores de los parámetros y del término de
error que mejor se ajustan a la población que estamos estudiando. Así tendremos:
Tabla 1
ESPERANZA DEL ERROR CUADRÁTICO MEDIO
Gráfico 1
ESPERANZA RESPECTO DEL MODELO DEL ERRROR CUADRÁTICO MEDIO
En segundo lugar vamos a observar la varianza respecto del modelo del error
cuadrático medio. En la siguiente tabla tenemos el error cuadrático medio obtenido
en cada población finita, su valor esperado, su varianza y un indicador de la cota
superior del error que hemos definido como la esperanza mas dos veces la desvia-
ción respecto del modelo.
Tabla 2
ESPERANZA Y VARIANZA DEL ERROR CUADRÁTICO MEDIO PARA UNA DES-
VIACIÓN DE LA PERTURBACIÓN ALEATORIA IGUAL A DOS Y UN TAMAÑO DE
MUESTRA IGUAL A CUATRO
Gráfico 2
ERROR CUADRÁTICO MEDIO SOBRE UN CONJUNTO DE 200 POBLACIONES
FINITAS REALIZADAS ALEATORIAMENTE CON LA MISMA ESTRUCTURA POBLA-
CIONAL BASADA EN UN MODELO POLINÓMICO DE GRADO TRES
Gráfico 3
POBLACIÓN HIPOTÉTICA DE HOTELES SEGÚN CAPACIDAD ORDENADOS
POR NÚMERO DE HABITACIONES
Aquí podemos observar como a pesar de que el valor esperado respecto del
modelo permite definir como preferibles los métodos centrados al método de Yates,
si bien la varianza respecto del modelo de los primeros provoca que en un gran
número de poblaciones el error cuadrático medio del estimador obtenido este por
encima del obtenido con el método de Yates. En la siguiente tabla podemos obser-
var estos valores.
Tabla 3
ESPERANZA Y VARIANZA DEL ERROR CUADRÁTICO MEDIO PARA UNA DES-
VIACIÓN DE LA PERTURBACIÓN ALEATORIA IGUAL A SIETE, HETEROCEDÁSTI-
CIDAD Y UN TAMAÑO DE MUESTRA IGUAL A CUATRO
E V I=E+2*D Pf1 Pf2 ... Pf200
C_isc 74.27154 5014.4383 215.89694 1.975495 132.91205 ... 75.702003
C_isv 69.72824 4525.6562 204.27424 13.19773 151.38329 ... 73.30413
Corr_extr. 81.82519 216.88261 111.27906 89.037626 109.44578 ... 106.28774
Gráfico 4
ERROR CUADRÁTICO MEDIO SOBRE UN CONJUNTO DE 200 POBLACIONES
FINITAS GENERADAS ALEATORIAMENTE CON LA MISMA ESTRUCTURA POBLA-
CIONAL BASADA EN UN MODELO POLINÓMICO DE GRADO TRES, TÉRMINO DE
ERROR ALEATORIO DE DESVIACIÓN SIETE Y HETEROCEDASTÍCIDAD 0.01
Gráfico 5
DISTINTOS MODELOS DE SUPERPOBLACIÓN AJUSTADOS
Núm. De
plazas entre 10
y 150
Hoteles
Tabla 4
COEFICIENTES ESTIMADOS PARA CADA MODELO
a0 a1 a3 a4
Modelo 1 -4.19E+00 +3.91E-01
Modelo 2 +2.07E+01 -1.71E-01 +2.12E-03
Modelo 3 +7.39E-00 +4.28E-01 -3.51E-03 +1.42E-05
Hemos comprobado los cálculos que lleva a cabo el proceso de simulación con
POSDEM mediante las ecuaciones siguientes:
Los resultados obtenidos al aplicar estos modelos en la generación de poblacio-
nes aleatorias pueden comprobarse, para el caso lineal, con los siguientes resulta-
dos teóricos:
1) Muestreo sistemático:
Em Vp ( x sis ) = a1 2 (k2 - 1)/12 + σ 2
con σ 2 = σ 2 (k - 1)/nk
20 ESTADÍSTICA ESPAÑOLA
Tabla 5
ESPERANZA RESPECTO DE DIFERENTES MODELOS -P1,P2 Y P3- DEL ERROR
CUADRÁTICO MEDIO
En esta tabla podemos observar que los métodos equilibrado y modificado son
sensibles a las especificaciones del modelo, tanto al orden del polinomio como a si
el tamaño de muestra es par o impar. Los resultados para un modelo de ajuste
polinómico de grado tres se han presentado en la tabla 1. La principal conclusión
de este apartado es que, para este ejemplo con datos del marco de la encuesta de
establecimientos hoteleros, el muestreo centrado con intervalo de selección varia-
ble reduce el error cuadrático medio, en términos generales, frente a otros métodos
sistemáticos considerados. Esta reducción se lleva a cabo con robustez sobre
parámetros que influyen decisivamente en el comportamiento de los otros métodos
como son: el tamaño de muestra, el número de grupos en la población y sobre si
estos son pares o impares.
También hemos observado en este apartado la relación acusada entre el térmi-
no de error aleatorio del modelo y el comportamiento errático del método centrado.
Por ello se ha propuesto un indicador de la cota superior del error, que incorpora la
información relativa a la representatividad del valor esperado, mediante la desvia-
ción respecto del modelo del error cuadrático medio.
22 ESTADÍSTICA ESPAÑOLA
(3) Existe en este momento una versión de evaluación de este programa en internet.
MUESTREO SISTEMÁTICO CON INTERVALO DE SELECCIÓN VARIABLE 23
Figura 2
DOS PANTALLAS DE LA APLICACIÓN POSDEM(4)
(4) La aplicación POSDEM tiene más de cien opciones diferentes. Aquí sólo se representan dos
de las pantallas más significativas.
MUESTREO SISTEMÁTICO CON INTERVALO DE SELECCIÓN VARIABLE 25
En resumen y desde esa triple óptica, este programa será de utilidad: a alum-
nos de un curso de teoría y práctica de muestreo en poblaciones finitas en sus dos
posibles versiones de básico o avanzado; a profesores que deseen disponer de un
instrumento para la investigación empírica del área de las encuestas por muestreo;
y a empresas, oficinas centrales de estadística o profesionales de investigaciones
por muestreo que deseen diseñar encuestas con una selección óptima de las
unidades muestrales. Este instrumento, la aplicación POSDEM, permite realizar
diseños de una manera personalizada a cada investigación e incorpora el conoci-
miento que el experto en muestreo tiene, no siendo necesario que la persona que
efectivamente realiza el diseño tenga estos conocimientos.
Vamos a resumir lo que permite hacer POSDEM:
1. El programa permite trabajar con bases de datos procedentes de ficheros
externos en formatos Dbase, Paradox, Foxpro y Acces. También permite generar
variables definidas a medida y generar poblaciones aleatorias bajo una amplia
gama de posibilidades: aleatoriedad, dispersión, heterocedastícidad, tendencia y
ciclo. De forma que es posible modelar una gran variedad de poblaciones que se
pueden encontrar en la práctica de las encuestas por muestreo. Esta posibilidad se
utiliza sobre todo dentro del enfoque de modelos de superpoblación.
2. El programa tiene incorporados diecisiete métodos de selección y veinte
métodos de estimación distintos. Una vez elegido el método y obtenidas las mues-
tras, calcula para cada muestra, el estimador del total, de la media, o de la propor-
ción, según se trate de datos cualitativos o cuantitativos; la varianza del estimador,
su desviación típica, los límites de confianza al 95% y el coeficiente de variación.
Calcula también, para ciertas opciones, los momentos de segundo, tercer y cuarto
orden. Todos estos cálculos se realizan para cada muestra obtenida, y se pueden
listar bajo diferentes formatos, con salidas a pantalla, a impresora, a disco o al
portapapeles de Windows. Para una población tipo de 800 unidades, calcula como
resultado final y en una sola realización, sin tener en cuenta procesos intermedios o
cálculos definidos específicamente, un total de 11.298 estimaciones diferentes.
Dispone además de cien opciones específicas, todas ellas accesibles desde menú.
Las más utilizadas dispuestas en teclas de función y teclas abreviadas (combina-
ción de ctrl+letra). Presenta también una ayuda en línea de cada pantalla con su
correspondiente glosario y ejemplos. Esta ayuda se presenta en formato hipertexto.
3. De los procedimientos de selección que utiliza la aplicación, tenemos un pri-
mer grupo con doce procedimientos que tienen en común que la selección se
realiza con probabilidades iguales, y un segundo grupo de tres métodos con
probabilidades desiguales, proporcionales al valor de una variable auxiliar,
generalmente el tamaño.
26 ESTADÍSTICA ESPAÑOLA
10. Permite, por último realizar diseños polietápicos. Así, en primer lugar es
posible obtener las unidades que formarán la muestra de unidades primarias sobre
las que a su vez se realizará un nuevo muestreo, hasta conseguir determinar las
unidades últimas de estudio. La aplicación tiene implementado un procedimiento
para obtener el error de muestreo en diseños bietápicos.
7. CONCLUSIONES
LIMITE SUPERIOR
LIMITE INFERIOR 6,09 0,33 0,65 3,89 7,67 10% 9,58 3,10 12,77 3,58 54% 48,36 399,50 3299,13
POBLACION (Orden aleatorio) 6,50 2,17 1,47 1,21 1,10 23% 11,92 3,45 13,00 3,61 55% 54,17 507,00 5059,17
(1) MED Estimador de la media. (8) DES Desviación muestral.
(2) VARM Varianza del estimador media. (9) CUA Cuasivarianza.
(3) DESM Desviación del estimador. (10) CUD Cuasidesviación.
(4) LIM.I Límite inferior del intervalo de confianza al 95%. (11) CVS Coeficiente de variación.
(5) LIM.S Límite superior. (12) M2 Momento de segundo orden respecto al origen.
(6) CVSM Coeficiente de variación por el estimador medio en %. (13) M3 “ tercer “ “ “ .
(7) VAR Varianza muestral. (14) M4 “ cuarto “ “ “ .
29
30 ESTADÍSTICA ESPAÑOLA
Anexo 2
1 2 3 2 1 3 0 (*) 2+(1-1)(3+1)-(0)(3)= 2
4 5 6 2 6 0 2+(2-1)(3+1)-(0)(3)= 6
7 8 9 3 9 1 (**) 2+(3-1)(3+1)-(1)(3)= 7
10 11 12 4 12 1 2+(4-1)(3+1)-(1)(3)= 11
13 14 15 5 15 1 2+(5-1)(3+1)-(1)(3)= 15
16 17 18 6 18 2 (***) 2+(6-1)(3+1)-(2)(3)= 16
19 20 21 7 21 2 2+(7-1)(3+1)-(2)(3)= 20
REFERENCIAS
SUMMARY