Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Programa R. Varios.
Instalación de R. Ejecutar R. (trabajaremos en C:\muestreo)
Importar paquetes externos survey, sampling y xlsReadWrite.
Cargar paquetes
>library(sampling)
>library(xlsReadWrite)
Leer dataframe MU284
>data(MU284)
Son los datos de 284 “municipalidades” de Suecia. Algunas variables son,
LABEL : Identificador, de 1 a 284.
P75 : Población en 1975.
P85 : Población en 1985.
RMT85 : Recaudación por impuestos municipales en 1985.
REG : Región geográfica. Hay 8 regiones.
CL : Indicador de conglomerado o “cluster”. Hay 50 conglomerados.
Programa R. Varios.
Instalación de R. Ejecutar R. (trabajaremos en C:\muestreo)
Importar paquetes externos survey, sampling y xlsReadWrite.
Cargar paquetes
>library(sampling)
>library(xlsReadWrite)
Leer f1500.xls. Lo carga en un dataframe llamado f1500
>f1500=read.xls(“c:/muestreo/f1500.xls”)
Son los datos de 1500 familias. Las variables son,
NID : Identificador, de 1 a 1500.
PE : Personas en la familia.
ING : Ingresos anuales. En euros.
AL : Gastos en alimentación.
VIV: Vivienda propia. SÍ:1, NO:0.
ZONA: Zona de residencia. De 1 a 30.
NIVEL: Nivel económico. A, B ó C, de menos a mayor ingresos.
Programa R.
Cargar f1500.xls
Supongamos que la variable ING está relacionada con AL, por una relación
aproximada de proporcionalidad directa. Se supone que ING es conocida y AL
de estudio (esta sería una situación real).
Hacer lo mismo para estimar la proporción de familias con vivienda propia, con
una precisión de 0‟05.
PROGRAMA SPSS
Programa SPSS.
Abrimos la población mu284.xls.
(a) Diseñamos un plan de muestreo para seleccionar una muestra aleatoria
simple de n=10 “municipalidades”. Con dicha muestra estimamos media
y total de P75 y P85. Obtener el efecto del diseño y su raíz cuadrada.
R
Supongamos que el dataframe que contiene la muestra es musamp.
Cargamos survey.
>library(survey)
Definimos el diseño.
pvdis = svydesign(id = ~1,weights = ~PESOS, data = musamp)
Estimamos media y total de P85 con efecto del diseño.
>svymean(~P85,pvdis,deff=T)
>svytotal(~P85,pvdis,deff=T)
CURSO DE MUESTREO. IEA. PRÁCTICA 5.
Programa R.
>library(sampling)
>library(survey)
>data(MU284)
>muestra=MU284[sample(284,15),]
>dise=svydesign(~1,data=muestra,weights=~rep(284/15),fpc=~rep(284))
>attach(f1500)
>Na=length(NIVEL[NIVEL=="A"])
>Nb=length(NIVEL[NIVEL==”B”])
>Nc=length(NIVEL[NIVEL==”C”])
Afijación proporcional
>na=trunc(30*Na/1500)
>nb=trunc(30*Nb/1500)
>nc=trunc(30*Nc/1500)
Muestreo
>ma=f1500[NIVEL=="A",][sample(length(f1500[NIVEL=="A",][[1]]),na),]
>mb=f1500[NIVEL=="B",][sample(length(f1500[NIVEL=="B",][[1]]),nb),]
>mc=f1500[NIVEL=="C",][sample(length(f1500[NIVEL=="C",][[1]]),nc),]
>mest=rbind(ma,mb,mc)
Estimación
>disest=svydesign(~1,data=mest,weigths=~c(rep(Na/na,na),rep(Nb/nb,nb),
rep(Nc/nc,nc)),fpc=~c(rep(Na,na),rep(Nb,nb),rep(Nc,nc)))
>svymean(~AL+AD+VIV,disest)
>svyby(~AL+AD+VIV,~NIVEL,disest,svymean)
SPSS
Repetir la última actividad de la práctica 5 empleando SPSS.
R
Seleccionar una muestra aleatoria simple de tamaño 40 en f1500
>mu40=f1500[sample(1500,40),]
Definir el diseño
>dise=svydesign(~1,data=mu,weights=~rep(1500/40,40),fpc=~rep(1500,40))
Estimar la media de AL y la proporción de VIV
>svymean(~AL+VIV,dise)
Post estratificar el diseño (la muestra)
> Na=517
> Nb=633
> Nc=350
> estra=data.frame(NIVEL=c("A","B","C"),tam=c(Na,Nb,Nc))
> postdesi=postStratify(desi,strata=~NIVEL,population=estra)
Repetir las estimaciones
> svymean(~AL+VIV,postdesi)
SPSS
Una población se compone de 2000 familias, distribuidas en 3 zonas. Cada
zona está dividida en secciones censales, 10, 15 y 20 respectivamente.
Mediante muestreo aleatorio simple se han seleccionado en cada zona
2, 3 y 3 secciones censales . Dentro de cada sección seleccionada se ha
obtenido mediante muestreo aleatorio simple, una muestra de familias.
Para ellas se ha observado los ingresos familiares en EUROS y si la
vivienda en la que habitan es en propiedad (1), o en alquiler (2). Los datos
obtenidos se encuentran en el fichero famestcon.xls.
(a) Estimar los ingresos medios por familia y el porcentaje de familias
con vivienda propia o en alquiler. Realizar las estimaciones para la población
completa y por zonas. En todos los casos, calcular intervalos de confianza al
95%.
(b) Estimar los ingresos medios para las subpoblaciones FAMILIAS CON
VIVIENDA PROPIA y FAMILIAS CON VIVIENDA EN ALQUILER.
>desi=svydesign(~seccion+familia,data=famestcon,strata=~distrito,
weights=~pesos,fpc=~nsec+tamsec)
SPSS