Está en la página 1de 5

Universidad Nacional de Tres de Febrero

Maestría en Generación de Información Estadística


Teoría y Técnicas de Muestreo
TP Diseño de muestra y estimadores

Augusto E. Hoszowski

Ejercicio I
En la siguiente población de cuatro alumnos se tienen definidas dos variables X e Y.

Alumno X Y
a 6 14
b 9 20
c 5 12
d 4 10

Se desea estimar mediante una Muestra Aleatoria Simple de 2 alumnos la media de X, la media de Y y la
razón R = Ȳ /X̄. Se pide:
• Listar todas las muestras posibles
• Para cada muestra calcular ȳ, x̄, r = ȳ/x̄, s2x , s2y .
• Verificar que E(ȳ)=Ȳ , E(x̄)=X̄, E(s2x )=Sx2 ,E(s2y )=Sy2 (la media muestral es un estimador insesgado de
la media poblacional en el MAS y s2 muestral es un estimador insesgado de S 2 en el MAS, pero r no es
un estimador insesgado de R en el MAS$)
• Hallar el sesgo relativo de r (SesgRel = 100 · Sesgo/P arámetro). Verificar que es despreciable.
• Calcular V ar(ȳ) hallando la varianza de todas las muestras posibles y verificar que coincide con
(1 − n/N ) · S 2 /n
• Hallar CV (ȳ) y CV (Y ) (siendo Y la variable medida en las cuatro unidades del marco de muestreo).
Coinciden?
• Hallar CV (r) y EM C(r)

Ejercicio II
La tabla tabla_muestras_posibles.xlsx contiene 20 unidades, a las que se le midieron una variable Y. Será
nuestro universo/marco de muestreo. Se desea estimar la media de Y mediante una MAS(10). Se compararán
estos estimadores:
• Media muestral
• Media muestral truncada, eliminando 10% inferior y 10% superior (en nuestro caso resulta el menor
valor de la muestra y el mayor valor de la muestra)
• Mediana
1. Listar con R todas las muestras posibles y calcular para cada una de ellas media, media truncada y
mediana

2. Agregar a cada muestra la media, media truncada y mediana de los diez valores.

1
3. Verificar que la media muestral es un estimador insesgado de la media poblacional, lo que no se cumple
para la mediana y la media truncada
4. Graficar mediante tres histogramas las tres series de estimaciones. Tienen una distribución aproxi-
madamente normal? Incluir en los gráficos una línea vertical de referencia que indique la ubicación del
parámetro a estimar.
5. En base a los histogramas qué estimador parece preferible?

Esquema de resolución de los puntos 1. y 2.


Para listar los subconjuntos posibles podemos hacer por ejemplo,
df_tabla <- read_excel("tabla_muestras_posibles.xlsx")
df_muestras <- data.frame(matrix(unlist(combn(df_tabla$Y,10, simplify = FALSE)),
ncol=10, byrow=TRUE))

Para agregar a cada muestra la media muestral y el correspondiente histograma podemos hacer
# Calculo la media de cada muestra
media <- apply(df_muestras[,1:10],1,mean)
df_muestras$media <- media

# Histograma de la media
p <- ggplot(df_muestras, aes(x=media)) +
geom_histogram(bins=30, color="black", fill="white")

p <- p+ geom_vline(aes(xintercept=mean(media)),
color="blue", linetype="dashed", size=1)
p

2
15000

10000
count

5000

10 20 30 40 50
media

La mediana podemos calcularla así


# Mediana
mediana <- apply(df_muestras[,1:10],1,median)
df_muestras$mediana <- mediana

Y la media truncada así


# Media truncada
media_truncada <- function(x){
mean(x, trim=0.1)

media_truncada <- apply(df_muestras[,1:10],1,media_truncada)


df_muestras$media_truncada <- media_truncada

Ejercicio III
Se desea estimar la población de Argentina según CEN2010 censando una Muestra Aleatoria Simple de radios
censales (eliminamos los radios sin viviendas).
1. Qué tamaño de muestra se necesita para que el estimador tenga un CV inferior al 2%?.

2. Seleccionar una MAS de ese tamaño y con survey estimar total de población, CV e intervalo de
confianza con un nivel de confianza de 90%.
3. Si el CV requerido fuese la mitad (2%), la muestra necesaria sería el doble?

3
Sugerencias para el punto 1.
Leemos las bases
radios_sexo <- read_excel("cen2010_radios_sexo.xlsx")
radios_bienes <- read_excel("cen2010_radios_bienes.xlsx")
radios_tipo <- read_excel("cen2010_radios_tipo.xlsx")

radios_2010 = merge(radios_sexo, radios_bienes, by = "Codigo")


radios_2010 = merge(radios_2010, radios_tipo, by = "Codigo")
radios_2010$Pob_radio <- radios_2010$Varon + radios_2010$Mujer
radios_2010$Viv_radio <- radios_2010$Casa +
radios_2010$Rancho +
radios_2010$Casilla +
radios_2010$Departamento +
radios_2010$Inquilinato +
radios_2010$Hotel_pension

radios_2010 <- radios_2010[radios_2010$Viv_radio>0,]

Calculo N (total de radios en el universo), población en cada radio (Y), ty (total de población) y S2 (varianza
corregida de Y)
N= nrow(radios_2010)
radios_2010$Y <- radios_2010$Varon + radios_2010$Mujer

ty = sum(radios_2010$Pob_radio)

S2 <- var(radios_2010$Y)
CV= 0.02

Planteo a qué es igual el CV del estimador del total de una variable Y en el MAS(n):

DS
CV =
ty
Elevo ambos miembros al cuadrado

V ar N 2 · (1 − n/N ) · S2/n
CV 2 = =
ty 2 ty

Despejo n
n= round((CVˆ2*tyˆ2/(S2*Nˆ2)+1/N)ˆ(-1))

Verificamos
Var <- Nˆ2*(1-n/N)*S2/n

CV= 100*sqrt(Var)/ty

Nota: Otra forma válida de resolver este ejercicio sería probar con algunos valores de n

Ejercicio IV
Se desea estimar el total de hogares que habitan en viviendas rancho/casilla según el CEN2010 de Argentina
censando una Muestra Aleatoria Simple de radios censales.
1. Seleccionar una MAS de ese tamaño 2. Con survey estimar (con la muestra seleccionada) total de
población, CV e intervalo de confianza con un nivel de confianza de 90%. El IC contiene al parámetro?

4
Ejercicio V
En un ballotage, un candidato X encarga una estadístico una muestra aleatoria simple de electores para saber
si gana o pierde la elección. Supongamos que la gente no miente y que no cambia el voto luego de la encuesta.
Por motivos de costo se encuestan a 400 personas. De ellas, 212 afirman que votarán por X.
1. Qué le informa el estadístico al candidato?. La información que da la encuesta es útil?
2. Cuál es el CV del estimador?

Ejercicio VI
Se selecciona una muestra aleatoria simple de 30 hogares para indagar cierta característica rara. En la
muestra ningún hogar la presenta. Puede dar un intervalo de confianza al 90% para la proporción de hogares
con esa característica? (puede utilizarse el paquete de R binom)

También podría gustarte