Está en la página 1de 7

Muestreo, Otoño 2020, FCFM-BUAP

TAREA 2a MEA

1. Una cadena de tiendas departamentales está interesada en estimar la proporción de


cuentas por cobrar que están en mora. La cadena consta de cuatro tiendas. Para reducir
el costo del muestreo, se utiliza un muestreo aleatorio estraticado, con cada tienda
como un estrato. Debido a que no se dispone de información sobre las proporciones de
la población antes del muestreo, se utiliza la asignación proporcional. A partir de la
Tabla 1, estime p, la proporción de cuentas morosas para la cadena y coloque un límite
en el error de estimación.
Tabla 1: Datos para las cuentas morosas en una cadena de tiendas departamentales
Estrato Estrato Estrato Estrato
I II III IV
Número de cuentas N1 = 65 N2 = 42 N3 = 93 N4 = 25
por cobrar
Tamaño de muestra n1 = 14 n2 = 9 n3 = 21 n4 = 6
Número muestral de 4 2 8 1
cuentas morosas

2. Una corporación desea estimar el número total de horas-trabajador perdidas, para un


mes dado, debido a accidentes entre todos los empleados. Debido a que los obreros,
técnicos y administrativos tienen diferentes tasas de accidentes, el investigador decide
usar un muestreo aleatorio estraticado, con cada grupo formando un estrato separa-
do. Los datos de años anteriores sugieren las variaciones que se muestran en la Tabla
2 para el número de horas-trabajador perdidas por empleado en los tres grupos, y los
datos actuales dan los tamaños de estrato. Determine la asignación de Neyman para
una muestra de n = 30 empleados.

Tabla 2: Datos de años anteriores


I II III
(obreros) (técnicos) (administrativos)
σ12 = 36 σ22 = 25 σ32 = 9
N1 = 132 N2 = 92 N3 = 27

Estime el número total de horas-trabajador perdidas durante el mes dado y ponga un


límite al error de estimación. Utilice los datos de la Tabla 3, obtenidos de una muestra
de 18 obreros, 10 técnicos y 2 administrativos. Haga un gráco de los datos para vericar
si hay características inusuales.
Tabla 3: Datos de una muestra para las horas-trabajador perdidas.
I I III
(obreros) (técnicos) (administrativos)
8 24 0 4 5 1
0 16 32 0 24 8
6 0 16 8 12
7 4 4 3 2
9 5 8 1 8
18 2 0

3. Una escuela desea estimar el puntaje promedio que se puede obtener en un examen
de comprensión de lectura para los estudiantes de sexto grado. Los estudiantes de la
escuela se agrupan en tres pistas, con los estudiantes rápidos en la pista I, los estudiantes
lentos en la pista III y el resto en la pista II. La escuela decide estraticar por pistas
porque este método debería reducir la variabilidad de los puntajes de las pruebas. El
sexto grado contiene 55 estudiantes en la pista I, 80 en la pista II y 65 en la pista
III. Una muestra aleatoria estraticada de 50 estudiantes se asigna proporcionalmente
y produce muestras aleatorias simples de n1 = 14, n2 = 20 y n3 = 16 de las pistas
I, II y III, respectivamente. La prueba se administra a la muestra de estudiantes; los
resultados están en la Tabla 4.
Tabla 4: Datos de las muestras para los puntajes promedio de lectura de comprensión de
estudiantes de sexto grado.
Estrato I Estrato II Estrato III
(Pista I) (Pista II) (Pista III)
80 92 85 82 42 32
68 85 48 75 36 31
72 87 53 73 65 29
85 91 65 78 43 19
90 81 49 68 53 14
62 79 72 81 61 31
61 83 53 59 42 30
68 52 39 32
71 61
59 42

(a). Estime el puntaje promedio para el sexto grado y establezca un límite en el error
de estimación.
(b). Construya diagramas de caja paralelos para estos datos y comente los patrones
que ve. ¾Crees que podría haber un problema al colocar a los estudiantes en las
pistas?
(c). Estime la diferencia en los puntajes promedio entre los estudiantes de la pista I
y de la pista II. ¾Son los estudiantes de la pista I signicativamente mejores, en
promedio, que los estudiantes de la pista II?

4. Suponga que el puntaje promedio de la prueba para la clase en el ejercicio 3 debe esti-
marse nuevamente al nal del año escolar. Los costos de muestreo son iguales en todos
los estratos, pero las variaciones dieren. Encuentre la asignación óptima (Neyman)
de una muestra de tamaño 50, utilizando los datos del ejercicio 3 para aproximar las
varianzas.
5. Utilizando los datos del ejercicio 3, encuentre el tamaño de muestra requerido para
estimar la puntuación promedio, con un límite de cuatro puntos en el error de estimación
(precisión). Utilice la asignación proporcional.
6. Repita el ejercicio 5 utilizando la asignación de Neyman. Compare los resultados con
la respuesta del ejercicio 5.
7. Si no hay información disponible sobre la variable de interés principal, digamos y ,
entonces la estraticación óptima se puede aproximar al observar una variable, digamos
x, que está altamente correlacionada con y . Suponga que un investigador desea estimar
el número promedio de días de licencia por enfermedad otorgados por cierto grupo
de empresas en un año determinado. No se dispone de información sobre bajas por
enfermedad, pero se pueden encontrar datos sobre el número de empleados por empresa.
Suponga que para estas empresas los días totales de licencia por enfermedad están
altamente correlacionados con el número de empleados. Use los datos de frecuencia en
la tabla 5 para dividir de manera óptima las 97 empresas en L = 4 estratos para los
cuales se pueden usar tamaños de muestra iguales.
Tabla 5: Tabla de frecuencias de número de empleados.
Número de
empleados Frecuencia
0-10 2
11-20 4
21-30 6
31-40 6
41-50 5
51-60 8
61-70 10
71-80 14
80-90 19
91-100 13
101-110 3
111-120 7

8. En una población con N = 6 y L = 2, los valores de yki son 0, 1, 2 en el estrato I y 4,


6, 11 en el estrato II. Se debe tomar una muestra con n = 4,
(a) Muestre que las nh óptimas bajo la asignación de Neyman, cuando se redondea a
enteros, son nh = 1 en el estrato I y nh = 3 en el estrato II.
(b) Calcule la estimación y e para cada muestra posible que se pueda extraer bajo
asignación óptima y bajo asignación proporcional. Verique que las estimaciones
sean insesgadas. Por lo tanto, encuentre directamente Vopt (y e ) y Vprop (y e ).
(c) Verique que Vopt (y e ) y Vprop (y e ) estén de acuerdo con las fórmulas dadas en la
clase.
(d) El uso de la fórmula para la varianza mínima con n ja, para calcular Vopt (y e ) es
ligeramente incorrecto porque no permite el hecho de que el nh fueron redondeados
a enteros. ¾Qué tan bien concuerda este resultado con el valor corregido?

9. Los hogares en una ciudad deben ser muestreados para estimar la cantidad promedio de
activos por hogar que son fácilmente convertibles en efectivo. Los hogares se estratican
en un estrato de renta alta y de renta baja. Se cree que una casa en el estrato de renta
alta tiene aproximadamente nueve veces más activos que una en el estrato de renta
baja, y se espera que Sh sea proporcional a la raíz cuadrada de la media del estrato.
Hay 4000 hogares en el estrato de renta alta y 20,000 en el estrato de renta baja.
(a) ¾Cómo distribuiría una muestra de 1000 hogares entre los dos estratos? (b) Si el
objetivo es estimar la diferencia entre los activos por hogar en los dos estratos, ¾cómo
debe distribuirse la muestra?
10. Los siguientes datos muestran la estraticación de todas las granjas en un condado por
tamaño de granja y el promedio de acres de maíz por granja en cada estrato. Para
una muestra de 100 granjas, calcule los tamaños de muestra en cada estrato bajo:
(a) asignación proporcional, (b) asignación óptima. Compare las precisiones de estos
métodos con las del muestreo aleatorio simple.

Promedio de
Tamaño de la Número de acres de Desviación
propiedad propiedades maíz estándar
(acres) Nh Yh Sh
0-40 394 5.4 8.3
41-80 461 16.3 13.3
81-120 391 24.3 15.1
121-160 334 34.5 19.8
161-200 169 42.1 24.5
201-240 113 50.1 26.0
241- 148 63.8 35.2
Total o media 2012 26.3

11. Verique el resultado establecido en la fórmula (x), dado por:


1X 1−f X
Vran = Vopt + Wh (Sh − S)2 + Wh (Y h − Y )2 .
n h n h
12. Un muestreador tiene dos estratos con tamaños relativos W1 , W2 . Él cree que S1 , S2
pueden tomarse como iguales pero piensa que c2 puede estar entre 2c1 y 4c1 . Preferiría
usar una asignación proporcional pero no desea incurrir en un aumento sustancial de la
varianza en comparación con la asignación óptima. Para un costo dado C = c1 n1 + c2 n2
ignorando la cpf, demuestre que
Vprop (y e ) W 1 c1 + W 2 c2
= √ √ 2 .
Vopt (y e ) W 1 c1 + W 2 c2

Si W1 = W2 , calcule los aumentos relativos en la varianza del uso de la asignación


c
proporcional cuando 1 = 2, 4.
c2
13. Un muestreador propone tomar una P muestra aleatoria estraticada. Él espera que sus
costos de campo sean de la forma h ch nh . Sus estimaciones anticipadas de cantidades
relevantes para los dos estratos son las siguientes:

Estrato Wh Sh Ch
I 0.4 10 $4.0
II 0.6 20 $9.0
n n
(a) Encuentre los valores de 1 y 2 que minimizan el costo total de campo para
n n
un valor dado de V (y e ). (b) Encuentre el tamaño de muestra requerido, bajo esta
asignación óptima, para hacer V (y e ) = 1. Ignore el cpf. (c) ¾Cuánto será el costo total
de campo?
14. Después de tomar la muestra en el Ejercicio 6, el muestreador encuentra que sus costos
de campo fueron en realidad $2,0 por unidad en el estrato I y $12,00 en el estrato II. (a)
¾Cuánto es mayor el costo de campo de lo que se había previsto? (b) Si hubiera conocido
los costos de campo correctos de antemano, ¾podría haber obtenido V (y e = 1) para el
costo de campo estimado originalmente en el ejercicio 6? (Sugerencia. La desigualdad
de Cauchy-Schwarz, con V 0 = 1, da la respuesta a esta pregunta sin encontrar la nueva
asignación).
15. En una estraticación con dos estratos, los valores de Wh y Sh son los siguientes:

Estrato Wh Sh
I 0.8 2
II 0.2 4

Calcule los tamaños de muestra n1 , n2 necesarios de los dos estratos para satisfacer las
siguientes condiciones. Cada cise requiere un cálculo por separado. (Ignore el cpf.) (a)
El error estándar de la media poblacional estimada y e debe ser 0.1 y el tamaño total de
la muestra n = n1 + n2 se debe minimizar, (b) El error estándar de la media estimada
de cada estrato debe ser 0.1. (c) El error estándar de la diferencia entre dos medias de
estrato estimadas debe ser 0.1, minimizando nuevamente el tamaño total de la muestra.
16. Con dos estratos, un muestreador quisiera tener n1 = n2 por conveniencia administrati-
va, en lugar de usar los valores dados por la asignación de Neyman. Si V (y e ) y Vopt (y e )
denotan las varianzas dadas por la asignación n1 = n2 y la asignaciones de Neyman,
respectivamente, demuestre que el aumento fraccionario de la varianza es
 2
V (y e ) − Vopt (y e ) r−1
= ,
Vopt (y e ) r+1
n1
en donde r = según la asignación de Neyman. Para los estratos en el Ejercicio 8,
n2
caso (a), ¾cuál sería el aumento fraccionario de la varianza usando n1 = n2 en lugar de
la asignación óptima?

17. Si la función de costo es de la forma C = c0 + h th nh donde c0 y th son números
P
conocidos, mostrar que para minimizar V (y e ) para un costo total jo, nh debe ser
proporcional a:
 23
Wh2 Sh2

.
th
Encontrar los nh para una muestra de tamaño 1,000, bajo las siguientes condiciones:
Estrato Wh Sh th
I 0.4 4 1
II 0.3 5 2
III 0.2 6 4
18. Si Vprop (y e ) es la varianza de la media estimada de una muestra aleatoria estraticada
de tamaño n con asignación proporcional y V (y) es la varianza de la media de una
muestra aleatoria simple de tamaño n, demuestre que la razón
Vprop (y e )
,
V (y)
no depende del tamaño de la muestra, en tanto, que la razón
Vmin (y e )
,
Vprop (y e )
disminuye a medida que n aumenta. (Esto implica que la asignación óptima para n ja
se vuelve más efectiva en relación con la asignación proporcional a medida que aumenta
n).
19. Compare los valores obtenidos para V (pe ) bajo asignación proporcional y asignación
óptima para tamaño de muestra jo en las siguientes dos poblaciones. Cada estrato es
de igual tamaño. La cpf puede ser ignorada.
Población 1 Población 2
Estrato Ph Estrato Ph
I 0.1 I 0.01
II 0.5 II 0.05
III 0.9 III 0.10
¾Qué resultado general se ilustra con estas dos poblaciones?
20. Demuestre que en la estimación de proporciones los resultados correspondientes al teo-
rema donde se muestran las desigualdades entre las varianzas de distribución óptima,
proporcional y aleatoria son los siguientes:
1−f X
Vran = Vprop + Wh (Ph − P )2 ,
n h

P √ √ p 2
h Wh Ph Qh − Ph Qh
Vprop = Vopt + .
n
en donde q X p
Ph Qh = Wh Ph Qh .
h

21. En una empresa, el 62 % de los empleados son hombres calicados o no calicados,


el 31 % son mujeres de ocina y el 7 % son supervisores. A partir de una muestra de
400 empleados, la empresa desea estimar la proporción que utiliza ciertas instalaciones
recreativas. Las estimaciones aproximadas son que las instalaciones son utilizadas por
40 a 50 % de los hombres, 20 a 30 % de las mujeres y 5 a 10 % de los supervisores,
(a) ¾Cómo asignaría la muestra a los tres grupos? (b) Si las verdaderas proporciones
de usuarios fueran 48, 21 y 4 %, respectivamente, ¾cuál sería el error estándar de la
proporción estimada pe ? (c) ¾Cuál sería el error estándar de p derivado de una muestra
aleatoria simple con n = 400 ?

Profesor: Bulmaro Juárez Hernández Puebla, Pue., 02 de octubre de 2020.

También podría gustarte