Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TAREA 2a MEA
3. Una escuela desea estimar el puntaje promedio que se puede obtener en un examen
de comprensión de lectura para los estudiantes de sexto grado. Los estudiantes de la
escuela se agrupan en tres pistas, con los estudiantes rápidos en la pista I, los estudiantes
lentos en la pista III y el resto en la pista II. La escuela decide estraticar por pistas
porque este método debería reducir la variabilidad de los puntajes de las pruebas. El
sexto grado contiene 55 estudiantes en la pista I, 80 en la pista II y 65 en la pista
III. Una muestra aleatoria estraticada de 50 estudiantes se asigna proporcionalmente
y produce muestras aleatorias simples de n1 = 14, n2 = 20 y n3 = 16 de las pistas
I, II y III, respectivamente. La prueba se administra a la muestra de estudiantes; los
resultados están en la Tabla 4.
Tabla 4: Datos de las muestras para los puntajes promedio de lectura de comprensión de
estudiantes de sexto grado.
Estrato I Estrato II Estrato III
(Pista I) (Pista II) (Pista III)
80 92 85 82 42 32
68 85 48 75 36 31
72 87 53 73 65 29
85 91 65 78 43 19
90 81 49 68 53 14
62 79 72 81 61 31
61 83 53 59 42 30
68 52 39 32
71 61
59 42
(a). Estime el puntaje promedio para el sexto grado y establezca un límite en el error
de estimación.
(b). Construya diagramas de caja paralelos para estos datos y comente los patrones
que ve. ¾Crees que podría haber un problema al colocar a los estudiantes en las
pistas?
(c). Estime la diferencia en los puntajes promedio entre los estudiantes de la pista I
y de la pista II. ¾Son los estudiantes de la pista I signicativamente mejores, en
promedio, que los estudiantes de la pista II?
4. Suponga que el puntaje promedio de la prueba para la clase en el ejercicio 3 debe esti-
marse nuevamente al nal del año escolar. Los costos de muestreo son iguales en todos
los estratos, pero las variaciones dieren. Encuentre la asignación óptima (Neyman)
de una muestra de tamaño 50, utilizando los datos del ejercicio 3 para aproximar las
varianzas.
5. Utilizando los datos del ejercicio 3, encuentre el tamaño de muestra requerido para
estimar la puntuación promedio, con un límite de cuatro puntos en el error de estimación
(precisión). Utilice la asignación proporcional.
6. Repita el ejercicio 5 utilizando la asignación de Neyman. Compare los resultados con
la respuesta del ejercicio 5.
7. Si no hay información disponible sobre la variable de interés principal, digamos y ,
entonces la estraticación óptima se puede aproximar al observar una variable, digamos
x, que está altamente correlacionada con y . Suponga que un investigador desea estimar
el número promedio de días de licencia por enfermedad otorgados por cierto grupo
de empresas en un año determinado. No se dispone de información sobre bajas por
enfermedad, pero se pueden encontrar datos sobre el número de empleados por empresa.
Suponga que para estas empresas los días totales de licencia por enfermedad están
altamente correlacionados con el número de empleados. Use los datos de frecuencia en
la tabla 5 para dividir de manera óptima las 97 empresas en L = 4 estratos para los
cuales se pueden usar tamaños de muestra iguales.
Tabla 5: Tabla de frecuencias de número de empleados.
Número de
empleados Frecuencia
0-10 2
11-20 4
21-30 6
31-40 6
41-50 5
51-60 8
61-70 10
71-80 14
80-90 19
91-100 13
101-110 3
111-120 7
9. Los hogares en una ciudad deben ser muestreados para estimar la cantidad promedio de
activos por hogar que son fácilmente convertibles en efectivo. Los hogares se estratican
en un estrato de renta alta y de renta baja. Se cree que una casa en el estrato de renta
alta tiene aproximadamente nueve veces más activos que una en el estrato de renta
baja, y se espera que Sh sea proporcional a la raíz cuadrada de la media del estrato.
Hay 4000 hogares en el estrato de renta alta y 20,000 en el estrato de renta baja.
(a) ¾Cómo distribuiría una muestra de 1000 hogares entre los dos estratos? (b) Si el
objetivo es estimar la diferencia entre los activos por hogar en los dos estratos, ¾cómo
debe distribuirse la muestra?
10. Los siguientes datos muestran la estraticación de todas las granjas en un condado por
tamaño de granja y el promedio de acres de maíz por granja en cada estrato. Para
una muestra de 100 granjas, calcule los tamaños de muestra en cada estrato bajo:
(a) asignación proporcional, (b) asignación óptima. Compare las precisiones de estos
métodos con las del muestreo aleatorio simple.
Promedio de
Tamaño de la Número de acres de Desviación
propiedad propiedades maíz estándar
(acres) Nh Yh Sh
0-40 394 5.4 8.3
41-80 461 16.3 13.3
81-120 391 24.3 15.1
121-160 334 34.5 19.8
161-200 169 42.1 24.5
201-240 113 50.1 26.0
241- 148 63.8 35.2
Total o media 2012 26.3
Estrato Wh Sh Ch
I 0.4 10 $4.0
II 0.6 20 $9.0
n n
(a) Encuentre los valores de 1 y 2 que minimizan el costo total de campo para
n n
un valor dado de V (y e ). (b) Encuentre el tamaño de muestra requerido, bajo esta
asignación óptima, para hacer V (y e ) = 1. Ignore el cpf. (c) ¾Cuánto será el costo total
de campo?
14. Después de tomar la muestra en el Ejercicio 6, el muestreador encuentra que sus costos
de campo fueron en realidad $2,0 por unidad en el estrato I y $12,00 en el estrato II. (a)
¾Cuánto es mayor el costo de campo de lo que se había previsto? (b) Si hubiera conocido
los costos de campo correctos de antemano, ¾podría haber obtenido V (y e = 1) para el
costo de campo estimado originalmente en el ejercicio 6? (Sugerencia. La desigualdad
de Cauchy-Schwarz, con V 0 = 1, da la respuesta a esta pregunta sin encontrar la nueva
asignación).
15. En una estraticación con dos estratos, los valores de Wh y Sh son los siguientes:
Estrato Wh Sh
I 0.8 2
II 0.2 4
Calcule los tamaños de muestra n1 , n2 necesarios de los dos estratos para satisfacer las
siguientes condiciones. Cada cise requiere un cálculo por separado. (Ignore el cpf.) (a)
El error estándar de la media poblacional estimada y e debe ser 0.1 y el tamaño total de
la muestra n = n1 + n2 se debe minimizar, (b) El error estándar de la media estimada
de cada estrato debe ser 0.1. (c) El error estándar de la diferencia entre dos medias de
estrato estimadas debe ser 0.1, minimizando nuevamente el tamaño total de la muestra.
16. Con dos estratos, un muestreador quisiera tener n1 = n2 por conveniencia administrati-
va, en lugar de usar los valores dados por la asignación de Neyman. Si V (y e ) y Vopt (y e )
denotan las varianzas dadas por la asignación n1 = n2 y la asignaciones de Neyman,
respectivamente, demuestre que el aumento fraccionario de la varianza es
2
V (y e ) − Vopt (y e ) r−1
= ,
Vopt (y e ) r+1
n1
en donde r = según la asignación de Neyman. Para los estratos en el Ejercicio 8,
n2
caso (a), ¾cuál sería el aumento fraccionario de la varianza usando n1 = n2 en lugar de
la asignación óptima?
√
17. Si la función de costo es de la forma C = c0 + h th nh donde c0 y th son números
P
conocidos, mostrar que para minimizar V (y e ) para un costo total jo, nh debe ser
proporcional a:
23
Wh2 Sh2
.
th
Encontrar los nh para una muestra de tamaño 1,000, bajo las siguientes condiciones:
Estrato Wh Sh th
I 0.4 4 1
II 0.3 5 2
III 0.2 6 4
18. Si Vprop (y e ) es la varianza de la media estimada de una muestra aleatoria estraticada
de tamaño n con asignación proporcional y V (y) es la varianza de la media de una
muestra aleatoria simple de tamaño n, demuestre que la razón
Vprop (y e )
,
V (y)
no depende del tamaño de la muestra, en tanto, que la razón
Vmin (y e )
,
Vprop (y e )
disminuye a medida que n aumenta. (Esto implica que la asignación óptima para n ja
se vuelve más efectiva en relación con la asignación proporcional a medida que aumenta
n).
19. Compare los valores obtenidos para V (pe ) bajo asignación proporcional y asignación
óptima para tamaño de muestra jo en las siguientes dos poblaciones. Cada estrato es
de igual tamaño. La cpf puede ser ignorada.
Población 1 Población 2
Estrato Ph Estrato Ph
I 0.1 I 0.01
II 0.5 II 0.05
III 0.9 III 0.10
¾Qué resultado general se ilustra con estas dos poblaciones?
20. Demuestre que en la estimación de proporciones los resultados correspondientes al teo-
rema donde se muestran las desigualdades entre las varianzas de distribución óptima,
proporcional y aleatoria son los siguientes:
1−f X
Vran = Vprop + Wh (Ph − P )2 ,
n h
P √ √ p 2
h Wh Ph Qh − Ph Qh
Vprop = Vopt + .
n
en donde q X p
Ph Qh = Wh Ph Qh .
h