Está en la página 1de 11

1.- Una organización sindical está interesada en conocer la situación laboral de los 10.

000 trabajadores
que en el año 1997 pertenecían a cierto grupo industrial. Para realizar el informe, los trabajadores fueron
clasificados en tres grupos de edad, seleccionándose una muestra aleatoria simple en cada uno de ellos.
Algunos de los resultados obtenidos aparecen en la siguiente tabla:

Salario mensual (euros)


Número total Número de
Grupos Número total Desviación
de trabajadores Media contratos inferiores
de edad de trabajadores típica
seleccionados muestral a dos años
muestral
18-35 2.900 666 1.205 380 375
36-50 4.700 754 1.630 350 150
51-65 2.400 580 1.950 400 90

Con una confianza del 99%:


e) Obtenga, mediante el correspondiente intervalo de confianza, la estimación de la cantidad total
mensual repartida en salarios por este grupo industrial entre los empleados más jóvenes.
f) Calcule una estimación del salario mensual medio de los 10.000 trabajadores, así como su error de
muestreo.
g) Indique si el reparto muestral anterior en los distintos grupos de edad ha sido el más eficiente posible
para estimar el salario mensual medio; en caso contrario, indique cuál sería este.
h) Estime la proporción de trabajadores de este grupo industrial cuyo contrato tiene una duración
inferior a los dos años, indicando el error de muestreo cometido.
i) Si se deseara estimar la proporción de trabajadores con más de 50 años que padecieron
enfermedades por no cumplirse las normas de seguridad e higiene en sus puestos de trabajo.
¿cuántos trabajadores sería necesario seleccionar para que el error de muestreo no supere el 6%?.

Solución:
X= Salario mensual de un trabajador

Nos pide la estimación de la cantidad total mensual repartida en salarios por este grupo industrial entre
los empleados más jóvenes y dentro de cada estrato se hace un muestreo aleatorio simple. Por tanto,
utilizaremos la formula para la obtención de un intervalo
a) para el total, pero del muestreo aleatorio simple para el primer grupo de edad (los mas jóvenes)

𝑇"! = 𝑁! ∗ 𝑥̅! = 2900 ∗ 1205 = 3494500


𝑠! 𝑠!
𝐼"! = 0𝑇"! − 𝑧∝⁄$ 3𝑁! (𝑁! − 𝑛! ) ; 𝑇"! + 𝑧∝⁄$ 3𝑁! (𝑁! − 𝑛! ) <
√𝑛! √𝑛!

Como la confianza es del 99%, entonces 𝑧∝⁄$ = 2,575

380
𝐼"! = 03494500 ± 2,57532900(2900 − 666) <=
√666
= [3397991,78; 3591008,21]

b) En este caso, al tratarse del salario medio global, deberemos de aplicar el estimador del muestreo
aleatorio estratificado.
𝑠)$
Estratos Nh nh 𝑥̅) 𝑠) 𝑎) 𝑊) 𝑊) . 𝑥̅ ) Nh-nh Nh(Nh-nh) 𝑠)$ 𝑁) (𝑁) − 𝑛) )
𝑛)
18-35 2.900 666 1.205 380 375 0,29 349,45 2.234 6478600 144400 1404669429,43
36-50 4.700 754 1.630 350 150 0,47 766,1 3.946 18546200 122500 3013142572,94
51-65 2.400 580 1.950 400 90 0,24 468 1.820 4368000 160000 1204965517,24
10000 2000 1 1583,55 5622777519,62

𝑥̅&'( = D 𝑊) . 𝑥̅) = 1583,55


)+!
Y el error de muestreo será:
*
1 𝑠$ 1
𝑒̂, = 𝑧-⁄$ I $ D 𝑁) (𝑁) − 𝑛) ) ) = 2,575J . 5622777519,62 = 19,31€
𝑁 𝑛) 10000$
)+!

c) El reparto muestral más eficiente será el que se obtenga por medio del criterio de afijación óptima
de mínima varianza. Los tamaños muestrales que tenemos en cada estrato son 666, 754 y 580, veamos
si coinciden con los que proporciona el criterio
𝑁)
𝑛) = * .𝑛
∑)+! 𝑁) 𝑠)

Estratos Nh sh Nh*sh nh
18-35 2900 380 1102000 594,55085
36-50 4700 350 1645000 887,51012
51-65 2400 400 960000 517,93903
10000 3707000

Entonces n1=595, n2=888 y n3=518, que evidentemente no coinciden con el reparto muestral del
enunciado. Por tanto, el reparto muestral del enunciado no es el más eficiente.

d) Nos piden obtener la estimación de la proporción poblacional en un muestreo aleatorio estratificado

𝑝̂ &'( = D 𝑊) 𝑝) = 0,29403
)+!

Estratos 𝑁" 𝑛" 𝑎" 𝑝) 𝑊" 𝑊" . 𝑝"


18-35 2900 666 375 0,5631 0,29 0,16329
36-50 4700 754 150 0,1989 0,47 0,0935
51-65 2400 580 90 0,1552 0,24 0,03724
10000 2000 1 0,29403
𝑁" − 𝑛" 𝑝" 𝑞" 𝑁" − 𝑛" 𝑝" 𝑞"
Estratos 𝑁" 𝑛" 𝑝" 𝑊" 𝑊"#
𝑁" − 1 𝑛" 𝑁" − 1 𝑛"
18-35 2900 666 0,5631 0,7706 0,29 0,0004 0,000024
36-50 4700 754 0,1989 0,8398 0,47 0,0002 0,000039
51-65 2400 580 0,1552 0,7586 0,24 0,0002 0,000010
10000 2000 1 0,000073

*
(𝑁) − 𝑛) ) 𝑝) 𝑞)
𝑒̂. = 𝑧-⁄$ I D 𝑊)$ = 2,57530,000073 = 0,022
𝑁) − 1 𝑛)
)+!

e) Si se deseara estimar la proporción de trabajadores con más de 50 años, (del tercer estrato) que
padecieron enfermedades con un error de muestreo no supere el 6%, necesitamos obtener el
tamaño muestral para la proporción del muestreo aleatorio simple

𝑧∝$⁄$ 𝑝𝑞
𝑛/0 =
𝑒1$
Como no sabemos nada sobre p, entonces p=q=0,5

𝑧∝$⁄$ 𝑝𝑞 2,575$ . 0,5.0,5


𝑛/0 = = = 460,46 = 461
𝑒1$ 0,06$

Ahora calculamos la fracción de muestreo

𝑛/ 461
𝑓= = = 0,1921 ≥ 0,05
𝑁 2400

habrá que hacer corrección por finitud


𝑛/ 461
𝑛= 𝑛/ = 1,1921 = 386,71 = 387
1+ 𝑁
2.- Una cadena de restaurantes tiene 60 establecimientos en Madrid, 50 en Barcelona y 45 en Sevilla. La
dirección está considerando añadir un nuevo producto en el menú. Para contrastar la posible demanda
de este producto, lo introdujo en el menú de muestras aleatorias de doce restaurantes de Madrid, diez de
Barcelona y nueve de Sevilla (mediante asignación proporcional, el 20% de cada estrato se incluye en
la muestra). Usando los índices 1, 2 y 3 para designar Madrid, Barcelona y Sevilla, respectivamente, las
medias y las desviaciones típicas muestrales del número de pedidos de este producto recibidos por
restaurante en las tres ciudades durante una semana fueron
x1 = 21, 2 s1 = 12,8
x2 = 13,3 s2 = 11, 4
x3 = 26,1 s3 = 9, 2
Estime el número medio de pedidos semanales por restaurante, µ, para todos los restaurantes de la
cadena.

𝑠)$
Estratos Nh nh 𝑥̅) 𝑠) 𝑊) 𝑊) . 𝑥̅ ) Nh-nh Nh(Nh-nh) 𝑠)$ 𝑁) (𝑁) − 𝑛) )
𝑛)
I 60 12 21,20 12,8 0,39 8,206 48 2880 163,84 39321,60
II 50 10 13,30 11,4 0,32 4,290 40 2000 129,96 25992,00
III 45 9 26,10 9,2 0,29 7,577 36 1620 84,64 15235,20
155 31 1 20,074 80548,80

𝑥̅&'( = D 𝑊) . 𝑥̅ ) = 20,074
)+!

Y el error de muestreo será para una confianza del 95%:

*
1 𝑠$ 1
𝑒̂, = 𝑧-⁄$ I $ D 𝑁) (𝑁) − 𝑛) ) ) = 1,96J . 80548,8 = 3,59
𝑁 𝑛) 155$
)+!
3.- En una muestra aleatoria estratificada de estudiantes de segundo ciclo de una pequeña Universidad,
se solicitó a los miembros de la muestra que puntuasen entre 0 y 5 su grado de acuerdo con las
oportunidades de realizar actividades extraacadémicas. Los resultados obtenidos se muestran en la tabla
adjunta:

Estudiantes de primer año Estudiantes de segundo año


Ni 632 529
ni 50 50
xi 3,12 3,37
si 1,04 0,86

a) Obtenga el error de muestreo para la calificación media que otorgaron los estudiantes de cada año.
b) ¿Se puede concluir que la puntuación media de ambos colectivos es significativamente distinta?
Razone detalladamente su respuesta.
c) Estime la puntuación media otorgada globalmente por todos los estudiantes y su error de muestreo.
d) Asumiendo como cierta la información presente en la tabla, determine el número de estudiantes que
debería ser elegido en cada curso si se desea:
-Muestras autoponderadas.
-Repartir según criterio de mínima varianza, suponiendo conocidos previamente los datos
necesarios.
e) Si posteriormente se quiere analizar también, mediante muestreo aleatorio simple, la proporción de
estudiantes que están de acuerdo con el Plan de Estudios, calcule cuál debería ser el tamaño muestral
preciso para que el error de estimación no supere el 3%.
NOTA: Utilice en todo el ejercicio un nivel de confianza del 95%.

a)
𝑁! − 𝑛! 𝑠! 632 − 50 1,04
𝑒̂,! = 𝑧-⁄$ J = 1,96J = 1,96 ∗ 0,96 ∗ 0,15 = 0,2822
𝑁! √𝑛! 632 √50

2$ 34$ '$ 6$7368 8,:;


𝑒̂,$ = 𝑧-⁄$ R 2$
= 1,96R = 1,96 ∗ 0,95 ∗ 0,12 = 0,2234
√4$ 6$7 √68

2! 34! '!
b) 𝐼,! = 0𝑥̅! ± 𝑧-⁄$ R 2!
< = [3,12 − 0,2822; 3,12 + 0,2822] = [2,84; 3,40]
√4!

2$ 34$ '$
𝐼,$ = 0𝑥̅$ ± 𝑧-⁄$ R 2$
< = [3,37 − 0,2234; 3,37 + 0,2234] = [3,15; 3,59]
√ 4$

2,84
3, 15 3,40 3,59
Como se solapan los intervalos, no son significativamente distintos.
c)

𝑠)$
Estratos Nh nh 𝑥̅) 𝑠) 𝑊) 𝑊) . 𝑥̅ ) Nh-nh Nh(Nh-nh) 𝑠)$ 𝑁) (𝑁) − 𝑛) )
𝑛)
I 632 50 3,12 1,04 0,54 1,698 582 367824 1,0816 7956,77
II 529 50 3,37 0,86 0,46 1,536 479 253391 0,7396 3748,16
1.161 100 1 3,234 11704,93

𝑥̅&'( = D 𝑊) . 𝑥̅) = 3,234


)+!

! '$ !
𝑒̂, = 𝑧- ⁄$ R2$ ∑*)+! 𝑁) (𝑁) − 𝑛) ) 4% = 1,96R!!;!$ . 11704,93 =0,18265
%

d) Si suponemos muestras autoponderadas, entonces:


𝑛) = 𝑊) . 𝑛
𝑛! = 𝑊! . 𝑛 = 0,54 ∗ 100 = 54
𝑛$ = 𝑊$ . 𝑛 = 0,46 ∗ 100 = 46

Si utilizamos el criterio óptimo de mínima varianza

2 % '%
𝑛) = ∑& .𝑛
%'! 2% '%

𝑁) 𝑠)
Estratos 𝑁) 𝑠) 𝑁) 𝑠) 𝑛) = * .𝑛
∑)+! 𝑁) 𝑠)
I 632 1,04 657,28 59,10
II 529 0,86 454,94 40,90
1.112,22 100

Por tanto, n1= 60 y n2=41, con lo que el tamaño muestral n sería de 101

e) Si se quiere analizar mediante muestreo aleatorio simple la proporción de estudiantes que están de
acuerdo con el Plan de Estudios, nos pide obtener el tamaño muestral con un error inferior al 3%

𝑧∝$⁄$ 𝑝𝑞
𝑛/0 =
𝑒1$
Como no sabemos nada sobre p, entonces p=q=0,5

𝑧∝$⁄$ 𝑝𝑞 1,96$ . 0,5.0,5


𝑛/ = = = 1067,11 = 1068
𝑒1$ 0,03$

Ahora calculamos la fracción de muestreo


𝑛/ 1068
𝑓= = = 0,9199 ≥ 0,05
𝑁 1161

habrá que hacer corrección por finitud

𝑛/ 1068
𝑛= 𝑛/ = 1,9199 = 526,28 = 527
1+ 𝑁
4.- Una Estación de televisión da servicio a un área compuesta por tres distritos, de manera que el número
de familias que viven en ellos es 12.473, 35.241 y 23.178, respectivamente. Desea estimar el porcentaje
de familias que prefiere sus programas sobre el resto mediante muestreo aleatorio estratificado con un
nivel de confianza del 95% y un error máximo de ±2,5% para datos globales.
a) Calcule el tamaño muestral global que le permitiría cumplir sus objetivos y repártalo entre los
estratos (distritos) del mejor modo posible.
b) Finalmente, por motivos de presupuesto, ha decidido obtener una muestra de un 1% de cada distrito
con la que ha obtenido los siguientes datos:

Distrito Tamaño Nº de familias que


muestral prefieren sus
programas
1 125 26
2 352 60
3 232 79

Estime la proporción de familias que prefiere sus programas en cada uno de los distritos y evalúe los
correspondientes errores de muestreo.
c) Con los datos anteriores, obtenga la estimación global del porcentaje de familias que prefiere sus
programas en toda la zona y evalúe su error de muestreo. Comente los resultados en relación con los
objetivos trazados inicialmente.

Solución:

a) El tamaño muestral en el caso de la proporción para la estimación global es:

𝑁) 𝑊)$

𝑁 𝑤 𝑝) 𝑞)
𝑛 = $ )3! ) $
𝑒1 𝑊
$ + ∑ 𝑁 ) 𝑝) 𝑞)
𝑧∝⁄$ )3!
La única forma de estimar n es utilizando el criterio uniforme o el autoponderado ya que no
conocemos los tamaños muestrales de los estratos y en ese caso el mejor es el autoponderado.
Por tanto, n queda ya que Wh=wh
𝑁
∑ ) 𝑊) 𝑝) 𝑞)
𝑁)3!
𝑛= $
𝑒1 𝑊)$
+ ∑
𝑧∝$⁄$ 𝑁)3! 𝑝) 𝑞)

𝑵𝒉 𝑵𝒉 𝒑𝒉 𝒒𝒉
Estratos Nh Wh Ph 𝑾𝒉 . .𝒑 𝒒 𝑾𝟐𝒉 . nh=Wh.n
𝑵𝒉)𝟏 𝑵𝒉)𝟏 𝒉 𝒉 𝑵𝒉)𝟏

I 12.473 0,1759 0,50 1,00008 0,043989 0,00000062 265,00


II 35.241 0,4971 0,50 1,00003 0,124281 0,00000175 749,00
III 23.178 0,3269 0,50 1,00004 0,081741 0,00000115 493,00
70.892 1 0,250011 0,00000353 1.507
𝑁)

𝑁)3! 𝑊) 𝑝) 𝑞) 0,250011
𝑛= $ $ = $ = 1504,101 ⟹ 𝑛 = 1505
𝑒1 𝑊) 0,025
+∑𝑁 𝑝) 𝑞) + 0,00000353
𝑧∝$⁄$ )3! 1,96$
Vamos a hacer el reparto entre los estratos:

n1=W1.n=0,1759*1505=264.80. ⟹n1=265
n2=W2.n=0,4971*1505=748,15. ⟹n2=749
n3=W3.n=0,3269*1505=492,06. ⟹n3=493

b) Ahora nos pide que estimemos las proporciones de familias que prefieren el programa en cada uno
de los estratos, así como su error de muestreo. En cada estrato se ha realizado un muestreo aleatorio
simple, por tanto:

Distrito Tamaño Nº de familias que


muestral prefieren sus
programas
1 125 26
2 352 60
3 232 79

26
𝑝̂! = = 0,208;
125
𝑁! − 𝑛! 𝑝! 𝑞! 12473 − 125 0,208 ∗ (1 − 0,208)
𝑒̂1! = 𝑧∝⁄$ J J = 1,96J J
𝑁! − 1 𝑛! 12472 125
60
𝑝̂ $ = = 0,1705
352
𝑁$ − 𝑛$ 𝑝$ 𝑞$ 35241 − 352 0,1705 ∗ (1 − 0,1705)
𝑒̂1$ = 𝑧∝⁄$ J J = 1,96J J
𝑁$ − 1 𝑛$ 35240 352
79
𝑝̂ 0 = = 0,3405
232
𝑁0 − 𝑛0 𝑝0 𝑞0 23178 − 232 0,3405 ∗ (1 − 0,3405)
𝑒̂1, = 𝑧∝⁄$ J J = 1,96J J
𝑁0 − 1 𝑛0 23177 232

c) Nos piden obtener la estimación de la proporción poblacional en un muestreo aleatorio estratificado

𝑝̂ &'( = D 𝑊) 𝑝) = 0,2327
)+!
Distritos 𝑁" 𝑛" 𝑎" 𝑝) 𝑊" 𝑊" . 𝑝"
I 12.473 125 26 0,208 0,1759 0,0366
II 35.241 352 60 0,1705 0,4971 0,0847
III 23.178 232 79 0,3405 0,3269 0,1113
70.892 709 1 0,2327

𝑁" − 𝑛" 𝑝" 𝑞" 𝑁" − 𝑛" 𝑝" 𝑞"


Estratos 𝑁" 𝑛" 𝑝" 𝑊" 𝑊"#
𝑁" − 1 𝑛" 𝑁" − 1 𝑛"
I 12.473 125 0,2080 0,9901 0,1759 0,0013 0,000040
II 35.241 352 0,1705 0,9900 0,4971 0,0004 0,000098
III 23.178 232 0,3405 0,9900 0,3269 0,0010 0,000102
70.892 709 1 0,000241

*
(𝑁) − 𝑛) ) 𝑝) 𝑞)
𝑒̂. = 𝑧-⁄$ ID 𝑊)$ = 2,57530,000241 = 0,0399
𝑁) − 1 𝑛)
)+!
5.- Con el fin de estimar el consumo semanal medio de leche (en litros), la población objeto de estudio
se ha subdividido en tres estratos, de tamaños N1=3000, N2=2000 y N3=5000. Las cuasivarianzas
estimadas en dichos estratos son 100, 400 y 900, respectivamente.
a) Calcule el tamaño de muestra necesario, según el criterio de afijación proporcional, si se quiere
cometer un error máximo de e=2 litros para un margen de confianza del 95%.
b) Supongamos que se ha utilizado la afijación proporcional. Los datos obtenidos a través de la muestra
son los siguientes:
n1 n2 n3

å y1i = 4237,5 lit.


i =1
å y2i = 2938 lit.
i =1
åy
i =1
3i = 8249 lit.

Estime, el consumo semanal medio de leche así como su error de muestreo.

También podría gustarte