Una compañía suministradora de gas tiene que cobrar cantidades atrasadas de
20.000 clientes. Para estimar la cantidad total que se le adeuda, selecciona una muestra aleatoria de 64 clientes, que debían una cantidad media de 1.600 euros, con una desviación típica de 2.000 euros. Se quiere obtener: a) Intervalo de confianza del 95% de la cantidad total que se adeuda a la compañía de gas. b) ¿Cuántos clientes tiene que seleccionar la compañía para estimar la cantidad anterior con un error de muestreo inferior a 2.400.000 euros? Solución: a) Sea la variable aleatoria X = "Cantidad atrasada de pago por un cliente". La cantidad total adeuda por los 20.000 clientes es 20.000 i i1 τX, =
= Σ que se estima con
n i i1 ˆ N x N.x . x n= == Σ , con un error de muestreo estimado / 2 N. (N n ) ez.. ταn σ − = El intervalo de confianza para el total τ poblacional es: /2 ˆ N. ( N n ) I( ) x e N. x z . . ταn τ σ ⎡ − ⎤ = ⎡⎣ ± ⎤⎦ = ⎢ ± ⎥ ⎣⎦ Por consiguiente, z α / 2 = z0,025 = 1,96 [] ˆ 20.000 . ( 20.000 64 ) I( ) x e 20.000 . 1.600 1,96 . 2.000 . 64 22.215.692,56 , 41.784.307,44 ττ ⎡ − ⎤ = ⎡⎣ ± ⎤⎦ = ⎢ ± ⎥ = ⎣⎦ = b) Para obtener una estimación de la cantidad total que se adeuda, con un error inferior a e τ = 2.400.000 , se tiene que elegir una muestra de tamaño superior de: xx xx 222222 /2 222222 /2 z . .N 1,96 2.000 20.000 n n 1.013 e z . . N 2.400.000 1,96 2.000 20.000 α τα σ σ =→=≈ ++ clientes Portal Estadística Aplicada: Técnicas Muestreo Poblaciones Finitas 25 POBLACIONES FINITAS: MUESTREO ALEATORIO SIMPLE Para llevar a cabo el análisis de un destino turístico con alta afluencia de turistas (200.000) se desea realizar una encuesta para determinar el gasto medio por turista. Se ha decidido aceptar un error máximo en el gasto medio de 30 euros. a) Suponiendo una desviación estándar de la población de 200 euros y un nivel de confianza del 95%, obtener el tamaño adecuado de la muestra. b) Con el tamaño de la muestra encontrado en (a) y sabiendo que la media y la desviación estándar son, respectivamente, de 450 y 320 euros. Determinar el intervalo de confianza del 95% para el verdadero valor del gasto medio por turista. Solución: a) Intervalo de confianza de la media μ de una población normal con varianza poblacional desconocida y muestras grandes. /2x Nn I( ) x e x z . s . μαn . N μ ⎡ − ⎤ = ⎡⎣ ± ⎤⎦ = ⎢ ± ⎥ ⎣⎦ Error de muestreo: / 2 x Nn e z .s . 30 μαn . N − == 2222 /2x 222222 /2x xx xx z .s .N 1,96 200 200.000 n 170,59 171 N. e z . s 200.000 30 1,96 200 α μα ===≈ ++ b) x x [ ] x 200.000 171 I( ) x e 450 1,96 320 402,057 , 497,943 μ 171 200.000 μ ⎡ − ⎤ = ⎡⎣ ± ⎤⎦ = ⎢ ± ⎥ = ⎣⎦ Portal Estadística Aplicada: Técnicas Muestreo Poblaciones Finitas 26 POBLACIONES FINITAS: MUESTREO ALEATORIO SIMPLE En la Facultad de Económicas 200 alumnos han aprobado el curso la asignatura de Estadística Avanzada mediante tres exámenes parciales. Entre ellos, se efectúa una entrevista a 25 alumnos, elegidos sin resposición y probabilidades iguales. De las contestaciones, se obtienen entre otros, los siguientes resultados: a) 18 alumnos están contentos con la enseñanza recibida. b) El número de horas que han necesito para preparar el último examen parcial viene dado por la distribución de frecuencias: xi (horas) 16 20 30 ni (alumnos) 6 12 7 Se pide, estimar: a) Proporción del número de alumnos satisfechos y su error de muestreo. b) La media de horas por alumno dedicadas a preparar el último examen, su error de muestreo y el intervalo de confianza del 95%. Solución: a) Como la proporción muestral es un estimador insesgado de la proporción poblacional, se tiene: ˆ 18 p 0,72 25 == Es decir, el 72% de los alumnos aprobados por curso están satisfechos con la enseñanza recibida. Un estimador insesgado de la varianza de ˆp es: ˆ pˆ qˆ V(pˆ) (1 f) n1 =− − Fracción de muestreo: 25 f 0,125 200 == ˆp x x ˆ ˆ 0,72 0,28 V(p) (1 0,125) 0,00735 Estima Error muestreo: ˆ 0,00735 0,0857 24 =−=→σ== b) xi ni xi ni 2 (xi − x) ni 16 6 96 204,634 20 12 240 40,627 30 7 210 466,099 Total 25 546 711,360 3 2 ii i 1 2x 3 i i1 (x x) n 711,36 s 29,64 24 n1 = = − === − Σ Σ sx = 29,64 = 5,444 Siendo la media muestral un estimador insesgado de la media poblacional, resulta: 3 ii i1 3 i i1 xn 546 x 21,84 horas 25 n = = === Σ Σ Portal Estadística Aplicada: Técnicas Muestreo Poblaciones Finitas 27 Un estimador inesgado de la varianza de x es: 2x x s 29,64 ˆV (x) (1 f) (1 0,125) 1,037 n 25 =−=−= con lo que, la estimación del error de muestreo: σx = 1,037 = 1,019 Suponiendo la normalidad de la distribución de la media muestral: Prob(x − 2σx ≤ x ≤ x + 2σx ) = 0,95 Intervalo de confianza: I = ⎡⎣x ± 2σx ⎤⎦ = ⎡⎣21,84 ± 2x 1,019⎤⎦ = ⎡⎣19,802 , 23,878⎤⎦ Otra forma de calcular el error de muestreo y el intervalo de confianza: / 2 , (n 1) x Nn I( ) x e x t . s . μαn . N μ − ⎡ − ⎤ = ⎣⎡ ± ⎦⎤ = ⎢ ± ⎥ ⎣⎦ Error de muestreo: 0,025 , 24 x x x x N n 200 25 e t . s . 2,064 5,444 2,102 μ n . N 25 200 −− === I(μ) = ⎡⎣ x ± e μ ⎤⎦ = [ 21,84 ± 2,102 ] = [ 19,738 , 23,942 ] Portal Estadística Aplicada: Técnicas Muestreo Poblaciones Finitas 28 POBLACIONES FINITAS: MUESTREO ALEATORIO SIMPLE En un distrito de la ciudad existen 10.000 viviendas. Los datos de un censo anterior hacen suponer que, aproximadamente, los 2/3 corresponde a régimen de alquiler. Se pide el tamaño de muestra necesario para estimar la proporción actual de viviendas en alquiler, con un error de muestreo igual a 0,04, en caso de: a) Muestreo con reposición y probabilidades iguales. b) Muestreo aleatorio simple (muestreo sin reposición y probabilidades iguales). Solución: a) En el muestreo con reposición, la varianza de la proporción muestral: x 21 p q 3 3 2 V(p) n n 9n === Error σp = V(p) = 0,04 con lo que, 22 0,0016 n 139 9n 0,0144 =→== b) En el muestreo sin reposición interviene el factor de corrección de poblaciones finitas N n p q Npq V(p) . n N 1 n pq (N 1)V(p) − =→= −+− xx xx 21 10.000 n 3 3 137 21 9.999 0,0016 33 == + La muestra es más pequeña, consecuencia de una mayor precisión en el muestreo sin reposición. Portal Estadística Aplicada: Técnicas Muestreo Poblaciones Finitas 29 POBLACIONES FINITAS: MUESTREO ALEATORIO SIMPLE En un municipio de 2.500 viviendas, una encuesta piloto muestra que la proporción de viviendas desocupadas es de 0,12. a) Utilizando un muestreo aleatorio simple, calcular el tamaño de muestra necesario para estimar el número de viviendas desocupadas con un error de muestreo igual a 10. ¿Cuál sería el tamaño de la muestra si el error de muestreo fuera igual a 30?. b) ¿Cuáles serían los tamaños de muestra bajo las condiciones anteriores si se utiliza un muestreo con reposición? Solución: a) El error de muestreo (σp τ = 10 ) del estimador de un total de clase y el tamaño de la muestra están relacionados por la expresión: 2222 p x xx ( N n ) p . q ( 5.200 n ) 0,12 0,88 N . 10 5.200 τ ( N 1 ) n ( 5.200 1 ) n σ −− =→= −− 33 2222 p xx xxx N pq 5200 0,12 0,88 n n 4.399 τ (N 1) N p q 10 5.199 5200 0,12 0,88 =→== σ−++ viviendas El elevado valor de la muestra se debe a la alta precisión con que se requieren los resultados. Si la precisión es menor σp τ = 30 , se obtiene: 3 22 xx xxx 5200 0,12 0,88 n 1,971 30 5.199 5200 0,12 0,88 == + viviendas Observando los tamaños de las muestras no se verifica la teoría del muestreo en poblaciones infinitas, que determina que el error de muestreo disminuye proporcionalmente a la raíz cuadrada del incremento de la muestra , es decir, un error de muestreo 3 veces mayor exigiría una muestra 9 veces menor (489 viviendas). El responsable del no cumplimiento de este principio se debe a la influencia del factor de corrección de poblaciones finitas Nn N1 − − , tanto más relevante cuanto mayor sea la muestra en relación con la población. b) En el caso del muestreo con reposición: 2 22 p 2p p.qN.p.q N.n τn τ σ σ =→= Para σp τ = 10 , se tiene : 2 2 5200 x 0,12 x 0,88 n 28.554 10 = = viviendas Resulta un tamaño de muestra superior al tamaño de la población, lo que hace que este muestreo, semajante al de poblaciones infinitas, no sea práctico