Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TCNICAS CUANTITATIVAS 3
Grado en Marketing e Investigacin de Mercados
MUESTREO
Teora y ejercicios.
NDICE
1. Muestreo aleatorio simple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.0 Definiciones y conceptos bsicos . . . . . . . . . . . . . . . . . . . . . . .
1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. . . . . . . .
1.2 Muestreo aleatorio simple en poblaciones infinitas. . . . . . . . . . . . . .
1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de
estimacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Estimacin puntual. Intervalos de confianza. Contrastes de hiptesis.
1.2.3 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . .
1.3 Muestreo aleatorio simple en poblaciones finitas. . . . . . . . . . . . . . .
1.3.1 Estimacin de la media, proporcin y total poblacionales. . . . . . .
1.3.2 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . .
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
11
12
14
14
17
19
26
26
27
30
31
31
32
32
38
40
50
50
51
52
55
56
57
59
59
59
61
62
4. Muestreo sistemtico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Seleccin de una muestra sistemtica. Usos. Ventajas. . . . . . . . . . . . .
4.2 Estimacin de la media, proporcin y total poblacionales. . . . . . . . . . .
4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas,
aleatorias y peridicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . . . . .
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
68
69
77
77
77
77
82
5
5
7
8
72
73
74
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
Relacin de Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . . . .
94
Muestreo con informacin auxiliar . . . . . . . . . . . . . . . . . . . . . . . .
99
Muestreo sistemtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . .
105
Formulario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo con informacin auxiliar . . . . . . . . . . . . . . . . . . . . . . . .
Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . .
111
111
113
115
118
ser pequea para permitir que se hagan inferencias acerca de la poblacin basndose en una
muestra obtenida del marco.
La cantidad de informacin contenida en una muestra se controla por medio del nmero de
datos muestrales y por el mtodo usado para seleccionar los datos muestrales. Los mtodos de
muestreo ms utilizados son:
1. Muestreo aleatorio simple.
2. Muestreo aleatorio estratificado.
3. Muestreo sistemtico.
4. Muestreo por conglomerados.
La formulacin y el orden de las preguntas pueden tener un gran efecto sobre las
respuestas obtenidas
1. Reentrevistas.
2. Recompensas e incentivos.
3. Entrevistadores adiestrados.
4. Verificacin de datos
Son muchas las razones para el uso del muestreo, entre otras destacamos:
(a) Evitar la destruccin de la poblacin. En algunos casos, por ejemplo en el control de
calidad, la observacin de los elementos lleva a su destruccin.
(b) Rapidez. Los datos se pueden reunir ms rpido, de modo que las estimaciones se
pueden publicar de una manera programada. Por ejemplo las elecciones.
(c) Economa y precisin. El muestreo puede proporcionar informacin fiable con costes
mucho menores que los de un censo. Un censo completo necesita muchas personas en
la recoleccin de los datos y debido a su complejidad se pueden cometer muchos
errores. En una muestra, se puede dedicar ms atencin a la calidad de los datos y
realizar un seguimiento de quienes no contestan la encuesta.
1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. Rutas aleatorias.
Si cada muestra posible de tamao n tiene la misma probabilidad de ser seleccionada, el
procedimiento de muestreo se denomina muestreo aleatorio simple y a la muestra as
seleccionada se le llama muestra aleatoria simple.
La condicin de que cada muestra tenga la misma probabilidad de ser seleccionada equivale a
que cada elemento tenga la misma probabilidad de pertenecer a la muestra. Para ello la
seleccin de cada elemento de la muestra se debe hacer con un sorteo completamente
aleatorio. Para facilitar la obtencin de los resultados de ese sorteo aleatorio existen lo que se
conoce como tablas de nmeros aleatorios que suelen aparecer en un apndice al final de
muchos libros de estadstica. Cada vez ms, estas tablas de nmeros aleatorios son sustituidas
por la generacin de nmeros aleatorios mediante programas de ordenador (Excel, SPSS,...).
Para asociar el valor de esos nmeros aleatorios con los elementos de la poblacin
necesitamos que sta est numerada, en caso contrario deberamos formar una lista y
numerarla. Esto ltimo, en muchos casos, no es tan sencillo. Una alternativa a la formacin de
una lista numerada para la seleccin mediante nmeros aleatorios de los elementos de la
muestra es el mtodo de las rutas aleatorias. Segn este mtodo cada nmero aleatorio o
grupo de nmeros aleatorios describe el camino hasta el elemento de la muestra. Veamos
cmo se aplicara este mtodo con un sencillo ejemplo:
7
Se ha seleccionado el nmero aleatorio 11071032, las dos primeras cifras (11) indican el
distrito de la ciudad, las dos siguientes (07) la calle del distrito, las dos siguientes (10) el
nmero de la calle, la siguiente (3) la planta del edificio y la ltima (2) la letra B de dicha
planta.
En muchos casos para llevar a cabo este procedimiento se recurre a la gua telefnica,
sobretodo si la entrevista es por telfono, as el nmero aleatorio 7836 podra interpretarse
como que se selecciona la pgina 78 de la gua y dentro de sta al abonado del telfono que
aparece en el lugar 36 de dicha pgina.
1 n
yi
n i =1
Un valor aislado y del estimador revela poco acerca de la media poblacional, deberamos
evaluar tambin su bondad.
Este estimador tiene propiedades deseables como ser insesgado y tener mnima varianza
( )
E y =
( )
V y =
2
n
1 n
yi y
n 1 i =1
S2
n
Cuando las variables Y, Y1, ..., Yn son dicotmicas o binomiales, slo toman dos valores (0 y
1), su media representa una proporcin que se nota como p y el estimador de la misma, la
proporcin muestral, por p
p=
1 n
yi
n i =1
yi = 0, 1
Este estimador, como media muestral que es, tiene las mismas propiedades mencionadas
antes.
La varianza de la poblacin es en este caso 2 = pq , donde q=1-p. Como antes, el estimador
insesgado de la varianza es la cuasivarianza muestral que para este tipo de variables es igual a
S2 =
n
pq
n 1
si
2 conocida
N (0,1)
n
Y N ( , 2 )
si
2 desconocida
y
tn 1 N (0,1)
S
n
tn 1 N (0,1))
si
y
N (0,1)
S
n
p p
pq
n
p p
n pq
n 1 n
p p
N (0,1)
pq
y= p
n 1
Todo lo anterior puede resumirse diciendo que la media muestral (de variables numricas, y ,
o dicotmicas, p ) sigue una distribucin Normal o se puede aproximar por ella si el tamao
de la muestra es suficientemente grande. De forma que podemos conocer la probabilidad de
que dicha variable tome determinados valores, por ejemplo (tomando una de las anteriores
expresiones de la media muestral tipificada, siendo vlido lo que sigue tambin para las otras)
y
P 1, 96
1, 96 = 0,95
o en un caso ms general
y
P Z
Z = 1
2
2
n
=nivel de significacin
1-=nivel de confianza
Para un nivel de confianza del 95% (el ms habitual) se suele redondear el anterior valor
1,962.
P 2
y 2
= 0, 95 P y 2
= 0, 95
n
n
n
puede estar cometiendo, con una confianza del 95%. En la prctica, es desconocida y se
estima por S .
10
La segunda lectura:
Py 2
y+2
= 0, 95
n
n
expresa la confianza que tenemos de que el verdadero valor del parmetro se encuentre
Todo lo anterior se puede asegurar si el estimador sigue una distribucin Normal (si el tamao
de la muestra es suficientemente grande, n>30, est garantizado). Pero qu ocurre si no es as.
En ese caso la desigualdad de Tchebychev nos da la respuesta.
La desigualdad de Tchebychev asegura que si X es una variable aleatoria con media
E ( X ) = y varianza V ( X ) = 2 , sea cual sea su distribucin de probabilidad
P X k 1
1
k2
P y 2
1 4 = 0, 75
n
P y 2
= 0, 95
n
salvo que en este caso lo ms que podemos asegurar es que dicha probabilidad es mayor que
0,75.
,y+2
y2
n
n
11
En ocasiones se quiere contrastar con los valores observados en una muestra la posibilidad de
que el verdadero valor de un parmetro de la poblacin sea un valor dado, por ejemplo, se
quiere contrastar la hiptesis nula H 0 : = 0 con un nivel de significacin del 5%. Lo
anterior equivale a comprobar si
0 y 2
S
S
,y+2
n
n
2
n
= B2 n =
2
B2
4
2
D
, D=
B2
4
R2
16
2
pq
,
D
D=
B2
4
1
se obtiene un tamao muestral conservador (mayor que el requerido para
2
12
Ejemplo 1.1. Un hipermercado desea estimar la proporcin de compras que los clientes pagan
con su Tarjeta de Compras. Durante una semana observaron al azar 200 compras de las
cuales 35 fueron pagadas con la tarjeta.
a) Estime con un intervalo de confianza la proporcin de compras pagadas con dicha tarjeta.
b) Cuantas compras deberan observarse para estimar, con un error inferior al 3%, la
proporcin de compras pagadas con la tarjeta? (Consideren los datos anteriores como una
muestra previa)
c) Si no se tuviera ninguna informacin acerca de los clientes que utilizan la tarjeta, cuntas
compras deberamos observar para asegurar que la anterior estimacin se realiza con un
error inferior al 3%.
d) Este mismo hipermercado desea estimar tambin el valor medio de las compras
realizadas con su Tarjeta de Compras. Basndose en los anteriores datos se observa que
el valor total de las compras hechas con la tarjeta fue de 5.600 (siendo la cuasivarianza
de los datos 625). Estime el valor medio de las compras pagadas con la tarjeta y el error
de estimacin asociado.
Solucin:
a)
p=
1 n
35
yi =
= 0,175
n i =1
200
q = 1 0,175 = 0,825
n = 200
V ( p) =
pq
= 0, 000726
n 1
p (12,11% , 22,89% )
B = 2 V ( p) = 0,0539
b)
B = 0, 03
D=
B2
= 0, 000225
4
n=
pq
= 641, 6 642
D
c)
B = 0, 03
D=
B2
= 0, 000225
4
p = q = 0,5
n=
pq
= 1111,1 1112
D
d)
n = 35
S 2 = 625
V ( y) =
S 2 625
=
= 17,8571
n
35
y=
1 n
5600
yi =
= 160
n i =1
35
B = 2 V ( y ) = 8, 45
13
=y=
( )
E y =
( )
V y =
2 N n
n N 1
N
2
N 1
N 1 2
E
S =2
N
N
n N 1 n N
( )
S2
expresin igual a la del caso de poblaciones infinitas, V ( y ) =
, salvo el coeficiente
n
N n
Para calcular el lmite para el error de estimacin , con un 95% de confianza, se halla
95% cuando trabajamos con el coeficiente 1,962. Pero en algunos casos, segn la
desigualdad de Tchevychev, slo se puede asegurar que este nivel es mayor que un 75%.
= N y =
N
n
= N utilizaremos el estimador
y
i =1
Como en el caso de la media, el lmite para el error de estimacin con una confianza del 95%
est dado por 2 V ( ) . Valiendo comentarios anlogos a los hechos anteriormente.
En lo sucesivo se dar el valor de la varianza del estimador para los distintos tipos de
muestreo, omitindose, para no repetirnos ms, la referencia al lmite para el error de
estimacin.
Ejemplo 1.2. Un auditor examina las cuentas abiertas con diferentes clientes de una empresa.
Suponga que existen 1.000 cuentas de las cuales se examinan 300. La media muestral de las
cuentas fue y = 1.040 y la cuasivarianza muestral es S2=45.0002. Estime el promedio de la
deuda y el total de la deuda por cobrar para las 1.000 cuentas abiertas con un intervalo de
confianza al 95%.
Solucin:
S n21 N n 45000 1000 300
V ( y) =
=
= 105
n
N
300
1000
2 V ( y ) = 2 105 = 20, 49
15
1 n
yi
n i =1
yi = 0, 1
n pq
, es igual a
n 1
S2 N n
pq N n
=
n N
n 1 N
= N p
Ejemplo 1.3. Se toma una muestra aleatoria simple de 100 estudiantes de un centro con 900
estudiantes para estimar
Sean yi , zi
yi = 70
Segn la muestra
i =1
100
z
i =1
= 25
Solucin:
100
p1 =
V ( p1 ) =
yi
i =1
100
100
= 0, 70 (70%)
p1 q 1 N n
= 0,0018855
n 1 N
2 = N p 2 = 900 0, 25 = 225
16
p2 =
z
i =1
100
V ( p2 ) =
= 0, 25 (25%)
p 2 q 2 N n
= 0, 0016835
n 1 N
( )
2 V ( y) = B V y =
V ( y) =
2 N n
n N 1
=D n=
B2
=D
4
N 2
( N 1) D + 2
Para estimar el total poblacional con un lmite para el error de estimacin B, dado que
B2
R2
16
2
Npq
( N 1) D + pq
D=
B2
(para la proporcin)
4
D=
B2
(para el total)
4N 2
1
se obtiene un tamao muestral conservador (mayor que el
2
Ejemplo 1.4. Encuentre el tamao de la muestra necesario para estimar el valor total de 1.000
cuentas por cobrar con un lmite para el error de estimacin de 10.000. Aunque no se cuenta
17
con datos anteriores para estimar la varianza poblacional, se sabe que la mayora de las
cuentas caen dentro del intervalo (600, 1.400).
Solucin:
D=
B2
10.0002
=
= 25
4 N 2 4 1.0002
n=
N 2
= 615, 62 616
( N 1) D + 2
Si se realizan dos mediciones (o ms) sobre cada elemento de la muestra, se calcularn los
tamaos muestrales que satisfacen los lmites para el error de estimacin fijados para cada
estimacin y finalmente el mayor de los dos ser el tamao de la muestra que satisface ambos
lmites.
Ejemplo 1.5. Los alumnos de TC3 de una facultad con 3.000 estudiantes desean realizar una
encuesta para determinar la proporcin de estudiantes que estn a favor de hacer los exmenes
en sbado con un lmite para el error de estimacin del 10%. La informacin previa disponible
indica que el 60% preferan los exmenes en sbado. Tambin se quiere estimar la proporcin
de estudiantes que apoyan al equipo decanal con un error de estimacin del 5%. Determnese
el tamao muestral que se requiere para estimar ambas proporciones con los lmites de error
especificados.
Solucin:
B12 (0,10)2
=
= 0, 0025
4
4
Np1q1
3.000 0, 60 0, 40
=
= 93, 05 94
( N 1) D1 + p1q1 (2.999 0, 0025) + (0, 60 0, 40)
Np2 q2
3.000 0,50 0, 50
=
= 353, 04 354
( N 1) D2 + p2 q2 (2.999 0, 000625) + (0,50 0, 50)
para cumplir con ambos objetivos habra que tomar n=354 con lo que el lmite para el error de
la estimacin de p1 disminuira (con un 95% de confianza) hasta:
2 V ( p1 ) = 2
18
p1 q 1 N n
0, 60 0, 40 3.000 354
=2
= 0, 0489 ( 4,9%)
n 1 N
353
3.000
o bien la cota del error de estimacin del 10% se tiene con un nivel de confianza mucho
mayor
V ( p1 ) = z
0, 60 0, 40 3.000 354
p1 q 1 N n
= z
= 0,10
2
n 1 N
353
3.000
z 0, 02445 = 0,10
z = 4, 09
buscando en la tabla de la Normal (o con ayuda de la hoja de clculo Excel, ...) la probabilidad
comprendida entre (-4,09 , 4,09), se obtiene 0,99995684, es decir, prcticamente un nivel de
confianza del 100%.
EJERCICIOS RESUELTOS
1. Se selecciona una m.a.s. de 9 compras de clientes de un centro comercial para estimar el
valor medio de las compras por cliente.
VALOR en
33,5 32
52
43
40
41
45
42,5
39
33, 5 + ... + 39
= 40,89
9
1
2
2
( 33,5 40,89 ) + ... + ( 39 40,89 ) = 35, 67
9 1
( )
S2
= 3,963
V y =
n
( )
B = 2 V y = 3, 98
2
B2
4
S 2 35, 67
=
= 35, 67 36 compras
B2
1
4
2. Se han entrevistado 1.000 vecinos, elegidos aleatoriamente entre los ms de cien mil
habitantes de una ciudad para conocer su opinin sobre los nuevos impuestos municipales.
655 manifestaron su opinin desfavorable. Estime la proporcin de vecinos que estn en
19
V ( p) =
655
= 0, 655
1.000
p = 65,5%
pq 0, 655 (1 0, 655)
=
= 0, 0002262012
n 1
999
2 V ( p) = 0, 0301 3, 01%
(65,5% 3, 01% , 65, 5% + 3, 01%) = (62, 49% , 68, 51%)
p (62, 49% , 68,51%)
habitantes estn en contra
SOLUCIN:
Ri
2.200-1.200=1000
1.700-500=1.200
n1 =
n2 =
12
D1
22
D2
12
2
1
B
4
22
2
2
B
4
Ri
i
4
250
300
i2
62.500
90.000
62.500 62.500
=
= 25
10.000
100 2
4
4
90.000 90.000
=
= 25
14.400
120 2
4
4
n = n1 + n2 = 50
4. Entre todas las oficinas bancarias de una pequea ciudad se tienen concedidos 2000
prstamos hipotecarios. Existen razones para pensar que el prstamo hipotecario de menor
20
cuanta es de algo ms de 1200 euros, siendo de casi 11000 euros el de mayor cuanta.
cul es el tamao muestral necesario para estimar estos dos parmetros:
-
SOLUCIN:
N = 2.000
D=
n=
R
= 2450 2 6.002.500
4
B 2 4002
=
= 40.000
4
4
N 2
= 139, 65 140
( N 1) D + 2
B 2 0.052
=
= 0, 000625
4
4
Npq
n=
= 333, 47 334
( N 1) D + pq
D=
p = q = 0,5
Para conseguir estimar los dos parmetros con los niveles de error especificados
necesitamos un tamao muestral igual al mximo de 140 y 334. n = 334 .
SOLUCIN:
N = 110 R = 1.800 1.500 = 300
D=
R
= 75 2 5625
4
B 2 102
=
= 25
4
4
N 2
n=
= 74,1 75
( N 1) D + 2
D=
B 2 0.022
=
= 0, 0001
4
4
21
p = q = 0,5
n=
Npq
= 105, 4 106
( N 1) D + pq
6. Una empresa de trabajo temporal quiere investigar las necesidades de empleo de las
empresas de un pueblo. Para ello decide seleccionar una muestra de 5 de las 25 inscritas en
el registro mercantil. El nmero de bajas en el ltimo ao, el nmero de empleados y la
respuesta de cada empresa sobre si utilizara los servicios de la empresa de trabajo
temporal fueron los siguientes:
Empresa Bajas Empleados Respuesta
1
1
7
Si
2
2
15
No
3
9
85
Si
4
0
3
No
5
2
12
No
a) Estime el nmero de bajas en el ltimo ao en las empresas del pueblo. Calcule el
lmite para el error de estimacin.
b) Estime el nmero de empresas que usaran los servicios ofertados. Calcule el lmite
para el error de estimacin.
SOLUCIN:
a) N = 25
n=5
14
= 2,8 = N y = 70
y=
5
S2
12, 7
= 25 20
= 1270
V ( ) = N ( N n)
n
5
B = 2 V ( ) = 71, 2741
Nota: este apartado podr resolverse de otra forma cuando estudiemos el muestreo por
conglomerados. Vase ejercicio 10 de la relacin del captulo 6)
b)
2
= 0, 4 = N p = 10
5
pq
0, 24
V ( ) = N ( N n)
= 25 20
= 30
n 1
4
B = 2 V ( ) = 10,9545
p=
7. El consumo medio de combustible de los taxis de una ciudad es 5.6 litros cada 100 Km.
Puesto que se considera que el consumo es demasiado elevado, en 600 taxis se monta un
dispositivo para disminuirlo. Pasado cierto tiempo se toma una muestra aleatoria de 20
22
taxis, elegidos entre los 600 que colocaron el dispositivo. El consumo en litros de
combustible por cada 100 Km. se recoge en la siguiente tabla
Taxi n Consumo Taxi n Consumo Taxi n Consumo Taxi n Consumo
1
5.4
6
6.3
11
3.6
16
5.4
2
5.5
7
5.4
12
6.7
17
4.8
3
6.9
8
5
13
5.2
18
4.7
4
3.9
9
4.5
14
5.1
19
5.8
5
4.5
10
4.4
15
5.4
20
6.2
a) Estmese mediante un intervalo de confianza la proporcin de taxis con un consumo
inferior a 5.6 litros/100 Km.
b) Cuantos taxis deben observarse para estimar la anterior proporcin con un error
menor o igual que un 10%?
SOLUCIN:
a) 15 de los 20 taxis no superan el consumo de 56 litros/100 Km, por tanto
p=
15
= 0 '75
20
V ( p) =
2 V ( p) = 0 '1953
D=
( 0 '10 )
n=
( 55'47% , 94 '53% )
= 0 '0025
Npq
600 0 '75 0 '25
=
= 66 '77 67
( N 1) D + pq ( 599 0 '0025 ) + ( 0 '75 0 '25)
8. Una muestra aleatoria simple de 6 deudas de clientes de una farmacia es seleccionada para
estimar la cantidad total de deuda de las 100 cuentas abiertas. Los valores de la muestra
para estas seis cuentas son los siguientes:
Dinero adeudado ()
35,50
32,00
43,00
41,00
44,00
42,50
Estime el total del dinero adeudado y establezca un lmite para el error de estimacin.
23
SOLUCIN:
yi2
1260,25
1024,00
1849,00
1681,00
1936,00
1806,25
yi
35,50
32,00
43,00
41,00
44,00
42,50
n
y
i =1
= 238,00
i =1
= N y =
2
i
N
n
= 9556,50
y
i =1
100
238=3966,6
6
2
S2 =
1 n
yi y
n 1 i =1
yi
n
yi2 i =1
1
2382
n
= i =1
= 9556,50
= 23,1667
n 1
5
6
2
S
23,1667
2 V ( ) = 2 N ( N n)
= 2 100(100 6)
= 381, 02
n
6
Los anteriores clculos que se han realizado a mano o con ayuda de una calculadora bsica
se simplifican notablemente si utilizamos una calculadora cientfica de uso comn. Estas
calculadoras nos proporcionan los valores de un grupo de funciones estadsticas
n = sx
n = sx = desviacin tpica
n 1 = Sx
de forma inmediata.
n 1 = S x = cuasidesviacin tpica
24
51
pq N n
= 0,17 q = 1 p = 0,83 V ( p ) =
= 0, 00044359197 2 V ( p ) = 0, 0421
300
n 1 N
25% (17% 4, 21% ) = (12, 79%, 21, 21% )
luego se rechaza la hiptesis de que en el 25% de los hogares de esa ciudad habita al
menos una persona mayor de 65 aos.
10. El gerente de un taller de maquinaria desea estimar el tiempo medio que necesita un
operador para terminar una tarea sencilla. El taller tiene 45 operadores. Se seleccionaron
aleatoriamente 5 operadores y se les tom el tiempo. Los resultados obtenidos son los
siguientes:
Tiempo(minutos) 4,2 5,1 7,9 3,8 5,3
Se puede aceptar la hiptesis de que el tiempo medio que necesitan los operarios del
taller para terminar dicha tarea es inferior a 6 minutos?
SOLUCIN: (con las funciones del modo SD de la calculadora )
N=45, n=5
y=
1 n
yi = 5, 26
n i =1
S2 =
1 n
yi y
n 1 i =1
= 2, 563
S2 N n
= 0, 4556
2 V ( y ) = 1,35 Intervalo de confianza : ( 3,91 min ., 6, 61 min .)
n N
Valores mayores e igual a 6 minutos pertenecen al intervalo de confianza, por tanto no
V ( y) =
11. Con objetivos benficos, una asociacin filantrpica ha solicitado firmas para una peticin
en 700 hojas. Cada hoja tiene espacio suficiente para 40 firmas pero en muchas de las
hojas se ha obtenido un nmero menor. Contando el nmero de firmas por hoja en una
muestra aleatoria de 50 hojas se han observado los siguientes resultados:
50
Yi = 1.450;
i =1
50
i =1
= 54.496
y=
1 n
1450
yi =
= 29
n i =1
50
= N y = 20.300
yi
n
yi2 i =1
n
S 2 = i =1
= 254
n 1
2
S
V ( ) = N ( N n)
= 2.311.400
n
B = 2 V ( ) = 3.040, 66
25
n = tamao de la muestra
N = Ni
n = ni
i =1
26
i =1
i =1
i =1
mediante y st =
1
N
y la
N
i =1
yi
NOTA:
Varianza estimada de y st
1 L 2
1 L 2 Si2 N i ni
N
V
(
y
)
=
Ni n N
i
i
N 2 i =1
N 2 i =1
i
i
Se obtiene aplicando que la varianza de la suma de variables independientes es la suma de
V ( y st ) =
Varianza estimada de st
L
S2 N n
V ( st ) = N 2 V ( y st ) = N i2 i i i
ni N i
i =1
1
N
N
i =1
pi
Varianza estimada de p st
V ( p st ) =
1
N2
Ni2 V ( pi ) =
i =1
1
N2
Ni2
i =1
pi q i N i ni
ni 1 N i
27
st = N p st = N i pi
i =1
Varianza estimada de st
L
p q N n
V ( st ) = N 2 V ( p st ) = N i2 i i i i
ni 1 N i
i =1
BARRIO B
20
25
30
14
41
39
BARRIO C
14
22
15
17
21
11
20
14
24
Estime el tiempo medio que se ve la televisin y el lmite para el error de estimacin, en horas por
semana, para:
a) Los hogares del barrio A.
b) Los hogares del barrio B.
c) Los hogares del barrio C.
d) Todos los hogares
Solucin: en primer lugar se calculan las medias y cuasivarianzas muestrales en cada estrato
y1 = 34, 67 horas / semana
y 2 = 28,17 h / s
y = 28, 23
S 2 = 92, 74
A partir de estos valores calculamos las varianzas de los estimadores de la media en cada
estrato y los lmites para los errores de dichas estimaciones
N1 = 210 N 2 = 84 N 3 = 126 N = N1 + N 2 + N 3 = 420
28
n1 = 15 n2 = 6 n3 = 9 n = n1 + n2 + n3 = 30
S12 N1 n1
V ( y1 ) =
= 1, 44
n1 N1
S 22 N 2 n2
V ( y2 ) =
= 17, 42
n2 N 2
S32 N 3 n3
V ( y3 ) =
= 1, 99
n3 N 3
2 V ( y1 ) = 2, 40 h / s
2 V ( y 2 ) = 8,35 h / s
2 V ( y 3 ) = 2,82 h / s
Para el conjunto de todos los hogares el estimador de la media es
1 3
Ni y i = 28, 23 h / s
N i =1
y la varianza de este estimador la podemos calcular basndonos en las varianzas de los
y st =
N
i =1
2
i
V ( y i ) = 1, 24
o, si se prefiere, utilizando
1 3 2 Si2 N i ni
Ni n N
N 2 i =1
i
i
el error para la estimacin de la media para todos los hogares est dado por
V ( y st ) =
2 V ( y st ) = 2, 22 h / s
Ejemplo 2.2. En el caso anterior, tambin se desea saber qu proporcin de hogares ven un
determinado programa, para decidir la conveniencia de insertar un anuncio en los intermedios
del mismo. La respuesta a la pregunta de si ven dicho programa en los hogares de la muestra
anterior se recoge a continuacin:
BARRIO A
BARRIO B BARRIO C
SI
NO
SI
SI
SI
NO
SI
SI
SI
SI
NO
SI
SI
NO
NO
NO
SI
SI
SI
NO
SI
NO
SI
NO NO
SI
NO
NO
SI
SI
Estime con un intervalo de confianza la proporcin de hogares del municipio donde se ve el
programa.
7
= 0, 4667
15
p2 =
5
= 0,8333
6
p3 =
6
= 0, 6667
9
V ( p st ) =
1
N2
N
i =1
2
i
pi q i N i ni
= 0, 00748
ni 1 N i
2 V ( p st ) = 0,173
29
1
N2
N
i =1
2
i
i2 N i ni
ni N i 1
No podemos despejar el valor de todos los ni de una sola ecuacin a menos que conozcamos
la relacin entre los ni y n . Hay diversas formas de asignar el tamao muestral n en los
diferentes estratos
n=
i =1
N i2 i2
N 2 D + N i i2
i =1
B
D=
4
B2
y la misma expresin vale para el total tomando D =
.
4N 2
Al igual que en el m.a.s. para poder usar la anterior ecuacin necesitamos conocer las
varianzas poblacionales de los estratos o valores aproximados de ellas, para lo cual se pueden
usar las cuasivarianzas muestrales de una muestra previa o basarnos en el rango de variacin
de las observaciones dentro de cada estrato.
En el caso de variables dicotmicas se obtiene una expresin similar, teniendo en cuenta que
en este caso particular i2 = pi qi
L
n=
i =1
N i2 pi qi
N 2 D + N i pi qi
i =1
D=
30
B2
B2
(para estimar p) y la misma expresin vale para el total tomando D =
.
4
4N 2
N j j
cj
j =
i =1
N i i
ci
sustituyendo los j en la expresin que obtenamos antes para n se tiene el tamao total de la
muestra segn la asignacin ptima
L
Ni i ci
i =1
n=
i =1
Ni i
ci
N 2 D + N i i2
i =1
Nj
j =
N
i =1
N
n=
i =1
pi qi
ci
L
pi qi ci
i =1
pi qi
ci
N 2 D + N i pi qi
i =1
B2
B2
D=
(para estimar la media o p), D =
(para estimar el total).
4
4N 2
31
C
n=
i =1
N
i
i =1
ci
pi qi .
j =
N
i
i =1
( N )
L
n=
i =1
N 2 D + N i i2
i =1
Caso dicotmico
j =
N j pjqj
L
N
i =1
( N
pi qi
2
n=
i =1
pi qi
N 2 D + N i pi qi
i =1
A este tipo de asignacin se le denomina de Neyman que coincide con la asignacin ptima
solamente cuando los costes de observacin son iguales en todos los estratos. Esta asignacin
se utiliza an cuando los costes de observacin no son idnticos, a veces, sencillamente no se
conocen.
Caso numrico
Nj
j =
n=
N
i
i =1
ND +
1
N
2
i
N
i
i =1
2
i
Caso dicotmico
Nj
j =
n=
N pq
i
i =1
ND +
1
N
i i
N pq
i =1
i i
33
Nj
N
las variables al no depender de sus varianzas, as si en dos estimaciones para los niveles de
error requeridos tenemos lo siguiente
1 estimacin: n = 100 1 = 0,30 n1 = 30 2 = 0, 70 n2 = 70
2 estimacin: n = 40 1 = 0,30 n1 = 12 2 = 0, 70 n2 = 28
tomando como n el mximo de los dos (y en general para k variables), se tiene garantizado
que se cumple con los lmites para el error fijados para todas las estimaciones.
Ni
N
n i = i i
N
N
o equivalentemente que
i
15 210
=
= 0, 5
30 420
6
84
=
= 0, 2
30 420
9 126
=
= 0, 3
30 420
1 = S12 = 23, 24
34
2 = S22 = 112,56
3 = S32 = 19, 28
D=
Ni
ci
N i i ci
210
84
126
420
4,8208
10,6094
4,3909
1
3
2
1012,368
2673,5688
1106,5068
4792,4436
N i i
ci
1012,368
297,0632
276,6267
1586,0579
N i i2
4880,4
9455,04
2429,28
16764,72
B2 1
= = 0, 25
4 4
3
N
n=
i =1
Ni i
ci
ci
i =1
N 2 D + N i i2
i =1
N1 1
c
1 = 3 1 = 0, 6383
N i i
ci
i =1
n1 = n1 = 79, 71 80
2 = 0,1873
n2 = n2 = 23,39 24
3 = 0,1744
n3 = n3 = 21, 78 22
n = 80 + 24 + 22 = 126
c) En el supuesto de que se disponga slo de 600 para realizar el estudio
N i i
ci
600
n=
i =1
N
i =1
ci
n2 = 0,1873n = 37,19 37
n = 126 + 37 + 34 = 197
n3 = 0,1744n = 34, 63 34
n=
600
600
=
= 198,57
c11 + c22 + c33 3, 0216
35
pi
qi
N i pi qi
N i pi qi
210
84
126
420
0,4667
0,8333
0,6667
0,5333
0,1667
0,3333
52,2671
11,6685
27,9986
91,9342
104,7669
31,3075
59,3955
195,4699
B 2 0, 052
D=
=
= 0, 000625
4
4
( N
n=
i =1
pi qi
N 2 D + N i pi qi
195, 46992
= 188,98
( 4202 0, 000625) + 91,9342
i =1
n1 = n1 = n
N1 p1q1
= 188,98
N
i =1
anlogamente n2 = 30, 27 31
pi qi
104, 7669
= 101, 29 102
195, 4699
n3 = 57, 42 58
n = 102 + 31 + 58 = 191
b)
Ni
210
84
126
420
pi
0,5
0,5
0,5
qi
0,5
0,5
0,5
N i pi qi
52,5
21
31,5
105
n=
n1 = 204,878
N pq
i =1
1
ND +
N
i i
N pq
i =1
i i
105
105
( 420 0, 000625 ) +
420
210
= 102, 439 103 anlogamente n2 = 40,98 41
420
n = 103 + 41 + 62 = 206
36
= 204,878
n3 = 61, 46 62
Ejemplo 2.5 Un distribuidor de productos de limpieza desea conocer el consumo por hogar
durante un ao de un determinado producto en una comarca formada por cuatro municipios.
Para estimar de paso tambin el consumo en cada municipio decide usar muestreo
estratificado tomando cada municipio como un estrato. Se sabe que el 20% de la poblacin de
la comarca vive en el municipio 1, el 30% en el municipio 2, el 25% en el municipio 3 y el
25% restante en el municipio 4. El distribuidor tiene medios suficientes para controlar y
obtener datos sobre el consumo anual de 20 hogares.
Dado que no tiene informacin previa respecto a las varianzas de los estratos y porque el coste
del muestreo es el mismo en cada municipio, decide aplicar asignacin Proporcional, la cual
conduce a
N1
= 20 0, 20 = 4 de forma similar n2 = 6 n3 = 5 n4 = 5 .
N
Obteniendo los resultados de la tabla siguiente (consumo expresado en euros).
n1 = n
Estrato 1
470
510
500
550
Estrato 2
490
500
470
520
550
500
y 2 = 505 S22 = 750
Estrato 3
540
480
500
470
470
Estrato 4
450
560
460
440
580
Estime el consumo anual medio por hogar y fije un lmite para el error de estimacin.
Solucin:
y st =
1
N
N1
= 0, 20
N
i =1
i =1
Ni y i =
N2
= 0,30
N
N3
= 0, 25
N
N4
= 0, 25
N
Ni
y i = ( 0, 20 507, 5 ) + ( 0,30 505 ) + ( 0, 25 492 ) + ( 0, 25 498 ) = 500,5
N
1 20
10010
yi =
= 500,5
n i =1
20
37
4
2
N i Si2
Si2 N i ni
N i2 Si2
N
= 2
=
=
ni N i
ni
i =1
i =1 N
i =1 N ni
4
2
i
1091, 67
2 750
2 870
2 4420
= 0, 202
+ 0, 30
+ 0, 25
+ 0, 25
= 88, 29
4
6
5
5
2 V ( y st ) = 18, 79
Supongamos que el distribuidor hubiera decidido tomar una muestra aleatoria simple de 20
hogares, los mismos 20 de la tabla anterior, entonces el estimador de la media hubiera sido
y=
1 20
yi = 500, 5
n i =1
que coincide con el estimador del muestreo estratificado por las razones mencionadas
anteriormente, pero la varianza estimada y error de estimacin asociados tomaran los valores
S n21 = 1520, 79
V ( y) =
S n21 N n 1520, 79
=
= 76, 04
n
N
20
, se supone
N n
1
N
2 V ( y ) = 17, 44
Se observa que el error de estimacin es menor en el caso del muestreo aleatorio simple, esto
es debido a que el distribuidor no tuvo en cuenta que el consumo vara mucho dentro del
cuarto municipio. Pudo haber obtenido un error menor si hubiera estratificado en base al
tamao de las familias u hogares, esto es, colocando los hogares pequeos en un estrato, los
medianos en otro, ..., es decir, formando los estratos con hogares que tengan un consumo
similar.
Ni
sea conocido para todo i.
N
Obsrvese que en esta situacin los ni son aleatorios, ya que varan de una muestra a otra
aunque n sea fijo. Luego esto no es una muestra aleatoria estratificada en pleno sentido, pero
38
si
Ni
es conocido y ni 20 i , entonces este mtodo de estratificar despus de la seleccin
N
es casi tan exacto como el muestreo aleatorio estratificado con asignacin Proporcional. Este
mtodo no debe usarse si
Ni
o una buena aproximacin de su valor se desconocen.
N
Ejemplo 2.6 En una ciudad se sabe que el 30% de los hogares tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (valor en euros de la factura bimensual) se
obtuvieron los siguientes resultados:
Tipo Calefaccin N casas Valor total de las facturas desviacin tpica muestral
Elctrica
60
5730
200
No elctrica
40
2080
90
Obtenga una estimacin del valor medio de la factura de electricidad en la ciudad y el lmite
para el error de estimacin.
Solucin: Ya que la proporcin observada de facturas de hogares con calefaccin elctrica
(0,60=60/100) est muy alejada de la proporcin verdadera (0,30), es conveniente la
estratificacin despus de que se ha seleccionado la muestra aleatoria simple. Adems el
procedimiento se justifica pues tanto n1 como n2 superan 20.
y1 =
y st =
1
N
5730
= 95,5
60
i =1
i =1
Ni y i =
1
V ( y st ) = 2
N
y2 =
2080
= 52
40
Ni
y i = (0, 30 95,5) + (0, 70 52) = 65, 05
N
2
Si2 N i ni
N i2 Si2 N i ni
N
= 2
ni N i
ni N i
i =1
i =1 N
2
2
i
V ( y st ) =
i =1
2
2
2
N i Si2
N i2 Si2
2 200
2 90
=
=
0,30
+
0,
70
= 159, 225
N 2 ni
ni
60
40
i =1 N
2 V ( y st ) =25,24
A veces este mtodo de estimacin se utiliza para ajustar por no respuesta. Por ejemplo, si
muchos de quienes no respondieron a una muestra aleatoria simple son varones, entonces la
proporcin de varones en la muestra va a ser pequea, y se podra conseguir un estimador
ajustado mediante la estratificacin despus del muestreo.
39
As, en este ejemplo la baja representacin en la muestra de facturas sin calefaccin elctrica y
la alta de facturas con calefaccin elctrica conducen a una sobreestimacin del valor medio
de las facturas si se utiliza muestreo aleatorio simple y no se ajusta la estimacin de la media
con la estraficacin despus de seleccionar la muestra:
y=
EJERCICIOS RESUELTOS
1. Un analista de la opinin pblica tiene un presupuesto de 20.000 euros para realizar una
encuesta sobre el nmero medio de coches por hogar. Se sabe que de los 10.000 hogares
de la ciudad, 9.000 tienen telfono. Las entrevistas por telfono cuestan 10 euros por hogar
llamado y las entrevistas personales cuestan 30 euros por hogar visitado. Suponga que las
varianzas en los estratos con y sin telfono son iguales. Con el objetivo de minimizar el
lmite de error de estimacin Cuntos hogares deben ser entrevistados en cada estrato si
los hogares que cuentan con servicio telefnico son entrevistados por telfono y los
hogares sin telfono son entrevistados personalmente?
SOLUCIN:
L
C
n=
i =1
N i i
ci
N
i =1
Ni
9.000
1.000
10.000
ci
C
=
i =1
N i
ci
C
=
N
i =1
ci
10
30
ci
i =1
Ni
ci
N i ci
i =1
Ni
ci
2.846,05
182,574
3.028,624
Ni
ci
C
=
i =1
N
i =1
ci
N i ci
28.460,5 2.846,05/3.028,624=0,9397
5.477,226 182,574/3.028,624=0,0603
33.937,726
40
1,0000
O bien
c1n1 + c2 n2 = 20.000
c11n + c22 n = 20.000
9, 397 n + 1,809n = 11, 206n = 20.000
20.000
= 1.784,8 = n
11, 206
Y a partir de n se obtienen n1 y n2 como antes.
2. Se desea conocer el nmero de fines de semana que las familias de una gran ciudad salen
fuera de ella. Se sabe que el 425% de las familias tienen de 0 a 2 hijos, el 30% tienen de 3
a 5 hijos y el 275% tienen ms de 5 hijos. Se realiz un muestreo segn el nmero de
hijos y se pregunt a las familias sobre los fines de semana que pasan fuera, obtenindose
los siguientes datos:
Nmero de hijos ni
yi
S i2
i =1
0-2
25 239 6076
3-5
19 174 6301
Mas de 5
16 78
7824
Estimar el nmero medio de fines de semana que las familias pasan fuera de la ciudad y
dar el lmite de error de estimacin. Omitir el corrector por poblacin finita.
SOLUCIN:
y1 =
y st =
Si
1
N
239
= 9,56
25
i =1
i =1
Ni y i =
y2 =
174
= 9,16
19
y3 =
78
= 4,87
16
Ni
y i = ( 0, 425 9, 56 ) + ( 0, 30 9,16 ) + ( 0, 275 4,87 ) = 8,15
N
N i ni
1
= 1 V ( y st ) = 2
Ni
N
Si2 N i ni
1
N
= 2
ni N i
N
i =1
L
2
i
2
L
L
Si2
N i2 Si2
N i Si
N
= 2
=
=
ni
ni
i =1
i =1 N
i =1 N ni
L
2
i
60, 77
2 63, 01
2 78, 24
= 0, 4252
+ 0,30
+ 0, 275
= 1,107
25
19
16
2 1,107 = 2,1
3. Una compaa de autobuses est planeando una nueva ruta para dar servicio a cuatro
barrios. Se tomaron muestras aleatorias de hogares en cada barrio y se solicit a los
miembros de la muestra que valorasen en una escala de 1 (totalmente opuesto) a 5
(totalmente a favor) su opinin sobre el servicio propuesto. Los resultados se resumen en la
tabla adjunta:
41
Barrio
1
2
3
4
N i 240 190 350 220
ni
25 25 25 25
y i 3,5 3,6 3,9 3,8
S i 0,8 0,9 1,2 0,7
a) Halle un intervalo de confianza para la opinin media de los hogares que dispondrn del
nuevo servicio.
b) Si se asigna la muestra de 100 hogares de la mejor forma, determine cuntos
perteneceran al barrio 3. (Suponga iguales los costes de observacin)
SOLUCIN:
a)
L
N = N i = 1000
y st =
i =1
1
N
Ni y i =3, 725
i =1
B = 2 V ( y st ) = 0,1973
b)
n3 = n3 = 100
N 3 3
= 100
N
i =1
V ( y st ) =
1
N2
Ni2
i =1
Si2 N i ni
= 0, 00973
ni N i
( 3,5277 , 3,9223)
350 1, 2
=
(240 0,8) + (190 0,9) + (350 1, 2) + (220 0, 7)
SOLUCIN:
La asignacin que minimiza la cota del error de estimacin para un coste fijo es la
asignacin ptima.
42
ci
100 16
500 9
700 4
600 = 16n1 + 9n2 + 4n3
Ri
ci
4
3
2
R
.
4
N i i
ci
600-400 50
360-240 30
130-70 15
1250 01087
5000 04348
5250 04565
11500
1
600 = 17392n + 39132n + 1826n = 74784n
( ni = in )
n = 600/74784 = 80231
n1 = 1n = 872 8
n2 = 2n = 3488 34 n3 = 3n = 3663 36
pero
5.
HOMBRES
2.500
MUJERES
2.700
ni
100
400
yi
120
250
9.000
16.000
Si2
Estime la media poblacional de gasto mensual en ocio y su cota de error, mediante
muestreo aleatorio estratificado despus de seleccionar la muestra.
SOLUCIN:
Ni
ni
2.500
2.700
5.200
Si2
yi
100
400
500
120
250
9.000
16.000
y st =
1
V ( y st ) = 2
N
Ni y i
1
N
300.000
675.000
975.000
N y
i =1
2
i
0,96
0,85185
N i2
Si2 N i ni
ni N i
540.000.000
248.399.460
788.399.460
975.000
= 187, 5
5.200
Si2 N i ni 788.399.460
N
=
= 29,16
ni N i
5.2002
i =1
L
N i ni
Ni
2 29,16 = 10,8
43
6.
p1 =
p st =
1
N
i =1
i =1
Ni pi =
p2 =
130
= 0,52 q i = 1 p i
250
Ni
p i = ( 0, 50 0, 24 ) + ( 0,50 0,52 ) = 0,38 p st = 38%
N
N i ni
=1
Ni
2
L
L
1 L 2 p i q i N i ni
1 L 2 p i q i
N i2 p i q i
N i p i q i
V ( p st ) = 2 N i
= 2 Ni
=
=
=
N i =1
ni 1 N i
N i =1
ni 1 i =1 N 2 ni 1 i =1 N ni 1
0, 24 0, 76
2 0,52 0, 48
= 0,502
+ 0,50
= 0, 0011812146
49
249
Si
2 V ( p st ) = 0, 0687 6,87%
7.
Una corporacin desea estimar el nmero total de horas perdidas debido a accidentes de
sus empleados, en un determinado mes. Ya que los obreros, tcnicos y administrativos
tienen diferentes tasas de accidentes, la corporacin decide usar muestreo estratificado,
formando con cada grupo un estrato. Datos de aos previos sugieren las cuasivarianzas
mostradas en la siguiente tabla para el nmero de horas perdidas por empleado en los tres
grupos, y de datos actuales se obtienen los tamaos de los estratos. No habiendo
diferencia entre los costes de observacin de cada grupo, determine la mejor asignacin
para una muestra de 40 empleados.
44
Obreros
Tcnicos
Administrativos
Si2
36
25
Ni
132
92
27
SOLUCIN:
Ni
132
i Si
N i i
792
i
792
1.333
= 0,5941
= 0,3451
1.333
81
= 0, 0608
27
3
81
1.333
1.333
1
Donde se ha aplicado la asignacin de Neyman al ser los costes de observacin iguales:
92
j =
N j j
N
i
460
460
n1 = 40 0,5941 = 23,8 24
n2 = 40 0, 3451 = 13,8 14
i =1
8.
n3 = 40 0, 0608 = 2, 4 2
n = 40
ci
q i
pi
p i q i
N i p i q i
ci
5.000
0,90
0,10
0,3
500
2.000
0,55
0,45
0,4975
199
3.000
0,70
0,30
0,45826
343,695
1.042,695
500
1.042, 695
= 0, 4795
= 0,1909
1.042, 695
343, 695
= 0,3296
1.042, 695
1
199
j =
N
i =1
9.
p jq j
cj
pi qi
ci
La produccin de piezas de una factora se realiza en dos mquinas. El 40% de las piezas
las produce la mquina A y el 60% restante la mquina B. Se les pas control de calidad a
200 piezas; 67 producidas por la mquina A y dos de ellas resultaron defectuosas; las 133
restantes procedan de la mquina B, siendo 6 de ellas defectuosas. Estimar la proporcin
de piezas defectuosas de la factora y dar el lmite de error de estimacin. Omita el
coeficiente corrector por poblacin finita.
45
SOLUCIN:
p=
Estrato
Ni
ni
pi
A
B
0.40 N
0.60 N
N
67
133
200
2/67=0.030
6/133=0.045
p i q i
ni 1
0.000441
0.000326
1
( ( 0.40 N 0.030 ) + ( 0.60 N 0.045) ) = ( ( 0.40 0.030 ) + ( 0.60 0.045) ) = 0.039
N
( )
( 3.9% )
1
0.402 N 2 0.000441) + ( 0.602 N 2 0.000326 ) =
2 (
N
= ( 0.402 0.000441) + ( 0.602 0.000326 ) = 0.000188
V p =
B = 2 0.000188 = 0.0274
( 2.74% )
SOLUCIN:
Peso en gramos
S1 = 1, 4142
S12 = 2
S 22 = 8
46
S3 = 1,8257
S32 = 3, 3333
Ni
N i i
2
i
N i
j =
2
i
N j j
i =1
300
500
200
1,4142
2,8284
1,8257
2
8
3,3333
N = 1000
424,26
1414,2
365,14
600
4000
666,66
2203,6
5266,66
n=
13, 79 14
45,99 46
11,87 12
n = 72
( N )
i =1
0,1925
0,6418
0,1657
B2
250.000
D=
=
= 0, 0625
2
4N
4.000.000
ni = 71, 66i
= 71, 66
N D + N i
2
i =1
2
i
11. Una inspectora de control de calidad debe estimar la proporcin de circuitos integrados de
ordenador defectuosos que provienen de dos diferentes operaciones de ensamble. Ella
sabe que de entre los circuitos integrados que van a ser inspeccionados, 60% procede de
la operacin de ensamble A y 40% de la operacin de ensamble B. En una muestra
aleatoria de 100 circuitos integrados resulta que 20 provienen de la operacin A y 80 de la
operacin B. De entre los circuitos integrados muestreados de la operacin A, 2 son
defectuosos. De entre las piezas muestreadas de la operacin B, 16 son defectuosas.
a. Considerando nicamente la muestra aleatoria simple de 100 circuitos
integrados, estime la proporcin de los defectuosos en el lote, y establezca un
lmite para el error de estimacin.
b. Estratifique la muestra, despus de la seleccin, en circuitos integrados
provenientes de la operacin A y B, estime la proporcin de los defectuosos en
la poblacin, y fije un lmite para el error de estimacin.
c. Qu respuesta encuentra ms aceptable? Por qu?
SOLUCIN:
a. p =
18
pq
= 0,18 (18%) V ( p ) =
= 0, 001491 2 V ( p ) = 0, 0772
100
n 1
b. p st =
1
N
i =1
i =1
Ni pi =
1
V ( p st ) = 2
N
Ni
2
16
p i = 0, 60 + 0, 40 = 0,14
N
20
80
L
L
p i q i N i ni
N i2 p i q i
N
=
=
2
ni 1 N i
i =1
i =1 N ni 1
i =1
= ( 0, 60 )
2
i
( 7, 72% )
(14% )
2
N i p i q i
=
N ni 1
0,10 0,90
2 0, 20 0,80
+ ( 0, 40 )
= 0, 00203
19
79
2 V ( p st ) = 0, 0901
( 9, 01% )
47
S1 = 12
y2 = 13, 3
S 2 = 11
y3 = 26,1
S3 = 9
1
N
N y
i
i =1
1
N2
Ni2
i =1
3834
= 19,17 pedidos / semana
200
Si2 N i ni
= 6, 2965
ni N i
2 V ( y st ) = 5, 02 pedidos / semana
b.
Ni
2
i
N i i
N i
2
i
j =
N j j
N
i =1
100
70
30
N = 200
48
12
11
9
144
121
81
ni = 43, 52i
1200
770
270
14400
8470
2430
0,5357
0,3438
0,1205
2240
25300
23, 31 24
14,96 15
5, 24 6
n = 45
( N )
L
D=
B2 9
= = 2, 25
4 4
n=
i =1
= 43,52
N D + N i
2
i =1
2
i
13. De una ciudad con 350 casas, se sabe que 164 de ellas tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (en kilovatios-hora) se obtuvieron los
siguientes resultados:
Tipo Calefaccin N casas Media muestral Cuasivarianza muestral
Elctrica
24
972
202,396
No elctrica
36
463
96,721
a. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado en la
ciudad. D un lmite para el error de estimacin.
b. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado por las
casas que no tienen calefaccin elctrica. D un lmite para el error de
estimacin.
SOLUCIN:
a.
Ni
164
186
350
ni
24
36
Si2
yi
972
463
202,396
96,721
y st =
V ( y st ) =
Ni y i
1
N2
1
N
L
N y
i
i =1
Ni2
i =1
159.408
86.118
245.526
N i ni
Ni
0,854
0,806
Si2 N i ni
N
ni N i
193.699,13
74.925,32
268.624,45
2
i
245.526
= 701, 50
350
Si2 N i ni 268.624, 45
=
= 2,19
ni N i
3502
2 2,19 = 2,96
b.
y 2 = 463
V ( y2 ) =
49
3.1 Introduccin.
Si entre dos variables existe una fuerte relacin es posible utilizar la informacin auxiliar
que tengamos de una variable, como puede ser la media o el total poblacional, para estimar la
media o el total de la otra variable.
Notaremos por
Y Variable bajo estudio
X Variable que proporciona la informacin auxiliar
(x1 , y1 ),..., ( x n , y n )
A partir de los datos muestrales se puede estimar la relacin existente entre ambas
variables.
Pueden utilizarse distintos diseos de muestreo en la estimacin con informacin auxiliar.
Aqu suponemos que se emplea el muestreo aleatorio simple.
La estimacin con informacin auxiliar es importante cuando se pretende estimar el total sin
conocer el nmero de elementos de la poblacin pero s el valor total de la variable que
proporciona la informacin auxiliar.
Poe ejemplo, debido a que existe una fuerte relacin entre renta y ahorro, se puede estimar el
valor total de los ahorros de los individuos de una poblacin si se conoce el valor total de las
rentas de dichos individuos. As, si se sabe que por trmino medio el 10% de la renta se dedica
al ahorro y se conoce la renta total, el ahorro total se estima igual al 10% de la renta total.
Observemos que la estimacin del total de ahorro se ha llevado a cabo sin necesidad de
conocer el nmero de individuos de la poblacin, N.
50
y = rx )
Estimadores de regresin ( y = a + bx )
y = d + x)
Estos estimadores slo se deben utilizar si entre las dos variables existe una fuerte relacin
lineal positiva, rxy >
1
.
2
y
x
x = N x , obtenemos
R=
N Y Y
=
N X X
y = R x
y = R x
Por tanto, si se conocen los valores de la media y el total de la variable X , para estimar la
media y el total de Y slo hay que estimar el valor de R (que notaremos como R = r ):
y = r x
y = r x
Puesto que la razn R es el cociente entre las medias poblacionales, tomando una muestra
aleatoria simple:
( y1 , x1 ) ,..., ( yn , xn ) ,
medias muestrales:
ESTIMADOR DE LA RAZN:
VARIANZA ESTIMADA DE r :
1 n
yi
y n
i =1
r= =
=
x 1 n
xi
n i =1
y
i =1
n
x
i =1
1 S2 N n
1 n
2
V (r ) = 2 r
,
( yi rxi )2
S
=
r
x n N
n 1 i =1
51
( y = bx,
ESTIMADOR DE LA MEDIA:
y = r x
x x
VARIANZA ESTIMADA DE y :
S2 N n
V ( y ) = x2V (r ) = r
n N
y = r x
2 S2 N n
S r2
VARIANZA ESTIMADA DE y : V (y ) = x2V ( r ) = x2 r
=
N
N
n
(
)
x n N
n
Si
N n
= 1 y aproximando x por x se tiene
N
2 S2
V ( y ) x2 r
x n
N n
0,95 ,
N
N n
1 . (Vase ejercicio resuelto 4)
N
De la relacin x =
x
N
3840
calcular el tercero. (Vase ejemplo 3.1: = x =
= 5,12 ha / socio )
x N
750
52
Ejemplo 3.1
Mediante una tasacin previa se desea estimar la produccin media y la produccin total de
los 750 socios de una cooperativa agrcola. Se sabe que el total de superficie plantada es de
3840 hectreas. Se realiz un sorteo entre los socios para elegir a 20 de ellos a los que se les
pregunt por la superficie plantada y se les tas su produccin. Los resultados fueron:
Superficie Produccin
3,7
12
4,3
14
4,1
11
5
15
5,5
16
3,8
12
8
24
5,1
15
5,7
18
6
20
3
8
7
20
5,4
16
4,4
14
5,5
18
5
15
5,9
18
5,6
17
5
15
7,2
22
Estime la produccin media y total mediante los estimadores de razn y muestreo aleatorio
simple. Calcule sus respectivos lmites para el error de estimacin y comprelos.
Solucin
xi
yi
xi2
yi2
xi yi
3,7
4,3
4,1
5
5,5
3,8
8
5,1
5,7
6
3
7
12
14
11
15
16
12
24
15
18
20
8
20
13,69
144
44,4
18,49
196
60,2
16,81
121
45,1
25
225
75
30,25
256
88
14,44
144
45,6
64
576
192
26,01
225
76,5
32,49
324
102,6
36
400
120
64
24
49
400
140
53
5,4
4,4
5,5
5
5,9
5,6
5
7,2
105,2
TOTALES
16
14
18
15
18
17
15
22
320
29,16
256
86,4
19,36
196
61,6
30,25
324
99
25
225
75
34,81
324
106,2
31,36
289
95,2
25
225
75
51,84
484
158,4
581,96
5398
1770,2
i =1
= 105, 2
y
i =1
y=
1 n
320
yi =
= 16
n i =1
20
x
i =1
1 n
105, 2
xi =
= 5, 26
n i =1
20
1 n
xi x
n i =1
= 320
x=
sxy =
x = 3840 ha
N = 750 socios
sx2 =
s y2 =
2
i
= 581, 96
i =1
1 n
xi x
n i =1
1 n
yi y
n i =1
2
i
= 5398
x y
i =1
= 1770, 2
2
1 n 2
581,96
xi x =
5, 26 2 = 1, 4304
n i =1
20
2
1 n 2
5398
yi y =
16 2 = 13,9
n i =1
20
2
( 5, 26 16 ) = 4, 35
)( y y ) = 1n x y x y = 1770,
20
n
i =1
n 2 20
s x = 1, 4304 = 1,5057
n 1
19
S y2 =
n 2 20
s y = 13,9 = 14, 6316
n 1
19
(s , s )
x
y las
cuasidesviaciones tpicas ( S x , S y ) .
Los anteriores clculos que se han realizado a mano o con ayuda de una calculadora bsica se
simplifican notablemente si utilizamos una calculadora cientfica de uso comn. Estas
calculadoras nos proporcionan los valores de un grupo de funciones estadsticas de forma
inmediata:
n n = s x = desviacin tpica
s xy
sx s y
n 1 = S x = cuasidesviacin tpica
4,35
= 0, 9756 . Esto, junto con la
1,196 3, 728
54
razn. Por otra parte, dado el contexto, es lgico que la relacin pase por el origen (a 0 ha de
superficie le corresponde una produccin de 0 tm).
20
r=
y
i =1
20
x
i =1
320
= 3,042 tm/ha
105, 2
3840
= x =
= 5,12 ha / socio
x
750
20
1 20
1 20 2 2 20 2
2
y
+
r
x
2
r
xi yi
( yi rxi ) =
i
i
n 1 i =1
n 1 i =1
i =1
i =1
Sr2 N n
V (y ) =
= 0, 0344
n N
B = 2 V ( y ) = 0,37 tm/socio
2
2 S2 N n
2 Sr N n
V (y ) = x2 r
=
N
= 19326,75
x n N
n N
=0, 706
B = 2 V (y ) = 278,04 tm
B = 750 B = 750 0,37 = 277,5 tm (los dos procedimientos no coinciden por simples
y=
320
= 16 tm / socio
20
S 2 N n 14, 63 750 20
V y =
= 0, 712
n N
20 750
( )
B = 2 0, 712 = 1, 69 tm / socio
= Ny = 750
320
= 12000 tm
20
S2 N n
2 14,63 750 20
V ( ) = N 2
= 750
= 400539,47
n N
20 750
55
N r2
n= 2
r + ND
donde para estimar:
la razn:
D=
B 2 x2
4
la media:
D=
B2
4
el total:
D=
B2
4N 2
Comentarios:
Si x es desconcocido, x2 = x 2
Solucin
MEDIA: n =
TOTAL: n =
N r2
2
B
4
r2 + N
N r2
r2 + N
B2
4N 2
750 0, 706
= 42,6 43 socios
0, 252
0, 706 + 750
N r2
750 0, 706
=
= 37, 7 38 socios
2
B
2002
2
r +
0, 706 +
4N
4 750
56
s
b = xy2 =
sx
( y
i =1
y )( xi x )
( x x )
i =1
a = y bx
donde
s x2 =
1 n
1 n 2
2
x
x
=
xi x 2
(
)
i
n i =1
n i =1
s xy =
1 n
1 n
=
x
x
y
y
(
)(
)
i
xi yi x y
i
n i =1
n i =1
ESTIMADOR DE LA MEDIA:
yL = a + b x = y bx + b x = y + b ( x x )
x x
S2 N n
VARIANZA ESTIMADA DE yL : V ( yL ) = L
n N
S L2 =
1 n
yi ( y + b ( xi x ) )
n 2 i =1
2
n 2 s xy
n 2
s
s y (1 rxy2 )
=
y
2
n2
sx n 2
yL = N yL
, y ) .
VARIANZA ESTIMADA DE yL :
V ( yL ) = N 2V ( yL )
Ejemplo 3.3
Para un grupo de 1000 pequeos establecimientos se desea realizar un estudio sobre las ventas
diarias. Se tiene informacin de que, por trmino medio, el gasto en publicidad es de 5 euros.
Se elige al azar una muestra de 18 establecimientos y se toman datos de su gasto en publicidad
y ventas diarios. Los resultados son:
57
Gastos Ventas
3,7
120
4,3
140
4,1
135
5
150
5,5
160
3,8
120
8
160
5,1
150
5,7
125
6
130
0
80
7
150
5,4
150
4,4
120
5,5
140
5
150
5,9
150
6,6
170
Estime el total de ventas diarias y la media utilizando estimadores de regresin. Obtenga el
lmite para el error de estimacin.
Solucin
Notamos Y = " ventas diaria (euros)" ;
n = 18 establecimientos
N = 1000 establecimientos
x = 5
x = 5, 0556
y = 138,889
s y = 20,314 s 2y = 412,654
sxy = 27, 7284
La relacin entre las variables es fuerte: rxy = 0,8336 .
b=
s xy
s
2
x
27,7284
= 10,341
2,6814
S L2 =
n 2
s y (1 rxy2 ) = 141, 6
n2
B = 2 V ( yL ) = 5,56
58
S2 N n
V ( yL ) = L
= 7, 73
n N
B = N B = 1000 5,56 = 5560
N L2
L2 + ND
la media: D =
el total:
D=
B2
4
B2
4N 2
N L2
L2 + N
B
4N 2
1000 141, 6
= 361, 6 362 establecimientos.
1000 2
141, 6 + 1000
4 1000 2
(y =a+x
y = y + ( x x) a = y x = d
ESTIMADOR DE LA MEDIA:
yD = y + ( x x ) = x + d
d = yx
x x
S D2 N n
VARIANZA ESTIMADA DE yD : V ( yD ) =
n N
59
2
2
1 n
1 n
(
(
)
)
(
y
x
+
d
=
d i d ) , donde d i = y i xi , por tanto S D2 es la
i
i
n 1 i =1
n 1 i =1
cuasivarianza de los d i .
S D2 =
yD = N yD
VARIANZA ESTIMADA DE YD : V ( yD ) = N 2V ( yD )
Ejemplo 3.5
Para un grupo de 200 establecimientos se desea realizar un estudio sobre el gasto diario. Se
tiene informacin de que los ingresos medios diarios son de 500 euros. Se elige al azar una
muestra de 10 establecimientos y se toman datos de ingresos y gastos, obtenindose:
X=Ingresos Y=Gastos
470
405
650
585
710
650
300
240
475
410
505
435
610
550
380
320
540
480
520
460
Estime el gasto medio y el gasto total diario para los 200 establecimientos utilizando muestreo
aleatorio simple, estimadores de razn, regresin y diferencia. Obtenga el lmite para el error
de estimacin en cada caso.
Solucin
Y = "gasto diario (euros)"
Denotamos
"
X = "ingresos diarios (euros)
n = 10 establecimientos
N = 200 establecimientos
x = 500
y = 453,5
s x = 115, 797
s x2 = 13409
s y = 115,738
s 2y = 13395,3
60
S y2 = 14883,7
s xy = 13396,5
rxy2 = 0,99916 .
= y = 453,5
= Ny = 90700
) = S N n = 1413,94
V(
n N
ESTIMADORES DE RAZN
2
y
r=
y
= 0,879
x
Sr =
2
) = 75,20
B = 2 V(
x = 200 x = 100000
B = 200 B =15040,97
y = r x = 87900
y = r x = 439,5
n
1 n
1 n 2 2 n 2
2
y
rx
=
y
+
r
x
2
r
xi yi
(
)
i i n 1
i
i
n 1 i =1
i =1
i =1
i =1
S2 N n
V ( y ) = r
= 21, 63
n N
= 227, 717
B = 9,3
B = N B =1860
ESTIMADORES DE REGRESIN
s
13.396,5
b = xy2 =
= 0,99907
sx
13.409
yL = y + b ( x x ) = 437,515
n 2
S =
s y (1 rxy2 ) = 14,05
n2
S L2 N n
V ( yL ) =
= 1,33
n N
2
L
B = 2, 3104
yL = N yL = 87.503
B = NB = 462, 09
ESTIMADORES DE DIFERENCIA
d = 62,5
yD = x + d = 437,5
yD = N yD = 87500
1 n
S =
di d
n 1 i =1
2
D
S2 N n
V ( yD ) = D
= 1,1875
n N
= 12, 5
B = 2 V ( yD ) = 2,179
B = NB = 435,8899
N D2
D2 + ND
61
la media: D =
el total:
D=
B2
4
B2
4N 2
EJERCICIOS RESUELTOS
1. En una poblacin de 500 hogares, para la que es conocido que el gasto total general
durante un ao es de 15000000 , se quiere estimar el gasto total en alimentacin durante
un ao, para lo que se obtiene una muestra aleatoria simple de 4 hogares que proporciona
los siguientes valores anuales en :
Gasto en alimentacin 12500 15000 10000 17500
Gasto general
62
N = 500 n = 4 r =
y
i =1
n
x
i =1
550
= 0, 4955 y = r x = 0, 4955 150000 = 74325 cientos de
1110
y = 7432500
2
n
1 n
1 n 2 2 n 2
62, 2
S =
y
+
r
x
2
r
xi yi =
= 20, 73
( yi rxi ) =
i
i
n 1 i =1
n 1 i =1
3
i =1
i =1
2
r
S
V ( y ) = N ( N n) r = 1285, 4667
2 V ( y ) = 2267,568
n
y ( 72057, 432 ; 76592,568) en cientos de
Para expresarlo en hay que multiplicarlo por cien.
2. Un trabajador social quiere estimar la ratio personas/habitacin en un determinado barrio.
El trabajador social selecciona una muestra aleatoria simple de 25 viviendas de las 275 del
barrio. Sea x el nmero de personas en cada vivienda e y el nmero de habitaciones por
vivienda. A partir de los datos siguientes:
x = 9,1;
25
xi2 = 2240;
y = 2, 6;
i =1
25
yi2 = 169;
i =1
25
x y
i =1
= 522
N = 275 n = 25 r =
x
i =1
n
i =1
2
S r2 =
2
x
= 3,5 pers. / hab. y2 y = 2, 62 = 6, 76
y
n
1 n
1 n 2 2 n 2
ry
=
x
+
r
y
2
r
xi yi = 27,34375
( i i)
i
i
n 1 i =1
n 1 i =1
i =1
i =1
V (r ) =
1 ( N n) S r2
= 0,1471
y2 N
n
2 V (r ) = 0, 767
3. Se desea estimar el agua utilizada en la presente campaa por una comunidad de riego
constituida por 250 parcelas. Se seleccionan al azar 10 parcelas cuyo tamao y metros
cbicos utilizados en riego aparecen en la siguiente tabla
m3
600
1800
750
900
1100
1400
950
700
1000
720
Hectreas
50
150
60
70
100
120
80
60
90
60
63
Estime la media de m3 /hectrea que utiliza la comunidad de regantes y la cota del error de
dicha estimacin.
SOLUCIN:
Y = consumo de m3 de agua,
xi
xi2
yi
50
150
60
70
100
120
80
60
90
60
840
600
1800
750
900
1100
1400
950
700
1000
720
9920
2500
22500
3600
4900
10000
14400
6400
3600
8100
3600
79600
yi2
360000
3240000
562500
810000
1210000
1960000
902500
490000
1000000
518400
11053400
xi yi
30000
270000
45000
63000
110000
168000
76000
42000
90000
43200
937200
r=
y
i =1
n
x
i =1
9920
= 11'81 m3 / hectarea
840
n
1 n
1 n 2 2 n 2
2
y
rx
=
y
+
r
x
2
r
xi yi =
(
)
i
i
i
i
n 1 i =1
n 1 i =1
i =1
i =1
1
= (11053400 + 11102297 '56 22136664 ) = 2114 '84
9
S r2 =
840
= 84
10
1 N n S r2
1 240 2114 '84
V (r ) = 2
= 2
= 0 '02877
x N n 84 250 10
x = x =
2 V (r ) = 0 '3392
4. Se desea estimar el consumo mensual de una ciudad. Se sabe que los ingresos en dicha
ciudad, va declaracin de la renta, ascienden a 1502530 euros mensuales. Se realiza una
encuesta entre 12 hogares elegidos al azar y los resultados de renta y consumo se recogen
en esta tabla.
Renta Consumo
1702,44
1204
1339,56
1000
981,06
800
2537,04
1800
64
1519,85
1200
3080,19
2600
1502,53
1080
1702,87
1240
1402,36
1000
1803,04
1400
2053,46
1484
3005,06
2000
Estime el consumo total mensual para todos los hogares de la ciudad mediante el
estimador de razn. Obtenga el lmite para el error de estimacin.
SOLUCIN:
Denotemos por
Y = consumo mensual
X = ingresos mensuales
12
y
i =1
= 16808 euros
12
x
i =1
= 22629, 46 euros
s xy
sx s y
= 0,9677 .
Esto junto con la informacin auxiliar nos permite utilizar muestreo con informacin
auxiliar, en concreto utilizaremos estimadores de razn.
12
r =
i =1
12
yi
xi
i =1
= 0, 7 42 7
y = r x = 1 1 1 6 0 0 2 , 0 7
2 S N n
Para calcular V (Y ) = x2 r
tenemos en cuenta que:
x n N
2
12
x < ( 5% )
i =1
N n
1
N
x = x = 1885, 79
Sr =
2
12
1 12
1 12 2 2 12 2
2
y
rx
=
y
+
r
x
2
r
xi yi
( i i ) n 1
i
i
n 1 i =1
i =1
i =1
i =1
V (Y ) = 871825002, 67
= 16479, 7
B = 2 V (Y ) = 59053,37
5. Las diferencias entre ingresos y gastos, en 5 de las 250 oficinas que tiene abiertas una
agencia de seguros, en el presente mes, han sido (en euros)
65
570
721
650
650
569
Este mes el gasto medio para el conjunto de todas las oficinas ha sido 12764 euros, estime
el total de ingresos y el lmite para el error de estimacin.
SOLUCIN:
N=250, n=5, x = 12764 , X=gastos, Y=ingresos
(con las funciones del modo SD de la calculadora ) :
yD = x + d = 13396
d = 632
S D2 = 4095,5
yD = N yD = 3349000
2
S D2
2 N n SD
V ( yD ) = N
= N ( N n)
= 50169875 2
N n
n
2 V ( yD ) = 14166,14
6. Una cadena de electrodomsticos est interesada en estimar el total de ganancias por las
ventas de televisores al final de un periodo de tres meses. Se tienen cifras del total de
ganancias de todas las tiendas de la cadena para ese mismo periodo de tres meses
correspondiente al ao anterior, ese total es de 128200 . Una muestra aleatoria simple de
5 tiendas es seleccionada de las 123 tiendas de la cadena resultando los datos de la
siguiente tabla:
Oficinas Datos de 3 meses del ao anterior Datos de 3 meses del ao actual
1
550
610
2
720
780
3
1500
1600
4
1020
1030
5
620
600
Usando un estimador de razn, estime el total de ganancias con un intervalo de confianza.
SOLUCIN:
N=123, n=5, x = 128200 , X=ganancias del ao anterior, Y=ganancias del ao actual
(con las funciones del modo SD de la calculadora ) :
5
x = 882
i =1
= 4410
yi = 4620
y = 924
i =1
x
i =1
y
i =1
xi yi
335500
561600
2400000
1050600
372000
= 4495700
2
i
2
i
= 4961400
r=
y
i =1
n
x
i =1
66
y
= 1, 047619
x
y = r x = 134304, 76
x y
i =1
Sr =
2
5
1 5
1 5 2 2 5 2
2
y
rx
=
y
+
r
x
2
r
xi yi
(
)
i i n 1
i
i
n 1 i =1
i =1
i =1
i =1
= 1640, 25
= 4719700
S
V ( y ) = N ( N n ) r = 4761314, 071
n
2 V ( y ) = 4364, 09
y (129940, 67 , 138668,85 )
x = 331, 6
xi2 = 587146
i =1
y = 355, 6
y
i =1
i =1
= 1778
xi yi
49712
171200
207680
71484
127413
xi = 1658
y
i =1
2
i
= 671034
r=
y
i =1
5
x
i =1
Sr =
2
D=
y
= = 1, 072376
x
x y
i =1
= 627489
5
1 5
1 5 2 2 5 2
2
y
rx
=
y
+
r
x
2
r
xi yi
(
)
i i n ' 1
i
i
n ' 1 i =1
i =1
i =1
i =1
= 109, 4775
2
B2
= 4,8947 r = S r2 = 109, 4775
2
4N
n=
N r2
= 21,3 22
ND + r2
67
4. Muestreo sistemtico.
4.1 Seleccin de una muestra sistemtica. Usos. Ventajas.
4.2 Estimacin de la media, proporcin y total poblacionales.
4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas, aleatorias
y peridicas.
4.4 Determinacin del tamao muestral.
N
:
n
N
.
n
N
entero. Entonces se obtienen exactamente n observaciones.
n
N
N
no es entero. Por ejemplo si N = 103 y n = 5 , entonces
= 20,6 y tomamos
n
n
k = 20 . Segn el punto inicial nos podemos encontrar con:
68
Usos:
Este tipo de muestreo es muy utilizado por los planes de muestreo para el control de calidad
dentro del proceso de fabricacin, los auditores cuando se enfrentan a largas listas de apuntes
para comprobar y los investigadores de mercados cuando se enfrentan a personas en
movimiento.
= ysy =
1 n
yi +( j 1) k
n j =1
69
S2 N n
(
)
V y sy =
n N
VARIANZA ESTIMADA DE y sy :
Comentarios.
-
N n
1.
N
Como puede observarse, la varianza del estimador de la media se estima igual que en el
muestreo aleatorio simple (vase 4.3 Comparacin con el muestreo aleatorio simple). Aunque
las varianzas de los estimadores no son realmente iguales, stas son:
V (y) =
2 N n
n N 1
V ( y sy ) =
2
n
[1 + (n 1) ]
= Ny sy
VARIANZA ESTIMADA DE :
2
2
2 S N n
V ( ) = N V ( y sy ) = N
n N
Ejemplo 4.1
Los funcionarios de un museo estn interesados en el nmero total de personas que visitaron
el lugar durante un periodo de 180 das cuando una costosa coleccin de antigedades estuvo
en exhibicin. Puesto que el control de visitantes en el museo cada da es muy costoso, los
funcionarios decidieron obtener estos datos cada diez das. La informacin de esta muestra
sistemtica de 1 en 10 se resume en esta tabla
173 290
18
yi = 4868
i =1
18
yi2 = 1321450
i =1
Use estos datos para estimar el nmero total de personas que visitaron el museo durante el
periodo especificado y el lmite para el error de estimacin.
70
Solucin
= Nysy = 180
N = 180
4868
= 48680 visitantes
18
4868 )
(
1321450
n
= 289, 79
S2 =
n 1
S2 N - n
V ( ) = N 2
= 469461,18
n N
B = 1370,34
Como en el muestreo aleatorio simple, las propiedades del estimador de la proporcin son
anlogas a las propiedades de la media muestral:
1 n
yi+( j 1) k
n j =1
V ( p sy ) =
VARIANZA ESTIMADA DE p sy :
, yi = 0, 1
p sy q sy N n
n 1 N
Notemos, de nuevo, que las varianzas estimadas son iguales a las del muestreo aleatorio
simple.
Ejemplo 4.2
La Guardia Civil de Trfico est interesada en la proporcin de automovilistas que llevan el
permiso de conducir. Se instala un puesto de control en una carretera nacional y se detiene un
conductor de cada siete. Use los datos de la tabla adjunta para estimar la proporcin de
conductores que portan su licencia. Establezca un lmite para el error de estimacin. Suponga
que 2800 autos pasan por el puesto de verificacin durante el periodo de muestreo.
Automvil Respuesta
1
1
8
1
15
0
2794
1
400
yi = 324
i =1
Solucin
p sy = y sy =
324
= 0,81
400
71
= 0,000330612
n 1 N
400 1 2800
B = 0, 0364
2 N n
n N 1
V ( y sy ) =
2
n
[1 + (n 1) ]
N n
1 y 0 , pero en otros casos no.
N 1
A. Poblacin ordenada ( 0)
Una poblacin es ordenada cuando los elementos que la constituyen estn ordenados
de acuerdo a los valores, crecientes o decrecientes, de una determinada caracterstica.
En este caso es preferible el uso del muestreo sistemtico, ya que la muestra se
extiende uniformemente a lo largo de toda la poblacin:
V ( y sy ) V ( y )
Por ejemplo, en una lista de cuentas por cobrar que estn ordenadas de mayor a menor
cantidad, las estimaciones de una muestra sistemtica tendran en general una varianza
menor que las de una muestra aleatoria simple (es posible que sta ltima contenga
solo cantidades grandes o cantidades pequeas).
Al utilizar las varianzas estimadas de los estimadores del muestreo aleatorio simple en
el muestreo sistemtico conseguimos una estimacin conservadora del error (mayor
que el error real que cometemos en el muestreo sistemtico).
72
B. Poblacin aleatoria ( 0)
Se dice que una poblacin es aleatoria cuando sus elementos estn ordenados al azar.
En este caso es indiferente el uso del muestreo aleatorio simple y el muestreo
sistemtico ya que
V ( y sy ) V ( y ) .
Por ejemplo, en una lista de estudiantes por orden alfabtico, la estimacin de sus
calificaciones sera similar con ambos muestreos ya que las calificaciones no dependen
del apellido del estudiante.
C. Poblacin peridica ( 0)
Una poblacin es peridica cuando los valores de la variable objeto de estudio tienen
una variacin cclica. En este caso es preferible el muestreo aleatorio simple dado que
V ( y sy ) > V ( y ) .
Por ejemplo:
a. Supongamos que tenemos una lista en la que los nombres de mujeres y
hombres se alternan. Una muestra sistemtica con k par proporcionara solo
una lista de mujeres o de hombres.
b. Ventas diarias de un supermercado a partir de una muestra sistemtica con
k = 7.
Para evitar este problema, el investigador puede cambiar varias veces el punto de
inicio aleatorio. Esto tiene el efecto de mezclar los elementos de la poblacin y
comportarse como una poblacin aleatoria, en cuyo caso el uso de las expresiones del
muestreo aleatorio simple en el muestreo sistemtico estara justificado.
73
Tamao muestral requerido para estimar y con un lmite B para el error de estimacin
B2
4 para estimar la media
con D =
2
B para estimar el total
4 N 2
N 2
n=
( N 1) D + 2
Tamao muestral requerido para estimar p y con un lmite B para el error de estimacin
n=
B2
4 para estimar p
con D =
2
B para estimar el total
4 N 2
Npq
(N - 1)D + pq
Solucin
p = 0,81
n=
q = 1 p = 0,19
Npq
5000 0,81 (1 0,81)
=
= 1176,97 1177 automviles
2
B
0, 02 2
( N 1)
+ pq (5000 1)
+ ( 0,81 (1 0,81) )
4
4
Si tomramos k=5 n =
N
= 4, 25
n
5000
5000
= 1000 . Tomando k=4 n =
= 1250 1177 .
5
4
EJERCICIOS RESUELTOS
1. La gerencia de una compaa privada con 2000 empleados est interesada en estimar la
proporcin de empleados que estn a favor de una nueva poltica de inversin. Una muestra
sistemtica de 1 en 10 es obtenida de los empleados que salen del edificio al final de un da
de trabajo (las respuestas a favor se han representado como 1)
74
Empleado Respuesta
muestreado
3
1
13
0
23
1
1993
1
200
y
i =1
= 110
Se quiere volver a repetir el anterior estudio pero con un error de estimacin inferior al 5%
(considerando la muestra anterior como una muestra previa para estimar los parmetros
necesarios). Qu tipo de muestra sistemtica deber obtenerse? (indique n y k).
SOLUCIN
110
0, 052
= 0,55 q = 1 p = 0, 45 D =
= 0, 000625
200
4
Npq
N
n=
= 330, 7 331
k = 6, 04 k = 6
( N 1) D + pq
n
N = 2000
p=
2. Un auditor se enfrenta a una larga lista de 1000 cuentas por cobrar de una empresa. El
valor de cada una de estas cuentas no suele superar los 21000. El auditor quiere estimar
el valor total de las deudas por cobrar con un error inferior a 1000000 y con una
confianza del 95%. Para ello decide tomar una muestra sistemtica de 1 en k . Determine
el valor de k.
SOLUCIN
21000 2
1000000 2
=
27562500
D
=
= 250000
42
4 1000 2
N 2
N
n=
= 99,39 100 k = = 10
2
( N 1) D +
n
N = 1000 R = 21000 2
3. La tabla anexa muestra el nmero de nacimientos y la tasa de natalidad por cada 1000
individuos para Estados Unidos durante seis aos seleccionados sistemticamente.
Ao Nac.Masculinos Nac.Femeninos Total de Nac. Natalidad
1955 2073719
1973576
4047295
26,0
1960 2179708
2078142
4257850
23,7
1965 1927054
1833304
3760358
19,4
1970 1915378
1816008
3731386
18,4
1975 1613135
1531063
3144198
14,6
1980 1852616
1759642
3612258
15,9
Estime el nmero medio de varones nacidos por ao para el periodo 1955-1980, y
establezca un lmite para el error de estimacin.
SOLUCIN
Desde 1955 hasta 1980, ambos inclusive, hay 26 aos. N = 26 .
75
= ysy =
1 n
1
yi = 11.561.610 = 1.926.935
6
n i =1
S 2 = 37913412871,20
S2 N n
V ( ysy ) =
= 4860693957,85
n N
B = 139437,35
4. La seccin de control de calidad de una empresa usa el muestreo sistemtico para estimar
la cantidad media de llenado en latas de 33cl que salen de una lnea de produccin. Los
datos de la tabla adjunta representan una muestra sistemtica 1 en 300 de una produccin
diaria de 1800 latas.
Cantidad de llenado en cl
33 32,5 33,5 33 32 31
Determine el tamao de la muestra y k para estimar el contenido medio de las latas con un
error de estimacin inferior a 0,42cl, considerando la muestra anterior como una muestra
previa para estimar los parmetros necesarios.
SOLUCIN:
N=1800
n=6
D=
B2
= 0, 0441
4
n=
N 2
= 17,97 18
( N 1) D + 2
k=
2 = Sn2'1
1800
= 100
18
SOLUCIN:
N=650
B = 0, 05
n=
76
n=65
D=
p=
47
= 0, 7231
65
q = 1 0, 7231 = 0, 2769
B2
= 0, 000625
4
Npq
= 214,8 215
( N 1) D + pq
650
= 3, 02
215
k =3
aulas = conglomerados)
n = conglomerados en la muestra.
77
m = mi = elementos en la muestra
i =1
1 N
mi = tamao medio de los conglomerados de la poblacin (con frecuencia es desconocido)
N i =1
1 n
m = mi = tamao medio de los conglomerados de la muestra (se utililza para estimar M ).
n i =1
M=
1 n
= y = yi =
m i =1
y
i =1
n
m
i =1
V ( y) =
1 N n S c2
2
N n
M
donde Sc2 =
1 n
yi ymi
n 1 i =1
sesgo
desaparece
cuando
los
tamaos
de
los
conglomerados
son
iguales
( m1 = m2 = ... = mN ).
Notas:
La
expresin
de
V ( y) =
1 N n S c2
2
N n
M
no
se
suele
simplificar
como
N ( N n ) Sc2
V ( y) =
para poder calcularla fcilmente cuando N y M sean desconocidos.
M2
n
A veces N no se conoce debido a su gran tamao y
N n
se aproxima por 1. Si M es
N
78
p=y=
a
i =1
n
m
i =1
= M y
y la varianza estimada del mismo
S2 M 2 S2
V ( ) = M 2 V ( y ) = N ( N n) c 2 c
n
m n
(sea cual sea el valor de M, ste no afecta a la varianza ni al error del estimador, aunque s al
valor del estimador del total)
N n
se aproxima por 1 debido al gran tamao de N, la varianza del
N
M 2 Sc2
.
2
n
m
1 n
yi , es el promedio de los totales de los conglomerados de la muestra y un estimador
n i =1
insesgado del promedio de los N totales de los conglomerados de la poblacin. Por el mismo
razonamiento empleado en el muestreo aleatorio simple, N y t es un estimador insesgado de la
suma de los totales de todos los conglomerados, o equivalentemente del total poblacional .
79
En resumen
t = N y t
2
S
V ( t ) = N 2 V ( y t ) = N ( N n) t
n
N n St2
V ( yt ) =
N n
donde
St2 =
1 n
yi y t
n 1 i =1
yt =
1 n
yi
n i =1
Si existe una gran variacin entre los tamaos de los conglomerados y adems los tamaos
estn altamente correlacionados con los totales de los conglomerados, la varianza de t = N y t
es generalmente mayor que la varianza de = M y . Esto es debido a que el estimador
Ejemplo 5.1 En una ciudad se quiere estimar la proporcin de hogares interesados en contratar
el sistema de televisin digital, para lo cual se considera la ciudad dividida en 200 manzanas de
viviendas. Se extrae una muestra piloto de 5 manzanas y se interroga a cada familia acerca de
si estara interesada en contratar la televisin digital. Los datos de la encuesta se encuentran en
la tabla:
Manzana N hogares en la manzana N hogares interesados
1
8
2
2
7
2
3
9
3
4
6
3
5
5
3
a) Estime la proporcin de hogares interesados en contratar el sistema de televisin
digital. Calcule el lmite para el error de estimacin.
b) Con un intervalo de confianza estime el nmero de hogares interesados en
contratar dicho sistema.
c) Responda al apartado b) suponiendo que el nmero de hogares en la ciudad es
1500.
80
SOLUCIN
Aunque en un caso de variables dicotmicas como ste se suele usar en los textos la
notacin ai en lugar de yi , utilizaremos esta ltima para unificar la notacin a emplear en el
muestreo por conglomerados, tanto para variables numricas como dicotmicas.
a)
N=200
mi
yi
mi2
yi2
mi yi
8
7
9
6
5
35
2
2
3
3
3
13
64
49
81
36
25
255
4
4
9
9
9
35
16
14
27
18
15
90
n=5
n
p=y=
y
i =1
n
m
i =1
Sc2 =
13
= 0,3714
35
p = 37,14%
1 n
yi ymi
n 1 i =1
n
n
2
1 n 2
3,3222
y
2
y
y
m
+
y
mi2 =
= 0,8306
i
i i
n 1 i =1
4
i =1
i =1
1 n
35
mi =
= 7 hogares / manzana
n i =1
5
V ( y) =
1 N n S c2
= 0, 003305
2
m N n
yt =
b)
1 n
13
yi = = 2, 6
n i =1
5
(y y )
n
S =
2
t
i =1
n 1
2 V ( y ) = 0,115
11,5%
t = N y t = 520
2
1 n
yi
n i =1
= i =1
= 0, 3
n 1
n
2
i
N ( N n) St2
V ( t ) =
= 2.340
n
2 V ( t ) = 96, 75
c)
= M y = 557,14
M=
1500
= 7,5
200
V ( y) =
1 N n Sc2
= 0, 0028795
2
N n
M
V ( ) = M 2 V ( y ) = 6478,8
2 V ( ) = 160,98
( 396,16 ; 718,12 )
81
El lmite para el error de estimacin es ms pequeo en b) que en c), debido a que los tamaos
de los conglomerados no estn correlacionados con los totales de los conglomerados
( rmy2 = 0, 08 ). En otras palabras, los tamaos de los conglomerados proporcionan poca
informacin sobre los totales de los conglomerados.
1 n
yi ymi
n 1 i =1
B2
para la estimacin del total.
4N 2
N t2
ND + t2
B2
1 n
2
2
y
se
estima
mediante
S
=
yi y t
t
t
4N 2
n 1 i =1
Ejemplo 5.2 Suponiendo que los datos del ejemplo 5.1 representan una muestra previa, cmo
debe tomarse una nueva muestra para estimar la proporcin poblacional del apartado a) con un
lmite para el error de estimacin del 1%.
SOLUCIN
S = 0,8306
2
c
1 n
35
M m = mi =
=7
n i =1
5
n=
82
N c2
= 154, 4 155
ND + c2
B2 M
0, 012 7 2
D=
=
= 0, 001225
4
4
EJERCICIOS RESUELTOS
1. Con motivo del cuarto centenario del Quijote, el Ministerio de Cultura desea estimar el
nmero de libros comprados cada mes en una localidad. Se selecciona una localidad con
6200 hogares agrupados en 700 manzanas de viviendas. Se tiene una encuesta piloto en la
cual se seleccion una muestra de 4 manzanas y se entrevistaron a todas las familias,
obtenindose los siguientes resultados:
manzana
1
2
3
4
Determine, usando los datos
muestra si se quiere estimar los libros comprados cada mes con un error de estimacin
inferior a 140 unidades.
SOLUCIN
mi
yi
10
8
11
7
36
13
9
15
8
45
mi2
yi2 mi yi
100 169
130
64 81
72
121 225
165
49 64
56
334 539
423
n
M = 6200 N = 700
y=
y
i =1
n
m
i =1
c2 Sc2 =
1 n
yi ymi
n 1 i =1
n=
2.
= 1, 25 D =
B2
= 0, 01
4N 2
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi = 1,125
i
i
n 1 i =1
i =1
i =1
N c2
= 96,92 97
ND + c2
83
yi
51
62
49
73
101
336
42
53
40
45
63
243
mi2
2601
3844
2401
5329
10201
24376
yi2
1764
2809
1600
2025
3969
12167
mi yi
2142
3286
1960
3285
6363
17036
p=
y
i =1
n
m
i =1
Sc2 =
1 n
yi pmi
n 1 i =1
243
= 0, 7232 p = 72,32%
336
n
2 n
1 n 2
2
p
y
m
+
p
mi2 = 68, 7
i
i i
n 1 i =1
i =1
i =1
336
M m =
= 4515,84
5
1 N n Sc2
V ( p) = 2
= 0, 00278
N
n
M
b)
2
2 V ( p) = 0,1054 10,54%
B2 M
0, 052 4515,84
D=
=
= 2,8224
4
4
S
2
c
2
c
N c2
n=
= 17, 06 18
ND + c2
3. Un socilogo quiere estimar el ingreso medio por persona en cierta ciudad pequea donde
no existe una lista disponible de adultos residentes. Por esta razn para el diseo de la
encuesta utiliza muestreo por conglomerados. Se divide la ciudad en bloques rectangulares
y el socilogo decide que cada bloque rectangular va a ser considerado como un
conglomerado. Los conglomerados son numerados del 1 al 415. El investigador tiene
84
8
12
4
5
6
6
7
5
8
3
2
6
5
10
9
3
6
5
5
4
6
8
7
3
8
151 residentes
a) Estime el ingreso medio por persona en la ciudad y establezca un lmite para el error de
estimacin.
b) Estime el ingreso total de todos los residentes de la ciudad y el lmite para el error de
estimacin, suponiendo que M es desconocido.
c) Suponiendo que existen 2500 residentes en la ciudad, estime el ingreso total de todos los
residentes de la ciudad mediante un intervalo de confianza.
NOTA: Repetir este ejemplo con todos los mi iguales (por ejemplo, mi = 6 i ,
supongamos conocido M = 6 415 = 2490 ) y estime el total por los dos mtodos
85
d) Tomando los anteriores datos como una muestra previa, cmo debe tomarse la muestra en
una encuesta futura para estimar el ingreso promedio por persona con un lmite para el
error de estimacin de 500.
SOLUCIN:
a) (este ejemplo no se puede resolver con una calculadora de 10 dgitos de forma exacta
por la dificultad de trabajar con cantidades muy grandes)
n=25
N=415
n
=y=
y
i =1
n
m
i =1
1329000
= 8801,32 / residente
151
i =1
i =1
2
i
= 82 + ... = 1047
Sc2 =
1 n
yi ymi
n 1 i =1
n
n
2
1 n 2
15227502247
y
2
y
y
m
+
y
mi2 =
= 634501213, 40
i
i i
n 1 i =1
24
i =1
i =1
1 n
151
mi =
= 6, 04 residente / bloque
n i =1
25
V ( y) =
1 N n Sc2
= 653785,19
2
N n
M
2 V ( y ) = 1.617,14
b)
yt =
1 n
1329000
yi =
= 53160 / bloque
n i =1
25
2
1 n
1
y yi
82039000000 (1329000) 2
n i =1
25
= i =1
=
=
n 1
24
n
St2 =
1 n
yi y t
n 1 i =1
2
i
11389360000
= 474556666, 6
24
2
S
V ( t ) = N ( N n) t = 3072279860000
n
86
t = N y t = 22061400
2 V ( t ) = 3505584, 04
c)
N = 415
n = 25
M=
Sc2 = 634501213, 40
2500
= 6, 0241
415
V ( y) =
= M y = 22003311, 26
1 N n S c2
= 657240,9482
2
N n
M
V ( ) = M 2 V ( y ) = 4107755926250
2 V ( ) = 4053519,92
(17949791,34 ; 26056831,18 )
Como puede observarse el lmite para el error de estimacin es ms pequeo en b) que en
c) debido a que los tamaos de los conglomerados no estn altamente correlacionados con
los totales de los conglomerados en este ejemplo ( rmy2 = 0, 0919 ). En otras palabras, los
tamaos de los conglomerados proporcionan poca informacin referente a los totales de
los conglomerados.
2
d)
S = 634501213, 40
2
c
n=
B2 M
5002 6, 04 2
D=
=
= 2280100
4
4
N c2
= 166,58 167
ND + c2
4. Una empresa de trabajo temporal quiere investigar las necesidades de empleo de las
empresas de un pueblo. Para ello decide seleccionar una muestra de 10 de las 85 inscritas
en el registro mercantil. El nmero de bajas en el ltimo ao, el nmero de empleados y la
respuesta de cada empresa sobre si utilizara los servicios de la empresa de trabajo
temporal fueron los siguientes:
Empresa Bajas Empleados Respuesta
1
1
7
Si
2
2
15
No
3
9
85
Si
4
0
3
No
5
2
12
No
6
0
8
No
7
1
21
Si
8
0
4
No
9
4
35
No
10
6
92
Si
(a) Estime el nmero de bajas en el ltimo ao en las empresas del pueblo y el lmite del
error de estimacin.
(b) Estime la proporcin de empresas que usaran los servicios ofertados y el lmite del
error de estimacin.
87
SOLUCIN:
a) Se trata de un muestreo por conglomerados (cada empresa es un conglomerado) donde
no se conoce el nmero total de empleados para toda la poblacin, por tanto para estimar
el total consideraremos un muestreo aleatorio simple tomando como elementos muestrales
las empresas.
(y y )
yi
1
2
9
0
2
0
1
0
4
6
25
2,25
0,25
42,25
6,25
0,25
6,25
2,25
6,25
2,25
12,25
80,5
t = 85 2,5 = 212,5 bajas
25
= 2,5 bajas / empresa
10
80,5
85 10 8,94
2
St =
= 8,94 V ( y t ) =
= 0, 7892157 V ( t ) = 852 V ( y t ) = 5702, 08
9
85 10
yt =
4
= 0, 40 (40%)
10
85 10 0, 4 0, 6
= 0, 02353
85
10 1
5. Se disea una encuesta econmica para estimar la cantidad media gastada en servicios por
hogar de una ciudad formada por 3600 hogares. Se selecciona una muestra aleatoria de 3
barrios de la ciudad de un total de 60. Los entrevistadores obtienen el gasto en servicios
de cada hogar en los barrios seleccionados; los gastos totales se muestran en esta tabla:
Barrio N hogares Cantidad total gastada en servicios ()
1
55
2210
2
60
2390
3
63
2430
Estime la cantidad media de gastos en servicios por hogar en la ciudad y el lmite para el
error de estimacin.
88
SOLUCIN:
mi yi
121550
143400
153090
n
m y
i =1
N = 60
n
n=3
M=
mi = 178
3600
= 60
60
mi2 = 10594
i =1
= 418040
yi = 7030
i =1
i =1
i =1
2
i
= 16501100
y==
y
i =1
n
m
i =1
Sc =
2
1 n
yi ymi
n 1 i =1
V ( y) =
= 39, 49
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 0, 23
2
N n
M
= 2612,04
2 V ( y ) = 0,96
6. En un proceso de control del volumen envasado por una fbrica de bebidas se eligen 3 de
los 40 paquetes envasados en una hora, cada uno de los cuales contiene 4 envases, y se
mide el volumen que cada envase contiene. Las observaciones se presentan en la tabla
adjunta:
Paquete n Volumen envasado en cl
1
33,5 32,5 31 34
2
32,5 32
33 32,5
3
30,5 33
33 33,5
Estime el volumen medio de los envases y la cota del error de estimacin.
SOLUCIN:
N=40, n=3,
mi
4
4
4
yi
131
130
130
mi yi
524
520
520
3
m y
i
= 1564
i =1
mi = 12
i =1
y t = 130,33
yi = 391
i =1
2
i
i =1
3
y
i =1
2
i
= 48
= 50961
89
y==
y
i =1
3
m
i =1
Sc =
yt
= 32,5833 cl
m
1 3
yi ymi
n 1 i =1
V ( y) =
3
3
2
1 3 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 0, 006423
2
N
n
M
= 0,3333
2 V ( y ) = 0,1603 cl
7. Un fabricante de sierras quiere estimar el coste medio de reparacin mensual para las
sierras que ha vendido a ciertas industrias. El fabricante no puede obtener un coste de
reparacin para cada sierra, pero puede obtener la cantidad total gastada en reparacin y el
nmero de sierras que tiene cada industria. Entonces decide usar muestreo por
conglomerados, con cada industria como un conglomerado. El fabricante selecciona una
muestra aleatoria simple de 5 de 100 industrias a las que da servicio. Los datos sobre coste
total de reparaciones por industria y el nmero de sierras son:
Industria N sierras Costo total de reparacin
para el mes pasado ()
1
3
50
2
7
110
3
11
230
4
9
140
5
2
60
Estime el coste medio de reparacin por sierra para el mes pasado y el lmite para el error
de estimacin.
SOLUCIN: N=100
n=5
mi yi
150
770
2530
1260
120
n
m y
i =1
= 4830
M = m = 6, 4
m
i =1
y t = 118
90
= 32
yi = 590
i =1
2
i
i =1
n
y
i =1
2
i
= 264
= 90700
y==
i =1
5
yt
= 18, 4375
m
i =1
Sc =
1 n
yi ymi
n 1 i =1
V ( y) =
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 2, 7116
2
N
n
M
= 584, 57
2 V ( y ) = 3, 2934
n=5
mi yi
877200
738270
399000
1514700
651832
n
m y
i =1
= 4181002
M = m = 1260, 2
m
i =1
y t = 638, 6
= 6301
yi = 3193
i =1
2
i
i =1
n
y
i =1
2
i
= 8270161
= 2183195
91
p==
y
i =1
5
m
i =1
Sc =
2
yt
= 0,506745
m
( 50, 67% )
1 n
yi ymi
n 1 i =1
V ( p) =
92
n
n
2
1 n 2
2
y
+
y
m
2
y
mi yi
i
i
n 1 i =1
i =1
i =1
1 N n Sc2
= 0, 00216573
2
N
n
M
2 V ( y ) = 0, 0930748
= 17372,505
( 9,31% )
RELACIN DE EJERCICIOS
1. Muestreo Aleatorio Simple
1. Un dentista est interesado en la efectividad de una nueva pasta dental. Un grupo de 1.000
nios de escuela particip en el estudio. Los registros de un estudio anterior mostraron que
haba un promedio de 2,2 caries cada seis meses para el grupo. Despus de un ao de
iniciado el estudio, el dentista muestre 10 nios para determinar cunto haban
progresado con la nueva pasta dental. Usando los datos de la siguiente tabla:
Nmero de caries
en seis meses
1
0
2
4
3
2
4
3
5
2
6
0
7
3
8
4
9
1
10
1
Se puede decir que la incidencia media de las caries ha disminuido?
Nio
93
Por menor
n1 = 70
94
y1 = 520 S1 = 210
n2 = 30
y 2 = 280 S2 = 90
Estime el valor medio de las facturas de la empresa, y fije un lmite para el error de
estimacin.
Solucin:
154,3
411,8
Desviacin tpica
87,3
219,9
3. Una universidad tiene 152 profesores ayudantes, 127 profesores asociados y 208
profesores titulares. Una reportera del peridico de los estudiantes quiere averiguar si los
profesores estn realmente en sus despachos durante las horas de tutoras. Decide
investigar muestras de 40 profesores ayudantes, 40 asociados y 50 titulares. Algunos
estudiantes voluntarios llamaron a la puerta de los profesores de la muestra durante sus
horas de tutoras. Se hall que 31 de los profesores ayudantes, 29 de los asociados y 34 de
los titulares se encontraban realmente en sus despachos. Hallar un intervalo de confianza
para la proporcin de profesores que permanecen en sus despachos durante las horas de
tutoras.
Solucin:
p st = 0,7214; B = 0,0685
4. Un auditor quiere estimar el valor medio de las facturas por cobrar de una compaa. La
poblacin se divide en cuatro estratos que contienen 500, 400, 300 y 200 facturas,
95
n2 = 39; n = 61
6. En un centro escolar se quiere realizar una encuesta para conocer la proporcin de padres
que estaran dispuestos a participar en actividades. Se quiere estimar la proporcin de
padres tanto a nivel global como para cada grupo de edad de los alumnos por lo que se
decide estratificar segn la edad de los alumnos. A partir de la informacin proporcionada
por la siguiente tabla, obtener el nmero ptimo de padres que, de cada estrato, hay que
encuestar para que la proporcin de participacin de los padres con hijos de edades entre 6
y 8 aos sea estimada con un error menor o igual al 10%. (Suponemos que cada padre
tiene un solo hijo en el centro)
Aos
Alumnos
matriculados
150
130
120
100
Coste de encuestar a un
elemento
4
9
16
25
4-6
6-8
8-12
12-14
Sol. n = 200,3; n1 = 94,84 95; n 2 = 51,27 52; n3 = 33,53 34; n 4 = 20,65 21 n = 202
98
n1 = 7, 77 8
n2 = 19,14 20 n = 28
1981
14,5
42,7
15,1
53,6
25,4
35,9
48,5
221,2
114,0
17,0
1981, y establezca un lmite
100
N 2 = 60;
N 3 = 40; n1 = 10; n 2 = 8; n3 = 6
5. En una escuela de 560 alumnos, se desea estimar la calificacin media que puede
obtenerse en el examen final de matemticas en el curso 00/01. Se toma como informacin
auxiliar la calificacin de los mismos alumnos en el examen final de matemticas del
curso 99/00 con una nota media de 75. A partir de una muestra aleatoria de estudiantes
para los cuales se observ la nota del examen final en el curso 00/01 y la calificacin de
dicho alumno en la prueba correspondiente al curso 99/00. Los resultados fueron los
siguientes:
101
Cantidad en fotografa 12 30 24 24 18 30 12 6
Cantidad en terreno
10
36 42
18 42 24 36 24 36 14 10 48 54
102
4. Muestreo Sistemtico
1. La seccin de control de calidad de una empresa usa el muestreo sistemtico para estimar
la cantidad media de llenado en latas de 12 onzas que sale de una lnea de produccin. Los
datos de la tabla adjunta representan una muestra sistemtica 1 en 50 de la produccin de
un da.
103
y i = 48
i =1
4. En la tabla anexa se presentan los datos sobre las tasas de divorcio (por cada 1000
personas) en Estados Unidos para una muestra sistemtica de los aos de 1900-1980.
Estime la tasa media anual de divorcios para tal periodo y establezca un lmite para el
error de estimacin. Es en este caso el muestreo sistemtico mejor o peor que el muestreo
aleatorio simple?Por qu?
Solucin: sy
Ao Tasa Ao Tasa
1900 0,7 1945 3,5
1905 0,8 1950 2,6
1910 0,9 1955 2,3
1915 1,0 1960 2,2
1920 1,6 1965 2,5
1925 1,5 1970 3,5
1930 1,6 1975 4,8
1935 1,7 1980 5,2
1940 2,0
= 2,26; B = 0,57 . Mejor, se observa, en general, una tendencia creciente en
los datos de la muestra, aunque se rompa ese orden parcial en los aos 1945-1955.
12
6
130
13
3
70
14
2
50
15
1
10
16
4
60
17
12
280
18
6
150
19
5
110
20
8
120
a. Estime el costo medio de reparacin por sierra para el mes pasado, y establezca un
lmite para el error de estimacin.
b. Estime la cantidad total gastada por las 96 industrias en la reparacin de sierras.
Establezca un lmite para el error de estimacin.
c. Despus de verificar sus registros de ventas, el fabricante se percata de que ha vendido
un total de 710 sierras a esas industrias. Usando esta informacin adicional, estime la
cantidad total gastada en reparacin de sierras por estas industrias, y establezca un
lmite para el error de estimacin.
Solucin: (a) = 19,73; B = 1,78 (b) = 12.312; B = 3.175,07
(c) = 14.008,85; B = 1.110,78
2. Se disea una encuesta econmica para estimar la cantidad media gastada en servicios
para los hogares en una ciudad. Ya que no se encuentra disponible una lista de hogares, se
usa muestreo por conglomerados, con barrios formando los conglomerados. Se selecciona
una muestra aleatoria de 20 barrios de la ciudad de un total de 60. Los entrevistadores
obtienen el gasto en servicios de cada hogar en los barrios seleccionados; los gastos totales
se muestran en esta tabla:
Barrio N hogares Cantidad total gastada en servicios ()
1
55
2210
2
60
2390
3
63
2430
4
58
2380
5
71
2760
6
78
3110
7
69
2780
8
58
2370
9
52
1990
10
71
2810
11
73
2930
12
64
2470
13
69
2830
14
58
2370
15
63
2390
16
75
2870
17
78
3210
106
18
51
2430
19
67
2730
20
70
2880
a. Estime la cantidad media de gastos en servicios por hogar en la ciudad y establezca un
lmite para el error de estimacin.
b. En la encuesta anterior se desconoce el nmero de hogares en la ciudad. Estime la
cantidad total gastada en servicios por todos los hogares de la ciudad y establezca un
lmite para el error de estimacin.
c. La encuesta econmica se va a llevar a cabo en una ciudad vecina de estructura
similar. El objetivo es estimar la cantidad total gastada en servicios por los hogares de
la ciudad, con un lmite de 5.000 para el error de estimacin. Use los datos anteriores
para encontrar el nmero aproximado de conglomerados que se necesitan para obtener
ese lmite.
Solucin: (a) = 40,17; B = 0,64 (b) = 157.020; B = 6.927,88 (c) n = 29,4 30
3. Un inspector quiere estimar el peso medio de llenado para cajas de cereal empaquetadas
en una fbrica. El cereal est en paquetes que contienen 12 cajas cada uno. El inspector
selecciona aleatoriamente 5 y mide el peso de llenado de cada caja en los paquetes
muestreados, con los resultados (en onzas) que se muestran:
Paquete
Onzas de llenado
1
16,1 15,9 16,1 16,2 15,9 15,8 16,1 16,2 16,0 15,9 15,8 16,0
2
15,9 16,2 15,8 16,0 16,3 16,1 15,8 15,9 16,0 16,1 16,1 15,9
3
16,2 16,0 15,7 16,3 15,8 16,0 15,9 16,0 16,1 16,0 15,9 16,1
4
15,9 16,1 16,2 16,1 16,1 16,3 15,9 16,1 15,9 15,9 16,0 16,0
5
16,0 15,8 16,3 15,7 16,1 15,9 16,0 16,1 15,8 16,0 16,1 15,9
Estime el peso medio de llenado para las cajas empaquetadas por esta fbrica, y establezca
un lmite para el error de estimacin. Suponga que el nmero total de cajas empaquetadas
por la fbrica es lo suficientemente grande para que no se tome en cuenta la correccin por
poblacin finita.
Solucin: = 16,0050; B = 0,0215
4. Un peridico quiere estimar la proporcin de votantes que apoyan a cierto candidato A en
una eleccin estatal. La seleccin y entrevista de una muestra aleatoria simple de votantes
registrados es muy costosa por lo que se utiliza muestreo por conglomerados. Se
selecciona una muestra aleatoria de 50 distritos (conglomerados) de un total de 497 que
tiene el estado. El peridico quiere hacer la estimacin el da de la eleccin, pero antes de
que se haya hecho la cuenta final de los votos. Es por eso que los reporteros son enviados
a los lugares de votacin de cada distrito en la muestra, para obtener la informacin
pertinente directamente de los votantes. Los resultados se muestran en esta tabla:
107
Un empresario quiere estimar el nmero de tubos de dentfrico usados por mes en una
comunidad de 4000 hogares divididos en 400 bloques. Se selecciona una muestra aleatoria
simple de 4 bloques que proporciona los siguientes resultados:
Bloque
tubos gastados por hogar
1
1 2 1 3 3 2 1 4
2
1 3 2 2 3 1 4 1 1
3
2 1 1 1 3 2 2
4
1 1 3 2 1 5 1 3
Estime de distintas formas el nmero total de tubos gastados, obtenga el lmite para el
error de estimacin en cada caso y comente los resultados.
Solucin:
= 6400; B = 1077,78
6.
En un proceso de control del volumen envasado por una fbrica de bebidas se eligen 5 de
los 40 paquetes que tiene la fbrica, cada uno de los cuales contiene 4 envases, y se mide
el volumen que cada envase contiene. Las observaciones se presentan en la tabla adjunta:
108
110
FORMULARIO de MUESTREO
(95% de confianza, z=2)
y=
ESTIMADOR
VARIANZA
MUESTRAL
s2 =
CUASIVARIANZA
MUESTRAL
S2 =
1 n
yi
n i =1
1 n
yi y
n i =1
1 n
yi y
n 1 i =1
2
1 n 2
yi y
n i =1
yi
n
yi2 i =1
n
= i =1
n 1
V ( y) =
B
LIMITE DEL ERROR
DE ESTIMACIN
2 V ( y) = 2
n=
2
B2
4
2
D
1 n
yi ,
n i =1
s2 =
1 n
yi y
n i =1
yi = 0, 1
S2 =
S
n
1 n
yi y
n 1 i =1
= pq
n pq
n 1
pq
n 1
2 V ( p) = 2
D=
V ( p) =
pq
n 1
pq
pq
p2
, p+2
n 1
n 1
S
S
, y+2
y2
n
n
INTERVALO DE
CONFIANZA
p=
S2
n
VARIANZA DEL
ESTIMADOR
TAMAO MUESTRAL
PROPORCION
B2
4
n=
pq pq
=
B2
D
4
D=
111
B2
4
y=
ESTIMADOR
1 n
yi
n i =1
= N y =
V ( y) =
VARIANZA DEL
ESTIMADOR
B
LIMITE DEL ERROR
DE ESTIMACIN
112
i =1
S2 N n
n N
V ( p) =
2 V ( ) = N 2 V ( p)
( 2 V ( ) , + 2 V ( ) ) =
= ( N ( y 2 V ( y ) ) , N ( y + 2 V ( y ) ))
B2
D=
(media )
4
B2
D=
(total )
4N 2
pq N n
n 1 N
2 V ( p)
2 V ( ) = N 2 V ( y )
N 2
( N 1) D + 2
yi = 0, 1
pq
V ( ) = N 2 V ( p ) = N ( N n)
n 1
2 V ( y)
V ( y) , y + 2 V ( y )
1 n
yi
n i =1
= N p
n=
TAMAO
MUESTRAL
N
n
p=
S
V ( ) = N 2 V ( y ) = N ( N n)
n
(y 2
INTERVALO DE
CONFIANZA
PROPORCION
TOTAL
(p 2
( 2
= (N ( p 2
n=
V ( p) , p + 2 V ( p)
V ( ) , + 2 V ( ) =
) (
V ( p) , N p + 2 V ( p)
Npq
( N 1) D + pq
B2
( proporcion)
4
B2
D=
(total )
4N 2
D=
))
MEDIA
TOTAL
y st =
ESTIMADOR
1
N
i =1
i =1
Ni y i =
PROPORCION
TOTAL
Ni
yi
N
p st =
VARIANZA DEL
ESTIMADOR
1
N2
L
=
i =1
N
i =1
Ni2
i =1
2
i
i =1
i =1
Ni pi =
Ni
pi
N
st = N p st = Ni pi
i =1
1
N2
st = N y st = N i y i
V ( y st ) =
1
N
i =1
V ( yi ) =
Si2 N i ni
=
ni N i
2
N i Si N i ni
N ni N i
2
L
S2 N n
V ( st ) = N 2 V ( y st ) = Ni2 i i i
ni Ni
i =1
V ( p st ) =
1
N2
N
i =1
V ( pi ) =
2
i
p i q i N i ni
=
ni 1 N i
i =1
2
L
N p q N n
= i i i i i
ni
Ni
i =1 N
=
1
N2
Ni2
L
p q N n
V ( st ) = N 2 V ( p st ) = N i2 i i i i
ni 1 N i
i =1
FORMULACIN
GENERAL
(error fijo B)
n=
i =1
PROPORCION
TOTAL
N i2 i2
N 2 D + N i i2
i =1
n=
i =1
N i2 pi qi
N 2 D + N i pi qi
i =1
113
N
n=
i =1
PROPORCION
TOTAL
(error fijo B)
Ni i
ci
ci
i =1
N 2 D + N i i2
N
n=
i =1
i =1
n=
(coste fijo C)
N i i
ci
i =1
i =1
n=
ci
i =1
N
i =1
N j j
i =1
i =1
n=
N D + N i
i =1
j =
2
i
N j j
i
i =1
ASIGNACIN
PROPORCIONAL
(error fijo B)
i =1
1
N
j =
114
Ni i2
pi qi
ci
i =1
pi qi
N 2 D + N i pi qi
N j p jqj
L
pi qi
n=
N pq
Nj
i =1
ND +
i =1
1
N
j =
B2
(media )
4
B2
D=
(total )
4N 2
D=
( N
i =1
Ni i2
ND +
i =1
n=
j =
cj
ASIGNACIN DE
NEYMAN
(error fijo B)
pjq j
i =1
( N )
L
n=
j =
N i i
ci
pi qi ci
Nj
cj
j =
pi qi
ci
C Ni
i =1
N 2 D + N i pi qi
(coste fijo C)
i =1
ASIGNACIN
PTIMA
pi qi ci
i i
N pq
i =1
i i
Nj
N
B2
( proporcion)
4
B2
D=
(total )
4N 2
D=
pi qi
ci
ESTIMACIN DE RAZN.
MEDIA
TOTAL
RAZN
y = rx
ESTIMADOR
r=
y
i =1
n
x
i =1
y
=
x
y = r x
S r2 =
VARIANZA
RESIDUAL
1 n
2
( yi rxi )
n 1 i =1
V ( y ) = x2 V (r ) =
VARIANZA DEL
ESTIMADOR
1 N n Sr2 1 N n Sr2
V (r ) = 2
x N n x2 N n
n=
TAMAO
MUESTRAL
N r2
ND + r2
N n S r2
N n
N n Sr2 x2 Sr2
V ( y ) = x2V (r ) = N 2
N n x2 n
D=
115
ESTIMACIN DE REGRESIN.
MEDIA
TOTAL
sx2 =
1 n
xi x
n i =1
VARIANZA, COVARIANZA Y
1 n
COEF. DE CORRELACIN
sxy = xi x
MUESTRALES
n i =1
r =
2
xy
)(
2
1 n 2
xi x
n i =1
yi y =
1 n
xi yi x y
n i =1
sxy2
sx2 s y2
( x x )( y
n
yL = y + b( x x)
ESTIMADOR
b=
sxy
sx2
i =1
( x x)
n
i =1
yL = N yL
VARIANZA RESIDUAL
( (
1 n
S =
yi y + b( xi x)
n 2 i =1
2
L
))
2
n 2 s xy
=
sy 2
n 2
sx
n 2
s y (1 rxy2 )
=
n2
S L = S L2
ERROR TPICO DE
ESTIMACIN
V ( yL ) =
VARIANZA DEL
ESTIMADOR
N n S L2
N n
V ( yL ) = N 2 V ( yL )
n=
TAMAO MUESTRAL
N L2
ND + L2
B2
D=
4
116
( para estimar y )
B2
D=
4N 2
( para estimar y )
ESTIMACIN DE DIFERENCIA.
MEDIA
TOTAL
yD = y + ( x x) = x + d
d = yx
ESTIMADOR
yD = N yD
VARIANZA RESIDUAL
S D2 =
1 n
yi ( xi + d )
n 1 i =1
V ( yD ) =
VARIANZA DEL
ESTIMADOR
1 n
di d
n 1 i =1
di = yi xi
N n S D2
N n
V ( yD ) = N 2 V ( yD )
n=
N D2
ND + D2
D=
B2
4
TAMAO MUESTRAL
( para estimar y )
D=
B2
4N 2
( para estimar y )
117
TOTAL
=y=
ESTIMADOR
y
i =1
n
m
i =1
1 n
y
=
yi
t
n i =1
t = N y t
= M y
V ( y) =
VARIANZA
DEL
ESTIMADOR
1 N n Sc2
2
N n
M
2
S
V ( ) = M 2 V ( y ) = N ( N n) c
n
Sc2 =
(
n 1
n
yi ymi
i =1
n=
TAMAO
MUESTRAL
S
V ( t ) = N 2 V ( y t ) = N ( N n) t
n
N c2
ND + c2
St2 =
B2 M
D=
4
B2
D=
4N 2
yt
i =1
c = Sc2
(y
n 1
n
n=
N t2
ND + t2
t = St2
(media)
D=
B2
4N 2
(total )
(total )
NOTACIN:
N = conglomerados en la poblacin (habitualmente conocido)
mi = elementos en el conglomerado i
n = conglomerados en la muestra
yi = suma de las observaciones del conglomerado i
M = mi = elementos en la poblacin
(habitualmente desconocido)
i =1
m = mi = elementos en la muestra
i =1
1 N
M
mi =
= tamao medio de los conglomerados de la poblacin (habitualmente desconocido)
N i =1
N
1 n
m
m = mi = = tamao medio de los conglomerados de la muestra . Este valor m se usa para estimar el anterior, M .
n i =1
n
M=
118