Documentos de Académico
Documentos de Profesional
Documentos de Cultura
rl mutnwto
Adela Abad
Luis A. Servín
gan z1912
Introducción
al
muestreo
SEGUNDA EDICION
Adela Abad
Luís A. Seruin
MORIEGA Editores
E D I T O R I A L L I M U S A
MEXICO • ESPAÑA • VENEZUELA • ARGENTINA
COLOMBIA • PUERTO RICO
g a n z l9 1 2
ha presentación y disposición en conjunto de
INTRODUCCION AL MUESTREO
son propiedad del editor. Ninguna parle de esta obra
puede ser reproducida o transmitida, mediante ningún sistema
o método, electrónico o mecánico (incluyendo el folocopiado,
la grabación o cualquier sistema do recuperación y almacenamiento
de información), sin consentimiento por escrito del editor.
Derechos reservados:
PROLOGO
7
8 Prólogo
Adela Abad
México, D.F. Luis A. Servfn
CONTENIDO
Prólogo
1. Generalidades 11
2. Algunos conceptos de estadística y de muestreo 27
8. Submuestreo 187
Bibliografía 209
Respuestas a los ejercicios 211
9
CAPITULO
GENERALIDADES
1.1 MOTIVACION
Figura 7.7
Objetivo del
investigador
Objetivo de
la encuesta
1.2 POBLACIONES
estado civil,
de un asegurado
núm. de beneficiarios,
de una
grupo de salario de cotización,
institución de
trayectoria que sigue para ir de su casa
seguridad social.
al trabajo, etc.
sexo
edad
de un diagnóstico médico
enfermo número de días de hospitalización
tipo de seguro que posee
estado civil,
de un estudiante cantidad de dinero empleado en la compra
universitario de libros el semestre pasado,
trabaja o no.
1.6 V A R IA B ILID A D
//) El salario medio es de: 175 + 300 +125 + 100 + 100 +275 +
1775
150 + 150 + 200 + 200 dividido entre 10, es decir,
10
177.5 pesos al día.
S2 =■
N- 1
1.8 EJERCICIOS
Tabla 1.1
1 2 0 11 11 5
2 5 5 12 6 0
3 3 1 13 6 0
4 6 0 14 3 1
5 9 0 15 7 0
6 7 0 16 6 0
7 5 0 17 6 0
8 5 1 18 4 0
9 6 3 19 9 2
10 4 0 20 8 0
Determine:
ALGUNOS CONCEPTOS
DE ESTADISTICA Y DE MUESTREO
2.1 VA R IAB LE ALEATO R IA Y
DISTRIBUCION DE PROBABILIDADES
27
28 Algunos conceptos de estadística y muestre»
Epf) = S ^ x .P í 2.1
E(o) = a, a constante.
* Para las definiciones en este apartado existen las análogas en el caso continuo.
Esperanza matemática y variancia 31
VP< ) = (1 - § ) 2 (1) + ( 2
1
y su desviación estándar es
2
V (o) = 0
V(X: + X2 + . . . + X n) = V
Frecuencia p¡
Figura 2.2
Estimadores 33
2.4 ESTIMADORES
Molino 1 2 3 4 5 6 7 8 9 10
No. de empleados 2 2 2 3 1 2 1 1 1 1
Molino 11 12 13 14 15 16 17 18 19 20
No. de empleados 2 2 3 1 4 2 1 3 1 2
Figura 2.4
38 Algunos conceptos de estadística y muestreo
Figura 2.6
* El procedimiento empleado fue una simulación en una computadora digital.
Ejercicios 39
2.7 EJERCICIOS
2.1 Véase el ejercicido 2 del capítulo 7. Marcamos una canica por familia con
el número de ésta y de sus miembros; las ponemos en una urna, las
mezclamos y elegimos aleatoriamente a cinco de ellas, obteniendo los
resultados siguientes:
Canica 1 2 3 4 5
No. de miembros 5 5 3 6 7
x ' iY i-y )2 ( 2 y?
5
-J -w I) - 1 ( 2 i =1
n - ¿ i _________ = ( i y
2 Cr 20 5 5 — 1
5 - 1
v) Según su dibujo, ¿le parece que está muy dispersa esa distribución? ,
es decir, ¿su variancia es grande o pequeña?
40 Algunos conceptos de estadística y muestieo
2.3 En una encuesta de opinión desarrollada sobre los obreros de una fábrica, se
encontró el porcentaje de obreros favorables a cierta regla. Este porcentaje
fue de 38%. Como había información suficiente para obtener dos estimacio
nes, se hizo esto y se obtuvo, para la segunda, nuevamente 38%, aunque no
así para sus errores estándar. En el primer caso se encontró 0.07 y en el se
gundo 0.05. ¿Cuál de las dos estimaciones es mejor?, dé sus razones.
CAPITULO
3.2 NOTACION
N
y - y i + y-i + • • - + yn 2 y,
574
399
74
195
308
44 Muestreo aleatorio simple
Tabla 3.1
Números aleatorios
16 99 41 99 56 31 28 76 26 73 19 15 57 44 94
43 34 83 23 42 99 06 39 84 31 61 29 39 99 99
75 61 18 80 72 61 42 89 22 99 28 05 07 47 07
10 30 57 40 79 30 65 93 49 42 75 51 19 54 93
81 28 33 05 75 61 21 33 19 36 05 37 30 84 80
78 53 31 66 07 92 02 98 59 71 79 85 35 10 66
72 15 95 21 55 17 89 53 16 56 69 09 40 91 40
12 45 96 72 44 26 82 09 42 12 61 62 55 05 41
32 47 05 82 59 05 62 75 24 36 84 19 11 21 43
15 43 91 52 51 78 58 99 04 03 75 71 34 50 75
80 13 31 30 09 65 32 06 21 28 93 23 13 08 42
59 94 08 38 68 75 20 90 19 78 48 34 58 17 11
62 26 89 09 89 13 27 30 01 31 43 47 21 58 65
36 18 06 08 14 55 62 84 68 78 16 59 22 63 76
83 55 66 36 27 51 28 55 48 41 74 80 03 94 39
37 72 86 68 78 75 47 51 41 76 77 04 50 65 67
60 83 53 77 48 13 81 62 79 93 64 22 98 46 95
19 63 11 54 88 95 27 69 08 85 39 27 27 81 68
92 57 48 11 69 88 47 30 38 47 84 69 43 62 78
88 07 20 65 91 35 05 53 18 61 92 33 65 08 73
Tabla 3.2
No.
No. letras Sexo vocales No. consonantes
Persona Nombre Yi x¡ ¿i w¡
1 Mario 5; y ¡ ■= 5 M, Xj = 0 zi = 3 w¡ = 2
2 Juan 4; y 2 ■= 4 M, x2 = 0 21=2 w2 = 2
3 Raúl 4; y 3 = 4 M ,x 3 = 0 ^3=2 w3 = 2
4 Gloria 6; y 4 := 6 F, x4 = 1 Z4 = 3 w4 = 3
5 Cosme 5; ys = 5 M, x5 = 0 ^5=2 w5 = 3
6 Carlos 6; y 6 := 6 M, x 6 = 0 ¿6 =2 w6 = 4
7 Luz 3; y-i ■= 3 F, x7 = 1 Z1 ~ 1 w7 = 2
8 Ernesto 7; y s := 7 M, xg = 0 z8 = 3 iv8 = 4
9 Rosa 4; y 9 == 4 F, x 9 = 1 *9=2 w9 = 2
10 Norma
TI
5; Yi o = 5 ivio = 3
O
z i 0 —2
II
*
n n n n
2 y , = 49; 2 x¡ = 4; 2 z¡ = 22; 2 w ¡ = 27
i~ 1 i= 1 i= 1 1= 1
.2 y i
I= 1 3.1
Y =y = n
2 y¡
Y = N y = N L~ 1 . 3.2
n
Estim ación, de porcentajes: Usando la misma muestra podemos
estimar el porcentaje de personas de sexo femenino y ésta será
Igual a la fracción de mujeres en la muestra multiplicada por 100;
4
en este caso ^ 100= 40%. En general, para estimar el porcentaje
de unidades poblacionales que tienen una determinada cualidad
(sexo femenino), o pertenecen a una clase determinada, encuén
trese la fracción de ellas en la muestra y multipliqúese por 100,
P= p
r = n 1 00% 3.3
1 i-n
2 y,.
I- 1
1 i = n
n i._= i ,\ j - i
(
la unidad sea elegida
en la y'-ésima extracción
probabilidad de que
j= N no sea elegida en las probabilidad de que
2 y¡ primeras / — 1 lo sea en la y'-ésima
i - 1 extracciones
1 i - n ( Í =N 1 1 j=N -
n 2 yj = /
ñ ,M- 1 N; 2= , y ' N A7/V
j - i
E(Ny) = /V (E (y)) = N Y = Y
y\ y 2 y 3 y 4 y< ye y 7 y 8 >'9 yi o yi i. y i 2 y 13 y i 4 y i s
0 1 1 0 1 1 i 1 0 1 1 1 0 1 0
No. de empleados 3 1 5 2 7 2 2 1 2 1 1 4 2 2 1
50 Muestreo aleatorio simple
1* n
2 y¡
36
y = — — = 7 7 = 2.4 empleados por establecimiento
n '
guntas y para ello hay que calcular las variancias de los estimadores.
Obtengamos la variancia de la media muestral aplicando la ecuación
2.5 y recordando que la esperanza de la media muestral y es la
media poblacional Y.
Vji) ==E((ji)2) - Y1
==E ( £ 2) _y2
- n2E l i Y? + i ==j yy) - 0
- - ( ■í , E^ + ,I j E (YY1 )) - Y2
para obtener esta expresión se han usado los resultados 2.2 y 2.3.
Recordando que E(y,) == (1/N) 1 : y,-:
J= ,
1 .n 1 N 2 n N
V(.V) ==n ( i=1:1—N¡=1:1 y ¡ +1:
2 1: y k y l (probabilidadde queyft se
i=f=í k=/=l
obtenga en la /-ésima extracción) (probabilidadde que y, se
obtenga en la j-ésima extracción dado que yk lo fue en la
/-ésima)) —Y2
Y2
n — N
_ ny
1
i ---------
1
¿i y k y¡ - yz
nN yj nN (N — 1 ) k
i w „ n —1 N n —1 / N \2
V(y) = 7¡Ñ ;= i Vi “ n N { N - \ ) j l , y f + ^Ñ~(N - T ) \ j =
f 1 _ ” ~ 1 ^ £
V(y)
^ \n /V n N {N -\)/i= i y’* + «/v(/v — i ) (s y> )2 y 2
w _ n -N
N -n 2 y j+ y 2
nN (N - 1) i - 1 n(N — 1)
N -n 1 z 1* - n 2
2 y / - A/V'2 A/ - /7 1 / = i________
A/ n N n N -*[
A /- 1
¡ii) Variancia de p:
n 2 ( 2 y,-)2
(A//2)2
2 y?- NP - A//>Q
/V
52 = N - /V - 1
1 A/-1
de donde:
NPQ 1 - f
V(p) = 3.7
N- 1 n
¡v) Variancia de R:
1
j —N _
S2 2 [y,-Y )
N - 1
Veámoslo:
e (( 1 - n ^ ) = "4 / e (í 2)
= E( ! •=, "((yí W )
i _ f 1 , n ¡= at _ _
= — ( 7V £ (y, - Y f - « ((y - Y)*))
n
Vaiiancias de los estimadores 55
- - A/2 c2
V(/Vy) = N2 V(y) = Z - f - ( 1 - / )
3.9.1
V (Ny)= - ^ Í I z D _ J _ (¿y ? _
n n —1 ' n
N lN — n) 3.10
V (¿ ) = n _ i PQ
n 2 _2
N n n 2S2
Total N y —- 2 y ¡ V(Ny) = - - - V(Ny) — (1-f) — Ny + t(V(Ny))112
n <_1 n n
v (R > “ ^ “ 2 + * ’ £*?)
n
en la cual x es la media muestral: x = '—A .
TABLA 3.4
Fórmulas para el cálculo de varianzas estimadas (m. a. $.)
* Para un tamaño de muestra pequeño, t debe ser buscado en las tablas de la distribución
t con n-1 grados de libertad, ya que la variancia es desconocida.
Intervalos de confianza 59
V(y) = (1 - 0 ^ = (1 - f) £
= (1 - 10) -1 s (y¡ - y f
K 1 0 0 j 10 ' n "--1 '
60 Muestreo aleatorio simple
(49)2
100 (253 10
= 0.129 (Ietras/nombre)2
{4 .182,5.618} Ietras/nombre
{ 431 ,5 4 9 } letras.
^ £ Zf 2 2 '
R = = 0 7 = 0-81 vocales/consonan te.
2 {zí - Rw¡) Vi
e.e.<¿) -
n
90
_ / 100 ^ z¿ - 2R 2 ¿¡Wf + /?2 2 */2
~ ( ( 1 0 )( 2 . 7 ) 2 9 /
V(2 .7 ) 2 9 )
3.8 EJERCICIOS
3.2 Suponga que las unidades en la población anterior están numeradas como
se indica a continuación:
1 001 9 811
1 002 9 813
♦ 9 910
1 317 9 911
1 318 9 912
1 319 9 913
•
t
2 040 9918
¿Cómo seleccionaría una muestra aleatoria simple sin remplazo de ta
maño 10?
3.5 Sobre el mismo ejercicio 3.3, estime el número de miembros por persona
que trabajan y el error estándar de su estimación.
Ejercicios 65
3.9 Un grupo asesor de una escuela técnica piensa que los planes de estudio
del plantel están un poco desactualizados y, mediante una encuesta sobre
los egresados de ella, piensa derivar resultados que le ayuden en su
reestructuración. Las preguntas que se deben formular, van dirigidas para
aquellos egresados que estén trabajando como investigadores. El listado
muestra 638 nombres cada uno con su dirección, de ellos se elige una
muestra aleatoria de tamaño 20. Al hacer el trabajo de campo, los
entrevistadores preguntan al egresado si eso no investigador. Si responde
afirmativamente le hacen la entrevista y en caso contrario no la hacen.
Al devolver los cuestionarios, el grupo asesor encuentra que 18 de los
egresados en la muestra se calificaron como investigadores. Y asi', emite
instrucciones para que en el procesamiento de la información, en el
cálculo de porcentajes y medias se use como tamaño de muestra 20.
/) ¿Cree usted que está bien definida la población objetivo? Indique sus
razones.
//) En el supuesto de que la población estuviera bien definida, ¿sería
correcto usar el tamaño de muestra de 20 que indica el grupo
asesor?
1
1 3
2
3 7
3 1 5
4 1 1
5 1 9
6
2 8
7 1 8
8
2 5
9 3 7
10
1 3
11
1 4
12
1 4
13 1 8
14 1
11
15 4 4
16 1
7
17 3 3
18 2
3
19 1
3
2 0
2
2
21
2 5
2 2
2 4
23 1
9
24 1
6
25 1 6
26 1
7
27 2 6
28 3 6
29
1 5
30 1 5
31 1 9
32 1
8
33 1
4
34 3 6
35 1
1
36 7 7
37 1
3
38 1
3
39 6
6
40
3 9
40 v .„_ i=40
y ¡ = 73 E y¡x¡ = 4 1 3 I: = 2 2 0
;= 1 1 -1
I; y \ = 207 I; x ]= 1436
66
Ejercicios 67
3.12 En la urna del ejercicio 3.11 la muestra aleatoria es extraída sin reposi
ción. ¿Cuál es la probabilidad de que b canicas (b < n < A + B) sean
blancas? ¿Cuál es la distribución del número b de canicas blancas en
cada muestra de tamaño n i ¿Cuál es la media y la variancia de esta
distribución?
* Aunque ya vimos en 1.5 que en ocasiones el método de medición aunado a otro tip o de
eventualidades no permiten llegar 3í valor correcto.
69
70 Determinación del tamaño de la muestra
e(k »= y
Figura 4.1
los intervalos de magnitud d a la derecha e izquierda del parámetro
Y, por lo general no cubren a toda la distribución; por lo cual en
las áreas punteadas sigue existiendo probabilidad,, es decir, oportu
nidad de que algunas muestras sean elegidas y arrojen un error
mayor a d¿
Para tomar en consideración este hecho, se introduce el concep
to desconfianza; ! es decir, se acepta un error d = (x%) Y con una
confianza del 95% en el sentido de que si se muestreara repetidas
veces, en promedio, 95 de cada 100 muestras tendrían máximo un
error de magnitud d, y 5 de ellas tendrían un error mayor. Y como
es intuitivo el hecho de que, si en una urna existen 95 bolas verdes
y 5 rojas y se revolviera y se extrajera una de ellas, es muy
probable, es decir, se tiene bastante confianza (95%) de que la bola
19
que salga sea verde (probabilidad de verde ~ aunque no
estamos exentos de que salga roja, con probabilidad de ^
En muestreo, la precisión con que se desea una estimación
queda indicada por un error d igual a x por ciento del parámetro
poblacional y una confianza entre 0 y 100%. Evidentemente las
confianzas más solicitadas serán, digamos dei 80% en adelante.
Y esto debido al hecho de que si en la urna tenemos 99 canicas
verdes y una roja, al extraer una aleatoriamente, pues, apostamos a
verde. Si en lugar de tener una roja tenemos 5 ó 10 de ellas y el
Precisión estadística 71
V = (£)»
error d
y
confianza C
Precisión
desviación estándar
del estimador
variancia del estimador
recursos disponibles
dinero y deseo desarrollar una encuesta para estimar tal (es) pará
metro (s). ¿Para qué precisión me alcanza?
52 52 t 2
n° V d2
que se suele corregir asi':
"o
n = --------
1
N
Las expresiones 4.2 constituyen las ecuaciones necesarias para en
contrar el tamaño de la muestra cuando se desea estimar un valor
medio. Primero se determina n 0 y posteriormente se corrige este
valor con la ecuación para Ia / 7 . La n asi' determinada es el tamaño
de la muestra necesario.
Tabla 4.1
21 5 41 3
22 5 42 5
23 6 43 4
24 3 44 6
25 4 45 1
26 2 46 3
27 2 47 3
28 1 48 3
29 4 49 2
30 2 50 1
31 2 51 2
32 2 52 2
33 3 53 1
34 2 54 3
35 8 55 5
36 9 56 3
37 5 57 3
38 1 58 3
39 1 59 2
40 3 60 2
7* S*
2 y¡ = 198, 2 y] = 900
N 198
A/ s y¿ = 3.3 hojas/expediente
60
variancia poblacional S2 vale:
N _ N
2 (y¡ - Y)2 _ 2 y? - N Y2 _ 900 - 60(3.3)2
5J = /V —1 /V - 1 60-1
= 4.18 (hojas) 2
4.18
"o /0±66>2 38.4
l 2 '
no 38.4 38 .4
n 23.4
38.4 1 + 0.64
1 + ^"o_
- 1 +
N 60
Por otra parte, si en lugar del error anterior del 20% pedimos
el 5% se tiene d = 5% (3.3) = 0.165 y para la misma confianza,
obtenemos n 0 = 614 .1 y n = 55. Es natural el aumento necesario
en el tamaño de muestra ya que se requiere mayor precisión.
N2 ’ ( n
5 2 1
: V = ( tO luego:
\ 1 ~Ñ
N2 • 5 2
n0 = n = 4.3
V 1
N
Muestra para estimación de porcentajes 75
15.72
n 12.46
15.72
1 4
60
y usando N en vez de N — 1:
n N ’
de donde:
n n = PQ. H ’ n 4 .4
v ’ 1 4
N
76 Determinación del tamaño de la muestra
¿El problema es
determinar el ta
maño de muestra
para estimar:
S2
. . . una media? , use -y
N 2 <?2
. . . un total? , use — —
= 2 0 ( 8 0 ) , 4QQ _ (0 .2 0 ) (0.80)
«o nn = 4 0 0 **
(0 ^ i )2
400
n 52.17
1 +O
Por lo cual elegimos n = 53. Dado que la población es de
tamaño 60, generalmente en términos prácticos esto significa que
hay que censar. En la tabla 4.2 aparecen los tamaños de muestra y
las fracciones muéstrales que se requerirían para diferentes tamaños
* Las expresiones 4.4 también pueden ser usadas cuando P, Q y d están en por unidad.
* * Para efecto de claridad, se presentan los cálculos de ng cuando P , Q y d están
expresados en porcentajes y cuando lo están en por unidad, en este últim o caso P y Q
toman valores entre 0 y 1.
Muestra para estimación de porcentajes 77
Tabla 4.2
P = 20% d = 4% t = 2
sis:
N n unidad de cada:
ii
600 240 240/600 2.5
6 000 375 375/6 000 16
60 000 398 398/60 000 151
600 000 400 400/600 000 1 500
6 000 000 400 400/6 000 000 15 000
Figura 4.2
* El estudio de este tema requiere mayor detalle estadístico matemático que el pretendi
do en este libro; se recomienda ver el libro “ Sampling Teckniques”, 1963, W.G. Cochran,
J. Wiley and Sons, N. Y. segunda edición.
Cuestionario con varias preguntas 81
43. Usualmente ¿de qué tipo son sus exámenes? (orales, es
critos, de otro tipo).
50 000
nn = 80
< T )'
de donde:
80___
n = = 77
f _J0
2000
Similarmente, para la media de la pregunta 2 se obtiene un
tamaño de muestra de 98. Al preguntar sobre el porcentaje de la
pregunta 3, le indican que éste debe encontrarse entre 30 y 60% y
que la desean estimar con un 5% de error y un 95% de confianza.
Entonces el tamaño de muestra se obtiene con la expresión 4.4
= P P = á °.J5. ° i = ano
V (§ )’
400
334
400
2 0 0 0
Pregunta 1 2 3 4 5 6 7
86 Determinación del tamaño de la muestra
Tamaño de
muestra 77 98 334 300 200 200 370
4.7 EJERCICIOS
Tabla 4.3
1 6 0 b 1/ 3
2 4 10 2 18 ü
3 2 11 1 19 2
4 3 12 2 20 1
R 2 13 2 21 5
6 3 14 1 22 3
7 2 15 1 23 5
8 9 16 1 24 3
n z yi
_ n __ = y
n n X 5.1
Zx,- Zxf
n
*En el cual el denominador es una constante.
89
90 Muestreo aleatorio simple
v \r ) = 1 ~ f s (y¡ ~ R 5.2
nX1 N - 1
1- f z ( - R x¡)2
V(¿) =
nX1 n - 1
= W ¿y? - 2 R X y f x i + R* 2 x f
V(/?) nX2 n - 1
Tabla 5.1
y¡ *i Yt Vi x¡ Yi *i
3 3 4 2 7 7 6 5
5 2 4 2 9 4 10 3
6 2 5 3 7 4 6 3
5 5 7 4 7 3 4 4
5 5 9 2 8 2 5 4
4 1 5 2 6 2 7 4
5 3 5 1 6 3 6 3
5 2 6 1 8 1 6 5
6 2 6 3 5 1 9 2
3 3 5 3 5 2 6 2
S y, = 236; 2 x t = 115
2 y 2¡ = 1494; 2 x f = 401
• , = 685
236
R = = 2.05 miembros por auto
115
1 - f 2 yj 2 R 2 y¡Xj + R2 2 xf
</(R) =
nx~2 n - 1
40
,1 - ( 3 000 -) 1 494 - 2(2.05) (685) + (2.05)2 (401)
40 (Ü 5 . 40-1
w ' 40
= 0.028
5;4
{1.716 , 2.384}
Una estimación del peso total de las piedras en todos los sacos
la obtenemos mediante Ny:
Razones e intervalos de confianza 93
T a b la 5 .2
1 2 47
2 2.5 46
3 1.5 46
4 1.5 48
5 2 47
6 3 50
7 2 50
8 2.5 51
9 2 49
10 2 49
11 2 48
12 2 50
13 2 49
14 2.5 48
15 3 45
16 2.5 47
17 2 46
18 3 49
19 2 50
20 1.5 48
21 1 48
22 2 48
23 2 46
24 2.5 50
25 2 50
Totales 53 1 205
* Recordar que un porcentaje puede ser tratado como una media (apartado 3.5).
Medias y totales con estimadores de razón 95
v(?B)= n N- 1
5J
5.12
n
ncl
2 ydk 5.13
k = i______
nd
siempre que nd sea mayor que cero. En esta expresión la suma se
extiende sólo para aquellas unidades que están en la muestra y que
pertenecen al dominio d —ésimo de interés. Puede haber tantos
dominios como se quiera, pero como la selección es aleatoria, nada
se puede asegurar sobre el tamaño de muestra resultante en cada
dominio. Esto puede verse como una restricción de la selección
aleatoria. Si uno desea estar seguro de que todos y cada uno de los
dominios estén presentes en la muestra, es necesario cambiar de
esquema. Veremos más adelante que en ocasiones una selección
sistemática (capítulo 7) es la solución para esto, y desde luego, la es
tratificación juega un papel muy importante en las posibles soluciones.
Como el estimador 5.13 es un cociente de variables aleatorias,
lo identificamos como uno de razón. Sin incurrir en un error grave
podemos usar la ecuación siguiente como expresión de su variancia:
n d __
v ( Yh ) = ^ ~ iPrf* ~ y<iY _ 1 — fd 2
1 dl nd nd — 1 n d sd 5.15
Muestra aleatoria
n - nd
5.16
= Nd Y d
5.17
V( Vd) = N d
en la cual: k=nd
k -n.
(f - ,
(sá) 2 = n — 1U = i y dH -
Tabla 5.3
N o. de ¿El h o te l
turistas No. to ta l cuenta con
No. del en la fecha de teléfono y
h o te l dada cuartos estacionamiento?
1 80 50 sí
2 50 30 sí
3 60 60 sí
4 45 20 sí
5 15 10 sí
6 20 15 no
7 25 15 sí
8 20 17 sí
9 15 13 no
10 10 20 sí
11 14 10 no
12 20 12 no
13 25 15 no
14 33 14 sí
15 80 38 sí
16 60 25 sí
17 35 20 sí
18 20 20 sí
19 23 15 sí
20 36 25 sí
21 18 10 sí
22 44 20 sí
23 40 22 sí
24 39 30 sí
25 90 50 sí
26 12 10 no
27 10 10 no
28 5 15 no
29 12 10 sí
30 13 13 no
31 10 17 sí
Totales en dominios de estudio 101
N o . de ¿El hotel
turistas No. to tal cuenta con
N A d el en la fecha de teléfono y
h otel dada cuartos estaclonamlen to?
32 20 25 sí
33 30 20 sí
34 32 20 SÍ
35 140 80 sí
36 85 40 sí
37 20 13 sí
38 7 9 sí
39 16 14 sí
40 19 17 sí
41 31 16 sí
42 41 23 sí
43 6 8 no
44 8 10 sí
45 10 15 sí
46 12 10 sí
47 14 10 sí
48 12 12 sí
49 18 14 sí
50 7 9 sí
1 367
40
nd ( ^ v ) 2\ 1 (895)2)
1 f mi)Ak - V »-» y d V 5Ó -Z1 (28 993 - 50
R = a + (b — a)r
Tabla 5.4
Tiene el
Ferretería artículo Observaciones
1 no
2 no
3 no
4 Está clausurada
5 sí
6 no
7 sí
8 no
9 no
10 sí
11 Está cerrada
12 sí
13 sí
14 no
15 sí
16 sí
17
18 Hay un edificio residencial en
la dirección dada.
19 si
20 si'
21 Como no estaba el encargado, el
ertumerador visitó a la siguien
te ferretería en la misma calle.
22 sí
23 no
24 Parece que existe el artículo.
pero no estaba el encargado.
25 si
26 sí
27 sí
28
sí
29 Ya no existe
30 sí
E(y) = ?
Ejercicios 109
V ( y ) = - . V (£ tiy ¡ ) =
n í =m
1
2 y ] • V(f,) + 2 2 Cov(y¡, }'j)
n7
y i y j
í* 1 í < j
N N - 1 N
2 2 2
N i < , y '- y ' ^
_ N - 1 ^S_2
N n
N
2 j (y, ~ 7 j 2
V(F) = ~
n A7 - 1
5.10 EJERCICIOS
Tabla 5.5
Vi x, V¡ X/ Vi x,
52 38 70 53 52 39
62 43 71 50 56 42
73 50 55 40 57 41
57 45 59 47 60 46
68 45 71 47 58 44
54 42 58 44 74 50
53 40 72 48 48 37
51 38 74 49 52 39
63 46 63 46 57 44
70 48 53 40 70 48
Tabla 5.6
Vi- 160 180 190 240 200 150 190 190 240 220
x¡: 150 120 130 170 160 140 140 120 180 160
Vi- 200 200 220 240 180 160 190 200 130 170
*i- 150 140 170 180 140 110 130 140 120 130
£ y¡ Z xí
— i=i
5 3. Si y =
n >y,
'' x n \
, demuestre que bajo muestreo aleatorio simple
, 2 ( y t -Y ) (x ¡-X )
. 1 ~ f i = I
COV(x, y ) =
N- 1
5.4 Usando las definiciones y el resultado del ejercicio 5.3 y considerando la
expansión por la serie de Taylor de la función ^(x, y ) alrededor del punto
+ (despreciable)
Entonces:
Var 9[ x, y ) = E 9{ x, y ) - 9{X, Y)
Ejercicios III
5.6 En referencia al ejemplo 5.2, calcule intervalos de confianza del 95% para
el peso medio de piedras por saco, así como para el total en los 1 000
sacos.
5.7 En referencia al ejemplo 5.2, estime el error estándar del estimador del
cociente entre el peso total de la piedra y el peso total de la semilla usando
la aproximación normal y considerando como válida la expresión 5.3.
5.10 Considere las expresiones obtenidas para las variancias de la media mues-
tral en los esquemas de selección con y sin remplazo. ¿Cuál es la
magnitud de su diferencia?
5.11 Con referencia al ejemplo de los gaveteros del apartado 5.2, ¿por qué es
necesario que las familias generalmente tengan más de dos hijos?
112 Muestreo aleatorio simple
Tabla 5.7
No. de! Conocen los cambios Fuman
empleado a! reglamento cigarrillos
1 no sí
2 no no
3 no sí
4 no sí
5 no no
6 sí no
7 no no
8 sí no
9 sí no
10 no no
11 sí no
12 sí no
13 sí no „
14 sí no
15 renunció -
16 sí no
17 sí sí
18 sí no
19 no sí
20 sí sí
21 sí sí
22 sí no
23 tiene permiso por 6 meses
24 renunció —
25 no sí
26 no no
27 sí no
28 no no
29 sí no
30 sí no
31 sí no
32 no no
33 no no
34 no sí
35 sí sí
36 no no
37 no no
38 no no
39 no no
40 no no
CAPITULO
MUESTREO
ESTRATIFICADO
h =L >= N h ¡= N h
2 2 Yhi
-y — „
h 2- ] ?
i- i y * i
h = i i ~~ 1
N Ni + N2 + . . . + Nh + . . . + N l
La población de ta
m año N es frag
mentada en L estra
tos
De cada estrato se
elige una muestra de
manera independien
te del resto de las
selecciones.
Y h i t y h2,
■■- Yhn h.
R6
R1
* 1.
Rt2 8
r9
R4 Figura 6.2.
116 Maestreo estratificado
T otal
Región
1 2 3 4 5 6 7 8 9 10 11 12
No. Total
de granjas 221 75 30 400 50 90 60 50 63 77 42 25 1 183
Tabla 6.1
Regiones
I 1V2
II 3, 5 y 6
III 4 muy lejana
IV 7 y 11
V 8, 9, 10 y 12
Tabla 6.2
Total
Estrato h: 1 2 3 4 5 N
Regiones: 1 V2 3, 5 y 6 4 7 y 11 8, 9, 10 y 12
Tamaño Nh : 296 170 400 102 215 1183
N = /V, + N 2 + . . . + N l
N = 296 + 170 + 400 + 102 + 215
=H 183
La estratificación anterior se ha hecho según un criterio geográ
fico, el cual no necesariamente toma en cuenta los diferentes
Estimación de medias 117
I Yh S N„ Yh
F yhi h h________
Y =-
N N N
£ Nh Ph
h
P .; t = /V 6 . 1.
N (yest) (1 6.3
en donde:
V Whi - n )1
V,
si
nh - 1
nh
2 y hi
y h = nh
p i ■/ p , N fa _
tn la expresión b. I , - — es la ponderación que recibe y h¡ por lo
que se denomina ponderación del estrato /?-ésimo, y en 6.2 y 6.3 el
nh
cociente t h - —— Se le denomina fracción de muestreo del estrato
Nh
/ 7 -ésimo. En este capítulo se considera que la selección dentro de
cada estrato se efectúa con muestreo aleatorio simple. En la ecua
ción 6.3 y en la definición de s2 h éste aparece dividido por nh — 1
por lo cual, para que exista el estimador de la variancia en el
estrato /7-ésimo, es necesario que el tamaño de muestra en él, n h
sea al menos de 2 .
ESTRATO 1
Entonces;
ESTRATO 2
Entonces:
ESTRATO 3
Entonces:
y¡ = 2 3 f f i 0 = 1 958.33,
- 30 100
y 2 = — ?-----= 6 0 2 0
60 900
y 3 = — ^— = 20 300,
v (y .) = ( 1 - f,)
" 1
12 1 1 (Zy,,-)2,
= “ 240^ Í2 12A ( S y i ¡ ^
0.95
1 990 000 = 14 322
132
V (ya ) = (1 - f 2 )
n2
5 1 1
= (1 c 5
c -1
_i ' ^ y 22 í [ W )
100' 5
0.95
10 288 000 = 488 680
20
- _ N l y l + N2 y 2 + N 3y 3 _
Scst /y
V (y » „) = S { V( yh)
= 111 010
Es decir, n x
2 Nh
h
6.5.
124 Muestreo estratificado
(1 - ") 1~s M, p 1 - f
V (y ¡st) 2 NhS\
' N 1 n h /y nN h
V (yesí) 1 ~ ^ j At S2
nN h Nh ^ 6.6
V (r„„) - L / 2 N„ s i 6.7
^est Nyest 6 .8
V W , , () = S N I (1 - f h) 6.10
h
6.11
N( 1 - f) 6.12
V(/Vyesf)
n
- /V Nh -n h
V (pe$t) = 2—; PhQh 615
h N2 (nh — 1 )Nh
126 Muestteo estratificado
pest = ( 1 - 2 ah) 1 0 0
6.16
1 - f N\
V(pesí) N i, n Nh - N
Phqh
Estimadores aplicables a muestreo estratificado, con afijación proporcional y muestreo aleatorio simple en cada estrato.
ESTRATO POBLACION
— 1 n h a sh
Media Vh - — L Yhi - - 1 L nh A 1- f L 2
V (Vh) = (1 - f h ) - Ve‘ Í - L L Yhi
n h ;=l nh VWes t ) = N L N h sh
n h = i i= i nN h=1
ah - N h —n h TL A 1 —f L
Ph = — ■ 100 V(ph) , PhQh Pesf = — 2 a^ 100
Porcentaje Nh (nh - 1) n h=i V (pest) N L=1
nh
Ni
p hdh
nN h - N
127
128 Muestreo estratificado
*73 = 30 — n 2 = 1 9
Médico 1 2 3 4 5 6 7 8 9 10 11
Casos 1 1 1 5 3 1 5 2 5 1 1
Estrato No. 3
Médico 1 2 3 4 5 6 7 8 9 10
Casos 7 2 1 3 1 1 1 1 1 3
Médico 11 12 13 14 15 16 17 18 19
Casos 3 1 1 2 1 1 1 1 1
+ N2y 2 + N 3y 3
Estimación de porcentajes 129
= 2 632 niños.
s\ $3
V ( Y) = 0 + N \ (1 - f 2) — + NI (1 - M —
n2 n3
11 94 - (26)
+ (450)'2 (1 - 11
450 11 (10)
9 7_ m a
+ (800)2 (1 - - 1 2 -) * 19
' 800 19 (18)
= 58 445.35 + 72,499
3, 17, 27, 37, 47, 57 y 67. Esto es una selección sistemática la cual
termina con un tamaño de muestra de 7.
TABLA 6.5
42 090 1 410
19 043
1 403 = 635
42 090
429
1 403 = 14
42 090
5 010
1 403 = 167
42 090
1 114
1 403 = 37
42 090
721
1 403 = 24
42 090
474
1 043 = 16
42 090
4 415
1 403 = 147
42 090
132 Muestreo estratificado
450
1 043 = 15
42 090
2 750
1 403 = 92
42 090
487
1 403 = 16
42 090
150
1 403 = 5
42 090
925
1 403 = 31
42 090
2 800
1 403 = 93
42 090
2 900
1 403 = 97
42 090
422
1 403 = 14
42 090
6:6. EJERCICIOS
Tabla 6.6
6.5 En el ejercicio 6.4 indique cuáles serían los estimadores a usar /) a nivel
estrato, //') a nivel global.
6.7 Estime la producción total en kilos de to rtilla para las tres ciudades del
ejercicio 6.6 y calcule intervalos de confianza del 95% para su estimación.
6.8 En el ejercicio 6.6 estime el número medio de empleados por to rtille fía e
indique intervalos de confianza del 95%.
N\ s i /V,
= V = 2 —£ SI
h N2 nh N'
y además: 6.17
n —n i + n 2 + . . . + nh
4
Nh lu í \
"h = — n = (M'fc) n
V= SI
h N2 {Wh)n h N2
n0 2 NhS2
NV
6.18
n_o
n
1
1 N J
nh = ( ) n, h = 1, 2, . . ., L
6.19
n o
N n = ----------
nn = T j) * N hSl 6.20
1 + ^°
V h
N
Entonces:
400 (■
2
= 37.4
- 240 __ _ 01
n' 400 3 5 2
100
n2 35 = 8.75
400
60
35 = 5.25
400
n x = 2 1 , r>2 = 9, n 3 = 5
S2 180 909
/»ot ZJ 2.89
v*
y también:
138 Muestreo estratificado
2.89
«i 2.86. Tomamos n, = 3
2.89
1 +
240
2 572 000
n02 41.15
(500)2
41.15
n2 29.15. Tomamos n 2 = 30
41.15
1 +
1 0 0
10 570 000
n0 3 169.12
(500^
2
169.12
n3 44.29. Tomamos n 3 = 45
, 169.12
60
6 . 8 AFIJACION OPTIMA
Dado un tamaño de muestra total n para ser afijado entre los
estratos diferentes, éste puede ser repartido entre ellos con cual
quier criterio que especifiquemos. Sin embargo, sabemos que las
variancias de los estimadores en cada estrato son función del tama
ño de muestra asignado a cada uno de ellos, por ello es deseable
que el tamaño de muestra n h sea grande. Por otro lado, los costos
en que se incurre por concepto de transportación dentro de cada
estrato son variables. En algunos estratos resulta barato localizar a las
unidades en la muestra y efectuar la(s) medición(es) correspondien
te ^ ), en otros, resulta más o menos caro y aun, en algunos casos,
puede ser muy costoso; en estas condiciones no es conveniente que
los tamaños de muestra n h sean grandes. Estos dos factores, a saber
precisión y costos por estrato, son usados como lincamientos para
afijar de manera óptima la muestra total n entre los estratos.
Afijación óptima 139
sabemos que por ley deben estar registradas las empresas y solicitar
un listado de ellas. Si de esta manera pudie'ramos conseguir un
listado y, además, ocurriéramos a otros organismos, los cuales
igualmente deben contar con los mismos listados, obtuviéramos las
copias respectivas y procedie'ramos a compararlos, encontrari'amos
una divergencia entre ellos; por ejemplo, varias industrias que
aparecen en un listado no están en el otro, o si aparecen, están
registradas en una actividad económica diferente. Si ésta fuera la
situación, podríamos tratar de construir un solo listado combinan
do los contenidos de cada uno de ellos, aunque en ocasiones son
miles o decenas de miles de nombres y es un problema complicado
el tratar de conciliarios. De manera que obtener un marco muestral
adecuado puede significar una tarea laboriosa que requiere mucho
tiempo, equipo y personal.
En otras ocasiones, conseguir el equipo necesario que demanda
el me'todo de medición aprobado o entrenar adecuadamente al
personal que intervendrá en las diferentes etapas, se torna una
actividad crítica en el desarrollo general de la encuesta. Tambie'n,
en ocasiones, el llegar a un acuerdo sobre el cuestionario que
deberá ser usado en definitiva, requiere de una serie de reuniones
largas convocando a personal especializado y que derivan en un
retraso sustancial para todo el proceso.
Los comentarios anteriores los hacemos para hacer resaltar el
hecho de que en muchas ocasiones no vale la pena estar conside
rando refinamientos matemáticos que llevan a la obtención de
tamaños de muestra óptimos o a métodos de estimación complejos
y rebuscados que aunque teóricamente producen estimaciones muy
precisas, las aplicaciones o usos prácticos no los requieren o que
son tan complejos que las personas que deben interpretarlos se
confunden provocando que los cálculos se vuelvan más largos y que
todo el proceso quede más sujeto a errores.
n hd
y h d i
2 N hd 2
h i =1 nhd 2 NhdYhd
h_________ 6.22
Kd
2 Nh d 2 N hd
h
NhdS*h d
V ( V d ) = 7CT 6.24
( 2 Nhd)2 h nhd V N h d )
h
Yest ^ _ Yest
Y r c X
Xe st üc et 6.26
2
» N hy h
Yr c
2 Nhx h
h
1
V (Y * c ) = ?
nh Nh - 1
2
<*i ( l Yhi K) - R(xhl - X h)V 6.27
» Y est
donde R —
*est
En la situación en que sólo exista un estrato, el estimador YRC
en la expresión 6.26 coincide con el presentado en la ecuación 5.6
Estimación de medias y de totales 143
Nh
n hd
nh
luego, la expresión siguiente en un estimador del valor medio.
" hd
N¿L I
nh i - l yh di 6.31
K
Y d -~ - - d =
Nd n hd
h
i 2 ÍVU 1 ~ f h)
v (h ) iZ N h „
(„ — n hdy h n h (nh - 1 )
nh
nhd
2 2 yhdi
V _ h i = l_____ __
Yd ~ h2 n/1
hd 6 . 3 3
v ( 7 d) = -o if ^
(2 z>„d)2 M ,/í - N
h
( 2 tvhdi - y hd )2 + n hd ^i - í n r j y hd - ?d 'j J 6 34
Tabla 6.7
Municipio 1 2 3 4 5 6 7
No. de predios 400 175 1 320 4 200 150 3 075 800
Municipio 8 9 10 11 12 13
Tabla 6.8
No. de predios
Municipios ejidales
Zona 1 7, 4, 9 y 13 6 207
Zona 2 5 y 6 3 225
Zona 3 1, 2, 3 y 10 7 085
Zona 4 Resto del
estado 2 515
n2 = 3 225 - Í M , 34
19 032
( 200)
n3 = 7 085 -------- = 74.45 ; tomemos n 3 = 74*
19 032
n 4 = 300 - 65 - 34 - 74 = 127
* En el estudio concreto se usaron estos valores.
Estimación de medias y de totales 147
Tabla 6.9
Zona 1. Tractores:
1 0 0 0 1 0 0 1 1 3 1 0 0 0 1
PP 3 1 5 PP 1 1 2 0 0 1 0 0 0 0
0 0 7 1 3 1 1 1 1 2 0 3 1 1 2
0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
2 1 0 0 PP
Zona 1. Camiones:
0 0 0 0 0 0 0 1 0 1 0 0 0 0 0
PP 1 0 2 PP 0 0 0 0 0 0 0 0 0 0
0 0 3 0 0 0 0 1 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 1 0 0 PP
Zona 2 3 4
No. de camiones 4 55 0
4 n hd
y =l y_hdi _ 51 + 8 + 100 + 4
d ~ d nhd ~ 62 + 33 + 67 + 124
]_63_ q ^ Tractores por predio ejidal
286 ' tenga o no tenga el vehículo.
148 Muestreo estratificado
6.12 EJERCICIOS
6.13 Usando una variable auxiliar que tome como valores uno o cero según
que la unidad se encuentre o no en el dominio ¿Z-ésimo, muestre que la
ecuación 6.31 es un cociente de medias estratificadas, y que, por lo
tanto, es de la forma del estimador de razón combinado en la ecuación
6.26.
Donde
nh ~ - ,
Qh =2 ({yh ¡ - R x h i) - [yh - R x h))2
¡=i
Tabla 6.10
Tabla 6.11
Estrato 1 48 2 3 6 5
Estrato 2 127 3 7 9 8
Estrato 3 390 4 6 9 6
6.18 Hace 10 años se estimó el número medio de familias por manzana en las
400 manzanas de un poblado. Se pensó que este número dependía del
nivel socioeconómico de cada una de ellas y, así, las manzanas fueron
estratificadas en dos estratos de tamaños 60 y 340 respectivamente. Se
tom ó una muestra aleatoria de manzanas en cada estrato y se obtuvo
como resultado:
y i = 25 , y 2 = 55
j \ = 50 ,s \ = 170
M = 2 Mi,
V =y = 1 2 , 7.1.1
n
M i
en la cual = 2 y ¿ j* * El estimador de la variancia resulta ser:
j~ i
Y = Ny = ~ f y, 7.2.1
/-I
V(/Vy) =
/v2 (i - f) s (y,- - y )2
n n —1 7.2.2
2 y¡
■p = --------
n
j —M i
yi = 2 y¡j
;'= i
1 — f u , (y, —y)2
vvy =— =s------ :-----
7.3.2
I - f 1 ,¡~ n 2 1 ,1—rt
V W = - Hm
nM 2 n — 11 í=i y2¡ -
n (¿
_ 2
=i
i —n 1= N
donde: y
z y.- 2 Afi Ai
M = --------- = —
n /V /V
= i =N t _ i i=N
Y = 1 2 Yt ; Y = ^ 2 Yt
M i=, N f= ,
1S8 Muestreo por conglomerados y sistemático
Yr = ^ — M 7.4
2 Mi
N2 (1 - f ) 2 ( yt - P r M í )2
V(Y r ) =
n - 1
* V/ n
V
tr - y R - s
M 2 M>
7.5
1~ f 2 (y; ~ y * M¡)2
W r ) =
nM 2 /7 — 1
Tabla 7.1
1 15 30 11 20 30
2 18 54 12 30 30
3 12 12 13 22 42
4 15 15 14 15 30
5 10 10 15 20 40
6 20 80 16 16 24
7 15 30 17 18 45
8 16 32 18 20 40
9 18 54 19 25 25
10 18 36 20 25 75
20 ¡=20 20 M¡
2 M i = 368, 2 yi = 2 2 y v = 734
¡= i ,■= i ¿= i j =i
im 20 „ 20 M ‘ i= 20
2 yj = 2 ( 2 y a )2 = 33 336; 2 M¡yt = 14 241
¡ =i ¡= i ;= i i- 1
2 M f= 1 186
600 1 n
V(y) = ( )2 - £ 2 ü li
1 0 0 0 0 (20)19 n
= 0.06 (niños/empleado)2,
1 - f z y i - 2y R Z M¡y¡ + y ¿ £ M?
V(7«)
nM 2 n —1
600
=( ) 2 ^ ^ - ( 3 3 336 - 2 (1.99)(14 2 4 I)
1 0 0 0 0
2(7;
Pr = P r = ----- —100
2 Mi
7.6
(*)
1~ f 2 di2 ~ 2p R 2 Oí M í + Pr s M¡2
V (P « )
nM 2 n - 1
ÍT" Mj_
r;=i n
Tabla 7.2
No. de No. acumulado Intervalo de
Oficina empleados de empleados selección
* 1 20 20 1 a 20
2 10 30 21 a 30
* 3 15 45 31 a 45
4 25 70 46 a 70
* 5 20 90 71 a 90
f = p _ ¿ y*
ppt yPPt
1
n s M¡ v(y,p p t ) n(n
7.7
* En este libro nos restringimos al caso de selección con remplazo, aunque existen téc
nicas para muestrear con ppet. que no ¡a permiten. (Cochran, W.G. sección 9.14. 1963.
Sampling Techniques. J. Wiley & Sons. N.Y. segunda edición.
Ejercicios 165
^ ppt Myppt
7.8
V(V'ppr) = ^ 2 ( V ( 7 p P f ))
7.6 EJERCICIOS
7.2 En referencia al ejercicio 7.1, ¿de qué signo, y de qué valor cree usted
que sea la correlación entre el número de tarjetas y el número de
nombres?
E(yu - Y) ( y * - Y) 2 (yn-Y)(yik- 7 )
rho
E ( y ¡ j - Y )2 ( M - 1) ( N M - l) S 2
i - r
(1 + [M - 1) rho)
r,M
Tabla 7.3
O ficina N o . de N o . de empleados
empleados que respondieron
" s í"
1 15 3
2 18 10
3 12 10
4 15 12
5 10 10
6 20 8
7 15 10
8 16 13
9 18 11
10 18 9
11 20 15
12 30 30
13 22 17
14 15 9
15 20 13
16 16 10
17 18 14
18 20 8
19 25 12
20 25 15
7.5 En el ejercicio 7.3 aparece una relación que muestra la variancia del
estimador de la media muestral por elemento en términos del coeficiente
de correlación intraconglomerado. ¿Cuál es el valor mínimo que puede
tomar el coeficiente de correlación intraconglomerado según esta re
lación?
Tabla 7.4
1 200 0
2 232 0
3 210 3
4 305 1
5 244 25
6 290 3
7 185 100
8 227 11
9 261 0
10 298 0
11 250 1
12 273 43
13 209 17
14 260 3
15 240 1
16 210 55
17 190 40
18 229 7
19 255 2
20 232 0
21 288 10
22 240 0
23 227 4
24 239 14
25 248 11
26 225 1
27 220 3
28 220 1
29 229 1
30 240 98
Tabla 7.5
1 48 9 12
2 50 30 19
3 50 21 3
4 50 14 7
5 27 19 8
6 35 15 7
7 9 9 1
8 39 23 9
9 17 11 3
10 17 11 3
11 11 7 7
12 13 11 1
13 50 10 1
14 20 3 3
15 29 19 9
16 6 1 4
17 14 3 4
18 14 3 4
19 41 9 7
20 40 14 6
42
50
58
66
74 4
12
20
28
2 y¿
£ Ys is t
• • • + y n ))
= yjr (y i + Y2 + y 3 + . • • + Y n )
= Y *
P >’ 7,0
Ya que hay sólo k muestras posibles y cada una de ellas con elementos diferentes.
La muestra sistemática 175
1. _________________________________________
2. ________________________________________
Herrerías:
1. _________________________________________
2. ____________ ____________
70. ________________________
Fabricación de calzado:
1. _________________________________________
2. ________________________________________
•
40. _______________________________
176 Muestreo por conglomerados y sistemático
1 . ________________________
2. _________________________________________
90. ________________________
1 . _______________________
2. ________________________________________
50. _______________
Fabricación de ropa:
1 . _______________
2. __________________________
20. ________________
Talleres automotrices:
1 . ________________
2. _____________________________________
190. _______________________
Etc.
3 800 - 190
(57.89) (42.11) = 12.25
189(3 800)
al extraer su raíz cuadrada se obtiene el valor de 3.5% que es su
error estándar.
Tabla 7.6*
C ong/omerados
1 2 • • • 6 N 42
k
i 7>= 7 6
6 1 1 2 3 4 5 6
*2 2 7 8 9 10 11 12
s • 13 14 15 16 17 18
• 19 20 21 22 23 24
* 25 26 27 28 29 30
s
6 31 32 33 34 35 36
Ui 7 37 38 39 40 41 42
1 • • • 6
1 1 / 2 \ 3 4 5 6
2 7 1 8 9 10 11 12
3 13 I 14 15 16 17 18
O 4 19 l 20 21 22 23 24
2 5 25 l 26 , 27 28 29 30
Uj ’’ 6 31 \ 32 / 33 34 35 36
n == 7 37 \3 8 / 39 40 41 42
7.9 SU USO
47 1
Es decir, la fracción de muestreo general f u t f = f 1 • f 2 = J
47 1
y requerimos un censo en las primarias seleccionadas.
1410 30
94 1 94 1 _ 1_
S¡ fl = Í4 T Ó y ’ ^ = y e n to n c e s' f = í 410 2
30 '
Aquí'estamos solicitando 94 hojas en la muestra y dentro de cada
una de ellas entramos con fracción de muestreo 1 de cada 2. El
número de primarias en la muestra se ha duplicado. Otra opción
es usar 188 primarias en la muestra y dentro de cada una de ellas se-
188 1 1
leccionar a uno de cada cuatro nombres, es decir, f - ^ = J q-
A medida que aumentamos el número de primarias en la muestra
reducimos el número de nombres en la muestra dentro de cada hoja.
Si las listas de nombres siguen al orden de adscripción del personal
a cada uno de los departamentos u oficinas en la empresa, lo que
estamos haciendo al aumentar el número de primarias en la muestra,
es aumentar al número de departamentos u oficinas en ella, aumen
tando, por asi' decirlo, la dispersión de la muestra y por lo tanto,
evitando que se centralice, introduciendo tamaños de muestra rela
tivamente pequeños en cada oficina o departamento respaldados
en que usualmente ofrecen una correlación intraclase positiva (pocas
observaciones nos dicen lo mismo que muchas observaciones), y
el precio que se está pagando por ello, es tener que recorrer más
edificios o ciudades (digamos) buscando a las distintas oficinas
seleccionadas.
7.10 EJERCICIOS
7.8 En el ejercicio 7.1 sobre el archivo de nombres ordenado alfabética
mente,. /) ¿se puede suponer un "orden” aleatorio sobre los primeros
apellidos? , //) ¿Por qué? , ///) ¿Y sobre las longitudes de los primeros
apellidos?
N
7.9 Muestre que cuando lt=— no es entero, el uso de la muesLra cíclica,
n
hace que la media sistemática sea insesgada de la media poblacional.
7.10 Suponga que se cuenta con una lista de 100 alimentos que usualmentc se
consumen en una población y que en ella también aparecen los consu
mos promedios en gramos de alimento por persona. Un grupo de dic-
tislas está interesado en estimar el total de alimento en gramos consu
mido por persona sin tener en cuenta el tipo de alim ento.* La lista está
* El ejercicio es académico, ya que el total de alimento en gramos es la suma de las 100
cantidades, la cual puede ser obtenida sin dificultad.
Ejeicicios 183
1 10/1 10/1/74 04 1 S
2 9/1 14/1/74 07 3 S
3 20/1 21/1/74 23 7 S
4 14/1 25/1/74 12 2 T
5 28/1 28/1/74 07 3 M
6 30/1 30/1/74 14 1 S
7 27/1 1/11/74 19 3 S
184 Muestreo por conglomerados y sistemático
Diagnóstico
Hoja No. Fecha de Fecha de Tipo de de mayor M otivo del
ingreso egreso servicio relevancia ingreso
8 3/11 4/11 33 4 s
9 9/11 9/11 22 2 T
10 10/11 15/11 07 2 T
11 3/11 19/11 11 1 s
12 2/11 23/11 19 3 M
13 25/11 28/11 14 4 M
14 3/111 3/1(1 25 4 M
15 10/111 10/111 07 4 s
16 15/111 19/111 36 4 s
17 23/111 24/111 22 2 s
18 5 /IV 5/IV 04 4 s
19 19/111 11 /IV - ' 07 1 s
20 12/IV 13/IV 03 1 T
21 2 2/IV 22/IV 14 1 T
22 30/IV 2/V 35 1 M
23 9/V 9/V 29 1 s
24 19/V 19/V 18 3 s
25 5 /V I 5/Vl 06 5 M
26 1/VI 13/VI 20 2 T
27 17/VI 17/VI 36 5 s
28 1/V II 1/V II 14 4 s
29 7 /V ll 9 /V ¡l 04 4 s
30 1 0/V ll 1 4/V ll 10 6 s
31 2 0 /V ll 2 5 /V ll 18 3 s
32 7 /V lll 7 /V lll 04 5 T
33 1 5 /V lll 1 5 /V lll 04 5 s
34 1 9 /V lll 2 0 /V lll 35 4 T
35 1/IX 1/IX 19 4 s
36 5 /IX 5 /IX 08 4 s
37 7/1X 11/IX 04 2 s
38 3 0 /V lll 17/ IX - 07 1 s
39 5/X 8/X 30 7 s
40 18/X 18/X 19 2 s
41 27/X 27/X 13 3 s
42 3/XI 4/XI 08 1 s
43 10/XI 10/XI 24 3 s
4.:t 15/XI 16/XI 13 4 s
45 23/XI 23/XI 04 4 s
46 2 /X ll 2 /X ll 04 5 s
47 6 /X ll 8 /X ll 04 3 M
48 1 5 /X ll 1 7/X ll 14 4 M
49 2 5 /X ll 2 5 /X ll 01 1 M
50 2 7 /X ll 2 7/X ll 22 4 M
Ejercicios 185
7.12 Sobre el ejercicio 7.11 y de entre las personas curadas (motivo de egreso
S), estime el porcentaje de ellas que fueron atendidas tanto en el servicio
04 como en el 07.
Números aleatorios
74
90
25
01
41
37
25
CAPITULO
SUBMUESTREO
8.2. SUBMUESTREO
8.3 NOTACION
mi
yi = £ ya ; yi = y mt
N M • N
Y =2 2 yu = 2 y±
N N
N M i N i =N
y = s S yu = S y¡ = A J I
*
N N M
2 M¡ 2 M¡
N Mi N
Y= 2 2 yu = 2 y¡.
« .i
es decir, para estimar una media por elemento, habiendo hecho una
selección aleatoria en la primera y segunda etapas del submuestreo,
debemos calcular las medias muéstrales de cada conglomerado en la
muestra y t, y 2, . . y¡, . . y n ; m ultiplicar a cada una de ellas por
el tamaño del conglomerado respectivo M X, M 2> . . ., M„ . Mn ;
hacer la suma de estos productos y al resultado afectarlo por el
* Debemos notar que en submuestreo (ver también la nota en el apartado 7.2), los valores
poblacionales pueden definirse a nivel de conglomerado o unidad primaria y a nivel de
elemento o_unidad secundaria. Para referirnos a la media por unidad primaria ponemos
una barra (V) en tanto que para referirnos a la media por unidad secundaria o elemento
ponemos dos barras (V].
Estimadores insesgados de la media 193
-|
V(P) =JTBT1V +„-¡v»! i M? (1
nM t l i ] m;
8 .2
En esta e x p re s ió n :
f - —
fl = N 1
f - mi
' 21 Mi
r m 22
_ '''
f22 —
—
f . = -xr-_
f2 ‘ A7¿
f
'2 n
— /7/»
“ T7“
Mn
y además:
,2 = '"s" (M ¡y¡ - M j7 )2
** 1 n — T
. T l ( y j - .J71 ) 2
52
52 1 = —
A771 — 1
j- m 2
2 (y2¡ -.Y2 )2
s2 _ j = 1
s22
m2 — l
194 Submuestreo
Figura 8.2
Tabla 8.1
Primaria 1 2 3 4 5 6
No. de
comercios 400 200 650 300 100 350
No. de
comercios
submues-
treados 20 10 33 15 5 18
512 36 1329 62 3 77
= 1 7.92 empleados/comercio
Entonces:
21 031 830
6(30) (300)2
8.4
= 1-h
V(F r nW s> + nNMr
T ih * s 8.5
m¡
Donde: s? S M j (y¡ - y R ) 2
n - 1 y
Y r = ? r $ M, , V( Y r ) = (S M i)2 V (? R ) 8 .6
Ejemplo 8.2 Usando los datos del ejemplo 8.1 anterior podemos
volver a calcular las estimaciones ahí' solicitadas, pero usando los
estimadores de razón propuestos en este apartado:
Según la expresión 8.4
= _ í M¡y¡ 32 265 . , .
yn — ñ------~ nnnn ~ 16.13 empleados/comercio.
£ M¡ 1 uuu
s] = ~ = j ( 5 3 481 945)
= 10 6 9 6 3 8 9;
Estimadores de razón de la media 199
1 _ A
V(Ph) = 6(3Ó^ ( 1 0 6 9 6 3 8 9 )+ 1-29 = 15.85 + 1.29
= 17.14 (empleados/comercio ) 2
Tabla 8.2
Conglomerado
primario 1 2 3 4 5 6 7 8 9 10 Suma
No. de agricul
tores por uni
d a d primaria 78 100o 400 2200 700 1400 500 2000 3000 3000 14278
Mi
Unidades pri
marias en la
muestra
*= 3 5 ?.
2 A f ? ( l - f 2 i ) £ ' = 2 771 2 0 8
1 -^ -
^ = 3(1 428)¿ <1 9 5 2 3 336) 4 3(10) (1 428)*2
= 2 .2 3 + 0 .0 4 5 3 = 2 .2 8
Estimadores de razón de la media 201
Tabla 8.3
Primaria 1 2 3
Fracción de muestreo
en las secundarias f2¡ 0.01 0.01 0.01
= _ .2= 2 2 100
Y fi = Y R = ---------- = 3 7 0 0 = 6 .5 h¡í° s p ° r agri cu 1t o r ‘
1: M¡
¡= i
n - 1
1 520 000
760 000
A - 1 -T W
V (p R ) = 3 ( 7 3 0 8 )2 (7 6 0 0 0 0 ) + 0 .0 4 5 3
= 0 .0 8 7 + 0 .0 4 5 3 = 0 .1 3 2
Estimadores de razón de la media 203
y su error estándar vale 0.364 hijos por agricultor; por lo cual los
intervalos del 95% de confianza para esta media son:
f= f . f =_L 1 = 1
r ri T2 18 5 90
Es decir, entrar a la selección de primarias con fracción de mues-
treo 1 de cada 18, y dentro de ellas, seleccionar a personas con
fracción 1 de cada 5. Otra propuesta es f - f x • f 2 = 9 J q = ~§q ■
En ambos casos no se asegura el terminar con 100 personas
exactamente. SI deseamos 50 agricultores en la muestra y tenemos
1 0 primarias, las siguientes son dos maneras de seleccionarlos:
w = _L 1 = 1
n T 10 28.556 285.56
-1 f = - L 1 = 1
T 10 142.78 285.56
h =L __
2 Mhy h
h = |_______
ye»t h~ L 8.7
~ i Mh
h 2
h
Mh n 2
[-¡¡d
h~¡
V(FJ 8.8
8.8 EJERCICIOS
8.4 Los estimadores 8.1 y 8.4 se vuelven autoponderados cuando f 2.- = f 2 una
constante; en este caso, encuentre la estructura de ellos y de sus respec
tivos estimadores de variancia.
8.5 Suponga que lodos los conglomerados son de tamaño igual M, y que la
fracción de muestreo de las secundarias es constante, f 2 = m/M. ¿Qué
estructura adquieren 8.1 y 8.2?
8.6 Un organismo público desea llevar a cabo una encuesta de opinión sobre
sus 130 000 empleados. Ellos se encuentran repartidos en 30 delegaciones
regionales dispersas en los estados de la República Mexicana incluyendo a
la capital del país. La nómina es elaborada de manera independiente en la
capital y en cuatro delegaciones diferentes. Una vez que ésta ha sido
elaborada se reparte a los diferentes estados y de esa manera se les paga a
los empleados.
Ejercicios 207
8.7 Indique los estimadores que deberían ser empleados en cada uno de los
esquemas de muestreo propuestos para el caso del ejercicio anterior, 8.6.
8.8 En una escuela con 30 salones se desea hacer una selección sistemática de
2 salones y dentro de cada salón, elegir pupitres con fracción de muestreo
1 de cada 20. Los salones y el número de pupitres por salón son como sigue:
Salón 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
No. de pupitres 20 25 20 27 26 25 48 30 25 40 21 20 27 35 38
Salón 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
No. de pupitres 30 40 43 48 40 21 21 25 27 29 35 40 42 42 45
39
48
30
07
209
RESPUESTAS A LOS EJERCICIOS
7 18
1.2 i) 118, ii) 5.9, Hi) ^ 100 = 35%,iv) — = 0 .1 5 3 , v) ~ = 2.57
zU lio /
90
3.4 — 100 = 50%, error estándar = 7 .9 9 3
* 22°
3.5 R = = 3.01, error estándar = 0 .3 9 8
c i) ¿¡ = 58.148, Ls = 64.052
¿ ¡ = 4 3 110.4 Ls = 49 289.6
¿ ¡= 3 8 1 4 1 .4 ¿s = 42 067
, 240
6.3 n = 120, / nx = ----- 120 = 72, r>2 = 30, n3 = 18
400
120
i i) n ¡ = r¡2 = n 3 = — = 40
522.9
6.16 Para los m olinos--------= 2.452,
213.3
383.6
para los molinos-tortiMerías--------= 1.091
351 .7
6.17 Usando afijación proporcional se obtiene n = 178
7.12 34.38%
INDICE ALFABETICO
Afijación en la estimación, 69
óptima, 138 Esperanza matemática, 30
proporcional, 123 definición, 30
Atributos de los elementos, 17 de la med¡a muestra!, 47
Azar, 27,70 propiedades, 30
Caracteri'stica de los elementos, 17, Estimación
42 de cocientes, 46
Caracterización de la distribución nor de medias, 45
mal, 32 de porcentajes y de proporciones,
Censo, 1 3, 19 46
Cociente poblacional, 19 de totales, 46
Coeficiente de correlación ¡ntraconglo- de varianzas, 54, 78
merado, 161 por intervalos, 50
Concentración, 21,35 puntual, 50
Confianza, 33, 70 Estimador, 33
Conglomerados, 152 de primera etapa, autoponderado, 124,206
190 consistente, 34,47
Consistencia, 47 definición, 34
Covariancia, 32 de razón,89, 94
Desviación o error estándar, 29 de razón combinado, 141
en la distribución normal, 33 de razón en el submuestreo, 197
Diseño de muestreo, 33, 36 insesgado, 34
Dispersión, 21,35 sesgado, 34
Distribución Estratos, 11 3
de probabilidades, 27,28 Factor de corrección por población
hipergeome'trica, 59 fin ita , 52
normal, 32 Finalidad del muestreo, 36
Dominios de estudio, 17, 97, 103 Fracción
Elementos, 16 de muestreo,50,52
muéstrales, 16 de muestreo en el submuestreo,
falsos, 22 194
Encuesta, 15 Insesgamiento, 47
encuesta o prueba pilota, 79 Intervalos de confianza, 29, 33, 50,
Enumeración completa, 19 58
Error Intervalos de variación de una variable
de medición, 20 aleatoria, 21
215
216 Indice
ES TA O B R A S E T E R M IN O D E IM PR IM IR E L D IA
27 D E E N E R O DE 19B 7, E N LOS T A L L E R E S D E
I M P R E S I O N E S E D I T O R I A L E S , S . A.
LAGO C H ALC O 230, CO L. A N A H U A C
M EX IC O , D. F.
518
Esta obra es un libro de texto para el curso de muestreo
probabil ístico que se imparte a estudiantes de licenciatura de
las carreras de Ciencias Sociales, Economía, Administración,
Actuaría y Ciencias de la Comunicación. En el libro no se hace
énfasis en el rigor matemático, sino en las aplicaciones de ias
técnicas de nr.jestreo probabil ístico en las áreas sociales y eco
nómico-administrativas.
La exposición es clara y sencilla y se presentan en secuencia
temas tales como conceptos de muestreo y estadística, mues
treo aleatorio simple, tamaño de la muestra, muestreo estra
tificado, muestreo por conglomerados, muestreo sitemático y
submuestreo. Además, en todos los capítulos hay ejemplos
resueltos para facilitarle al estudiante el tema expuesto~y al
terminar cada capítulo hav ejercicios cuvas respuestas están al
final del libro.