Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4
Muestreo aleatorio estratificado
77
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
se les aplica un muestreo aleatorio simple para elegir los elementos concretos que forma-
rán parte de la muestra y obtener así las estimaciones de los parámetros que nos interesan.
En ocasiones, las dificultades que plantean los estratos son demasiado grandes, pues exi-
gen un conocimiento detallado de la población, como tamaño geográfico, género, edades,
niveles de estudio, etcétera (Pérez, 2000).
1. Produce estimaciones más precisas que las que se obtienen a partir del muestreo
aleatorio simple.
Notación
Para esta técnica de muestreo necesitamos una notación adicional que distingue los ele-
mentos de la población, como la siguiente:
78
M UESTREO ALEATORIO ESTRATIFICADO
79
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Para comprender mejor las expresiones que nos darán la estimación de µ y τ, debemos
tomar en cuenta que ȳ h es un estimador insesgado de µh y que N ȳ h es un estimador in-
!Nh
sesgado del total del estrato τh = i =1 y hi , tal como en el muestreo aleatorio simple. Hasta
aquí todo parece razonable, como formar el estimador de τ (τ̂) con la suma de los τ̂h y de
esta manera construir un estimador para la media de la población al dividir τ̂ entre N , el
cual hereda la propiedad de insesgamiento (Scheaffer, 1987).
Nótese que se ha usado el subíndice est r en ȳ para señalar que la estimación se hace
con el muestreo estratificado. Dado que cada estrato se maneja de manera independiente,
las ȳ k con h = 1, 2, . . . E también son independientes. Por lo tanto, la varianza de ȳ est r es la
suma de las varianzas de las medias de cada estrato. Este estimador es insesgado.
80
M UESTREO ALEATORIO ESTRATIFICADO
!
" % &' 2 (
" 1 $ E N h − n h Sh
ȳ est r ± t (n−1,α/2) # 2 Nh2
N h=1 Nh nh
!
" E
"$
ȳ est r ± t (n−1,α/2) # Wh2 S 2ȳ h
h=1
E
$
τ̂est r = N ȳ est r = N1 ȳ 1 + N2 ȳ 2 + . . . + NE ȳ E = Nh ȳ h
h=1
% &' (
2 2
E
$ Nh − n h S h2
V̄ (N ȳ est r ) = N V ( ȳ est r ) = N Wh2 (4.1)
h=1 Nh nh
El intervalo de confianza
!
" E % &' 2 (
"$ N h − n h Sh
N ȳ est r ± t (n−1,α/2) # Nh2
h=1 Nh nh
81
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Cuando se decide precisar el tamaño de muestra se debe tomar en cuenta varios fac-
tores como el tipo de muestreo, el parámetro a estimar, la precisión admisible, la varianza
poblacional y el nivel de confianza de la inferencia. Además, dependiendo de las estrategias
de asignación, se puede recurrir a información más específica o adicional.
De aquí se puede concluir que cuanto mayor sea el tamaño muestral en los estratos,
se obtendrá información más precisa, por lo que a los estratos grandes les corresponden
tamaños muestrales grandes. También es fácil inferir que si en algún estrato hay mucha va-
riabilidad debe considerarse un tamaño de muestra mayor.
Por último, es importante considerar que si el costo de obtener una observación varía
entre estratos, se deberá tomar muestras pequeñas en estratos donde el costo sea alto y vi-
ceversa, con el fin de minimizar el costo total del muestreo. Así, la calidad de la información
que se obtenga en las estimaciones provendrá directamente de n, ya que al incrementarse
ésta, la varianza de la media decrecerá. Para lograr la precisión deseada usamos:
!
d M = t (n−1,α/2) V (θ̄)
82
M UESTREO ALEATORIO ESTRATIFICADO
En este caso, Wh también es igual a Nh /N y d T es el tamaño del error que se desea acep-
tar en la estimación del total.
La asignación de la muestra
N1 N2 Nh
n1 = n, n 2 = n, . . . , n h = n
N N N
Los estratos más grandes requieren un tamaño de muestra mayor, es decir, la asignación
de n entre los estratos es proporcional al tamaño del estrato.
83
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
A veces, es una tarea sencilla debido a que los estratos están implícitos y se conoce el com-
portamiento con base en registros antiguos, nuestra experiencia o simplemente en la na-
turaleza de los resultados que deseamos obtener.
¿Con base en qué se delimitan los estratos? Una primera aproximación es el caso cuanti-
tativo. Habrá que construirlos dado un interés particular, porque muchas veces sólo hasta
el momento de diseñar la investigación se conocen los rangos de las estimaciones. Pero
también podría tener el rango de salida de los datos y algunas frecuencias en categorías
generales de la variable de interés o de alguna variable altamente correlacionada. En este
caso podemos usar el sencillométodo acumulativo de la raíz cuadrada de la frecuencia.
3. Se forman dos columnas más, una constituida por la raíz de las frecuencias y otra por
su raíz acumulada.
6. Se puede delimitar con las marcas de clase por estrato, eligiendo la raíz de la frecuen-
cia acumulada más cercana a la marca de clase y así cada estrato estará formado por
todas las clases de la variable original que correspondan a la marca de clase.
84
M UESTREO ALEATORIO ESTRATIFICADO
Ejemplos
Ejemplo 4.1 En Tecomán, Colima, hay 780 parcelas sembradas con limón. Se desea estimar el pro-
medio de plantas por hectárea, que en determinada etapa del cultivo se infectaron
de alguna enfermedad. De acuerdo con las condiciones ecológicas en la región se
siembran tres variedades de limón. Considerando que el desarrollo de la enferme-
dad puede ser distinto de una variedad a otra, la población de parcelas se estratificó
en E = 3 estratos. Los tamaños de los estratos son: N1 = 270, N2 = 180 y N3 = 330; N =
N1 + N2 + N3 = 780. Suponga que para realizar las estimaciones se tomó una muestra
de n = 63 parcelas. Los datos se presentan en el cuadro 4.1.
48 53 64 20 31 45 74 68 77
62 45 47 36 17 26 70 72 73
59 65 54 15 30 18 78 76 69
45 48 46 40 25 35 69 80 74
50 60 63 24 29 30 80 78 71
55 57 46 19 42 27 72 71 79
64 61 54 33 51 48 76 75 68
Ejemplo 44.1
Ejemplo 4.1 a) Realice la estimación puntual del promedio de plantas infectadas por hectárea.
N1 ȳ 1 + N2 ȳ 2 + N3 ȳ 3
ȳ est r =
N
donde N1 = 270, N2 = 180, N3 = 330 y N = 780.
48 + 62 + 59 + . . . + 46 + 64
ȳ 1 = = 54.5714
21
20 + 36 + 15 + . . . + 27 + 48
ȳ 2 = = 30.5238
21
74 + 70 + 78 + . . . + 79 + 68
ȳ 3 = = 73.8095
21
Por lo tanto:
85
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
44, 581.5
ȳ est r = = 57.1612 plantas infectadas por parcela
780
τ̂est r = N ŷ est r
Por lo tanto:
86
M UESTREO ALEATORIO ESTRATIFICADO
Ejemplo 4.1 d) Estime por intervalo la media estratificada con una confiabilidad de 95 %.
Por lo tanto:
57.1558 ± (1.96)(0.7967)
57.4579 ± 1.5551
55.5943 ≤ µest r ≤ 58.7173
Ejemplo 4.1 e) Halle por intervalo el total de plantas infectadas en la población con una confiabi-
lidad del 95 %.
donde τ̂est r = 44, 581.524, N = 780, Zα/2 = Z0.025 = 1.96 y S ȳ est r = 0.7934.
Por lo tanto:
Ejemplo 4.1 f) Suponga que n = 63 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de ± 3 % de la media estratificada y una con-
fiabilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño
del estrato.
E
!
N (Zα/2 )2 Wh S h2
h=1
n= "E
N d 2 + (Z α/2 )
2
h=1
Wh S h2
donde Zα2 = Z0.025 = 1.96, d = (.03)(57.1611) = 1.7148 y además:
E
! N1 2 N2 2 N3 2
Wh S h2 = S + S + S = 48.7679.
h=1 N 1 N 2 N 3
87
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Ejemplo 44.1
(780)(1.96)2 (48.7679)
n= = 59 parcelas (muestra)
(780)(1.7146)2 + (1.96)2 (48.7679)
N1 270
n1 = n= (59) = 20
N 780
N2 180
n2 = n= (59) = 14
N 780
N3 330
n3 = n= (59) = 25
N 780
Ejemplo 4.1 g) Suponga que n = 63 es una muestra preliminar. Determine el tamaño de muestra
para estimar el total con una precisión de ± 3 % del total estratificado y con una con-
fiabilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño.
E
!
N 2 (Zα/2 )2 Wh S h2
h=1
n=
E
!
d 2 + (Zα/2 )2 Wh S h2
h=1
"E
donde d = (0.03)(44, 585.628) = 1, 337.568 y h=1
Wh S h2 = 48.7679.
Por lo tanto:
Ejemplo 4.2 La Facultad de Lenguas Extranjeras de la Universidad de Colima desea estimar el pro-
medio y el total de faltas justificadas que tuvieron los alumnos en un año determina-
88
M UESTREO ALEATORIO ESTRATIFICADO
do. Al suponer que podrían encontrarse diferencias según el grado de estudios (pri-
mero, segundo, tercero y cuarto año), se decidió usar el muestreo estratificado. De
esta manera, la población de N = 400 estudiantes que alberga la Facultad quedó es-
tratificada así: Estrato 1 (primer año): N1 = 120 alumnos, Estrato 2 (segundo año):
N2 = 100 alumnos, Estrato 3 (tercer año): N3 = 90 alumnos, Estrato 4 (cuarto año):
N4 = 90 alumnos. Se seleccionó una muestra de n = 40 alumnos: 12 para el estrato 1,
10 para el estrato 2, 9 para el estrato 3 y 9 para el estrato 4 (cuadro 4.2).
7 6 4 4 3 4 3 3
6 7 5 6 3 4 2 2
7 7 4 4 3 3 3 5
8 8 5 6 4 4 4 2
5 5 6 6 4 5
4 6
Ejemplo 4.1
7+6+7+...+5+6
ȳ 1 = = 6.3333
12
4+5+4+...+6+6
ȳ 2 = =5
10
3+3+3+...+3+4
ȳ 3 = = 3.5556
9
3+2+3+...+5+2
ȳ 4 = = 3.2222
9
Por lo tanto:
89
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
72 + 62 + 72 + . . . + 52 + 62 − (12)(6,3333)2
S 12 = = 1.5152
12 − 1
42 + 52 + 42 + . . . + 62 + 62 − (10)(5)2
S 22 = = 0.8889
10 − 1
32 + 32 + 32 + . . . + 32 + 42 − (9)(3.5556)2
S 32 = = 0.2728
9−1
32 + 22 + 32 + . . . + 52 + 22 − (9)(3.2222)2
S 42 = = 1.4444
9−1
ŷ est r = N ȳ est r
Por lo tanto:
Ejemplo 4.1 d) Halle el intervalo para la media estratificada con una confiabilidad de 95 %.
Por lo tanto:
4.675 ± (1.96)(0.1547)
4.3717 ≤ µest r ≤ 4.9783
90
M UESTREO ALEATORIO ESTRATIFICADO
Esto significa que el promedio de fallas justificadas está entre 4.3717 y 4.9783.
Ejemplo 4.1 e) Cuantifique por intervalo el total estratificado con una confiabilidad de 95 %.
Por lo tanto:
1, 870 ± (400)(1.96)(0.1547)
1, 870 ± 121.3201
1, 748.6821 ≤ τest r ≤ 1, 991.3179
Esto quiere decir que el total de plantas infectadas por hectárea está entre 1,748.6821
y 1,991.3179.
Ejemplo 4.1 f) Suponga que n = 40 es una muestra preliminar. ¿Cuál es el tamaño de muestra para
estimar la media con una precisión de 5 % de la media estratificada y una confiabili-
dad de 95 %? Además, distribuya n entre los estratos en forma proporcional al tamaño
del estrato.
E
!
N (Zα/2 )2 Wh S h2
h=1
n=
E
!
N d 2 + (Zα/2 )2 Wh S h2
h=1
"E N1 2 N2 2 N3 2
Wh S h2 = S + S + S .
h=1 N 1 N 2 N 3
Ejemplo 4.1
(400)(1.96)2 (1.0643)
n= = 63.05353 alumnos (muestra)
(400)(0.2337)2 + (1.96)2 (1.0643)
91
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
N1 120
n1 = n= (64) = 19.2
N 400
N2 100
n2 = n= (64) = 16
N 400
N3 90
n3 = n= (64) = 14.4
N 400
N4 90
n4 = n= (64) = 14.4
N 400
Ejemplo 4.1 g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar el total con una precisión de 5 % del total estratificado y una confiabili-
dad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño.
E
!
N 2 (Zα/2 )2 Wh S h2
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh S h2
h=1
"E
donde d = (0.05)(4.675)(400) = 93.5 y h=1
Wh S h2 =1.0643.
Por lo tanto:
Ejemplo 4.3 El gobierno del Estado de Chiapas desea estimar el ingreso promedio mensual (miles
de pesos) de las familias chiapanecas. Supóngase que el total de familias es de 6,000.
Por otro lado, el Estado tiene 3 zonas geográficas bien definidas (costa, centro y altos)
y entre ellos existen diferencias marcadas respecto al ingreso; por ello, para realizar
el estudio se estratificó al Estado en k = 3 estratos: estrato 1 (zona costa): N = 2, 000;
estrato 2 (zona centro): N = 1, 500 y estrato 3 (zona altos): N = 2, 500.
92
M UESTREO ALEATORIO ESTRATIFICADO
10 09 8 9 4 5
11 08 8 9 3 2
12 12 8 8 2 3
10 12 7 4 3
09 13 6 3 4
08 14 9 5 4
13 11 9 4
14 8 3
Ejemplo 4.1
10 + 11 + 12 + . . . + 14 + 11
ȳ 1 = = 11.0667
15
8+8+8+...+9+8
ȳ 2 = = 8.0909
11
4+3+2+...+4+4
ȳ 3 = = 3.5
14
Por lo tanto:
τ̂est r = N ȳ est r
Por lo tanto:
93
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Ejemplo 4.1 d) Estime por intervalo la media estratificada con una confiabilidad de 95 %.
ȳ est r ± Z α2 S ȳ est r
Por lo tanto:
7.1699 ± (1.96)(0.2140)
7.1699 ± 0.4196
6.750375 ≤ µest r ≤ 7.589541
Ejemplo 4.1 e) Estime mediante intervalo el total estratificado con una confiabilidad de 95 %.
τ̂est r ± N Z α2 S ȳ est r
94
M UESTREO ALEATORIO ESTRATIFICADO
Ejemplo 4.1 f) Supóngase que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 5 % de la media estratificada y una confia-
bilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño del
estrato.
E
!
N (Z α2 )2 Wh S h2
h=1
n=
E
!
N d 2 + (Z α2 )2 Wh S h2
h=1
Ejemplo 4.1
N1 2, 000
n1 = n= (57.6349) = 19.2116
N 6, 000
N2 1, 500
n2 = n= (57.6349) = 14.4087
N 6, 000
95
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
N3 2, 500
n3 = n= (57.6349) = 24.0145
N 6, 000
Ejemplo 4.1 g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
definitivo para estimar el total con una precisión de 5 % del total estratificado y una
confiabilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al ta-
maño.
K
!
N 2 Z α2 Wi S i
i =1
n=
K
!
d 2 + N Z α2 Wi S i2
i =1
"E
donde d = (0.05)(43019.69670) = 2150.9849 y h=1
Wh S h2 =1.4969.
Por lo tanto:
Ejemplo 4.4 En el Estado de Colima hay N = 3,200 familias. Se desea estimar el número de ho-
ras promedio por día que cada familia ve televisión. Sin embargo, se sabe que en el
Estado existen tres estratos sociales bien definidos: clase baja, media y alta. Consi-
derando que el número de horas de ver televisión puede ser distinto de estrato a es-
trato, la población se dividió en k = 3 estratos, los cuales son: estrato 1 (clase baja):
N = 1, 000 familias; estrato 2 (clase media): N = 1, 600 familias y estrato 3 (clase alta):
N = 600 familias.
7 08 5 5 4 4
6 07 6 5 7 3
6 08 7 6 8 4
7 09 5 6 6 5
8 10 7 7 6 4
Ejemplo 4.1
96
M UESTREO ALEATORIO ESTRATIFICADO
7 + 6 + 6 + . . . + 9 + 10
ȳ 1 = = 7.60
10
5+6+7+...+6+6
ȳ 2 = =6
15
4+3+4+...+5+4
ȳ 3 = =4
5
Ejemplo 4.1 Por lo tanto:
(1, 000)(7.60) + (1, 600)(6) + (600)(4.00)
ȳ est r =
3, 200
19, 600
ȳ est r = = 6.125 horas diarias en promedio
3, 200
τ̂est r = N ȳ est r
Por lo tanto:
97
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Por lo tanto:
! " ! "! " ! " ! "! "
1, 000 2 1, 000 − 10 1.60 1, 600 2 1, 500 − 15 1.1421
S 2y est r = +
3, 200 1, 000 10 3, 200 1, 600 15
! "2 ! "! "
600 600 − 5 0.50
+ = 0.0378
3, 200 600 5
# "
S y est r = S y est r = 0.0378 = 0.1945
Ejemplo 4.1 d) Estime mediante intervalo la media estratificada con una confiabilidad de 95 %.
Por lo tanto:
5.4875 ± (1.96)(0.1945)
5.4875 ± 0.38122
5.1081 ≤ µest r ≤ 5.8669
Esto significa que el promedio de horas por día que las familias de Colima ven te-
levisión está entre 5.1081 y 5.8669.
Ejemplo 4.1 e) Estime el intervalo del total estratificado con una confiabilidad de 95 %.
donde τ̂est r = 17, 560, N = 3, 200, Zα/2 = Z0.025 = 1.96 y S y est r = 0.1945.
Por lo tanto:
17,560 ± (3,200)(1.96)(0.1945)
17,560 ± 1,272.96
16,345.9 ≤ τest r ≤ 18,774.1
Entonces, el total de horas por día que las familias de Colima ven televisión está entre
16,345.9 y 18,774.1.
Ejemplo 4.1 f) Suponga que n = 30 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 5 % de la media estratificada y una confia-
bilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño de
cada estrato.
98
M UESTREO ALEATORIO ESTRATIFICADO
E
!
N (Zα/2 )2 Wh S h2
h=1
n=
E
!
N d 2 + (Zα/2 )2 Wh S h2
h=1
"E N1 2 N2 2 N3 2
Wh S h2 = S + S + S = 1.1652.
h=1 N 1 N 2 N 3
Ejemplo 4.1 Por lo tanto:
Ejemplo 4.1
Ejemplo 4.1 g) Suponga que n = 30 es una muestra preliminar. Determine el tamaño de muestra
definitivo para estimar el total con una precisión de 5 % del total estratificado y con
una confiabilidad de 95 %. Además, realice la asignación de n a cada estrato en forma
proporcional al tamaño.
E
!
N 2 Zα2 Wh S h2
h=1
n=
E
!
d 2 + N Zα2 Wh S h2
h=1
"E
donde d = (0.05)(17, 560) = 878 y h=1
Wh S h2 =1.1652.
99
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Ejercicios
En los ejercicios siguientes estime un IC para la media y el total con una confiabilidad de 95 %. Su-
ponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuál es el tamaño de muestra
para estimar la media y el total de tal manera que sean estimados con una precisión de 5 % de la
media y el total preliminar con una confiabilidad de 95 %?
Ejercicio 4.1 La química llevó a cabo un estudio con el objetivo de estimar el número de colifor-
mes fecales que son bioindicadores de contaminación en el Río Colima, cuya longi-
tud es de N = 15, 000 metros, de los cuales N1 = 4, 000 metros pertenecen a la zona
pre-urbana, N2 = 8, 000 corresponden a la zona urbana, y N3 = 3, 000 a la zona post-
urbana. Cabe mencionar que este estudio se realizó en las cuatro estaciones del año
2004, pero aquí presentamos solamente los resultados de la primavera. Para el estu-
dio se tomó una muestra de n = 15 metros distribuidos de la siguiente manera: n 1 = 4
metros para la zona pre-urbana, n 2 = 8 metros para la zona urbana, y n 3 = 3 metros
para la zona post-urbana. Los resultados se presentan en el cuadro 4.5.
Ejemplo 4.1
Ejercicio 4.2 La Secretaría de Educación desea estimar el promedio de calificaciones de los egresa-
dos de una normal superior. En la escuela hay tres licenciaturas: Educación Preesco-
lar, Educación Primaria y Educación Secundaria. En 2007 la población de egresados
100
M UESTREO ALEATORIO ESTRATIFICADO
Ejercicio 4.3 Un investigador desea estimar el daño promedio de tres cepas causantes de la enfer-
medad de chagas. Supóngase que 300 ratones tienen la cepa uno, 350 la cepa dos y
350 la cepa tres. Además, como se espera que el daño varíe dependiendo de la cepa,
se toma una muestra estratificada de tamaño n = 50 de la población (cuadro 4.7).
Ejercicio 4.4 En una entidad hay tres variedades de nances (500 plantas de la variedad uno; de la
dos, 10,000; y de la tres, 7,000 plantas) y se quiere estimar el promedio de taninos por
árbol. Se toma una muestra de n = 44 plantas distribuidas de la siguiente manera:
n 1 = 10 (variedad 1), n 2 = 20 (variedad 2) y n 3 = 14 (variedad 3) (véase el cuadro 4.8).
Cuadro 4.6 Calificaciones de egresados Cuadro 4.7 Daño promedio de las cepas
4 6 6 4 7
5 5 5 5 7
4 7 6 5 7
3 6 5 4 6
5 5 6 6
5 5 7 7
4 6 5 7
3 6 5 6
2 5 5 5
5 5 7 4
Ejemplo 4.1
101
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Defínase: !
1 éxito
y h,i =
0 fracaso
que representa al i -ésimo componente del h-ésimo estrato. El éxito consiste en tener la ca-
racterística C .
Esta variable se comporta como una variable aleatoria del tipo binomial, por lo que el
estimador de la proporción de la característica de interés para el estrato h es:
nh
" y h,i
ph =
i =1 nh
1 1 "E
p st = (N1 p 1 + ... + NE p E ) = Nh p h
N N h=1
E
"
τ̂st = (N1 p 1 + ... + NE p E ) = Nh p h = N p st
h=1
102
M UESTREO ALEATORIO ESTRATIFICADO
1 ! E
= N 2 S 2 (proporción)
N 2 h=1 h p h
"E
= h=1
Nh2 S 2p h (total)
( E
)2 !
N t (n−1,α/2) Wh p h q h
h=1
n=
E
!
2
N dM + (t (n−1,α/2) )2 Wh p h q h
i =1
103
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Asignación de la muestra
Nh
ni = n = Wh n; i = 1, 2, . . . , h,
N
o específicamente como:
N1 N2 Nh
n1 = n, n 2 = n, . . . , n h = n
N N N
Nótese que a los estratos más grandes les corresponderá un tamaño de muestra mayor,
o sea, la asignación de n entre los estratos es proporcional al tamaño de cada estrato.
Ejemplos
Ejemplo 4.5 En Colima hay N = 5, 000 personas mayores de 60 años (N1 = 2, 600 son mujeres y
N2 = 2, 400 son hombres). Para estimar el porcentaje y el total de personas que pade-
cen diabetes, se tomó una muestra aleatoria de n = 220, donde n 1 = 120 son mujeres
y n 2 = 100 son hombres. Se estratificó la población porque la enfermedad es influida
por el género. De las mujeres, 40 padecen diabetes y de los hombres, 50.
104
M UESTREO ALEATORIO ESTRATIFICADO
!n 1
i =1 40
p1 = = = 0.327731
n1 120
!n 2
i =1 50
p2 = = = 0.5
n2 100
Por lo tanto:
1 2, 066.6667
p st = (2, 600(0.3333) + 2, 400(0.5)) = =41.33 % de enfermos
5, 000 5, 000
τ̂ = N p st
Por lo tanto:
1
S 2p h = ((2, 600)2 (0.0017663) + (2, 400)2 (0.002396))
5, 0002
= 0.001030
$ "
Sp = S 2p = 0.001030 = 0.0321
p st ± t α/2,n−1 S p h
105
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Por lo tanto:
0.4133 ± (1.645)(0.0321)
0.4133 ± 0.0528
0.355066 ≤ P ≤ 0.4609255
La proporción verdadera de personas que padece diabetes está entre 35.50 y 46.09 %.
Ejercicio 4.1 e) Realice una estimación por intervalo para el total estratificado.
τ̂ ± N t α/2,n−1 S p s t
Por lo tanto:
2,006.6667 ± (5000)(1.645)(0.0321)
2,006.6667 ± 264
1, 775.331715 ≤ τst ≤ 2, 304.627542
Ejercicio 4.1 f) Suponga que n = 220 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 0.05 y una confiabilidad de 90 %. Además,
realice la asignación de n a cada estrato en forma proporcional al tamaño del estrato.
E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1
"E N1 N2
h=1
Wh S h2 = p 1 q1 + p 2 q 2 = 0.2356.
N N
Estratos Ni ph qh Whphqh
Ejemplo 4.1
106
M UESTREO ALEATORIO ESTRATIFICADO
N1 2, 600
n1 = n= (242) = 126
N 5, 000
N2 2, 400
n2 = n= (242) = 116
N 5, 000
Ejercicio 4.1 g) Suponga que n = 220 es una muestra preliminar. Determine el tamaño de mues-
tra para estimar la proporción con una precisión de 250 y una confiabilidad de 95 %.
Además, haga la asignación de n a cada estrato en forma proporcional al tamaño.
E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n= !
d 2 + N (Zα/2 )2
"E
d = (0.05)(5, 000) = 250 y h=1
Wh p h q h =0.2356.
Por lo tanto:
Ejemplo 4.6 Una empresa que produce artículos electrónicos tiene tres líneas de producción. La
línea uno produce N1 = 2, 000 artículos por hora, la dos N2 = 1, 500 y la tres produce
N3 = 2, 500. La producción total por hora es de N = 6, 000. Con la finalidad de esti-
mar el porcentaje y total de artículos defectuosos producidos por hora, se tomó una
muestra aleatoria de n = 150 artículos distribuidos de la siguiente manera: n 1 = 50 de
la línea uno, n 2 = 30 de la línea dos y n 3 = 70 de la línea tres, debido a que las líneas
de producción no son idénticas y se sospecha que el número de artículos defectuosos
por líneas son diferentes. En la muestra de la línea uno (n 1 ) se encontraron 4 defec-
tuosos; en la muestra de la línea dos, 3; y en la línea tres hubo 8 defectuosos.
107
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
!n 1
i =1
p1 = = 450 = 0.08
n1
!n 2
i =1
p2 = = 330 = 0.1
n2
!n 3
i =1
p3 = = 870 = 0.1143
n3
Por lo tanto:
1
p st = (2, 000(0,08) + 1, 500(0.1) + 2, 500(0.1142))
6, 000
1 595.7142
p st = (160 + 150 + 285.7142) = = 0.0992 ó 9.92 % artículos
6, 000 6, 000
τ̂ = N p st
Por lo tanto:
1
S 2p h = ((2, 000)2 (0.0014) + (1, 500)2 (0.0029) + (2, 500)2 (0.0014)) = 0.000579
6, 0002
$ "
S ph = S 2p = 0.000579 = 0.0240
108
M UESTREO ALEATORIO ESTRATIFICADO
p st ± t α/2,n−1 S p h
Por lo tanto:
0.0992 ± (1.645)(0.0242)
0.0992 ± 0.039809
0.0594 ≤ P ≤ 0.1390
Ejercicio 4.1 e) Realice una estimación por intervalo del total poblacional.
τ̂ ± N t α/2,n−1 S p s t
Por lo tanto:
595.8 ± (6000)(1.645)(0.024)
595.8 ± 236.88
356.555 ≤ τst ≤ 834.8730
El total de artículos electrónicos defectuosos que se producen por hora está entre
358.92 y 832.68.
Ejercicio 4.1 f) Suponga que n = 150 es una muestra preliminar. Determine el tamaño de mues-
tra para estimar la media con una precisión de 0.05 y con una confiabilidad de 90 %.
Además, asigne n a cada estrato en forma proporcional al tamaño del estrato.
E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1
109
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Por lo tanto:
Estratos Ni ph qh Whphqh
Ejemplo 4.1
Ejercicio 4.1 g) Suponga que n = 150 es una muestra preliminar. Determine el tamaño de mues-
tra para estimar la proporción con una precisión de ± 300 y con una confiabilidad de
90 %. Además, distribuya n entre los estratos en forma proporcional al tamaño.
E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh p h q h
h=1
"E
donde d = (0.05)(6, 000) = 300 y h=1
Wh p h q h = 0.0892
Ejemplo 4.7 La Secretaría de Educación Pública del Estado de Colima desea conocer el porcentaje
y el total de personas que ven telenovelas. Suponga que la población de individuos en
el Estado es de N = 10, 000, de los cuales 30 % son niños (estrato 1), 50 % son jóvenes
(estrato 2) y el resto son adultos (estrato 3). Se estratificó la población de esa forma
ya que los hábitos televisivos son muy diferentes entre niños, jóvenes y adultos. Para
110
M UESTREO ALEATORIO ESTRATIFICADO
estimar el porcentaje y total de personas que ven telenovelas se tomó una muestra
aleatoria de n = 300 individuos distribuidos de la siguiente manera: n 1 = 90 del estra-
to uno, n 2 = 150 del estrato dos y n 3 = 60 del estrato tres. Los resultados fueron: en el
estrato uno, 30 niños; en el dos, 70; y en el estrato tres, 40.
Ejercicio 4.1 a) Haga la estimación de la proporción estratificada de personas que ven telenovelas.
1
p st = (N1 p 1 + N2 p 2 )
N
donde N = 10, 000, N1 = 3, 000, N2 = 5, 000 y N3 = 2, 000.
!n 1
i =1 30
p1 = = = 0.3333
n1 90
!n 2
i =1 70
p2 = = = 0.4666
n2 150
!n 3
i =1 40
p3 = = = 0.6666
n3 60
Por lo tanto:
1
p st = (3, 000(0.3333) + 5, 000(0.4666) + 2, 000(0.6666))
10, 000
1 4, 666.6667
p st = (1, 000 + 2, 333.3333 + 1, 333.3333) = = 46.67 %
10, 000 10, 000
τ̂ = N p st
Por lo tanto:
111
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
! "# $ # $
N12 − n 1 p 1 q1 3, 000 − 90 (0.3333)(0.6667)
S 2p 1 = = = 0.0024
N1 n1 3, 000 90
! "# $ # $
N22 − n 2 p 2 q2 5, 000 − 150 (0.4667)(0.5333)
S 2p 2 = = = 0.0016
N2 n2 5, 000 150
! "# $ # $
N32 − n 3 p 3 q3 2, 000 − 60 (0.6667)(0.3333)
S 2p 3 = = = 0.0036
N3 n3 2, 000 60
Por lo tanto:
1
S 2p h = ((3, 000)2 (0.0024) + (5, 000)2 (0.0016) + (2, 000)2 (0.0035)) = 0.00076
10, 0002
% "
S p = S 2p = 0.00076 = 0.0276
p st ± t α/2,n−1 S p h
Por lo tanto:
0.4667 ± (1.645)(0.0276)
0.4667 ± 0.0454
0.42228 ≤ P ≤ 0.51329
Esto significa que la proporción verdadera de personas que ven telenovelas está entre
42.13 y 51.21 %, con una confiabilidad de 90 %.
Ejercicio 4.1 e) Estime por intervalo el total estratificado con una confiabilidad de 90 %.
τ̂ ± N t α/2,n−1 S p s t
Por lo tanto:
112
M UESTREO ALEATORIO ESTRATIFICADO
El total de personas que ven televisión está entre 4,212.7259 y 5,120.6074, con una
confiabilidad de 90 %.
Ejercicio 4.1 f) Suponga que n = 300 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 0.05 y una confiabilidad de 90 %. Además,
realice la asignación de n a cada estrato en forma proporcional al tamaño del estrato.
E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1
Estratos Ni ph qh Whphqh
Ejemplo 4.1
Ejercicio 4.1 g) Suponga que n = 300 es una muestra preliminar. Halle el tamaño de muestra defi-
nitivo para estimar la proporción con una precisión de ± 500 y confiabilidad de 90 %.
Además, haga la asignación de n a cada estrato en forma proporcional al tamaño.
113
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh p h q h
h=1
"E
donde d = 500 y h=1
Wh p h q h = 0.2356.
Por lo tanto:
Ejemplo 4.8 En la Facultad de Filosofía se desea conocer el porcentaje y total de alumnos que han
leído Cien Años de Soledad de Gabriel García Márquez. El número total de alumnos es
de N = 600, de los cuales 29 % son de primer grado (estrato 1), 25 % de segundo grado
(estrato 2), 23 % de tercer grado (estrato 3) y 23 % de cuarto grado (estrato 4). Se estrati-
ficó la población de esa forma debido a que los hábitos de lectura entre los grados son
diferentes. Para estimar este porcentaje y el total, se tomó una muestra aleatoria de
n = 40 individuos distribuidos de la siguiente manera: n 1 = 13 del estrato uno, n 2 = 12
del estrato dos, n 3 = 8 del estrato tres y n 4 = 7 del cuarto estrato. Los alumnos que han
leído el libro fueron 7, 6, 5 y 5 en el estrato 1, 2, 3 y 4, respectivamente.
114
M UESTREO ALEATORIO ESTRATIFICADO
τ̂ = N p st
Por lo tanto:
τ̂ = (600)(0.5892) = 353.52
! "# $ # $
N22 − n 2 p 2 q2 150 − 12 (0.500)(0.500)
S 2p 2 = = = 0.02088
N2 n2 150 12
! "# $ # $
N32 − n 3 p 3 q3 138 − 8 (0.625)(0.375)
S 2p 3 = = = 0.02759
N3 n3 138 8
! "# $ # $
N42 − n 4 p 4 q4 138 − 7 (0.7143)(0.2857)
S 2p 4 = = = 0.02767
N4 n4 138 7
Por lo tanto:
1
S 2p h = ((174)2 (0.0177) + (150)2 (0.0192) + (138)2 (0.0276) + (138)2 (0.0277))
6002
= 0.00561
% "
Sp = S 2p = 0.0056 = 0.0749
115
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
p st ± t α/2,n−1 S p h
Por lo tanto:
0.5892± (1.645)(0.0749)
0.5892± 0.1232
0.465995 ≤ P ≤ 0.712384
Esto significa que la proporción verdadera de lectores varía entre 46.60 y 71.24 %, con
una confiabilidad de 90 %.
Ejercicio 4.1 e) Estime por intervalo el total poblacional, con una confianza de 90 %.
τ̂ ± N t α/2,n−1 S p s t
Por lo tanto:
353.52 ± (600)(1.645)(0.0749)
353.52 ± 37.6108
279.597 ≤ τst ≤ 427.43
El total de alumnos lectores fluctúa entre 279.597 y 427.43, con una confiabilidad de
90 %.
Ejercicio 4.1 f) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 0.05 y una confiabilidad del 90 %. Además,
asigne n a cada estrato en forma proporcional al tamaño del estrato.
E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1
116
M UESTREO ALEATORIO ESTRATIFICADO
Estratos Ni ph qh Whphqh
Ejemplo 4.1
(600)(1.645)2 (0.2354)
n= = 179 personas (muestra)
(600)(0.05)2 + (1.645)2 (0.2354)
N1 174
n1 = n= (179) = 52
N 600
N2 150
n2 = n= (179) = 45
N 600
N3 138
n3 = n= (179) = 41
N 600
N4 138
n4 = n= (179) = 41
N 600
Ejercicio 4.1 g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar la proporción con una precisión de ± 30 y una confiabilidad de 90 %.
Además, haga la asignación de n a cada estrato en forma proporcional al tamaño.
E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh p h q h
h=1
"E
donde d = (0.05)(600) = 30 y h=1
Wh p h q h = 0.2354.
Por lo tanto:
117
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
Ejercicios
En los ejercicios estime los parámetros siguientes:
b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuál es el tamaño de
muestra para estimar la proporción y el total estratificado de tal manera que la proporción
y el total sean estimados con una precisión de 5 % de la proporción y el total preliminar con
una confiabilidad de 95 %?
Ejercicio 4.5 Un investigador estudió los niveles de colesterol sérico en 500 personas mayores de
45 años (300 mujeres y 200 hombres). Dado que piensa que el género influye en la va-
riable respuesta, estratificó la población por género. Para poder estimar la cantidad
de personas que tiene altos niveles de colesterol, tomó una muestra aleatoria simple
de 120 personas: 84 hombres y 36 mujeres. Al momento de realizar las mediciones
encontró que 3 mujeres y 5 hombres tenían un alto nivel de colesterol.
Ejercicio 4.6 Un agrónomo sembró tres variedades de manzanas. En total, sembró 5,000 plantas:
1,000 pertenecen a la variedad uno, 2,500 a la dos y 1,500 a la tres. Para calcular el
porcentaje y el total de plantas dañadas por una plaga X, tomó una muestra aleatoria
de 250 plantas: 100 de la primera variedad, 100 de la segunda y 50 de la tercera. El
número de plantas dañadas por estrato es el siguiente: 15 plantas en la variedad uno,
4 en la variedad dos y 6 en la variedad tres.
Ejercicio 4.7 En una población urbana de 3,500 personas del Estado de Michoacán, se desea cono-
cer la cantidad de personas que utilizan Internet. Supóngase que en dicha población
45 % son adolescentes, 30 % niños y el resto adultos. Para estimar el porcentaje y to-
tal de personas que utilizan Internet se tomó una muestra aleatoria de 600 individuos
distribuidos de la siguiente manera: adolescentes: n 1 = 200, niños: n 2 = 150 y adultos:
n 3 = 250. Los resultados del número de personas que usan Internet por estrato son:
70, 30 y 40, respectivamente.
Ejercicio 4.8 A un centro de salud asisten aproximadamente 7,000 personas de los cuales 4,000 son
adolescentes y 3,000 son adultos. Se desea conocer el porcentaje de personas que ha-
cen ejercicio diariamente y para ello se toma una muestra aleatoria de 350 individuos
(150 son adolescentes y 200 adultos) y se les pregunta si hacen ejercicio diariamente.
Los resultados obtenidos son los siguientes: 12 en el estrato de adolescentes hacen
ejercicio diariamente, mientras que 6 en el de adultos.
118