Está en la página 1de 42

C APÍTULO

4
Muestreo aleatorio estratificado

En este mundo complejo,


nunca es fácil elegir.
Pero con datos y muestras,
tú lo podrás conseguir.
De una forma inteligente,
que te conduzca a un buen fin.
OAML

C UANDO el costo de la investigación es excesivo y la población es heterogénea, el mues-


treo aleatorio simple no es, en principio, una buena opción. Por esta razón, este ca-
pítulo brinda la opción del Muestreo Aleatorio Estratificado (MAE), que trata de hacer aún
más precisas las estimaciones que se pueden obtener con un diseño básico de muestreo
como el aleatorio simple (Cochran, 1985).

..Muestreo aleatorio estratificado


Si la población de N individuos se divide en E subpoblaciones o estratos que
no se traslapan, con respecto a criterios que puedan ser importantes en el es-
tudio y tratando en la medida posible que exista homogeneidad dentro de cada
estrato. Los estratos contienen N1 , ..., NE unidades muestrales, de manera que
!
N = Eh Nh , y en cada uno de estos estratos o subpoblaciones se realiza un mues-
treo aleatorio simple con muestras respectivas de tamaño n h , así que la muestra
estratificada de tamaño n es igual a la suma de todas las muestras de cada estrato,
!
es decir, n = Eh=1 n h .

En general, los estratos naturales o convenientemente definidos deberán ser homogé-


neos internamente y heterogéneos entre ellos, con respecto a la variable bajo estudio. Cada
unidad muestral debe estar incluida en solo un estrato, o sea, no debe haber traslapes en-
tre los estratos. Las unidades que se incluyan en un estrato deben tener un valor similar
en cuanto a la variable de interés, aunque al no conocer esos valores, se puede usar otra
característica para formar los estratos con la esperanza de lograr que los valores sean muy
parecidos dentro de cada estrato. Los estratos formados funcionan independientemente, y

77
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

se les aplica un muestreo aleatorio simple para elegir los elementos concretos que forma-
rán parte de la muestra y obtener así las estimaciones de los parámetros que nos interesan.
En ocasiones, las dificultades que plantean los estratos son demasiado grandes, pues exi-
gen un conocimiento detallado de la población, como tamaño geográfico, género, edades,
niveles de estudio, etcétera (Pérez, 2000).

El MAE se utiliza cuando la población es muy heterogénea y las consideraciones de costo


limitan el tamaño de la muestra. Si no se toma en cuenta la variabilidad y posiblemente los
costos diferenciados y utilizamos el muestreo aleatorio simple, las estimaciones podrían
ser menos precisas o el costo sería demasiado elevado. Por otro lado, para la población
estratificada habrá que determinar dos tamaños de muestra: para la población y para cada
estrato, n y n h , respectivamente.

4.1. Ventajas de utilizar el MAE


Algunos motivos para utilizar muestreo aleatorio estratificado en lugar del muestreo alea-
torio simple son:

1. Produce estimaciones más precisas que las que se obtienen a partir del muestreo
aleatorio simple.

2. El costo por observación puede ser reducido mediante la estratificación de la pobla-


ción.

3. Se puede obtener información de parámetros poblacionales para cada estrato de la


población.

4. Se simplifica el trabajo administrativo y el de control, ya que se puede usar personal


específico para cada estrato.

5. El tamaño de muestra será menor, si la estratificación está bien definida, en compa-


ración con el muestreo simple aleatorio.

Notación

Para esta técnica de muestreo necesitamos una notación adicional que distingue los ele-
mentos de la población, como la siguiente:

N : el número total de unidades muestrales en la población.


E : el número de estratos en la población.
h : un estrato.
Nh : el número total de unidades en el estrato h.
n h : el número de unidades en la muestra en el estrato h.
i : alguna unidad muestral que siempre pertenece a algún estrato h.

78
M UESTREO ALEATORIO ESTRATIFICADO

y hi : el valor obtenido en la i-ésima unidad dentro del estrato h.


Wh = Nh /N : la ponderación, peso o tamaño relativo del estrato h.
f h = n h /Nh : la fracción de muestreo para el estrato h.
!nh
y hi
ȳ h = i =1 : la media muestral del estrato h.
!nh n h !nh 2
(y − ȳ h )2
i =1 hi
y − n h ȳ h2
2
Sh = = i =1 hi : la varianza en el estrato h.
nh − 1 nh − 1
Si se desea conocer la cantidad de horas promedio que cierto grupo de personas de
una ciudad ve la televisión, debemos pensar que habrá niños, jóvenes y adultos, y que el
tiempo de horas libres varía de un grupo a otro. De esta manera dividimos la población
en tres estratos, ya que es lógico afirmar que las tendencias dentro de cada estrato son
similares y son homogéneas. También podemos entender que el número total de personas
de la población es la suma de los elementos de los estratos. Otro ejemplo es el siguiente:
si queremos conocer el ingreso promedio de las familias en Colima, donde se supone que
existen tres clases sociales bien definidas, podemos considerar las familias de la misma
clase social como un estrato, ya que es homogéneo.

4.2. ¿Cómo seleccionar una muestra aleatoria estratificada?


La selección de la muestra de cada estrato es diferente, ya que cada uno tiene características
y costos de medición distintos, por lo que el número de unidades también será diferente.
Por ejemplo, el tamaño de la muestra del estrato debe ser mayor si es muy variable o si con-
tiene más unidades. Por el contrario, será menor si el costo de la medición es elevado. Antes
de seleccionar una muestra es preciso considerar qué tan grande debe ser la precisión de
estimación y de acuerdo con esto, seleccionar el tamaño de la muestra (Cochran, 1985).

En resumen, de un estrato dado se toma una muestra más grande si:

1. El estrato es más grande.

2. Los elementos del estrato tienen alta variabilidad.

3. El muestreo es más barato en el estrato.

4.3. La estimación de la media poblacional


Supongamos que ya hemos tomado nuestra muestra aleatoria estratificada, y entonces
nos preguntamos, ¿cómo debemos usarla para estimar los principales parámetros? Es de-
cir, contestarnos preguntas como: ¿cuál es la media de nuestra población? o ¿cuál es el to-
tal? Si µh y τh son la media y el total para el estrato h, respetivamente, resulta obvio que
τ1 + τ2 + ... + τE = τ, donde τ es el total de la población.

79
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Para comprender mejor las expresiones que nos darán la estimación de µ y τ, debemos
tomar en cuenta que ȳ h es un estimador insesgado de µh y que N ȳ h es un estimador in-
!Nh
sesgado del total del estrato τh = i =1 y hi , tal como en el muestreo aleatorio simple. Hasta
aquí todo parece razonable, como formar el estimador de τ (τ̂) con la suma de los τ̂h y de
esta manera construir un estimador para la media de la población al dividir τ̂ entre N , el
cual hereda la propiedad de insesgamiento (Scheaffer, 1987).

El estimador de la media estratificada


!E
h=1
Nh ȳ h
ȳ est r =
N

Nótese que se ha usado el subíndice est r en ȳ para señalar que la estimación se hace
con el muestreo estratificado. Dado que cada estrato se maneja de manera independiente,
las ȳ k con h = 1, 2, . . . E también son independientes. Por lo tanto, la varianza de ȳ est r es la
suma de las varianzas de las medias de cada estrato. Este estimador es insesgado.

El estimador de la varianza de la media estratificada


1 " #
S 2ȳ est r = V ( ȳ est r ) = 2 N12V̂ ( ȳ 1 ) + N22V̂ ( ȳ 2 ) + . . . + NE2 V̂ ( ȳ E )
N
$ % &' 2 ( % & ' 2 ()
1 N 1 − n 1 S 1 N E − n E SE
= 2 N12 + . . . + NE2
N N1 n1 NE nE
% & ' 2(
1 * E Nh − n h S h
= 2 Nh2
N h=1 Nh nh
2% &' 2 (
* Nh Nh − n h S h
E
= 2
h=1 N Nh nh
% & ' 2(
*E Nh − n h S h
= Wh2
h=1 Nh nh
*E
= Wh2 S 2ȳ h
h=1

El siguiente paso es la obtención del intervalo de confianza de nuestra estimación.


Cuando hay pocos grados
+ de libertad en cada estrato, el procedimiento para calcular el
error de muestreo (t V̄ ( ȳ est r )), consiste en leer el valor de t en las tablas de la t -Student,
como se hizo en el muestreo aleatorio simple, y cuando es mayor de 30 utilizaremos la tabla
Z de la normal estándar.

80
M UESTREO ALEATORIO ESTRATIFICADO

El intervalo de confianza para la estimación de la media estratificada

!
" % &' 2 (
" 1 $ E N h − n h Sh
ȳ est r ± t (n−1,α/2) # 2 Nh2
N h=1 Nh nh
!
" E
"$
ȳ est r ± t (n−1,α/2) # Wh2 S 2ȳ h
h=1

Se ha revisado lo referente al estimador de la media estratificada; sin embargo, en oca-


siones el principal interés es conocer el total de la población, por ejemplo el gasto total
semanal de las familias o el total de personas que visitan algún puerto durante Semana
Santa, o quizá la cantidad de personas que consumen un producto cualquiera.

El estimador del total estratificado

E
$
τ̂est r = N ȳ est r = N1 ȳ 1 + N2 ȳ 2 + . . . + NE ȳ E = Nh ȳ h
h=1

La varianza se deduce de la varianza de la media y hereda sus propiedades. Para estimar


la varianza, la media y el total, debe haber al menos dos observaciones en cada estrato.

La varianza del estimador del total estratificado

% &' (
2 2
E
$ Nh − n h S h2
V̄ (N ȳ est r ) = N V ( ȳ est r ) = N Wh2 (4.1)
h=1 Nh nh

La desviación estándar se necesita para crear un intervalo de confianza del total.

El intervalo de confianza

!
" E % &' 2 (
"$ N h − n h Sh
N ȳ est r ± t (n−1,α/2) # Nh2
h=1 Nh nh

81
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

La determinación del tamaño de la muestra

Es tiempo de planear las unidades muestrales que se deben seleccionar aleatoriamente en


toda la población, y las de los estratos, para constituir una muestra que satisfaga una pre-
cisión deseada, d .

Cuando se decide precisar el tamaño de muestra se debe tomar en cuenta varios fac-
tores como el tipo de muestreo, el parámetro a estimar, la precisión admisible, la varianza
poblacional y el nivel de confianza de la inferencia. Además, dependiendo de las estrategias
de asignación, se puede recurrir a información más específica o adicional.

Anteriormente, se revisaron los elementos estadísticos que se deben tomar en cuenta


para obtener un tamaño de muestra preciso; sin embargo, existen otros factores que son
fundamentales para tomar una decisión al respecto. Para la asignación de la muestra a cada
estrato también se requiere información sobre:

El número total de elementos del estrato.

La variabilidad de las observaciones del estrato.

El costo que representa muestrear cada estrato.

De aquí se puede concluir que cuanto mayor sea el tamaño muestral en los estratos,
se obtendrá información más precisa, por lo que a los estratos grandes les corresponden
tamaños muestrales grandes. También es fácil inferir que si en algún estrato hay mucha va-
riabilidad debe considerarse un tamaño de muestra mayor.

Por último, es importante considerar que si el costo de obtener una observación varía
entre estratos, se deberá tomar muestras pequeñas en estratos donde el costo sea alto y vi-
ceversa, con el fin de minimizar el costo total del muestreo. Así, la calidad de la información
que se obtenga en las estimaciones provendrá directamente de n, ya que al incrementarse
ésta, la varianza de la media decrecerá. Para lograr la precisión deseada usamos:
!
d M = t (n−1,α/2) V (θ̄)

donde V (θ̄) es la varianza del estimador de interés y α es el nivel de significancia.

El tamaño de muestra para estimar la media estratificada


E
"
N (t (n−1,α/2) )2 Wh S h2
h=1
n=
E
"
2
N dM + (t (n−1,α/2) )2 Wh S h2
h=1

82
M UESTREO ALEATORIO ESTRATIFICADO

En la ecuación anterior Wh = Nh /N , mientras que d M es el margen de error (precisión)


que se desea aceptar en la estimación de la media.

El tamaño de muestra para estimar el total estratificado


E
!
N 2 (t (n−1,α/2) )2 Wh S h2
h=1
n=
E
!
d T2 + N (t (n−1,α/2) )2 Wh S h2
h=1

En este caso, Wh también es igual a Nh /N y d T es el tamaño del error que se desea acep-
tar en la estimación del total.

La asignación de la muestra

Como se expresó, el muestreo estratificado involucra h estratos y por tanto, h tamaños de


muestra, n 1 , n 2 , . . . , n h correspondientes a los estratos en que se divide la población. Asimis-
mo, se tiene el tamaño de muestra total n, el cual es la suma de los h tamaños de muestra
relacionados con los estratos. Se debe tener presente que el número de unidades del es-
trato influye en el tamaño de muestra. Así, se asignará un tamaño de muestra mayor a los
estratos más grandes y uno menor a los estratos más chicos. A los estratos que más aportan
a la variabilidad, es decir, los estratos menos homogéneos, les corresponderá un tamaño
de muestra mayor. De los estratos donde el costo por unidad sea alto, se tomarán muestras
más pequeñas. Por lo tanto, existen diferentes métodos de asignación de la muestra.

Por su simplicidad, en la práctica se recurre con frecuencia a la denominada asignación


proporcional. Este procedimiento de asignación es recomendable cuando se sabe que los
estratos tienen tamaños diferentes, que la variabilidad entre estratos se desconoce, pero
puede suponerse ligeramente similar y que la variabilidad en el estrato más pequeño es
menor que la del estrato más grande; en cuanto al costo por unidad, se asume que es igual o
que no cambia entre estratos. El criterio de asignación proporcional, suponiendo que ya se
ha calculado el tamaño de la muestra n requerido, consiste en determinar una parte de n, la
cual será proporcional al tamaño del estrato. Algebraicamente, el criterio está representado
por n i = [(Nh )/N ]n = Wh n donde i = 1, 2, . . . , h o específicamente como:

N1 N2 Nh
n1 = n, n 2 = n, . . . , n h = n
N N N

Los estratos más grandes requieren un tamaño de muestra mayor, es decir, la asignación
de n entre los estratos es proporcional al tamaño del estrato.

83
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

4.4. La selección de estratos


En ocasiones es sencillo delimitar los elementos que corresponden a cada estrato, pero
¿siempre es así? Definitivamente no. En estadística, cada problema es una nueva experien-
cia, la cual no necesariamente tiene una respuesta única y un razonamiento lógico para
llegar a la solución más satisfactoria. Este trabajo puede resultar un poco complicado y tor-
narse desesperante en algunas ocasiones, por lo que a continuación se dan algunas ideas
útiles.

¿Qué hago cuando. . . ?


¿Cómo delimitar los estratos?
¿Se debe estratificar después de seleccionar la muestra?

A veces, es una tarea sencilla debido a que los estratos están implícitos y se conoce el com-
portamiento con base en registros antiguos, nuestra experiencia o simplemente en la na-
turaleza de los resultados que deseamos obtener.

¿Con base en qué se delimitan los estratos? Una primera aproximación es el caso cuanti-
tativo. Habrá que construirlos dado un interés particular, porque muchas veces sólo hasta
el momento de diseñar la investigación se conocen los rangos de las estimaciones. Pero
también podría tener el rango de salida de los datos y algunas frecuencias en categorías
generales de la variable de interés o de alguna variable altamente correlacionada. En este
caso podemos usar el sencillométodo acumulativo de la raíz cuadrada de la frecuencia.

Los pasos del método acumulativo de la raíz cuadrada de la frecuencia:

1. Elegimos el número de estratos que se desea obtener.

2. Sacamos por rangos la frecuencia de la variable de interés, o en su defecto a una al-


tamente correlacionada con ella. Con estos resultados formamos una columna de
datos.

3. Se forman dos columnas más, una constituida por la raíz de las frecuencias y otra por
su raíz acumulada.

4. Se divide la frecuencia acumulada final entre el número de estratos. Este resultado es


el ancho de la clase (AC).

5. Se utiliza la ecuación AChi = h ∗ AC; h = 1, 2, ...n, donde h representa el estrato h.

6. Se puede delimitar con las marcas de clase por estrato, eligiendo la raíz de la frecuen-
cia acumulada más cercana a la marca de clase y así cada estrato estará formado por
todas las clases de la variable original que correspondan a la marca de clase.

84
M UESTREO ALEATORIO ESTRATIFICADO

Ejemplos
Ejemplo 4.1 En Tecomán, Colima, hay 780 parcelas sembradas con limón. Se desea estimar el pro-
medio de plantas por hectárea, que en determinada etapa del cultivo se infectaron
de alguna enfermedad. De acuerdo con las condiciones ecológicas en la región se
siembran tres variedades de limón. Considerando que el desarrollo de la enferme-
dad puede ser distinto de una variedad a otra, la población de parcelas se estratificó
en E = 3 estratos. Los tamaños de los estratos son: N1 = 270, N2 = 180 y N3 = 330; N =
N1 + N2 + N3 = 780. Suponga que para realizar las estimaciones se tomó una muestra
de n = 63 parcelas. Los datos se presentan en el cuadro 4.1.

Cuadro 4.1 Plantas infectadas por hectárea

Estrato 1 Estrato 2 Estrato 3


(n1 = 21) (n2 = 21) (n3 = 21)

48 53 64 20 31 45 74 68 77
62 45 47 36 17 26 70 72 73
59 65 54 15 30 18 78 76 69
45 48 46 40 25 35 69 80 74
50 60 63 24 29 30 80 78 71
55 57 46 19 42 27 72 71 79
64 61 54 33 51 48 76 75 68

Ejemplo 44.1

Ejemplo 4.1 a) Realice la estimación puntual del promedio de plantas infectadas por hectárea.

El estimador de la media estratificada en este caso es,

N1 ȳ 1 + N2 ȳ 2 + N3 ȳ 3
ȳ est r =
N
donde N1 = 270, N2 = 180, N3 = 330 y N = 780.

48 + 62 + 59 + . . . + 46 + 64
ȳ 1 = = 54.5714
21
20 + 36 + 15 + . . . + 27 + 48
ȳ 2 = = 30.5238
21
74 + 70 + 78 + . . . + 79 + 68
ȳ 3 = = 73.8095
21
Por lo tanto:

(270)(54.57) + (180)(30.52) + (330)(73.80)


ȳ est r =
780

85
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

44, 581.5
ȳ est r = = 57.1612 plantas infectadas por parcela
780

Ejemplo 4.1 b) Realice la estimación puntual del total de plantas infectadas.

El estimador del total estratificado es:

τ̂est r = N ŷ est r

donde N = 780 y ŷ est r = 57.1612.

Por lo tanto:

τ̂est r = (780)(57.1612) = 44, 585.736 plantas infectadas

Ejemplo 4.1 c) Calcule la varianza del promedio estratificado.

El estimador de la varianza del promedio poblacional es:


! "2 ! " # 2 $ ! "2 ! "# 2 $
N 1 N 1 − n 1 S 1 N 2 N 2 − n 2 S2
S 2ȳ est r = +
N N1 n1 N N2 n2
! "2 ! "# 2 $
N3 N3 − n 3 S 3
+
N N3 n3
donde N1 = 270, N2 = 180, N3 = 330, N = 780 y n 1 = n 2 = n 2 = n 3 = 21.

482 + 622 + 592 + . . . + 462 + 542 − (21)(54.57)2


S 12 = = 50.3571
21 − 1
202 + 362 + 152 + . . . + 272 + 482 − (21)(30.52)2
S 22 = = 107.2619
21 − 1
742 + 702 + 782 + . . . + 792 + 682 − (21)(73.80)2
S 32 = = 15.5619
21 − 1
Por lo tanto:
! "2 ! "! " ! " ! "! "
270 270 − 21 51.7709 180 2 180 − 21 107.2619
S 2ȳ est r = +
780 270 21 780 180 21
! "2 ! "! "
330 330 − 21 15.5619
+ = 0.6348
780 330 21
% "
S ȳ est r = S 2ȳ est r = 0.6348 = 0.7967

86
M UESTREO ALEATORIO ESTRATIFICADO

Ejemplo 4.1 d) Estime por intervalo la media estratificada con una confiabilidad de 95 %.

ȳ est r ± Zα/2 S ȳ est r

donde N = 780, ȳ est r = 57.4579 y Zα/2 = Z0.025 = 1.96.

Por lo tanto:

57.1558 ± (1.96)(0.7967)
57.4579 ± 1.5551
55.5943 ≤ µest r ≤ 58.7173

El promedio de plantas infectadas por hectárea en la población está entre 55.5943


y 58.7173.

Ejemplo 4.1 e) Halle por intervalo el total de plantas infectadas en la población con una confiabi-
lidad del 95 %.

τ̂est r ± N Zα/2 S ȳ est r

donde τ̂est r = 44, 581.524, N = 780, Zα/2 = Z0.025 = 1.96 y S ȳ est r = 0.7934.

Por lo tanto:

44, 817.1929 ± (780)(1.96)(0.7934)


44, 817.1929 ± 1, 212.978
43, 372.8 ≤ τest r ≤ 45, 798.6

El total de plantas infectadas por hectárea en la población está entre 43,604.2429 y


46,030.1429.

Ejemplo 4.1 f) Suponga que n = 63 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de ± 3 % de la media estratificada y una con-
fiabilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño
del estrato.

E
!
N (Zα/2 )2 Wh S h2
h=1
n= "E
N d 2 + (Z α/2 )
2
h=1
Wh S h2
donde Zα2 = Z0.025 = 1.96, d = (.03)(57.1611) = 1.7148 y además:

E
! N1 2 N2 2 N3 2
Wh S h2 = S + S + S = 48.7679.
h=1 N 1 N 2 N 3

87
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Estratos Ni Sh2 WhSh2

1 270 050.3571 17.4313


2 180 107.2619 24.7527
3 330 015.5619 06.5839
Total 780 48.7679

Ejemplo 44.1

Ejemplo 4.1 Por lo tanto:

(780)(1.96)2 (48.7679)
n= = 59 parcelas (muestra)
(780)(1.7146)2 + (1.96)2 (48.7679)

Asignación de la muestra en forma proporcional

N1 270
n1 = n= (59) = 20
N 780
N2 180
n2 = n= (59) = 14
N 780
N3 330
n3 = n= (59) = 25
N 780

Ejemplo 4.1 g) Suponga que n = 63 es una muestra preliminar. Determine el tamaño de muestra
para estimar el total con una precisión de ± 3 % del total estratificado y con una con-
fiabilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño.

E
!
N 2 (Zα/2 )2 Wh S h2
h=1
n=
E
!
d 2 + (Zα/2 )2 Wh S h2
h=1
"E
donde d = (0.03)(44, 585.628) = 1, 337.568 y h=1
Wh S h2 = 48.7679.

Por lo tanto:

(780)2 (1.96)2 (48.7679)


n= = 59
(1, 337.568)2 + (780)(1.96)2 (48.7679)
De ahí que el número estimado de unidades muestrales (parcelas) que deben consti-
tuir la muestra con una precisión de ± 1, 337.568 plantas y 0.05 de probabilidad de no
incluir en el intervalo de estimación al total verdadero, es de 59 parcelas. Por tanto, la
asignación proporcional es la misma.

Ejemplo 4.2 La Facultad de Lenguas Extranjeras de la Universidad de Colima desea estimar el pro-
medio y el total de faltas justificadas que tuvieron los alumnos en un año determina-

88
M UESTREO ALEATORIO ESTRATIFICADO

do. Al suponer que podrían encontrarse diferencias según el grado de estudios (pri-
mero, segundo, tercero y cuarto año), se decidió usar el muestreo estratificado. De
esta manera, la población de N = 400 estudiantes que alberga la Facultad quedó es-
tratificada así: Estrato 1 (primer año): N1 = 120 alumnos, Estrato 2 (segundo año):
N2 = 100 alumnos, Estrato 3 (tercer año): N3 = 90 alumnos, Estrato 4 (cuarto año):
N4 = 90 alumnos. Se seleccionó una muestra de n = 40 alumnos: 12 para el estrato 1,
10 para el estrato 2, 9 para el estrato 3 y 9 para el estrato 4 (cuadro 4.2).

Cuadro 4.2 Faltas justificadas por año

Estrato 1 Estrato 2 Estrato 3 Estrato 4

7 6 4 4 3 4 3 3
6 7 5 6 3 4 2 2
7 7 4 4 3 3 3 5
8 8 5 6 4 4 4 2
5 5 6 6 4 5
4 6

Ejemplo 4.1

Ejemplo 4.1 a) Estime la media estratificada.


N1 ȳ 1 + N2 ȳ 2 + N3 ȳ 3 + N4 ȳ 4
ȳ est r =
N
donde N1 = 120, N2 = 100, N3 = 90, N4 = 90 y N = 400.

7+6+7+...+5+6
ȳ 1 = = 6.3333
12
4+5+4+...+6+6
ȳ 2 = =5
10
3+3+3+...+3+4
ȳ 3 = = 3.5556
9
3+2+3+...+5+2
ȳ 4 = = 3.2222
9

Por lo tanto:

(120)(6.33) + (100)(5) + (90)(3.55) + (90)(3.22)


ȳ est r = = 4.675 faltas
400

Ejemplo 4.1 b) Estime la varianza y la desviación estándar de la media estratificada.


! "2 ! "# $ ! " ! "# $
N1 N1 − n 1 S 12 N2 2 N2 − n 2 S 22
S 2ȳ est r = +
N N1 n1 N N2 n2

89
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

! "2 ! "# $ ! " ! "# $


N3 N3 − n 3 S 32 N4 2 N4 − n 4 S 42
+ +
N N3 n3 N N4 n4

Ejemplo 4.1 donde N1 = 120, N2 = 100, N3 = N4 = 90, N = 400, n 1 = 12, n 2 = 10 y n 3 = n4 = 9.

72 + 62 + 72 + . . . + 52 + 62 − (12)(6,3333)2
S 12 = = 1.5152
12 − 1
42 + 52 + 42 + . . . + 62 + 62 − (10)(5)2
S 22 = = 0.8889
10 − 1
32 + 32 + 32 + . . . + 32 + 42 − (9)(3.5556)2
S 32 = = 0.2728
9−1
32 + 22 + 32 + . . . + 52 + 22 − (9)(3.2222)2
S 42 = = 1.4444
9−1

Ejemplo 4.1 Por lo tanto:


! " ! "! " ! " ! "! "
120 2 120 − 12 1.5152 100 2 100 − 10 0.8889
S 2y e= +
400 120 12 400 100 10
! "2 ! "! " ! "2 ! "! "
90 90 − 9 0.2728 90 90 − 9 1.4444
+ + = 0.02395
400 90 9 400 90 9
% "
S y est r = S 2y est r = 0.02395 = 0.1547

Ejemplo 4.1 c) Calcule el total estratificado.

ŷ est r = N ȳ est r

donde N = 400 y ȳ est r = 4.675.

Por lo tanto:

τ̂est r = (400)(4.675) = 1, 870 faltas justificadas

Ejemplo 4.1 d) Halle el intervalo para la media estratificada con una confiabilidad de 95 %.

ȳ est r ± Zα/2 S ȳ est r

donde N = 400, ȳ est r = 4.675 y Zα/2 = Z0.025 = 1.96.

Por lo tanto:

4.675 ± (1.96)(0.1547)
4.3717 ≤ µest r ≤ 4.9783

90
M UESTREO ALEATORIO ESTRATIFICADO

Esto significa que el promedio de fallas justificadas está entre 4.3717 y 4.9783.

Ejemplo 4.1 e) Cuantifique por intervalo el total estratificado con una confiabilidad de 95 %.

τ̂est r ± N Zα/2 S ȳ est r

donde τ̂est r = 1, 870, N = 780, Zα/2 = Z0.025 = 1.96, S ȳ est r = 0.1547.

Por lo tanto:

1, 870 ± (400)(1.96)(0.1547)
1, 870 ± 121.3201
1, 748.6821 ≤ τest r ≤ 1, 991.3179

Esto quiere decir que el total de plantas infectadas por hectárea está entre 1,748.6821
y 1,991.3179.

Ejemplo 4.1 f) Suponga que n = 40 es una muestra preliminar. ¿Cuál es el tamaño de muestra para
estimar la media con una precisión de 5 % de la media estratificada y una confiabili-
dad de 95 %? Además, distribuya n entre los estratos en forma proporcional al tamaño
del estrato.

E
!
N (Zα/2 )2 Wh S h2
h=1
n=
E
!
N d 2 + (Zα/2 )2 Wh S h2
h=1

donde Zα/2 = Z0.025 = 1.96, d = (0.05)(4.675) = 0.23375 y además:

"E N1 2 N2 2 N3 2
Wh S h2 = S + S + S .
h=1 N 1 N 2 N 3

Estratos Ni Sh2 WhSh2

1 120 1.5152 0.4545


2 100 0.8889 0.2222
3 090 0.2778 0.0625
4 090 1.4444 0.3250
Total 400 1.0643

Ejemplo 4.1

Ejemplo 4.1 Por lo tanto:

(400)(1.96)2 (1.0643)
n= = 63.05353 alumnos (muestra)
(400)(0.2337)2 + (1.96)2 (1.0643)

91
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Asignación de la muestra en forma proporcional

N1 120
n1 = n= (64) = 19.2
N 400
N2 100
n2 = n= (64) = 16
N 400
N3 90
n3 = n= (64) = 14.4
N 400
N4 90
n4 = n= (64) = 14.4
N 400

Ejemplo 4.1 g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar el total con una precisión de 5 % del total estratificado y una confiabili-
dad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño.

E
!
N 2 (Zα/2 )2 Wh S h2
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh S h2
h=1
"E
donde d = (0.05)(4.675)(400) = 93.5 y h=1
Wh S h2 =1.0643.

Por lo tanto:

(400)2 (1.96)2 (1.0643)


n= = 63.03 alumnos.
(93.5)2 + (400)(1.96)2 (1.0643)
Nótese que la asignación proporcional es la misma, es decir, la muestra a extraer de
cada estrato será de 19 en el primer estrato, 16 en el segundo, 14 en el tercero y 15 en
el cuarto.

Ejemplo 4.3 El gobierno del Estado de Chiapas desea estimar el ingreso promedio mensual (miles
de pesos) de las familias chiapanecas. Supóngase que el total de familias es de 6,000.
Por otro lado, el Estado tiene 3 zonas geográficas bien definidas (costa, centro y altos)
y entre ellos existen diferencias marcadas respecto al ingreso; por ello, para realizar
el estudio se estratificó al Estado en k = 3 estratos: estrato 1 (zona costa): N = 2, 000;
estrato 2 (zona centro): N = 1, 500 y estrato 3 (zona altos): N = 2, 500.

Para las estimaciones se tomó una muestra preliminar de n = 40 familias: 15 para el


primer estrato, 11 para el segundo estrato y 14 para el tercer estrato (cuadro 4.3).

92
M UESTREO ALEATORIO ESTRATIFICADO

Cuadro 4.3 Ingreso promedio mensual

Estrato 1 Estrato 2 Estrato 3

10 09 8 9 4 5
11 08 8 9 3 2
12 12 8 8 2 3
10 12 7 4 3
09 13 6 3 4
08 14 9 5 4
13 11 9 4
14 8 3

Ejemplo 4.1

Ejemplo 4.1 a) Realice la estimación puntual de la muestra estratificada.


N1 ȳ 1 + N2 ȳ 2 + N3 ȳ 3
ȳ est r =
N
donde N1 = 2, 000, N2 = 1, 500, N3 = 2, 500 y N = 6, 000.

10 + 11 + 12 + . . . + 14 + 11
ȳ 1 = = 11.0667
15
8+8+8+...+9+8
ȳ 2 = = 8.0909
11
4+3+2+...+4+4
ȳ 3 = = 3.5
14
Por lo tanto:

(2, 000)(11.0667) + (1, 500)(8.0909) + (2, 500(3.50))


ȳ est r =
6, 000
43019.6970
ȳ est r = = 7.1699 miles de pesos mensuales (promedio)
6, 000

Ejemplo 4.1 b) Realice la estimación puntual del total estratificado.

τ̂est r = N ȳ est r

donde: N = 6, 000 y ȳ est r = 7.1699.

Por lo tanto:

τ̂est r = (6, 000)(7.1699) = 43, 019.4 (total de ingresos mensuales)

93
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Ejemplo 4.1 c) Calcule la varianza y la desviación estándar del promedio estratificado.


! "! "# $ ! "! "# $ ! "! "# $
N1 N1 − n 1 S 12 N2 N2 − n 2 S 22 N3 N3 − n 3 S 32
S 2ȳest r = + +
N N1 n1 N N2 n1 N N3 n3
donde N1 = 2, 000, N2 = 1, 500, N3 = 2, 500, N = 6, 000, n 1 = 15, n 2 = 11 y n 3 = 14.

102 + 112 + 122 + . . . + 142 + 112 − (15)(11.0667)2


S 12 = = 4.0667
15 − 1
2 2 2 2 2 2
8 + 9 + 8 + . . . + 9 + 8 − (11)(8.0909)
S 22 = = 0.8909
11 − 1
42 + 32 + 22 + . . . + 42 + 42 − (14)(3.50)2
S 32 = = 0.8846
14 − 1

Ejemplo 4.1 Por lo tanto:


! " ! "! " ! " ! "! "
2, 000 2 2, 000 − 15 4.06 1, 500 2 1, 500 − 11 0.8909
S ȳ est r = +
6, 000 2, 000 15 6, 000 1, 500 11
! "2 ! "! "
2, 500 2, 500 − 14 0.8846
+ = 0.04583
6, 000 2, 500 14
% "
S ȳ est r = S 2ȳ est r = 0.04583 = 0.2141

Ejemplo 4.1 d) Estime por intervalo la media estratificada con una confiabilidad de 95 %.

ȳ est r ± Z α2 S ȳ est r

donde N = 6, 000, ȳ est r = 7.1699 y Z α2 = Z0.025 = 1.96.

Por lo tanto:

7.1699 ± (1.96)(0.2140)
7.1699 ± 0.4196
6.750375 ≤ µest r ≤ 7.589541

El ingreso promedio de las familias en la población está entre 6.750375 y 7.589541.

Ejemplo 4.1 e) Estime mediante intervalo el total estratificado con una confiabilidad de 95 %.

τ̂est r ± N Z α2 S ȳ est r

donde τ̂est r = 43, 019.6970, N = 6, 000, Z α2 = Z0.025 = 1.96 y S ȳ est r = 0.2141.

94
M UESTREO ALEATORIO ESTRATIFICADO

Ejemplo 4.1 Por lo tanto:

43, 019.6970 ± (6, 000)(1.96)(0.2141)


43, 019.6970 ± 2, 517.5985
40, 501.1446 ≤ τest r ≤ 45, 537.2493

El total de ingresos mensuales de las familias esté entre 40,501.1446 y 45,537.2493.

Ejemplo 4.1 f) Supóngase que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 5 % de la media estratificada y una confia-
bilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño del
estrato.

E
!
N (Z α2 )2 Wh S h2
h=1
n=
E
!
N d 2 + (Z α2 )2 Wh S h2
h=1

Estratos Ni Sh2 WhSh2

1 2,000 4.0660 1.3556


2 1,500 0.8909 0.2227
3 2,500 0.8846 0.3686
Total 6,000 1.9469

Ejemplo 4.1

Ejemplo 4.1 donde Z α2 = Z0.025 = 1.96, d = (.05)(7.1699) = 0.3585 y además:


E
! N1 2 N2 2 N3 2
Wh S h2 = S + S + S = 1.9469.
h=1 N 1 N 2 N 3

Ejemplo 4.1 Por lo tanto:

(6, 000)(1.96)2 (1.9469)


n= = 57.6349
(6, 000)(0.3585)2 + (1.96)2 (1.9469)

Asignación de la muestra en forma proporcional

N1 2, 000
n1 = n= (57.6349) = 19.2116
N 6, 000
N2 1, 500
n2 = n= (57.6349) = 14.4087
N 6, 000

95
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

N3 2, 500
n3 = n= (57.6349) = 24.0145
N 6, 000
Ejemplo 4.1 g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
definitivo para estimar el total con una precisión de 5 % del total estratificado y una
confiabilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al ta-
maño.

K
!
N 2 Z α2 Wi S i
i =1
n=
K
!
d 2 + N Z α2 Wi S i2
i =1
"E
donde d = (0.05)(43019.69670) = 2150.9849 y h=1
Wh S h2 =1.4969.

Por lo tanto:

(6, 000)2 (1.96)2 (1.9469)


n= = 57.6349 familias
(2, 150.9849)2 + (6, 000)(1.96)2 (1.9469)
Dado que el tamaño de muestra es el mismo, entonces se tiene la misma asignación
en cada estrato, es decir, la muestra a extraer de cada estrato será de 19 en el primer
estrato, 15 en el segundo y 24 en el tercero.

Ejemplo 4.4 En el Estado de Colima hay N = 3,200 familias. Se desea estimar el número de ho-
ras promedio por día que cada familia ve televisión. Sin embargo, se sabe que en el
Estado existen tres estratos sociales bien definidos: clase baja, media y alta. Consi-
derando que el número de horas de ver televisión puede ser distinto de estrato a es-
trato, la población se dividió en k = 3 estratos, los cuales son: estrato 1 (clase baja):
N = 1, 000 familias; estrato 2 (clase media): N = 1, 600 familias y estrato 3 (clase alta):
N = 600 familias.

La distribución de la muestra de tamaño n = 30 familias fue de 10 para el primer es-


trato, 15 para el segundo y 5 para el tercero (cuadro 4.4).

Cuadro 4.4 Número de horas diarias

Estrato 1 Estrato 2 Estrato 3


(n1 = 10) (n2 = 15) (n3 = 5)

7 08 5 5 4 4
6 07 6 5 7 3
6 08 7 6 8 4
7 09 5 6 6 5
8 10 7 7 6 4

Ejemplo 4.1

96
M UESTREO ALEATORIO ESTRATIFICADO

Ejemplo 4.1 a) Realice la estimación puntual de la muestra estratificada.


N1 ȳ 1 + N2 ȳ 2 + N3 ȳ 3
ȳ est r =
N
donde N1 = 1, 000, N2 = 1, 600, N3 = 600 y N = 3, 200.

7 + 6 + 6 + . . . + 9 + 10
ȳ 1 = = 7.60
10
5+6+7+...+6+6
ȳ 2 = =6
15
4+3+4+...+5+4
ȳ 3 = =4
5
Ejemplo 4.1 Por lo tanto:
(1, 000)(7.60) + (1, 600)(6) + (600)(4.00)
ȳ est r =
3, 200
19, 600
ȳ est r = = 6.125 horas diarias en promedio
3, 200

Ejemplo 4.1 b) Calcule el total estratificado.

τ̂est r = N ȳ est r

donde N = 3, 200 y ȳ est r = 5.4875.

Por lo tanto:

τ̂est r = (3, 200)(5.4875) = 17, 560 horas totales por día

Ejemplo 4.1 c) Calcule la varianza y la desviación estándar del promedio estratificado.


! " ! " # $ ! "2 ! "# $
N1 2 N1 − n 1 S 12 N2 N2 − n 2 S 22
S 2ȳ est r = +
N N1 n1 N N2 n2
! "2 ! " 2$
#
N3 N3 − n 3 S 3
+
N N3 n3
donde N1 = 1, 000, N2 = 1, 600, N3 = 600, N = 3, 200, n 1 = 10, n 2 = 15 y n 3 = 5.

72 + 62 + 62 + . . . + 92 + 102 − (10) (7.60)2


S 12 = = 1.60
10 − 1
52 + 62 + 72 + . . . + 62 + 62 − (15) (6)2
S 22 = = 1.1421
15 − 1
42 + 32 + 42 + 52 + 42 − (5) (4)2
S 32 = = 0.50
5−1

97
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Por lo tanto:
! " ! "! " ! " ! "! "
1, 000 2 1, 000 − 10 1.60 1, 600 2 1, 500 − 15 1.1421
S 2y est r = +
3, 200 1, 000 10 3, 200 1, 600 15
! "2 ! "! "
600 600 − 5 0.50
+ = 0.0378
3, 200 600 5
# "
S y est r = S y est r = 0.0378 = 0.1945

Ejemplo 4.1 d) Estime mediante intervalo la media estratificada con una confiabilidad de 95 %.

ȳ est r ± Zα/2 S ȳ est r

donde N = 3, 200, ȳ est r = 5.4875 y Zα/2 = Z0.2025 = 1.96.

Por lo tanto:

5.4875 ± (1.96)(0.1945)
5.4875 ± 0.38122
5.1081 ≤ µest r ≤ 5.8669

Esto significa que el promedio de horas por día que las familias de Colima ven te-
levisión está entre 5.1081 y 5.8669.

Ejemplo 4.1 e) Estime el intervalo del total estratificado con una confiabilidad de 95 %.

τ̂est r ± N Zα/2 S ȳ est r

donde τ̂est r = 17, 560, N = 3, 200, Zα/2 = Z0.025 = 1.96 y S y est r = 0.1945.

Por lo tanto:

17,560 ± (3,200)(1.96)(0.1945)
17,560 ± 1,272.96
16,345.9 ≤ τest r ≤ 18,774.1

Entonces, el total de horas por día que las familias de Colima ven televisión está entre
16,345.9 y 18,774.1.

Ejemplo 4.1 f) Suponga que n = 30 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 5 % de la media estratificada y una confia-
bilidad de 95 %. Además, asigne n a cada estrato en forma proporcional al tamaño de
cada estrato.

98
M UESTREO ALEATORIO ESTRATIFICADO

E
!
N (Zα/2 )2 Wh S h2
h=1
n=
E
!
N d 2 + (Zα/2 )2 Wh S h2
h=1

donde Zα/2 = Z0.0025 = 1.96, d = (.05)(5.4875) = 0.2744 y además:

"E N1 2 N2 2 N3 2
Wh S h2 = S + S + S = 1.1652.
h=1 N 1 N 2 N 3
Ejemplo 4.1 Por lo tanto:

(3, 200)(1.96)2 (1.1945)


n= = 48 familias
(3, 200)(0.2744)2 + (1.96)2 (1.1945)

Estratos Ni Sh2 WhSh2

1 1,000 1.60 0.5000


2 1,600 1.14 0.5714
3 1,600 0.50 0.0938
Total 3,200 1.1652

Ejemplo 4.1

Ejemplo 4.1 Asignación de la muestra en forma proporcional


N1 1, 000
n1 = n= (52) = 16
N 3, 200
N2 1, 500
n2 = n= (52) = 24
N 3, 200
N3 600
n3 = n= (52) = 10
N 3, 200

Ejemplo 4.1 g) Suponga que n = 30 es una muestra preliminar. Determine el tamaño de muestra
definitivo para estimar el total con una precisión de 5 % del total estratificado y con
una confiabilidad de 95 %. Además, realice la asignación de n a cada estrato en forma
proporcional al tamaño.

E
!
N 2 Zα2 Wh S h2
h=1
n=
E
!
d 2 + N Zα2 Wh S h2
h=1
"E
donde d = (0.05)(17, 560) = 878 y h=1
Wh S h2 =1.1652.

99
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Ejemplo 4.1 Por lo tanto:

(3, 200)2 (1.96)2 (1.1985)


n= = 48
(878)2 + (3, 200)(1.96)2 (1.1985)
El número estimado de unidades muestrales es de 52 familias, para tener una preci-
sión de ± 980 horas y 0.05 de probabilidad de no incluir en el intervalo de estimación
al total verdadero. La asignación proporcional es la misma, es decir, la muestra de ca-
da estrato será de 16 en el primer estrato, 26 en el segundo y 10 en el tercero.

Ejercicios
En los ejercicios siguientes estime un IC para la media y el total con una confiabilidad de 95 %. Su-
ponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuál es el tamaño de muestra
para estimar la media y el total de tal manera que sean estimados con una precisión de 5 % de la
media y el total preliminar con una confiabilidad de 95 %?

Ejercicio 4.1 La química llevó a cabo un estudio con el objetivo de estimar el número de colifor-
mes fecales que son bioindicadores de contaminación en el Río Colima, cuya longi-
tud es de N = 15, 000 metros, de los cuales N1 = 4, 000 metros pertenecen a la zona
pre-urbana, N2 = 8, 000 corresponden a la zona urbana, y N3 = 3, 000 a la zona post-
urbana. Cabe mencionar que este estudio se realizó en las cuatro estaciones del año
2004, pero aquí presentamos solamente los resultados de la primavera. Para el estu-
dio se tomó una muestra de n = 15 metros distribuidos de la siguiente manera: n 1 = 4
metros para la zona pre-urbana, n 2 = 8 metros para la zona urbana, y n 3 = 3 metros
para la zona post-urbana. Los resultados se presentan en el cuadro 4.5.

Cuadro 4.5 Coliformes fecales en el agua

Pre-urbana Urbana Post-urbana

1,350 1,920 1,600


1,240 1,920 2,400
1,600 1,920 1,600
2,400 1,600
2,400

Ejemplo 4.1

Ejercicio 4.2 La Secretaría de Educación desea estimar el promedio de calificaciones de los egresa-
dos de una normal superior. En la escuela hay tres licenciaturas: Educación Preesco-
lar, Educación Primaria y Educación Secundaria. En 2007 la población de egresados

100
M UESTREO ALEATORIO ESTRATIFICADO

fue de N1 = 30 de educación preescolar, N2 = 46 de educación primaria y N3 = 80 de


educación secundaria. Para el estudio se realizó una muestra de n = 16 estudiantes
distribuidos de la siguiente forma: n 1 = 3 (preescolar), n 2 = 5 (primaria) y n 3 = 8 (se-
cundaria). Los datos se presentan en el cuadro 4.6.

Ejercicio 4.3 Un investigador desea estimar el daño promedio de tres cepas causantes de la enfer-
medad de chagas. Supóngase que 300 ratones tienen la cepa uno, 350 la cepa dos y
350 la cepa tres. Además, como se espera que el daño varíe dependiendo de la cepa,
se toma una muestra estratificada de tamaño n = 50 de la población (cuadro 4.7).

Ejercicio 4.4 En una entidad hay tres variedades de nances (500 plantas de la variedad uno; de la
dos, 10,000; y de la tres, 7,000 plantas) y se quiere estimar el promedio de taninos por
árbol. Se toma una muestra de n = 44 plantas distribuidas de la siguiente manera:
n 1 = 10 (variedad 1), n 2 = 20 (variedad 2) y n 3 = 14 (variedad 3) (véase el cuadro 4.8).

Cuadro 4.6 Calificaciones de egresados Cuadro 4.7 Daño promedio de las cepas

Preescolar Primaria Secundaria Cepa 1 Cepa 2 Cepa 3


(n1 = 15) (n2 = 17) (n3 = 8)

9.5 9.3 08.7 25 26 28 28 29 29


8.7 9.7 08.0 23 24 27 26 31 32
9.9 8.8 09.0 22 23 29 28 31 33
9.0 09.2 22 22 28 29 32 31
8.5 07.8 23 23 27 28 33 33
08.3 25 24 28 27 32 33
09.9 26 26 29 29 32 32
10.0 25 28 29 32 33
28 33 31
Ejemplo 4.1

Cuadro 4.8 Taninos por kg de nance (en %)

Variedad 1 Variedad 2 Variedad 3


(n1 = 10) (n2 = 20) (n3 = 14)

4 6 6 4 7
5 5 5 5 7
4 7 6 5 7
3 6 5 4 6
5 5 6 6
5 5 7 7
4 6 5 7
3 6 5 6
2 5 5 5
5 5 7 4

Ejemplo 4.1

101
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

4.5. La estimación de la proporción poblacional


Suponga que surge la necesidad de estimar la proporción de unidades muestrales que po-
seen un cierto atributo, en otras palabras, nuestro interés radicará en saber cómo se ma-
nifiesta la característica C en cada uno de los estratos. En tal caso nos importa saber la
proporción (p h ) de unidades muestrales que tienen la característica C en el estrato h.

Defínase: !
1 éxito
y h,i =
0 fracaso

que representa al i -ésimo componente del h-ésimo estrato. El éxito consiste en tener la ca-
racterística C .

Esta variable se comporta como una variable aleatoria del tipo binomial, por lo que el
estimador de la proporción de la característica de interés para el estrato h es:
nh
" y h,i
ph =
i =1 nh

Y su varianza correspondiente es,


# $
Nh − n h p h (1 − p h )
S 2p h =
Nh nh

Obsérvese que p h es un estimador insesgado de P h , la proporción de unidades mues-


trales que tienen la característica C (Scheaffer, 1987). De la misma manera, N p h también
es un estimador insesgado del total en el estrato h que cuentan con la característica C . De
%
tal manera Eh=1 Nh p h es un buen estimador del total poblacional que cuenta con la carac-
terística C (Pérez, 2000).

El estimador de la proporción y total poblacional

1 1 "E
p st = (N1 p 1 + ... + NE p E ) = Nh p h
N N h=1

E
"
τ̂st = (N1 p 1 + ... + NE p E ) = Nh p h = N p st
h=1

102
M UESTREO ALEATORIO ESTRATIFICADO

El estimador de la varianza de la proporción y total poblacional


1
S 2p h = (N 2 S 2 + ... + NE2 S 2p E )
N 2 1 p1

1 ! E
= N 2 S 2 (proporción)
N 2 h=1 h p h

S τ̂2 = (N12 S 2p 1 + ... + NE2 S 2p E )


st

"E
= h=1
Nh2 S 2p h (total)

Los intervalos de confianza para la proporción y total poblacional

De forma tradicional, construimos un intervalo que tiene la siguiente ecuación:


#
$ E & '& '
$ 1 !
% 2 Nh − n h p h qh
p̂ st ± t (n−1,α/2) N
N 2 h=1 h N nh
#
$ E & '& '
$ !
% 2 2 Nh − n h p h qh
τ̂ ± N t (n−1,α/2) 1N Nh
h=1 N nh

El tamaño de muestra para estimar la proporción estratificada

En cuanto a la determinación del tamaño de muestra, se procede de manera análoga a la


determinación vista en el apartado anterior. Se utiliza una modificación de la ecuación (4.3)
sustituyendo la estimación de la varianza σ2h por la varianza de la proporción estimada, que
es p h q h .

El tamaño de muestra para estimar la proporción estratificada

( E
)2 !
N t (n−1,α/2) Wh p h q h
h=1
n=
E
!
2
N dM + (t (n−1,α/2) )2 Wh p h q h
i =1

donde Wh = Nh /N y d M = el tamaño del error aceptable en la estimación de la media.

103
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

El tamaño de muestra para estimar el total estratificado


!E
N 2 (t (n−1,α/2) )2 W p q
h=1 h h h
n= ! E
d T2 + N (t (n−1,α/2) )2 i =1 Wh p h q h

donde Wh = Nh /N y d T = el tamaño del error aceptable en la estimación del total.

Asignación de la muestra

El criterio de asignación proporcional, suponiendo que ya se ha calculado el tamaño de la


muestra n requerido, considera como tamaño de muestra de cada estrato una parte de n,
la cual será proporcional al tamaño del estrato. Esto es, algebraicamente el criterio:

Nh
ni = n = Wh n; i = 1, 2, . . . , h,
N

o específicamente como:

N1 N2 Nh
n1 = n, n 2 = n, . . . , n h = n
N N N

Nótese que a los estratos más grandes les corresponderá un tamaño de muestra mayor,
o sea, la asignación de n entre los estratos es proporcional al tamaño de cada estrato.

Ejemplos
Ejemplo 4.5 En Colima hay N = 5, 000 personas mayores de 60 años (N1 = 2, 600 son mujeres y
N2 = 2, 400 son hombres). Para estimar el porcentaje y el total de personas que pade-
cen diabetes, se tomó una muestra aleatoria de n = 220, donde n 1 = 120 son mujeres
y n 2 = 100 son hombres. Se estratificó la población porque la enfermedad es influida
por el género. De las mujeres, 40 padecen diabetes y de los hombres, 50.

Ejercicio 4.1 a) Estime la proporción estratificada.


1
p st = (N1 p 1 + N2 p 2 )
N
donde N = 5, 000, N1 = 2, 600 y N2 = 2, 400.

104
M UESTREO ALEATORIO ESTRATIFICADO
!n 1
i =1 40
p1 = = = 0.327731
n1 120
!n 2
i =1 50
p2 = = = 0.5
n2 100
Por lo tanto:

1 2, 066.6667
p st = (2, 600(0.3333) + 2, 400(0.5)) = =41.33 % de enfermos
5, 000 5, 000

Ejercicio 4.1 b) Halle el total estratificado.

τ̂ = N p st

donde N = 5, 000 y p st = 0.4133.

Por lo tanto:

τ̂ = (5, 000)(0.4133) = 2, 006.6667 personas con diabetes

Ejercicio 4.1 c) Calcule la varianza y la desviación estándar de la proporción estratificada.


1
S 2p h = (N 2 S 2 + N22 S 2p 2 )
N 2 1 p1
donde N = 5, 000, N1 = 2, 600, N2 = 2, 400, p 1 = 0.327731 y p 2 = 0.5.
" #" # " #
N1 − n 1 p 1 q 1 2, 600 − 120 (0.3333)(0.6667)
S 2p 1 = = = 0.001767
N1 n1 2, 600 120
" #" # " #
2 N2 − n 2 p 2 q 2 2, 400 − 100 (0.5)(0.5)
S p2 = = = 0.002396
N2 n2 2, 400 100
Por lo tanto:

1
S 2p h = ((2, 600)2 (0.0017663) + (2, 400)2 (0.002396))
5, 0002
= 0.001030
$ "
Sp = S 2p = 0.001030 = 0.0321

Ejercicio 4.1 d) Calcular un IC para la proporción estratificada con una confianza de 90 %.

p st ± t α/2,n−1 S p h

donde p st = 0.4133, t α/2,n−1 = Zα/2 = Z0.05 = 1.645 y S p = 0.0321.

105
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Por lo tanto:

0.4133 ± (1.645)(0.0321)
0.4133 ± 0.0528
0.355066 ≤ P ≤ 0.4609255

La proporción verdadera de personas que padece diabetes está entre 35.50 y 46.09 %.

Ejercicio 4.1 e) Realice una estimación por intervalo para el total estratificado.

τ̂ ± N t α/2,n−1 S p s t

donde τ̂ = 2006.6667, N = 5,000, t α/2,n−1 = Zα/2 = Z0.05 = 1.645 y S p = 0.0321.

Por lo tanto:

2,006.6667 ± (5000)(1.645)(0.0321)
2,006.6667 ± 264
1, 775.331715 ≤ τst ≤ 2, 304.627542

Esto significa que el total de enfermos está entre 1,802.7676 y 2,330.5657.

Ejercicio 4.1 f) Suponga que n = 220 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 0.05 y una confiabilidad de 90 %. Además,
realice la asignación de n a cada estrato en forma proporcional al tamaño del estrato.

E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1

donde Zα/2 = Z0.05 = 1.645, d = 0.05 y además:

"E N1 N2
h=1
Wh S h2 = p 1 q1 + p 2 q 2 = 0.2356.
N N

Estratos Ni ph qh Whphqh

1 2,600 0.3333 0.6667 0.1156


2 2,400 0.5000 0.5000 0.1200
Total 5,000 0.2356

Ejemplo 4.1

106
M UESTREO ALEATORIO ESTRATIFICADO

Ejercicio 4.1 Por lo tanto:

(5, 000)(1.645)2 (0.2356) 3, 186.3344


n= 2 2
= = 242 personas
(5, 000)(0.05) + (1.645) (0.2356) 13.1373
La asignación de la muestra en forma proporcional

N1 2, 600
n1 = n= (242) = 126
N 5, 000
N2 2, 400
n2 = n= (242) = 116
N 5, 000

Ejercicio 4.1 g) Suponga que n = 220 es una muestra preliminar. Determine el tamaño de mues-
tra para estimar la proporción con una precisión de 250 y una confiabilidad de 95 %.
Además, haga la asignación de n a cada estrato en forma proporcional al tamaño.

E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n= !
d 2 + N (Zα/2 )2
"E
d = (0.05)(5, 000) = 250 y h=1
Wh p h q h =0.2356.

Por lo tanto:

(5, 000)2 (1.645)2 (0.2356)


n= = 242 personas
(250)2 + (5, 000)(1.645)2 (0.2356)
La asignación proporcional es la misma que en el inciso f ).

Ejemplo 4.6 Una empresa que produce artículos electrónicos tiene tres líneas de producción. La
línea uno produce N1 = 2, 000 artículos por hora, la dos N2 = 1, 500 y la tres produce
N3 = 2, 500. La producción total por hora es de N = 6, 000. Con la finalidad de esti-
mar el porcentaje y total de artículos defectuosos producidos por hora, se tomó una
muestra aleatoria de n = 150 artículos distribuidos de la siguiente manera: n 1 = 50 de
la línea uno, n 2 = 30 de la línea dos y n 3 = 70 de la línea tres, debido a que las líneas
de producción no son idénticas y se sospecha que el número de artículos defectuosos
por líneas son diferentes. En la muestra de la línea uno (n 1 ) se encontraron 4 defec-
tuosos; en la muestra de la línea dos, 3; y en la línea tres hubo 8 defectuosos.

Ejercicio 4.1 a) Realice la estimación de la proporción estratificada.


1
p st = (N1 p 1 + N2 p 2 + N3 p 3 )
N
donde N = 6, 000, N1 = 2, 000, N2 = 1, 500 y N3 = 2, 500.

107
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
!n 1
i =1
p1 = = 450 = 0.08
n1
!n 2
i =1
p2 = = 330 = 0.1
n2
!n 3
i =1
p3 = = 870 = 0.1143
n3
Por lo tanto:

1
p st = (2, 000(0,08) + 1, 500(0.1) + 2, 500(0.1142))
6, 000
1 595.7142
p st = (160 + 150 + 285.7142) = = 0.0992 ó 9.92 % artículos
6, 000 6, 000

Ejercicio 4.1 b) Realice la estimación del total poblacional.

τ̂ = N p st

donde N = 6, 000 y p st = 0.0993.

Por lo tanto:

τ̂ = (6, 000)(0.0993) = 595.8 artículos defectuosos por hora

Ejercicio 4.1 c) Calcule la varianza y la desviación estándar de la proporción estratificada.


1
S 2p h = (N 2 S 2 + N22 S 2p 2 + N32 S 2p 3 )
N 2 1 p1
donde N = 6, 000, N1 = 2, 000, N2 = 1, 500, N3 = 2, 500, p 1 = 0.08, p 2 = 0.1 y p 3 =
0.1143.
" #" # " #
N1 − n 1 p 1 q 1 2, 000 − 50 (0.08)(0.92)
S 2p 1 = = = 0.0014
N1 n1 2, 000 50
" #" # " #
2 N2 − n 2 p 2 q 2 1, 500 − 30 (0.1)(0.9)
S p2 = = = 0.0029
N2 n2 1, 500 30
" #" # " #
N3 − n 3 p 3 q 3 2, 500 − 70 (0.1143)(0.8857)
S 2p 3 = = = 0.0014
N3 n3 2, 500 70
Por lo tanto:

1
S 2p h = ((2, 000)2 (0.0014) + (1, 500)2 (0.0029) + (2, 500)2 (0.0014)) = 0.000579
6, 0002
$ "
S ph = S 2p = 0.000579 = 0.0240

108
M UESTREO ALEATORIO ESTRATIFICADO

Ejercicio 4.1 d) Calcular un IC para la proporción estratificada con una confianza de 90 %.

p st ± t α/2,n−1 S p h

donde p st = 0.0993, t α/2,n−1 = Zα/2 = Z0.05 = 1.645 y S p = 0.0242.

Por lo tanto:

0.0992 ± (1.645)(0.0242)
0.0992 ± 0.039809
0.0594 ≤ P ≤ 0.1390

La proporción verdadera de artículos electrónicos defectuosos que se producen por


hora está entre 5.94 y 13.9 %.

Ejercicio 4.1 e) Realice una estimación por intervalo del total poblacional.

τ̂ ± N t α/2,n−1 S p s t

donde τ̂ = 595.8, N = 6, 000, t α/2,n−1 = Zα/2 = Z0.05 = 1.645 y S p = 0.0242.

Por lo tanto:

595.8 ± (6000)(1.645)(0.024)
595.8 ± 236.88
356.555 ≤ τst ≤ 834.8730

El total de artículos electrónicos defectuosos que se producen por hora está entre
358.92 y 832.68.

Ejercicio 4.1 f) Suponga que n = 150 es una muestra preliminar. Determine el tamaño de mues-
tra para estimar la media con una precisión de 0.05 y con una confiabilidad de 90 %.
Además, asigne n a cada estrato en forma proporcional al tamaño del estrato.

E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1

Ejercicio 4.1 donde Zα/2 = Z0.05 = 1.645, d = 0.05 y además:


"E N1 N2 N3
h=1
Wh S h2 = p 1 q1 + p 2 q2 + p 3 q 3 = 0.0892.
N N N

109
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Por lo tanto:

(6, 000)(1.645)2 (0.0892) 1, 448.4302


n= 2 2
= = 96 artículos electrónicos
(6, 000)(0.05) + (1.645) (0.0892) 15.2413

Estratos Ni ph qh Whphqh

1 2,000 0.08 0.92 0.0245


2 1,500 0.10 0.99 0.0225
3 2,500 0.11 0.89 0.0422
Total 6,000 0.0892

Ejemplo 4.1

Ejercicio 4.1 La asignación de la muestra en forma proporcional


N1 2, 000
n1 = n= (96) = 32
N 6, 000
N2 1, 500
n2 = n= (96) = 24
N 6, 000
N3 2, 500
n3 = n= (96) = 40
N 6, 000

Ejercicio 4.1 g) Suponga que n = 150 es una muestra preliminar. Determine el tamaño de mues-
tra para estimar la proporción con una precisión de ± 300 y con una confiabilidad de
90 %. Además, distribuya n entre los estratos en forma proporcional al tamaño.

E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh p h q h
h=1

"E
donde d = (0.05)(6, 000) = 300 y h=1
Wh p h q h = 0.0892

(6, 000)2 (1.645)2 (0.0892)


n= = 95.0325.
(300)2 + (6, 000)(1.645)2 (0.0892)
La asignación proporcional es la misma que en el inciso anterior.

Ejemplo 4.7 La Secretaría de Educación Pública del Estado de Colima desea conocer el porcentaje
y el total de personas que ven telenovelas. Suponga que la población de individuos en
el Estado es de N = 10, 000, de los cuales 30 % son niños (estrato 1), 50 % son jóvenes
(estrato 2) y el resto son adultos (estrato 3). Se estratificó la población de esa forma
ya que los hábitos televisivos son muy diferentes entre niños, jóvenes y adultos. Para

110
M UESTREO ALEATORIO ESTRATIFICADO

estimar el porcentaje y total de personas que ven telenovelas se tomó una muestra
aleatoria de n = 300 individuos distribuidos de la siguiente manera: n 1 = 90 del estra-
to uno, n 2 = 150 del estrato dos y n 3 = 60 del estrato tres. Los resultados fueron: en el
estrato uno, 30 niños; en el dos, 70; y en el estrato tres, 40.

Ejercicio 4.1 a) Haga la estimación de la proporción estratificada de personas que ven telenovelas.
1
p st = (N1 p 1 + N2 p 2 )
N
donde N = 10, 000, N1 = 3, 000, N2 = 5, 000 y N3 = 2, 000.
!n 1
i =1 30
p1 = = = 0.3333
n1 90
!n 2
i =1 70
p2 = = = 0.4666
n2 150
!n 3
i =1 40
p3 = = = 0.6666
n3 60
Por lo tanto:

1
p st = (3, 000(0.3333) + 5, 000(0.4666) + 2, 000(0.6666))
10, 000
1 4, 666.6667
p st = (1, 000 + 2, 333.3333 + 1, 333.3333) = = 46.67 %
10, 000 10, 000

Ejercicio 4.1 b) Calcule la estimación del total estratificado.

τ̂ = N p st

donde N = 10,000 y p st = 0.4667.

Por lo tanto:

τ̂ = (10, 000)(0.4667) = 4, 666.6667 personas ven telenovelas

Ejercicio 4.1 c) Estime la varianza y la desviación estándar de la proporción estratificada.


1
S 2p h = (N 2 S 2 + N22 S 2p 2 )
N 2 1 p1
donde N = 5, 000, N1 = 1, 000, N2 = 3, 000, N3 = 2, 000, p 1 = 0.3333, p 2 = 0.4667 y
p 3 = 0.6667.

111
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS
! "# $ # $
N12 − n 1 p 1 q1 3, 000 − 90 (0.3333)(0.6667)
S 2p 1 = = = 0.0024
N1 n1 3, 000 90

! "# $ # $
N22 − n 2 p 2 q2 5, 000 − 150 (0.4667)(0.5333)
S 2p 2 = = = 0.0016
N2 n2 5, 000 150

! "# $ # $
N32 − n 3 p 3 q3 2, 000 − 60 (0.6667)(0.3333)
S 2p 3 = = = 0.0036
N3 n3 2, 000 60
Por lo tanto:

1
S 2p h = ((3, 000)2 (0.0024) + (5, 000)2 (0.0016) + (2, 000)2 (0.0035)) = 0.00076
10, 0002
% "
S p = S 2p = 0.00076 = 0.0276

Ejercicio 4.1 d) Calcular un IC para la proporción estratificada con una confiabilidad de 90 %.

p st ± t α/2,n−1 S p h

donde p st = 0.4667, t α/2,n−1 = Zα/2 = Z0.05 = 1.645 y S p = 0.0276.

Por lo tanto:

0.4667 ± (1.645)(0.0276)
0.4667 ± 0.0454
0.42228 ≤ P ≤ 0.51329

Esto significa que la proporción verdadera de personas que ven telenovelas está entre
42.13 y 51.21 %, con una confiabilidad de 90 %.

Ejercicio 4.1 e) Estime por intervalo el total estratificado con una confiabilidad de 90 %.

τ̂ ± N t α/2,n−1 S p s t

donde τ̂ = 4, 666.6667, N = 10,000, t α/2,n−1 = Zα/2 = Z0,05 = 1.645 y S p = 0.0276.

Por lo tanto:

4, 666,6667± (10, 000)(1.645)(0.0276)


4, 666,6667± 453.9811
4, 212.7259 ≤ τst ≤ 5, 120.6074

112
M UESTREO ALEATORIO ESTRATIFICADO

El total de personas que ven televisión está entre 4,212.7259 y 5,120.6074, con una
confiabilidad de 90 %.

Ejercicio 4.1 f) Suponga que n = 300 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 0.05 y una confiabilidad de 90 %. Además,
realice la asignación de n a cada estrato en forma proporcional al tamaño del estrato.

E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1

Ejercicio 4.1 donde Zα/2 = Z0.05 = 1.645, d = 0.05 y también:


"E N1 N2 N3
h=1
Wh S h2 = p 1 q1 + p 2 q2 + p 3 q 3 = 0.2356.
N N N

Estratos Ni ph qh Whphqh

1 03,000 0.3333 0.6667 0.0667


2 05,000 0.4667 0.5333 0.1244
3 02,000 0.6667 0.3333 0.0444
Total 10,000 0.2355

Ejemplo 4.1

Ejercicio 4.1 Por lo tanto:

(10, 000)(1.645)2 (0.2355) 6, 374.1922


n= 2 2
= = 248.6284 personas (muestra)
(10, 000)(0.05) + (1.645) (0.2355) 25.6374

Ejercicio 4.1 Asignación de la muestra en forma proporcional


N1 3, 000
n1 = n= (249) = 75
N 10, 000
N2 5, 000
n2 = n= (249) = 125
N 10, 000
N3 2, 000
n3 = n= (249) = 50
N 10, 000

Ejercicio 4.1 g) Suponga que n = 300 es una muestra preliminar. Halle el tamaño de muestra defi-
nitivo para estimar la proporción con una precisión de ± 500 y confiabilidad de 90 %.
Además, haga la asignación de n a cada estrato en forma proporcional al tamaño.

113
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh p h q h
h=1

"E
donde d = 500 y h=1
Wh p h q h = 0.2356.

Por lo tanto:

(10, 000)2 (1.645)2 (0.2355)


n= = 249 personas (muestra)
(500)2 + (10, 000)(1.645)2 (0.2355)
Entonces, la asignación proporcional es la misma, es decir, que la muestra a extraer
de cada estrato será de 75 para el primer estrato, 124 para el segundo y 50 para el ter-
cero.

Ejemplo 4.8 En la Facultad de Filosofía se desea conocer el porcentaje y total de alumnos que han
leído Cien Años de Soledad de Gabriel García Márquez. El número total de alumnos es
de N = 600, de los cuales 29 % son de primer grado (estrato 1), 25 % de segundo grado
(estrato 2), 23 % de tercer grado (estrato 3) y 23 % de cuarto grado (estrato 4). Se estrati-
ficó la población de esa forma debido a que los hábitos de lectura entre los grados son
diferentes. Para estimar este porcentaje y el total, se tomó una muestra aleatoria de
n = 40 individuos distribuidos de la siguiente manera: n 1 = 13 del estrato uno, n 2 = 12
del estrato dos, n 3 = 8 del estrato tres y n 4 = 7 del cuarto estrato. Los alumnos que han
leído el libro fueron 7, 6, 5 y 5 en el estrato 1, 2, 3 y 4, respectivamente.

Ejercicio 4.1 a) Realice la estimación de la proporción estratificada.


1
p st = (N1 p 1 + N2 p 2 )
N
donde N = 600, N1 = 174, N2 = 150, N3 = 138 y N4 = 138.
"n 1
i =1 7
p1 = = = 0.5385
n1 13
"n 2
i =1 6
p2 = = = 0.5454
n2 12
"n 3
i =1 5
p3 = = = 0.625
n3 8
"n 4
i =1 5
p4 = = = 0.71428
n4 7

114
M UESTREO ALEATORIO ESTRATIFICADO

Ejercicio 4.1 Por lo tanto:


1
p st = (174(0.5385) + 150(0.500) + 138(0.625) + 138(0.7143)) = 58.92 % alumnos
600

Ejercicio 4.1 b) Estime el total estratificado.

τ̂ = N p st

donde N = 600 y p st = 0.5892.

Por lo tanto:

τ̂ = (600)(0.5892) = 353.52

El total de alumnos de esa facultad que leyó el libro es de 353.52

Ejercicio 4.1 c) Estime la varianza y la desviación estándar de la proporción estratificada.


1
S 2p h = (N 2 S 2 + N22 S 2p 2 )
N 2 1 p1
donde N = 600, N1 = 174, N2 = 150, N3 = 138, N4 = 138, p 1 = 0.5385, p 2 = 0.500,
p 3 = 0.625 y p 4 = 0.7143. De igual manera:
! "# $ # $
2
N12 − n 1 p 1 q 1 174 − 13 (0.5385)(0.4615)
S p1 = = = 0.0177
N1 n1 174 13

! "# $ # $
N22 − n 2 p 2 q2 150 − 12 (0.500)(0.500)
S 2p 2 = = = 0.02088
N2 n2 150 12

! "# $ # $
N32 − n 3 p 3 q3 138 − 8 (0.625)(0.375)
S 2p 3 = = = 0.02759
N3 n3 138 8

! "# $ # $
N42 − n 4 p 4 q4 138 − 7 (0.7143)(0.2857)
S 2p 4 = = = 0.02767
N4 n4 138 7
Por lo tanto:

1
S 2p h = ((174)2 (0.0177) + (150)2 (0.0192) + (138)2 (0.0276) + (138)2 (0.0277))
6002
= 0.00561
% "
Sp = S 2p = 0.0056 = 0.0749

115
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Ejercicio 4.1 d) Calcule el IC para la proporción estratificada con una confianza de 90 %.

p st ± t α/2,n−1 S p h

donde p st = 0.5892, t α/2,n−1 = Zα/2 = Z0.05 = 1.645 y S p = 0.0749.

Por lo tanto:

0.5892± (1.645)(0.0749)
0.5892± 0.1232
0.465995 ≤ P ≤ 0.712384

Esto significa que la proporción verdadera de lectores varía entre 46.60 y 71.24 %, con
una confiabilidad de 90 %.

Ejercicio 4.1 e) Estime por intervalo el total poblacional, con una confianza de 90 %.

τ̂ ± N t α/2,n−1 S p s t

donde τ̂ = 353.5137, N = 600, t α/2,n−1 = Zα/2 = Z0.05 = 1.645 y S p = 0.0749.

Por lo tanto:

353.52 ± (600)(1.645)(0.0749)
353.52 ± 37.6108
279.597 ≤ τst ≤ 427.43

El total de alumnos lectores fluctúa entre 279.597 y 427.43, con una confiabilidad de
90 %.

Ejercicio 4.1 f) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar la media con una precisión de 0.05 y una confiabilidad del 90 %. Además,
asigne n a cada estrato en forma proporcional al tamaño del estrato.

E
!
N (Zα/2 )2 p h qh
h=1
n=
E
!
N d 2 + (Zα/2 )2 p h qh
h=1

Ejercicio 4.1 donde Zα/2 = Z0.025 = 1.645, d = 0.05 y también:


"E N1 N2 N3
h=1
Wh S h2 = p 1 q1 + p 2 q2 + p 3 q 3 = 0.2354.
N N N

116
M UESTREO ALEATORIO ESTRATIFICADO

Estratos Ni ph qh Whphqh

1 174 0.5385 0.4615 0.0721


2 150 0.5000 0.5000 0.0625
3 138 0.625 0.3750 0.0539
4 138 0.7143 0.2857 0.0469
Total 600 0.2354

Ejemplo 4.1

Ejercicio 4.1 Por lo tanto:

(600)(1.645)2 (0.2354)
n= = 179 personas (muestra)
(600)(0.05)2 + (1.645)2 (0.2354)

Asignación de la muestra en forma proporcional

N1 174
n1 = n= (179) = 52
N 600
N2 150
n2 = n= (179) = 45
N 600
N3 138
n3 = n= (179) = 41
N 600
N4 138
n4 = n= (179) = 41
N 600

Ejercicio 4.1 g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de muestra
para estimar la proporción con una precisión de ± 30 y una confiabilidad de 90 %.
Además, haga la asignación de n a cada estrato en forma proporcional al tamaño.

E
!
N 2 (Zα/2 )2 Wh p h q h
h=1
n=
E
!
d 2 + N (Zα/2 )2 Wh p h q h
h=1

"E
donde d = (0.05)(600) = 30 y h=1
Wh p h q h = 0.2354.

Por lo tanto:

(600)2 (1.645)2 (0.2354)


n= = 179 personas (muestra)
(30)2 + (600)(1.645)2 (0.2354)
La asignación de la muestra es la misma.

117
M UESTREO ESTADÍSTICO : TAMAÑO DE MUESTRA Y ESTIMACIÓN DE PARÁMETROS

Ejercicios
En los ejercicios estime los parámetros siguientes:

a) El IC para la proporción y el total estratificado con una confiabilidad de 95 %.

b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuál es el tamaño de
muestra para estimar la proporción y el total estratificado de tal manera que la proporción
y el total sean estimados con una precisión de 5 % de la proporción y el total preliminar con
una confiabilidad de 95 %?

Ejercicio 4.5 Un investigador estudió los niveles de colesterol sérico en 500 personas mayores de
45 años (300 mujeres y 200 hombres). Dado que piensa que el género influye en la va-
riable respuesta, estratificó la población por género. Para poder estimar la cantidad
de personas que tiene altos niveles de colesterol, tomó una muestra aleatoria simple
de 120 personas: 84 hombres y 36 mujeres. Al momento de realizar las mediciones
encontró que 3 mujeres y 5 hombres tenían un alto nivel de colesterol.

Ejercicio 4.6 Un agrónomo sembró tres variedades de manzanas. En total, sembró 5,000 plantas:
1,000 pertenecen a la variedad uno, 2,500 a la dos y 1,500 a la tres. Para calcular el
porcentaje y el total de plantas dañadas por una plaga X, tomó una muestra aleatoria
de 250 plantas: 100 de la primera variedad, 100 de la segunda y 50 de la tercera. El
número de plantas dañadas por estrato es el siguiente: 15 plantas en la variedad uno,
4 en la variedad dos y 6 en la variedad tres.

Ejercicio 4.7 En una población urbana de 3,500 personas del Estado de Michoacán, se desea cono-
cer la cantidad de personas que utilizan Internet. Supóngase que en dicha población
45 % son adolescentes, 30 % niños y el resto adultos. Para estimar el porcentaje y to-
tal de personas que utilizan Internet se tomó una muestra aleatoria de 600 individuos
distribuidos de la siguiente manera: adolescentes: n 1 = 200, niños: n 2 = 150 y adultos:
n 3 = 250. Los resultados del número de personas que usan Internet por estrato son:
70, 30 y 40, respectivamente.

Ejercicio 4.8 A un centro de salud asisten aproximadamente 7,000 personas de los cuales 4,000 son
adolescentes y 3,000 son adultos. Se desea conocer el porcentaje de personas que ha-
cen ejercicio diariamente y para ello se toma una muestra aleatoria de 350 individuos
(150 son adolescentes y 200 adultos) y se les pregunta si hacen ejercicio diariamente.
Los resultados obtenidos son los siguientes: 12 en el estrato de adolescentes hacen
ejercicio diariamente, mientras que 6 en el de adultos.

118

También podría gustarte