Está en la página 1de 17

MUESTREO POR CONGLOMERADOS (MPC _1 ETAPA)

3. Estimación de la Proporción poblacional

La proporción poblacional puede estimarse cuando la variable es


cuantitativa o cualitativa, pero para efectos de estimación de la
proporción la respuesta debe clasificarse solo en dos categorías
denominadas éxito y fracaso asignándole valores de éxito=1 y fracaso
=0; así por ejemplo anemia (éxito=1), familia en extrema pobreza
(éxito=1), talla pequeña (éxito=1), obeso (éxito=1), palto con parásito
(éxito=1), paciente con covid-19 asintomático (éxito=1), etc.

Si en un estudio el interés es estimar la proporción de anémicos en


niños en edad preescolar:

X ij = 1 cuando el niño presenta anemia.

X ij = 0 cuando el niño no presenta anemia.

La estimación de la proporción tiene un manejo análogo al de la


estimación de la media.
Los datos con valores X ij = 1 o con X ij = 0 pueden representarse para la
población y muestra de la siguiente manera:

La población con M elementos y N conglomerados cada uno con Mi


elementos

Conglomerado i

Elemento j 1 2 … N Total

1 X11 X21 XN1

2 X12 X22 XN2

Mi X1Mi X2Mi XNMi

Total elementos Mi M1 M2 MN M
Mi
A1 A2 AN A
∑ Xij= Ai
i

X ij = 1 o X ij = 0

Mi: Número de elementos en el conglomerado i

Ai: suma de los datos de los Mi elementos del conglomerado i. Es el número


de elementos con la característica de interés en el conglomerado i

M: Número de elementos en la población

A: Total de elementos con la característica de interés en la población.

N: Número de conglomerados en la población


La muestra de n conglomerados, cada uno con Mi elementos

Conglomerado i

Elemento j 1 2 … n Total

1 X11 X21 Xn1

2 X12 X22 Xn2

Mi X1M1 X2M2 XnMn

Total elementos Mi M1 M2 Mn ∑Mi


Mi
A1 A2 An ∑Ai
∑ Xij= Ai
i

Ai: suma de los Mi elementos de interés del conglomerado i.

En muchas situaciones se tiene la información global del número total de elementos del
conglomerado i; es decir la información del 100% de los datos.

Para datos con valores X ij = 1 o con X ij = 0 se tiene:


N N Mi

Parámetro : P= ∑ Xi ∑ ∑ X ij
i=1 i=1 j=1
μ= =
M M

i) Estimador puntual de la proporción poblacional


El estimador de la proporción poblacional es la proporción

muestral conglomerada.

n
∑ Ai
i=1
pcong= n Mi

∑ Mi Ai = ∑ X ij
i=1 j=1 Suma todos datos conglomerado i

ii) Varianza del estimador de la proporción poblacional

V ( pcong ) =
nM
1
2 σ 2c ( )
N−n
N −1

N N N
∑ A 2 −2 P ∑ AiM i + P ∑ M
2

i=1 i i =1 i=1 i
2 2
σc : Varianza poblacional de Xc σc = N

n : Tamaño muestra

M
∑ Mi
i=1
M= N o se puede usar su estimador n

iii) Estimador de la varianza del estimador de la proporción

poblacional

1
( )
N−n
¿
V ( pcong ) = S 2c
nM
2
N −1

n
2
Sc = ∑ A i2−2( p cong) ¿ ¿ ¿
i=1
n

M ^ ∑ Mi
M i=1
M= N o se puede usar su estimador = n

iv) Intervalo confidencial para la proporción poblacional



P : pcong ± z V ( pcong )

z: valor de la distribución normal asociado a un nivel de confianza.

v) Tamaño de muestra

N z2 S 2c
n= 2
( N-1) M d 2 + z 2 S 2c

n : Tamaño de muestra (número de conglomerados)


z : Valor de la distribución normal asociado a un nivel de confianza.
S 2c : Varianza muestral de estudio piloto

d : Error de muestreo, debe ser un valor adecuado (d ≤ 0.10)


N : Tamaño de población. Número de conglomerados
Ejemplo 1

Cierta provincia tiene 150 clínicas de salud materno infantil cada uno de ellos
con una atención de Mi pacientes durante el último mes y desea estimar la
proporción de partos vía cesárea. Se aplicó un muestreo por conglomerados
con n=10 clínicas de salud materno infantil como conglomerados. La
información es la siguiente:

Centro Número Partos vía cesárea


materno pacientes Ai
infantil Mi
1 105 45
2 182 69
3 130 84
4 185 80
5 200 90
6 140 92
7 188 78
8 160 75
9 120 73
10 170 81
1580 767
n n

∑ Ai 2 ∑ Ai
i =1 =60 405 i=1 = 767
n n n
∑ Mi 2
∑ Mi ∑ Mi Ai
i=1 =259 118 i=1 = 1580 i =1 =123 077

S 2c = 219.273 pcong = 767


1580=¿ ¿
0.4854
n n n
∑ A 2 −2 pcong ∑ AiM i + p
i
2 ∑ Mi
cong i =1
2
2
60405−2( 0. 4854 )(123077 )+(0 . 4854 ) 259 118
i=1 i =1
2
Sc = n−1 = 10−1
2
S c = 219.273

a). La proporción de partos vía cesárea si se conoce que fueron atendidos


23 820 partos (conociendo M):
n
∑ Ai
i=1 23820
n
767 150
pcong ∑ M i 1580 M=
= i=1 = = 0.4854 = 158.8


V ( pcong ) =
1
nM
S
2 c
2 N −n
N−1 = n M(
2
2 Sc
N −1 )1
1
= 10¿ ¿ =0.02872
( ) N−n


¿
p cong ± z V ( p cong ) 0 .4854 ± 1.96(0.0287)
P : P :

z =1.96: Valor Z para 95% de confianza d = 0.0562 d%= 11.6%

P: 0. 4854 ± 0.0562

Prob (0.4294 < P < 0.5416) = 0.95

b). La proporción de partos vía cesárea si no se conoce el número de


pacientes que fueron atendidos (no conociendo M):
n

^
∑ Mi 1580
M i=1 =158.0
n 10
= =

( X )= ( )

1 N−n
( )
¿
1 2 N−n
V cong S 2c S 1
N −1 = n M c N −1 = 10¿ ¿ =0.02872
2 2
nM

¿
p cong ± z V ( p cong )
P :

P : 0. 4854 ± 1. 96(0.0287 )

P : 0. 4854 ± 0.0562

z =1.96: Valor Z para 95% de confianza d = 0.0562

Prob (0.4294 < P < 0.5416) = 0.95

c) Suponga que se desea determinar el tamaño de muestra para estimar la


proporción de partos vía cesárea con un error de muestreo de d=0.05 y una
confianza del 95% conociendo finalmente que M= 24 000:

2 2
N z Sc
n= 2 n=
(150) (1.96)2 (219.273)
( N-1) M d 2 + z 2 S 2c (150-1)¿ ¿

n= 13 clínicas

4.Estimación del número total de elementos de interés poblacional

Cuando es de interés estimar el número de elementos con la característica

de interés se puede usar como estimador base a la proporción poblacional.

a) Cuando el tamaño de la población M es conocido

N N Mi N

Parámetro : A=∑ X i=∑ ❑ ∑ X ij= ∑ Ai


i=1 i=1 j=1 i=1
i) Estimador puntual del número de elementos de interés poblacional

El estimador del total poblacional es el total conglomerado estimado.


n

¿
∑ Ai
i=1
A cong = M pcong = M n Mi

∑ Mi Xi = ∑ X ij
i=1 j=1

Mi

Xi = ∑ X ij
j=1 = Suma de todos datos del conglomerado i

ii) Varianza del Estimador puntual del número de elementos de interés

poblacional

( )
¿
( )
2
N 2 N−n
V A cong V ( p cong ) = σ
n c N−1
=M 2

σ c: Varianza poblacional
2

N n n


σ = i=1
2
c
A i −2 P ∑ Ai M i + P ∑ M i
2 2 2

i =1 i=1
N

n : Tamaño muestra

iii) Estimador de la varianza del estimador del número de elementos de

interés poblacional

( )
¿ ¿
( )
2
¿
N 2 N −n
V A cong V ( pcong ) = S
n c N −1 S 2c = Varianza muestral
= M2

n n n
∑ A i −2 pcong ∑ AiM i + pcong ∑ M i
2 2 2

i=1 i =1 i =1
S 2c = n−1
iv) Intervalo confidencial para el número de elementos de interés

poblacional


∧ ∧ ∧
A : A cong ± Z V ( A cong )

Z valor de la distribución normal asociado a un nivel de confianza.

vi) Tamaño de muestra

N 3 z 2 S2c
n=
( N-1) d 2 + N 2 z 2 S2c

n : Tamaño de muestra
Z: Valor de la distribución normal asociado a un nivel de
confianza.
2
Sc : Varianza muestral de estudio piloto
d: Error de muestreo (% A ).Debe ser un valor adecuado
N : número de conglomerados en población

b) Cuando el tamaño de la población M es desconocido

N N Mi
A = ∑ X i =∑ ∑ X ij ∑ A
N

i
Parámetro : i=1 i=1 j=1 =i=1

i) Estimador puntual del número de elementos de interés

poblacional

El estimador del total poblacional es el total conglomerado


estimado.
n

¿ ∑ Ai Mi

A cong = N
i=1
¿ N At Ai = ∑ X ij
n j=1 suma todos datos conglomerado i

ii) Varianza del estimador del número de elementos de interés

poblacional

( )
¿
( )
2
N 2 N −n
V A cong V ( At) = σ
n t N−1
=N 2

2
σ t : Varianza poblacional de los Ai

n : Tamaño muestra

iii) Estimador de la varianza del estimador del número de

elementos de interés poblacional

( )
¿ ¿
( )
2
¿
N 2 N −n
V A cong V ( A t) = S
n t N −1
= N2

S 2t = s2(A , A , …, A ): Varianza muestral Ai


1 2 n

iv) Intervalo confidencial para el número de elementos de

interés poblacional


¿ ¿ ¿

A :
A cong ± z V ( A cong )

z valor de la distribución z asociado a un nivel de confianza

vii) Tamaño de muestra


N 3 z 2 S2t
n=
( N-1) d 2 + N 2 z 2 S2t

n : Tamaño de muestra
Z : Valor de la distribución normal asociado a un nivel de
confianza.
2
St : Varianza muestral de estudio piloto
d: Error de muestreo (% A ).Debe ser un valor adecuado
N : Número de conglomerados en población

Ejemplo

Usando la información de la provincia con 150 clínicas de salud materno


infantil cada uno de ellos con una atención de M i pacientes durante el último
mes y desea estimar el total de partos vía cesárea. Se aplicó un muestreo por
conglomerados con n=10 centros de salud como conglomerados.

a). La proporción de partos y total de partos vía cesárea si se conoce que


fueron atendidos 23 750 partos (conociendo M):
n
∑ Ai
i=1
n
767 23750
pcong = ∑ Mi M = 150 = 158.33
i=1 = 1580 = 0.4854

( X )= ( )

1 N−n
( ) ( )
¿
1 2 N−n 1 150−10
V cong S 2c Sc 219 . 273
N −1 = n M 150−1
2
N −1 = 10 (1 58 .333 )
2 2

nM =0.02872


¿
p cong ± z V ( p cong ) 0. 4854 ± 1.96 (0.0287 )
P : P :

P : 0. 4854 ± 0 .056 Z =1.96: Valor Z para 95% de confianza

El total de partos vía cesárea (conociendo M):


El estimador puntual :
¿
A cong = M pcong = 23750(0.4854) = 11528.25 = 11 529

El intervalo confidencial a partir del intervalo de la proporción:

MP : M(0.4854) ± M(0.056) con M= 23750

A : 11 528.25 ± 1330

Prob (10 199 < A < 12859)

b) El total de partos vía cesárea (No conociendo M):


n

¿ ∑ Ai 767
i=1
A cong = N n = 150( 10 )= 11 505 partos vía cesárea

( )
¿ ¿
( ) ( )
2 2
N 2 N −n 15 0 150−10
V A cong ¿
n
St
N−1 = 10
(175.122)
150−1
= 608.462

S t = S 2 (45, 69, …, 81)= 175.122


2

A = 11505 ±1.96(608.46)

A = 11505 ± 1192 d= 1192 d%= 10.4% parece alto.

Prob (10313 < A < 12697) = 0.95

c) Se desea estimar el total de partos vía cesárea en las clínicas de la


provincia; determine el tamaño de muestra con un error de muestreo del 8.0%
y una confianza del 95% si no se conoce el número de partos a ser atendidos
(no conociendo M).
3 2 2 3 3
N z St ( 150) ( 1.96) ( 175.122)
n= 2 2 2 2 = 2 2 2 = 16 clínicas
(N-1) d + N z St (150-1) (921) + (150 ) ( 1.96 ) (175.122)

d= 0.08 (11505) = 921 partos vía cesárea.


NOTA.

En los resultados de conteo rápido se usa este tipo de muestreo. En las


últimas elecciones, 2da vuelta del 6 de junio, la encuestadora IPSOS PERU,
de un total aproximado de 86000 mesas tomó una muestra aproximada de
1675 mesas con un error de 1 punto y un 99% de confianza. Con esta
muestra los resultados a las 10 pm por conteo rápido, considerando a las
mesas ya escrutadas fueron:

Castillo: 50.2% Interv: Prob(49.2 < P < 51.2) =0.99

Fujimori: 49.8 % Interv: Prob(48.8 < P < 50.8) =0.99

Dado a que el error fue de 1 punto no se podía señalar un virtual ganador.

Después de varios días la ONPE, evaluando al 100% de las mesas,


aproximadamente 83,000 mesas en territorio nacional y 3000 en el extranjero,
arrojó la siguiente información:

Castillo: 50.125%

Fujimori: 49.875 %

El resultado muestral de IPSOS cayó dentro del error o dentro del intervalo.
Ejercicio

1.En cierta provincia existe una votación con los candidatos A y B, y se desea estimar a
través del conteo rápido los resultados en tiempo real. Del total de 450 mesas o grupos
electorales cada uno de ellas con Mi electores con información del escrutinio en mesas del
número de electores que votaron a favor del candidato A. Se aplicó un muestreo aleatorio
por conglomerados con n=15 mesas o grupos como conglomerados. La información es la
siguiente:

Mesa Número electores: Mi Votaron por A: Ai

1 254 126

2 225 105

3 280 110

4 235 100

5 265 118

6 250 132

7 220 98

8 210 110

9 274 124
10 228 103

11 246 135

12 236 110

13 264 120

14 278 125

15 286 136

Estimar de manera puntual y en un intervalo de confianza al 95%:

a). La proporción de electores que votaron por el candidato A. ¿Se puede considerar un
virtual perdedor?

b)¿Cuál debería ser el tamaño de muestra si se quiere que el error de muestreo sea de 2
puntos con una confianza del 95%?

2. En cierta provincia existen 150 caseríos cada uno de ellos con Mi familias y se desea
estimar el número total de familias con extrema pobreza. Del total de caseríos cada uno de
ellas con Mi familias se tomó una muestra de n=10 caseríos evaluándose luego a todas las
familias del caserío elegido. La información es la siguiente:

Caserío Número familias: Mi Extrema pobreza

1 80 12

2 100 20

3 150 25

4 95 15

5 200 35

6 175 32

7 88 15

8 210 45

9 125 20

10 130 30

Estimar de manera puntual y en un intervalo de confianza al 95%:

a). La proporción de familias con extrema pobreza

b) El total de familias con extrema pobreza.

También podría gustarte