Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTIMACION DE LA MEDIA Y LA
PROPORCION POBLACIONAL.
En el muestreo estratificado una población heterogénea con N unidades, X1, X2, . . . ,XN
se divide en L subpoblaciones o estratos lo más homogéneos posibles no encubiertos 𝑋ℎ𝑖
con:
h = 1, 2, . . . , L (estratos)
i = 1, 2, . . . , 𝑁ℎ ( i-ésimo elemento en cada estrato)
de tamaño N1, N2, . . . , NL. La muestra estratificada de tamaño n se obtiene seleccionando
𝑛ℎ elementos ( h = 1, 2, . . . , L) de cada uno de los L estratos en que se subdivide la
población de forma independiente.
La formación de estratos en la población y la formación de la muestra estratificada se
puede expresar de la siguiente manera:
Población
es decir: ∑𝐿ℎ=1 𝑛ℎ = n
Notaciones:
𝑛ℎ
𝑓ℎ = : fracción de muestreo en el estrato ℎ
𝑁ℎ
𝑁 ℎ 𝑋
∑𝑖=1 ℎ𝑖
𝜇ℎ = : media poblacional del estrato ℎ
𝑁ℎ
𝑛ℎ 𝑥
∑𝑖=1 ℎ𝑖
𝑥̅ℎ = : media muestral del estrato ℎ
𝑛ℎ
𝑁ℎ (𝑋 − 𝜇 )2
∑𝑖=1 ℎ𝑖 ℎ
𝜎ℎ2 = : varianza poblacional del estrato ℎ
𝑁ℎ
𝑛ℎ (𝑥 − 𝑥̅ )2
∑𝑖=1 ℎ𝑖 ℎ
𝑠ℎ2 = : varianza muestral del estrato ℎ
𝑛ℎ − 1
𝑁ℎ − 𝑛ℎ 𝑁ℎ − 𝑛ℎ
≈ : factor de corrección para poblaciones finitas
𝑁ℎ −1 𝑁ℎ
La estimación de los principales indicadores puede hacerse según dos situaciones:
i) El parámetro
𝑁ℎ
∑𝐿
ℎ=1 𝑁ℎ ∑𝑖=1 𝑋ℎ𝑖
𝑁ℎ
∑𝐿ℎ=1 ∑𝑖=1 𝑋ℎ𝑖 𝑁ℎ ∑𝐿ℎ=1 𝑁ℎ 𝜇ℎ
𝑋̅ = 𝜇 = = = = ∑𝐿ℎ=1 𝑊ℎ 𝜇ℎ
𝑁 𝑁 𝑁
∑𝐿ℎ=1 𝑁ℎ 𝑥̅ ℎ
𝑥̅𝑠𝑡 = = ∑𝐿ℎ=1 𝑊ℎ 𝑥̅ℎ
𝑁
𝑁ℎ
𝑥̅𝑠𝑡 es insesgado y los coeficientes de ponderación 𝑊ℎ = cumplen lo siguiente:
𝑁
𝑁ℎ ∑𝐿ℎ=1 𝑁ℎ 𝑁
∑𝐿ℎ=1 𝑊ℎ = ∑𝐿ℎ=1 = = = 1
𝑁 𝑁 𝑁
𝝈𝟐𝒉
𝜎𝑥̅2𝑠𝑡 = V(𝑥̅𝑠𝑡 ) = V(∑𝐿ℎ=1 𝑊ℎ 𝑥̅ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 𝑉(𝑥̅ℎ ) = ∑𝑳𝒉=𝟏 𝑾𝟐𝒉 muestreo con
𝒏𝒉
reposición
𝝈𝟐 𝑵 − 𝒏
𝜎𝑥̅2𝑠𝑡 = V(𝑥̅𝑠𝑡 ) = V(∑𝐿ℎ=1 𝑊ℎ 𝑥̅ℎ ) = ∑𝐿ℎ=1 𝑊ℎ2 𝑉(𝑥̅ℎ ) = ∑𝑳𝒉=𝟏 𝑾𝟐𝒉 𝒉 ( 𝒉 𝒉) muestreo sin
𝒏𝒉 𝑵𝒉
reposición
𝑠ℎ2
𝜎̂𝑥̅2𝑠𝑡 = 𝑉̂ (𝑥̅ 𝑠𝑡 ) = ∑𝐿ℎ=1 𝑊ℎ2 muestreo con reposición
𝑛ℎ
𝑠2 𝑁 − 𝑛
𝜎̂𝑥̅2𝑠𝑡 = 𝑉̂ (𝑥̅ 𝑠𝑡 ) = ∑𝐿ℎ=1 𝑊ℎ2 ℎ ( ℎ ℎ) muestreo sin reposición
𝑛ℎ 𝑁ℎ
v) Intervalo confidencial para la media poblacional
P [𝑥̅𝑠𝑡 − 𝑡(𝑛−1 , 𝛼 𝜎
̂
1− ) 𝑥̅ 𝑠𝑡
≤ 𝜇 ≤ 𝑥̅𝑠𝑡 + 𝑡(𝑛−1 , 𝛼 𝜎
̂ ]
1− ) 𝑥̅ 𝑠𝑡
= 1 – 𝛼 cuando no se conoce 𝜎ℎ2
2 2
t = Tabla t
Ejemplo:
Una granja tiene 1000 cerdos, listos para su comercialización, de 3 razas diferentes. Para
estimar el peso (en Kg) se ha tomado la siguiente información:
Raza 𝑁ℎ 𝑛ℎ
A 350 10 150, 160, 188, 166, 148, 150, 155, 150, 152, 170
B 500 15 140, 128, 125, 130, 135, 144, 160, 162, 128, 120, 125, 123, 120,
130, 150
C 150 10 120, 110, 112, 114, 118, 125, 128, 120, 100, 98
1000 35
Se pide:
a.- Estimar puntualmente el peso promedio de los cerdos en la granja
b.- Estimar en un intervalo confidencial del 95% el peso promedio de los cerdos en la
granja.
Solución:
a.-
Raza 𝑁ℎ 𝑛ℎ 𝑥̅ ℎ 𝑠ℎ2
A 350 10 150, 160, 188, 166, 148, 150, 155, 150, 152, 170 158.90 160.10
B 500 15 140, 128, 125, 130, 135, 144, 160, 162, 128, 134.66̅ 187.52
120, 125, 123, 120, 130, 150
C 150 10 120, 110, 112, 114, 118, 125, 128, 120, 100, 98 114.50 97.16̅
1000 35
∑3ℎ=1 𝑁ℎ 𝑥̅ ℎ ̅)+150(114.50)
350(158.9)+500(134.66
𝑥̅𝑠𝑡 = = = 140.12 kg.
𝑁 1000
𝑛ℎ 𝑥
∑𝑖=1 ℎ𝑖
𝑥̅ℎ = 𝑛ℎ
P [𝑥̅𝑠𝑡 − 𝑡(𝑛−1 , 𝛼 𝜎
̂
1− ) 𝑥̅ 𝑠𝑡
≤ 𝜇 ≤ 𝑥̅𝑠𝑡 + 𝑡(𝑛−1 , 𝛼 𝜎
̂ ]
1− ) 𝑥̅ 𝑠𝑡
= 1–𝛼
2 2
entonces, usamos la varianza estimada y como n/N = 35/1000 = 0.035 < 0.05 se usa
varianza para muestreo con reposición.
𝑛 𝑛
ℎ 𝑥2 − (∑ 𝑥ℎ𝑖 )2
ℎ (𝑥 − 𝑥̅ )2
∑𝑖=1 ∑𝑖=1 ℎ𝑖
ℎ𝑖 ℎ 𝑛ℎ
𝑠ℎ2 = =
𝑛ℎ − 1 𝑛ℎ −1
Por tanto:
Por tanto, estimamos que el peso promedio de los cerdos es de 140.12 Kg. con un límite
para el error de estimación de ± 4.6 Kg.
4.6
Nota: El error de muestreo es aproximadamente igual a d = 2 (2.3) = 4.6 kg. o d = 140.12
x 100 = 3.3% ( este resultado indica que el tamaño de muestra es aceptable).
1 𝑆𝑖 (é𝑥𝑖𝑡𝑜)
Si los datos 𝑋ℎ𝑖 = {
0 𝑁𝑜 (𝑓𝑟𝑎𝑐𝑎𝑠𝑜)
i) Parámetro
𝑁 𝑁
∑𝐿ℎ=1 ∑𝑖=1
ℎ 𝑋
ℎ𝑖 𝐴
ℎ
𝑁ℎ ∑𝑖=1 𝑋ℎ𝑖 ∑𝐿ℎ=1 𝑁ℎ 𝑃ℎ
𝑃= =𝑁 = ∑𝐿ℎ=1 = ∑𝐿ℎ=1 𝑊ℎ 𝑃ℎ =
𝑁 𝑁 𝑁ℎ 𝑁
𝑝ℎ 𝑞ℎ 𝑁ℎ − 𝑛ℎ
𝜎̂𝑝2𝑠𝑡 = 𝑉̂ (𝑝𝑠𝑡 ) = ∑𝐿ℎ=1 𝑊ℎ2 ( 𝑁 ) muestreo sin reposición
𝑛ℎ ℎ
Ejemplo:
Suponga que se desea información acerca de las viviendas que hacen uso de telecable.
Para efectos de dicha investigación se ha distribuido a la ciudad en 4 estratos (A, B, C,
D), obteniéndose una muestra aleatoria de 200 viviendas, con los siguientes resultados:
𝑛ℎ
Estratos 𝑁ℎ 𝑛ℎ
∑ 𝑋ℎ𝑖
𝑖=1
A 500 20 15
B 800 40 20
C 1500 50 10
D 3000 90 5
Total 5800 200
Se pide:
a.- Estimar puntualmente la proporción de viviendas con telecable
b.- Estimar en un intervalo al 95% de confianza la proporción de viviendas con telecable.
Solución:
a.-
𝑛ℎ
Estratos 𝑁ℎ 𝑛ℎ 𝑝ℎ 𝑞ℎ
∑ 𝑋ℎ𝑖
𝑖=1
A 500 20 15 0.75 0.25
B 800 40 20 0.50 0.50
C 1500 50 10 0.20 0.80
D 3000 90 5 0.05̅ 0.94̅
Total 5800 200
∑4ℎ=1 𝑁ℎ 𝑝ℎ ̅)
500(0.75)+800(0.5)+1500(0.2)+3000(0.05
𝑝𝑠𝑡 = = = 0.21408 ≈ 21.4%, es decir de cada
𝑁 5800
100 viviendas 21 tienen
telecable.
𝑛ℎ 𝑋
∑𝑖=1 ℎ𝑖
𝑝ℎ = 𝑛ℎ
̅ (0.94
0.05 ̅)
( ) = 0.00055858
90
𝜎̂𝑝𝑠𝑡 = 0.0236
Luego, el intervalo de confianza para estimar la proporción de viviendas con telecable es:
Por tanto, estimamos que la proporción de viviendas con Telecable es del 21.4% con un
error de estimación o muestreo del 4.6%.