Está en la página 1de 24

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE INGEENIERÍA AMBIENTAL Y DE


RECURSOS NATURALES

ESTADÍSTICA APLICADA A LA I.A

1
MUESTREO ALEATORIO ESTRATIFICADO
• El objetivo del diseño de encuestas por muestreo es maximizar la
cantidad de información para un coste dado.
• El muestreo aleatorio simple suele suministrar buenas estimaciones de
parámetros poblacionales a un coste bajo, pero existen otros
procedimientos de muestreo, como el muestreo estratificado, que en
muchas ocasiones incrementa la cantidad de información para un costo
dado.
• El muestreo estratificado es un diseño de muestreo probabilístico en el
que dividimos a la población en subgrupos o estratos. La estratificación
puede basarse en una amplia variedad de atributos o característica de la
población como edad, género, nivel socioeconómico, ocupación, etc.
MUESTREO ALEATORIO ESTRATIFICADO
• Así, consideramos una población heterogénea con N unidades, y en la
que la subdividimos en L subpoblaciones denominados estratos lo
más homogéneas posibles no solapadas, atendiendo a criterios que
puedan ser importantes en el estudio, de tamaños N1, N2, . . . , NL.
Obviamente:
• N1+ N2 + . . . + NL = N total de individuos de la población
• n1+ n2 + . . . + nL = n tamaño de la muestra que queremos seleccionar.
• Podemos expresar la formación de estratos en la población y la
formación de la muestra estratificada de la forma siguiente:
Población = u1 , u2 ,..., u N ,  se divide en L estratos
u11 , u12 ,..., u1 N 1 
 
 21 22
u , u ,..., u 2N 2 
L


... ... ... ...
 N h  N.
  h 1
u L1 , u L 2 ,..., u L NL 
 
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALETORIO ESTRATIFICADO
• Seleccionamos una muestra de tamaño n,

u1, u2 ,..., uN ,  se extrae en cada estrato


u11 , u12 ,..., u1n1 
 
u21 , u22 ,..., u2 n2  L

  n h  n.
... ... ... ...  h 1
u , u ,..., u 
 L1 L2 LnL 
Este muestreo se utiliza cuando la población de estudio es muy heterogénea ya que
necesitaríamos un gran esfuerzo muestral para obtener cierta precisión mientras
que si la población esta dividida en grupos, bloques o estratos que sean
internamente homogéneos, el esfuerzo en cada grupo será mínimo resultando
globalmente un esfuerzo menor. Por ejemplo, si preguntamos en una facultad el
número medio de horas de estudio los estratos en este estudio serán los cursos. Las
razones para el uso del muestreo estratificado son las siguientes:
MUESTREO ALETORIO ESTRATIFICADO
• El muestreo estratificado puede aportar información más precisa de algunas
subpoblaciones que varían bastante en tamaño y propiedades entre si, pero que
son homogéneas dentro de si. Los estratos deberían en lo posible estar
constituidos por unidades homogéneas. El uso adecuado del muestro
estratificado puede generar ganancia en precisión, pues al dividir una población
heterogénea en estratos homogéneos, el muestreo en estos estratos tiene poco
error debido precisamente a la homogeneidad.
• Motivaciones de tipo geográfico ya que se requieren estimaciones para ciertas
áreas o regiones geográficas.
• Las cuestiones que plantea este tipo de muestreo son:
• ¿Qué caracter'ıstica utilizar para dividir la población en estratos?
• ¿Cómo se identificaran los estratos?
• ¿Cuantos estratos debe haber?
• ¿Cuantas unidades seleccionar de cada estrato?
Etimación de una Media y un Total Poblaciones
• Estimación de la media poblacional µ:
1
y st   N i yi . . . . . . . . . . . (2.1)
N
• Varianza de la media de yst
2  N i  ni  si 
2
1
Vˆ ( y st )  2  N i    . . . . . . . . . . . (2.2)
N  N i  ni 

• Límite para el error de estimación:


1 N n  s. .. . . . . . . . . (2.3)
2

2 Vˆ ( y )  2  N 
2 i i
 
i

 N  n 
st 2 i
N i i

MUESTREO ESTADISTCIA APLICADA 7


Etimación de una Media y un Total Poblaciones
• Estimador del total poblacional :
l
Nyst   N i yi . . . . . . . . . . . (2.4)
1

• Varianza estimada de Nyst


 N i  ni  si2 
Vˆ ( Nyst )   N 
i
2
  . . . . . . . . . . . (2.5)
 N i  ni 
• Límite para el error de estimación:
 N  n   s 2

2 Vˆ ( Nyst )  2  N  i
i
2 i
 
i . . . . . . . . . . . (2.6)
 N i  ni 

MUESTREO ESTADISTCIA APLICADA 8


EJERCICIOS
EJERCICIOS
• Como podemos observar hay 4 estratos, para clasificar la categoría de las
granjas, dividiendo las granjas en 4 categorías o estratos con tamaños N1
= 72, N2 = 37, N3 = 50 y N4 = 11.
• De cada uno de los estratos se selecciona una muestra de tamaños n1 =
12, n2 = 6, n3 = 8, y n4 = 2 respectivamente. Las fracciones de muestreo
para cada uno de los estratos vienen dadas por
n1 12 n2 6 n3 8 n4 1
f1   0,167; f 2    0,16 f3    0,16 f4    0,182
N 2 37 N 3 50 N 4 11
N1 72
1 n1 61  47  44  70  28  39  51  101  49  54  71
X 1   X 1i   55,58
n1 1 12
1 n 160  148  89  139  142  93

2

X2  X 2i   128,5
n2 i 1 6
EJERCICIOS
1 26  19  21  34  28  15  20  24
n3
X 3   X 3i   23,38
n3 i1 8
1 n4 17  11
X 4   X 4i   14
n4 i1 2
• En este caso, el estimador del total de vacas productoras de leche viene dado por:
n4
Xˆ  ˆ   N h X h  72*55,58  37*128,5  50*23,38  11*14  10079 vacas
h1
L 2 nh
1
V ( X st )  V (ˆst )   N h (1  f h )
ˆ ˆ ˆ 2 Sh Sh2   ( X 1i  X h ) 2
nh nh i1
h 1
EJERCICIOS
C1 C2 C3 C4
61 160 26 17
47 148 19 11
44 89 21
70 139 34
28 142 28
39 93 15
51 20
52 24
101 Vˆ ( Xˆ st )
49
54
71
medias 55.58 128.50 23.38 14.00
varianzas 350.992 897.1 35.4107 18

L 2
S
1 nh V ( X st )  V (ˆst )   N h (1  f h )
ˆ ˆ ˆ 2 h
S   ( X 1i  X h ) 2
2
h h1 nh
nh i1
C1 C2 C3 C4 N1 72 n1 12 f1 0.167 1-f1 0.83
61 160 26 17 N2 37 n2 6 f2 0.162 1-f2 0.84
47 148 19 11 N3 50 n3 8 f3 0.16 1-f3 0.84
44 89 21 N4 11 n4 2 f4 0.182 1-f4 0.82
70 139 34
28 142 28
39 93 15
51 20
52 24
101
49
54
71
55.58 128.50 23.38 14.00
350.99 897.10 35.41 18.00
L 2
S
Vˆ ( Xˆ st )  Vˆ (ˆst )   N h2 (1  f h ) h
6656.9
h 1 nh

E  2 Vˆ ( Xˆ st )  2 Vˆ (ˆst )  2 6656,9  163,2 vac


AFIJACIÓN DE LA MUESTRA
• n1 + n2 + . . . + nL = n.
Afijación uniforme
Este tipo de reparto consiste en asignar el mismo numero de unidades muestrales a cada estrato con lo que se
tomaran todos los nh iguales a k = n/L. Para este tipo de afijación, las varianzas de los estimadores vendrán dadas
por: n1 = n2 = n3 = . . . = nL
AFIJACIÓN DE LA MUESTRA
AFIJACIÓN DE LA MUESTRA
• Afijación proporcional.
• Consiste en asignar a cada estrato un número de unidades muestrales
proporcional a su tamaño. Las n unidades de la muestra se distribuyen
proporcionalmente a los tamaños de los estratos expresados en
número de unidades. Si el tamaño muestral es proporcional al tamaño
del estrato, entonces existe una constante k positiva tal que:
L L
• nh = kNh, h = 1, 2, . . . , L n  kNh h 
n  kN h  h
h1 h1

n  kN  k  n / N
Como k = n/N = f. Por lo tanto, la constante k es igual a la fracción de muestreo. La
fracción de muestreo en cada uno de los estratos viene dado por
AFIJACIÓN DE LA MUESTRA
nh N h k
fh    k  f ; es decir, las fracciones de muestreo son iguales y coinciden
Nh Nh
con fracción global de muestreo, siendo su valor constante de
proporcionalidad Wh son iguales a:
N h nh / k nh
Wh     wh
N h n / kh n
• A la vista de los anterior, los coeficientes de ponderación Wh se obtienen
exclusivamente a partir de la muestra, pues para su cálculo sólo son necesarios
valores muestrales nh y n. Utilizando las igualdades anteriores, los estimadores
para la media poblacional y el total poblacional vienen dados por:
N N
1 N
X st  Wh X h   (nh / n) X h   nh X h
N N N
1
ˆst   N h X h   (nh / k ) X h   nh X h
h 1 h 1 k h1 h 1 h 1 k h1
AFIJACIÓN DE LA MUESTRA
• Para este tipo de afijación, las varianzas de los estimadores serán:
L
S 2 L
S 2
1  k L
Vˆ (ˆst )   N h2 (1  f ) h   N h2 (1  k ) h   N 2 2
h Sh
h 1 nh h1 kN h k h1
L
S 1 k 2 L
V ( X st )  Wh (1  f h ) 
ˆ 2
 h 2
Wh S h
h 1 nh n h1
1  k L
N P Q 1  k L
 Nh / N 
ˆ ˆ
V ( Pst )  
n h1
Wh h h h
Nk 1 k
    PhQh
k h1  N h  1 
AFIJACIÓN DE LA MUESTRA
Ejemplo 3 Considerando el ejemplo ??, realizar una afijación proporcional.

n  kN  k  n / N
 100 100
 1 870 1 870 * 210  24
n  * N 

100  100 100
100  K *870  K   n2  * N2  *600  69
870  870 870
 100 100
 3 870 3 870 *60  7
n  * N 

AFIJACIÓN DE LA MUESTRA
• Afijación de mínima varianza (o afijación de Neyman)
• La afijación de mínima varianza o afijación de Neyman consiste en
determinar los valores de nh (número de unidades que se extraen del
estrato L-th para la muestra) de forma que para un tamaño de muestra
fijo igual a n la varianza de los estimadores sea mínima. El desarrollo
teórico para obtener la expresi´on de la afijación en cada estrato y los
estimadores correspondientes se basa en la teoría de los
multiplicadores de Lagrange obteniéndose que el número de unidades
que se extraen del estrato L-th es igual a
 
 NS 
nh  n  L h h  ; h  1,2,..., L
 NS 
 h h 
 h1 
AFIJACIÓN DE LA MUESTRA
El valor de la varianza del estimador del total y de la media vienen dados por:
2
1  L
 1 L
Vˆ ( X st )   Wh S h   Wh S h2
n  h1  N h1
2
1 L
 1 L
Vˆ (ˆst )   Wh Sh    N h Sh2
n  h1  N h1
2
1
L
PQ N  1 L  PhQh N h 
V ( Pst )   Wh h h h
ˆ ˆ   Wh  
n  h1 Nh   N h1  N h  1 
AFIJACIÓN DE LA MUESTRA
Ejemplo 4 Considerando el Ejemplo ??, realizar una afijación de Neyman. Como
hemos comentado anteriormente, la asignación para cada muestra viene dado por:
  X ni nixi
Primero vamos a calcular las cuasi
 NS  2 20 40

nh  n L h h  varianzas poblacionales para cada
 NS  3 30 90
 h h 
uno de los estratos. Para el estrato
 h1  4 60 240 poblacional 1,
X ni nixi
7 100
2 20 700
40
3 30 90
4 60 240
7 100 700

• La media poblacional en el estrato 1 viene dada por:


40  90  240  700
X1   5,09
210
AFIJACIÓN DE LA MUESTRA
ESTRATO I ESTRATO II ESTRATO III
(Xi- (Xi-
PROMEDIO)2 PROMEDIO)2 (Xi-PROMEDIO)2
X ni nixi *ni X ni nixi *ni X ni nixi *ni
2 20 40 191.61 10 150 1500 2970.375 30 20 600 3645
3 30 90 131.70 12 200 2400 1200.5 35 18 630 1300.5
4 60 240 71.97 16 120 1920 288.3 50 10 500 422.5
7 100 700 362.81 20 80 1600 2464.2 60 8 480 2178
25 50 1250 5565.125 100 4 400 12769
TOTALES 210 1070 758.10 600 8670 12488.5 60 2610 20315
PROMEDIO 5.095 14.45 43.5
VAR 3.63 20.85 344.32
DSV 1.90 4.57 18.56

N  N1  N 2  N 3  210  600  60  870


N1S1  N 2 S2  N 3 S3  210*1,90  600* 4,57  60*18,556  4254,6
AFIJACIÓN DE LA MUESTRA
N1S1  N 2 S2  N 3 S3  210*1,90  600* 4,57  60*18,556  4254,6
 
 N1S1  100 * 399
n1  n    9
 
3


4254, 6
 N h S h 

 h 1

 N 2 S2  100 * 2742
n2  n     65
 
3


4254, 6
 N h S h 
 h 1

 N S  100 *1113,36
n3  n  3 3 3   26
 
  N h Sh
4254,6

 h1 

También podría gustarte