Está en la página 1de 37

UNIVERSIDAD DEL ATLÁNTICO

MAESTRIA EN DIDACTICAS DE LAS


MATEMATICAS

MUESTRO ALEATORIO ESTRATIFICADO

Kennedy Hurtado Ibarra


MSc. En Estadística aplicada
Barranquilla- Colombia
Referencia: David Ospina Botero, Introducción al muestreo. Universidad
Nacional De Colombia.
MUESTREO ALEATORIO ESTRATIFICADO (MAE)

INTRODUCCIÓN.
Cuando en la población objetivo existen subpoblaciones y
los elementos de la misma son heterogéneos respecto a la
variable que se desea estudiar, se puede elegir la muestra de
manera diferente al MAS si se dispone de información sobre
las subpoblaciones existentes. En este caso se utiliza el
muestreo aleatorio estratificado.
DEFINICIÓN:
El muestreo aleatorio estratificado es aquel en que se
divide la población de N elementos en L subpoblaciones,
cada una con NL elementos, donde N = …….: Esta
subpoblaciones que reciben el nombre de estratos no
deben traslaparse. Los estratos entre si deben tener
características diferentes respecto a la variable que se
desea estudiar, pero dentro de cada estrato debe existir
homogeneidad.
Toma de la muestra:
La muestra se toma asignando primero, mediante algún
criterio, un número de miembros a cada estrato y escogiendo
después los elementos que forman la muestra por muestreo
aleatorio simple dentro del estrato.
En algunas poblaciones los estratos se presentan en forma
natural, tal es el caso de estudios de carácter social, espacial,
económico.
 
VENTAJAS.
Las ventajas del muestreo estratificado respecto al
aleatorio simple son tanto mayores cuanto más
diferentes sean los estratos entre si y más homogéneos
sean internamente. En este caso la precisión del
muestreo estratificado puede aumentar mucho con
relación al aleatorio simple, debido a que se tienen en
cuenta características relevantes dentro de los estratos.
La representación de cada estrato en la muestra total
depende de varios factores, a saber:
 
.
 El tamaño relativo del estrato en la población.

 La variabilidad que tiene la característica que estudiamos


dentro de cada estrato. Tomaremos más elementos del
estrato con mayor variabilidad. Si hay mucha variabilidad
entre estratos se necesitará una muestra de menor tamaño
que en el MAS.
 Los costos de muestreo de los individuos dentro de cada
estrato.
 
Notación.
La Población consta de N elementos y está dividida en L
estratos. El subíndice h denota el estrato, e i denota la
unidad dentro del estrato. Todos los símbolo siguientes se
refieren al estrato h.
: Numero total de elementos.
Tamaño de la muestra.
Valor obtenido de la i-ésima unidad
= : Ponderación del estrato.
= : Fracción de muestreo
  = : Media poblacional.

: Media muestral.

: : Estimador del total.

= : Cuasivarianza verdadera.

=: Cuasivarianza muestral
  LaMedia Poblacional
Si en cada estrato es un estimador insesgado de entonces
(media muestral para la población para el muestreo
estratificado) es un estimador insesgado de la media
poblacional , donde:

= , es un estimador insesgado de la media verdadera en el


estrato h y donde la proporción de la población que
pertenece a dicho estrato

Si las muestras se extraen independientemente en cada


estrato.
VAR(=
D
  onde:
VAR( =
Un estimador insesgado de VAR(se obtiene reemplazando
en la formula anterior. Obteniendo:

var(

Otra formula alternativa para de más fácil manejo


computacional es:
VAR(= - ,
El error estándar  de estimación está dado por
EE(=
Un estimador de VAR( es var(
Donde todos los términos son conocidos, el error estándar se
.

estima
ee(
 
ESTIMACIÓN DEL TOTAL POBLACIONAL.
El total poblacional puede ser estimado insesgadamente
con:
=N
La varianza y el error estándar de este estimador esta dado
por:
VAR() = y el error estándar
EE( , cuyo estimadores son:
var() = y ee(

= Nee(
INTERVALOS DE CONFIANZA.
 
Bajo el supuesto de que los estimadores se distribuyen
normalmente el intervalo de confianza del 100(1- para la
media y el total poblacional puede establecerse como:
) y )

Si los tamaños de muestras son suficientemente grande la


aproximación normal proporciona intervalos aceptables ,
tanto para la media como al total.
 
Donde. =
Cuando los tamaños de muestra de los estratos son muy
pequeños y no es válido el uso de la normalidad el valor z se
reemplaza por un valor t con v grados de libertad calculados
con la siguiente expresan:

v= , donde =
EJEMPLO:
La tabla presenta la información correspondiente a gastos
mensuales en servicios públicos de una muestra aleatoria
estratificada de 120 familias en una ciudad geográficamente
dividida en tres estratos. Norte, centro y sur.
Estrato Norte Centro Sur
4000 6000 10000
0,20 0,30 0,50
36 40 44
2,4 1,2 0,6
9600 7200 6000
1,21 0,36 0,04
Var( 0,004404 0,000993 0,000226
Solución:
 
Con base en la tabla anterior se puede obtener estimaciones
para el gasto promedio de toda la población, el gasto total y
los correspondientes intervalos de confianza.
N= 20000
Para la media:
= 0,20(2,4)+0,30(1,2)+0,50(0,6) = 1,14 salarios mínimos.

Var(= + - = 0,002363
ee(0,049 salarios mínimos
Un intervalo de confianza del 95% para está dado por:
  [1,14 - ; 1,14 + ], el valor para =1,98 no muy diferente al valor de z=
1.96.

[1,04 ; 1,24]

Para el total = 20000(1,14) = 22800 salarios mínimos.

ee()= 20000(0,049) = 980 salarios mínimos

El intervalo de confianza observado del 95% de confianza sería,


entonces:

[20860 ; 24700] salarios mínimos.


ESTIMACIÓN DE LA PROPORCIÓN.

  Anteriormente se ha definido P como la proporción deseada y A como


el número total de elementos en la población con el atributo deseado.

Adicionalmente, se definen:

: Número de elemento en el estrato h con el atributo deseado.


: Número de elementos en la muestra h con el atributo deseado.
: Proporción de elementos de la población en el estrato h con el
atributo deseado.
: Proporción de elementos de la muestra en el estrato h con el atributo
deseado.
y pueden de ser estimados insesgadamente por y = , respectivamente.
Las varianzas y errores estándar de estos estimadores son:

Para .
 
VAR(= ,

EE()=

Los cuales se estiman con

vara(= .

ee()=

Var() es un estimador insesgado de VAR() .


Para

  VAR() = ,
EE() =

Con estimadores dado por:

var()= -)

ee()=

var() es un estimador insesgado de VAR()


  Estimadores insesgados para P y A pueden definirse
fácilmente:
= y, = N

Con varianzas y error estándar


VAR() = ) y su estimador es var() = )
EE() = = )

y, VAR() = ) y su estimador es var() = )

EE() =
EJEMPLO:

 Considérese nuevamente la ciudad intermedia dl ejemplo anterior pero en


este caso el objetivo es estimar el porcentaje y el número total de familias
que poseen al menos un automóvil. La información obtenida de la muestra
aparece en la tabla siguiente:
Estrato Norte Centro Sur
4000 6000 10000
0,20 0,30 0,50
36 40 44
0,90 0,60 0,20
3600 3600 3600
0,10 0,40 0,80
Var( 0,002548 0,006113 0,003251
  Con base en la primera información se pueden obtener estimaciones
puntuales y por intervalos de confianza tanto para la proporción
poblacional como el número total de familia con al menos un automóvil.

Para la proporción de familias.


= (0,20)(0,90)+(0,30)(0,60)+(0,50)(0,20) = 0,46

Var() ==

= 0,001465,
ee() = 0,0383.
Un intervalo de confianza para el 95% sería:
[0,46-1,98(0,0383) ; 0,46 + 198(0,383) = [0,38 ; 0,54]
o expresado en termino de porcentaje, [38% : 54%]
  Para el total de familias.
= 20000(0,46) = 9200
Var() = [(Var()] = 0,001465) = 586000

ee() = 765,51

Un intervalo de confianza del 95% sería:

[9200-1,98(765,51) ; 9200(765,51)]

[ 7684 ; 10716] familias


AFIJACIÓN DE LA MUESTRA.

 Existen varios procedimiento de asignación de la muestra a los diferentes


estratos.
 Afijación igual
Si todos los estratos tienen aproximadamente el mismo tamaño y no hay
ninguna información disponible acerca de la variabilidad existente dentro
de los estratos, lo más sencillo y aconsejable es asignar a cada uno de los
estratos el mismo tamaño de muestra. Esto es,
, donde n es el tamaño de la muestra y L el número de estrato

 Afijación proporcional.
Cuando los tamaños de los estratos son diferentes, es común darle a todas
unidades en la población la misma probabilidad de ser parte de la muestra
.Para que ello se cumpla, es necesario que el tamaño de muestra
correspondiente sea proporcional al tamaño de dicho estrato.
=n
Siendo el tamaño relativo de cada estrato.
  La varianza del estimador de la media en este Caso es:
VAR()=
Las dos afijaciones mencionadas pocas veces producen buenos resultados
pues ellos no tienen en cuenta para nada la homogeneidad de los
elementos dentro de los estratos, razón que en ultimo caso, justifica la
estatificación.
 Afijación optima.
La posición más conveniente consiste en balancear la variabilidad dentro
de los estratos con el tamaño de ellos. La asignación resultante teniendo
en cuenta estos dos aspectos, se denomina afijación optima.
=n
El tamaño de muestra correspondiente a cada estrato es directamente
proporcional al producto del tamaño del estrato por su variabilidad
representada esta por la desviación estándar poblacional.
La varianza para este tipo de afijación es:
VAR(= -
  La afijación optima produce “la mejor estimación” en el sentido de menor
varianza del estimador de la media y, por tanto de la proporción y el total.
Como la desviación estándar poblacional debe estimarse de antemano,
una formula más apropiada para es:
= donde es la estimación previa de la desviación estándar para el estrato
h.

 Afijación optima para costos variables.


Un factor a menudo determinante en la asignación del tamaño de la
muestra es el costo de recolección de la información. La función de costo
considerada es:
C=
C= ,
  Siendo:
C el presupuesto total asignado a la recolección de la información.
: El costo fijo que no depende del numero de elementos a seleccionar.
: El costo de muestrear un elemento perteneciente al estrato h.

Entonces el tamaño de muestra optimo por estrato está dado por:

=n
TAMAÑO DE MUESTRA PARA MEDIAS Y TOTALES.
 

El tamaño de muestra global en MAE que minimiza la varianza


de la media (total) dado un presupuesto fijo, viene dado por:
n= en la practica la formula a utilizar es:

n=
Si lo que se desea es minimizar el costo para una variabilidad
 
del estimador VAR() dada de antemano. El tamaño de muestra
aproximado es:

n= , donde =

y =
 
Al desconocerse los , se utilizan alternativamente.
n= , donde,

= , el valor de =
 
Si los costos son desconocidos y no hay forma de estimarlos
aceptablemente, el tamaño de muestra puede aproximarse
por:

n=, que también se presenta como:

n=
 
En caso que se desconozca, además de los costos, la
variabilidad dentro de los estrato, y se debe hacer uso de la
afijación proporcional, el tamaño de la muestra estará dado
por:

n= , donde

EJEMPLO: Libro pagina 117


TAMAÑO DE MUESTRA PARA LA PROPORCION
  Si lo que se desea minimizar para un presupuesto fijo:
n=

Si por el contrario lo que se busca minimizar el costo para una


varianza del estimador dada de antemano n=, donde =
La distribución de la muestra a los estratos en los dos caso
anteriores
 
debe ser optima , esto es, de acuerdo con:
n
Si los costos no se consideran
n= , donde =
La muestra debe distribuirse como
Si la afijación es proporcional,
 
n= , donde

EJEMPLO PAGINA 123.


   
  .  

GRACIAS

También podría gustarte