Está en la página 1de 25

Sesión 3.

Muestreo estratificado
Antecedentes y conceptos básicos
Aunque el diseño de muestreo aleatorio simple suele suministrar buenas estimaciones de cantidades
poblacionales a un costo bajo, es posible en muchas ocasiones, incrementar la cantidad de
información para un costo dado con el muestreo aleatorio estratificado.

Una muestra aleatoria estratificada es la obtenida mediante la separación de los elementos de la


población en grupos que no presenten traslapes, llamados estratos, y la selección posterior de una
muestra aleatoria simple en cada estrato.
Este tipo de muestreo es más complicado, ofrece algunas ganancias potenciales:

1) Si los individuos dentro de cada estrato son mucho más similares que los individuos en general,
entonces la estimación de la media poblacional global tendrá un error estándar menor que el que puede
obtenerse con un muestreo irrestricto aleatorio del mismo tamaño muestral.

2) La estratificación hace posible muestrear diferentes partes de una población, lo cual puede constituir
un posible ahorro en los costos. (Uniformidad)

3) Puede ser de valor tener estimaciones separadas de los parámetros poblacionales para los diferentes
estratos. El muestreo aleatorio estratificado permite la estimación separada de parámetros poblacionales
dentro de cada estrato
Los costos pueden ser minimizados mediante una muestra aleatoria estratificada, cuidadosamente
planeada para áreas geográficas compactas bien definidas. Los motivos principales para utilizar muestreo
aleatorio estratificado en lugar de muestreo irrestricto aleatorio son:

1. La estratificación puede producir un límite más pequeño para el error de estimación que el que se
generaría por una muestra irrestricta aleatoria del mismo tamaño. Este resultado es particularmente cierto
si las mediciones dentro de los estratos son homogéneas.

2. El costo por observación en la encuesta puede ser reducido mediante la estratificación de los elementos
de la población en grupos convenientes.

3. Se pueden obtener estimaciones de parámetros poblacionales para subgrupos de la población. Los


subgrupos deben ser entonces estratos identificables.
Generalmente, los tipos de estratificación que deberían ser considerados son aquellos basados en
ubicaciones espaciales, regiones dentro de las cuales se espera que la población sea uniforme. Por
ejemplo, al muestrear casas, una localidad puede dividirse en regiones (AGEBS) en donde las
características de edad y clase social son relativamente uniformes. Usualmente la elección de qué
estratificar es sólo cuestión de sentido común para la encuesta en consideración.

Este método (m.a.e.) consiste en seleccionar una muestra de una población cuya naturaleza presenta
subconjuntos claros en función de la variable estudiada. Estos subconjuntos para ser considerados
estratos deben ser tales que:

1) No se traslapen.
2) Sean homogéneos en su interior.
3) Sean heterogéneos entre ellos.
Obtención de la muestra aleatoria estratificada

1. Especificar claramente los estratos: cada unidad muestral debe ubicarse en uno y sólo un estrato apropiado. A
veces esto puede ser difícil, por ejemplo, en una ciudad de 10000 habitantes, ¿cómo distinguimos entre hogares
urbanos y rurales? Pueden ser rurales si el pueblo está aislado en el campo o pueden ser urbanos si el pueblo
está junto a una gran ciudad.

2. Seleccionar una muestra aleatoria simple de cada estrato usando las técnicas vistas. Se requiere un marco
de muestreo para cada estrato.

3. Asegurarse que las muestras seleccionadas en los estratos sean independientes. Esto es, se deben aplicar
diferentes esquemas de muestreo aleatorio dentro de cada estrato, de tal manera que las observaciones
elegidas en un estrato no dependan de las que se han elegido en otro estrato.
Estimación de parámetros y error
Estimación de la media poblacional
La estimación de la media poblacional en el m.a.e. es un promedio ponderado de las medias de
las muestras aleatorias simples en cada estrato, donde los pesos son los tamaños proporcionales
de los estratos: 𝑁𝑖/𝑁.

El límite de error de estimación se obtiene:

Donde la varianza también corresponde a un promedio ponderado de las varianzas de cada estrato
Ejemplo.
Se desea estimar la calificación promedio que pueden obtener estudiantes de sexto grado en un examen de
comprensión de lectura. Los estudiantes son agrupados en tres estratos: los que aprenden de manera rápida
en el estrato I, los que aprenden de manera regular en el estrato II y los que aprenden de manera lenta en el
estrato III. Se decide esta estratificación porque de esta manera se reduce la variabilidad en las calificaciones
del examen. El sexto grado contiene 55 estudiantes en el estrato I, 80 en el estrato II y 65 en el estrato III.
Una muestra aleatoria estratificada de 50 estudiantes es asignada proporcionalmente y produce muestras
aleatorias simples de 𝑛1 = 14, 𝑛2 = 20 y 𝑛3 = 16 de los estratos I, II y III respectivamente. El examen se
aplica a la muestra de estudiantes y se obtienen los resultados que se muestran en el Cuadro 1.
Una buena manera de examinar las características clave de estas tres muestras es mediante
gráficos de caja paralelos como se muestra en la siguiente figura:
Nota:
Donde dichos datos, pueden
obtenerse mediante las fórmulas
de Excel (Sheets)
=

Nota:
Se puede obtener del archivo del MIA sustituyendo el valor de N, n y s2.
Así, se estima que la calificación promedio de los alumnos del sexto grado es 59.9887. El error
de estimación debe ser menor que 3.0324, con un nivel de confianza aproximadamente igual a
95%.
Estimación del total poblacional
Los procedimientos para estimar el total poblacional 𝜏 se derivan directamente de los procedimientos
presentados para la estimación de 𝜇.
Estimación de la proporción poblacional
Ejercicio
Se desea conocer la proporción de respaldos de información que se ejecutan en los tiempos y días
establecidos en los procedimientos de cierta empresa.
Debido a su tamaño, es necesario analizarla para cada una de las zonas/sectores en las que se encuentra
conformada, de tal manera, que se decide realizar un muestreo estratificado formando los estratos I, 2, 3 y 4,
para cada una de las regiones que conforman la empresa.
Supóngase que los tamaños de muestra tomados fueron: 𝑛1 = 39, 𝑛2 = 17, 𝑛3 = 69 y 𝑛4 = 33.
Registros existentes nos dan el número de respaldos que se debieron ejecutar durante el periodo de análisis,
quedando de la siguiente manera: 𝑁1 = 97, 𝑁2 = 43, 𝑁3 = 145 y 𝑁4 = 68.
Se obtienen las siguientes proporciones de cumplimiento para cada una de la regiones: 𝑝̂1 = 0.87, 𝑝̂2 =
0.93, 𝑝̂3 = 0.60, 𝑝̂4 = 0.53.
Estime la proporción poblacional, p, y establezca un límite para el error de estimación, al 95% de confianza.
Así, se estima que la proporción de respaldos realizados en tiempo y forma es de 70% con un límite de
error de estimación de 5% (al 95% de confianza). Es decir, se esperaría con un 95% de confianza que
entre el 65% y 75% de los respaldos, se ejecuten de acuerdo a los tiempos establecidos.
Tamaño de muestra
Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos
técnicas de muestreo estratificado:
1. Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño
en la población.
2. Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más
variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de
hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta
homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría
una muestra que contenga también esa misma proporción.

Sin embargo, para efectos prácticos y debido a su amplio uso en la práctica, nos centraremos en la
asignación proporcional.
Asignación proporcional para estimar 𝜇 y 𝜏
Este método de asignación de la muestra a los estratos se llama asignación proporcional porque los
tamaños de muestra 𝑛1 = 𝑛2 = ⋯ = 𝑛𝐿 son proporcionales a los tamaños de los estratos 𝑁1 = 𝑁2 = ⋯
= 𝑁𝐿 .
El tamaño de muestral total se obtiene:

Esta última fórmula, aparte de ser válida cuando se quiere estimar con , se usaría cuando

interesa estimar 𝜇 , pero con el valor de cua cuando se desee estimar 𝜏


Se desea conocer el monto promedio por órden de compra realizado en cierta empresa
Debido a su tamaño, es necesario analizarla para cada una de las regiones en las que se encuentra
conformada, de tal manera, que se decide realizar un muestreo estratificado formando los estratos I, 2
y 3 para cada una de las zonas que conforman su estructura
Registros existentes nos dan el número de respaldos que se debieron ejecutar durante el periodo de
análisis, quedando de la siguiente manera: 𝑁1 = 55, 𝑁2 = 80 y 𝑁3 = 65
Calcular el tamaño de muestra considerando un límite de error B de $4 (miles).

Con la información proporcionada y tomando como referencia una revisión de auditoría similar, se estimaron s^2
para cada una de las regiones de la empresa, obteniéndose la siguiente información.
Se utiliza el archivo excel para rellenar la información conocida por estrato: N tamaño población y s^2 varianza
muestral de cada estrato; Así como el límite de error de estimación B.

Se requieren 10 órdenes para el estrato I, 14 órdenes para el estrato II y 12 órdenes para estrato III para
garantizar un margen de error de $4 (en miles) del monto promedio por orden de compra.
Asignación proporcional para estimar 𝒑
Como se recordará, en la asignación proporcional, el tamaño de la muestra en cada estrato 𝑖 está
dado por:

En el caso del tamaño de la muestra 𝑛 para estimar 𝑝, se tiene:


Ejercicio
Se desea conocer la proporción de respaldos de información que se ejecutan en los tiempos y días
establecidos en los procedimientos de cierta empresa.
Debido a su tamaño, es necesario analizarla para cada una de las zonas/sectores en las que se encuentra
conformada, de tal manera, que se decide realizar un muestreo estratificado formando los estratos I, 2, 3 y 4,
para cada una de las regiones que conforman la empresa.
Registros existentes nos dan el número de respaldos que se debieron ejecutar durante el periodo de análisis,
quedando de la siguiente manera: 𝑁1 = 97, 𝑁2 = 43, 𝑁3 = 145 y 𝑁4 = 68.
Se obtienen las siguientes proporciones de cumplimiento de la auditoría previa para cada una de la regiones:
𝑝̂1 = 0.9, 𝑝̂2 = 0.9, 𝑝̂3 = 0.50, 𝑝̂4 = 0.5.
Calcular el tamaño de muestra, considerando un error máximo del 5%.
Se utiliza el archivo excel para rellenar la información conocida por estrato: N tamaño población y p proporcional
muestral de cada estrato; Así como el límite de error de estimación B.

Se requieren 49 respaldos para el estrato I, 22 respaldos para el estrato II y 73 respaldos para estrato III y 34
respaldos para el estrato IV para garantizar un margen de error del 5% en la proporción del cumplimento de
respaldos..
En general, el m.a.e con asignación proporcional producirá un estimador con una
varianza más pequeña que la producida por m.i.a (con el mismo tamaño de
muestra), si existe considerable variabilidad entre las medias de los estratos.

También podría gustarte