Está en la página 1de 28

Sesión 4.

Muestreo sistemático y conglomerados


Antecedentes y conceptos básicos
El muestreo sistemático se define:
Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros 𝑘 elementos en el
marco y después cada 𝑘-ésimo elemento se denomina muestra sistemática de 1 en 𝑘.

Por ejemplo, supóngase que una muestra de 12 nombres será seleccionada de una larga lista. Una
manera sencilla de hacer esta selección es elegir un intervalo apropiado y seleccionar los nombres a
intervalos iguales a lo largo de la lista. De este modo cada quinto nombre podría ser seleccionado, por
ejemplo. Si el punto de inicio para este proceso de selección es aleatorio, un número entre 1 y 5, el
resultado es una muestra sistemática.
El muestreo sistemático proporciona una opción para el muestreo irrestricto aleatorio por las siguientes
razones:

1. El muestreo sistemático es fácil de llevar a cabo en el campo y, por tanto, a diferencia de las muestras
irrestrictas aleatorias y las muestras aleatorias estratificadas, está menos expuesto a errores de selección
que cometen los investigadores en el campo.

2. El muestreo sistemático puede proporcionar mayor información que la que puede proporcionar el
muestreo irrestricto aleatorio por unidad de costo. Esto puede ser consecuencia de querer muestrear de
manera uniforme a lo largo de un área de estudio completa. Una muestra sistemática generalmente se
extiende más uniformemente sobre toda la población y, por lo tanto, puede proporcionar más información
acerca de la población que una cantidad equivalente de datos contenida en una muestra irrestricta
aleatoria.
Otra ventaja del muestreo sistemático es que produce fácilmente una muestra proporcional,
si aprovechamos el hecho de que la muestra se reparte uniformemente en la población
mediante un ordenamiento correspondiente de esta última. Por ejemplo, una muestra de
cada 𝑘-ésima vivienda de una manzana se extenderá a su alrededor por los lados que tal
vez difieran considerablemente en características. O bien, una muestra sistemática de una
lista de nombres en orden alfabético producirá aproximadamente la misma proporción de
nombres de cada letra.

Los auditores frecuentemente se enfrentan con el problema de muestrear una lista de cuentas
para comprobar el cumplimiento con los procedimientos de contabilidad o para verificar las
cantidades. La forma más natural para muestrear las listas es seleccionar las cuentas
sistemáticamente.

Los investigadores de mercado y los encuestadores, quienes muestrean personas en


movimiento, muy frecuentemente emplean un diseño sistemático. A cada vigésimo cliente en un
mostrador de pago se le puede preguntar su opinión acerca del sabor, color, o textura de un
producto alimenticio. A cada décima persona que aborde un autobús se le puede pedir que llene
un cuestionario acerca del servicio de autobús. Cada centésimo automóvil que entra a un
parque de diversión puede ser detenido y al conductor preguntarle acerca de los sistemas de
publicidad del parque o sobre el precio de los boletos. Todas estas muestras son sistemáticas.
El muestreo de intervalo es apropiado cuando, por ejemplo, un auditor quiere evaluar si los controles
estaban operando a lo largo de todo un año. (Una muestra aleatoria puede resultar en que todos los
elementos sean seleccionados en un solo mes.)

Obtención de la muestra

1. Se selecciona al azar el punto de inicio, entre 1 y 𝑘, y se ubica en el marco. Para determinar 𝑘 se requiere
conocer el tamaño de la población 𝑁. En este caso, para una muestra sistemática de 𝑛 elementos de una
población de tamaño 𝑁, 𝑘 debe ser un número aleatorio menor o igual que 𝑁/𝑛 (𝑘≤𝑁/𝑛).

2. Posteriormente se selecciona cada 𝑘-ésimo elemento a partir del punto de inicio hasta completar el
tamaño de muestra 𝑛.
Ejemplo

Muestra de manzanas.

Una Localidad se divide en 𝑁=576 manzanas numeradas en forma serpentina; es decir, las manzanas
vecinas tienen números consecutivos. Va a tomarse una muestra de 57 manzanas, lo que da un intervalo
muestral de 𝑘=10 (576/57). Si el número al azar entre 1 y 10 es 03, las manzanas con los números

03, 13, 23, 33, 43, 53, . . ., 573


conformarán la muestra. En cambio, si el número al azar es 08, la muestra se integrará con las
manzanas numeradas
08, 18, 28, 38, 48, 58, . . ., 568

La primera muestra tiene 58 manzanas y la segunda sólo 57. Así, el tamaño de la muestra puede
diferir en 1 de una muestra a otra cuando 𝑁 no es exactamente divisible entre 𝑘.

No podemos seleccionar exactamente a 𝑘 cuando el tamaño de la población es desconocido.


Cultura General: Relaciones entre el m.s. y el m.i.a.

1. Los elementos de una muestra sistemática de una población aleatoria se espera que
sean heterogéneos. Por tanto, el muestreo sistemático es equivalente al muestreo
irrestricto aleatorio.

2. Una muestra sistemática extraída de una población ordenada es generalmente


heterogénea (muy variable) . Una muestra aleatoria de una población ordenada
proporciona más información que una m.i.a. por unidad de costo.
Si el marco del cual se extrae una muestra sistemática está listado de acuerdo al valor
numérico ascendente de la variable de interés, entonces la población está ordenada.

3. Los elementos de una muestra sistemática extraída de una población periódica pueden
ser homogéneos. Por tanto, en este caso, el muestreo sistemático proporciona menos
información que el m.i.a. por unidad de costo.

Si hay una variación periódica en la población debemos tener cuidado en el empleo del
muestreo sistemático.
Es frecuente la aparición de poblaciones con variación periódica. Las temperaturas en un período de
24 horas, las ventas semanales de las tiendas, los artículos postales recibidos en una oficina de
correos durante una semana, son algunos ejemplos. Debemos estar suficientemente familiarizados con
los datos para poder decidir acerca del intervalo muestral si ha de emplearse el muestreo sistemático.
Considérese, por ejemplo, el problema de la estimación del número de vehículos que pasan por un
puente durante cierto mes. Esperamos que el tránsito sobre el puente muestre periodicidad durante el
día, pues hay horas en que el tránsito es muy intenso y otras en que es muy escaso. Supongamos que
seleccionamos una hora al azar y examinamos el tránsito durante esta hora y los períodos
subsecuentes de 24 horas. Si la hora seleccionada resulta ser la de tránsito máximo, la muestra
contendrá todos los períodos y éstos producirán una cifra muy elevada. Por otra parte, si la primera
hora seleccionada muestra escaso tránsito, todas las observaciones tomadas en este momento
durante los días subsecuentes deberán encontrarse por debajo del promedio, lo que producirá una
cifra baja.
La recomendación práctica es así: se puede usar muestreo sistemático, pero cuidar posibles
tendencias periódicas. Si tiene para elegir entre tomar una m.i.a. o una muestra sistemática,
escoja siempre una m.i.a, debido a que siempre puede haber preocupación por la presencia de
efectos periódicos que pueden influir en las estimaciones. Pero si el costo e inconveniencia de la
aleatorización son demasiado grandes, puedes perder muy poco al muestrear de manera
sistemática.
Estimación de parámetros y tamaño de
muestra
Para estimar un promedio, total o proporción, así como su respectivo error B de estimación, se
utilizan las mismas fórmulas del muestreo aleatorio simple.

Sucede lo mismo para el cálculo del tamaño de muestra.


Ejemplo.
Supongamos que el área de auditoría requiere realizar una revisión de contratos, con el fin de validar que
las carpetas resguardadas contenga la documentación completa establecida en las políticas de la empresa.
Los contratos a revisar corresponden al periodo enero 2021 - junio 2021, el cual en su conjunto
representan un total de 500 contratos y se desea conocer el total de ellos que cuenta con una
calificación satisfactoria. Sin embargo, se cuenta con poco personal y tiempo para ejecutar una revisión
exhaustiva de los mismos por lo que se ha decidido tomar una muestra que sea representativa. El equipo
auditor está dispuesto a aceptar un error de muestreo de máximo 5%.

Técnica de muestreo: Muestreo aleatorio sistemático


Parámetro a estimar: p (proporción)
Muestreo conglomerados
Ahora trataremos muestreo por conglomerados, el cual algunas veces proporciona más información por
unidad de costo que cualquier otro de los diseños estudiados anteriormente. Inicialmente nos ocuparemos
del caso más general en que las unidades de muestreo comprenden dos o más unidades de estudio.

Una muestra por conglomerados, la unidad de muestreo (o de selección), en lugar de ser un elemento de
la población, está constituida por varios de estos elementos agrupados naturalmente. Se habla de
“cluster” o conglomerado para referirse a cada unidad de muestreo.
Ejemplos de muestreo por conglomerados serían:

1. La selección aleatoria de familias de una población para efectuar un estudio de individuos.


2. La selección de ranchos de una localidad para una investigación en que las unidades
últimas fuesen cabezas de ganado.
3. Las manzanas de la ciudad son usadas frecuentemente como conglomerados de hogares o
personas.
4. La selección de árboles de una plantación cuando las unidades últimas fuesen los frutos. 5.
Un árbol de naranja agria forma un conglomerado de naranjas para la investigación de
infestación por insectos.
6. Una parcela en el campo contiene un conglomerado de árboles para la estimación de
volúmenes de madera o proporción de árboles enfermos.
Se recomienda su uso cuando no se encuentra disponible o es muy costoso obtener un buen
marco para la población, mientras que se puede lograr fácilmente un marco que liste
conglomerados.

También es idóneo cuando el costo por obtener datos se incrementa con la distancia que separa las
unidades experimentales últimas. Por ejemplo, supóngase que deseamos estimar el ingreso promedio
por hogar en una gran ciudad. ¿Cómo debemos seleccionar la muestra? Si usamos m.i.a., se requiere
un marco que liste todos los hogares (elementos) en la ciudad, y este marco puede ser muy costoso o
imposible de obtener. No podemos evitar este problema al utilizar m.a.e. porque incluso se requiere un
marco para cada estrato en la población. En lugar de extraer una m.i.a. de elementos, podríamos dividir
la ciudad en regiones tales como manzanas (o conglomerados de elementos) y seleccionar una m.i.a. de
ellas. Esta tarea se realiza con facilidad mediante el uso de un marco que liste todas las manzanas de la
ciudad. Entonces se podría medir el ingreso de cada familia dentro de cada manzana muestreada.
En lo que respecta a la distancia que separa a los elementos, suponga que se cuenta con una lista de
hogares de la ciudad. Podríamos seleccionar una m.i.a. de hogares, la cual probablemente estará
dispersa en toda la ciudad. El costo por realizar entrevistas en los hogares dispersos va a ser grande
debido al tiempo de transporte de los encuestadores y otros gastos relacionados. El m.a.e. podría reducir
estos gastos, pero el uso de muestreo por conglomerados es un método más efectivo para reducir los
gastos de transporte. Los elementos dentro de un conglomerado deben estar geográficamente cerca uno
de otro, y entonces los gastos de transporte se reducen. Obviamente el transporte dentro de un bloque de
la ciudad sería mínimo si se comparara con el transporte asociado al m.i.a. dentro de la ciudad.

En resumen, el muestreo por conglomerados es un diseño efectivo para obtener una cantidad
especificada de información al costo mínimo bajo las siguientes condiciones:

1. No se encuentra disponible o es muy costoso obtener un buen marco que liste los elementos de la
población, mientras que se puede lograr fácilmente un marco que liste los conglomerados.

2. El costo por obtener observaciones se incrementa con la distancia que separa los elementos
Obtención de una muestra por conglomerados
1. Especificar los conglomerados apropiados.
Nota: La principal diferencia entre la construcción óptima de estratos y la construcción de los
conglomerados consiste en que los estratos deben ser tan homogéneos (semejantes) dentro de ellos,
como sea posible (contiene casi toda la diversidad de la población), pero un estrato debe diferir tanto
como sea posible de otro con respecto a la característica que está siendo medida. Los conglomerados,
por otro lado, deben ser tan heterogéneos (diferentes) dentro de ellos como sea posible, y a la vez un
conglomerado debe ser muy similar (en estructura) a otro para poder aprovechar las ventajas
económicas del muestreo por conglomerados.
2. Conformar un marco que liste todos los conglomerados de la población.

3. Seleccionar una m.i.a. de conglomerados de este marco.

4. Los elementos o unidades experimentales últimas muestreadas serán todos los elementos
de los conglomerados seleccionados.
Ejercicio 1
Un auditor desea revisar el cumplimiento de la política de compras. El objetivo de la auditoría es
cotejar la factura emitida por el proveedor respecto a la orden de compra.
La empresa se compone de 87 plantas independientes localizadas en todo el país. Como los
resultados deben obtenerse rápidamente y con poco dinero, la industria decide usar muestreo por
conglomerados considerando cada planta como un conglomerado, ya que cada planta resguarda su
correspondiente evidencia física.
Se selecciona una muestra aleatoria simple de 15 plantas y se obtienen los resultados de
cumplimiento. Los resultados se presentan en la tabla anexa.
1. Indicar el tamaño del universo, es
decir, el número de conglomerados
o grupos existentes en el marco del
muestreo. (N) En este ejemplo, el
número de plantas de la empresa.
2. Indicar el tamaño de muestra
calculado (n)
3. Indicar el “número de elementos
contenidos en el conglomerado”, es decir,
el total de observaciones de interés que
tiene cada grupo. En este caso, sería
indicar el número de facturas que hay en
cada planta (conglomerado).
4. Indicar los elementos que contienen el
atributo observado, es decir, de las
unidades revisadas, cuántas cumplen con
el control que se planea revisar.
(¿Cuántas facturas cumplieron con la
política?)
El valor p, nos indica la estimación deseada, en este caso,
indicaría que el 70.8% de las facturas, cumplen con lo
establecido en la política de compras. Dicho valor puede
extrapolarse a la población, si se conoce el total de facturas
para las 87 plantas.
Se estima con un 95% de confianza, un 4.81% de error, es
decir, Se espera que entre el 65.99% y 72.62% de las
facturas cumplen con la política establecida.
Ejercicio 2
Un auditor desea revisar y estimar el monto de total de cuentas por cobrar de una empresa. La
documentación es empaquetada en cajas, conteniendo cada una 24 documentos. Hay cien cajas en la
bodega.
Se decidió tomar una muestra de n=5 cajas para analizar los importes registrados, los cuales se
presentan a continuación:
1. Indicar el tamaño del universo, es
decir, el número de conglomerados
o grupos existentes en el marco del
muestreo. (N) En este ejemplo, el
número de cajas.
2. Indicar el tamaño de muestra
calculado (n)
3. Indicar el número de elementos en
todo el universo, es decir, total de
registros de cuentas por pagar.

3. Indicar el “número de elementos contenidos en el


conglomerado”, es decir, el total de observaciones de
interés que tiene cada grupo. En este caso, sería
indicar el número de documentos de cuentas por
pagar que hay en cada caja
4. Indicar el importe total observado en cada
conglomerado, es decir, de las unidades revisadas,
cuánto es el importe total de las cuentas revisadas en
cada caja.
El valor total, nos indica la estimación deseada, en este caso,
indicaría que el saldo correcto estimado de la población de
cuentas por cobrar es de $600 (en miles)
Se estima con un 95% de confianza, un error de 308.22 (en
miles) de pesos, es decir, se espera que el verdadero valor se
encuentre en $291.77 y $908.22 (en miles) del saldo
registrado de cuentas por cobrar.
Tamaño de muestra
Supongamos que al siguiente año, se decide realizar nuevamente una auditoría para estimar
el monto de total de cuentas por cobrar de una empresa, tal y como establecía el Ejercicio 2.
¿Cuál sería el tamaño de muestra (número de cajas o conglomerados) ideal, si se desea tener
un límite de error de $215.1

Para calcular el tamaño de muestra, es necesario realizar un premuestreo (muestra piloto) o tomar la
información de un análisis previo (como ocurre en este caso).

Para obtener la muestra ideal, basta con llenar el archivo excel que a continuación se presenta:
1. El primer paso consiste en tomar la información del premuestreo o el histórico que se tenga. En
este caso, se utilizó la muestra de conglomerados obtenida en la auditoría previa. Se requiere para
este caso, el tamaño de cada caja (conglomerado) y el total de importe en miles de pesos de cada
grupo observado.
2. El segundo paso, consiste en indicar el tamaño del universo (N) y el límite de error de estimación.
De acuerdo con la información del Ejercicio 2, se tenían en total 100 cajas o conglomerados. Así mismo,
en la nueva auditoría, se desea cometer un error máximo de $215.1 (miles).

Finalmente, se obtiene el tamaño de muestra (en verde) de 10 cajas (conglomerados)


Supongamos que al siguiente año, se decide realizar nuevamente una auditoría del
cumplimiento de la política de compras, con el mismo objetivo expuesto en el Ejercicio 1.
¿Cuál sería el tamaño de muestra (número de cajas o conglomerados) ideal, si se desea tener
un límite de error de 8%

Para calcular el tamaño de muestra, es necesario realizar un premuestreo (muestra piloto) o tomar la
información de un análisis previo (como ocurre en este caso).

Para obtener la muestra ideal, basta con llenar el archivo excel que a continuación se presenta:
1. El primer paso consiste en tomar la información del premuestreo o el histórico que se tenga. En
este caso, se utilizó la muestra de conglomerados obtenida en la auditoría previa. Se requiere para
este caso, el tamaño de cada planta (conglomerado) y el total de documentación que cumple con
las políticas establecidas.
2. El segundo paso, consiste en indicar el tamaño del universo (N) y el límite de error de estimación.
De acuerdo con la información del Ejercicio 1, se tenían en total 87 plantas (cedis) o conglomerados. Así
mismo, en la nueva auditoría, se desea cometer un error máximo de 8%

Finalmente, se obtiene el tamaño de muestra (en verde) de 7 plantas (conglomerados)


Puntos que afecta el tamaño de
muestra.

También podría gustarte