Está en la página 1de 7

CONGLOMERADO BIETAPICO

El análisis de conglomerados en dos fases, también llamado bietápico, es una herramienta de exploración diseñada
para descubrir las agrupaciones naturales de un conjunto de datos.

Con esta técnica se generan criterios de información, frecuencias de los conglomerados y los estadísticos
descriptivos por conglomerado. También se pueden generar gráficos de barras de frecuencias de los
conglomerados, gráficos de sectores de frecuencias y gráficos sobre la importancia de las variables. Finalmente,
se pueden obtener medidas de la distancia para el cálculo de la similitud entre dos conglomerados.

Se lleva a cabo en dos etapas, en la primera etapa, una muestra de unidades, llamadas unidades primarias, es
seleccionada de la población. Las unidades primarias pueden ser rodales, lotes, estratos, parcelas de muestreo,
etc.

Cada unidad primaria está a su vez dividida en unidades más pequeñas llamadas unidades secundarias. En la
segunda etapa, sólo una parte de las unidades secundarias situadas dentro de cada unidad primaria es observada.
Por eso este diseño recibe también el nombre de muestreo con submuestreo.

Las razones para aplicar este diseño son variadas, pero puede ser especialmente apto cuando no hay tiempo o
fondos suficientes para observar todos los rodales, lotes o estratos. Por cierto, se puede incorporar una tercera
etapa de muestreo, una cuarta, etc.; pero el más usado es el bietápico.

 Se recomienda cuando el tamaño de muestra de los conglomerados es muy variable, o cuando el tamaño
poblacional es muy grande, en estos casos, se procede a seleccionar la unidad de análisis en dos pasos.

Diferencia entre el muestreo polietápico y el muestreo por conglomerados

El muestreo polietápico es muy similar al muestreo por conglomerados. Sin embargo, son sustancialmente
diferentes. En el muestreo polietápico se toma una muestra aleatoria de todos los estratos, y en el muestreo por
conglomerados solamente se estudian los grupos seleccionados en una o varias etapas.
METODOLOGIA:

Esta técnica se rige por las siguientes condiciones de aplicación:

A. Las variables del modelo de conglomeración deben ser independientes.


B. Las variables cuantitativas continuas siguen la ley normal. El procedimiento de exploración para comprobar
la normalidad de una variable continua puede ser la prueba de Kolmogorov-Smirnov.
C. Las variables cualitativas categóricas tienen una distribución multinomial. Se recomienda la prueba de chi-
cuadrado para comprobar si una variable categórica sigue una distribución multinomial.

Etapas del muestreo polietápico:

1. Seleccionar el tamaño de la muestra. Cada grupo debe ser numerado de forma única y posteriormente, se
selecciona una pequeña muestra relevante.
2. Seleccionar un marco de muestreo de subgrupos relevantes. Este paso se realiza después de elegir los
grupos relevantes en la etapa anterior.
3. Repetir la segunda etapa si es necesario
4. Seleccionar a los miembros del grupo de la muestra de subgrupos utilizando alguna variación de muestreo
probabilístico.
ESTIMACION INSESGADA DE UNA MEDIA Y UN TOTAL POBLACIONALES

N= el número de conglomerados en la población


n= el número de conglomerados seleccionados en una muestra irrestricta aleatoria
EJEMPLO 1

Usando los datos de la tabla, estime el tiempo sin funcionar promedio por máquina y establezca un límite para
el error de estimación. El fabricante sabe que tiene un total de 4500 máquinas en todas las plantas.
SOLUCION

Para estimar la varianza debemos calcular:

Luego de la ecuación (9.2)

La estimación de µ con un límite para el error de estimación está dada por:


Por lo tanto, el tiempo promedio sin funcionar se estima que es de 4,8 horas. El error de estimación será menor
que 0.38 horas con una probabilidad de aproximadamente 0,95.

EJEMPLO 2:

Estime la cantidad total de tiempo sin funciona durante el mes pasado para todas las maquinas propiedad del
fabricante del ejercicio anterior. Establezca un límite para el error de estimación.

La varianza estimada del total poblacional se encuentra usando el valor de la ecuación 9.2 calculado en el
ejemplo anterior y sustituyendo de la siguiente forma:

La estimación de T, con un límite para el error de estimación es:

Por lo tanto, la estimación total del tiempo sin funcionar es 21605,31 horas. Tendremos bastante confianza en
que el error de estimación sea mejor que 1733,4 horas.

https://www.questionpro.com/blog/es/muestreo-polietapico-o-multietapas/

file:///D:/Samsung/Downloads/12_Muestreo_por_clusters_de_1_y_2_etapas%20(1).pdf

file:///D:/Samsung/Downloads/16741-36415-1-PB%20(1).pdf

https://www.inegi.org.mx/rde/2017/05/01/una-aproximacion-metodologica-al-uso-de-datos-de-encuestas-
en-hogares/

https://issuu.com/hectorm.delossantos-posadas/docs/elementos_de_muestreo_-_schaffer_et