Está en la página 1de 1

DENDOGRAMA

COMO FUNCIONA: El dendrograma puede utilizarse para reducir los errores estadísticos de
clasificación en su análisis, ya que proporciona la información necesaria para combinar o separar
clases de datos. Si las clases de su análisis son estadísticamente demasiado cercanas (es decir,
puede ser difícil diferenciar las dos clases según sus estadísticas), puede dar lugar a una mala
clasificación. En este caso, plantéese la fusión de las clases. No hay reglas definitivas de cuándo las
clases se deben y no se deben fusionar. ¿Cuándo se deben fusionar las clases? Depende de la
heterogeneidad de su área de estudio y sus datos, el número de clases en las que está intentando
clasificar los datos y sus objetivos. Por ejemplo, si su área de estudio es muy heterogénea, tiene el
potencial para muchas clases distintas y dispares, por lo que es posible que no sea necesario
fusionar las clases. En otra situación posible, sus datos pueden ser más homogéneos y podría estar
intentando clasificar los datos en demasiadas clases. En la segunda situación, las clases pueden ser
estadísticamente demasiado cercanas; por lo tanto, puede ser adecuado fusionar algunas de las
clases.

Si su análisis no requiere clases detalladas, es posible que desee fusionar las clases en categorías
más generales para disminuir la oportunidad de que se produzcan clasificaciones incorrectas. El
dendrograma identifica qué clases son estadísticamente más cercanas, pero depende de usted,
utilizando sus conocimientos del área y sus objetivos, determinar cuándo es apropiado fusionar las
clases.

En el dendrograma anterior, la altura del dendrograma indica el orden en el que se unieron los
grupos. Se puede crear un dendrograma más informativo donde las alturas reflejan la distancia
entre los grupos, como se muestra a continuación. En este caso, el dendrograma nos muestra que
la gran diferencia entre los conglomerados está entre el conglomerado de A y B versus el de C, D, E
y F.

Es importante apreciar que el dendrograma es un resumen de la matriz de distancias y, como


ocurre con la mayoría de los resúmenes, se pierde información. Por ejemplo, el dendrograma
sugiere que C y D están mucho más cerca entre sí que C a B, pero los datos originales (que se
muestran en el diagrama de dispersión) nos muestran que esto no es cierto.

La consecuencia de la pérdida de información es que los dendrogramas son más precisos en la


parte inferior, mostrando qué elementos son muy similares.

También podría gustarte