Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2: Análisis Clúster
La herramienta de análisis clúster desarrollada por otros softwares como d-SNAP y
posteriormente Polysnap 3 para perfiles de difracción está disponible ahora para el software
DIFFRAC. EVA V5.2. Esta herramienta permite agrupar al usuario una determinada
cantidad de perfiles de difracción tomando como criterio correlaciones estadísticas
paramétricas y no paramétricas. En el presente documento se desarrolla la herramienta
clúster y los criterios a considerar para el correcto procesamiento de datos.
Se desarrolló la herramienta clúster para un grupo de 15 perfiles de difracción importados
en la sección Pattern Matching_set1. Las herramientas disponibles en el desplegable de la
sección Pattern Matching_tool son Cluster Analysis, Pre-Screen, Quality Control, Quant y
PMI (ver figura 1).
Maximum estimate is 5
Minimum estimate is 1
Este párrafo contiene estimaciones del número de clústeres determinado para distintos
métodos de análisis clúster. Según la literatura el metodo mas efectivo es el Group average
link que es el metodo predeterminado por el DIFFRAC.EVA. En ese sentido se puede
modificar la cantidad de clústeres que se forman moviendo la línea de corte. En el
dendrograma de la figura 3, existe una línea continua de corte. Además de una línea
puntuada en la parte posterior, la cual representa el nivel donde se forma el número
máximo de agrupaciones, es decir 5(ver figura 8).
Este método determina coeficientes para cada patrón, pero el valor a observar es el
coeficiente de rango grupal de pertenencia. La línea que contiene el término “range of
cluster membership values is” es el valor observable, debe ser mayor a 0.8 y al igual que
la prueba Silhouettes el valor es susceptible a diferencias de intensidad, asimetría de picos,
etc. Por lo que no es necesario que sea mayor a 0.8 pero tampoco puede ser menor o igual
a 0.3 que indicaría una pertenencia despreciable.
Cuando se trata de un numero de muestras mucho mayor, puede existir dificultad para
visualizar el dendrograma, por ello existen otros esquemas para visualizar el análisis
cluster como el Cell Display View que se observa en la figura 10, este esquema es otra
forma de observar el dendrograma.
Cluster 1:
Sample #1: OT-2106-GM-050.
Sample #2: OT-2106-GM-036.
Sample #3: OT-2106-GM-037.
Sample #4: OT-2106-GM-042.
Sample #5: OT-2106-GM-043.
Sample #6: OT-2106-GM-044.
Sample #7: OT-2106-GM-045.
Sample #8: OT-2106-GM-046.
Sample #9: OT-2106-GM-047.
Sample #10: OT-2106-GM-048.
Sample #11: OT-2106-GM-049.
Cluster 2:
Sample #1: OT-2106-GM-038.
Sample #2: OT-2106-GM-039.
Sample #3: OT-2106-GM-040.
Sample #4: OT-2106-GM-041.
Este párrafo indica el nivel de la línea de corte en el dendrograma asi como tambien el listado de
muestras que pertenece a cada clúster. No obstante, este párrafo es editable por lo que se puede
colocar asterisco a los difractogramas más representativos de forma manual. Otra opción es
simplificar el dendrograma como en la figura 14 cuando se tiene una cantidad excesiva de
muestras.
Los cambios realizados en el dendrograma en cuanto a nivel de corte y formación de más o
menor número de clústeres se actualiza de forma automática para las otras herramientas como
3D MMDS Plot, Cell Display y en el Log Report.
Cabe mencionar que las fases Cuprite y Covellite se elucidan con apoyo de los resultados FRX
para las muestras. Por otro lado, todos presentan Montmorillonite, pero solo es posible
observarlo en el análisis de arcillas por DRX. Los resultados del análisis cluster están sujetos a
fallos respecto a las fases minoritarias. Otros factores a considerar son los de orientación
preferencial, asimetría en los picos, background y superposición de fases.
La herramienta cluster clasifica los perfiles de difracción evaluando cada punto de difractograma
utilizando estadística paramétrica y no paramétrica. Los resultados están sujetos a los factores
antes mencionados, es decir, mientras más complejo el perfil de difracción, será más impreciso el
análisis cluster. Por ello se tienen en consideración los criterios antes mencionados para los
diferentes diagramas resultantes del análisis.
Para un análisis de 151 perfiles de difracción se tiene el siguiente dendrograma:
Figura 16. Sección del listado de coeficientes de pertenencia del indicador Silhouettes.
La figura 16 representa el fragmento de la generación de coeficientes de correlación del
indicador Silhouettes. Además, se coloca la sección del Log Report donde se indica las
estimaciones del número de clústeres:
Estimation of the number of clusters
------------------------------------
Maximum estimate is 21
Minimum estimate is 4
Figura 17. Vista Cell Display View para 151 perfiles de difracción.
Si se observa la vista inferior de los perfiles existen zonas donde es evidente que existen
las mismas fases, sin embargo, en otras zonas se observa que hay ciertas fases que se
encuentran en menor proporción o no están presentes. La figura 18 muestra la zona A y B.
Este listado es útil para identificar a todos los miembros de cada cluster y proceder con la
elucidación en grupo.
El análisis cluster puede ser utilizado para 1000 o más patrones de difracción, sin embargo,
cuando se trata de muestras que presentan múltiples fases, asimetría en los picos,
orientación preferencial o background irregular se presenta limitantes. La literatura explora
muestras simples de 1 hasta 3 fases, de componentes que no exhiben orientación
preferencial. En el caso de los defectos en los picos estos son corregido midiendo la misma
muestra varias veces, pero esto no siempre es práctico. Se ha desarrollado la herramienta
cluster para muestras minerales, medidas una sola vez, considerando defectos como
orientación preferencial, asimetría de picos, desplazamiento de posiciones 2ϴ y
background irregular. Algunos de estos factores pueden ser corregidos por los ajustes del
análisis cluster, pero otros no. Finalmente se desarrolló los criterios para un correcto
análisis cluster como el número estimado de clústeres a obtener, los distintos diagramas del
análisis y los indicadores secundarios de cada cluster. Se concluye que la herramienta
cluster puede ser utilizada para realizar de forma más rápida la clasificación y elucidación
de un gran número de perfiles de difracción. Además, si bien se han descrito los criterios
para el análisis, las modificaciones en el análisis siempre están sujetas al criterio del
usuario.
References
Barr, G., Dong, W. & Gilmore, C.J. (2009). J. Appl. Cryst.42, 965-974.
Barr, G., Dong, W. & Gilmore, C.J. (2004). J. Appl. Cryst.37, 874-882.
Barr, G., Dong, W. & Gilmore, C.J. (2004). J. Appl. Cryst.37, 658-664.
Gilmore, C.J., Barr, G. & Paisley, J. (2004). J. Appl. Cryst.37, 665-668.
Barr, G., Dong, W., Gilmore, C.J & Faber, J. (2004). J. Appl. Cryst.37, 635-642.
Gilmore, C.J., Barr, G. & Paisley, J. (2004). J. Appl. Cryst.37, 231-242.
Barr, G., Dong, W. & Gilmore, C.J (2004). J. Appl. Cryst.37, 243-252.