Está en la página 1de 26

Análisis de agrupamiento (Cluster – nMDS)

Agregación (Cluster)
Conjunto de técnicas que intentan organizar la
información de las unidades de muestreo (UM) en
clases o grupos discretos

Crea agrupaciones sobre la base de una sola variable

Basa el proceso en la similitud (parecido) o disimilitud


(diferencia) entre las UM.

Propósito: generar grupos mutuamente excluyentes


(cada miembro de un grupo este lo más cerca de otro
miembro del mismo grupo y los grupos diferentes lo
más alejados entre sí.
Cluster

Estrategias de agrupación (Ligamento)

- Ligamento simple: (vecino más cercano) define las


distancias entre entidades y agrupamientos como la
distancia entre las entidades más cercanas.

- Ligamento Completo: (vecino más lejano) define las


distancias entre entidades y agrupamientos como la
distancia entre las entidades más lejanas

- Ligamento Centroide: minimiza la disimilitud entre los


centroides delos agrupamientos. Es valido solamente
con datos métricos (longitudes).
Cluster

Ligamento promedio: designa los valores de distancia


entre entidades como la distancia promedio de
disimilitud entre los agrupamientos.

Ligamento de Ward: minimiza la distancia cuadrada


entre los grupos con base en el tamaño del cluster

Recomendación para generar matrices

- Datos Biológicos: abundancias  Bray Curtis


- Datos Abióticos: registros  Distancia Euclidiana
nMDS

Propósito: representar gráficamente las relaciones


entre objetos en un espacio multidimensional.

Los objetos diferentes se ubican alejados en el espacio


de ordenación y los similares se ubican cerca, sin que
se mantengan las distancias originales

Construye un mapa de ordenación de las muestras en


un número determinado de dimensiones (2 o 3) que
intenta satisfacer las condiciones impuestas por los
rangos definidos a partir de la matriz original
(similitud o disimilitud).
nMDS

Solo conserva los rangos de similitud, por lo que los


ejes no tienen unidades (no métrico)

Punto de partida una matriz de similitud o disimilitud

Algoritmo evalúa el grado de Stress: distorsión entre


los rangos de similitud y los rangos de distancia
correspondientes en la gráfica de ordenación.

Meta: escoger la configuración de puntos que


minimice el grado de Stress (por re-muestreo)

 Valor crítico del stress: 0.2 o 20%.


Software Premier

Poderosa herramienta de análisis multivariado ecológico

Tipo de datos: muestreo de riqueza de especies en diferentes estaciones


de dos o mas localidades + muestreo de datos abióticos:

Dos localidades
9 estaciones por localidad
Listado de especies en cada
estación con registro de
abundancia estandarizada
Registro de condiciones
abióticas en cada estación
2 matrices de datos: bióticos y
abióticos

¿Son diferentes los ensambles?


¿Hay relación entre las matrices?
Lista de pasos

1. Revisar la matriz de datos bióticos y abióticos:


- Todas las especies deben estar registradas por
lo menos en una estación.
- En todas las estaciones debe haber registro de
las variables abióticas
2. Asignar factores a las estaciones:
- Relacionar estaciones con grupos para el
análisis.
3. Construir las matrices de similitud
- Transformar las matrices de datos para
garantizar supuestos, reducir efecto de 0.
- Datos biológicos: log (x+1)
- Datos abióticos: Raiz cuarta si es necesario.
Lista de pasos

4. Seleccionar algoritmo para construir la matriz de


similitud:
- Bray Curtis: biológicos
- Euclidiana: abióticos
- Presencia-ausencia (tipo de muestreo)

5. Con base en la matriz de similitud construir el


Cluster:
- Promedio por grupo (Group Average)

6. Confirme conformación de grupos con nMDS


Premier: Cluster & nMDS

Matriz de datos biológicos:


Premier: Cluster & nMDS

Asignación de factores: agrupación de cada estación


Premier: Cluster & nMDS

Transformación y algoritmo de similitud:


Premier: Cluster & nMDS

Matriz de similitud: se debe tener abierta para Cluster


Premier: Cluster & nMDS

Seleccionar características para el Cluster


Premier: Cluster & nMDS

Construir Cluster
Premier: Cluster & nMDS

Regresar matriz de similitud y realizar nMDS


Premier: Cluster & nMDS

Construir gráfico de ordenación


Análisis derivados del Cluster & nMDS

Quienes son los responsables de la similitud dentro de


los grupos y la disimilitud entre los grupos?

Análisis de porcentaje de similitud: SIMPER

Se fundamenta en un análisis de similitud (ANOSIM)

Anosim: análisis no paramétrico que evalúa la


significancia en las diferencias entre dos grupos a
partir de las medidas de distancia (ordenación).

Compara las distancias entre grupos con las


distancias dentro de los grupos.
SIMPER

Se realiza con la matriz de datos abierta


SIMPER
SIMPER
Análisis derivados del Cluster & nMDS

Se relaciona el ensamble con las condiciones


abióticas?

Análisis de correlación no paramétrica entre


matrices: BIOENV

Se fundamenta en un análisis de correlación no


paramétrica de Spearman

Se realiza entre la matriz de similitud biológica y


la matriz de similitud abiótica
BIOENV

Se debe tener abierta la matriz de similitud biológica


BioEnv

Se debe establecer condiciones matriz similitud abiótica


BioEnv

Resultado: se definen características del análisis


BioEnv

Se evalúa el valor de Correlación


Trabajo Independiente

Cuál es el propósito de un análisis discriminante?

También podría gustarte