Está en la página 1de 22

Tema 2.

Aplicación de técnicas
multivariantes en estudios ecológicos

• Técnicas multivariantes.

• Técnicas de clasificación
• Índices de similitud
• Técnicas de clasificación o agrupación

• Técnicas de ordenación
• Tipos. Ventajas e inconvenientes

(KREBS, C.J. 1989. Ecological Methodology. Harper & Row.)


Técnicas multivariantes o multifactoriales

• Una única variable y uno (o pocos, 2 ó 3)


factores de variación:

• Estadística clásica (ANOVA, etc)

• Muchas variables y uno o muchos factores


de variación

• TÉCNICAS MULTIVARIANTES (o
MULTIFACTORIALES)
Técnicas multivariantes o multifactoriales

TÉCNICAS DE CLASIFICACIÓN O AGRUPACIÓN:


• Las técnicas de clasificación consisten en la agrupación de
entidades similares formando grupos (clusters).

TÉCNICAS DE ORDENACIÓN O REDUCCIÓN DE


LA DIMENSIONALIDAD:
II (21%)
•Su fin principal es representar las relaciones A
entre muestras y especies (o parámetros químicos, P
P A
u otro tipo de variables) tan fácilmente como sea P
A
A
posible en un espacio de baja dimensionalidad. P
I (54%)

• El producto final es una gráfica, normalmente


bidimensional, en la que las muestras o las M
B

especies similares, o ambas, están cerca unas M B B


M B
de otras y las entidades poco parecidas se
M
encuentran alejadas.
Análisis de similitud. Técnicas de clasificación

• Podemos partir de una matriz de muestras y especies


• Los datos pueden ser cualitativos (Presencia-Ausencia) o
cuantitativos (Abundancia, etc).

Datos cualitativos. Matriz de Contingencia:

Muestra q
Sp. presentes Sp. ausentes Totales

Sp. presentes a b a+b


Muestra p Sp. ausentes c d c+d
Totales a+c b+d n

(n = a+b+c+d)
Análisis de similitud
Datos cualitativos:
• Índices que incluyen dobles ceros o dobles ausencias Ejemplos:
a+d
• Si se da la misma importancia a la doble S = ---------------
a+b+c+d
presencia que a la doble ausencia:
a+d
• Si se da más importancia a las diferencias que a S = -------------------
a+2b+2c+d
las semejanzas:
2a + 2d
• Si se da más importancia a las semejanzas: S = -------------------
2a+b+c+2d

• Índices que no incluyen dobles ceros o dobles ausencias


Ejemplos:
a
S = ---------------
• Indice de Jaccard: a+b+c
2a
• Indice de Sorensen: S = -----------------
2a + b + c
Análisis de similitud

Datos cuantitativos:
2w
• Indice atribuido a Steinhaus por Motyka (1950). S = -------------
A+B

• Indices de distancia:
• Distancia Euclídea: Se calcula por la fórmula de Pitágoras, teniendo en
cuenta un espacio euclídeo de n dimensiones. Varía V entre 0 e infinito; cuanto
mayor es la distancia, menos similares son las dos muestras.
• Indice de Bray-Curtis: Es una estandarización del índice de Manhattan. Varía
entre 0 (muestras idénticas) y 1 (totalmente diferentes).
• Indice de Camberra:
Camberra Es otra estandarización del índice de Manhattan. Varía
entre 0 y 1, como el de Bray-Curtis.
Los índices de Bray Curtis y de Camberra resultan muy afectados por el
tamaño de la muestra, no son eficaces en la comparación de comunidades
diversas, con tamaños grandes de muestra. Son muy útiles para el estudio de
comunidades con poca diversidad de especies y tamaños de muestra pequeños
Análisis de similitud
Datos cuantitativos. Índices de distancia

(KREBS, C.J. 1989. Ecological Methodology. Harper & Row)


Análisis de similitud. Técnicas de
clasificación o agrupación

MATRIZ DE DATOS

Índices de similitud
MATRIZ DE SIMILITUD
O AFINIDAD
Análisis de similitud. Técnicas de clasificación o agrupación
Técnica de clasificación

DENDROGRAMA
Técnicas de clasificación o agrupación
La clasificación puede ser:
• Jerárquica o reticulada: Una clasificación jeráquica es como un árbol,
mientras que en una clasificación reticulada hay solapamientos como en
una red.
• Divisiva o aglomerativa: En una clasificación divisiva se empieza por el
conjunto de muestras y se van dividiendo en clases; en la clasificación
aglomerativa se empieza desde la base y se van agrupando las muestras.
• Monotética o politética: En una clasificación monotética dos grupos
hermanos se distinguen por un atributo simple (como presencia de una
especie). En una clasificación politética se utiliza la similitud global,
basada en todos los atributos (todas las especies).

No existe ningún índice de similitud ni ninguna técnica de


clasificación que sean los mejores en todos los casos

Siempre debemos basarnos en nuestros conocimientos ecológicos


para evaluar los resultados de un análisis de clasificación
Técnicas de clasificación
o agrupación
La elección de una técnica de
clasificación dependerá de los
objetivos del estudio.
Los métodos sencillos son a
menudo preferibles a los más
complejos.
Hay que decidir:
• El índice de similitud a utilizar.
• Si se utilizan los datos en
bruto o transformados.
• El tipo de técnica de cluster.
Los resultados pueden variar
en función de todas estas
decisiones.
(KREBS, C.J. 1989. Ecological Methodology. Harper & Row)
Técnicas de clasificación o agrupación

Técnicas de clasificación más frecuentes:


• Uniones simples (single linkage) Uniones simples

• Uniones completas (complete linkage)


• Uniones promedio (U.P.G.M.A.)

Las tres son jerárquicas,


aglomerativas y politéticas. La más
utilizada es U.P.G.M.A.

Uniones promedio
Uniones completas
U.P.G.M.A.
TÉCNICAS DE ORDENACIÓN
• Su fin principal es representar las relaciones entre muestras y especies
(o parámetros químicos, u otro tipo de varibles) tan fácilmente como sea
posible en un espacio de baja dimensionalidad.
II (21%)

• El producto final es una gráfica, normalmente P


bidimensional, en la que las muestras o las P
P
A A
especies similares, o ambas, están cerca unas A
A

de otras y las entidades poco parecidas se P

encuentran alejadas. I (54%)

M
• Frecuentemente se acompaña esto de una M
B

interpretación ambiental de la disposición de las M


B
muestras y de las especies (parcialmente
B
subjetiva). M B

Las técnicas de ordenación y de clasificación son complementarias:


• Las técnicas de clasificación forman grupos de muestras, pero no relacionan los
grupos con las variables (especies).
• Las técnicas de ordenación no forman grupos, pero relacionan las muestras con las
variables (especies).
Análisis en Componentes Principales (ACP ó PCA)

La figura muestra tres diferentes sistemas de


coordenadas:
• Los ejes originales en el espacio de especies y los
puntos de muestras situados de acuerdo con sus
abundancias para esas dos especies.

• Un segundo par de ejes, en la misma dirección que


los ejes originales, pero con el origen desplazado de
modo que se sitúa en el centroide (punto localizado
en el promedio para cada especie). El movimiento del
sistema de coordenadas hacia el centroide se llama
centrado.

• El tercer par de ejes "ACP 1" y "ACP 2" implica una


rotación rígida alrededor del centroide tal que el
primer eje ACP va a través de la extensión principal de
la nube de puntos.

Se maximiza así la varianza de la proyección de los puntos (muestras), como proyecciones perpendiculares sobre el primer
eje ACP. En otras palabras, el primer eje ACP está en la dirección que captura la mayor varianza posible a lo largo de los
ejes de ordenación (el eje pasa por el centro de la nube de puntos y es el que absorbe o explica la mayor información de esa
nube de puntos). El segundo eje es perpendicular al primero y absorbe la mayor varianza residual y así sucesivamente.
El resultado de una ordenación ACP es una secuencia de ejes de importancia progresivamente menor.
Análisis Factorial de Correspondencias (AFC ó CA)
Denominado también Análisis de Correspondencias.
El AFC, como el ACP busca una derivación de nuevos ejes que maximicen la
información de la estructura de los puntos de una nube de puntos
multidimensional, haciendo posible la disminución de dimensionalidad.

Comparación entre el ACP y el AFC:


• Aunque ahora se pueden utilizar diferentes índices, en origen el ACP usaba distancia
euclídea. El AFC se basa en distancias a partir del chi-cuadrado; además hace un
doble pesado.
• En el AFC el espacio de muestras y especies es similar. Se puede hacer una
representación simultánea de muestras y especies en el mismo espacio. En el ACP
había que representar muestras y especies por separado, (ahora se pueden incluir
en la misma gráfica, pero representando las variables como vectores).
• Ambos son análisis objetivos, y la interpretación en función de los parámetros
ambientales se realiza en un paso posterior.
• Con matrices de datos de muestras x especies, suele funcionar mejor el AFC.
AFC
• Pero el ACP es el único adimensional. Se utiliza siempre que se tienen matrices de
datos con variables expresadas en diferentes unidades (datos de química de suelo,
de agua)
Análisis de correspondencias sin tendencia ó
Detrended Correspondence Analysis (DCA)
Inconvenientes del ACP y el AFC:
• No se han desarrollado para trabajar con datos de muestras x especies.
• Asumen que la respuesta de las variables a los gradientes ambientales
es lineal (En las especies curva del óptimo en forma de campana de Gauss) .
• Si se muestrea un único gradiente ambiental amplio y las variables son
especies, se produce un artificio por no cumplirse los supuestos de estas
técnicas (este artificio se denomina Efecto “arco”)
“arco”

• El DCA en una técnica mejorada basada en el AFC pero corrigiendo sus


defectos principales.

• Elimina el efecto arco, de modo que en el DCA distancias iguales en la


ordenación correspondan a diferencias iguales en la composición de
especies.

• Solo es necesario utilizarla cuando las variables son especies y hay un


único factor de variación, que varía de forma continua y gradual. No se
puede utilizar con variables expresadas en diferentes unidades
Ejemplo inventado para efecto “arco”

A.C.P. Muestras

Matriz de datos
Análisis de Correspondencias Canónicas
(ACC o CCA)

• Es otro método de autoanálisis aplicable a una matriz de datos de


especies (muestras y especies) y simultáneamente a una matriz
de datos ambientales (muestras y variables ambientales).

• El objetivo del análisis es encontrar ejes de ordenación que


revelen la estructura común o conjunta de las dos matrices.

• Esto suele ser muy próximo al principal deseo de los ecólogos, una
herramienta matemática objetiva que haga que emerjan las
relaciones básicas entre las especies vegetales o animales y las
características ambientales.

• Da lugar a tres gráficas: Muestras, Especies y Variables ambientales.


Se pueden representar por separado, superpuestas dos a dos, o las
tres juntas.
ACC o CCA.
Ejemplo (1)

DOS TABLAS DE DATOS:


• 18 Muestras x 125 Especies
• 18 Muestras x 6 Variables
edáficas
ACC o CCA. Ejemplo (1)

DOS MATRICES:
1) Matriz de Muestras
(zonas quemadas en
diferentes años) x
Especies vegetales
2) Matriz de Muestras
(zonas quemadas en
diferentes años) x
Variables del suelo

TRES GRÁFICAS
(superpuestas):
1) Muestras (Zonas)
2) Especies vegetales
3) Variables del suelo
TWINSPAN (Two-Way Indicator Species Analysis)

• Combina técnicas de ordenación y clasificación.

• Fue desarrollado por Hill (1979).

• Se caracteriza por construir una clasificación de las


muestras, la cual se usa para obtener una clasificación de las
especies de acuerdo con sus preferencias ecológicas.

• Las dos clasificaciones son usadas conjuntamente para obtener


una tabla de doble entrada.

• Es un método jerárquico, politético y divisivo. Las primeras


subdivisiones se pueden considerar las más importantes.

• Las variables se ordenan mediante un análisis de


correspondencias.
TWINSPAN

Matriz o tabla de datos

% Cob. Clases.
0,1-2 1
2-10 2
10-25 3
25-50 4
>50 5

También podría gustarte