Está en la página 1de 27

http://capacitacionvirtualbp.

com

COLEGIO DE BIÓLOGOS DEL PERÚ


Consejo Regional XXII –Callao

Manual
ANÁLISIS MÚLTIVARIADO Y SUS APLICACIONES
EN BIOLOGÍA DE LA CONSERVACIÓN
Mg. Héctor Aponte Ubillús
2014

1
Héctor Aponte Ubillús
Biólogo egresado de la Universidad Nacional
Mayor de San Marcos con especialidad en
Botánica, con Maestría en Ecología,
Biodiversidad y Evolución (EBE) en la
Universidad Paris Sud (Orsay - Francia)
dentro de la especialidad de Ingeniería
Ecológica y Gestión de Ecosistemas.
Maestría en Botánica Tropical dentro de
la mención en Taxonomía y Sistemática
Evolutiva de la Universidad Nacional Mayor
de San Marcos. Estudios Doctorales en
Ciencias Biológicas (UNMSM). Profesor de
Ecología, Diversidad Vegetal y Evolución de
la Universidad Científica del Sur desde el año
2009. Investigador Asociado del Museo de
Historia Natural - UNMSM. Autor de
múltiples artículos científicos y libros de
divulgación de la flora peruana.
E-mail: haponteu@yahoo.fr

2
Presentación

El conocimiento de nuestro entorno es fundamental para lograr conservarlo y hacer uso


sostenible de los bienes y servicios de los que nos provee. Sin embargo, la naturaleza y los
ecosistemas que la componen son difíciles de entender. Muchos científicos comparten la idea de
que mientras más se estudia un espacio, mientras más nos adentramos en comprender el
funcionamiento de las especies y ecosistemas, más preguntas sin respuesta encontramos. Esto
puede ser tomado de dos formas. La primera consiste en dejarnos llevar por el desánimo y no
hacer absolutamente nada por comprender nuestro entorno, de todas formas nunca vamos a
llegar a comprender al 100% la naturaleza, la misma que, lamentablemente, poco a poco se está
deteriorando. Por otro lado podríamos tomar esta situación como un reto, una situación que nos
obliga a utilizar al máximo nuestros conocimientos para lograr conocer la verdad de lo que nos
rodea, un escenario que nos permite utilizar nuestro ingenio y todas las herramientas disponibles
para comprender los procesos y reacciones que se dan en los hábitats donde vivimos, un
conjunto de circunstancias que nos dan la esperanza de poder utilizar correctamente los recursos
naturales y dejar a nuestra futuras generaciones un planeta interesante (como el que nosotros
encontramos). Esta guía está preparada para el segundo grupo de personas, quienes,
conocedores de que la naturaleza no está compuesta por números, intentan por medio de las
matemáticas comprender un poco mejor las poblaciones y ecosistemas de las especies que nos
rodeas, tomando decisiones acordes a las necesidades de todos los seres vivos que la componen.

Sin entrar en los detalles mátemáticos, esta guía intenta presentar las principales herramientas
del estudio de la estadística multivariada, empezando por el estudio de distancias (base del
ordenamiento multivariado) y entrando luego a los estudios multivariados exploratorios y a las
pruebas de hipótesis. Si desea ahondar sus conocimientos en estos tópicos recomiendo la lectura
de libros especializados (por ejemplo Dytham 2011, Emden 2012), o inclusive del manual del
PAST (Hammer et al. 2001) que contiene ejemplos bastante didácticos . Todos estos
conocimientos serán tocados en el contexto de la Biología de la Conservación, parte de la
Biología que nos congrega para lograr hacer un uso sostenible de los bienes y servicios de los
ecosistemas.

Espero que la presente sea de su agrado,

Héctor Aponte Ubillús

3
http://capacitacionvirtualbp.com

Contenido
Presentación .................................................................................................................................. 3

Contenido ...................................................................................................................................... 4

Un vistazo al software que utilizaremos: PAST 2.17 .................................................................... 6

Parte 1. Medidas de distancia y similitud ...................................................................................... 8

Fórmulas de las medidas de distancia entre vectores ................................................................ 8

Fórmulas para medidas de distancia comunitaria...................................................................... 9

¿Cuándo utilizar cada tipo de distancia? ................................................................................. 10

Parte 2: Gráficos con Medidas de Similitud (Clustering) ........................................................... 13

Caso 1. Estado de la Riqueza y diversidad Vegetal en el Área de Conservación Regional


Humedales de Ventanilla (Callao, Perú) (Aponte el al. 2014, in prep) ................................... 13

Medidas de similitud como índices de diversidad Beta .......................................................... 14

Caso 2: Análisis de Diversidad en los suelos Crioturbados .................................................... 14

Caso 3: Foraminíferos en una gradiente medio ambiental (Hammer, 2011.) ......................... 16

Parte 3. Análisis exploratorio multivariado................................................................................. 17

Análisis de Componentes Principales (PCA) .......................................................................... 17

Análisis de Coordenadas principales (PCoA) ......................................................................... 18

Análisis de Correspondencia (CA) y de Correspondencia sin tendencia (DCA) .................... 19

Análisis de Correspondencia Canónica (CCA) ....................................................................... 19

Escalamiento Multidimensional No métrico (NMDS) ............................................................ 20

Reforzando los análisis de similitud........................................................................................ 21

Caso 4 ¿Qué variables caracterizan mi estación biológica? .................................................... 21

Caso 5. Efectos de la ganadería en los humedales costeros ................................................... 22

Caso 7: Estrategias de vida y conservación de peces marinos ................................................ 23

Parte 4. Prueba de Hipótesis multivariada .................................................................................. 24

Paired Hotteling ...................................................................................................................... 24

4
Permutación de dos grupos ..................................................................................................... 24

Análisis de varianza Multivariado (MANOVA) ..................................................................... 25

Análisis de similitud de una o dos vías (One-way/Two-way ANOSIM) ................................ 25

Análisis de varianza multivariado no paramétrico de una o dos vías (One-way /Two way
NPMANOVA, PERMANOVA) ............................................................................................. 25

Verificando las hipótesis de los casos ..................................................................................... 25

Referencias Bibliográficas .......................................................................................................... 26

5
Un vistazo al software que utilizaremos: PAST 2.17
A diferencia de otros programas estadísticos, PAST es un software amigable e intuitivo. Su
plataforma se asemeja bastante a la plataforma de programas como Excel y Access de Microsoft
Office, lo que hace que su manipulación sea de alguna manera conocida (Figura. 1). No cuenta
con una versión en español, por lo que todas las indicaciones y comandos están en inglés.

Figura 1. Plataforma del software PAST

La barra de Herramientas que se muestra en la parte superior de la plataforma, contiene las


pestañas esenciales para la manipulación y análisis de los datos (Figura 2). Esta se ha ido
actualizando conforme se han ido creando diferentes versiones del programa.

Figura 2. Barra de Herramientas de PAST 2.17

La Barra de herramientas (de izquierda a derecha) contiene todas las pestañas mostradas en la
figura 2, de las cuales utilizaremos:

6
 Archivo (File): En ella encontrará las opciones para guardar, abrir, crear e imprimir un
archivo.
 Editar (Edit): Aquí se encuentran todas las opciones para copiar, pegar, remover o
transponer los datos, insertar o eliminar columnas. PAST permite también retroceder
(undo) o rehacer (redo) las acciones, pero estas son limitadas.
 Transformar (Transform): Esta pestaña tiene todas las opciones necesarias para
transformar los datos (por ejemplo logarítmicamente o transformar los datos a
presencia/ausencia).
 Gráficos (Plot): Permite hacer gráficos de doble entrada, gráficos de cajas e histogramas
entre otros gráficos. Una vez generado el gráfico es posible encontrar las herramientas
de edición de los gráficos (haciendo clic derecho) así como guardar o copiar la imagen
que hemos generado.
 Estadísticos (Statistics): Aquí se encuentran las opciones para realizar análisis
estadísticos univariados y los índices de distancias.
 Multivariados (Multivar): Aquí se encuentran las opciones para realizar análisis
estadísticos multivariados, incluyendo los análisis de agrupamiento (Cluster analysis).

Además de ello hay que considerar que PAST es un software libre, que no requiere de una
instalación (lo que permite llevar como un ejecutable en USB) y que no consume mucha
memoria. Al mismo tiempo, debemos de considerar que por ser un software pequeño, tiene sus
limitaciones (por ejemplo, el tamaño límite de la base de datos). A pesar de ello, PAST es un
programa muy versátil y portátil, lo que lo convierte en una muy buena herramienta para la
evaluación de datos estadísticos y de la diversidad.

7
Parte 1. Medidas de distancia y similitud
La base para poder hacer análisis multivariados está en la correlación y covarianza, así como en
el análisis de distancias entre vectores. Las medidas de distancia y similitud sirven para saber la
similitud o diferencia entre dos vectores así como correlaciones (distancias matemáticas) o de
dos puntos en el espacio (distancia geográfica). Biológicamente, estos parámetros permiten ver
diferencias o semejanzas entre comunidades tratando a las especies como variables continuas,
discontinuas o de presencia/ausencia. También, estas medidas de distancia son utilizadas para
ver similitudes y diferencias entre secuencias génicas, lo cual no es nuestro objetivo pero es
bueno mencionarlo. Estas medidas de distancia son específicas al tipo de comparación que se
quiera realizar, por ello es importante conocerlas, para poder saber con qué distancia podemos
responder la pregunta científica planteada. A continuación, usted podrá encontrar las fórmulas
de los índices de distancia y similitud que utilizaremos (basado en Hammer et al. 2001). Los
cálculos pueden variar de acuerdo a arreglos realizados por los autores. Las fórmulas que
encontrará usted, se basan en las que utilizar PAST 2.17 para hacer los cálculos.

Fórmulas de las medidas de distancia entre vectores

Mahnattan

Mahalanobis

Grower
Chord

Distancia Euclideana

8
Correlación Cosine

Fórmulas para medidas de distancia comunitaria

Csenakowski / Dice / Sorenssen Simpson

M/Nmin, donde Nmin es la menor riqueza


entre las dos columnas que se comparan. Si
M=Nmin entonces Simpson=1.

Jaccard

Raup – Crick

Usa randomización comparando el número


Kuklinsky de especies observadas en 1000 réplicas.

BrayCurtis

Ochiai

9
Morisita

Horn

¿Cuándo utilizar cada tipo de distancia?


Ahora que ya conocemos las fórmulas, es importante saber cuándo utilizar cada tipo de
distancia. Por ejemplo, las distancias entre vectores nos permitirán ubicar estos vectores en un
espacio multidimensional, es decir, son distancias que, sin importarles el contenido numérico de
los vectores, nos van a permitir colocarlos en el espacio. Algunas de estas distancias son muy
similares, por ejemplo, la distancia Euclideana y la distancia de Chord se diferencian en la
normalización que tiene esta última. La distancia de Mahalanobis utiliza la matriz varianza
covarianza entre los datos. Otras medidas matemáticas son las de correlación, que, como su
nombre dice calculan la correlación entre los vectores (utilizando fórmulas conocidas como la
de Pearson y Spearman).

10
http://capacitacionvirtualbp.com

Por otro lado tenemos las medidas de similitud comunitaria. Aquí se encuentran aquellas
medidas que consideran como los componentes de un vector a especies, en consecuencia los
valores deben ser positivos. Estos índices trabajarán con valores de abundancia o de presencia
ausencia. Por ejemplo los índices de Sorenssen, Jaccard, Kuklinski, Ochiay, Simpson y Raup-
Crick utilizarán valores binarios de presencia ausencia. De ellos, Sorenssen y Jaccard son
similares, pero Sorenssen valora más las especies comunes. Otros índices como Bray-Curtis,
Morisita y Horn utilizan datos de abundancia. De estos últimos Morisita tiene mayor
aplicabilidad que Horn, ya que este último aplica logaritmos (imposible con abundancia 0),
además es más sensitivo a las especies dominantes. Wolda (1981) comparó 22 índices,
indicando que Morisita da mayor ventaja dado que es independiente de la talla de la muestra y
de la diversidad. Sin embargo indica que es muy sensible a cambios en la abundancia de las
especies dominantes, por lo que conviene utilizar transformaciones logarítmicas de sus
abundancias. Por otro lado Bray-Curtis es muy utilizado en análisis de Biología Marina, por lo
que resulta importante utilizarlo en este campo para comparaciones.

Los índices de Similud los encontraremos en Similarities and Distance Indices en la pestaña
Statistics (Figura 3).

Figura 3. Ruta para encontrar los índices de similitud

El resultado del análisis es una matriz de similitud, donde podemos elegir la medida de similitud
entre los vectores según nuestras necesidades (Figura 4). PAST, convierte automáticamente los
valores de abundancia a presencia ausencia si se requiriera. Recuerde siempre COLOCAR LAS
ESPECIES EN LAS COLUMNAS Y LOS TRANSECTOS EN LAS FILAS. Si sus datos no
estuvieran ordenados de esa forma los puede transponer (siga la ruta edit-> Transpose). Pruebe
estas opciones con el ejemplo 0 (similitud).

11
Figura 4. Matriz de similitud

12
Parte 2: Gráficos con Medidas de Similitud (Clustering)
Es conocido que una imagen habla más que mil palabras, por ello es de mucha utilidad expresar
la matriz de similitud en un gráfico; a este proceso se le llama Clustering. El producto es un
dendrograma construido a partir del agrupamiento de los puntos según su similitud y distancia
entre los vectores (que en caso del análisis biológico son comunidades).

PAST permite además elegir el método de agrupamiento:

 Método UPGMA (Unweighted Pair Group Method with Arithmetic Mean): Es un


método que busca distancias entre los vectores buscando la menor distancia por pares.
 Single linkage: Considera la menor distancia entre los vectores.
 Ward Method: Minimiza la varianza dentro de los grupos (suma de diferencias al
cuadrado entre vectores es la mínima).

Caso 1. Estado de la Riqueza y diversidad Vegetal en el Área de Conservación


Regional Humedales de Ventanilla (Callao, Perú) (Aponte el al. 2014, in prep)
Los humedales de Ventanilla están conformados por un ecosistema fragmentado por carreteras,
zonas agrícolas y urbanas. Los cambios en el uso de suelo y en la gestión del área determinan el
paisaje actual, donde la diversidad de especies coexiste junto a los impactos antropogénicos.
Con la finalidad de conocer las características de las comunidades vegetales se realizó una
evaluación cuantitativa (14 transectos de 20m, los cuales fueron evaluados con el método del
point quadrat reiterado). Los transectos fueron distribuídos de forma aleatoria estratificada
tratando de evaluar proporcionalmente todas las comunidades del área (figura 5).

Figura 5. Formaciones vegetales y posición de sus transectos en el área de estudio.

13
http://capacitacionvirtualbp.com

Utilizando el grupo de datos del Ejemplo 1, se le pide a usted que indique

• ¿Cuál es la similitud entre los puntos evaluados? ¿Qué formaciones vegetales se


asemejan más entre si?

• ¿Qué índices podremos utilizar para este juego de datos?¿Cuál representa mejor la
similitud?

• ¿Hay diferencias en la interpretación si utilizamos distancias de abundancia y de


presencia ausencia? ¿Podría esto afectar en decisiones de conservación del área? (Por
ejemplo: si tuviera que elegir dos puntos representativos de cada formación vegetal).
Tenga en cuenta la distribución de los puntos y que el número de parcelas es
proporcional a la abundancia de la formación vegetal en el área de estudio.

Medidas de similitud como índices de diversidad Beta


Muchas veces se confunde el uso de las medidas de similitud como una medida directa de la
diversidad Beta, lo cual es inadecuado. Los índices de similitud (como su nombre lo dice)
miden la similitud. Sin embargo, si contamos con la similitud entre los transectos de un área
específica, podremos tener una medida indirecta de la diversidad Beta (recambio de especies).

Utilizando el grupo de datos del Ejemplo 1, se le pide a usted que indique

• ¿Cuál de las comunidades presenta mayor diversidad Beta? ¿Todos los índices indican
lo mismo? ¿Cómo afectaría ello sus decisiones de conservación?

Caso 2: Análisis de Diversidad en los suelos Crioturbados


Basado en Cano et al. (2010): Flora y vegetación de suelos crioturbados y hábitats
asociados en la Cordillera Blanca, Ancash, Perú. Rev. Peru. Biol. 17: 095– 0103.

La cordillera de los Andes proporciona una gran variedad de hábitats y diversidad


biológica al Perú. Suelos crioturbados son aquellos sometidos a una secuencia de hielo
y deshielo; fenómeno que ocurre diariamente en la parte alta de los Andes tropicales y
que provoca el desplazamiento de partículas, modificando su distribución en las capas
del suelo. Esta condición, sumada a las bajas temperaturas, la intensa radiación solar, y
otros factores edáficos y climáticos, hacen que la vegetación que colonizan estos suelos

14
sea diferente a la encontrada en hábitats circundantes, principalmente respecto a su
diversidad, estructura, fisiología y ecología (Figura 6).

Figura 6. Especies propias de suelos crioturbados. a) Stangea henrici (Valerianaceae),


b) Xenophyllum decorum (Asteraceae), c) X. dactyllophyllum y d) Nototriche antoniana
(Malvaceae). Tomado de Cano et al 2010.

Con el objetivo de analizar la diversidad en este tipo de ecosistemas se hicieron un total


de 21 parcelas (10 en suelos crioturbados y 11 en hábitat asociados). Usted cuenta con
los datos de abundancia de cada especie por parcela (Ej. 2 Suelos Crioturbados). Con
los datos que usted cuenta intente responder:

• ¿Cuán similares son los puntos dentro de los suelos crioturbados y dentro de los
pastizales? ¿Qué parcelas se semejan más?

• Basándose en ello: ¿Podría determinar cuál de los dos ambientes tiene mayor
diversidad Beta?

• ¿Hay algún error en el análisis de los datos? ¿Cuál (es) es (son)?

15
Caso 3: Foraminíferos en una gradiente medio ambiental (Hammer, 2011.)
Ejemplo proporcionado por el web site de PAST.

Los foraminíferos con protozoarios que cuentan con una protección calcárea (Figura 7).
Este esqueleto intraectoplásmico es la característica más sobresaliente de los
foraminíferos, y el motivo de que sean susceptibles de fosilizar con relativa facilidad.
Esta característica permite encontrarlos en los sedimentos y utilizarlos como indicadores
climáticos y estatigráficos.

Figura 7. Foraminíferos planctónicos. Escala 1micra.

Usted cuenta con los datos de las especies de foraminíferos en un transecto longitudinal
realizado en una bahía perpendicular a la costa (Ejemplo 3). Con los datos que usted cuenta
intente responder:

• ¿Qué índice de similitud utilizaría? ¿Por qué?

• ¿Qué zonas se asemejan más entre si?

• ¿En qué zona es mayor la diversidad beta?

16
http://capacitacionvirtualbp.com

Parte 3. Análisis exploratorio multivariado


Los análisis exploratorios son análisis muy frecuentes en el análisis de comunidades. Estos
procesos matemáticos permiten realizar gráficos donde las variables (especies, transectos o
parámetros medio ambientales) se distribuyen en un espacio bidimensional según su similitud o
correlación entre ellos o entre ellos y ejes construidos con dichos fines. Existen múltiples
técnicas. Nosotros exploraremos las más utilizadas para análisis biológicos. La tabla 1 resume
sus principales características.

Tabla 1. Características más importantes de los análisis exploratorios

Análisis de Componentes Principales (PCA)

El PCA es un método de ordenación. Este se encuentra basado en relaciones entre un vector y


un eje. Estos ejes, y la distribución de los puntos con respecto a estos ejes se crean utilizando
correlaciones (cuando variables no son dimensionalmente homogéneas) o covarianzas (cuando
variables son dimensionalmente homogéneas) entre las variables explicativas y los vectores
dependientes de estas variables, de tal forma que la correlación o covarianza sea la máxima. El
número de ejes (también denominados componentes) puede ser igual al número de variables.
Como resultado de este proceso matemático obtendremos datos que nos indican la variabilidad
explicada por el componente de una variable (eigenvector) y el potencial explicativo de cada eje
obtenido (eigenvalue, también denominado autovalor o potencial explicativo y que correponde a
la sumatoria de todos los eigenvectors para ese eje). El coeficiente de correlación entre un eje y
las variables es expresado como el coseno del ángulo. El resultado final es un gráfico
denominado Biplot que permite ver la posición de un vector, la cual está determinada en función
de las correlaciones o covarianzas de este vector y los ejes creados.

17
Dentro de las asunciones del modelo se encuentran la linealidad (las variables son continuas) y
la distribución normal multivariada.

Para seleccionar qué ejes utilizar es muy útil utilizar las gráficas de Broken stick y el valor de
Jolliffe cut-off (Valor de Eigenvalue mínimo para aceptar un eje). PAST además permite
graficar polígonos de los grupos (Convex Hulls), el cual se grafica considerando el polígono
convexo más pequeño conteniendo todos los puntos, permitiendo así apreciar áreas que ocupan
los puntos de diferentes grupos. Se puede sombrear el área (ver opciones del gráfico). Asimismo
se puede graficar árboles de distancia (Minimal Spaning Tree) las cuales se grafican haciendo
líneas que conectan todos los puntos con la menor distancia (euclidiana) posible.

Preguntas biológicas frecuentes a responder con el PCA:

• ¿Cuál es la relación de mis especies en una gradiente?

• ¿Cuáles han sido los principales cambios temporales (a nivel abiótico) en mi estación?

• ¿Las especies tienen preferencias por ciertas condiciones?

• En taxonomía: Considerando múltiples parámetros ¿Las especies son diferentes?

Análisis de Coordenadas principales (PCoA)

El Análisis de Coordenadas (PCoA, Metric Multidimensional Scaling, Torgerson-Gower


Scaling, Clasical scaling) es un análisis exploratorio que genera un gráfico bidimensional,
donde los puntos (vectores, que pueden ser transectos, por ejemplo) se juntan según su
similitud. Las distancias se elevan a un exponente (exponente c) antes del análisis (por defecto
2), ya que los valores de c mayores de 2 ayudan a evitar el efecto de Arco (Arch effect,
horseshoe effect). El efecto de arco es una distorsión en un diagrama de ordenamiento en el que
el segundo eje es una función de arco del primer eje. Esta distorsión es causada por distribución
unimodal de especies en una gradiente (por ejemplo, si la especie tiene un medio ambiente
óptimo y es poco plástica a otros ecositemas). Otros análisis como el de Corresponencia sin
Tendencia (DCA) y el de Correspondencia Canónica (CCA) no se ven tan afectados por ello.
Las distancias utilizadas son las medidas de distancia y similitud explicadas en la primera parte.
El potencial de esta técnica es que muestra un gráfico alternativo al análisis de agrupamiento.

Generalmente estos análisis se hacen para saber si los transectos (u otras unidades
experimentales evaluadas son similares según las especies que los componen.

18
Análisis de Correspondencia (CA) y de Correspondencia sin tendencia (DCA)

Este es uno de los métodos más populares de ordenamiento para muestras en taxa. Conocido
también como Análisis de promedios recíprocos. El objetivo de este método es realizar la mejor
representación simultánea del agrupamiento entre especies y/o transectos. Esta técnica es muy
útil para unidades muestreales en una o multiples gradientes. Las distancia utilizadas son
distancias Chi-cuadrado. Las coordenadas se obtienen a partir de el análisis de normalización
simétrica.

A pesar de ser uno de los métodos más populares, esta técnica tiene varios supuestos que no se
cumplen para las comunidades biológicas como que las especies siguen una distribución normal
y no unimodal, asimismo que las especies repartidas independientemente. Es muy importante
contar en campo con una representatividad de las comunidades. Finalmente, es importante
recordar que en este análisis todos los datos deben ser positivos, con magnitudes del mismo
orden (aquí puede ser muy útil transformaciones logarítmicas).

Una variación de este análisis es el de Correspondencia sin tendencia. Esto es útil ya que a veces
los puntos se comprimen en los bordes del cuadro (refleja no linearidad entre los ejes y las
variables). El DCA elimina las tendencias no lineales (permite ver con mejor resolución las
zonas comprimidas) ocasionadas, por ejemplo, por el horseshoe effect.

Tanto el CA y el DCA tienen una respuesta gráfica útil para conocer el agrupamiento de
especies en un área respondiendo las siguientes preguntas biológicas

• ¿Qué especies caracterizan mis transectos? ¿Hay especies comunes entre ellos?

• Después de un análisis cuantitativo: ¿Cómo se agrupan las especies?

Análisis de Correspondencia Canónica (CCA)

Este análisis es muy útil para detectar patrones de variación en composición de especies en
comunidades. Los vectores se colocan en un plano como resultado de regresiones múltiples
(donde las variables dependientes corresponden a la matriz de sitios x especies y las variables
independientes son las variables ambientales). Este análisis implica el uso de abióticos, los
cuales deben seguir una relación lineal con los ejes (denominados ejes canónicos). El resultado
es un gráfico donde se muestran las especies, los transectos y las variables abióticas en
simultáneo (denominado un triplot).

19
La técnica consiste en encontrar una combinación lineal de las variables
X(V1=b1X1+b2X2+...+bpXp… variables ambientales) y otra combinación lineal de las variables
Y(U1=a1Y1+a2Y2+...+aqYq … variables biológicas) de tal manera que la correlación entre U y V
sea máxima. Después se debe encontrar otras dos combinaciones lineales para cada grupo de
variable que tenga correlación máxima y así sucesivamente se encuentran un conjunto de
combinaciones lineales para cada grupo de variables que tienen correlación máxima. Al grupo
de combinaciones lineales se les llama variables canónicas y a sus correlaciones, las
correspondencias canónicas.

Es muy importante recordar que el CCA incluye la aplicación de técnicas de regresión, y en


consecuencia todos los supuestos y consideraciones de los modelos lineales deben ser tenidos en
cuenta. Además, a mayor número de variables ambientales con respecto al número de
observaciones (muestras), el resultado del CCA se hace más dudoso, independientemente de
que las relaciones observadas sean aparentemente fuertes. Finalmente, debemos recordar que su
interpretación no supone una descripción de los datos de la matriz de especies per se, sino más
bien de la parte de la estructura de los datos que está relacionada con las variables
medioambientales, en consecuencia, no muestra relaciones entre especies, sino entre estas y las
variables ambientales.

Dado que se trata de una regresión, hay análisis que permiten conocer la robustez de la
regresión. Uno de ellos es el análisis de permutación. PAST permite realizar este análisis
permitiéndonos calcular la fiabilidad de la distribución, inclusive obteniendo un valor de
probabilidad (P value) de la misma.

Escalamiento Multidimensional No métrico (NMDS)

Este análisis está basado en una matriz de distancias (cualquier distancia conocida) y muestra
los datos en múltiples dimensiones (2 o 3 en PAST). Si se desea puedes mezclar variables
Medioambientales y Biológicas, colocando para los datos medioambientales dibujar vectores (el
largo de los vectores es arbitrario, la dirección es lo más importante).

Para verificar la confiabilidad del análisis se puede realizar el gráfico de Shepard (observado
versus esperado, indica la calidad del resultado; idealmente se debe formar una línea recta; x=y)
y obtener un coeficiente de determinación R2. Asimismo, es muy útil medir el stress, que refleja
la calidad del gráfico estimando cómo encajan las distancias ocasionadas por la ordenación y las
distancias originales (valores entre 0.1 y 0.2 son aceptables).

20
http://capacitacionvirtualbp.com

Las preguntas biológicas que se pueden responder son:

• ¿Cuál es la relación de mis transectos y las variables medioambientales?

• ¿Los transectos tienen relación con las variables medioambientales?

Reforzando los análisis de similitud


Utilizando los métodos de análisis exploratorio:

• Utilice los datos del Caso 1. Responda: ¿Qué transectos se asemejan más entre sí? ¿Qué
especies están siempre juntas? ¿Es posible reconocer las formaciones vegetales
muestreadas en los análisis exploratorios? ¿Los resultados concuerdan con los análisis
de distancias realizados? Si usted contara con datos temporales (varias matrices de los
mismos puntos del humedal en el tiempo): ¿Qué le permitiría estudiar el conjunto de
datos?

• Además de ello, usted cuenta con los datos de pH y conductividad del suelo (Ej4
Venta+pH+cond). ¿Es posible apreciar alguna relación entre las especies y la variable
ambiental? ¿Es posible apreciar alguna relación entre las formaciones vegetales y las
variables medioambientales? ¿Sería importante medirlas durante el monitoreo de estas
comunidades?

• Utilice los datos del Caso 2. Responda: ¿Qué transectos se asemejan más entre sí? ¿Qué
especies están siempre juntas? ¿Hay especies compartidas entre los grupos
muestreados? ¿Los resultados concuerdan con los análisis de distancias realizados?

• Utilice los datos del Caso 3. Responda: ¿Qué transectos se asemejan más entre sí? ¿Hay
especies compartidas entre los grupos muestreados? ¿Los resultados concuerdan con los
análisis de distancias realizados? ¿Es posible evidenciar gráficamente la gradiente
ambiental?

Caso 4 ¿Qué variables caracterizan mi estación biológica?


En una estación biológica se observa un cambio radical en la estructura comunitaria
(diversidad y composición específica) después del mes de mayo. Usted cuenta con los
datos de pH, Conductividad, partículas disueltas, Nitrógeno (como nitratos y como
amonio), fosfatos, demanda biológica de Oxígeno, Turbidez y saturación de oxígeno
(ej5. estación). Se le solicita determinar cuáles fueron los cambios en los parámetros

21
abióticos que llevaron a los cambios en la estructura de las comunidades. Intente
responder a las siguientes preguntas:

• ¿Qué parámetro abiótico es el principal factor que conllevó a la modificación de


la estructura de las comunidades en estos meses?

• Conociendo el principal factor de cambio: ¿Se trata de un cambio natural?


¿Puede deberse a la intervención humana?

Caso 5. Efectos de la ganadería en los humedales costeros

Basado en Aponte & Ramírez (2011): Los Humedales de La Costa central del Perú:
Comunidades Vegetales y Conservación. Rev. Ecol. Apl. 10(1): 31–39.

Los humedales de Lima son parte de un corredor biológico a lo largo de la costa


desértica del Perú. La mayor parte de estos ambientes coexiste con poblaciones
humanas, quienes hacen uso de los recursos que los humedales les proporcionan, por
ejemplo Schoenoplectus americanus (Pers.) Volkart ex Schinz & R. Kéller (conocido
como « junco ») es utilizado para la fabricación de productos artesanales (León et al.
1998). Otras actividades en estos ecosistemas son la pesca artesanal y la crianza de
ganado vacuno y ovino. En ese sentido, la relación hombre-naturaleza tiene un lado
productivo positivo. Sin embargo, esta relación también presenta un aspecto negativo, la
extracción del junco en algunos humedales genera desechos que promueven la presencia
de plagas (por ejemplo, la polilla y la quereza del junco) las cuales dañan diversas
especies nativas (Aponte 2009). Otros humedales reciben aguas servidas y desechos
orgánicos de poblaciones humanas aledañas, afectando la calidad del agua en estos
ambientes (Young 1998). Asimismo, la ganadería es una actividad frecuente en los
humedales costeros y que puede afectar la estructura de las comunidades vegetales.
Usted cuenta con datos de dos localidades: Las Albuferas de Medio Mundo (Végueta,
no impactado intensamente) y los Humedales de Santa Rosa (Chancay, impactados por
ganadería y agricultura) (Ej6 Ganadería). Realice los análisis que le permitan
evidenciar y explicar el efecto de la ganadería sobre las comunidades vegetales.

22
Caso 7: Estrategias de vida y conservación de peces marinos

Basado en (King & Mc Farlane 2003): Marine fish life history strategies: applications to
fishery management. Fish. Manag. Ecol. 10: 249–264.

De forma clásica las estrategias atribuídas a las especies son las de tipo r (crecimiento
rápido y exponencial) y k (crecimiento lento). Sin embargo, pueden realizarse estudios a
nivel cuantitativo a fin de encontrar mayor detalle dentro de estos grandes tipos,
pudiendo inclusive determinar una clasificación personalizada para las estrategias de
vida de cada grupo taxonómico. King & McFarlane proporcionan una base de datos
sobre peces marinos, pudiendo identificar algunos grupos importantes según su
estrategia de vida, entre las que se encuentran grupos que deben gestionarse de diferente
manera, por ejemplo:

• Oportunistas: Mantener su biomasa en el stock.

• Periódicos: Bajo reclutamiento. Mantener estructura de edades en el stock.

• Equilibrio (estrategas K): Baja tasa de crecimiento. Soporta tasas de caza


moderadas.

• Salmónidos: La productividad de los salmónidos cambia cada 10 años


aproximadamente (cambios en las condiciones del agua). Importante el
seguimiento de condiciones del agua oceánica y de los ríos.

Usted cuenta con una base de datos sobre peces marinos (Ej7 peces). Identifique grupos
importantes de peces según sus estrategias de vida.

Responda las siguientes preguntas:

• ¿Es posible evidenciar las estrategias de vida con métodos exploratorios


multivariados? ¿Con cuál?

• ¿Cómo se agrupan estas especies basado en los parámetros dados? (Utilice los
datos de la columna AA para corroborarlo)

• ¿Es posible establecer estrategias de conservación con los datos brindados?

23
http://capacitacionvirtualbp.com

Parte 4. Prueba de Hipótesis multivariada

Las pruebas de hipótesis son test estadísticos que permiten comprobar estadísticamente
una hipótesis. La hipótesis inicial (H0) puede aceptarse o ser rechazada y aceptar una
hipótesis secundaria (H1), ello dependiendo del valor de la probabilidad de que se
mantenga la primera hipótesis (p valor, p value). Dado que los análisis exploratorios
simplemente agrupan los vectores (especies o transectos) según variables explicativas,
es muchas veces necesario hacer pruebas de hipótesis para aseverar nuestras
observaciones gráficas. Un Resumen de las pruebas de hipótesis y cómo aplicarlas se
encuentra en la figura 8.

Figura 8. Diagrama de flujo de las pruebas de hipótesis multivariada.

Paired Hotteling
Esta es una prueba paramétrica (verificar normalidad y homocedasticidad) para dos
grupos multivariados. Importante: Se necesitan más repeticiones que especies.
Estadístico utilizado: T2

Permutación de dos grupos


Esta es una alternativa al test de Hotelling cuando la normalidad multivariada no se ha
comprobado. No necesita más transectos que número de especies. Estadístico: distancia
Euclideana y de Mahalanobis

24
Análisis de varianza Multivariado (MANOVA)
Esta corresponde a la versión multivariada del ANOVA (en consecuencia es
paramétrica). El estadístico que utiliza es el de Willks lambda (más usado) o el de Pillai
trace (más robusto). PAST permite hacer un análisis Hotelling como prueba a posteriori
y además proporciona un gráfico canónico que permite clasificar los grupos en los dos
primeros ejes.

Análisis de similitud de una o dos vías (One-way/Two-way ANOSIM)


Este es un test no paramétrico. Utiliza los valores de distancias entre y dentro de los
grupos. Estadístico: R. Si se desea hacer un análisis de dos vías en PAST se deben
colocar números enteros en las dos primeras columnas.

Análisis de varianza multivariado no paramétrico de una o dos vías (One-way


/Two way NPMANOVA, PERMANOVA)
Este es un test no paramétrico basado en distancias. Arroja un valor p a partir del uso
del estadístico F.

Verificando las hipótesis de los casos


• Caso 3: Si dividimos la gradiente en tres partes: ¿Habrán diferencias
significativas en su composición de especies? Utilizar Ej3 Foraminíferos

• Caso 4: ¿Habrá diferencia entre los trimestres de las estaciones biológicas?


Utilice los datos del ej. 5

• Caso 5: La estructura de las comunidades será diferente entre los humedales de


Medio Mundo y Santa Rosa. Utilice los datos del ej8 MM+SR

• Caso 6: ¿Podremos encontrar diferencias significativas entre las especies con


estrategias salmónidos, oportunistas, periódicos y de equilibrio? Utilice EJ7
Peces

25
http://capacitacionvirtualbp.com

Referencias Bibliográficas

Aponte, H. 2009. El junco. Clasificación, Biología y gestión. Científica 6 (1): 38–45.


Aponte, H. & W. Ramírez. 2011. Los Humedales de La Costa central del Perú:
Comunidades Vegetales y Conservación. Rev. Ecol. Apl. 10(1): 31–39.
Cano, A., W. Mendoza, S. Castillo, M. Morales, M.I. La Torre, H. Aponte, A. Delgado,
N. Valencia & N. Vega. 2010. Flora y vegetación de suelos crioturbados y
hábitats asociados en la Cordillera Blanca, Ancash, Perú. Rev. Peru. Biol. 17:
095– 0103.
Dytham, C. 2011. Choosing and Using Statistics: A Biologist’s Guide. John Wiley &
Sons.
Emden, H. van. 2012. Statistics for Terrified Biologists. John Wiley & Sons.
Hammer, Ø., D.A.T. Harper & P.D. Rayan. 2001. PAST: Paleontological statistics
software package for education and data analysis. Palaeontol. Electron. 4(1): 9.
King, J. & G. Mc Farlane. 2003. Marine fish life history strategies: applications to
fishery management. Fish. Manag. Ecol. 10: 249–264.
León, B., A. Cano & K. Young. 1998. Uso Actual de la Flora y Vegetación en los
Humedales de la Costa Central del Perú, p. 191–104. In Los Pantanos de Villa:
Biología Y Conservación, Serie de Divulgación N°11. Universidad Nacional
Mayor de San Marcos, Lima - Perú.
Young, K. 1998. El Ecosistema, p. 3–20. In Los Pantanos de Villa: Biología Y
Conservación, Serie de Divulgación N°11. Universidad Nacional Mayor de San
Marcos, Lima - Perú.

26
27

También podría gustarte