Está en la página 1de 4

Universidad Pedagógica y Tecnológica de Colombia

Maestría en Ciencias Biológicas


Asignatura: Electiva IV: Análisis Multivariados en Ecología, Docente: Salvador Gonzales de
León

Actividad 2° PCA
Elaborado por: Angela Saray Burbano Valdivieso, Código: 202110228

En este caso vamos a realizar un Análisis de Componentes Principales para los datos de
abundancia de especies de cactáceas colectados en 60 sitios de México.

Para ello iniciamos subiendo la base de datos a R, en donde vamos a realizar estos análisis:

Corremos las librerías respectivas, y adicionalmente las funciones complementarias


pertenecientes al paquete NEwR2-Functions.

Ahora, elegimos la base de datos de cactáceas, y leemos la tabla, luego, seleccionamos las
columnas que vamos a eliminar puesto que tenemos que alistar nuestra base de datos para que
podamos correr el código, en este caso eliminamos las columnas de sitio, especie de árbol, DAP,
cobertura, y epifitas, adicionalmente eliminamos la especie que no presenta datos que es
Mammiillaria polyhedra.

Procedemos entonces a hacer el calculo de los componentes principales, y graficar nuestro PCA.

Esta grafica de barra partida se obtiene a partir del cálculo de una matriz, basada en la distancia
hellinger en donde, se obtienen valores de probabilidad, en donde los mayores valores
corresponden a los componentes que mayor explican las variables.
Entonces con base en los datos, realizamos un primer diagrama de barras partidas en donde
vamos a evaluar los componentes principales interpretables, o que explican las abundancias de las
especies, aquí interpretamos que las barras en las que se encuentre la línea roja, abarcan los
componentes principales que explican en mayor medida las abundancias.

Ahora, ya que verificamos los componentes principales que explican mejor la variación de los
datos, que son los componentes 1 y 2, procedemos a realizar una gráfica de los componentes
principales en donde se relacionan las especies y los sitios de muestreo, en donde vamos a
representar las características principales de los datos a lo largo de un número reducido de ejes.
En esta grafica podemos observar la abundancia de las especies organizadas en base a los sitios de
muestreo, en este caso podemos observar que las abundancias de las especies ubicadas en el
cuadrante 4, son mucho mayores que las abundancias obtenidas de esas mismas especies en los
sitios dispuestos en el cuadrante 1. Algo muy similiar nos sucede con la especie Mammilaria
lanata, que presenta una gran abundancia en los sitios de muestreo del cuadrante dos, pero que
no presenta tanta abundancia en los sitios dispuestos en el cuadrante numero 3. La especie
Mytillocactus geometricans presenta una baja abundancia representada por la longitud de su
vector en los sitios dispuestos en el componente 1.

Ahora, con el plot del escalamento 2, encontramos información muy similar al anterior, puesto
que las especies se disponen de la misma forma en los cuadrantes del PCA, sin embargo la escala
del PCA difiere por dos unidades adicionales, y también los vectores de las especies son de
longitudes diferentes, puede que esto cambie, dado las probabilidades de explicación de los
componentes principales, anteriormente elegidos.

También podría gustarte