Está en la página 1de 20

ANÁLISIS DE COMPONENTES PRINCIPALES

INTRODUCCIÓN

Los componentes principales es un análisis de ordenación que tiene como objetivo el


reducir la dimensionalidad de un conjunto de variables (McGarigal et al., 2000). El análisis
crea nuevas variables, o componentes principales, a partir del cálculo de la combinación
lineal de las variables originales que expliquen la máxima varianza entre los datos
analizados (Gotelli y Ellison 2004). Las componentes principales se caracterizan por ser
ortogonales y porque no se correlacionan entre sí (Jongman et al., 1995). Los ACP han sido
utilizados frecuentemente en los estudios ecológicos orientados a analizar la preferencia de
micro-ambiente (Conner y Adkisson 1977; Langkilde et al., 2003), variaciones morfológicas
(Vincent et al., 2004) y relación entre poblaciones y clima (Mysterud et al., 2007). Por lo
tanto, la práctica tiene como objetivo que el alumno aprenda a utilizar e interpretar los
resultados derivados del ACP.
MÉTODO

1. En la práctica se determinará si en 23 sitios de pesca existe una tendencia en


las toleradas de atún capturadas durante nueve años, la información está
contenida en el archivo ACP-practica.xls.

2. A continuación, se describen los pasos a seguir:


3. Abra la hoja de Excel y estandarice los datos, recuerde que a cada valor (yi) se
le debe restar la media (Y) y dividirlo entre la desviación estándar (s):
4. Para ello obtenga la media y desviación estándar
de cada variable

Promedio
Desviación estándar

Atajos

5. Presionar una ocasión F4 sobre la celda, con los cual se fija la celda en la
formula tanto en columna como en renglón. La columna (letra) contiene un
signo de dinero antes y después de la celda.

6. Presionar dos ocasiones F4 sobre la celda, con ello se fija la celda en la formula
solo en reglones y la columna permanece variable. La columna (letra) contiene
solo un signo de dinero después de la celda.

7. Presionar tres ocasiones F4 sobre la celda, se fija la celda en la formula solo en


la columna y en renglón permanece variable. La columna (letra) contiene solo un
signo de dinero antes de la celda.

8. Presionar cuatro ocasiones F4 sobre la celda, se regresa al formato original de


la celda, la celda permanece variable en renglón y columna.

Cálculo

9. Debe restar el número de toneladas de cada sitio entre el promedio anual y


dividirlo entre su correspondiente desviación estándar, recuerde que puede reducir
el tiempo de cálculo si utiliza la función F4 para fijar celdas. En el caso de la
columna del año 1991, todas las celdas comparten la
misma media y desviación estándar, por lo que estos parámetros deben quedar fijos en
reglones y variables en las columnas.

10. Seleccione la celda que contiene la formula con valores fijos a renglones (B29),
observe que el vértice de la esquina inferior derecha se resalta, con un clic
sostenido desplace el ratón hasta la celda J29 y suelte el botón.

11. Repita la operación, pero de la celda J29 a la J51


12. ¡Listo!, sus datos están estandarizados.

13. Abra el paquete estadístico Statistica

14. Cree un nuevo archivo, para ello despliegue el menú “File” /New o con el botón de
acceso directo.

15. El paquete le desplegará un panel, en el cual le solicitará el número de


columnas y reglones, para esta práctica son 9 y 23, respectivamente, ya que
son 23 sitios y nueve años.

16. Observe el resultado.


17. Copie los datos no estandarizados de Excel y péguelos en Statistica.

18. Edite el nombre de las variables, oprimiendo dos veces el rótulo de la columna. Le
desplegará un panel en el que puede especificar el nombre de la columna y características
de los datos que contiene. Utilice el botón que se indica en la siguiente figura para cambiar
de variable, asigne el nombre de cada columna.
19. Al término presione el botón OK y observe el resultado.

20. Guarde el archivo en formato de Statistica.

21. Elija el análisis “Principal Components & Classification Analysis” que se encuentra en el
menú “Statistics” y “Multivariate Exploratory Techniques”.

22. Le desplegará un panel en que debe especificar las variables que utilizará.
23. Seleccione todas las variables y presione el botón de OK

24. Aparecerá el siguiente panel:

25. El resumen especifica el número de variables (9), casos (23) y los valores de los eigenvalores.

a) Elija la opción de eigenvalores, le desplegará un cuadro de resultados donde la


primera columna contiene el valor de los eigevalores para los 9 CP generados, la
segunda el porcentaje de varianza que explica, la tercera el valor acumulado del
eigenvalor y la cuarta el valor acumulado del porcentaje.
26. Copie los datos y péguelos en la hoja de Excel.

27. Recuerde que existen tres criterios para elegir el número de CP que deben ser utilizados
para ordenar los sitios de pesca en función de las toneladas de atún pescado entre los
años de 1991 a 1999: a) aquellos CP tienen un eigenvalor mayor de 1.0, b) aquellos CP que
contengan más del 70% de la varianza de los datos o 3) cuando la curva de acumulación de los
eigenvalores se estabilice. Lo más utilizado es la primera opción.

28. Elija la pestaña variables, seleccione la opción de “Factor Coordinate of Variables”.


29. Desplegará la relación de cada variable a los
CP.

30. Cópielos y péguelos en la hoja de Excel.

31. Compare su gráfica con la desplegada por Statistica


32. La magnitud y dirección de los vectores son utilizadas para ordenar los datos. La magnitud
es utilizada para elegir a las variables que aportan la mayor variación, preferentemente las que
sean en términos absolutos mayores de 0.7. La dirección es utilizada para determinar si la
variable presenta una relación positiva o negativa con los nuevos valores de los sitios en los CP.
Si el valor es negativo, entonces al incrementar el valor del CP se reduce el valor original de esa
variable; en contraste, si el valor es positivo, entonces al incrementar el valor del CP
aumentar el valor original de la variable. En el caso de los análisis multivariados, el valor
canónico de 0.0 corresponde a la media de todas las variables, por lo que la ordenación está
en función de si el elemento se encuentre por encima o por debajo de la media de las
principales variables.

33. Las principales variables en el CP1 son 1993 y 1996, quienes tienen una relación negativa con
los valores del CP; mientras que para el CP2 son 1994 y también es una relación negativa.

34. Elija la opción “cases”, desplegara el siguiente panel:


a) Seleccione la opción “Factor Scores”, los nuevos valore contienen a las 9 variables,
la diferencia entre CP es que cada valor representa una fracción distinta de la variación,
por lo que los valores de los sitios son diferentes entre CP.

35. Cópielos y péguelos en la hoja de Excel. Observe que en la gráfica se representan los 23 sitios
en los dos CP que aportan la mayor variación, aquellos que presentan un eigenvalor con un
valor mayor de 1.0.
5

3 3
7 8
2
6
1
Factor 2: 16.72%

19
1 18 23
5
2 4
15 1120
0 12 10 17
22 21
1314 9
-1
16

-2

-3

-4
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Factor 1: 48.08%

Interpretación

36. En el CP1 las principales variables fueron los años 1993 y 1996, quienes tienen una relación
negativa con los valores del CP1 (eje X), es decir con forme se incrementa el valor de CP
disminuye las toneladas capturadas en los años de 1993 y 1996. Por lo tanto, los sitios 2 y
3 al tener los valores más pequeños en el CP1, se espera que tengan valores por encima
de la media, a diferencia del sitio 23 quien presentó el valor más grande para el primer CP,
de quienes se espera que tenga valores por debajo de la media.
37. En contraste, para el CP2, el año que aporta la mayor variación fue 1994, quien es
negativo. Por lo que también presenta una relación negativa con el CP2, el sitio 3 al
situarse en el lado positivo del CP2 se espera que tenga valores menores que la media.

38. El objetivo del ACP es ordenar los sitios de pesca en función de las toneladas pescadas en
nueve años, los sitios que están cercanos en el espacio canónico presentan valores similares,
en contraste de los sitios lejanos, quienes presentan valores distintos. Compare los valores del
sitio 3 con el sitio
23. A partir de la gráfica se pueden proponer grupos de sitios, los cuales deben ser
comprobados con otros análisis univariados o multivariados.

39. En un archivo en blanco del programa Block de Notas, copie el número de localidad, los
“factor scores” del componente 1, 2, las toneladas capturadas en los años de 1996 y 1994.
Nombre el archivo ACP.txt y guárdelo en la carpeta multivaridos.

40. Abra el programa ArcView 3.2 y agregue la tabla ACP.txt


41. Abra una nueva vista y en ella solicite la opción “Add Event Theme”, que se encuentra en el
menú View.

42. Especifique a campo ACP1 como el campo de X, mientras que el campo ACP2 como el campo Y.

43. Despliegue el tema.


44. Interpole estos puntos con la opción “Interpolate Grids” que se encuentra en el menú “Surface”.

45. Especifique que la extensión de la interpolación será igual al tema ACP.

46. El campo de toneladas de 1996 será el que utilizará para realizar la interpolación.
47. Observe el resultado, el grid representa el gradiente de captura de peces en el año 1996, el
cual presenta los valores más grandes en la parte superior derecha del GRID y los valores más
pequeños en la parte inferior izquierda.

48. Solicite la creación de contornos, que se encuentra en el menú “Surface”.

49. El intervalo que utilizará el programa será de 1, el cual depende del rango de valores
(mínimo y máximo).
50. Observe el resultado.

51. Realice el mismo procedimiento para el año 1994.


52. Genere un diseño de impresión con los las curvas de toneladas de los años de 1996 y 1994
en las localidades analizadas. La gráfica le muestra las variaciones en las toneladas capturadas
en los años 1996 y 1994, donde en las localidades 18, 6, 7, 8, 19 y 23 se capturó menos de
65 toneladas en el año de 1996 y menos de 80 toneladas en el año 1994. A diferencia de
las localidades 12, 22, 4, 3, 2, 13 y 14 en las que se capturó más de 67 toneladas en el año
de 1996 y más de 80 toneladas en el año de 1994.

53. Despliegue los factores scores, los cuales son utilizados para obtener los principales scores, es
decir para crear los CP que contienen a las 9 variables. Péguelos en la hoja de Excel.
54. En la hoja de Excel, calcule los principales scores.

55. Para cada sitio, se debe multiplicar el valor estandarizado del año 1991 por el factor
coefficient del año de 1991 del CP1 más el estandarizado del año 1992 por el factor coefficient
del año de 1992 del CP1, se continúa hasta el año de 1999. El valor resultante es el principal
score del sitio 1 para el CP1.

56. Para el cálculo de los “factor scores” utilice la función F4.

57. Podemos saber cuáles son los sitios que aportan la mayor variación, para ellos seleccione
la opción contribución de los casos.
58. Calcule los principales scores de los nuevos datos y grafíquelos, recuerde que tiene
que estandarizarlos. No debe volver a generar el ACP, utilice la media, DE y factor
score coefficients calculados en la presente práctica.

LITERATURA CITADA

Conner, R. N. y C. S. Adkisson. 1977. Principal component analysis of woodpecker nesting habitat.


The Wilson Bulletin 89:122-129.
Gotelli, N. J. y A. M. Ellison. 2004. A Primer of Ecological Statistics, Sunderland. Jongman, R.
H. G., C. J. F. Ter Braak y O. F. R. Van Tongeren. 1995. Data analysis in community and
landscape ecology. Cambridge University Press, Cambrige.
Langkilde, T., D. O`Connor y R. Shine. 2003. Shelter-site use by five species of montane
scincid lizards in south-eastern Australia. Austral J. Zool. 51:175-186.
McGarigal, K., S. Cashman y S. Stattard. 2000. Multivariate statistics for wildlife and ecology
research. Springer, Nueva York.
Mysterud, A., K. A. Bartn, B. Jedrzejewska, Z. A. Krasinski, M. Niedzialkowska, J. F. Kamler, N. G.
Yoccoz y N. C. Stenseth. 2007. Population ecology and conservation of endangered
megafauna: the case of European bison in Bialowieza primaveral forest, Poland. Anim.
Conserv. 10:77-87.
Vincent, S. E., A. Herrel y D. J. Irschick. 2004. Ontogeny of intersexual head shape and prey
selection in the pitviper Agkistrodon piscivorus. Biol. J. Linn. Soc. 81:151-159.

También podría gustarte