Está en la página 1de 25

Análisis multivariado

Enero de 2018
Análisis multivariado

•Los componentes principales es la forma más sencilla de


ordenar datos.
•Las bases teóricas fueron desarrolladas por Karl Pearson (1901),
mientras que el desarrollo computacional fue realizado por Harold
Hotelling en 1933.
•Los componentes principales es un análisis de ordenación que tiene como
objetivo el reducir la dimensionalidad de un conjunto de variables.
•El análisis crea nuevas variables, o componentes principales, a partir
del cálculo de la combinación lineal de las variables originales que
expliquen la máxima varianza entre los datos analizados.

Gotelli y Ellison, 2001

Enero de 2018
Análisis multivariado

Crear una ecuación que represente la mayor variabilidad de los datos, a


la cual se le nombra componente principal 1 (CP1).

Crear una nueva ecuación que explique la mayor variación que no fue
incluida en el CP1, a la que se nombra CP2.

Así sucesivamente, hasta explicar el 100% de la variación

Enero de 2018
Análisis multivariado

Cada una de las


observaciones tendrá un
valor para cada
componente.

El número de
componentes será igual
al número de variables.

Enero de 2018
Análisis multivariado

La variación que es representada en cada


componente es resultado de una o varias
variables y dado que cada componente
extrae una variación distinta, entonces las
variables asociadas a tales cambios pueden
ser diferentes.

Por lo que las variaciones observadas en


cada componente están asociadas a
diferentes variables.
Enero de 2018
Análisis multivariado

Relación de los valores del CP1 contra el valor de la variable toneladas,


que aportó la mayor variación.
R² = 0.686

Enero de 2018
Análisis multivariado

El 68.6% de las variaciones de las toneladas de peces son representadas


en el CP1.

El mayor número de toneladas


se asocian a los valores del CP1
más bajos.

El menor número de
toneladas se asocian a
los valores del CP1 más
altos.

Enero de 2018
Análisis multivariado

• El objetivo es ordenas u organizar los elementos en función de un


conjunto de variables, para ello crea nuevas variables
(componentes principales) que contienen la mayor variación.

• Los elementos, para cada componente principal, tendrán una


posición que dependerá de los valores que lo caractericen (variables
originales).

Eigenvalor: representa la varianza que explica el componente


principal, el cual es utilizado para elegir el número de componentes
a utilizar (mayores de 1.0).

Eigenvector: contiene la correlación entre cada variable original con


respecto al componente principal (loading), para cada componente
se tendrá un eigenvector distinto, ya que representa una porción de la
varianza distinta. Si el análisis incluyo 7 variables entonces se tienen
7 eigenvectores.
Enero de 2018
Análisis multivariado

• Loading: representa la correlación entre cada variable original con respecto al


componente principal, puede tener una relación negativa (incrementarse el
valor canónico, se incrementa el valor de la variable original) o negativo (al
incrementarse el valor canónico, se reduce el valor de la variable original).

• Toma valores de 1.0 a -1.0, se debe elegir aquellos que tengan un valor mayor
de 0.75 (relación negativa) o menor de 0.75 (relación negativa).

• Para cada componente se tendrá un


valor de correlación distinto.

• Los loadings pueden graficarse en 2-3


dimensiones, donde cada dimensión
representa un componente. X siempre
será el CP1, Y el CP 2 y Z el CP 3.

Enero de 2018
Análisis multivariado

Scores: representa la posición de cada elemento en el


componente.

• Cada elemento tendrá un score distinto para cada


componente.
• Cada score contiene un porcentaje de la
variación de las variables originales (eigenvalor).
• Los scores se pueden graficarse en dos o tres
dimensiones.
• Elementos con características similares serán cercanos
en el componente.

Enero de 2018
Análisis multivariado

Promedio 140 Tn

Enero de 2018
Análisis multivariado

Las componentes principales se caracterizan por ser ortogonales y


porque no se correlacionan entre sí.

Los componentes principales se orientan en la dirección de la máxima


varianza, por lo tanto cruzan el centro de la nube de puntos.

Gotelli y Ellison, 2001.


Enero de 2018
Análisis multivariado

• Los componentes representan un gradiente de las variables


analizadas.

• El primer componente (CP) extrae la mayor varianza, el segundo


componente extrae la máxima variación restante y así sucesivamente
hasta el último CP.

• El número de componentes es
igual al número de variables.

• Por ejemplo en un análisis de 9


variables se obtendran 9 CP.

Enero de 2018
Análisis multivariado

• Los nuevos componentes reducen el número original de variables a un


menor número de variables que contienen la mayor varianza.

• Por ejemplo, de nueves variables se reducen a 2 nuevas variables que


contienen la información de las variables originales.

ACP1 (48.1) + ACP2 (16.7) = 64.8%

A lo que se le llama reducir la dimensionalidad de los datos.


Enero de 2018
Análisis multivariado

Enero de 2018
Análisis multivariado

4. Se calculan los eigenvalores y eigenvectores de la matriz (C):


• Los eigenvalores representan la proporción de la varianza
explicada
• Los eigenvectores contienen a los valores de las variables que
explican a su respectivo eigengenvalor.
5. La sumatoria de todos los eigenvalores representa la varianza
total.

Enero de 2018
Análisis multivariado

6. Se calculan los scores de cada CP:

• Los scores (zj) representan a cada uno de los elementos.


• Los cuales son calculados a partir de la multiplicación de los
coeficientes de las variables por su respectivo variable normalizada.
• En cada componente existe una valor distinto al mismo elemento.
• Al conjunto de nuevos valores (scores) se le llama variable
ortogonal.

Jongman, 1995.

Enero de 2018
Análisis multivariado

INTERPRETACIÓN
En una matriz de 9 variables y 23 elementos:
1. Se generan 9 CP porque son 9 variables
2. ¿Cuántos CP se deben utilizar?
a) Eigenvalores mayores de 1.0
b) CP que expliquen más del 70-80% de la variación de los datos
c) Cuando la curva de acumulación se estabilice

Enero de 2018
Análisis multivariado

3) ¿Qué variables son las más importantes? Los eigenvectores, que


contienen a los “loadings”, representan la relación entre la variable y el
componente
a) Sí el análisis es descriptivo, TODAS.
b) Sí el análisis contrasta una hipótesis, entonces las que tengan
un valor mayor de 0.7 o menor de -0.7.

El valor de los “loadings” va de


1.0 a -1.0 y se pueden graficar
como vectores i.e. con una
dirección y magnitud.

Enero de 2018
Análisis multivariado

4) ¿Qué significan los scores?

a) Posición canónica de cada elemento a partir de los valores


originales a los cuales esta asociado

Enero de 2018
Análisis multivariado

Vanhooydonck et al., 2000.

Enero de 2018
Análisis multivariado

Vanhooydonck et al., 2000.

Enero de 2018
Análisis multivariado

Diferencias en los
caracteristicas morfologicas
de los gonopodos de tres
especies de milípedos.

Bond et al., 2003.


Enero de 2018
Análisis multivariado

Melville y Schulte, 2001. Enero de 2018


Análisis multivariado

LITERATURA CITADA
•Bond, J. E., D. A. Beamer, M. C. Hedin, y P. Sierwald. 2003. Gradual
evolution of male genitalia in a sibling species complex of millipedes (Diploda:
Spirobolida: Anadenobolus). Invertebrate Systematics 17:711-717.
•Gotelli, N. J., y A. M. Ellison. 2004. A Primer of Ecological Statistics,
Sunderland.
•Jongman, R. H. G., C. J. F. Ter Braak, y O. F. R. Van Tongeren. 1995. Data
analysis in community and landscape ecology. Cambridge University Press,
Cambrige.
•Melville, J., y J. A. Schulte. 2001. Correlates of active body temperature
and microhabitat occupation in nine species of central Australia agamid
lizards. Austral Ecology 26:660-669.
•Vanhooydonck, B., R. V. Damme, y P. Aerts. 2000. Ecomorphological
correlates of hábitat partitioning in Corsican lacertid lizards. Functional Ecology
14:358-368.

Enero de 2018

También podría gustarte