Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
## Mean :49.43 Mean :14.53
## 3rd Qu.:50.02 3rd Qu.:14.94
## Max. :51.16 Max. :15.67
Matriz de correlacin La correlacin entre las variables se puede calcular como sigue:
cor.mat <- round(cor(decathlon2.active),2)
head(cor.mat[, 1:6])
au e
library(corrplot)
l
rd
corrplot(cor.mat, type = "upper", order = "hclust",
Sh mp
Lo mp
Po .hu
lt
ut
0m
e
m
lin
s
.p
.v
cu
h.
00
00
10
50
ng
ot
ve
le
ig
is
X4
X1
X1
X1
Ja
D 1
Javeline
0.8
High.jump
0.6
Long.jump
0.4
Shot.put
0.2
Discus
0
X400m
0.2
X100m
0.4
X110m.hurdle
0.6
Pole.vault
0.8
X1500m
1
Anlisis de componentes principales
res.pca<-PCA(decathlon2.active, graph = FALSE)
print(res.pca)
2
## *The results are available in the following objects:
##
## name description
## 1 "$eig" "eigenvalues"
## 2 "$var" "results for the variables"
## 3 "$var$coord" "coord. for the variables"
## 4 "$var$cor" "correlations variables - dimensions"
## 5 "$var$cos2" "cos2 for the variables"
## 6 "$var$contrib" "contributions of the variables"
## 7 "$ind" "results for the individuals"
## 8 "$ind$coord" "coord. for the individuals"
## 9 "$ind$cos2" "cos2 for the individuals"
## 10 "$ind$contrib" "contributions of the individuals"
## 11 "$call" "summary statistics"
## 12 "$call$centre" "mean of the variables"
## 13 "$call$ecart.type" "standard error of the variables"
## 14 "$call$row.w" "weights for the individuals"
## 15 "$call$col.w" "weights for the variables"
Variaciones de los componentes principales La proporcin de varianzas retenidas por los componentes
principales se puede extraer de la siguiente manera:
eigenvalues <- res.pca$eig
head(eigenvalues[, 1:2])
3
Varianza
40
Percentaje de Varianza
30
20
10
0
1 2 3 4 5 6 7 8 9 10
Componentes Principales
4
Scree plot
40
Percentage of explained variances
30
20
10
1 2 3 4 5 6 7 8 9 10
Dimensions
5
Grfico de variables usando el grfico de base FactoMineR
plot(res.pca, choix = "var")
Pole.vault X1500m
0.5
Javeline
Dim 2 (18.39%)
X400m Long.jump
Shot.put
0.0
X110m.hurdle Discus
X100m
0.5
High.jump
1.0
2 1 0 1 2
Dim 1 (41.24%)
6
Variables PCA
1.0
Pole.vault
X1500m
0.5
Javeline
X400m Long.jump
Dim2 (18.4%)
Shot.put
Discus
X110m.hurdle
0.0
X100m
High.jump
0.5
1.0
fviz_pca_var(res.pca, col.var="steelblue")+
theme_minimal()
7
Variables PCA
1.0
Pole.vault
X1500m
0.5
Javeline
X400m Long.jump
Dim2 (18.4%)
Shot.put
Discus
X110m.hurdle
0.0
X100m
High.jump
0.5
1.0
fviz_pca_var(res.pca, col.var="contrib")
8
Variables PCA
1.0
Pole.vault
X1500m
0.5
Javeline
X400m Long.jump contrib
Dim2 (18.4%)
12
Shot.put
Discus
X110m.hurdle 10
0.0
X100m
8
High.jump 6
0.5
1.0
fviz_pca_var(res.pca, col.var="contrib")+
scale_color_gradient2(low="white", mid="blue",
high="red", midpoint=55)+theme_bw()
9
Variables PCA
1.0
Pole.vault
X1500m
0.5
Javeline
X400m Long.jump contrib
Dim2 (18.4%)
12
Shot.put
Discus
X110m.hurdle 10
0.0
X100m
8
High.jump 6
0.5
1.0
Tambin es posible controlar automticamente la transparencia de las variables por sus contribuciones:
fviz_pca_var(res.pca, alpha.var="contrib")+
theme_minimal()
10
Variables PCA
1.0
Pole.vault
X1500m
0.5
Javeline
X400m Long.jump
contrib
Dim2 (18.4%)
Shot.put
Discus 6
X110m.hurdle 8
0.0
X100m 10
12
High.jump
0.5
1.0
11
Individuals factor map (PCA)
3
CLAY
2
BERNARD Clay
Schoenbeck SEBRLE Sebrle
Dim 2 (18.39%)
Schwarzl
Warners
0
BARRAS YURKOV
Barras McMULLEN
1
Karpov
MARTINEAU Zsivoczky
Hernu
NOOL Bernard
2
ZSIVOCZKY Macey
6 4 2 0 2 4
Dim 1 (41.24%)
12
Individuals PCA
CLAY
2
BERNARD SEBRLE Clay
BOURGUIGNON Schoenbeck Sebrle
HERNU
1 Pogorelov
Schwarzl
Dim2 (18.4%)
Warners
0
BARRASYURKOV
Barras Karpov
Zsivoczky
McMULLEN
1 Hernu
MARTINEAU
NOOL Bernard
2
ZSIVOCZKY Macey
13
Individuals PCA
CLAY
2
BERNARD SEBRLE Clay
BOURGUIGNON Schoenbeck Sebrle
HERNU
1 Pogorelov
Schwarzl
Dim2 (18.4%)
Warners
0
BARRASYURKOV
Barras Karpov
Zsivoczky
McMULLEN
1 Hernu
MARTINEAU
NOOL Bernard
2
ZSIVOCZKY Macey
Controla automticamente el color de los individuos usando los valores cos2 (la calidad de los individuos en
el mapa de factores):
fviz_pca_ind(res.pca, col.ind="cos2") +
scale_color_gradient2(low="white", mid="blue",
high="red", midpoint=0.50)
14
Individuals PCA
CLAY
2
BERNARD SEBRLE Clay
BOURGUIGNON Schoenbeck Sebrle
HERNU
1 Pogorelov cos2
Schwarzl
Dim2 (18.4%)
Warners 0.75
0 0.50
BARRAS
YURKOV
0.25
Barras Karpov
Zsivoczky
McMULLEN
1 Hernu
MARTINEAU
NOOL Bernard
2
ZSIVOCZKY Macey
Cambiar el tema :
fviz_pca_ind(res.pca, col.ind="cos2") +
scale_color_gradient2(low="white", mid="blue",
high="red", midpoint=0.50)+
theme_minimal()
15
Individuals PCA
CLAY
2
BERNARD SEBRLE Clay
BOURGUIGNON Schoenbeck Sebrle
HERNU
1 Pogorelov cos2
Schwarzl
Dim2 (18.4%)
Warners 0.75
0 0.50
BARRAS
YURKOV
0.25
Barras Karpov
Zsivoczky
McMULLEN
1 Hernu
MARTINEAU
NOOL Bernard
2
ZSIVOCZKY Macey
16
PCA Biplot
CLAY
Pole.vault
X1500m
2
BERNARD SEBRLE Clay
BOURGUIGNON Schoenbeck Sebrle
HERNU Javeline
1 X400m Pogorelov Long.jump
Schwarzl
Dim2 (18.4%)
Warners
Shot.put
Discus
0
X110m.hurdle
BARRASYURKOV
X100m
Barras Karpov
Zsivoczky
McMULLEN
1 Hernu
MARTINEAU High.jump
NOOL Bernard
2
ZSIVOCZKY Macey
Cambiar el color de las personas por grupos Utilizaremos conjuntos de datos de iris en esta seccin:
data("iris")
head(iris)
17
Individuals PCA
1
Dim2 (22.9%)
2 0 2
Dim1 (73%)
18
Individuals PCA
1
Dim2 (22.9%)
Groups
setosa
0
versicolor
virginica
2 0 2
Dim1 (73%)
Aadir elipses de concentraciones puntuales : el argumento habillage se utiliza para especificar la variable
factor para colorear las observaciones por grupos.
fviz_pca_ind(iris.pca, label="none", habillage=iris$Species,
addEllipses=TRUE, ellipse.level=0.95)
19
Individuals PCA
1
Dim2 (22.9%)
Groups
setosa
0
versicolor
virginica
2 0 2
Dim1 (73%)
Ahora vamos a :
- hacer una biplot de individuos y variables - cambiar el color de los individuos por grupos - cambiar la
transparencia de los colores variables por sus valores de contribucin - mostrar slo las etiquetas de las
variables
fviz_pca_biplot(iris.pca,
habillage = iris$Species, addEllipses = TRUE,
col.var = "red", alpha.var ="cos2",
label = "var") +
scale_color_brewer(palette="Dark2")+
theme_minimal()
20
PCA Biplot
Sepal.Width
3
2 cos2
Sepal.Length 0.94
0.96
Dim2 (22.9%)
1
0.98
Petal.Width
Petal.Length
0 Groups
setosa
1 versicolor
virginica
2 0 2
Dim1 (73%)
21