Está en la página 1de 8

Práctica de Análisis Factorial Inter-baterías

IND7210 Métodos Avanzados de Análisis de Datos

Alba Martínez Ruiz


Departamento de Ingeniería Industrial
Universidad Católica de la Ssma. Concepción
Otoño, 2012

Datos Linnerud

Fuente:
- Tenenhaus, M. (1998). La régression PLS: Théorie et practique. Paris: Technip.

Problema

Los datos Linnerud están compuestos por 20 observaciones correspondientes a 20 atletas para
dos conjuntos de variables X e Y. El primer conjunto está compuesto por las variables Peso,
Talla y Pulso, y el segundo conjunto por las variables Tracción, Flexión y Saltos. Las
observaciones fueron medidas para estudiar la relación que existe entre las características
físicas de los atletas y su rendimiento físico en atletismo.

Tabla 1: Datos Linnerud Originales


Peso Talla Pulso Tracción Flexión Saltos
Nº X1 X2 X3 Y1 Y2 Y3
1 191 36 50 5 162 60
2 189 37 52 2 110 60
3 193 38 58 12 101 101
4 162 35 62 12 105 37
5 189 35 46 13 155 58
6 182 36 56 4 101 42
7 211 38 56 8 101 38
8 167 34 60 6 125 40
9 176 31 74 15 200 40
10 154 33 56 17 251 250
11 169 34 50 17 120 38
12 166 33 52 13 210 115
13 154 34 64 14 215 105
14 247 46 50 1 50 50
15 193 36 46 6 70 31
16 202 37 62 12 210 120
17 176 37 54 4 60 25
18 157 32 52 11 230 80
19 156 33 54 15 225 73
20 138 33 68 2 110 43
Promedio 178.60 35.40 56.10 9.45 145.55 70.30
Desviación 24.69 3.20 7.21 5.29 62.57 51.28

Se desea resumir el conjunto de variables X e Y en dos conjuntos de variables, th y uh, tal que
éstas expliquen bien su propio conjunto de variables y que a la vez tengan máxima covarianza.
Se realiza un Análisis Factorial Inter-baterías.
Solución

Las matrices de correlaciones que se muestran a continuación muestran claramente la


asociación que existen entre las variables X, entre las variables Y, y entre las variables X e Y. La
variable Peso se relaciona de forma positiva y fuertemente con la variable Talla (0.870). La
variable Pulso, como era de esperar, muestra una asociación lineal negativa, en este caso
moderada, con las variable Peso (-0.366) y Talla (-0.353). Podemos pensar que si queremos
resumir la información contenida en la matriz X, son las variables Peso y Talla las que más
contribuirán a su formación (primera variable canónica).

Matriz de correlaciones entre las variables X (R11)


Peso Talla Pulso
Peso 1 0.870 -0.366
Talla 0.870 1 -0.353
Pulso -0.366 -0.353 1

Por otro lado, la variable Tracción muestra una asociación lineal moderadamente fuerte y
positiva con la variable Flexión (0.696). La variable Saltos también se encuentra asociada de
forma positiva con los rendimientos de los atletas en Tracción (0.496) y Flexión (0.669),
aunque la asociación es menor. Probablemente las tres variables contribuirán fuertemente a la
formación de la primera variable canónica.

Matriz de correlaciones entre las variables Y (R22)


Tracción Flexión Saltos
Tracción 1 0.696 0.496
Flexión 0.696 1 0.669
Saltos 0.496 0.669 1

Las correlaciones entre ambos conjuntos de variables son un tanto diferentes a las
anteriormente mostradas. Existen asociaciones lineales moderadas y negativas entre Peso y el
rendimiento en Flexión (-0.493) y entre Talla y el rendimiento en Flexión (-0.646). La
característica física que más se relaciona con el rendimiento en Tracción es la Talla (-0.552);
ambas variables muestran una asociación lineal negativa, es decir a mayor talla menor
rendimiento en tracción. El rendimiento de los atletas en Saltos parece no verse influenciado
de forma importante por ninguna de las características físicas de los atletas, aunque existen
asociaciones pequeñas y negativas entre Saltos y Peso (-0.226), y entre Saltos y Talla (-0.191).
Si se suman los valores absolutos de las correlaciones para cada una de las variables Y,
podemos obtener una medida de asociación entre cada una de las variables Y y las variables X.
Se puede observar que la variable que más se asocia a las características de los atletas es
Flexión (1.364) y en segundo lugar Tracción (1.093). Si se sigue el mismo procedimiento pero
ahora sumando los valores absolutos de las correlaciones para cada X, se obtendrá que las
variables Talla (1.389) y Peso (1.109) son las que más se relacionan con las Y.

Resumiendo, las variables Talla, Peso, Flexión y Tracción son las que debieran aportar más en
la formación de las primeras variables canónicas.
Matriz de correlaciones entre las variables X e Y (R12)
X Valores absolutos
Peso Talla Pulso Peso Talla Pulso Suma
Tracción -0.390 -0.552 0.151 0.390 0.552 0.151 1.093
Y Flexión -0.493 -0.646 0.225 0.493 0.646 0.225 1.364
Saltos -0.226 -0.191 0.035 0.226 0.191 0.035 0.452

Análisis de Factorial Inter-baterías (resultados obtenidos con R-Project)

Valores propios  de la matriz  


h 1 2 3
Valor propio 1.272 0.006 0.001

Coeficientes ah de las combinaciones lineales    


h 1 2 3
Peso -0.590 -0.772 0.236
Talla -0.771 0.452 -0.448
Pulso 0.239 -0.447 -0.862

Coeficientes bh de las combinaciones lineales


   
h 1 2 3
Tracción 0.613 -0.214 0.760
Flexión 0.747 -0.156 -0.646
Saltos 0.257 0.964 0.064

Componentes th y uh
Obs. t1 t2 t3 u1 u2 u3
1 -0.643 0.075 0.764 -0.371 -0.054 -0.823
2 -0.770 0.155 0.366 -1.340 0.196 -0.717
3 -0.907 -0.201 -0.453 -0.082 0.585 0.866
4 0.688 0.097 -0.809 -0.355 -0.629 0.744
5 -0.487 0.244 1.363 0.463 -0.399 0.397
6 -0.229 -0.015 -0.039 -1.306 -0.201 -0.359
7 -1.404 -0.640 -0.041 -0.862 -0.438 0.211
8 0.744 -0.076 -0.382 -0.797 -0.379 -0.322
9 1.715 -1.649 -1.550 1.142 -0.930 0.198
10 1.163 0.437 0.112 3.034 2.811 0.222
11 0.365 0.480 0.833 0.409 -0.850 1.309
12 0.743 0.309 0.705 1.405 0.537 -0.099
13 1.187 0.082 -0.984 1.531 0.296 -0.019
14 -4.390 -0.264 -0.098 -2.223 0.198 -0.254
15 -0.823 0.260 1.262 -1.499 -0.411 0.235
16 -0.749 -0.871 -0.705 1.314 0.671 -0.237
17 -0.393 0.437 0.002 -1.880 -0.418 0.043
18 1.199 0.449 0.759 1.237 -0.090 -0.637
19 1.049 0.498 0.370 1.606 -0.372 -0.019
20 1.942 0.194 -1.476 -1.425 -0.123 -0.739
Varianzas de las componentes th y uh
h th uh
1 2.025 2.050
2 0.283 0.641
3 0.692 0.309

Matriz de varianzas y covarianzas de las th


t1 t2 t3
t1 2.025 0.098 -0.332
t2 0.098 0.283 0.256
t3 -0.332 0.256 0.692

Matriz de varianzas y covarianzas de las uh


u1 u2 u3
u1 2.050 0.544 0.157
u2 0.544 0.641 -0.053
u3 0.157 -0.053 0.309

Matriz de correlaciones entre las componentes th


t1 t2 t3
t1 1 0.129 -0.281
t2 0.129 1 0.579
t3 -0.281 0.579 1

Matriz de correlaciones entre las componentes uh


u1 u2 u3
u1 1 0.474 0.197
u2 0.474 1 -0.120
u3 0.197 -0.120 1

Matriz de correlaciones entre las componentes th y uh


u1 u2 u3
t1 0.554 0 0
t2 0 0.177 0
t3 0 0 0.072

Estadístico Φm
m Φm Grados libertad Significancia
0 25.584 9 0.00
1 0.584 4 0.96
2 0.103 1 0.75
Correlaciones entre las variables X y las componentes th
t1 t2 t3
Peso -0.948 -0.405 0.195
Talla -0.962 -0.117 0.075
Pulso 0.511 -0.609 -0.950

Correlaciones entre las variables Y y las componentes uh


u1 u2 u3
Tracción 0.880 0.195 0.616
Flexión 0.940 0.426 -0.134
Saltos 0.741 0.942 0.016

Correlaciones entre las variables X y las componentes uh


u1 u2 u3
Peso -0.465 -0.073 0.014
Talla -0.608 0.042 -0.027
Pulso 0.188 -0.042 -0.052

Correlaciones entre las variables Y y las componentes th


t1 t2 t3
Tracción 0.486 -0.030 0.030
Flexión 0.592 -0.022 -0.026
Saltos 0.203 0.136 0.003

Parte de la varianza de las explicada por las componentes  , … ,  :   ;  , … ,  


h 1 2 3
Peso 0.898 0.979 1
Talla 0.925 0.926 1
Pulso 0.261 0.724 1
Media 0.695 0.876 1

Parte de la varianza de las  explicada por las componentes


 , … ,
 :   ;
 , … ,
 
h 1 2 3
Tracción 0.775 0.839 1
Flexión 0.883 0.883 1
Saltos 0.549 0.999 1
Media 0.735 0.907 1
Comunalidad inter-grupos: parte de la varianza de las
explicada por las componentes uh
h 1 2 3
Peso 0.216 0.244 0.268
Talla 0.369 0.510 0.548
Pulso 0.035 0.058 0.075
Media 0.207 0.271 0.297

Comunalidad inter- grupos: parte de la varianza de las 


explicada por las componentes th
h 1 2 3
Tracción 0.236 0.245 0.340
Flexión 0.351 0.360 0.436
Saltos 0.041 0.054 0.054
Media 0.209 0.220 0.277

Estimación de la matriz R12


 
     ′
Tracción Flexión Saltos
Peso -0.460 -0.561 -0.193
Talla -0.601 -0.733 -0.252
Pulso 0.186 0.227 0.078

Estimación del residuo



 
    
       . 
Proyección de los individuos en el plano determinado por las componentes t1 y u1
Círculo de correlaciones de las variables X e Y con las componentes del otro grupo uh y th

También podría gustarte