Está en la página 1de 27

CASO PRACTICO ACP

Cuando nos planteamos realizar una investigacin estadstica en el campo del anlisis
multivariante y concretamente en el ACP podemos partir, como contbamos en nuestra
introduccin, de dos estrategias: realizar un anlisis exploratorio o confirmatorio. Tanto en un caso
u otro partiremos de una seleccin previa de las variables que consideremos relevantes para la
investigacin. El proceso ser mas o menos elaborado en funcin de la informacin previa que se
tenga del problema que se va a investigar, y lo enmarcaremos en uno u otro, si pretendemos o no
confirmar una idea prefijada.
Tngase en cuenta que a travs del ACP pretendemos obtener nuevas variables sintticas
(componentes) incorrelacionadas que agruparan cada una de ellas a variab les originales
(relacionadas entre si), de forma que estas nuevas variables expliquen el comportamiento de las
variables originales y por tanto el mximo de su variabilidad total.
En nuestro caso y para aplicar esta tcnica pretendemos realizar un anlisis confirmatorio
sobre la influencia de las diferentes tendencias polticas en la aplicacin de una determinada
poltica de bienestar social.
El primer problema que se nos plantea es la eleccin de las variables. Para realizar el
estudio hemos recogido el comportamiento de 17 variables a lo largo del periodo 1980 1995.
Dichas variables son:
ACUESOC
COBNEG
CONFSOC
CONVENIO
DENSNAF
DESEMPLE
EDUCACIO
GASTSOC
INCOFSOC
IZQGOBIE
OTPREST
PARTHUEL
GASTPENS
GASTSANI
TCONFSOC
VARCONFS
GASTVIVI

Acuerdos Sociales
Tasa de cobertura de Negociacin Colectiva
Jornadas no Trabajadas
Trabajadores Afectados por Convenio
Tasa de Densidad Neta de Afiliacin
Gasto en prestacin por Desempleo
Gasto en Educacin
Gasto Social
ndice de jornadas no Trabajadas
Control del Partido Socialista
Otras Prestaciones Sociales
Participaciones en Huelga
Gasto en Pensiones
Gasto en Sanidad
Tasa de Conflictividad Laboral
Tasa de Variacin de Jornadas no Trabajadas
Gasto en Vivienda

Donde los datos de las variables originales vienen dados en la tabla 1. En ella se expresan
los valores de las 17 variables socioeconmicas estudiadas desde 1975 a 1995. Hay que tener en
cuenta que la variable GASTSOC engloba a las variables correspondientes a las partidas
presupuestarias de gasto, como son : Educacin, Sanidad, Vivienda, Desempleo, Pensiones y Otras
Prestaciones Sociales. Tambin tenemos que tener en cuenta que de las 17 variables originales 2
son cualitativas dicotmicas IZQ, ACUESOC.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

Cuando tenemos una masa de datos en un principio cada una de las variables presenta
una configuracin distinta, as en nuestros datos tenemos variables como ndices, tasas, miles de
millones etc, esto plantea el problema de las escalas de medida.
Si considersemos por ejemplo la representacin de los individuos (aos) en el plano
definido por las variables GASTSOC (Gasto Social) y CONFSOC (Conflicto Social), tal como
aparece en la figura 1,
6

1977
1980

1981

1976
1979

1982

1978

1983
1984

1987
1989
19
86

1990
1995
1991

Confsoc

1985

1993

1988
1992 1994

1
16

18

20

22

24

26

28

30

gasto social

Fig 1: Distribucin de los Individuos (aos) en las variables originales Gastsocial y Conflsocial
Podemos observar que en el transcurso de os aos, desde el punto de vista de estas dos variables,
a medida que el gasto Social aumenta la conflictividad Laboral por jornadas no trabajadas diminuye.
Esto en definitiva, no nos proporciona mucha informacin, ya que podra deberse dicha
circunstancia al efecto producido por otras variables.
Tambin podramos representar en estos dos ejes la variable IZQ que nos indicara cual
era la tendencia poltica en el gobierno del Pas.
Tendencia Politica segun variables
6

Con
Con

Con
Con

Con

Confsoc

Con

Con

Pro
Pro

P
Pro
roPro

Pro

Pro

Pro
Pro
Pro

Pro

1
16

Pro Pro

18

20

22

24

26

28

30

gas to s oc ial

Fig 2: Situacin del partido Gobernante en las variables CONFSOC y GASTSOC


Observamos igualmente la evolucion desde un gobierno politico conservador en los aos 1975
hasta 1983 como se situa en las cuotas mas altas de conflictividad laboral.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

Tal vez seria interesante mostrar el comportamiento de la "variable" (individuo IZQ)


representada por los ejes formados por las variables originales: Gasto por prestacion de desempleo
(DESEM) frente a la tasa de Conflictividad Laboral (TCONFSOC).

Tendencia Politica segun Variables


300
Con
Con

200
Con

Con

Tconfsoc

100

Con

Pro
Pro

Pro
Con
Pro

Pro
Pro
Pro

Pro
Pro
ConPro
Pro
Pro

0
,5

1,0

1 ,5

2 ,0

2,5

Pro

3,0

3 ,5

4,0

d es emp leo

Fig 3: Situacin del partido gobernante ante el gasto por desempleo y la tasa de
conflictividad laboral
No cabe duda que realmente todas estas posibles combinaciones de individuos y
variables son muy interesantes, pero realmente, lo que estamos buscando en realidad es por que
los individuos se dispersan o se comportan de esa manera.
La explicacin no hay que buscarla en una , dos o tres variables sino en su conjunto. Con
estas representaciones se esta buscando la justificacin de la semejanza (llmese comportamiento)
de dos variables cualquiera en el espacio de los individuos.
Desde otro punto de vista podemos observar el comportamiento de los individuos en el
conjunto de variables. En este caso estamos planteando la semejanza de dos individuos en el
espacio de las variables. Lo que obtenemos es una representacin grafica de la dispersin de las
variables segn los individuos (llmese ao).
Si alternativamente, consideramos dos aos, el conjunto de variables podra representarse
anlogamente en u grfico plano de ejes perpendiculares, cuyas coordenadas se identificaran con
el valor que tomasen las variables en ambos aos (individuos). As mismo, este grfico permitira
evaluar si el comportamiento de los individuos es anlogo con respecto al conjunto de las variables
y descubrir grupos de caractersticas similares.
En este caso obtenemos un problema adicional que viene promovido por la disparidad de
medidas de las variables. Si representamos la dispersin de las variables originales (sin
estandarizar) en los ejes formados por los individuos (aos 1977 - 1987) observamos segn fig 4
como es imposible aventurarse a interpretar nada.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

1987

Dispersion de las variables orig.


8000
6000
4000
2000
0
0

1000

2000

3000

4000

1977
Fig 4: Dispersin de las Variables Originales sin estandarizar
A la vista de la fig 4. La interpretabilidad es nula, por esto adquiere inmediatamente la
importancia de la mtrica del espacio en que se representa. Antes de efectuar un ACP conviene
asegurarse de la homogeneidad de los datos, de forma que tenga sentido interpretar la distancia
entre filas y columnas. Para homogeneizar los datos se presenta en la tabla 2 la matriz de
puntuaciones estandarizadas.
Si tenemos en cuenta los datos estandarizados la representacin quedara como la Fig. 5 o
Fig 6 donde si podemos comprobar el comportamiento de las variables, al igual que comentbamos
anteriormente. Como hay 21 aos y si quisiramos representar las variables originales en todos los
posibles planos, tendramos una combinacin de 21 elementos tomados de dos en dos, lo que nos
impedira ser lo suficientemente razonables para extraer conclusiones de la visualizacin de tantas
figuras.
Dispersion de las variables orig.
1,5

1987

1
0,5
0
-4

-2

-0,5 0

-1
-1,5
1977

Fig 5: Representacin de las variables originales en los ejes de individuos (1977 1987)

Prof: Salvador Carrasco Arroyo Universidad de Valencia

Sin embargo lo que pretendemos con dicha visualizacin a travs de las distancias entre
las variables. Como interpretar la proximidad o parecido entre indiv iduos si tienen valores
parecidos en ciertos pares de variables, pero no en otros?.
Vemos en la figura 3 como la dispersin de las variables originales referentes a los aos
1982 y 1992 tiene, por supuesto una configuracin distinta.

Dispersion de variables orign


2
1,5
1

1980

0,5
0
-2

-1

-0,5

-1
-1,5
-2

1992

Fig 6: Representacin de las variables originales en los ejes de individuos (1980 1992)
En definitiva lo que perseguimos es la representacin de todas las variables o todos los
individuos de manera que podamos recoger toda la informacin posible y representar todas las
variables en un espacio m dimensional (que para facilitar su interpretacin ser de dimensin dos)
que explique la dispersin de las variables originales, as como el comportamiento de los individuos
en dichas variables.
En nuestro ejercicio, queremos confirmar si la poltica de bienestar social llevada a cabo
por los gobiernos desde el ao 1975 a 1995 ha estado influenciada por el partido en el poder
(conservador o progresista).

Prof: Salvador Carrasco Arroyo Universidad de Valencia

PERIO GAST GASTPE


OTRS GASTE GASTS GASTV
DESEM
D
S
N
GA
D
A
I
1975 16,15
5,62
0,48
3,15
2,09
3,77
1,04
1976
17,3
6,73
0,57
2,66
2,33
3,91
1,1
1977 17,55
7,39
0,84
2,13
2,45
3,66
1,08
1978 19,87
8,81
1,22
1,89
2,94
4,1
0,91
1979 20,99
9,42
1,64
1,93
3,11
4
0,89
1980 21,65
8,58
2,23
1,89
3,27
4,53
1,15
1981 23,06
9,11
2,75
2,23
3,12
4,54
1,31
1982 22,63
9,1
2,59
2,24
3,01
4,29
1,4
1983 23,31
9,56
2,47
2,31
3,21
4,16
1,6
1984 23,26
9,59
2,4
2,29
3,3
3,94
1,74
1985 24,76
10,21
2,78
1,34
3,75
4,67
2,01
1986 24,14
10,02
2,7
1,23
3,79
4,56
1,84
1987 24,19
9,7
2,71
1,39
3,97
4,58
1,84
1988 24,23
9,65
2,7
1,51
3,88
4,74
1,75
1989 24,46
9,69
2,71
1,54
4,11
4,8
1,61
1990 25,04
9,92
2,83
1,66
4,17
4,89
1,57
1991 25,97
10,26
3,19
1,8
4,14
5,05
1,53
1992 27,85
10,97
3,37
1,81
4,27
5,77
1 ,66
1993
29,1
11,54
3,75
1,68
4,54
5,9
1,69
1994 28,57
11,65
3,3
1,71
4,36
5,84
1,71
1995 27,75
11,63
2,59
1,77
4,32
5 ,92
1,52

TADEN TRCO TSCO PARTH CONF ICONF VARC TCONFS ACUE


IZQU
S
NV
BE
U
SO
S
ON
O
R
,
,
,
,
,
,
,
,
2
2
,
,
,
2321
3,77
100 ,
161,8
2
2
18,46
2876
33,6
2475
5,63
121
21
194,9
1
2
28,45
4629
55
3425
2,99
83,9
-30,5
137,4
1
2
24,72
4960
60,4
2132
3,31 137,5
63,7
230,6
2
2
13,76
6070
76,6 857,2
5,28
44,9
-67,3
78
1
2
13,08
4435
57,8 861,7
4,58
37,4
-16,5
67,2
1
2
13,18
6263
82,3 714,3
3,19
20,2
-45,9
36,6
1
2
13,86
6226
82, 1
1022
2,98
32,1
58,4
58,2
1
1
13,85
6182
85,2
1497
2,84
46,2
43,9
87,6
2
1
14,19
6131
83,8
1384
2,13
23,4
-49,2
44,1
1
1
13,64
627 5
81,9 938,6
2,66
16,5
-29,2
29,7
1
1
14,68
6868
86,1
1257
2,67
36,5 120,4
63
2
1
15,13
6865
82,1
5610
1,73
84,6 131,6
81,9
2
1
15,7
6994
78,7
1320
2,67
26,7
-68,3
41,5
2
1
16,84
7624
82,2 701,8
2,83
17,7
-33,7
26,3
2
1
19,26
7822
83,4
1253
2,27
32,1
80,9
47,1
2
1
21,54
7922
87,2
3989
1,2
45,4
41,2
68,8
2
1
22,94
7737
89 881,6
2,01
14,6
-67,7
23,1
2
1
22,68
7502
86,9
6099
1,15
45,4 210,7
72,5
2
1
,
7459
83,4
658
2,53
10,4
-76,9
16,1
2
1

Tabla 1: Datos de las 17 Variables Originales

Prof: Salvador Carrasco Arroyo Universidad de Valencia

PERIOD
O
1975
1976
1977
1978
1979
1980

GASTSO
C
-2,02377
-1,70367
-1,63408
-0,98829
-0,67654
-0,49282

GASTPE
N
-2,5492
-1,81677
-1,38128
-0,4443
-0,04179
-0,59606

GASTDE
S
-2,08027
-1,98133
-1,68453
-1,2668
-0,8051
-0,15652

OTRGAS
T
2,69526
1,62815
0,47393
-0,04874
0,03837
-0,04874

GASTED
U
-2,0069
-1,67242
-1,50518
-0,82227
-0,58535
-0,36236

GASTSA
N
-1,24033
-1,04268
-1,39562
-0,77445
-0,91562
-0,16739

GASTVI
V
-1,31763
-1,13539
-1,19614
-1,71249
-1,77324
-0,98353

,
,
0,19419
2,33379
1,53492
-0,81244

TRACON
V
,
,
-2,59265
-1,28812
-1 ,04221
-0,21609

TSCOBE
R
,
,
-2,9 8007
-1,50113
-1,12794
-0,00837

PARTH
UE
,
0,21759
0,31345
0,90249
0,1004
-0,68984

CONFLS
O
,
0,72071
2,29963
0,05857
0,33022
2,00252

ICOFSO
C
,
1,39129
1,96222
0,95358
2,4108
-0,10671

1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992

-0,10034
-0,22003
-0,03075
-0,04467
0,37286
0,20028
0,2142
0,22534
0,28936
0,4508
0,70967
1,23298

-0,24634
-0,25294
0,05059
0,07038
0,47949
0,35412
0,14297
0,10997
0,13637
0,28813
0,51248
0,98097

0,41511
0,23923
0,10731
0,03036
0,44809
0,36015
0,37114
0,36015
0,37114
0,50305
0,8988
1,09667

0,6917
0,71348
0,86593
0,82237
-1,2465 2
-1,48608
-1,13763
-0,8763
-0,81096
-0,54963
-0,24474
-0,22296

-0,57141
-0,72471
-0,44598
-0,32055
0,30661
0,36236
0,61322
0,48779
0,80834
0,89196
0,85015
1,03133

-0,15328
-0,50622
-0,68974
-1,00033
0,03025
-0,12504
-0,09681
0,12907
0,21378
0,34084
0,56672
1,58318

-0,49755
-0,22419
0,38329
0,80852
1,6286
1,11225
1,11225
0,83889
0,41366
0,29216
0,17067
0,56553

-0,95808
-0,93666
-0,79102
-0,79316
-0,72034
-0,83814
-0,6154
-0,51902
-0,39694
-0,15278
0,36553
0,85384

-1,4325
-0,07222
-0,09946
-0,13251
-0,17032
-0,06314
0,3779
0,37567
0,47175
0,94071
1,088
1,1625

-1,30762
0,38556
0,37174
0,58598
0,48922
0,35791
0,64817
0,37174
0,13676
0,37865
0,46158
0,72419

-0,68705
-0,77844
-0,58741
-0,29326
-0,36333
-0,63937
-0,44219
2,25678
-0,40288
-0,78619
-0,44455
1,25188

1,4083
0,22835
0,05008
-0,06876
-0,67147
-0,22156
-0,21307
-1,01102
-0,21307
-0,07725
-0,55263
-1,46093

-0,31061
-0,77823
-0,4547
-0,07137
-0,69123
-0,87882
-0,33508
0,97261
-0,60151
-0,84619
-0,4547
-0,09312

1993
1994
1995

1,58092 1,3570 8 1,5144 -0,50607 1,40762 1,76671 0,65665 1,15369 1,02496 0,84859 -0,67471 -0,77334 -0,93047 -1,02517 -0,94078
1,4334 1,42966 1,01972 -0,44074 1,15676 1,68201 0,71739 1,098 0,85006 0,70346 2,55998 -1,50338 -0,09312 2,42245 -0,09916
1,20514 1,41647 0,23923 -0,31007 1,10101 1,79495 0,1403
,
0,81768 0,46158 -0,81335 -0,33191 -1,04466 -1,1391 -1,06004

TDENSI

,
,
0,07326
-0,5645
0,60204
-1,02022

TCONFS
O
,
1,42225
1,98617
1,00655
2,59439
-0,00545

-0,39113
-0,75521
0,53641
0,35685
-0,79608
-0,5484
1,3042
1,4429
-1,0326
-0,60413
0,81504
0,32341

-0,18945
-0,71078
-0,34278
0,1581
-0,58301
-0,82834
-0,26101
0,06099
-0,6273
-0,88626
-0,5319
-0,16219

VARCOF

Tabla 2: Puntuaciones estandarizadas de las variables originales en los 21 aos (1975 1995)

Prof: Salvador Carrasco Arroyo Universidad de Valencia

En Salida SPSS:1 se han recogido las medidas descriptivas correspondientes a las


variables originales a excepcin de las variables dicotmicas (Tendencia Poltica y
Acuerdos Sociales), posteriormente nos servirn para plasmar en el plano factorial su
comportamiento.
Salida SPSS 1: Medidas descriptivas de las variables
GS
PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
PARTHUEL
CONFSOC
ICONFSOC
VARCONFS
TCONFSOC

Mean

Std Dev

Cases

23,42048
9,48333
2,37238
1,91238
3,53000
4,64857
1,47381
17,55333
6359,94211
76,72105
1969,77000
2,92100
48,82500
15,08421
78,32000

3,59253
1,51551
,90968
,45918
,71752
,70834
,32923
4,30468
1274,67267
13,72726
1571,96071
1,14819
35,85105
76,60749
57,20957

21
21
21
21
21
21
21
18
19
19
20
20
20
19
20

Label
gasto social
pensiones
desempleo
otras prestaciones sociales
gasto en educacion
g. sanidad
gast. vivienda y otros serv colectivo
Tasa de densidad neta (afiliacion)
trabajadores afectados por convenio e
tasa de cobertura de la negociacion c
participantes en huelgas por numero d
jornadas no trabajadas por numero de
jornadas no trabajadas en n indices
tasa de variacion de las jornadas no
tasa de conflictividad laboral

En el conjunto de las 15 variables observamos que la variable VARCOFS y


PARTHUEL tienen una desviacin muy elevada, hecho que dar pie a un posterior estudio
para incluirlas en el anlisis o excluirlas.
Correlation Matrix:
GS
GS
1,00000
PENS
,96488
DES
,94906
OPRS
-,65932
EDUC
,95759
SAN
,90793
VIV
,72731
DENSN
,05104
CONVE
,69410
COBER
,62944
PARTHUEL
,06661
CONFSOC
-,67096
ICONFSOC
-,61665
VARCONFS
,09431
TCONFSOC
-,65293

DENSN
CONVE
COBER
PARTHUEL
CONFSOC
ICONFSOC
VARCONFS
TCONFSOC

DENSN
1,00000
-,02211
-,25676
,44978
-,25905
,42949
,16346
,43483

TCONFSOC

TCONFSOC
1,00000

PENS

DES

OPRS

EDUC

SAN

VIV

1,00000
,88915
-,72178
,92365
,84064
,65375
,15006
,55191
,50073
,08151
-,62097
-,49056
,09065
-,51071

1,00000
-,65902
,90076
,78740
,76204
-,12231
,62917
,61790
-,02773
-,57131
-,66044
,07836
-,69540

1,00000
-,77827
-,52388
-,62251
-,01274
-,28765
-,25765
-,06678
,38100
,28939
-,00817
,34445

1,00000
,88088
,71942
,08087
,71774
,60398
,07259
-,66304
-,56544
,08470
-,62170

1,00000
,52140
,21665
,72022
,55609
,16883
-,62750
-,54076
,02847
-,59244

1,00000
-,42046
,58238
,70275
,00003
-,62081
-,65372
,16079
-,70320

CONVE

COBER

PARTHUEL

CONFSOC

ICONFSOC

VARCONFS

1,00000
,91426
,04604
-,75655
-,61683
,11855
-,67858

1,00000
-,04548
-,71732
-,68283
,10734
-,71849

1,00000
-,41409
,45209
,69145
,32440

1,00000
,37128
-,35892
,45108

1,00000
,33818
,97377

1,00000
,26622

Determinant of Correlation Matrix =


,0000000
>Warning # 11301
>The correlation matrix is not positive definite.

Salida SPSS 2: Matriz de Correlacin

Prof: Salvador Carrasco Arroyo Universidad de Valencia

Normalmente la matriz XX' es de rango completo a travs de la cual obtenemos la


matriz de correlacin R a partir de la cual, diagonalizando, se llega a obtener los valores
propios (autovalores). Por este motivo en el caso de que exista un valor prop io nulo
revelara la existencia de una dependencia lineal entre las variables, hecho ocurrido en
nuestro caso, donde el Gasto Social (GASTSOC) es una combinacin lineal exacta de las
partidas de gasto. As la matriz R es no definida y positiva segn podemo s observar en la
Salida SPSS 2.
Observando la matriz de correlaciones R encontramos ya la primera aproximacin a
la existencia de relaciones entre las variables. Podemos observar que la variable PATHUEL y
la VARCONFS tienen muy poca relacin en general con el resto de las variables y puesto
que su dispersin es muy elevada procederemos a eliminarlas del estudio. En definitiva lo
que pretendemos buscar son grupos de variables originales muy relacionados entre si pero
no relacionado entre los grupos. Tambin eliminaremos la variable GASTSOC por el motivo
aludido anteriormente la matriz R de correlaciones preparada para realizar el ACP ser:

Correlation Matrix:
PENS
PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

1,00000
,88915
-,72178
,92365
,84064
,65375
,15006
,55191
,50073
-,49056
-,51071

CONVE
COBER
ICONFSOC
TCONFSOC

CONVE
1,00000
,91426
-,61683
-,67858

DES

OPRS

EDUC

SAN

VIV

DENSN

1,00000
-,65902
,90076
,78740
,76204
-,12231
,62917
,61790
-,66044
-,69540

1,00000
-,77827
-,52388
-,62251
-,01274
-,28765
-,25765
,28939
,34445

1,00000
,88088
,71942
,08087
,71774
,60398
-,56544
-,62170

1,00000
,52140
,21665
,72022
,55609
-,54076
-,59244

1,00000
-,42046
,58238
,70275
-,65372
-,70320

1,00000
-,02211
-,25676
,42949
,43483

COBER

ICONFSOC

TCONFSOC

1,00000
-,68283
-,71849

1,00000
,97377

1,00000

Determinant of Correlation Matrix =

,0000000

Salida SPSS 3: Matriz de correlacin eliminada la variable GASTSOC


Para comprobar que los p valores propios son no nulos se aplicara un contraste de
hiptesis, donde la Hiptesis Nula es que pj h=0 y se aplicara el test de esfericidad de
Bartlett cuyo estadstico tiene una distribucin Chi-cuadrado con p(p -1)/2 grados de
libertad.
En nuestro caso Salida SPSS 4nos da un estadstico de 230'666 con un p-valor
(significancia) del 0'000000 lo que nos indica que rechazamos la Hiptesis Nula.
Tambin aparece en la salida del spss una medida de adecuacin que compara los
coeficientes de correlacin con los coeficientes de correlacin parcial . Este estadstico es el
proporcionado por Kaiser, segn l, los valores inferiores a 0'70 pondran de relieve lo

Prof: Salvador Carrasco Arroyo Universidad de Valencia

inadecuado de la utilizacin de las variables de que se traten. En nuestro caso dicho valor es
de 0'717.
Inverse of Correlation Matrix:

PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

PENS

DES

OPRS

EDUC

SAN

22,94370
-2,01927
-5,06478
-28,66266
-4,56209
1,78835
-2,78730
24,36168
-17,39909
2,68617
-4,58024

11,13618
-3,67236
-13,72370
,55158
,78053
1,07989
8,21718
-5,54317
-2,16173
3,55015

8,84027
22,04889
-1,98089
-,78252
,59175
-14,24779
8,53567
3,79492
-3,68961

84,63455
-3,89483
-9,30349
1,78700
-58,43419
40,16325
7,10312
-6,49806

8,91906
,74030
-,77873
-3,76611
3,15142
-2,74225
4,83670

VIV

DENSN

CONVE

COBER

ICONFSOC

6,86948
1,12147
8,57869
-8,25976
-3,36645
3,88812

3,27674
-3,63370
2,48621
,92623
-2,44434

57,99599
-42,89410
-10,79163
11,16099

35,14299
8,11177
-7,48974

27,90220
-30,08222

TCONFSOC
TCONFSOC

36,50848

Kaiser-Meyer-Olkin Measure of Sampling Adequacy = ,71705


Bartlett Test of Sphericity = 230,66006, Significance =

,00000

Salida SPSS 4: Inversa de la matriz de correlacin y medidas de adecuacin


Una vez clarificada la adecuacin del Acp procedemos a realizar dicho anlisis a
travs del paquete SPSS
A continuacin extraemos las componentes principales de las variables:

Prof: Salvador Carrasco Arroyo Universidad de Valencia

10

Initial Statistics:
Variable

Communality

PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000

*
*
*
*
*
*
*
*
*
*
*
*
*

Factor
1
2
3
4
5
6
7
8
9
10
11

Eigenvalue
6,91013
1,84595
1,03883
,51896
,25568
,17269
,12220
,07339
,04088
,01576
,00552

Pct of Var
62,8
16,8
9,4
4,7
2,3
1,6
1,1
,7
,4
,1
,1

Cum Pct
62,8
79,6
89,0
93,8
96,1
97,7
98,8
99,4
99,8
99,9
100,0

Salida SPSS 5: factores extrados, valores propios y porcentaje de variabilidad total


explicada
Donde la segunda columna recoge las comunalidades, cuyo significado se
expondr en el tema referente al anlisis Factorial. Como puede verse, cuando se consideran
todas las componentes principales, la comunalidad toma el valor 1, que indica que con todos
los componentes se explica totalmente la varianza de todas y cada una de las variables
objeto del estudio. Sin embargo si empleremos todas ellas no reduciramos el espacio en
que nos queremos mover y tendramos tantas componentes como variables originales.
En la tercera columna tenemos los valores propios (autovalores), tiene sentido
interpretar cada uno comovarianza de la componente, sino tambin como la parte de la
varianza que el K-esimo eje principal explica y el ratio (valor propio/ n de componentes)
como ndice de la importancia de esta componente en una descripcin del conjunto de
variables originales.
En nuestro caso, a la primera componente le corresponde el valor propio
(autovalor) 6'91, lo que supone que sobre sta se proyecta el 62'8 % de la varianza total.
De hecho si observamos el cuadro vemos que con las tres primeras componentes
explicamos el 89 % de la variabilidad de las variables originales.
El problema se plantea ahora es cuantas componentes retener. Esto depende del
numero de variables originales, de la magnitud de las correlaciones R, del estudio de la
significacin estadstica de las componentes y ,sobre todo, de la experiencia y conocimiento
que el investigador posea sobre las variables que ha considerado.
Existen varios procedimientos expuestos en la parte terica, sin embargo, la regla
analtica que utiliza por defecto el SPSS es retener aquellas componentes cuyo valor propio
sea mayor que 1, es la llamada regla de Kaiser. Ya que la varianza a explicar por las
componentes es igual al numero de variables, por puro azar a cada componente le
corresponde un valor propio de 1. La regla de Kaiser se basa en retener las componentes
con valor propio mayor del que tendra por puro azar.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

11

El SPSS nos muestra el grfico de sedimentacin (fig. 4) . En dicho grfico se


observa que a continuacin de los valores propios 1 y 2, hay un cambio de tendencia
suavizndose la grfica. Con arreglo al grfico de sedime ntacin no estara claro donde se
alcanza el punto de corte, pudiendo realizarse tanto a la componente 2 como a la
componente 3.

Grfico de sedimentacin
8

Valor Propio

2
0
1

10

11

Nmero de factor
Fig. 4: Grfico de Sedimentacin de las 10 componentes
Siguiendo la recomendacin expuesta anteriormente de escoger tres componentes
obtenemos la salida de SPSS siguiente:
Variable

Communality

PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

,91992
,88946
,87320
,97475
,88056
,84120
,91791
,91403
,85773
,83781
,88834

*
*
*
*
*
*
*
*
*
*
*
*
*

Factor
1
2
3

Eigenvalue
6,91013
1,84595
1,03883

Pct of Var
62,8
16,8
9,4

Cum Pct
62,8
79,6
89,0

Salida SPSS 6: Comunalidades y Factores extrados


En la tabla siguiente obtenemos la matriz de vectores propios, matriz V ,
(autovectores) o como la llama el SPSS, Factor Matrix. En nuestro caso solo nos muestra tres
componentes cuyos elementos son los coeficientes de correlacin entre las componentes y
las variables originales tipificadas.
Las variables aparecen ordenadas de acuerdo con el valor absoluto de los
coeficientes de correlacin con las sucesivas componentes. As en primer lugar aparece
EDUCACION y DESEMPLEO, que son las que tienen mayor coeficiente de correlacin con
la componente 1 y as sucesivamente.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

12

Factor Matrix:
Factor

Factor

Factor

EDUC
DES
PENS
VIV
SAN
TCONFSOC
CONVE
COBER
ICONFSOC
OPRS

,92761
,92183
,85205
,84177
,83764
-,83417
,80918
,79597
-,79033
-,65295

,33305
,13409
,42436
-,20355
,35680
,43570
-,08318
-,31090
,45858
-,39949

-,05795
-,14735
-,11773
-,30198
,22718
-,05173
,50233
,35707
-,05373
,53597

DENSN

-,16894

,83960

,42947

Salida SPSS 7: Matriz Factorial


Observamos que automticamente la salida del SPSS nos muestra una separacin
entre el conjunto de variables y la variable DENSN, a simple vista podemos indicar que la
correlacin existente entre esta variable y la primera componente (que es la que explica
mayor varianza del conjunto de variables originales) es muy pequea. Si nos fijamos en la
tabla siguiente observaremos que justamente el nivel de significacin del coeficiente de
correlacin de dicha variable nos indicaba que tenia escasa correlacin con el restante del
conjunto de variables.
1-tailed Significance of Correlation Matrix:
' . ' is printed for diagonal elements.
PENS
,
,00000
,00011
,00000
,00000
,00065
,25808
,00474
,01039
,01198
,00900

DES

OPRS

EDUC

SAN

PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

,
,00058
,00000
,00001
,00003
,29869
,00112
,00142
,00056
,00023

,
,00002
,00739
,00129
,47815
,10304
,12975
,10162
,06313

,
,00000
,00012
,36375
,00012
,00187
,00378
,00131

,
,00768
,17276
,00012
,00443
,00568
,00233

VIV
,
,02886
,00280
,00019
,00065
,00019

DENSN

CONVE

COBER

ICONFSOC

VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

,
,46531
,15185
,03764
,03567

,
,00000
,00245
,00070

,
,00064
,00026

,
,00000

TCONFSOC

TCONFSOC
,

Salida SPSS 8: Matriz de adecuacin

El hecho que hayamos escogido tres componentes y, por tanto, expliquemos el 89


% de la varianza total hace que a la hora de obtener la matriz de correlaciones reproducida

Prof: Salvador Carrasco Arroyo Universidad de Valencia

13

(Salida SPSS 9) aparezca dividida en tres partes, en la diagonal principal tiene las
comunalidades , en la parte superior los residuos y en la inferior las correlaciones
reproducidas.
Resulta muy interesante comparar la matriz R original con la reproducida. La matriz
de residuos ( parte superior de la diagonal) seria nula, si utilizsemos las 11 componentes. Si
en la observacin de estas tablas nos centramos en los elementos de la diagonal principal,
estamos siguiendo un criterio adecuado del ACP; y si, por el contrario, nos fijamos en los
exteriores a la diagonal, la evaluacin correspondera al modelo de Anlisis Factorial.
Una vez estudiada la situacin de cmo aparecen las componentes y porque
escogemos tres componentes, retomamos la matriz factorial (factor matrix). Si observamos
dicha matriz veremos que la mayora de los coeficientes de correlacin con la primera
componente son muy elevados y positivos y el resto de los factores son bipolares con
valores pequeos. Esto ocurre cuando se eliminan componentes, haciendo que la matriz sea
de poco inters. Como el objetivo general del ACP es hallar grupos de variables, grupos que
se identifican por las variables con coeficientes de correlacin altos (en valor absoluto) en
determinados componentes, no es adecuado tener una primera componente en el que la
mayora de las variables tengan los coeficientes positivos altos.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

14

Reproduced Correlation Matrix:


PENS
DES

OPRS

EDUC

SAN

PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

,91992*
,85969
-,78897
,93853
,83838
,66640
,16179
,59502
,50423
-,47248
-,51977

,02945
,88946*
-,73445
,90830
,78653
,79317
-,10643
,66076
,63945
-,65915
-,70292

,06719
,07542
,87320*
-,76979
-,56771
-,63017
,00508
-,22589
-,20415
,30405
,34288

-,01487
-,00754
-,00848
,97475*
,88268
,73054
,09804
,69380
,61411
-,57728
-,62568

,00226
,00086
,04383
-,00180
,88056*
,56387
,25563
,76225
,63693
-,51061
-,55503

PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

VIV
-,01265
-,03112
,00766
-,01112
-,04247
,84120*
-,44280
,54638
,62548
-,74239
-,77524

DENSN
-,01172
-,01588
-,01781
-,01717
-,03897
,02233
,91791*
,00919
-,24215
,49546
,48452

CONVE
-,04311
-,03159
-,06177
,02394
-,04203
,03600
-,03130
,91403*
,84931
-,70466
-,73722

COBER
-,00350
-,02155
-,05351
-,01013
-,08084
,07728
-,01461
,06494
,85773*
-,79084
-,81790

ICONFSOC
-,01809
-,00129
-,01466
,01184
-,03016
,08867
-,06597
,08784
,10802
,83781*
,86185

PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

TCONFSOC
,00906
,00752
,00157
,00397
-,03741
,07204
-,04969
,05864
,09941
,11191
,88834*

The lower left triangle contains the reproduced correlation matrix; the
diagonal, reproduced communalities; and the upper right triangle residuals
between the observed correlations and the reproduced correlations.
There are
15 (27,0%) residuals (above diagonal) with absolute values > 0.05.

Salida SPSS 9: Matriz de correlacin reproducida


Lo que si tiene inters son los coeficientes de correlacin rotados. La rotacin
redistribuye estos coeficientes consiguiendo, en general, que des aparezcan los factores
bipolares. Normalmente se emplea la rotacin Varimax, que tiene como objetivo la
simplicidad factorial. Para cada componente el criterio Varimax trata de obtener los
coeficientes mas altos posibles (cerca de +1 o -1) o los mas bajos posibles (cerca de 0), de
manera que las variables tengan o bien mucha relacin o bien muy poca relacin con las
componentes.
En nuestro caso, ver tabla, produce el efecto deseado ya que tenemos ordenadas
las variables de mayor a menor correlacin y separada por bloques. Si observamos la matriz

Prof: Salvador Carrasco Arroyo Universidad de Valencia

15

de correlacin rotada vemos que a la componente 1 se le han asignados las variables de


ndole econmico, es decir, todas las variables originales que conforman partidas
presupuestaria de gasto como: EDUCACIN, PENSIONES, DESEMPLEO, SANIDAD,
VIVIENDA y OTRAS PRESTACIONES SOCIALES con la salvedad de que todas estn
correlacionadas positivamente menos la variable Otras Prestaciones Sociales, seguramente
porque este capitulo presupuestario es un cajn de sastre donde se introduce todas las
gastos posibles futuros sin especificacin presupuestaria concreta.
En la segunda componente, aparece el segundo bloque (grupo de variables muy
correlacionadas) formado por variables de ndole laboral, como son CONVE (Trabajadores
afe ctados por convenios laborales), COBER ( Tasa de Cobertura de Negociacin Colectiva),
TCONFSOC (Tasa de Conflictividad laboral) y ICONFSOC (Indice de jornadas laborales no
Trabajadas). Este grupo de variables esta caracterizado por la oposicin de las variables tipo
negociacin y convenio frente a las otras dos variables que reflejan movilidad de los
trabajadores ante la situacin laboral.
VARIMAX converged in 6 iterations.
Rotated Factor Matrix:
Factor 1
Factor

Factor

OPRS
PENS
EDUC
DES
SAN
VIV

-,92726
,87239
,84779
,78398
,65692
,62828

,02222
,38575
,50396
,49812
,62467
,43788

,11357
,10029
,04513
-,16345
,24251
-,50470

CONVE
COBER
TCONFSOC
ICONFSOC

,27163
,21520
-,32726
-,28383

,91530
,87553
-,73497
-,71274

,04968
-,21179
,49099
,49926

,10899

-,07381

,94899

DENSN

Salida SPSS 10: Matriz factorial rotada : Varimax


Por ultimo, el tercer grupo de variables con una correlacin mu y alta es el que
constituye la variable DENS (Tasa de Densidad Neta de Afiliacin) que nos marcara la
importancia de afiliacin de los trabajadores a sindicatos, con capacidad de movilizar a los
trabajadores, firmar convenios y reivindicar mayores partidas presupuestarias de gasto.
Un examen detallado de la matriz rotada hace posible saber que variable contribuye
a la explicacin del factor., pinsese que nuestro objetivo original era encontrar unas nuevas
variables (componentes) en numero menor que las originales que explicasen la mayor
varianza total, en nuestro caso 3 frente a las 11 originales.
El problema reside ahora en darle nombre a las componentes, para ello basta
observar que variables contribuyen mas a la configuracin de cada una de ellas. En nuestro
caso estn muy diferenciados los tres bloques, a la primera componente podemos llamarle
componente ECONOMICA a la segunda SOCIOLABORAL y a la tercera SINDICAL.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

16

Antes de adentrarnos en las representaciones grficas de los individuos y


variables en los planos factoriales nos faltara hacer referencia a la matriz de coeficientes de
puntuaciones de los factores ( Factos Score):
Factor Score Coefficient Matrix:

Factor
PENS
DES
OPRS
EDUC
SAN
VIV
DENSN
CONVE
COBER
ICONFSOC
TCONFSOC

,26173
,20071
-,43329
,21511
,07735
,17059
,01652
-,18065
-,17740
,07567
,06384

Factor

Factor

-,05694
-,02344
,34053
,00316
,17293
-,07744
,12637
,41514
,35657
-,18505
-,18454

,09566
-,04855
,13509
,08602
,25296
-,27641
,60178
,21115
,03414
,19366
,18609

Salida SPSS11: Matriz de coeficientes scores


Estos coeficientes establecen la contribucin de cada variable especifica a cada
componente de manera que podemos expresar las componentes como combinacin lineal de
las variables originales, segn el siguiente sistema de ecuaciones:

y las puntuaciones de los 21 individuos (aos) en estas tres nuevas variables se obtendran
sustituyendo las variables (xj) por las correspondientes puntuaciones estandarizadas
recogidas en la Tabla 2. As obtendramos las coordenadas de los individuos en los planos
factoriales.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

17

PERIODO
1975

Comp 1
-3,00498

Comp 2
0,99295

Comp 3
0,09904

1976
1977

-2,01156

0,07323

0,59653

-0,2039

-2,85055

0,07329

1978

-0,17059

-1,14513

1,78336

1979

0,10558

-1,60709

1,95209

1980

-0,40546

-0,12069

-0,4586

1981

-0,03691

-0,90476

-0,98982

1982
1983

-0,74273
-0,54682

0,44654
0,27811

-0,97176
-0,88305

1984

-0,43396

0,07586

-0,89786

1985

0,93784

-0,32998

-1,29955

1986

0,87448

-0,32559

-1,37327

1987

0,67169

-0,06751

-0,84785

1988

0,66794

-0,31745

-0,3195

1989
1990

0,51225
0,30619

0,15127
0,68525

-0,4937
-0,20297

1991

0,31933

0,84062

0,44711

1992

0,65492

1,02209

1,13603

1993

0,96285

1,2544

1,02165

1994

0,98368

0,80692

1,24819

1995

0,56017

1,04151

0,38064

Salida SPSS12: Coordenadas de los individuos en los factores


La primera representacin grfica seria justamente la de los individuos en los
planos factoriales. Parece importante resaltar si se a la hora de representar grficamente se
debe hacer en las tres dimensiones o en dos. Siempre es mas interpretable visualmente la
representacin en dos dimensiones. En nuestro caso y debido a que las dos primeras
componentes explican el mayor porcentaje de variabilidad, representaremos los individuos
en dichos ejes factoriales. No obstante nos parece interesante plasmar las tres posibles
combinaciones para representar tanto los individuos (aos) como las dos variables
dicotmicas (IZQ, ACUEDOC).

INTERPRETACION DE LOS GRAFICOS


Existe una mxima estadstica, con la que estamos totalmente de acuerdo, que
afirma que conocer ol s fundamentos tericos de un procedimiento estadstico es una
condicin necesaria, pero no suficiente para poder aplicar de forma correcta un anlisis, y lo
que es mas importante, para ser capaz de aprovechar el caudal de informacin que dicho
anlisis puede proporcionarnos.
Por otra parte, la facilidad de obtener a travs de los paquetes informticos puede
tentar la obtencin de brillantes resultados estadsticos sin apenas conocer los
fundamentos tericos del anlisis que supuestamente hemos realizado . Este hecho se
produce con bastante frecuencia en la interpretacin de los mapas o grficos que
obtenemos cuando realizamos un anlisis factorial. La lectura de las grficas debe ser

Prof: Salvador Carrasco Arroyo Universidad de Valencia

18

extraordinariamente prudente, y a la hora de realizar la interpretacin de las mismas han de


tenerse en cuenta muchos aspectos como la importancia de los ejes factoriales, contribucin
de las variables o individuos,....
La experiencia general del analista y sus conocimientos sobre el fenmeno
estudiado permite verdaderamente dar un sentido a los hechos estadsticos y por tanto
explicarlo de una forma mas clarificadora. Hecho que se produce cuando se le da el nombre a
la componente o se interpretan los planos factoriales y la distribucin de los individuos y
variables en dichos planos.
En la interpretacin de un ACP es conveniente seguir un orden:
1.
2.
3.
4.

Interpretacin de los factores en funcin de su correlacin con las variables.


Interpretacin de la nube de variables
Interpretacin de la nube de individuos
Interpretacin simultanea de individuos y variables.

Interpretacin de los factores en funcin de su correlacin con las variables.


Una componente es una variable que no se puede medir directamente, sino que se
construye a travs de las variables originales (entrada). El factor es, por tanto, un
agrupamiento de estas variables y se interpreta a partir de su correlacin con las variables
originales. Esta correlacin es precisamente la proyeccin de la variable sobre el factor.
Si una variable esta muy correlacionada con un factor tendr una coordenada muy
alta prxima a +1 1. Los puntos de mayor coordenada son los que mas contribuyen a la
formacin del eje, luego cuanto mayor sea la coordenada(mayor distancia al eje) de una
variable sobre un eje, mayor peso tiene en la explicacin del eje.
Antes de entrar a explicar cada un de los factores que constituyen nuestro anlisis,
es necesario hacer resaltar que las dos primeras componentes explican el comportamiento o
variabilidad de las variables originales en su conjunto en un 80 %, que la primera
componente (gastosocial econmica) explica el 63% frente a la segunda componente que
explica el 17% del comportamiento de las variables. Es decir, la componente econmica
explica casi 4 veces ms el comportamiento del conjunto de las variables entre el ao 1975 y
1995 que el factor sociolaboral (2 factor). Esto hace pensar que a la hora de interpretar
existe un claro dominio del gasto social en sus diferentes captulos presupuestarios para
justificar el comportamiento del resto de varia bles.
Por todo ello nosotros vamos a proceder a la interpretacin, en su conjunto, en
base a los dos primeros factores y los planos que ellos generan.
Si observamos la SALIDA SPSS 10 (Matriz Factorial Rotada) vemos como las
variables con mayor correlacin son las variables de gasto social (econmica). En dicha
tabla el gasto en pensiones, desempleo y gasto en educacin son las que mas contribuyen a
la formacin del eje, junto con Otras Prestaciones Sociales que aparece con signo negativo,
tal vez porque su comportamiento como partida presupuestaria es polivalente donde no
est especificada una asignacin finalista. El desempleo y el gasto sanitario serian las otras
dos variables que justifican el comportamiento de este primer factor.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

19

VARIMAX converged in 6 iterations.


Rotated Factor Matrix:
Factor 1
Factor

Factor

OPRS
PENS
EDUC
DES
SAN
VIV

-,92726
,87239
,84779
,78398
,65692
,62828

,02222
,38575
,50396
,49812
,62467
,43788

,11357
,10029
,04513
-,16345
,24251
-,50470

CONVE
COBER
TCONFSOC
ICONFSOC

,27163
,21520
-,32726
-,28383

,91530
,87553
-,73497
-,71274

,04968
-,21179
,49099
,49926

,10899

-,07381

,94899

DENSN

Una forma de medir las aportaciones de cada variable a la inercia(varianza) del eje
es a travs de las contribuciones absolutas, donde se mide la proporcin de la varianza
explicada por un factor debida a una variable original y que matemticamente seria:

CTA ( j ) =

G2 ( j )

G (j)
2

Donde

G ( j ) = X ' v1 = 1 u1
As tenemos que las contribuciones de cada variable a explicar la variabilidad del factor 1 o 2
se expresan en el siguiente cuadro:
CONTRIBUCIONES ABSOLUTAS

educ
des
pens
viv
san
tconfs
conve
cober
inconfs
opres
densn

FACTOR 1 FACTOR 2
12,5%
6,0%
12,3%
1,0%
10,5%
9,8%
10,3%
2,2%
10,2%
6,9%
10,1%
10,3%
9,5%
0,4%
9,2%
5,2%
9,0%
11,4%
6,2%
8,6%
0,4%
38,2%

Hay que sealar que estas contribuciones se han calculado sobre la matriz de
saturaciones sin rotar (La rotacin por el mtodo varimax se ha explicado con anterioridad).

Prof: Salvador Carrasco Arroyo Universidad de Valencia

20

En ella vemos como las variables que componen mayoritariamente el capitulo presupuestario
gasto social son las que explican el primer factor (econmico), sobre todo el gasto en
educacin con un 12,5% y el gasto en desempleo con un 12,3% . En el caso de las
contribuciones al segundo factor son las variables TCONFS y INCONFS las que mayor
aportacin realizan. La razn de que la variable DENSN (afiliacin a sindicatos) no sea
valorada ya se explico (tenia poca relacin con las dems y su aplicacin vendra referida
respecto al tercer factor).
Igualmente respecto al segundo factor (sociolaboral) las variables con mayor
correlacin( tabla sppss 10) son CONVE (0,91) y COBER(0,87) frente a la TCONFS (-0,73) y
CONFS (-0,71). Vemos como se contraponen las variables que hacen referencia a la
negociacin colectiva frente a las variables que expresan conflictividad social. Tambin
habra que hacer especial mencin a la variable Gasto Sanitario (SAN) que aunque no es
prioritaria para la construccin de este factor si tiene cierta relevancia en la componente
sociolaboral.

Interpretacin de la nube de variables


El conjunto de variables proporciona una perspectiva que caracteriza -resalta los
rasgos fundamentales - el sistema original de p variables, teniendo en cuenta las relaciones
existentes.
Las variables estarn inscritas en un circulo de radio la unidad centrado en el
origen del espacio definido por las dos primeras componentes, siendo su distancia al origen
la proporcin de varianza explicada de la variable original (comunalidad) por ambas
componentes.
As tenemos que en la tabla (Salida SPSS 6) se expone las comunalidades de las
variables en funcin de las tres componentes, esto se representara en un grfico
tridimensional de las saturaciones:

Prof: Salvador Carrasco Arroyo Universidad de Valencia

21

Grfico de saturaciones en espacio factorial rotado

1,0

pensiones
gasto en
educacion
desempleo
g. sanidad
gast. vivienda y otr
trabajadores afectad

,5 tasa de cobertura de
Sociolaboral

ta sa de densidad net

0,0
jornadas
no trabajad
tasa de conflictivid

-,5
otras prestac iones s

-1,0
1,0 ,5
0,0 -,5
Econmico

1,5
,5 1,0
-,5 0,0
Sindical

Al hacerlo en un grfico bidimensional (fac 1 fac 2) perdemos informacin,


aunque debido a la poca importancia del factor 3 las comunalidades serian muy parecidas
(prximas) y nos indicara el porcentaje de la variabilidad (comportamiento de la variable)
explicada por los dos factores conjuntamente. En nuestro caso los factores econmico y
sociolaboral explican mas del 80% del comportamiento de las variables (ver tabla 6) llegando
a explicar en algunas de ellas hasta el 90% de su comportamiento.
Es de resaltar si vemos el grfico bidimensional en el que se nos presentan las
variables en el espacio de las dos primeras componentes cinco nubes de variables repartidas
entre los cuatro cuadrantes.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

22

Grfico de saturaciones en espacio factorial rotado


1,0

pensiones
gasto en educ aci on
desempleo
sanidad
gast. vivi enda yg.otr

,5
trabajadores af
tasa de c obertura
tas a de densidad net

Econmico

0,0
jornadas no trabajad
tasa de conflictivid

-,5
otras prestac iones s

-1,0
-1,0

-,5

0,0

,5

1,0

Sociolaboral
La variable DENSN densidad neta de afiliacin, indicador de afiliacin de los
trabajadores a sindicatos esta mal representada y no es significativa debido a los dos
factores en los que se representa, esta variable monopoliza el tercer factor.
Las variables que configuran el capitulo presupuestario gasto social esta muy
definido, por un lado se agrupan todas las partidas de gasto a excepcin de Otras
Prestaciones Sociales, habra que ver que contenido tiene esta partida para poder justificar
su comportamiento. La nube 1 es ta prxima a la nube 2 lo que puede determinar una
semejanza en el comportamiento o influencia mayor entre ambas nubes. Es decir una
influencia entre el gasto social y las negociaciones por convenios.
Por otro lado la nube 4 esta mas prxima a la 5. Es decir, parece existir una relacin
,influencia o semejanza entre ambas nubes que relacionan las variables que hacen referencia
a la conflictividad laboral con la partida de gasto de otras prestaciones sociales. Desde esta
perspectiva conjunta de variables puede interpretarse que las reinvindicaciones va
conflicto son menos positivas que las demandadas va negociacin cara a obtener una
mayor consignacin presupuestaria en el capitulo de gasto social. Esto vendra avalado por
el comportamiento antagnico de las variables de conflicto frente a las negociadoras.

Interpretacin de la nube de individuos


A diferencia de lo que sucede con la nube de variables, los individuos estn
equilibradamente distribuidos alrededor del origen, puesto que el anlisis se realiza con
respecto al centroide que representa al individuo medio, en nuestro caso el ao medio.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

23

Este anlisis de componentes principales tiene una significativa particularidad, y es


que, para nosotros el individuo es UN AO y por tanto tiene una doble significacin: por
un lado, podemos analizar el comportamiento esttico de cada individuo, por otro, ver la
evolucin a lo largo del periodo 75 95.
Tambin seria necesario hacer mencin que debido a esta particularidad, no solo el
individuo es el ao sino adems sabemos que en dicho ao exista un tipo de gobierno
(conservador progresista) y se realizaron o no acuerdos sociales. Todo esto nos plantea
una visin muy extensa y que como toda interpretacin existen diferentes visiones segn el
analista que la examina: la puramente estadstica y la poltico-econmica. Es en esta visin
poltica, la que a travs del conocimiento de los hechos producidos en este periodo, donde
debemos justificar el comportamiento de los individuos(aos). Solo en un sentido general al
anlisis y al periodo que analizamos hay que dejar patente que el periodo 75-95 engloba la
salida de una dictadura, con la problemtica propia del hecho, la legalizacin de partidos
polticos y confederaciones sindicales, etc.. que van a marcar este periodo de transicin y
consolidacin de un estado democrtico..

Dispersion de los individuos ( aos) en los F1 , F2


2
1985
1986
1988 1987

FACTOR ECONOMICO

1
1979

1977

1994
1989

1993

1992
1995
19901991

1978 1981
198019841983
1982

-1
1976

-2

1975

-3
-4
-3

-2

-1

FACTOR 2 SOCIOLABORA L
Si analizamos el grfico en funcin de los factores podemos interpretar que:
respecto al primer factor (gasto social) divide la nube de individuos en dos partes
contraponiendo aquellos aos que tienen una relacin positiva con este factor econmico
(1 y 4 cuadrante) frente a los aos que la relacin es negativa (2 y 3 cuadrante) esto
supone un comportamiento opuesto de estos individuos(aos -signo politico). Respecto al
segundo factor (sociolaboral) opone el cuadrante 1 y 2 al 3 y 4 de esta forma los aos 75
a 84 tienen un comportamiento opuesto a los aos 85 95 .

Prof: Salvador Carrasco Arroyo Universidad de Valencia

24

Parece muy interesante comprobar en un mismo grfico la evolucin de los aos y


los equipos de gobierno como se van situando en los cuadrantes y como van
evolucionando hasta situarse en el primer cuadrante. Si observamos el grfico RRRR
podemos ver como partiendo del ao 1975 (final de la dictadura- partido conservador ) se
van acercando a la zona positiva donde la negociacin va consiguiendo mejoras en
prestaciones sociales. Es patente en este grfico como los gobiernos sucesivos van
acercndose a una reinvindicaciones sociales va negociacin.

Dispersion de los individuos ( aos) en los F1 , F2


2
1985
1986
1988 1987

FACTOR ECONOMICO

1
1979

1977

1994
1989

1993

1992
1995
19901991

1978 1981
198019841983
1982

-1
1976

-2

1975

-3
-4
-3

-2

-1

FACTOR 2 SOCIOLABORA L
Llegados a este punto realmente es necesario ahondar en cada ao para justificar el
comportamiento de cada individuo. Desde nuestro anlisis para seguir con nuestra
investigacin es necesario contemplar simultneamente los grficos de individuos y
variables llegando de esta forma a interpretar la evolucin correctamente.
Interpretacin simultanea de individuos y variables

Es til representar sobre l mismo grfico las nubes de puntos de individuos y


variables superpuestos (para ello se suele multiplicar las coordenadas de los individuos por
un coeficiente c para que estn en la misma escala). La disposicin de los puntos variables
en proyeccin permite interpretar la nube de puntos individuo.
El factor 1 combina las caractersticas que significan recurrir a los captulos de
gasto social a la vez que la negociacin oponiendo los aos que toman valores altos, en
estas caractersticas, frente a los aos que tienen valores bajos. De abajo a arriba ordena los
aos de menor a mayor bienestar social.

Prof: Salvador Carrasco Arroyo Universidad de Valencia

25

El segundo eje esta muy correlacionado con las caractersticas que constituyen
signos de conflictividad, oponiendo aquellos aos de mayor a menor conflictividad.
En el 1 Cuadrante F1 >0 los aos situados en l (1989-1995) vienen caracterizados
por la cercana a las variables que representan gasto social y negociacin recursos
utilizados por gobiernos progresistas que determinan un mayor estado del bienestar. Este es
el cuadrante propio del Estado del Bienestar. A dems F2 >0 tasas de conflictividad baja.
Tercer cuadrante F1 <0 y F2 <0 es la anttesis de bienestar. Caracterizado por una
poca de conflictos laborales y una respuesta gubernamental de poco gasto social, tan solo
existe una cercana a emplear el capitulo presupuestario Otros Gastos Sociales.
En el segundo cuadrante F1 >0 y F2 <0 y cuarto cuadrante F1 <0 y F 2 >0 son fases
propias de transicin a un estado de bienestar inicia un decrecimiento de la conflictividad
social, la expansin del gasto y comienza las negociaciones.
Para completar el anlisis si consideramos el comportamiento medio de las
respuestas produc idas durante los aos que hubieron partidos conservadores y producidas
por la nube de aos de los gobiernos progresistas, localizamos en el eje de coordenadas el
centro de la nube de individuos (CONSERVADOR) y el centro de la nube de individuos con
gobierno PROGRESISTA. Observaremos claramente como en nuestro anlisis, el
comportamiento de las variables:

En un gobierno conservador se caracteriza por una poca de reinvindicaciones


y conflictividad
En un gobierno progresista se caracteriza por un estado de negociaciones y
una poltica expansiva de gasto social.
Centro de la nube de individuos segn Tipo de Gobierno

2
F1 >0
F2 <0
2 Cuad.

F1 <0
F2 >0
4 Cuad.

198
19856
198 8 1 987

1 993
19 92
19 95

1989
P ROGR .
19 9019 91

1979

199 4

1 978 1 981

1 977

19 8019 84
CONS

19 83
19 82

F 1 Econmico

-1
F1 <0
F2 >0
4 Cuad.

19 76

-2
F1 <0
F2 <0
3 Cuad.

-3
-4
-3

197 5

-2

-1

F2 Sociolaboral

Prof: Salvador Carrasco Arroyo Universidad de Valencia

26

G r fico d e sa tu ra cion es e n es pac io fa ct orial ro ta do


2 ,0
g.g.g.
pensiones
educacion
desempleo
g. sanidad
g. vivienda
trab. afect.deconveni
t.cobertura
negoc
tasa afiliacion
ind.
jorn. no trabaj
t.conflictividad

1 ,0
0 ,0

g. otras prestacione

-1 ,0

Factor 1

-2 ,0
-3 ,0
-4 ,0
-3, 0

-2, 0

-1 ,0

0, 0

1,0

2, 0

F act o r 2

Prof: Salvador Carrasco Arroyo Universidad de Valencia

27

También podría gustarte