Está en la página 1de 19

ANLISIS DE CORRESPONDENCIAS SIMPLE

Estudio de tablas de contingencia, para juzgar objetos segn un cierto


nmero de criterios.
Matriz de datos de orden (n*p):Tabla de doble entrada.
Filas: n modalidades de la variable A Columnas: p modalidades de la variable B.
Interseccin kij: frecuencia conjunta entre las modalidades i y j.

Mtodo:
Simtrico con relacin a lneas y columnas.
Deber permitir comparar las distribuciones de frecuencias.

Transformaciones en la matriz de datos

1
.
.
.
.
.
.
.
j
.
.
.
.
.
.
.
p
1.
i. Kij
n

PerfildelneasenR

fij

fij/fi
n

PerfildelneasenR

fij/fj
ANLISIS DE CORRESPONDENCIAS SIMPLE

Nube de puntos
Transformaciones a realizar: Iguales en ambos subespacios, llevando a
transformaciones analticas diferentes.
Perfil de lneas en Rp
f ij
f i.

k ij
k i.

siendo f i.

k i.
k

j 1,2,.....p

Perfil de lneas en Rn
f ij
f.j

k ij
k .j

siendo f.j

k .j
k

i 1,2,....n

p y n puntos de las nubes, situados en subespacios de p-1 y n-1


dimensiones.
Centro de gravedad: media de perfiles de frecuencias afectados por sus
masas
n
f ij
f i.

i 1

f i.

f.j

ANLISIS DE CORRESPONDENCIAS SIMPLE

Distancia Chi-cuadrado
f i j 2
f ij 2
1 f ij
1 f ij
2
) d (j, j ) = ( )(
)
d (i,i ) = ( )(
f j fi
f i
fi f j
f j
2

Propiedades:

Equivalencia distribucional
Permite agregar dos modalidades de idnticas frecuencias de una
variable, en una nueva modalidad afectada por la suma de sus masas,
sin cambiar nada, ni en las distancias entre modalidades de esta
variable o de la otra.

Relaciones de transicin
Ligan grficamente las dos variables representadas en lneas y
columnas.

ANLISIS DE CORRESPONDENCIAS SIMPLE

Obtencin de los ejes factoriales


Se toma como columnas la dimensin ms pequea.
Dos transformaciones: en el perfil de lneas y de las columnas.
Maximizar la suma ponderada de los cuadrados de las proyecciones
sobre el eje:

2
Max fi.d (i, O)

u i

Matriz a diagonalizar
n

s jj

f ijf ij
ff

i 1 i .j

Despus de descartar el valor propio trivial igual a 1 y su vector propio


asociado, retenemos los p-1 valores propios no nulos y sus vectores
propios asociados. Obtendremos como mximo p-1 ejes factoriales.
ANLISIS DE CORRESPONDENCIAS SIMPLE

Normalizacin
Cannica: Si se desea examinar conjuntamente las diferencias
o similitudes entre dos variables.
Principal: Si se desea examinar las diferencias o similitudes
entre categoras de variables, pero por separado.
Principal por filas: Si se desea averiguar cmo difieren entre s
las distintas categoras de la variable fila.
Principal por columnas: Si se desea averiguar cmo difieren
entre s las distintas categoras de la variable columna.

ANLISIS DE CORRESPONDENCIAS SIMPLE

Anlisis
Valores propios. Inercia total
p 1

k I Contraste de independencia
2

2
I
k

Coordenadas: Proyecciones de los puntos filas en los ejes factoriales


Contribuciones a la inercia de puntos a varianza explicada en cada eje
f i. i2
Cr (i)

Correlaciones: Contribucin de dimensiones a la inercia de cada punto


Cos 2 (i)

d 2 (i, G)
i2
2

d (i, G) d 2 (i, G)

ANLISIS DE CORRESPONDENCIAS SIMPLE

Interpretacin de representacin simultnea


Filas (columnas) con estructura similar, situacin prxima en el plano.
Cercana punto fila i y columna j: interpretar si estn alejados del origen.
Lnea con perfil prximo al medio, se encontrar prxima al origen.
Buscar los puntos de mayor Contribucin absoluta de las inercias. Se
separa los que se proyectan del lado positivo de los del lado negativo.
Estudiar la calidad de representacin (correlacin) de los puntos.
Correlacin pequea: tiene un papel importante sobre otro eje.
Se buscan aquellos puntos i(j) que si bien no contribuyen a la formacin
del factor, s se encuentran bien representados (correlacin alta).
ANLISIS DE CORRESPONDENCIAS SIMPLE

Caso: Forma jurdica de las empresas exportadoras


canarias y su propensin a exportar
Estudio sobre la relacin entre formas jurdicas de las empresas exportadoras canarias y su propensin a exportar (volumen de exportaciones/volumen de negocios).
Datos: Base de Datos de CAMERDATA en 1990. Informacin sobre 36020 empresas exportadoras espaolas. 693 son de la C. A. de Canarias. Depurada la Base de
Datos, el n de empresas canarias se redujo a 394 realizndose transformaciones sobre las variables.

Las siete formas jurdicas de las empresas, se redujeron a cuatro mediante agregacin :
Sociedades Annimas
Sociedades Limitadas
Autnomos

Otros

La propensin a exportar presentara tres modalidades:

Propensin a exportar baja: entre 0 y 10%.


Propensin a exportar media: entre 10 y 50%
Propensin a exportar alta: entre 50 y 100%.

Tabla de correspondencias
Propensin exportar
Forma jurdica baja media alta Margen activo
Sociedad Annima 151
51
34
236
Sociedad Limitada
42
30
22
94
Otras
3
9
10
22
Autnomo
3
12
27
42
Margen activo
199
102
93
394

Frecuencias relativas
Soc. Annima
FORMA Soc. Limitada
JURDICA Otras
Autnomo
fi

PROPENSIN EXPORTAR
BAJA MEDIA ALTA
0,383
0,129
0,086
0,107
0,076
0,056
0,008
0,023
0,025
0,008
0,030
0,069
0,505
0,259
0,236

fj
0,599
0,239
0,056
0,107
1,000

Solucin: Anlisis de correspodencias simple.


Objetivo:
Conocer la forma jurdica que se asocia con la propensin a la
exportacin en mayor proporcin que las dems.
Detectar las caractersticas que ms destacan en cada forma jurdica.
Reducir n de caracteres relacionados a dimensiones independientes.
Mtodo:
Obtener ejes factoriales que reducen la informacin original mediante
nuevas variables estudiando la asociacin entre modalidades fila y
columna. Se parte de frecuencias relativas para comparar.
En el espacio de las columnas: nube de n puntos i con coordenadas
kij/ki. para j = 1, 2, .....p
En el espacio de las filas: nube de p puntos j con coordenadas k ij/k.j
para i = 1, 2, ......n

SPSS: Introducir los datos


Poner en las dos primeras columnas los pares de rangos posibles para
las columnas (1 a 3) y las filas (1 a 4) y, en la tercera, la frecuencia de
cada par de rangos. Se puede poner etiquetas al valor de cada rango.
Utilizar como variable de ponderacin las frecuencias mediante los
comandos del men: Datos, Ponderar casos

Ventanas Anlisis de Correspondencias Simple

Ventana Modelo

Las soluciones con los cuatro procedimientos son equivalentes en trminos de ajuste (valores singulares), inercia y
contribuciones, pero las puntuaciones por filas y columnas son diferentes.
Para examinar diferencias o similitudes entre dos variables: Cannica.
Para examinar diferencias o similitudes entre categoras de variables por separado: Principal.
Para averiguar cmo difieren entre s las distintas categoras de la variable fila o columna, de modo que maximice las
distancias existentes entre las distintas categoras o modalidades de las filas o columnas de la tabla: Principal por
filas o columnas.

Ventana Estadsticos

Dependiendo de la opcin elegida en la normalizacin se podr


demandar el grfico conjunto o no.
Si se ha elegido la normalizacin cannica: Grfico conjunto.
Si se ha elegido la principal: Grficos por separado de filas y columnas.

Resultados
Valor
ChiInercia
Sig.
propio
cuadrado
Dimensin
1
2
Total

,434
,098

,189
,010
,198

Proporcin de
Confianza para
inercia
el Valor propio
Explicada Acumulada S (*) Correlacin
2
,952
,952 ,043
,195
,048
1,000 ,056
78,055 ,000
1,000
1,000

Inercia: Valor propio o varianza explicada


Valores singulares: Raz cuadrada de la inercia.
Inercia global
p 1

I
1

Chi cuadrado: Prueba de independencia.


2

kI

2
I
k

2 = 394*0,19811 = 78,055. Se rechaza la hiptesis de independencia entre las modalidades.

Analisis en Rp: Examen de los puntos fila


Masa Puntuacin Inercia
1

F. jurdica
S.A.
,599 -,278 ,041
S.L.
,239 ,070 -,126
Otras
,056 ,721 -,198
Autnomo ,107 1,026 ,155
Total
1,000

Contribucin

De
De puntos
dimensin
a inercia
a inercia
dimensin
Total
del punto
1
2
1
2
,047 ,245 ,106 ,979 ,021 1,000
,005 ,006 ,396 ,239 ,761 1,000
,031 ,154 ,230 ,930 ,070 1,000
,115 ,595 ,268 ,978 ,022 1,000
,198 1,000 1,000

COORDENADAS :Puntos fila


Proyecciones de los puntos filas en los ejes factoriales. Mientras ms alejados del origen sean los valores, mejor representadas estarn las filas en
cada uno de los ejes.
CONTRIBUCIN A LA INERCIA O ABSOLUTAS:
Las de cada uno de los puntos filas a la inercia explicada en cada eje. Se busca conocer los elementos responsables de la construccin de cada eje.

CORRELACIN O CONTRIBUCIN RELATIVA:


La contribucin de las dimensiones a la inercia de cada punto fila es la correlacin existente entre cada uno de los caracteres y los nuevos ejes.
Coseno del ngulo entre el eje y el vector uniendo el centro de gravedad de la nube al punto i.

fi.2i
Cr (i)

Cos 2 (i)

d2 (i, G)
2i
2

d (i, G) d2 (i, G)

Analisis en Rn: Examen de los puntos columna


Contribucin
Puntuacin en la
Propensin
De puntos a inercia De dimensin a la
dimensin
Masa
Inercia
exportar
de la dimensin
inercia del punto
1
2
1
2
1
2
Total
baja
,505
-,391
,040 ,078
,408
,086 ,989 ,011
1,000
media
,259
,152
-,161 ,013
,032
,709 ,471 ,529
1,000
alta
,236
,669
,091 ,108
,560
,204 ,982 ,018
1,000
Total activo 1,000
,198
1,000
1,000

INTERPRETACIN:
Eje 1
Lado positivo: Autnomo y Otras y propensiones a exportar alta y media. Lado negativo: Sociedades
Annimas y propensin a exportar baja.
Contribucin a la inercia: Sociedad Annima y Autnomos, y propensiones a exportar baja y alta.
Correlaciones: Altas en Sociedad Annima, Otras y Autnomos y propensiones a exportar baja y alta.
Eje 2
Los puntos fila estn muy cercanos al origen, por lo que ser difcil su interpretacin. Los puntos
columnas destaca en el lado positivo la propensin a exportar media.
Contribuciones a la inercia: Soc. Limitadas, Otras y Autnomos, y propensin a exportar media.
Correlacin: las Sociedades Limitadas y la propensin a exportar media.

GRFICO
Diagrama de dispersin puntuaciones
Forma jurdica-Propensin a exportar
,2

Autnomo
alta

,1

Eje 2

Sociedad
Annima
baja
-,0

-,1

Sociedad Limitada
media
Otras

-,2

-,3
-,6

-,4

-,2

-,0

,2

,4

Eje 1

,6

,8

1,0

1,2

También podría gustarte