Está en la página 1de 7

Gigi Causio Voinea

Anlisis multivariante

Anlisis Multivariante
Correlacin cannica con SPSS

2013

Estadstica Aplicada

Gigi C. Voinea

Correlacin cannica

El fichero correlacionca2.sav contiene los resultados de una encuesta en la que


se meda el grado de acuerdo o desacuerdo (cada una con cinco niveles) con
seis afirmaciones. Las respuestas se codifican en las variables respuesta1respuesta6.
Realizar un anlisis de correlacin cannica no lineal tomando como primer
conjunto las preguntas 1, 2 y 3 y como segundo grupo las preguntas 4, 5 y 6.
Realizarlo con dos dimensiones.
Realizarlo mediante SPSS.

La correlacin cannica es especialmente til en situaciones donde se tienen mltiples


variables dependientes. Cuando las variables son mtricas la correlacin cannica es
la respuesta adecuada, ya que permite la valoracin de la relacin entre variables
predictoras mtricas y mltiples medidas dependientes. En otras palabras, el anlisis
de correlacin cannica es un modelo estadstico multivariante que facilita el estudio
de las interrelaciones entre mltiples variables criterio (dependientes) y mltiples
variables predictoras (independientes).
El primer paso en el anlisis de correlacin cannica es fijar los objetivos. Una vez
tenidos los dos conjuntos de variables podemos fijar algunos objetivos:
a) Determinar si los dos conjuntos de variables son independientes uno de otro o
determinar la magnitud de las relaciones que pueden existir entre los dos
conjuntos
b) Obtener un conjunto de ponderaciones para cada conjunto de variables criterio
y variables predictoras
c) Explicar la naturaleza de cualquiera de las relaciones existentes entre los
conjuntos de variables criterio y variables predictoras
El segundo paso supone el diseo de un anlisis de correlacin cannica.
Tenemos que tener un tamao muestral adecuado, por lo cual se recomienda
mantener por lo menos 10 observaciones por cada variable para evitar el
<<sobreajuste>> de los datos. En nuestro caso hay 6 variables y 67 observaciones
cumplindose con el mnimo requerido. Recordamos tambin que la clasificacin de
las variables como dependientes o independientes tiene poca importancia en la
estimacin estadstica de las funciones cannicas, ya que el anlisis de correlacin
cannica pondera ambos valores tericos para maximizar la correlacin y no establece
ningn nfasis particular en alguno de los valores tericos.
El tercer paso es la evaluacin de los supuestos bsicos de la correlacin
cannica. Estos supuestos son la linealidad, la multicolinealiadad, la
homoscedasticidad, y es ste caso no es estricto el supuesto de normalidad. Si la
linealidad no se cumple los resultados se pueden ver afectados, entonces se debe
transformar una o todas las variables si fuese posible. El SPSS realiza
Pgina 2

Gigi C. Voinea

Correlacin cannica

automticamente sta transformacin. Si la homoscedasticidad no se cumple hay


menos correlacin entre las variables, y si las variables presentan multicolinealidad
entre algn conjunto de variables se disminuye la capacidad de la tcnica para aislar
el impacto de cualquier variable nica, haciendo que la interpretacin que sea menos
fiable.
El cuarto paso es la obtencin de las funciones cannicas. El nmero mximo de
valores tericos cannicos (funciones/dimensiones) es que se pueden obtener a partir
de los conjuntos de variables es igual al nmero de variables que hay en el conjunto
menor, ya sea dependiente o independiente.
Despus de cargar los datos en SPSS vamos al men Analizar-Reduccin de
dimensiones-Escalamiento ptimo. En la primera ventana seleccionamos El nivel de
escalamiento ptimo, el nmero de conjuntos de variables y Definir. En la siguiente
ventana introducimos los conjuntos de datos por separados y seleccionamos el rango
de cada variable en parte, introduciremos el nmero de dimensiones (funciones), en
nuestro caso vamos a seleccionar 2 dimensiones. En ltimo lugar con el botn
Opciones optamos por los tipos de tablas y grficos que queremos que nos devuelva
el programa.

Tabla 1.1: Resumen del anlisis


Dimensin
1
Conjunto 1
Prdida
Conjunto 2
Media
Autovalores
Ajuste

Suma
2

,250
,249
,249
,751

,331
,329
,330
,670

,581
,579
,580
1,420

Los valores de ajuste del modelo nos relavan en qu medida el anlisis de correlacin
ajusta los datos en relacin a la asociacin entre las diferentes series de variables. El
valor de 1,420 de un mximo de 2, nos indica un ajuste en dos dimensiones es
bastante bueno. Si se hubiera elegido tres dimensiones el valor de ajuste obtenido
hubiera sido 2,016 de un mximo de 3, lo que en proporcin es ms pequeo que el
obtenido en dos dimensiones, por lo cual la eleccin do dos dimensiones es correcta.

El quinto paso es la interpretacin del valor terico cannico. Se suelen interpretar


las ponderaciones cannicas, las cargas cannicas (saturaciones en componentes) y
las cargas cruzadas cannicas.

Pgina 3

Gigi C. Voinea

Correlacin cannica

1) Ponderaciones cannicas.
Tabla 1.2: Ponderaciones
Conjunto

Dimensin
1

item1
item2
item3
item4
item5
item6

,514
-,370
,584
,182
-,206
-,777

2
,671
,380
-,351
-,838
-,384
-,359

Para interpretar las ponderaciones nos tenemos que fijar en el signo y en la magnitud
de la ponderacin cannica asociada a cada variable en su valor terico cannico.
Las variables con ponderaciones relativamente mayores contribuyen ms al valor
terico de manera positiva, directa, en oposicin con las variables con ponderaciones
relativamente menores, contribuyen menos al valor terico. Los que tienen un signo
negativo contribuyen de manera indirecta, negativa al valor terico.
En la Tabla 1.2 se observa que en el primer conjunto para la primera dimensin la
mayor ponderacin la tiene el tem 3 (0,584) seguido por el primer tem (0,514), y para
la segunda dimensin la mayor influencia la tiene tambin la primera variable, con una
ponderacin de 0,671.
Para el segundo conjunto en la primera dimensin el tem 6 tiene una ponderacin
fuerte, pero negativa (-0,777), y para la segunda dimensin el tem 4 es el que ms
ponderacin tiene, tambin negativa (-0,838).
Una ponderacin pequea puede significar o bien que su correspondiente variable es
irrelevante para explicar la relacin o bien que ha sido apartada de la relacin debido a
un alto grado de multicolinealidad.

2) Las cargas cannicas (saturaciones en componentes)


Las cargas cannicas, tambin denominadas correlaciones de estructura cannica,
miden la correlacin simple entre una variable original observada del conjunto
dependiente o independiente y el valor terico cannico del conjunto. Las cargas
cannicas reflejan la varianza que la variable observada comparte con el valor terico
cannico, y puede ser interpretada como una carga factorial para valorar la
contribucin relativa de cada variable a cada funcin cannica. Cuanto mayor es el
coeficiente, mayor es la importancia que tiene para calcular el valor terico cannico.

Pgina 4

Gigi C. Voinea

Correlacin cannica

Tabla 1.3: Ajuste

Conjunto

Ajuste mltiple
Dimensin
1

Ajuste simple

Suma

Dimensin

Prdida simple
Suma

Dimensin
1

Suma

item1

,272

,465

,737

,252

,460

,712

,020

,005

,025

item2

,179

,134

,313

,152

,131

,283

,027

,003

,030

item3

,357

,134

,491

,342

,119

,461

,015

,015

,030

item4

,072

,699

,771

,041

,697

,738

,031

,002

,033

item5

,054

,153

,206

,043

,140

,182

,011

,013

,024

item6

,585

,148

,732

,583

,140

,724

,001

,007

,008

a. Nivel de escalamiento ptimo: Ordinal

En la Tabla 1.3 vemos, para el conjunto de dimensiones, los tems 1, 4 y 6 son los que
ms discriminan y los que menos discriminan son los 5, 2 y 3. Si queremos ver las
dimensiones por separado, nos fijamos en la primera y en la segunda columna de la
tabla. Para la primera dimensin el tem ms discriminante es el 6 y el menos
discriminante es el 4. Para la segunda dimensin el tem ms discriminante es el 4 y el
menos discriminante es el 2.

3) Las cargas cruzadas cannicas.


Representan una alternativa a las cargas convencionales, y consiste en correlacionar
cada una de las variables dependientes originales observadas directamente con el
valor terico cannico independiente, y viceversa. De sta manera, las cargas
cruzadas proporcionan una medida ms directa de las relaciones entre las variables
dependientes e independientes eliminando un paso intermedio incluido en las cargas
convencionales. Notamos que el SPSS no nos proporciona stas cargas cruzadas,
pero hay otros programas como el SAS que si lo hace.

Con el grfico de saturaciones en componentes (Figura 1.2) podemos ver la posicin


en dos dimensiones de las variables, donde observamos que el en la primera
dimensin el tem 1, 3, 4 estn cercanos teniendo coeficientes parecidos (vase la
Tabla 1.3, tambin), y el tem 4, 5, 6, estn ms separados. El segundo factor sigue
un modelo bastante diferente con los tems separados uno de otro, con valores entre 0,665 y +0,638.

Pgina 5

Gigi C. Voinea

Correlacin cannica

Los resultados de los centroides nos ayudan a interpretar el grado en que cada
variable discrimina los grupos de individuos. En ste caso los datos estn bastante
agrupados y nos dice mucho.

Presentamos tambin el grfico de las puntuaciones para ver de sta manera cual son
los individuos raros, que pueden afectar fuertemente la relacin. Hay alguno ms
separado (como el 25, el 3 y el 17) pero a una muestra de 67 no pueden influir
decisivamente, por lo cual todos se queda en el anlisis.

Pgina 6

Gigi C. Voinea

Correlacin cannica

Pgina 7

También podría gustarte