Está en la página 1de 12

158

la prueba 0.0001E-37.

Por lo tanto existe suficiente evidencia

estadstica para rechazar la hiptesis nula a favor de la alterna, es


decir, la matriz de correlacin no

es factorizable, por ese motivo

utilizar componentes principales no es favorable.

4.5

Correlacin cannica.
El anlisis de correlacin cannica busca identificar y cuantificar las
asociaciones lineales entre dos grupos de variables. Este anlisis se
enfoca en la correlacin entre combinaciones lineales pertenecientes a
los grupos de variables. La idea es determinar el par de
combinaciones lineales que tienen la correlacin ms alta, luego el
segundo par cuya correlacin es menor o igual a la primera, y as
sucesivamente.

A estos pares de combinaciones lineales se los

denomina variables cannicas, por consiguiente sus correlaciones son


llamadas correlaciones cannicas, las mismas que miden la fuerza de
asociacin entre los dos grupos de variables.

El primer grupo de variables esta representado por el vector aleatorio


p variado (1), el segundo grupo, de q variables es representado por

(2), donde el primer conjunto de variables tiene menos componentes


que el segundo es decir p q.

159

En este anlisis el vector (1) estar formado por las 22 variables


que miden el nivel de conocimientos de lenguaje, es decir p = 22, y el
vector (2) contienen las 27 variables que miden el nivel de
conocimientos de matemticas es decir q = 27.

(1) y (2) se cumplen las siguientes

Para los vectores aleatorios


propiedades:

E ( (1) ) (1)

Cov ( (1) ) 11

E ( ( 2) ) ( 2 )

Cov ( ( 2) ) 22

Cov ( (1) , ( 2) ) 12 t21

Cada par de variables cannicas es representada como una


combinacin lineal de las variables tanto del grupo (1) y (2).
El vector aleatorio y el vector de medias.

X1(1)

(1)
X2

X (1)
(( p q)1) (2)
X1(2)
( 2)
X2


X q(1)
(1)
p

E ( (1) )
(1)

E .......... ..........
E ( ( 2) )
( 2)

160

Donde la matriz de covarianzas es:

( p q) x( p q)

E (1) (1) (1) (1) t E (1) (1) ( 2 ) ( 2 ) t

E ( 2) ( 2 ) (1) (1) t E ( 2 ) ( 2) ( 2 ) ( 2 ) t

11 12
( pxp )
( pxq )


21 22
( qxq )
( qxp )

Las covarianzas entre dos vectores de diferentes conjuntos, es decir


de un vector (1) y de un vector (2) esta contenida en 12 o su
transpuesta

21 . Cuando se tiene gran cantidad de variables, los

clculos de las varianzas se vuelven rutinarios, por ese motivo la


tcnica de correlacin cannica tiene como objetivo resumir las
asociaciones entre los conjuntos de vectores de (1) y

(2)

en

trminos de unas pocas covarianzas debidamente escogidas en lugar


de las pq covarianzas contenidas dentro de la matriz de covarianzas
12 .

Consideremos las siguientes combinaciones lineales:


U a t (1)
V bt ( 2)

161

Para un par de vectores coeficientes a y b, se obtiene:


Var V b Cov b b b
CovU ,V Corr
a Cov
U ,V , ba a b
Var U a t Cov (1) a at 11a
t

( 2)

22

(1)

( 2)

12t

12b
a 11a b t 22b
Se buscar vectores de coeficientes tal que:
t

Por lo que se define:


El primer par de variables cannicas, son las combinaciones lineales
correspondientes a U1, V1 que tienen varianzas unitarias y que
maximizan la correlacin entre ambas.

El segundo par de variables cannicas, son las combinaciones lineales


correspondientes a U2, V2

que poseen varianzas unitarias y que

maximizan la correlacin previa entre todas las opciones no


correlacionadas con el primer par de variables cannicas.

El i-simo par de variables cannicas, son las combinaciones lineales


correspondientes al par Ui, Vi, la cual contiene varianzas unitarias y
maximizan la correlacin previa, entre todas las opciones no
correlacionadas con las i 1 variables cannicas.
Para los clculos de los vectores a, b se tom en cuenta los siguientes
resultados.

162

Suponga que p q y que los vectores (1) y (2) tienen.


Cov ( (1) ) 11
Cov ( ( 2) ) 22
Cov ( (1) , ( 2 ) ) 12 t21

Para los vectores coeficientes a y b, que forman las combinaciones


lineales.
U a t (1)
V bt ( 2)

Entonces para obtener U1, V1 es necesario:

max Corr U ,V

*
1

a ,b

Logrando el i simo par de variables cannicas


1 / 2
U i e ti 11
(1)

Vi f it 221 / 2 ( 2 )
Con

Donde

Cov (U i , Vi ) i*

1*2 2*2 p*2

Son los valores propios de la matriz, resultado de la multiplicacion de:


1 / 2
1 / 2
11
12 221 21 11
Adems e1, e2, , ep son los vectores propios de px1 asociados a

sta. As mismo se obtiene:

1*2 2*2 p*2

163

Los p valores propios ms grandes de la matriz


1 / 2
1
1 / 2
22
2 1 11
1 2 22

Donde:

E( )( )
t

M ( p q )( p q )

Con los correspondientes vectores propios (de qx1) f1, f2, ..., fp.

En vista de que tenemos conocimiento de lo que son las variables


cannicas y sus correlaciones, se proceder a realizar el anlisis de
correlacin cannica de dos grupos de variables que miden el nivel de
conocimientos de matemticas y lenguaje de los nios de sptimo
ao bsico de las escuelas particulares urbanas del cantn Guayaquil
a travs de sus pruebas. El primer grupo de variables que conforman
el vector p variado est formado por las 22 variables de la prueba de
lenguaje y el segundo grupo que conforman el vector q variado est
representado por las 28 variables de la prueba de matemticas, los
vectores fueron elegidos de esta manera, ya que se sabe que p q,
es decir que se obtendrn variables Ui y Vi, que son combinaciones
lineales de las variables de lenguaje y matemticas.

164

Para poder obtener los resultados fue necesario elaborar en SPSS


una rutina (que utilizaba la librera INCLUDE y llamaba al programa
correlacin cannica), la misma que se presenta a continuacin:
INCLUDE 'C:\PROGRAM FILES\SPSS\Canonical correlation.sps'.
CANCORR SET1= X3, X4, X5, X6, X7, X8, X9, X10, X11, X12, X13, X14, X15, X16,
X17, X18, X19, X20, X21, X22, X23, X24, X25, X26, X27, X28, X29/ SET2= x30, x31,
x32, x33, x34, x35, x36, x37, x38, x39, x40, x41, x42, x43, x44, x45, x46, x47, x48,
x49, x50, x51.

En la tabla CXX se presentan las correlaciones correspondientes a las


23 variables cannicas, se considera importante la correlacin
cannica si su coeficiente es mayor o igual a 0.4, en nuestro caso
tomaremos los dos primeros pares de variables cannicas.

TABLA CXX
Correlaciones cannicas entre las variables
que conforman la prueba de lenguaje y matemticas

165

Correlacin Cannica

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

0,701
0,383
0,315
0,295
0,279
0,251
0,24
0,222
0,217
0,194
0,192
0,17
0,153
0,145
0,138
0,122
0,095
0,079
0,074
0,063
0,05
0,026

Como se sabe la varianza de cada variable cannica es unitaria,


entonces en este caso:
Var(U1) = Var(U2) = ... = Var(U22)=1
Var(V1) = Var(V2) = ... = Var(V22)=1

Y las correlaciones entre


Corr(Ui,Vk) = Corr(Vk,Ui) = Corr(Ui, Uk) = Corr(Vi,Vk)=0 para i k

166

Como se puede observar la correlacin entre las dos primeras


variables cannicas (ver tabla CXX), es la siguiente:
Corr(U1,V1)=0.701
Corr(U2,V2)=0.383

Los coeficientes de U1 y U2, las dos primeras variables cannicas para


lenguaje se muestran en la tabla CXXI.

TABLA CXXI
Coeficientes de las primeras dos variables
cannicas de lenguaje.
V

r i a

l e

l e

j e

f i c

i e

t e

f i c

i e

X
3

X
3

X
3

. 3

. 1

- 0

. 5

. 0

- 0

. 3

. 0

- 0

. 5

. 4

- 0

. 7

- 0

- 0

. 6

- 0

- 0

. 6

. 0

- 0

. 4

. 2

- 0

. 2

. 1

- 0

. 4

- 0

- 0

. 5

. 4

- 0

. 6

. 0

- 0

. 4

. 2

- 0

. 5

. 0

- 0

. 6

- 0

. 1

- 0

. 6

- 0

. 0

- 0

. 6

- 0

. 0

- 0

. 5

- 0

. 0

- 0

. 6

- 0

. 5

- 0

. 0

- 0

. 6

- 0

. 2

. 0

. 4

. 0

X
4

X
5

- 0

X
4

X
4

. 2

X
4

X
3

. 5

X
3

- 0

. 1

t e

167

U1 = -0.5X30 - 0.354X31 - 0.507X32 - 0.374X33 - 0.595X34 - 0.721X35


-0.635X36 - 0.605X37 - 0.495X38 - 0.285X39 - 0.464X40 - 0.536X41 0.644X42 - 0.496X43 - 0.540X44 - 0.649X45 - 0.695X46 - 0.682X47 - 0.565X48
- 0.621X49 - 0.586X50 - 0.661X51

U2 = 0.229X30 + 0.175X31 + 0.052X32 + 0.078X33 + 0.459X34 - 0.006X35


-0.429X36 + 0.038X37 + 0.291X38 + 0.122X39 - 0.004X40 + 0.461X41 +
0.076X42 + 0.234X43 + 0.075X44 - 0.103X45 - 0.043X46 - 0.091X47 0.052X48 + 0.103X49 - 0.094X50 - 0.270X51

Los coeficientes de las dos primeras variables cannicas V1 y V2 de


matemticas se presentan en la tabla CXXII.

TABLA CXXII
Coeficientes de las primeras dos variables
cannicas de matemticas.
Variables
de matemticas
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
X13
X14
X15
X16
X17
X18
X19
X20
X21
X22
X23
X24
X25
X26
X27
X28
X29

Coeficientes Coeficientes
de V1
de V2
-0.098
-0.127
-0.405
-0.238
-0.322
-0.369
-0.535
-0.385
-0.454
0.193
-0.449
0.055
-0.506
-0.102
-0.485
0.153
-0.294
-0.392
-0.534
-0.326
-0.435
-0.161
-0.639
0.148
-0.263
0.176
-0.520
0.203
-0.397
0.272
-0.339
0.143
-0.414
0.232
-0.492
0.380
-0.596
0.258
-0.383
-0.065
-0.487
0.145
-0.411
0.262
-0.420
0.185
-0.500
0.311
-0.349
0.176
-0.468
0.404
-0.339
0.199

168

V1 = -0.098X3 - 0.405X4 - 0.322X5 - 0.535X6 - 0.454X7 - 0.449X8 -0.506X9


- 0.485X10 - 0.294X11 - 0.534X12 - 0.435X13 - 0.639X14 - 0.263X15 0.520X16 - 0.397X17 - 0.339X18 - 0.414X19 - 0.492X20 - 0.596X21 - 0.383X22
- 0.487X23 - 0.411X24 - 0.420X25 - 0.5X26 - 0.349X27 0.468X28 - 0.339X29

V2 = -0.127X3 - 0.238X4 - 0.369X5 - 0.385X6 + 0.193X7 + 0.055X8


-0.102X9 - 0.153X10 - 0.392X11 - 0.326X12 - 0.161X13 + 0.148X14 +
0.176X15 + 0.203X16 + 0.272X17 + 0.143X18 + 0.232X19 + 0.380X20 +
0.258X21 - 0.065X22 + 0.145X23 + 0.262X24 + 0.185X25 + 0.311X26 +
0.176X27 + 0.404X28 + 0.199X29

A continuacin se analizar las primeras dos variables cannicas,


recalcando los mayores pesos tanto para Uk como para Vk.

Primer par de variables cannicas


Las variables que tienen los mayores pesos en las variable cannica
U1.

Variable X35: Oracin 2

Variable X46: Palabras graves

Variable X47: Palabras esdrjulas

Las variables que tienen los mayores pesos en la variable cannica


V1.

169

Variable X14: Permetro y rea del rectngulo

Variable X21: Romanos a arbigos.

Variable X12: Resta de decimales.

Segundo par de variables cannicas


Las variables que tienen los mayores pesos en la variable cannica
U2.

Variable X41: Palabras maysculas.

Variable X34: Oracin 1.

Variable X36: Oracin 3.

Las variables que tienen los mayores pesos en las variable cannica
V2.

Variable X28: Complemento de un conjunto.

Variable X11: Suma de decimales

Variable X6: Divisin de enteros

También podría gustarte