Está en la página 1de 5

Cristian David Mariaca Rueda

CC.1152452163
Cristian.mariaca@udea.edu.co

Análisis de correlación canónica

1. Resumen

El estudio fue motivado por el deseo de saber la correlación que existía entre un
grupo de variables relacionadas a una especie de caprino, el método empleado para
esto fue el análisis de correlación canónica y mediante métodos gráficos
relacionados con el análisis ejecutado se pudo comprobar que el porcentaje de
nitrógeno está muy poco relacionado a la longitud del cuerpo y la anchura de las
caderas del caprino, del mismo modo se pudo comprobar que si existía una relación
entre la producción de leche y estas medidas.

2. Materiales y Métodos

 Descripción de la base de datos:

Los datos que se utilizaron en la elaboración del trabajo fue tomada del libro
estadística multivariada: inferencia y métodos de la universidad Nacional
sede Bogotá. La base de datos está basada en una muestra de cierta especie
de caprino en los que se miden la producción máxima diaria de leche ( y1 ),
y el porcentaje de nitrógeno ( y2 ), y dos medidas corporales: longitud del
cuerpo ( x1 ) y anchura de las caderas ( x2 ).

 Descripción del análisis utilizado:


El análisis utilizado en este caso fue el análisis de correlación canónica, lo
que se pretende es estudiar las relaciones que existe entre las variables.

3. Resultados

Previamente a lo que fue la realización de análisis de correlación canónica se realizó


la matriz de correlación entre las variables, el resultado es el que se presenta a
continuación:

Y1 Y2 X1 X2
Y1 1.0000000 0.4121160 0.9252458 0.9278182
Y2 0.4121160 1.0000000 0.3837868 0.4686837
X1 0.9252458 0.3837868 1.0000000 0.9087394
X2 0.9278182 0.4686837 0.9087394 1.0000000

Por medio de esta matriz podemos deducir que existe una relación alta en entre las
variables ( x1 , y1 ),( x2 , y1 ),( x1 , x2 ), la relación existente entre el resto de pares de
variables no es tan alta como estas. Eso significa que existe una relación significativa
entre la producción máxima diaria de leche con la longitud del cuerpo y la anchura
de las caderas, al igual que existe una relación alta entre la longitud del cuerpo con
la anchura de las caderas. Además, se analizó el grafico de correlación para las
matrices:

En este grafico podemos observar que hay una alta correlación para la matriz X pero
en la matriz Y esta correlación no es tan marcada.
Posteriormente a esto, se realiza el análisis de correlación canónica, para la
interpretación de los resultados obtenidos nos vamos a basar en los gráficos
resultantes. Primero vamos a analizar el grafico de proyección de los individuos
sobre el plano canónico:

Gráficamente se puede observar un comportamiento muy diferente entre ambas


variables, el comportamiento de la variable X parece ser aproximadamente lineal
mientras que el comportamiento de la variable Y parecería no tener ningún tipo de
comportamiento, lo que nos daría a entender que la longitud del cuerpo
efectivamente está relacionada con el tamaño de las caderas, algo que ya habíamos
deducido antes mediante la matriz de correlaciones.

El grafico siguiente corresponde a el plano canónico con circulo de correlaciones:


En el primer círculo se encuentra una correlación cercana a 1 entre las dos
componentes de la variable X con las variable Y , sin embargo, en el segundo circulo
podemos observar que solo la componente y1 de la variable Y tiene alta correlación
con las componentes de X, algo que de igual manera se había comprobado
mediante la matriz de correlaciones.

En el tercer grafico tenemos lo siguiente:

En este grafico se puede reforzar la conclusión obtenida del grafico anterior, hay
una relación significativamente alta de las componentes de X con y1 .

Finalmente hacemos una observación del ultimo grafico obtenido:


Con este grafico se siguen manteniendo las evidencias de las relaciones existentes
entre las variables, observamos que las componentes de X están más cercanas al
origen lo que indican alta correlación con Y , específicamente y1 , sin embargo, en
el otro grafico ( derecha parte inferior) se puede observar que mientras y1 está más
cerca del origen , la componente y2 está mucho más lejos, incluso se sale del círculo
, esto nos indica que realmente la relación de esta componente con la variable X es
muy débil.

4. Análisis

De todo lo observado en este trabajo se pueden concluir que hay evidencias claras
y fuertes de que el porcentaje de nitrógeno está muy poco relacionado con la
longitud del cuerpo y el tamaño de las caderas del caprino, sin embargo, si hay una
relación muy fuerte entre la producción máxima diaria de leche con la longitud del
cuerpo y la anchura de las caderas, además, la anchura de las caderas es
proporcional a la longitud del cuerpo , es decir, a mayor longitud del cuerpo mayor
va a ser la anchura de las caderas y por lo tanto es más probable que el caprino
produzca más leche.

5. Referencias

 Universidad Nacional de Colombia, tercera edición 2012, Estadística


multivariada: inferencia y métodos, Bogotá, Colombia, Editorial Universidad
Nacional de Colombia.

También podría gustarte