Está en la página 1de 15

Análisis de Correlación

Ing. Jorge Calderón Velásquez. Mg. Sc., Ph. D. (c)


jcalderonv@lamolina.edu.pe

Correlación lineal

Mejoramiento Genético del Ganado I 1


Definición

 El coeficiente de correlación lineal o de Pearson, mide el grado de intensidad de


esta posible relación entre las variables. Este coeficiente se aplica cuando la
relación que puede existir entre las variables es lineal.
 Otra definición es que explica el grado de asociación que existe entre las
variables en estudio, es decir entre la variable independiente y la variable
dependiente.
 Es la relación de la covarianza que existe entre las dos variables con respecto a la
raíz cuadrada del producto de sus varianzas.

Propiedades del coeficiente de correlación

i. Número sin dimensiones, el rango del coeficiente de correlación es entre [‐1,


1].
ii. Si las variables son independientes =0. La inversa no es necesariamente
cierta, aunque si las variables son normales bivariantes sí.
iii. Si las variables estuvieran relacionadas linealmente =1
iv. Por lo menos una de las variables debe seguir una distribución normal.

Mejoramiento Genético del Ganado I 2


Clasificación del coeficiente de correlación

r >0 r<0 r=0


El coeficiente de
correlación puede • Correlación • DeCorrelación • No existe
positiva. negativa. correlación.
ser clasificada en
• Si se incrementa en • Si se incrementa en • Relación
tres grupos, en X se incrementa X se reduce en Y independiente.
función a su valor también en Y
o grado de
asociación.

Clasificación del coeficiente de correlación

En función a
su valor r=0 r = (0, 0.30] r=(0.30, 0.60] r=(0.60, 1.00]
absoluto, se • No existe • Correlación • Correlación • Correlación
puede correlación baja media alta
clasificar:

Mejoramiento Genético del Ganado I 3


Representación de la correlación

Correlación positiva Correlación negativa Ausencia de correlación Correlación no lineal

Tipos de correlación

 Correlación lineal o de Pearson: covarianza de las variables comparadas,


estandarizadas por varianzas, o lo que viene a ser lo mismo, covarianza calculada
sobre los datos centrados ‐reducidos.
 Correlación de Spearman: coeficiente de correlación no paramétrico,
estrictamente equivalente al coeficiente de correlación de Pearson calculado
sobre los rangos de valores.
 Correlación de Kendall: coeficiente de correlación no paramétrico, es decir,
calculado sobre los rangos de los valores.

Mejoramiento Genético del Ganado I 4


Correlación lineal o de Pearson

 Para poder establecer una discusión del coeficiente de correlación es necesario


observar la distribución de los datos pareados, para ver si los datos son
homogéneos con respecto a cada una de las variables estudiadas.
 Existe heterogeneidad por presencia de datos atípicos

Correlación lineal o de Pearson

 Heterogeneidad por presencia de datos agrupados en dos grupos a más.

Mejoramiento Genético del Ganado I 5


Determinación del coeficiente de correlación

 El coeficiente de correlación lineal o de Pearson, se puede determinar mediante

 X  X Y  Y 
la fórmula de desarrollo: n

i 1

r n 1

 X  X   Y  Y 
n n
2 2

i 1 i 1
n 1 n 1

 X  X Y  Y 
n

r i 1

 X  X   Y  Y 
n n
2 2

i 1 i 1

Coeficiente de determinación (R2)

 El coeficiente de determinación (r²) es la proporción de la varianza total (s²) de la


variable dependiente que puede ser explicado por la regresión lineal de Y sobre
X.
 El coeficiente de determinación mide cuanto de la varianza total observada en la
variable dependiente es atribuible al efecto de la variable independiente.
 Mide la proporción de la variación total en la variable dependiente Y que está
explicada por o se debe a la variación en la variable independiente X.
 El coeficiente de determinación es el cuadrado del coeficiente de correlación, R2
= r2, y toma valores de 0 a 1.

Mejoramiento Genético del Ganado I 6


Coeficiente de determinación (R2)

 Asimismo, podemos definir como la diferencia que existe entre la varianza total y
la varianza no explicada con respecto a la varianza total.

Varianza total  Varianza no explicada


r2 
Varianza total

 Y  Y    Yi  Yˆ  
n n 2
2
i
r2  i 1 i 1

 Y Y 
n
2
i
i 1

Coeficiente de determinación (R2)

 Dicho de otra forma, es la relación que existe entre la varianza explicada por la
regresión con respecto a la varianza total.

 Y2  VTotal  VResidual  VExplicada

VExplicada
R2  r 2 
VTotal

 Y2  VResidual VResidual
R  2
 1 
 Y2  Y2

Mejoramiento Genético del Ganado I 7


Coeficiente de determinación (R2)

 Por definición del coeficiente de correlación, el coeficiente de determinación será


estimado:

2
n 
   X i  X Yi  Y 
r 2  n i 1 

 X i  X   Yi  Y 
n
2 2

i 1 i 1

Coeficiente de determinación (R2)

2
n 
 X i  X Yi  Y   X i  X 
n
2

SC debido a X 
r 2   i 1  i 1

 Yi  Y 
n
2 SC Total (Y )
 Otra forma de i 1

determinar el n 
2

 X i  X Yi  Y   Yi  Y 
n
2
coeficiente de SC debido a Y 
determinación: r 2   i 1  i 1

 X i  X 
n
2 SC Total ( X )
i 1

 n  n 
  X i  X Yi  Y    X i  X Yi  Y  
r 
2  i 1  i 1 b b
 
  X i  X  Yi  Y  
n n YX XY


2 2

 i 1  i 1 

Mejoramiento Genético del Ganado I 8


Coeficiente de no determinación (1 ‐ R2)

 El coeficiente de no determinación (1‐r²) es la proporción de la varianza no


explicada por la regresión.
 El coeficiente de no determinación indica la variación que es atribuible a otros
factores no atribuibles a la variable independiente.

1 ‐ r² = s²XY / s²Y

Significancia del coeficiente de correlación

 Dado que los coeficientes de correlación son estimados en muestras, no


necesariamente son de distribución simétrica cuando el parámetro de la
población es diferente de cero (≠0).
 La simetría se presenta sólo cuando 0, y la asimetría se observa cuando los
valores de +1 o ‐1.
 Es conveniente realizar una transformación para poder estimar un intervalo de
confianza del valor del coeficiente.

1 r
Z '  0.5 ln
1 r

Mejoramiento Genético del Ganado I 9


Significancia del coeficiente de correlación

 El valor transformado es una aproximación a la distribución normal con una


media apropiada y desviación estándar.
1 
uZ '  0.5 ln
1 
1
 Z' 
n3
 Determinado el intervalo de confianza, se puede estimar el valor que puede
tomar el coeficiente de correlación en la población.
e2Z'  1
r
e2Z'  1

Prueba de hipótesis: Coeficiente de correlación

 La prueba de la hipótesis nula, cuando  = 0, se puede probar mediante la


siguiente relación de t.

r
t
1 r2
n2

Mejoramiento Genético del Ganado I 10


Homogeneidad de los coeficientes de correlación

 Cuando se tiene dos valores de coeficientes de correlación, que han sido


estimados de diferentes muestras, pudiendo ser de la misma población, por
ejemplo en el tiempo, se puede establecer una equivalencia entre dichos valores,
la prueba de homogeneidad.
1   2

Z1'  Z 2'
Z* 
m
1
n
i 1 i 3

Homogeneidad de los coeficientes de correlación

 Cuando se tiene más de dos coeficientes de correlación, para determinar la


homogeneidad, se utiliza la prueba de chi cuadrado, mediante la transformación
de los coeficientes a la distribución z.
2
 Z i'  Z w' 
  
2 

i 1 ni  3 

 2   ni  3Z i'  Z w' 


2

Mejoramiento Genético del Ganado I 11


Homogeneidad de los coeficientes de correlación

 Determinación de Z promedio:

 n  3Z
i
'
i
Z w'  i

 n  3
i
i

Aplicación

Mejoramiento Genético del Ganado I 12


Prueba de homogeneidad de los coeficientes de correlación.

 Se ha realizado un estudio en cerdos, información de 16 años, considerando las


tres razas criadas en la Unidad Experimental de Porcinos de la UNALM, Landrace,
Yorkshire y Duroc, determinando la correlación entre las características de:
1. Tamaño de Camada al Nacimiento
2. Tamaño de Camada al Destete
3. Peso de Camada al Nacimiento
4. Peso de Camada al Destete
 Los valores de los coeficientes de la correlación fenotípicas entre ellas y por
razas están dadas en el siguiente cuadro.

Coeficientes de Correlación, Raza Landrace.

Tamaño de Camada Tamaño de Camada Peso de la Camada Peso de la Camada


al Nacimiento al Destete al Nacimiento al Destete

9.83 ± 0.14 7.82 ± 0.12 11.87 ± 0.16 73.92 ± 1.29


Promedios
442 362 440 357

Tamaño de Camada 1.00 0.597 0.842 0.326


al Nacimiento 442 362 440 357

Tamaño de Camada 0.597 1.00 0.558 0.771


al Destete 362 362 362 356

Peso de la Camada 0.842 0.558 1.00 0.353


al Nacimiento 440 362 440 357

Peso de la Camada 0.326 0.771 0.353 1.00


al Destete 357 356 357 357

Mejoramiento Genético del Ganado I 13


Coeficientes de Correlación, Raza Yorkshire.

Tamaño de Camada Tamaño de Camada Peso de la Camada Peso de la Camada


al Nacimiento al Destete al Nacimiento al Destete

9.43 ± 0.14 7.57 ± 0.13 13.38 ± 0.21 74.63 ± 1.45


Promedios
310 258 309 259

Tamaño de Camada 1.00 0.530 0.822 0.331


al Nacimiento 310 258 309 259

Tamaño de Camada 0.530 1.00 0.577 0.793


al Destete 258 258 258 258

Peso de la Camada 0.822 0.577 1.00 0.481


al Nacimiento 309 258 309 259

Peso de la Camada 0.331 0.793 0.481 1.00


al Destete 259 258 259 259

Coeficientes de Correlación, Raza Duroc.

Tamaño de Camada Tamaño de Camada Peso de la Camada Peso de la Camada


al Nacimiento al Destete al Nacimiento al Destete

8.76 ± 0.15 6.62 ± 0.13 11.42 ± 0.20 58.88 ± 1.29


Promedios
316 261 313 260

Tamaño de Camada 1.00 0.528 0.838 0.387


al Nacimiento 316 261 313 260

Tamaño de Camada 0.528 1.00 0.545 0.826


al Destete 261 261 261 259

Peso de la Camada 0.838 0.545 1.00 0.431


al Nacimiento 313 261 313 260

Peso de la Camada 0.387 0.826 0.431 1.00


al Destete 260 259 260 260

Mejoramiento Genético del Ganado I 14


Homogeneidad de coeficientes de correlación

 Para el Peso de Camada al Nacimiento con el Peso de la Camada al Destete.


Raza n r n–3 z (n – 3)z zi ‐ zw (n‐3)(zi ‐ zw)2
Landrace 357 0.354 354 0.3700 130.9834 ‐0.0726 1.8638
Yorkshire 259 0.481 256 0.5243 134.2168 0.0817 1.7093
Duroc 260 0.431 257 0.4611 118.5089 0.0186 0.0884
Total 867 383.7091 X2 = 3.6616
Promedio (zw) 0.4426 P= 0.16028
X2(0.05, 2 gl) 5.99146

 r = 0.416

Mejoramiento Genético del Ganado I 15

También podría gustarte