Está en la página 1de 11

Qu mide el Coeficiente de Correlacin?

En probabilidad y estadstica, la correlacin indica la fuerza y la direccin


de una relacin lineal entre dos variables aleatorias. Se considera que dos
variables cuantitativas estn correlacionadas cuando los valores de una de ellas
varan sistemticamente con respecto a los valores homnimos de la otra: si
tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo
hacen tambin los de B y viceversa.
El coeficiente de correlacin sirve para medir la correlacin entre 2
variables. La ventaja que tiene este coeficiente sobre otras herramientas para
medir la correlacin, como puede ser la covarianza, es que los resultados del
coeficiente de correlacin estn acotados entre -1 y +1. Esta caracterstica nos
permite comparar diferentes correlaciones de una manera ms estandarizada.
El coeficiente de correlacin se puede calcular con Excel mediante el comando
COEF.DE.CORREL. Tambin se puede calcular mediante la frmula:

Siendo Cov (X,Y) la covarianza entre las series temporales X e Y, y X e Y las


desviaciones estndar de X e Y.
Interpretacin
Como se ha mencionado antes, el coeficiente de correlacin tiene un valor
acotado entre -1 y +1. Los valores cercanos a cero indican que no hay asociacin
entre las variables. Valores cercanos a uno indican una asociacin fuerte, mientras
que los valores cercanos a menos uno indican una asociacin fuerte pero inversa.
Por ejemplo, si el coeficiente de correlacin entre dos activos financieros es mayor
que 0,70, podemos decir que estn muy correlacionados positivamente. Por el
contrario, si el valor de este coeficiente est entre -0,20 y +0,20, la correlacin
ser baja. Por ltimo, si el coeficiente de correlacin es menor que -0,70 existir
una gran correlacin, pero negativa.
La

c or re la c i n

tra ta

de

e sta b le ce r

la

re la ci n

de p e nd e n ci a q ue e xi ste e n tre la s d o s va ri ab l e s qu e in te r vi en e n
en un a dis tr i buc i n b idim e ns io na l .
Es d e ci r, d e te rm in a r si l o s cam bi o s en u n a de la s va ri ab l e s
in fl u ye n en lo s ca mb io s de la o tra . En ca so de qu e su ced a ,

di rem o s qu e la s va ri a b le s e st n co rre la ci o na d a s o q u e h a y
c orr e la c in e n tre e ll a s.

Tip os de c orr e la c i n
1 C or r e la c in dir e c ta
La co rrel a ci n d ire cta se da cu an d o al au me n ta r un a de
la s va ri ab l e s l a o tra a um en ta .
La re cta co rre sp o nd i en te a la nu b e d e pu n to s de l a
di stri b u ci n e s u n a re cta cre ci e n te .

2 C or r e la c in in ve r s a
La co rrel a ci n i n ve rsa se d a cu a n do a l au me n ta r un a de
la s va ri ab l e s l a o tra d i sm in u ye .
La re cta co rre sp o nd i en te a la nu b e d e pu n to s de l a
di stri b u ci n e s u n a re cta d e cre ci en te .

3 C or r e la c in nu la
La co rrel a ci n n ul a se d a cu a n do n o ha y de p e nd e n cia d e
ni n g n tip o e n tre l a s va ri a b le s.
En e ste ca so se di ce qu e l as va ria b l e s so n in co rrel a d a s y
la nu b e de pu n to s ti e n e un a fo rm a red o n de a d a .

Gr a do de c orr e la c in
El gr a do de c or r e lac i n in di ca l a p ro xi mi d ad q u e h a y
en tre l o s p u n to s de la n ub e d e p u n to s. Se p u ed e n da r tre s
ti po s:
1 . C or re la c i n fuer te

La co rrel a ci n se r fu e rte cu an to m s ce rca e st n lo s


pu n to s d e l a re cta .

2 . C or re la c i n d bil
La co rre l a ci n se r d b il cua n to m s se p a rad o s e st n l o s
pu n to s d e l a re cta .

3 . C or re la c i n nula

Coeficiente de correlacin de Pearson


En estadstica, el coeficiente de correlacin de Pearson es un ndice que mide
la relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlacin de Pearson es independiente de la escala de medida de
las variables.

De manera menos formal, podemos definir el coeficiente de correlacin de


Pearson como un ndice que puede utilizarse para medir el grado de relacin de
dos variables siempre y cuando ambas sean cuantitativas.

Definicin
En el caso de que se est estudiando dos variables aleatorias x e y sobre una
poblacin estadstica; el coeficiente de correlacin de Pearson se simboliza con la
letra
, siendo la expresin que nos permite calcularlo:

Donde:

es la covarianza de

es la desviacin tpica de la variable

es la desviacin tpica de la variable

De manera anloga podemos calcular este coeficiente sobre un estadstico


muestral, denotado como
a:

Int
erpretacin
El valor del ndice de correlacin vara en el intervalo [-1,1]:

Si r = 1, existe una correlacin positiva perfecta. El ndice indica una


dependencia total entre las dos variables denominada relacin directa:
cuando una de ellas aumenta, la otra tambin lo hace en proporcin
constante.

Si 0 < r < 1, existe una correlacin positiva.

Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que


las variables son independientes: pueden existir todava relaciones no
lineales entre las dos variables.

Si -1 < r < 0, existe una correlacin negativa.

Si r = -1, existe una correlacin negativa perfecta. El ndice indica una


dependencia total entre las dos variables llamada relacin inversa: cuando
una de ellas aumenta, la otra disminuye en proporcin constante.
Coeficiente de correlacin de Spearman

El coeficiente de correlacin de Spearman es menos sensible que el de Pearson


para los valores muy lejos de lo esperado. En este ejemplo: Pearson = 0.30706
Spearman = 0.76270
En estadstica, el coeficiente de correlacin de Spearman, (ro) es una
medida de la correlacin (la asociacin o interdependencia) entre dos variables
aleatorias continuas. Para calcular , los datos son ordenados y reemplazados por
su respectivo orden.
El estadstico viene dado por la expresin:

donde D es la diferencia entre los correspondientes estadsticos de orden de x - y.


N es el nmero de parejas.
Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos,
aunque si stos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximacin a la distribucin t de Student

La interpretacin de coeficiente de Spearman es igual que la del coeficiente de


correlacin de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas
o positivas respectivamente, 0 cero, significa no correlacin pero no
independencia. La tau de Kendall es un coeficiente de correlacin por rangos,
inversiones entre dos ordenaciones de una distribucin normal bivariante.
Ejemplo
Los datos brutos usados en este ejemplo se ven debajo.
CI
106
86
100
100
99
103
97
113
113
110

Horas de TV a la semana
7
0
28
50
28
28
20
12
7
17

El primer paso es ordenar los datos de la primera columna. Despus, se crean dos
columnas ms. Ambas son para ordenar (establecer un lugar en la lista) de las dos
primeras columnas. Despus se crea una columna "d" que muestra las diferencias
entre las dos columnas de orden. Finalmente, se crea otra columna "d 2". Esta
ltima es slo la columna "d" al cuadrado.
Despus de realizar todo esto con los datos del ejemplo, se debera acabar con
algo como lo siguiente:

CI (i)
86
97
99
100
100
103

Horas de TV a la semana (t)


0
20
28
50
28
28

orden(i)
1
2
3
4.5
4.5
6

orden(t)
1
6
8
10
8
8

d
0
4
5
5.5
3.5
2

d2
0
16
25
30.25
12.25
4

106
110
113
113

7
17
7
12

7
8
9.5
9.5

2.5
5
2.5
4

4.5
3
7
5.5

20.25
9
49
30.25

Ntese como el nmero de orden de los valores que son idnticos es la media de
los nmeros de orden que les corresponderan si no lo fueran.
Los valores de la columna d2 pueden ser sumados para averiguar
El valor de n es 10. As que esos valores pueden ser sustitudos en la frmula.

De lo que resulta

.
Determinando la significacin estadstica

La aproximacin moderna al problema de averiguar si un valor observado de es


significativamente diferente de cero (siempre tendremos -1 1) es calcular la
probabilidad de que sea mayor o igual que el esperado, dada la hiptesis nula,
utilizando un test de permutacin. Esta aproximacin es casi siempre superior a
los mtodos tradicionales, a no ser que el conjunto de datos sea tan grande que la
potencia informtica no sea suficiente para generar permutaciones (poco probable
con la informtica moderna), o a no ser que sea difcil crear un algoritmo para
crear permutaciones que sean lgicas bajo la hiptesis nula en el caso particular
de que se trate (aunque normalmente estos algoritmos no ofrecen dificultad).
Aunque el test de permutacin es a menudo trivial para cualquiera con recursos
informticos y experiencia en programacin, todava se usan ampliamente los
mtodos tradicionales para obtener significacin. La aproximacin ms bsica es
comparar el observado con tablas publicadas para varios niveles de
significacin. Es una solucin simple si la significacin slo necesita saberse
dentro de cierto rango, o ser menor de un determinado valor, mientras haya tablas
disponibles que especifiquen los rangos adecuados. Ms abajo hay una referencia
a una tabla semejante. Sin embargo, generar estas tablas es computacionalmente
intensivo y a lo largo de los aos se han usado complicados trucos matemticos
para generar tablas para tamaos de muestra cada vez mayores, de modo que no
es prctico para la mayora extender las tablas existentes.
Una aproximacin alternativa para tamaos de muestra suficientemente grandes
es una aproximacin a la distribucin t de Student. Para tamaos de muestra ms
grandes que unos 20 individuos, la variable

tiene una distribucin t de Student en el caso nulo (correlacin cero). En el caso no


nulo (ej: para averiguar si un observado es significativamente diferente a un
valor terico o si dos s observados difieren significativamente, los tests son
mucho menos potentes, pero puede utilizarse de nuevo la distribucin t.
Una generalizacin del coeficiente de Spearman es til en la situacin en la cual
hay tres o ms condiciones, varios individuos son observados en cada una de
ellas, y predecimos que las observaciones tendrn un orden en particular. Por
ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar
cierta tarea, y predecimos que su habilidad mejorar de intento en intento. Un test
de la significacin de la tendencia entre las condiciones en esta situacin fue
desarrollado por E. B. Page y normalmente suele conocerse como Page's trend
test para alternativas ordenadas.

También podría gustarte