Está en la página 1de 6

Correlacin de Spearman

En estadstica, el coeficiente de correlacin de Spearman, (rho) es una


medida de la correlacin (la asociacin o interdependencia) entre dos variables
aleatorias continuas. Para calcular , los datos son ordenados y reemplazados
por su respectivo orden.
El estadstico viene dado por la expresin:
donde D es la
correspondientes
N es el nmero de

diferencia entre los


estadsticos de orden de x - y.
parejas.

Se tiene que considerar la existencia de datos idnticos a la hora de


ordenarlos, aunque si stos son pocos, se puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente
aproximacin a la distribucin t de Student

La interpretacin
de coeficiente de Spearman es
igual que la del coeficiente de correlacin de Pearson. Oscila entre -1 y +1,
indicndonos asociaciones negativas o positivas respectivamente, 0 cero,
significa no correlacin pero no independencia. La tau de Kendall es un
coeficiente de correlacin por rangos, inversiones entre dos ordenaciones de
una distribucin normal bivariante.

Ejemplo:

El primer paso es
ordenar los datos
de la primera columna. Se agregan dos columnas 'orden(i)' y 'orden(t)'

Para el orden i, se correspondern con el nmero de fila del cuadro, para 99,
orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a mayor
para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de TV a la
semana', para no hacer otro cuadro, la secuencia ordenada quedara
T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }

para este caso, el orden sera para cada elemento, respectivamente:


orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }

sin embargo, el valor de orden est dado por el valor promedio de sus
posiciones, as para:
7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5
28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8
50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10
Despus, se crean dos columnas ms, una columna "d" que muestra las
diferencias entre las dos columnas de orden y, otra columna "d 2". Esta ltima es
slo la columna "d" al cuadrado.
Despus de realizar todo esto con los datos del ejemplo, se debera acabar con
algo como lo siguiente:

Ntese como el nmero de orden de los valores que son idnticos es la media
de los nmeros de orden que les corresponderan si no lo fueran.

Los valores de la columna d2 pueden ser sumados para averiguar


valor de n es 10. As que esos valores pueden ser sustituidos en la frmula.

.El

De lo que resulta:

Determinando la significacin estadstica


La aproximacin moderna al problema de averiguar si un valor observado de
es significativamente diferente de cero (siempre tendremos -1 1) es
calcular la probabilidad de que sea mayor o igual que el esperado, dada la
hiptesis nula, utilizando un test de permutacin. Esta aproximacin es casi
siempre superior a los mtodos tradicionales, a no ser que el conjunto de datos
sea tan grande que la potencia informtica no sea suficiente para generar
permutaciones (poco probable con la informtica moderna), o a no ser que sea
difcil crear un algoritmo para crear permutaciones que sean lgicas bajo la
hiptesis nula en el caso particular de que se trate (aunque normalmente estos
algoritmos no ofrecen dificultad).
Aunque el test de permutacin es a menudo trivial para cualquiera con recursos
informticos y experiencia en programacin, todava se usan ampliamente los
mtodos tradicionales para obtener significacin.

El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal


entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlacin de Pearson es independiente de la escala de medida de las
variables
El coeficiente de correlacin entre dos variables aleatorias X e Y es el cociente
El valor del ndice de correlacin vara en el intervalo [-1, +1]:
Si r = 1, existe una correlacin positiva perfecta. El ndice indica una
dependencia total entre las dos variables denominada relacin directa: cuando
una de ellas aumenta, la otra tambin lo hace en proporcin constante.
Si 0 < r < 1, existe una correlacin positiva.
Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todava relaciones no lineales
entre las dos variables.
Si -1 < r < 0, existe una correlacin negativa.

Si r = -1, existe una correlacin negativa perfecta. El ndice indica una


dependencia total entre las dos variables llamada relacin inversa: cuando una
de ellas aumenta, la otra disminuye en proporcin constante.
Resea Charles Edward Spearman
(Londres, 1863-1945) Psiclogo britnico. Sigui estudios de psicologa en
Alemania y se doctor en Leipzig. Fue profesor de mente y lgica en el
University College de Londres. En un artculo, publicado en 1904, expuso su
teora bifactorial de la inteligencia, segn la cual la ejecucin de cualquier
actividad mental depende de dos factores distintos, un factor general "g", que
es la base comn de la inteligencia y que, aunque vara libremente de un
individuo a otro, se mantiene igual para cualquiera de ellos respecto de todas
las capacidades correlacionadas, y un factor especfico "s", que son las
aptitudes especficas, que no slo varan de un individuo a otro, sino tambin
de una capacidad a otra. La nocin de un factor general despert gran inters y
mucha controversia. Sperman desarroll la tcnica estadstica conocida como
anlisis factorial, como complemento indispensable de su teora. Tambin
aport el coeficiente de correlacin ordinal que lleva su nombre, que permite
correlacionar dos variables por rangos en lugar de medir el rendimiento
separado en cada una de ellas. Sus obras ms importantes son The nature of
intelligence and the principles of cognition (1923) y The abilities of
man (1927). 3
Correlacin. Conceptos asociados
Regresin: La regresin es una tcnica utilizada para inferir datos a partir de
otros y hallar una respuesta de lo que puede suceder Se pueden encontrar
varios tipos de regresin, por ejemplo:

Regresin lineal simple.

Regresin mltiple ( varias variables).

Regresin logstica.

Correlacin: Expresa grado de asociacin entre dos variables, segn el sentido


de la relacin de estas en trminos de aumento o disminucin. Se clasifican en:
Lineal o curvilnea, segn la nube de puntos se condense en torno a una lnea
recta o a una curva.
Positiva o directa cuando al aumentar una variable aumenta la otra y viceversa.
Negativa o inversa cuando al crecer una variable, la otra decrece y viceversa.
Nula cuando no existe ninguna relacin y la nube de puntos estn distribuidas
al azar. Se dice que no estn correlacionadas.

Funcional si existe una funcin tal que todos los valores de la nube de puntos la
satisfacen.

COEFICIENTE DE CORRELACION
Estadstico que cuantifica la correlacin. Sus valores estn comprendidos entre
-1 y 1
COEFICIENTE DE DETERMINACION
Es el cuadrado del coeficiente de correlacin.
RHO DE SPEARMAN
Nombre utilizado para designar la correlacin de Spearman.

Cundo utilizar la prueba de correlacin de rangos de Spearman?


El coeficiente de correlacin no debe utilizarse para comparar dos mtodos que
intentan medir el mismo evento, como por ejemplo dos instrumentos que miden
la saturacin de oxgeno en sangre. El coeficiente de correlacin mide el grado
de asociacin entre dos cantidades, pero no mira el nivel de acuerdo o
concordancia. Si los instrumentos de medida miden sistemticamente
cantidades diferentes uno del otro, la correlacin puede ser 1 y su
concordancia ser nula . El coeficiente de correlacin de Spearman es
recomendable utilizarlo cuando los datos presentan valores extremos, ya que
dichos valores afectan mucho el coeficiente de correlacin de Pearson, o ante
distribuciones no normales. No est afectada por los cambios en las unidades
de medida. 5
Coeficiente de correlacin de rangos de Spearman
Como resultado de la revisin de varios autores, asumimos el siguiente
concepto:
SPEARMAN (Rho de Spearman). Este coeficiente es una medida de
asociacin lineal que utiliza los rangos, nmeros de orden, de cada grupo de
sujetos y compara dichos rangos. Existen dos mtodos para calcular el
coeficiente de correlacin de los rangos: uno, sealado por Spearman y otro,
por Kendall. El r de Spearman llamado tambin rho de Spearman es ms fcil
de calcular que el de Kendall. 5
Frmula

en donde d i = r xi r yi es la diferencia entre los rangos de X e Y.

Otra variante de la frmula expresada es:

También podría gustarte