Está en la página 1de 4

Coeficiente de correlacin de Spearman - Wikipedia, la enciclopedia libre https://es.wikipedia.

org/wiki/Coeficiente_de_correlacin_de_Spearman

Coeficiente de correlacin de Spearman


De Wikipedia, la enciclopedia libre

En estadstica, el coeficiente de correlacin de Spearman, (rho)


es una medida de la correlacin (la asociacin o interdependencia)
entre dos variables aleatorias continuas. Para calcular , los datos
son ordenados y reemplazados por su respectivo orden.

El estadstico viene dado por la expresin:

El coeficiente de correlacin de
Spearman es menos sensible que el de
donde D es la diferencia entre los correspondientes estadsticos de Pearson para los valores muy lejos de
orden de x - y. N es el nmero de parejas de datos. lo esperado. En este ejemplo: Pearson
= 0.30706 Spearman = 0.76270
Se tiene que considerar la existencia de datos idnticos a la hora de
ordenarlos, aunque si stos son pocos, se puede ignorar tal
circunstancia

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximacin a la distribucin t de


Student

La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin de Pearson.


Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlacin pero no independencia. La tau de Kendall es un coeficiente de correlacin por rangos,
inversiones entre dos ordenaciones de una distribucin normal bivariante.

ndice
1 Ejemplo
2 Determinando la significacin estadstica
3 Vase tambin
4 Enlaces externos
5 Fuente

Ejemplo
Los datos brutos usados en este ejemplo se ven debajo.

1 de 4 28/7/17 23:30
Coeficiente de correlacin de Spearman - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Coeficiente_de_correlacin_de_Spearman

CI Horas de TV a la semana
106 7
86 0
100 28
100 50
99 28
103 28
97 20
113 12
113 7
110 17

El primer paso es ordenar los datos de la primera columna. Se agregan dos columnas 'orden(i)' y 'orden(t)'

Para el orden i, se correspondern con el nmero de fila del cuadro, para 99, orden(i) =3 ya que ocupa el 3.er
lugar, ordenado de menor a mayor

para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de TV a la semana', para no hacer otro
cuadro, la secuencia ordenada quedara

T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }

para este caso, el orden sera para cada elemento, respectivamente:

orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }

sin embargo, el valor de orden est dado por el valor promedio de sus posiciones, as para:

7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.5

28 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 8

50 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10

Despus, se crean dos columnas ms, una columna "d" que muestra las diferencias entre las dos columnas de
orden y, otra columna "d2". Esta ltima es slo la columna "d" al cuadrado.

Despus de realizar todo esto con los datos del ejemplo, se debera acabar con algo como lo siguiente:

2 de 4 28/7/17 23:30
Coeficiente de correlacin de Spearman - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Coeficiente_de_correlacin_de_Spearman

CI (i) Horas de TV a la semana (t) orden(i) orden(t) d d2


86 0 1 1 0 0
97 20 2 6 4 16
99 28 3 8 5 25
100 50 4.5 10 5.5 30.25
100 28 4.5 8 3.5 12.25
103 28 6 8 2 4
106 7 7 2.5 4.5 20.25
110 17 8 5 3 9
113 7 9.5 2.5 7 49
113 12 9.5 4 5.5 30.25

Ntese como el nmero de orden de los valores que son idnticos es la media de los nmeros de orden que
les corresponderan si no lo fueran.

Los valores de la columna d2 pueden ser sumados para averiguar . El valor de n es 10. As que
esos valores pueden ser sustituidos en la frmula.

De lo que resulta .

Determinando la significacin estadstica


La aproximacin moderna al problema de averiguar si un valor observado de es significativamente
diferente de cero (siempre tendremos -1 1) es calcular la probabilidad de que sea mayor o igual que el
esperado, dada la hiptesis nula, utilizando un test de permutacin. Esta aproximacin es casi siempre
superior a los mtodos tradicionales, a no ser que el conjunto de datos sea tan grande que la potencia
informtica no sea suficiente para generar permutaciones (poco probable con la informtica moderna), o a
no ser que sea difcil crear un algoritmo para crear permutaciones que sean lgicas bajo la hiptesis nula en
el caso particular de que se trate (aunque normalmente estos algoritmos no ofrecen dificultad).

Aunque el test de permutacin es a menudo trivial para cualquiera con recursos informticos y experiencia
en programacin, todava se usan ampliamente los mtodos tradicionales para obtener significacin. La
aproximacin ms bsica es comparar el observado con tablas publicadas para varios niveles de
significacin. Es una solucin simple si la significacin slo necesita saberse dentro de cierto rango, o ser
menor de un determinado valor, mientras haya tablas disponibles que especifiquen los rangos adecuados.
Ms abajo hay una referencia a una tabla semejante. Sin embargo, generar estas tablas es
computacionalmente intensivo y a lo largo de los aos se han usado complicados trucos matemticos para
generar tablas para tamaos de muestra cada vez mayores, de modo que no es prctico para la mayora
extender las tablas existentes.

Una aproximacin alternativa para tamaos de muestra suficientemente grandes es una aproximacin a la
distribucin t de Student. Para tamaos de muestra ms grandes que unos 20 individuos, la variable

3 de 4 28/7/17 23:30
Coeficiente de correlacin de Spearman - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Coeficiente_de_correlacin_de_Spearman

tiene una distribucin t de Student en el caso nulo (correlacin cero). En el caso no nulo (ej: para averiguar si
un observado es significativamente diferente a un valor terico o si dos s observados difieren
significativamente), los tests son mucho menos potentes, pero puede utilizarse de nuevo la distribucin t.

Una generalizacin del coeficiente de Spearman es til en la situacin en la cual hay tres o ms condiciones,
varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrn un orden
en particular. Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta
tarea, y predecimos que su habilidad mejorar de intento en intento. Un test de la significacin de la
tendencia entre las condiciones en esta situacin fue desarrollado por E. B. Page y normalmente suele
conocerse como Page's trend test para alternativas ordenadas.

Vase tambin
Regresin lineal

Enlaces externos
Tabla de los valores crticos del coeficiente de correlacin de Spearman para muestras pequeas
(http://www.sussex.ac.uk/Users/grahamh/RM1web/Rhotable.htm) (ingls)
Calculadora en internet (http://www.wessa.net/rankcorr.wasp) (ingls)

Fuente
Wikipedia. Traduccin del ingls.

Obtenido de https://es.wikipedia.org/w/index.php?title=Coeficiente_de_correlacin_de_Spearman&
oldid=100276038

Se edit esta pgina por ltima vez el 5 jul 2017 a las 15:29.
El texto est disponible bajo la Licencia Creative Commons Atribucin Compartir Igual 3.0; pueden
aplicarse clusulas adicionales. Al usar este sitio, usted acepta nuestros trminos de uso y nuestra
poltica de privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una organizacin sin nimo de
lucro.

4 de 4 28/7/17 23:30

También podría gustarte