Está en la página 1de 4

El Coeficiente de Correlación de Rango de Spearman

FICHA TÉCNICA:
Hipótesis nula: las dos variables de interés no se encuentran asociadas de ninguna manera.
Hipótesis alternativa: las dos variables muestran algún tipo de asociación (correlación)
positiva o negativa; es decir, al variar los valores de una cambiarán necesariamente los
valores de la segunda.
Nivel de Significancia (alfa): 0.05
Estadístico de la prueba: rs
Grados de Libertad= (n 2).
Decisión: se acepta la Hipótesis Alternativa si el valor calculado de r tiene una probabilidad
asociada menor al alfa escogido (p<0.05).

Este coeficiente es una medida de asociación lineal que utiliza los rangos, o números de orden, de
cada grupo de sujetos y compara dichos rangos. Existen dos métodos para calcular el coeficiente de
correlación de los rangos: uno señalado por Spearman y otro por Kendall. El r de Spearman llamado
también rho de Spearman es más fácil de calcular que el de Kendall.

El coeficiente de correlación de Spearman es exactamente el mismo que el coeficiente de


correlación de Pearson calculado sobre los rangos de las observaciones y no sobre sus valores
crudos; en otras palabras, la correlación estimada entre X e Y se efectúa calculando el coeficiente de
correlación de Pearson para el conjunto de rangos apareados.

El coeficiente de correlación de Spearman suele utilizarse cuando las distribuciones de los datos no
son normales y/o el tamaño de la muestra es pequeño.

El cálculo del coeficiente viene dado por:

en donde di = rxi ryi es la diferencia entre los rangos de X e Y.

n = tamaño de la muestra

Los valores de los rangos se colocan según el orden numérico de los datos de la variable.

Para buscar la probabilidad asociada a rs se lo puede hacer en una Tabla para esta prueba (Apéndice
10), pero si no se la tiene se puede hacer la transformación a la t de Student a través de:

gl = n 2

Yánez, P. (2016). Biometría y Bioestadística Fundamentales. Quito: Biodata. 132 pp. ISBN: 978-9942-8586-2-7. 71
Ejercicios

Ejercicio 30: se realiza un estudio para determinar la asociación entre la concentración de nicotina
en la sangre de varios individuos y el contenido de nicotina en los cigarrillos que ellos fuman; los
valores de los rangos están entre paréntesis.

X Y
Concentración de Contenido de nicotina por
nicotina en sangre cigarrillo
(nmol/litro) (mg)
185.7 (2) 1.51 (8)
197.3 (5) 0.96 (3)
204.2 (8) 1.21 (6)
199.9 (7) 1.66 (10)
199.1 (6) 1.11 (4)
192.8 (3) 0.84 (2)
207.4 (9) 1.14 (5)
183.0 (1) 1.28 (7)
234.1 (10) 1.53 (9)
196.5 (4) 0.76 (1)

Los valores originales después de haberlos convertido en sus rangos respectivos se encuentran
escritos entre paréntesis.

El valor del Coeficiente de Correlación de Rango de Spearman para las dos variables anteriores se
desarrolla de la siguiente manera:

Si utilizamos la fórmula para calcular el coeficiente de correlación de Pearson de los rangos


obtendríamos el mismo resultado:

Yánez, P. (2016). Biometría y Bioestadística Fundamentales. Quito: Biodata. 132 pp. ISBN: 978-9942-8586-2-7. 72
La interpretación del coeficiente rs de Spearman es similar a la interpretación del de Pearson: los
valores próximos a 1 indican una correlación fuerte y positiva. Valores próximos a 1 indican una
correlación fuerte y negativa. Valores próximos a cero indican que no hay correlación lineal. Así
mismo el tiene el mismo significado que el coeficiente de determinación de r2.

Para el ejercicio anterior el valor de rs= 0.27 tiene una probabilidad asociada > 0.05 (Apéndice 10)
(p= 0.44 para ser exactos), por lo que podemos decir que no es significativo y por lo tanto las dos
variables no se encuentran asociadas o correlacionadas.

La distribución de rs es similar a la de r por tanto el cálculo de los intervalos de confianza de rs se


puede realizar utilizando la misma metodología previamente explicada para el coeficiente de
correlación de Pearson (y por consiguiente, utilizando la misma tabla de significancia que para la
correlación de Pearson, Apéndice 3).

Recuerde que en esta prueba, al igual que en otras no paramétricas, cuando existen valores iguales
en las columnas se deben escribir como rangos los promedios de los rangos que hubiesen sido
asignados si no hubiese habido coincidencias. Por ejemplo, si en una de las variables X tenemos:

X (edad) (Los rangos


serían)
23 1.5
23 1.5
27 3.5
27 3.5
39 5
41 6
45 7
... ...

Ejercicio 31: en un Hospital de Ecuador se lleva un registro de las causas de las visitas que los
pacientes hacen por trastornos digestivos. Un médico sospecha que puede existir una relación entre
el consumo de ají y las visitas que efectúan ciertos pacientes, elije 6 pacientes al azar y toma dos
tipos de datos a lo largo de un año.

Consumo de ají (en Número de visitas al


mililitros) por persona médico por año debidas
por año a dolencias estomacales
1000 16
1245 14
980 15
768 11
545 9
456 4

Escriba su hipótesis de trabajo, determine si existe la relación y que grado podría tener (positivo o
negativo) a través del cálculo del coeficiente de correlación de Spearman. Además de presentar los
valores de rs y p , grafique en papel milimetrado los datos bajo un sistema XY y decida si ambas
variables están asociadas o no (alfa límite: 0.05).

Yánez, P. (2016). Biometría y Bioestadística Fundamentales. Quito: Biodata. 132 pp. ISBN: 978-9942-8586-2-7. 73
Verifique si sus resultados estadísticos corresponden a : rs = 0.828 , N=6 , p > 0.05 (p = 0.041);
coeficiente no significativo ; no existe asociación entre ambas variables.

Yánez, P. (2016). Biometría y Bioestadística Fundamentales. Quito: Biodata. 132 pp. ISBN: 978-9942-8586-2-7. 74

También podría gustarte