Está en la página 1de 10

r de Spearman y

de Pearson

Metodología de
Análisis de Datos
Cuantitativos

1
r de Spearman y de Pearson
Para las variables cuantitativas o numéricas (tanto intervalares como
medidas en escalas de razón), podemos calcular como medidas de la
asociación entre ellas, diferentes coeficientes que permiten cuantificar la
correlación entre sí.

Coeficiente de correlación por rangos de Spearman


Este coeficiente es una medida de asociación lineal que utiliza los rangos,
números de orden, de cada grupo de sujetos y compara dichos rangos.
El denominado rho de Spearman es análogo al coeficiente de correlación de
Pearson, que presentaremos a continuación, pero en este caso calculado
sobre el rango de observaciones.
Esta diferencia implica que la correlación estimada entre las variables X e Y
corresponda en este caso a diferencias entre dados apareados. El coeficiente
de correlación de Spearman es recomendable para situaciones en las que los
datos presentan valores externos, lo que los valores afectan demasiado el
coeficiente de correlación de Pearson, o para el caso de distribuciones no
normales.
El cálculo del coeficiente viene dado por:

Donde di es la diferencia de los rangos de X y Y.


Los valores de los rangos se colocan según el orden numérico de los datos
de la variable.
Veamos un ejemplo:

2
Tabla 1: Edad del ciudadano vs cantidad de elecciones en las que votó

Edad del ciudadano Cantidad de elecciones en las


que votó
18 0
25 2
35 7
17 0
35 8
45 9
53 12
46 8
27 5
66 19
70 16
56 13
30 3

Fuente: elaboración propia.

Si ordenamos cada variable de menor a mayor, podemos asignar a cada valor


de cada variable un rango correspondiente a la posición que ocupa en la
serie ordenada. Cuando aparezcan valores coincidentes se coloca el
promedio de los rangos que hubiesen sido asignado si no hubiese
coincidencias.
La siguiente tabla incorpora entre paréntesis el rango para cada valor de
ambas series:

3
Tabla2: Tabla de datos incluyendo rango

Edad del ciudadano Cantidad de elecciones en las


que votó
18 (2) 0 (1,5)
25 (3) 2 (3)
35 (6,5) 7 (6)
17 (1) 0 (1,5)
35 (6,5) 8 (7,5)
45 (8) 9 (9)
53 (10) 12 (10)
46 (9) 8 (7,5)
27 (4) 5 (5)
66 (12) 19 (13)
70 (13) 16 (12)
56 (11) 13 (11)
30 (5) 3 (4)

Por lo tanto, las diferencias quedan de la siguiente manera, si directamente


trabajamos con los rangos respectivos:

4
Tabla 3

Rango de edad Rango de di di2


cantidad de
elecciones en
las que
votó
2 1,5 0,5 0,25
3 3 0 0
6,5 6 0,5 0,25
1 1,5 -0,5 0,25
6,5 7,5 -1 1
8 9 -1 1
10 10 0 0
9 7,5 1,5 2,25
4 5 -1 1
12 13 -1 1
13 12 1 1
11 11 0 0
5 4 1 1

Para calcular el valor de r de Spearman tenemos:

Interpretación del coeficiente de correlación de Spearman:

 Los valores próximos a 1 indican una correlación fuerte y positiva.


 Los valores próximos a –1 indican una correlación fuerte y negativa.
 Valores próximos a cero indican que no hay correlación lineal.

En el caso del ejemplo, el valor del coeficiente de correlación indica una


correlación positiva fuerte: a medida que es mayor la edad del ciudadano,
mayor el número de elecciones en las que votó.

5
Coeficiente de correlación por rangos de Pearson
La medida de la relación lineal entre dos variables cuantitativas, se estudia
por medio del cálculo del coeficiente de correlación de Pearson.
Interpretación de los resultados:
Este coeficiente brindará valores entre –1 y +1.

 Cuando el valor tiende a 1, la asociación positiva es elevada. Un valor de


1 indica una relación lineal positiva perfecta.
 Cuando el valor tiende a -1, la asociación negativa es elevada. Un valor
de -1 indica una relación lineal negativa perfecta.
 Una correlación próxima a cero indica que no hay relación lineal entre
las dos variables.

La representación gráfica de los datos para visualizar la relación entre el


valor del coeficiente de correlación y la forma de la gráfica es fundamental
ya que podría existir una relación no lineal o la ausencia de relación que
prever desde el propio gráfico.
El coeficiente de correlación posee las siguientes características:
El valor del coeficiente de correlación es independiente de cualquier unidad
de medida usada para medir las variables. Esto implica que el coeficiente es
una magnitud que no posee una unidad de medida propia.
El valor del coeficiente de correlación se altera de forma importante ante la
presencia de un valor extremo.
El coeficiente de correlación mide solo la relación lineal. Dos variables
pueden tener una relación no lineal fuerte, a pesar de que su correlación sea
pequeña. Por tanto cuando se consideren las relaciones entre dos variables
debe preliminarmente partir de su representación gráfica y luego calcular el
coeficiente de correlación.
El coeficiente de correlación no se debe extrapolar más allá del rango de
valores considerado para su cálculo ya que la relación existente entre X e Y
puede cambiar fuera de dicho rango.
La correlación no implica causalidad. La causalidad requiere más
información que un simple valor cuantitativo de un coeficiente de
correlación y especialmente trabajarse a partir de los modelos teóricos
propios de cada disciplina.
El coeficiente de correlación de Pearson puede calcularse en cualquier grupo
de datos.
La validez del test de hipótesis sobre la correlación entre las variables exige
el cumplimiento de los siguientes supuestos:

1) Que ambas variables correspondan a una muestra aleatoria de


individuos.
2) Que al menos una de las variables tenga una distribución normal en la
población de la cual la muestra procede.

6
El coeficiente de correlación puede arrojar valores entre –1 y +1, en tanto el
valor 0 indica que no existe asociación lineal entre las dos variables a
estudio.
Mostraremos ahora el cálculo del coeficiente de correlación de Pearson a
través de un ejemplo.
Se dispone de la siguiente información captada en una muestra de recién
nacidos, en la cual se registra el dato de edad gestacional y el peso al nacer
(en gramos).

Figura 1: Datos de análisis

El primer paso es obtener las medias de cada una de las variables:


X =̅ 35,89 semanas.
Y ̅=2599,20 gramos.
Para el cálculo del coeficiente, incluiremos las columnas auxiliares
correspondientes a los desvío y al producto de los desvíos, respecto de las
medias respectivas.

7
Figura 2: Desviaciones

Para el cálculo del coeficiente de correlación de Pearson consideramos las


sumas de las columnas respectivas:

Observe que el valor del coeficiente de correlación alcanza un valor muy


próximo a 1, lo cual, como indicamos previamente, significa que la relación
entre las variables es positiva y fuerte.
Tras realizar el cálculo del coeficiente de correlación de Pearson se debe
determinar si dicho coeficiente es estadísticamente diferente de cero, o lo

8
que es lo mismo, si ese valor no se debió sólo al azar. Para dicho cálculo se
aplica un test basado en la distribución de la t de Student.

9
Referencias
Aaron y Aaron (2001). Capítulos 14 y 16.

Blalock, H. (1978). Introducción A La Investigación Social. Capítulos XV, XVII, XVIII y


XIX.

10