Está en la página 1de 3

Artículo de Educación

Modelos de Regresión y Correlación IV. Correlación de Spearman


REGRESSION MODELS AND CORRELATION IV. SPEARMAN CORRELATION

MD Mauricio Salinas
MD, MPH(c) Director Unidad de Epidemiología y Estadística.
Fundación Científica y Tecnológica ACHS.

RESUMEN ABSTRACT
Con frecuencia nos enfrentamos al análisis de variables que son de We often face the analysis of variables that are of quantitative dis-
carácter cuantitativo discreto y/o con jerarquía. Estos no son suscepti- crete character and/or with hierarchy. These are not susceptible of
bles de un análisis de regresión lineal y tampoco se puede utilizar linear regression analysis nor can logistic regression be used. There
regresión logística. Existe la posibilidad de hacer correlación por ran- is the possibility of making Spearman´s rank correlation, a method
gos de Spearman, método muy utilizado en estudios del ámbito psi- widely used in psychosocial field studies. This article explains what
cosocial. En este artículo se explica en qué consiste este método y is this method about and which are its mathematical foundations. It
cuáles son sus fundamentos matemáticos. Se enseña cómo aplicarlo is taught how to apply it using an example easy to be reproduced in
utilizando un ejemplo fácil de reproducir en cualquier planilla de cál- any spreadsheet. Finally, its limitations and advantages are men-
culo. Finalmente se mencionan sus limitaciones y ventajas. tioned.

(Salinas M. 2007. Modelos de regresión y correlación IV. Correlación Descriptors: STATISTICS, NONPARAMETRIC; REGRESSION ANALYSIS.
de Spearman. Cienc Trab. jul-sep;9(25):143:145).

Descriptores: ESTADÍSTICAS NO PARAMÉTRICAS; ANÁLISIS DE


REGRESIÓN.

INTRODUCCIÓN en el resultado de encuestas de índole psicosocial, para medir


fenómenos como burnout, presentismo, fatiga, resiliencia y otros.
En números anteriores hemos visto básicamente dos modelos, En estos casos, cuando la variable dependiente o independiente
desde la perspectiva del tipo de datos analizados: regresión lineal es ordinal y/o cuantitativa discreta, debemos buscar un método
para enfrentarnos a datos cuantitativos (Salinas y Silva 2007) y alternativo para determinar si existe correlación entre las varia-
regresión logística para datos cualitativos con dos posibles bles. Para resolver esta situación lo más utilizado es la correla-
respuestas (Silva y Salinas 2007). ción de Spearman, que explicaremos a continuación.
Sin embargo, con frecuencia debemos resolver problemas con
datos cuantitativos de carácter discreto. Recordemos que una
variable cuantitativa discreta es aquélla en la cual no existen CORRELACIÓN POR RANGOS
infinitos números entre un valor y otro, a diferencia de las cuan-
titativas continuas, que sí cumplen esta condición (Taucher La correlación de Spearman, o por rangos, se basa en reemplazar
1997). Ejemplos de variables discretas son: el número de trabaja- los valores originales, de ambas variables, por números enteros
dores o el número de sucursales de una empresa. Éstos pueden positivos, comenzando del 1 en adelante, que correspondan a su
tomar valores de 1, 2, 5, 50, etc., pero no pueden ser 5,5 o 2,7. ordenamiento de menor a mayor magnitud (RANGOS). Para ello,
En otras ocasiones debemos aproximarnos a datos de carácter los valores reales de cada una de las variables son ordenados de
ordinal, es decir, que los distintos valores posibles de la variable menor a mayor, por separado y reemplazados por los rangos
sólo tienen jerarquía. Ejemplo de esto es el grado funcionario de (Guilford y Fruchter 1984).
un trabajador: directivo, administrativo, vendedor o el grado de Supongamos 6 pares de valores (X,Y) presentados en la Tabla 1
estrés de una persona. Este tipo de valores se ven con frecuencia junto con los valores de sus rangos:

Tabla 1.
Plantilla básica para el cálculo de la correlación por rangos.
VARIABLES RANGOS Diferencia Diferencia
X Y RX Ry RX-Ry al cuadrado
Correspondencia / Correspondence
18 31 1 2 -1 1
Mauricio Salinas F.
20 33 2 3 -1 1
Fundación Científica y Tecnológica ACHS
23 30 3 1 2 4
Vicuña Mackenna 210, piso 6, Providencia
24 50 4 6 -2 4
Tel.: (56-2) 685 29 61
40 40 5 4 1 1
e-mail: msalinasf@achs.cl
55 45 6 5 -1 1
Recibido: 05 de septiembre de 2007 / Aceptado: 10 de septiembre de 2007

Ciencia & Trabajo | AÑO 9 | NÚMERO 25 | JULIO / SEPTIEMBRE 2007 | www.cienciaytrabajo.cl | 143/145 143
Artículo Original | Salinas Mauricio

Si hacemos una gráfica de RY vs RX obtenemos el Gráfico 1: cero, se deben realizar algunas modificaciones para obtener el r, las
cuales no revisaremos en este artículo. En este último caso, tampoco
Gráfico 1.
es posible utilizar la fórmula 1.
Gráfica de los rangos de la Tabla 1.
Nótese que si cambiáramos el Valor X=55 por X=75 o el valor Y=50
por Y=60, o hiciéramos ambos cambios, el valor de los rangos no se
altera y, por lo tanto, el valor de rs sigue siendo 0,657. Es decir, la
estadística correlación por rangos de Spearman no es influenciada
por valores extremos de X o de Y, al revés de lo que ocurre con la
correlación lineal o de Pearson. Por eso es muy adecuado usar rs
cuando X e Y son cuantitativas, pero no normales.

UTILIZANDO CORRELACIÓN DE SPEARMAN


A continuación analizaremos un ejemplo con datos inventados, pero
que perfectamente puediesen corresponder a la realidad. El análisis
siguiente se puede hacer utilizando Excel. Para simplificarlo, no
existen empates en los datos.
Supongamos que se investiga la presencia de Burnout (Síndrome de
estar quemado, en español) y Presentismo en los trabajadores de una
empresa (Arteaga et al. 2007; Vera et al. 2007). Para ello se aplica a
25 individuos dos instrumentos distintos, para medir ambos fenó-
Si evaluamos la correlación lineal simple, también llamada corre- menos. Los resultados se muestran en la Tabla 2.
lación de Pearson, entre tales rangos obtenemos r = 0,65 (Silva y Tabla 2.
Salinas 2006). Este coeficiente de correlación lineal entre rangos Puntajes de Burnout y Fatiga en 25 trabajadores.
se conoce como correlación de Spearman. INDIVIDUO ESCALA DE BURNOUT ESCALA DE FATIGA
1 153 57
Dado que la correlación de Spearman siempre utiliza la misma 2 149 55
3 165 70
escala para los rangos de las observaciones de X e Y (1, 2, 3, 4, 4 166 73
etc.), el análisis se puede hacer mediante la siguiente fórmula: 5 173 79
6 158 60
7 174 85
8 176 83
9 169 74
(1) 10 167 75
11 160 61
Donde: 12 168 62
13 159 67
14 162 82
rS = coeficiente de correlación de Spearman 15 161 77
D2 = Cuadrado de las diferencias entre X e Y 16 163 66
N = número de parejas 17 155 65
18 164 68
Esta fórmula es una definición alternativa, muy cómoda, de la 19 156 69
20 171 80
correlación de Spearman. El coeficiente de correlación de Spearman 21 170 76
suele designarse con la letra griega Rho. 22 157 54
23 154 63
Si se introducen los valores de la Tabla 1 en la fórmula (1), ésta 24 172 78
queda de la siguiente forma: 25 175 94

La hipótesis de trabajo es que mientras mayor Burnout presenta un


trabajador, menor es su productividad y, por lo tanto, mayor
Presentismo autorreportado. Para corroborar esto debemos ver si
Y resolviendo obtenemos: existe correlación entre ambas escalas.
Podríamos tratar de aplicar regresión lineal; sin embargo, la escala
es discreta y además el rango de los valores es bastante estrecho y
no tienen distribución normal. Por lo tanto, es mejor utilizar un
método de correlación por rangos.
Lo primero que debemos hacer es asignar los nuevos valores a las
Como se observa la fórmula obtiene el mismo valor de r que la regre- variables. Para ello, copie los datos en una hoja de cálculo y ordé-
sión lineal. Ésta es la base de la correlación por rangos. Cuando nelos de menor a mayor, utilizando los puntajes de Burnout. Luego
existen empates, que se refiere a diferencias entre X e Y iguales a cree una columna nueva al lado de ésta y asigne los puntajes

144 143/145 | www.cienciaytrabajo.cl | AÑO 9 | NÚMERO 25 | JULIO / SEPTIEMBRE 2007 | Ciencia & Trabajo
Artículo Original | Modelos de Regresión y Correlación IV. Correlación de Spearman

Tabla 3. Ejemplo de cálculo de valores para correlación de Spearman en muestra de 25 trabajadores.


INDIVIDUO ESCALA DE BURNOUT ESCALA DE FATIGA BURNOUT RANGOS FATIGA RANGOS DIFERENCIAS (D) D2
1 149 55 1 2 -1 1
2 153 57 2 3 -1 1
3 154 63 3 7 -4 16
4 155 65 4 8 -4 16
5 156 69 5 12 -7 49
7 157 60 6 4 2 4
8 158 67 7 10 -3 9
6 159 54 8 1 7 49
9 160 61 9 5 4 16
10 161 77 10 18 -8 64
11 162 82 11 22 -11 121
14 163 70 12 13 -1 1
15 164 73 13 14 -1 1
16 165 75 14 16 -2 4
12 166 66 15 9 6 36
13 167 68 16 11 5 25
18 168 74 17 15 2 4
17 169 62 18 6 12 144
19 170 76 19 17 2 4
20 171 80 20 21 -1 1
22 172 79 21 20 1 1
21 173 78 22 19 3 9
23 174 85 23 24 -1 1
24 175 94 24 25 -1 1
25 176 83 25 23 2 4
Suma D2 582

comenzando del 1 en adelante. Una vez que termine, repita el mismo escapa a los objetivos de esta revisión. Sólo por curiosidad mencio-
procedimiento utilizando los puntajes de Fatiga. nemos que en este ejemplo el valor p es < 0,0001.
Ahora cree una columna que denominaremos D, y calcule las dife-
rencias entre los rangos asignados a las variables. Luego cree otra
columna más, que llamaremos D2–donde irá el resultado de D*D–, es COMENTARIOS FINALES
decir, el cuadrado de las diferencias. Finalmente sume estas diferen-
cias cuadráticas. La correlación de Spearman es un excelente método para cuantificar
Los datos quedarán como se muestra en la Tabla 3. la relación entre dos escalas de valores discretos y/o con jerarquía
(ordinales). También es una excelente opción cuando los datos no
Utilicemos ahora la fórmula (1) tienen distribución normal bivariante, especialmente si hay valores
extremos.
El método de Spearman permite calcular correlación, pero sólo entre
dos variables. Este método tampoco permite hacer regresión, es decir,
no se puede modelar la variable respuesta Y con varios predictores en
Y reemplazando con los valores de la tabla forma simultánea o ver la influencia de un predictor sobre otro. En
este sentido, el método es mucho menos poderoso que la regresión
lineal o logística.
Los análisis mostrados aquí son un ejemplo para entender el método.
Existen múltiples programas computacionales e incluso páginas Web
que calculan Rho Spearman en forma automática. El valor de r puede
De tal forma, que la correlación entre Síndrome de Burnout y ser un poco distinto del calculado de la manera mostrada en este
Presentismo tiene un coeficiente de correlación por rangos de 0,776. ejemplo, ya que los programas computacionales ocupan la fórmula
Existe una estrecha relación entre ambos fenómenos. de regresión de Pearson, utilizando los valores de los rangos.
El valor p asociado al coeficiente de correlación de Spearman se Finalmente, si alguien desea más información sobre este tema, puede
calcula con otra fórmula que no detallaremos en este artículo, ya que consultar la bibliografía al final del artículo.

REFERENCIAS
Arteaga O, Vera A, Carrasco C, Contreras G. 2007. Presentismo (Presenteeism) y su Silva C, Salinas M. 2006. Modelos de Regresión y Correlación. Cienc Trab. Oct-Dic;
relevancia para la Salud Ocupacional en Chile. Cienc Trab. Abr-Jun; 9(24): 61-63. 8(22):185-189.
Guilford JP, Fruchter B. 1984. Métodos y problemas especiales de correlación. En: ————. Salinas M. 2007. Modelos de Regresión y Correlación III. Regresión Logística.
Estadística aplicada a la sicología y la educación. Editorial MacGraw–Hill. p. Cienc Trab. Abr-Jun; 9(24):81 – 84.
265–333. Vera A, Cancino L, Ravanal I, Carrasco C, Contreras G, Arteaga O. 2007. Burnout, Inteligencia
Salinas M, Silva C. 2007. Modelos de Regresión y Correlación II. Regresión Lineal Emocional y Factores de Riesgos Psicosociales Laborales en fiscalizadores de una
Múltiple. Cienc Trab. 23:39 – 41. repartición pública del Estado de Chile. Cienc Trab. Abr-Jun; 9(24):51-54.

Ciencia & Trabajo | AÑO 9 | NÚMERO 25 | JULIO / SEPTIEMBRE 2007 | www.cienciaytrabajo.cl | 143/145 145

También podría gustarte