Está en la página 1de 42

Suscríbete a DeepL Pro para poder traducir archivos de mayor t Más información disponible en .

Prueba 29
Coeficiente de correlación de rango de
Spearman (medida no paramétrica de
asociación/correlación empleada con datos ordinales)

I. Hipótesis evaluada con la prueba y los antecedentes


pertinentes
El coeficiente de correlación de Spearman es una de las medidas de correlación o
asociación que se tratan en este libro. Las medidas de correlación no son pruebas
estadísticas inferenciales, sino medidas estadísticas descriptivas que representan el grado
de relación entre dos o más variables. Al calcular una medida de correlación, es habitual
emplear una o más pruebas estadísticas inferenciales para evaluar una o más hipótesis
relativas al coeficiente de correlación. La hipótesis que se expone a continuación es la más
comúnmente evaluada para el coeficiente de correlación de Spearman.

Hipótesis evaluada con test En la población subyacente representada por una muestra,
¿tiene la correlación entre las puntuaciones de los sujetos en dos variables algún valor
distinto de cero? Esta última hipótesis también puede plantearse de la siguiente forma: En
la población subyacente representada por la muestra, ¿existe una relación monótona
significativa entre las dos variables? Es importante señalar que la naturaleza de la relación
descrita por el coeficiente de correlación de rangos de Spearman se basa en un análisis
de dos conjuntos de rangos.

Antes de leer el material de esta sección, el lector debería repasar el análisis general de la
correlación en la Sección I del coeficiente de correlación producto-momento de Pearson
(Test28). Desarrollado por Spearman (1904), el coeficiente de correlación de orden de
rango de Spearman es una medida bivariante de correlación/asociación que se emplea
con datos de orden de rango. El parámetro de población estimado por la correlación
se representará mediante la notación pS (donde p es la letra griega rho en minúscula). El
estadístico muestral calculado para estimar el valor de pS se representará mediante la
notación rS. De hecho, el coeficiente de correlación de rango de Spearman es un caso
especial del coeficiente de correlación de rango de
Coeficiente de correlación producto-momento de Pearson, cuando esta última medida se
calcula para dos conjuntos de rangos. La relación entre el coeficiente de correlación de
rangos de Spearman y el coeficiente de correlación producto-momento de Pearson se
analiza en la Sección VI.
Como en el caso del coeficiente de correlación producto-momento de Pearson, el
coeficiente de correlación de orden de rango de Spearman puede emplearse para
evaluar los datos de n sujetos, cada uno de los cuales ha aportado una puntuación en dos
variables (designadas como variables A e Y). Dentro de cada variable, las n puntuaciones
están ordenadas por rango. El coeficiente de correlación de rangos de Spearman también
Copyright 2004 por Chapman &
suele emplearse para evaluar el grado de concordancia entre las clasificaciones de m = 2
jueces para n sujetos/objetos.
Para calcular el coeficiente de correlación de Spearman, una de las siguientes
condiciones es cierta con respecto a los datos de orden de rango que se evalúan: a) Los
datos de ambas variables están en un formato de orden de rango, ya que es el único
formato para el que se dispone de datos; b) Los datos originales

Copyright 2004 por Chapman &


están en un formato de orden de rango para una variable y en un formato de intervalo/ratio
para la segunda variable. En tal caso, los datos de la segunda variable se convierten a un
formato de orden de rango para que ambos conjuntos de datos representen el mismo nivel
de medición; y c) Los datos de ambas variables se han transformado a un formato de orden
de rango a partir de un formato de intervalo/ratio, ya que el investigador tiene motivos para
creer que se han violado de forma destacada uno o más de los supuestos subyacentes al
coeficiente de correlación producto-momento de Pearson (que es el procedimiento
correlacional paramétrico análogo empleado para los datos de intervalo/ratio). Cabe
señalar que, dado que se sacrifica información cuando los datos de intervalo/ratio se
transforman en un formato de orden de rango, algunos investigadores pueden optar por
emplear el coeficiente de correlación producto-momento de Pearson en lugar del
coeficiente de correlación de orden de rango de Spearman, incluso cuando haya
razones para creer que se han violado uno o más de los supuestos de la primera medida.
El coeficiente de correlación de rango de Spearman determina el grado en que existe
una relación monótona entre dos variables. Una relación monótona puede describirse como
monótona creciente (que se asocia a una correlación positiva) o monótona decreciente (que
se asocia a una correlación negativa). Una relación entre dos variables es monótona creciente si
un aumento del valor de una variable siempre va acompañado de un aumento del valor de la
otra variable. Una relación entre dos variables es monótona decreciente si el aumento del valor
de una variable siempre va acompañado de una disminución del valor de la otra. De acuerdo
con las definiciones anteriores, una línea recta con pendiente positiva representa un ejemplo de
función monótona creciente, mientras que una línea recta con pendiente negativa representa un
ejemplo de función monótona decreciente. Además de las funciones lineales mencionadas, las
funciones curvilíneas también pueden ser monótonas. Por ejemplo, la función Y -J2
representada en la figura 29.1 representa un ejemplo d e f u n c i ó n m o n ó t o n
a c r e c i e n t e , ya que un aumento en la variable A siempre da como resultado un aumento
en la variable F. Debe tenerse en cuenta que cuando las puntuaciones de intervalo/razón de dos
variables están monotónicamente relacionadas entre sí, puede emplearse una función lineal para
describir la relación entre las ordenaciones de rango de las dos variables. Este último hecho se
demuestra en la sección Vf.

20

Y
10

1
0
Figura 29.1 Relación monótona creciente (F = Y)

Las mismas directrices generales que se describen para interpretar el valor del coeficiente
Copyright 2004 por Chapman &
de correlación producto-momento de Pearson pueden aplicarse al coeficiente de correlación
de rango de Spearman. Así, el intervalo de valores rS cm asumir viene definido por los límites -
Ia

Copyright 2004 por Chapman &


+l (es decir, - l s r < +1). El valor absoluto de rs (Î.e., | r,| ) indica la fuerza de la relación
entre las dos variables. A medida que el valor absoluto de rs se aproxima a 1, aumenta la
fuerza de la relación monótona, siendo la más fuerte cuando rg es igual a +1 o -1.
Cuanto más se acerque el valor absoluto de r$ a 0, más débil será la relación monotónica
entre las dos variables, y cuando rS -- 0 no existe ninguna relación monotónica. El signo de
r$ indica la dirección de la relación monótona (es decir, positiva/monótona creciente
frente a negativa/monótona decreciente). Al igual que en el caso del coeficiente de
correlación producto-momento de Pearson, una correlación positiva indica que el
aumento (disminución) de una variable es superior al aumento (disminución) de la otra.
asociada a un aumento (disminución) de la otra variable. Una correlación negativa indica
que un aumento (disminución) de una variable está asociado a una disminución (aumento)
de la otra variable.
Es importante señalar que la correlación no implica causalidad. Por consiguiente, si
existe una correlación fuerte entre dos variables (es decir, el valor absoluto de rs es
cercano a l), no está justificado que un investigador concluya que una variable causa la otra.
Aunque es posible que cuando existe una correlación fuerte una variable pueda, de hecho,
causar la otra variable, la información empleada en el cálculo del coeficiente de
correlación de orden de rango de Spearman docs no permite a un investigador llegar a
tal conclusión. Este es el caso, ya que variables extrañas que no han sido tenidas en cuenta
por el investigador pueden ser
responsable de la correlación observada entre las dos variables.

II. Ejemplo
El ejemplo 29.1 es idéntico al ejemplo 28.1 (que se evalúa con el coeficiente de correlación
producto-momento de Pearson). En la evaluación del ejemplo 29.1 se supondrá que los
datos de la proporción están ordenados por rango, ya que se han violado notablemente uno
o más de los supuestos del coeficiente de correlación producto-momento de Pearson.'

Ejemplo 29.1 Un psicólogo realiza un estudio empleando una muestra de cinco niños
para determinar si existe o no una relación estadística entre el número de onzas de azúcar
que un niño de diez años consume a la semana (que representará la variable X) y el número
decavidades en la boca del niño (que representará la variable Y). Las dos puntuaciones
(onzas de azúcar consumidas por semana y número de caries) obtenidas para cada uno de
los cinco niños son las siguientes. Niño 1 (20, 7); Niño 2 (0, 0); Niño 3 (1, 2); Niño 4 (12,
5); Niño 5 (3, 3). ¿Existe una correlación significativa entre el consumo de azúcar y el
número decavf'tfes?

IH. Hipótesis nulas frente a hipótesis alternativas


Al calcular el coeficiente de correlación de Spearman, se suele determinar si el valor
absoluto obtenido del coeficiente de correlación es lo suficientemente grande como para
permitir al investigador concluir que el coeficiente de correlación poblacional subyacente
entre las dos variables tiene un valor distinto de cero. En la sección V se describe cómo
puede evaluarse esta última hipótesis, que se enuncia a continuación, mediante el uso de
tablas de valores r$ críticos o mediante el uso de una prueba estadística inferencial que se
basa en las distribuciones f o r.

Hipótesis nula ff0: qS 0

Copyright 2004 por Chapman &


(En la población subyacente que representa la muestra, la correlación entre los rangos de
los sujetos en la Variable A y la Variable Y es igual a 0).

Copyright 2004 por Chapman &


Hipótesis alternativa H,: py ' 0
(En la población subyacente que representa la muestra, la correlación entre los rangos de
los sujetos en la VariableJy la Variable Y es igual a algún valor distinto de 0. Esta es una
hipótesis alternativa no direccional, y se evalúa con una prueba de dos colas. O bien un
resultado positivo significativo
rS o un valor rS negativo significativo apoyarán esta hipótesis alternativa. Para que sea
significativo, el valor absoluto obtenido de r$ debe ser igual o superior a la
valor crítico rS de dos colas tabulado al nivel de significación preespecificado).

H,: p > 0
(En la población subyacente a la que representa la muestra, la correlación entre los rangos
de los sujetos en la Variable I y la Variable r tiene algún valor superior a 0. Se trata de una
hipótesis alternativa direccional, y se evalúa con una prueba de una cola. Sólo un valor
positivo
rd proporcionará apoyo a esta hipótesis alternativa. Para que sea significativo (además del
requisito de un valor positivo de rS), el valor absoluto obtenido de rS debe ser igual o
superior al valor crítico tabulado de una cola8d ^s al nivel de significación
preespecificado).
o

Eli Ps < 0
(En la población subyacente que representa la muestra, la correlación entre los rangos de
los sujetos en la Variable A y la Variable Y es igual a algún valor inferior a 0. Esta es una
hipótesis alternativa direccional, y se evalúa con una prueba de una cola. Sólo una rS
apoyará esta hipótesis alternativa. Para que sea significativo (además
al requisito de un valor negativo de rS), el valor absoluto obtenido de rS debe ser igual o
superior al valor crítico tabulado de rS de una cola al nivel de significación preespecificado).

Nota: Sólo se emplea una de las hipótesis alternativas mencionadas. Si se confirma la


hipótesis alternativa seleccionada por el investigador, se rechaza la hipótesis nula.

IV. Cálculos de prueba


En la tabla 29.1 se resumen los datos del ejemplo 29.1. Con respecto a la tabla 29.1, debe
tenerse en cuenta lo siguiente: a) El número de sujetos es n - 5. Cada sujeto tiene una
puntuación I y una puntuación Y. Por lo tanto, hay cinco puntuaciones I y cinco
puntuaciones Y. Cada sujeto tiene una puntuación I y una puntuación Y, por lo que hay
cinco puntuaciones I y cinco puntuaciones Y; b) Las clasificaciones de las puntuaciones de
los cinco sujetos en las variables I e Y se registran respectivamente en las columnas
etiquetadas fig y fi,; c) La columna etiquetada d -- R - fip contiene una puntuación de
diferencia para cada sujeto, que se obtiene restando la clasificación de un sujeto en la
variable Y de la clasificación del sujeto en la variable A; y d) La columna etiquetada d 2
contiene el cuadrado de la puntuación de diferencia de cada sujeto.
El protocolo de clasificación empleado en la Tabla 29.1 es idéntico al empleado para
la prueba f/ de Mann-Whitney (Prueba 12). Mientras que en el caso de esta última
prueba las puntuaciones de los sujetos se ordenan dentro de cada grupo, en el cálculo de la
rho de Spearman las puntuaciones de los n = 5 sujetos se ordenan dentro de cada
Copyright 2004 por Chapman &
una de las

Copyright 2004 por Chapman &


variables. Así, en la tabla 29.1, las puntuaciones J de los cinco sujetos se ordenan de forma
que se asigna un rango de 1 a la puntuación más baja en la v a r i a b l e I, un rango de
2 a la siguiente puntuación más baja en la variable Av, y así sucesivamente hasta que se
asigna un rango de 5 a la puntuación más alta en la v a r i a b l e I. El mismo
procedimiento de ordenación se emplea con respecto a las puntuaciones J de los cinco
sujetos. El mismo procedimiento de clasificación se aplica a las puntuaciones r (es decir,
se asigna un rango de 1 a la puntuación más baja de la variable r, un rango de 2 a la
puntuación más alta de la variable r, y así sucesivamente hasta que se asigna un rango de 5
a la puntuación más alta de la variable I).

Copyright 2004 por Chapman &


Tabla 29.1 Resumen de los datos del ejemplo 29.1

Y
20 5 7 0
0 0 1 0 0
1 2 2 2 0 0
4 12 4 5 4 0 0
5 3 3 3 3 0 0
W2 = 0

a la siguiente puntuación más baja de la variable F, y así sucesivamente hasta que se asigna
un rango de 5 a la puntuación más alta de la variable Y). En caso de empate de
puntuaciones (que no se produce en el ejemplo 29.1), como ocurre en otros procedimientos
de ordenación por rango, se asigna la media de los rangos implicados a todas las
puntuaciones empatadas para un rango determinado.
Cabe señalar que es posible invertir el protocolo de clasificación descrito
anteriormente. Específicamente, para cada variable se puede asignar un rango de 1 a la
puntuación más alta en esa variable y un rango de 5 a la puntuación más baja en esa variable.
Si se utiliza este protocolo de clasificación alternativo, el valor de rS será idéntico al del
protocolo de clasificación empleado en la tabla
29.1. Cabe destacar que, independientemente del protocolo de clasificación que se emplee,
el mismo
para ambas variables. En el Ejemplo 29.1 se emplea el protocolo de asignar el rango más
bajo a la puntuación más baja y el rango más alto a la puntuación más alta, ya que permite
interpretar más fácilmente los resultados del estudio.
En la columna 6 de la tabla 29.1, se calcula que la suma de las puntuaciones de
diferencia es W= 0. De hecho, Rd siempre será igual a cero y siW es algún valor distinto
de cero, indica que se ha cometido un error en las clasificaciones y/o cálculos. En la última
columna de la tabla 29.1, se calcula la suma de las puntuaciones de diferencia al
cuadrado (Zd2 = 0). Este último valor (que sólo será igual a cero cuando rS -- 1) y el valor
deii se emplean en la ecuación 29.1, que es la
ecuación para calcular el coeficiente de correlación de orden de rango de Spearman".

6
n(n - l) (Ecuación 29.1)

Sustituyendo los valores apropiados en la Ecuación 29.1, se calcula el valor rS -- 1.

(6)(0) i
5[(5)2 l]

V. Interpretación de los resultados de las pruebas

El valor obtenido r; -- 1 se evalúa con la Tabla A18 (Tabla de Valores Críticos para
Rho de Spearman) en los Apéndices. Los valores críticos de la Tabla A18 se enumeran
en referencia a n.' Empleando la Tabla A18, se puede determinar que para n - 5 el valor
crítico tabulado de dos colas de rf; al nivel de significación de .05 es r -- I . Debido al
pequeño tamaño de la muestra, no es

Copyright 2004 por Chapman &


es posible evaluar la hipótesis nula no lineal al nivel 0,01. Los valores críticos tabulados de
rSde una cola en los niveles de significación .05 y .01 son rS -- .90 y r -- 1
Para evaluar la hipótesis nula Off se emplean las siguientes pautas: p, -
0.

Copyright 2004 por Chapman &


a) Si se emplea la hipótesis alternativa no direccional H,: pg 0, la hipótesis nula puede
rechazarse si el valor absoluto obtenido de rS es igual o superior al valor crítico tabulado de
dos colas al nivel de significación preespecificado.
b)Si se emplea la hipótesis alternativa direccional ffl: pS > 0, se puede rechazar la
hipótesis nula si el signo de rS es positivo y el valor de rS es igual o superior al valor crítico
de una cola tabulado al nivel de significación preespecificado.
c) Si se emplea la hipótesis alternativa direccional H,: pS < 0, se puede rechazar la
hipótesis nula si el signo de rS es negativo y el valor absoluto de rS es igual o superior al
valor crítico de una cola tabulado al nivel de significación preespecificado.
Siguiendo las pautas anteriores, la hipótesis alternativa no direccional H,: pS 1 0 se
confirma al nivel de 0,05, ya que el valor calculado rS -- 1 es igual al valor crítico tabulado de
dos colas rS -- l . La hipótesis alternativa direccional f/l: pS > 0 se confirma en los niveles .05
y
.01, ya que el valor calculado r -- l es un número positivo que es igual o mayor que los
valores críticos tabulados de una cola rS -- .90 y rS -- 1 . La hipótesis alternativa direccional
H,: pg < 0 no se confirma, ya que el valor calculado rS -- l es un número positivo.
Cuando se emplea el coeficiente de correlación producto-momento de Pearson para
evaluar la
mismo conjunto de datos (es decir, las puntuaciones de ratio de los sujetos están
correlacionadas entre sí), la hipótesis alternativa no direccional (es decir, N,: p ' 0) también
se apoya sólo en el nivel .05, y la hipótesis alternativa direccional (es decir, /fl: p > 0 se
apoya tanto en el nivel .05 como en el .01. Por lo tanto, en este caso, los dos coeficientes
de correlación arrojan resultados comparables. Así pues, en este caso, los dos coeficientes
de correlación arrojan resultados comparables. (Sin embargo, dado que
La r de Pearson es el más potente de los dos procedimientos correlacionales, tiene más
probabilidades de dar lugar al rechazo de la hipótesis nula a un nivel determinado de
significación cuando se aplica al mismo conjunto de datos).

Prueba 29a: Prueba de significación para el coeficiente de correlación de orden de


rango de Spearman En caso de que un investigador no tenga acceso a la tabla A18, la
ecuación 29.2, que emplea la distribución r, proporciona una forma alternativa de evaluar
la hipótesis nula /-f0 : p" - 0. La mayoría de las fuentes que recomiendan la ecuación 29.2
afirman que proporciona una aproximación razonablemente buena de la distribución de
muestreo subyacente cuando n > 10.

rS
n 2
(Ecuación 29.2)

El valor I calculado con la Ecuación 29.2 se evalúa con la Tabla A2 (Tabla de la


distribución I de Student) del ApéndiceE. Los grados de libertad empleados son df --n -
2. Así, en el caso del ejemplo 29.1, df- 5 - 2 = 3. Para d/- 3, los valores críticos tabulados
de dos colas de .05 y .01 se calculan con la ecuación 29.2. Para d/- 3, los valores críticos
tabulados de dos colas de .05 y .01 son i05 ' 3,18 e i0 , = 5,84, y los valores críticos tabulados de
una cola de .05 y .01 son f0 , = 2,35 e i , = 4,54. Puesto que el signo del valor I calculado con
la ecuación 29.2 siempre será el mismo que el signo de r;, las directrices descritas
anteriormente en referencia a la tabla
Al8 para evaluar un valor rS también puede aplicarse en la evaluación del valor t calculado
con la Ecuación 29.2 (es decir, sustituir t en lugar de r en el texto de las directrices para
evaluar r;).
Copyright 2004 por Chapman &
La inspección de la ecuación 29.2 revela que si el valor absoluto de rS es igual a 1, el

Copyright 2004 por Chapman &


término l r será igual a cero, con lo que la ecuación será insoluble (es decir, t -- [(1) 5
2]/1 (1)2
= ?). En consecuencia, la ecuación 29.2 no puede aplicarse al ejemplo 29.1.
La ecuación 29.3, que emplea la distribución normal, es una ecuación alternativa para
evaluar la significación de rS. Cuando el tamaño de la muestra es grande
(aproximadamente 200 o más), la ecuación 29.3 dará un resultado equivalente al obtenido
con la ecuación 29.2.".

Copyright 2004 por Chapman &


z rS l (Ecuación 29.3)

Aunque el tamaño de la muestra del ejemplo 29. l está muy por debajo del tamaño
mínimo recomendado para la ecuación 29.3, se sustituirán los valores apropiados en esta
última ecuación para demostrar su aplicación. Sustituyendo los valores rd -- l y n = 5 en la
ecuación 29.3, se calcula el valor z - 2,00.
z -- (l) 5 =2

El valor calculado r = 2,00 se evalúa con la tabla Al (tabla de la distribución


normal) del apéndice. En esta última tabla, los valores críticos tabulados de dos colas .05 y
.01 son z0 , = 1,96 y z01 = 2,58, y los valores críticos tabulados de una cola .05 y .01 son z p5 =
1,65 y z , -- 2,33. Puesto que el signo del valor r calculado con la ecuación 29.3 siempre será
el mismo que el signo de rS, las directrices descritas anteriormente en referencia a la tabla
A18 para evaluar un valor rS también pueden aplicarse para evaluar el valor calculado con
la ecuación
29.3 (es decir, sustituir z por rS en el texto de las directrices para evaluar rS).
Empleando las directrices, la hipótesis alternativa no direccional N,: pS ' 0 es
apoyada al nivel .05, ya que el valor computado z - 2.00 es mayor que el crítico tabulado
valor de dos colas z05 ' 1,96. Sin embargo, no se confirma al nivel de 0,01, ya que z - 2,00
es inferior al valor crítico tabulado de dos colas z0 , = 2,58.
La hipótesis alternativa direccional H,: pS > 0 se confirma al nivel 0,05, ya que el
valor calculado r = 2,00 es un número positivo mayor que el valor crítico de una cola z05 -
1,65. Sin embargo, no se confirma al nivel 0,01, ya que r = 2,00 es menor que el val o r
c r í t i c o d e u n a c o l a z - 1,65. Sin embargo, no se confirma al nivel 0,01, ya que
r = 2,00 es inferior a
el valor crítico tabulado de una cola z0 , = 2,33 .
La hipótesis alternativa direccional If,: p < 0 no se confirma, ya que el valor
calculado s = 2,00 es un número positivo. Para que se apoye la hipótesis alternativa H,: pS
< 0 , el valor calculado de r debe ser un número negativo (así como el hecho de que el
valor absoluto dez debe ser igual o mayor que el valor crítico tabulado de una cola al nivel
de significación preespecificado). Obsérvese que los resultados obtenidos mediante el uso
de la Ecuación 29.3 son razonablemente coherentes con los que se obtienen cuando se
emplea la Tabla A18.'
A continuación se presenta un resumen del análisis del ejemplo 29.1: Puede
concluirse que existe una relación significativa monótona creciente/positiva entre el número
de onzas de azúcar que come un niño de diez años y el número de caries en la boca del
niño. Este resultado puede resumirse como sigue (si se supone que se emplea la hipótesis
alternativa no direccional H,: pt z 0): r -- 1, p < .05.

VI. Procedimientos analíticos adicionales para el coeficiente de


correlación de rango de Spearman y/o pruebas afines
1. Corrección de empates para el coeficiente de correlación de rango de Spearman
Cuando hay uno o más empates en un conjunto de datos, muchas fuentes recomiendan que el
valor rS calculado con la ecuación
29.1. Esto se debe a que, cuando hay empates, la ecuación 29.1 es errónea.
infla el valor absoluto de rS. En la práctica, la mayoría de las veces que hay empates, el
efecto sobre el valor de rS será mínimo (a menos que el número de empates sea excesivo). El
procedimiento de corrección de empates que se demostrará en esta sección utilizará los
datos resumidos en la Tabla 29.2.
Copyright 2004 por Chapman &
Supongamos que los datos corresponden a las mismas variables evaluadas en el Ejemplo
29.1, excepto por el hecho de que se emplea un conjunto diferente de sujetos con n - 10.
Empleando la Ecuación 29.1, se determina que el valor de la rho de Spearman sin
emplear una corrección de empate es rS -- .764.

Copyright 2004 por Chapman &


6(39)
.764
10 (10)2 - 1)a

Tabla 29.2 Datos empleados con el procedimiento de corrección de empates


X Rz Y Rp d Rg r
0 1.5 1 2 -.5 .25
2 0 1.5 0 1 .5 .25
3 2 3 2 3.5 -.5 .25
4 4 4 2 3.5 .5 .25
5 8 6 8 9.5 -3.5 12.25
6 8 6 8 9.5 -3.5 12.25
7 8 6 3 5 1 1
8 13 8 4 6 2 4
9 16 9.5 6 7 2.5 6.25
10 16 9.5 7 8 1.5 2.25
W2 - 39

A continuación se introduce la corrección de empates. En el ejemplo que nos ocupa hay s


- 3 conjuntos de empates que implican los rangos de las puntuaciones A de los sujetos
(Sujetos 1 y 2; Sujetos 5, 6 y 7; Sujetos 9 y 10), y s - 2 conjuntos de empates que implican
los rangos de las puntuaciones F de los sujetos (Sujetos 3 y 4; Sujetos 5 y 6). La ecuación
29.8 se emplea para calcular el coeficiente de correlación de orden de rango de
Spearman corregido por empates, que se representará con la notación rS . Obsérvese que
los valores lx2 y Ky de la ecuación 29.8 se calculan con las ecuaciones 29.6 y 29.7, y que
las ecuaciones 29.6 y 29.7 se basan, respectivamente, en los valores Tp y TY, que se
calculan con las ecuaciones 29.4 y 29.5. En la ecuación 29.4, f,q representa el número de
puntuaciones off
que están empatadas para un rango dado. En la ecuación 29.5, i; representa el número de
puntuaciones Y que están
empatados para un rango dado. Las notaciones H, ( 3 i ) indican que el
t- t,p ) y ''n
se hace lo siguiente con respecto a cada una de las variables: a) Para cada conjunto
deties, el número de empates
en el conjunto se resta del cubo del número de empates en ese conjunto; y b) Se obtiene
la suma de todos los valores calculados en la parte a) para esa variable.
Cuando los datos de la tabla 29.2 se sustituyen en las ecuaciones 29.W29.8, se obtiene el
valor corregido de empate rg -- .758.

Tg (f, td ) [(2)' - 2] + [(3)' - 3] + [(2)' - 2] 36 (Ecuación 29.4)

(r, f, ) [(2)3 2] + [(2)3 - 2] 12 (Ecuación 29.5)

3
n - n - Tp (10)' - 10 -
12 12 79.5 (Ecuación 29.6)
36

y2
n' -x-T (10)3 - 10 - 12
12 12 81.5 (Ecuación 29.7)
Copyright 2004 por Chapman &
2
Sr.2 + Y' - W2 79,5 + 81,5 - 39
.758 (Ecuación 29.8)
2 y2 (79 5)(81
5)

Copyright 2004 por Chapman &


Así, al emplear la corrección de empate, el valor de rho se reduce del valor sin corregir
de r$ --- .764 a rig -- .758. Como ya se ha señalado, la corrección es mínima.

2. El coeficiente de correlación de rango de Spearman como facilidad especial del


coeficiente de correlación producto-momento de Pearson Aunque el procedimiento
descrito en la sección anterior para tratar los empates es el recomendado en la mayoría de
las fuentes, en realidad se puede emplear un procedimiento alternativo y, a veces, más
eficiente desde el punto de vista computacional. En la sección I se señala que el
coeficiente de correlación de orden de rango de Spearman es un caso especial del
coeficiente de correlación producto-momento de Pearson. De hecho, si se calcula el
coeficiente de correlación producto-momento de Pearson para los rangos de un conjunto
de datos de intervalo/ratio, el valor r calculado será
será idéntico al valor calculado para rS con la ecuación 29.1. Esto se demuestra a
continuación en el ejemplo 29.1, donde se emplea la ecuación 28.1 (la ecuación para
calcular el coeficiente de correlación producto-momento de Pearson) para calcular el
valor r -- rs °° 1. La tabla 29.3 resume los valores que se sustituyen en la ecuación 28.1.
Obsérvese que los rangos fiq y R
empleadas Tabla 29.1 se utilizan en la Tabla 29.3 para representar las puntuaciones en las
Pvariables de mano.7

(15)(15)
55 --
5
r rS 1
(15)2
55 55
10

Tabla 29.3 Resumen de los datos de la muestra 29.1 para la evaluación con la
ecuación 28.1 Asunto 2
1 5 25 5 25 25
2 1 1 1 1 1
3 2 4 2 4 4
4 4 16 4 16 16
5 3 9 3 9 9
M = l5 EY2 = 55 LF -- 15 Año2 = 55 = 55

Cuadro 29.4 Resumen de los datos del cuadro 29.2 para la evaluación con la ecuación 28.1
Asunto J2 Y y2 EN
1 1.5 2.25 2 4 3
2 1.5 2.25 1 1 1.5
3 3 9 3.5 12.25 10.5
4 4 16 3.5 12.25 14
5 6 36 9.5 90.25 57
6 6 36 9.5 90.25 57
7 6 36 5 25 30
8 8 64 6 36 48
9 9.5 90.25 7 49 66.5
10 9.5 90.25 8 64 76

M = 55 M2 = 382KF = 55 Lr2 = 384= 363,5

Copyright 2004 por Chapman &


Cuando no hay empates en los datos, las ecuaciones 29.1 y 28.1 siempre darán el
mismo valor para rS. Sin embargo, siempre que haya al menos un conjunto de empates, los
valores obtenidos por

Copyright 2004 por Chapman &


las dos ecuaciones no serán idénticas. De hecho, Howell (2002) señala que cuando hay
empates en los datos, el valor rS calculado con la ecuación 28.1 será equivalente al valor
r$q calculado con la ecuación 29.8. Cuando no hay empates en los datos, es
claramente más eficiente emplear la Ecuación 29.1 que emplear la Ecuación 28.1. Sin
embargo, cuando hay empates, se puede argumentar que el uso de la ecuación 28.1 es más
eficiente desde el punto de vista computacional que la ecuación 29.8. Para demostrar la
equivalencia de la Ecuación 28.1 y la Ecuación 29.8, a continuación se emplea la Ecuación
28.1 con los rangos de ordenación de la Tabla 29.2. La tabla 29.4 resume los valores que se
sustituyen en la ecuación 28.1. El valor r - .758 obtenido con la Ecuación 28.1 es idéntico
al valor rig . 758 obtenido con la Ecuación 29.8.
(55)(55)
363.5 - 10
r .758
382 - (55) (55)°
384
10 10

3. Análisis de regresión y coeficiente de correlación de orden de rango de Spearman


Cuando se calcula el coeficiente de correlación de orden de rango de Spearman para un
conjunto de datos, es posible que un investigador también desee derivar la función
matemática que mejor permite predecir la puntuación de un sujeto en una variable mediante
el uso de la puntuación del sujeto en la segunda variable. Para ello es necesario utilizar el
análisis de regresión que, como se indica en la sección VI del coeficiente de correlación
producto- momento de Pearson, es un término general que describe los procedimientos
estadísticos que determinan la fiinción matemática que mejor describe la relación entre dos
o más variables. Un tipo de análisis de regresión que entra dentro de la categoría general de
análisis de regresión no paramétrico es el denominado análisis de regresión
monotónica. Este último tipo de análisis se basa en el hecho de que si dos variables (que
están representadas por datos de intervalo/ratio) están monotónicamente relacionadas entre
sí, las clasificaciones de las variables estarán linealmente relacionadas entre sí. Esto puede
ilustrarse en el ejemplo 29.1 mediante la figura 29.2. Mientras que la figura 28.1 (en la
sección VI del coeficiente de correlación producto-momento de Pearson) representa un
diagrama de dispersión de los cinco pares de puntuaciones de relación de los ejemplos
28.1/29.1, la figura 29.2 es un diagrama de dispersión de los cinco pares de clasificaciones
de las dos variables. Observe que el diagrama de dispersión es tal que se puede trazar una
línea recta con pendiente positiva que pasa por todos los puntos de datos. La única vez que
todos los puntos de datos caerán sobre la línea de regresión es cuando el valor absoluto de
la correlación entre las dos variables sea igual a 1. Aunque algunos puntos de datos pueden
caer sobre la recta cuando existe una relación monótona imperfecta, los demás no lo harán.
Cuanto más fuerte sea la relación monótona, mayor será la proximidad de los puntos de
datos a la recta.
Como se indica en el apartado VI del coeficiente de correlación producto-momento
de Pearson, el método de análisis de regresión más empleado es el de mínimos cuadrados
(que es un procedimiento de regresión lineal que obtiene la línea recta que mejor se ajusta
a un conjunto de datos). Aunque la inspección visual de las figuras 28.1 y 29.2 sugiere una
fuerte relación monótona creciente entre las dos variables (es decir, un aumento del
número de onzas de azúcar consumidas está asociado a un aumento del número de caries),
no permite determinar con precisión si la función que mejor describe la relación es una
línea recta o una curva monótona. Para determinar esto último, es necesario contrastar la
exactitud
Copyright 2004 por Chapman &
predictiva del método de los mínimos cuadrados con alguna forma alternativa de análisis
de regresión. Conover (1980, 1999), que proporciona una bibliografía sobre el tema
general del análisis de regresión monotónica, describe su aplicación en la derivación de
una curva para un conjunto de datos ordenados por rango. Marascuilo y McSweeney
(1977) y Sprent (1989, 1993) también tratan el tema del análisis de regresión monotónica.
Además de las fuentes sobre estadística no paramétrica que analizan

Copyright 2004 por Chapman &


Y -- Número de cavidades

(Clasificación según la varia ble


(2.2)

2 3 4
X -- Onzas de azúcar

{ Rangos en la variable X)

Figura 29.2 Diagrama de dispersión de los rangos del ejemplo


29.1

regresión monotónica, muchos libros sobre correlación y regresión describen


procedimientos para derivar diferentes tipos de funciones curvilíneas. Daniel (1990) analiza
una serie de enfoques diferentes del análisis de regresión no paramétrico, que derivan
la línea recta que mejor describe la relación entre las puntuaciones de intervalo/ratio de
las dos variables. Estos últimos tipos de análisi s de re gre si ón (que emplean la
mediana en lugar de la media como punto de referencia) se recomiendan cuando hay
razones para creer que uno o más de los supuestos en los que se basa el método de los
mínimos cuadrados se violan de forma destacada. Entre estos procedimientos, Daniel
(1990) describe el método Brown-Mood (Brown y Mood (1951) y Mood (1950)) y una
metodología desarrollada por Theil (1950). Daniel (1990) también ofrece una amplia
bibliografía sobre el tema del análisis de regresión no paramétrico.

4. Correlación de rango parcial El cálculo de un coeficiente de correlación parcial,


descrito en la Sección IX del coeficiente de correlación producto-momento de Pearson,
puede extenderse al coeficiente de correlación de orden de rango de Spearman. Así,
cuando se evalúan los rangos de tres variables, se puede emplear la ecuación 28.100
para calcular un coeficiente de correlación parcial para la rho de Spearman (empleando los
valores rS relevantes en la ecuación). Conover
(1980, 1999) y Daniel (1990) discuten el cálculo de un coeficiente de correlación parcial.
en referencia al rho de Spearmaa.

5. Uso de la transformación z de Fisher con el coeficiente de correlación de rango


de Spearman Zar (1999) señala que cuando n z 10 y pS < .9 (cuyo valor se estima
mediante rS), las ecuaciones y procedimientos que emplean la transformación p de
Fisher que se describen en
referencia al coeficiente de correlación producto-momento de Pearson también puede
emplearse para la rho de Spearman. Estos últimos procedimientos implican la comprobación
de varias hipótesis sobre un coeficiente de correlación, el cálculo de intervalos de confianza y el
cálculo de la potencia (todo lo cual se describe en la Sección VI del coeficiente de
correlación producto-momento de Pearson). Zar (1999) señala, sin embargo, que
Copyright 2004 por Chapman &
cuando el elemento 1/(ri - 3) aparece en una ecuación (el valor I/( ) representa el error

Copyright 2004 por Chapman &


estándar de Fisher'sq ), debe sustituirse por el valor I.060/(n - 3) cuando los cálculos
se refieren a la rho de Spearman (por ejemplo, la ecuación 28.20 debe tener la forma z
-- {z - zip)/ 060/(n - 3) cuando se evalúa la misma hipótesis para la rho de Spearmnn.

Copyright 2004 por Chapman &


VII. Discusión adicional de la correlación de rango de Spearman
Coeficiente
1. La relación entre el coeficiente de correlación de Spearman, el coeficiente de
concordancia de Kendall y el análisis de varianza bidireccional de Friedman mediante
rsnks El coeficiente de concordancia de Kendall (Prueba 31), que se analiza más
adelante en el libro, es una medida de asociación que permite a un investigador evaluar el
grado de acuerdo entre m conjuntos de rangos sobre n sujetos/objetos. De hecho, el
coeficiente de concordancia de Kendall está linealmente relacionado con el coeficiente
de correlación de rangos de Spearman". El modelo estadístico subyacente en el que se
basa el coeficiente de concordancia de Kendall es idéntico al modelo del análisis de
varianza bidireccional por rangos de Friedman (Prueba 25). Por consiguiente, el
análisis de varianza bidireccional de Friedman por rangos puede utilizarse para
determinar si el valor del coeficiente de concordancia es significativo. De hecho, el
análisis bidireccional de varianza por rangos de Friedman también puede utilizarse para
determinar si el valor de la rho de Spearman es significativo. Esto se ilustrará con el
Ejemplo 29.2, que representa un tipo de problema de que suele evaluarse con el coeficiente
de correlación de rangos de Spearnian (así como el coeficiente de concordancia de
Kendall cuando hay más de dos conjuntos de rangos). En el ejemplo 29.2, n - 10 películas
(es decir, objetos/sujetos) son clasificadas por m = 2 jueces, y se determina el grado de
acuerdo entre las clasificaciones de los jueces.

Ejemplo 29.2 Para determinar si dos críticos coinciden o no en su valoración de las


películas, el director de un periódico pide a los dos críticos que clasifiquen diez películas
(asignando un rango de I a la mejor película, un rango de o/2 a la siguiente mejor
película, etc.). La tabla 29.5 resume los datos del estudio. ¿Existe una asociación
significativa entre los dos conjuntos de ranLs?

Tabla 29.5 Resumen de los datos del ejemplo


29.2 Crítico I Crítico 2
Película R% Rf' d pr
i 7 10 -3 9
2 1 2 -l 1
8 6 2 4
10 8 2 4
9 7 2 4
6 4 2 4
7 5 9 16
8 2.5 3 .25
2.5 1 2.25
10 4 5 1

= 0Ed2 = 45.5

Observe que en la tabla 29.5 cada una de las n = 10 filas representa una de las diez
películas, en lugar de representar a ii = 10 sujetos (como en el ejemplo 29.1). Los rangos
del Crítico l se representan en la columna denominada fip, y los rangos del Crítico 2 se
representan en la columna denominada fip. Observe que el Crítico I coloca a las Películas
8 y 9 en un empate para la segunda mejor película. Por lo tanto (empleando el protocolo
para empates descrito en la sección IV del último Mann-Whitney), se promedian las
Copyright 2004 por Chapman &
dos

Copyright 2004 por Chapman &


clasificaciones implicadas (2 y 3) ((2 + 3)/2 = 2,5), y a cada una de las películas se le
asigna la clasificación media de 2,5.

Copyright 2004 por Chapman &


Empleando la ecuación 29.1, se calcula el valor r - - .724. El valor corregido de empate
rsq -- .723 (para el que no se muestran los cálculos) es casi idéntico.

r l (6)(45.5) 724
10[(10)° - l]

Empleando la Tabla A18, se determina que para n - 10, los valores críticos tabulados
de dos colas de .05 y .01 son r$ -- .648 y rS = .794, y los valores críticos tabulados de una
cola de .05 y .01 son rS -- .564 y rS -- .745. Empleando los valores críticos mencionados, la
hipótesis alternativa no direccional H,: pt 0 y la hipótesis alternativa direccional
H,: pS > 0 se apoyan en el nivel .05, ya que el valor calculado rS -- .724 es mayor que
que el valor crítico tabulado de dos colas rS -- .648 y el valor crítico tabulado de una cola
rS = .564. Las hipótesis alternativas no se apoyan al nivel .01, ya que rS -- .724 es menor
que el valor crítico tabulado de dos colas rS -- .794 y que el valor crítico tabulado de una
cola rS -- .745 .
" Si se emplea la ecuación 29.2 para evaluar la hipótesis nula ff0 : py = 0, el valor t -
2. 97.

(.724) 10 2 2.97
1 ( 4)2

Empleando la Tabla A2, se determina que para df- 10 - 2 = 8, el crítico tabulado de


dos colas
.05 y .01 son i0 , = 2,31 y r0 , = 3,36, y los valores críticos tabulados de una cola .05 y
.01 son i5 = 1,86 y t0 , = 2,90. Utilizando los valores críticos mencionados, la hipótesis
alternativa no direccional H,: pt ' 0 se confirma al nivel .05, ya que el valor calculado t
- 2.97 es mayor que el valor crítico de dos colas i0 5 - 2.31 . No se confirma al nivel 0,01,
ya que r = 2,97 es inferior a t0 , = 3,36. La hipótesis alternativa direccional H,: pS > 0 se
confirma tanto en el nivel de 0,05 como en el de 0,01, ya que el valor calculado r
= 2,97 es un número positivo (ya que rS -- .724 es un número positivo) que es mayor que el
tabulado
valores críticos de una cola i 05 ' 1 ,86 y f 0, = 2,90.
Si se emplea la ecuación 29.3 para evaluar la hipótesis nula /f0 : pS -- 0, el valor
z - 2,17.

z = (.724) 10 l - 2.17

Utilizando la tabla Al, se determina que el valor calculado z - 2,17 es mayor que el valor
crítico tabulado de dos colas z05 - 1,96 y el valor crítico tabulado de una cola z5 = 1,65,
pero menor que el valor crítico tabulado de dos colas z0 - 2,58 y el valor crítico tabulado de
una cola z0 , = 2,33. Por lo tanto, tanto la hipótesis alternativa no direccional H,: pg ' 0
como la hipótesis alternativa direccional H,: pS > 0 se apoyan al nivel .05, pero no al nivel
.01
nivel. Obsérvese que se llega a conclusiones idénticas con la Tabla A18 y la Ecuación 29.3,
pero el
Estas últimas conclusiones no son idénticas a las obtenidas con la ecuación 29.2 (en la que
la hipótesis alternativa direccional H,: pt > 0 también se confirma al nivel 0,01). Como se
señala en la Sección V, las conclusiones basadas en el uso de la Tabla A18, la Ecuación
29.2 y la Ecuación 29.3 no siempre estarán totalmente de acuerdo.

Copyright 2004 por Chapman &


Se ha señalado anteriormente en esta sección que el análisis de varianza de
Friedman de dos vías por rangos puede emplearse para determinar si el valor
deSpearman's rho es significativo. Este

Copyright 2004 por Chapman &


se ilustrará ahora con referencia al Ejemplo 29.2. Los datos del Ejemplo 29.2 se reordenan
en la Tabla 29.6 para ajustarse al modelo de prueba del análisis de varianza de Friedman
de dos vías por rangos. Obsérvese que las filas y columnas empleadas en la Tabla 29.5 se
invierten en la Tabla 29.6. Cuando se emplea la Tabla 29.d dentro del marco del modelo de
prueba de Friedman, los dos críticos representan n = 2 sujetos, y los 10 rangos representan
k
- 10 niveles de una variable independiente dentro de los sujetos/medidas repetidas.

Tabla 29.6 Datos del ejemplo 29.2 formateados para análisis con
el análisis de varianza de Friedman de dos vías por rangos
Película 1 2 3 4 5 6 7 8 9 10
Crítico 1 7 1 8 10 9 6 5 2.5 2.5 4
Crítico 2 10 2 6 8 7 4 9 3 1 5
O 17 3 14 18 16 10 14 5.5 3.5 9
(Xfi )2 289 9 196 324 256 100 196 30.25 12.25 81

A partir de la información resumida de la tabla 29.6, se calcula el valor_ (Zfi )°1493


,5. i
(YA )2 = 289 + 9 + 196 + 324 + 256 + 100 + 196 + 30,25 * 12,25 + 81 1493.5

Empleando el valor anterior, junto con los demás valores apropiados de la ecuación 25.1
(el
ecuación para el análisis de varianza Friedman de dos vías por rangos), se calcula el
valor2 - 15,46.9
12

12
[1493.5] (3)(2)(10 + l) 15.46
(2)(10)(10 + 1)
2
El valor = 15,46 se evalúa con la Tabla A4 (Tabla del Chi-Cuadrado
Distribution) en el Apéndice. Para df -- k - l = 10 - l = 9, el valor crítico tabulado de dos colas
.05
y .01 son 5 - 16,92 y 2" - 21,67, y los valores críticos tabulados de una cola .05 y
.01
son2 = 14,68 y .01 - 19,50 (este último valor se obtiene por interpolación).l0
Utilizando los valores críticos mencionados, la hipótesis nula para el análisis de Friedman
de dos vías de la varianza por rangos (ftp: 81 = 8= -- = 8") puede rechazarse al nivel .05,
pero
sólo si se realiza un análisis de una cola (ya que= 15,4d es mayor que el valor
crítico tabulado
v a l o r de una.05 14.68).'l El resultado no llega a ser significativo al nivel de 0,05
2
para cola 2
un análisis de dos colas, ya que= 15,46 es inferior al valor crítico de dos
colas tabulado.
2
.05 - 16.92. Rechazo de la hipótesis nula para el análisis de varianza bidireccional de
Friedman

Copyright 2004 por Chapman &


por rangos se corresponde con el rechazo de la hipótesis nula ff0 : pS -- 0 para el
coeficiente de correlación de rangos de Spearman. En realidad, el resultado obtenido
empleando el

Copyright 2004 por Chapman &


análisis de varianza bidireccional de Friedman por rangos es similar, pero no idéntico,
al análisis de
rho de Spearman con la tabla A18, la ecuación 29.2 y la ecuación 29.3 (que, como ya se
ha señalado, no coinciden totalmente). La ligera discrepancia entre los resultados de la
prueba de Friedman y los métodos más comúnmente empleados para evaluar la
significación de la rho de Spearman puede atribuirse al hecho de que los estadísticos de
prueba basados en las distribuciones i, normal y ji-cuadrado son aproximaciones de
muestras grandes, que en el caso del Ejemplo 29.2

Copyright 2004 por Chapman &


se emplean con un tamaño de muestra pequeño. También se ha señalado anteriormente que
los valores del cuadro A18 son aproximaciones de los valores exactos de la distribución
de muestreo subyacente.

2. Daniel (1990) y Siegel y Castellan (1988) señalan que (para muestras de gran tamaño)
la eficacia relativa asintótica (que se analiza en la sección VII de la prueba de rangos con
signo de Wilcoxon (prueba 6)) del coeficiente de correlación de rangos de
Spearman en relación con el coeficiente de correlación producto-momento de
Pearson es de aproximadamente 0,91 (cuando se cumplen los supuestos subyacentes a
esta última prueba).

3. Breve discusión de la Tau de Kendall: Una medida alternativa de asociación para


dos conjuntos de rangos La tan de K e n d a l l (Prueba 30) es una medida alternativa
de asociación que puede emplearse para evaluar dos conjuntos de rangos. Aunque la rho
de Spearman y la tan de Kendall pueden emplearse para medir el grado de asociación
para el mismo conjunto de datos, la rho de Spearman es la más descrita de las dos
medidas (principalmente porque requiere menos cálculos). En la sección I de esta última
prueba encontrará un análisis comparativo de la rho de Spearman y la tan de Kendall.

4. Clasificación ponderada/correlación descendente Puede haber ocasiones en las


que el principal interés de un investigador sea la correlación entre las puntuaciones más
extremas de un conjunto de datos (es decir, el grupo de puntuaciones que comprenden los
valores más altos y más bajos de ambas variables). Esto último puede lograrse mediante el uso
de un procedimiento (desarrollado por Salama y Quade (1981) y Quade y Salama (1992)), que
pondera las puntuaciones de forma que cuanto más extrema es una puntuación, mayor
es su peso en la determinación del coeficiente de correlación. Este último
procedimiento, que se denomina correlación ponderada por rango o correlación
descendente (Iman y Conover (1985, 1987)) se describe en Zar (1999, pp. 398-401).

VIII. Ejemplos adicionales que ilustran el uso de la prueba de


Spearman Coeficiente de correlación de rango
Si un investigador opta por ordenar por rango las puntuaciones de los sujetos en
cualquiera de los ejemplos para los que se emplea el coeficiente de correlación producto-
momento de Pearson, puede calcularse un valor para el coeficiente de correlación de
orden de rango de Spearman. Así, como en el caso del Ejemplo 28.1, los datos de los
Ejemplos 28.2 y 28.3 pueden ordenarse por rango y evaluarse con la rho de Spearnian.
Como las clasificaciones de los dos últimos ejemplos son idénticas a las del Ejemplo 29.1,
los tres ejemplos arrojan el mismo resultado. Dado que la decena de Kendall y la rho de
Spearman pueden emplearse para evaluar los mismos datos, el Ejemplo 30.1, así como
el conjunto de datos presentado en la Tabla 30.4, también pueden evaluarse con la rho
de Spearman.

Referencias
Brown, G. M. y Mood, A. M. (195 l). On median tests for linear hypotheses, Jerzy Neyman
(ed.), Proceedings of the Second Berkeley Symposium on Mathematical Sta- tistics and
Probability. Berkeley y Los Ángeles: The University of California Press, 159-166.
Conover, W. J. (1980). Practical nonparametric statistics (2ª ed.). New York: John Wiley
Copyright 2004 por Chapman &
& Sons.
Conover, W. J. (1999). Practical nonparaoietric statistics (3ª ed.). New York: John Wiley
& Sons.

Copyright 2004 por Chapman &


Daniel, W. W. (1990). Applied nonparametric statistics (2ª ed.). Boston: PWWKent
Pub- lishing Company.
Edwards, A. L. (1984). An introduction to linear regression and correlation (2ª ed.).
New York: W. H. Freeman & Company.
Franklin, L. A. (1996). Tablas exactas para el coeficiente de correlación de rangos de
Spearman para ii = 19 y n - 20. Unpublished paper presented at the joint meetings,
Aug 4-8, American Statistical Association, Chicago.
Howell, D. C. (2002). Métodos estadísticos para la psicología (5ª ed.). Pacific Grove,
California: Duxbury.
Iman, R L. y Conover, W. J. (1985). Una medida de correlación descendente. Informe
técnico
SAND85-0601, Sandia National Laboratories, Albuquerque, Nuevo México, 44 pp.
Iman, R. L. y Conover, W. J. (1987). A measure of top-down correlation. Technometrics
29, 351-357. Corrección: Tecbnometrics, 1989, 31, 133.
Lindeman, R. H., Merenda, P. F., y Gold, iL Z. (1980). Introduction to bivariate and
multivariate analysis. Glenview, IL: Scott, Foresman and Company.
Marascuilo, L. A. y McSweeney, M. (1977). Nonparametric and distribution-free methods
for the social sciences. Monterey, CA: Brooks/Cole Publishing Company.
Mood, A. M. (1950). Introducción a la teoría de la estadística. New York: McGraw-Hill
Book Company.
Olds, E. G. (1938). Distribution of sum of squares of rank differences for small numbers of
individuals. Annals of Mathematical Statistics, 9, 133-148.
Olds, E. G. (1949). The 5% significance levels of sums of squares ofrank differences and a
cor- relation. Annals of Mathematical Statistics, 20, 117-119.
Quade, D. y Salama, I. (1992). A survey of weighted rank correlation. En Sen, P. K. y
Salama, I. (Eds.), Order statistics and nonparametric theory and appliations (pp.
213- 224). New York: Elsevier.
Ramsey, P. H. (1989). Critical values for Spearman's rank order correlation. Journal of
Educational Statistics, 14, 245-253.
Salama, I. y Quade, D. (1981). A nonparametric comparison of two multiple regressions by
means ofa weighted measure ofcorrelation. Communic. Statisti. - Theor. Meth.,
A11, l 185-1195.
Siegel, S. y Castellan, N. J., Jr. (1988). Nonparametric statistics for the behavioral
sciences (2ª ed.). New York: McGraw-Hill Book Company.
Spearman, C. (1904). La prueba y medida de la asociación entre dos cosas.
American Journal of Psychology, 15, 72-101.
Sprent, P. (1989). Métodos estadísticos no paramétricos aplicados. London: Chapman &
Hall.
Sprent, P. (1993). Métodos estadísticos no paramétricos aplicados (2ª ed.). London:
Chapman & Hall.
Theil, H. (1950). A rank-invariant method of linear and polynomial regression analysis
III. Nederl. Akad. Wetensch. Proc., Series A, 53, 1397-1412.
Zar, J. H. (1972). Significance testing of Spearman rank correlation coefficient. Journal of the
Asociación Estadística Americana, d7, 578-580.
Zar, J. H. (1999). Biostatistieal analysis (4ª ed.). Upper Saddle River, NJ: Prentice Hall.

Notas finales
1. Cabe señalar que, aunque las puntuaciones de los sujetos del ejemplo 29.1 son datos
Copyright 2004 por Chapman &
de razón, en la mayoría de los casos en los que se emplea el coeficiente de

Copyright 2004 por Chapman &


correlación de orden de rango de Spearman es más probable que los datos
originales de ambas variables estén en formato de orden de rango. Como se observa

Copyright 2004 por Chapman &


en la Sección I, la conversión de datos de razón a un formato de orden de rango (lo
que se hace en la Sección IV con respecto al Ejemplo 29.1) es más probable que
ocurra cuando un investigador tiene razones para creer que uno o más de los supuestos
subyacentes de la correlación producto-momento de Pearson ct'efficient se violan
de forma destacada. El Ejemplo 29.2 de la Sección Vl representa un estudio que
incluye dos variables que originalmente están en un formato de orden de rango para el
que se calcula la rho de Spear- man.

2. Algunas fuentes emplean las siguientes afirmaciones como hipótesis nula e hipótesis
alternativa no direccional para el coeficiente de correlación de rango de Spearman:
Hipótesis nula: ff0 : Las variables A e Y son independientes entre sí; Hipótesis alternativa
no direccional: H,: Las variables A e Y no son independientes entre sí.
De hecho, es cierto que si en la población subyacente las dos variables son
independientes, el valor de pS será igual a cero. Sin embargo, el hecho de que pS -- 0,
en sí mismo, no garantiza que las variables sean independientes entre sí. Así, es
concebible
que en una población en la que la correlación entre el riesgo de mano pS -- 0, se puede
emplear una función curvilínea no monotónica para describir la relación entre las
variables.

3. Daniel (1990) señala que el valor calculado de rS no es una estimación insesgada de pS.

4. El lector puede encontrar ligeras discrepancias en los valores críticos indicados para
la rho de Spearman en las tablas publicadas en diferentes libros. Las diferencias se
deben a que en las distintas fuentes se emplean tablas separadas derivadas por Olds
(1938, 1949) y Zar (1972), que no son idénticas. Howell (2002) señala que los valores
críticos tabulados que figuran en diversas fuentes son aproximaciones y no valores
exactos. Ramsey (1989) y Franklin (1996) han obtenido valores críticos que, según
ellos, son más exactos que los que figuran en el cuadro Al8.

5. El tamaño mínimo de muestra para el que se recomienda la ecuación 29.3 varía según
la fuente que se consulte. Algunas fuentes recomiendan el uso de la ecuación 29.3
para valores tan bajos como n - 25, mientras que otras afirman que n debe ser igual a
100 como mínimo.

6. Los resultados obtenidos mediante el uso de la Tabla A18, la Ecuación 29.2 y la


Ecuación 29.3 no siempre estarán totalmente de acuerdo entre sí. En los casos en los
que los diferentes métodos para evaluar la significación no coincidan, normalmente
no habrá una discrepancia importante entre ellos. En el análisis final, cuanto mayor
sea el tamaño de la muestra, más probable será que los métodos sean coherentes entre
sí.

7. Cuando se emplea la ecuación 28.1 para calcular la r de Pearson (y la rS) cuando se


Copyright 2004 por Chapman

emplean los rank-orders para representar las puntuaciones en las variablesI e Y,


siempre se cumplirá lo siguiente: M = ZF y M2 = KY2 (sin embargo, esto último sólo
será cierto si no hay empates).

8. La relación entre el coeficiente de correlación de rangos de Spearman y el


coeficiente de concordancia de Kendall se analiza con más detalle en la Sección VII
de esta última prueba. En este último apartado, se señala que, aunque cuando hay dos
conjuntos de rangos, los valores calculados para el rho de Spearnmn y el coeficiente
de concordancia de Kendall no serán idénticos, un valor puede convertirse en el otro
mediante el uso de la ecuación 31.7.

9. Si se emplea la corrección de empate para el análisis de varianza bidireccional de


Friedman por rangos, el valor calculado de2 será ligeramente superior.
10. Los valores críticos de ji-cuadrado de dos colas de 0,05 y 0,01 representan los valores de
ji-cuadrado en los percentiles 95 y 99, y los valores críticos de ji-cuadrado de una cola
de 0,05 y 0,01 representan los valores de ji-cuadrado en los percentiles 90 y 98.

11. En la discusión del análisis Friedman de dos vías de variación por rangos, se
asume que siempre se lleva a cabo un análisis no direccional para esta última
prueba. Aquí se utiliza un análisis direccional/de una cola para emplear valores de
probabilidad comparables a los valores de una cola empleados en la evaluación de la rho
de Spearman. Dentro del modelo de prueba de Friedman, cuando k = 10, el uso del
término análisis de una cola no tiene realmente sentido. Para aclarar esta cuestión
(es decir, realizar un análisis direccional cuando k > 3), el lector debería leer la
discusión sobre la direccionalidad de la prueba de bondad de ajuste ehi-cuadrado
(Prueba 8) en la Sección VII de esta última prueba (que puede generalizarse a la
prueba de Friedizian).
Copyright 2004 por Chapman & Hal/CRC

También podría gustarte