Está en la página 1de 10

Jesús Reynaga Obregón

Prueba de asociación de dos variables cuantitativas


discretas (o dos continuas sin distribución normal). Prueba de
Spearman

Descripción
La evaluación de la intensidad con que se asocian dos variables cuantitativas medidas en un solo grupo
de individuos suele efectuarse de manera espontánea a través del coeficiente rp de correlación de
Pearson. Sin embargo, en muchas ocasiones el uso de dicho procedimiento no es acorde con la
naturaleza de los datos ni con las condiciones establecidas para utilizar dicho coeficiente rp.

El uso de la técnica de Pearson requiere que las dos variables hayan sido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal; es decir, que
tengan sesgo y curtosis parecidos a los de dicha distribución.

Cuando las variables, siendo cuantitativas continuas, no tienen una distribución semejante a la de la
curva normal, o cuando una o ambas son de tipo discreto, el coeficiente idóneo para evaluar la intensidad
de la asociación es el descrito por Spearman, que se simboliza con rs.

Una vez calculado, el coeficiente de correlación rs de Spearman puede tener valores que varían entre - 1
hasta + 1, pasando por el cero.

Cuando el valor resultante es cercano a +1 se dice que ambas variables se asocian directamente de
manera muy estrecha; por ejemplo: si a un grupo de personas se les midieran simultáneamente sus
concentraciones de glucosa y colesterol y se encontrara que los valores bajos de glucosa y los valores
bajos de colesterol se corresponden y que también los valores altos de glucosa se corresponden con los
valores altos de colesterol se diría que existe una asociación directa.

Cuando el valor resultante es cercano a - 1 se dice que ambas variables se asocian inversamente de
manera muy estrecha; por ejemplo: si a un grupo de personas se les midiera simultáneamente su ingesta
de fósforo y su densidad ósea y se encontrara que los valores altos de ingestión de fósforo se
corresponden con valores bajos en la densitometría ósea se diría que existe una asociación inversa (las
bebidas de cola contienen altas concentraciones de ácido fosfórico como estabilizante).

Cuando el coeficiente de correlación rs de Spearman calculado tiene un valor cercano a cero se dice que
ambas variables no presentan asociación.

En la prueba se plantean las siguientes hipótesis estadísticas:

Hipótesis estadística nula: Ho: rs = 0 (cero)


Hipótesis estadística alterna: Ha: rs ≠ 0

En vista de que la hipótesis estadística nula (Ho) significa que las dos variables no se asocian, el
propósito de la prueba es evaluar la posibilidad de rechazar a dicha hipótesis. El rechazo de la Ho ocurre
cuando el valor del coeficiente de correlación rs de Spearman calculado con los datos supera a un valor
crítico del coeficiente de correlación de Spearman que se encuentra en tablas ad hoc.

111
Jesús Reynaga Obregón

Si la Ho es rechazada se concluye que probablemente exista una real asociación entre la pareja de
variables en estudio.

Ejemplo desarrollado
Un investigador suponía que el desempeño de los alumnos de la carrera de medicina en materias afines
y sinérgicas podría ser semejante. Para comprobar lo anterior, aplicó dos exámenes a un grupo de diez
alumnos. Al aplicarles un examen de anatomía y otro de embriología, el investigador tenía la pretensión
de averiguar si los estudiantes con puntuaciones bajas en una materia obtenían puntuaciones bajas en la
otra y si quienes obtenían puntuaciones altas en una materia también lograban puntuaciones altas en la
otra.

A continuación se muestran los resultados que consisten en los aciertos obtenidos en una y otra materia
y expresados en números enteros:

Aciertos en Aciertos en
Anatomía Embriología
Alumno (x) (y)

1 65 74
2 72 61
3 75 69
4 82 90
5 50 51
6 95 79
7 87 95
8 53 52
9 83 77
10 64 63

100

80
Embriología

60

40
40 60 80 100
Anatomía

112
Jesús Reynaga Obregón

Luego de observar la tabla de datos y su correspondiente gráfico, el investigador confirmó que parecía
existir una asociación de tipo directo; es decir, los alumnos con puntuaciones bajas en la prueba de
anatomía también tenían puntuaciones bajas en la prueba de embriología. Complementariamente, los
alumnos con altas puntuaciones en la prueba de anatomía tenían altas puntuaciones en la prueba de
embriología.

Toda vez que ambas variables quedaron clasificadas como cuantitativas discretas, el investigador
confirmó que no se cumplían las condiciones para calcular el coeficiente rp de Pearson, por lo que
procedió a calcular el coeficiente rs de Spearman con el propósito de verificar las siguientes hipótesis
estadísticas:

Hipótesis estadística nula: Ho: rs = 0


Hipótesis estadística alterna: Ha: rs ≠ 0

Para determinar el coeficiente rs se utilizó la siguiente fórmula:

6 ∑ d2
rs = 1 −
n ( n − 1) ( n + 1)
Los cálculos de la fórmula se realizaron con facilidad usando la siguiente tabla auxiliar de trabajo:

Rangos de las Diferencia


Rangos de las Calificaciones al
Aciertos en calificaciones Aciertos en en Diferencia cuadrado
Alumno Anatomía en Anatomía Embriología Embriología (d) ( d2 )

1 65 4 74 6 -2 4
2 72 5 61 3 2 4
3 75 6 69 5 1 1
4 82 7 90 9 -2 4
5 50 1 51 1 0 0
6 95 10 79 8 2 4
7 87 9 95 10 -1 1
8 53 2 52 2 0 0
9 83 8 77 7 1 1
10 64 3 63 4 -1 1
Sumatoria de d2 = 20

Los cálculos condujeron al siguiente resultado:

6 ( 20 ) 120
rs = 1 − =1− = 0.88
10 (10 − 1) (10 + 1) 990

113
Jesús Reynaga Obregón

Tal resultado, descriptivamente hablando, indicaba una buena asociación de tipo directo entre ambas
variables; es decir, las más altas puntuaciones en una de las variables correspondieron a las más altas
puntuaciones en la otra y, complementariamente, las más bajas puntuaciones en una variable
correspondieron a las más bajas puntuaciones de la otra.

En vista de que el propósito de la prueba era evaluar la posibilidad de rechazar a la Ho, se hizo una
comparación del valor calculado con un valor crítico tabular.

En seguida se muestra la tabla de valores críticos para rs :

Valores críticos del coeficiente de correlación de Spearman


al nivel de significancia de 0.05

Nivel de
significancia
n 0.05
4 1.000
5 0.900
6 0.829
7 0.714
8 0.643
9 0.600
10 0.564
12 0.506
14 0.456
16 0.425
18 0.399
20 0.377
22 0.359
24 0.343
26 0.329
28 0.317
30 0.306

En la tabla se localizaron los valores críticos a diferentes niveles de significancia para un grupo de 10
sujetos ( tamaño n = 10 ). Se encontró que el valor calculado de rs = 0.88 rebasaba al valor crítico de
0.564 en el nivel de significancia de 0.05.

Por lo anterior, se rechazó la hipótesis estadística nula Ho: rs = 0; en otras palabras, se rechazó la
suposición de que no había asociación estadísticamente significativa entre ambas variables.

Lo anterior, permitió concluir que, al menos para el grupo estudiado, existía asociación directa entre los
aciertos que obtuvieron los alumnos en las pruebas de anatomía y de embriología y que el riesgo de
equivocarse al establecer tal conclusión era menor a 0.05 (equivalente a 5%); lo anterior se expresó así:
la Ho fue rechazada ( p < 0.05 ).

114
Jesús Reynaga Obregón

Procedimiento
1. Confirmar que el propósito del estudio consiste en evaluar la asociación entre dos variables
cuantitativas discretas o entre dos cualitativas continuas con distribución, de una o ambas,
diferente a la curva normal, y que se han medido a un único grupo de individuos.

2. Elaborar un cuadro y una gráfica de correlación para caracterizar la forma de la asociación de


ambas variables.

3. Mediante la siguiente fórmula, determinar el valor de rs calculado

6 ∑ d2
rs = 1 −
n ( n − 1) ( n + 1)

En caso de no disponer de un programa de cómputo que efectúe los cálculos, utilizar


una tabla auxiliar de trabajo como la siguiente:

Rangos de los Rangos de los Diferencia


Valor valores Valor valores al
discreto de discretos de la discreto de discretos de la Diferencia cuadrado
Sujeto la variable x variable x la variable y variable y (d) ( d2 )

1
2
3
4
5
n
n
n
n
n
Sumatoria de d2 =

4. Considerando el tamaño n del grupo en estudio, ubicar el valor a rebasar en la tabla de valores
críticos de de rs

5. Rechazar a la Ho si el valor de rs calculado excede al valor crítico de la tabla. En caso contrario


señalar que no fue posible rechazarla.

6. De acuerdo al paso anterior, establecer la conclusión referente a si ambas variables parecen


tener una asociación estadísticamente significativa o no.

115
Jesús Reynaga Obregón

Problema resuelto: un caso con rangos empatados


Se deseaba comprobar si las siguientes dos variables presentaban una asociación estadísticamente
significativa:

Persona Peso Colesterol


(x) (y)
1 66.25 197
2 93.50 201
3 71.80 193
4 74.35 235
5 83.25 208
6 69.50 201
7 99.28 233
8 87.15 222
9 68.90 232
10 85.85 260
11 102.05 245
12 98.9 192

270
260
250
240
Colesterol

230
220
210
200
190
180
60.00 70.00 80.00 90.00 100.00 110.00
Peso

Se encontró que una variable era cuantitativa continua y que su distribución no era semejante a la de la
curva normal porque su sesgo y su curtosis, calculados por el método de momentos, estaban fuera del
rango aceptable. Por otro lado, se observó que la otra variable era discreta. La inspección del gráfico no
mostraba indicios de una tendencia asociativa definida, pues la nube de puntos no tenía una forma más o
menos lineal.

116
Jesús Reynaga Obregón

Por lo anterior, se decidió determinar el coeficiente rs calculado. Para tal efecto, se usó la siguiente tabla
auxiliar de trabajo:

Diferencia
Rangos de los Rangos de los al
valores del valores de Diferencia cuadrado
Persona Peso peso Colesterol colesterol (d) ( d2 )

1 66.25 1 197 3 -2 4
2 93.50 9 201 4.5 4.5 20.25
3 71.80 4 193 2 2 4
4 74.35 5 235 10 -5 25
5 83.25 6 208 6 0 0
6 69.50 3 201 4.5 -1.5 2.25
7 99.28 11 233 9 2 4
8 87.15 8 222 7 1 1
9 68.90 2 232 8 -6 36
10 85.85 7 260 12 -5 25
11 102.05 12 245 11 1 1
12 98.9 10 192 1 9 81
Sumatoria de d2 = 203.5

Obsérvese que las personas 2 y 6 tienen iguales valores de colesterol.

Al asignar los rangos a sus correspondientes valores de colesterol habría que otorgar a uno el rango 4 y
al otro el rango 5 para, luego, continuar con la asignación del rango 6 al valor de colesterol de la persona
5.

En el caso de empates como el presente se procede a asignar un rango promedio. Como puede
apreciarse el cálculo fue así: promedio de los rangos 4 y 5 = ( 4 + 5 ) ÷ 2 = 4.5

En vista de que existían empates, la evaluación de rs calculado se hizo mediante la fórmula:

6 ∑ d2 6 ( 203.5)
rs = 1 − =1− = 1 − 0.712 = 0.288
n ( n − 1) ( n + 1) 12 (12 − 1) (12 + 1)

Al encontrar que el valor de rs calculado era de 0.288 y que no rebasaba al valor crítico correspondiente
a n = 12, que era de 0.506, se concluyó que no podía rechazarse a la Ho: rs = 0

Por lo anterior, se concluyó que en el grupo de doce personas no parecía existir una asociación
estadísticamente significativa entre los valores de peso y de colesterol y que el riesgo de equivocarse si
se afirmara que efectivamente existiera asociación sería mayor a 0.05 (o 5%). Lo anterior se expresó de
la siguiente forma: no fue posible rechazar a la Ho (p > 0.05)

117
Jesús Reynaga Obregón

Problemas a resolver
A continuación se presentan dos tablas con datos de 20 mujeres y de 20 hombres. Considere que
ambas variables son discretas. ¿Existe asociación estadísticamente significativa entre el coeficiente
intelectual y el tamaño del cerebro?

Tabla de valores de las mujeres

Tamaño del cerebro (miles de mega


Caso Género Coeficiente intelectual píxeles en imagen de escáner)
1 Femenino 133 817
2 Femenino 137 952
3 Femenino 99 929
4 Femenino 138 991
5 Femenino 92 854
6 Femenino 132 834
7 Femenino 140 856
8 Femenino 96 879
9 Femenino 83 865
10 Femenino 132 852
11 Femenino 101 808
12 Femenino 135 791
13 Femenino 91 832
14 Femenino 85 799
15 Femenino 77 794
16 Femenino 130 867
17 Femenino 133 858
18 Femenino 83 834
19 Femenino 133 948
20 Femenino 88 894
Las celdas sombreadas representan a valores empatados
Mujeres

1050
Tamaño del cerebro

950

850

750
80 100 120 140
Coeficiente intelectual

118
Jesús Reynaga Obregón

Tabla de valores de los hombres

Tamaño del cerebro (miles de mega


Caso Género Coeficiente intelectual píxeles en imagen de escáner)
1 Masculino 140 1001
2 Masculino 139 1038
3 Masculino 133 965
4 Masculino 89 905
5 Masculino 133 955
6 Masculino 141 1080
7 Masculino 135 924
8 Masculino 100 945
9 Masculino 80 889
10 Masculino 83 892
11 Masculino 97 906
12 Masculino 139 955
13 Masculino 141 935
14 Masculino 103 1062
15 Masculino 144 950
16 Masculino 103 998
17 Masculino 90 880
18 Masculino 140 949
19 Masculino 81 930
20 Masculino 89 936
Las celdas sombreadas representan a valores empatados

Hombres

1050
Tamaño del cerebro

950

850
80 100 120 140
Coeficiente intelectual

119
Jesús Reynaga Obregón

Valores críticos para el coeficiente rs

Niveles de Significancia
n 0.05 0.01

4 1.000 -
5 0.900 1.000
6 0.829 0.943
7 0.714 0.893
8 0.643 0.833
9 0.600 0.783
10 0.564 0.746
12 0.506 0.712
14 0.456 0.645
16 0.425 0.601
18 0.399 0.564
20 0.377 0.534
22 0.359 0.508
24 0.343 0.485
26 0.329 0.465
28 0.317 0.448
30 0.306 0.432

120

También podría gustarte