Está en la página 1de 4

Prueba de los rangos con signo de Wilcoxon

La prueba de los rangos con signo de Wilcoxon es una prueba no paramétrica para


comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre
ellas. Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la
normalidad de dichas muestras. Debe su nombre a Frank Wilcoxon, que la publicó en
1945.1 Es una prueba no paramétrica de comparación de dos muestras relacionadas, debe
cumplir las siguientes características:

• Es libre de curva, no necesita una distribución específica • Nivel ordinal de la variable


dependiente • Se utiliza para comparar dos mediciones de rangos (medianas) y determinar
que la diferencia no se deba al azar (que la diferencia sea estadísticamente significativa).

Se utiliza cuando la variable subyacente es continua pero no se presupone ningún tipo


de distribución particular.

Planteamiento[editar]
Suponga que se dispone de n pares de observaciones, denominadas  . El objetivo del
test es comprobar si puede dictaminarse que los valores   e   son o no iguales.

Suposiciones[editar]

1. Si  , entonces los valores   son independientes.


2. Los valores   tienen una misma distribución continua y simétrica respecto a una
mediana común  .

Método[editar]
La hipótesis nula es  :  . Retrotrayendo dicha hipótesis a los valores   
originales, ésta vendría a decir que son en cierto sentido del mismo tamaño.

Para verificar la hipótesis, en primer lugar, se ordenan los valores absolutos   y


se les asigna su rango  . Entonces, el estadístico de la prueba de los signos de
Wilcoxon,  , es

es decir, la suma de los rangos   correspondientes a los valores positivos de  .

La distribución del estadístico   puede consultarse en tablas para determinar si se acepta


o no la hipótesis nula.
En ocasiones, esta prueba se usa para comparar las diferencias entre dos muestras de datos
tomados antes y después del tratamiento, cuyo valor central se espera que sea cero. Las
diferencias iguales a cero son eliminadas y el valor absoluto de las desviaciones con respecto
al valor central son ordenadas de menor a mayor. A los datos idénticos se les asigna el lugar
medio en la serie. La suma de los rangos se hace por separado para los signos positivos y los
negativos. S representa la menor de esas dos sumas. Comparamos S con el valor
proporcionado por las tablas estadísticas al efecto para determinar si rechazamos o no la
hipótesis nula, según el nivel de significación elegido.

Prueba T de Wilcoxon
La prueba T de Wilcoxon es un procedimiento estadístico de significancia no
paramétrico. Se supone que se emplea un diseño de muestras relacionadas, que
la variable independiente es dicotómica y la variable dependiente es una
variable continua y cuya medición es por lo menos ordinal. Esta prueba es una
excelente alternativa a la prueba t de Student para muestras relacionadas. Se
utiliza cuando la variable dependiente está en un nivel de medición de
intervalos pero por las características de la investigación no cumplen con los
supuestos básicos de las pruebas paramétricas o cuando la variable
dependiente es definitivamente ordinal.

La prueba T de Wilcoxon evalúa la probabilidad de que las diferencias


encontradas entre dos muestras relacionadas se deba únicamente el error de
muestreo a partir de la comparación de pares y tiene la ventaja de que da
más peso a las diferencias mayores

Procedimiento

El primer paso consiste en organizar los datos de los grupos en pares


ordenados como lo muestra la Tabla 1. En la primera fila se colocan los datos
del primer par: del lado izquierdo el correspondiente al sujeto del Grupo 1 y
del lado derecho el correspondiente al sujeto del grupo 2 y de la misma
manera los datos de los siguientes pares de sujetos.

A continuación, en cada par se le resta el valor de la primera columna el valor


de la segunda columna y la diferencia se coloca en la tercera columna. El
siguiente paso consiste en asignar el rango correspondiente a los valores
absolutos de las diferencias, esto es, la diferencia absoluta menor recibe el rango
1, la que le sigue tiene el rango 2, etcétera sin tomar en cuenta el signo. Una
forma de hacerlo consiste en construir una tabla similar a la Tabla 2. En la
primera columna se escriben los diferentes valores (absolutos) de las
diferencias de menor a mayor. En la segunda columna se escribe la frecuencia
con que se presenta cada diferencia (empates). En la tercera columna se
escriben los rangos que corresponderían a esas diferencias si fueran valores
distintos. La cuarta columna contendrá el promedio de los rangos que
corresponden a cada diferencia, y la quinta columna tiene un valor que se
calcula con la fórmula:

donde ti es la frecuencia de cada diferencia

y que será útil para hacer una corrección en el valor de T por el número de
empates existente en nuestros datos ; estas diferencias se escriben en la cuarta
columna (Rd). Los rangos de las diferencias se separan en las siguientes dos
columnas de la tabla escribiendo en la quinta columna (R+) los rangos que
corresponden a las diferencias positivas y en se sexta columna (R-) los rangos
que corresponden a las diferencias negativas. Cuando la diferencia es cero, no
se asigna rango y el par es descartado de cualquier análisis posterior.
Finalmente, se suman los rangos de las columnas quinta y sexta. El valor menor
será el valor T de Wilcoxon Para determinar la significancia de T, se determina
el número de diferencias distintas de cero y con ese valor se consulta la tabla
de significancia de T
Tabla 1. Procesamiento de datos   Tabla 2. Cálculo de rangos de las diferencias

Grupo 1 Grupo 2 dif Rd R+ R- Rangos Rango


Diferencia t T
ocupados asignado
13 18   -5 12.5   12.5
1 7 1a7 4 28
17 18   -1 4   4
2 1 8 8 0
8 9   -1 4   4
3 1 9 9 0
18 18   0      
4 2 10 a 11 10.5 0.5
17 17   0      
5 2 12 a 13 12.5 0.5
20 21   -1 4   4
6 1 14 14 0
18 17   1 4 4  
7 1 15 15 0
13 11   2 8 8  
Suma = 29
16 17   -1 4   4

19 20   -1 4   4

16 10   6 14 14  

17 16   1 4 4  

16 12   4 10.5 10.5  

13 16   -3 9   9

10 15   -5 12.5   12.5

13 9   4 10.5 10.5  

11 18   -7 15   15

        Sumas 51 69

        Ndif 15

eet = 17.190113437671084

Cuando el número de datos es mayor que el previsto en la tabla de T se puede


estandarizar el valor T considerando que la media de esta distribución es (60):

donde N es el número de diferencias distinto de cero (Ndif = 15)

y el error estándar (17.190113437671084) es:

Donde la suma de Ti es la suma de los valores T de la


Tabla 2
En este caso, el valor de z se utiliza para consultar la tabla de la distribución
normal de probabilidades

También podría gustarte