Está en la página 1de 3

TEST DE WILCOXON PARA MUESTRAS INDEPENDIENTES Y APAREADAS

La prueba de wilcoxon  también llamada prueba de los rangos de wilcoxon, es un test no


paramétrico, para comparar el rango medio de dos muestras y determinar si existen diferencias
entre ellas.

El término no paramétrico se debe a que la distribución no se ajusta a los criterios de


distribuciones conocidas como la normal (como la de la derecha) , chi cuadrado, binomial, gama,
entre otras.

Esta es una prueba alternativa a la T student que explicara mi compañera más adelante, y como
les comentaba se usa cuando no se puede ajustar a la normalidad

Se basa en demostrar la hipótesis de H sub cero que será la igualdad entre u1 y u2, los cuales son
valores estadísticos.

Acá vemos las formulas con las que se trabaja. Mas adelante las entenderemos mejor

Lo importante es saber que

N representa el numero de observaciones o datos

W la suma de los enes rangos

U es un valor estadistico, lo que queremos despejar para comprobar o rechazar la hipótesis

Lo que vamos a ver ahora son los pasos que hay que seguir

Como primer paso es ordenar los datos de menor a mayor

Luego de que ya están ordenados debemos asignarles un rango

Es decir al dato menor le asignamos el rango 1

Al siguiente dato el rango 2

Y así sucesivamente

En caso de que dos datos sean iguales, el rango para ambos seria la media de los dos rangos,

Por ejemplo, si dos datos son iguales en el rango 7 y 8, a los dos se les asigna 7.5

Luego solo faltaría calcular el w1 y w2 y el U1y el U2, finalmente determinar si se acepta o recha
la hipótesis

Y en base a los resultados decidir si se confirma o niega la hipótesis.

En la imagen de la izquierda esta Frank wilcoxon que fue un estadístico estadounidense el cual
desarrollo toda la prueba en los años 40

Ahora vamos a ver el siguiente ejemplo

EJEMPLO
Se encontró que el contenido de nicotina de dos marcas de cigarrillo, medido en miligramos, es el
siguiente:

Acá podemos observar los 18 datos

A un nivel de significancia de 0.05. Pruebe la hipótesis de que las medianas del contenido de
nicotina de las dos marcas son iguales, en comparación con la hipótesis alternativa de que son
diferentes.

Esto significa probar que la hipótesis de H sub cero es cierta o no

Lo del nivel de significancia es un criterio que lo explico mas adelante

SOLUCION

Entonces como pueden ver en la tabla ordenamos los datos y le asignamos el rango

Para el dato 4 y 5.4 que se repiten, se le aplico la media entre los dos rangos

Sabiendo que w1 es la suma de los n rangos de la muestra A se procede a calcularlo y se tiene un


valor de 93

Luego w2 lo podemos calcular con la formula al multiplicar el rango total que corresponde a 18,
por este valor mas uno, dividir esto entre 2 y restarle el w1, así obtenemos el valor de 78

Una vez se obtienen estos valores, se calculan los parámetros u

El valor de u de la muestra 1 se calcula con el numero de datos de la muestra, en este caso la


muestra A tiene 8 datos por lo cual es

93 que corresponde al w1, menos 8 que es el numero de datos, multiplicado por este valor mas 1
que correspondería a nueve, y esto ultimo dividido entre 2, de esto obtenemos como valor
estadistico 57

De la misma manera se realiza para u2 y obtenemos el valor de 23

Entonces como valor final de u escogemos el menor entre los dos que para este caso es 23

Y recuerdan lo de la significancia de 0.05, aquí es donde entra

Eso de significancia quiere decir con que tanta efectividad queremos realizar la prueba

Es decir el valor de 0.05 significa que esta prueba solo va a presentar un error del 0.05%

Por lo cual tenemos 99.95% de efectividad

Y con este valor de 0.05 entramos a la tabla dada y hallamos el valor critico.

Ubicamos el n1 en el eje Y y el n2 en el eje X y en el cruce de ambos que para este caso era 8 y 10
que eran el numero de datos de cada muestra obtenemos el valor de 20

Por lo cual para rechazar la hipótesis el valor de u debe ser menor o igual que este 20

Y para aceptarla el valor de u debe ser mayor


En este caso es mayor ya que 23 es mayor a 20 y con eso ACEPTARIAMOS la hipótesis

La conclusión es que no hay diferencia significativa en las medias ya que recuerden que en esto se
basa el criterio, en demostrar la diferencia entre las medias.

Consideración

Por último, tenemos como consideración que en tal caso de que los números de datos de cada
muestra superen los 20, se quedan fuera de las tablas, es posible aproximar a una distribución
normal con media y varianza dadas por las siguientes ecuaciones y con estas trabajar como una
distribución normal.

Como CONCLUSION FINAL se tiene que esta prueba de wilcoxon siempre va a ser mejor que una T
student para una muestra no normal, ósea que no presente una distribución normal.

MUCHAS GRACIAS

KAROLL TATIANA FONSECA CORREDOR

POSIBLES PREGUNTAS

 Muestras independientes significa que se seleccionan de forma aleatoria y que sus valores
no dependen de otros.
 Muestras pareadas significa que son para dos poblaciones

También podría gustarte