Está en la página 1de 3

Pruebas no paramétricas

En las pruebas estadísticas que se han discutido hasta ahora se hacen suposiciones acerca de la forma
como se distribuye la población, la que por lo general se asume que se distribuye normalmente. De no
haber normalidad las pruebas estadísticas no son válidas. La normalidad de la población se puede cotejar
en base a la muestra tomada. Frecuentemente se llega a la conclusión de que no hay normalidad y en
consecuencia las pruebas que se hacen no son muy confiables, pero a pesar de todo se usan.

Ahora se estudiarán las pruebas no paramétricas, las cuales no requieren asumir normalidad de la
población y que en su mayoría se basan en el ordenamiento de los datos. Las pruebas que se verán ahora,
requieren que la población sea continua. El parámetro que se usa para hacer las pruebas estadísticas es la
Mediana y no la Media. Existen una serie de pruebas no paramétricas, nosotros sólo veremos las más
usadas. Entra las que veremos están: prueba de signos, prueba de rangos con signo de Wilcoxon, prueba
de suma de rangos de Wilcoxon, prueba de rachas y prueba de Kruskal Wallis

Pruebas no paramétricas para una sola muestra


Prueba de los Signos

Se usa para hacer pruebas de hipótesis acerca de la mediana de una población de una variable continua o
para la diferencia de medianas en el caso de muestras dependientes. Es una alternativa a la prueba de Z o
de t para la media poblacional. La hipótesis nula es Ho: La Mediana poblacional es igual a un valor dado (
~
μ=~ μ0 ¿ y la Hipótesis alterna H1: La mediana es menor (mayor ó distinta) del valor dado.

La prueba estadística está basada en la distribución Binomial con probabilidad de éxito p=1/2, puesto que
la probabilidad de que un dato sea mayor o menor que la mediana es ½. Para calcularla se determinan las
diferencias de los datos con respecto al valor dado de la mediana y se cuenta los signos positivos y
negativos.
n n
1
Cuando la hipótesis alterna es "mayor que", el valor P se calcula así:
P1=∑ n C i
i=c
( )
2 donde c es el
número de diferencias positivas y, n es igual al número de datos pero, si hay datos de valor igual a la
mediana que se asume en la hipótesis nula entonces, n es igual al número de datos menos la cantidad de
datos iguales a la mediana asumida.
c n
1
Si la hipótesis alterna es "menor que", el valor P se calcula así:
P2 =∑ n C i
i=0
( )
2
Cuando la hipótesis alterna es de dos colas y el número de diferencias positivas son mayores que el
número de diferencias negativas entonces, el valor P=2P1. Si hay menor número de diferencias positivas
entonces valor P=2P2, y si hay igual número de diferencias positivas y negativas entonces, valor P=1.0

Ejemplo:

El tiempo de sobrevivencia (en años) de 12 personas que se han sometido a un trasplante de corazón son
los siguientes: 3.1, 0.9, 2.8, 4.3, 0.6, 1.4, 5.8, 9.9, 6.3, 10.4, 0, 11.5
Pruebe con una significancia de 0.05 si los datos de tiempo de vida después del trasplante sugieren que la
mediana sea diferente de 5.
Para la solución de esta prueba podemos elaborar el siguiente cuadro:

Valo mediana diferencia Signo


r
3.1 5 -1.9 -
0.9 5 -4.1 -
2.8 5 -2.2 -
4.3 5 -0.7 -
0.6 5 -4.4 -
1.4 5 -3.6 -
5.8 5 0.8 +
9.9 5 4.9 +
6.3 5 1.3 +
10.4 5 5.4 +
0 5 -5.0 -
11.5 5 6.5 +

Las hipótesis a probar son:


Ho: La mediana del tiempo de sobrevivencia es 5 años (~μ=5 ¿
H1: La mediana del tiempo de sobrevivencia es diferente de 5 años (~
μ≠5¿

Como el número de signos positivos (5), es menor que el número de signos negativos (7), entonces el
valor P se calcula de la siguiente manera:
c
1 n
Valor P = 2 P2, donde P2 se calcula de la siguiente manera:
P2 =∑ n C i
i=0
( )
2 , siendo c=5 y n=12.
5 n
∑ 12 C i (1 2 )
P = 2( i=0 ) = 2(0.387207) = 0.774414

Como este valor es mayor que 0.05 (α) no se rechaza la hipótesis nula y se concluye que no hay evidencia
para creer que el tiempo de supervivencia sea diferente de 5 años.

Nota: Si n es grande, n>25 se puede usar aproximación Normal a una Binomial con p=q=0.5, para
X−0 . 5 n
Z=
calcular los valores P. Es decir, 0 . 5 √n , donde X representa el número de signos positivos.

La aproximación mejora si incluimos el factor de corrección por continuidad igual a 0.5

Ejercicios
1. Los siguientes datos representan el tiempo, en minutos, que un paciente tiene que esperar durante
12 visitas al consultorio de un médico antes de ser atendido.

1 15 20 20 32 28 12 2 25 25 3 24
7 6 5
Utilice la prueba de signo a un nivel de significancia de 0.05 para probar la afirmación del médico
de que la mediana del tiempo de espera de sus pacientes no es mayor que 20.

2. Los siguientes datos representan el número de horas que funciona una destrozadora antes de
requerir una recarga.
1.5 2.2 0.9 1.3 2.0 1.6 1.8 1.5 2.0 1.2 1.7

A un nivel de significancia de 0.05, utilice la prueba de signos para probar la hipótesis de que esta
destrozadora específica funciona con una mediana de 1.8 horas antes de requerir una recarga

También podría gustarte