Está en la página 1de 19

UAP Facultad de Ingenierías

PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS

Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de


probabilidad a partir de la que fueron obtenidos los datos. Son muy útiles cuando no puede
suponerse que los datos cumplen las condiciones de una prueba paramétrica o cuando los
datos se presentan en forma ordinal.

Las principales pruebas no paramétricas son:

Prueba no Paramétrica Su alternativa Paramétrica


Prueba de Rachas -
Prueba del Signo para una muestra.
Prueba de Wilcoxon para una muestra. Prueba t para la media.

Prueba del Signo para 2 muestras pareadas.


Prueba de Wilcoxon para 2 muestras pareadas. Prueba t para datos pareados.

Prueba t para dos muestras


Prueba U de Mann-Whitney. independientes.

Prueba de Kruskal-Wallis. Anova de un factor.

Anova de un factor y un bloque


Prueba de Friedman
Coeficiente de Correlación de
Coeficiente de Correlación por Rangos de
Pearson.
Spearman

Ventajas:

- El procedimiento es relativamente fácil de entender y de aplicar.


- Su uso es apropiado para muestras de tamaño mayor o igual que 25.
- No se afectan significativamente en presencia de observaciones atípicas o
outliers.
- Si uno o más de los supuestos distribucionales en una prueba paramétrica no se
cumplen, la correspondiente prueba no paramétrica es más eficiente.
- Tienen un gran campo de aplicación.

Desventajas:

- Serán menos eficientes que el procedimiento paramétrico correspondiente


cuando se pueden aplicar ambos métodos. Es decir, si se puede utilizar una
prueba paramétrica y se usa una no paramétrica, entonces hay una pérdida de
información.
- Son menos eficientes si las muestras son menores que 25..

Gladys Enríquez Mantilla 175


UAP Facultad de Ingenierías

PRUEBA DE RACHAS

Se llama racha a la interacción entre elementos iguales dentro de una secuencia de sucesos
observables. El número de elementos de una racha se llama longitud.

Por ejemplo, si se tiene la secuencia de dos sucesos A y B:

AAA BB A BB AA BBB ésta tiene 6 rachas


Cuyas longitudes son: 3 2 1 2 2 3

Si en una muestra, la aparición de un elemento condiciona la aparición de otro; entonces la


muestra no es aleatoria.

Esta prueba se utiliza para determinar si la muestra fue extraída de manera aleatoria; es
decir si es aleatorio el orden de aparición de dos valores de una variable.

Hipótesis:

H0 : La muestra es aleatoria.
H1 : La muestra no es aleatoria.

Ejemplo:

El registro de juegos perdidos y ganados por un equipo de fútbol en sus últimos 60 partidos
consecutivos fue el siguiente:

Resultado
G G G G G G P G G G G G G P G G G G
G G G P P P G G P P P P G P P P P G
P P P P G G P P G G G G P G G G G P
G G G G G G
¿Se puede afirmar que los resultados han sido aleatorios?

Hipótesis:
H0 : Los resultados han sido aleatorios.
H1 : Los resultados no han sido aleatorios.

Ingresar los datos:

Gladys Enríquez Mantilla 176


UAP Facultad de Ingenierías

Luego, codificar estos datos texto en datos numéricos: asignando 1 a G y 2 a P.

Manip – Code – Tex to Numeric…

OK

Stat – Nonparametrics - Runs Test…

OK

Runs Test: C2
C2
K = 1.3500
The observed number of runs = 19
The expected number of runs = 28.3000
21 Observations above K 39 below
The test is significant at 0.0077

Interpretación: P= 0.0077 entonces se acepta H1 por lo tanto los resultados no han sido
aleatorios.

Gladys Enríquez Mantilla 177


UAP Facultad de Ingenierías

PRUEBA DEL SIGNO


Para un grupo:

Se utiliza para probar hipótesis sobre la mediana de un grupo con distribución continua. Es
una alternativa a la prueba t para la media poblacional.
Sobre la base de una muestra aleatoria de tamaño n, se sustituye cada valor de la muestra
mayor que la mediana con el signo positivo (+) y cada valor menor que la mediana con el
signo negativo (-).

Hipótesis:

H0 : La mediana poblacional es igual a un valor dado.


H1 : La mediana poblacional es menor (mayor o diferente) del valor dado.

Para dos grupos:

Se utiliza para probar la hipótesis sobre la mediana con grupos pareados o dependientes. Se
estudia la diferencia para cada par de observaciones pero no se estudian los dos grupos
individualmente como se hacía en las pruebas paramétricas. La prueba del Signo no toma
en cuenta la magnitud de la diferencia.

Hipótesis:

H0 : La diferencia es cero (no hay cambio).


H1 : La diferencia es menor (mayor o diferente) de cero.

Ejemplo 1: Prueba del Signo para un grupo.

Se supone que el peso mediano de un grupo de personas con sobrepeso es inferior a 97


kilos. Los datos obtenidos son los siguientes:

96.4 96.0 95.3 97.0 96.5 96.8 93.2 95.2


95.2 100.3 99.1 98.5 97.3 97.0 96.1 94.9

¿Es correcta dicha afirmación?

Solución:

Hipótesis:
H0 : La mediana es sup erior o igual a 97
H1 : La mediana es menor que 97

• INGRESAR LOS DATOS:

C1
Peso
96.4
96
95.3
97
96.5
96.8
93.2
95.2
etc.

Gladys Enríquez Mantilla 178


UAP Facultad de Ingenierías

Stat – Nonparametrics – 1-Sample Sign…

Sign Test for Median: Peso

Sign test of median = 97.00 versus < 97.00


N Below Equal Above P Median
Peso 16 10 2 4 0.0898 96.45

Interpretación:

Como el valor P es mayor que 0.05, entonces con una confianza del 95% concluimos que la
mediana no es menor que 97. Se acepta Ho.

Ejemplo 2: Prueba del Signo para dos grupos pareados.

Se desea hacer un estudio para comparar la energía en reposo usada por personas con
cierta enfermedad vs. La energía en reposo usada por personas sanas. Para ello se eligen al
azar pares de personas (pacientes de la misma edad, sexo, estatura y peso) enfermas y
sanas. Los datos son los siguientes:

Energía usada por pacientes


par
enfermos sanos
1 1153 996
2 1132 1080
3 1165 1182
4 1460 1452
5 1634 1162
6 1493 1619
7 1358 1140
8 1453 1123
9 1185 1113
10 1824 1463
11 1793 1632
12 1930 1614
13 2075 1836

Obtener una conclusión significativa.

Gladys Enríquez Mantilla 179


UAP Facultad de Ingenierías

Solución:

Hipótesis:
H 0 : No hay diferencia entre personas sanas y enfermas.
(La mediana de las diferencias es cero)
H1 : Sí hay diferencia entre personas sanas y enfermas.

• INGRESAR LOS DATOS:

C1 C2 C3
enfermos sanos Diferencia
1153 996
1132 1080
1165 1182
1460 1452
1634 1162
1493 1619
1358 1140
1453 1123
1185 1113
1824 1463
1793 1632
1930 1614
2075 1836

En la columna C3 escribir como título: Diferencia

Calc – Calculator…

En la columna C3 aparecerá el resultado de restar la columna C1 menos la columna C2.

Gladys Enríquez Mantilla 180


UAP Facultad de Ingenierías

Stat – Nonparametrics – 1-Sample Sign…

Sign Test for Median: Diferencia

Sign test of median = 0.00000 versus not = 0.00000

N Below Equal Above P Median


Diferenc 13 2 0 11 0.0225 161.0

Interpretación:

Como el valor P es menor que 0.05, entonces con una confianza del 95% concluimos que la
mediana no es cero, es decir existen evidencias para afirmar que sí hay diferencias entre
personas sanas y enfermas en cuanto a la energía usada en reposo. Se acepta la hipótesis
alternativa.

PRUEBA DE WILCOXON

Esta prueba se utiliza para probar hipótesis relativas a la mediana con un solo grupo o con
grupos pareados o dependientes en una población simétrica, es decir se utiliza en los
mismos casos que la prueba del signo pero la diferencia radica en que la prueba de
Wilcoxon es un procedimiento que utiliza tanto la dirección (signo) como la magnitud
mientras que la prueba del Signo considera sólo la dirección.
Esta prueba considera que si la hipótesis nula fuera cierta, las diferencias negativas serían
similares en cantidad y tamaño a las diferencias positivas.

Para un grupo:

Hipótesis:

H0 : La mediana poblacional es igual a un valor dado.


H1 : La mediana poblacional es menor (mayor o diferente) del valor dado.

Gladys Enríquez Mantilla 181


UAP Facultad de Ingenierías

Para dos grupos:

Hipótesis:

H0 : La diferencia es cero (no hay cambio).


H1 : La diferencia es menor (mayor o diferente) de cero.

Ejemplo 1: Prueba de Wilcoxon para un grupo.

Un actuario de una compañía de seguros desea examinar los registros de reclamos por robo
de las personas que tienen póliza contra incendio y robo. En el pasado, la mediana fue de
85 dólares por reclamo. Se toma una muestra aleatoria de 18 reclamos y los resultados,
expresados en dólares, son los siguientes:

140 92 35 202 80 87 80 100 47


25 160 68 50 65 310 90 75 120

¿Ha aumentado significativamente la mediana?

Solución:

Hipótesis:

H 0 : La mediana no ha aumentado.
H1 : La mediana ha aumentado. ( Me > 85 )

• INGRESAR LOS DATOS:

Stat – Nonparametrics – 1 Sample Wilcoxon…

OK

Gladys Enríquez Mantilla 182


UAP Facultad de Ingenierías

Wilcoxon Signed Rank Test: Reclamos

Test of median = 85.00 versus median > 85.00

N for Wilcoxon Estimated


N Test Statistic P Median
Reclamos 18 18 91.5 0.405 87.50

Interpretación:

Como el valor P es mayor que 0.05, entonces con una confianza del 95% concluimos que la
mediana no es mayor que 85. Se acepta Ho.

Ejemplo 2: Prueba de Wilcoxon para dos grupos pareados.

Adamson estudió los efectos sobre la salud causados por la exposición diaria a fuertes
ejercicios físicos en unos varones voluntarios. Para ocho de los sujetos la tabla muestra los
niveles nocturnos de plasma corticostiroide observados en controles las noches anteriores y
posteriores a los ejercicios.

Antes 69.9 46.0 63.7 55.9 53.9 72.9 53.9 36.5


Después 49.9 45.9 47.5 57.9 47.1 50.3 36.7 31.4

¿Se puede afirmar que el nivel nocturno de plasma corticostiroide disminuye con los
ejercicios?

Solución:

Hipótesis:

H 0 : La mediana de las diferencias no es mayor que cero.


H1 : La mediana de las diferencias es mayor que cero.

• INGRESAR LOS DATOS:

C1 C2 C3
Antes Después Diferencia
69.9 49.9
46 45.9
63.7 47.5
55.9 57.9
53.9 47.1
72.9 50.3
53.9 36.7
36.5 31.4

En la columna C3 escribir como título: Diferencia

Gladys Enríquez Mantilla 183


UAP Facultad de Ingenierías

Calc – Calculator…

En la columna C3 aparecerá el resultado de restar la columna C1 menos la columna C2.

Stat – Nonparametrics – 1- Sample Wilcoxon…

Wilcoxon Signed Rank Test: Diferencia

Test of median = 0.000000 versus median > 0.000000

N for Wilcoxon Estimated


N Test Statistic P Median
Diferenc 8 8 34.0 0.015 10.90

Interpretación:

Como P es menor que 0.05 entonces se acepta la hipótesis alternativa.

Gladys Enríquez Mantilla 184


UAP Facultad de Ingenierías

PRUEBA DE MANN-WHITNEY

Esta prueba se usa cuando se quiere comparar dos poblaciones usando muestras
independientes, es decir es una prueba alterna a la prueba t para comparar dos medias
usando muestras independientes.
Es una prueba no paramétrica que mide las diferencias entre medias, asignando rangos a
cada grupo.

Hipótesis:

H0 : La mediana de las dos poblaciones son iguales.


H1 : La mediana de la primera población es menor (mayor o diferente) que la
mediana de la segunda población.

Estadística de Prueba:

n1 ( n1 +1 )
U = n1 n2 + − R1
2

Donde:
n1 : Número de elementos en la muestra 1.
n2 : Número de elementos en la muestra 2.
R1 : Suma de los rangos de los elementos en la muestra 1.
R2 : Suma de los rangos de los elementos en la muestra 2.

Ejemplo:

El director de control de calidad de una firma farmacéutica desea saber si dos métodos de
producción de comprimidos proporcionan diferencias entre los espesores medianos. Una
muestra aleatoria de comprimidos es extraída de lotes producidos por los dos métodos,
ofreciendo los siguientes resultados que han sido codificados:
método A:
51 42 45 48 52 44 58 41 52 44 45 52 61 60 41
método B:
40 47 36 39 37 46 43 55 53 56
¿Proporcionan estos datos suficiente evidencia en contra de que las medianas poblacionales
no son las mismas?

Solución:

Hipótesis:

H 0 : Las medianas poblacionales son las mismas.


H1 : Las medianas poblacionales no son las mismas.

• INGRESAR LOS DATOS:


En la columna C1 ingresar los datos del método A y en la columna C2 ingresar los
datos del método B.

Gladys Enríquez Mantilla 185


UAP Facultad de Ingenierías

Stat – Nonparametrics – Mann- Whitney…

Mann-Whitney Test and CI: método A, método B

método A N = 15 Median = 48.00


método B N = 10 Median = 44.50

Point estimate for ETA1-ETA2 is 5.00


95.1 Percent CI for ETA1-ETA2 is (-3.00,9.00)
W = 217.0

Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2330


The test is significant at 0.2324 (adjusted for ties)

Cannot reject at alpha = 0.05

Interpretación:

Como P = 0.2324 es mayor que 0.05 entonces se acepta la hipótesis nula. Es decir, con una
confianza del 95% podemos afirmar que estos datos proporcionan suficiente evidencia en
contra de que las medianas poblacionales no son las mismas.

Gladys Enríquez Mantilla 186


UAP Facultad de Ingenierías

PRUEBA DE KRUSKAL-WALLIS

Es una alternativa a la prueba F del análisis de varianza para diseños de clasificación


simple. En este caso, se comparan varios grupos pero usando la mediana de cada uno de
ellos, en lugar de las medias.

Hipótesis:
H0 : La mediana de las k poblaciones consideradas son iguales.
H1 : Al menos una de las k poblaciones tiene mediana distinta a las otras.

Ejemplo:

Se tienen tres restaurantes A, B y C que elaboran los domingos el mismo menú. En cada
uno de ellos se selecciona una muestra de tamaño 9, 7 y 6 respectivamente y se les pide que
puntúen de 0 a 10 el grado de satisfacción y calidad que les ha proporcionado el menú. Los
datos que se obtuvieron fueron:

A : 7.0 4.5 5.6 8.2 6.3 5.0 9.1 8.7 6.9


B : 5.4 6.2 8.0 7.9 4.2 6.7 9.6
C : 8.5 7.4 5.0 4.9 7.2 6.1

¿Se puede concluir que no todos los restaurantes presentan la misma mediana poblacional?

Solución:

H 0 : Todos los restaurantes presentan la misma mediana.


H1 : No todos los restaurantes presentan la misma mediana.

• INGRESAR LOS DATOS:


C1 C2
Puntaje Restaurante
7 A
4.5 A
5.6 A
8.2 A
6.3 A
5 A
9.1 A
8.7 A
6.9 A
5.4 B
6.2 B
8 B
7.9 B
4.2 B
6.7 B
9.6 B
8.5 C
7.4 C
5 C
4.9 C
7.2 C
6.1 C

Gladys Enríquez Mantilla 187


UAP Facultad de Ingenierías

Stat – Nonparametrics – Kruskal-Wallis…

Kruskal-Wallis Test: Puntaje versus Restaurante


Kruskal-Wallis Test on Puntaje

Restaura N Median Ave Rank Z


A 9 6.900 11.9 0.27
B 7 6.700 11.7 0.11
C 6 6.650 10.6 -0.41
Overall 22 11.5

H = 0.17 DF = 2 P = 0.919
H = 0.17 DF = 2 P = 0.919 (adjusted for ties)

Interpretación:

Como p es mayor que 0.05 entonces se acepta Ho, es decir no existen evidencias como para
afirmar que no todos los restaurantes presentan la misma mediana.

PRUEBA DE HIPÓTESIS DE FRIEDMAN

Se utiliza cuando se desea comparar los efectos de k tratamientos y se sabe que hay una
variable que, si bien no es de interés directo, puede interferir la capacidad de detectar
diferencias reales entre los k tratamientos.

Estadística de Prueba:

k 2
⎡ b ( k +1 ) ⎤
S = ∑ ⎢ Ri − 2 ⎥
i =1 ⎣ ⎦

Donde:
k : número de tratamientos.
b : número de bloques.
R i : suma de los rangos asociados con cada uno de los k tratamientos.

Gladys Enríquez Mantilla 188


UAP Facultad de Ingenierías

Ejemplo:

Un experimento sobre la alimentación de ganado porcino se lleva a cabo mediante la


comparación de tres raciones diferentes A, B y C. Se han administrado las mismas a tres
cerdos de cinco camadas, obteniendo las siguientes ganancias de peso en libras:

Camadas (bloques)
Ración 1 2 3 4 5
A 6.7 16.2 13.4 10.8 14.2
B 13.3 15.2 20.2 9.9 19.6
C 8.2 16.3 13.8 15.8 14.4

¿Existen diferencias en el peso ganado por cada ración a un nivel de significación del 1%?

Solución:

H0 : No existen diferencias en el peso ganado por cada ración.


H1 : Al menos una de las raciones presenta una ganancia de peso diferente.

• INGRESAR LOS DATOS:

Stat Nonparametrics – Friedman…

OK

Gladys Enríquez Mantilla 189


UAP Facultad de Ingenierías

Friedman Test: gan Peso versus Racion, Camada

Friedman test for gan Peso by Racion blocked by Camada

S = 2.80 DF = 2 P = 0.247

Est Sum of
Racion N Median Ranks
A 5 13.433 7.0
B 5 18.867 11.0
C 5 13.800 12.0

Grand median = 15.367

Interpretación:

Como P=0,247 es mayor que 0,05 entonces se acepta H0 . Es decir con una confianza
del 95% se puede concluir que no existen diferencias en el peso ganado por cada ración.

COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN

La correlación de Spearman mide el grado de asociación entre dos variables cuantitativas


que siguen una tendencia siempre creciente o siempre decreciente. Es decir, es más general
que el coeficiente de correlación de Pearson, el cual asume que la relación entre las dos
variables solamente es lineal, la correlación de Spearman en cambio se puede calcular para
relaciones exponenciales o logarítmicas entre las variables.

Este coeficiente se emplea cuando no se puede determinar la magnitud de las


características pero sí se pueden ordenar por su tamaño o por su importancia relativa con
respecto a los demás términos de la serie.

El coeficiente de correlación de Spearman simplemente es la correlación de Pearson entre


los rangos de los valores de las dos variables y se puede utilizar como un estadístico de
prueba para verificar la independencia entre X e Y.

Para el cálculo del coeficiente de Spearman se utiliza la fórmula:

rS = 1 −
6 ∑ d2i
n ( n2 − 1 )

Donde:
n : número de observaciones pareadas.
d i = rx i − ry i es la diferencia entre los rangos de X e Y.

Hipótesis:

H 0 : X e Y son mutuamente independientes.


H1 : X e Y no son mutuamente independientes.

Gladys Enríquez Mantilla 190


UAP Facultad de Ingenierías

Ejemplo:

Como parte de un estudio, un equipo de investigadores médicos recolectó valores de


secreción de aldosterorna y valores del área superficial del cuerpo en un grupo de 18 niños.

Area SupCorp:

0.20 0.25 0.50 0.60 0.70 0.55 0.40 0.55 0.75 0.60
0.30 0.28 0.30 0.40 0.25 0.72 0.70 0.50

Novel Aldost.

22 41 80 50 70 110 32 69 120 30
52 36 100 100 70 22 40 50

¿Proporcionan estos datos evidencia suficiente como para indicar que los niveles de
secreción de aldosterona y los valores del área superficial del cuerpo en los niños no son
independientes?

Solución:

• INGRESAR LOS DATOS:

C1 C2 Para calcular los rangos de cada una de estas


Area SCorp Nov Aldost. columnas se procede de la siguiente manera:
0.2 22
Manip – Rank…
0.25 41
0.5 80
0.6 50
0.7 70
0.55 110
0.4 32
0.55 69
0.75 120
0.6 30
0.3 52
0.28 36
0.3 100
0.4 100
0.25 70
0.72 22
0.7 40
0.5 50

Al presionar OK, aparecen los rangos entonces en la columna C3 se debe escribir Rango de
C1.

Gladys Enríquez Mantilla 191


UAP Facultad de Ingenierías

Manip – Rank…

Al presionar OK, aparecen los rangos entonces en la columna C4 se debe escribir Rango de
C2.

La hoja de cálculo debe presentar las siguientes columnas:

C1 C2 C3 C4
Area SupCorp Novel Aldost. Rango de C1 Rango de C2
0.2 22 1 1.5
0.25 41 2.5 7
0.5 80 9.5 14
0.6 50 13.5 8.5
0.7 70 15.5 12.5
0.55 110 11.5 17
0.4 32 7.5 4
0.55 69 11.5 11
0.75 120 18 18
0.6 30 13.5 3
0.3 52 5.5 10
0.28 36 4 5
0.3 100 5.5 15.5
0.4 100 7.5 15.5
0.25 70 2.5 12.5
0.72 22 17 1.5
0.7 40 15.5 6
0.5 50 9.5 8.5

A continuación se encuentra el coeficiente de correlación de los rangos, es decir de las


columnas C3 y C4.

Gladys Enríquez Mantilla 192


UAP Facultad de Ingenierías

Stat – Basic Statistics – Correlation…

Correlations: Rango de C1, Rango de C2

Pearson correlation of Rango de C1 and Rango de C2 = 0.124


P-Value = 0.625

Interpretación:

Como p es mayor que 0.05 entonces se acepta Ho, es decir estos datos proporcionan
evidencia suficiente como para indicar que los niveles de secreción de aldosterona y los
valores del área superficial del cuerpo en los niños sí son independientes

Gladys Enríquez Mantilla 193

También podría gustarte