20101da02010220802010402114074 PDF

UAP Facultad de Ingenierías
PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS
Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de

probabilidad a partir de la que fueron obtenidos los datos. Son muy útiles cuando no puede
suponerse que los datos cumplen las condiciones de una prueba paramétrica o cuando los
datos se presentan en forma ordinal.
Las principales pruebas no paramétricas son:
Prueba no Paramétrica Su alternativa Paramétrica

Prueba de Rachas -
Prueba del Signo para una muestra.
Prueba de Wilcoxon para una muestra. Prueba t para la media.
Prueba del Signo para 2 muestras pareadas.

Prueba de Wilcoxon para 2 muestras pareadas. Prueba t para datos pareados.
Prueba t para dos muestras

Prueba U de Mann-Whitney. independientes.
Prueba de Kruskal-Wallis. Anova de un factor.
Anova de un factor y un bloque

Prueba de Friedman
Coeficiente de Correlación de
Coeficiente de Correlación por Rangos de
Pearson.
Spearman
Ventajas:
- El procedimiento es relativamente fácil de entender y de aplicar.

- Su uso es apropiado para muestras de tamaño mayor o igual que 25.
- No se afectan significativamente en presencia de observaciones atípicas o
outliers.
- Si uno o más de los supuestos distribucionales en una prueba paramétrica no se
cumplen, la correspondiente prueba no paramétrica es más eficiente.
- Tienen un gran campo de aplicación.
Desventajas:
- Serán menos eficientes que el procedimiento paramétrico correspondiente

cuando se pueden aplicar ambos métodos. Es decir, si se puede utilizar una
prueba paramétrica y se usa una no paramétrica, entonces hay una pérdida de
información.
- Son menos eficientes si las muestras son menores que 25..
Gladys Enríquez Mantilla 175

PRUEBA DE RACHAS
Se llama racha a la interacción entre elementos iguales dentro de una secuencia de sucesos
observables. El número de elementos de una racha se llama longitud.
Por ejemplo, si se tiene la secuencia de dos sucesos A y B:
AAA BB A BB AA BBB ésta tiene 6 rachas

Cuyas longitudes son: 3 2 1 2 2 3
Si en una muestra, la aparición de un elemento condiciona la aparición de otro; entonces la

muestra no es aleatoria.
Esta prueba se utiliza para determinar si la muestra fue extraída de manera aleatoria; es
decir si es aleatorio el orden de aparición de dos valores de una variable.
Hipótesis:
H0 : La muestra es aleatoria.
H1 : La muestra no es aleatoria.
Ejemplo:
El registro de juegos perdidos y ganados por un equipo de fútbol en sus últimos 60 partidos
consecutivos fue el siguiente:
Resultado
G G G G G G P G G G G G G P G G G G
G G G P P P G G P P P P G P P P P G
P P P P G G P P G G G G P G G G G P
G G G G G G
¿Se puede afirmar que los resultados han sido aleatorios?
Hipótesis:
H0 : Los resultados han sido aleatorios.
H1 : Los resultados no han sido aleatorios.
Ingresar los datos:

Luego, codificar estos datos texto en datos numéricos: asignando 1 a G y 2 a P.
Manip – Code – Tex to Numeric…
OK
Stat – Nonparametrics - Runs Test…
OK
Runs Test: C2
C2
K = 1.3500
The observed number of runs = 19
The expected number of runs = 28.3000
21 Observations above K 39 below
The test is significant at 0.0077
Interpretación: P= 0.0077 entonces se acepta H1 por lo tanto los resultados no han sido
aleatorios.

PRUEBA DEL SIGNO

Para un grupo:
Se utiliza para probar hipótesis sobre la mediana de un grupo con distribución continua. Es
una alternativa a la prueba t para la media poblacional.
Sobre la base de una muestra aleatoria de tamaño n, se sustituye cada valor de la muestra
mayor que la mediana con el signo positivo (+) y cada valor menor que la mediana con el
signo negativo (-).
Hipótesis:
H0 : La mediana poblacional es igual a un valor dado.

H1 : La mediana poblacional es menor (mayor o diferente) del valor dado.
Para dos grupos:
Se utiliza para probar la hipótesis sobre la mediana con grupos pareados o dependientes. Se
estudia la diferencia para cada par de observaciones pero no se estudian los dos grupos
individualmente como se hacía en las pruebas paramétricas. La prueba del Signo no toma
en cuenta la magnitud de la diferencia.
Hipótesis:
H0 : La diferencia es cero (no hay cambio).

H1 : La diferencia es menor (mayor o diferente) de cero.
Ejemplo 1: Prueba del Signo para un grupo.
Se supone que el peso mediano de un grupo de personas con sobrepeso es inferior a 97

kilos. Los datos obtenidos son los siguientes:
96.4 96.0 95.3 97.0 96.5 96.8 93.2 95.2

95.2 100.3 99.1 98.5 97.3 97.0 96.1 94.9
¿Es correcta dicha afirmación?
Solución:
Hipótesis:
H0 : La mediana es sup erior o igual a 97
H1 : La mediana es menor que 97
• INGRESAR LOS DATOS:
C1
Peso
96.4
96
95.3
97
96.5
96.8
93.2
95.2
etc.

Stat – Nonparametrics – 1-Sample Sign…
Sign Test for Median: Peso
Sign test of median = 97.00 versus < 97.00

N Below Equal Above P Median
Peso 16 10 2 4 0.0898 96.45
Interpretación:
Como el valor P es mayor que 0.05, entonces con una confianza del 95% concluimos que la
mediana no es menor que 97. Se acepta Ho.
Ejemplo 2: Prueba del Signo para dos grupos pareados.
Se desea hacer un estudio para comparar la energía en reposo usada por personas con
cierta enfermedad vs. La energía en reposo usada por personas sanas. Para ello se eligen al
azar pares de personas (pacientes de la misma edad, sexo, estatura y peso) enfermas y
sanas. Los datos son los siguientes:
Energía usada por pacientes

par
enfermos sanos
1 1153 996
2 1132 1080
3 1165 1182
4 1460 1452
5 1634 1162
6 1493 1619
7 1358 1140
8 1453 1123
9 1185 1113
10 1824 1463
11 1793 1632
12 1930 1614
13 2075 1836
Obtener una conclusión significativa.

Solución:
Hipótesis:
H 0 : No hay diferencia entre personas sanas y enfermas.
(La mediana de las diferencias es cero)
H1 : Sí hay diferencia entre personas sanas y enfermas.
C1 C2 C3
enfermos sanos Diferencia
1153 996
1132 1080
1165 1182
1460 1452
1634 1162
1493 1619
1358 1140
1453 1123
1185 1113
1824 1463
1793 1632
1930 1614
2075 1836
En la columna C3 escribir como título: Diferencia
Calc – Calculator…
En la columna C3 aparecerá el resultado de restar la columna C1 menos la columna C2.

Stat – Nonparametrics – 1-Sample Sign…
Sign Test for Median: Diferencia
Sign test of median = 0.00000 versus not = 0.00000
N Below Equal Above P Median

Diferenc 13 2 0 11 0.0225 161.0
Interpretación:
Como el valor P es menor que 0.05, entonces con una confianza del 95% concluimos que la
mediana no es cero, es decir existen evidencias para afirmar que sí hay diferencias entre
personas sanas y enfermas en cuanto a la energía usada en reposo. Se acepta la hipótesis
alternativa.
PRUEBA DE WILCOXON
Esta prueba se utiliza para probar hipótesis relativas a la mediana con un solo grupo o con
grupos pareados o dependientes en una población simétrica, es decir se utiliza en los
mismos casos que la prueba del signo pero la diferencia radica en que la prueba de
Wilcoxon es un procedimiento que utiliza tanto la dirección (signo) como la magnitud
mientras que la prueba del Signo considera sólo la dirección.
Esta prueba considera que si la hipótesis nula fuera cierta, las diferencias negativas serían
similares en cantidad y tamaño a las diferencias positivas.
Para un grupo:
Hipótesis:
H0 : La mediana poblacional es igual a un valor dado.

H1 : La mediana poblacional es menor (mayor o diferente) del valor dado.

Para dos grupos:
Hipótesis:
H0 : La diferencia es cero (no hay cambio).

H1 : La diferencia es menor (mayor o diferente) de cero.
Ejemplo 1: Prueba de Wilcoxon para un grupo.
Un actuario de una compañía de seguros desea examinar los registros de reclamos por robo
de las personas que tienen póliza contra incendio y robo. En el pasado, la mediana fue de
85 dólares por reclamo. Se toma una muestra aleatoria de 18 reclamos y los resultados,
expresados en dólares, son los siguientes:
140 92 35 202 80 87 80 100 47

25 160 68 50 65 310 90 75 120
¿Ha aumentado significativamente la mediana?
Solución:
Hipótesis:
H 0 : La mediana no ha aumentado.
H1 : La mediana ha aumentado. ( Me > 85 )
Stat – Nonparametrics – 1 Sample Wilcoxon…
OK

Wilcoxon Signed Rank Test: Reclamos
Test of median = 85.00 versus median > 85.00
N for Wilcoxon Estimated

N Test Statistic P Median
Reclamos 18 18 91.5 0.405 87.50
Interpretación:
Como el valor P es mayor que 0.05, entonces con una confianza del 95% concluimos que la
mediana no es mayor que 85. Se acepta Ho.
Ejemplo 2: Prueba de Wilcoxon para dos grupos pareados.
Adamson estudió los efectos sobre la salud causados por la exposición diaria a fuertes
ejercicios físicos en unos varones voluntarios. Para ocho de los sujetos la tabla muestra los
niveles nocturnos de plasma corticostiroide observados en controles las noches anteriores y
posteriores a los ejercicios.
Antes 69.9 46.0 63.7 55.9 53.9 72.9 53.9 36.5

Después 49.9 45.9 47.5 57.9 47.1 50.3 36.7 31.4
¿Se puede afirmar que el nivel nocturno de plasma corticostiroide disminuye con los
ejercicios?
Solución:
Hipótesis:
H 0 : La mediana de las diferencias no es mayor que cero.

H1 : La mediana de las diferencias es mayor que cero.
C1 C2 C3
Antes Después Diferencia
69.9 49.9
46 45.9
63.7 47.5
55.9 57.9
53.9 47.1
72.9 50.3
53.9 36.7
36.5 31.4
En la columna C3 escribir como título: Diferencia

Calc – Calculator…
En la columna C3 aparecerá el resultado de restar la columna C1 menos la columna C2.
Stat – Nonparametrics – 1- Sample Wilcoxon…
Wilcoxon Signed Rank Test: Diferencia
Test of median = 0.000000 versus median > 0.000000
N for Wilcoxon Estimated

N Test Statistic P Median
Diferenc 8 8 34.0 0.015 10.90
Interpretación:
Como P es menor que 0.05 entonces se acepta la hipótesis alternativa.

PRUEBA DE MANN-WHITNEY
Esta prueba se usa cuando se quiere comparar dos poblaciones usando muestras
independientes, es decir es una prueba alterna a la prueba t para comparar dos medias
usando muestras independientes.
Es una prueba no paramétrica que mide las diferencias entre medias, asignando rangos a
cada grupo.
Hipótesis:
H0 : La mediana de las dos poblaciones son iguales.

H1 : La mediana de la primera población es menor (mayor o diferente) que la
mediana de la segunda población.
Estadística de Prueba:
n1 ( n1 +1 )
U = n1 n2 + − R1
2
Donde:
n1 : Número de elementos en la muestra 1.
n2 : Número de elementos en la muestra 2.
R1 : Suma de los rangos de los elementos en la muestra 1.
R2 : Suma de los rangos de los elementos en la muestra 2.
Ejemplo:
El director de control de calidad de una firma farmacéutica desea saber si dos métodos de
producción de comprimidos proporcionan diferencias entre los espesores medianos. Una
muestra aleatoria de comprimidos es extraída de lotes producidos por los dos métodos,
ofreciendo los siguientes resultados que han sido codificados:
método A:
51 42 45 48 52 44 58 41 52 44 45 52 61 60 41
método B:
40 47 36 39 37 46 43 55 53 56
¿Proporcionan estos datos suficiente evidencia en contra de que las medianas poblacionales
no son las mismas?
Solución:
Hipótesis:
H 0 : Las medianas poblacionales son las mismas.

H1 : Las medianas poblacionales no son las mismas.

En la columna C1 ingresar los datos del método A y en la columna C2 ingresar los
datos del método B.

Stat – Nonparametrics – Mann- Whitney…
Mann-Whitney Test and CI: método A, método B
método A N = 15 Median = 48.00

método B N = 10 Median = 44.50
Point estimate for ETA1-ETA2 is 5.00

95.1 Percent CI for ETA1-ETA2 is (-3.00,9.00)
W = 217.0
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2330

The test is significant at 0.2324 (adjusted for ties)
Cannot reject at alpha = 0.05
Interpretación:
Como P = 0.2324 es mayor que 0.05 entonces se acepta la hipótesis nula. Es decir, con una
confianza del 95% podemos afirmar que estos datos proporcionan suficiente evidencia en
contra de que las medianas poblacionales no son las mismas.

PRUEBA DE KRUSKAL-WALLIS
Es una alternativa a la prueba F del análisis de varianza para diseños de clasificación

simple. En este caso, se comparan varios grupos pero usando la mediana de cada uno de
ellos, en lugar de las medias.
Hipótesis:
H0 : La mediana de las k poblaciones consideradas son iguales.
H1 : Al menos una de las k poblaciones tiene mediana distinta a las otras.
Ejemplo:
Se tienen tres restaurantes A, B y C que elaboran los domingos el mismo menú. En cada
uno de ellos se selecciona una muestra de tamaño 9, 7 y 6 respectivamente y se les pide que
puntúen de 0 a 10 el grado de satisfacción y calidad que les ha proporcionado el menú. Los
datos que se obtuvieron fueron:
A : 7.0 4.5 5.6 8.2 6.3 5.0 9.1 8.7 6.9

B : 5.4 6.2 8.0 7.9 4.2 6.7 9.6
C : 8.5 7.4 5.0 4.9 7.2 6.1
¿Se puede concluir que no todos los restaurantes presentan la misma mediana poblacional?
Solución:
H 0 : Todos los restaurantes presentan la misma mediana.

H1 : No todos los restaurantes presentan la misma mediana.

C1 C2
Puntaje Restaurante
7 A
4.5 A
5.6 A
8.2 A
6.3 A
5 A
9.1 A
8.7 A
6.9 A
5.4 B
6.2 B
8 B
7.9 B
4.2 B
6.7 B
9.6 B
8.5 C
7.4 C
5 C
4.9 C
7.2 C
6.1 C

Stat – Nonparametrics – Kruskal-Wallis…
Kruskal-Wallis Test: Puntaje versus Restaurante

Kruskal-Wallis Test on Puntaje
Restaura N Median Ave Rank Z

A 9 6.900 11.9 0.27
B 7 6.700 11.7 0.11
C 6 6.650 10.6 -0.41
Overall 22 11.5
H = 0.17 DF = 2 P = 0.919
H = 0.17 DF = 2 P = 0.919 (adjusted for ties)
Interpretación:
Como p es mayor que 0.05 entonces se acepta Ho, es decir no existen evidencias como para
afirmar que no todos los restaurantes presentan la misma mediana.
PRUEBA DE HIPÓTESIS DE FRIEDMAN
Se utiliza cuando se desea comparar los efectos de k tratamientos y se sabe que hay una
variable que, si bien no es de interés directo, puede interferir la capacidad de detectar
diferencias reales entre los k tratamientos.
Estadística de Prueba:
k 2
⎡ b ( k +1 ) ⎤
S = ∑ ⎢ Ri − 2 ⎥
i =1 ⎣ ⎦
Donde:
k : número de tratamientos.
b : número de bloques.
R i : suma de los rangos asociados con cada uno de los k tratamientos.

Ejemplo:
Un experimento sobre la alimentación de ganado porcino se lleva a cabo mediante la

comparación de tres raciones diferentes A, B y C. Se han administrado las mismas a tres
cerdos de cinco camadas, obteniendo las siguientes ganancias de peso en libras:
Camadas (bloques)
Ración 1 2 3 4 5
A 6.7 16.2 13.4 10.8 14.2
B 13.3 15.2 20.2 9.9 19.6
C 8.2 16.3 13.8 15.8 14.4
¿Existen diferencias en el peso ganado por cada ración a un nivel de significación del 1%?
Solución:
H0 : No existen diferencias en el peso ganado por cada ración.

H1 : Al menos una de las raciones presenta una ganancia de peso diferente.
Stat Nonparametrics – Friedman…
OK

Friedman Test: gan Peso versus Racion, Camada
Friedman test for gan Peso by Racion blocked by Camada
S = 2.80 DF = 2 P = 0.247
Est Sum of
Racion N Median Ranks
A 5 13.433 7.0
B 5 18.867 11.0
C 5 13.800 12.0
Grand median = 15.367
Interpretación:
Como P=0,247 es mayor que 0,05 entonces se acepta H0 . Es decir con una confianza
del 95% se puede concluir que no existen diferencias en el peso ganado por cada ración.
COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN
La correlación de Spearman mide el grado de asociación entre dos variables cuantitativas

que siguen una tendencia siempre creciente o siempre decreciente. Es decir, es más general
que el coeficiente de correlación de Pearson, el cual asume que la relación entre las dos
variables solamente es lineal, la correlación de Spearman en cambio se puede calcular para
relaciones exponenciales o logarítmicas entre las variables.
Este coeficiente se emplea cuando no se puede determinar la magnitud de las

características pero sí se pueden ordenar por su tamaño o por su importancia relativa con
respecto a los demás términos de la serie.
El coeficiente de correlación de Spearman simplemente es la correlación de Pearson entre

los rangos de los valores de las dos variables y se puede utilizar como un estadístico de
prueba para verificar la independencia entre X e Y.
Para el cálculo del coeficiente de Spearman se utiliza la fórmula:
rS = 1 −
6 ∑ d2i
n ( n2 − 1 )
Donde:
n : número de observaciones pareadas.
d i = rx i − ry i es la diferencia entre los rangos de X e Y.
Hipótesis:
H 0 : X e Y son mutuamente independientes.

H1 : X e Y no son mutuamente independientes.

Ejemplo:
Como parte de un estudio, un equipo de investigadores médicos recolectó valores de

secreción de aldosterorna y valores del área superficial del cuerpo en un grupo de 18 niños.
Area SupCorp:
0.20 0.25 0.50 0.60 0.70 0.55 0.40 0.55 0.75 0.60
0.30 0.28 0.30 0.40 0.25 0.72 0.70 0.50
Novel Aldost.
22 41 80 50 70 110 32 69 120 30
52 36 100 100 70 22 40 50
¿Proporcionan estos datos evidencia suficiente como para indicar que los niveles de
secreción de aldosterona y los valores del área superficial del cuerpo en los niños no son
independientes?
Solución:
C1 C2 Para calcular los rangos de cada una de estas

Area SCorp Nov Aldost. columnas se procede de la siguiente manera:
0.2 22
Manip – Rank…
0.25 41
0.5 80
0.6 50
0.7 70
0.55 110
0.4 32
0.55 69
0.75 120
0.6 30
0.3 52
0.28 36
0.3 100
0.4 100
0.25 70
0.72 22
0.7 40
0.5 50
Al presionar OK, aparecen los rangos entonces en la columna C3 se debe escribir Rango de
C1.

Manip – Rank…
Al presionar OK, aparecen los rangos entonces en la columna C4 se debe escribir Rango de
C2.
La hoja de cálculo debe presentar las siguientes columnas:
C1 C2 C3 C4
Area SupCorp Novel Aldost. Rango de C1 Rango de C2
0.2 22 1 1.5
0.25 41 2.5 7
0.5 80 9.5 14
0.6 50 13.5 8.5
0.7 70 15.5 12.5
0.55 110 11.5 17
0.4 32 7.5 4
0.55 69 11.5 11
0.75 120 18 18
0.6 30 13.5 3
0.3 52 5.5 10
0.28 36 4 5
0.3 100 5.5 15.5
0.4 100 7.5 15.5
0.25 70 2.5 12.5
0.72 22 17 1.5
0.7 40 15.5 6
0.5 50 9.5 8.5
A continuación se encuentra el coeficiente de correlación de los rangos, es decir de las

columnas C3 y C4.

Stat – Basic Statistics – Correlation…
Correlations: Rango de C1, Rango de C2
Pearson correlation of Rango de C1 and Rango de C2 = 0.124

P-Value = 0.625
Interpretación:
Como p es mayor que 0.05 entonces se acepta Ho, es decir estos datos proporcionan
evidencia suficiente como para indicar que los niveles de secreción de aldosterona y los
valores del área superficial del cuerpo en los niños sí son independientes

20101da02010220802010402114074 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

20101da02010220802010402114074 PDF

Cargado por

Copyright:

Formatos disponibles

UAP Facultad de Ingenierías

PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS

Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de

Las principales pruebas no paramétricas son:

Prueba no Paramétrica Su alternativa Paramétrica

Prueba del Signo para 2 muestras pareadas.

Prueba t para dos muestras

Prueba de Kruskal-Wallis. Anova de un factor.

Anova de un factor y un bloque

- El procedimiento es relativamente fácil de entender y de aplicar.

- Serán menos eficientes que el procedimiento paramétrico correspondiente

Gladys Enríquez Mantilla 175

Por ejemplo, si se tiene la secuencia de dos sucesos A y B:

AAA BB A BB AA BBB ésta tiene 6 rachas

Si en una muestra, la aparición de un elemento condiciona la aparición de otro; entonces la

Ingresar los datos:

Gladys Enríquez Mantilla 176

Luego, codificar estos datos texto en datos numéricos: asignando 1 a G y 2 a P.

Manip – Code – Tex to Numeric…

Stat – Nonparametrics - Runs Test…

Gladys Enríquez Mantilla 177

PRUEBA DEL SIGNO

H0 : La mediana poblacional es igual a un valor dado.

Para dos grupos:

H0 : La diferencia es cero (no hay cambio).

Ejemplo 1: Prueba del Signo para un grupo.

Se supone que el peso mediano de un grupo de personas con sobrepeso es inferior a 97

96.4 96.0 95.3 97.0 96.5 96.8 93.2 95.2

¿Es correcta dicha afirmación?

• INGRESAR LOS DATOS:

Gladys Enríquez Mantilla 178

Stat – Nonparametrics – 1-Sample Sign…

Sign Test for Median: Peso

Sign test of median = 97.00 versus < 97.00

Ejemplo 2: Prueba del Signo para dos grupos pareados.

Energía usada por pacientes

Obtener una conclusión significativa.

Gladys Enríquez Mantilla 179

• INGRESAR LOS DATOS:

En la columna C3 escribir como título: Diferencia

En la columna C3 aparecerá el resultado de restar la columna C1 menos la columna C2.

Gladys Enríquez Mantilla 180

Stat – Nonparametrics – 1-Sample Sign…

Sign Test for Median: Diferencia

Sign test of median = 0.00000 versus not = 0.00000

N Below Equal Above P Median

H0 : La mediana poblacional es igual a un valor dado.

Gladys Enríquez Mantilla 181

Para dos grupos:

H0 : La diferencia es cero (no hay cambio).

Ejemplo 1: Prueba de Wilcoxon para un grupo.

140 92 35 202 80 87 80 100 47

¿Ha aumentado significativamente la mediana?

• INGRESAR LOS DATOS:

Stat – Nonparametrics – 1 Sample Wilcoxon…

Gladys Enríquez Mantilla 182

Wilcoxon Signed Rank Test: Reclamos

Test of median = 85.00 versus median > 85.00

N for Wilcoxon Estimated

Ejemplo 2: Prueba de Wilcoxon para dos grupos pareados.

Antes 69.9 46.0 63.7 55.9 53.9 72.9 53.9 36.5

H 0 : La mediana de las diferencias no es mayor que cero.

• INGRESAR LOS DATOS: