Está en la página 1de 4

Pruebas no paramétricas

Dr. Jesús Alberto Mellado Bosque

1 Definición
Cuando se tiene una población que se va a estudiar, se definen las variables (características)
que se van a medir en cada uno de los elementos o unidades experimentales y luego se lleva a
cabo el muestreo. El objetivo es elaborar un modelo matemático que exprese el
comportamiento de la población en cuestión. Afortunadamente, en la mayoría de las veces se
tienen modelos predeterminados del comportamiento de los datos, que se les llama
distribuciones, así por ejemplo, se tienen las distribuciones uniforme, normal, binomial, etc.
Estas distribuciones tienen parámetros propios de la población, como lo son la media o la
desviación estándar.
En algunos casos no se sabe si la población tiene un modelo predeterminado, es decir, no se
sabe si es uniforme, normal, exponencial, binomial, etc. Por ejemplo, el patrón de infección de
un parásito, la aparición de alguna característica en un animal, etc. Entonces no tiene sentido
calcular los parámetros, porque no se sabe la distribución.
Cuando la muestra es grande, se puede realizar la prueba de bondad de ajuste (ji-cuadrada) o
prueba de normalidad para determinar si los datos tienen alguna distribución. Si la prueba
determina que los datos no tienen alguna distribución, o si la muestra es muy pequeña para la
prueba, se procede con las pruebas no paramétricas.

2 Prueba de los signos (Prueba de Hipótesis para


la mediana)
La hipótesis nula es que M (mediana) = M0 al momento de aplicar un tratamiento, en
consecuencia la hipótesis alterna es que la mediana es diferente a M0. El procedimiento es es
siguiente:

1 Establecer la hipótesis
nula y la hipótesis alterna.
H0: M = M0.
H1: M ≠ M0

2 Se toman los datos de la


variable en cuestión.
3 Los valores que estén por debajo de la mediana se les asigna un número negativo y los
valores que estén por encima de la mediana se les asigna un número positivo. Los
valores que sean igual a la mediana no se toma en cuenta.

4 En caso de que H0 sea cierta, la mediana debe estar en medio y el número de casos
positivos debe ser igual al de casos negativos, en este caso la probabilidad de que salga
un positivo es igual al de un negativo, es decir p=0.5 (q=1-p=0.5)

5 Se obtiene la probabilidad de que ocurran x positivos


mediante la binomial, donde p=0.5, n es el número de
observaciones y x es el número de casos positivos.
n
P( x)    p x (1  p) n  x
 x
(Los cálculos se pueden hacer en Excel con la función
binomial).

6 Si la probabilidad es menor a 0.05 se rechaza la hipótesis nula, de lo contrario se


acepta.

Importante: También se pueden probar las hipótesis nulas de que H 0:M < M0 o que H0: M >
M0. Aunque no se tratan en el presente texto, siguen el mismo procedimiento, pero en el
primer caso H0 se rechaza cuando los casos positivos tienen mayor cantidad y P(x)<0.05; en
el segundo caso se rechaza cuando los los valores positivos son menor cantidad y P(x)<0.05.

3 Prueba de Wilcoxon para dos medias.


La prueba de Wilcoxon se aplica cuando a un grupo de unidades experimentales se les aplica
un tratamiento, y a otro grupo del mismo tamaño se deja como grupo testigo. Se selecciona
una unidad experimental del grupo del tratamientos y otra unidad del testigo, se miden y se
toma la diferencia entre ellos. Los pasos se muestran a continuación.

Datos Datos Diferencia Valor abs Odenados Posición Posición Con signo
Trat Testigo diferencia Promedios original
11 9 2 2 0
12 15 -3 3 1 1 1.5 1.5
5 9 -4 4 1 2 1.5 -1.5
7 6 1 1 2 3 3.5 3.5
5 14 -9 9 2 4 3.5 3.5
5 16 -11 11 3 5 5 -5
8 8 0 0 4 6 6 -6
9 10 -1 1 9 7 7 -7
16 14 2 2 10 8 8 -8
8 18 -10 10 11 9 9 -9
Suma positivos = 8.5
1 En la primera columna y segunda columna se anotan los datos recabados
de las unidades experimentales con tratamiento y testigo. n
6
Valor
crítico
2

2 En la tercera columna se anota su diferencia, respetando los signos (la


primera columna menos la segunda).
7
8
9
3
5
8

3 La cuarta columna es el valor absoluto de la diferencia (eliminando el 10 10


signo) 11 13
12 17

4 La quinta columna incluye los datos de la cuarta columna ordenados


de menor a mayor.
13
14
15
21
25
30

5 En la sexta columna se asigna la posición ordinal eliminando los


ceros. (del 1 al n).
16
17
18
35
41
47

6 Si dos o más números son iguales, se van a promediar sus números


ordinales y se les asigna el promedio a todos (columna 7)
19
20
21
53
60
67

7 En la columna ocho se copian los valores de la columna siete y se les


va a agregar el signo del número de la diferencia donde provienen, por
ejemplo, la posición 8 viene del número 10, que originalmente tenía
22
23
75
83
número negativo, así que se agrega el número negativo al 8 (-8). 24 91

8
25 100
Se suman los números positivos. Y en la tabla de la derecha se va a
localizar el valor de n (el número de datos excluyendo los ceros, en 26 110
este ejemplo es 9). Si la suma de los positivos es menor al valor crítico, 27 119
se considera que hay diferencia entre las muestras, de lo contrario, se 28 130
considera que las muestras son iguales. 29 140
30 151
31 163
32 175
33 187
34 200
35 213
36 227
37 241
38 256

4 Prueba de Kruskal-Wallis para varias medias.


La prueba de Kruskal-Wallis se aplica cuando se aplican varios tratamientos a grupos de
unidades experimentales de tamaño n1, n2, …. Y se desea determinar si hay diferencia entre
sus medias.
Trat Result Trat Result Trat Result

1 Se anotan en cuadros los


tratamientos y los resultados
obtenidos.
1
1
1
6
8
7
2
2
2
8
8
9
3
3
3
9
10
10
1 5 2 11 3 11
1 4 3 11
3 12

2 Los resultados se ubican en una sola columna y se


ordenan según el resultado junto con el tratamiento
que corresponde, como se muestran en la columna
Trat
1
1
Result
4
5
Ordinal Ord c/prom
1
2
1
2
1 y 2 de la derecha. 1 6 3 3

3
1 7 4 4.5
Como se muestra en la columna 3, se le asigna un
número ordinal a cada valor. 2 7 5 4.5
1 8 6 6.5

4 Como se muestra en la columna 4, si dos o mas 2 8 7 6.5


resultados son iguales, se obtiene el promedio de 2 9 8 8.5
los ordinales que le corresponde y se le asigna a 3 9 9 8.5
cada uno. 3 10 10 10.5

5
3 10 11 10.5
Se obtiene el valor de R, que es la suma de todos
los ordinales entre N (total de datos), pero también 2 11 12 13
se puede obtener con la ecuación: 3 11 13 13
3 11 14 13
𝑁+1
R= =8 3 12 15 15
2

6 Se suman los ordinales que corresponden a


cada tratamiento, como se muestran en las
columna 1 y 2 de la tabla de la derecha.
trat Ri
1
Ri prom (Ri prom-R)2 ni(Ri prom-R)2
17 3.40
2 32.5 8.13
21.16
0.02
105.80
0.06

7
A cada suma de cada tratamiento (columna
2) se le resta el número de datos en cada 3 70.5 11.75 14.06 84.38
tratamiento, el resultado es Ri-prom y se pone suma 190.24
en la columna 3.

8 A cada promedio de cada tratamiento (columna 3) se le resta el valor de R total y se


eleva al cuadrado, el valor se pone en la columna 4.

9 En la columna 4 se multiplica cada valor por el número de datos y se suma la columna.

10
2
Se resuelve el estadístico H con la ecuación que se 12 𝑛𝑖 𝑅𝑖 − 𝑅
muestra (Nótese que la sumatoria del numerador ya 𝐻=
está calculado al sumar la última columna de la tabla: 𝑁 𝑁+1

11 Se busca en la tabla ji-cuadrada en la columna 0.05 en


el renglón t-1 (tratamientos -1), es decir, en el renglón
de 2gl. Si H es menor a x2 2gl,0.05, Ho se acepta, de lo
𝐻=
12(190.24)
15 15+1
= 9.51
contrario se concluye que hay diferencia significativa
entre tratamientos.
Como 9.5 > 5.99 se concluye que hay diferencia significativa entre tratamientos.

También podría gustarte