Está en la página 1de 29

UNIVERSIDAD NACIONAL SAN LUIS GONZAGA DE ICA

ESCUELA DE POSGRADO

ESTADSTICA APLICADA
DR. OSWALDO ASPILCUETA FRANCO
MAG. DIANA ANICAMA ORMEO

PRUEBAS NO PARAMETRICAS

INTRODUCCIN
En la mayora de las pruebas de hiptesis se parte de la
suposicin de que la Poblacin de la que se extrae las
muestras aleatorias tiene una distribucin normal. Existen
poblaciones que no satisfacen dicha condicin porque tienen
algn sesgo respecto a la distribucin normal
Cuando las poblaciones no son normales entonces se
aplican las PRUEBAS NO PARAMETRICAS

CARACTERSTICAS DE LA DISTRIBUCIN
NORMAL DE PROBABILIDAD

Descripcin
de la
CURVA NORMAL

El extremo izquierdo se
extiende de manera
indefinida y nunca toca
el eje horizontal

Media
Mediana
Moda

La
distribucin
normal
de
probabilidad es SIMTRICA con
respecto a una lnea vertical que
pase por la media
El extremo derecho se
extiende
de
manera
indefinida y nunca toca el
eje
horizontal
ASINTOTICA

P-1

LA MEDIA, LA MEDIANA Y LA MODA, EN


UNA DISTRIBUCIN SIMTRICA

MEDIA

MEDIANA

MODA

MEDIA

MEDIANA MODA

P-1

LA MEDIA, LA MEDIANA Y LA MODA, EN


UNA DISTRIBUCIN SESGADA

CURVA CON SESGO POSITIVO


Y
CURVA CON SESGO
NEGATIVO

CURVA A

CURVA B

Sesgo +

Sesgo -

P-2

KURTOSIS

LEPTOCURTOSIS

MESOCURTOSIS

PLATOCURTOSIS

CARACTERSTICAS DE UNA DISTRIBUCIN


NORMAL DE PROBABILIDAD:

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene la


forma de campana

2. La media de una poblacin distribuida normalmente cae en el


centro de su curva normal.

3. Debido a la simetra de la distribucin normal de probabilidad, la

mediana y la moda de la distribucin se encuentran tambin en


el centro; en consecuencia, para una curva normal, la media, la
mediana y la moda tienen el mismo valor.

4. Los dos extremos de la distribucin normal de probabilidad se


extienden indefinidamente y nunca tocan el eje horizontal.

5. El rea bajo la curva normal es igual a 1

La mayor parte de las poblaciones reales no se extienden de manera


indefinida en ambas direcciones; pero para estas poblaciones, la
distribucin normal es una aproximacin conveniente. No hay una
sola distribucin normal, sino una familia de curvas normales.
Para definir una distribucin normal de probabilidad necesitamos
establecer slo dos parmetros: la media (
estndar (

) y

la desviacin

DISTRIBUCIONES NORMALES DE PROBABILIDA CON MEDIA


IDNTICAS Y DIFERENTES DESVIACIONES ESTNDAR
Curva A tiene una desviacin
estndar muy pequea

1
Curva B tiene una desviacin
estndar ms grande

Curva C tiene una desviacin


estndar muy grande

10

50

DISTRIBUCIONES NORMALES DE PROBABILIDAD CON


DIFERENTES MEDIAS E IGUALES DESVIACIN
ESTNDAR

15

25

40

Curva A tiene la
Media ms
pequea

Curva B tiene una


Media entre la de la
curva A y la C

Curva C tiene la
Media ms
grande

TRES DISTRIBUCIONES NORMALES DE PROBABILIDAD, CADA


UNA CON UNA MEDIA Y UNA DESVIACIN ESTNDAR
DIFERENTES A LAS DE LAS DEMS

15

Curva A tiene una


Media y una desviacin
estndar pequeas

10

25
Curva B tiene una Media
y una desviacin
estndar ms grande

40
Curva C tiene una
Media y desviacin
estndar muy grande

DISTRIBUCIONES NORMALES DE PROBABILIDAD CADA


UNA CON UNA MEDIA Y UNA DESVIACIN ESTNDAR
DIFERENTES A LAS DE LAS DEMS.

15
Curva A tiene una media
y
una
desviacin
estndar pequeas

10

25
Curva B tiene una media y
una desviacin
estndar
ms grande

P-3

40
Curva C tiene una media y
una desviacin
estndar
muy grande

PRUEBAS
PRUEBAS NO
NO PARAMETRICAS
PARAMETRICAS
a) PRUEBA DEL SIGNO
b) PRUEBA DE SUMAS DE RANGO,
- PRUEBA U:

PRUEBA DE WILCOXON O PRUEBA DE MANN-WHITNEY

- PRUEBA H: PRUEBA H. O PRUEBA DE KRUSKAL-WALLIS

c) PRUEBAS DE KOLMOGOROV-SMIRNOV

PRUEBA DEL SIGNO


En esta prueba describiremos una alternativa no paramtrica de la prueba t unimuestral;
para muestras apareadas y las correspondientes pruebas para muestras de gran tamao.
Como alternativa de prueba t unimuestral o de la correspondiente para muestras de gran
tamao la PRUEBA DEL SIGNO se aplica cuando muestreamos una poblacin simtrica de tal
manera que las probabilidades de obtener un valor muestral menor que la media y la de
un valor muestral mayor a la media son ambas iguales a ; ya que con frecuencia la
simetra es difcil de verificar, entonces podemos formular la hiptesis en trminos de la
mediana (

) poblacional

En una muestra aleatoria de tamao n, reemplazamos cada valor muestral >

por un signo + y cada valor muestral < 0 por un signo - ; despus probamos la
hiptesis nula de que los signos + y son los resultados de ensayos binomiales
con p = . Si un valor muestral es = 0, lo cual puede suceder descartamos dicho
valor
EJEMPLO: Los siguientes datos integran una muestra aleatoria de 11 mediciones

del coeficiente intelectual correspondiente a estudiantes de pre-grado


99.0, 102.3, 99.8, 100.5, 99.7, 103.3, 98.0, 97.4, 100.4, 98.9, 102.5
Prubese
Ho: = 98.0
H1 : > 98.0

para = 0.05

SOLUCIN:

Dado que uno de los valores muestrales es 98.0, debe descartarse y por tanto el
tamao de la muestra es igual a 10

SOLUCIN

1) FORMULACIN DE LAS HIPOTESIS


Ho: = 98.0
(p= )
H1: > 98.0
(p > )
2) NIVEL DE SIGNIFICANCIA
para = 0.05
3) CRITERIO

5) TOMA DE DECISIN
En la tabla de la binomial para n = 10 se
tiene que para x 9, p = 0.50, es 0.0107 es
la probabilidad buscada.
Luego esta probabilidad 0.0107 es menor
que 0.05 por lo tanto debe rechazarse a la
hiptesis nula y concluimos que el coeficiente
intelectual promedio de los estudiantes de
pre-grado considerado excede a 98.0

El criterio se basa en la cantidad de signos


positivos o en la cantidad de signos
negativos. Utilizando la cantidad de signos
positivos que se denotaran por x, se rechaza
la hiptesis nula si la probabilidad de obtener
x o ms signos es menos o igual a 0.05
4) CALCULOS:
Reemplazando cada valor mayor que 98.0 por un signo positivo y cada valor
menor que 98.0 por un signo negativo se tiene los 10 valores muestrales generados ;
97.4, 98.0, 98.9, 99.0, 99.7, 99.8, 100.4, 100.5, 102.3, 102.5, 103.3,
+
+
+
+
+
+
+
+
+
As x = 9 para n = 10 y p =

LA PRUEBA DEL SIGNO.- Puede emplearse


tambin como alternativa no paramtrica de la
prueba t para muestra apareadas o tambin
de la prueba correspondientes para muestras
de gran tamao. En tales problemas cada par
de valores muestrales se remplaza por un
signo + si el primer valor es mayor que el
segundo, y con un signo menos si el primer
valor es menor que el segundo. Se descarta si
los 2 valores son iguales
EJEMPLO:

SOLUCIN

1) FORMULACIN DE LA HIPTESIS
Ho:
H1:

= 0.5 (p = )
> 0.5 (p mayor que )

2) NIVEL DE SIGNIFICANCIA
= 0.05
3) CRITERIO
Si x es el nmero de signos positivos, se rechaza
la hiptesis nula cuando la probabilidad de
obtener x o mas signos positivos es menor o igual
a 0.05

Los siguientes datos son resultado del conteo


de errores ortogrficos cometidos por los
alumnos del Instituto Superior Las Amricas
(escala de 1-130) antes y despus de que se
implantara cierto programa de capacitacin
ortogrfica.

4) CALCULOS

45 y 36 73 y 60 45 y 44 45 y 45 124
y 119 36 y 35 50 y 51 83 y 77 34 y
29 26 y 24 17 y 11

5) TOMA DE DECISIN

para 0.05

Reemplazando cada par de valores se tiene:


+

As tenemos que x = 9, n =10, p =


Es 0.0108 es menor que 0.05
Dado que 0.0108 es menor que 0.05,
Rechazamos la Ho
Se concluye que el programa de capacitacin es
eficaz.

PRUEBAS DE SUMAS DE RANGOS


Existen 2 pruebas que se basa en la suma de rangos:
a)

La prueba U tambin denominada prueba Wilcoxon o Prueba Mann- Whitney

b)

La prueba H prueba de kruskal-wallis.


EJEMPLO:
Para calcular la prueba U, en un estudio sobre las competencias alcanzadas en la
asignatura de ANALISIS MATEMTICO por dos grupos de estudiantes se obtuvieron los
siguientes resultados.
Grupo I: 0,63 0,17 0,35 0,49 0,18 0,43 0,12 0,20 0,47 0,36 0,51 0,45 0,84 0,32
0,40
Grupo II: 0,98 0,54
0,58

0,96 0,26 0,39 0,88 0,92 0,53 0,95 0,48 0,89 0,99 0,97

SOLUCIN
El
problema consiste en decidir si las muestras son las mismas o son diferentes,

1) FORMULACIN DE LA HIPOTESIS
Ho: El cumplimiento de las competencias son iguales
H1: El cumplimiento de las competencias son diferentes
2) ELECCIN DE LA PRUEBA
U 1 W1

U 2 W2

n1 n1 1
2

n2 n2 1
2

Donde:
W1 es la suma de los rangos del grupo 1
W2 es la suma de los rangos del grupo 2

1+2+3+4+5=15

n1 n1 1
2

1+2+3+4+5++99 =

99

99 1
2

Adems:

Media del U1

n1n2 ( n1 n2 1)

12

2
U1

n1n2

y,

OSERVACIN
Si dos o mas valores son
iguales se le asigna un rango
que es la media de ellos

U 1 U1

= 0.01

3 ) CRITERIO
Se rechaza la hiptesis nula si Z es menor que -2.58 o mayor que 2.58 (ver tabla z)

4 ) CALCULOS
a) n1 = 15 n2 = 14
b) datos por Grupos
I

0,63 (1) 0,17 (1) 0,35 (1) 0,49 (1) 0,18 (1) 0,43 (1) 0.12 (1)

II

0,98 (2) 0,54 (2) 0,96 (2) 0,26 (2) 0,39 (2) 0,88 (2) 0,92 (2) 0,53 (2) 0,95 (2) 0,48 (2) 0,89 (2) 0,99 (2) 0,97 (2) 0,58 (2)

c) ordenando Grupo I

0,20 (1) 0,47 (1) 0,36 (1) 0,51 (1) 0,45 (1) 0,84 (1) 0,32 (1) 0,40 (1)

Grupo II

0,12 (1) 0,17 (1) 0,18 (1) 0,20 (1) 0,32 (1) 0.35 (1)

II

0,26 (2) 0,39 (2) 0,48 (2) 0,53 (2) 0,54 (2) 0,58 (2) 0,88 (2) 0,89 (2) 0,92 (2) 0,95 (2) 0,96 (2) 0,97 (2) 0,98 (2) 0,99 (2)

0,36 (1) 0,40 (1) 0,43 (1) 0,45 (1) 0,47 (1) 0,49 (1)0,51 (1) 0,63 (1) 0,84 (1)

d) Ordenando (Grupo I

Grupo II)

0,12 (1) 0,17 (1) 0,18 (1) 0,20 (1) 0,26 (2) 0,32 (1) 0,35 (1) 0,36 (2) 0,39 (1) 0,40 (1) 0,43 (1) 0,45 (1) 0,47 (2) 0,48 (1) 0,49 (1)

II
0,51 (1) 0,53 (2) 0,54 (2) 0,58 (2) 0,63 (1) 0,84 (2) 0,88 (2) 0,89 (2) 0,92 (2) 0,95 (2) 0,96 (2) 0,97 (2) 0,98 (2) 0,99 (1)

e) Asignando los rangos a (Grupo I

Grupo II)

0,12 (1) 0,17 (1) 0,18 (1) 0,20 (1) 0,26 (2) 0,32 (1) 0,35 (1) 0,36 (2) 0,39 (1) 0,40 (1) 0,43 (1) 0,45 (1) 0,47 (2) 0,48 (1) 0,49 (1)

II

10

11

12

13

14

15

0,51 (2) 0,53 (2) 0,54 (2) 0,58 (1) 0,63 (1) 0,84 (2) 0,88 (2) 0,89 (2) 0,92 (2) 0,95 (2) 0,96 (2) 0,97 (2) 0,98 (2) 0,99 (1)
16

17

18

19

20

21

22

23

24

25

26

27

28

29

d) Determinar el rango de cada grupo (sumatoria)


I

0.12

0.17

0.18

0.20

0.32

0.35

0.36

0.40

0.43

0.45

0.47

0.49

0.51

0.63

0.84

10

11

12

13

15

16

20

21

W1=
II

0.26

0.39

0.48

0.53

0.54

0.58

0.88

0.89

0.92

0.95

0.96

0,97

0,98

0,99

14

16

17

19

21

22

23

24

25

26

27

28

W2=

286

149

U 1 149

1515 1
29
2

15 *14
2
105

15 *14(15 14 1)
12
525

U2
1

U2

29 105

525
z 3,32
5 ) TOMA DE DESICIN
Dado que z =-3.32 es menor que
-2.58 entonces la Ho debe
rechazarse (ver tabla z)

OBSERVACIN:

1+2+3++n=n(n+1)/2
Ejemplo
1 + 2 + 3 + + 15 = 15 ( 15 + 1 ) / 2 = 42

PRUEBAS DE KRUSKL-WALLIS
Es una generalizacin de la PRUEBA U que nos permite probar la
hiptesis nula, en el sentido de que K muestras aleatorias
independientes provienen de poblaciones independientes. R i es la suma
de los rangos ocupados por las ni observaciones, donde n1 + n2+
nk = n es el estadstico que se emplea es:
k
12
Ri2
H
3( n 1)

n( n 1) i 1 ni

.(I)

EJEMPLO: un experimento diseado para comparar 3 mtodos de

enseanza aprendizaje, produjo los puntajes respectivos:


MTODO A: 77, 54, 67, 74, 71, 66
MTODO B: 60, 41, 59, 65, 62, 64, 52
MTODO C: 49, 52, 69, 47, 56.

n1=6

n2=7

n3=5,

n =18

= 0.05

Prubese la hiptesis nula que las muestras provienen de


poblaciones estudiantiles idnticas

SOLUCIN

1) FORMULACIN DE LA HIPOTESIS
Ho: Las poblaciones son idnticas
H1: Las poblaciones no son idnticas
2) NIVEL DE SIGNIFICANCIA

= 0.05, Entonces el Chi cuadrado 0.95 = 5.99 para v=2 (ver

tabla)
3) CRITERIO
Se rechaza la hiptesis nula si H es mayor que 5.99

4) CALCULOS
- ordenar los datos en forma creciente
-

Se determinan los rangos


Establecer los rangos para cada uno de ellos
Los resultados son los siguientes
Los rangos del mtodo A son: 6, 13, 14, 16, 17 y 18, de donde R1 = 84
Los rangos del mtodo B son: 1, 4.5, 8, 9, 10, 11, 12,
Los rangos del mtodo C son: 2, 3, 4.5, 7 y 15

R 2 = 55.5
R 3 = 31.5

Reemplazando valores en la ecuacin .(I)


k
Ri2
12
H
3( n 1)

n( n 1) i 1 ni

12 84 2
55.5
31.52

18 *19 6
7
5

3(18 1)

H 6.7

5) TOMA DE DECISIN
Dado que H = 6.7 mayor que 5.99 entonces rechazamos la hiptesis
nula luego los 3 mtodos de aprendizaje no tiene la misma eficacia,
donde Chi cuadrado
para v = k-1 =3-1= 2
X 02.95 5.99

PRUEBA DE KOLMOVOROV-SMIRNOW
LaS prueba de KOLMOVOROV- SMIRNOV son pruebas no parametricas
que se utilizan para diferencias Entre distribuciones acumuladas. La
prueba unimuestral se refiere a la concordancia entre una distribucin
acumulada observada de valores muestrales y una funcin de
distribucin continua determinada; es pues una prueba de bondad de
ajuste. La prueba bimuestral esta relacionada con la conformidad de 2
distribuciones acumuladas observadas.
La prueba K-S unimuestral es en general mas eficiente que el Chi
cuadrado para bondad de ajuste en muestras pequeas y puede
emplearse en muestras muy pequeas donde el Chi cuadrado no se
aplica. La prueba unimuestral se fundamenta en la diferencia absoluta
mxima D, entre los valores de la distribucin acumulada de una
muestra aleatoria de tamao n y una distribucin terica
determinada. Para decidir si esta diferencia es mayor de lo que
razonablemente puede esperarse para un nivel de alfa determinado,
buscamos los valores crticos de D en la tabla de valores crticos.

EJEMPLO

SOLUCIN

Se desea comprobar si los agujeros de 1) FORMULACIN DE LAS HIPOTESIS


un
electrodo
de
estao
estn
Ho: Los agujeros estn uniformemente
uniformemente distribuido a lo largo de
distribuidos a travs de la placa de estao
una tira enrollada en su base por eso se
ha tomado medidas de las distancias (en
H1: Los agujeros no estn uniformemente
pulgadas) de los 10 agujeros a partir de
distribuidos a travs de la placa de estao
un extremo de la placa de estao que
tiene 30 pulgadas de ancho 4.8, 14.8,
2) NIVEL DE SIGNIFICANCIA
28.2, 23.1, 4.4, 28.7, 19.5, 2.4, 25.0, 6.2
= 0.05
prubese la hiptesis nula para alfa 0.05.
Definir la funcin acumulativa de:

x0
0 Para

x Para

0 x 30
F ( x)

30 Para

x30
1

3) CRITERIO

Se rechaza la hiptesis nula si D es mayor


que 0.41, donde 0.41 se tiene en la tabla
de valores crticos. (D0.05); y D es la
diferencia mxima entre la distribucin
acumulada observada y la distribucin
acumulada bajo la distribucin F (x)

4) CALCULOS
Graficando la distribucin acumulada, tal
como aparece en el grfico (I) se ve que la
diferencia es mayor para x = 6.2 y que su
valor es D = (0.40 6.2)/30 = 0.193

1,0
0,8
0,6

.(I)

0,4
D = 0.193

0,2
0

10

15

20

25

30

5) TOMA DE DESICIN
Puesto que D = 0.40 6.2/30 = 0.193, es el valor mximo se tiene: 0.193
menor que 0.410 que esta en la tabla para n=10 y D=0.05 entonces no
rechazamos la hiptesis nula.

TRABAJO
CONTRASTAR hiptesis por mtodos no paramtricos:
1) En un experimento de laboratorio 18 medidas del coeficiente de friccin
entre cuero y metal, arrojaron los siguientes resultados:
0.59, 0.56, 0.49, 0.55, 0, 65, 0.55, 0.51, 0.60, 056, 0.47, 0.58, 0.61, 0.54,
0.68, 0.56, 0.50, 0.57, 0.53.
Para alfa 0.05 y mediana = 0.55 (hiptesis)
Mediana diferente 0.55
2) El departamento de control de calidad de una gran fabrica obtuvo los
siguientes datos muestrales (en libras) de la resistencia a la ruptura de
cierto tipo de algodn de 2 plg: 153, 159, 144, 160, 158, 153, 171, 162,
159, 137, 159, 159, 148, 162, 154, 159, 160, 157, 140, 168, 163,148,
151, 153, 157, 148, 168, 162, 149. mediante la prueba del signo 0.01 y
la mediana y alternativa mediana mayor que 150

Los siguientes datos corresponden a la resistencia a la ruptura (libras),


dos tipos de materiales
144, 181, 200, 187, 169, 171, 186, 194, 176, 182, 133, 183, 197, 165,
180, 198.
Material ii
175, 164, 172, 194, 176, 198, 154, 134, 169, 164, 185, 159, 161, 189,
171, 164.
Emplese la prueba de u
0.05 y probar que el material 1 es mas resistente