Está en la página 1de 35

METODOS O PRUEBAS NO

PARAMETRICAS MAS EMPLEADAS


1)LA Ji CUADRADA CHI-CUADRADA
2) COEFICIENTES DE CORRELACION
E INDEPENDNENCIA PARA
TABULACIONES CRUZADAS.
3) LOS COEFICIENTES DE
CORRELACION PARA RANGOS
ORDENADOS DE SPERMAN Y
KENDALL

Ji - CUADRADA
Es una prueba estadstica para
evaluar hiptesis acerca de la
relacin entre dos variables.
Se simboliza por :

Prueba hipotesis Correlacionales


Variables involucradas : dos ( no
considera relaciones causales)
Nivel de medicion de variables:
Nominal y Ordinal.

Ji - CUADRADA
La Chi Cuadrada se calcula a
traves de una Tabla de
contingencia o Tabulacion
cruzada, que constituye una
Tabla de dos dimensiones o
matriz de dos x dos.
Cada dimension contiene una
variable.
Cada variable se subdivide en

La Prueba Ji-Cuadrado
2

Distribucin Ji-Cuadrado

Supngase que se tiene una serie de variables aleatorias independientes con distribucin normal
estndar, Z1 , Z 2 , ... , Z n , entonces la variable aleatoria ,X Z12 ... Z 2n sigue una distribucin
Ji-Cuadrado.

La Prueba Ji-Cuadrado
FUNCIN DE DENSIDAD

MEDIA Y VARIANZA.
2

Procedimientos para usar el anlisis de ji cuadrada y


probar la independencia de dos variables nominales
Hiptesis nula:
Las variables son independientes
Se construye o se obtiene una tabla de
tabulacin cruzada para las frecuencias
reales observadas (Oij )
Suponiendo que las variables son
independientes, se construye una tabla
de tabulacin cruzada para las
frecuencias tericas ( Eij)
Se determina el nivel de significado
deseado en la prueba.
Se determina el valor
calculado del estadstico
ji cuadrada
r

i 1 j1

ij

E ij
E ij

USO DE LA TABLA

Tabla 4. Distribucin de ji-cuadrado

El rea sombreada de naranja


2
2
representa la probabilidad P[ ,n ]
que se determinadapor
, donde:
2 ,n es el valor critico del margen
superior de la tabla, y n son los
grados de libertad del margen
izquierdo de la tabla.

Probabilidad de un valor superior


Grados de libertad

0,1

0,05

0,025

0,01

0,005

2,71

3,84

5,02

6,63

7,88

4,61

5,99

7,38

9,21

10,60

6,25

7,81

9,35

11,34

12,84

7,78

9,49

11,14

13,28

14,86

9,24

11,07

12,83

15,09

16,75

10,64

12,59

14,45

16,81

18,55

12,02

14,07

16,01

18,48

20,28

13,36

15,51

17,53

20,09

21,95

14,68

16,92

19,02

21,67

23,59

10

15,99

18,31

20,48

23,21

25,19

Tabla 4. Distribucin de ji-cuadrado

Uso de la tabla JiCuadrado

P [ 15.99 | n 10] 0.10


2

P [ 11.07 2 | n 5] 0.05

Probabilidad de un valor superior


Grados de libertad

0,1

0,05

0,025

0,01

0,005

2,71

3,84

5,02

6,63

7,88

4,61

5,99

7,38

9,21

10,60

6,25

7,81

9,35

11,34

12,84

7,78

9,49

11,14

13,28

14,86

9,24

11,07

12,83

15,09

16,75

10,64

12,59

14,45

16,81

18,55

12,02

14,07

16,01

18,48

20,28

13,36

15,51

17,53

20,09

21,95

14,68

16,92

19,02

21,67

23,59

10

15,99

18,31

20,48

23,21

25,19

EJEMPLO
Martha Revilla, directora de mantenimiento de la
calidad en MEGA, elige 29 bicicletas y halla una
varianza en la distancia entre ejes de 32.7
pulgadas cuadradas. Si la seora Revilla tienen
que garantizar que la variacin no supere 27
pulgadas cuadradas indica esto que se cumplen
las normas de produccin? (=0.05)
Hiptesis
Hiptesis

H 0 2 27

H1 2 27

Prueba
Prueba de
de una
una cola
cola aa la
la
derecha
derecha

n 29
s 2 32.7
2 27

n 1 s 2 29 1 32.7

33.91
2

27

f 2

02.05; 28 41.337

0.05
33.91

41.337

Como
Como XX2=33.91<41.337
=33.91<41.337 la
la seora
seora Revilla
Revilla no
no rechazar
rechazar

la
la HH00 yy confiar
confiar al
al 95%
95% en
en que
que se
se cumplen
cumplen las
las normas
normas de
de
produccin

Que pasara, si las instrucciones de la seora Revilla fueran


que la variacin se mantuviera inferior a 27 pulgadas
cuadradas?

H 0 27
2

H1 27
2

Prueba
Prueba de
de una
una cola
cola aa la
la
izquierda
izquierda

f 2

02.95; 28 16.928
0.05

16.928
33.91

=33.91,la
laseora
seoraRevilla
Revillano
norechazar
rechazarla
laH
H00yyconfiar
confiar
XX2=33.91,

al
al95%
95%en
enque
quese
secumplen
cumplenlas
lasnormas
normasde
deproduccin
produccin

La seora Revilla, ahora elabora un intervalo de confianza del


90% para la varianza de la distancia entre ejes.

n 1 s 2

2
0.05; 28

n 1 s 2

02.95; 28

29 1 32.7 2 29 1 32.7

41.337

16.928

22.15 2 54.09
0.90

0.05

0.05

16.928
0.9
5

41.337

Revilla
Revilla puede
puede confiar
confiar al
al 90%
90% en
en que
que la
la varianza
varianza de
de la
la

distancia
distancia entre
entre ejes
ejes se
se encuentra
encuentra entre
entre 22.15
22.15 yy 54.09
54.09
pulgadas
pulgadascuadradas
cuadradas

Prueba Ji-Cuadrado de Independencia


H0: Las variables X e Y son independientes
H1: Existe asociacin entre X e Y
Y
X

Categ. 1

......

Categ. s

Total

Cat. 1

O11

......

O1s

R1

.........

.......

......

.......

.....

Cat. r

Or1

......

Ors

Rr

Total

C1

......

Cs

Prueba Ji-Cuadrado de Independencia


Estadstica
r

(O ij E ij ) 2
E ij

i 1 j1

donde ,

E ij

Ri Cj
n

12

R .C.

Ejemplo de Prueba Ji-Cuadrado de independencia


Para verificar la suposicin de que la fabricacin de cierto
producto est asociado con enfermedades respiratorias, a
450 trabajadores de una empresa que fabrica el producto se
evalu respecto a la presencia de sntomas de alteraciones
respiratorias y se los clasific a su vez de acuerdo al nivel de
exposicin al producto. Los resultados se presentan en la
tabla siguiente:
Nivel de Exposicin
Presencia de
Total
Sntoma
Alto
Medio
Bajo
Si
No
Total

175
90
265

43
60
103

27
55
82

245
205
450

H
H00:: Las
Las alteraciones
alteraciones respiratorias
respiratorias son
son independientes
independientes
de
exposicin
dela
la
exposicinal
alproducto.
producto.
H
H11:: Las
Las alteraciones
alteraciones respiratorias
respiratorias estn
estn asociadas
asociadas aa la
la
exposicin
exposicinal
alproducto
producto

Frecuencias Esperadas:

Por ejemplo:

E 23

E ij

R iC j
n

R 2 C3 205 82

37.4
n
450
Nivel de Exposicin

Presencia de
Sntoma

Alto

Medio

Bajo

Si
No
Total

144.3
120.7
265

56.1
46.9
103

44.6
37.4
82

Total
245
205
450

Estadstica
2

(O ij E ij ) 2
E ij

i 1 j1

donde ,

E ij

Ri Cj
n

0.05
12

R .C.

O
2 ij n
i 1 j1 E ij
2

1752
552

...
450 36.4
144.3
37.4
Que
Que sigue
sigue una
una distribucin
distribucin Ji-cuadrado
Ji-cuadrado
con
con
(n-1)*(C-1)=(
(n-1)*(C-1)=( 2-1)*(3-1)=2
2-1)*(3-1)=2 grados
grados de
de
libertad
libertad

p P 36.4 0.0000000125 0.005


2
2

En
En conclusin,
conclusin, se
se rechaza
rechaza la
la H
H00 (p
(p <
< 0.05),
0.05), es
es
decir
decir las
las alteraciones
alteraciones respiratorias
respiratorias estn
estn
asociadas
asociadasaala
laexposicin
exposicinal
alproducto
producto

Distribucin F de Snedecor
Si
yX 2 son variables Ji-cuadrado distribuidas en forma
independiente
con
y
grados de libertad,
X1
respectivamente,
la variable Z1 k1
k1 k 2
F
Z2 k 2

sigue la distribucin F con k1 yk 2

grados de libertad.

Tabla F de Fisher

=0.05 con letra normal.


=0.01 con letra negrita

Ejemplo de uso de la tabla F de Fisher

Ejemplo de Aplicacin

De dos aulas de 5 ao de secundaria se tomaron muestras de


tamaos 10 y 15 de las notas promedios de alumnos para probar
si la dispersin de las notas es la misma para las dos aulas. Los
resultados obtenidos son los siguientes:
Aula 1: 15, 16, 12, 14, 14, 15, 16, 13, 14, 15.
Aula 2: 12, 14, 15, 16, 16, 17, 15, 16, 18, 14, 12, 15, 16, 14, 13.

x1 14.40
x 2 14.87

S12 1.600

n1 10

S22 2.981

n 2 15

Deseamos probar las hiptesis:

H 0 : 12 22

H1 : 12 22

Luego F

Si

0.05

1.600
0.5367
2.981

, entonces para
F(9,14 )

F0.025 (9,14 ) 0.26

las cuantilas
/ 2 1 / 2 y

F0.025 (9,14 ) 3.21

0.025

0.025

0.26

0.5367

3.21

Luego concluimos que la dispersin de las notas entre los alumnos


para las dos aulas de 5 ao son las mismas, pues no se encuentra
diferencia significativa.

EJEMPLO
La compaa llantera Good Year del Per, ha
efectuado un estudio sobre los hbitos de manejo
de varios grupos ocupacionales. En una muestra
de 35 profesores universitarios, el nmero
promedio de kilmetros recorridos al ao fue de
14,500 con una desviacin standart de 3,200 km.
En una muestra de 40 dentistas, el kilometraje
fue de 13,400, con una desviacin standart de
1,950 km.
Se
Setiene
tiene

X1 14,500, s1 3,200, n1 35
X 2 13,450, s 2 1,950, n 2 40

Primero se verificar la condicin siguiente:

1 2

X1 14,500, s1 3,200, s12 10240000, n1 35


X 2 13,450, s 2 1,950, s12 3802500, n 2 40
Planteamos las
Hiptesis:

H 0 : 12 22

H1 : 12 22

10240000
F
2.693
3802500

Para =0.05

0.02
5

F0.025 ( 34,39 ) 0.515

0.95

0.515

F0.975 ( 34,39 ) 1.9

0.02
5
1.9

Se
Serechaza
rechazala
laHH00,,es
esdecir
decirque
que

2.693

11 22

Luego, se
prueba la
hiptesis:
Diferencia de
las
medias
muestrales

H 0 : 1 2

X1 X 2 14,500 13,450 1,050Km.

s12 s 22
s X1 X 2

n1 n 2

Valores
Valorescrticos
crticos

H1 : 1 2

3,200 2 1,950 2
35

40

622.6

0 Z * s X1 X 2
0 1.96 622.6
0 1,220.3

YY los
los valores
valores crticos
crticos son:
son: -1,220.3
-1,220.3 yy
+1,220.3
+1,220.3

Se acepta la hiptesis nula

Se Rechaza

Se Rechaza

rea
=0.025

rea
=0.025

Z= -1.96

Z= +1.96

X1 X 2 0
-1220.3
Valor
critico

s X1X2 622.6 millas

+1220.3
Valor
critico

+1050 =
diferencia
observada entre
las medias
muestrales.

Ejercicio
Como la diferencia entre las
medias muestrales es de 1050
millas y se acepta un margen
de error de 1220 millas, en
consecuencia,
no
hay
diferencias significativas entre
los dos grupos

EJEMPLO
Freddy Lopez, operador de la cadena de restaurantes
Las Tejas, ha hecho una encuesta entre los clientes
en dos ciudades, pues desea averiguar si les gustara
que en el men se incluyeran sandwiches de jamn y
queso. De las 500 personas encuestadas en la capital,
200 contestaron afirmativamente, mientras que 150
de las 300 encuestadas en una ciudad cercana
tambin contestaron afirmativamente. Freddy quiere
saber si, en un nivel de 0.05 esos resultados son
significativamente diferente.

En
Enresumen
resumen

P1 200 / 500 0.40, n1 500


P 2 150 / 300 0.50, n 2 300

Primero se determinar si se cumple lo siguiente:

2
Se
Setiene
tiene

P1 200 / 500 0.40, n1 500, s12

0.40 0.60 0.00048

P 2 150 / 300 0.50, n 2 300, s 22

0.50 0.50 0.00083

500

300

Planteamos las
Hiptesis:

H0 :
2
1

2
2

H1 :
2
1

2
2

0.00048
F
0.576
0.00083

Para =0.05
F

0.025 ( 499 , 299 )

0.02
5

0.576

0.8184 F0.975 ( 499, 299 ) 1.228

0.95

0.8184

0.02
5
1.228

Se
Se rechaza
rechaza la
la HH00,, es
es decir
decir que
que

22

11

Luego, se
H 0 : P1 P2
H1 : P1 P2
prueba la
hiptesis:
Diferencia de las
P
1 P 2 0.40 0.50 0.10
proporciones muestrales
n P1 n 2 P 2 500 0.40 300 0.50
P 1

0.4375
n1 n 2
500 300
Re mplazando p 0.4375 en la frmula de s P1 P 2
asi como los valores de
n1 , n 2

1 1
s P1 P 2 P1 P
0.0362
n1 n 2
Valores
Valorescrticos
crticos

0 Z * s P1 P 2
0 1.96 0.0362
0 0.071

YY los
los valores
valores crticos
crticos son:
son: -0.071
-0.071 yy

Se acepta la hiptesis nula

Se rechaza

Se rechaza

rea
=0.025

Diferencia
observada entre las
proporciones
muestrales =
(0.40-.050) =-0.10

rea =0.025

Z= -1.96

Z= +1.96

P1 P2 0
-0.071
Valor
critico

s P1 P2 0.0362

+0.07
1
Valor
critico

Ejercicio
Como la diferencia entre las
proporciones muestrales es de
-0.10 y se acepta un margen de
error
de
0.071,
en
consecuencia,
si
hay
diferencias significativas entre
los dos grupos