Está en la página 1de 27

II.

COMPROBACIN DE LA NORMALIDAD
Prueba de X
2
La prueba de X
2
es una de las pruebas no paramtricas ms verstiles
pues es til para probar bondad de ajuste, independencia entre dos
criterios de clasificacin y homogeneidad entre poblaciones.
Prueba de X
2
para bondad de ajuste
Dentro de las pruebas de bondad de ajuste, se pueden considerar dos
tipos de hiptesis de inters:
1. Probar si la muestra tiene distribucin Normal, Uniforme,
Poison, etc. (Ejemplo 1).
2. Probar si un conjunto de observaciones tiene una distribucin
especificada completamente por el investigador (Ejemplo 2 y 3).
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
Ejemplo 1.- Se va a analizar un experimento en el cual, la variable de
respuesta es el nivel de protena en muestras de alfalfa. Como se
pretende aplicar la tcnica del ANOVA, se requiere probar el supuesto
de normalidad de dichos datos.
Tabla de frecuencia absoluta del
contenido de protena en alfalfa
Clase
Valor de
clase (X
i
)
Frecuencia
absoluta (f
i
)
0.61 - 2.40 1.51 8
2.40 - 3.00 2.70 65
3.00 - 3.60 3.30 180
3.60 - 4.20 3.90 328
4.20 - 4.80 4.50 408
4.80 - 5.40 5.10 284
5.40 - 6.00 5.70 83
6.00 - 6.60 6.30 13
6.60 - 9.00 7.80 3
1372
Juego de hiptesis
Ho: El contenido de protena tiene
distribucin norma l
Ha: El contenido de protena no
tiene distribucin norma l

Las 1372 observaciones
colectadas, fueron organizadas
en una tabla de frecuencias
Tabla de frecuencia absoluta del
contenido de protena en alfalfa
Clase
Valor de
clase (X
i
)
Frecuencia
absoluta (f
i
)
0.61 - 2.40 1.51 8
2.40 - 3.00 2.70 65
3.00 - 3.60 3.30 180
3.60 - 4.20 3.90 328
4.20 - 4.80 4.50 408
4.80 - 5.40 5.10 284
5.40 - 6.00 5.70 83
6.00 - 6.60 6.30 13
6.60 - 9.00 7.80 3
1372
32 . 4
3 ... 8
) 3 ( 8 . 7 ... ) 8 ( 51 . 1
=
+ +
+ +
= =

i
i i
f
f X
X
( )
=

1

2
2
2
i
i i
f
f
f X
f X
S
i
i i
| |
=
+ +
+ +
+ +
=
1371
3 ... 8
) 3 ( 8 . 7 ... ) 8 ( 51 . 1 (
) 3 ( 8 . 7 ... ) 8 ( 51 . 1
2
2 2
8148 . 0 6639 . 0
2
= = = S S
6639 . 0
2
= S
Estimacin de los parmetros y o ) (
2 2
o S y X
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
Clase
(k)
Frec. Ab.
(O
i
)
P(Z X)
P
i

E
i
=np
i
(0
i
- E
i
)
2
/E
i
0.61 - 2.40 8 Z
1
= -2.36 0.0091
2.40 - 3.00 65 -1.62 0.0526
3.00 - 3.60 180 -0.88 0.1894
3.60 - 4.20 328 -0.15 0.4404
4.20 - 4.80 408 0.59 0.7224
4.80 - 5.40 284 1.33 0.9082
5.40 - 6.00 83 2.06 0.9803
6.00 - 6.60 13 Z
8
= 2.80 0.9974
6.60 - 9.00 3 Z
9
= 5.74 1.0000
1372
Clculo de Z y de probabilidades acumulativas
9974 . 0 ) 80 . 2 ( ) 60 . 6 ( ; 80 . 2
8148 . 0
32 . 4 60 . 6
8
= s = s =

= Z P X P Z
0091 . 0 ) 36 . 2 ( ) 40 . 2 ( ; 36 . 2
8148 . 0
32 . 4 40 . 2
1
= s = s =

= Z P X P Z
32 . 4 = X
8148 . 0 = S
0000 . 1 ) 74 . 5 ( ) 00 . 9 ( ; 74 . 5
8148 . 0
32 . 4 00 . 9
9
= s = s =

= Z P X P Z
S
X
i
X
Z

=
X
i
=Lmite superior de cada clase
Probabilidades acumulativas
32 . 4 = X
8148 . 0 = S
0.0091
0.0526
0.1894
0.4404
0.7224
0.9082
0.9803
0.9974
1.000
0
50
100
150
200
250
300
350
400
450
Clase
(k)
Frec. Ab.
(O
i
)
P(Z X)*
P
i

E
i
=np
i
(0
i
- E
i
)
2
/E
i
0.61 - 2.40 8 -2.36 0.0091 0.0091
2.40 - 3.00 65 -1.62 0.0526 0.0435
3.00 - 3.60 180 -0.88 0.1894 0.1368
3.60 - 4.20 328 -0.15 0.4404 0.2510
4.20 - 4.80 408 0.59 0.7224 0.2820
4.80 - 5.40 284 1.33 0.9082 0.1858
5.40 - 6.00 83 2.06 0.9803 0.0721
6.00 - 6.60 13 2.80 0.9974 0.0171
6.60 - 9.00 3 5.74 1.0000 0.0026
n=1372
Clculo de probabilidades (P
i
) para cada clase
P
1
=0.0091
P
9
=1.000 0 - 0.9974=0.0026 P
2
=0.0526 - 0.0091=0.0435
P
8
=0.9974 - 0.9803 =0.0171
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
S
X
i
X
Z

=
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
0.0091
0.0435
0.1368
0.2510
0.2820
0.1858
0.0721
0.0171
0.0026
0
50
100
150
200
250
300
350
400
450
Probabilidades (P
i
) para cada clase
Clase
(k)
Frec. Ab.
(O
i
)
Z=(X
i
- )/S
P(Z X)*
P
i

E
i
=np
i
(0
i
- E
i
)
2
/E
i
0.61 - 2.40 8 -2.36 0.0091 0.0091 12.4852
2.40 - 3.00 65 -1.62 0.0526 0.0435 59.682
3.00 - 3.60 180 -0.88 0.1894 0.1368 187.6896
3.60 - 4.20 328 -0.15 0.4404 0.2510 344.372
4.20 - 4.80 408 0.59 0.7224 0.2820 386.904
4.80 - 5.40 284 1.33 0.9082 0.1858 254.9176
5.40 - 6.00 83 2.06 0.9803 0.0721 98.9212
6.00 - 6.60 13 2.80 0.9974 0.0171 23.4612
6.60 - 9.00 3 5.74 1.0000 0.0026 3.5672
n=1372
Clculo de lo Esperado
X
E
1
=1372 (0.0091)=12.4852
E
2
=1372 (0.0435)=59.682
E
9
=1372 (0.0026)=3.5672
E
i
=n(P
i
)
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
Regla de decisin
Rechace Ho si:
2 2
t c
X X >
Ho rechazo anterior lo por X X
t c
, 59 . 12 964 . 14
2 2
= > =
Conclusin El contenido de protena no tiene distribucin normal
59 . 12
2 2 2
) 2 1 9 ( , 05 . 0 ,
= = =

X X X
gl
t
o
Estadstica de prueba, regla de decisin y conclusin
Clase
(k)
Frec. Ab.
(O
i
)
Z=(X
i
- )/S
P(Z X)*
P
i

E
i
=np
i
(0
i
- E
i
)
2
/E
i
0.61 - 2.40 8 -2.36 0.0091 0.0091 12.4852 1.611
2.40 - 3.00 65 -1.62 0.0526 0.0435 59.682 0.474
3.00 - 3.60 180 -0.88 0.1894 0.1368 187.6896 0.315
3.60 - 4.20 328 -0.15 0.4404 0.2510 344.372 0.778
4.20 - 4.80 408 0.59 0.7224 0.2820 386.904 1.150
4.80 - 5.40 284 1.33 0.9082 0.1858 254.9176 3.318
5.40 - 6.00 83 2.06 0.9803 0.0721 98.9212 2.562
6.00 - 6.60 13 2.80 0.9974 0.0171 23.4612 4.665
6.60 - 9.00 3 5.74 1.0000 0.0026 3.5672 0.090
n=1372
14.964
*Valores acumulados. Se obtienen de la tabla de Z
=

=
i
i i
E
E O
X
2
) (
2
X
Ejemplo 2.- En un experimento Mendeliano con chcharos se
obtuvieron 13 flores rojas, 42 rosadas y 25 blancas. Tericamente
debe esperarse la proporcin 1:2:1, o sea, 25% rojas, 50% rosadas y
25% blancas. Se ajustan estos resultados obtenidos a la teora?
Clases o categoras Rojas Rosadas Blancas Total
Observado (O
i
) 13 42 25 80
Proporcin (P
i
) 0.25 0.50 0.25 1.0
Esperado (E
i
=np
i
) 20 40 20 80
8 . 3
20
) 20 25 (
40
) 40 42 (
20
) 20 13 ( ) (
2 2 2
1
2
2
=

=
k
i
i
i i
C
E
E O
X
99 . 5
2 2 2
2 , 05 . 0 ,
= = = X X X
l g t o
Hiptesis
Estadstico
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
Ho: P
rojas
=0.25; P
rosadas
= 0.50; P
blancas
=0.25
Ha: Pi es diferente de las especificadas
(Ho: O=E)
(Ha: OE)
8 . 3
) (
1
2
2
=

=
k
i
i
i i
C
E
E O
X
99 . 5
2
=
t
X
Regla de decisin Rechace Ho si:
2 2
t c
X X >
Ho rechazo no anterior lo por X X
t c
99 . 5 8 . 3
2 2
= < =
Conclusin Los datos observados se ajustan a la teora del
investigador
E O Ho = :
E O Ha = :
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
Ejemplo 3.- Un psiclogo sostiene que el nmero de suicidios durante
la primavera es el doble que en cualquiera de las otras tres estaciones.
Para verificar su hiptesis toma una muestra de tamao n=500 usando
los registros policiacos de la principales ciudades del pas.
Estacin P V O I E
No. de suicidios 182 96 120 102 500
Juego de hiptesis
Ho: p
p
= 2/5; p
v
= 1/5; p
o
= 1/5; p
i
= 1/5 (El mayor nmero de suicidios ocurre
en primavera)
Ha: Al menos una p
i
es diferente de las especificadas (Los datos no apoyan a
la teora del
investigador)
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
Nota: Cada estacin se considera como una clase o categora
Estadstica de prueba
Estacin
P V O I E
No. de suicidios (O
i
)
182 96 120 102 500
p
i
2/5 1/5 1/5 1/5 1.0
Esperado (E
i
=np
i
)
200 100 100 100 500
82 . 5
100
) 100 102 (
100
) 100 120 (
100
) 100 96 (
200
) 200 182 ( ) (
2 2 2 2
1
2
2
=

=
k
i
i
i i
E
E O
X
8147 . 7
2 2 2
3 , 05 . 0 ,
= = = X X X
l t g o
Regla de decisin
Rechace Ho si:
2 2
t c
X X >
Ho rechazo no anterior lo por X X
t c
8147 . 7 82 . 5
2 2
= < =
Conclusin El mayor nmero de suicidios ocurre en primavera
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para bondad de ajuste
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar independencia

Esta prueba se utiliza cuando se toma una muestra y cada uno de
sus elementos se clasifican simultneamente en dos caractersticas,
dentro de las cuales, se tienen a su vez cierto nmero de clases o
categoras mutuamente excluyentes.
.
Tabla de doble entrada o tabla de contingencia
Caracterstica o criterio
de clasificacin 2
(Hilera)
Caracterstica o criterio de clasificacin 1
(Columna)
E
1 2 . . . c
1
n
11
n
12

. . .
n
1c
n
1 .

2
n
21
n
22

. . .
n
2c
n
2 .

. . . . .
. . . . .
. . . . .
h
n
h1
n
h2

. . .
n
hc
n
h .

E n.
1
n.
2
. . . n.
c
n..
Son independientes los criterios de clasificacin?
Nivel
socioeconmico
Cultivo
E
Meln Mango Sanda
Bajo 35 15 24 74
Medio 33 18 27 78
Alto 40 25 33 97
E 108 58 84 250
Juego de hiptesis
Ho: La produccin de los cultivos es independiente del nivel socioeconmico del
productor.
Ha: La produccin de los cultivos depende del nivel socioeconmico del productor.

Ejemplo 1.- Con la finalidad de saber si la produccin de meln,
mango y sanda es independiente del nivel socioeconmico del
productor, se entrevistaron a n=250 productores.
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar independencia

Clculo de los valores esperados
32
250
) 108 ( 74
11
= = E 17
250
) 58 ( 74
12
= = E 25
250
) 84 ( 74
13
= = E
34
250
) 108 ( 78
21
= = E 18
250
) 58 ( 78
22
= = E 26
250
) 84 ( 78
23
= = E
Nivel
socioeconmico
Frutal
E
Meln Mango Sanda
Bajo 35 (32) 15 (17) 24 (25) 74
Medio 33 (34) 18 (18) 27 (26) 78
Alto 40 (42) 25 (23) 33 (33) 97
E 108 58 84 250
42
250
) 108 ( 97
31
= = E 23
250
) 58 ( 97
32
= = E 33
250
) 84 ( 97
33
= = E
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar independencia

Estadstica de prueba
99 . 0
33
) 33 33 (
. . .
17
17) - (15

32
) 32 35 ( ) (
2 2 2
1
2
2
=

+ + +

=
k
i
i
i i
E
E O
X
Nivel
socioeconmico
Frutal
E
Meln Mango Sanda
Bajo 35 (32) 15 (17) 24 (25) 74
Medio 33 (34) 18 (18) 27 (26) 78
Alto 40 (42) 25 (23) 33 (33) 97
E 108 58 84 250
Regla de decisin Rechace Ho si:
2 2
t c
X X >
Ho rechazo no anterior lo por X X
t c
; 48 . 9 99 . 0
2 2
= < =
Conclusin:
La produccin de los cultivos es independiente del nivel
socioeconmico del productor
48 . 9
2
) 2 )( 2 ( , 05 . 0
2
) 1 )( 1 ( ,
2
= = =

X X X
c h t o
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar independencia

PVH VIH
E
Seropositivo
sintomtico
Seropositivo
asintomtico
Seronegativo
Positivo 23 4 10 37
Negativo 10 14 35 59
E 33 18 45 96
Juego de hiptesis
Ho: La infeccin del VIH es independiente a la infeccin del PVH.
Ha: La infeccin del VIH y del PVH son dependientes
Ejemplo 2.- Se pretende saber si la infeccin del VIH, en mujeres, es
independiente a la infeccin del papilomavirus humano (PVH). Los
datos se presentan en el siguiente cuadro.
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar independencia

Clculo de los valores esperados
13
96
) 33 ( 37
11
= = E 7
96
) 18 ( 37
12
= = E 17
96
) 45 ( 37
13
= = E
20
96
) 33 ( 59
21
= = E 11
96
) 18 ( 59
22
= = E 28
96
) 45 ( 59
23
= = E
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar independencia

PVH VIH
E
Seropositivo
sintomtico
Seropositivo
asintomtico
Seronegativo
Positivo 23 (13) 4 (7) 10 (17) 37
Negativo 10 (20) 14 (11) 35 (28) 59
E 33 18 45 96
Estadstica de prueba
42 . 19
28
) 28 35 (
. . .
7
7) - (4

13
) 13 23 ( ) (
2 2 2
1
2
2
=

+ + +

=
k
i
i
i i
E
E O
X
Regla de decisin Rechace Ho si:
2 2
t c
X X >
Ho rechazo anterior lo por X X
t c
; 991 . 5 42 . 19
2 2
= > =
Conclusin:
La infeccin del VIH y del PVH son dependientes
991 . 5
2
) 2 )( 1 ( , 05 . 0
2
) 1 )( 1 ( ,
2
= = =

X X X
c h t o
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar independencia

PVH VIH
E
Seropositivo
sintomtico
Seropositivo
asintomtico
Seronegativo
Positivo 23 (13) 4 (7) 10 (17) 37
Negativo 10 (20) 14 (11) 35 (28) 59
E 33 18 45 96
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar homogeneidad entre poblaciones

Para probar la homogeneidad entre poblaciones, los datos se
organizan tambin en una tabla de doble entrada o de contingencia
Poblacin
(h)
Categora (c)
E
1 2 . . . c
1 n
11
n
12

. . .
n
1c
n
1

2 n
21
n
22

. . .
n
2c
n
2

. . . . .
. . . . .
. . . . .
h n
h1
n
h2

. . .
n
hc
n
h

E c
1
c
2
. . . c
c
n
El caso ms tpico es cuando se tienen h poblaciones, donde en cada
una de ellas se toma una muestra de tamao previamente
determinado antes de realizar el experimento. Cada elemento de las
muestras, se clasifican en una de las c categoras mutuamente
excluyentes.
Con esta nueva
estructura, lo que
interesa es comparar
las h poblaciones con
respecto al criterio de
clasificacin elegido
para formar las
columnas.
Poblacin
Nivel de tecnologa
E
Nulo Pobre Mediano Alto
Riego 3 4 10 8 25
Temporal 15 10 10 5 40
Medio riego 12 12 8 3 35
E 30 26 28 16 100
Juego de hiptesis
Ho: Las poblaciones utilizan el mismo nivel de tecnologa .
Ha: Las poblaciones utilizan diferente nivel de tecnologa.
Ejemplo 1.- Con la finalidad de identificar el nivel de tecnologa que
utilizan los productores, se tom una muestra de cada poblacin de
agricultores: 25 de riego, 40 de temporal y 35 de medio riego.
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar homogeneidad entre poblaciones

Clculo de los valores esperados
5 . 7
100
) 30 ( 25
11
= = E 5 . 6
100
) 26 ( 25
12
= = E 7
100
) 28 ( 25
13
= = E
12
100
) 30 ( 40
21
= = E 4 . 10
100
) 26 ( 40
22
= = E 2 . 11
100
) 28 ( 40
23
= = E
5 . 10
100
) 30 ( 35
31
= = E 1 . 9
100
) 26 ( 35
32
= = E 8 . 9
100
) 28 ( 35
33
= = E
Poblacin
Nivel de tecnologa
E
Nulo Pobre Mediano Alto
Riego 3 (7.5) 4 (6.5) 10 (7) 8 (4) 25
Temporal 15 (12) 10 (10.4) 10 (11.2) 5 (6.4) 40
Medio riego 12 (10.5) 12 (9.1) 8 (9.8) 3 (5.6) 35
E 30 26 28 16 100
4
100
) 16 ( 25
14
= = E
4 . 6
100
) 16 ( 40
24
= = E
6 . 5
100
) 16 ( 35
34
= = E
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar homogeneidad entre poblaciones

Estadstica de prueba
8237 . 12
6 . 5
) 6 . 5 3 (
. . .
6.5
6.5) - (4

5 . 7
) 5 . 7 3 ( ) (
2 2 2
1
2
2
=

+ + +

=
k
i
i
i i
E
E O
X
Regla de decisin Rechace Ho si:
2 2
t c
X X >
Ho rechazo anterior lo por X X
t c
; 5916 . 12 8237 . 12
2 2
= > =
Conclusin: Las poblaciones utilizan diferente nivel de tecnologa.
5916 . 12
2
) 3 )( 2 ( , 05 . 0
2
) 1 )( 1 ( ,
2
= = =

X X X
c h t o
Poblacin
Nivel de tecnologa
E
Nulo Pobre Mediano Alto
Riego 3 (7.5) 4 (6.5) 10 (7) 8 (4) 25
Temporal 15 (12) 10 (10.4) 10 (11.2) 5 (6.4) 40
Medio riego 12 (10.5) 12 (9.1) 8 (9.8) 3 (5.6) 35
E 30 26 28 16 100
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar homogeneidad entre poblaciones

Estadstica de prueba
Regla de decisin Rechace Ho si:
2 2
t c
X X >
Ho rechazo anterior lo por X X
t c
; 5916 . 12 8237 . 12
2 2
= > =
Conclusin: Las poblaciones utilizan diferente nivel de tecnologa.
81 . 7
2
) 3 ( , 05 . 0
2
) 1 ( ,
2
= = =

X X X
c t o
Poblacin
Nivel de tecnologa
E
Nulo Pobre Mediano Alto
Riego 3 (7.5) 4 (6.5) 10 (7) 8 (4) 25 8.9472
Temporal 15 (12) 10 (10.4) 10 (11.2) 5 (6.4) 40 1.2002
Medio riego 12 (10.5) 12 (9.1) 8 (9.8) 3 (5.6) 35 2.6762
E 30 26 28 16 100
II. COMPROBACIN DE LA NORMALIDAD
Pruebas de X
2
para probar homogeneidad entre poblaciones

2
c
X
II. COMPROBACIN DE LA NORMALIDAD
Clculo de estadsticas con calculadora fx-82ES


INSTRUCCIONES INICIALES INSERTAR
VALORES
DE CLASE
INSERTAR
FREC.
ABSOLUTAS
SOLICITUD DE
ESTADSTICAS
SHIFT CLR
1.51 = 8 = SHIFT STAT
3
2.70 = 65 = 5 VAR
=
. . 2 =
=
. . 4.32
SHIFT SETUP
. . SHIFT STAT
OPRIMIR FLECHA ABAJO DE
LA TECLA REPLAY
7.80 = 3 = 5 VAR
3 STAT
4 =
1 ON*
0.81
SETUP
Para obtener la varianza
eleve al cuadrado a la
desviacin estndar
2
1
Para nuevos clculos iniciar a partir de SHIFT SETUP
= x
=
1 n x
o
II. COMPROBACIN DE LA NORMALIDAD
Clculo de estadsticas con calculadora fx-350MS


INSTRUCCIONES
INICIALES
INSERTAR VALORES
DE CLASE Y
FREC. ABSOLUTAS
SOLICITUD DE
ESTADSTICAS
SHIFT CLR 1.5 ; 8 M+ SHIFT S-VAR
3 2.70 ; 65 M+ 1 =
= . 4.32
= . SHIFT S-VAR
MODE . 3 =
2 7.80 ; 3 M+ 0.8148
Para obtener la varianza eleve al cuadrado a la desviacin estndar
Para nuevos clculos iniciar a partir MODE
= x
=
1 n x
o

También podría gustarte