Está en la página 1de 67

LA PRUEBA DE CHI-CUADRADO

PRUEBA DE BONDAD DE AJUSTE


Si:

f ei < 5

Agrupar dicha frecuencia con las frecuencias adyacentes,


hasta que:

f ei ≥ 5

De igual manera se agrupan las frecuencias observadas.

Al agrupar las frecuencias esperadas y observadas, el


número de categorías ( K ) se reduce.
2
CHI-CUADRADO CALCULADO ( X c )

( f 0 k − f ek )
2
K
X =∑
2
c
k =1 f ek
GRADO DE LIBERTAD ( gl )

gl = K − m − 1

K = N º Categorías
m = N º Parametros estimados en la distribución de probabilidad

2
CHI-CUADRADO CRÍTICA ( X gl ;α )

X gl2 ;α
EJEMPLO 1
(Distribución Uniforme)
Un distribuidor regional de sistemas de aire acondicionado ha subdividido su región en cuatro
territorios. A un posible comprador de una distribuidora se le dice que las instalaciones de
equipos se distribuyen de manera aproximamente igual en los cuatro territorios. El prospecto
de comprador toma una muestra aleatoria de 40 instalaciones colocadas el año anterior, de
los archivos de la compañía, y encuentra que el número de instalaciones en cada uno de los
cuatro territorios son los que se enlistan en la fila de frecuencias observadas de la tabla.
Pruebe la hipótesis nula de que las instalaciones están distribuidas en forma uniforme en los
cuatro territorios, utilizando un nivel de significancia del 5%.
CHI-CUADRADO CALCULADO ( X c2 )

( f0 k − fek )
2
K
Χ =∑
2
c
k =1 f ek

X 2
=
(6 − 10)
2
+
(12 − 10 )
2
+
(14 − 10 )
2
+
(8 − 10)
2
=4
c
10 10 10 10
GRADO DE LIBERTAD ( gl )

gl = 4 − 0 − 1 = 3

K =4
m=0
2
CHI-CUADRADO CRÍTICA ( X gl ;α )

X 2
3; 0.05 = 7.81
1) HIPOTESIS
H0: El número de instalaciones están distribuidas de manera uniforme en los
cuatro territorios.
Ha: El número de instalaciones no están distribuidas de manera uniforme en los
cuatro territorios.
2) NIVEL DE SIGNIFICANCIA (α)
α = 0.05
3) PUNTOS CRITICOS
Se
acepta
H0

Se
0.95 acepta
Ha

0.05

X 32;0.05 = 7.81

4) CHI-CUADRADO CALCULADO
X c2 = 4

5) CONCLUSIONES
Como X c < X 3;0.05 ( 4 < 7.81 ), entonces se acepta la H0, es decir, el número de
2 2

instalaciones están distribuidas de manera uniforme en los cuatro territorios, a un


nivel de confianza del 95%
EJEMPLO 2
(Distribución Poisson)
Suponga que se plantea la hipótesis de que la distribución de descomposturas de maquinaria
por hora en una planta de ensamble se ajusta a una distribución poisson. En la tabla se
presenta el número de descomposturas observadas durante 40 horas que se incluyeron en la
muestra. Pruebe la hipótesis a un nivel de significancia del 1%.
λ=X = ∑ X f
i 0i
=
128
= 3.2 descomposturas por hora
∑f 0i 40

m =1
x −λ
λe
P[ X = x / λ ] =
x!
1

3
6 6.8

8 8.8
2
CHI-CUADRADO CALCULADO ( X c )

( f0 k − fek )
2
K
Χ =∑
2
c
k =1 f ek

X2 =
(6 − 6 . 8 )2
+
(8 − 8 . 3)2
+
(11 − 8. 9 )2
+
(7 − 7 . 1)2
+
(8 − 8 . 8 )2
= 0.67
c
6.8 8.3 8 .9 7 .1 8.8
GRADO DE LIBERTAD ( gl )

gl = 5 − 1 − 1 = 3

K =5
m =1
2
CHI-CUADRADO CRÍTICA ( X gl ;α )

X 2
3; 0.01 = 11.34
1) HIPOTESIS
H0: La distribución de las descomposturas observadas en la maquinaria cada hora
se ajusta a una variable con distribución Poisson.
Ha: La distribución de las descomposturas observadas en la maquinaria cada hora
no se ajusta a una variable con distribución Poisson.
2) NIVEL DE SIGNIFICANCIA (α)
α = 0.01
3) PUNTOS CRITICOS
Se
acepta
H0

Se
0.99 acepta
Ha

0.01

X 32; 0.01 = 11.34

4) CHI-CUADRADO CALCULADO
X c2 = 0.67

5) CONCLUSIONES
Como X c2 < X 32;0.01 ( 0.67 < 11.34 ), entonces se acepta la H0 , es decir, La
distribución de las descomposturas observadas en la maquinaria cada hora se
ajusta a una variable con distribución Poisson, a un nivel de confianza del 99%
EJEMPLO 3
(Distribución Binomial)
Si un ingeniero de control de calidad toma una muestra de 10 neumáticos que salen de una
línea de ensamblaje y él desea verificar sobre la base de los datos que siguen, los números
de llantas con defectos observadas en 200 días, si es cierto que el 5% de todos los
neumáticos tienen defecto; es decir, si el muestrea una población binomial con n = 10 y
p=0.05. Pruebe la hipótesis nula de que el número de defectos de las llantas se ajustan a una
distribución binomial, con un nivel de significancia del 5%.
P[ X = x / β ] =
n! x n− x
p q
x!(n − x )!
1

3
17.2
2
CHI-CUADRADO CALCULADO ( X c )

( f0 k − fek )
2
K
Χ =∑2
c
k =1 f ek

X2 =
(138 − 119. 7 )2
+
(53 − 63 )2
+
(9 − 17 . 2 )2
= 8.3
c
119.7 63 17.2
GRADO DE LIBERTAD ( gl )

gl = 3 − 0 − 1 = 2

K =3
m=0
2
CHI-CUADRADO CRÍTICA ( X gl ;α )

X 2
2; 0.05 = 5.99
1) HIPOTESIS
H0: El número de defectos de las llantas se ajustan a una distribución binomial.
Ha: El número de defectos de las llantas no se ajustan a una distribución binomial.
2) NIVEL DE SIGNIFICANCIA (α)
α = 0.05
3) PUNTOS CRITICOS
Se
acepta
H0

Se
0.95 acepta
Ha

0.05

X 22;0.05 = 5.99

4) CHI-CUADRADO CALCULADO

X c2 = 8.3
5) CONCLUSIONES
Como X c > X 2;0.05 ( 8.3 > 5.99 ), entonces se acepta la Ha , es decir, el número de
2 2

defectos de las llantas no se ajustan a una distribución binomial, a un nivel de


significancia del 5%
EJEMPLO 4
(Distribución Normal)
Pruebe la hipótesis de que la distribución de frecuencia de las duraciones de baterías (en
horas) dadas en la siguiente tabla, se puede aproximar mediante una distribución normal.
Utilice un nivel de significancia del 5%
X=
∑ X f k 0k
=
136.5
= 3.4
∑f 0k 40

( ∑ X f )
2

(136.5 )
2

∑X f −
2 k 0k
484.75 −
S=
i 0i
∑f 0k
= 40 = 0.7
∑ f −1 0k 40 − 1

m=2
Xi − µ
zi =
σ
1

P[X ≤ x / N ≈ (µ ; σ )] 2

P ⎡⎣ Z ≤ z / N ≈ ( µ = 0;σ = 1) ⎤⎦
1

3
5 10.4

8 8.7
2
CHI-CUADRADO CALCULADO ( X c )

( f0 k − fek )
2
K
Χ =∑
2
c
k =1 f ek

X2 =
(7 − 10. 4 )2
+
(15 − 10 . 7 )2
+
(10 − 10. 2 )2
+
(8 − 8. 7 )2
= 2.9
c
10.4 10.7 10.2 8 .7
GRADO DE LIBERTAD ( gl )

gl = 4 − 2 − 1 = 1

K =4
m=2
2
CHI-CUADRADO CRÍTICA ( X gl ;α )

X 2
1; 0.05 = 3.84
1) HIPOTESIS
H0: La duración de las baterías se ajustan a una distribución normal.
Ha: La duración de las baterías no se ajustan a una distribución normal.
2) NIVEL DE SIGNIFICANCIA (α)
α = 0.05
3) PUNTOS CRITICOS
Se
acepta
H0

Se
0.95 acepta
Ha

0.05

X 12;0.05 = 3.84

4) CHI-CUADRADO CALCULADO

X c2 = 2.9
5) CONCLUSIONES
Como X c < X 2;0.05 ( 2.9 < 3.84 ), entonces se acepta la H0 , es decir, La duración
2 2

de las baterías se ajustan a una distribución normal, a un nivel de confianza del


95%
EJEMPLO 5
(Distribución Exponencial)
Pruebe la hipótesis de que la distribución de frecuencia de llegada de las solicitudes de
reparación de maquinaria, las cuales están dadas en la siguiente tabla, se puede aproximar
mediante una distribución exponencial. Utilice un nivel de significancia del 5%
µ=X = ∑ X f
k 0k
=
2,540
= 36.3
∑f 0k 70

m =1
1

P[ X ≤ x / µ ] = 1− e µ
1

3
2
CHI-CUADRADO CALCULADO ( X c )

( f 0 k − f ek )
2
K
Χc = ∑
2

k =1 f ek

( 5 − 15.1) ( 7 − 10.9 ) (10 − 7.9 ) (15 − 11.1)


2 2 2 2

X 2
c = + + +" + = 20.45
15.1 10.9 7.9 11.1
GRADO DE LIBERTAD ( gl )

gl = 6 − 1 − 1 = 4

K =6
m =1
2
CHI-CUADRADO CRÍTICA ( X gl ;α )

X 42;0.05 = 9.49
1) HIPOTESIS
H0: El orden de llegadas de solicitudes de reparación se ajustan a una distribución
Exponencial.
Ha: El orden de llegadas de solicitudes de reparación no se ajustan a una
distribución Exponencial.
2) NIVEL DE SIGNIFICANCIA (α)
α = 0.05
3) PUNTOS CRITICOS
Se
acepta
H0

Se
0.95 acepta
Ha

0.05

X 62;0.05 = 9.29
4) CHI-CUADRADO CALCULADO
X c2 = 20.45
5) CONCLUSIONES
Como X c2 > X 22;0.05 ( 20.45 > 9.29 ), entonces se acepta la Ha , es decir, El orden de
llegadas de solicitudes de reparación no se ajustan a una distribución
Exponencial, a un nivel de significancia del 5%
PRUEBA PARA LA
INDEPENDENCIA DE DOS
VARIABLES
(TABLAS DE CONTIGENCIA)
FRECUENCIA ESPERADA ( f e )
f rK f Rk
f 0 jk =
n
2
CHI-CUADRADO CALCULADO ( X c )

( f0 rk − ferk )
2
R K
X = ∑∑
2
c
r =1 k =1 f erk
GRADO DE LIBERTAD ( gl )

gl = ( R − 1)( K − 1)
K = N º Categorías de la Variable Categorica 1
R = N º Categorías de la Variable Categorica 2

CHI-CUADRADO CRÍTICA ( X gl2 ;α )


2
X gl ;α
EJEMPLO 1
El director de una escuela primaria divide a los padres de familia en tres categorías de
ingresos, de acuerdo con el rumbo en donde viven y de acuerdo con tres niveles de
participación en los programas escolares. Con los datos de la tabla pruebe la hipótesis de que
no existe relación entre los ingresos y la participación de los programas escolares, utilizando
un nivel de significancia del 5%.
f rK f Rk
f 0 jk =
n
2
CHI-CUADRADO CALCULADO ( X c )

( f0 rk − ferk )
2
R K
X = ∑∑
2
c
r =1 k =1 f erk
X c2 = 17.15

GRADO DE LIBERTAD ( gl )

gl = (3 − 1)(3 − 1) = 4

K =3
R=3
2
CHI-CUADRADO CRÍTICA ( X gl ;α )

X 2
4; 0.05 = 9.49
1) HIPOTESIS
H0: El nivel Económico de los padres de familias y la Participación a los
Programas son independientes (no existe relación).
Ha: El nivel Económico de los padres de familias y la Participación a los
Programas son dependientes (existe relación).
2) NIVEL DE SIGNIFICANCIA (α)
α = 0.05
3) PUNTOS CRITICOS
Se
acepta
H0

Se
0.95 acepta
Ha

0.05

X 62;0.05 = 9.29
4) CHI-CUADRADO CALCULADO
X c2 = 17.15
5) CONCLUSIONES
Como X c2 > X 22;0.05 ( 17.15 > 9.29 ), entonces se acepta la Ha , es decir, El nivel
Económico de los padres de familias y la Participación a los Programas son
dependientes , a un nivel de significancia del 5%

También podría gustarte