Está en la página 1de 19

PRUEBA JI CUADRADA

Pruebas de bondad de ajuste


Y
Pruebas para tablas de contingencias

DISTRIBUCIN JI_CUADRADA
La distribucin ji_cuadrada permite probar, si dos o mas proporciones de poblacin
pueden ser consideradas iguales.
Si se clasifica a una poblacin en diferentes categoras con respecto a dos atributos
(edad, y gnero), podemos utilizar una prueba ji_cuadrada, para comprobar si los
dos atributos son independientes entre si; se denota por la letra griega (Ji),
elevada al cuadrado: 2.
A medida que aumentan los grados de libertad la curva se va haciendo ms
simtrica y su cola derecha se va extendiendo.
Caractersticas de la distribucin:
Todos los valores de 2 son positivos.
Es una curva sesgada hacia la derecha.

PROPIEDADES DE LAS DISTRIBUCIONES JI_CUADRADAS


l.-Los valores de 2 son mayores o iguales que O
2.-La forma de una distribucin 2 depende del g I =n-l. En
consecuencia hay un numero infinito de distribuciones 2.
3.-EI rea bajo una curva ji_cuadrada y sobre el eje horizontal es 1.
4.-Las distribuciones 2 no son simtricas, tienen colas estrechas que
se extienden a la derecha; estn sesgadas a la derecha.
5.- Cuando n>2 la media de una distribucin 2 es n-1 y la varianza
es 2(n-1).
6.-EI valor modal de una distribucin 2 se da en el valor (n-3).


Para una poblacin con distribucin
normal, el cociente:
(n-1) s2 / 2
Tiene una distribucin de probabilidad de X2
Adems, distinta para los diferentes grados de libertad
(n-1).
Por ello, la estadstica que se utiliza para probar el valor
hipottico de una varianza poblacional es:

X2 =
Para determinar los valores crticos de la prueba jicuadrada (ver la tabla) para diversos valores de
significancia

1. PRUEBAS DE BONDAD DEL AJUSTE


una afirmacin sobre el patrn esperado
frecuencias en un conjunto de categoras.

de

las

El patrn esperado puede ajustarse a la suposicin de


igualdad de probabilidades, y puede, por ello, implica la
comparacin de frecuencias muestrales clasificadas en
categoras definidas de datos, teniendo en todos los
casos el patrn esperado de frecuencias que se basan en
una hiptesis nula (Ho) especfica.
La estadstica de prueba, se distribuye como el modelo
de probabilidad de ji-cuadrada, donde la Ho es una
prueba de bondad del ajuste, siendo o: ser uniforme.

1. Ejemplo: Durante mucho tiempo, un fabricante de TV


ha tenido el 40% de sus ventas en aparatos
pequeos, el 40% de tamao mediano y un 20% en
tamaos grandes; para fijar los programas adecuados
de produccin para el prximo ao, se toma una
muestra aleatoria de 100 ventas del ltimo ao,
donde se encontr que el 55% de los aparatos eran
pequeos, el 35% eran medianos y slo el 10% eran
grandes. Los porcentajes de compras de aparatos de
TV de pantalla pequea, mediana y grande son del
40%, 40% y 20% respectivamente, para un nivel de
significancia del 1%.

Ho: los porcentajes de compras de aparatos de TV de pantalla


pequea,
mediana y grande son del 40%, 40% y 20%, respectivamente.
H1: el patrn de compras de TV es diferente al patrn histrico
planteado Ho.

gl = k m 1 = 3 0 1 = 2
y con .. = 1% .. La x2 crtica es de 9,21
La x2 calculada ser:
= (55 40)2 / 40 + (35 40)2 / 40 + (10 20)2 / 20 = 11,25

La estadstica ji-cuadrada calculada de 11,25 es mayor que el valor de 9,21. Por ello, la
hiptesis nula a un nivel de significancia del 1%, debe ser rechazada, por lo que no se
acepta el patrn de compras y se debe programar la produccin de una manera
diferente al patrn actual.

9,21

ZONA DE ACEPTACION
DE LA Ho
0

11,25
8

10

12

14

16

2. PRUEBAS TABLAS DE CONTINGENCIA


Para las pruebas de bondad del ajuste, existe slo una variable
categrica (de ah, que m=0).
Las pruebas de independencia implican por lo menos dos variables
y lo que se prueba es la suposicin de que las dos variables son
estadsticamente independientes; implica que el saber la categora
en la que se clasifica una observacin con respecto a una variable,
no tiene ningn efecto sobre la probabilidad de caer tambin en
alguna de las diversas categoras de las otras variables.
Como se trabaja con dos variables, se anotan las frecuencias
observadas en una tabla de clasificacin doble o de contingencias,
con dimensiones:
r x k,
donde r es el nmero de renglones y k es nmero de
columnas.

Dada

la hiptesis de independencia de las dos variables, la


frecuencia esperada correspondiente a cada una de las celdas de la
tabla de contingencia debe ser proporcional al total de frecuencias
observadas, tanto de columna como de rengln. La frmula
conveniente para determinar la frecuencia esperada para la celda
de la tabla de contingencia que se encuentra en ese rengln y
columna, es:
fr: es la frecuencia total del rengln
fk es la frecuencia total de una columna
n : Tamao de la muestra
(k-1)

donde:

gl = (r -1)

Ejemplo: en la siguiente tabla, se muestra los clientes de una tienda


de electrodomsticos, clasificados por edad y por gnero. Se puede
decir que estas dos variables son independientes a un nivel de
significancia del 1%.
EDAD
(AOS)

GENERO
GENERO

TOTAL

HOMBRE

MUJER

MENOR DE 30

60

50

110

30 Y MAS

80

10

90

140

60

200

TOTAL
fo = Fr.
Observadas

(110) (140) /200 = 15400 / 200 = 77

= (110) (60) /200 = 6600 / 200 = 33


= (90) (140) /200 = 12600 / 200 = 63
= (90) (60) /200 = 5400 / 200 = 27

EDAD
(AOS)

GENERO
GENERO

TOTAL

HOMBRE

MUJER

MENOR DE 30

77

33

110

30 Y MAS

63

27

90

140

60

200

TOTAL
fe : Fr.
esperadas


Ho: El Gnero y la Edad de los clientes
de la tienda son
independientes.
H1: Son variables dependientes (Existe relacin entre ellas)

gl = ( r - 1) ( k 1) = ( 2 1) ( 2 1) = 1
y con .. = 1% .. La x2 crtica es de 6,63
La x2 calculada ser:
= (60 77)2 / 77 + (50 33)2 / 33 + (80 63)2 / 63 + (10 27)2 / 27 = 27,80

La estadstica ji-cuadrada calculada de 27,80 es mayor que el valor de 6,63. Por ello, la
hiptesis nula a un nivel de significancia del 1%, debe ser rechazada, por lo que se
acepta que existe relacin entre la edad y el gnero al momento de compra de
electrodomsticos en la tienda.

6,63

ZONA DE ACEPTACION
DE LA Ho
0

27,80
8

10

12

14

16

EJEMPLO:
LA EMPRESA UNAB CONSIDERA QUE LOS ESTUDIANTES NO TIENEN RENDIMIENTO DEBIDO A LA
FALTA DE DEDICACION A HORAS DE ESTUDIUO FUERA DE LA UNIVERSIDAD Y POR QUE ALGUNOS
DE ELLOS TRABAJAN; EN LA SIGUIENTE TABLA SE MUESTRA LOS VALORES CORRESPONDIENTES
A UNA MUESTRA DE 300 ESTUDIANTES.

CALIFICACIONES
< 2,0

2,1 2,9

3,0 3,5

3,6 4,0

> 4,0

HE:<
3,0

25

18

24

30

28

H E: 3.0

45

20

20

30

60

SERAN INDEPENDINETES A UN NIVEL DE SIGNIFICANCIA DEL 5%?

EJEMPLO:
LA EMPRESA UNAB CONSIDERA QUE LOS ESTUDIANTES NO TIENEN RENDIMIENTO DEBIDO A LA
FALTA DE DEDICACION A HORAS DE ESTUDIUO FUERA DE LA UNIVERSIDAD Y POR QUE ALGUNOS
DE ELLOS TRABAJAN; EN LA SIGUIENTE TABLA SE MUESTRA LOS VALORES CORRESPONDIENTES
A UNA MUESTRA DE 300 ESTUDIANTES.

CALIFICACIONES

HT:<
4,0
H
H T:
T: MAS
4 -6
DE 6

< 2,0

2,1 2,9

3,0 3,5

3,6 4,0

> 4,0

15

18

22

25

30

10
35

25
27

5
21

13
32

7
15

SERAN INDEPENDINETES A UN NIVEL DE SIGNIFICANCIA DEL 5%?

También podría gustarte