Está en la página 1de 10

5.

4 PRUEBAS CHI-CUADRADO
CONTENIDOS:
5.4.1. Prueba de bondad de ajuste.
5.4.2 Prueba de independencia.
5.3.3 Prueba de homogeneidad.
OBJETIVOS:

Plantear hiptesis para diferentes propsitos.


Determinar los pasos a seguir al realizar una prueba chi-cuadrado.
Interpretar el nivel de significacin de la prueba de hiptesis.
Redactar una conclusin con los resultados obtenidos de la prueba de
hiptesis realizada.
Realizar pruebas chi-cuadrado en problemas prcticos

5.4.1

PRUEBA DE BONDAD DE AJUSTE.

Parmetro. Estimador. Hiptesis. Frecuencia esperada


Estadstico de prueba. Nivel de significacin. Regin de rechazo. Conclusin.
CONCEPTOS CLAVES:

RESUMEN DE CONCEPTOS Y PROPIEDADES:


Sea X 0 ( ) , 0 es una distribucin terica conocida que depende de un parmetro y
se tiene una muestra aleatoria de tamao n de X agrupada en m categoras A1 , A2 ,......, An
con frecuencias observadas n1 , n2 ,...., nm
Pasos a seguir al realizar la prueba de hiptesis:
P1: Plantear hiptesis.
Hiptesis nula H 0 : Los datos se ajustan a la distribucin terica 0
v/s Hiptesis alternativa H A : Los datos no se ajustan a la distribucin terica
m

P2: Estadstico de prueba: J 0 =


i =1

( ni ei )
ei

2 (m k 1)

Donde ni : Frecuencia observada de la categora Ai


ei = nP( Ai ) : Frecuencia esperada de la categora Ai
k : nmero de parmetros estimados en la distribucin terica.
m : nmero de categoras en que se agrupan los datos.
P3: Establecer un nivel de significacin: = P (Re chazar H 0 / H 0 es verdadero)
P4: Regin de rechazo de H 0
Para H 0 v / s H A R = { x / x > 2(1 ,m k 1) }
P5: Decisin: Si J 0 R se rechaza H 0 al nivel de significacin
P6: Conclusin: Se debe interpretar la decisin tomada en Paso 5.

EJERCICIO RESUELTO, PASO A PASO:


Ejercicio 1: (Aplicacin en Ciencias de la salud)
El nmero de alumnos por semana que sufren algn tipo de accidente en un colegio
durante 36 semanas del periodo escolar es la siguiente:
N alumnos accidentados (X)
0 1 2 3 4 o ms
N de semanas con X accidentes ( ni ) 6 8 10 6
6
Probar si la muestra de datos se ajusta a una distribucin de Poisson con intensidad , con
un nivel de significacin de 5%
Esquema de solucin
Paso 1: Leer cuidadosamente el enunciado del problema.
Paso 2: Identificar la variable en estudio y los parmetros involucrados.
Sea X = Nmero de alumnos accidentados. En este caso se debe suponer que X ( ) ;
es decir, P( X = j ) =

j e

y el parmetro involucrado es la intensidad , donde es el

j!

nmero promedio de alumnos accidentados por semana en la poblacin.


Paso 3: Estimar los parmetros. En este caso se tiene que el estimador de la intensidad
es la media muestral, luego de la tabla de frecuencias obtenemos que
5

xn

i i

0*6 + 1*8 + 2 *10 + 3*6 + 4*6 70


=
= 1.94
36
36
36
Paso 4: Leer la pregunta 1 y revisar cual de los conceptos se debe usar para obtener
lo pedido. Para responder la pregunta se debe realizar una prueba de bondad de ajuste
donde las hiptesis deben ser: H 0 : Los datos se ajustan a la distribucin de Poisson
v/s H A : Los datos no se ajustan a la distribucin de Poisson.

= X =

i =1

Paso 5: Realizar la prueba siguiendo los seis pasos.


P1: Plantear hiptesis.
Hiptesis nula H 0 : Los datos se ajustan a la distribucin de Poisson
v/s Hiptesis alternativa H A : Los datos no se ajustan a la distribucin de Poisson
5

P2: Estadstico de prueba:

J0 =
i =1

( ni ei )
ei

Donde ei = P( Ai ) *36 y Ai = ( X = i 1)
Luego

2 (5 1 1)
para i = 1, 2,3, 4,5

P( A1 ) = P( X = 0) =

(1.94)0 e1.94
= 0.1437 e1 = 36*0.1437 = 5.1732
0!

P( A2 ) = P( X = 1) =

(1.94)1 e 1.94
= 0.2788 e2 = 36*0.2788 = 10.0368
1!

(1.94) 2 e 1.94
= 0.2704 e3 = 36*0.2704 = 9.7344
2!
(1.94)3 e 1.94
P( A4 ) = P( X = 3) =
= 0.1749 e4 = 36*0.1749 = 6.2964
3!
P( A5 ) = P ( X 4) = 1 P( X < 4) = 0.1322 e5 = 36*0.1322 = 4.7592
P( A3 ) = P( X = 2) =

Luego calculamos el valor del estadstico de prueba en la tabla siguiente:

( ni ei )

Valores de X

ni

ei

0
1
2
3
4 o ms

6
8
10
6
6

5.1732
10.0368
9.7344
6.2964
4.7592

ei

0.1321
0.4133
0.00725
0.01395
0.3235

( ni ei )

i =1

ei

J0 =

= 0.8901

P3: Nivel significacin: = 0.05


P4: Regin de rechazo de H 0 v / s H A

} {

R = x / x > 2 (1 , m k 1) = x / x > 2 (0.95,3) = { x / x > 7.8}


P5: Decisin. Como J 0 = 0.8901 < 7.81 J 0 R No se rechaza H 0 al nivel de
significacin 0.05
P6: Conclusin. Con 95% de confianza la muestra de datos correspondiente al nmero de
accidentes escolares por semana se ajusta a la distribucin de Poisson

EJERCICIOS PROPUESTOS:

1. (Aplicacin en Ciencias de la Salud) En una ciudad la distribucin habitual del


grupo sanguneo es de un 35%, 10%, 6% y un 49% para los grupos A, B, AB y
O respectivamente. En Antofagasta, se realiz el estudio en una muestra de 200
individuos obtenindose una distribucin de 100, 60, 36, y 20 individuos para
los grupos A, B AB y O respectivamente.
Verifique si la muestra de datos de la ciudad de Antofagasta se ajusta a la
distribucin habitual del grupo sanguneo en dicha ciudad usando un nivel de
significacin de 0.01.
2. (Aplicacin en Ciencias de la Salud) Con el fin de conocer si un cierto tipo de
bacterias se distribuyen al azar en un determinado cultivo o si, por el contrario,
lo hacen con algn tipo de preferencia (el centro, los extremos, etc...), se divide
un cultivo en 576 reas iguales y se cuenta el nmero de bacterias en cada rea.
Los resultados son los siguientes:
no de bacterias
no de reas

229 211 93 35

Se ajustan los datos a una distribucin de Poisson de intensidad ? Use un


nivel de significacin de 0.05
3. (Aplicacin en Ciencias de la Salud) La siguiente tabla recoge la distribucin
de los triglicridos en suero, expresados en mg/dl en 90 nios de 6 aos:
Nivel de triglicridos Frecuencias
Menos de 20

20 - 30

11

30 - 40

15

40 - 50

24

50 - 60

18

60 - 70

12

70 o ms

Contrastar la hiptesis de que los datos se ajustan a una distribucin Normal de media
y varianza 2 con un nivel de significacin de 0.05

5.4.2

PRUEBA DE INDEPENDENCIA.

CLAVES: Muestra aleatoria. Estadstico de prueba. Nivel de


significacin. Regin de rechazo. Conclusin. Coeficiente de contingencia.
CONCEPTOS

RESUMEN DE CONCEPTOS Y PROPIEDADES:


Supongamos que se tiene una muestra de n datos bidimensionales de las variables X e Y y
que se clasifican en m categoras A1 , A2 ,......, Am para X y k categoras B1 , B2 ,......, Bk para Y, en
la siguiente tabla de frecuencias conjunta:
X\Y

B1

B2

Bk

Total

A1

n11

n12

n1k

n1

A2

n21

n22

n2k

n2

Am

nm1

nm 2

nmk

nm

Total

n1

n2

n k

P1: Plantear hiptesis.


Hiptesis nula H 0 : Las variables X e Y son independientes
v/s Hiptesis alternativa H A : Existe alguna relacin entre X e Y
La hiptesis H 0 es equivalente a probar que P( Ai B j ) = P ( Ai ) P( B j ) es decir que los
sucesos Ai y B j son independientes i y j
m

P2: Estadstico de prueba: J 0 =


i =1 j =1

(n

ij

eij

2 [ (m 1)( k 1) ]

eij

Donde m : nmero de categoras para la variable X.


k : nmero de categoras para la variable Y
nij : Frecuencia observada de la categora Ai B j
eij = nP ( Ai B j ) : Frecuencia esperada de la categora Ai B j
Para obtener las frecuencias esperadas se supone que H 0 es verdadera, es decir
eij = nP ( Ai B j ) = nP( Ai ) P( B j ) = n

ni n j ni n j
=
n
n n

P3: Establecer un nivel de significacin: = P (Re chazar H 0 / H 0 es verdadero)


P4: Regin de rechazo de H 0

Para H 0 v / s H A R = x / x > 2(1 , ( m 1)( k 1) )

P5: Decisin: Si J 0 R se rechaza H 0 al nivel de significacin


P6: Conclusin: Se debe interpretar la decisin tomada en Paso 5.
Grado de relacin: Para medir el grado de relacin entre las variables cualitativas se
usa como indicador el coeficiente de contingencia (CC), definido por:

J0
CC =
*100
J 0 + n

EJERCICIO RESUELTO, PASO A PASO:


Ejercicio 1: (Aplicacin en Ciencias de la ingeniera)
Una empresa minera hizo un estudio para verificar si el tipo de trabajo se
relaciona con el grado de silicosis de los trabajadores. Para lo cual se elige una
muestra aleatoria de 300 trabajadores y se clasifican en la tabla siguiente:
Grado Silicosis
Tipo de Trabajo
Total
I
II
III
Oficina
42 24 30 96
Terreno
54 78 72 204
Total
96 102 102 300
a) Probar la hiptesis de que el tipo de trabajo afecta el grado de silicosis del
trabajador con un nivel de significacin de 5%
b) Determine el grado de relacin
Esquema de solucin
Paso 1: Leer cuidadosamente el enunciado del problema.
Paso 2: Identificar las variables en estudio.
Sea X=Tipo de trabajo Y=Grado de silicosis
Paso 4: Leer la pregunta y revisar cual de los conceptos se debe usar para
obtener lo pedido.
Para responder la pregunta se debe realizar una prueba de hiptesis de
independencia para variables cualitativas
Paso 5: Realizar la prueba siguiendo los seis pasos.
P1: Plantear hiptesis.
H 0 : El grado de silicosis es independiente del tipo de trabajo
v/s H A : Existe alguna relacin entre grado de silicosis y tipo de trabajo
P2: Estadstico de prueba;

(n

ij

eij

nij

eij

eij

42
24

30,72

4,1419

32,64
32,64
65,28
69,36
69,36

2,2871
0,2135
1,9491
1,0763
0,1005

Jo =

9,7683

30
54
78
72

P3: Nivel significacin; = 0.05


P4: Regin de rechazo de H 0 v / s H A

} {

R = x / x > 2 (1 ,( m 1)( k 1)) = x / x > 2 (0.95,2) = { x / x > 5.99}


P5: Decisin. Como J 0 = 9.7683 > 5.99 J 0 R Se rechaza H 0 al nivel de
significacin 0.05
P6: Conclusin. Con 95% de confianza Existe alguna relacin entre grado de
silicosis y tipo de trabajo

EJERCICIOS PROPUESTOS:

1. (Aplicacin en Ciencias de la Salud)


Una institucin ambiental hizo un estudio para determinar si el sector
habitacional se relaciona con el grado de contaminacin por plomo. Una
muestra aleatoria de 300 personas a las que se les examin entreg los
siguientes resultados:
Grado de Contaminacin
Sector habitacional
Alto
Medio
Bajo
Gran Va
18
6
12
Coviefi
42
24
30
Playa Blanca
36
72
60
a) Cree usted que el sector habitacional se relaciona con el grado de
contaminacin por plomo? Use una confiabilidad de 99% en su
conclusin.
b) Determine el grado de relacin entre las variables analizadas e
interprete el resultado.
2. (Aplicacin en Ciencias del Mar) Se desea comparar la efectividad de dos
anlisis de laboratorio para detectar la presencia de bacterias en
equinodermos (erizo rojo), para ello se selecciona dos muestras
independientes de Loxechinus albus (erizo rojo comestible) en un sector de
caleta coloso y los resultados de los anlisis fueron los siguientes:
Deteccin de la Bacteria
Anlisis
Total
Si
No
1
11
39
50
2
8
42
50
Total
19
81
100
a) Pruebe la hiptesis de que la deteccin de la bacteria es independiente del
tipo de anlisis usado, con un nivel de significacin de 0.05
b) Determine el grado de relacin entre las variables
3. (Aplicacin en Ciencias del Mar) La siguiente tabla muestra la distribucin
de una muestra aleatoria de 400 truchas cafs de un gran ro., segn la
longitud y el sector donde fueron extradas.
SECTOR DEL RIO
LONGITUD

Alto
Centro
Bajo
67
64
25
Bajo el promedio
42
76
56
Promedio
Sobre el promedio
10
23
37
a) Pruebe la hiptesis de que existe alguna relacin entre la longitud de las
truchas y el sector del ro donde fueron extradas, usando un nivel de
significacin de 0.05.
b) Cul es el grado de relacin entre las variables?.

5.4.3

PRUEBA DE HOMOGENEIDAD.

CONCEPTOS CLAVES:

Hiptesis nula. Estadstico de prueba. Frecuencia esperada


Nivel de significacin. Regin de rechazo. Conclusin.

RESUMEN DE CONCEPTOS Y PROPIEDADES:


Consideremos k poblaciones independientes, cada una particionada en las clases
A1 , A2 ,......, Am .
Para cada Ai se definen las probabilidades
pij = P ( Ai / Poblacin j ) i = 1, 2,..., m

j = 1, 2,..., k

El objetivo es probar si cada clase Ai tiene la misma probabilidad en todas las poblaciones.
Para realizar la prueba se toma una muestra de tamao n j de la poblacin j y se clasifican
segn las clases Ai en la siguiente tabla
Poblacin
Clases
Total
1
2
k
A1

n11

n12

n1k

n1

A2

n21

n22

n2k

n2


Am

nm1

nm 2

nmk

nm

Total

n1

n2

nk

P1: Plantear hiptesis.


p11 p12
p1k p1


p
p
p
p
Hiptesis nula H 0 : 21 = 22 = ...... = 2 k = 2
 
 


pm1 pm 2
pmk pm
v/s Hiptesis alternativa H A : Alguna diferencia existe
m

P2: Estadstico de prueba: J 0 =

(n

i =1 j =1

ij

eij

2 [ (m 1)( k 1) ]

eij

Donde m : nmero de clases.


k : nmero de poblaciones
nij : Frecuencia observada de la clase Ai en la poblacin j
eij : Frecuencia esperada de la clase Ai en la poblacin j
Para obtener las frecuencias esperadas se supone que H 0 es verdadera, es decir basta
estimar pi por p i =

ni
n

luego

eij = n j p i

P3: Establecer un nivel de significacin: = P (Re chazar H 0 / H 0 es verdadero)


P4: Regin de rechazo de H 0

Para H 0 v / s H A R = x / x > 2(1 , ( m 1)( k 1) )

P5: Decisin: Si J 0 R se rechaza H 0 al nivel de significacin


P6: Conclusin: Se debe interpretar la decisin tomada en Paso 5.

EJERCICIO RESUELTO, PASO A PASO:


EJERCICIO : (APLICACIN EN CIENCIAS DE LA INGENIERA)
En un proceso de fabricacin de tornillos, el fabricante quera determinar si la
proporcin de tornillos defectuosos producidos por tres mquinas variaba de
una mquina a otra. Para verificar esto se seleccionaron muestras de 400 tornillos
de la produccin de cada mquina y se cont el nmero de tornillos defectuosos
en cada una, obteniendo la siguiente tabla de frecuencias.
Mquina
Calidad
Total
1
2
3
Defectuosos
16 24
9
49
No Defectuosos 384 376 391 1151
Total
400 400 400 1200
Pregunta: Realizando la prueba de hiptesis adecuada, verifique si la proporcin
de tornillos defectuosos no vara entre las diferentes mquinas. Use un nivel de
significacin de 0.05.
Esquema de solucin
Paso 1: Leer cuidadosamente el enunciado del problema.
Paso 2: Identificar las clases y las poblaciones.
En este caso tenemos tres poblaciones (las mquinas) particionadas en dos clases
(defectuosos y no defectuosos).
Paso 3: Leer la pregunta y revisar cual de los conceptos se debe usar para
obtener lo pedido.
Para responder la pregunta se debe realizar una prueba de homogeneidad
Donde p1 j = P ( Defectuoso / Mquina j ) y p2 j = P( No Defectuoso / Mquina j )
Paso 4: Realizar la prueba siguiendo los seis pasos.
P1: Plantear hiptesis.
p p p p
H 0 : 11 = 21 = 31 = 1
p21 p22 p32 p2

v/s H A : Alguna diferencia existe

P2: Estadstico de prueba;

(n

ij

nij

16

49
= 16.3
1200
384
1151
400
= 383.7
1200
24
16.3
376
383.7
9
16.3
391
383.7
Jo =
P3: Nivel significacin; = 0.05
P4: Regin de rechazo de H 0 v / s H A

} {

eij

eij
400

eij

4,1419
2,2871
0,2135
1,9491
1,0763
0,1005
9,7683

R = x / x > (12 ,( m1)( k 1)) = x / x > (20.95,2) = { x / x > 5.99}


P5: Decisin. Como J 0 = 9.7683 > 5.99 J 0 R1 Se rechaza H 0 al nivel de
significacin 0.05
P6: Conclusin. Con 95% de confianza alguna diferencia existe en la proporcin
de tornillos defectuosos entre las diferentes mquinas.

EJERCICIOS PROPUESTOS:

1. (Aplicacin en Ciencias de Ingeniera) Se desea probar si la distribucin


proporcional del rendimiento en una gran compaa variaba segn el coeficiente
intelectual de los trabajadores, para lo cual se toma una muestra para cada nivel del
CI y se clasifica segn el rendimiento en la compaa en la siguiente tabla.
R E N D I M I E N T O
COEFICIENTE
INTELECTUAL Deficiente
Regular
Bueno
Bajo el promedio
67
64
25
Promedio
42
76
56
Sobre el Promedio
10
23
37
Verifique la hiptesis que la distribucin proporcional del rendimiento en la
compaa es el mismo para cada nivel de CI. Use un nivel de significacin de 5%
2. (Aplicacin en Ciencias de Ingeniera) Con el propsito de decidir si la opinin
sobre el nivel de las carreras de ingeniera, que tienen los acadmicos y los alumnos,
son concordantes, se procede a encuestar a 100 acadmicos y a 200 alumnos,
obtenindose los siguientes resultados:

Acadmicos
Alumnos

Deficiente
36
80

Regular
55
93

Bueno
4
14

Excelente
5
13

Pruebe la hiptesis que la distribucin proporcional de la opinin entre los


acadmicos y los alumnos es la misma, usando una significacin de 0.05

3. (Aplicacin en Ciencias de la salud) El Servicio nacional de salud desea verificar


si la la distribucin proporcional del estado nutricional de los nios no vara en tres
ciudades de la regin, para lo cual toma una muestra de nios de las tres ciudades y
los clasifica segn estado nutricional obteniendo la siguiente tabla:

Estado nutricional

Ciudad
Antofagasta

Calama

Tocopilla

Total

Obeso

82

70

62

214

Sobrepeso

93

62

67

222

Normal

25

18

21

64

Flaco

16

15

18

49

Total

216

165

168

549

Realice el anlisis estadstico correspondiente destacando las hiptesis que usted


deber probar con una significacin de 0.05 y los pasos que ha seguido para
lograr su conclusin.

También podría gustarte