Está en la página 1de 10

5.4 PRUEBAS CHI-CUADRADO CONTENIDOS: 5.4.1. Prueba de bondad de ajuste. 5.4.2 Prueba de independencia. 5.3.3 Prueba de homogeneidad.

OBJETIVOS: Plantear hiptesis para diferentes propsitos. Determinar los pasos a seguir al realizar una prueba chi-cuadrado. Interpretar el nivel de significacin de la prueba de hiptesis. Redactar una conclusin con los resultados obtenidos de la prueba de hiptesis realizada. Realizar pruebas chi-cuadrado en problemas prcticos

5.4.1

PRUEBA DE BONDAD DE AJUSTE.

Parmetro. Estimador. Hiptesis. Frecuencia esperada Estadstico de prueba. Nivel de significacin. Regin de rechazo. Conclusin.
CONCEPTOS CLAVES:

RESUMEN DE CONCEPTOS Y PROPIEDADES: Sea X 0 ( ) , 0 es una distribucin terica conocida que depende de un parmetro y se tiene una muestra aleatoria de tamao n de X agrupada en m categoras A1 , A2 ,......, An con frecuencias observadas n1 , n2 ,...., nm Pasos a seguir al realizar la prueba de hiptesis: P1: Plantear hiptesis. Hiptesis nula H 0 : Los datos se ajustan a la distribucin terica 0 v/s Hiptesis alternativa H A : Los datos no se ajustan a la distribucin terica P2: Estadstico de prueba: J 0 =
i =1 m

( ni ei )
ei

2 (m k 1)

Donde ni : Frecuencia observada de la categora Ai ei = nP( Ai ) : Frecuencia esperada de la categora Ai k : nmero de parmetros estimados en la distribucin terica. m : nmero de categoras en que se agrupan los datos. P3: Establecer un nivel de significacin: = P (Re chazar H 0 / H 0 es verdadero) P4: Regin de rechazo de H 0 Para H 0 v / s H A R = { x / x > 2(1 ,m k 1) } P5: Decisin: Si J 0 R se rechaza H 0 al nivel de significacin P6: Conclusin: Se debe interpretar la decisin tomada en Paso 5.

EJERCICIO RESUELTO, PASO A PASO: Ejercicio 1: (Aplicacin en Ciencias de la salud) El nmero de alumnos por semana que sufren algn tipo de accidente en un colegio durante 36 semanas del periodo escolar es la siguiente: N alumnos accidentados (X) 0 1 2 3 4 o ms N de semanas con X accidentes ( ni ) 6 8 10 6 6 Probar si la muestra de datos se ajusta a una distribucin de Poisson con intensidad , con un nivel de significacin de 5% Esquema de solucin Paso 1: Leer cuidadosamente el enunciado del problema. Paso 2: Identificar la variable en estudio y los parmetros involucrados. Sea X = Nmero de alumnos accidentados. En este caso se debe suponer que X ( ) ; es decir, P( X = j ) =
j e
j!

y el parmetro involucrado es la intensidad , donde es el

nmero promedio de alumnos accidentados por semana en la poblacin. Paso 3: Estimar los parmetros. En este caso se tiene que el estimador de la intensidad es la media muestral, luego de la tabla de frecuencias obtenemos que 0*6 + 1*8 + 2 *10 + 3*6 + 4*6 70 = = 1.94 36 36 36 Paso 4: Leer la pregunta 1 y revisar cual de los conceptos se debe usar para obtener lo pedido. Para responder la pregunta se debe realizar una prueba de bondad de ajuste donde las hiptesis deben ser: H 0 : Los datos se ajustan a la distribucin de Poisson v/s H A : Los datos no se ajustan a la distribucin de Poisson. =X =
i =1

xn

i i

Paso 5: Realizar la prueba siguiendo los seis pasos. P1: Plantear hiptesis. Hiptesis nula H 0 : Los datos se ajustan a la distribucin de Poisson v/s Hiptesis alternativa H A : Los datos no se ajustan a la distribucin de Poisson

P2: Estadstico de prueba:

J0 =
i =1

( ni ei )
ei

2 (5 1 1)
para i = 1, 2,3, 4,5

Donde ei = P( Ai ) *36 y Ai = ( X = i 1) Luego


P( A1 ) = P( X = 0) =
P( A2 ) = P( X = 1) =

(1.94)0 e1.94 = 0.1437 e1 = 36*0.1437 = 5.1732 0!


(1.94)1 e 1.94 = 0.2788 e2 = 36*0.2788 = 10.0368 1!

(1.94) 2 e 1.94 = 0.2704 e3 = 36*0.2704 = 9.7344 2! (1.94)3 e 1.94 P( A4 ) = P( X = 3) = = 0.1749 e4 = 36*0.1749 = 6.2964 3! P( A5 ) = P ( X 4) = 1 P( X < 4) = 0.1322 e5 = 36*0.1322 = 4.7592 P( A3 ) = P( X = 2) =

Luego calculamos el valor del estadstico de prueba en la tabla siguiente: Valores de X 0 1 2 3 4 o ms


ni ei

( ni ei )
ei

6 8 10 6 6

5.1732 10.0368 9.7344 6.2964 4.7592


J0 =
i =1 5

0.1321 0.4133 0.00725 0.01395 0.3235


2

( ni ei )
ei

= 0.8901

P3: Nivel significacin: = 0.05 P4: Regin de rechazo de H 0 v / s H A

R = x / x > 2 (1 , m k 1) = x / x > 2 (0.95,3) = { x / x > 7.8}


P5: Decisin. Como J 0 = 0.8901 < 7.81 J 0 R No se rechaza H 0 al nivel de significacin 0.05 P6: Conclusin. Con 95% de confianza la muestra de datos correspondiente al nmero de accidentes escolares por semana se ajusta a la distribucin de Poisson

} {

EJERCICIOS PROPUESTOS:

1. (Aplicacin en Ciencias de la Salud) En una ciudad la distribucin habitual del grupo sanguneo es de un 35%, 10%, 6% y un 49% para los grupos A, B, AB y O respectivamente. En Antofagasta, se realiz el estudio en una muestra de 200 individuos obtenindose una distribucin de 100, 60, 36, y 20 individuos para los grupos A, B AB y O respectivamente. Verifique si la muestra de datos de la ciudad de Antofagasta se ajusta a la distribucin habitual del grupo sanguneo en dicha ciudad usando un nivel de significacin de 0.01. 2. (Aplicacin en Ciencias de la Salud) Con el fin de conocer si un cierto tipo de bacterias se distribuyen al azar en un determinado cultivo o si, por el contrario, lo hacen con algn tipo de preferencia (el centro, los extremos, etc...), se divide un cultivo en 576 reas iguales y se cuenta el nmero de bacterias en cada rea. Los resultados son los siguientes: no de bacterias no de reas 0 1 2 3
4

229 211 93 35

Se ajustan los datos a una distribucin de Poisson de intensidad ? Use un nivel de significacin de 0.05 3. (Aplicacin en Ciencias de la Salud) La siguiente tabla recoge la distribucin de los triglicridos en suero, expresados en mg/dl en 90 nios de 6 aos: Nivel de triglicridos Frecuencias Menos de 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 o ms 5 11 15 24 18 12 5

Contrastar la hiptesis de que los datos se ajustan a una distribucin Normal de media y varianza 2 con un nivel de significacin de 0.05

5.4.2

PRUEBA DE INDEPENDENCIA.

CLAVES: Muestra aleatoria. Estadstico de prueba. Nivel de significacin. Regin de rechazo. Conclusin. Coeficiente de contingencia. CONCEPTOS

RESUMEN DE CONCEPTOS Y PROPIEDADES: Supongamos que se tiene una muestra de n datos bidimensionales de las variables X e Y y que se clasifican en m categoras A1 , A2 ,......, Am para X y k categoras B1 , B2 ,......, Bk para Y, en la siguiente tabla de frecuencias conjunta: X\Y
A1 A2 B1 n11 n21 B2 n12 Bk n1k n2 k

Total
n1 n2

n22

Am

nm1 n1

nm 2 n2

nmk n k

nm
n

Total

P1: Plantear hiptesis. Hiptesis nula H 0 : Las variables X e Y son independientes v/s Hiptesis alternativa H A : Existe alguna relacin entre X e Y La hiptesis H 0 es equivalente a probar que P( Ai B j ) = P ( Ai ) P( B j ) es decir que los sucesos Ai y B j son independientes i y j P2: Estadstico de prueba: J 0 =
i =1 j =1 m k

(n

ij

eij eij

2 [ (m 1)( k 1) ]

Donde m : nmero de categoras para la variable X. k : nmero de categoras para la variable Y nij : Frecuencia observada de la categora Ai B j eij = nP ( Ai B j ) : Frecuencia esperada de la categora Ai B j Para obtener las frecuencias esperadas se supone que H 0 es verdadera, es decir
eij = nP ( Ai B j ) = nP( Ai ) P( B j ) = n ni n j ni n j = n n n

P3: Establecer un nivel de significacin: = P (Re chazar H 0 / H 0 es verdadero) P4: Regin de rechazo de H 0 Para H 0 v / s H A R = x / x > 2(1 , ( m 1)( k 1) )

P5: Decisin: Si J 0 R se rechaza H 0 al nivel de significacin P6: Conclusin: Se debe interpretar la decisin tomada en Paso 5. Grado de relacin: Para medir el grado de relacin entre las variables cualitativas se usa como indicador el coeficiente de contingencia (CC), definido por:
J0 CC = *100 J0 + n

EJERCICIO RESUELTO, PASO A PASO: Ejercicio 1: (Aplicacin en Ciencias de la ingeniera) Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado de silicosis de los trabajadores. Para lo cual se elige una muestra aleatoria de 300 trabajadores y se clasifican en la tabla siguiente: Grado Silicosis Tipo de Trabajo Total I II III Oficina 42 24 30 96 Terreno 54 78 72 204 Total 96 102 102 300 a) Probar la hiptesis de que el tipo de trabajo afecta el grado de silicosis del trabajador con un nivel de significacin de 5% b) Determine el grado de relacin Esquema de solucin Paso 1: Leer cuidadosamente el enunciado del problema. Paso 2: Identificar las variables en estudio. Sea X=Tipo de trabajo Y=Grado de silicosis Paso 4: Leer la pregunta y revisar cual de los conceptos se debe usar para obtener lo pedido. Para responder la pregunta se debe realizar una prueba de hiptesis de independencia para variables cualitativas Paso 5: Realizar la prueba siguiendo los seis pasos. P1: Plantear hiptesis. H 0 : El grado de silicosis es independiente del tipo de trabajo v/s H A : Existe alguna relacin entre grado de silicosis y tipo de trabajo P2: Estadstico de prueba;

(n
nij eij
30,72 32,64 32,64 65,28 69,36 69,36 Jo =

ij

eij eij

42 24
30 54 78 72

4,1419 2,2871 0,2135 1,9491 1,0763 0,1005 9,7683

P3: Nivel significacin; = 0.05 P4: Regin de rechazo de H 0 v / s H A

R = x / x > 2 (1 ,( m 1)( k 1)) = x / x > 2 (0.95,2) = { x / x > 5.99}


P5: Decisin. Como J 0 = 9.7683 > 5.99 J 0 R Se rechaza H 0 al nivel de significacin 0.05 P6: Conclusin. Con 95% de confianza Existe alguna relacin entre grado de silicosis y tipo de trabajo

} {

EJERCICIOS PROPUESTOS:

1. (Aplicacin en Ciencias de la Salud) Una institucin ambiental hizo un estudio para determinar si el sector habitacional se relaciona con el grado de contaminacin por plomo. Una muestra aleatoria de 300 personas a las que se les examin entreg los siguientes resultados: Grado de Contaminacin Sector habitacional Alto Medio Bajo Gran Va 18 6 12 Coviefi 42 24 30 Playa Blanca 36 72 60 a) Cree usted que el sector habitacional se relaciona con el grado de contaminacin por plomo? Use una confiabilidad de 99% en su conclusin. b) Determine el grado de relacin entre las variables analizadas e interprete el resultado. 2. (Aplicacin en Ciencias del Mar) Se desea comparar la efectividad de dos anlisis de laboratorio para detectar la presencia de bacterias en equinodermos (erizo rojo), para ello se selecciona dos muestras independientes de Loxechinus albus (erizo rojo comestible) en un sector de caleta coloso y los resultados de los anlisis fueron los siguientes: Deteccin de la Bacteria Anlisis Total Si No 1 11 39 50 2 8 42 50 Total 19 81 100 a) Pruebe la hiptesis de que la deteccin de la bacteria es independiente del tipo de anlisis usado, con un nivel de significacin de 0.05 b) Determine el grado de relacin entre las variables 3. (Aplicacin en Ciencias del Mar) La siguiente tabla muestra la distribucin de una muestra aleatoria de 400 truchas cafs de un gran ro., segn la longitud y el sector donde fueron extradas. SECTOR DEL RIO Alto Centro Bajo 67 64 25 Bajo el promedio 42 76 56 Promedio Sobre el promedio 10 23 37 a) Pruebe la hiptesis de que existe alguna relacin entre la longitud de las truchas y el sector del ro donde fueron extradas, usando un nivel de significacin de 0.05. b) Cul es el grado de relacin entre las variables?. LONGITUD

5.4.3

PRUEBA DE HOMOGENEIDAD.

CONCEPTOS CLAVES:

Hiptesis nula. Estadstico de prueba. Frecuencia esperada Nivel de significacin. Regin de rechazo. Conclusin.

RESUMEN DE CONCEPTOS Y PROPIEDADES: Consideremos k poblaciones independientes, cada una particionada en las clases A1 , A2 ,......, Am . Para cada Ai se definen las probabilidades
pij = P ( Ai / Poblacin j ) i = 1, 2,..., m y j = 1, 2,..., k

El objetivo es probar si cada clase Ai tiene la misma probabilidad en todas las poblaciones. Para realizar la prueba se toma una muestra de tamao n j de la poblacin j y se clasifican segn las clases Ai en la siguiente tabla Poblacin Clases Total 1 2 k
A1 A2 Am n11 n21 nm1 n1 n12 n1k n2 k nmk nk n1 n2 nm n

n22
nm 2 n2

Total P1: Plantear hiptesis.

p11 p12 p1k p1 p p p p Hiptesis nula H 0 : 21 = 22 = ...... = 2 k = 2 p p m1 pm 2 mk pm v/s Hiptesis alternativa H A : Alguna diferencia existe

P2: Estadstico de prueba: J 0 =


i =1 j =1

(n

ij

eij eij

2 [ (m 1)( k 1) ]

Donde m : nmero de clases. k : nmero de poblaciones nij : Frecuencia observada de la clase Ai en la poblacin j eij : Frecuencia esperada de la clase Ai en la poblacin j Para obtener las frecuencias esperadas se supone que H 0 es verdadera, es decir basta
i = estimar pi por p ni n

luego

i eij = n j p

P3: Establecer un nivel de significacin: = P (Re chazar H 0 / H 0 es verdadero) P4: Regin de rechazo de H 0 Para H 0 v / s H A R = x / x > 2(1 , ( m 1)( k 1) )

P5: Decisin: Si J 0 R se rechaza H 0 al nivel de significacin P6: Conclusin: Se debe interpretar la decisin tomada en Paso 5.

EJERCICIO RESUELTO, PASO A PASO: EJERCICIO : (APLICACIN EN CIENCIAS DE LA INGENIERA) En un proceso de fabricacin de tornillos, el fabricante quera determinar si la proporcin de tornillos defectuosos producidos por tres mquinas variaba de una mquina a otra. Para verificar esto se seleccionaron muestras de 400 tornillos de la produccin de cada mquina y se cont el nmero de tornillos defectuosos en cada una, obteniendo la siguiente tabla de frecuencias. Mquina Calidad Total 1 2 3 Defectuosos 16 24 9 49 No Defectuosos 384 376 391 1151 Total 400 400 400 1200 Pregunta: Realizando la prueba de hiptesis adecuada, verifique si la proporcin de tornillos defectuosos no vara entre las diferentes mquinas. Use un nivel de significacin de 0.05. Esquema de solucin Paso 1: Leer cuidadosamente el enunciado del problema. Paso 2: Identificar las clases y las poblaciones. En este caso tenemos tres poblaciones (las mquinas) particionadas en dos clases (defectuosos y no defectuosos). Paso 3: Leer la pregunta y revisar cual de los conceptos se debe usar para obtener lo pedido. Para responder la pregunta se debe realizar una prueba de homogeneidad Donde p1 j = P ( Defectuoso / Mquina j ) y p2 j = P( No Defectuoso / Mquina j ) Paso 4: Realizar la prueba siguiendo los seis pasos. P1: Plantear hiptesis.
p p p p H 0 : 11 = 21 = 31 = 1 p21 p22 p32 p2

v/s H A : Alguna diferencia existe

P2: Estadstico de prueba;

(n
nij eij 400 49 = 16.3 1200 384 1151 400 = 383.7 1200 24 16.3 376 383.7 9 16.3 391 383.7 Jo = P3: Nivel significacin; = 0.05 P4: Regin de rechazo de H 0 v / s H A

ij

eij eij

16

4,1419 2,2871 0,2135 1,9491 1,0763 0,1005 9,7683

2 R = x / x > (1 = x / x > (20.95,2) = { x / x > 5.99} ,( m 1)( k 1))

} {

P5: Decisin. Como J 0 = 9.7683 > 5.99 J 0 R1 Se rechaza H 0 al nivel de significacin 0.05 P6: Conclusin. Con 95% de confianza alguna diferencia existe en la proporcin de tornillos defectuosos entre las diferentes mquinas.

EJERCICIOS PROPUESTOS:

1. (Aplicacin en Ciencias de Ingeniera) Se desea probar si la distribucin proporcional del rendimiento en una gran compaa variaba segn el coeficiente intelectual de los trabajadores, para lo cual se toma una muestra para cada nivel del CI y se clasifica segn el rendimiento en la compaa en la siguiente tabla. R E N D I M I E N T O COEFICIENTE INTELECTUAL Deficiente Regular Bueno Bajo el promedio 67 64 25 Promedio 42 76 56 Sobre el Promedio 10 23 37 Verifique la hiptesis que la distribucin proporcional del rendimiento en la compaa es el mismo para cada nivel de CI. Use un nivel de significacin de 5% 2. (Aplicacin en Ciencias de Ingeniera) Con el propsito de decidir si la opinin sobre el nivel de las carreras de ingeniera, que tienen los acadmicos y los alumnos, son concordantes, se procede a encuestar a 100 acadmicos y a 200 alumnos, obtenindose los siguientes resultados: Deficiente 36 80 Regular 55 93 Bueno 4 14 Excelente 5 13

Acadmicos Alumnos

Pruebe la hiptesis que la distribucin proporcional de la opinin entre los acadmicos y los alumnos es la misma, usando una significacin de 0.05

3. (Aplicacin en Ciencias de la salud) El Servicio nacional de salud desea verificar si la la distribucin proporcional del estado nutricional de los nios no vara en tres ciudades de la regin, para lo cual toma una muestra de nios de las tres ciudades y los clasifica segn estado nutricional obteniendo la siguiente tabla:
Ciudad Antofagasta Estado nutricional Obeso Sobrepeso Normal Flaco Total 82 93 25 16 216 Calama 70 62 18 15 165 Tocopilla 62 67 21 18 168 Total 214 222 64 49 549

Realice el anlisis estadstico correspondiente destacando las hiptesis que usted deber probar con una significacin de 0.05 y los pasos que ha seguido para lograr su conclusin.