Está en la página 1de 16
Capitulo 12 La prueba chi-cuadrado FRECUENCIAS OBSERVADAS Y TEORICAS Como ya st ha visto muchas veces, los resultados obtenidos de muestras no siempre concuerdan cexactamente c6n los resultados te6ricos esperados, segin las reglas de probabilidad. Por ejemplo, aunque cconsideraciones teéricas conduzcan a esperar 30 catas y 30 cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se obtengan exactamente estos resultados. ‘Supéngase que en una determinada muestra se ob- ‘Tabla 12-1 ‘A menudo se desea saber si las frecuencias observadas difieren significativamente de las frecuen- cias esperadas. Para el caso en que solamente son posibles dos sucesos E, y F, (a veces llamado dicotomia © clasificacién dicétoma), como, por ejemplo, caras o cruces, defectuoso 0 00 defectunso, etc., el pro bblema queda resuelto satisfactoriamente con los métodos de los capitulos anteriores. En este capitulo se considera el problema general DEFINICION DE 7? ‘Una medida de la discrepancia existente entre las frecuencias observadas y esperadas es suminis trada por el estadistico z* (Iéase cki-cuadrado), dado por + @cak . $ret a B= N @ Una expresiéa equivalente a (J) es (véase Problema 11) w= at (3) Si z2 = 0, las frecuencias observadas y teSricas coneuerdan exactamente; mientras que si x? > 0, no coinciden exactamente: A valores mayores de 7, mayores son las discrepancias entre las frecuencias observadas y esperadas. La distribucién muesteal de y* se aproxima muy estrechamente a la distribucién chi-cuadrado ¥ = vyoeiete tt = vy ant im) (considerada ya en el Capitulo 11) si las-frecuencias esperadas son al merios iguales a 5, Ja aproxima- cidn mejora para valores superiores. 201 ane me RAR KRHA MMAARHRAAAMA 202 LA PRUEBA CHL-CUADRADO [car 2 EL némero de grados de tibertad v esti dado por (0) =k — | si las frecuencias esperadas pueden calcularse sin tener que estimar pardmetros pobla- cionales con los estadisticos muestrales. Adviértase que el restar I a k es a causa de la condicién restrictiva (2) que denota que si son conocidas k — 1 de las frecuencias esperadas, la frecuencia restante puede ser determinada, () v= k—1~m si las frecuencias esperadas solamente pueden calcularse estimando m patiime- tros de Ia poblacién a partir de los estadisticos muestrales. ENSAYOS DE SIGNIFICACION En Ia practice, las frecuencias esperadas se caleulan de acuerdo con una hipStesis Hp. Si bajo esta hipdtesis cl valor caleulado de 7° dado por (1) 0 (3) es mayor que algin valor critico (tal como ros 0 row Que son los valores criticos a los niveles de signifcacién de 0,05 y 0,01, respectivamente), se de- Guce que las frecuencias observadas difteren significarieamente de las esperadas y se rechaza Hy al nivel de signiicacién correspondiente. En caso contrario, se aceptara o al menos no se rechazara. Este pro- cedimiento se Hama ensayo 0 prueba de chi-cuadrado de la hipétess. Debe advertrse que en aquellascircunstancias en que 2° esté muy préximo a cero debe mirarse con cierto recelo, puesto que es raro que ls Frecuencias abservadas concverden demastado bien con las esperadas. Para examinar tales situaciones, se puede determinar si el valor calculado de y? es menor ve 9s © Zags. en cuyOs cas0s se decide que la concordancia es bastante buena a los niveles de sgaic ficacién de 0,05 a 0,01, respectivamente LA PRUEBA CHI-CUADRADO PARA LA BONDAD DEL AJUSTE La prueba chi-cuadrado puede ser empleada para determinar de qué forma distribuciones teéricas, tales como la normal, binomial, etc., se ajustan a distribuciones empiricas, es decir, aquellas que se ob- tienen de Jos datos muestrales. Véanse Problemas 12 y 13. ‘TABLAS DE CONTINGENCIA La Tabla 12-1, en la que las frecuencias observadas ocupan una sola fila, es una tabla de clasifica- cidn simple. Puesto que el niimero de columnas es k, también se llama tabla J x k (lease «1 por ko»). Ex: tendiendo estas ideas se llega 2 las tablas de clasificacién doble o tablas h x k, en las que las frecuencias observadas-ocupan A filas y & columnas. Tales tablas se llaman a menudo tablas de contingencia, Correspondiéndose con cada frecuencia observada en una tabla de contingencia h x k, hay-una frecuencia teérica 0 esperada que se calcula bajo alguna hipstesis y segin las reglas de probabilidad, Estas ffecuencias que ocupan las casillas de una tabla de contingencia se Haman frecuencias elementa- les. La frecuencia total de cada fila o columna es Ia llamada frecuencia marginal. Para estudiar el acuerdo entre las frecuencias observadas y esperadas, se calcula el estadistico (oi-e)* tears © donde Ia suma se extiende a todas las casillas de Ia tabla de contingenca, los simbolos o,y ¢, representan, respectivamente, las frecuencias observadas y esperadas en la casillaj. Esta suma, que es andloga a (0), contiene hk términos. La suma de todas las frecuencias observadas se denota por Vy es igual a la sua de todas las frecuencias esperadas [comparar con lx Ecuacién (2). car. 1) 1A FRUEBA CHI-CUADRADO 203 Como antes, el estadistico (5) tiene una distribucién muestesl muy estrechamente aproximada a Ta dada por (4), con tal de que las frecuencias esperadas no sean demasiado pequeias. Fl numero de grados de libertad v de esta distribucidn chi-cuadrado est dado para h> 1, k > 1 por (a) v = (h ~ 1k ~ 1) si las frecuencias esperadas pueden caleularse sin tener que estimar paréme- tos poblacionales con los estadisticos muestrales. Para una prueba de esto vease el Problema 18, (8) v= (h = 1)(k — 1) — m si las frecuencias observadas pueden solamente calcularse estimando m parimeiros poblacionales con los estadisticos muestrales. Los ensayos de significacién para tablas A x & son andlogos a los de las tablas 1» k. Las frecuen- cias esperadas son halladas bajo una determinada hipétesis Mo. Una hipdtesis normalmente supuesta cs la de que las dos clasificaciones son independientes entre si ‘Las tablas de contingencia pueden extenderse a un niimero mayor de dimensiones. Asi, por ejem- plo, se pueden tener tablas it x k x J donde estén presentes 3 clasficaciones CORRECCION DE YATES PARA LA CONTINUIDAD Cuando se aplican a datos discretos los resultados para distribuciones continuas deben hacerse ciertas correcciones, como se ha visto en capitulos anteriores. Una correccién andloga es aplicable cuan- do se utiliza la distribucién chi-cuadrado. La correccién consiste en poner (J) conto sigue 1 ore) = Hea =O9% , =e 05 6 se cone fcunamente somo cocci de Yates. Tambiln exe ea motifs anioga de) En general, la correccidn se hace solamente cuando el ntmero de grados de libertad es v = 1. Ea rmuestras grandes se obtienen pricticamente los mismos resultados que la y* no corregia, pero pueden aparecer difcultades en relacién con los valores critcos (véase Problema 8). Para muestras pequeia, donde cada frecuencia esperada se encuentra entre 5 y 10, quiz sea Io mejor comparar los valores de 2 corregido y no corregido. Si ambos valores conducen a la misma conclusién, segin una hip6tesis, tal como rechazarla al nivel de 0,05, raramente se presentan dificultades. Si conducen a conclusiones diferentes, se puede o bien incrementar los tamatios muestrales si esto no es posible, se pueden emplear miétodos de probabilidad exactos, de acuerdo con Ia distribucién multinomial del ‘Capitulo 6. FORMULAS SENCILLAS PARA EL CALCULO DE x Se pueden obtener formulas sencilla para el cdlculo de 7* que se basen Gnicamente en Ins frecuencias ‘observadas. En lo que sigue se dan los resultados para tablas de contingencia 2 x 2 y 2 x 3. Tablas 2 x 2 Nabs- ab)? GF bles + bales + ald +O) m x donde A = a,by — 036), N= ay +05 +: + By Ny = ay + by Na = 02 + ba, Nanay + ay Ny = 6, + by. Véase Problema 19. Con Ia correccién de Yates esto pasa a ser 2 = ——Nilesbs —asby X Gorregida) = bert bast @ Tablas 2 x 3 donde so ha empleado el restado genera, vélido Trane] Par todas Las tablas de coming ae ene reece ea ye ad-wy (20) B bm [om | & | N+ | Véase Problema 43. El resultado (9) puede genera- "ED Ta] ere para tablae 2, donde > 5. (Wee Pro. al biema 48) COEFICIENTE DE CONTINGENCTA Una medida del grado de relacién, asociaci6n 0 dependencia de las clasificaciones en una tabla de contingencia es dada por «ny aque se llama coeficiente de contingencia, A mayor valor de C, mayor es el grado de asociacién. El namero de filas y columnas de Ia tabla de contingencia determina el valor méximo de C, que no es nunca su- perior a uno, Siel ntimero de filas y columnas de una tabla de contingencia es igual a &, el méximo va- lor de C viene dado por /ie ~ IVk, (Véanse Problemas 22, 52 y 53) CORRELACION DE ATRIBUTOS ‘Como las clasificaciones de una tabla de contingencia describen a menudo caracteristicas de indi- viduos 1 objetos, se denotan a veces como atributos y el grado de dependencia, asociacién o relacién se llama correlaciém de atributos. Para tablas k x & se define Viv@=1) como el coeficiente de correlacién entre atributos o clasificaciones. Este coeficiente se encuentra entre Oy 1 (véase Problema 24), Para tablas 2 x 2, en las que k = 2, la correlacién se llama a menudo corre- lacién tetracérica. EI problema general de la correlacién de variables numéricas se considera en el Capitulo 4 PROPIEDAD ADITIVA DE 7 Supéngase que los resultados de experimentos repetidos dan valores muestrales de y* representa dos por 72, 13, 13, --» £91 Yiy Yas Ys; --» grados de libertad, respectivamente. Entonces el resultado de todos estos experimentos puede considerarse equivalente a un y# de valor dado por yi + 13 + 73 + con yy + vat My + s+, grados de libertad, Véase Problema 25. t ! cap. 12) LA PRUEBA CHLCUADRADO 205 Problemas resueltos LA PRUEBA CHI-CUADRADO 1 En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces. Ensayar la hipétesis de que Ja moneda esti bien hecha con un nivel de significacién del (a) 0,05, (b) 0,01 Soluci ‘Las frecvencias de caras y cruces observadas son, respectivamente, 0; = 115, 03 = 85. Las frecuencias de caras y eruces esperadas si la moneda est bien hecha sone, = 100, ey = 100, espsst- ‘vemente, Entonces x 015— 1009 , (@5— 200)" _ + Sate 450 Pussto que el nimero de eategorias o clases (caras, cruces) es k= 2, v= k— Lm 2-121 (@) Bt valor extco z2ys para 1 grado de libertad = 3.84. Entonces, puesio que 4,50 > 3.84, se recaza la hipé tess de que la moneda estd bien hecha al nivel de signiieacién del 005. (6) El valor ertico yes para | grado de libertad ~ 6,63. Entonces, puesto que 4,50 < 6,63, no se rechaza la bipstesis de que le moneda esta bien hechfl al nivel de signifcacion del 001 Se deduce de los resultados observados que som probablemene signficatoos y la moneda no exié probe brlemente Bier fecha, Para una comparacin de este método con los métodos utlzados anteiormente, véase Problema 3. Hacer el Problema 1 utilizando la correccién de Yates. Soluciin: een esl = 0,57 | (ex ~ eal — 0,5) _ (1115 ~ 100} - 0,57 | [85 — 100} ~ 0,5)¢ ea 1 * er 0 0 ass 45 = ar EE = 4205, Puesto que 4,208 > 3,84 y 4,205 < 6,63 se deducen las mismas conclusiones que en el Problema I Para una comparaciéa con fos métodos anteriores, véase Problems 3, Hacer el Problema 1 mediante la aproximacién normal a la distribucién binomial. Soluciin: Bajo la hipétesis de que Ia moneda esté bien hecha, la media y la desviacion tipica del ndmero'de earas és peradas en 200lanzamicntos dela moneda son x = Np = (2000.5) = 100ye = /Npg = V/200K0.5N0.3) * 7.07 fespectivamente. , Primer método: 11S caras en unidades tipiicadas = (115 — 100/07 = 2.12. Con un nivel de signifieacin del 0,05 y un ensayo bilateral, serechaza Ia hipStesis de que la moneda esti bien hecha, si el valor de = estuviese fuera del intervalo ~ 1,96 a 1,96. Con wn nivel de 0,01 el intervalo seria —2,58 2 2,58. Se sigue como en el Problema 1, que la hipétesis se rechaza al nivel de 0.03, pero no al de 0,01 [Notese que el cuadrado del valor anterior, 2,12)? = 4,30, es el mismo valor de, ? obtenido en el Proble- ‘ma 1, Esto se cumple siempre que la prueba de chi-cuadrado comprende dos categorias, Véase Problema 10. Segundo método: Con ia conrecién para la continuidad, 115 0 mis caas equivale a 114,5 0 mas caras. Entonces, 114,5 en uni- ades upifcadas ~ (114,5 ~ 100/7,07 = 2,05, Esto conduce alas mismas conclusiones que por el primer método, Nétese que cuadsado de este valor, 2,057 = 4,20 es igual al valor de x* corregida con la correccién d= ‘Yates para la continuidad del Problema 2. Esto se cumple siempre que la prueba de ch-cuadrado comprende dos categorias y se aplica la correecién de Yates, obey A uv. od 4 ‘La Tin 12d amen It fecanaiasctnecides 3 epoca of nar ax dato 12 ves Et Jar la hipbtas de que el dado ent bien echo t uve Ge sgnifonctn de O(. Frecuencia | 90 | 20 | 20 | 20 20 soci: : x eee = Gham , T= , WS—a0y , A=" , (=29", We—29" Gore amore rieorn te ast ttrany cana ee och os eeoeeiedieal a Lt Bets pm ie Toe pene Part Sites dered rhe = 118 Soro que = 500 > 15, De a sgn qu comcanaia | lontre ambas frecuencias no es tan buena como para no dudar de lo deducio. ‘5. Una tabla de niimeros aleatorios de 250 digitos mostr6 la distribucidn de los digitos 0, 1, 2,...,9 que se-da en la tabla adjunta, iDifiere significativamente la distribucién observada de la distribucién esperada al nivel de 0,01? rccveein Tag | ax | a0 | as | 14 | 20 | 35 | 30 | 20 | 30. Frecuencia | 95 | 25 | 25 | 25 | 25 | 25 | 25 | 25 | 26 | 25 Solin: (St=25" , @o—25 | (s—25 so 25" + MIS ee , Deer, Wot, 4 Wes 233 EL valor ritco de x.y para y= ~ 1 = 9 grados de libertad es 21,7; como 23,3 > 21,7 se deduce quel distribucién observada difiere significativamente de la esperada al nivel de significacién del 0,01. Se deduce que Sake sospechar alguna tendenea no letora en cic tabla de nimers, 6. En los experimentos de Mendel con guisantes, observ 315 lisos y, amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De acuerdo con su teoria, estos nimeros deberian presentarse en la proporcién 9:3:3:1. Hay alguna evidencia que permita dudar de su teoria al nivel de significaci6n del (a) 0,01; (6) 0,05? Solus: El ndmero total de guisantes es 315 + 108 + 101 + 32 = $56. Puesto que los nimeros esperados estan ‘en la proporcion 9:3:3:1 (y 9 +3434 1-= 16) se esperarian “$4586) = 312,75 lisos y amarillos (556) = 10425 rugosos y amarillos 1H556) = 108,25 lisos'y verdes E1556) = 34,75 rugosps y verdes "Spain z= BS = IMDSF | C2 HIP gary Puesto que hay cuatro eategorias; & = 4 y el aimero de grados de litertad es v = 4 7S 1=3 AP. 12] LA PRUEBA CHL-CUADRADO 207 (a) Para y= 3, rBa9 = 113 de modo que no se puede rechazar In teoria al nivel de 0,01 (6) Para = 3, ray = 7.81 de modo que no se puede cechazar Ia teoria al nivel de 0.08, Se deduce, pes, que la teoria y los resultados del experimento estén de acuerdo, [Notese que para} grados de libertad, 7295 = 0,352 y 7? ~ 0,470 > 0,352. De mado que aunque el acuerdo bueno, los resultados obtenidos estén sujeios a una razonable influeneia de error muestra 7. Una uma contiene un gran nimero de bolas de cuatro colores diferentes: rojo, naranja, amarillo y verde. Una muesira de 12 bolas extraida al azar de la urna dio 2 rojas, 5 naranjas, 4 amarillas y | verde. Ensayar la hipstesis de que la urna contenga proporciones iguales de los diferentes colores. Solucén: Bajo 1a hipétesis de que la ura contiene proporcions iguales de los cuatro colores, eabrla esperar 3 bolas de cada clase en la muesira de 12 bolas Pesto que estos mimeros esperados son menores de 5.ta aproximacin de chi-cuadrado seri errénea. Para evitar esto se agrupan las cateorias de modo que los nimeros esperados en cada categoria sea ul menos 5 Si se desea rechaza Ia hipStesis, ¢ agrupan las categorias de forma que Ia evidencia en contra dela hip: tesis se muestre claramente, Esto se consgue en nvestro caso considerand las categoria afoja 0 verde» ¥ «na ‘anja 0 amare, para las que la muestra dio 39 boas, respectivamente, Puesto que el nimero esperado en cada categoria bajo la hipstess-de iguales proporciones es 6, se tiene Gan , Ono eee: x ‘= 3,84. Asino se puede rechazar Ia hipétess al nivel de signifiacion del 0.05, 0). Los resultados observados pueden imaginablemente deberse al azar, aun cue do las proporciones de los colores sean iguales. Otro método: Usilizando Ie correccién de Yates, se tene SY ast ast, nigra ngrait ‘que conduce alas mismas conclusiones anteriores, Esto cabiaesperarse puesto que la correccin de Yates siempre reduce el valor d2 32. ‘Debe ponerse de manifesto que si se emplea la aproximacién de 2" a pesar de que las frecuencias scan dema~ siado pequefas, se obtendria aa, Gao, MoM, We wag Punto que para y= 4 — t= 3, xhyg= 78s gain» Is mitmas concsons que antes Desai: amente a spotnein par ecustas pause pobre, ce ae! gue cuando n set sonable aerpst fen oP inh rk £ ks modo son de promi dl Capitulo © 8 En 360 lanzamientos de un par de dados, se observaron 74 veces «siete» y 24 veces wonce». Ensa- yar Ia hipétesis de que el dado esté bien hecho al nivel de significacién de 0,05 Solvetn: ‘Un par de dads puede caer de 36 formas. «Siete se puede presentar de 6 formas y woncen de 2 formas. Entonces Pests) = fe = £9 P(ooncen) ~ ye = ys Ash, pues, en 360 lanzamientoscabria esperar $1360) 60 veces set y #360) = 20 vss woncer, de modo que (r4—eoy , 24-20)" . Cr) = 407 Para y= 2—1= 1, roy = 384, Entonces, puesto que 407 > 3,84 se estariainctinado a rechazat la hi- pétesis de que los dados esten bien, Sin embargo, empleando la correccin de Yates, s¢ tiene Fe os? _ 035? |, 8.57 | 1 (corregida) + = BF SOF 3565, De acuerdo, pues, con la x? corregida, no se rechazaria la hipdtsis al nivel de 0.05. 208 LA PRUEBA CHL-CUADRADO fear. 12 En general, para grandes muesras tales como las de aqui, los resultados que se obtienenutilizando la corres cidn de Yates son mas dignos de coafianza que lo resultados no corregidos. Sin embargo, puesto que inciso el valor corregido de 7! se encuentra ce:ea del valor eric, se éuda acerca de la decisn que se debe tomar. En tales casos, lo mejor quid sea incrementar el tamao mucstral haciendo mds observaciones si se est interesado dde una manera especial por alguna razéa en el nivel de 0,05, De otro modo, se rechazaria ta hipdtesis a agin ‘otro nivel (al como 0,10) si esto es satisfactori. 9. Una encuesta sobre 320 familias con 5 nifios dio la distribucién que aparece en la Tabla 12-3. (Es el resultado consistente con la hipétesis de que el nacimiento de varén y hembra son igualmente probables? Ton 23 | Namero de] Smitor | 4 nitor | 3 nitos 1 sito] d nites = 2 Dor gadts | Onaes | TR | 2 Bist ithe | 5 hie | Tt Nine = | emesis] se eu eee ire aay } = Soa: LL Sea p = probabildad de necimient de varén, y g~ 1 — p = probabildad de nacimiento de hembra En- | = sna pats ado acy ei, kon dts pores enn oa sean | [ Io binomial = aeere gt ag? a + a = BP Sahat 10a? + 104" + Sut + Si pm and, w Gene PS nosy 0 nits) = = (2 ios y 3 alas) = 108)°4) = 48 PIG nifos y 1 nifa) = 54) PIL nfo y 4 nibas) = Sb) = (3 nosy 2 nias} = 10d) 4) = $$ P(Onifos y 5 nitas) = )? = sh Entonces ef nlmero de familias que se espera tengan 5, 4, 3. 2,1 yO nifos se obtiene multplicando las rs pectivas probebidades anteriores por 320, y los resultados son 10, $0, 100, 100,50, 10. De aqui af = GS=1OF , 5— SO , M10— 100" , B= 200}, HO— 50)", (2—20* _ 49g | 70 0 700 700 50 10 Pucsto que xdys = 11 y xdyg = 15,1, para v = 6 ~ 1 = 5 grados de libertad, se rechazard Ia hipdtesis al nivel de sigiicaciin del 0,05, oro no al 0,01. Asi se dedace que los resultados son probablemente significa: tivos, y el macimiento de varén y hembra no son probablemente iguale. ‘ 10. Mostrar que una prucba en chi-cusdrado que comprende dos categorias es equivalente al ensayo especial de significacién para proporciones de a pagina 170, Capitulo 10, Solin ‘Si P es la proporcién muesteal para la ca- rr - a a tego pea propor poblaconaly Nes ia ary = frecuencia total, se pueden describir las situa- = Sones Ee ae, a Giones por medio de la adjnt Frawacla penta | Np | NG=9) = Na |W Entonces, por definicién, = bi eae : We- mF , NO-F) ~ N(l—p)]* ecient cece eRICEaE me=p) , MP—p apy(het) = M@xat 2 apt pe eee nated eat (erie) 7 av ‘que 65 el cuadrado del estadistico z de la pizina 170 : M. (a) Demostrar que la férmula (1), pigina 201, puede escribirse x* 7 (6) Usitizar et resultado de (a) para comprobar el valor de 1 calculado en el Problema 6. ‘CAP. 12) LA PRUEBA CHI-CUADRADO 209 Solu: (2) Por defnicion, 2 = BF ~ s56~ 0,870, C) ¥ a BONDAD DE AJUSTE 2 42, Utilizar la prueba chi-cuadrado para determinar la bondad de ajuste de los datos del Problema 31 del Capitulo 7, Solueiin: 8 = 33.2)" , (144 — 161,97" | G42 ~ 3162) | 87 ~ 308,77 | 6A — 150.7) 25 — 29.47 32 1619 3162 Bar eT =184. Pesto que el mero de parimetos wtiados pa estimar las fecuecis expeadas es m = 1 (Que es el parimeto p de ta dstribucén binomial, v= k= I~ m= 6—1—1=4 Para ¥~ 4, Bgs = 989. De aqui qe el juste de Ios dator sea bueno, Para y = A/gdse = Oj]. As, puesto ue 754 > O71, juste noes tan bus como pudira eres. 13, Determinar la bondad de ajuste de los datos dei Problema 33 del Capitulo 7. sob: 2 = AAD, US 20687 | 2 — 38927, G72 B= 7490 gory ed 413 20,68 38.92 277 743 Puesto qu el nimero de pardmetiosempleidos en estima las feevencas espera es = 2 gue som tn din 3 ln deviacin tien de a dsibueisn normal, y= k= = mm S12 = 2 Para 7 = 2, zon = 599. Se deduce que el ajuste de los datos es muy bueno. Para y = 2, zhos ~ 0,103. Entonces, puesto que z2 = 0,959 > 0,103, el ajuste no es wdemasiado bueno». TABLAS DE CONTINGENCIA 14, Hacer el Problema 20, Capitulo 10 utilizando la prueba chi-cuadrado. Solucién: Las condiciones del problema se presentan en la Tabla 12-42), Bajo la hipétsis nula Hp de que el suero no tiene efecto, abria esperar que 70 individuos de cada uno de los grupos se recuperase y 30 en cada grupo no se recupernse, como se indica en la Tabla 12-4(b). Adviértase que H es equivalene a afrmar que la recuperacién 5 tndependionte del empleo del euero, et decir, las clasieaciones son independents, ‘Tabla 12-42) Frecuencias observadas Tabla 12-42) Frecuenclas esperadas bajo Ho Total Total “Grape A ‘Grape A (otieands el sero) a8) (vtisando ester) 10 | crow ‘Giaps (co uitizando 300 (va tans 100 ‘sue ‘sue Total 200 Total 200 4 SS— TOP , 25= a0} = 20 70 Ey : 210 LA PRUEBA CHI-CUADRADO [car 2 ara determinat el ndmero de grados de libertad, con- Tabla 125 sidérese la Tabla 12-5, que es igual a las dos dadas an- teriormente, pero en la que solamente se han puesto ls to- tales Eat claro que slaraent se tiene libertad para colocar tun aumero en una de las cuatro casllas vacas, puesto que | Grape A 100) una vez hecho esto los ndmeros de las restantescasllas vie- | ~Gropo B 109) ‘nen obligados por los totals ya indicados. De modo que aaa aan hay un grado de libertad wo método: Por la formule (vase Problems 18), y= Gk ~ 1k — 1) = @~1)2= 1) = 1 Pesto que 7d ny = 384 para I grado de ibertad y puesto que 2 = 2,38 < 3,84, se deduce que los reu sados no zon signfcaivs al nivel de 0,0. Nose ext ashen condiciones de vechszar Fi a ext ively s Jed. Ge 0 que el sero nos efectvo 0s deja sin tomar devisibn en espera de posterores enayos Notee que 1" = 2.38 es lcuadrado del valor de 2 ~ 1,34, obtenido en el Problema 20 del Capitulo 10 {Em general, a prutbachieuadrado en olaci con proporsiones muestas de una tabla de cootigenca 2 2 equivale un ensayo de tignfiacion de diferencias e proporciones mediante Ia aproximacign normal, como fn la pigina 171 del Capitlo 10 (vase Problema 20) Nts también que un ensayo unilateral utilzando y? equiva a un ensayo bilateral uizando x, ya que por eemplo, x" > rye eortesponte a lf > Zoys) © [-< —Yoss) Pues que para tablas 2 = 2, 7* cc eva Srado dal vor de, sigue que e310 misma que = en este caso. ASL, pues, ef rechazat una hipétess a vel 4: 0.05 utiizando x! equivale a rechazatexta hiptesiscon un ensayo unilateral y al nivel de 0,10 utiizendo = 15. Hacer el problema anterior aplicando la correccién de Yates. Solu + orregida) = W792 TO1= O37 , 65 ~ 70] — 07 , (5 — 30] 0.57 | (35 — 30] - 057 bia ail 0 SaearrreceE Ey Samy Veneeereat te Obteniéndose que las conchsiones del problema anterior son también vilidas aqui. Esto podria haberse visto répidamente, Ja que la correccién de Yates siempre dismiauye el valor de x2 16. En la Tabla 12-6, se indican los estudiantes apro- hu weds a bados y suspendidos por 3 profesores: Sr. X, Sr. ¥ y Sr. Z. Ensayar la hipétesis de que las Sex] Sev | SZ] Total proporciones de estudiantes suspendidos por los 7} tues profesores son iguales Souci a jo Ia hipstesis Hy de que las proporciones d¢ [aaa [as Ta] er Teo estudiantes suspendidos por los tres profesores son las trismas, babrian euspendido 27/180 = 15 % de los estux Aiantes y babrian aprobado el 85 7 de los estudiantes, En este caso, el Sr. X, por ejemplo, habria suspendido e115 5 de 55 estudiantes y habria aprobado el 85 % de $5 estudiantes. Las frecuenciasesperadas bajo My se mues~ tran en la Tabla 12-7, ‘Tabla 12-7 Frecueucias esperadas bajo Ho wy ae asiss 7 ae 35 598 Para determinar el nimero de grados'de libertad, considérese la Tabla 12-8, que es igual qu la Tabla 127, pero en la que solamente se han puesto los totales. Est claro que como cada fila y cada columna han de cum- Plircon les totale, solamente se eth en bertad de poner al azar un numero en una de la calla dela primera Columna y otro en una de las casas de la segunda otecera columea, después de lo cual, todos los nimeros res- tantes vienen obligados por los totales. Asi, pues, hay en este easo dos grados de libertad cap, 12) LA PRUEBA CHI-CUADRADO 2 17. 18. 9. Owe método: Por la Formula, ¥= (k= KE 1) = @ = DB ~ 1) =2. Puesto que zéys ~ 599, no se pucderecNrar al nivel ee 0.5, Notese, sin embargo, que puesto que w.go = 461, se puede rechazar He al nivel de 0,10 si seestédispuesto a eorrer el riesgo de estar equivocado | vez decade 10, Con la férmula (9), pagina 204, calcular el valor de 7? para el problema anterior. Solucién: Setiene ay = 50, as 183, No = bit bet be 1, Ni = as tbs + Neb Ns = 180, Entonces oy), 220 fir «| * ar [5s ‘Mostrar que para una tabla de contingencia hx kel niimero de grados de libertad es (h — 1) * (k= 1), donde b> 1, k> 1 Soluctén: En una taba con h us yk columns, ee puede dejar un solo nirmero de eda flay columns, de forma que tales nmeros puedan ser filet ealesiada, al conocer ls totes de cada fla y cada columns, De ello se sigue que se tiene libertad de colocar (h — 1) — 1) nomeros en la tbla, Ls otros quedan automiticarente ‘eterminados de una forma Unica. As el aero de grade deIbertad ex (} Ik ~ 1). Notese que ete re sultado es valide con tal de que sean conocidas los pardmetros poblacionales necesarios para obtener la fre ccuencias esperadas. |= 280 = 480 6 (2) Demostrar que para la tabla de contingencia 2 x 2 que se muestra en la Tabla 12-9(a), a = Nlabs—axbit : NiNaNaNe (6) Aplicar el resultado de (a) a los datos del Problema 14 Tabla 12.9(2)_ Resultados observados Tabla 12.9(6) Resultados experados 1 nm | Total 1 1 | Tout a = e Na a | MNWN | ma | We B eras ieee ™ B | maw | men | ve Tot | Ms ™ w Tou | ™ N Solocion: ‘Como en el Problema 14, los resultados experados bajo a hipétess mula aperecen en la Tabla 12:9().Entonees 4 (X= MNAINY 4 (b= NaNalNY (be = Nadal NNN cm (ut b)leta) _ aibe—abs athens hs w Pero MN ast Andlogamente (2x son tambien igual a ( Asi, se puede escribi Neidio Ny wud MWA ai—aboy , CORY + xml 2 = Mavts— abs! NaN ‘que, al simplificar, da VIVIVIIVIIIIIIIIIIS car. 12) LA PRUEBA CHL-CUADRADO. 213 CORRELACION DE ATRIBUTOS 23. Hallar el coeficiente de correlacin para ta tabla del Problema 14 (a) sin y (b) con la correccién de Yates Solucins (a) Puesto que y? = 2.38, N= 200 y k = 2, se tiene r= yf 238 (2) Peto ue 4 = 238, Wm D0 y km 2.26 tener = Yep = yFEE oon, qe indica moy Doce eorelacibn cai la recupericiény el so del sui (0) Del Problema 15, r (corregida) = ./1,93/200 = 0,0582. 24, Demosirar que cl cocfciente de corrlacién de tablas de contingeicia, como se define en la Eeua- cién (12), pagina 204, se encuentra entre 0 y 1. Solucin: oe Por ef Problema $3, el miximo valor de /FTG7# Mi es JE=Tik, Entonces see st ag sens Perera vine od Bk DGEE MD), byt shyt aR x5 kN, win = eee Neamt Nana ** Puesto que 7° 2 0. r 2 0, Entonces, 0 3. (6), pagina 205, 5 Demostear Ia fem 48. Por similitud con ls idcas desarolladas para tablas de contingencia h x k, discutir las tablas de contingencia hs ke J, sBalando las posible apligaciones que pueden tener. COEFICIENTE DE CONTINGENCIA Color det peo ‘Tabla 1220 49. La Tabla 1220 muestra Ja telacién entre el color det pelo Rubio | No ratio y los ojos de una muestra de 200 estudiantes. (a) Halla el coset de comings sin conta conecén de Yates. [ames [a8 s (8) Comparar el resultado de (a) con el corficiente maximo | ¥ e contingencia Es] No amie | 20 96 Resp. (a) 0,3863, 0,3779 (con la correctién de Yates), 50, Halla el cocfciene de contingencia sin y con la correccin de Yates para Tos datos de (a) Problema 36 y (6) Pro- blema 38. Resp. (a) 0,2205, 0,1985 (corregido). (b)0,0872, 0,0738 (cortegido). SI, Hallar el coeficiente de contingencia para los datos del Problema 41. Resp. 0,651. 52, Demostrar que el coeficiente de contingencia maximo para una tabla 3x 328 /F = 0,8165 aproximadament, 153. Demostrar que el coeficiente de contingencia miximo para una tabla kx kes E> IVR. CORRELACION DE ATRIBUTOS ‘ S4, Hallar el cosficente de correlacién para los datos de la tabla del Problema 49. ‘Resp. () 04188, 04082 con la correccin de Yates 55, Halla ef cosfciente de corrlacin para los datos de las tablas (a) del Problema 36 y (t) del Problema 38 sin y con Ta corteccién de Yates. Resp. (a) 0,2261, 0,2026 (corregido). () 0,0875, 0,0740 (corregido). ‘56, Hallas el coeficiente de correlacién entre las notas de matemdticas y fisiea del Problema 41, Resp. 03115, 57. SiCes el coedciente de contingencia para una tabla k x k y r es el correspondiente coeficiente de cortelacion, demostrar que r= Ci = CED PROPIEDAD ADITIVA DE ‘58, Para ensayar una hipétesis Ho, s repite un experimento cinco veces. Los valores resultantes con 4 grados de lier. tad cada uno fueron 8,3, 9,1, 89, 78 y 86, respectivamente, Mostrar que mientras que Hy no puede rechazarse al nivel de 0,05 en ninguna de las repeticiones por separado, puede ser rechazada al nivel de 0,005 al agrupar las repeticiones,

También podría gustarte