Está en la página 1de 5

TEMAS SELECTOS

Los usos de la chi cuadrada (ji cuadrado, 2, chi-square) Estadstica


Dr. Sergio Sobrino Cosso Servicio de Endoscopia, Instituto Nacional de Cancerologa Correspondencias: Dr. Sergio Sobrino Cosso. Av. San Fernando nm. 22, col. Seccin XVI, C.P. 14080, Tlalpan D.F. Mxico. Tel. (55) 5628 0400 ext. 179. E-mail: ssobrinocossio@prodigy.net.mx

Ejemplo clnico

La asociacin entre reflujo gastroesofgico diurno y nocturno con la exposicin esofgica al cido en 24 h fue evaluada en 59 pacientes con pirosis 4 veces a la semana en los ltimos 6 meses. (Tabla 1.) El ejemplo trata de relacionar la asociacin entre estas dos variables nominales, cualitativas categricas: 1. presencia de reflujo gastroesofgico nocturno o diurno y 2. acidez esofgica en 24 h. La 2 es una estadstica frecuentemente usada para comparar proporciones en la literatura mdica. Los datos nominales (categricos) obtenidos de una muestra con n observaciones independientes son ordenados en una tabla de renglones y columnas. En cada celda se coloca el nmero de unidades en estudio observadas en esa combinacin de categoras de las dos variables. El ordenamiento se conoce como tabla de frecuencias o Tabla 1. Frecuencias observadas: reflujo gastroesofgico (diurno o nocturno) y acidez esofgica (24 h)* de contingencia. Por tanto, una tabla de conObservaciones en dos grupos independientes tingencia con dos renTabla de 2 X 2 glones y dos columnas Acidez esdofgica (24 h) Reflujo diurno Reflujo nocturno Frecuencia marginal dar lugar a cuatro cel22 37 Mayor 15 das y a su vez originar 12 22 Menor 10 las frecuencias margi34 59 Frecuencia marginal 25 nales (ver tabla 1). Tablas bidireccionales En las tablas bidireccio*Los datos fueron tomados del resumen del AJG y los usaremos para el ejercicio de esta prueba estadstica.

nales, la hiptesis de inters se relaciona con las variables que estamos estudiando. Con esta prueba tratamos de someter a prueba si existe independencia o relacin entre las variables (criterio de independencia). Los datos se miden en escala nominal y se conoce como criterio de clasificacin. Es importante que la categora o clase sea mutuamente excluyente por ejemplo, tiene reflujo gastroesofgico nocturno o no lo tiene. Por otra parte, la prueba de igualdad u homogeneidad de las proporciones para observaciones independientes requiere de dos o ms muestras obtenidas de dos o ms poblaciones. Entonces, la prueba de independencia difiere de la de homogeneidad en cuanto a: 1. Hiptesis examinada. 2. Nmero de poblacin muestreada. 3. Nmero de criterios sobre el que las observaciones son clasificadas despus del muestreo 4. Las conclusiones derivadas del anlisis de datos. La distribucin de frecuencias (tabla de 2 X 2 ) se origina de las frecuencias observadas entre renglones y columnas (celdas 1,1, 1,2, 2,1 y 2,2), obtenindose frecuencias marginales (nmero de observaciones en cada columna y en cada rengln). (Tabla 2.)

98

Los usos de la chi cuadrada (ji cuadrado, 2, chi-square)

es un valor seleccionado en las pruebas de hiptesis; generalmente usamos Reflujo diurno 24 h Reflujo nocturno 0.05, 0.01 y 0.001. Celda 1,1 Mayor Celda 1,2 Frecuencia marginal Grados de libertad (GL) = (nmero de Celda 2,1 Menor Celda 2,2 Frecuencia marginal columnas 1) (nm. de renglones 1). Frecuencia marginal Frecuencia marginal Total Zona crtica (2 crit) = 3.84 se obtiene de la relacin entre GL y valor de p (tablas para distribucin 2). Objetivo del ejemplo clnico Ejemplos: Medir la relacin entre reflujo gastroesofgico nocturno y Para un valor de 0.05 y 1 GL es 3.84. acidez esofgica de 24 h 4 veces a la semana en pacientes Para un valor de 0.10 y 1 GL es 2.7. con pirosis en los ltimos 6 meses. Para un valor de 0.05 y 2 GL es 5.99. El valor crtico es la cantidad que una prueba estadsti1. Desarrollo de la hiptesis cientfica ca debe exceder para rechazar la H0 de que no hay rela Existe relacin entre reflujo gastroesofgico nocturno y cin. (Grfica 1.) la acidez esofgica de 24 h en pacientes con pirosis 4 veces a la semana en los ltimos 6 meses. 4. Anlisis de datos La tabla 3 muestra las frecuencias observadas en el ejem2. Formulacin de la hiptesis estadstica: se parte de plo y las frecuencias marginales. que la prueba de independencia es unidireccional Nula (H0): no existe relacin entre reflujo gastroesofgico Grfica 1. Distribucin 2 con 1 GL, 2 = 0.05 nocturno y acidez esofgica de 24 h en pacientes con pirosis 4 veces a la semana en los ltimos 6 meses (s existe relacin). Alterna (H1): s existe relacin entre reflujo gastroesofgico nocturno y acidez esofgica de 24 h en pacientes con Frecuencia pirosis 4 veces a la semana en los ltimos 6 meses (s relativa existe relacin). rea de rechazo 0.05 Tabla 2. Distribucin de frecuencias 3. Determinar las reglas de decisiones Dado que se trata de dos grupos independientes con variables nominales emplearemos la distribucin y esta2crtica = 3.84 2 dstica . Nivel de significacin: es la Tabla 3. Frecuencias observadas y marginales probabilidad de obtener un resultado tan extremo o ms Reflujo gastroesofgico diurno Reflujo nocturno Marginal Acidez esofgica extremo que el observado si (24 h y 22:00 a 08:00 h) 22 15 37 H0 es verdadera. Existe el riesa Mayor b a+b go de rechazar incorrecta12 Menor 10 22 mente la H0 cuando es verc Marginal d c+d dadera (error tipo 1 o alfa). 34 25 59 Usaremos una 2 = 0.05, que a+c b+d a+b+c+d

99

Sobrino Cosso S

La estadstica 2 es:
Columna

J = 1Fila i = 1(0 ij E ij)2 , 1 GL (columna-1) (fila-1) E ij

El paso siguiente es multiplicar los valores marginales para obtener la frecuencia esperada; tenemos cuatro valores marginales: 37, 22, 34 y 25 y un total que es 59. Procedemos a calcular las frecuencias esperadas: multiplicando los valores marginales y dividindolos entre el nmero total de observaciones (n = 59). En la tabla 4 se ejemplifica cmo se obtienen las frecuencias esperadas. Celda 1,1 = E1,1 = (37) (34) = 21.32 (59) Celda 1,2 = E1,2 = (37) (25) = 15.67 (59) Celda 2,1 = E2,1 = (22) (34) = 12.67 (59) Celda 2,2 = E2,2 = (22) (25) = 9.32 (59) La tabla 5 muestra las frecuencias esperadas. Si los valores esperados son grandes continuamos con chi cuadrada:

Todas las frecuencias esperadas deben ser 2. No ms de 20% de las celdas deben tener frecuencias esperadas < 5. En caso de no cumplirse, debemos realizar la prueba exacta de Fisher o la correccin de Yates para reducir la discrepancia entre la estadstica chi cuadrada calculada y la distribucin terica. Prueba exacta de Fisher Es la probabilidad exacta de la ocurrencia de secuencias observadas, dada la premisa de independencia y el tamao de las frecuencias marginales, se calcula como una tabla de 2 X 2. p = (a + b)! (c + d)! (a + c)! + (b + d) = 37 22 34 25 a!b!c!d!n! 22 ! 15 ! 12 ! 10 ! 59 ! Frmula simplificada: n (ad-bc)2 (a + c) (b + d) (a + b) (c + d)

La H0 es que las frecuencias observadas extremas podran ocurrir por casualidad; por tanto, deben calcularse las frecuencias ms extremas y estas probabilidades se agregan a la probabilidad del conjunto observado (probabilidad marginal y Tabla 4. Cmo obtener frecuencias esperadas condicional). Reflujo diurno a c 34 Reflujo nocturno b d 25 Marginal 37 22 59 Correccin de continuidad de Yates Requiere restar 0.50 del valor total absoluto de la diferencia entre las frecuencias observadas y esperadas antes de elevarlo al cuadrado. 2 = Columna J = 1 Fila i = 1 (0 ij E ij- 0.50)2 E ij Prueba de McNemar Se usa para variables nominales y proporciones pareadas donde se analizan discordancias y probar el resultado de la relacin.

Acidez esofgica (24 h y 22:00 a 08:00 h) Mayor Menor Marginal

Tabla 5. Frecuencias esperadas Acidez esofgica (24 h y 22:00 a 08:00 h) Reflujo diurno Reflujo nocturno 21.32 Mayor 15.67 12.67 Menor 9.32

100

Los usos de la chi cuadrada (ji cuadrado, 2, chi-square)

Diagnstico de cncer TAC-3D + endoscopia virtual gstrico irresecable Positivo Negativo Ultrasonido 18 8 positivo endoscpico 1 27 negativo

el valor esperado de cada celda. Obtendremos un valor 2 = 0.43 como resultado de la suma de la celda 1,1 (0.02) + celda 1,2 (0.02), celda 2,1 (0.35) y celda 2,2 (0.04).

Ejemplo: 2= (b - c - 1 ) 2 = 62 = 4.00 b+c 9 En el ejemplo: 2 calculada = 4.00 < 2 crtica 3.84 que permite rechazar la H0. Bondad de ajuste Se usa cuando la interrogante es si un grupo observado de mediciones sigue una distribucin terica de cierta clase. Para esto se divide la distribucin en varios intervalos y con base en el tamao de la muestra se determina el nmero de observaciones que debern fallar en cada intervalo. 2 = (k - 1) = (0-E)2 Ahora determinaremos (0 ij - E ij)2 para cada celda E ij Celda 1,1 = E 1,1 = (22 - 21.32)2 (21.32) Celda 1,2 = E 1,2 = (15 - 15.67)2 (15.67) Celda 2,1 = E 2,1 = (12 - 12.67)2 (12.67) Celda 2,2 = E 2,2 = (10 - 9.32)2 (9.32) Recordemos las frecuencias Observadas: celda 1,1 (22), celda 1,2 (15), celda 2,1 (12) y celda 2,2 (10). Esperadas: celda 1,1 (21.32), celda 1,2 (15.67), celda 2,1 (12.67) y celda 2,2 (9.32). Restamos en cada celda: valor observado del valor esperado. Elevamos al cuadrado. Dividimos el numerador entre

5. Evaluacin de la estadstica El valor crtico se obtiene de acuerdo con las tablas de distribucin 2 que para 1 GL, unidireccional o una cola, 2 = 0.05 es de 3.84. Nuestro resultado es: 2 calculada = 0.43 < 2crtica3.84 que no permite rechazar la H0. 6. Interpretacin y estadstica No existe relacin entre reflujo gastroesofgico nocturno y acidez esofgica de 24 h en pacientes con pirosis 4 veces a la semana en los ltimos 6 meses (2calculada = 0.43, < 2crtica 3.84, 1 GL, 2 = 0.05).

Conclusiones
La chi cuadrada permite al investigador comprobar una hiptesis acerca de una relacin entre dos medidas nominales. La lgica 2 es la siguiente: el nmero total de observaciones en cada columna (puede ser de tratamiento o control) y el nmero total de observaciones en cada rengln (positivo o negativo) son considerados dados o fijados y se conoce como frecuencia marginal. Si nosotros asumimos que columnas y renglones son independientes, podemos calcular el nmero de observaciones esperadas que ocurran al azar y se conoce como frecuencia esperada. Este tipo de estadstica compara la frecuencia observada y la esperada de cada celda despus de multiplicar columnas y renglones para encontrar si existe o no una relacin. Existen abusos de esta prueba estadstica como su empleo en grupos independientes cuyas variables son numricas, para lo cual debiera usarse la t de student y no convertir los valores numricos a valores ordinales o nominales. Un ejemplo frecuente es usar puntos de corte arbitrariamente como la edad de 45 o 60 aos cuando los datos numricos con la estadstica correspondiente nos brindan ms informacin.

101

Sobrino Cosso S

Lecturas recomendadas: Dawson B, Trapp RG. Chapter 6. Research Questions About Two Separate or Independent Groups. In Basic and Clinical Biostatistics. Lange Medical Books/McGraw-Hill. Fourth Ed 2004:134-161. Elston RC, Jonson W. D. Cap. 8 Los numerosos usos de la chi cuadrada. En Principios de Bioestadstica. Editorial El Manual Moderno. Mxico 1990: 145-171. Essex-Sorlie D. Chapter 15 Testing Hypotheses about frequencies and proporcions. In Medical Biostatistics and

Epidemiology. Appleton and Lange. First Edition 1995: 227-46 Gardner JD, M.D, Sloan S, Robinson M, Miner PB Jr, GERD Subjects with Increased Nocturnal Esophageal Acidity Have Increased Nocturnal Gastric Acidity. Am J Gastroenterol 2005;100 (Suppl.): S24. (Abstract.) Namakforoosh M. Cap. 12 prueba de Hiptesis. En Metodologa de la Investigacin. Editorial LIMUSA. Mxico 1999: 332-63.

102

También podría gustarte