Está en la página 1de 20

TEST Chi-Cuadrado

ASOCIACIN DE VARIABLES
CUALITATIVAS O CATEGRICAS

Carmen M. Cadarso-Surez
eicadar@usc.es

En ocasiones, el investigador est interesado en el estudio de una posible Asociacin entre dos variables categricas A y B

A = { A1 , A2 ,......, Ai ,....., Ar }

B = { B1 , B2 ,......, B j ,....., Bs }

A, presentando r niveles de respuesta, y B con s niveles de respuesta. EJEMPLOS: 1. Asociacin entre Sobrepeso (si,no) e Hipertensin (si,no). 2. Bajo peso del nio al nacer (2500 grs, >2500 grs) y edad de la madre (<40 aos, 40 aos). 3. Tipo de patologa (inflamatoria, neoplasia, traumtica, otras) y tipo de operacin (limpia, potencialmente contaminada, contaminada, sucia). 4. Estado del paciente aquejado de artrosis (peor, igual, mejor) y tipo de tratamiento recibido ( T1, T2)...... En la prctica, contamos con una tabla de contingencia r x s
B B1 A1 A2 A Ai Ar ni1 nr1 n.1 ni2 nr2 n.2 nij nrj n.j nis nrs n.s ni. nr. n n11 n21 B2 n12 n22 Bj n1j n2j Bs n1s n2s n1. n2.

En un estudio de Infecciones post-operatorias, interesa estudiar la asociacin entre patologa y tipo de operacin:
Recuento limpia 142 186 21 526 875 TIPO DE OPERACIN pot_cont contam 352 213 268 39 15 13 118 29 753 294 sucia 347 25 16 43 431

PATOLOGA

inflam neo traum otras

1054 518 65 716 2353

Para una mejor interpretacin, damos los porcentajes por filas o por columnas:
Tabla de contingencia PATOL * TIP_OPER TIP_OPER pot_cont contam 352 213 46.7% 72.4% 268 39 35.6% 13.3% 15 13 2.0% 4.4% 118 29 15.7% 9.9% 753 294 100.0% 100.0%

PATOL

inflam neo traum otras

Total

Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER

limpia 142 16.2% 186 21.3% 21 2.4% 526 60.1% 875 100.0%

sucia 347 80.5% 25 5.8% 16 3.7% 43 10.0% 431 100.0%

Total 1054 44.8% 518 22.0% 65 2.8% 716 30.4% 2353 100.0%

Resultados de una biopsia heptica, se distribuyen por igual en ambos sexos?


Tabla de contingencia SEXO * Biopsia Heptica Biopsia Heptica SEXO mujer hombre Total Recuento % de SEXO Recuento % de SEXO Recuento % de SEXO Esteatosis 3 6.8% 45 32.1% 48 26.1% Fibrosis 3 6.8% 24 17.1% 27 14.7% Hepatitis 23 52.3% 47 33.6% 70 38.0% Cirrosis 15 34.1% 24 17.1% 39 21.2% Total 44 100.0% 140 100.0% 184 100.0%

Fumar durante el embarazo es un factor de riesgo para el bajo peso nio al nacer?
madre fumadora y bajo peso del nio al nacer PESO_N FUMADORA no si Total Recuento % de FUMADORA Recuento % de FUMADORA Recuento % de FUMADORA >=2500 grs 86 74.8% 44 59.5% 130 68.8% <2500 grs 29 25.2% 30 40.5% 59 31.2% Total 115 100.0% 74 100.0% 189 100.0%

CONTRASTE DE ASOCIACIN
Planteamos las siguientes hiptesis de trabajo:

Ho : A y B son INDEPENDIENTES (no asociacin) H1 : A y B son DEPENDIENTES 1. Partimos de un total de n individuos. 2. La tabla de frecuencias OBSERVADAS es: B1 n11 n21 ni1 nr1 n.1 B2 n12 n22 ni2 nr2 n.2 Bj n1j n2j nij nrj n.j Bs n1s n2s nis nrs n.s (asociacin)

A1 A2 Ai Ar

n1. n2. ni. nr. n

3. Bajo la hiptesis nula de NO ASOCIACIN se tendra P(AI Bj )= P(AI ) X P(Bj ) i,j

y entonces la tabla de frecuencias ESPERADAS bajo Ho sera : B1 e11 e21 ei1 er1 n.1 B2 e12 e22 ei2 er2 n.2 Bj e1j e2j eij erj n.j Bs e1s e2s eis ers n.s

A1 A2 Ai Ar

n1. n2. ni. nr. n

donde

eij = ( ni. x n.j )/n

4. Construimos el estadstico distancia entre la tabla de frecuencias observadas y frecuencias esperadas:

(n e ) 2 = 11 11
e11

(n e ) + 12 12
e12

(n e ) + ......... + rs rs
ers

=
i =1 j =1

(n

ij

eij ) eij

2 el cual, bajo la hiptesis nula sigue una distribucin

=
2 i =1 j =1

(n

ij

eij ) eij

(2r 1)( s 1)
12 .

5. Fijar un nivel de significacin ( p.e. , 0.05), y construir el valor crtico

Asumo H0

2 1

6. Regla de decisin: Si Si

2 > 12 2 12

rechazamos H0 y existe asociacin significativa (p-value < ) asumimos H0 (p-value ). El test es no significativo (n.s.)

p-value =p (rechazar H0 con nuestra muestra particular ) =

p ( (2r 1)( s 1) > 2 ) .

Ejemplo: Existe asociacin significativa entre presencia de hepatomegalia y enfermedad heptica (segn resultado de la biopsia)?
Tabla de contingencia hepatomegalia * Biopsia Heptica Biopsia Heptica Esteatosis hepatomegalia no s Total Recuento % de Biopsia Heptica Recuento % de Biopsia Heptica Recuento % de Biopsia Heptica 12 25.0% 36 75.0% 48 100.0% Fibrosis 7 25.9% 20 74.1% 27 100.0% Hepatitis 6 8.6% 64 91.4% 70 100.0% Cirrosis 4 10.3% 35 89.7% 39 100.0% Total 29 15.8% 155 84.2% 184 100.0%

Aplicamos el test chi-cuadrado y la salida del SPSS es la siguiente:


Tabla de contingencia hepatomegalia * Biopsia Heptica Biopsia Heptica hepatomegalia no s Total Recuento Frecuencia esperada Recuento Frecuencia esperada Recuento Frecuencia esperada Esteatosis 12 7.6 36 40.4 48 48.0 Fibrosis 7 4.3 20 22.7 27 27.0 Hepatitis 6 11.0 64 59.0 70 70.0 Cirrosis 4 6.1 35 32.9 39 39.0 Total 29 29.0 155 155.0 184 184.0

Pruebas de chi-cuadrado Sig. asinttica (bilateral) .032

Chi-cuadrado de Pearson N de casos vlidos

Valor 8.803a 184

gl 3

a. 1 casillas (12.5%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 4.3.

=
2 i =1 j =1

(n

ij eij )

eij

(12 7.6 ) =
7.6

( 35 32.9 ) + .......... +
32.9

= 8.803

Fijado =0.05 , el valor crtico es

2 12 = 0.95 = 7.81

p value = 0.032

2 = 8 .8 0 3 2

2 Como el p-value = p ( 3 > 8.803) = 0.032 < 0.05

Existe asociacin significativa entre presencia de hepatomegalia y tipo de enfermedad heptica (p=0.032, o tambin, p<0.05)

Ejemplo (estudio en pacientes VIH/SIDA): Existe asociacin significativa entre la edad del paciente y sus niveles de linfocitos CD4?
Tabla de contingencia CD4_CO * EDAD_CO EDAD_CO CD4_CO <200 200-500 >500 Total Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO <=30 aos 6 13.3% 20 44.4% 19 42.2% 45 100.0% 31-40 aos 30 19.9% 72 47.7% 49 32.5% 151 100.0% >=41 aos 6 15.4% 21 53.8% 12 30.8% 39 100.0% Total 42 17.9% 113 48.1% 80 34.0% 235 100.0%

Pruebas de chi-cuadrado Sig. asinttica (bilateral) .643

Chi-cuadrado de Pearson N de casos vlidos a.


r s

Valor 2.508a 235

gl 4

2 =
i =1 j =1

(n

ij eij )

eij

= 2.508

Fijado =0.05 , el valor crtico es

2 12 = 0.95 = 9.49

p value = 0.643

2 =2.508

12

2 Como el p-value = p ( 4 > 2.508 ) = 0.643 > 0.05

No existe asociacin significativa entre edad del paciente y niveles de linfocitos CD4 (p=0.643, o simplemente, n.s.)

CORRECCIN POR CONTINUIDAD (Yates)

En aquellos casos en que las frecuencias esperadas eij son <5 se recomienda realizar una correccin por continuidad del estadstico

2 =
i =1 j =1

( nij eij )
eij

(2r 1)( s 1)

Correccin de Yates

=
2 c i =1 j =1

(n

ij

eij 0.5 eij

(2r 1)( s 1)

INFEC.SAV Objetivo del estudio:


Identificar los factores pronstico de infeccin post-quirrgica EDAD (aos) SEXO PATOL (Patologa) 1=varn ; 2=mujer 1=inflamatoria; 2=neoplasia;3=trauma; 4=otras.

TIP_OPER (tipo operacin) 1=limpia; 2=potencialente contaminada; 3=contaminada; 4=sucia ALB (albmina) HB (Hemoglobina) HCTO (Hematocrito) LEUCOS (Leucocitos) LINFOPCT (Linfocitos (%)) HEMAT (Hemates) GLUC (Glucosa) OBES (Obesidad) DESNUTR (Desnutricin) DIABETES 1=si ; 2=no. 1=si; 2=no. 1=si; 2=no.

INFEC = Infeccin post-quirrgica

0=no; 1=si

EJEMPLO (infec.sav) Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de operacin (tip_oper)
Analizar... Estadsticos descriptivos...... Tablas de contingencia...... Filas= infec , Columnas= tip_oper Casillas......columna (as tenemos el porcentaje de infeccin por cada tipo de operacin ) Estadsticos.......Chi-cuadrado

Tabla de contingencia INFEC * TIP_OPER TIP_OPER limpia INFEC no si Total Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER 824 94.2% 51 5.8% 875 100.0% pot_cont 607 80.6% 146 19.4% 753 100.0% contam 211 71.8% 83 28.2% 294 100.0% sucia 247 57.3% 184 42.7% 431 100.0% Total 1889 80.3% 464 19.7% 2353 100.0%

Pruebas de chi-cuadrado Sig. asinttica (bilateral) .000 .000 .000

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

Valor 263.828a 268.727 262.198 2353

gl 3 3 1

a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 57.98.

REPRESENTACIN GRFICA
Grficos... Diagramas de barras ..... agrupados.... Eje de categoras infec Filas= infec , Columnas= tip_oper Definir grupos por ........tip_oper

100

80

Porcentaje

60

40

TIP_OPER
limpia

20

pot_cont contam

0 no si

sucia

INFEC

EJEMPLO (infec.sav) Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de patologia (patol):
Tabla de contingencia INFEC * PATOL PATOL inflam INFEC no si Total Recuento % de PATOL Recuento % de PATOL Recuento % de PATOL 829 78.7% 225 21.3% 1054 100.0% neo 379 73.2% 139 26.8% 518 100.0% traum 45 69.2% 20 30.8% 65 100.0% otras 636 88.8% 80 11.2% 716 100.0% Total 1889 80.3% 464 19.7% 2353 100.0%

EJEMPLO (infec.sav) Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y edad del paciente (Nota: Trabajos previos indican que las personas con >=65 aos tienen ms riesgo de infeccin ....) La variable infec es binaria y la edad es contnua. Podemos actuar de dos formas: 1) Utilizar el test de Mann-Whitney:
Informe EDAD INFEC no si Total Media 53.01 61.21 54.63 Desv. tp. 20.039 18.509 20.011 Mnimo 14 15 14 Mximo 97 96 97 N 1887 464 2351

120

100

a Estadsticos de contraste

80

EDAD U de Mann-Whitney 332239.5 2113568 -8.058 .000 a. Variable de agrupacin: INFEC


N= 1887 464

60

W de Wilcoxon Z Sig. asintt. (bilateral)

40

20

EDAD

0 no si

INFEC

con lo que, La infeccin post-quirrgica est significativamente asociada a la edad (p<0.001).

2) Categorizar edad en edad_co: 65 aos, <65aos , Edad_co = 1 si edad 65. Edad_co = 2 si edad <65. y contrastar la posible asociacin entre infec y edad_co con el test
2

.....

Cmo categorizar variables en el SPSS?

Transformar.. Recodificar..... en distintas variables.... Variable numrica edad Variable de resultado edad_co Valores antiguos y nuevos ........ Antiguo nuevo 65 thru Highest 1 Lowest thru 64.9991

Entonces se crea la variable edad_co que el SPSS incorpora automticamente en la base de datos.....

Antes de continuar, podemos ponerle etiquetas (labels) a los valores de edad_co

Vista de variables

Asociacin entre infec y edad_co....

Tabla de contingencia EDAD_CO * INFEC INFEC no EDAD_CO >=65 aos <65 aos Total Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO 651 72.7% 1236 84.9% 1887 80.3% si 245 27.3% 219 15.1% 464 19.7% Total 896 100.0% 1455 100.0% 2351 100.0%

Pruebas de chi-cuadrado Valor Chi-cuadrado de Pearson Correccin por a continuidad N de casos vlidos a. b. 52.892b 52.119 2351 gl 1 1 Sig. asinttica (bilateral) .000 .000

La edad esta significativamente asociada a la infeccin post-quirrgica (p-value<0.001): La presencia de infeccin es de un 27% en pacientes 65 aos, frente a un 15.1% en pacientes <65 aos.

EJEMPLO (infec.sav)

Comprobar si existe asociacin entre Linfocitos% (linfopct) e infeccin postquirrgica (infec), pero considerando la variable Linfopct (que es contnua) como categrica.

1. Categorizamos la variable Linfopct en tres niveles: 1= Normal = 25% linfopct 33% 2=linfocitosis = linfopct > 33% 3=linfocitopenia = linfopct < 25%. creando la variable categrica linf_co.

2. Obtenemos la siguiente tabla de contingencia de infec y linf_co:

Tabla de contingencia INFEC * LINF_CO LINF_CO normal INFEC no si Total Recuento % de LINF_CO Recuento % de LINF_CO Recuento % de LINF_CO 443 88.2% 59 11.8% 502 100.0% linfocitosis 460 90.7% 47 9.3% 507 100.0% linfocitopenia 959 72.9% 356 27.1% 1315 100.0% Total 1862 80.1% 462 19.9% 2324 100.0%

3. Aplicamos el test chi-cuadrado obteniendo un p-value<0.001.

ANLISIS ESTRATIFICADOS En ocasiones dos variables categricas estn (o no ) asociadas. Sin embargo, puede existir una tercera variable , C, que modifica, confunde o interacciona en la relacin entre A y B.
a) RELACIN ENTRE INFECCIN POST-QUIRRGICA Y DIABETES.
Tabla de contingencia DIABETES * INFEC INFEC no DIABETES si no Total Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES 97 68.3% 1792 81.0% 1889 80.3% si 45 31.7% 419 19.0% 464 19.7% Total 142 100.0% 2211 100.0% 2353 100.0%

En la muestra global, existe una asociacin estadsticamente significativa entre diabetes e infeccin post-quirrgica (p<0.001). Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 31.7% y en los no diabticos de un 19%.

b) RELACIN ENTRE INFECCIN POST-QUIRRGICA Y DIABETES, ESTRATIFICADA POR EDAD.

Como ya sabemos la edad_co y la diabetes, por separado, estn significativamente asociadas a la infeccin post-operatoria. En la siguiente tabla podemos comprobar que edad_co y diabetes estn asociadas:
Tabla de contingencia EDAD_CO * DIABETES DIABETES si EDAD_CO >=65 aos <65 aos Total Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO 95 10.6% 47 3.2% 142 6.0% no 801 89.4% 1408 96.8% 2209 94.0% Total 896 100.0% 1455 100.0% 2351 100.0%

p<0.0001

Observamos que la presencia de diabetes es mayor en pacientes 65 aos (10.6%) que en pacientes <65 aos (3.2%). Si eliminamos el efecto de la edad pdemos decir que la diabetes est asociada a la infeccin post-quirrgica?en qu sentido? Respondemos a estas preguntas, estratificando por edades (65, <65) y viendo en cada subgrupo de edades la asociacin entre Infeccin post-quirrgica y diabetes.

ANLISIS ESTRATIFICADOS EN EL SPSS

Analizar... Estadsticos descriptivos...... Tablas de contingencia...... Filas= diabetes , Columnas= infec Casillas......filas (porcentaje de infeccin por diabetes si,no ) Capa 1 de 1=edad_co Estadsticos.......Chi-cuadrado

obteniendo como resultados.......

Tabla de contingencia DIABETES * INFEC * EDAD_CO INFEC EDAD_CO >=65 aos no DIABETES si no Total <65 aos DIABETES si no Total Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES 66 69.5% 585 73.0% 651 72.7% 31 66.0% 1205 85.6% 1236 84.9% si 29 30.5% 216 27.0% 245 27.3% 16 34.0% 203 14.4% 219 15.1% Total 95 100.0% 801 100.0% 896 100.0% 47 100.0% 1408 100.0% 1455 100.0%

Pruebas de chi-cuadrado EDAD_CO >=65 aos Chi-cuadrado de Pearson Correccin por continuidad N de casos vlidos <65 aos Chi-cuadrado de Pearson Correccin por continuidad N de casos vlidos Valor .542 .377 896 13.700 12.208 1455 1 1 .000 .000 gl 1 1 Sig. asinttica (bilateral) .462 .539

1) Para pacientes con 65 aos: No existe asociacin significativa entre diabetes e infeccin post-quirrgica (p=0.539): Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 30.5% y en los no diabticos de un 27%. 2) Para pacientes con <65 aos: La relacin entre diabetes e infeccin post-quirrgica es significativa (p<0.001): Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 34% y en los no diabticos de un 14%.

También podría gustarte