Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ASOCIACIN DE VARIABLES
CUALITATIVAS O CATEGRICAS
Carmen M. Cadarso-Surez
eicadar@usc.es
En ocasiones, el investigador est interesado en el estudio de una posible Asociacin entre dos variables categricas A y B
A = { A1 , A2 ,......, Ai ,....., Ar }
B = { B1 , B2 ,......, B j ,....., Bs }
A, presentando r niveles de respuesta, y B con s niveles de respuesta. EJEMPLOS: 1. Asociacin entre Sobrepeso (si,no) e Hipertensin (si,no). 2. Bajo peso del nio al nacer (2500 grs, >2500 grs) y edad de la madre (<40 aos, 40 aos). 3. Tipo de patologa (inflamatoria, neoplasia, traumtica, otras) y tipo de operacin (limpia, potencialmente contaminada, contaminada, sucia). 4. Estado del paciente aquejado de artrosis (peor, igual, mejor) y tipo de tratamiento recibido ( T1, T2)...... En la prctica, contamos con una tabla de contingencia r x s
B B1 A1 A2 A Ai Ar ni1 nr1 n.1 ni2 nr2 n.2 nij nrj n.j nis nrs n.s ni. nr. n n11 n21 B2 n12 n22 Bj n1j n2j Bs n1s n2s n1. n2.
En un estudio de Infecciones post-operatorias, interesa estudiar la asociacin entre patologa y tipo de operacin:
Recuento limpia 142 186 21 526 875 TIPO DE OPERACIN pot_cont contam 352 213 268 39 15 13 118 29 753 294 sucia 347 25 16 43 431
PATOLOGA
Para una mejor interpretacin, damos los porcentajes por filas o por columnas:
Tabla de contingencia PATOL * TIP_OPER TIP_OPER pot_cont contam 352 213 46.7% 72.4% 268 39 35.6% 13.3% 15 13 2.0% 4.4% 118 29 15.7% 9.9% 753 294 100.0% 100.0%
PATOL
Total
Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER
limpia 142 16.2% 186 21.3% 21 2.4% 526 60.1% 875 100.0%
Total 1054 44.8% 518 22.0% 65 2.8% 716 30.4% 2353 100.0%
Fumar durante el embarazo es un factor de riesgo para el bajo peso nio al nacer?
madre fumadora y bajo peso del nio al nacer PESO_N FUMADORA no si Total Recuento % de FUMADORA Recuento % de FUMADORA Recuento % de FUMADORA >=2500 grs 86 74.8% 44 59.5% 130 68.8% <2500 grs 29 25.2% 30 40.5% 59 31.2% Total 115 100.0% 74 100.0% 189 100.0%
CONTRASTE DE ASOCIACIN
Planteamos las siguientes hiptesis de trabajo:
Ho : A y B son INDEPENDIENTES (no asociacin) H1 : A y B son DEPENDIENTES 1. Partimos de un total de n individuos. 2. La tabla de frecuencias OBSERVADAS es: B1 n11 n21 ni1 nr1 n.1 B2 n12 n22 ni2 nr2 n.2 Bj n1j n2j nij nrj n.j Bs n1s n2s nis nrs n.s (asociacin)
A1 A2 Ai Ar
y entonces la tabla de frecuencias ESPERADAS bajo Ho sera : B1 e11 e21 ei1 er1 n.1 B2 e12 e22 ei2 er2 n.2 Bj e1j e2j eij erj n.j Bs e1s e2s eis ers n.s
A1 A2 Ai Ar
donde
(n e ) 2 = 11 11
e11
(n e ) + 12 12
e12
(n e ) + ......... + rs rs
ers
=
i =1 j =1
(n
ij
eij ) eij
=
2 i =1 j =1
(n
ij
eij ) eij
(2r 1)( s 1)
12 .
Asumo H0
2 1
6. Regla de decisin: Si Si
2 > 12 2 12
rechazamos H0 y existe asociacin significativa (p-value < ) asumimos H0 (p-value ). El test es no significativo (n.s.)
Ejemplo: Existe asociacin significativa entre presencia de hepatomegalia y enfermedad heptica (segn resultado de la biopsia)?
Tabla de contingencia hepatomegalia * Biopsia Heptica Biopsia Heptica Esteatosis hepatomegalia no s Total Recuento % de Biopsia Heptica Recuento % de Biopsia Heptica Recuento % de Biopsia Heptica 12 25.0% 36 75.0% 48 100.0% Fibrosis 7 25.9% 20 74.1% 27 100.0% Hepatitis 6 8.6% 64 91.4% 70 100.0% Cirrosis 4 10.3% 35 89.7% 39 100.0% Total 29 15.8% 155 84.2% 184 100.0%
gl 3
a. 1 casillas (12.5%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 4.3.
=
2 i =1 j =1
(n
ij eij )
eij
(12 7.6 ) =
7.6
( 35 32.9 ) + .......... +
32.9
= 8.803
2 12 = 0.95 = 7.81
p value = 0.032
2 = 8 .8 0 3 2
Existe asociacin significativa entre presencia de hepatomegalia y tipo de enfermedad heptica (p=0.032, o tambin, p<0.05)
Ejemplo (estudio en pacientes VIH/SIDA): Existe asociacin significativa entre la edad del paciente y sus niveles de linfocitos CD4?
Tabla de contingencia CD4_CO * EDAD_CO EDAD_CO CD4_CO <200 200-500 >500 Total Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO <=30 aos 6 13.3% 20 44.4% 19 42.2% 45 100.0% 31-40 aos 30 19.9% 72 47.7% 49 32.5% 151 100.0% >=41 aos 6 15.4% 21 53.8% 12 30.8% 39 100.0% Total 42 17.9% 113 48.1% 80 34.0% 235 100.0%
gl 4
2 =
i =1 j =1
(n
ij eij )
eij
= 2.508
2 12 = 0.95 = 9.49
p value = 0.643
2 =2.508
12
No existe asociacin significativa entre edad del paciente y niveles de linfocitos CD4 (p=0.643, o simplemente, n.s.)
En aquellos casos en que las frecuencias esperadas eij son <5 se recomienda realizar una correccin por continuidad del estadstico
2 =
i =1 j =1
( nij eij )
eij
(2r 1)( s 1)
Correccin de Yates
=
2 c i =1 j =1
(n
ij
(2r 1)( s 1)
TIP_OPER (tipo operacin) 1=limpia; 2=potencialente contaminada; 3=contaminada; 4=sucia ALB (albmina) HB (Hemoglobina) HCTO (Hematocrito) LEUCOS (Leucocitos) LINFOPCT (Linfocitos (%)) HEMAT (Hemates) GLUC (Glucosa) OBES (Obesidad) DESNUTR (Desnutricin) DIABETES 1=si ; 2=no. 1=si; 2=no. 1=si; 2=no.
0=no; 1=si
EJEMPLO (infec.sav) Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de operacin (tip_oper)
Analizar... Estadsticos descriptivos...... Tablas de contingencia...... Filas= infec , Columnas= tip_oper Casillas......columna (as tenemos el porcentaje de infeccin por cada tipo de operacin ) Estadsticos.......Chi-cuadrado
Tabla de contingencia INFEC * TIP_OPER TIP_OPER limpia INFEC no si Total Recuento % de TIP_OPER Recuento % de TIP_OPER Recuento % de TIP_OPER 824 94.2% 51 5.8% 875 100.0% pot_cont 607 80.6% 146 19.4% 753 100.0% contam 211 71.8% 83 28.2% 294 100.0% sucia 247 57.3% 184 42.7% 431 100.0% Total 1889 80.3% 464 19.7% 2353 100.0%
Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos
gl 3 3 1
a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 57.98.
REPRESENTACIN GRFICA
Grficos... Diagramas de barras ..... agrupados.... Eje de categoras infec Filas= infec , Columnas= tip_oper Definir grupos por ........tip_oper
100
80
Porcentaje
60
40
TIP_OPER
limpia
20
pot_cont contam
0 no si
sucia
INFEC
EJEMPLO (infec.sav) Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de patologia (patol):
Tabla de contingencia INFEC * PATOL PATOL inflam INFEC no si Total Recuento % de PATOL Recuento % de PATOL Recuento % de PATOL 829 78.7% 225 21.3% 1054 100.0% neo 379 73.2% 139 26.8% 518 100.0% traum 45 69.2% 20 30.8% 65 100.0% otras 636 88.8% 80 11.2% 716 100.0% Total 1889 80.3% 464 19.7% 2353 100.0%
EJEMPLO (infec.sav) Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y edad del paciente (Nota: Trabajos previos indican que las personas con >=65 aos tienen ms riesgo de infeccin ....) La variable infec es binaria y la edad es contnua. Podemos actuar de dos formas: 1) Utilizar el test de Mann-Whitney:
Informe EDAD INFEC no si Total Media 53.01 61.21 54.63 Desv. tp. 20.039 18.509 20.011 Mnimo 14 15 14 Mximo 97 96 97 N 1887 464 2351
120
100
a Estadsticos de contraste
80
60
40
20
EDAD
0 no si
INFEC
2) Categorizar edad en edad_co: 65 aos, <65aos , Edad_co = 1 si edad 65. Edad_co = 2 si edad <65. y contrastar la posible asociacin entre infec y edad_co con el test
2
.....
Transformar.. Recodificar..... en distintas variables.... Variable numrica edad Variable de resultado edad_co Valores antiguos y nuevos ........ Antiguo nuevo 65 thru Highest 1 Lowest thru 64.9991
Entonces se crea la variable edad_co que el SPSS incorpora automticamente en la base de datos.....
Vista de variables
Tabla de contingencia EDAD_CO * INFEC INFEC no EDAD_CO >=65 aos <65 aos Total Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO 651 72.7% 1236 84.9% 1887 80.3% si 245 27.3% 219 15.1% 464 19.7% Total 896 100.0% 1455 100.0% 2351 100.0%
Pruebas de chi-cuadrado Valor Chi-cuadrado de Pearson Correccin por a continuidad N de casos vlidos a. b. 52.892b 52.119 2351 gl 1 1 Sig. asinttica (bilateral) .000 .000
La edad esta significativamente asociada a la infeccin post-quirrgica (p-value<0.001): La presencia de infeccin es de un 27% en pacientes 65 aos, frente a un 15.1% en pacientes <65 aos.
EJEMPLO (infec.sav)
Comprobar si existe asociacin entre Linfocitos% (linfopct) e infeccin postquirrgica (infec), pero considerando la variable Linfopct (que es contnua) como categrica.
1. Categorizamos la variable Linfopct en tres niveles: 1= Normal = 25% linfopct 33% 2=linfocitosis = linfopct > 33% 3=linfocitopenia = linfopct < 25%. creando la variable categrica linf_co.
Tabla de contingencia INFEC * LINF_CO LINF_CO normal INFEC no si Total Recuento % de LINF_CO Recuento % de LINF_CO Recuento % de LINF_CO 443 88.2% 59 11.8% 502 100.0% linfocitosis 460 90.7% 47 9.3% 507 100.0% linfocitopenia 959 72.9% 356 27.1% 1315 100.0% Total 1862 80.1% 462 19.9% 2324 100.0%
ANLISIS ESTRATIFICADOS En ocasiones dos variables categricas estn (o no ) asociadas. Sin embargo, puede existir una tercera variable , C, que modifica, confunde o interacciona en la relacin entre A y B.
a) RELACIN ENTRE INFECCIN POST-QUIRRGICA Y DIABETES.
Tabla de contingencia DIABETES * INFEC INFEC no DIABETES si no Total Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES 97 68.3% 1792 81.0% 1889 80.3% si 45 31.7% 419 19.0% 464 19.7% Total 142 100.0% 2211 100.0% 2353 100.0%
En la muestra global, existe una asociacin estadsticamente significativa entre diabetes e infeccin post-quirrgica (p<0.001). Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 31.7% y en los no diabticos de un 19%.
Como ya sabemos la edad_co y la diabetes, por separado, estn significativamente asociadas a la infeccin post-operatoria. En la siguiente tabla podemos comprobar que edad_co y diabetes estn asociadas:
Tabla de contingencia EDAD_CO * DIABETES DIABETES si EDAD_CO >=65 aos <65 aos Total Recuento % de EDAD_CO Recuento % de EDAD_CO Recuento % de EDAD_CO 95 10.6% 47 3.2% 142 6.0% no 801 89.4% 1408 96.8% 2209 94.0% Total 896 100.0% 1455 100.0% 2351 100.0%
p<0.0001
Observamos que la presencia de diabetes es mayor en pacientes 65 aos (10.6%) que en pacientes <65 aos (3.2%). Si eliminamos el efecto de la edad pdemos decir que la diabetes est asociada a la infeccin post-quirrgica?en qu sentido? Respondemos a estas preguntas, estratificando por edades (65, <65) y viendo en cada subgrupo de edades la asociacin entre Infeccin post-quirrgica y diabetes.
Analizar... Estadsticos descriptivos...... Tablas de contingencia...... Filas= diabetes , Columnas= infec Casillas......filas (porcentaje de infeccin por diabetes si,no ) Capa 1 de 1=edad_co Estadsticos.......Chi-cuadrado
Tabla de contingencia DIABETES * INFEC * EDAD_CO INFEC EDAD_CO >=65 aos no DIABETES si no Total <65 aos DIABETES si no Total Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES Recuento % de DIABETES 66 69.5% 585 73.0% 651 72.7% 31 66.0% 1205 85.6% 1236 84.9% si 29 30.5% 216 27.0% 245 27.3% 16 34.0% 203 14.4% 219 15.1% Total 95 100.0% 801 100.0% 896 100.0% 47 100.0% 1408 100.0% 1455 100.0%
Pruebas de chi-cuadrado EDAD_CO >=65 aos Chi-cuadrado de Pearson Correccin por continuidad N de casos vlidos <65 aos Chi-cuadrado de Pearson Correccin por continuidad N de casos vlidos Valor .542 .377 896 13.700 12.208 1455 1 1 .000 .000 gl 1 1 Sig. asinttica (bilateral) .462 .539
1) Para pacientes con 65 aos: No existe asociacin significativa entre diabetes e infeccin post-quirrgica (p=0.539): Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 30.5% y en los no diabticos de un 27%. 2) Para pacientes con <65 aos: La relacin entre diabetes e infeccin post-quirrgica es significativa (p<0.001): Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 34% y en los no diabticos de un 14%.