Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Chi Cuadrado
Chi Cuadrado
Revisar
Revisión estadística 8: Datos cualitativos – pruebas de asociación
Viv Bewick1, Liz Cheek1 y Jonathan Ball2
1Profesor titular, Facultad de Informática, Ciencias Matemáticas y de la Información, Universidad de Brighton, Brighton, Reino Unido
2Profesor de Medicina de Cuidados Intensivos, Facultad de Medicina del Hospital St George, Londres, Reino Unido
Resumen
Esta revisión presenta métodos para investigar las relaciones entre dos variables cualitativas (categóricas).
Se describe la prueba de asociación de ÿ2 , junto con las modificaciones necesarias para muestras
pequeñas. También se plantea la prueba de tendencia, en la que al menos una de las variables es ordinal.
Se discute la medición del riesgo. Se describe el cálculo de los intervalos de confianza para proporciones
y las diferencias entre proporciones. Se consideran situaciones en las que se emparejan las muestras.
Palabras clave Prueba de asociación ÿ2 , prueba exacta de Fisher, prueba de McNemar, razón de probabilidades, razón de riesgo, corrección de Yates
tabla 1 Tabla 2
Número de pacientes clasificados por sitio de venosa central Número de pacientes esperados en cada clasificación si hay
cánula y complicación infecciosa no hubo asociación entre el sitio de la cánula venosa central
y complicación infecciosa
Complicación infecciosa
Complicación infecciosa
Bacteriemia/
Sitio de la línea central Ninguna Septicemia en el sitio de salida Total Bacteriemia/
Sitio de la línea central Ninguna Septicemia en el sitio de salida Total
yugular interna 686 152 96 934
yugular interna 714.5 134.1 85.4 934
Subclavia 451 35 38 524
Subclavia 400.8 75.3 47,9 524
Femoral 168 58 22 248
Femoral 189.7 35.6 22.7 248
Total 1305 245 156 1706
Total 1305 245 156 1706
(EO) ÿ
Equipo original
ij ij
ÿÿ= =
ij ij
d = yo
mi yo
yo 1 1 ÿ yo
_ ÿÿ n .j ÿ
mi ÿ1 ÿ
ÿ 1ÿ
ÿ ÿ
yo ÿ ÿ
= –3,3
934 ÿÿ 1
1305 ÿ
Para los datos de la Tabla 1, el estadístico de prueba es: 714.5 1 ÿ
ÿ
ÿ
ÿÿ ÿÿ
ÿ 1706 ÿÿ 1706 ÿ
1.134 + 2.380 + 1.314 + 6.279 + 21.531 +
2,052 + 2,484 + 14,069 + 0,020 = 51,26 La Tabla 4 muestra los residuos estandarizados ajustados para cada
célula. Cuanto mayor sea el valor absoluto del residual, mayor
Comparando este valor con una distribución ÿ2 con la diferencia entre las frecuencias observadas y esperadas, y por lo tanto
(3 – 1) × (3 – 1) = 4 grados de libertad, un valor de P menor que más significativa la asociación
0.001 se obtiene usando un paquete estadístico o entre las dos variables. Sitio subclavio/no infeccioso
refiriéndose a una tabla ÿ2 (como la Tabla 3), en la que 51.26 siendo complicación tiene el residuo más grande, siendo 6.2. Porque es
mayor a 18.47 lleva a la conclusión de que P< 0.001. positivo hay más individuos de los esperados sin
Por lo tanto, existe una probabilidad menor a 0.001 de obtener frecuencias complicaciones infecciosas donde el sitio de la línea central subclavia
como las observadas si no hubiera asociación se utilizó. Como estos residuos siguen una distribución Normal
entre el sitio de la línea venosa central y la complicación infecciosa con media 0 y desviación estándar 1, todos los valores absolutos 47
Machine Translated by Google
Tabla 3 Tabla 4
25 34.38 37.65 44.31 52.62 El valor P exacto para una tabla de dos por dos se puede calcular mediante
considerando todas las tablas con la misma fila y columna
totales como el original pero que son tan o más extremos en sus
salida de la hipótesis nula. En el caso de la Tabla 5,
más de 2 son significativos (ver Revisión estadística 2 [3]). La asociación considere todas las tablas en las que fallecieron tres o menos pacientes
sitio femoral/sin complicación infecciosa también es que recibieron el tratamiento, que figuran en la Tabla 6(i)–(iv). el exacto
significativa, pero debido a que el residual es negativo hay probabilidades de obtener cada una de estas tablas bajo el nulo
menos individuos de los esperados en esta celda. Cuando se utiliza el sitio Las hipótesis de ausencia de asociación o independencia entre el tratamiento
de la vía central subclavia aparecen complicaciones infecciosas y la supervivencia se obtienen de la siguiente manera.
ser menos probable que cuando se usaron los otros dos sitios.
Para calcular la probabilidad de obtener una tabla en particular,
Mesas de dos en dos considerar el número total de tablas posibles con el dado
El uso de la distribución ÿ2 en las pruebas de asociación es una totales marginales, y el número de formas en que podríamos tener
aproximación que depende de las frecuencias esperadas obtuvo las frecuencias de celda particulares en la tabla en cuestión. El
siendo razonablemente grande. Cuando la relación entre dos número de formas en que los totales de fila de 11 y 84 podrían
variables categóricas, cada una con sólo dos categorías, está siendo se han obtenido dados 95 pacientes en total se denota
investigadas, las variaciones en la prueba de asociación ÿ2 a menudo son por 95C11 y es igual a 95!/11!84!, donde 95! ('factorial 95')
calculado así como, o en lugar de, la prueba habitual para es el producto de 95 y todos los enteros menores que el mismo
mejorar la aproximación. La Tabla 5 comprende datos sobre hasta 1. Del mismo modo, el número de formas en que la columna totaliza
pacientes con infarto agudo de miocardio que participaron en un 50 y 45 podría haberse obtenido está dada por
prueba de nitrato intravenoso (ver Revisión de estadísticas 3 [4]). Un total 95C50= 95!/50!45!. Suponiendo independencia, el total
48 de 50 pacientes fueron asignados al azar al tratamiento número de tablas posibles con los totales marginales dados es:
Machine Translated by Google
Tabla 6
Murió 3 8 2 9 1 10 0 11
Sobrevivió 47 37 48 36 49 35 50 34
2
95! 95! (95!)
= Tabla 7
11!84! × 50!45! 11!84!50!45!
Frecuencias ajustadas para la corrección de Yates
El número de formas en que la Tabla 5 (Tabla 6[i]) podría haber sido
obtenido está dado considerando el número de formas en que cada celda Salir Tratamiento Control Total
podría haber surgido la frecuencia. Hay 95C3 formas de obtener
los tres pacientes de la primera celda. Los ocho pacientes de la siguiente Murió 3.5 7.5 11
La célula se puede obtener de 92C8 formas de los 95–3=92 pacientes Sobrevivió 46.5 37.5 84
restantes. Las celdas restantes se pueden obtener en 84C47 y
Total 50 45 95
37C37 (=1) maneras. Por lo tanto, el número de formas de obtener
La Tabla 6(i) bajo la hipótesis nula es:
Para muestras grandes las tres pruebas – ÿ2, Fisher y Yates – Siguiendo las líneas de la prueba del gradiente en regresión,
dan resultados muy similares, pero para muestras más pequeñas prueba de Fisher con algunas modificaciones bastante menores y usando una muestra grande 49
Machine Translated by Google
Tabla 8 Tabla 9
Número de pacientes según AVPU y supervivencia Resultados del estudio realizado por Rivers y colaboradores
Se presentan datos sobre los resultados del estudio realizado por Rivers
y compañeros de trabajo sobre la terapia temprana dirigida por objetivos en la sepsis grave y
aproximaciones, obtenemos un estadístico ÿ2 con 1 grado de choque séptico [6].
libertad dada por [5]:
2
norte
norte
ÿÿÿ
ÿ (xx)(aa)
i
ÿ
i
ÿ
ÿ (xx)
i (aa)
ÿ 2
i
ÿ 2 expuestos al factor de riesgo que desarrollan la enfermedad en comparación
=1
yo con los expuestos al factor de riesgo que no desarrollan el
enfermedad. Esto se ilustra mejor con un ejemplo simple. si una bolsa
Para los datos de la Tabla 8, obtenemos un estadístico de prueba de 19.33 contiene 8 bolas rojas y 2 bolas verdes, entonces la probabilidad
con 1 grado de libertad y un valor de P inferior a 0,001. (riesgo) de sacar una bola roja es 8/10 mientras que las probabilidades de
Por lo tanto, la tendencia es muy significativa. La diferencia sacar una bola roja es 8/2. Como puede verse, la medida
entre el estadístico de prueba ÿ2 para tendencia y el estadístico de prueba ÿ2 de probabilidades, a diferencia del riesgo, no se limita al rango 0-1. En el
en la prueba original es 19.38 – 19.33 = 0.05 con 2 – 1 = 1 estudio realizado por Rivers y colaboradores [6] las probabilidades de
grado de libertad, que proporciona una prueba de la salida muerte con terapia temprana dirigida por objetivos es 38/79 = 0.48, y
de la tendencia. Esta desviación es muy insignificante y sugiere que la asociación en la terapia estándar es 59/60 = 0,98.
entre la supervivencia y la clasificación AVPU puede explicarse casi en su
totalidad por la tendencia. Intervalo de confianza para una proporción
Radio de riesgo
×
ÿ ÿ
2 117 119
enfermedad al haber estado expuesto a un factor de riesgo en comparación
con no haber estado expuesto al factor de riesgo. esta dado por
Por lo tanto, el intervalo de confianza requerido es –0,171 – 1,96 ×
RR = riesgo para los expuestos/riesgo para los no expuestos, y es
0,063 a –0,171 + 1,96 × 0,063; es decir –0,295 a –0,047.
a menudo referido como el riesgo relativo. La interpretación de un riesgo relativo
se describe en la Revisión estadística 6 [7]. por los ríos Por lo tanto, la diferencia entre las proporciones reales es
probable que esté entre –0,295 y –0,047, y el riesgo de
estudiar el riesgo relativo = 0,325/0,496 = 0,66, lo que indica
aquellos en terapia temprana dirigida por objetivos es menor que el riesgo de
que un paciente en la terapia temprana dirigida por objetivos es 34% menos
aquellos en terapia estándar.
probabilidades de morir que un paciente con la terapia estándar.
El cálculo del intervalo de confianza del 95% para el relativo Prueba de hipotesis
El riesgo [8] se cubrirá en una revisión futura, pero puede ser útil También podemos realizar una prueba de hipótesis de la hipótesis nula
interpretarse aquí. Para el estudio Rivers el 95% de confianza que la diferencia entre las proporciones es 0. Esto sigue
El intervalo para el riesgo relativo de la población es de 0,48 a 0,90. líneas similares al cálculo del intervalo de confianza, pero
Porque el intervalo no contiene 1.0 y el extremo superior bajo la hipótesis nula el error estándar de la diferencia
está a continuación, indica que los pacientes en el tratamiento temprano dirigido a objetivos en proporciones viene dada por:
tienen un riesgo significativamente menor de morir en comparación con los que
ÿ
ÿ ÿ
(1p 1p 1 1
+ (1p 2p )2
)1 ÿ
reciben la terapia estándar. = ÿ
pag(1 pag)
ÿ +
ÿ ÿÿ
nº
1n 2 ÿ ÿ
norte
norte
1 2
Razón de probabilidades
A la hora de cuantificar el riesgo de desarrollar una enfermedad, la relación donde p es una estimación agrupada de la proporción obtenida de
de las probabilidades también se puede utilizar como una medida de comparación ambas muestras [5]:
entre los expuestos y los no expuestos a un factor de riesgo. 38 +
59 97
muertes totales en ambas muestras
= = = 0,3856
Viene dado por OR = probabilidades para los expuestos/ probabilidades para
total de tamaños de muestra 117 +119 236
los no expuestos, y se denomina razón de probabilidades. La interpretación
de la razón de probabilidades se describe en la Revisión estadística 3 [4]. Para el Asi que:
2p 1p )
ÿ
- 0.1710
El cálculo del intervalo de confianza del 95% para las cuotas = = –2,71
2p 1 se(p
ÿ
0.0634
ratio [2] también se tratará en una revisión futura pero, al igual que con
riesgo relativo, puede ser útil interpretarlo aquí. por los ríos Comparando este valor con una distribución Normal estándar
ejemplo, el intervalo de confianza del 95% para la razón de probabilidades es da p = 0,007, lo que nuevamente sugiere que hay una diferencia
0,29 a 0,83. Esto puede interpretarse de la misma manera que el entre las dos proporciones de población. De hecho, la prueba
Intervalo de confianza del 95% para el riesgo relativo, lo que indica que descrito es equivalente a la prueba de asociación de ÿ2 en el
aquellos que reciben terapia temprana dirigida por objetivos tienen una reducción mesa de dos por dos. La prueba de ÿ2 da un estadístico de prueba de 7.31,
riesgo de morir. que es igual a (–2.71)2 y tiene el mismo valor P de
0.007. Una vez más, esto sugiere que hay una diferencia entre
Diferencia entre dos proporciones los riesgos para aquellos que reciben terapia temprana dirigida por objetivos y
Intervalo de confianza
aquellos que reciben terapia estándar.
Para el estudio de Rivers, en lugar de examinar la proporción de la
riesgos (el riesgo relativo) podemos obtener un intervalo de confianza Muestras emparejadas
y llevar a cabo una prueba de significación de la diferencia entre Los diseños de pares combinados, como se analiza en la Revisión estadística 5 [9],
los riesgos. La proporción de aquellos en temprana dirigida a objetivos también se puede utilizar cuando el resultado es categórico. Para 51
Machine Translated by Google
ejemplo, cuando se comparan dos pruebas para determinar una determinada Tabla 10
condición, los mismos individuos pueden ser utilizados para cada prueba.
Los resultados de dos pruebas para determinar la presencia de
prueba de McNemar Helicobacter pylori
En esta situación, debido a que la prueba de ÿ2 no tiene en cuenta el emparejamiento Test de respiración
anterior para la prueba de asociación de ÿ2 . El estadístico de prueba es entonces el tamaño total de la muestra debe ser de al menos 30.
dada por:
2 (
antes de Cristo 1
ÿÿ
de asociación [8].
y nuevamente se compara con una distribución ÿ2 con 1 grado de
libertad. Para el ejemplo, la estadística de prueba calculada que incluye la El requisito del tamaño de la muestra a menudo especificado para McNemar's
continuidad correcta es 0.75, lo que da un valor P mayor prueba e intervalo de confianza es que el número de discordantes
de 0,25. los pares deben ser al menos 10 [8].
Al igual que con las proporciones no apareadas, un intervalo de confianza para la Conclusión
se puede calcular la diferencia. Para muestras grandes, la diferencia entre las Se puede utilizar la prueba de asociación ÿ2 y otras pruebas relacionadas
proporciones pareadas se puede aproximar en el análisis de la relación entre variables categóricas. Se debe tener cuidado
a una distribución Normal. La diferencia entre las proporciones se puede calcular para asegurar que el tamaño de la muestra
a partir de los pares discordantes [8], por lo que la es adecuado
la diferencia viene dada por (b – c)/n, donde n es el número total
de pares, y el error estándar de la diferencia por Conflicto de intereses
52 (b + c)0,5/n. Ninguno declarado.
Machine Translated by Google
Referencias
1. Bewick V, Cheek L, Ball J: Revisión estadística 7: Correlación y regresión. Cuidado
crítico 2003, 7: 451-459.
2. Everitt BS: El análisis de las tablas de contingencia, 2ª ed. Londres, Reino Unido:
Chapman & Hall; 1992.
3. Whitley E, Ball J: Revisión de estadísticas 2: muestras y poblaciones.
Cuidado crítico 2002, 6:143-148.
4. Whitley E, Ball J: Revisión de estadísticas 3: prueba de hipótesis y P
valores. Critic Care 2002, 6:222-225.
5. Bland M: Introducción a las estadísticas médicas, 3.ª ed. oxford,
Reino Unido: Oxford University Press; 2001.
6. Rivers E, Nguyen B, Havstad S, Ressler J, Muzzin A, Knoblich B, Peterson E,
Tomlanovich M; Grupo colaborativo de terapia temprana dirigida por objetivos:
Terapia temprana dirigida por objetivos en el tratamiento de la sepsis grave y el
shock séptico. N Engl J Med 2001, 345:1368-1377.
53