Está en la página 1de 8

Machine Translated by Google

Critical Care Febrero 2004 Vol 8 No 1 Bewick et al.

Revisar
Revisión estadística 8: Datos cualitativos – pruebas de asociación
Viv Bewick1, Liz Cheek1 y Jonathan Ball2

1Profesor titular, Facultad de Informática, Ciencias Matemáticas y de la Información, Universidad de Brighton, Brighton, Reino Unido
2Profesor de Medicina de Cuidados Intensivos, Facultad de Medicina del Hospital St George, Londres, Reino Unido

Correspondencia: Viv Bewick, v.bewick@brighton.ac.uk

Publicado en línea: 30 de diciembre de Cuidado crítico 2004, 8:46-53 (DOI 10.1186/cc2428)


2003 Este artículo está en línea en http://ccforum.com/content/
8/1/46 © 2004 BioMed Central Ltd (ISSN impreso 1364-8535; ISSN en línea 1466-609X)

Resumen
Esta revisión presenta métodos para investigar las relaciones entre dos variables cualitativas (categóricas).
Se describe la prueba de asociación de ÿ2 , junto con las modificaciones necesarias para muestras
pequeñas. También se plantea la prueba de tendencia, en la que al menos una de las variables es ordinal.
Se discute la medición del riesgo. Se describe el cálculo de los intervalos de confianza para proporciones
y las diferencias entre proporciones. Se consideran situaciones en las que se emparejan las muestras.

Palabras clave Prueba de asociación ÿ2 , prueba exacta de Fisher, prueba de McNemar, razón de probabilidades, razón de riesgo, corrección de Yates

Introducción prueba de asociación ÿ2


En las revisiones estadísticas anteriores, la mayoría de los Para probar si existe una asociación entre dos variables categóricas,
procedimientos discutidos son apropiados para mediciones cuantitativas. calculamos el número de individuos que obtendríamos en cada celda
Sin embargo, los datos cualitativos o categóricos se recopilan con de la tabla de contingencia si las proporciones en cada categoría de
frecuencia en las investigaciones médicas. Por ejemplo, las variables una variable permanecieran iguales independientemente de las
evaluadas pueden incluir sexo, grupo sanguíneo, clasificación de la categorías de la otra. variable. Estos valores son las frecuencias que
enfermedad o si el paciente sobrevivió. Las variables categóricas esperaríamos bajo la hipótesis nula de que no existe asociación
también pueden comprender variables cuantitativas agrupadas; por entre las variables, y se denominan frecuencias esperadas. Para los
ejemplo, la edad podría agruparse en 'menores de 20 años', '20 a 50 datos de la Tabla 1, las proporciones de pacientes en la muestra con
años' y 'mayores de 50 años'. Algunas variables categóricas pueden cánulas ubicadas en las venas yugular interna, subclavia y femoral
ser ordinales, es decir, los datos que surgen se pueden ordenar. El son 934/1706, 524/1706, 248/1706, respectivamente. Hay 1305
grupo de edad es un ejemplo de una variable categórica ordinal. pacientes sin complicaciones infecciosas. Entonces, la frecuencia
que esperaríamos en la categoría del sitio yugular interno es 1305 ×
Cuando se utilizan variables categóricas en una investigación, los (934/1706) = 714.5. De manera similar, para los sitios subclavio y
datos se pueden resumir en forma de frecuencias o recuentos de femoral esperaríamos frecuencias de 1305 × (524/1706) = 400,8 y
pacientes en cada categoría. Si estamos interesados en la relación 1305 × (248/1706) = 189,7.
entre dos variables, entonces las frecuencias se pueden presentar
en una tabla de contingencia o de doble entrada. Por ejemplo, la
Tabla 1 comprende el número de pacientes en una clasificación Repetimos estos cálculos para los pacientes con infecciones en el
bidireccional según el sitio de la cánula venosa central y las sitio de salida y con bacteriemia/septicemia para obtener lo siguiente:
complicaciones infecciosas. El interés aquí es si existe alguna
relación o asociación entre el sitio de canulación y la incidencia de
complicaciones infecciosas. La pregunta también podría formularse Sitio de salida: 245 × (934/1706) =
en términos de proporciones, por ejemplo, si las proporciones de 134,1, 245 × (524/1706) = 75,3, 245 × 248/1706 = 35,6
pacientes en los tres grupos determinados por el sitio de la cánula
venosa central difieren según el tipo de complicación infecciosa. Bacteriemia/septicemia: 156 × (934/1706) = 85,4, 156 ×
(524/1706) = 47,9, 156 × (248/1706) = 22,7

46 AVPU: A = alerta, V = respuesta de voz, P = respuesta al dolor y U = no respuesta


Machine Translated by Google

Disponible en línea http://ccforum.com/content/8/1/46

tabla 1 Tabla 2

Número de pacientes clasificados por sitio de venosa central Número de pacientes esperados en cada clasificación si hay
cánula y complicación infecciosa no hubo asociación entre el sitio de la cánula venosa central
y complicación infecciosa
Complicación infecciosa
Complicación infecciosa
Bacteriemia/
Sitio de la línea central Ninguna Septicemia en el sitio de salida Total Bacteriemia/
Sitio de la línea central Ninguna Septicemia en el sitio de salida Total
yugular interna 686 152 96 934
yugular interna 714.5 134.1 85.4 934
Subclavia 451 35 38 524
Subclavia 400.8 75.3 47,9 524
Femoral 168 58 22 248
Femoral 189.7 35.6 22.7 248
Total 1305 245 156 1706
Total 1305 245 156 1706

Obtenemos así una tabla de frecuencias esperadas (Tabla 2).


Tenga en cuenta que 1305 × (934/1706) es lo mismo que ción Esto sugiere que existe una asociación entre el sitio
934 × (1305/8766), por lo que igualmente podríamos haber redactado de línea venosa central y complicación infecciosa.
el argumento en términos de proporciones de pacientes en cada uno de
Derechos residuales de autor
las categorías de complicaciones infecciosas permanecen constantes
para cada sitio de línea central. En cada caso, el cálculo está condicionado La prueba de ÿ2 indica si existe una asociación entre
al tamaño de los totales de fila y columna y al dos variables categóricas. Sin embargo, a diferencia de la correlación
tamaño total de la muestra. coeficiente entre dos variables cuantitativas (ver Estadísticas
revisión 7 [1]), en sí mismo no da una indicación de la
La prueba de asociación consiste en calcular las diferencias fuerza de la asociación. Para describir la asociación más completamente,
entre las frecuencias observadas y esperadas. Si las diferencias son es necesario identificar las celdas que tienen
grandes, entonces esto sugiere que existe una asociación entre una variable grandes diferencias entre las frecuencias observadas y esperadas. Estas
y la otra. la diferencia por diferencias se conocen como residuos, y
cada celda de la tabla se escala de acuerdo con la frecuencia esperada en pueden estandarizarse y ajustarse para seguir una distribución Normal con
la celda. La estadística de prueba calculada para una tabla con media 0 y desviación estándar 1 [2]. los
r filas y c columnas viene dada por: los residuos estandarizados ajustados, dij, vienen dados por:
r C 2 ÿ

(EO) ÿ
Equipo original
ij ij
ÿÿ= =
ij ij
d = yo
mi yo
yo 1 1 ÿ yo
_ ÿÿ n .j ÿ
mi ÿ1 ÿ

ÿ 1ÿ
ÿ ÿ

yo ÿ ÿ

donde Oij es la frecuencia observada y Eij es la esperada ÿ norte


ÿÿ norte
ÿ
frecuencia en la celda de la fila i y la columna j. Si la hipótesis nula de no donde ni. es la frecuencia total de la fila i, nj es la frecuencia total de la
asociación es verdadera, entonces el estadístico de prueba calculado columna j y N es la frecuencia total general. En
sigue aproximadamente una distribución ÿ2 con (r – 1) × (c – 1) el ejemplo, el residual estandarizado ajustado para aquellos
grados de libertad (donde r es el número de filas y c el con cánulas situadas en la yugular interna y sin infecciones
número de columnas). Esta aproximación se puede utilizar para complicaciones se calcula como:
obtener un valor de P.
686 714.5ÿ

= –3,3
934 ÿÿ 1
1305 ÿ
Para los datos de la Tabla 1, el estadístico de prueba es: 714.5 1 ÿ
ÿ
ÿ

ÿÿ ÿÿ

ÿ 1706 ÿÿ 1706 ÿ
1.134 + 2.380 + 1.314 + 6.279 + 21.531 +
2,052 + 2,484 + 14,069 + 0,020 = 51,26 La Tabla 4 muestra los residuos estandarizados ajustados para cada
célula. Cuanto mayor sea el valor absoluto del residual, mayor
Comparando este valor con una distribución ÿ2 con la diferencia entre las frecuencias observadas y esperadas, y por lo tanto
(3 – 1) × (3 – 1) = 4 grados de libertad, un valor de P menor que más significativa la asociación
0.001 se obtiene usando un paquete estadístico o entre las dos variables. Sitio subclavio/no infeccioso
refiriéndose a una tabla ÿ2 (como la Tabla 3), en la que 51.26 siendo complicación tiene el residuo más grande, siendo 6.2. Porque es
mayor a 18.47 lleva a la conclusión de que P< 0.001. positivo hay más individuos de los esperados sin
Por lo tanto, existe una probabilidad menor a 0.001 de obtener frecuencias complicaciones infecciosas donde el sitio de la línea central subclavia
como las observadas si no hubiera asociación se utilizó. Como estos residuos siguen una distribución Normal
entre el sitio de la línea venosa central y la complicación infecciosa con media 0 y desviación estándar 1, todos los valores absolutos 47
Machine Translated by Google

Critical Care Febrero 2004 Vol 8 No 1 Bewick et al.

Tabla 3 Tabla 4

Puntos porcentuales de la distribución ÿ2 producidos en un Los residuos estandarizados ajustados


hoja de cálculo
Complicación infecciosa
Valores de ÿ2 para las probabilidades (P)
Bacteriemia/
Grados Sitio de la línea central Ninguna Salir del sitio septicemia
de libertad 0.1 0.05 0.01 0.001
yugular interna –3.3 2.5 1.8
1 2.71 3.84 6.63 10.83
Subclavia 6.2 –6.0 –1.8
2 4.61 5.99 9.21 13.82
Femoral –3.5 4.4 –0.2
3 6.25 7.81 11.34 16.27

4 7.78 9.49 13.28 18.47

5 9.24 11.07 15.09 20.52 Tabla 5

6 10.64 12.59 16.81 22.46


Datos sobre pacientes con infarto agudo de miocardio que tomaron
7 12.02 14.07 18.48 24.32 parte en un ensayo de nitrato intravenoso

8 13.36 15.51 20.09 26.12 Salir Tratamiento Control Total

9 14.68 16.92 21.67 27.88


Murió 3 8 11
10 15.99 18.31 23.21 29.59
Sobrevivió 47 37 84
11 17.28 19.68 24.72 31.26
Total 50 45 95
12 18.55 21.03 26.22 32.91

13 19.81 22.36 27.69 34.53

14 21.06 23.68 29.14 36.12

15 22.31 25.00 30.58 37.70 grupo y 45 al grupo control. La tabla muestra el


número de pacientes que murieron y sobrevivieron en cada grupo.
dieciséis 23.54 26.30 32.00 39.25
La prueba de ÿ2 da un estadístico de prueba de 3.209 con 1 grado de
17 24.77 27.59 33.41 40.79
libertad y un valor de P de 0,073. Esto sugiere que no hay
18 25,99 28.87 34.81 42.31 evidencia suficiente para indicar una asociación entre el tratamiento y la
supervivencia.
19 27.20 30.14 36.19 43.82

20 28.41 31.41 37.57 45.31 Prueba exacta de Fisher

25 34.38 37.65 44.31 52.62 El valor P exacto para una tabla de dos por dos se puede calcular mediante
considerando todas las tablas con la misma fila y columna
totales como el original pero que son tan o más extremos en sus
salida de la hipótesis nula. En el caso de la Tabla 5,
más de 2 son significativos (ver Revisión estadística 2 [3]). La asociación considere todas las tablas en las que fallecieron tres o menos pacientes
sitio femoral/sin complicación infecciosa también es que recibieron el tratamiento, que figuran en la Tabla 6(i)–(iv). el exacto
significativa, pero debido a que el residual es negativo hay probabilidades de obtener cada una de estas tablas bajo el nulo
menos individuos de los esperados en esta celda. Cuando se utiliza el sitio Las hipótesis de ausencia de asociación o independencia entre el tratamiento
de la vía central subclavia aparecen complicaciones infecciosas y la supervivencia se obtienen de la siguiente manera.

ser menos probable que cuando se usaron los otros dos sitios.
Para calcular la probabilidad de obtener una tabla en particular,
Mesas de dos en dos considerar el número total de tablas posibles con el dado
El uso de la distribución ÿ2 en las pruebas de asociación es una totales marginales, y el número de formas en que podríamos tener
aproximación que depende de las frecuencias esperadas obtuvo las frecuencias de celda particulares en la tabla en cuestión. El
siendo razonablemente grande. Cuando la relación entre dos número de formas en que los totales de fila de 11 y 84 podrían
variables categóricas, cada una con sólo dos categorías, está siendo se han obtenido dados 95 pacientes en total se denota
investigadas, las variaciones en la prueba de asociación ÿ2 a menudo son por 95C11 y es igual a 95!/11!84!, donde 95! ('factorial 95')
calculado así como, o en lugar de, la prueba habitual para es el producto de 95 y todos los enteros menores que el mismo
mejorar la aproximación. La Tabla 5 comprende datos sobre hasta 1. Del mismo modo, el número de formas en que la columna totaliza
pacientes con infarto agudo de miocardio que participaron en un 50 y 45 podría haberse obtenido está dada por
prueba de nitrato intravenoso (ver Revisión de estadísticas 3 [4]). Un total 95C50= 95!/50!45!. Suponiendo independencia, el total
48 de 50 pacientes fueron asignados al azar al tratamiento número de tablas posibles con los totales marginales dados es:
Machine Translated by Google

Disponible en línea http://ccforum.com/content/8/1/46

Tabla 6

Tablas con los mismos totales de fila y columna que la Tabla 5

(i) (ii) (iii) (iv)

Salir Control de tratamiento Control de tratamiento Control de tratamiento Control de tratamiento

Murió 3 8 2 9 1 10 0 11

Sobrevivió 47 37 48 36 49 35 50 34

2
95! 95! (95!)
= Tabla 7
11!84! × 50!45! 11!84!50!45!
Frecuencias ajustadas para la corrección de Yates
El número de formas en que la Tabla 5 (Tabla 6[i]) podría haber sido
obtenido está dado considerando el número de formas en que cada celda Salir Tratamiento Control Total
podría haber surgido la frecuencia. Hay 95C3 formas de obtener
los tres pacientes de la primera celda. Los ocho pacientes de la siguiente Murió 3.5 7.5 11

La célula se puede obtener de 92C8 formas de los 95–3=92 pacientes Sobrevivió 46.5 37.5 84
restantes. Las celdas restantes se pueden obtener en 84C47 y
Total 50 45 95
37C37 (=1) maneras. Por lo tanto, el número de formas de obtener
La Tabla 6(i) bajo la hipótesis nula es:

95! 92! 84! 95!


95C3×92C8×84C47×1= ×××= 1 y la corrección de Yates dan resultados más conservadores que la
3!92! 8!84! 47!37! 3!8!47!37!
prueba de ÿ2 ; es decir, los valores de P son más grandes y es menos probable que
Por lo tanto, la probabilidad de obtener la Tabla 6(i) es: para concluir que existe una asociación entre las variables. Existe cierta

2 controversia sobre qué método es


95! (95!) 11!84!50!45!
= preferible para muestras más pequeñas, pero Bland [5] recomienda
÷ 3!8!47!37! 11!84!50!45! 95!3!8!47!37! el uso de la prueba de Fisher o Yates para una evaluación más cautelosa
Por tanto, la probabilidad total de obtener las cuatro tablas Acercarse.
dado en la Tabla 6 es:
Prueba de tendencia
11!84!50!45! 11!84!50!45! 11!84!50!45! 11!84!50!45!
+++ La Tabla 8 comprende el número de pacientes en una clasificación
95!3!8!47!37! 95!2!9!48!36! 95!1!10!49!35! 95!0!11!50!34!
bidireccional según la clasificación AVPU (voz y dolor).
= 0,0541 + 0,0139 + 0,0020 + 0,0001 = 0,070 categorías de respuesta combinadas) y la subsiguiente supervivencia o
muerte de 1306 pacientes que asistieron a un accidente y emergencia
Esta probabilidad generalmente se duplica para dar un valor de P bilateral unidad. (AVPU es un sistema para evaluar el nivel de conciencia:
de 0.140. Hay una discrepancia bastante grande en este caso. A = alerta, V = respuesta de voz, P = respuesta al dolor y
entre la prueba de ÿ2 y la prueba exacta de Fisher. U = no responde.) La prueba de asociación ÿ2 da un estadístico de prueba
de 19.38 con 2 grados de libertad y un valor P de
Corrección de continuidad de Yates menos de 0,001, lo que sugiere que existe una asociación
Al usar la distribución ÿ2 en la prueba de asociación, se usa una distribución entre supervivencia y clasificación AVPU.
de probabilidad continua para aproximar las probabilidades discretas. Una
corrección, atribuible a Yates, puede ser Debido a que las categorías de AVPU tienen un ordenamiento natural, es
aplicado a las frecuencias para hacer la prueba más cercana a la apropiado preguntar si hay una tendencia en la proporción
prueba exacta. Para aplicar la corrección de continuidad de Yates, muriendo por encima de los niveles de AVPU. Esto se puede probar llevando
aumente la frecuencia más pequeña de la tabla en 0,5 y ajuste realizar cálculos similares a los utilizados en la regresión para probar
las otras frecuencias en consecuencia para mantener la fila y la pendiente de una línea (ver Revisión estadística 7 [1]). Suponer
la columna totaliza lo mismo. Aplicando esta corrección a los datos la variable 'supervivencia' se considera como la variable y tomando dos
dado en la Tabla 5 da la Tabla 7. valores, 1 y 2 (sobrevivió y murió), y AVPU como la variable x tomando tres
valores, 1, 2 y 3. Entonces tenemos seis pares de
La prueba de ÿ2 que usa estas cifras ajustadas da una estadística de prueba valores x, y, cada uno ocurriendo el número de veces igual al
de 2,162 con un valor de P de 0,141, que está cerca de la P frecuencia en la tabla; por ejemplo, tenemos 1110 ocurrencias del punto
valor de la prueba exacta de Fisher. (1,1).

Para muestras grandes las tres pruebas – ÿ2, Fisher y Yates – Siguiendo las líneas de la prueba del gradiente en regresión,
dan resultados muy similares, pero para muestras más pequeñas prueba de Fisher con algunas modificaciones bastante menores y usando una muestra grande 49
Machine Translated by Google

Critical Care Febrero 2004 Vol 8 No 1 Bewick et al.

Tabla 8 Tabla 9

Número de pacientes según AVPU y supervivencia Resultados del estudio realizado por Rivers y colaboradores

Voz o dolor Salir


Salir Alerta sensible Total que no responde
Terapia Murió Sobrevivió Total
Sobrevivió 1110 (91,1%) 54 (79,4%) 14 (70%) 1178
Dirigido a objetivos tempranos 38 79 117
Murió 108 (8,9%) 14 (20,6%) 6 (30%) 128
Estándar 59 60 119
Total 1218 (100%) 68 (100%) 20 (100%) 1306
Total 97 139 236

Se presentan datos sobre los resultados del estudio realizado por Rivers
y compañeros de trabajo sobre la terapia temprana dirigida por objetivos en la sepsis grave y
aproximaciones, obtenemos un estadístico ÿ2 con 1 grado de choque séptico [6].
libertad dada por [5]:
2
norte

norte
ÿÿÿ
ÿ (xx)(aa)
i
ÿ

i
ÿ

ÿ Otra medida de la asociación entre una enfermedad


ÿ yo= 1 ÿ y el posible factor de riesgo son las probabilidades. Esta es la proporción de esos
norte

ÿ (xx)
i (aa)
ÿ 2
i
ÿ 2 expuestos al factor de riesgo que desarrollan la enfermedad en comparación
=1
yo con los expuestos al factor de riesgo que no desarrollan el
enfermedad. Esto se ilustra mejor con un ejemplo simple. si una bolsa
Para los datos de la Tabla 8, obtenemos un estadístico de prueba de 19.33 contiene 8 bolas rojas y 2 bolas verdes, entonces la probabilidad
con 1 grado de libertad y un valor de P inferior a 0,001. (riesgo) de sacar una bola roja es 8/10 mientras que las probabilidades de
Por lo tanto, la tendencia es muy significativa. La diferencia sacar una bola roja es 8/2. Como puede verse, la medida
entre el estadístico de prueba ÿ2 para tendencia y el estadístico de prueba ÿ2 de probabilidades, a diferencia del riesgo, no se limita al rango 0-1. En el
en la prueba original es 19.38 – 19.33 = 0.05 con 2 – 1 = 1 estudio realizado por Rivers y colaboradores [6] las probabilidades de
grado de libertad, que proporciona una prueba de la salida muerte con terapia temprana dirigida por objetivos es 38/79 = 0.48, y
de la tendencia. Esta desviación es muy insignificante y sugiere que la asociación en la terapia estándar es 59/60 = 0,98.
entre la supervivencia y la clasificación AVPU puede explicarse casi en su
totalidad por la tendencia. Intervalo de confianza para una proporción

Como la medida del riesgo es simplemente una proporción, el intervalo de


Algunos paquetes de computadora dan la prueba de tendencia, o una variación. confianza para la medida del riesgo de la población puede ser
La prueba de tendencia descrita anteriormente a veces se denomina calculado como para cualquier proporción. Si el número de personas
prueba de Cochran-Armitage, y una variación común es la en una muestra aleatoria de tamaño n que experimentan una determinada
Prueba de tendencia de Mantel-Haentzel. resultado es r, entonces r/n es la proporción muestral, p. Para grande
muestras, la distribución de p puede considerarse aproximadamente Normal,
Medición del riesgo
con un error estándar de [2]:
Otra aplicación de una tabla de contingencia de dos por dos es para
p(1ÿ p)/ norte
examinar la asociación entre una enfermedad y un posible
factor de riesgo. El riesgo de desarrollar la enfermedad si se expone a El intervalo de confianza del 95 % para la verdadera proporción de la población,
el factor de riesgo se puede calcular a partir de la tabla. Una medida básica del p, está dado por p – 1,96 × error estándar a p + 1,96 ×
riesgo es la probabilidad de que un individuo desarrolle una error estándar, que es:
enfermedad si han estado expuestos a un factor de riesgo (es decir, la frecuencia
p ±1,96 p(1ÿ p)/ norte
relativa o la proporción de personas expuestas al factor de riesgo
que desarrollan la enfermedad). Por ejemplo, en el estudio de los primeros donde p es la proporción de la muestra y n es el tamaño de la muestra.
terapia dirigida por objetivos en el tratamiento de la sepsis grave y La proporción de la muestra es el riesgo y el tamaño de la muestra es el
shock séptico realizado por Rivers y colaboradores [6], uno de número total expuesto al factor de riesgo.
los resultados medidos fueron la mortalidad hospitalaria. de los 263
pacientes que fueron asignados aleatoriamente a la terapia temprana dirigida Para el estudio realizado por Rivers y colaboradores [6] la
por objetivos o a la terapia estándar, 236 completaron el El intervalo de confianza del 95 % para el riesgo de muerte con la terapia
período de terapia con los resultados que se muestran en la Tabla 9. temprana dirigida por objetivos es 0,325 ± 1,96 (0,325 [1 – 0,325]/117) 0,5 o
(24,0%, 41,0%), y en la terapia estándar es (40,6%,
En la tabla se puede ver que la proporción de pacientes 58,6%). La interpretación de un intervalo de confianza es
recibiendo terapia temprana dirigida por objetivos que fallecieron es descrito en la Revisión estadística 2 [3] e indica que, para
38/117 = 32,5%, por lo que este es el riesgo de muerte con aquellos en terapia temprana dirigida por objetivos, el verdadero riesgo de la población
terapia dirigida a objetivos. El riesgo de muerte en el estándar. de muerte es probable que esté entre 24,0% y 41,0%, y que
50 la terapia es 59/119 = 49,6%. para la terapia estándar entre 40,6% y 58,6%.
Machine Translated by Google

Disponible en línea http://ccforum.com/content/8/1/46

Comparación de riesgos terapia que fallecieron es p1= 38/117 = 0.325 y la proporción


de aquellos en terapia estándar que murieron es
Para evaluar la importancia del factor de riesgo, es necesario
comparar el riesgo de desarrollar una enfermedad en los expuestos p2= 59/119 = 0,496. Un intervalo de confianza para la diferencia.
entre las verdaderas proporciones de la población está dada por:
grupo con el riesgo en el grupo no expuesto. En el estudio de
Rivers y colaboradores [6] el riesgo de muerte en la terapia temprana dirigida
por objetivos es del 32,5%, mientras que en la terapia estándar es del 32,5%. (p1 – p2) – 1,96 × se(p1 – p2) a (p1 – p2) + 1,96 × se(p1 – p2)

es 49.6%. Se puede hacer una comparación entre los dos riesgos.


examinando su proporción o la diferencia entre ellos. Donde se(p1 – p2) es el error estándar de p1 – p2 y se calcula como:

Radio de riesgo
×
ÿ ÿ

(1p 1p 0,325 0,675 0,496 0,504


La razón de riesgo mide el aumento del riesgo de desarrollar una
)1
+ (1p 2p )2
= × + = 0,063
1n
norte

2 117 119
enfermedad al haber estado expuesto a un factor de riesgo en comparación
con no haber estado expuesto al factor de riesgo. esta dado por
Por lo tanto, el intervalo de confianza requerido es –0,171 – 1,96 ×
RR = riesgo para los expuestos/riesgo para los no expuestos, y es
0,063 a –0,171 + 1,96 × 0,063; es decir –0,295 a –0,047.
a menudo referido como el riesgo relativo. La interpretación de un riesgo relativo
se describe en la Revisión estadística 6 [7]. por los ríos Por lo tanto, la diferencia entre las proporciones reales es
probable que esté entre –0,295 y –0,047, y el riesgo de
estudiar el riesgo relativo = 0,325/0,496 = 0,66, lo que indica
aquellos en terapia temprana dirigida por objetivos es menor que el riesgo de
que un paciente en la terapia temprana dirigida por objetivos es 34% menos
aquellos en terapia estándar.
probabilidades de morir que un paciente con la terapia estándar.

El cálculo del intervalo de confianza del 95% para el relativo Prueba de hipotesis

El riesgo [8] se cubrirá en una revisión futura, pero puede ser útil También podemos realizar una prueba de hipótesis de la hipótesis nula
interpretarse aquí. Para el estudio Rivers el 95% de confianza que la diferencia entre las proporciones es 0. Esto sigue
El intervalo para el riesgo relativo de la población es de 0,48 a 0,90. líneas similares al cálculo del intervalo de confianza, pero
Porque el intervalo no contiene 1.0 y el extremo superior bajo la hipótesis nula el error estándar de la diferencia
está a continuación, indica que los pacientes en el tratamiento temprano dirigido a objetivos en proporciones viene dada por:
tienen un riesgo significativamente menor de morir en comparación con los que
ÿ
ÿ ÿ

(1p 1p 1 1
+ (1p 2p )2
)1 ÿ
reciben la terapia estándar. = ÿ

pag(1 pag)
ÿ +
ÿ ÿÿ


1n 2 ÿ ÿ
norte
norte
1 2
Razón de probabilidades

A la hora de cuantificar el riesgo de desarrollar una enfermedad, la relación donde p es una estimación agrupada de la proporción obtenida de
de las probabilidades también se puede utilizar como una medida de comparación ambas muestras [5]:
entre los expuestos y los no expuestos a un factor de riesgo. 38 +
59 97
muertes totales en ambas muestras
= = = 0,3856
Viene dado por OR = probabilidades para los expuestos/ probabilidades para
total de tamaños de muestra 117 +119 236
los no expuestos, y se denomina razón de probabilidades. La interpretación
de la razón de probabilidades se describe en la Revisión estadística 3 [4]. Para el Asi que:

Rivers estudia el cociente de probabilidades = 0,48/0,98 = 0,49, lo que ÿ 1 1 ÿ


0.3856 ×0.6144
× ÿ + ÿ
= 0,0634
nuevamente indica que aquellos en la terapia temprana dirigida por objetivos tienen una se(p1 – p2) =
ÿ 117 119 ÿ
riesgo reducido de morir en comparación con los que reciben la terapia estándar.
Esto se cubrirá completamente en una revisión futura. El estadístico de prueba es entonces:

2p 1p )
ÿ

- 0.1710
El cálculo del intervalo de confianza del 95% para las cuotas = = –2,71
2p 1 se(p
ÿ

0.0634
ratio [2] también se tratará en una revisión futura pero, al igual que con
riesgo relativo, puede ser útil interpretarlo aquí. por los ríos Comparando este valor con una distribución Normal estándar
ejemplo, el intervalo de confianza del 95% para la razón de probabilidades es da p = 0,007, lo que nuevamente sugiere que hay una diferencia
0,29 a 0,83. Esto puede interpretarse de la misma manera que el entre las dos proporciones de población. De hecho, la prueba
Intervalo de confianza del 95% para el riesgo relativo, lo que indica que descrito es equivalente a la prueba de asociación de ÿ2 en el
aquellos que reciben terapia temprana dirigida por objetivos tienen una reducción mesa de dos por dos. La prueba de ÿ2 da un estadístico de prueba de 7.31,
riesgo de morir. que es igual a (–2.71)2 y tiene el mismo valor P de
0.007. Una vez más, esto sugiere que hay una diferencia entre
Diferencia entre dos proporciones los riesgos para aquellos que reciben terapia temprana dirigida por objetivos y
Intervalo de confianza
aquellos que reciben terapia estándar.
Para el estudio de Rivers, en lugar de examinar la proporción de la
riesgos (el riesgo relativo) podemos obtener un intervalo de confianza Muestras emparejadas
y llevar a cabo una prueba de significación de la diferencia entre Los diseños de pares combinados, como se analiza en la Revisión estadística 5 [9],
los riesgos. La proporción de aquellos en temprana dirigida a objetivos también se puede utilizar cuando el resultado es categórico. Para 51
Machine Translated by Google

Critical Care Febrero 2004 Vol 8 No 1 Bewick et al.

ejemplo, cuando se comparan dos pruebas para determinar una determinada Tabla 10
condición, los mismos individuos pueden ser utilizados para cada prueba.
Los resultados de dos pruebas para determinar la presencia de
prueba de McNemar Helicobacter pylori

En esta situación, debido a que la prueba de ÿ2 no tiene en cuenta el emparejamiento Test de respiración

consideración, una prueba más apropiada, atribuida a


prueba de Oxoid + – Total
McNemar, se puede utilizar al comparar estos
dimensiones. + 40 48
8 (b)
– 4 (c) 32 36
Por ejemplo, en la comparación de dos pruebas diagnósticas utilizadas
en la determinación de Helicobacter pylori, la prueba del aliento Total 44 40 84(n)
y la prueba Oxoid, ambas pruebas se realizaron en 84 pacientes
y se registró la presencia o ausencia de H. pylori para
cada paciente Los resultados se muestran en la Tabla 10, que indica que hubo
72 pares concordantes (en los que las pruebas
de acuerdo) y 12 pares discordantes (en los que las pruebas no están de acuerdo). Para el ejemplo donde b = 8, c = 4 y n = 84, la diferencia
La hipótesis nula de esta prueba es que no hay diferencia se calcula como 0,048 y el error estándar como 0,041. los
en las proporciones que muestran positivo por cada prueba. si esto fuera intervalo de confianza aproximado del 95 % 0,048 ± 1,96 × es, por lo tanto
cierto entonces las frecuencias para las dos categorías de discordantes 0,041 dando –0,033 a 0,129. A medida que esto se extiende
los pares deben ser iguales [5]. La prueba consiste en calcular la diferencia entre 0, nuevamente indica que no hay diferencia en la proporción de determinaciones
el número de pares discordantes en cada categoría y escalar esta diferencia por positivas de H. pylori usando el aliento
el número total de pares. y las pruebas Oxoid.
parejas discordantes. El estadístico de prueba está dado por:
2
Limitaciones
2 (antes de Cristo)
ÿ

x= Para una prueba de asociación de ÿ2 , una recomendación sobre la muestra


+
antes de Cristo

tamaño que se utiliza comúnmente y se atribuye a Cochran [5] es


Donde b y c son las frecuencias en las dos categorías de que ninguna celda de la tabla debe tener una frecuencia esperada de
pares discordantes (como se muestra en la Tabla 10). La prueba calculada menos de uno, y no más del 20% de las células deben tener
estadístico se compara con una distribución ÿ2 con 1 grado de una frecuencia esperada de menos de cinco. Si las frecuencias esperadas son
libertad para obtener un valor P. Para el ejemplo b = 8 y c = 4, demasiado pequeñas, es posible combinar
por lo tanto, la estadística de prueba se calcula como 1,33. Comparando categorías donde tiene sentido hacerlo.
esto con una distribución ÿ2 da un valor de P mayor a 0.10,
indicando que no hay diferencia significativa en la proporción de determinaciones Para tablas de dos por dos, corrección de Yates o prueba exacta de Fisher
positivas de H. pylori usando la respiración y el se puede utilizar cuando las muestras son pequeñas. Prueba exacta de Fisher
Pruebas de Oxoid. también se puede usar para tablas más grandes, pero el cálculo puede
volverse imposiblemente largo.
La prueba también se puede realizar con una corrección de continuidad.
atribuido a Yates [5], de manera similar a la descrita En la prueba de tendencias, los tamaños de las celdas individuales no son importantes, pero

anterior para la prueba de asociación de ÿ2 . El estadístico de prueba es entonces el tamaño total de la muestra debe ser de al menos 30.
dada por:

2 (
antes de Cristo 1
ÿÿ

)2 Los análisis de proporciones y riesgos descritos anteriormente


x= suponga muestras grandes con requisitos similares a la prueba de ÿ2
+
antes de Cristo

de asociación [8].
y nuevamente se compara con una distribución ÿ2 con 1 grado de
libertad. Para el ejemplo, la estadística de prueba calculada que incluye la El requisito del tamaño de la muestra a menudo especificado para McNemar's
continuidad correcta es 0.75, lo que da un valor P mayor prueba e intervalo de confianza es que el número de discordantes
de 0,25. los pares deben ser al menos 10 [8].

Al igual que con las proporciones no apareadas, un intervalo de confianza para la Conclusión
se puede calcular la diferencia. Para muestras grandes, la diferencia entre las Se puede utilizar la prueba de asociación ÿ2 y otras pruebas relacionadas
proporciones pareadas se puede aproximar en el análisis de la relación entre variables categóricas. Se debe tener cuidado
a una distribución Normal. La diferencia entre las proporciones se puede calcular para asegurar que el tamaño de la muestra
a partir de los pares discordantes [8], por lo que la es adecuado
la diferencia viene dada por (b – c)/n, donde n es el número total
de pares, y el error estándar de la diferencia por Conflicto de intereses
52 (b + c)0,5/n. Ninguno declarado.
Machine Translated by Google

Disponible en línea http://ccforum.com/content/8/1/46

Este artículo es el octavo de una serie de revisión educativa en curso


sobre estadísticas médicas en cuidados intensivos.

Los artículos anteriores han cubierto 'presentación y


resumen de datos', 'muestras y poblaciones', 'prueba de hipótesis y
valores P', 'cálculos de tamaño de muestra', 'comparación de medias',
'medias no paramétricas' y 'correlación y regresión'.

Los temas futuros que se cubrirán incluyen:

Chi-cuadrado y pruebas exactas de Fisher


Análisis de varianza Otras pruebas no
paramétricas: Kruskal-Wallis y Friedman Medidas de enfermedad: PR/
OR Datos de supervivencia: Curvas de Kaplan-Meier y pruebas de
rango logarítmico Curvas ROC Regresión logística múltiple.

Si hay algún tema de estadísticas médicas que le gustaría


explicar, contáctenos en editorial@ccforum.com.

Referencias
1. Bewick V, Cheek L, Ball J: Revisión estadística 7: Correlación y regresión. Cuidado
crítico 2003, 7: 451-459.
2. Everitt BS: El análisis de las tablas de contingencia, 2ª ed. Londres, Reino Unido:
Chapman & Hall; 1992.
3. Whitley E, Ball J: Revisión de estadísticas 2: muestras y poblaciones.
Cuidado crítico 2002, 6:143-148.
4. Whitley E, Ball J: Revisión de estadísticas 3: prueba de hipótesis y P
valores. Critic Care 2002, 6:222-225.
5. Bland M: Introducción a las estadísticas médicas, 3.ª ed. oxford,
Reino Unido: Oxford University Press; 2001.
6. Rivers E, Nguyen B, Havstad S, Ressler J, Muzzin A, Knoblich B, Peterson E,
Tomlanovich M; Grupo colaborativo de terapia temprana dirigida por objetivos:
Terapia temprana dirigida por objetivos en el tratamiento de la sepsis grave y el
shock séptico. N Engl J Med 2001, 345:1368-1377.

7. Whitley E, Ball J: Revisión estadística 6: Métodos no paramétricos.


Cuidado crítico 2002, 6:509-513.
8. Kirkwood BR, Sterne JAC: Estadísticas médicas esenciales, 2.ª ed.
Oxford, Reino Unido: Blackwell Science Ltd; 2003.
9. Whitley E, Ball J: Revisión de estadísticas 5: Comparación de medias.
Cuidado crítico 2002, 6:424-428.

53

También podría gustarte