Está en la página 1de 6

GUÍA ACADÉMICA UNIVERSIDAD

NACIONAL
DE COLOMBIA
Revista de la Facultad de
Medicina 2001; 49 (3):175-180

Aspectos sobre diseño y tamaño de muestra en estudios de pruebas


d·13gnóstí cas
Ricardo Sánchez Pedraza, Profesor Asociado, Departamento de Psiquiatría y Centro de Epidemiología Clínica. Iairo Echeverry Raad, Profesor
Asociado, Departamento de Pediatría y Centro de Epidemiología Clínica, Facultad de Medicina, Universidad Nacional Dirección para

SUMMARY este sentido, y como elementos para y la enfermedad es lo que realmente el


efectuar un mismo diagnóstico, se pue- individuo tiene. Un diagnóstico es apro-
This article deals with general and parti- den tener al alcance, por un lado unas piado si ambos sentidos coinciden (4).
cular aspects related with the meaning and pruebas sofisticadas, costosas e Dado que esto es un asunto difícil, y a
development of diagnostic tests. Its main
invasivas, y por el otro, sencillas pre- la vez esencia del proceso diagnóstico,
subject is about the elements needed for
the appropriate sample size in these kind guntas, la observación o medición del el establecimiento de la presencia de una
of studies. tamaño, color u olor de un individuo o enfermedad se realiza más en términos
de una parte de su anatomía, la forma de probabilidades de su ocurrencia.
de saludar, la descripción de su com- El proceso en el que se construye la
portamiento, etc. probabilidad de decirle a alguien que
En este artículo se presentan algunas está enfermo o que padece alguna con-
consideraciones generales y particula- En forma habitual las Px.Dx. se han dición, mediante el acopio necesario de
res con respecto al significado y desa- utilizado en el intento de establecer con Px.Dx. se denomina proceso diagnós-
rrollo de los estudios sobre pruebas exactitud y precisión la presencia de tico (1). Diagnosticar significa clasifi-
diagnósticas. El centro del mismo se alguna enfermedad o condición; sin car a los individuos en alguna condi-
dedica a la formulación de los elemen- embargo, también juegan papel impor- ción (5), sea esta una taxonomía
tos necesarios que subyacen al cálculo tante en el establecimiento de factores nosológica, un síndrome, una enferme-
del tamaño de muestra en este tipo par- de riesgo, estadío o evolución clínica dad, el estadío evolutivo, etc.
ticular de diseños. de las enfermedades, respuesta a las
terapias e intervenciones, o en la pre- Cada Px.Dx, sin importar sus caracte-
INTRODUCCIÓN dicción de los desenlaces intermedios rísticas, métodos utilizados, costos o
o finales (2,3). sitio en la historia natural de la enfer-
En Medicina, una Prueba Diagnóstica medad en la que se ejecute, es suscep-
(Px.Dx.) es cualquier dato que, perci- Los datos obtenidos para establecer la tible de ser medida en su rendimiento
bido a través de alguno de nuestros sen- situación pasada o actual suelen llamar- operativo (1).
tidos, puede modificar las probabilida- se pruebas diagnósticas y los que
des de un diagnóstico. Dentro de estos proyectan sus resultados, con predic- Características operativas de las
términos una Px.Dx. no sólo es aquella ción de lo que puede suceder se cono- pruebas diagnósticas
que puede ser verificada en un labora- cen como pruebas pronósticas (4).
torio, sala de rayos X, o unidad de pa- En el proceso de mejoramiento conti-
tología, después de un proceso tecno- El diagnóstico va en un sentido (del clí- nuo de calidad, la tecnología de la sa-
lógico complejo, sino también, mediante nico hacia su paciente), y la enferme- lud está a la caza de elementos diag-
lo observado, lo auscultado, lo palpa- dad en otro (del paciente al médico). nósticos o pronósticos que cada día,
do, lo percutido y demás elementos del Dicho de otra manera, el diagnóstico con mayor validez y precisión, y me-
ejercicio semiológico cotidiano (1). En es lo que uno cree que el paciente tiene nor costo y riesgo, sean más costo-

175
SÁNCHEZ R, ECHEVERRY J.

efectivos en el establecimiento o deter- diagnóstica es el de un estudio transver- todos y las pruebas deben ser descritos
minación del estado de las cosas. sal comparativo (8). En general, para su en detalle. El diagnóstico de la condición
desarrollo se toma un grupo de indivi- debe ser el más cercano a la verdad, y el
Esto se logra mediante el proceso de duos enfermos y otro de sanos (selec- mismo estándar de referencia debe ha-
validación en el que un grupo de indivi- cionados en forma ideal, de un universo, ber sido aplicado a todos los pacientes
duos se somete tanto a una prueba tras un proceso aleatorio), definidos en por igual, desconociendo cualquier dato
diagnóstica nueva como ante el estándar tales condiciones a la luz de un mismo adicional de ellos, incluso cómo resulta-
de referencia (patrón de oro o "Gold Stan- estándar de referencia. A continuación ron en la prueba bajo estudio. Es funda-
dard"), que no es otra cosa que la mejor unos y otros son sometidos, en forma mental disponer de un patrón de oro ade-
prueba diagnóstica disponible para esta- enmascarada e independiente, a la lectu- cuado: Para evaluar una nueva Px.Dx.
blecer la verdadera condición o situación ra de la prueba bajo investigación (9). es necesario que en la muestra se inclu-
de un paciente. yan individuos en los que se haya iden-
La calidad de un estudio de Px.Dx. se tificado con buen grado de certeza el
Fruto de este proceso de validación se relaciona con aspectos del diseño, con desenlace de interés. Si el patrón de oro
establece para la prueba en cuestión un los métodos para reclutar la muestra (en que me ha definido dicho desenlace es
conjunto de indicadores de exactitud que la selección), con la ejecución de las prue- imperfecto se corre el riesgo de califi-
han sido llamados Características bas (en la medición) y con lo completo car como falsos positivos a individuos
Operativas de las Pruebas Diagnósticas del reporte del estudio (10,11). Un as- no detectados por el patrón de oro o
(COPD). pecto trascendente, pero un tanto des- como falsos negativos a los errónea-
cuidado a nuestro juicio, como es el nú- mente detectados positivos por el pa-
Las COPD tradicionales son la Sensibili- mero mínimo necesario de pacientes para trón de oro.
dad (capacidad de la prueba en detectar la obtención de indicadores precisos,
los enfermos), la Especificidad (capaci- será discutido más adelante. Eh relación con la prueba bajo estudio
dad de la prueba de detectar a los sanos), (1,2,4,9,14), su aplicación debe ser
el Valor Predictivo Positivo (A la preva- De manera más específica, con respec- descrita con detalle. A los miembros
lencia del estudio, cuál es la probabilidad to a la muestra de pacientes (1,2,4,9,12), de la muestra se les deben efectuar las
de enfermedad si la prueba resultara po- esta debe ser seleccionada consecutiva o evaluaciones de forma enmascarada, o
sitiva?), y el Valor Predictivo Negativo aleatoriamente, reclutada como una sea que el investigador que evalúa la
(A la prevalencia del estudio, cuál es la cohorte no clasificada según su estado prueba debe desconocer el resultado del
probabilidad de estar sano si la prueba de enfermedad, en escenarios en donde patrón de oro y el que aplica el patrón
resultara negativa?). la prueba bajo estudio pudiera ser reali- de oro debe ignorar el resultado de la
zada en el futuro. El proceso de selec- prueba que se estudia. Se deben haber
Últimamente se han utilizado resúmenes ción y referencia utilizado y las caracte- reportado todos los resultados incluso
de los anteriores indicadores (6,7), como rísticas demográficas y clínicas de los aquellos con resultados indeterminados
las razones de verosimilitud positivas, pacientes deben ser completamente des- o en "zona gris" y haberse realizado
del inglés positive likelihood ratios ó (+) critas. Es óptimo incorporar en la mues- antes de iniciar cualquier tratamiento.
LR, las razones de verosimilitud negati- tra todo el espectro de enfermedad: Si en Evidencia empírica reciente (16,17),
vas, del inglés negative likelihood ratios la muestra sólo se incluyen individuos se- ha revelado que los sesgos más impor-
ó (-)LR, Y más recientemente las razo- veramente enfermos y claramente sanos, tantes en los estudios de PxDx., radi-
nes de ventaja diagnóstica, del inglés la prueba puede no detectar enfermos can en el diseño y muy particularmen-
Diagnostic Odds Ratio (DOR) (2). Es- cuando se aplica en poblaciones en las te en los siguientes, en su orden:
tos indicadores se han convertido en me- cuales hay estadías menos severos de la i. Reclutar por separado a "enfermos"
didas de resumen de las COPD, con suma enfermedad. Esto cobra especial impor- y a "sanos" (Sesgo de selección).
utilidad en el establecimiento más sólido tancia cuando el resultado de la prueba ii.Dada una información preliminar
y depurado de las características intrín- que se estudia se correlaciona con la se- arrojada por la prueba bajo estudio,
secas de ellas, en las selección más apro- veridad de la enfermedad; cuando el ren- ejecutar diferentes patrones de refe-
piada de un punto de corte en la prueba, dimiento operativo de una prueba se rencia a enfermos y a sanos (Sesgo
en la escogencia de la prueba más ade- modifica en la medida en que se modifi- de medición en la verificación).
cuada entre homólogas o en la determi- ca el espectro de enfermedad, esa prue- iii.Determinar la prueba bajo estudio
nación de probabilidades pos-prueba (1). ba revela Sesgo de Espectro (l3). siendo conocedor (no enmascarado)
de la real condición de salud de los
El estudio de una prueba diagnóstica En lo referente al diagnóstico por el.Qª= individuos, o viceversa, establecer la
El diseño general de una prueba trón de referencia (1,2,4,9,14), los mé- situación real del individuo mediante

176
ASPECTOS SOBRE DISEÑO Y TAMAÑO DE MUES1RA Rev Fac Med UN Col 2001 Vol.49 N°3

el estándar de referencia conociendo medida tras medida, los resultados ob- ii. Se quieren comparar dos pruebas,
el resultado arrojado por la prueba tenidos muestran poca variabilidad, di- una de las cuales tiene característi-
bajo estudio (Sesgo de medición por ríamos que dicha báscula es inexacta cas operativas reconocidas.
un diagnóstico conocido). pero precisa. El instrumento está ses- iii, Se quieren comparar dos pruebas,
gado (descalibrado) pero con poco error contrastando su exactitud.
Resultados de una prueba aleatorio (preciso). El interés iv. Se desea evaluar la concordancia
diagnóstica epidemiológico es la obtención de entre dos pruebas diagnósticas.
Al culminar el proceso se contará con indicadores de frecuencia o de efecto
cuatro posibles pares de resultados in- que sean ante todo válidos y precisos El tamaño de la muestra (TM)
herentes a las pruebas, dos aciertos y (23). Una de las maneras de disminuir la po-
dos errores: En los pares de aciertos, sibilidad de errores aleatorios en un es-
la prueba resulta positiva y el individuo Aunque suene reiterativo, si un estudio tudio, es calcular el número mínimo
se encuentra realmente enfermo (ver- toma un grupo significativo y suficiente necesario de observaciones o indivi-
dadero positivo) o la prueba resulta ne- de individuos sanos y enfermos, con duos para obtener unos resultados
gativa y el individuo realmente es sano un perfil similar al que presenciaríamos precisos y consistentes.
(verdadero negativo). En los errores, en el ejercicio clínico, y a todos los con-
la prueba resulta positiva y el individuo fronta de manera enmascarada e inde- Para resumir, el calcular un tamaño de
se encuentra realmente "sano" o libre pendiente a través tanto de una prueba muestra (TM) permite establecer de
de la condición bajo estudio (falso po- bajo estudio como del estándar de re- manera precisa el verdadero estimador
sitivo) o la prueba resulta negativa y el ferencia, diríamos que ese estudio de del rendimiento operativo de una prue-
individuo realmente está enfermo (fal- pruebas diagnósticas es válido (o sea ba diagnóstica o de la diferencia en el
so negativo). que no se cometieron errores sistemá- funcionamiento de dos pruebas, con un
ticos o sesgos en el proceso de selec- nivel tolerable de error aleatorio. Llama
Las observaciones epidemiológicas tie- ción y medición), y por lo tanto no se la atención la escasez de literatura alre-
nen dos fuentes de error (18-20): El desautorizan los resultados obtenidos dedor de este tópico, así como la falta
error sistemático y el aleatorio. El error (22). de un consenso, evidente en los múlti-
sistemático es la desviación sistemáti- ples enfoques que se plantean en dife-
ca de la verdad y por ello es llamado Pero lo anterior no anula la posibilidad rentes artículos sobre evaluación de
también sesgo (21). El sesgo suele de que se hayan introducido errores PX.Dx.
introducirse ya sea en la selección de aleatorios en el estudio, y que por esto
los individuos o en los procesos y ele- los resultados puedan haberse presen- Teniendoencuentalosdiversosdiseñosque
mentos para medición de ellos, sean tado sólo por efecto del azar. Este efec- pueden plantearse para el estudio de una
estos los instrumentos de medida o los to no permite tener la suficiente con- Px.Dx,no tiene sentidoestablecerun único
observadores. Exactitud, ausencia de fianza y precisión en los estimadores método para el cálculo del TM. Por esta
sesgo o validez, son conceptos simila- del indicador operativo de la prueba razón, ante la pregunta: ¿Qué tamaño de
res, aunque no idénticos. diagnóstica en consideración. muestra necesito?, la respuesta será: De-
pende el diseñoque tengael estudio.
El error aleatorio es aquel que se pre- No existen pruebas perfectas; cada una
senta debido al azar y puede producir- posee un grado relativo de aciertos y Si se tienen en cuenta las característi-
se por efectos de la variabilidad bioló- errores. Una prueba útil será aquella en cas específicas del diseño del estudio,
gica del individuo, del observador y de la que la relación entre los aciertos y considerando cómo se efectúe el plan-
los instrumentos de medida (22). sus costos, supere el de los errores y teamiento de hipótesis, se pueden te-
Reproducibilidad, confiabilidad, con- sus costos (6). ner presentes las siguientes opciones:
fianza, consistencia o precisión son l. Se tiene un patrón de oro robusto
palabras que sugieren un escaso error Teniendo como referente el diseño ge- y se quieren conocer las caracterís-
aleatorio. neral presentado previamente, se pue- ticas operativas de una nueva prue-
den plantear diferentes modalidades de ba, contrastando sus resultados con
La ausencia de sesgos no excluye los estudio de una prueba diagnóstica: ese patrón de oro: Teniendo en cuen-
errores aleatorios y viceversa. Por 1. Se tiene un patrón de oro robusto y ta que algunos estudios de PX.Dx. con
ejemplo, si un báscula se encuentra se quieren conocer las característi- esta estructura pueden semejar un dise-
descalibrada con un exceso de 200 gra- cas operativas de una nueva prueba, ño en el cual se analiza una eventual aso-
mos en cada medida, pero de manera contrastando sus resultados con ese ciación entre una condición (enfermedad
consistente en los mismos sujetos, patrón de oro. o diagnóstico) y un método para

177
SÁNCHEZ R, ECHEVERRY J.

detectarla o medirla (prueba), una aproxi- proporción conocida 1t1 con una pro- Tabla 2. Valores Z para dos niveles de beta.
mación muy general estima que un ta- porción 1t2 que se va a estimar (24):
maño debe ser suficiente cuando quiera B 1-B Z ¡.S
que hay mínimo 10 individuos en cada 0.2 0.8 0.84162
N= {Z¡'al2" [1t¡(1-1t¡)] +Z¡.B" [1tP-1t2)]}2
casilla marginal de la tabla de 2x24• Es- 0.1 0.9 1.2816
02
tos valores deberán ser ajustados de En esta función 1t1 es el valor conocido
acuerdo con el número de individuos de la sensibilidad, especificidad o valo- Dado que en la práctica clínica los va-
con y sin la condición que se busca res predictivos de la prueba patrón, 1t2 lores predictivos dependen fuertemen-
diagnosticar, aspecto que se mostrará es el valor que se espera tenga la prue- te de la prevalencia de la condición que
posteriormente. ba en dichos parámetros, y s- 1t2 -1ti" la prueba mide, se debe hacer la estimación
En el ejemplo que se ha mencionado, si de dichos valores con base en el teorema de
2. Se quiere evaluar una hipótesis se anticipa que la nueva prueba puede Bayes, de la siguiente manera (25):
sobre características de una nueva tener una sensibilidad del 95%, los va- Sensibilidad xPrevalencia
prueba: En estos casos lo que se quie- Vpp=------------------------
lores dentro de la función para calcular
Sensibilidad x Prevalencia + (l-Sensibilidad) x (l-Prevalencia)
re evaluar es si las características de la la muestra serían los siguientes:
nueva prueba (sensibilidad, especifici- 1t1 = 0.9 VPN = __ Es-,-p_ec...::.ifi_lc_id_ad_x_:(_l-_P_re_v
al __
en...:.cia:_! _
dad o valores predictivos) difieren de 1t2 = 0.95 Especificidad x (l-Prevalencia) + (1-Especificidad) x Prevalencia
las de la prueba convencional. Esto se 8 = 0.05
ilustra con el siguiente ejemplo: El tamaño de la muestra necesario será aquel
que resulte mayor luego de calcularlo para
Los valores de Z l-u/2 y Z I-B son térmi-
Existe una prueba de referencia "A" y nos constantes derivados de la distri- los escenarios de sensibilidad, especificidad
después de varios estudios se sabe que bución normal y se presentan en las o valores predictivos, o aquel dependiente
su sensibilidad es del 90%. Se desarro- tablas 1 y 2. El valor ex,también deno- de la característica que resulte más impor-
lló una nueva prueba "B" cuya sensibi- minado significación o probabilidad de tante para la prueba que se está evaluando,
lidad se quiere comparar con la de la error tipo 1, corresponde a la probabi- por ejemplo la sensibilidad si se trata de una
prueba de referencia. ¿se puede demos- lidad que asignamos al error de recha- prueba de tamizaje.
trar que es diferente la sensibilidad de zar la hipótesis nula cuando esta es cier-
la nueva prueba? ta. En investigación clínica suele fijar- 3. Se desea evaluar una hipótesis sobre
De acuerdo con el procedimiento de se en el 5% (0.05), aunque, dependien- diferencia de proporciones: En este caso
una prueba de hipótesis, el planteamien- do del caso, pueden asignarse valores se aplican simultáneamente dos pruebas
to sería el siguiente: menos estrictos (10% ó 0.1) o más es- diagnósticas a los mismos individuos. Se
~: Sensibilidad de A = Sensibilidad de B trictos (1 % ó 0.01). El valor B corres- quiere evaluar la hipótesis nula de no dife-
Ha: Sensibilidad de A toSensibilidaddeB ponde a la probabilidad de cometer error rencia en las exactitudes que arroja la prue-
tipo 2, es decir de no rechazar la hipótesis ba y el estándar de referencia. Hay que te-
Dichas hipótesis estarán planteadas nula cuando esta es falsa. Usualmente se ner en cuenta que en tal situación los datos
en términos de proporciones. establece en un 10 ó 20% (O.l ó 0.2). no son independientes, razón por la cual el
Si se considera que los pacientes o las cálculo del tamaño de la muestra sobre la
observaciones en las cuales se va a Al reemplazar los valores correspon- premisa de diferencia de proporciones en
aplicar la nueva prueba son muy simi- dientes en la función se obtiene un TM muestras independientes resulta erróneo.
lares a los utilizados en otros estudios de 238 individuos, que es el número de
para evaluar la prueba de referencia, pacientes a los cuales hay que aplicar Cuando se plantean hipótesis sobre dife-
puede no ser necesario volver a aplicar la nueva prueba para encontrar una di- rencia de proporciones en pruebas
esta última prueba. En tal caso se asu- ferencia significativa en los valores de diagnósticas que se aplican en un mismo
me que la sensibilidad de la prueba de sensibilidad. individuo, se utiliza la exactitud de la prue-
referencia "A", expresada como pro- ba. Recordemos que la exactitud es el
porción, es conocida y que el objetivo Tabla 1. Valores Z para diferentes niveles de total de verdaderos positivos y verdade-
alfa, pruebas a dos colas. ros negativos que arroja la prueba, y que
del estudio es estimar la sensibilidad de
la nueva prueba "B". puede expresarse como una proporción.
a a/2 l-a/2 Z l-al2
En tal caso las hipótesis se plantean de la
Para el cálculo del tamaño de la mues- 0.1 0.05 0.95 1.6449 siguiente manera:
tra se utiliza la siguiente función que, ()n~ OO?'i o Q7'i 1 Q¡;

con un nivel de significación a y un 0.025 0.0125 0.9875 2.2414 Ho: Exactitud de A = Exactitud de B
poder de 1-B, permite comparar una 0.01 0.005 0.995 2.5758
H,,: Exactitud de A -:f:. Exactitud de B

178
ASPECTOS SOBRE DISEÑO Y TAMAÑO DE MUESTRA Rev Fac Med UN Col 2001 Vo1.49 N"3

Plantear las hipótesis de esta manera (s+t)


supone que se dispone de un patrón de
1tDiscordante = N pares
oro de muy buena calidad, contra el cual
se están contrastando las dos pruebas. El cociente 'JI dice qué tanto mayor es la discordancia de la prueba B en relación con la
discordancia de la prueba A. En la tabla de pares equivale a dividir s entre t:
La tabla 2x2 correspondiente podría
tener esta estructura:
'JI = s/t
Resultados exactos* Para calcular el tamaño de la muestra es necesario anticipar la proporción de discordancia
Si No
entre las dos pruebas y el cociente 'JI. La función que se aplica es la siguiente:

Prueba A N={Z¡ OI2(\jI+ 1)+Z¡_B--J[(\jI+ 1)2-(\jI-l )ZreDiSCOrdanCiaW

('JI -1Y re2Discordancia


Prueba B
Si se quieren comparar dos pruebas con una probabilidad de discordancia de 0.15, teniendo
una discordancia tres veces mayor en una prueba que en otra, se tienen los siguientes
*Resultados exactos: Corresponden a la valores para reemplazar en la función:
suma de verdaderos positivos y negati- re Discordancia = 0.15
vos. En cada celda de la columna corres- 'JI=3
pondiente a "Si", se incluye el número de Z l-an = 1.96
casos verdaderos positivos y verdade- Z lB = 0.841
ros negativos para cada una de las pruebas.
Con los anteriores valores se requiere una muestra de 207 individuos a los cuales aplicar las
Teniendo en cuenta la situación de no dos pruebas.
independencia, la anterior tabla 2x2
puede construirse de tal modo que las 4 Se quiere evaluar una hipótesis de concordancia: En tal caso se asume que hay N
unidades que queden en cada celda sean sujetos evaluados por dos pruebas diferentes. Así, la probabilidad estimada de desacuerdo
los pares de observaciones efectuados entre las dos pruebas es:
sobre un mismo individuo. El diseño 1t tne: d+N
de la tabla es ahora el siguiente:
Donde d es el número de desacuerdos entre las dos pruebas. Como puede verse, aquí se
Prueba A aplica un criterio similar al del caso en el que se plantea la evaluación de diferencia de
Resultados exactos proporciones.

Si No Total Para una amplitud determinada W1tde un intervalo de confianza al1 00(1a)%, el tamaño de
v» la muestra será:
¡:o.g Si r s r+s
ro '"
.c:! o N= 41t Dis (1- 1t Dis) Z21-a/2
..0-
<l) ::1 -g No
2
o...~
:c >(
<l)
t u t-i-u
WZ1t
¿Cuántos enfermos y cuántos sanos?
Para definir el número de pacientes en la muestra con y sin la condición que se está
Total r+t s+u N pares
midiendo, el criterio es incluir un número similar de pacientes dentro de cada uno de los
posibles espectros de la enfermedad, esto es, intentar en lo posible reproducir la prevalencia
Esta tabla tiene la estructura utilizada o todo el espectro de la enfermedad, similar al que se verifIcaría en la práctica clínica. Por
en la prueba de McNemar (26). En este ejemplo, si la enfermedad tiene tres niveles de severidad (leve, moderado y grave), y el
tipo de estadístico se trabaja con los tamaño calculado de muestra son 400 pacientes, se deberían incluir 100 pacientes sin la
denominados pares discordantes, que enfermedad, 100 leves, 100 moderados y 100 severos.
son los correspondientes a las celdas s
y t, ya que los pares concordantes (cel- Otro criterio, fundamental cuando se evalúan características operativas, es que la propor-
das r y u) no dan información sobre ción de enfermos y sanos en muestra refleje la prevalencia de la condición que se busca
las diferencias que se están evaluando diagnosticar, en la población en la cual se aplicará la prueba. En general, es recomendable
(27). La proporción de discordantes incluir más individuos enfermos que sanos, aunque se estén creando artifIcialmente
(1tDiscordantes) puede calcularse así: prevalencias superiores al 50%, ya que de esta manera se tendría más oportunidad de
incluir pacientes con espectros de enfermedad desconocidos o posiblemente no detectables.

179
sÁNCHEZ R, ECHEVERRY J.

REFERENCIAS BIBLIOGRÁFICAS

1. Echeverry J, Ardila E. Pruebas Review of Screening and Diagnostic Test. Company, 1992: 31-51.
diagnósticas y proceso diagnóstico. En: Recommended methods [update 6 jun 19. Sox HC, Blatt MA, Higgins MC,
Ardila E, Sánchez R, Echeverry J. Estra- 1986]. www.cochrane.org/cochrane/ Marton KI. Probability: Quantifying
tegias de Investigación en Medicina Clí- sadtdoc l.htm Uncertainty. In: Sox HC, Blatt MA,
nica. Bogotá: Editorial Manual Moderno: 11. Reid MC, Lachs MS, Feinstein AR. Use Higgins MC, Marton KI. Medical
2001. of methodological standards in diagnostic Decision Making. Boston: Butterworth
2. Deeks JJ. Systematic reviews on test research. Getting better but still no Publishers, 1988: 103 -46.
evaluations of diagnostic and screening good. JAMA 1995;274:645 - 651. 20. Riegelman RK. Hirscb RP. Cómo estu-
test. BMJ 2001 ;323: 157-162. 12. Knapp RG, Miller m MC. Clínical diar un estudio y probar una prueba: lec-
3. Ruiz A, Ruiz JG. Fundamentos de In- Epidemiology and Biostatistics. tura crítica de la literatura biomédica. 2a.
vestigación Clínica. Exámenes diagnósti- Baltimore:Williams & Wilkins: 1992. p Ed. Washington, DC. : OPS, 1992. Publi-
cos: Aproximación a su uso racional. Pe- 42-43. cación científica: 531.
diatría 1993;28(2):111-119. 13. Lachs MS, Nachamkin 1, Edelstein PH, 21. Ransohoff DF, Feistein AR. Problems
4. Kramer HC. Medical Test: Objective and et al. Spectrum Bias in the Evaluation of of spectrum and bias in evaluating the
Quantitative Guidelínes. SAGE a Diagnostic Tests: Lessons from the efficacy of diagnostic test. N Eng J
Publications, Inc. Newburry Park, Cal, rapid Dipstick Test for Urinary Tract MedI978;299:926 -30.
USA. 1992. Chapter: 14. infection. Ann Int Med 1992;117:135 - 22. Rothman KJ, Greenland S. Precision
5. De Almeida N. Epidemiología sin Nú- 140. and validity in a Epidemiologic Studies.
meros: Una introducción crítica a la cien- 14. Knapp RG, Miller MC. Describing the In: Rothman KJ, Greenland S. Modern
cia epidemiológica. Serie Paltex N.28. Performance of a Diagnostic Test In:. Epidemiology. Second Edition.
OMS-OMS. 1992. Knapp RG, Miller MC. Clinical Lippincott Raven publishers,
6. Suchman AL, Dolan JG. Odds and epidemiology and biostatistics. Malvern Philadelphia, 1998: 115- 134.
Likelihood Ratio. In: Griner, Panzer RJ, (Pennsylvania): Harwal Publishing 23. Rotmnan KJ, Greenland S. Precision
Greenland P, eds. Clinical diagnosis and Company, Baltimore,Williams & Wilkins: and validity in Epidemiologic Studies. In:
the laboratory. Logical strategies for 1992: 31-51. Modern Epidemiology Rotmnan KJ,
cornmon medical problems. Chicago: Year 15.Bates AS, Margolis PA, Evans A. Greenland S. 2a Edition. Lippincott-Raven
Book Medical Publisher., 1986:36-43. Verification bias in paediatric studies publishers. Philadelphia. 1998:115-34.
7. Zweig MH, Campbell G. Receiver - evaluating diagnostic tests J Pediatr 24. Machin D, Campbell M, Fayers P,
Operating Characteristic Curve (ROC) 1993;122: 585 -90. Pinol A. Sample size tables for clinical
Plots: A fundamental Evaluation Tool in 16. Lijmer JG, Mol BW, Heisterkamp S, studies, 2nd ed.Oxford: Blackwell
Clínical Medicine. Clin Chem Bonsel GJ, Prins MH, Van der Science: 1997. p. 21.
1993;39(4):561-77. Maeulen JHP et al. Empirical evidence 25. Tobias A. Summary statistics report for
8. López F. Interpretación de Pruebas of design-related bias in studies of diagnostic tests. Stata Technical Bulletin
Diagnósticas. En: López F. Manual de diagnostic test. JAMA 1999;282:1061- 2000;56: 16-18.
Medicina Basada en la Evidencia. Edito- 66. 26. Norman GR, Streiner DL.
rial Manual Moderno & JGH Editores, 17. Begg CB. Biases in the assessment of Bioestadística. Madrid: Mosby/Doyma
2000. the diagnostic tests. Stat in Med Libros: 1996. pp. 155.
9. Dawson-Sanders B, Trapp RG. Proce- 1987;6:411 -23. 27. Rosner B. Fundamentals of Biostatistics.
dimientos para valorar diagnósticos. En: 18. Knapp RG, Miller MC. Describing the 4th ed. Belmont: Duxbury Press: 1995. pp.
Dawson-Sanders B, Trapp RG. Performance of a Diagnostic Test In:. 378-379.
Bioestadística Médica. Manual Moder- Knapp RG, Miller MC. Clinical 28. Machín D, Campbell M, Fayers P, Pinol A.
no, México 1990:265 -82. epidemiology and biostatistics. Malvern Sample size tables for clinical studies, 2nd
10. Cochrane Methods Group on Systematic (Pennsylvania): Harwal Publishing ed.Oxford: Blackwell Science: 1997. p. 71.

Correspondencia: Ricardo Sánchez Pedraza (risanche@bacata.usc.unal.edu.co), Iairo Echeverry Raad


Uechever@bacata.usa.unal.edu.co); Centro de Epidemiología Clínica, Instituto Materno Infantil

180