Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Notas
ndice 1. OBJETIVOS.....................................................................................................................2 2. NOMENCLATURA...........................................................................................................2 3. PRECISIN .....................................................................................................................6
3.1. Diseo experimental del estudio de imprecisin ........................................................................................ 6 3.2. Comparacin con otras evaluaciones de la precisin ................................................................................ 6 3.3. Comparacin estadstica con el fabricante ................................................................................................ 7 3.4. Componentes de la precisin ..................................................................................................................... 7 3.5. Materiales de calibracin y reactivos ......................................................................................................... 7 3.6. Deteccin de datos extremos (outliers) ...................................................................................................... 8 3.7. Estimacin de la repetibilidad..................................................................................................................... 8 3.8. Estimacin de la precisin intralaboratorio............................................................................................... 9 3.9. Comparacin con los datos de imprecisin del fabricante u otros criterios ............................................. 10 3.10. Comparacin de la repetibilidad ............................................................................................................. 10
5. LMITE DE CUANTIFICACIN......................................................................................22
5.1. Establecimiento del lmite de cuantificacin............................................................................................. 22 5.2. Verificacin de un lmite de cuantificacin ............................................................................................... 22 5.3. Informe de resultados............................................................................................................................... 23
6. LINEALIDAD..................................................................................................................24
6.1. Pool de muestras de pacientes ................................................................................................................ 25 6.2. Pool de muestras de pacientes diluido con un diluyente recomendado .................................................. 25 6.3. Pool de muestras de pacientes suplementado con el analito de inters ................................................. 25 6.4. Pool diluido con materiales tratados de baja concentracin o con otro pool tratado............................... 25 6.5. Controles / calibradores / materiales para estudio de linealidad comerciales ......................................... 25 6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado ........................................ 25 6.7. Material de control comercial diluido con diferente volumen del establecido .......................................... 25 6.8. Soluciones acuosas.................................................................................................................................. 26 6.9. Disoluciones en otros disolventes ............................................................................................................ 26 6.10. Intervalo analtico ................................................................................................................................... 26 6.11. Determinacin del intervalo lineal........................................................................................................... 27 6.12. Regresin polinmica ............................................................................................................................. 27 6.13. Orden de la regresin polinmica........................................................................................................... 28 6.14. Grado de nolinealidad .......................................................................................................................... 29 6.15. Consideraciones acerca del error aleatorio............................................................................................ 29
7. CALIBRACIN ..............................................................................................................31
7.1. Conceptos bsicos asociados a la calibracin......................................................................................... 31 7.2. Chequeo de la falta de ajuste................................................................................................................... 32 7.3. Diseo de un experimento de calibracin ................................................................................................ 33 7.4. Linealidad exacta? ................................................................................................................................. 33 7.5. Ajuste de datos a una funcin lineal con error en ambas variables......................................................... 34 7.6. Modelos de regresin y de relacin funcional .......................................................................................... 34 7.7. Aplicaciones analticas de FREML ........................................................................................................... 35 7.8. Cmo estimar las ponderaciones ............................................................................................................. 35
1. Objetivos
Clarificar conceptos y definiciones bsicos relacionados con la evaluacin de mtodos analticos; Conocer los procedimientos estadsticos adecuados para abordar la evaluacin y validacin de mtodos e instrumentos analticos; Conocer los criterios y algoritmos propuestos por entidades cientficas de mbito nacional e internacional para la evaluacin de mtodos e instrumentos.
2. Nomenclatura
A lo largo de las dos partes de este tema dedicado a la evaluacin de mtodos, se emplearn trminos que conviene definir y matizar previamente. Tambin se recomienda revisar algunos documentos de la SEQC que hace referencia a la validacin de mtodos.1 Exactitud y error Exactitud Es la concordancia entre un resultado de un test y el valor aceptado como referencia. Cuando se aplica a una serie de resultados analticos, incluye una combinacin de componentes aleatorios del error y componentes de sesgo o error sistemtico. [ISO 3534: 3.11] Esencialmente, la exactitud es la ausencia de error. Un resultado es ms exacto si se comete un error menor. Los conceptos exactitud y precisin estn relacionados: es poco probable que un resultado de un mtodo sea exacto si en general los resultados que proporciona dicho mtodo no son precisos. Cabe destacar que, estrictamente, el concepto de exactitud se aplica a resultados, y no a entidades generales como mtodos analticos, laboratorios o individuos. Error (de Es la diferencia entre el resultado de una medida y el valor verdadero del medida) mensurando. Dado que el valor verdadero no puede ser determinado, en la prctica se emplea un valor verdadero convencional. [VIM: 3.10] Error aleatorio Es una componente del error que, en el curso de un nmero de resultados (de un resultado) de un test de las mismas caractersticas, vara de forma impredecible. No es posible corregir el error aleatorio. [ISO 3534: 3.9] Error sistemtico Es una componente del error que, en el curso de un nmero de resultados de un test de las mismas caractersticas, permanece constante o vara de forma predecible. Los errores sistemticos y sus causas pueden ser conocidos o desconocidos. [ISO 3534: 3.10]
Responsabilidades en la obtencin de evidencia objetiva para la validacin de las caractersticas metrolgicas de los procedimientos de medida del laboratorio clnico. Qum Cln, 2003; 22: 33-5. pgina 2
Sesgo
Intervalo lineal
Linealidad
Precisin
Precisin
Condiciones de repetibilidad
Concordancia entre el valor promedio obtenido en una serie larga de resultados de un test y un valor aceptado como de referencia. [ISO 3534: 3.12] Habitualmente se expresa numricamente mediante la medida estadstica del sesgo que est inversamente relacionado con la veracidad Es la diferencia entre la expectativa de los resultados de un test y un valor de referencia aceptado. El sesgo es el error sistemtico total, en contraste con el error aleatorio. Puede haber una o ms componentes del error sistemtico que contribuyen al sesgo. Una diferencia sistemtica grande entre un valor aceptado como referencia se refleja mediante un valor de sesgo mayor. [ISO 3534: 3.13] La veracidad equivale a la ausencia de sesgo Es el intervalo en el cual los resultados de un mtodo analtico son aceptablemente lineales; esto es, en el que el error de nolinealidad es menor que un error criterio dado Es la capacidad (en un intervalo dado) de proporcionar resultados que son directamente proporcionales a la concentracin (cantidad) de analito presente en la muestra analizada. La linealidad suele aplicarse a todo el sistema de respuesta (p.ej. a la respuesta analtica final antes que a la lectura de salida del instrumento); La linealidad de un sistema se mide chequeando niveles de un analito que son conocidos por formulacin o con respecto a otro (no es necesario que se conozca el nivel absoluto); cuando los resultados del sistema se representan frente a estos valores, el grado en el que la curva representada se aproxima a una lnea recta es una medida de la linealidad del sistema. Es la concordancia entre los resultados independientes de un test obtenidos bajo unas condiciones estipuladas. La precisin depende slo de la distribucin de errores aleatorios y no se relaciona con el valor verdadero o especificado. La medida de la precisin habitualmente se expresa en trminos de imprecisin y se calcula como una desviacin tpica de los resultados de un test. Una menor precisin se refleja en una mayor desviacin tpica. Se habla de resultados independientes de un test cuando han sido obtenidos de manera que no estn influenciados por ningn resultado previo del mismo o similar al objeto del test. La medida cuantitativa de la precisin depende de manera fundamental de las condiciones estipuladas. Las condiciones de repetibilidad y de reproducibilidad son casos particulares de condiciones estipuladas extremas [ISO 3534: 3.14] Como la precisin depende de las condiciones de la medida, stas deben ser especificadas cuando se hace referencia a una estimacin de la precisin. A continuacin se definen trminos de uso comn empleados para describir las condiciones de medida Son condiciones en las que se obtienen resultados independientes de un test con el mismo mtodo en sistemas idnticos en el mismo laboratorio por el mismo operador empleando el mismo equipo y en intervalos de tiempo cortos. [ISO 3534: 3.15]
pgina 3
Condiciones de reproducibilidad
Repetibilidad
Son condiciones en las que los resultados de un test se obtienen mediante el mismo mtodo en sistemas idnticos en diferentes laboratorios con diferentes operadores y empleando diferentes equipos. [ISO 3534: 3.20]. Las condiciones de repetibilidad suponen repetir la ejecucin del mtodo entero desde un punto en el que se toma una alcuota de la muestra del laboratorio, no se reduce nicamente a repetir las determinaciones instrumentales en extractos preparados Precisin estimada bajo condiciones de repetibilidad [ISO 3534: 3.15] NOTAS Se distingue entre repetibilidad y reproducibilidad refirindose a la primera cuando se realizan medidas sucesivas bajo las mismas condiciones, y a la segunda cuando las medidas se realizan bajo diferentes condiciones de medida2. Para las condiciones de repetibilidad, las definiciones de VIM e ISO3534 son casi idnticas Sin embargo, la definicin de VIM de las condiciones de reproducibilidad es ms general que la de la norma ISO 3534, e incluye medidas intralaboratorio sobre periodos extensos de tiempo y/o incluso medidas empleando diferentes principios de medida. Esta terminologa ms general es cada vez ms comn. Por este motivo, se recomienda que las condiciones de medida se indiquen siempre cuando se refiere la reproducibilidad
La norma ISO 5725 discute adicionalmente medidas de precisin intermedia, y proporciona la notacin para condiciones en que varan el tiempo, calibracin, operador y equipo Reproducibilidad Precisin bajo condiciones de reproducibilidad [ISO 3534: 3.20] Precisin Precisin calculada cuando se obtienen resultados independientes en series interserial (run separadas en el mismo laboratorio con el mismo mtodo y en el mismo torun) material Periodo en el que se realiza el anlisis bajo condiciones de repetibilidad y se Run mantienen constantes los factores que afectan a la exactitud. Ntese que los runs separados habitualmente se realizan en distinto tiempo e involucran alguna recalibracin del instrumento Condiciones de Cuando los resultados de un test se obtienen con el mismo mtodo en precisin idntico sistema de medida y test, pero bajo diferentes condiciones de intermedia operacin. (a) Hay cuatro elementos de las condiciones de operacin: tiempo, calibracin, operador, y equipo; (b) deben anotarse las condiciones que cambian. Suele incluir estimaciones de la imprecisin, como las comnmente denominadas interserial (betweenrun), intrada (withinday), interda (betweenday), instrumental (withindevice) e intralaboratorio (withinlaboratory) Condiciones de Condiciones donde se obtienen resultados independientes con el mismo repetibilidad mtodo en idntico material y en el mismo laboratorio, por el mismo operador usando el mismo equipo y en un periodo corto de tiempo (ISO 3534-1); Anteriormente se denominaba precisin intraserial (withinrun) Condiciones de Los resultados se obtienen con el mismo mtodo en idntico sistema y en reproducibilidad diferentes laboratorios con diferentes operadores y diferentes equipos (ISO 5725-1)3
2 3
ISO. International of vocabulary of basic and general terms of metrology (VIM). Geneva:ISO, 1993. ISO. Accuracy (trueness and precision) of measurement methods and results Part 1: General principles and definitions. ISO 5725-1. Geneva:ISO, 1994. pgina 4
Precisin Instrumental
Precisin estimada mediante medidas repetidas en una nica solucin problema, sin ajustes instrumentales, en un periodo corto de tiempo NOTAS La precisin instrumental no es una definicin ISO, sino un tipo de precisin que frecuentemente se encuentra en las especificaciones de los instrumentos. Difiere de la repetibilidad en que no incluye repeticin de todo el mtodo analtico, sino slo la medida instrumental en si, frecuentemente incluso sin ajustes instrumentales
Mensurando Incertidumbre
Las condiciones interseriales (runtorun) constituyen un caso especfico de las condiciones de reproducibilidad en la definicin VIM, y se corresponden con las condiciones intermedias definidas por la norma ISO 5725 Cantidad sujeta a una medida [ISO 3534: 3.5] (a) Una estimacin asociada a un resultado que caracteriza el intervalo de valores en los que debe encontrarse el valor verdadero. [ISO 3534: 3.25] (b) (de medida) Parmetro asociado con el resultado de una medida, que caracteriza la dispersin de los valores y puede atribuirse razonablemente al mensurando. [GUM: 2.2.3]4 NOTAS Las definiciones (a) y (b) difieren en la filosofa, pero para la mayora de los propsitos pueden considerarse equivalentes Una estimacin de la incertidumbre debe incorporar tanto lo que se conoce acerca de los efectos aleatorios como de la incertidumbre asociada a efectos sistemticos de los procesos de medida Dado que la estimacin de la incertidumbre incorpora las incertidumbres de todos los posibles efectos, una estimacin de la incertidumbre es probablemente el modo ms apropiado de expresar la exactitud de los resultados
En un anlisis convencional, la incertidumbre asociada con un resultado individual se estima habitualmente a partir de estudios previos, que incluyen estudios de validacin y no se requiere una estimacin individual de la incertidumbre de cada resultado Es la incertidumbre del resultado de una medida, expresada como desviacin estndar [GUM: 2.3.1] Cantidad que define un intervalo en torno al resultado en el que se espera que se encuentre una fraccin grande de la distribucin de valores que pueden atribuirse razonablemente al mensurando [GUM: 2.3.5] La ilustracin clsica de la exactitud y precisin en trminos de una diana ya no describe correctamente la exactitud. sta se refiere a una combinacin de errores sistemticos y aleatorios, por lo que la siguiente grfica es ms adecuada
ISO Guide to the expression of uncertainty in measurement. Geneva:ISO,1995. ISBN 92-67-10188-9. pgina 5
3. Precisin
En el presente apartado se presenta el protocolo de estudio de imprecisin segn recomendaciones del CLSI.5 Se recomienda consultar tambin otros protocolos publicados por la SEQC para conocer otros posibles enfoques del procedimiento.6
NCCLS. Documento EP5-A2Evaluation of precision performance of quantitative measurement methods; Approved guideline 6 Recomendaciones para el estudio de la precisin de los procedimientos de medida en el laboratorio clnico. Qum Cln 2003; 22: 63-5 pgina 6
Imprecisin intralaboratorio. De estas, la repetibilidad y la imprecisin intralaboratorio son generalmente las de ms inters. En este diseo, no se pretende incorporar especficamente las estimaciones separadas de otras fuentes significativas de variabilidad, como el calibrador o las diferencias de lote de reactivos o de tcnicos/operadores.
pgina 7
aceptables para llevarlo a cabo. Durante los primeros cinco das del experimento, el usuario debe familiarizarse con el protocolo. Se considera un mtodo corto a aquel en que la duracin de la determinacin es inferior a 2 h, mientras que un mtodo largo (como el radioimmunoanlisis) dura considerablemente ms y no se procesa ms de uno al da. Para mtodos largos, existe un procedimiento aplicable incluyendo una serie analtica por da. Para procedimientos cortos, las muestras pueden ser analizadas en cualquier momento de la serie analtica. Para realizar el anlisis de la varianza, una serie analtica de evaluacin es un periodo de tiempo discreto de recogida de datos diseado para poder estimar la variabilidad (o deriva) en un da. Para algunos dispositivos, como instrumentos de acceso aleatorio, discretos, o individuales, el concepto de serie analtica (run) puede no ser apropiado. En este caso, las muestras deberan procesarse por duplicado en condiciones de repetibilidad y tiempos aleatorios a lo largo de una jornada de trabajo para simular la operacin real de instrumento. Cada da habr que realizar los siguientes pasos: 1. Analizar dos series analticas (runs o batches); 2. Si una serie analtica debe ser rechazada debido al control de calidad o a dificultades operativas, se realiza una nueva serie analtica despus de que se haya solucionado el problema; 3. En cada serie, se analizarn dos alcuotas del material chequeado para cada concentracin; 4. Se deben incluir en cada serie las muestras de control de calidad que se juzguen necesarias para valorar la aceptabilidad de la serie analtica o el da; 5. Se cambia el orden de anlisis de los materiales analizados y muestras de control de calidad para cada serie analtica o da; 6. Para simular la operacin verdadera, se incluyen al menos diez muestras de pacientes en cada serie, si es posible; 7. Separar la series analticas realizadas cada da al menos en 2 h.
sf =
donde I
( x
i =1 j =1
i j1
xi j2 )
4I
es el nmero total de das (generalmente 20); es el nmero de series analticas (intrada) (1 2); es el resultado para el replicado 1, de la serie j en el da i ; es el resultado para el replicado 2, de la serie j en el da i .
x I j1 xI j2
pgina 8
Se necesitan dos resultados de cada uno de las dos series analticas de cada da para usar la frmula anterior. Si solo se dispone de una serie analtica en un da dado, se puede utilizar la frmula (con j = 1 ). Siempre que no haya ms de un 10 % de los das de la evaluacin en que falten series analticas (por ejemplo, con un solo run) en un diseo experimental de dos series analticas por da, los clculos resultantes pueden ser vlidos (aplicando las frmulas del Apndice 1) si slo hay una serie analtica por da.
A =
donde: I
(x
i =1
i 1i
x i 2i )
2I
es el nmero de das (con dos series analticas); es el resultado promedio de la serie analtica 1, en el da i (promedio de dos replicados); es el resultado promedio de la serie analtica 2, en el da i (promedio de dos replicados).
x I j1 xI j2
A se calcula elevando al cuadrado la diferencia entre el promedio de los replicados de la primera y la segunda serie analtica de cada da, sumando dichas cantidades para todos los das, dividiendo por 2 I , y tomando la raz cuadrada. Este clculo no debe emplearse si los datos se han generado en un solo da o solo una serie analtica. Otra estimacin necesaria es:
B =
donde: I es el nmero de das;
(x
i =1
i ii
x iii )
I 1
x i ii x iii
Esta es la desviacin tpica de las medias diarias (Apndice 1) Con estas dos cantidades, se calculan
2 2 sd d = B
s r2r = A 2
donde: s d d
A2 2 s r2 2
es la estimacin de la desviacin tpica interdas (betweenday); es la estimacin de la desviacin tpica interserial (betweenrun).
srr
Si la varianza as calculada fuera negativa, por convenio se considerar igual a cero. La estimacin de la imprecisin intralaboratorio o instrumental (withindevice) se calcula con la siguiente frmula para la desviacin tpica:
sT =
2 2 2 sd d + srr + sr
Con esta formula para s T el resultado obtenido ser diferente al estimado con el clculo mediante la desviacin tpica de todos los datos (sin tener en cuenta el da o la serie analtica). La formula anterior es la forma correcta para estimar la imprecisin instrumental, porque sopesa adecuadamente la repetibilidad as pgina 9
como las componentes de la imprecisin interdas e interserial. El coeficiente de variacin (expresado en porcentaje) correspondiente a esta estimacin de la imprecisin debera calcularse dividiendo s T por la concentracin del material analizado y multiplicado por 100.
3.9. Comparacin con los datos de imprecisin del fabricante u otros criterios
La estimacin de la imprecisin obtenida en la seccin anterior puede compararse con las especificaciones de la imprecisin del fabricante. El estadstico jicuadrado
tomar como referencia la estimacin puntual que ofrezca el fabricante (por ejemplo, la desviacin tpica). Se deben comparar por separado la repetibilidad y la imprecisin intermedia.
( ) . El test de ji
r
cuadrado usa el cuadrado de las estimaciones de la repetibilidad, tanto del usuario como del fabricante. Deben conocerse el nmero de grados de libertad asociados con s r (varianza intraserial estimada por el usuario). s r tendr tantos grados de libertad como pares de datos (replicados) se usen para calcularla. Por tanto, ser igual el nmero de series analticas realizadas en el experimento, identificadas en adelante como R . Para aplicar el test es necesario calcular el siguiente valor:
2
2 =
donde: s r
2
s r2 R
2 r
es la repetibilidad estimada por el usuario (varianza); es la repetibilidad aportada por el fabricante (varianza); y es el nmero total de series analticas realizadas (grados de libertad para s r ).
2
2 r
R
El valor calculado de
utilizando el valor
crtico superior del 95 % de confianza con R grados de libertad (tabla 1). Si el valor calculado es inferior al de la tabla, la estimacin no es significativamente diferente del valor de la imprecisin aportado por el fabricante y se puede aceptar como verificada.
Tabla 1. Valores crticos de ji-cuadrado para la estimacin de la varianza estimada por el usuario Se puede emplear una aproximacin similar a la anterior para comparar la estimacin de la imprecisin intralaboratorio (o instrumental, within-device) con los requerimientos de la aplicacin mdica de cada parmetro. Sin embargo, a diferencia de la estimacin de la repetibilidad, calcular el nmero exacto de grados de libertad para s T implica un clculo ms complicado. Dada la estructura del protocolo propuesto en este tema, el usuario no puede asumir que todas las observaciones sean independientes, lo que es requisito necesario antes de que se pueda utilizar la estimacin de los grados de libertad del propio usuario (nmero total de observaciones menos uno). La siguiente formula para los T grados de libertad de s T tiene en cuenta esta falta de independencia.
I ( 2 ME + MR + MD ) T = I 2 ME 2 + MR 2 + MD 2 I 1
2
donde: ME = s r
es la media cuadrtica intraserial, o varianza de la repetibilidad; es la media cuadrtica de las series analticas o runs; es la media cuadrtica de los das.
MR = 2 A 2 MD = 4 B 2
El valor entero ms prximo al calculado segn esta formula ser empleado como grados de libertad para s T . Usando este valor, el estadstico apropiado es el siguiente:
2 =
donde: s T
2
2 sT T
T2
es el cuadrado de la desviacin tpica intralaboratorio (o instrumental) estimada por el usuario; es el cuadrado de la desviacin tpica instrumental aportada por el fabricante para el instrumento o requerida para los fines mdicos a los que se destina el anlisis; son los grados de libertad para s T . pgina 11
2 T
Si el valor calculado de
Si, por el contrario, el valor de calculado es mayor que dicho lmite crtico superior del 95 % de la imprecisin estimada no entra dentro de los lmites aceptables para la aplicacin mdica definida. La estimacin del usuario puede ser superior que la desviacin tpica aportada por el fabricante y ser an as aceptable. Dado que el experimento del usuario se basa en un nmero limitado de observaciones, cabe esperar errores de muestreo para los valores calculados de s r y s T en torno a los valores verdaderos. Cuanto mayor sea el tamao del experimento, ms prximas sern las estimaciones al valor real. El test de se usa para determinar si la estimacin del usuario es significativamente peor que la aportada por el fabricante. La valoracin de la tolerancia que puede considerarse aceptable en funcin del analito considerado es una informacin que debe obtenerse a partir de las especificaciones de variabilidad biolgica descritas en la bibliografa y de los requisitos necesarios para que un test tenga utilidad para la aplicacin que se le desee dar.
CLSI Documento EP17 - Protocols for determination of limits of detection and limits of quantitation; Approved guideline. 8 Recomendaciones para el estudio de la capacidad de deteccin de los procedimientos de medida en el laboratorio clnico. Qum Cln 2004; 23: 439-41. pgina 12
de lmite de deteccin. Adems, incluso si la pendiente de la curva de calibracin es pronunciada, la menor concentracin que puede detectarse con fiabilidad puede ser elevada si existe gran variabilidad en la seal medida. Por otra parte, un mtodo con moderada sensibilidad analtica (moderada pendiente de la curva de calibracin) pero muy baja variacin aleatoria de la seal puede tener un lmite de deteccin bajo. Otro uso que incluye el trmino sensibilidad es la denominada sensibilidad funcional, empleada para describir la precisin interserial a muy bajas concentraciones de analito, interesante para ciertos procedimientos diagnsticos con requerimiento de muy alta precisin a bajas concentraciones. Los trminos sensibilidad diagnstica o clnica se emplean para caracterizar o comparar el comportamiento de las pruebas diagnsticas en relacin con una informacin clnica preespecificada (por ejemplo, presencia o ausencia del analito diana relacionado con la enfermedad).
( LMR )
condiciones definidas para el mtodo. Las condiciones definidas incluyen caractersticas establecidas, como sesgo e imprecisin, incertidumbre, entre otras caractersticas. El lmite inferior del intervalo lineal
mtodo tiene una relacin lineal con la concentracin verdadera9. Esto implica requisitos para el error de nolinealidad, el cual debe acompaar a cualquier informe de linealidad. Siempre se cumple que LB < LD < LQ . El resto de lmites pueden no tener una relacin consistente con cada uno de los dems. El puesto relativo de estos lmites vendr determinado por los objetivos de cuantificacin, error de nolinealidad y otras caractersticas definidas para el mtodo.
NCCLS. Documento EP6. Evaluation of the linearity of quantitative measurement procedures: A statistical approach. pgina 13
discriminante entre los resultados positivos y los negativos (tambin denominado umbral o cutoff), y la respuesta instrumental a concentraciones cercanas a cero, deberan estar totalmente documentadas por el fabricante y ser comunicada a los usuarios. Esto no se aplica a los mtodos en que el punto discriminante est muy por encima del lmite de deteccin, como es el caso de los tests de embarazo. Las pruebas cualitativas pueden tener un intervalo dinmico estrecho y alcanzar la saturacin de la seal a concentraciones relativamente bajas. Sin embargo, todas las pruebas cualitativas con un fondo continuo tienen un rea de transicin desde la ausencia de respuesta o seal de fondo hasta la respuesta completa, y el punto discriminante est generalmente diseado para situarse en esa rea. Para algunas pruebas, los fabricantes definen un umbral diferente para los resultados positivos y los negativos, creando una zona donde la respuesta es indeterminada. Esta rea indeterminada se denomina intervalo del 95 % en el documento NCCLS EP12. User protocol for evaluation of qualitative test performance. En dicho documento, sin embargo, no se define un intervalo de confianza estadstico entorno al punto de cutoff, sino que los extremos que delimitan este intervalo son las concentraciones a las que resultados repetidos son positivos el 95 % de las veces o negativos el 95 % de las veces, respectivamente. Cabe destacar que la repeticin de una prueba de concentracin exactamente igual a la del cutoff proporcionar resultados positivos en el 50 % de las rplicas y resultados negativos en el restante 50 % de las veces. En este protocolo, el LB es el mismo que el punto de cutoff, el lmite superior del intervalo del 95 % se corresponde con el LD (donde las muestras verdaderamente positivas producen resultados positivos en el 95 % de las ocasiones), y el lmite inferior del intervalo es el cero (no existe analito presente en la muestra). El conocimiento del lmite de deteccin para un test cualitativo, combinado con el anlisis frecuente de un control positivo dbil, permite monitorizar en el laboratorio la consistencia de la eficacia del mtodo en la zona prxima a la concentracin de cutoff. Es posible experimentar un incremento no observado en el lmite de deteccin de una prueba cualitativa, por ejemplo, debido a cambios en los reactivos. Esto puede incrementar la proporcin de resultados falsamente negativos, debido a que las muestras con concentraciones detectables de un analito pueden tener resultados que caigan por debajo del cutoff, mientras que muestras con concentraciones altas seguiran en todo caso aportando respuestas correctamente positivas. Como consecuencia, la determinacin experimental del LD es importante para controlar la calidad de muchas pruebas cualitativas.
Figura 1. Distribuciones de las concentraciones observadas para el blanco y una muestra de baja concentracin de analito. La lnea discontinua correspondiente a concentraciones negativas indica que algunos instrumentos no proporcionan resultados menores de 0.
10
Currie AL, et al. Nomenclature in evaluation of analytical methods including detection and quantification capabilities (IUPAC recommendations). Pure Appl Chem. 1995; 67: 1699-723. pgina 14
recomend una definicin del mnimo lmite de deteccin en relacin con los niveles
establecidos para el error de tipo I y II. Por defecto, dichos errores se acotan al 5 %
de del 5 % se corresponde con usar el percentil 95 de la distribucin de valores del blanco como lmite para declarar un valor medido significativamente por encima del blanco. Dada una distribucin gaussiana de valores del blanco (figura 1), este lmite se corresponde con:
( = = 5% ) . Un valor
LB = B + 1, 645 B
donde:
[1]
B y B
Para una situacin donde no existe posibilidad de obtener valores negativos, o si la distribucin de los valores del blanco no es gaussiana (por ejemplo, cuando siguen una distribucin asimtrica), el percentil 95 debe estimarse por otra aproximacin. El procedimiento ms directo es aplicar un mtodo no paramtrico basado en los valores ordenados. El percentil que constituye el lmite de la distribucin de los blancos, p B , es el que deja un porcentaje de valores en la cola superior de la distribucin, y se define como lmite de blanco, LB , es decir,
LB = p B 100
[2]
ISO. Capability of detection Part 1: Terms and definitions. ISO 11843-1. Geneva: ISO, 1997. pgina 15
LB = s 1, 645 s
donde:
[3]
s y S
Globalmente, se tendr:
S = LD = LB + 1, 645 S
Si la distribucin de valores del blanco es gaussiana, LB =
LD = B + 1, 645 B + 1, 645 S
En caso de que la distribucin muestral no sea gaussiana (ni se pueda transformar en gaussiana), puede estimarse el LD no paramtricamente, como se ver; En caso contrario, ser necesario producir muestras de concentracin prxima al LD , y chequear cul es el valor para el que el 5 % o menos de las medidas observadas estn por debajo del LB .
Figura 2 Distribuciones de replicados para las muestras de blanco (curva izquierda en ambas figuras) y dos muestras hipotticas positivas de baja concentracin (2a y 2b). Cuando la concentracin real de analito presente en la muestra es igual al LB , el 50 % de las medidas sern superiores al (a). Con una concentracin real en la muestra igual al LD , (100% - ) (95%) de las medidas de las muestras sern superiores al LB (b).
pgina 16
incertidumbre de la estimacin del LB y la variabilidad entre las medidas en las muestras de bajo nivel (se hablar en trminos de s S ). La estimacin no paramtrica del LB es aproximadamente la mitad de eficaz que el procedimiento paramtrico. Esto significa que se espera obtener el mismo resultado mediante procedimientos paramtricos y no paramtricos, pero empleando el mismo nmero de muestras la estimacin paramtrica tiene menor incertidumbre (si los datos son gaussianos). Las incertidumbres del percentil o la estimacin de la desviacin tpica tambin sern proporcionales a la dispersin de las distribuciones. Por tanto, con una estimacin no paramtrica del LB y la estimacin paramtrica del LD , el nmero de medidas de blanco debera ser mayor que el de muestras de baja concentracin. Sin embargo, es ms frecuente que la dispersin de las medidas de la muestra de bajo nivel sea superior que la de las medidas del blanco. En conjunto, en la mayora de los casos puede ser aceptable procesar el mismo nmero de muestras de bajo nivel que de blancos. Cuando el nmero de medidas de blanco es el mismo que el de medidas de bajo nivel, la incertidumbre del LD decrece con el inverso de la raz cuadrada del nmero de medidas (ajustada por el nmero de muestras diferentes incluidas en el estudio). La relacin entre el tamao muestral y la incertidumbre del LD fue descrita por Linnet y Kondratovich.12. Una solucin de compromiso razonable entre precisin y coste es un mnimo de 60 medidas (tanto de blanco como de muestras de bajo nivel) para establecer el LD , generalmente cuando se desarrolla un mtodo. Para verificar un LD estipulado por el fabricante, se emplear un mnimo de 20 resultados de la concentracin esperada y, si es necesario, tambin de la concentracin del LB . Esta ser la evaluacin habitual realizada por el usuario.
Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. Clin Chem. 2004; 50: 732-40. pgina 17
medidas de cada una de cinco muestras. Las medidas deberan realizarse en das diferentes de modo que la s S refleje la variacin analtica total. Para que las estimaciones del LD y el LB tengan significado, los valores medidos deberan ser trazables hasta un nivel conocido. Si existe mtodo de referencia para el analito de inters, deberan compararse las medidas obtenidas por ambos mtodos en concentraciones cercanas al mmite inferior del intervalo analtico. La trazabilidad tambin puede comprobarse con medidas sobre muestras suplementadas.
4.11. Resultados
Las medidas pueden realizarse de una caracterstica o propiedad como la concentracin o la actividad siempre que la cantidad medida (el mensurando) est claramente definida. Cuando el mensurando difiere del analito de inters (por ejemplo, una actividad enzimtica no es lo mismo que la concentracin en masa del enzima), la cantidad debe estar bien definida. Esto es esencial para entender las diferencias en LD para diferentes mtodos o bajo diferentes condiciones de medida.
[5]
Si no es un valor entero se realizar una interpolacin lineal. En la prctica suele calcularse el percentil de orden 100 mediante cualquier software apropiado.
( ) a partir de
NS
medidas repetidas de muestra(s) con una concentracin baja detectable, por ejemplo, una concentracin en aproximadamente de cuatro veces el LB . Se recomienda un mnimo de 60 resultados obtenidos a partir de muestras de baja concentracin. El procedimiento preferido es tomar varias muestras de bajo nivel (de cuatro a seis) y calcular una estimacin conjunta de la precisin a esos niveles. Antes de juntar las estimaciones individuales de la precisin, debera comprobarse la consistencia de las mismas mediante un test F convencional (dos muestras) o un test de Cochran, en caso de que se trate de ms de dos muestras. Si el test falla, es preciso investigar una posible causa tcnica. Puede ser indicativo de inestabilidad de la reaccin o de que alguna de las muestras est afectada de una variabilidad superior a la esperada. Se obtiene de este modo una estimacin preliminar, LD p segn:
LD p = LB + c s S
donde: s S
[6]
pgina 18
debido a que la s S es una estimacin sesgada de la desviacin tpica poblacional Si el nmero de medidas N S no es demasiado pequeo,
S.
c =
1, 645 1 1 4g
donde: g
(N
c =
No es necesario ni deseable obtener todas las medidas en la misma muestra de baja concentracin. El motivo es que el empleo de varias muestras permite tener en cuenta la variabilidad entre sujetos. Consideraciones acerca de la desviacin tpica Es importante considerar si la s s obtenida al nivel medido puede ser la misma que al nivel del LD p . En la estimacin del LD , un problema comn es que la desviacin tpica muestral no sea constante, pues frecuentemente aumenta con la concentracin. Sin embargo, en un intervalo limitado de concentraciones, podra ser aproximadamente constante y el procedimiento anterior es adecuado. Si se puede asumir una s s constante, entonces LD = LD p . En caso contrario, se debe considerar una aproximacin ms complicada, asumiendo que la desviacin tpica muestral es funcin de la concentracin13,14.
LD = LB + D S ,
Si la s S no es constante, y no es posible obtener datos normales, deber emplearse un procedimiento de prueba y error no paramtrico Se prepararn muestras a niveles similares al LD esperado y se obtendr una serie de medidas (en distintos tiempos y con diferentes operadores). Se calcularn los percentiles ,
ISO. Capability of detection. Part 1. Terms and definitions. ISO 11843-1. Geneva:ISO, 1997. ISO. Capability of detection. Part 2. Methodology in the linear calibration case. ISO 11843-2. Geneva:ISO, 2000.
14
13
pgina 19
como porcentaje de observaciones por debajo de LB . El LD es el menor nivel para el cual dicho percentil sea del 5 % o menor.
n
20 30 40 50 60 70 80 90 100 150 200 250 300 400 500 1000
Tabla 2. Lmites inferiores del 95 % de confianza para los resultados observados que excedan el LB con una proporcin esperada de 1- = 95 % (modificado de Linnet & Kondratovich)15 Ejemplo de verificacin de un LD Un procedimiento analtico para medir una hormona un LD de 45 UI/L segn el fabricante con = = 5% . El usuario determina 25 medidas de blanco (5 medidas de 5 muestras de blanco durante 5 das) y 25 medidas en muestras a las que se ha aadido 45 U/L del analito (5 medidas de 5 muestras en 5 das). Los resultados se presentan en la tabla 3 y la figura 2. La inspeccin visual revela que la distribucin Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. Clin Chem. 2004; 50: 732-40. pgina 20
15
de valores del blanco es asimtrica y, por lo tanto, se estima el LB no paramtricamente. El percentil 95 es 20,28.
orden
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
blancos muestras
0 0 0 0 0 0 0 0 0 1,08 1,92 2,38 2,98 3,8 4,78 7,3 8,81 10,31 11,29 13,48 14,39 16,97 17,4 21 24 18,8 19,02 26,63 26,91 31,08 33,99 35,11 35,9 36,12 41,67 43,9 46,32 47,77 47,99 48,83 54,67 57,3 59,1 61,17 61,96 62,97 66,44 73,44 73,8 75,71
Figura 3. Ejemplo de verificacin del LD distribuciones de las 25 medidas del blanco y de las 25 de muestras suplementadas con analito de modo que la concentracin sea igual al LD supuesto de 45 U/L. Se estim el LB en 20,28 UI/L (p95 de la distribucin de los blancos). El 92 % de las medidas de las muestras, 23 , superaron el LB . pgina 21
25
En la tabla 3 se observa que el 92 % es mayor que el lmite inferior (85 %) para una confianza del 95 % siendo el tamao muestral de 25. Por tanto, la proporcin observada no es contradictoria con el LD esperado.
5. Lmite de cuantificacin
El Lmite de cuantificacin ( LQ ) es la menor cantidad de analito que puede ser detectado con fiabilidad (el
LD ), y al cual el error total cumple los requisitos del laboratorio para aportar un aceptable uso clnico. Dependiendo del objetivo definido para el error, el LQ puede ser igual la LD o mucho mayor. Nunca
puede ser inferior. El LQ debera determinarse como parte del desarrollo del mtodo y puede ser documentado por el fabricante. El usuario puede establecer su propio LQ o verificar el del fabricante. No es necesario determinar el LQ para cada mtodo si puede determinarse la incertidumbre (o error total) de la medida para los niveles bajos. En estos casos, puede ser aceptable informar la incertidumbre estimada del resultado de cada resultado de nivel bajo y permitir al usuario interpretar si es adecuado para su uso.
se obtienen hasta tres resultados con error excesivo, el LQ puede considerarse verificado. Si existe duda acerca de este resultado (en el ejemplo, permitiendo al 10 % de las muestras tener un error excesivo), deben obtenerse ms replicados. Si no se cumple este criterio, el LQ descrito por el fabricante quedar en entredicho.
resultado LB
no detectado; concentracin < LD ; analito detectado; concentracin < LQ; analito detectado; concentracin < LQ ; o bien
(b) se informa el resultado advirtiendo de que posiblemente est sujeto a mayor incertidumbre; Si
resultado > LQ
se informa.
Si un laboratorio elige informar slo resultados cuantitativos y simplificar el informe de las concentraciones inferiores al LQ , puede ser adecuado el siguiente procedimiento: Si Si Si
resultado LB resultado LQ
se informa como
Figura 4. 5.3.2. Precauciones en la interpretacin de resultados cuantitativos Los valores medidos menores que el LQ pero superiores al LB pueden servir para demostrar la presencia del analito, pero los niveles reales medidos no deberan emplearse para ninguna interpretacin clnica. Los resultados que se siten entre el LD y el LQ no deberan informarse sin alertar de la posible mayor incertidumbre de esos valores. El LD y el LQ pueden coincidir o diferir en cierta cantidad, dependiendo de la incertidumbre del LD y de los objetivos del laboratorio. Si hay diferencia entre ambos valores, no se puede asumir que la respuesta medida entre el LD y el LQ sea lineal, ni siquiera que siga una funcin montona creciente. Aunque esta monotona sea cierta en la mayora de los casos, pueden darse situaciones en que no exista relacin a esos pgina 23
niveles, debido a discontinuidades, valores nulos, etc. Si no existe una documentacin clara acerca de la relacin montona, no deben hacerse interpretaciones acerca de concentraciones en este intervalo de concentraciones. En la prctica rutinaria, el LD y el LQ deberan emplearse como se ha descrito anteriormente para decidir cmo informar los resultados. Existen otras situaciones, como es el caso de que se use el promedio de varias rplicas como resultado para un sujeto, o en estudios cientficos, en que deben registrarse las concentraciones medidas (si se dispone de ellos), independientemente de que estn por debajo o por encima del LD , porque en estas situaciones si se emplean resultados truncados, cualquier promedio estara sesgado.
6. Linealidad
La demostracin del intervalo lineal requiere una serie de concentraciones conocidas o relaciones conocidas establecidas por dilucin. En todas las situaciones la secuencia de anlisis debe ser aleatoria. El experimento del intervalo lineal requiere contar con suficiente cantidad de cada espcimen para preparar diluciones y llevar a cabo el anlisis de cada uno de cinco o ms concentraciones. El volumen puede variar segn lo que se desee establecer: Para demostrar que la operacin del sistema est dentro de las especificaciones del fabricante deben emplearse de cinco a siete concentraciones elegidas a lo largo de todo el intervalo lineal establecido. Deben chequearse dos replicados de cada nivel. En el desarrollo de mtodos nuevos, si se desea establecer el intervalo lineal, o cuando se quiere modificar un mtodo ya existente, deberan emplearse entre siete y once concentraciones a lo largo del intervalo de medida que se espera de antemano. En el desarrollo de mtodos se puede emplear ms puntos y ampliar dicho intervalo hasta hacerlo un 20 30 % ms amplio, con la intencin de eliminar algunos de los puntos y obtener el intervalo lineal ms amplio posible. Deben usarse de dos a cuatro replicados de cada nivel, dependiendo de la imprecisin esperada.
El nmero mnimo de puntos para describir de una manera fiable un intervalo lineal es cinco, mediante un mtodo polinmico. Con mayor nmero de puntos, se obtendr una descripcin ms exacta de la linealidad se podr tambin establecer un intervalo lineal ms amplio, una vez se hayan eliminado los puntos necesarios. Se recomienda preparar adecuadamente niveles de concentracin intermedia igualmente espaciados mezclando proporcionalmente un pool alto y uno bajo, aunque el mtodo que se propone en el documento CLSI EP6 no lo requiere necesariamente.9 Se acepta el empleo de muestras especialmente preparadas para obtener concentraciones especficas, dado que se conocern las concentraciones relativas a cada una de las dems. Para esta evaluacin, se cometer menos error si se emplean mezclas preparadas, dispensando con exactitud adecuada, a partir de un pool alto y otro bajo, que si se emplean muestras individuales o soluciones reconstituidas o preparadas en el laboratorio. Debe tenerse especial precaucin cuando se dispensen volmenes pequeos. Las pipetas de desplazamiento positivos son tiles para preparar diluciones exactas con pequeos volmenes.
S = 5 muestras S = 6 muestras
1: bajo (L) 2: 0,75 L + 0,25 H 3: 0,50 L + 0,50 H 4: 0,25 L + 0,75 H 5: Alto (H) 1: bajo (L) 2: 0,80 L + 0,20 H 3: 0,60 L + 0,40 H 4: 0,40 L + 0,60 H 5: 0,20 L + 0,80 H 6: Alto (H)
S = 7 muestras
1: bajo (L) 2: 0,833 L + 0,167 H 3: 0,667 L + 0,333 H 4: 0,500 L + 0,500 H 5: 0,333 L + 0,667 H 6: 0,167 L + 0,833 H 7: Alto (H)
S = 8 muestras
1: bajo (L) 2: 0,857 L + 0,143 H 3: 0,714 L + 0,286 H 4: 0,571 L + 0,429 H 5: 0,429 L + 0,571 H 6: 0,286 L + 0,714 H 7: 0,143 L + 0,857 H 8: Alto (H)
S = 9 muestras
1: bajo (L) 2: 0,875 L + 0,125 H 3: 0,750 L + 0,250 H 4: 0,625 L + 0,375 H 5: 0,500 L + 0,500 H 6: 0,375 L + 0,625 H 7: 0,250 L + 0,750 H 8: 0,125 L + 0,875 H 9: Alto (H) Tabla 4. Esquemas de dilucin para preparar muestras de cinco a once concentraciones igualmente espaciadas
pgina 24
Se pueden emplear productos comerciales para diagnstico in vitro, siempre que se sigan las instrucciones del fabricante. Estos productos permiten verificar cuantitativamente una calibracin, validar intervalos de medida, y determinar la linealidad de sistemas qumicos automticos, semiautomticos y manuales. A continuacin, se presenta una lista de posibles tipos de especmenes en orden de preferencia para la aplicacin que nos atae. Debe extremarse la precaucin en lo que respecta a emplear una matriz apropiada para un mtodo particular.
6.4. Pool diluido con materiales tratados de baja concentracin o con otro pool tratado
Si es posible, se emplear para las diluciones un pool de pacientes de baja concentracin. Alternativamente, pueden emplearse ciertos tratamientos para reducir la concentracin de analito, (como dilisis, tratamiento por calor o cromatografa). Debe tenerse en cuenta que estos tratamientos pueden alterar el analito y/o la matriz fsica o qumicamente. Es ms importante mantener constante la matriz que alcanzar bajos niveles por simple dilucin.
6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado
Cuando se empleen estas muestras debe considerarse posibles efectos de matriz que puedan afectar a los resultados. Las diluciones deben ser las mnimas necesarias y han de documentarse.
6.7. Material de control comercial diluido con diferente volumen del establecido
Cuando se empleen estas muestras deben considerarse posibles efectos de matriz que puedan afectar a los resultados: estos efectos pueden modificar la concentracin. Las diluciones deben ser las mnimas necesarias y han de documentarse. Debe extremarse la precaucin para asegurar que se consigue una completa disolucin del material liofilizado.
pgina 25
Pool 4: 1 parte de pool 1 y 3 partes de pool 5. La concentracin de cada pool se define por la siguiente frmula
concentracin =
donde: C 1 es la concentracin de Pool 1; es a concentracin de Pool 5; es el volumen del Pool 1; es el volumen de Pool 5.
C 1 V1 + C 5 V 5 V1 + V 5
C5 V1 V5
pgina 26
Debe tomarse la precaucin de mezclarlos perfectamente y protegerlos de la posible evaporacin y deterioro. Por ejemplo, para un sistema analtico que requiera 0,05 mL por determinacin, y se chequeen 10 muestras por concentracin, se necesitarn al menos 0,5 mL adicionales de volumen muerto. Supongamos que la concentracin del pool 1sea de 120 unidades y la del de concentracin baja de 40 unidades (no es preciso conocer la concentracin antes de analizarlo). (1) Especmenes para Pooles 1 y 5: alcuotas de 0,6 mL se dispensan en tubos apropiadamente rotulados. (2) Pool 2: se aaden 0,6 mL de Pool 1 a 0,2 mL de Pool 5. (3) Pool 3: Se mezclan 0,4 mL de Pool 1 y 0,4 mL de Pool 5. (4) Finalmente, el Pool 4 se hace mezclando 0,2 mL de Pool 1 y 0,6 mL de Pool 5. La concentracin de Pool 4 se calcula segn:
Pool 4 =
Las concentraciones esperadas de los pooles son 40, 60, 80, 100, y 120 unidades. La representacin de los resultados analticos puede emplear concentraciones conocidas o calculadas. Para establecer el intervalo lineal: 9 a 11 niveles, y 2 a 4 replicados de cada nivel. Para validar las especificaciones de un mtodo: 7 a 9 puntos, y 2 o 3 replicados de cada nivel.
Para confirmar que el intervalo lineal es vlido en un laboratorio: 5 a 7 niveles, y 2 replicados de cada nivel. Las muestras deberan analizarse aleatoriamente durante la misma serie o series analticas prximas. El nmero de rplicas deber ser suficiente para proporcionar una estimacin fiable de la concentracin a cada nivel. Para algunos analitos, en algunas concentraciones, se puede requerir 35 rplicas. Los usuarios deben juzgar acerca del nmero de rplicas necesarias. Este procedimiento no se ve afectado negativamente por el empleo de diferente nmero de replicados a diferentes niveles. En este captulo, se hablar de outliers en el sentido de aquellos resultados aislados que sean visual o estadsticamente diferentes del resto de los resultados, y se aplica slo a valores individuales de los replicados. No son mltiples replicados del mismo nivel o un valor promedio a un nivel; Estos tipos de resultados desviados seran indicativos de falta de linealidad o de error sistemtico. Los outliers son resultados que proceden de errores probados o razonablemente asumidos. En este contexto, los outliers son resultados que no se ajustan al patrn representado por el resto de los datos. La inspeccin visual de la grfica de los resultados frente a los valores esperados suele ser suficiente para detectarlos. Un nico outlier en una serie de datos puede ser eliminado y no necesita ser reemplazado. Si subjetivamente se observa ms de un punto candidato a ser eliminado, el sistema de medida probablemente sea impreciso, y las causas de la misma deberan ser examinadas y a ser posible solucionadas antes de tratar de establecer o verificar la linealidad del mtodo.
pgina 27
A continuacin, se realiza un anlisis de regresin polinmica para polinomios de primero, segundo y tercer orden. Esto puede llevarse a cabo en la mayora de los programas estadsticos comerciales.
polinomio
y = b 0 + b1 x
y = b 0 + b1 x + b 2 x 2 y = b 0 + b1 x + b 2 x 2 + b3 x 3
El modelo de primer orden es una lnea recta. Esta ser la ecuacin de mejor ajuste lineal tanto si el mtodo es lineal como si no lo es. El modelo de segundo orden describe una relacin en la que existe una curva de respuesta, tanto con una tendencia creciente en la misma como decreciente. El modelo de tercer orden ajusta situaciones donde la respuesta cambia segn los niveles; respuestas con forma sigmoide se ajustan bien a este modelo, dado que son modelos donde no hay linealidad en los extremos del intervalo de medida. Los coeficientes de regresin se etiquetan como bi . En el modelo de segundo orden, b 2 es el coeficiente de nolinealidad; en el modelo de tercer orden, b 2 y b3 son coeficientes de nolinealidad. Se debe obtener el error estndar de la pendiente para cada coeficiente de nolinealidad, es i . El siguiente paso es realizar una prueba t para comprobar si los coeficientes de nolinealidad son estadsticamente significativos; esto es, si el coeficiente es significativamente diferente de cero. Los primeros dos coeficientes b 0 , b1 chequean porque nunca reflejarn noinealidad. El test se calcula como sigue, para b 2 y b3 :
) no se
t =
bi es i
= 0, 05 ),
observado de t . Si ninguno de los coeficientes de nolinealidad, b 2 o b3 , son significativos ( p > 0, 05 para todos), puede considerarse que los datos son lineales y el anlisis est completado excepto si es preciso chequear una gran imprecisin. Si alguno de los coeficientes de nolinealidad son significativos, b 2 en el modelo de segundo orden, o b 2 o
b3 en el modelo de tercer orden, ( p < 0, 05 ) , entonces los datos no son lineales segn este protocolo. Es
importante notar que ste es un mero test de significacin estadstica, e indica solo que se ha detectado falta de linealidad, no que sea suficientemente relevante como para afectar a los resultados de los pacientes.
pgina 28
medidos y el modelo, de modo que el modelo con menor valor de es y , x proporciona el mejor ajuste de los
DL i = p ( x i ) ( b 0 + bi x i )
donde: x vara desde x1 a x s ; y
Calcular la diferencia entre dos replicados a cada nivel; Elevar al cuadrado las diferencias entre replicados; Sumar las diferencias al cuadrado; Dividir por el nmero de niveles ( L ) x 2; Tomar la raz cuadrada.
sr =
(r
i =1
i1
ri 2 )
2L
ri1 y ri 2 pueden ser tanto resultados reales del procedimiento como expresarse como porcentajes de la
media (aunque se deben usar las mismas unidades para todos los niveles). Si se emplean las diferencias porcentuales entonces el resultado obtenido sera un CV x en lugar de s x . Para situaciones con ms de dos replicados, la estimacin del error aleatorio deber venir de un anlisis de la varianza.
sr =
donde: R
(r
i =1 j =1
ij
r ji )
L ( R 1)
( j =1, 2, , R ) ;
L ri
Se compara s x con el objetivo para la repetibilidad, tanto si se expresa con sus unidades como en porcentaje. Si s x es mayor que el objetivo, la imprecisin puede no ser adecuada para efectuar una determinacin fiable de la linealidad. Esto es, la media de los replicados a cada nivel puede ser demasiado incierta para realizar una determinacin veraz de la linealidad. En este caso puede ser necesario estudiar el motivo de la imprecisin, corregirlo y repetir el experimento de linealidad. Cuando la repetibilidad es muy diferente a lo largo de las distintas concentraciones, puede ser preferible emplear regresin ponderada para el modelo lineal. Para ello se utiliza el inverso de la varianza de los replicados a cada nivel.
NCCLS. Estimation of total analytical error for clinical laboratory methods. Approved guideline. NCCLS document EP21-A. pgina 30
Los niveles de las muestras deben ser conocidos sin error (niveles reales conocidos, o conocidos con respecto a cada uno de los otros); El intervalo lineal se chequear slo entre las concentraciones menor y mayor que demuestren caractersticas aceptables; El intervalo lineal se evaluar para la salida final del sistema (concentracin o actividad) y no para la seal instrumental, la cual puede ser procesada posteriormente por el sistema; Las muestras usadas han de estar libres de interferencias, que invalidaran el experimento; El sistema analtico cumplir el resto de caractersticas en el intervalo lineal chequeado; Los tests de significacin de los coeficientes de regresin tambin asumen que los replicados se distribuyen segn una normal a cada nivel, y que la varianza de esta distribucin es constante a lo largo de todos los niveles.
Cuaderno tcnico: calibracin de equipos de medida industriales segn iso 9000. UNE-EN-ISO 9000: Normas para la gestin de la calidad y el aseguramiento de la calidad. (Partes individuales publicadas como ISO 9000, ISO 9001, ISO 9002, ISO 9003 e ISO 9004). AENOR, Madrid, 1994. 19 UNE-EN 300121: Requisitos de aseguramiento de la calidad de los equipos de medida. Parte 1: Sistema de confirmacin metrolgica de los equipos de medida. (ISO 100121: 1992). AENOR, Madrid, 1994.
18
17
pgina 31
r =
(x
i =1
x )( y i y )
2 n
( x
i =1
x)
( y
i =1
y)
es una medida de la relacin entre dos variables x e y . Tiene diversas propiedades muy tiles (vase el tema Correlacin, Notas). Su uso en calibracin, sin embargo, se basa en una incorrecta interpretacin bastante generalizada. Es cierto que, si los puntos de la calibracin se ajustan mucho a una recta, el valor experimental de r ser prximo a la unidad (figura 5).
Figura 5. Datos A Sin embargo, la afirmacin inversa no es cierta. Un valor de r prximo a la unidad no necesariamente procede de una relacin lineal sino que puede ser, por ejemplo, resultado de que los puntos se ajusten claramente a una curva (figura 4).
Figura 6. Datos B Existe un problema adicional relacionado con esto: los valores de r no pueden compararse apropiadamente. No es correcto decir que unos datos con r = 0,99 sean ms lineales que otros con una
r = 0,95 . Lo mismo ocurre con el estadstico R 2 obtenido de una regresin. Subyace una cuestin de grado. Una calibracin con r = 0,9999 se aproximar necesariamente a una recta. El problema es que no
se puede decir cunto o si ser lo suficientemente prxima.
Sin embargo, si no hay linealidad, se podr percibir un patrn en la grfica de los residuales, generalmente con forma de una tendencia en los puntos, como puede observarse en la figura 8, correspondiente a los datos de la figura 6. Para saber si este patrn que sugiere nolinealidad es significativo se debe replicar las medidas en cada punto de la calibracin, proporcionando la informacin inherente a la variabilidad de la respuesta de las medidas (lo que se conoce como el error puro). En la figura 8 se observa, por ejemplo, una desviacin sistemtica de los residuales respecto al cero que es razonablemente grande con respecto a las diferencias entre las medidas de los duplicados, y por tanto probablemente sea estadsticamente significativa.
Figura 7. Residuales estandarizados de la regresin lineal usando los datos A. No se observa patrn alguno respecto a los residuales.
Figura 8. Residuales estandarizados de la regresin lineal usando los datos B. Se observa clara tendencia de los residuales. En casos de duda, el test estadstico que se aplica es un anlisis de la varianza de los residuales en el contexto de una ausencia de ajuste o de error puro. Si existe una falta de ajuste significativa, y el patrn de los residuales apoya esta interpretacin, se habr demostrado la nolinealidad significativa de una manera inequvoca. Dados los datos de la figura 8, el estadstico muestra que existe falta de ajuste significativo, p 0, 01 . Si hay evidencia de diferente varianza en la respuesta, lo que es frecuente en calibraciones en un intervalo amplio, se puede emplear una regresin ponderada.
En la figura 9 se observa cmo emplear una relacin lineal para representar una curva de calibracin que en realidad es curva puede conllevar una falta de ajuste que conducir a resultados seriamente errneos. En este ejemplo, bajas concentraciones de analito pueden estar sujetas a errores sistemticos relativamente grandes.
Figura 9
7.5. Ajuste de datos a una funcin lineal con error en ambas variables
Una condicin bsica de la regresin es que los valores de la variable respuesta (variable dependiente) sean aleatorios mientras que los de la variable x (independiente o predictora) deberan estar exentos de error. Este modelo a menudo se aproxima a las aplicaciones clnicas, por ejemplo en el caso de las calibraciones. Sin embargo, si no se cumplen las condiciones, los resultados de la regresin son en principio incorrectos y en la prctica pueden llevar a error. Alternativamente puede ser vlido un mtodo general de estimacin funcional de mxima verosimilitud
( FREML ) .
pendiente, as como sus correspondientes errores estndar, sin introducir sesgos debidos al uso inadecuado de la regresin. El mtodo es simtrico, por lo que las variables x e y pueden ser intercambiadas sin afectar al resultado y permite manejar datos heterocedsticos, es decir resultados con diferentes precisiones.
regresin
ponderada
normal
se
basa
en
un
modelo
de
los
pares
de
datos
i
( )
i
( a , b)
de a y b se obtienen
i =1
(y
a b xi )
2 sy i
con respecto a a y b . La minimizacin se lleva a cabo por simple aplicacin del clculo a las conocidas ecuaciones de la regresin. En la estimacin de la relacin funcional el modelo es diferente:
xi = u i + i yi = i + i
i = + ui
donde
pgina 34
i =1
(x
ui )
i =1
(y
a bui )
Esta formulacin sigue el principio de mxima verosimilitud, que es una aproximacin de estimacin estadstica ms general que el conocido mtodo de mnimos cuadrados. Sin embargo, a diferencia de la regresin, la minimizacin ahora no puede resolverse algebraicamente, sino que requiere mtodos numricos iterativos.
za =
Asimismo, se podra chequear H 0 :
a es a b 1 es b
=1
za =
Los valores de z pueden interpretarse como una distribucin normal estndar, de modo que para una confianza del 95 % debe usarse el valor crtico de 1,96 para | z | . El estadstico de ausencia de ajuste es la suma de cuadrados de los residuales escalados, que pueden ser tratados aproximadamente como una variable con n 2 grados de libertad. Un valor significativamente alto de este estadstico sugiere tanto que la estimacin de la varianza fue considerada demasiado baja (un fallo comn) como una ausencia de ajuste. En el segundo caso puede deberse a una interferencia no corregida o a una verdadera falta de linealidad. El examen de la representacin grfica de los residuales escalados permite dilucidar cual de las situaciones se est dando.
2
pgina 35
Apndice 1. Consideraciones adicionales relativas al estudio de la imprecisin A1.1. Modificaciones para realizar una serie analtica por da
Para aquellos instrumentos en que por la larga duracin del mtodo, o por otro motivo, no sea posible realizar ms de una serie analtica por da, cabe la posibilidad de estimar la imprecisin Sin embargo en este caso no ser posible valorar por separado la imprecisin interensayo de la interda y no se podr estimar la imprecisin intrada. La frmula bsica para estimar la repetibilidad ser:
sr =
donde: I
(x
i =1
i1
xi2 )
2I
x i1 xi2
El procedimiento ser el descrito en el apartado 3, salvo por el hecho de que se realizar solo una serie analtica por da en lugar de 2. En esta estimacin los grados de libertad sern la mitad de los del protocolo que utiliza dos series analticas por da. Para aumentar el nmero de grados de libertad hay dos alternativas: (a) Incrementar el tamao del experimento, prolongando el estudio durante ms das (se recomienda un mnimo de 30), procesando dos alcuotas del material empleado para el estudio de la imprecisin en cada serie analtica; (b) Incrementar el nmero de alcuotas procesadas en cada serie manteniendo la duracin del estudio en 20 das. En este caso, la desviacin tpica intraserial se estimar mediante la siguiente frmula:
sr =
donde: I es el nmero total de das;
( x
i = 1 j =1
i1
xii )
I ( N 1)
N xi j
es el nmero de replicados analizados en cada serie analtica; es el resultado obtenido en el replicado j de la serie analtica procesada el da i ; es el promedio de todos los replicados del da i .
xii
El nmero de grados de libertad en esta estimacin es igual a I veces el nmero de replicados efectuados
en cada serie analtica menos 1, esto es, g . de l. = I ( N 1) . Cada serie analtica debe contener el mismo nmero de replicados para que la frmula anterior sea adecuada. No se incluye el factor 2 en el denominador porque ahora esta formula emplea la suma de desviaciones cuadrticas respecto a la media de las series analticas, a diferencia de las diferencias entre los duplicados empleados en frmulas previas (adecuado slo para dos observaciones).
B =
donde: I es el nmero de das;
(x
i =1
ii
x ii )
I 1
pgina 36
xii x ii
es el promedio de los replicados en el da i ; es el promedio de todos los resultados en todos los das;
B es la desviacin tpica de los promedios diarios (generalmente denominado error estndar de las medias diarias). Cuando slo se realiza una serie analtica por da, esta estimacin combina las componentes interdiaria e interserial de la imprecisin. Esta ser la formula empleada independientemente del nmero de das o el nmero de replicados.
A partir de la anterior estimacin, B , y de la desviacin tpica intraserial, s r , se puede calcular la imprecisin instrumental o intralaboratorio segn la expresin:
sT =
donde: N
B2 +
N 1 2 sr N
es el nmero de replicados en cada serie analtica; es la desviacin tpica de las medias diarias; es la estimacin de la repetibilidad en forma de varianza.
B
s
2 r
Esta frmula puede emplearse independientemente del mtodo usado para incrementar el nmero de observaciones del estudio de repetibilidad (das adicionales o replicados adicionales en cada serie analtica).
T =
( ( N 1) ME + MD )
+
( N 1) ME 2
I MD 2 I 1
donde: ME = s r
es la media cuadrtica intraserial; es la media cuadrtica para ambas series analticas y das.
MD = N B 2
Se utiliza el valor entero ms prximo al resultado obtenido para T como grados de libertad para evaluar sT .
pgina 37
var ( x ) =
con un valor esperado:
(x
i =1
ii
x ii )
I 1
2 = sD
E(s
donde: x i i
2 D
2 dd
r2
N
es el promedio de los resultados del da i ; es el promedio de todos los resultados en todos los das; es el nmero total de das; es la varianza interdas real (ajustada); es la varianza intraserial real (repetibilidad);
x ii I
2 d d
r2
N es el nmero de replicados de cada serie analtica. Segn aumenta el nmero de replicados de cada serie analtica, la estimacin ser ms prxima al parmetro verdadero (ej, la repetibilidad tendr menos influencia en la estimacin). La cantidad denominada B en este protocolo no puede tomarse como una estimacin de la imprecisin interdas. Para que esta cantidad sea til requiere un ajuste. El proceso de ajuste depende del nmero de series analticas por da y del nmero de observaciones por serie analtica, pero no del nmero de das en que haya sido efectuado el protocolo. Dos series analticas por da Para dos series analticas por da, como se describi en el protocolo principal, las cantidades A y B del apartado 3 se usan para derivar la estimacin de la desviacin tpica interdas verdadera ajustada d d :
sdd =
y de la desviacin tpica interensayo intrada:
A2 B 2
2
srr =
Una nica serie analtica por da
A
2
s r2
Para una nica serie analtica por da y dos o ms observaciones por serie, el procedimiento es algo diferente. Las componentes interda e interensayo no pueden separarse. La cantidad denominada B mide en este caso la suma de ambas componentes. Habr que eliminar el efecto de la variabilidad intraserial de la estimacin calculando:
sdd =
donde: N
B2
s r2 N
La interpretacin de la cantidad s d d es la suma de los efectos interda e interserial intrada. En algunos casos, la cantidad obtenido en el radicando anterior puede ser negativa, si la componente inter das es pequea. Si ocurre esto, la estimacin de s d d debe establecerse en 0. Esta precaucin debe aplicarse a las estimaciones calculadas anteriormente para dos series analticas por da.
pgina 38