Está en la página 1de 38

EVALUACIN DE MTODOS (I)

Notas
ndice 1. OBJETIVOS.....................................................................................................................2 2. NOMENCLATURA...........................................................................................................2 3. PRECISIN .....................................................................................................................6
3.1. Diseo experimental del estudio de imprecisin ........................................................................................ 6 3.2. Comparacin con otras evaluaciones de la precisin ................................................................................ 6 3.3. Comparacin estadstica con el fabricante ................................................................................................ 7 3.4. Componentes de la precisin ..................................................................................................................... 7 3.5. Materiales de calibracin y reactivos ......................................................................................................... 7 3.6. Deteccin de datos extremos (outliers) ...................................................................................................... 8 3.7. Estimacin de la repetibilidad..................................................................................................................... 8 3.8. Estimacin de la precisin intralaboratorio............................................................................................... 9 3.9. Comparacin con los datos de imprecisin del fabricante u otros criterios ............................................. 10 3.10. Comparacin de la repetibilidad ............................................................................................................. 10

4. LMITES DE DETECCIN Y CUANTIFICACIN ..........................................................12


4.1 Uso no estndar valor crtico .................................................................................................................. 12 4.2. Uso no estndar del trmino sensibilidad .............................................................................................. 12 4.3. Otros lmites de niveles bajos................................................................................................................... 13 4.4. Lmites de deteccin en el contexto de mtodos cualitativos .................................................................. 13 4.5. Procedimientos para determinar y verificar el lmite de deteccin de un mtodo.................................... 14 4.6. Aproximacin general para determinar el lmite de blanco ...................................................................... 15 4.7. Aproximacin general para determinar el lmite de deteccin ................................................................. 15 4.8. Diseo del estudio .................................................................................................................................... 16 4.9. Nmero de muestras ................................................................................................................................ 16 4.10. Caractersticas de blancos y muestras de bajo nivel ............................................................................. 17 4.11. Resultados.............................................................................................................................................. 18 4.12. Procedimiento para determinar y verificar el lmite de blanco y el lmite de deteccin.......................... 18 4.13. Procedimiento para determinar o establecer el lmite de blanco ........................................................... 18 4.14. Procedimiento para determinar el lmite de deteccin ........................................................................... 18 4.15. Consideraciones sobre la forma de la distribucin................................................................................. 19 4.16. Procedimiento para verificar un lmite de deteccin............................................................................... 20

5. LMITE DE CUANTIFICACIN......................................................................................22
5.1. Establecimiento del lmite de cuantificacin............................................................................................. 22 5.2. Verificacin de un lmite de cuantificacin ............................................................................................... 22 5.3. Informe de resultados............................................................................................................................... 23

6. LINEALIDAD..................................................................................................................24
6.1. Pool de muestras de pacientes ................................................................................................................ 25 6.2. Pool de muestras de pacientes diluido con un diluyente recomendado .................................................. 25 6.3. Pool de muestras de pacientes suplementado con el analito de inters ................................................. 25 6.4. Pool diluido con materiales tratados de baja concentracin o con otro pool tratado............................... 25 6.5. Controles / calibradores / materiales para estudio de linealidad comerciales ......................................... 25 6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado ........................................ 25 6.7. Material de control comercial diluido con diferente volumen del establecido .......................................... 25 6.8. Soluciones acuosas.................................................................................................................................. 26 6.9. Disoluciones en otros disolventes ............................................................................................................ 26 6.10. Intervalo analtico ................................................................................................................................... 26 6.11. Determinacin del intervalo lineal........................................................................................................... 27 6.12. Regresin polinmica ............................................................................................................................. 27 6.13. Orden de la regresin polinmica........................................................................................................... 28 6.14. Grado de nolinealidad .......................................................................................................................... 29 6.15. Consideraciones acerca del error aleatorio............................................................................................ 29

6.16 Establecimiento del error mximo permisible.......................................................................................... 30

7. CALIBRACIN ..............................................................................................................31
7.1. Conceptos bsicos asociados a la calibracin......................................................................................... 31 7.2. Chequeo de la falta de ajuste................................................................................................................... 32 7.3. Diseo de un experimento de calibracin ................................................................................................ 33 7.4. Linealidad exacta? ................................................................................................................................. 33 7.5. Ajuste de datos a una funcin lineal con error en ambas variables......................................................... 34 7.6. Modelos de regresin y de relacin funcional .......................................................................................... 34 7.7. Aplicaciones analticas de FREML ........................................................................................................... 35 7.8. Cmo estimar las ponderaciones ............................................................................................................. 35

APNDICE 1. CONSIDERACIONES ADICIONALES RELATIVAS AL ESTUDIO DE LA IMPRECISIN ...................................................................................................................36


A1.1. Modificaciones para realizar una serie analtica por da........................................................................ 36 A1.2. Desviacin tpica intralaboratorio o instrumental ................................................................................... 36 A1.3. Ecuacin de Satterthwaite ..................................................................................................................... 37 A1.4. Otras estimaciones posibles .................................................................................................................. 37 A1.5. Imprecisin interdas ............................................................................................................................ 37

1. Objetivos
Clarificar conceptos y definiciones bsicos relacionados con la evaluacin de mtodos analticos; Conocer los procedimientos estadsticos adecuados para abordar la evaluacin y validacin de mtodos e instrumentos analticos; Conocer los criterios y algoritmos propuestos por entidades cientficas de mbito nacional e internacional para la evaluacin de mtodos e instrumentos.

2. Nomenclatura
A lo largo de las dos partes de este tema dedicado a la evaluacin de mtodos, se emplearn trminos que conviene definir y matizar previamente. Tambin se recomienda revisar algunos documentos de la SEQC que hace referencia a la validacin de mtodos.1 Exactitud y error Exactitud Es la concordancia entre un resultado de un test y el valor aceptado como referencia. Cuando se aplica a una serie de resultados analticos, incluye una combinacin de componentes aleatorios del error y componentes de sesgo o error sistemtico. [ISO 3534: 3.11] Esencialmente, la exactitud es la ausencia de error. Un resultado es ms exacto si se comete un error menor. Los conceptos exactitud y precisin estn relacionados: es poco probable que un resultado de un mtodo sea exacto si en general los resultados que proporciona dicho mtodo no son precisos. Cabe destacar que, estrictamente, el concepto de exactitud se aplica a resultados, y no a entidades generales como mtodos analticos, laboratorios o individuos. Error (de Es la diferencia entre el resultado de una medida y el valor verdadero del medida) mensurando. Dado que el valor verdadero no puede ser determinado, en la prctica se emplea un valor verdadero convencional. [VIM: 3.10] Error aleatorio Es una componente del error que, en el curso de un nmero de resultados (de un resultado) de un test de las mismas caractersticas, vara de forma impredecible. No es posible corregir el error aleatorio. [ISO 3534: 3.9] Error sistemtico Es una componente del error que, en el curso de un nmero de resultados de un test de las mismas caractersticas, permanece constante o vara de forma predecible. Los errores sistemticos y sus causas pueden ser conocidos o desconocidos. [ISO 3534: 3.10]

Responsabilidades en la obtencin de evidencia objetiva para la validacin de las caractersticas metrolgicas de los procedimientos de medida del laboratorio clnico. Qum Cln, 2003; 22: 33-5. pgina 2

Veracidad Veracidad y sesgo

Sesgo

Intervalo lineal

Linealidad

Precisin

Precisin

Condiciones de repetibilidad

Concordancia entre el valor promedio obtenido en una serie larga de resultados de un test y un valor aceptado como de referencia. [ISO 3534: 3.12] Habitualmente se expresa numricamente mediante la medida estadstica del sesgo que est inversamente relacionado con la veracidad Es la diferencia entre la expectativa de los resultados de un test y un valor de referencia aceptado. El sesgo es el error sistemtico total, en contraste con el error aleatorio. Puede haber una o ms componentes del error sistemtico que contribuyen al sesgo. Una diferencia sistemtica grande entre un valor aceptado como referencia se refleja mediante un valor de sesgo mayor. [ISO 3534: 3.13] La veracidad equivale a la ausencia de sesgo Es el intervalo en el cual los resultados de un mtodo analtico son aceptablemente lineales; esto es, en el que el error de nolinealidad es menor que un error criterio dado Es la capacidad (en un intervalo dado) de proporcionar resultados que son directamente proporcionales a la concentracin (cantidad) de analito presente en la muestra analizada. La linealidad suele aplicarse a todo el sistema de respuesta (p.ej. a la respuesta analtica final antes que a la lectura de salida del instrumento); La linealidad de un sistema se mide chequeando niveles de un analito que son conocidos por formulacin o con respecto a otro (no es necesario que se conozca el nivel absoluto); cuando los resultados del sistema se representan frente a estos valores, el grado en el que la curva representada se aproxima a una lnea recta es una medida de la linealidad del sistema. Es la concordancia entre los resultados independientes de un test obtenidos bajo unas condiciones estipuladas. La precisin depende slo de la distribucin de errores aleatorios y no se relaciona con el valor verdadero o especificado. La medida de la precisin habitualmente se expresa en trminos de imprecisin y se calcula como una desviacin tpica de los resultados de un test. Una menor precisin se refleja en una mayor desviacin tpica. Se habla de resultados independientes de un test cuando han sido obtenidos de manera que no estn influenciados por ningn resultado previo del mismo o similar al objeto del test. La medida cuantitativa de la precisin depende de manera fundamental de las condiciones estipuladas. Las condiciones de repetibilidad y de reproducibilidad son casos particulares de condiciones estipuladas extremas [ISO 3534: 3.14] Como la precisin depende de las condiciones de la medida, stas deben ser especificadas cuando se hace referencia a una estimacin de la precisin. A continuacin se definen trminos de uso comn empleados para describir las condiciones de medida Son condiciones en las que se obtienen resultados independientes de un test con el mismo mtodo en sistemas idnticos en el mismo laboratorio por el mismo operador empleando el mismo equipo y en intervalos de tiempo cortos. [ISO 3534: 3.15]

pgina 3

Condiciones de reproducibilidad

Repetibilidad

Son condiciones en las que los resultados de un test se obtienen mediante el mismo mtodo en sistemas idnticos en diferentes laboratorios con diferentes operadores y empleando diferentes equipos. [ISO 3534: 3.20]. Las condiciones de repetibilidad suponen repetir la ejecucin del mtodo entero desde un punto en el que se toma una alcuota de la muestra del laboratorio, no se reduce nicamente a repetir las determinaciones instrumentales en extractos preparados Precisin estimada bajo condiciones de repetibilidad [ISO 3534: 3.15] NOTAS Se distingue entre repetibilidad y reproducibilidad refirindose a la primera cuando se realizan medidas sucesivas bajo las mismas condiciones, y a la segunda cuando las medidas se realizan bajo diferentes condiciones de medida2. Para las condiciones de repetibilidad, las definiciones de VIM e ISO3534 son casi idnticas Sin embargo, la definicin de VIM de las condiciones de reproducibilidad es ms general que la de la norma ISO 3534, e incluye medidas intralaboratorio sobre periodos extensos de tiempo y/o incluso medidas empleando diferentes principios de medida. Esta terminologa ms general es cada vez ms comn. Por este motivo, se recomienda que las condiciones de medida se indiquen siempre cuando se refiere la reproducibilidad

La norma ISO 5725 discute adicionalmente medidas de precisin intermedia, y proporciona la notacin para condiciones en que varan el tiempo, calibracin, operador y equipo Reproducibilidad Precisin bajo condiciones de reproducibilidad [ISO 3534: 3.20] Precisin Precisin calculada cuando se obtienen resultados independientes en series interserial (run separadas en el mismo laboratorio con el mismo mtodo y en el mismo torun) material Periodo en el que se realiza el anlisis bajo condiciones de repetibilidad y se Run mantienen constantes los factores que afectan a la exactitud. Ntese que los runs separados habitualmente se realizan en distinto tiempo e involucran alguna recalibracin del instrumento Condiciones de Cuando los resultados de un test se obtienen con el mismo mtodo en precisin idntico sistema de medida y test, pero bajo diferentes condiciones de intermedia operacin. (a) Hay cuatro elementos de las condiciones de operacin: tiempo, calibracin, operador, y equipo; (b) deben anotarse las condiciones que cambian. Suele incluir estimaciones de la imprecisin, como las comnmente denominadas interserial (betweenrun), intrada (withinday), interda (betweenday), instrumental (withindevice) e intralaboratorio (withinlaboratory) Condiciones de Condiciones donde se obtienen resultados independientes con el mismo repetibilidad mtodo en idntico material y en el mismo laboratorio, por el mismo operador usando el mismo equipo y en un periodo corto de tiempo (ISO 3534-1); Anteriormente se denominaba precisin intraserial (withinrun) Condiciones de Los resultados se obtienen con el mismo mtodo en idntico sistema y en reproducibilidad diferentes laboratorios con diferentes operadores y diferentes equipos (ISO 5725-1)3

2 3

ISO. International of vocabulary of basic and general terms of metrology (VIM). Geneva:ISO, 1993. ISO. Accuracy (trueness and precision) of measurement methods and results Part 1: General principles and definitions. ISO 5725-1. Geneva:ISO, 1994. pgina 4

Precisin Instrumental

Precisin estimada mediante medidas repetidas en una nica solucin problema, sin ajustes instrumentales, en un periodo corto de tiempo NOTAS La precisin instrumental no es una definicin ISO, sino un tipo de precisin que frecuentemente se encuentra en las especificaciones de los instrumentos. Difiere de la repetibilidad en que no incluye repeticin de todo el mtodo analtico, sino slo la medida instrumental en si, frecuentemente incluso sin ajustes instrumentales

Mensurando Incertidumbre

Las condiciones interseriales (runtorun) constituyen un caso especfico de las condiciones de reproducibilidad en la definicin VIM, y se corresponden con las condiciones intermedias definidas por la norma ISO 5725 Cantidad sujeta a una medida [ISO 3534: 3.5] (a) Una estimacin asociada a un resultado que caracteriza el intervalo de valores en los que debe encontrarse el valor verdadero. [ISO 3534: 3.25] (b) (de medida) Parmetro asociado con el resultado de una medida, que caracteriza la dispersin de los valores y puede atribuirse razonablemente al mensurando. [GUM: 2.2.3]4 NOTAS Las definiciones (a) y (b) difieren en la filosofa, pero para la mayora de los propsitos pueden considerarse equivalentes Una estimacin de la incertidumbre debe incorporar tanto lo que se conoce acerca de los efectos aleatorios como de la incertidumbre asociada a efectos sistemticos de los procesos de medida Dado que la estimacin de la incertidumbre incorpora las incertidumbres de todos los posibles efectos, una estimacin de la incertidumbre es probablemente el modo ms apropiado de expresar la exactitud de los resultados

Incertidumbre tpica Incertidumbre expandida

En un anlisis convencional, la incertidumbre asociada con un resultado individual se estima habitualmente a partir de estudios previos, que incluyen estudios de validacin y no se requiere una estimacin individual de la incertidumbre de cada resultado Es la incertidumbre del resultado de una medida, expresada como desviacin estndar [GUM: 2.3.1] Cantidad que define un intervalo en torno al resultado en el que se espera que se encuentre una fraccin grande de la distribucin de valores que pueden atribuirse razonablemente al mensurando [GUM: 2.3.5] La ilustracin clsica de la exactitud y precisin en trminos de una diana ya no describe correctamente la exactitud. sta se refiere a una combinacin de errores sistemticos y aleatorios, por lo que la siguiente grfica es ms adecuada

ISO Guide to the expression of uncertainty in measurement. Geneva:ISO,1995. ISBN 92-67-10188-9. pgina 5

3. Precisin
En el presente apartado se presenta el protocolo de estudio de imprecisin segn recomendaciones del CLSI.5 Se recomienda consultar tambin otros protocolos publicados por la SEQC para conocer otros posibles enfoques del procedimiento.6

3.1. Diseo experimental del estudio de imprecisin


Durante cada uno de los das que dure el estudio de la imprecisin, deben analizarse en dos series separadas dos muestras, cada una con diferente concentracin del analito de inters. Adicionalmente, al menos se procesa en cada serie analtica una muestra de control de calidad, segn los procedimientos habituales de control de calidad del laboratorio. Si la variabilidad entre las diferentes series analticas no constituye un aspecto relevante en el instrumento evaluado, deben analizarse cuatro muestras de cada nivel, como dos pares, en condiciones de repetibilidad, en diferentes momentos del da. Los resultados apareados deben tratarse como dos resultados obtenidos en la misma serie. Tras este protocolo propio del periodo de familiarizacin, el experimento debe continuarse durante 15 o ms das. Al final de cinco das de trabajo, deben recalcularse los lmites del control en una grfica de control de calidad y chequear todos los datos para ver si son aceptables. Si se detectan valores aberrantes, debe identificarse la causa del problema. No deben eliminarse datos sin una justificacin vlida, ya que esto conducir a una inadecuada valoracin de la imprecisin. Cuando se complete el experimento de imprecisin, se realizarn los correspondientes clculos estadsticos con los datos. Si se observa tendencia durante el protocolo del periodo de familiarizacin, los datos ms antiguos deben ser excluidos y reemplazados por una cantidad igual de datos recogidos al final del periodo planeado para el periodo de evaluacin.

3.2. Comparacin con otras evaluaciones de la precisin


Realizar un estudio de repetibilidad, o tomar una nica observacin (o unas pocas) a una concentracin dada cada da durante 10 o 20 das para evaluar la imprecisin total no es una prctica correcta al no incluir en estos procedimientos ciertas causas significativas de variacin. Cuando se emplea una nica serie analtica para estimar la repetibilidad (imprecisin intraserial o withinrun), existe un riesgo importante de que las condiciones operativas efectivas en el momento de procesar dicha serie analtica no reflejen los parmetros operativos habituales, afectando por tanto adversamente a la estimacin. Adems, no hay forma de determinar cmo de representativa puede ser una nica serie analtica de las caractersticas en estudio. Por este motivo, se recomienda que la repetibilidad se estime calculando la imprecisin intraserial (within run) en varias series analticas, asegurndose por tanto una estimacin ms robusta y representativa de las caractersticas del sistema en diversas condiciones operativas futuras. Las medidas intermedias de la imprecisin calculadas sern independientes del nmero de das y de series analticas procesadas en un da empleadas para su estimacin, cosa que no ocurre con los mtodos tradicionales. Veremos cmo este procedimiento combina correctamente el efecto de la repetibilidad y los componentes interserial e interda (que varan relativamente de un mtodo a otro), y evitan el error de emplear trminos incorrectos para el estudio de la imprecisin (como es la daada). Cuando se disea un experimento de evaluacin, se debe decidir de antemano con cunta fiabilidad se desea determinar la imprecisin verdadera. La estimacin obtenida con cada protocolo no ser la misma aunque se repita exactamente el mismo protocolo en el mismo laboratorio con un instrumento dentro del intervalo de tolerancia del control, incluso si la imprecisin real es la misma. Estas estimaciones de la imprecisin estarn distribuidas en torno a un valor verdadero, y las estimaciones obtenidas a partir de ms observaciones se acercarn ms a la imprecisin verdadera. En general, un mayor nmero de observaciones conduce a ms confianza en una estimacin, y a mayor confianza en la estimacin, mayor potencia estadstica para detectar alejamiento de las caractersticas esperadas para el instrumento.

NCCLS. Documento EP5-A2Evaluation of precision performance of quantitative measurement methods; Approved guideline 6 Recomendaciones para el estudio de la precisin de los procedimientos de medida en el laboratorio clnico. Qum Cln 2003; 22: 63-5 pgina 6

3.3. Comparacin estadstica con el fabricante


Este es un concepto muy importante que ilustra cmo una estimacin de la repetibilidad basada en 100 grados de libertad puede detectar desviaciones relativamente pequeas de las caractersticas del fabricante. Asimismo, una estimacin de la repetibilidad basada solo en 10 grados de libertad detectarn slo separaciones grandes de las caractersticas y por tanto una prueba basada en dicha estimacin tendr muy poca potencia estadstica. Si el estimado tiene 40 grados de libertad, se tiene mayor potencia estadstica y la estimacin puede detectar desviaciones pequeas, aunque quiz clnicamente importantes, de las caractersticas del fabricante.

3.4. Componentes de la precisin


El principal objetivo del experimento de evaluacin de la precisin es estimar la precisin del dispositivo de medida o del mtodo tal como se maneja en un instrumento o laboratorio. Intuitivamente, la imprecisin es la variabilidad del instrumento cuando se use en un periodo indefinidamente largo de tiempo. Hasta cierto punto, diversas fuentes de variabilidad contribuyen a esta imprecisin a largo plazo. En general, basta con disear un experimento que contemple todas las fuentes que afectan a la estimacin de la imprecisin intra laboratorio sin tratar de determinar el tamao relativo de cada fuente o componente. Los trminos empleados para describir las componentes de la imprecisin relacionadas con el tiempo incluyen: Repetibilidad; Imprecisin interserial; Imprecisin intrada; Imprecisin interda; y

Imprecisin intralaboratorio. De estas, la repetibilidad y la imprecisin intralaboratorio son generalmente las de ms inters. En este diseo, no se pretende incorporar especficamente las estimaciones separadas de otras fuentes significativas de variabilidad, como el calibrador o las diferencias de lote de reactivos o de tcnicos/operadores.

3.5. Materiales de calibracin y reactivos


Puede emplearse para todo el protocolo un nico lote de reactivos y materiales de calibracin, pero la interpretacin de los resultados debe considerar este hecho, dado que se puede subestimar verdaderas imprecisiones a largo plazo, intralaboratorio (o instrumentales). El introducir varios lotes de estos materiales incrementar la variabilidad observada, y aunque el experimento no permita estimar separadamente los efectos de estos factores, puede ser representar mejor la imprecisin real. Los materiales empleados en el estudio deben ser seleccionados de modo que simulen las caractersticas de muestras clnicas adecuadas. Cuando sea posible y apropiado, se preferirn pooles estables y congelados. En caso necesario, pueden emplearse materiales estables comerciales, con base proteica. Se recomiendan dos concentraciones, aunque pueden usarse ms. En este protocolo la imprecisin se estima separadamente para cada nivel, no se promedia para los distintos niveles. Si las estimaciones de la imprecisin o de la imprecisin relativa son iguales a estos niveles, hay evidencia de imprecisin constante. En caso contrario, puede ser necesario evaluar ms niveles. Si es posible, conviene seleccionar concentraciones que abarquen una porcin significativa del intervalo de medida. Si se dispone de ms de dos concentraciones, deben elegirse concentraciones adicionales tan cercanas como sea posible a los niveles de decisin mdica empleados en el laboratorio. Para comparar los resultados de la evaluacin con los publicados por el fabricante, deben elegirse concentraciones similares a los niveles empleados por el fabricante para el estudio. Cuando no se desea verificar una imprecisin dada por el fabricante, sino establecerla en el propio laboratorio, deben chequearse un nivel bajo, otro alto y otro cercano al punto de decisin mdica. Si los tres niveles demuestran una precisin constante o precisin relativa constante, son suficientes para el estudio. En caso contrario, o si hay diferencias importantes en las estimaciones de la precisin entre los tres niveles, deben chequearse ms niveles. El experimento de evaluacin de la precisin requiere una cantidad suficiente de datos de modo que la estimacin obtenida de la misma refleje adecuadamente los verdaderos parmetros de la imprecisin del instrumento. En general se considera aceptable un mnimo de 20 das operacionales en condiciones

pgina 7

aceptables para llevarlo a cabo. Durante los primeros cinco das del experimento, el usuario debe familiarizarse con el protocolo. Se considera un mtodo corto a aquel en que la duracin de la determinacin es inferior a 2 h, mientras que un mtodo largo (como el radioimmunoanlisis) dura considerablemente ms y no se procesa ms de uno al da. Para mtodos largos, existe un procedimiento aplicable incluyendo una serie analtica por da. Para procedimientos cortos, las muestras pueden ser analizadas en cualquier momento de la serie analtica. Para realizar el anlisis de la varianza, una serie analtica de evaluacin es un periodo de tiempo discreto de recogida de datos diseado para poder estimar la variabilidad (o deriva) en un da. Para algunos dispositivos, como instrumentos de acceso aleatorio, discretos, o individuales, el concepto de serie analtica (run) puede no ser apropiado. En este caso, las muestras deberan procesarse por duplicado en condiciones de repetibilidad y tiempos aleatorios a lo largo de una jornada de trabajo para simular la operacin real de instrumento. Cada da habr que realizar los siguientes pasos: 1. Analizar dos series analticas (runs o batches); 2. Si una serie analtica debe ser rechazada debido al control de calidad o a dificultades operativas, se realiza una nueva serie analtica despus de que se haya solucionado el problema; 3. En cada serie, se analizarn dos alcuotas del material chequeado para cada concentracin; 4. Se deben incluir en cada serie las muestras de control de calidad que se juzguen necesarias para valorar la aceptabilidad de la serie analtica o el da; 5. Se cambia el orden de anlisis de los materiales analizados y muestras de control de calidad para cada serie analtica o da; 6. Para simular la operacin verdadera, se incluyen al menos diez muestras de pacientes en cada serie, si es posible; 7. Separar la series analticas realizadas cada da al menos en 2 h.

3.6. Deteccin de datos extremos (outliers)


Se debe definir un criterio de deteccin de datos aberrantes para asegurar que problemas operacionales no distorsionarn los datos resultantes de la estimacin de la imprecisin. Asumiendo procedimientos adecuados de control de calidad durante el experimento, se sugiere un test dbil (baja potencia) para detectar datos muy aberrantes de los recogidos durante el test de imprecisin preliminar. (a) Si la diferencia absoluta entre los replicados excede 5,5 veces la desviacin tpica determinada en el test preliminar de la imprecisin el par de datos debe rechazarse. (b) Si se detecta un valor aberrante, el problema subyacente debe ser investigado, y la serie analtica repetida. El valor de 5,5 deriva del valor superior del 99,9 % del rango normalizado para la diferencia entre dos observaciones. Este test debera usarse cuando la concentracin del material empleado en el chequeo preliminar se acerca razonablemente a la concentracin del material en evaluacin. Se pueden planificar ms das para el estudio de la imprecisin, en prevencin de los valores aberrantes que haya que eliminar. Si ms del 5 % de las series analticas han de ser rechazadas y no se encuentra causa, debe considerarse la posibilidad de que el instrumento no sea lo suficientemente estable como para permitir establecer la variabilidad de una forma vlida.

3.7. Estimacin de la repetibilidad

sf =
donde I

( x
i =1 j =1

i j1

xi j2 )

4I

es el nmero total de das (generalmente 20); es el nmero de series analticas (intrada) (1 2); es el resultado para el replicado 1, de la serie j en el da i ; es el resultado para el replicado 2, de la serie j en el da i .

x I j1 xI j2

pgina 8

Se necesitan dos resultados de cada uno de las dos series analticas de cada da para usar la frmula anterior. Si solo se dispone de una serie analtica en un da dado, se puede utilizar la frmula (con j = 1 ). Siempre que no haya ms de un 10 % de los das de la evaluacin en que falten series analticas (por ejemplo, con un solo run) en un diseo experimental de dos series analticas por da, los clculos resultantes pueden ser vlidos (aplicando las frmulas del Apndice 1) si slo hay una serie analtica por da.

3.8. Estimacin de la precisin intralaboratorio


Se necesitar realizar los siguientes clculos: faltan los subndices de las formulas de A y B, al menos no se ven con mi version de word

A =
donde: I

(x
i =1

i 1i

x i 2i )

2I

es el nmero de das (con dos series analticas); es el resultado promedio de la serie analtica 1, en el da i (promedio de dos replicados); es el resultado promedio de la serie analtica 2, en el da i (promedio de dos replicados).

x I j1 xI j2

A se calcula elevando al cuadrado la diferencia entre el promedio de los replicados de la primera y la segunda serie analtica de cada da, sumando dichas cantidades para todos los das, dividiendo por 2 I , y tomando la raz cuadrada. Este clculo no debe emplearse si los datos se han generado en un solo da o solo una serie analtica. Otra estimacin necesaria es:

B =
donde: I es el nmero de das;

(x
i =1

i ii

x iii )

I 1

x i ii x iii

es el promedio de todos los resultados del da i ; y es el promedio de todos los resultados.

Esta es la desviacin tpica de las medias diarias (Apndice 1) Con estas dos cantidades, se calculan
2 2 sd d = B

s r2r = A 2
donde: s d d

A2 2 s r2 2

es la estimacin de la desviacin tpica interdas (betweenday); es la estimacin de la desviacin tpica interserial (betweenrun).

srr

Si la varianza as calculada fuera negativa, por convenio se considerar igual a cero. La estimacin de la imprecisin intralaboratorio o instrumental (withindevice) se calcula con la siguiente frmula para la desviacin tpica:

sT =

2 2 2 sd d + srr + sr

Con esta formula para s T el resultado obtenido ser diferente al estimado con el clculo mediante la desviacin tpica de todos los datos (sin tener en cuenta el da o la serie analtica). La formula anterior es la forma correcta para estimar la imprecisin instrumental, porque sopesa adecuadamente la repetibilidad as pgina 9

como las componentes de la imprecisin interdas e interserial. El coeficiente de variacin (expresado en porcentaje) correspondiente a esta estimacin de la imprecisin debera calcularse dividiendo s T por la concentracin del material analizado y multiplicado por 100.

3.9. Comparacin con los datos de imprecisin del fabricante u otros criterios
La estimacin de la imprecisin obtenida en la seccin anterior puede compararse con las especificaciones de la imprecisin del fabricante. El estadstico jicuadrado

( ) ser el que deber utilizarse. Para ello, se


2

tomar como referencia la estimacin puntual que ofrezca el fabricante (por ejemplo, la desviacin tpica). Se deben comparar por separado la repetibilidad y la imprecisin intermedia.

3.10. Comparacin de la repetibilidad


Se toma como valor de comparacin la desviacin tpica aportada por el fabricante
2

( ) . El test de ji
r

cuadrado usa el cuadrado de las estimaciones de la repetibilidad, tanto del usuario como del fabricante. Deben conocerse el nmero de grados de libertad asociados con s r (varianza intraserial estimada por el usuario). s r tendr tantos grados de libertad como pares de datos (replicados) se usen para calcularla. Por tanto, ser igual el nmero de series analticas realizadas en el experimento, identificadas en adelante como R . Para aplicar el test es necesario calcular el siguiente valor:
2

2 =
donde: s r
2

s r2 R

2 r

es la repetibilidad estimada por el usuario (varianza); es la repetibilidad aportada por el fabricante (varianza); y es el nmero total de series analticas realizadas (grados de libertad para s r ).
2

2 r
R

El valor calculado de

debe compararse con los valores tabulados del estadstico

utilizando el valor

crtico superior del 95 % de confianza con R grados de libertad (tabla 1). Si el valor calculado es inferior al de la tabla, la estimacin no es significativamente diferente del valor de la imprecisin aportado por el fabricante y se puede aceptar como verificada.

g. de l. de la varianza estimada por el usuario


5 6 7 8 9 10 11 12 13 14 15 16 17

valor crtico del 95 %


11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6
pgina 10

valor crtico del 99 %


1,51 16,8 18,5 20,1 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4

g. de l. de la varianza estimada por el usuario


18 19 20 25 30 35 40 50 60 70 75 79 80 90 100

valor crtico del 95 %


28,9 30,1 31,4 37,7 43,8 49,8 55,8 67,5 79,0 90,5 96,2 100,7 101,9 113,1 124,3

valor crtico del 99 %


34,8 36,2 37,6 44,3 50,9 57,3 63,7 76,2 88,4 100,4 106,4 111,1 112,3 124,1 135,6

Tabla 1. Valores crticos de ji-cuadrado para la estimacin de la varianza estimada por el usuario Se puede emplear una aproximacin similar a la anterior para comparar la estimacin de la imprecisin intralaboratorio (o instrumental, within-device) con los requerimientos de la aplicacin mdica de cada parmetro. Sin embargo, a diferencia de la estimacin de la repetibilidad, calcular el nmero exacto de grados de libertad para s T implica un clculo ms complicado. Dada la estructura del protocolo propuesto en este tema, el usuario no puede asumir que todas las observaciones sean independientes, lo que es requisito necesario antes de que se pueda utilizar la estimacin de los grados de libertad del propio usuario (nmero total de observaciones menos uno). La siguiente formula para los T grados de libertad de s T tiene en cuenta esta falta de independencia.

I ( 2 ME + MR + MD ) T = I 2 ME 2 + MR 2 + MD 2 I 1
2

donde: ME = s r

es la media cuadrtica intraserial, o varianza de la repetibilidad; es la media cuadrtica de las series analticas o runs; es la media cuadrtica de los das.

MR = 2 A 2 MD = 4 B 2

El valor entero ms prximo al calculado segn esta formula ser empleado como grados de libertad para s T . Usando este valor, el estadstico apropiado es el siguiente:

2 =
donde: s T
2

2 sT T

T2

es el cuadrado de la desviacin tpica intralaboratorio (o instrumental) estimada por el usuario; es el cuadrado de la desviacin tpica instrumental aportada por el fabricante para el instrumento o requerida para los fines mdicos a los que se destina el anlisis; son los grados de libertad para s T . pgina 11

2 T

Si el valor calculado de

es inferior que el valor crtico superior del 95 % de una distribucin de

(Tabla 1), se consideran aceptables las especificaciones de la imprecisin.


2 2

Si, por el contrario, el valor de calculado es mayor que dicho lmite crtico superior del 95 % de la imprecisin estimada no entra dentro de los lmites aceptables para la aplicacin mdica definida. La estimacin del usuario puede ser superior que la desviacin tpica aportada por el fabricante y ser an as aceptable. Dado que el experimento del usuario se basa en un nmero limitado de observaciones, cabe esperar errores de muestreo para los valores calculados de s r y s T en torno a los valores verdaderos. Cuanto mayor sea el tamao del experimento, ms prximas sern las estimaciones al valor real. El test de se usa para determinar si la estimacin del usuario es significativamente peor que la aportada por el fabricante. La valoracin de la tolerancia que puede considerarse aceptable en funcin del analito considerado es una informacin que debe obtenerse a partir de las especificaciones de variabilidad biolgica descritas en la bibliografa y de los requisitos necesarios para que un test tenga utilidad para la aplicacin que se le desee dar.

4. Lmites de deteccin y cuantificacin


Cuando se pretende conocer el umbral a partir del cual un mtodo es capaz de detectar la presencia de analito, es importante no olvidar que esta verificacin puede no ser correcta si el material empleado no es adecuado. Algunos requisitos que no se deben olvidar se presentan a continuacin, como la comprobacin de la gaussianidad y simetra de los resultados con los que se estimar el lmite de deteccin as como la homoscedasticidad de los resultados de los blancos y las muestras de bajo nivel del analito estudiado. Adems, veremos cmo es necesario considerar desde el punto de vista estadstico el hecho de que una muestra con una concentracin real del analito igual al lmite de deteccin slo tiene una probabilidad del 50 % de proporcionar un resultado que sea interpretado como presencia de analito. En este apartado se presentar el protocolo segn recomendaciones del CLSI.7 Una visin simplificada puede consultarse en los documentos de la SEQC.8

4.1 Uso no estndar valor crtico


El trmino valor crtico se emplea en la norma ISO 11843 como el resultado ms alto que puede esperarse en una muestra de blanco (muestra sin analito o con concentracin cercana a cero). Es la respuesta del mtodo (o instrumento) por encima de la que la muestra puede considerarse que tiene un valor positivo del mensurando. Sin embargo, este trmino se emplea frecuentemente en los laboratorios clnicos para los resultados de un test que indican una condicin mdica importante. En este tema la respuesta umbral de la que estamos hablando, se denominar lmite de blanco (LB).

4.2. Uso no estndar del trmino sensibilidad


El trmino sensibilidad no se emplear en este contexto sino alguna de las alternativas ms adecuadas. El lmite de deteccin se prefiere debido a que su definicin conlleva menor confusin y por tratarse de un trmino muy utilizado. En muchos laboratorios clnicos y aplicaciones diagnsticas se habla en ocasiones de sensibilidad, sensibilidad analtica indistintamente con lmite de deteccin. Sin embargo, el trmino sensibilidad tiene otros muchos usos, algunos de los cuales son mucho ms adecuados en las reas correspondientes. As, el uso ms comn deriva de la definicin IUPAC de la sensibilidad analtica, que es la pendiente de la curva de calibracin. La funcin de calibracin, como se ha visto, relaciona la media de las concentraciones medidas con concentraciones reales (conocidas) del analito; cuanto ms pronunciada sea la pendiente de la curva de calibracin, el mtodo ser ms sensible a pequeos cambios en la concentracin del analito presente en la muestra. Este concepto dista mucho del
7

CLSI Documento EP17 - Protocols for determination of limits of detection and limits of quantitation; Approved guideline. 8 Recomendaciones para el estudio de la capacidad de deteccin de los procedimientos de medida en el laboratorio clnico. Qum Cln 2004; 23: 439-41. pgina 12

de lmite de deteccin. Adems, incluso si la pendiente de la curva de calibracin es pronunciada, la menor concentracin que puede detectarse con fiabilidad puede ser elevada si existe gran variabilidad en la seal medida. Por otra parte, un mtodo con moderada sensibilidad analtica (moderada pendiente de la curva de calibracin) pero muy baja variacin aleatoria de la seal puede tener un lmite de deteccin bajo. Otro uso que incluye el trmino sensibilidad es la denominada sensibilidad funcional, empleada para describir la precisin interserial a muy bajas concentraciones de analito, interesante para ciertos procedimientos diagnsticos con requerimiento de muy alta precisin a bajas concentraciones. Los trminos sensibilidad diagnstica o clnica se emplean para caracterizar o comparar el comportamiento de las pruebas diagnsticas en relacin con una informacin clnica preespecificada (por ejemplo, presencia o ausencia del analito diana relacionado con la enfermedad).

4.3. Otros lmites de niveles bajos


Hay diversos tipos de lmites de uso comn en la nomenclatura de la qumica clnica, que se emplearn en este tema: lmite de blanco ( LB ) , lmite de deteccin ( LD ) y lmite de cuantificacin ( LQ ) . Sin embargo, hay otros dos tipos de lmites, el lmite inferior del intervalo lineal y el lmite inferior del intervalo de medida. Es posible que cuatro de estos cinco lmites coincidan (con el modelo que consideraremos en el presente tema el LB es inferior al LD , o podran ser los cinco diferentes). Es ms frecuente que algunos sean iguales, pero no todos. Al describir estos conceptos es importante distinguir entre la verdadera cantidad de sustancia que se encuentra realmente en la muestra y el resultado de una medida individual. En este tema, se hablar de concentracin real para describir la que contiene realmente la muestra y concentracin medida o resultado para describir los valores que se obtendrn en el laboratorio cuando se utilice un mtodo analtico particular. La relacin entre estos conceptos se describe a continuacin: El menor es el lmite de blanco, LB , que es el valor ms alto que se espera observar en una serie de resultado obtenidos en una muestra que no contenga analito. Es importante notar que el LB se refiere a un resultado observado de la prueba, mientras que el resto de lmites se refieren a concentraciones reales del analito. El siguiente lmite ms bajo es el lmite de deteccin, LD , que es la concentracin real a la que un resultado observado muy probablemente exceda el LB y por tanto podr declarase detectado. El lmite de cuantificacin, LQ , es la menor concentracin real a la cual el analito es detectado con fiabilidad y a la cual la incertidumbre del resultado observado es menor o igual que el lmite establecido para la incertidumbre, por el laboratorio o por el fabricante del mtodo. Los objetivos para la incertidumbre (o para el sesgo o la imprecisin) deben obtenerse de las especificaciones del mtodo, o estar disponibles a partir de los registros del laboratorio. El lmite ms bajo del intervalo de medida

( LMR )

es el nivel ms bajo al que se cumplen las

condiciones definidas para el mtodo. Las condiciones definidas incluyen caractersticas establecidas, como sesgo e imprecisin, incertidumbre, entre otras caractersticas. El lmite inferior del intervalo lineal

( LLR ) , es la concentracin ms baja a la que la respuesta del

mtodo tiene una relacin lineal con la concentracin verdadera9. Esto implica requisitos para el error de nolinealidad, el cual debe acompaar a cualquier informe de linealidad. Siempre se cumple que LB < LD < LQ . El resto de lmites pueden no tener una relacin consistente con cada uno de los dems. El puesto relativo de estos lmites vendr determinado por los objetivos de cuantificacin, error de nolinealidad y otras caractersticas definidas para el mtodo.

4.4. Lmites de deteccin en el contexto de mtodos cualitativos


El lmite de deteccin es tambin un criterio de eficacia de mtodos cualitativos, donde existe un fondo continuo de seal instrumental, ya que el resultado se informa como positivo o negativo (o bien presente o ausente). Por ejemplo, los mtodos de ELISA usan una funcin de densidad ptica u otras respuestas instrumentales para distinguir entre respuestas positivas y negativas. Para tests cualitativos tambin es posible estimar el lmite de deteccin. La relacin entre el lmite de deteccin, el punto
9

NCCLS. Documento EP6. Evaluation of the linearity of quantitative measurement procedures: A statistical approach. pgina 13

discriminante entre los resultados positivos y los negativos (tambin denominado umbral o cutoff), y la respuesta instrumental a concentraciones cercanas a cero, deberan estar totalmente documentadas por el fabricante y ser comunicada a los usuarios. Esto no se aplica a los mtodos en que el punto discriminante est muy por encima del lmite de deteccin, como es el caso de los tests de embarazo. Las pruebas cualitativas pueden tener un intervalo dinmico estrecho y alcanzar la saturacin de la seal a concentraciones relativamente bajas. Sin embargo, todas las pruebas cualitativas con un fondo continuo tienen un rea de transicin desde la ausencia de respuesta o seal de fondo hasta la respuesta completa, y el punto discriminante est generalmente diseado para situarse en esa rea. Para algunas pruebas, los fabricantes definen un umbral diferente para los resultados positivos y los negativos, creando una zona donde la respuesta es indeterminada. Esta rea indeterminada se denomina intervalo del 95 % en el documento NCCLS EP12. User protocol for evaluation of qualitative test performance. En dicho documento, sin embargo, no se define un intervalo de confianza estadstico entorno al punto de cutoff, sino que los extremos que delimitan este intervalo son las concentraciones a las que resultados repetidos son positivos el 95 % de las veces o negativos el 95 % de las veces, respectivamente. Cabe destacar que la repeticin de una prueba de concentracin exactamente igual a la del cutoff proporcionar resultados positivos en el 50 % de las rplicas y resultados negativos en el restante 50 % de las veces. En este protocolo, el LB es el mismo que el punto de cutoff, el lmite superior del intervalo del 95 % se corresponde con el LD (donde las muestras verdaderamente positivas producen resultados positivos en el 95 % de las ocasiones), y el lmite inferior del intervalo es el cero (no existe analito presente en la muestra). El conocimiento del lmite de deteccin para un test cualitativo, combinado con el anlisis frecuente de un control positivo dbil, permite monitorizar en el laboratorio la consistencia de la eficacia del mtodo en la zona prxima a la concentracin de cutoff. Es posible experimentar un incremento no observado en el lmite de deteccin de una prueba cualitativa, por ejemplo, debido a cambios en los reactivos. Esto puede incrementar la proporcin de resultados falsamente negativos, debido a que las muestras con concentraciones detectables de un analito pueden tener resultados que caigan por debajo del cutoff, mientras que muestras con concentraciones altas seguiran en todo caso aportando respuestas correctamente positivas. Como consecuencia, la determinacin experimental del LD es importante para controlar la calidad de muchas pruebas cualitativas.

4.5. Procedimientos para determinar y verificar el lmite de deteccin de un mtodo


La aproximacin clsica para determinar el LD 10 se discute brevemente a continuacin. Para una determinacin dada, en el desarrollo del mtodo se prepara una serie de resultados en muestras de blanco y en muestras de muy bajo nivel de analito. Los resultados para las muestras de blanco se emplean para determinar una respuesta que es infrecuente, y por tanto proporciona un umbral donde los valores superiores se interpretan como positivos. Este punto y la desviacin tpica de las medidas de la muestra de bajo nivel se emplean para encontrar la concentracin en que las medidas excedern muy probablemente el valor esperado ms alto de los blancos. Las curvas de distribucin de probabilidad de medidas repetidas de un blanco y una muestra de baja concentracin de analito se esquematizan en la figura 2.

Figura 1. Distribuciones de las concentraciones observadas para el blanco y una muestra de baja concentracin de analito. La lnea discontinua correspondiente a concentraciones negativas indica que algunos instrumentos no proporcionan resultados menores de 0.

10

Currie AL, et al. Nomenclature in evaluation of analytical methods including detection and quantification capabilities (IUPAC recommendations). Pure Appl Chem. 1995; 67: 1699-723. pgina 14

4.6. Aproximacin general para determinar el lmite de blanco


Las dispersiones de los resultados de los blancos y las muestras de bajo nivel se deben al error aleatorio de la medida, que a menudo es menor para la muestra del blanco. En la figura 1, la media de las medidas del blanco es cercana a cero con una distribucin simtrica. Mientras que este tipo de seal puede producirse internamente en el instrumento, muchos instrumentos convierten automticamente los valores negativos de las seales en cero o en un valor pequeo positivo, o bien los suprimen de modo que nicamente se obtengan valores de concentracin positivos como respuesta. Se asume que los valores por encima del percentil 95 de la distribucin de valores en muestras verdaderamente sin analito se desviarn significativamente de las medidas del blanco. Cuando una muestra proporciona un valor observado que supera este lmite, puede decirse que contiene una cantidad de analito mayor de cero. Empleando este lmite, se tiene un 5 % de probabilidad de que dada una muestra verdaderamente sin analito se obtenga un valor que indique la presencia de analito. Se trata del error de tipo I (error ). Asimismo, se observa que medidas de una muestra con baja concentracin del analito pueden caer por debajo de este lmite, con lo cual seran indistinguibles de las medidas del blanco. Si se concluye que no existe analito detectable en estos casos, se comete un error de tipo II, asociado al riesgo , o error . En funcin de los costes relativos de ambos errores, cuando se desarrolla un mtodo se establecen los errores y adecuadamente. En 1997, ISO
11

recomend una definicin del mnimo lmite de deteccin en relacin con los niveles

establecidos para el error de tipo I y II. Por defecto, dichos errores se acotan al 5 %

de del 5 % se corresponde con usar el percentil 95 de la distribucin de valores del blanco como lmite para declarar un valor medido significativamente por encima del blanco. Dada una distribucin gaussiana de valores del blanco (figura 1), este lmite se corresponde con:

( = = 5% ) . Un valor

LB = B + 1, 645 B
donde:

[1]

B y B

son la media y desviacin tpica de las medidas del blanco respectivamente.

Para una situacin donde no existe posibilidad de obtener valores negativos, o si la distribucin de los valores del blanco no es gaussiana (por ejemplo, cuando siguen una distribucin asimtrica), el percentil 95 debe estimarse por otra aproximacin. El procedimiento ms directo es aplicar un mtodo no paramtrico basado en los valores ordenados. El percentil que constituye el lmite de la distribucin de los blancos, p B , es el que deja un porcentaje de valores en la cola superior de la distribucin, y se define como lmite de blanco, LB , es decir,

LB = p B 100

[2]

4.7. Aproximacin general para determinar el lmite de deteccin


Para establecer el error de tipo II, se debe considerar la concentracin mnima presente en la muestra, igual al LD, que proporciona resultados con una probabilidad especfica de superar el LB . Si se establece en un 5 % el nivel de error de tipo II, el 95 % de las medidas sern mayores que el LB cuando la concentracin real sea la del LD . La figura 1 ilustra dos casos de muestras, una con una concentracin real igual al LB y otra con una concentracin a un nivel tal que el percentil 5 de la distribucin de las medidas de concentracin de la muestra es igual al LB . En el primer caso (figura 1a, 50 % de las medidas estn por debajo del LB , y el otro 50 % por encima. Slo este ltimo 50 % sera declarado como excediendo significativamente el valor del blanco, es decir, conteniendo una cantidad detectable de analito, y por tanto = 50 % ). En la figura 1b, en cambio, el 95 % de las medidas con muestras que tienen una concentracin de analito igual al LD exceden al LB y sern declaradas como medidas conteniendo una cantidad detectable de analito. Por tanto, slo el 5 % de las medidas sern errneamente consideradas no significativamente diferentes del blanco, y = 5% , que es el riesgo de error de tipo II (riesgo ). El LD es la concentracin real de la muestra, la menor concentracin real que puede ser detectada con fiabilidad. Habitualmente, la distribucin de muestras de bajo nivel es gaussiana y el percentil 5 se corresponde con el LB :
11

ISO. Capability of detection Part 1: Terms and definitions. ISO 11843-1. Geneva: ISO, 1997. pgina 15

LB = s 1, 645 s
donde:

[3]

s y S

son la media y desviacin tpica de la poblacin de medidas de bajo nivel.

Globalmente, se tendr:

S = LD = LB + 1, 645 S
Si la distribucin de valores del blanco es gaussiana, LB =

B + 1, 645 B , y, por tanto,


[4]

LD = B + 1, 645 B + 1, 645 S

En caso de que la distribucin muestral no sea gaussiana (ni se pueda transformar en gaussiana), puede estimarse el LD no paramtricamente, como se ver; En caso contrario, ser necesario producir muestras de concentracin prxima al LD , y chequear cul es el valor para el que el 5 % o menos de las medidas observadas estn por debajo del LB .

Figura 2 Distribuciones de replicados para las muestras de blanco (curva izquierda en ambas figuras) y dos muestras hipotticas positivas de baja concentracin (2a y 2b). Cuando la concentracin real de analito presente en la muestra es igual al LB , el 50 % de las medidas sern superiores al (a). Con una concentracin real en la muestra igual al LD , (100% - ) (95%) de las medidas de las muestras sern superiores al LB (b).

4.8. Diseo del estudio


El diseo propuesto por el CLSI7 asume un sistema nico del laboratorio operando en condiciones estables (sin cambios de lote de reactivos ni modificaciones importantes en las calibraciones). Sin embargo, las recomendaciones incluyen consideraciones de variabilidad debidas al tiempo (o run) y diferencias entre sujetos. Los fabricantes deben considerar determinar el LD en dos o ms instrumentos con dos o ms lotes de reactivos para incluir la variabilidad debida a la combinacin de diferentes instrumentos/reactivos. Si los resultados de los diferentes sistemas son sustancialmente distintos, ser necesario estudiar las razones de dichas discrepancias. En caso contrario, se asume como LD la estimacin mayor que se haya obtenido. Esta sugerencia se debe contextualizar con consideraciones prcticas y con el coste del estudio. En cualquier diseo que se elija, los resultados deben ir acompaados de una descripcin completa del estudio y de los parmetros que fueron investigados.

4.9. Nmero de muestras


En la determinacin del nmero ptimo de muestras para establecer o verificar un LD , el objetivo es calcular el nmero necesario de determinaciones y muestras, tanto de blanco como de muestras de bajo nivel, de modo que se utilicen eficazmente los recursos. Se sobreentiende que a mayor nmero de muestras y de determinaciones las estimaciones obtenidas tendrn menor incertidumbre, de modo que el nmero total de medidas empleado estar limitado principalmente por cuestiones de disponibilidad de las muestras adecuadas o por racionalizacin de recursos econmicos. Desde el punto de vista estadstico, se buscar una solucin de compromiso entre el nmero de medidas de blancos y de muestras y la

pgina 16

incertidumbre de la estimacin del LB y la variabilidad entre las medidas en las muestras de bajo nivel (se hablar en trminos de s S ). La estimacin no paramtrica del LB es aproximadamente la mitad de eficaz que el procedimiento paramtrico. Esto significa que se espera obtener el mismo resultado mediante procedimientos paramtricos y no paramtricos, pero empleando el mismo nmero de muestras la estimacin paramtrica tiene menor incertidumbre (si los datos son gaussianos). Las incertidumbres del percentil o la estimacin de la desviacin tpica tambin sern proporcionales a la dispersin de las distribuciones. Por tanto, con una estimacin no paramtrica del LB y la estimacin paramtrica del LD , el nmero de medidas de blanco debera ser mayor que el de muestras de baja concentracin. Sin embargo, es ms frecuente que la dispersin de las medidas de la muestra de bajo nivel sea superior que la de las medidas del blanco. En conjunto, en la mayora de los casos puede ser aceptable procesar el mismo nmero de muestras de bajo nivel que de blancos. Cuando el nmero de medidas de blanco es el mismo que el de medidas de bajo nivel, la incertidumbre del LD decrece con el inverso de la raz cuadrada del nmero de medidas (ajustada por el nmero de muestras diferentes incluidas en el estudio). La relacin entre el tamao muestral y la incertidumbre del LD fue descrita por Linnet y Kondratovich.12. Una solucin de compromiso razonable entre precisin y coste es un mnimo de 60 medidas (tanto de blanco como de muestras de bajo nivel) para establecer el LD , generalmente cuando se desarrolla un mtodo. Para verificar un LD estipulado por el fabricante, se emplear un mnimo de 20 resultados de la concentracin esperada y, si es necesario, tambin de la concentracin del LB . Esta ser la evaluacin habitual realizada por el usuario.

4.10. Caractersticas de blancos y muestras de bajo nivel


Cuando sea posible, blancos y muestras positivas de bajo nivel deben ser intercambiables por muestras naturales, como ser por ejemplo el caso, para un a determinacin de un frmaco, de procesar suero o plasma sin el compuesto en lugar de nicamente una solucin de tampn. Dado que las muestras artificiales y preparadas por adicin del compuesto pueden tener distinto comportamiento que las muestras obtenidas de un paciente, habr que tener en cuenta consideraciones respecto a interferencias y efectos de matriz. Para asegurar que las medidas son representativas, es preferible recopilarlas de un nmero dado de muestras diferentes que de una misma muestra. Dadas las diferencias de matriz existentes de muestras a muestra, incluso en medidas repetidas de una misma muestra, se prefiere una serie de cinco o ms muestras. Estas medidas deberan realizarse a lo largo de varios das de modo que reflejen la realidad del mtodo en las condiciones habituales del laboratorio, incluyendo (cuando sea apropiado) diferente personal y equipo. Para verificar un valor dado, el periodo necesario no incluir cambios de lote de reactivos o mantenimientos importantes del equipo. Para establecerlo, en cambio, es necesario incluir cambios de lote de reactivos. Consideraciones para muestras de blanco Para compuestos endgenos, el blanco debera ser muestras a las que se haya eliminado el componente, por ejemplo por precipitacin con un anticuerpo, por degradacin enzimtica o por absorcin con carbn activado, etc. Para hormonas, las muestras de blanco pueden provenir de sujetos enfermos o pacientes con niveles suprimidos debido a tratamiento farmacolgico. Para marcadores tumorales, son vlidas muestras de sujetos no enfermos. Si no es posible evitar un nivel residual de analito, debera ser de un orden de magnitud inferior al lmite del intervalo analtico del mtodo. Consideraciones para muestras positivas de bajo nivel Para muestras de bajo nivel de compuestos endgenos, se prefiere emplear una serie de muestras de sujetos con concentraciones bajas. Si es necesario adicionar a una muestra el analito (por ejemplo, para un frmaco), es mejor hacerlo sobre muestras de diferentes sujetos antes que del mismo paciente o a un pool. La s S conjunta se estimar a partir de medidas repetidas con la serie de muestras, por ejemplo, 12
12

Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. Clin Chem. 2004; 50: 732-40. pgina 17

medidas de cada una de cinco muestras. Las medidas deberan realizarse en das diferentes de modo que la s S refleje la variacin analtica total. Para que las estimaciones del LD y el LB tengan significado, los valores medidos deberan ser trazables hasta un nivel conocido. Si existe mtodo de referencia para el analito de inters, deberan compararse las medidas obtenidas por ambos mtodos en concentraciones cercanas al mmite inferior del intervalo analtico. La trazabilidad tambin puede comprobarse con medidas sobre muestras suplementadas.

4.11. Resultados
Las medidas pueden realizarse de una caracterstica o propiedad como la concentracin o la actividad siempre que la cantidad medida (el mensurando) est claramente definida. Cuando el mensurando difiere del analito de inters (por ejemplo, una actividad enzimtica no es lo mismo que la concentracin en masa del enzima), la cantidad debe estar bien definida. Esto es esencial para entender las diferencias en LD para diferentes mtodos o bajo diferentes condiciones de medida.

4.12. Procedimiento para determinar y verificar el lmite de blanco y el lmite de deteccin


Los procedimientos para establecer las caractersticas y verificar las especificaciones de un mtodo difieren en complejidad y en el nmero de medidas necesarias. El procedimiento para hacerlo se basa en el mismo modelo y las mismas tolerancias para los errores de tipo I y II.

4.13. Procedimiento para determinar o establecer el lmite de blanco


Se recomienda que se procesen un mnimo de 60 medidas de blanco. El LB se estima para N B medidas repetidas de una o varias muestras de blanco. El uso de varias muestras puede ayudar a asegurar que una muestra con cierta cantidad detectable de analito no sea tomada como un blanco. Si los datos parecen seguir una distribucin de Gauss, se deber emplear la ecuacin [1] para estimar el LB . Si los datos no siguen una distribucin normal (as como si estn truncados en el cero) se emplear la ecuacin [2] y el siguiente procedimiento. Dados los datos ordenados, se calcula el percentil apropiado este caso, p = (100 ) = 95 :

( p ) (en funcin del valor deseado para . En

p LB = resultado en la posicin N B + 0,5 100

= resultado en la posicin ( 0,95 N B + 0,5 ) = Pr (1 )

[5]

Si no es un valor entero se realizar una interpolacin lineal. En la prctica suele calcularse el percentil de orden 100 mediante cualquier software apropiado.

4.14. Procedimiento para determinar el lmite de deteccin


Para determinar el LD , se estima la desviacin tpica de las medidas de la muestra s S

( ) a partir de

NS

medidas repetidas de muestra(s) con una concentracin baja detectable, por ejemplo, una concentracin en aproximadamente de cuatro veces el LB . Se recomienda un mnimo de 60 resultados obtenidos a partir de muestras de baja concentracin. El procedimiento preferido es tomar varias muestras de bajo nivel (de cuatro a seis) y calcular una estimacin conjunta de la precisin a esos niveles. Antes de juntar las estimaciones individuales de la precisin, debera comprobarse la consistencia de las mismas mediante un test F convencional (dos muestras) o un test de Cochran, en caso de que se trate de ms de dos muestras. Si el test falla, es preciso investigar una posible causa tcnica. Puede ser indicativo de inestabilidad de la reaccin o de que alguna de las muestras est afectada de una variabilidad superior a la esperada. Se obtiene de este modo una estimacin preliminar, LD p segn:

LD p = LB + c s S
donde: s S

[6]

es la desviacin tpica estimada de la distribucin de las muestras de bajo nivel; y

pgina 18

se deriva del percentil 95 de la distribucin de Gauss, como factor de correccin aplicado

debido a que la s S es una estimacin sesgada de la desviacin tpica poblacional Si el nmero de medidas N S no es demasiado pequeo,

S.

c =

1, 645 1 1 4g

donde: g

son los grados de libertad de la desviacin tpica estimada s S .

Por ejemplo, si se han obtenido 60 resultados

(N

= 60 ) a partir de cinco muestras de concentracin baja

( k = 5) , para la desviacin tpica conjunta estimada s S ,


g

= N S k = 55 1, 645 = 1, 653 1 1 220

c =

No es necesario ni deseable obtener todas las medidas en la misma muestra de baja concentracin. El motivo es que el empleo de varias muestras permite tener en cuenta la variabilidad entre sujetos. Consideraciones acerca de la desviacin tpica Es importante considerar si la s s obtenida al nivel medido puede ser la misma que al nivel del LD p . En la estimacin del LD , un problema comn es que la desviacin tpica muestral no sea constante, pues frecuentemente aumenta con la concentracin. Sin embargo, en un intervalo limitado de concentraciones, podra ser aproximadamente constante y el procedimiento anterior es adecuado. Si se puede asumir una s s constante, entonces LD = LD p . En caso contrario, se debe considerar una aproximacin ms complicada, asumiendo que la desviacin tpica muestral es funcin de la concentracin13,14.

4.15. Consideraciones sobre la forma de la distribucin


Si los datos de la concentracin baja no son gaussianos, cabe la posibilidad de transformar los datos para obtener una distribucin normal, por ejemplo mediante una transformacin logartmica. En este caso, el LD se calcula en las unidades transformadas, y posteriormente convertirlo a las unidades originales mediante la transformacin inversa (por ejemplo, exponencial). Si no es posible obtener una distribucin normal, pero la s S es razonablemente constante, se puede emplear una estimacin no paramtrica de la dispersin, calculada como la distancia entre el percentil de la distribucin de medidas y el valor asignado (o valor aceptado como referencia) para la muestra de bajo nivel. Esta distancia, que se denominar D S , , es anloga al trmino c s S de la ecuacin [6], por lo que:

LD = LB + D S ,
Si la s S no es constante, y no es posible obtener datos normales, deber emplearse un procedimiento de prueba y error no paramtrico Se prepararn muestras a niveles similares al LD esperado y se obtendr una serie de medidas (en distintos tiempos y con diferentes operadores). Se calcularn los percentiles ,

ISO. Capability of detection. Part 1. Terms and definitions. ISO 11843-1. Geneva:ISO, 1997. ISO. Capability of detection. Part 2. Methodology in the linear calibration case. ISO 11843-2. Geneva:ISO, 2000.
14

13

pgina 19

como porcentaje de observaciones por debajo de LB . El LD es el menor nivel para el cual dicho percentil sea del 5 % o menor.

4.16. Procedimiento para verificar un lmite de deteccin


En un laboratorio se puede plantear asegurar que un procedimiento cumpla las especificaciones de LD que establece el fabricante, en lugar de establecer su propio LD . Si se dispone de l, el laboratorio debera usar el LB proporcionado por el fabricante, pero debe verificarlo con al menos 20 replicados de un blanco. Se puede asumir el LB considerado por el fabricante si no se observan ms de tres replicados superiores al LB . Si no se conoce el LB , se debe estimar como se ha descrito anteriormente y posteriormente procesar muestras repetidas de la concentracin del LD para as estimar la proporcin de resultados que exceden el LB . Se recomienda un mnimo de 20 medidas de dichas muestras, si es posible en diferentes muestras y varios das. Si la proporcin de observaciones que superan el LB est de acuerdo a lo esperado ( 1 , por defecto 95 %), es decir, si el 95 % est incluido en el intervalo de confianza del 95 % para la proporcin registrada, puede decirse que los datos apoyan el LD del fabricante. Puede ocurrir que se obtenga ms de una medida de 20 por debajo del LB y an as se cumpla este criterio. En la tabla 2 se presenta, para tamaos muestrales entre 20 y 1000, los lmites inferiores de la proporcin registrada que estn de acuerdo con la proporcin esperada del 95 %. Si la proporcin obtenida no est de acuerdo con el 95 % esperado, entonces no habr sido posible verificar el LD del fabricante. El usuario debera considerar contactar con ste, o establecer un LD por su cuenta, como es ha descrito anteriormente.

n
20 30 40 50 60 70 80 90 100 150 200 250 300 400 500 1000

lmite inferior proporcin observada (%)


85 87 88 88 88 89 89 90 90 91 92 92 92 93 93 94

Tabla 2. Lmites inferiores del 95 % de confianza para los resultados observados que excedan el LB con una proporcin esperada de 1- = 95 % (modificado de Linnet & Kondratovich)15 Ejemplo de verificacin de un LD Un procedimiento analtico para medir una hormona un LD de 45 UI/L segn el fabricante con = = 5% . El usuario determina 25 medidas de blanco (5 medidas de 5 muestras de blanco durante 5 das) y 25 medidas en muestras a las que se ha aadido 45 U/L del analito (5 medidas de 5 muestras en 5 das). Los resultados se presentan en la tabla 3 y la figura 2. La inspeccin visual revela que la distribucin Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. Clin Chem. 2004; 50: 732-40. pgina 20
15

de valores del blanco es asimtrica y, por lo tanto, se estima el LB no paramtricamente. El percentil 95 es 20,28.

orden
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

blancos muestras
0 0 0 0 0 0 0 0 0 1,08 1,92 2,38 2,98 3,8 4,78 7,3 8,81 10,31 11,29 13,48 14,39 16,97 17,4 21 24 18,8 19,02 26,63 26,91 31,08 33,99 35,11 35,9 36,12 41,67 43,9 46,32 47,77 47,99 48,83 54,67 57,3 59,1 61,17 61,96 62,97 66,44 73,44 73,8 75,71

Tabla 3. Valores de ejemplo para una verificacin del LD

Figura 3. Ejemplo de verificacin del LD distribuciones de las 25 medidas del blanco y de las 25 de muestras suplementadas con analito de modo que la concentracin sea igual al LD supuesto de 45 U/L. Se estim el LB en 20,28 UI/L (p95 de la distribucin de los blancos). El 92 % de las medidas de las muestras, 23 , superaron el LB . pgina 21

25

En la tabla 3 se observa que el 92 % es mayor que el lmite inferior (85 %) para una confianza del 95 % siendo el tamao muestral de 25. Por tanto, la proporcin observada no es contradictoria con el LD esperado.

5. Lmite de cuantificacin
El Lmite de cuantificacin ( LQ ) es la menor cantidad de analito que puede ser detectado con fiabilidad (el

LD ), y al cual el error total cumple los requisitos del laboratorio para aportar un aceptable uso clnico. Dependiendo del objetivo definido para el error, el LQ puede ser igual la LD o mucho mayor. Nunca
puede ser inferior. El LQ debera determinarse como parte del desarrollo del mtodo y puede ser documentado por el fabricante. El usuario puede establecer su propio LQ o verificar el del fabricante. No es necesario determinar el LQ para cada mtodo si puede determinarse la incertidumbre (o error total) de la medida para los niveles bajos. En estos casos, puede ser aceptable informar la incertidumbre estimada del resultado de cada resultado de nivel bajo y permitir al usuario interpretar si es adecuado para su uso.

5.1. Establecimiento del lmite de cuantificacin


Los resultados del estudio del LD deberan usarse para estimar el sesgo y la imprecisin para cada nivel de analito. Para este protocolo, se recomienda un mnimo de 40 replicados, entre tres y cinco muestras diferentes, determinadas en al menos cinco series. La diferencia entre la media de los replicados (si se emplea una muestra) y el valor de referencia aceptado es una estimacin del sesgo. Si se emplea ms de una muestra para cada nivel, el promedio de las diferencias es una estimacin de la veracidad. La desviacin tpica total de los 40 resultados (una muestra) o la estimacin conjunta de la s S es una estimacin de la precisin. La combinacin de estos para estimar el error total a cada nivel, se realiza empleando: sesgo + 2 s S = error total (si el sesgo es negativo, usar sesgo 2 s S = error total ). Si la estimacin es inferior al objetivo definido para el error total, puede asumirse que: LQ = LD . Este procedimiento asegura que, para muestras con un valor verdadero igual al LQ, hay aproximadamente un 95 % de probabilidad de que el resultado del test sea suficientemente exacto. Si se requiere mayor probabilidad, la s S debera multiplicarse por un factor mayor; por ejemplo, si sesgo + 4 s S y sesgo 4 s S estn dentro de los valores esperados (y el error es gaussiano), ms del 99,5 % de los resultados se ajustarn al uso deseado. Si no se cumple el objetivo a este nivel, debern chequearse niveles ligeramente ms altos. Deben obtenerse materiales de referencia adecuados, similares a los materiales empleados para determinar el LD . La concentracin real debe ser conocida por un mtodo independiente, bien mediante un mtodo de referencia, por suplementacin, o, cuando sea adecuado, por dilucin. Si los materiales con comerciales, la incertidumbre del factor de dilucin y/o proceso de suplementado debe incluirse con la estimacin de la incertidumbre o del error total derivado del estudio. Si se obtiene un LQ superior al menor nivel asumido en el intervalo de medida (o intervalo comunicable), el intervalo de medida puede no ser adecuado para el uso deseado en el laboratorio. Si los lmites inferiores del 95 % de confianza para la estimacin del sesgo y la imprecisin son mayores de lo descrito para el mtodo, deber investigarse una causa tcnica.

5.2. Verificacin de un lmite de cuantificacin


Si se desea confirmar un LQ o si el error no puede asumirse como gaussiano, se puede usar un procedimiento alternativo para chequear el LQ descrito. Esto requiere el seguimiento de todas las consideraciones anteriores, a excepcin del clculo de s S y la estimacin del error total, y es aceptable un mnimo de 25 replicados. En este caso, los replicados en cada muestra se comparan con el valor de referencia para la muestra y el objetivo de error total. El nmero de resultados que excedern el error total es una medida de lo adecuado del mtodo a ese nivel. Se puede utilizar la tabla 3 para determinar el nmero de resultados inaceptables que podran ser observados, si se emplea un criterio del 95%. Por ejemplo, si hay un total de 30 replicados (sobre un nmero de muestras), en la tabla 3 se puede ver que al menos 87 % de los resultados (26,1, redondeados a 27) deben estar entro del objetivo de error. Por tanto, si pgina 22

se obtienen hasta tres resultados con error excesivo, el LQ puede considerarse verificado. Si existe duda acerca de este resultado (en el ejemplo, permitiendo al 10 % de las muestras tener un error excesivo), deben obtenerse ms replicados. Si no se cumple este criterio, el LQ descrito por el fabricante quedar en entredicho.

5.3. Informe de resultados


5.3.1. Informe de intervalos para resultados cuantitativos Habiendo establecido varios lmites de acuerdo con este protocolo, el fabricante de un mtodo puede querer informar LB , LD y LQ en el folleto incluido en los reactivos o descripcin del mtodo. Si el fabricante del mtodo decide informar de estos lmites, deben ir acompaados de las probabilidades y , objetivos para los niveles establecidos de precisin y veracidad, as como otras caractersticas del diseo. El informe va a depender de dnde se sitan los resultados observados respecto a los lmites y de los procedimientos del laboratorio. Si un laboratorio quiere aportar el mximo de informacin, incluyendo la zona gris de incertidumbre de la cuantificacin, sera adecuado el siguiente planteamiento: Si

resultado LB

se informa como se informa como (a) se informa como

no detectado; concentracin < LD ; analito detectado; concentracin < LQ; analito detectado; concentracin < LQ ; o bien

Si LB < resultado < LD Si LD resultado < LQ

(b) se informa el resultado advirtiendo de que posiblemente est sujeto a mayor incertidumbre; Si

resultado > LQ

se informa.

Si un laboratorio elige informar slo resultados cuantitativos y simplificar el informe de las concentraciones inferiores al LQ , puede ser adecuado el siguiente procedimiento: Si Si Si

resultado LB resultado LQ

se informa como

concentracin < LD o no detectado; concentracin < LQ o detectado

LB resultado < LQ se informa como

se informa el resultado medido

Figura 4. 5.3.2. Precauciones en la interpretacin de resultados cuantitativos Los valores medidos menores que el LQ pero superiores al LB pueden servir para demostrar la presencia del analito, pero los niveles reales medidos no deberan emplearse para ninguna interpretacin clnica. Los resultados que se siten entre el LD y el LQ no deberan informarse sin alertar de la posible mayor incertidumbre de esos valores. El LD y el LQ pueden coincidir o diferir en cierta cantidad, dependiendo de la incertidumbre del LD y de los objetivos del laboratorio. Si hay diferencia entre ambos valores, no se puede asumir que la respuesta medida entre el LD y el LQ sea lineal, ni siquiera que siga una funcin montona creciente. Aunque esta monotona sea cierta en la mayora de los casos, pueden darse situaciones en que no exista relacin a esos pgina 23

niveles, debido a discontinuidades, valores nulos, etc. Si no existe una documentacin clara acerca de la relacin montona, no deben hacerse interpretaciones acerca de concentraciones en este intervalo de concentraciones. En la prctica rutinaria, el LD y el LQ deberan emplearse como se ha descrito anteriormente para decidir cmo informar los resultados. Existen otras situaciones, como es el caso de que se use el promedio de varias rplicas como resultado para un sujeto, o en estudios cientficos, en que deben registrarse las concentraciones medidas (si se dispone de ellos), independientemente de que estn por debajo o por encima del LD , porque en estas situaciones si se emplean resultados truncados, cualquier promedio estara sesgado.

6. Linealidad
La demostracin del intervalo lineal requiere una serie de concentraciones conocidas o relaciones conocidas establecidas por dilucin. En todas las situaciones la secuencia de anlisis debe ser aleatoria. El experimento del intervalo lineal requiere contar con suficiente cantidad de cada espcimen para preparar diluciones y llevar a cabo el anlisis de cada uno de cinco o ms concentraciones. El volumen puede variar segn lo que se desee establecer: Para demostrar que la operacin del sistema est dentro de las especificaciones del fabricante deben emplearse de cinco a siete concentraciones elegidas a lo largo de todo el intervalo lineal establecido. Deben chequearse dos replicados de cada nivel. En el desarrollo de mtodos nuevos, si se desea establecer el intervalo lineal, o cuando se quiere modificar un mtodo ya existente, deberan emplearse entre siete y once concentraciones a lo largo del intervalo de medida que se espera de antemano. En el desarrollo de mtodos se puede emplear ms puntos y ampliar dicho intervalo hasta hacerlo un 20 30 % ms amplio, con la intencin de eliminar algunos de los puntos y obtener el intervalo lineal ms amplio posible. Deben usarse de dos a cuatro replicados de cada nivel, dependiendo de la imprecisin esperada.

El nmero mnimo de puntos para describir de una manera fiable un intervalo lineal es cinco, mediante un mtodo polinmico. Con mayor nmero de puntos, se obtendr una descripcin ms exacta de la linealidad se podr tambin establecer un intervalo lineal ms amplio, una vez se hayan eliminado los puntos necesarios. Se recomienda preparar adecuadamente niveles de concentracin intermedia igualmente espaciados mezclando proporcionalmente un pool alto y uno bajo, aunque el mtodo que se propone en el documento CLSI EP6 no lo requiere necesariamente.9 Se acepta el empleo de muestras especialmente preparadas para obtener concentraciones especficas, dado que se conocern las concentraciones relativas a cada una de las dems. Para esta evaluacin, se cometer menos error si se emplean mezclas preparadas, dispensando con exactitud adecuada, a partir de un pool alto y otro bajo, que si se emplean muestras individuales o soluciones reconstituidas o preparadas en el laboratorio. Debe tenerse especial precaucin cuando se dispensen volmenes pequeos. Las pipetas de desplazamiento positivos son tiles para preparar diluciones exactas con pequeos volmenes.

S = 5 muestras S = 6 muestras
1: bajo (L) 2: 0,75 L + 0,25 H 3: 0,50 L + 0,50 H 4: 0,25 L + 0,75 H 5: Alto (H) 1: bajo (L) 2: 0,80 L + 0,20 H 3: 0,60 L + 0,40 H 4: 0,40 L + 0,60 H 5: 0,20 L + 0,80 H 6: Alto (H)

S = 7 muestras
1: bajo (L) 2: 0,833 L + 0,167 H 3: 0,667 L + 0,333 H 4: 0,500 L + 0,500 H 5: 0,333 L + 0,667 H 6: 0,167 L + 0,833 H 7: Alto (H)

S = 8 muestras
1: bajo (L) 2: 0,857 L + 0,143 H 3: 0,714 L + 0,286 H 4: 0,571 L + 0,429 H 5: 0,429 L + 0,571 H 6: 0,286 L + 0,714 H 7: 0,143 L + 0,857 H 8: Alto (H)

S = 9 muestras

1: bajo (L) 2: 0,875 L + 0,125 H 3: 0,750 L + 0,250 H 4: 0,625 L + 0,375 H 5: 0,500 L + 0,500 H 6: 0,375 L + 0,625 H 7: 0,250 L + 0,750 H 8: 0,125 L + 0,875 H 9: Alto (H) Tabla 4. Esquemas de dilucin para preparar muestras de cinco a once concentraciones igualmente espaciadas

pgina 24

Se pueden emplear productos comerciales para diagnstico in vitro, siempre que se sigan las instrucciones del fabricante. Estos productos permiten verificar cuantitativamente una calibracin, validar intervalos de medida, y determinar la linealidad de sistemas qumicos automticos, semiautomticos y manuales. A continuacin, se presenta una lista de posibles tipos de especmenes en orden de preferencia para la aplicacin que nos atae. Debe extremarse la precaucin en lo que respecta a emplear una matriz apropiada para un mtodo particular.

6.1. Pool de muestras de pacientes


La matriz de muestra ideal es un pool de especmenes de pacientes con una concentracin de analito cercana al lmite superior del intervalo dinmico esperado, que ser diluido con otro pool de muestras de pacientes de la menor concentracin esperada o deseada. La concentracin final de los pooles que realmente se analicen representar el intervalo estudiado. Por lo tanto, los pooles alto y bajo finales pueden requerir ajuste para llevarlos al intervalo deseado.

6.2. Pool de muestras de pacientes diluido con un diluyente recomendado


El fluido empleado para diluir una concentracin del pool de muestras de pacientes de concentracin alta puede afectar a los resultados obtenidos. Slo el diluyente recomendado por el fabricante, o que se haya comprobado como aceptable en el laboratorio, deber emplearse para las diluciones. Para aquellos sistemas analticos que permitan la dilucin de la muestra del paciente cuando las concentraciones del analito estn por encima del intervalo dinmico, empleando el diluyente apropiado para demostrar la linealidad a lo largo del intervalo de medida, existe la ventaja de que se dispondr de un diluyente recomendado y chequeado para dicho fin.

6.3. Pool de muestras de pacientes suplementado con el analito de inters


El material de suplemento que contenga el analito de inters no necesita ser de alta pureza si no existen sustancias interferentes. En caso contrario, debe registrarse en el estudio la fuente, pureza, efecto esperado... Si se emplea una disolucin concentrada del analito para suplementar el pool, se debe diluir el pool lo menos posible (en principio, menos del 10 %), y documentar el disolvente.

6.4. Pool diluido con materiales tratados de baja concentracin o con otro pool tratado
Si es posible, se emplear para las diluciones un pool de pacientes de baja concentracin. Alternativamente, pueden emplearse ciertos tratamientos para reducir la concentracin de analito, (como dilisis, tratamiento por calor o cromatografa). Debe tenerse en cuenta que estos tratamientos pueden alterar el analito y/o la matriz fsica o qumicamente. Es ms importante mantener constante la matriz que alcanzar bajos niveles por simple dilucin.

6.5. Controles / calibradores / materiales para estudio de linealidad comerciales


Si se emplean estos materiales, deben analizarse como si se tratara de muestras de pacientes. Si no se suministran mezclas de las concentraciones apropiadas, se emplear la muestra ms alta y ms baja para preparar concentraciones intermedias. Conviene asegurar que el analito est en la forma fisiolgicamente normal (por ejemplo, enlazado a protena o como metabolito, si es el caso).

6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado
Cuando se empleen estas muestras debe considerarse posibles efectos de matriz que puedan afectar a los resultados. Las diluciones deben ser las mnimas necesarias y han de documentarse.

6.7. Material de control comercial diluido con diferente volumen del establecido
Cuando se empleen estas muestras deben considerarse posibles efectos de matriz que puedan afectar a los resultados: estos efectos pueden modificar la concentracin. Las diluciones deben ser las mnimas necesarias y han de documentarse. Debe extremarse la precaucin para asegurar que se consigue una completa disolucin del material liofilizado.

pgina 25

6.8. Soluciones acuosas


Cuando se emplean disoluciones acuosas, no se chequean los efectos de la matriz de las muestras reales en la respuesta del mtodo. Dichos efectos de matriz pueden influir en la interpretacin de los resultados. Aunque son preferibles materiales de alta pureza porque minimizan las posibles interferencias que potencialmente afecten a los resultados, pueden ser aceptables materiales menos puros. Muchos mtodos qumicos en clnica se calibran con materiales acuosos, y la concentracin suministrada por pesada puede ser aceptada como valor diana.

6.9. Disoluciones en otros disolventes


Los efectos de matriz pueden ser ms probables an si se emplean disolventes orgnicos. La secuencia analtica debera ser aleatoria. Si existe arrastre o deriva significativos los resultados del experimento no son aceptables.

6.10. Intervalo analtico


Los niveles de concentracin extremos elegidos para la medida deben incluir o ser iguales a los valores mnimo y mximo especificados en las caractersticas del mtodo. Cuando se establece el intervalo lineal, se emplean entre siete y once niveles seleccionados en un intervalo de concentraciones dentro de un rango que ser entre un 20 y un 30 % ms amplio que el intervalo de medida esperado, con la intencin de eliminar puntos de nolinealidad y establecer el intervalo ms amplio posible de respuesta lineal aceptable. El empleo de un nmero mayor de niveles puede ayudar a justificar el uso de la interpolacin para definir las caractersticas del intervalo dinmico de medida. Si no se conoce la concentracin de los pooles alto y/o bajo, debe codificarse cada uno de ellos. La codificacin es el proceso de asignar a cada pool un nmero que aluda a su concentracin relativa. Para concentraciones igualmente espaciadas, la codificacin permite asignar nmeros enteros a cada pool consecutivo. En otras palabras, las concentraciones del pool no necesitan ser conocidas de antemano. Para verificar los lmites, puede emplearse la media de los resultados de los pooles alto y bajo. Se puede preparar una concentracin intermedia a partir de los pooles alto y bajo as como sucesivas concentraciones intermedias a partir de sta y los pooles alto y bajo. En el ejemplo siguiente, se emplea un protocolo por dilucin, aunque en algunos laboratorios puede ser preferible un diseo gravimtrico. Independientemente del procedimiento por el cual se preparen las disoluciones, stas deben realizarse con extremo cuidado (1) Se obtienen dos pooles (de concentraciones alta y baja respectivamente), en una matriz aceptable y con suficiente volumen para todo el experimento. El volumen requerido de cada pool depender del volumen del procedimiento. Aseguraremos que el sistema de dispensacin es el ms exacto y preciso posible. La siguiente aproximacin se basa en cinco concentraciones igualmente espaciadas. (2) El pool de concentracin baja (idealmente cerca y dentro del lmite bajo) se codifica como Pool 1; el pool de la concentracin ms alta chequeada se codifica como Pool 5. (3) Los pooles de concentracin intermedia se preparan por dilucin y se establecer la relacin entre ellos y con los pooles alto y bajo mediante intervalos constantes. Un mtodo conveniente para preparar los pooles intermedios es el siguiente: Pool 2: 3 partes de pool 1 y 1 parte de pool 5. Pool 3: 2 partes de pool 1 y 2 partes de pool 5.

Pool 4: 1 parte de pool 1 y 3 partes de pool 5. La concentracin de cada pool se define por la siguiente frmula

concentracin =
donde: C 1 es la concentracin de Pool 1; es a concentracin de Pool 5; es el volumen del Pool 1; es el volumen de Pool 5.

C 1 V1 + C 5 V 5 V1 + V 5

C5 V1 V5

pgina 26

Debe tomarse la precaucin de mezclarlos perfectamente y protegerlos de la posible evaporacin y deterioro. Por ejemplo, para un sistema analtico que requiera 0,05 mL por determinacin, y se chequeen 10 muestras por concentracin, se necesitarn al menos 0,5 mL adicionales de volumen muerto. Supongamos que la concentracin del pool 1sea de 120 unidades y la del de concentracin baja de 40 unidades (no es preciso conocer la concentracin antes de analizarlo). (1) Especmenes para Pooles 1 y 5: alcuotas de 0,6 mL se dispensan en tubos apropiadamente rotulados. (2) Pool 2: se aaden 0,6 mL de Pool 1 a 0,2 mL de Pool 5. (3) Pool 3: Se mezclan 0,4 mL de Pool 1 y 0,4 mL de Pool 5. (4) Finalmente, el Pool 4 se hace mezclando 0,2 mL de Pool 1 y 0,6 mL de Pool 5. La concentracin de Pool 4 se calcula segn:

Pool 4 =

40 0, 200 + 120 0, 600 = 100 unidades 0, 200 + 0, 600

Las concentraciones esperadas de los pooles son 40, 60, 80, 100, y 120 unidades. La representacin de los resultados analticos puede emplear concentraciones conocidas o calculadas. Para establecer el intervalo lineal: 9 a 11 niveles, y 2 a 4 replicados de cada nivel. Para validar las especificaciones de un mtodo: 7 a 9 puntos, y 2 o 3 replicados de cada nivel.

Para confirmar que el intervalo lineal es vlido en un laboratorio: 5 a 7 niveles, y 2 replicados de cada nivel. Las muestras deberan analizarse aleatoriamente durante la misma serie o series analticas prximas. El nmero de rplicas deber ser suficiente para proporcionar una estimacin fiable de la concentracin a cada nivel. Para algunos analitos, en algunas concentraciones, se puede requerir 35 rplicas. Los usuarios deben juzgar acerca del nmero de rplicas necesarias. Este procedimiento no se ve afectado negativamente por el empleo de diferente nmero de replicados a diferentes niveles. En este captulo, se hablar de outliers en el sentido de aquellos resultados aislados que sean visual o estadsticamente diferentes del resto de los resultados, y se aplica slo a valores individuales de los replicados. No son mltiples replicados del mismo nivel o un valor promedio a un nivel; Estos tipos de resultados desviados seran indicativos de falta de linealidad o de error sistemtico. Los outliers son resultados que proceden de errores probados o razonablemente asumidos. En este contexto, los outliers son resultados que no se ajustan al patrn representado por el resto de los datos. La inspeccin visual de la grfica de los resultados frente a los valores esperados suele ser suficiente para detectarlos. Un nico outlier en una serie de datos puede ser eliminado y no necesita ser reemplazado. Si subjetivamente se observa ms de un punto candidato a ser eliminado, el sistema de medida probablemente sea impreciso, y las causas de la misma deberan ser examinadas y a ser posible solucionadas antes de tratar de establecer o verificar la linealidad del mtodo.

6.11. Determinacin del intervalo lineal


La evaluacin polinmica de la linealidad asume, a priori, que los datos no son lineales. Esta aproximacin asume que los resultados se ajustan perfectamente a una curva en ausencia de error aleatorio. Si la curva de mejor ajuste es lineal o no afecta a la capacidad de interpolar entre los datos experimentales. Esencialmente, el mtodo polinmico evala la nolinealidad: por este motivo se emplean polinomios. El mtodo consta de dos partes. La primera parte examina si un polinomio nolineal ajusta los datos mejor que una lnea recta. La segunda parte, realizada en aquellos casos en que el ajuste polinmico nolineal es mejor que el lineal, establece si la diferencia entre el polinomio nolineal que mejor se ajusta y el lineal es menor que la cantidad de sesgo aceptable para el mtodo, que debera estar predefinido.

6.12. Regresin polinmica


La evaluacin de la linealidad requiere al menos cinco disoluciones de diferentes concentraciones analizadas al menos por duplicado. Se debe conocer tanto la concentracin de analito como la relacin entre las disoluciones, que puede consistir en intervalos equidistantes o intervalos de distinta longitud. Por ejemplo, en un intervalo de 0,20 a 1,00 g/L, las soluciones equidistantes deberan tener concentraciones de 0,40, 0,60, y 0,80 g/L. Se puede representar 0,20, 0,40, 0,60, 0,80 y 1,00 g/L para los valores en el eje de las abscisas, o 1, 2, 3, 4 y 5.

pgina 27

A continuacin, se realiza un anlisis de regresin polinmica para polinomios de primero, segundo y tercer orden. Esto puede llevarse a cabo en la mayora de los programas estadsticos comerciales.

6.13. Orden de la regresin polinmica orden


primero segundo tercero

polinomio

grados de libertad de la regresin (g. de l. reg)


2 3 4

y = b 0 + b1 x
y = b 0 + b1 x + b 2 x 2 y = b 0 + b1 x + b 2 x 2 + b3 x 3

El modelo de primer orden es una lnea recta. Esta ser la ecuacin de mejor ajuste lineal tanto si el mtodo es lineal como si no lo es. El modelo de segundo orden describe una relacin en la que existe una curva de respuesta, tanto con una tendencia creciente en la misma como decreciente. El modelo de tercer orden ajusta situaciones donde la respuesta cambia segn los niveles; respuestas con forma sigmoide se ajustan bien a este modelo, dado que son modelos donde no hay linealidad en los extremos del intervalo de medida. Los coeficientes de regresin se etiquetan como bi . En el modelo de segundo orden, b 2 es el coeficiente de nolinealidad; en el modelo de tercer orden, b 2 y b3 son coeficientes de nolinealidad. Se debe obtener el error estndar de la pendiente para cada coeficiente de nolinealidad, es i . El siguiente paso es realizar una prueba t para comprobar si los coeficientes de nolinealidad son estadsticamente significativos; esto es, si el coeficiente es significativamente diferente de cero. Los primeros dos coeficientes b 0 , b1 chequean porque nunca reflejarn noinealidad. El test se calcula como sigue, para b 2 y b3 :

) no se

t =

bi es i

Se calcula el nmero de grados de libertad a partir de la formula:

grados de libertad ( g . de l.) = L R g . de l. reg


donde: L es el nmero de concentraciones diferentes, es el nmero de replicados de cada preparacin o concentracin; y g. de l. reg. es el nmero de grados de libertad consumidos por el anlisis de regresin. g. de l. reg es el nmero de coeficientes presentes en el modelo de regresin (incluido b 0 ). (En el ejemplo anterior, para un polinomio de tercer orden sera L = 5 ; R = 2 , g. de l. reg. = 4, y g.de l. = 5 2 - 4 = 6 . Se consultara el valor crtico de t (bilateral para

= 0, 05 ),

o la probabilidad de que se exceda el valor

observado de t . Si ninguno de los coeficientes de nolinealidad, b 2 o b3 , son significativos ( p > 0, 05 para todos), puede considerarse que los datos son lineales y el anlisis est completado excepto si es preciso chequear una gran imprecisin. Si alguno de los coeficientes de nolinealidad son significativos, b 2 en el modelo de segundo orden, o b 2 o

b3 en el modelo de tercer orden, ( p < 0, 05 ) , entonces los datos no son lineales segn este protocolo. Es
importante notar que ste es un mero test de significacin estadstica, e indica solo que se ha detectado falta de linealidad, no que sea suficientemente relevante como para afectar a los resultados de los pacientes.

pgina 28

6.14. Grado de nolinealidad


Se selecciona el polinomio de segundo o tercer orden (nolineal) con el mayor ajuste examinando el error estndar de la regresin datos. Se calcula la desviacin de la linealidad ( DL ) a cada concentracin como sigue:

( es ) . Este estadstico es una medida de la diferencia entre los resultados


y,x

medidos y el modelo, de modo que el modelo con menor valor de es y , x proporciona el mejor ajuste de los

DL i = p ( x i ) ( b 0 + bi x i )
donde: x vara desde x1 a x s ; y

p ( x i ) es el valor del polinomio de mejor ajuste en el punto x i .


Por tanto, DL i es la diferencia entre el modelo de segundo orden (cuadrtico) y el de primer orden (lineal) a cada nivel de concentracin, o la diferencia entre el modelo de tercer orden (cbico) y el lineal. Es una medida de la diferencia entre el modelo nolineal y el lineal, a cada una de las concentraciones medidas. La diferencia se expresa en unidades analticas de modo que se puedan comparar con objetivos predefinidos. Si los objetivos se expresan como porcentajes, los valores DL i pueden transformarse anlogamente en porcentajes dividiendo DL i por la concentracin a cada valor (las concentraciones son x i para muestras de valores conocidos o el promedio de los valores medidos si x i son concentraciones relativas) y multiplicando por 100 %. Los DL i se calculan slo a los niveles de las muestras, no a cualquier valor de los polinomios entre dichos puntos (incluso la presuncin de nolinealidad podra ser mayor a niveles entre los niveles medidos). Se examina DL i a cada nivel y se compara con el criterio establecido para el error a cada nivel. Si cada

DL i es inferior que el criterio, entonces, incluso si se ha detectado nolinealidad estadsticamente


significativa no es importante dado que la cantidad de error nolineal est dentro de la tolerancia elegida. Si algn DL i supera el criterio, existe un posible problema de nolinealidad a ese nivel. Hay dos aproximaciones al problema: (a) tratar de encontrar la razn de la nolinealidad (preparacin de la muestra, interferencia, calibracin instrumental, etc.) y eliminarla; (b) examinar la grfica de respuesta frente a concentracin y determinar si la nolinealidad est en los extremos del intervalo de concentraciones o en el medio del mismo. Si la concentracin nolineal est a cada extremo, una opcin es eliminar el punto para el cual DL i sea demasiado grande y repetir el anlisis estadstico. Obviamente esta opcin reducir el intervalo de linealidad.

6.15. Consideraciones acerca del error aleatorio


Hasta ahora no hemos considerado la contribucin del error aleatorio al establecimiento de la linealidad. El error aleatorio resulta de la variabilidad aleatoria, (variabilidad en el sistema analtico) y puede conducir a dificultad para detectar una posible nolinealidad. La mejor estimacin de la repetibilidad es la diferencia conjunta entre las L parejas de replicados. La diferencia conjunta entre los replicados es una medida del promedio global de la variabilidad que es independiente del nivel de analito presente. Esta es la repetibilidad del mtodo, y se denota por s x (o CV x , o error proporcional). Si la estimacin de s x son razonablemente iguales a todos los niveles, entonces la repetibilidad es tambin constante. Si la diferencia es mucho mayor a concentraciones altas entonces la repetibilidad puede ser aproximadamente proporcional a la concentracin de referencia ( CV x constante). Si la repetibilidad es proporcional a la concentracin, debe calcularse los errores como diferencias porcentuales antes que como diferencias absolutas. La repetibilidad puede calcularse mediante anlisis de varianza, como la raz cuadrada de las medias cuadrticas del error. Tambin puede hacerse una estimacin sencilla como sigue: pgina 29

Calcular la diferencia entre dos replicados a cada nivel; Elevar al cuadrado las diferencias entre replicados; Sumar las diferencias al cuadrado; Dividir por el nmero de niveles ( L ) x 2; Tomar la raz cuadrada.

Para dos replicados y L niveles la frmula sera la siguiente:

sr =

(r
i =1

i1

ri 2 )

2L

ri1 y ri 2 pueden ser tanto resultados reales del procedimiento como expresarse como porcentajes de la
media (aunque se deben usar las mismas unidades para todos los niveles). Si se emplean las diferencias porcentuales entonces el resultado obtenido sera un CV x en lugar de s x . Para situaciones con ms de dos replicados, la estimacin del error aleatorio deber venir de un anlisis de la varianza.

sr =
donde: R

(r
i =1 j =1

ij

r ji )

L ( R 1)

es el nmero de replicados a cada nivel

( j =1, 2, , R ) ;

L ri

es el nmero de niveles ( i = 1, 2, , L ) ; es el resultado promedio del nivel i .

Se compara s x con el objetivo para la repetibilidad, tanto si se expresa con sus unidades como en porcentaje. Si s x es mayor que el objetivo, la imprecisin puede no ser adecuada para efectuar una determinacin fiable de la linealidad. Esto es, la media de los replicados a cada nivel puede ser demasiado incierta para realizar una determinacin veraz de la linealidad. En este caso puede ser necesario estudiar el motivo de la imprecisin, corregirlo y repetir el experimento de linealidad. Cuando la repetibilidad es muy diferente a lo largo de las distintas concentraciones, puede ser preferible emplear regresin ponderada para el modelo lineal. Para ello se utiliza el inverso de la varianza de los replicados a cada nivel.

6.16 Establecimiento del error mximo permisible


El laboratorio debe determinar sus propios objetivos para el error de medida de cada analito.16 Los objetivos deberan basarse en las necesidades de los clientes del propio laboratorio y en el entendimiento de las capacidades del mtodo tal como se emplea en dicho laboratorio. Los requisitos para el error de medida se emplean para determinar los objetivos de las diferentes fuentes de error de medida, como son los diversos componentes de la precisin, la veracidad y la nolinealidad. Se han propuesto diversos modelos para determinar los objetivos del error de medida. Algunas consideraciones para elegir objetivos para la linealidad: Los objetivos de la linealidad no deben ser superiores que los del sesgo; Los objetivos del sesgo deben ser menores o iguales que los del error de medida. Cuando las concentraciones de las muestras analizadas son desconocidas, los objetivos para la linealidad deben estar en unidades relativas (porcentaje). Ciertos requisitos que implcitamente deben cumplirse para la evaluacin estadstica del intervalo lineal segn el presente protocolo, son:
16

NCCLS. Estimation of total analytical error for clinical laboratory methods. Approved guideline. NCCLS document EP21-A. pgina 30

Los niveles de las muestras deben ser conocidos sin error (niveles reales conocidos, o conocidos con respecto a cada uno de los otros); El intervalo lineal se chequear slo entre las concentraciones menor y mayor que demuestren caractersticas aceptables; El intervalo lineal se evaluar para la salida final del sistema (concentracin o actividad) y no para la seal instrumental, la cual puede ser procesada posteriormente por el sistema; Las muestras usadas han de estar libres de interferencias, que invalidaran el experimento; El sistema analtico cumplir el resto de caractersticas en el intervalo lineal chequeado; Los tests de significacin de los coeficientes de regresin tambin asumen que los replicados se distribuyen segn una normal a cada nivel, y que la varianza de esta distribucin es constante a lo largo de todos los niveles.

7. Calibracin 7.1. Conceptos bsicos asociados a la calibracin


La calibracin y todos los conceptos asociados a sta, han sido determinados a lo largo de los aos por los organismos metrolgicos y de normalizacin internacionales. En un principio fueron fijados bsicamente con miras a su empleo desde dentro de los laboratorios de calibracin, ensayo, etc. Sin embargo, hoy da el personal tcnico de una empresa en la que se desea mantener un Sistema de Confirmacin Metrolgica se ve enfrentado con toda esta terminologa, conceptos y definiciones, que le resultan ajenos y de difcil comprensin. La definicin de calibracin desde la norma ISO17 es la operacin de comparar la salida de un equipo de medida frente a la salida de un patrn de exactitud conocida cuando la misma entrada (magnitud medida) es aplicada a ambos instrumentos. Durante el proceso de calibracin el equipo es verificado para un conjunto de puntos representativos de todo su intervalo de medida. El requisito 4.11 de la norma ISO 900118 especifica claramente que los equipos de medida se deben gestionar y utilizar de manera adecuada: "El suministrador debe establecer y mantener al da procedimientos documentados para controlar, calibrar y realizar el mantenimiento de los equipos de inspeccin, medicin y procedimiento (incluyendo el soporte lgico usado en los procedimientos analticos) utilizados por el suministrador para demostrar la conformidad del producto con los requisitos especificados." Ms concretamente, el documento ISO 10012-1 y en su versin UNE EN 30012-119 indica que se debe disear e implantar un Sistema de Confirmacin Metrolgica. El objetivo ltimo de este sistema de confirmacin es garantizar el correcto funcionamiento de los equipos de medida que afectan a la calidad. Si se atiende a la definicin de confirmacin metrolgica dada en el mismo documento, este sistema debe incluir toda operacin requerida para asegurar que un equipo de medida cumple con los requisitos establecidos para su uso planificado. Entre estas operaciones se encuentra la calibracin, ajuste, reparacin, sellado y etiquetado, etc. Examinar la linealidad de una funcin de calibracin es una tarea habitual tanto en la validacin de mtodos analticos como en las operaciones de la prctica rutinaria. La linealidad es una caracterstica importante y deseable de un mtodo analtico. Por ejemplo, si la funcin de calibracin es lineal, es ms fcil estimar la ecuacin y los errores en la estimacin de concentraciones desconocidas a partir de la funcin de calibracin sern probablemente menores. Adems, asumir la linealidad de la calibracin es implcito al uso vlido de un mtodo para adiciones estndar. Dada la importancia de la calibracin lineal, no es infrecuente que se tienda a usar el coeficiente de correlacin como indicador de linealidad. El coeficiente de correlacin, dado por

Cuaderno tcnico: calibracin de equipos de medida industriales segn iso 9000. UNE-EN-ISO 9000: Normas para la gestin de la calidad y el aseguramiento de la calidad. (Partes individuales publicadas como ISO 9000, ISO 9001, ISO 9002, ISO 9003 e ISO 9004). AENOR, Madrid, 1994. 19 UNE-EN 300121: Requisitos de aseguramiento de la calidad de los equipos de medida. Parte 1: Sistema de confirmacin metrolgica de los equipos de medida. (ISO 100121: 1992). AENOR, Madrid, 1994.
18

17

pgina 31

r =

(x
i =1

x )( y i y )
2 n

( x
i =1

x)

( y
i =1

y)

es una medida de la relacin entre dos variables x e y . Tiene diversas propiedades muy tiles (vase el tema Correlacin, Notas). Su uso en calibracin, sin embargo, se basa en una incorrecta interpretacin bastante generalizada. Es cierto que, si los puntos de la calibracin se ajustan mucho a una recta, el valor experimental de r ser prximo a la unidad (figura 5).

Figura 5. Datos A Sin embargo, la afirmacin inversa no es cierta. Un valor de r prximo a la unidad no necesariamente procede de una relacin lineal sino que puede ser, por ejemplo, resultado de que los puntos se ajusten claramente a una curva (figura 4).

Figura 6. Datos B Existe un problema adicional relacionado con esto: los valores de r no pueden compararse apropiadamente. No es correcto decir que unos datos con r = 0,99 sean ms lineales que otros con una

r = 0,95 . Lo mismo ocurre con el estadstico R 2 obtenido de una regresin. Subyace una cuestin de grado. Una calibracin con r = 0,9999 se aproximar necesariamente a una recta. El problema es que no
se puede decir cunto o si ser lo suficientemente prxima.

7.2. Chequeo de la falta de ajuste


Estrictamente hablando, no se puede chequear la linealidad como tal. Lo que se puede hacer es comprobar si la desviacin de la linealidad es demasiado pequea como para detectar que, dados unos resultados, dicha desviacin no es estadsticamente significativa. Una aproximacin es examinar los residuales de la regresin lineal. Se trata de las distancias entre los datos experimentales a la lnea de regresin, medida paralelamente al eje de respuesta. Si no hay falta de ajuste (esto es, si la calibracin es inherentemente lineal) los residuales representados frente a la concentracin parecern una muestra aleatoria de una distribucin normal de media cero. Como ejemplo, a continuacin se representan los datos de la figura 5 frente a la concentracin (figura 6). pgina 32

Sin embargo, si no hay linealidad, se podr percibir un patrn en la grfica de los residuales, generalmente con forma de una tendencia en los puntos, como puede observarse en la figura 8, correspondiente a los datos de la figura 6. Para saber si este patrn que sugiere nolinealidad es significativo se debe replicar las medidas en cada punto de la calibracin, proporcionando la informacin inherente a la variabilidad de la respuesta de las medidas (lo que se conoce como el error puro). En la figura 8 se observa, por ejemplo, una desviacin sistemtica de los residuales respecto al cero que es razonablemente grande con respecto a las diferencias entre las medidas de los duplicados, y por tanto probablemente sea estadsticamente significativa.

Figura 7. Residuales estandarizados de la regresin lineal usando los datos A. No se observa patrn alguno respecto a los residuales.

Figura 8. Residuales estandarizados de la regresin lineal usando los datos B. Se observa clara tendencia de los residuales. En casos de duda, el test estadstico que se aplica es un anlisis de la varianza de los residuales en el contexto de una ausencia de ajuste o de error puro. Si existe una falta de ajuste significativa, y el patrn de los residuales apoya esta interpretacin, se habr demostrado la nolinealidad significativa de una manera inequvoca. Dados los datos de la figura 8, el estadstico muestra que existe falta de ajuste significativo, p 0, 01 . Si hay evidencia de diferente varianza en la respuesta, lo que es frecuente en calibraciones en un intervalo amplio, se puede emplear una regresin ponderada.

7.3. Diseo de un experimento de calibracin


Un diseo eficaz es emplear seis o ms concentraciones del analito, igualmente espaciados a lo largo del intervalo de concentraciones de inters, y medirlas por duplicado en orden aleatorio. La razn es la siguiente: (a) debe haber suficientes puntos de calibracin para obtener un patrn discernible. En algunos casos seis puede ser un mnimo de puntos prctico; (b) aleatorizar el orden de las medidas evita el problema de confundir la nolinealidad con efectos temporales como deriva instrumental durante la calibracin.

7.4. Linealidad exacta?


Cabe preguntarse en algunos casos si necesitamos una linealidad exacta o es aceptable cierto grado de desviacin de la linealidad, como por ejemplo si la evaluacin de la incertidumbre resultante de usar una funcin de calibracin lineal aporta una contribucin insignificante sobre la incertidumbre global de la medida. Sin embargo, habr que considerar en todo caso qu parte de la calibracin es relevante para nuestras necesidades. pgina 33

En la figura 9 se observa cmo emplear una relacin lineal para representar una curva de calibracin que en realidad es curva puede conllevar una falta de ajuste que conducir a resultados seriamente errneos. En este ejemplo, bajas concentraciones de analito pueden estar sujetas a errores sistemticos relativamente grandes.

Figura 9

7.5. Ajuste de datos a una funcin lineal con error en ambas variables
Una condicin bsica de la regresin es que los valores de la variable respuesta (variable dependiente) sean aleatorios mientras que los de la variable x (independiente o predictora) deberan estar exentos de error. Este modelo a menudo se aproxima a las aplicaciones clnicas, por ejemplo en el caso de las calibraciones. Sin embargo, si no se cumplen las condiciones, los resultados de la regresin son en principio incorrectos y en la prctica pueden llevar a error. Alternativamente puede ser vlido un mtodo general de estimacin funcional de mxima verosimilitud

( FREML ) .

FREML estima la ordenada en el origen y la

pendiente, as como sus correspondientes errores estndar, sin introducir sesgos debidos al uso inadecuado de la regresin. El mtodo es simtrico, por lo que las variables x e y pueden ser intercambiadas sin afectar al resultado y permite manejar datos heterocedsticos, es decir resultados con diferentes precisiones.

7.6. Modelos de regresin y de relacin funcional


La

(( x , x ) , ( x , x ) ,, ( x , x )) tales que a y b son parmetros que describen la verdadera lnea y e


1 2 1 2 i i

regresin

ponderada

normal

se

basa

en

un

modelo

de

los

pares

de

datos
i

es el error normal aleatorio de varianza var y i . Las estimaciones minimizando la funcin

( )
i

( a , b)

de a y b se obtienen

i =1

(y

a b xi )
2 sy i

con respecto a a y b . La minimizacin se lleva a cabo por simple aplicacin del clculo a las conocidas ecuaciones de la regresin. En la estimacin de la relacin funcional el modelo es diferente:

xi = u i + i yi = i + i

i = + ui
donde

son independientes, normalmente distribuidas y con errores de varianzas

respectivamente. Se encuentra la relacin funcional minimizando

pgina 34


i =1

(x

ui )

i =1

(y

a bui )

Esta formulacin sigue el principio de mxima verosimilitud, que es una aproximacin de estimacin estadstica ms general que el conocido mtodo de mnimos cuadrados. Sin embargo, a diferencia de la regresin, la minimizacin ahora no puede resolverse algebraicamente, sino que requiere mtodos numricos iterativos.

7.7. Aplicaciones analticas de FREML


(a) Calibracin con materiales de referencia slidos (donde la incertidumbre del valor de referencia puede ser considerable); (b) Comparacin de resultados de dos mtodos sobre un intervalo de concentraciones apreciable y caracterizacin del sesgo, si existe, entre ellos. Ambas aplicaciones pueden requerir pruebas de significacin de a y b y de la ausencia de ajuste. FREML acomoda estos requisitos proporcionando los errores estndar es a , es b y un estadstico de ausencia de ajuste. Se podra contrastar, por ejemplo, la hiptesis H 0 : = 0 (la lnea pasa por el origen de la grfica) calculando:

za =
Asimismo, se podra chequear H 0 :

a es a b 1 es b

=1

(la pendiente de la recta es la unidad) con:

za =

Los valores de z pueden interpretarse como una distribucin normal estndar, de modo que para una confianza del 95 % debe usarse el valor crtico de 1,96 para | z | . El estadstico de ausencia de ajuste es la suma de cuadrados de los residuales escalados, que pueden ser tratados aproximadamente como una variable con n 2 grados de libertad. Un valor significativamente alto de este estadstico sugiere tanto que la estimacin de la varianza fue considerada demasiado baja (un fallo comn) como una ausencia de ajuste. En el segundo caso puede deberse a una interferencia no corregida o a una verdadera falta de linealidad. El examen de la representacin grfica de los residuales escalados permite dilucidar cual de las situaciones se est dando.
2

7.8. Cmo estimar las ponderaciones


En el ejemplo anterior las varianzas fueron estimadas a partir de un nmero moderado de resultados replicados. En algunos casos, el empleo de FREML estara indicado si tuviramos slo uno o un pequeo nmero de resultados por punto. Para ponderar las estimaciones en primer lugar se asume que los datos son homocedsticos, podramos usar una varianza comn para cada uno de los valores y otra para los x. Si los datos son heterocedsticos, una grfica de residuales escalados puede resolver el problema. Entonces se toman diferentes varianzas para cada valor x e y . Si la heterocedasticidad es muy grande incluso pocas rplicas de los datos mejorarn los resultantes estadsticos. En la calibracin, adems, se puede usar un modelo lineal simple de la desviacin tpica en funcin de la concentracin, que podra ser empleado para suavizar las estimaciones puntuales de los datos obtenidos con pocas medidas.

pgina 35

Apndice 1. Consideraciones adicionales relativas al estudio de la imprecisin A1.1. Modificaciones para realizar una serie analtica por da
Para aquellos instrumentos en que por la larga duracin del mtodo, o por otro motivo, no sea posible realizar ms de una serie analtica por da, cabe la posibilidad de estimar la imprecisin Sin embargo en este caso no ser posible valorar por separado la imprecisin interensayo de la interda y no se podr estimar la imprecisin intrada. La frmula bsica para estimar la repetibilidad ser:

sr =
donde: I

(x
i =1

i1

xi2 )

2I

es el nmero total de das (generalmente 20); es el replicado 1 del da i ; y es el replicado 2 del da i .

x i1 xi2

El procedimiento ser el descrito en el apartado 3, salvo por el hecho de que se realizar solo una serie analtica por da en lugar de 2. En esta estimacin los grados de libertad sern la mitad de los del protocolo que utiliza dos series analticas por da. Para aumentar el nmero de grados de libertad hay dos alternativas: (a) Incrementar el tamao del experimento, prolongando el estudio durante ms das (se recomienda un mnimo de 30), procesando dos alcuotas del material empleado para el estudio de la imprecisin en cada serie analtica; (b) Incrementar el nmero de alcuotas procesadas en cada serie manteniendo la duracin del estudio en 20 das. En este caso, la desviacin tpica intraserial se estimar mediante la siguiente frmula:

sr =
donde: I es el nmero total de das;

( x
i = 1 j =1

i1

xii )

I ( N 1)

N xi j

es el nmero de replicados analizados en cada serie analtica; es el resultado obtenido en el replicado j de la serie analtica procesada el da i ; es el promedio de todos los replicados del da i .

xii

El nmero de grados de libertad en esta estimacin es igual a I veces el nmero de replicados efectuados

en cada serie analtica menos 1, esto es, g . de l. = I ( N 1) . Cada serie analtica debe contener el mismo nmero de replicados para que la frmula anterior sea adecuada. No se incluye el factor 2 en el denominador porque ahora esta formula emplea la suma de desviaciones cuadrticas respecto a la media de las series analticas, a diferencia de las diferencias entre los duplicados empleados en frmulas previas (adecuado slo para dos observaciones).

A1.2. Desviacin tpica intralaboratorio o instrumental


Cuando slo se disponga de una serie analtica por da, se estimar la imprecisin intralaboratorio segn la siguiente expresin:

B =
donde: I es el nmero de das;

(x
i =1

ii

x ii )

I 1

pgina 36

xii x ii

es el promedio de los replicados en el da i ; es el promedio de todos los resultados en todos los das;

B es la desviacin tpica de los promedios diarios (generalmente denominado error estndar de las medias diarias). Cuando slo se realiza una serie analtica por da, esta estimacin combina las componentes interdiaria e interserial de la imprecisin. Esta ser la formula empleada independientemente del nmero de das o el nmero de replicados.
A partir de la anterior estimacin, B , y de la desviacin tpica intraserial, s r , se puede calcular la imprecisin instrumental o intralaboratorio segn la expresin:

sT =
donde: N

B2 +

N 1 2 sr N

es el nmero de replicados en cada serie analtica; es la desviacin tpica de las medias diarias; es la estimacin de la repetibilidad en forma de varianza.

B
s
2 r

Esta frmula puede emplearse independientemente del mtodo usado para incrementar el nmero de observaciones del estudio de repetibilidad (das adicionales o replicados adicionales en cada serie analtica).

A1.3. Ecuacin de Satterthwaite


Se emplea para calcular el nmero adecuado de grados de libertad, T , para valorar s T aplicando apropiadamente el test de calcula T segn la frmula:

cuando se quiera verificar la imprecisin aportada por el fabricante. Se

T =

( ( N 1) ME + MD )
+

( N 1) ME 2

I MD 2 I 1

donde: ME = s r

es la media cuadrtica intraserial; es la media cuadrtica para ambas series analticas y das.

MD = N B 2

Se utiliza el valor entero ms prximo al resultado obtenido para T como grados de libertad para evaluar sT .

A1.4. Otras estimaciones posibles


En ocasiones hablar de imprecisin daada o intrada ha creado confusin. A menudo daada se emplea errneamente como la imprecisin media a lo largo de una periodo largo de tiempo. Otra fuente de confusin adicional proviene de que los parmetros componentes de la imprecisin son independientes del tipo de experimento, mientras que los clculos de estas estimaciones difieren considerablemente en funcin del nmero de observaciones incluidas en cada serie analtica, de las series analticas procesadas por da, y del nmero de das del experimento.

A1.5. Imprecisin interdas


Estadsticamente, la imprecisin daada (ms apropiadamente denominada interdas) es la desviacin tpica (ajustada) de las medias diarias, tras eliminar los efectos de la repetibilidad y la variabilidad interserial, la variabilidad intrada, en los promedios diarios. Debemos pensar en trminos de una estimacin de la variabilidad de los promedios diarios que se esperaran si se pudiera realizar un nmero infinito de observaciones cada da. Si se realiza una nica serie analtica cada da, se puede demostrar que la varianza de los promedios diarios sigue la siguiente expresin:

pgina 37

var ( x ) =
con un valor esperado:

(x
i =1

ii

x ii )

I 1

2 = sD

E(s
donde: x i i

2 D

2 dd

r2
N

es el promedio de los resultados del da i ; es el promedio de todos los resultados en todos los das; es el nmero total de das; es la varianza interdas real (ajustada); es la varianza intraserial real (repetibilidad);

x ii I
2 d d

r2

N es el nmero de replicados de cada serie analtica. Segn aumenta el nmero de replicados de cada serie analtica, la estimacin ser ms prxima al parmetro verdadero (ej, la repetibilidad tendr menos influencia en la estimacin). La cantidad denominada B en este protocolo no puede tomarse como una estimacin de la imprecisin interdas. Para que esta cantidad sea til requiere un ajuste. El proceso de ajuste depende del nmero de series analticas por da y del nmero de observaciones por serie analtica, pero no del nmero de das en que haya sido efectuado el protocolo. Dos series analticas por da Para dos series analticas por da, como se describi en el protocolo principal, las cantidades A y B del apartado 3 se usan para derivar la estimacin de la desviacin tpica interdas verdadera ajustada d d :

sdd =
y de la desviacin tpica interensayo intrada:

A2 B 2
2

srr =
Una nica serie analtica por da

A
2

s r2

Para una nica serie analtica por da y dos o ms observaciones por serie, el procedimiento es algo diferente. Las componentes interda e interensayo no pueden separarse. La cantidad denominada B mide en este caso la suma de ambas componentes. Habr que eliminar el efecto de la variabilidad intraserial de la estimacin calculando:

sdd =
donde: N

B2

s r2 N

es el nmero de replicados por serie analtica.

La interpretacin de la cantidad s d d es la suma de los efectos interda e interserial intrada. En algunos casos, la cantidad obtenido en el radicando anterior puede ser negativa, si la componente inter das es pequea. Si ocurre esto, la estimacin de s d d debe establecerse en 0. Esta precaucin debe aplicarse a las estimaciones calculadas anteriormente para dos series analticas por da.

pgina 38