Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Notas
Índice
1. OBJETIVOS.....................................................................................................................2
2. NOMENCLATURA...........................................................................................................2
3. PRECISIÓN .....................................................................................................................6
3.1. Diseño experimental del estudio de imprecisión ........................................................................................ 6
3.2. Comparación con otras evaluaciones de la precisión ................................................................................ 6
3.3. Comparación estadística con el fabricante ................................................................................................ 7
3.4. Componentes de la precisión ..................................................................................................................... 7
3.5. Materiales de calibración y reactivos ......................................................................................................... 7
3.6. Detección de datos extremos (outliers) ...................................................................................................... 8
3.7. Estimación de la repetibilidad..................................................................................................................... 8
3.8. Estimación de la precisión intra–laboratorio............................................................................................... 9
3.9. Comparación con los datos de imprecisión del fabricante u otros criterios ............................................. 10
3.10. Comparación de la repetibilidad ............................................................................................................. 10
4. LÍMITES DE DETECCIÓN Y CUANTIFICACIÓN ..........................................................12
4.1 Uso no estándar “valor crítico” .................................................................................................................. 12
4.2. Uso no estándar del término “sensibilidad” .............................................................................................. 12
4.3. Otros límites de niveles bajos................................................................................................................... 13
4.4. Límites de detección en el contexto de métodos cualitativos .................................................................. 13
4.5. Procedimientos para determinar y verificar el límite de detección de un método.................................... 14
4.6. Aproximación general para determinar el límite de blanco ...................................................................... 15
4.7. Aproximación general para determinar el límite de detección ................................................................. 15
4.8. Diseño del estudio .................................................................................................................................... 16
4.9. Número de muestras ................................................................................................................................ 16
4.10. Características de blancos y muestras de bajo nivel ............................................................................. 17
4.11. Resultados.............................................................................................................................................. 18
4.12. Procedimiento para determinar y verificar el límite de blanco y el límite de detección.......................... 18
4.13. Procedimiento para determinar o establecer el límite de blanco ........................................................... 18
4.14. Procedimiento para determinar el límite de detección ........................................................................... 18
4.15. Consideraciones sobre la forma de la distribución................................................................................. 19
4.16. Procedimiento para verificar un límite de detección............................................................................... 20
5. LÍMITE DE CUANTIFICACIÓN......................................................................................22
5.1. Establecimiento del límite de cuantificación............................................................................................. 22
5.2. Verificación de un límite de cuantificación ............................................................................................... 22
5.3. Informe de resultados............................................................................................................................... 23
6. LINEALIDAD..................................................................................................................24
6.1. Pool de muestras de pacientes ................................................................................................................ 25
6.2. Pool de muestras de pacientes diluido con un diluyente recomendado .................................................. 25
6.3. Pool de muestras de pacientes suplementado con el analito de interés ................................................. 25
6.4. Pool diluido con materiales tratados de baja concentración o con otro pool tratado............................... 25
6.5. Controles / calibradores / materiales para estudio de linealidad comerciales ......................................... 25
6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado ........................................ 25
6.7. Material de control comercial diluido con diferente volumen del establecido .......................................... 25
6.8. Soluciones acuosas.................................................................................................................................. 26
6.9. Disoluciones en otros disolventes ............................................................................................................ 26
6.10. Intervalo analítico ................................................................................................................................... 26
6.11. Determinación del intervalo lineal........................................................................................................... 27
6.12. Regresión polinómica ............................................................................................................................. 27
6.13. Orden de la regresión polinómica........................................................................................................... 28
6.14. Grado de no–linealidad .......................................................................................................................... 29
6.15. Consideraciones acerca del error aleatorio............................................................................................ 29
6.16 Establecimiento del error máximo permisible.......................................................................................... 30
7. CALIBRACIÓN ..............................................................................................................31
7.1. Conceptos básicos asociados a la calibración......................................................................................... 31
7.2. Chequeo de la falta de ajuste................................................................................................................... 32
7.3. Diseño de un experimento de calibración ................................................................................................ 33
7.4. ¿Linealidad exacta? ................................................................................................................................. 33
7.5. Ajuste de datos a una función lineal con error en ambas variables......................................................... 34
7.6. Modelos de regresión y de relación funcional .......................................................................................... 34
7.7. Aplicaciones analíticas de FREML ........................................................................................................... 35
7.8. Cómo estimar las ponderaciones ............................................................................................................. 35
APÉNDICE 1. CONSIDERACIONES ADICIONALES RELATIVAS AL ESTUDIO DE LA
IMPRECISIÓN ...................................................................................................................36
A1.1. Modificaciones para realizar una serie analítica por día........................................................................ 36
A1.2. Desviación típica intralaboratorio o instrumental ................................................................................... 36
A1.3. Ecuación de Satterthwaite ..................................................................................................................... 37
A1.4. Otras estimaciones posibles .................................................................................................................. 37
A1.5. Imprecisión inter–días ............................................................................................................................ 37
1. Objetivos
• Clarificar conceptos y definiciones básicos relacionados con la evaluación de métodos analíticos;
• Conocer los procedimientos estadísticos adecuados para abordar la evaluación y validación de métodos
e instrumentos analíticos;
• Conocer los criterios y algoritmos propuestos por entidades científicas de ámbito nacional e
internacional para la evaluación de métodos e instrumentos.
2. Nomenclatura
A lo largo de las dos partes de este tema dedicado a la evaluación de métodos, se emplearán términos que
conviene definir y matizar previamente. También se recomienda revisar algunos documentos de la SEQC
que hace referencia a la validación de métodos.1
Exactitud Exactitud Es la concordancia entre un resultado de un test y el valor aceptado como
y error referencia. Cuando se aplica a una serie de resultados analíticos, incluye una
combinación de componentes aleatorios del error y componentes de sesgo o
error sistemático. [ISO 3534: 3.11] Esencialmente, la exactitud es la ausencia
de error. Un resultado es más exacto si se comete un error menor. Los
conceptos exactitud y precisión están relacionados: es poco probable que un
resultado de un método sea exacto si en general los resultados que
proporciona dicho método no son precisos. Cabe destacar que,
estrictamente, el concepto de exactitud se aplica a resultados, y no a
entidades generales como métodos analíticos, laboratorios o individuos.
Error (de Es la diferencia entre el resultado de una medida y el valor verdadero del
medida) mensurando.
Dado que el valor verdadero no puede ser determinado, en la práctica se
emplea un valor verdadero convencional. [VIM: 3.10]
Error aleatorio Es una componente del error que, en el curso de un número de resultados
(de un resultado) de un test de las mismas características, varía de forma impredecible. No es
posible corregir el error aleatorio. [ISO 3534: 3.9]
Error sistemático Es una componente del error que, en el curso de un número de resultados
de un test de las mismas características, permanece constante o varía de
forma predecible. Los errores sistemáticos y sus causas pueden ser
conocidos o desconocidos. [ISO 3534: 3.10]
1
Responsabilidades en la obtención de evidencia objetiva para la validación de las características
metrológicas de los procedimientos de medida del laboratorio clínico. Quím Clín, 2003; 22: 33-5.
página 2
Veracidad Veracidad Concordancia entre el valor promedio obtenido en una serie larga de
y sesgo resultados de un test y un valor aceptado como de referencia. [ISO 3534:
3.12] Habitualmente se expresa numéricamente mediante la medida
estadística del sesgo que está inversamente relacionado con la veracidad
Sesgo Es la diferencia entre la expectativa de los resultados de un test y un valor de
referencia aceptado. El sesgo es el error sistemático total, en contraste con
el error aleatorio. Puede haber una o más componentes del error sistemático
que contribuyen al sesgo. Una diferencia sistemática grande entre un valor
aceptado como referencia se refleja mediante un valor de sesgo mayor. [ISO
3534: 3.13]
La veracidad equivale a la ausencia de sesgo
Intervalo lineal Es el intervalo en el cual los resultados de un método analítico son
aceptablemente lineales; esto es, en el que el error de no–linealidad es
menor que un error criterio dado
Linealidad Es la capacidad (en un intervalo dado) de proporcionar resultados que son
directamente proporcionales a la concentración (cantidad) de analito
presente en la muestra analizada.
La linealidad suele aplicarse a todo el sistema de respuesta (p.ej. a la
respuesta analítica final antes que a la lectura de salida del instrumento); La
linealidad de un sistema se mide chequeando niveles de un analito que son
conocidos por formulación o con respecto a otro (no es necesario que se
conozca el nivel absoluto); cuando los resultados del sistema se representan
frente a estos valores, el grado en el que la curva representada se aproxima
a una línea recta es una medida de la linealidad del sistema.
Precisión Precisión Es la concordancia entre los resultados independientes de un test obtenidos
bajo unas condiciones estipuladas. La precisión depende sólo de la
distribución de errores aleatorios y no se relaciona con el valor verdadero o
especificado. La medida de la precisión habitualmente se expresa en
términos de imprecisión y se calcula como una desviación típica de los
resultados de un test. Una menor precisión se refleja en una mayor
desviación típica. Se habla de resultados independientes de un test cuando
han sido obtenidos de manera que no están influenciados por ningún
resultado previo del mismo o similar al objeto del test. La medida cuantitativa
de la precisión depende de manera fundamental de las condiciones
estipuladas. Las condiciones de repetibilidad y de reproducibilidad son casos
particulares de condiciones estipuladas extremas [ISO 3534: 3.14]
Como la precisión depende de las condiciones de la medida, éstas deben ser
especificadas cuando se hace referencia a una estimación de la precisión. A
continuación se definen términos de uso común empleados para describir las
condiciones de medida
Condiciones de Son condiciones en las que se obtienen resultados independientes de un test
repetibilidad con el mismo método en sistemas idénticos en el mismo laboratorio por el
mismo operador empleando el mismo equipo y en intervalos de tiempo
cortos. [ISO 3534: 3.15]
página 3
Condiciones de Son condiciones en las que los resultados de un test se obtienen mediante el
reproducibilidad mismo método en sistemas idénticos en diferentes laboratorios con
diferentes operadores y empleando diferentes equipos. [ISO 3534: 3.20]. Las
condiciones de repetibilidad suponen repetir la ejecución del método entero
desde un punto en el que se toma una alícuota de la muestra del laboratorio,
no se reduce únicamente a repetir las determinaciones instrumentales en
extractos preparados
Repetibilidad Precisión estimada bajo condiciones de repetibilidad [ISO 3534: 3.15]
NOTAS
• Se distingue entre repetibilidad y reproducibilidad refiriéndose a la
primera cuando se realizan medidas sucesivas bajo las mismas
condiciones, y a la segunda cuando las medidas se realizan bajo
diferentes condiciones de medida2. Para las condiciones de repetibilidad,
las definiciones de VIM e ISO3534 son casi idénticas
• Sin embargo, la definición de VIM de las condiciones de reproducibilidad
es más general que la de la norma ISO 3534, e incluye medidas intra-
laboratorio sobre periodos extensos de tiempo y/o incluso medidas
empleando diferentes principios de medida. Esta terminología más
general es cada vez más común. Por este motivo, se recomienda que las
condiciones de medida se indiquen siempre cuando se refiere la
reproducibilidad
• La norma ISO 5725 discute adicionalmente medidas de precisión
intermedia, y proporciona la notación para condiciones en que varían el
tiempo, calibración, operador y equipo
Reproducibilidad Precisión bajo condiciones de reproducibilidad [ISO 3534: 3.20]
Precisión Precisión calculada cuando se obtienen resultados independientes en series
interserial (run– separadas en el mismo laboratorio con el mismo método y en el mismo
to–run) material
Run Periodo en el que se realiza el análisis bajo condiciones de repetibilidad y se
mantienen constantes los factores que afectan a la exactitud. Nótese que los
runs separados habitualmente se realizan en distinto tiempo e involucran
alguna recalibración del instrumento
Condiciones de Cuando los resultados de un test se obtienen con el mismo método en
precisión idéntico sistema de medida y test, pero bajo diferentes condiciones de
intermedia operación. (a) Hay cuatro elementos de las condiciones de operación:
tiempo, calibración, operador, y equipo; (b) deben anotarse las condiciones
que cambian. Suele incluir estimaciones de la imprecisión, como las
comúnmente denominadas interserial (between–run), intra–día (within–day),
inter–día (between–day), instrumental (within–device) e intralaboratorio
(within–laboratory)
Condiciones de Condiciones donde se obtienen resultados independientes con el mismo
repetibilidad método en idéntico material y en el mismo laboratorio, por el mismo operador
usando el mismo equipo y en un periodo corto de tiempo (ISO 3534-1);
Anteriormente se denominaba precisión intraserial (within–run)
Condiciones de Los resultados se obtienen con el mismo método en idéntico sistema y en
reproducibilidad diferentes laboratorios con diferentes operadores y diferentes equipos (ISO
5725-1)3
2
ISO. International of vocabulary of basic and general terms of metrology (VIM). Geneva:ISO, 1993.
3
ISO. Accuracy (trueness and precision) of measurement methods and results – Part 1: General principles
and definitions. ISO 5725-1. Geneva:ISO, 1994.
página 4
Precisión Precisión estimada mediante medidas repetidas en una única solución
Instrumental problema, sin ajustes instrumentales, en un periodo corto de tiempo
NOTAS
• La precisión instrumental no es una definición ISO, sino un tipo de
precisión que frecuentemente se encuentra en las especificaciones de
los instrumentos. Difiere de la repetibilidad en que no incluye repetición
de todo el método analítico, sino sólo la medida instrumental en si,
frecuentemente incluso sin ajustes instrumentales
• Las condiciones interseriales (run–to–run) constituyen un caso específico
de las condiciones de reproducibilidad en la definición VIM, y se
corresponden con las condiciones intermedias definidas por la norma
ISO 5725
Mensurando Cantidad sujeta a una medida [ISO 3534: 3.5]
Incertidumbre (a) Una estimación asociada a un resultado que caracteriza el intervalo de
valores en los que debe encontrarse el valor verdadero. [ISO 3534: 3.25]
(b) (de medida) Parámetro asociado con el resultado de una medida, que
caracteriza la dispersión de los valores y puede atribuirse
razonablemente al mensurando. [GUM: 2.2.3]4
NOTAS
• Las definiciones (a) y (b) difieren en la filosofía, pero para la mayoría de
los propósitos pueden considerarse equivalentes
• Una estimación de la incertidumbre debe incorporar tanto lo que se
conoce acerca de los efectos aleatorios como de la incertidumbre
asociada a efectos sistemáticos de los procesos de medida
• Dado que la estimación de la incertidumbre incorpora las incertidumbres
de todos los posibles efectos, una estimación de la incertidumbre es
probablemente el modo más apropiado de expresar la exactitud de los
resultados
• En un análisis convencional, la incertidumbre asociada con un resultado
individual se estima habitualmente a partir de estudios previos, que
incluyen estudios de validación y no se requiere una estimación
individual de la incertidumbre de cada resultado
Incertidumbre Es la incertidumbre del resultado de una medida, expresada como
típica desviación estándar [GUM: 2.3.1]
Incertidumbre Cantidad que define un intervalo en torno al resultado en el que se espera
expandida que se encuentre una fracción grande de la distribución de valores que
pueden atribuirse razonablemente al mensurando [GUM: 2.3.5]
La ilustración clásica de la exactitud y precisión en términos de una diana ya
no describe correctamente la exactitud. Ésta se refiere a una combinación de
errores sistemáticos y aleatorios, por lo que la siguiente gráfica es más
adecuada
4
ISO Guide to the expression of uncertainty in measurement. Geneva:ISO,1995. ISBN 92-67-10188-9.
página 5
3. Precisión
En el presente apartado se presenta el protocolo de estudio de imprecisión según recomendaciones del
CLSI.5 Se recomienda consultar también otros protocolos publicados por la SEQC para conocer otros
posibles enfoques del procedimiento.6
5
NCCLS. Documento EP5-A2—Evaluation of precision performance of quantitative measurement methods;
Approved guideline
6
Recomendaciones para el estudio de la precisión de los procedimientos de medida en el laboratorio
clínico. Quím Clín 2003; 22: 63-5
página 6
3.3. Comparación estadística con el fabricante
Este es un concepto muy importante que ilustra cómo una estimación de la repetibilidad basada en 100
grados de libertad puede detectar desviaciones relativamente pequeñas de las características del
fabricante. Asimismo, una estimación de la repetibilidad basada solo en 10 grados de libertad detectarán
sólo separaciones grandes de las características y por tanto una prueba basada en dicha estimación tendrá
muy poca potencia estadística.
Si el estimado tiene 40 grados de libertad, se tiene mayor potencia estadística y la estimación puede
detectar desviaciones pequeñas, aunque quizá clínicamente importantes, de las características del
fabricante.
página 7
aceptables para llevarlo a cabo. Durante los primeros cinco días del experimento, el usuario debe
familiarizarse con el protocolo.
Se considera un método corto a aquel en que la duración de la determinación es inferior a 2 h, mientras que
un método largo (como el radioimmunoanálisis) dura considerablemente más y no se procesa más de uno al
día. Para métodos largos, existe un procedimiento aplicable incluyendo una serie analítica por día. Para
procedimientos cortos, las muestras pueden ser analizadas en cualquier momento de la serie analítica. Para
realizar el análisis de la varianza, una serie analítica de evaluación es un periodo de tiempo discreto de
recogida de datos diseñado para poder estimar la variabilidad (o deriva) en un día. Para algunos
dispositivos, como instrumentos de acceso aleatorio, discretos, o individuales, el concepto de serie analítica
(run) puede no ser apropiado. En este caso, las muestras deberían procesarse por duplicado en
condiciones de repetibilidad y tiempos aleatorios a lo largo de una jornada de trabajo para simular la
operación real de instrumento.
Cada día habrá que realizar los siguientes pasos:
1. Analizar dos series analíticas (runs o batches);
2. Si una serie analítica debe ser rechazada debido al control de calidad o a dificultades operativas, se
realiza una nueva serie analítica después de que se haya solucionado el problema;
3. En cada serie, se analizarán dos alícuotas del material chequeado para cada concentración;
4. Se deben incluir en cada serie las muestras de control de calidad que se juzguen necesarias para
valorar la aceptabilidad de la serie analítica o el día;
5. Se cambia el orden de análisis de los materiales analizados y muestras de control de calidad para cada
serie analítica o día;
6. Para simular la operación verdadera, se incluyen al menos diez muestras de pacientes en cada serie, si
es posible;
7. Separar la series analíticas realizadas cada día al menos en 2 h.
∑ ∑( x − xi j2 )
2
i j1
i =1 j =1
sf =
4I
donde I es el número total de días (generalmente 20);
j es el número de series analíticas (intra–día) (1 ó 2);
x I j1 es el resultado para el replicado 1, de la serie j en el día i ;
página 8
Se necesitan dos resultados de cada uno de las dos series analíticas de cada día para usar la fórmula
anterior. Si solo se dispone de una serie analítica en un día dado, se puede utilizar la fórmula (con j = 1 ).
Siempre que no haya más de un 10 % de los días de la evaluación en que falten series analíticas (por
ejemplo, con un solo run) en un diseño experimental de dos series analíticas por día, los cálculos
resultantes pueden ser válidos (aplicando las fórmulas del Apéndice 1) si sólo hay una serie analítica por
día.
∑(x − x i 2i )
2
i 1i
i =1
A =
2I
donde: I es el número de días (con dos series analíticas);
x I j1 es el resultado promedio de la serie analítica 1, en el día i (promedio de dos replicados);
∑(x − x iii )
2
i ii
i =1
B =
I −1
donde: I es el número de días;
x i ii es el promedio de todos los resultados del día i ; y
sT = s d2 d + s r2r + s r2
Con esta formula para s T el resultado obtenido será diferente al estimado con el cálculo mediante la
desviación típica de todos los datos (sin tener en cuenta el día o la serie analítica). La formula anterior es la
forma correcta para estimar la imprecisión instrumental, porque sopesa adecuadamente la repetibilidad así
página 9
como las componentes de la imprecisión inter–días e interserial. El coeficiente de variación (expresado en
porcentaje) correspondiente a esta estimación de la imprecisión debería calcularse dividiendo s T por la
concentración del material analizado y multiplicado por 100.
3.9. Comparación con los datos de imprecisión del fabricante u otros criterios
La estimación de la imprecisión obtenida en la sección anterior puede compararse con las especificaciones
de la imprecisión del fabricante. El estadístico ji–cuadrado ( χ ) será el que deberá utilizarse. Para ello, se
2
tomará como referencia la estimación puntual que ofrezca el fabricante (por ejemplo, la desviación típica).
Se deben comparar por separado la repetibilidad y la imprecisión intermedia.
cuadrado usa el cuadrado de las estimaciones de la repetibilidad, tanto del usuario como del fabricante.
2
Deben conocerse el número de grados de libertad asociados con s r (varianza intraserial estimada por el
2
usuario). s r tendrá tantos grados de libertad como pares de datos (replicados) se usen para calcularla. Por
tanto, será igual el número de series analíticas realizadas en el experimento, identificadas en adelante como
R . Para aplicar el test es necesario calcular el siguiente valor:
s r2 R
χ2 =
σ 2r
2
donde: s r es la repetibilidad estimada por el usuario (varianza);
El valor calculado de χ2 debe compararse con los valores tabulados del estadístico χ2 utilizando el valor
crítico superior del 95 % de confianza con R grados de libertad (tabla 1). Si el valor calculado es inferior al
de la tabla, la estimación no es significativamente diferente del valor de la imprecisión aportado por el
fabricante y se puede aceptar como verificada.
g. de l. de la varianza
valor crítico del 95 % valor crítico del 99 %
estimada por el usuario
5 11,1 1,51
6 12,6 16,8
7 14,1 18,5
8 15,5 20,1
9 16,9 21,7
10 18,3 23,2
11 19,7 24,7
12 21,0 26,2
13 22,4 27,7
14 23,7 29,1
15 25,0 30,6
16 26,3 32,0
17 27,6 33,4
página 10
g. de l. de la varianza
valor crítico del 95 % valor crítico del 99 %
estimada por el usuario
18 28,9 34,8
19 30,1 36,2
20 31,4 37,6
25 37,7 44,3
30 43,8 50,9
35 49,8 57,3
40 55,8 63,7
50 67,5 76,2
60 79,0 88,4
70 90,5 100,4
75 96,2 106,4
79 100,7 111,1
80 101,9 112,3
90 113,1 124,1
100 124,3 135,6
Tabla 1. Valores críticos de ji-cuadrado para la estimación de la varianza estimada por el usuario
Se puede emplear una aproximación similar a la anterior para comparar la estimación de la imprecisión
intra–laboratorio (o instrumental, within-device) con los requerimientos de la aplicación médica de cada
parámetro. Sin embargo, a diferencia de la estimación de la repetibilidad, calcular el número exacto de
grados de libertad para s T implica un cálculo más complicado. Dada la estructura del protocolo propuesto
en este tema, el usuario no puede asumir que todas las observaciones sean independientes, lo que es
requisito necesario antes de que se pueda utilizar la estimación de los grados de libertad del propio usuario
(número total de observaciones menos uno). La siguiente formula para los T grados de libertad de s T tiene
en cuenta esta falta de independencia.
I ( 2 ME + MR + MD )
2
T =
I
2 ME 2 + MR 2 + MD 2
I −1
donde: ME = s r
2
es la media cuadrática intraserial, o varianza de la repetibilidad;
página 11
Si el valor calculado de χ2 es inferior que el valor crítico superior del 95 % de una distribución de
χ 2
(Tabla 1), se consideran aceptables las especificaciones de la imprecisión.
Si, por el contrario, el valor de χ calculado es mayor que dicho límite crítico superior del 95 % de χ la
2 2
imprecisión estimada no entra dentro de los límites aceptables para la aplicación médica definida.
La estimación del usuario puede ser superior que la desviación típica aportada por el fabricante y ser aún
así aceptable. Dado que el experimento del usuario se basa en un número limitado de observaciones, cabe
esperar errores de muestreo para los valores calculados de s r y s T en torno a los valores verdaderos.
Cuanto mayor sea el tamaño del experimento, más próximas serán las estimaciones al valor real. El test de
χ2 se usa para determinar si la estimación del usuario es significativamente peor que la aportada por el
fabricante.
La valoración de la tolerancia que puede considerarse aceptable en función del analito considerado es una
información que debe obtenerse a partir de las especificaciones de variabilidad biológica descritas en la
bibliografía y de los requisitos necesarios para que un test tenga utilidad para la aplicación que se le desee
dar.
7
CLSI Documento EP17 - Protocols for determination of limits of detection and limits of quantitation;
Approved guideline.
8
Recomendaciones para el estudio de la capacidad de detección de los procedimientos de medida en el
laboratorio clínico. Quím Clín 2004; 23: 439-41.
página 12
de límite de detección. Además, incluso si la pendiente de la curva de calibración es pronunciada, la menor
concentración que puede detectarse con fiabilidad puede ser elevada si existe gran variabilidad en la señal
medida. Por otra parte, un método con moderada sensibilidad analítica (moderada pendiente de la curva de
calibración) pero muy baja variación aleatoria de la señal puede tener un límite de detección bajo.
Otro uso que incluye el término sensibilidad es la denominada sensibilidad funcional, empleada para
describir la precisión interserial a muy bajas concentraciones de analito, interesante para ciertos
procedimientos diagnósticos con requerimiento de muy alta precisión a bajas concentraciones. Los términos
sensibilidad diagnóstica o clínica se emplean para caracterizar o comparar el comportamiento de las
pruebas diagnósticas en relación con una información clínica preespecificada (por ejemplo, presencia o
ausencia del analito diana relacionado con la enfermedad).
9
NCCLS. Documento EP6. Evaluation of the linearity of quantitative measurement procedures: A statistical
approach.
página 13
discriminante entre los resultados positivos y los negativos (también denominado umbral o cutoff), y la
respuesta instrumental a concentraciones cercanas a cero, deberían estar totalmente documentadas por el
fabricante y ser comunicada a los usuarios. Esto no se aplica a los métodos en que el punto discriminante
está muy por encima del límite de detección, como es el caso de los tests de embarazo.
Las pruebas cualitativas pueden tener un intervalo dinámico estrecho y alcanzar la saturación de la señal a
concentraciones relativamente bajas. Sin embargo, todas las pruebas cualitativas con un fondo continuo
tienen un área de transición desde la ausencia de respuesta o señal de fondo hasta la respuesta completa,
y el punto discriminante está generalmente diseñado para situarse en esa área. Para algunas pruebas, los
fabricantes definen un umbral diferente para los resultados positivos y los negativos, creando una zona
donde la respuesta es “indeterminada.” Esta área indeterminada se denomina intervalo del 95 % en el
documento NCCLS EP12. User protocol for evaluation of qualitative test performance. En dicho documento,
sin embargo, no se define un intervalo de confianza estadístico entorno al punto de cutoff, sino que los
extremos que delimitan este intervalo son las concentraciones a las que resultados repetidos son positivos
el 95 % de las veces o negativos el 95 % de las veces, respectivamente. Cabe destacar que la repetición de
una prueba de concentración exactamente igual a la del cutoff proporcionará resultados positivos en el 50 %
de las réplicas y resultados negativos en el restante 50 % de las veces. En este protocolo, el LB es el
mismo que el punto de cutoff, el límite superior del intervalo del 95 % se corresponde con el LD (donde las
muestras verdaderamente positivas producen resultados positivos en el 95 % de las ocasiones), y el límite
inferior del intervalo es el cero (no existe analito presente en la muestra).
El conocimiento del límite de detección para un test cualitativo, combinado con el análisis frecuente de un
control positivo débil, permite monitorizar en el laboratorio la consistencia de la eficacia del método en la
zona próxima a la concentración de cutoff. Es posible experimentar un incremento no observado en el límite
de detección de una prueba cualitativa, por ejemplo, debido a cambios en los reactivos. Esto puede
incrementar la proporción de resultados falsamente negativos, debido a que las muestras con
concentraciones detectables de un analito pueden tener resultados que caigan por debajo del cutoff,
mientras que muestras con concentraciones altas seguirían en todo caso aportando respuestas
correctamente positivas. Como consecuencia, la determinación experimental del LD es importante para
controlar la calidad de muchas pruebas cualitativas.
Figura 1. Distribuciones de las concentraciones observadas para el blanco y una muestra de baja
concentración de analito. La línea discontinua correspondiente a concentraciones negativas indica
que algunos instrumentos no proporcionan resultados menores de 0.
10
Currie AL, et al. Nomenclature in evaluation of analytical methods including detection and quantification
capabilities (IUPAC recommendations). Pure Appl Chem. 1995; 67: 1699-723.
página 14
4.6. Aproximación general para determinar el límite de blanco
Las dispersiones de los resultados de los blancos y las muestras de bajo nivel se deben al error aleatorio de
la medida, que a menudo es menor para la muestra del blanco. En la figura 1, la media de las medidas del
blanco es cercana a cero con una distribución simétrica. Mientras que este tipo de señal puede producirse
internamente en el instrumento, muchos instrumentos convierten automáticamente los valores negativos de
las señales en cero o en un valor pequeño positivo, o bien los suprimen de modo que únicamente se
obtengan valores de concentración positivos como respuesta. Se asume que los valores por encima del
percentil 95 de la distribución de valores en muestras verdaderamente sin analito se desviarán
significativamente de las medidas del blanco. Cuando una muestra proporciona un valor observado que
supera este límite, puede decirse que contiene una cantidad de analito mayor de cero.
Empleando este límite, se tiene un 5 % de probabilidad de que dada una muestra verdaderamente sin
analito se obtenga un valor que indique la presencia de analito. Se trata del error de tipo I (error α ).
Asimismo, se observa que medidas de una muestra con baja concentración del analito pueden caer por
debajo de este límite, con lo cual serían indistinguibles de las medidas del blanco. Si se concluye que no
existe analito detectable en estos casos, se comete un error de tipo II, asociado al riesgo β , o “error β ”.
En función de los costes relativos de ambos errores, cuando se desarrolla un método se establecen los
errores α y β adecuadamente.
11
En 1997, ISO recomendó una definición del mínimo límite de detección en relación con los niveles
establecidos para el error de tipo I y II. Por defecto, dichos errores se acotan al 5 % (α = β = 5% ) . Un valor
de α del 5 % se corresponde con usar el percentil 95 de la distribución de valores del blanco como límite
para declarar un valor medido significativamente por encima del blanco.
Dada una distribución gaussiana de valores del blanco (figura 1), este límite se corresponde con:
LB = µ B + 1, 645 σ B [1]
donde: µB y σ B son la media y desviación típica de las medidas del blanco respectivamente.
Para una situación donde no existe posibilidad de obtener valores negativos, o si la distribución de los
valores del blanco no es gaussiana (por ejemplo, cuando siguen una distribución asimétrica), el percentil 95
debe estimarse por otra aproximación.
El procedimiento más directo es aplicar un método no paramétrico basado en los valores ordenados. El
percentil que constituye el límite de la distribución de los blancos, p B , es el que deja un porcentaje α de
valores en la cola superior de la distribución, y se define como límite de blanco, LB , es decir,
LB = p B − 100α [2]
11
ISO. Capability of detection – Part 1: Terms and definitions. ISO 11843-1. Geneva: ISO, 1997.
página 15
LB = µ s − 1, 645 σ s [3]
Figura 2 Distribuciones de replicados para las muestras de blanco (curva izquierda en ambas
figuras) y dos muestras hipotéticas positivas de baja concentración (2a y 2b). Cuando la
concentración real de analito presente en la muestra es igual al LB , el 50 % de las medidas serán
superiores al (a). Con una concentración real en la muestra igual al LD , (100% - β) (95%) de las
medidas de las muestras serán superiores al LB (b).
página 16
incertidumbre de la estimación del LB y la variabilidad entre las medidas en las muestras de bajo nivel (se
hablará en términos de s S ).
12
Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. Clin
Chem. 2004; 50: 732-40.
página 17
medidas de cada una de cinco muestras. Las medidas deberían realizarse en días diferentes de modo que
la s S refleje la variación analítica total.
Para que las estimaciones del LD y el LB tengan significado, los valores medidos deberían ser trazables
hasta un nivel conocido. Si existe método de referencia para el analito de interés, deberían compararse las
medidas obtenidas por ambos métodos en concentraciones cercanas al mímite inferior del intervalo
analítico. La trazabilidad también puede comprobarse con medidas sobre muestras suplementadas.
4.11. Resultados
Las medidas pueden realizarse de una característica o propiedad como la concentración o la actividad
siempre que la cantidad medida (el mensurando) esté claramente definida. Cuando el mensurando difiere
del analito de interés (por ejemplo, una actividad enzimática no es lo mismo que la concentración en masa
del enzima), la cantidad debe estar bien definida. Esto es esencial para entender las diferencias en LD
para diferentes métodos o bajo diferentes condiciones de medida.
p
LB = resultado en la posición N B + 0,5
100 [5]
= resultado en la posición ( 0,95 N B + 0,5 ) = Pr (1 − α )
Si no es un valor entero se realizará una interpolación lineal. En la práctica suele calcularse el percentil de
orden 100 − α mediante cualquier software apropiado.
LD p = LB + c β s S [6]
página 18
cβ se deriva del percentil 95 de la distribución de Gauss, como factor de corrección aplicado
debido a que la s S es una estimación sesgada de la desviación típica poblacional σS.
Si el número de medidas N S no es demasiado pequeño,
1, 645
cβ =
1
1−
4g
donde: g son los grados de libertad de la desviación típica estimada s S .
Por ejemplo, si se han obtenido 60 resultados (N S = 60 ) a partir de cinco muestras de concentración baja
( k = 5) , para la desviación típica conjunta estimada s S ,
g = N S − k = 55
1, 645
cβ = = 1, 653
1
1−
220
No es necesario ni deseable obtener todas las medidas en la misma muestra de baja concentración. El
motivo es que el empleo de varias muestras permite tener en cuenta la variabilidad entre sujetos.
Es importante considerar si la s s obtenida al nivel medido puede ser la misma que al nivel del LD p . En la
estimación del LD , un problema común es que la desviación típica muestral no sea constante, pues
frecuentemente aumenta con la concentración. Sin embargo, en un intervalo limitado de concentraciones,
podría ser aproximadamente constante y el procedimiento anterior es adecuado. Si se puede asumir una s s
constante, entonces LD = LD p .
En caso contrario, se debe considerar una aproximación más complicada, asumiendo que la desviación
típica muestral es función de la concentración13,14.
LD = LB + D S , β
Si la s S no es constante, y no es posible obtener datos normales, deberá emplearse un procedimiento de
“prueba y error” no paramétrico Se prepararán muestras a niveles similares al LD esperado y se obtendrá
una serie de medidas (en distintos tiempos y con diferentes operadores). Se calcularán los percentiles β ,
13
ISO. Capability of detection. Part 1. Terms and definitions. ISO 11843-1. Geneva:ISO, 1997.
14
ISO. Capability of detection. Part 2. Methodology in the linear calibration case. ISO 11843-2. Geneva:ISO,
2000.
página 19
como porcentaje de observaciones por debajo de LB . El LD es el menor nivel para el cual dicho percentil
β sea del 5 % o menor.
Ejemplo de verificación de un LD
Un procedimiento analítico para medir una hormona un LD de 45 UI/L según el fabricante con
α = β = 5% . El usuario determina 25 medidas de blanco (5 medidas de 5 muestras de blanco durante 5
días) y 25 medidas en muestras a las que se ha añadido 45 U/L del analito (5 medidas de 5 muestras en 5
días). Los resultados se presentan en la tabla 3 y la figura 2. La inspección visual revela que la distribución
15
Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. Clin
Chem. 2004; 50: 732-40.
página 20
de valores del blanco es asimétrica y, por lo tanto, se estima el LB no paramétricamente. El percentil 95 es
20,28.
Figura 3. Ejemplo de verificación del LD distribuciones de las 25 medidas del blanco y de las 25 de
muestras suplementadas con analito de modo que la concentración sea igual al LD supuesto de 45
U/L. Se estimó el LB en 20,28 UI/L (p95 de la distribución de los blancos).
página 21
En la tabla 3 se observa que el 92 % es mayor que el límite inferior (85 %) para una confianza del 95 %
siendo el tamaño muestral de 25. Por tanto, la proporción observada no es contradictoria con el LD
esperado.
5. Límite de cuantificación
El Límite de cuantificación ( LQ ) es la menor cantidad de analito que puede ser detectado con fiabilidad (el
LD ), y al cual el error total cumple los requisitos del laboratorio para aportar un aceptable uso clínico.
Dependiendo del objetivo definido para el error, el LQ puede ser igual la LD o mucho mayor. Nunca
puede ser inferior. El LQ debería determinarse como parte del desarrollo del método y puede ser
documentado por el fabricante. El usuario puede establecer su propio LQ o verificar el del fabricante. No
es necesario determinar el LQ para cada método si puede determinarse la incertidumbre (o error total) de
la medida para los niveles bajos. En estos casos, puede ser aceptable informar la incertidumbre estimada
del resultado de cada resultado de nivel bajo y permitir al usuario interpretar si es adecuado para su uso.
página 22
se obtienen hasta tres resultados con error excesivo, el LQ puede considerarse verificado. Si existe duda
acerca de este resultado (en el ejemplo, permitiendo al 10 % de las muestras tener un error excesivo),
deben obtenerse más replicados.
Si no se cumple este criterio, el LQ descrito por el fabricante quedará en entredicho.
Figura 4.
página 23
niveles, debido a discontinuidades, valores nulos, etc. Si no existe una documentación clara acerca de la
relación monótona, no deben hacerse interpretaciones acerca de concentraciones en este intervalo de
concentraciones.
En la práctica rutinaria, el LD y el LQ deberían emplearse como se ha descrito anteriormente para decidir
cómo informar los resultados. Existen otras situaciones, como es el caso de que se use el promedio de
varias réplicas como resultado para un sujeto, o en estudios científicos, en que deben registrarse las
concentraciones medidas (si se dispone de ellos), independientemente de que estén por debajo o por
encima del LD , porque en estas situaciones si se emplean resultados truncados, cualquier promedio
estaría sesgado.
6. Linealidad
La demostración del intervalo lineal requiere una serie de concentraciones conocidas o relaciones
conocidas establecidas por dilución. En todas las situaciones la secuencia de análisis debe ser aleatoria. El
experimento del intervalo lineal requiere contar con suficiente cantidad de cada espécimen para preparar
diluciones y llevar a cabo el análisis de cada uno de cinco o más concentraciones. El volumen puede variar
según lo que se desee establecer:
• Para demostrar que la operación del sistema está dentro de las especificaciones del fabricante deben
emplearse de cinco a siete concentraciones elegidas a lo largo de todo el intervalo lineal establecido.
Deben chequearse dos replicados de cada nivel.
• En el desarrollo de métodos nuevos, si se desea establecer el intervalo lineal, o cuando se quiere
modificar un método ya existente, deberían emplearse entre siete y once concentraciones a lo largo del
intervalo de medida que se espera de antemano. En el desarrollo de métodos se puede emplear más
puntos y ampliar dicho intervalo hasta hacerlo un 20 – 30 % más amplio, con la intención de eliminar
algunos de los puntos y obtener el intervalo lineal más amplio posible. Deben usarse de dos a cuatro
replicados de cada nivel, dependiendo de la imprecisión esperada.
• El número mínimo de puntos para describir de una manera fiable un intervalo lineal es cinco, mediante
un método polinómico. Con mayor número de puntos, se obtendrá una descripción más exacta de la
linealidad se podrá también establecer un intervalo lineal más amplio, una vez se hayan eliminado los
puntos necesarios.
Se recomienda preparar adecuadamente niveles de concentración intermedia igualmente espaciados
mezclando proporcionalmente un pool alto y uno bajo, aunque el método que se propone en el documento
CLSI EP6 no lo requiere necesariamente.9 Se acepta el empleo de muestras especialmente preparadas
para obtener concentraciones específicas, dado que se conocerán las concentraciones relativas a cada una
de las demás. Para esta evaluación, se cometerá menos error si se emplean mezclas preparadas,
dispensando con exactitud adecuada, a partir de un pool alto y otro bajo, que si se emplean muestras
individuales o soluciones reconstituidas o preparadas en el laboratorio. Debe tenerse especial precaución
cuando se dispensen volúmenes pequeños. Las pipetas de desplazamiento positivos son útiles para
preparar diluciones exactas con pequeños volúmenes.
página 24
Se pueden emplear productos comerciales para diagnóstico in vitro, siempre que se sigan las instrucciones
del fabricante. Estos productos permiten verificar cuantitativamente una calibración, validar intervalos de
medida, y determinar la linealidad de sistemas químicos automáticos, semiautomáticos y manuales.
A continuación, se presenta una lista de posibles tipos de especímenes en orden de preferencia para la
aplicación que nos atañe. Debe extremarse la precaución en lo que respecta a emplear una matriz
apropiada para un método particular.
6.4. Pool diluido con materiales tratados de baja concentración o con otro pool tratado
Si es posible, se empleará para las diluciones un pool de pacientes de baja concentración.
Alternativamente, pueden emplearse ciertos tratamientos para reducir la concentración de analito, (como
diálisis, tratamiento por calor o cromatografía). Debe tenerse en cuenta que estos tratamientos pueden
alterar el analito y/o la matriz física o químicamente. Es más importante mantener constante la matriz que
alcanzar bajos niveles por simple dilución.
6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado
Cuando se empleen estas muestras debe considerarse posibles efectos de matriz que puedan afectar a los
resultados. Las diluciones deben ser las mínimas necesarias y han de documentarse.
6.7. Material de control comercial diluido con diferente volumen del establecido
Cuando se empleen estas muestras deben considerarse posibles efectos de matriz que puedan afectar a
los resultados: estos efectos pueden modificar la concentración. Las diluciones deben ser las mínimas
necesarias y han de documentarse. Debe extremarse la precaución para asegurar que se consigue una
completa disolución del material liofilizado.
página 25
6.8. Soluciones acuosas
Cuando se emplean disoluciones acuosas, no se chequean los efectos de la matriz de las muestras reales
en la respuesta del método. Dichos efectos de matriz pueden influir en la interpretación de los resultados.
Aunque son preferibles materiales de alta pureza porque minimizan las posibles interferencias que
potencialmente afecten a los resultados, pueden ser aceptables materiales menos puros.
Muchos métodos químicos en clínica se calibran con materiales acuosos, y la concentración suministrada
por pesada puede ser aceptada como valor diana.
C5 es a concentración de Pool 5;
V5 es el volumen de Pool 5.
página 26
Debe tomarse la precaución de mezclarlos perfectamente y protegerlos de la posible evaporación y
deterioro.
Por ejemplo, para un sistema analítico que requiera 0,05 mL por determinación, y se chequeen 10 muestras
por concentración, se necesitarán al menos 0,5 mL adicionales de volumen muerto. Supongamos que la
concentración del pool 1sea de 120 unidades y la del de concentración baja de 40 unidades (no es preciso
conocer la concentración antes de analizarlo).
(1) Especímenes para Pooles 1 y 5: alícuotas de 0,6 mL se dispensan en tubos apropiadamente rotulados.
(2) Pool 2: se añaden 0,6 mL de Pool 1 a 0,2 mL de Pool 5.
(3) Pool 3: Se mezclan 0,4 mL de Pool 1 y 0,4 mL de Pool 5.
(4) Finalmente, el Pool 4 se hace mezclando 0,2 mL de Pool 1 y 0,6 mL de Pool 5. La concentración de
Pool 4 se calcula según:
40 × 0, 200 + 120 × 0, 600
Pool 4 = = 100 unidades
0, 200 + 0, 600
Las concentraciones esperadas de los pooles son 40, 60, 80, 100, y 120 unidades.
La representación de los resultados analíticos puede emplear concentraciones conocidas o calculadas.
• Para establecer el intervalo lineal: 9 a 11 niveles, y 2 a 4 replicados de cada nivel.
• Para validar las especificaciones de un método: 7 a 9 puntos, y 2 o 3 replicados de cada nivel.
• Para confirmar que el intervalo lineal es válido en un laboratorio: 5 a 7 niveles, y 2 replicados de cada
nivel.
Las muestras deberían analizarse aleatoriamente durante la misma serie o series analíticas próximas.
El número de réplicas deberá ser suficiente para proporcionar una estimación fiable de la concentración a
cada nivel. Para algunos analitos, en algunas concentraciones, se puede requerir 3–5 réplicas. Los usuarios
deben juzgar acerca del número de réplicas necesarias. Este procedimiento no se ve afectado
negativamente por el empleo de diferente número de replicados a diferentes niveles.
En este capítulo, se hablará de outliers en el sentido de aquellos resultados aislados que sean visual o
estadísticamente diferentes del resto de los resultados, y se aplica sólo a valores individuales de los
replicados. No son múltiples replicados del mismo nivel o un valor promedio a un nivel; Estos tipos de
resultados desviados serían indicativos de falta de linealidad o de error sistemático. Los outliers son
resultados que proceden de errores probados o razonablemente asumidos. En este contexto, los outliers
son resultados que no se ajustan al patrón representado por el resto de los datos. La inspección visual de la
gráfica de los resultados frente a los valores esperados suele ser suficiente para detectarlos. Un único
outlier en una serie de datos puede ser eliminado y no necesita ser reemplazado. Si subjetivamente se
observa más de un punto candidato a ser eliminado, el sistema de medida probablemente sea impreciso, y
las causas de la misma deberían ser examinadas y a ser posible solucionadas antes de tratar de establecer
o verificar la linealidad del método.
página 27
A continuación, se realiza un análisis de regresión polinómica para polinomios de primero, segundo y tercer
orden. Esto puede llevarse a cabo en la mayoría de los programas estadísticos comerciales.
segundo y = b 0 + b1 x + b 2 x 2 3
tercero y = b 0 + b1 x + b 2 x 2 + b3 x 3 4
El modelo de primer orden es una línea recta. Esta será la ecuación de mejor ajuste lineal tanto si el método
es lineal como si no lo es. El modelo de segundo orden describe una relación en la que existe una curva de
respuesta, tanto con una tendencia creciente en la misma como decreciente. El modelo de tercer orden
ajusta situaciones donde la respuesta cambia según los niveles; respuestas con forma sigmoide se ajustan
bien a este modelo, dado que son modelos donde no hay linealidad en los extremos del intervalo de
medida.
Los coeficientes de regresión se etiquetan como bi . En el modelo de segundo orden, b 2 es el coeficiente
de no–linealidad; en el modelo de tercer orden, b 2 y b3 son coeficientes de no–linealidad. Se debe obtener
el error estándar de la pendiente para cada coeficiente de no–linealidad, es i . El siguiente paso es realizar
una prueba t para comprobar si los coeficientes de no–linealidad son estadísticamente significativos; esto
(
es, si el coeficiente es significativamente diferente de cero. Los primeros dos coeficientes b 0 , b1 ) no se
chequean porque nunca reflejarán no–inealidad. El test se calcula como sigue, para b 2 y b3 :
bi
t =
es i
Se calcula el número de grados de libertad a partir de la formula:
grados de libertad ( g . de l.) = L R − g . de l. reg
donde: L es el número de concentraciones diferentes,
R es el número de replicados de cada preparación o concentración; y
g. de l. reg. es el número de grados de libertad consumidos por el análisis de regresión.
g. de l. reg es el número de coeficientes presentes en el modelo de regresión (incluido b 0 ). (En el ejemplo
anterior, para un polinomio de tercer orden sería L = 5 ; R = 2 , g. de l. reg. = 4, y g.de l. = 5 × 2 - 4 = 6 . Se
consultaría el valor crítico de t (bilateral para α = 0, 05 ), o la probabilidad de que se exceda el valor
observado de t . Si ninguno de los coeficientes de no–linealidad, b 2 o b3 , son significativos ( p > 0, 05 para
todos), puede considerarse que los datos son lineales y el análisis está completado excepto si es preciso
chequear una gran imprecisión.
Si alguno de los coeficientes de no–linealidad son significativos, b 2 en el modelo de segundo orden, o b 2 o
b3 en el modelo de tercer orden, ( p < 0, 05 ) , entonces los datos no son lineales según este protocolo. Es
importante notar que éste es un mero test de significación estadística, e indica solo que se ha detectado
falta de linealidad, no que sea suficientemente relevante como para afectar a los resultados de los
pacientes.
página 28
6.14. Grado de no–linealidad
Se selecciona el polinomio de segundo o tercer orden (no–lineal) con el mayor ajuste examinando el error
estándar de la regresión ( es ) . Este estadístico es una medida de la diferencia entre los resultados
y,x
medidos y el modelo, de modo que el modelo con menor valor de es y , x proporciona el mejor ajuste de los
datos.
Se calcula la desviación de la linealidad ( DL ) a cada concentración como sigue:
DL i = p ( x i ) − ( b 0 + bi x i )
donde: x varía desde x1 a x s ; y
página 29
• Calcular la diferencia entre dos replicados a cada nivel;
• Elevar al cuadrado las diferencias entre replicados;
• Sumar las diferencias al cuadrado;
• Dividir por el número de niveles ( L ) x 2;
• Tomar la raíz cuadrada.
Para dos replicados y L niveles la fórmula sería la siguiente:
L
∑(r − ri 2 )
2
i1
i =1
sr =
2L
ri1 y ri 2 pueden ser tanto resultados reales del procedimiento como expresarse como porcentajes de la
media (aunque se deben usar las mismas unidades para todos los niveles). Si se emplean las diferencias
porcentuales entonces el resultado obtenido sería un CV x en lugar de s x .
Para situaciones con más de dos replicados, la estimación del error aleatorio deberá venir de un análisis de
la varianza.
L R
∑ ∑ (r − r ji )
2
ij
i =1 j =1
sr =
L ( R − 1)
donde: R es el número de replicados a cada nivel ( j =1, 2,… , R ) ;
L es el número de niveles ( i = 1, 2,… , L ) ;
Se compara s x con el objetivo para la repetibilidad, tanto si se expresa con sus unidades como en
porcentaje. Si s x es mayor que el objetivo, la imprecisión puede no ser adecuada para efectuar una
determinación fiable de la linealidad. Esto es, la media de los replicados a cada nivel puede ser demasiado
incierta para realizar una determinación veraz de la linealidad. En este caso puede ser necesario estudiar el
motivo de la imprecisión, corregirlo y repetir el experimento de linealidad. Cuando la repetibilidad es muy
diferente a lo largo de las distintas concentraciones, puede ser preferible emplear regresión ponderada para
el modelo lineal. Para ello se utiliza el inverso de la varianza de los replicados a cada nivel.
16
NCCLS. Estimation of total analytical error for clinical laboratory methods. Approved guideline. NCCLS
document EP21-A.
página 30
• Los niveles de las muestras deben ser conocidos sin error (niveles reales conocidos, o conocidos con
respecto a cada uno de los otros);
• El intervalo lineal se chequeará sólo entre las concentraciones menor y mayor que demuestren
características aceptables;
• El intervalo lineal se evaluará para la salida final del sistema (concentración o actividad) y no para la
señal instrumental, la cual puede ser procesada posteriormente por el sistema;
• Las muestras usadas han de estar libres de interferencias, que invalidarían el experimento;
• El sistema analítico cumplirá el resto de características en el intervalo lineal chequeado;
• Los tests de significación de los coeficientes de regresión también asumen que los replicados se
distribuyen según una normal a cada nivel, y que la varianza de esta distribución es constante a lo largo
de todos los niveles.
7. Calibración
17
Cuaderno técnico: calibración de equipos de medida industriales según iso 9000.
18
UNE-EN-ISO 9000: Normas para la gestión de la calidad y el aseguramiento de la calidad. (Partes
individuales publicadas como ISO 9000, ISO 9001, ISO 9002, ISO 9003 e ISO 9004). AENOR, Madrid,
1994.
19
UNE-EN 30012–1: Requisitos de aseguramiento de la calidad de los equipos de medida. Parte 1: Sistema
de confirmación metrológica de los equipos de medida. (ISO 10012–1: 1992). AENOR, Madrid, 1994.
página 31
n
∑(x
i =1
i − x )( y i − y )
r =
n 2 n
∑( x − x) ∑( y − y)
2
i i
i =1 i =1
es una medida de la relación entre dos variables x e y . Tiene diversas propiedades muy útiles (véase el
tema Correlación, Notas). Su uso en calibración, sin embargo, se basa en una incorrecta interpretación
bastante generalizada. Es cierto que, si los puntos de la calibración se ajustan mucho a una recta, el valor
experimental de r será próximo a la unidad (figura 5).
Figura 5. Datos A
Sin embargo, la afirmación inversa no es cierta. Un valor de r próximo a la unidad no necesariamente
procede de una relación lineal sino que puede ser, por ejemplo, resultado de que los puntos se ajusten
claramente a una curva (figura 4).
Figura 6. Datos B
Existe un problema adicional relacionado con esto: los valores de r no pueden compararse
apropiadamente. No es correcto decir que unos datos con r = 0,99 sean ‘más lineales’ que otros con una
r = 0,95 . Lo mismo ocurre con el estadístico R 2 obtenido de una regresión. Subyace una cuestión de
grado. Una calibración con r = 0,9999 se aproximará necesariamente a una recta. El problema es que no
se puede decir cuánto o si será lo suficientemente próxima.
página 32
Sin embargo, si no hay linealidad, se podrá percibir un patrón en la gráfica de los residuales, generalmente
con forma de una tendencia en los puntos, como puede observarse en la figura 8, correspondiente a los
datos de la figura 6. Para saber si este patrón que sugiere no–linealidad es significativo se debe replicar las
medidas en cada punto de la calibración, proporcionando la información inherente a la variabilidad de la
respuesta de las medidas (lo que se conoce como el error puro). En la figura 8 se observa, por ejemplo, una
desviación sistemática de los residuales respecto al cero que es razonablemente grande con respecto a las
diferencias entre las medidas de los duplicados, y por tanto probablemente sea estadísticamente
significativa.
Figura 7. Residuales estandarizados de la regresión lineal usando los datos A. No se observa patrón
alguno respecto a los residuales.
Figura 8. Residuales estandarizados de la regresión lineal usando los datos B. Se observa clara
tendencia de los residuales.
En casos de duda, el test estadístico que se aplica es un análisis de la varianza de los residuales en el
contexto de una ausencia de ajuste o de error puro. Si existe una falta de ajuste significativa, y el patrón de
los residuales apoya esta interpretación, se habrá demostrado la no–linealidad significativa de una manera
inequívoca. Dados los datos de la figura 8, el estadístico muestra que existe falta de ajuste significativo,
p ≈ 0, 01 . Si hay evidencia de diferente varianza en la respuesta, lo que es frecuente en calibraciones en un
intervalo amplio, se puede emplear una regresión ponderada.
página 33
En la figura 9 se observa cómo emplear una relación lineal para representar una curva de calibración que en
realidad es curva puede conllevar una falta de ajuste que conducirá a resultados seriamente erróneos. En
este ejemplo, bajas concentraciones de analito pueden estar sujetas a errores sistemáticos relativamente
grandes.
Figura 9
7.5. Ajuste de datos a una función lineal con error en ambas variables
Una condición básica de la regresión es que los valores de la variable respuesta (variable dependiente)
sean aleatorios mientras que los de la variable x (independiente o predictora) deberían estar exentos de
error. Este modelo a menudo se aproxima a las aplicaciones clínicas, por ejemplo en el caso de las
calibraciones. Sin embargo, si no se cumplen las condiciones, los resultados de la regresión son en principio
incorrectos y en la práctica pueden llevar a error. Alternativamente puede ser válido un método general de
estimación funcional de máxima verosimilitud ( FREML ) . FREML estima la ordenada en el origen y la
pendiente, así como sus correspondientes errores estándar, sin introducir sesgos debidos al uso
inadecuado de la regresión. El método es simétrico, por lo que las variables x e y pueden ser
intercambiadas sin afectar al resultado y permite manejar datos heterocedásticos, es decir resultados con
diferentes precisiones.
(y − a − b xi )
2
n
∑
i
i =1 s y2 i
con respecto a a y b . La minimización se lleva a cabo por simple aplicación del cálculo a las conocidas
ecuaciones de la regresión.
En la estimación de la relación funcional el modelo es diferente:
xi = u i + ε i
yi = ν i + η i
ν i = α + β ui
donde εi y ηi son independientes, normalmente distribuidas y con errores de varianzas κi y λi
respectivamente. Se encuentra la relación funcional minimizando
página 34
(x − ui ) (y − a − bui )
2 2
n n
∑ ∑
i i
+
i =1 κi i =1 λi
Esta formulación sigue el principio de máxima verosimilitud, que es una aproximación de estimación
estadística más general que el conocido método de mínimos cuadrados. Sin embargo, a diferencia de la
regresión, la minimización ahora no puede resolverse algebraicamente, sino que requiere métodos
numéricos iterativos.
b −1
za =
es b
Los valores de z pueden interpretarse como una distribución normal estándar, de modo que para una
confianza del 95 % debe usarse el valor crítico de 1,96 para | z | .
El estadístico de ausencia de ajuste es la suma de cuadrados de los residuales escalados, que pueden ser
tratados aproximadamente como una variable χ con n − 2 grados de libertad. Un valor significativamente
2
alto de este estadístico sugiere tanto que la estimación de la varianza fue considerada demasiado baja (un
fallo común) como una ausencia de ajuste. En el segundo caso puede deberse a una interferencia no
corregida o a una verdadera falta de linealidad. El examen de la representación gráfica de los residuales
escalados permite dilucidar cual de las situaciones se está dando.
página 35
Apéndice 1. Consideraciones adicionales relativas al estudio de la imprecisión
∑(x − xi2 )
2
i1
i =1
sr =
2I
donde: I es el número total de días (generalmente 20);
x i1 es el replicado 1 del día i ; y
∑∑ ( x − xii )
2
i1
i = 1 j =1
sr =
I ( N −1)
donde: I es el número total de días;
N es el número de replicados analizados en cada serie analítica;
xi j es el resultado obtenido en el replicado j de la serie analítica procesada el día i ;
El número de grados de libertad en esta estimación es igual a I veces el número de replicados efectuados
en cada serie analítica menos 1, esto es, g . de l. = I ( N − 1) . Cada serie analítica debe contener el mismo
número de replicados para que la fórmula anterior sea adecuada. No se incluye el factor 2 en el
denominador porque ahora esta formula emplea la suma de desviaciones cuadráticas respecto a la media
de las series analíticas, a diferencia de las diferencias entre los duplicados empleados en fórmulas previas
(adecuado sólo para dos observaciones).
∑(x − x ii )
2
ii
i =1
B =
I −1
donde: I es el número de días;
página 36
xii es el promedio de los replicados en el día i ;
( ( N − 1) ME + MD )
2
I
T =
I MD 2
( N − 1) ME 2 +
I −1
donde: ME = s r
2
es la media cuadrática intraserial;
página 37
I
∑(x ii − x ii )
var ( x ) =
i =1
= s D2
I −1
con un valor esperado:
σ r2
E(s 2
D ) = σ 2
dd + ,
N
donde: x i i es el promedio de los resultados del día i ;
A2
sdd = B −
2
2
y de la desviación típica interensayo intra–día:
s r2
srr = A −
2
2
Una única serie analítica por día
Para una única serie analítica por día y dos o más observaciones por serie, el procedimiento es algo
diferente. Las componentes inter–día e interensayo no pueden separarse. La cantidad denominada B mide
en este caso la suma de ambas componentes. Habrá que eliminar el efecto de la variabilidad intraserial de
la estimación calculando:
s r2
sdd = B2 −
N
donde: N es el número de replicados por serie analítica.
La interpretación de la cantidad s d d es la suma de los efectos inter–día e interserial intra–día.
En algunos casos, la cantidad obtenido en el radicando anterior puede ser negativa, si la componente inter–
días es pequeña. Si ocurre esto, la estimación de s d d debe establecerse en 0. Esta precaución debe
aplicarse a las estimaciones calculadas anteriormente para dos series analíticas por día.
página 38