Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ej GLP
Ej GLP
TECNOLOGICA
METROPOLITANA
Departamento de Química
UTEM
Preparado por:
Santiago – 2006
CONTENIDOS
1. INTRODUCCIÓN
2. EL PROCESO DE CALIBRACIÓN
2.4.1 Consideraciones
2.4.2 Análisis de regresión utilizando software
3. CONCLUSIONES
Con el uso de paquetes de “software” adecuados (entre ellos Excel y otros) es fácil
generar un gran número de parámetros estadísticos. Esta Guía también pretende
explicar el significado y correcta interpretación de alguno de los términos estadísticos
comúnmente asociados con la calibración.
2. EL PROCESO DE CALIBRACIÓN
Uno de los primeros asuntos que el analista se pregunta es: Qué número de
experimentos necesito realizar? Debido al consumo de tiempo y otra
consideraciones, esto se traduce en: Cuál es el mínimo absoluto que puedo hacer?
Cuando pensamos en un experimento de calibración, ello relaciona el número de
estándares de calibración que necesito analizar y la cantidad de replicados de cada
nivel de calibración.
Para un aseguramiento inicial de la función de calibración, como por ejemplo como
parte de la validación de un método, deberán ser preparados por lo menos siete
concentraciones diferentes (incluyendo blanco). Las concentraciones de los
estándares deberán cubrir, por lo menos, el rango de concentraciones encontradas
durante el análisis de las muestras de ensayo y deberán ser adecuadamente
espaciadas a través del rango. Idealmente, el rango de calibración deberá ser
establecido de modo que la mayoría de las concentraciones de las muestras de
ensayos se encuentren hacia el centro del rango. Ello como se demostrará más
adelante, el área del rango de calibración donde la incertidumbre asociada a las
concentraciones predichas, es mínima. Resulta además útil realizar, al menos,
mediciones replicadas (duplicados) de cada nivel de concentración, particularmente
en la etapa de Validación de métodos puesto que ello permite evaluar la precisión
del proceso de calibración a cada nivel de concentración. Los replicados deberán ser
idealmente independientes. Cuando se realizan mediciones replicadas sobre el
mismo estándar de calibración, sólo se obtiene información parcial acerca de la
variabilidad de la calibración y por tanto sólo cubre la precisión del Instrumento
usado para las mediciones y no incluye el efecto de la preparación de los estándares
de calibración.
La construcción de una curva de calibración usando siete (7) estándares, cada vez
que se realiza una batería de medición de muestras, resulta costoso y de alto
consumo de tiempo. Si se a establecido durante una validación de método que la
función de calibración es “lineal”, entonces es posible establecer un procedimiento
simplificado de calibración cuando el método es aplicado rutinariamente, por
ejemplo, utilizando un número menor de estándares de calibración y solamente un
replicado para cada nivel de concentración. Un punto sencillo de calibración es un
camino rápido para el chequeo del sistema de calibración cuando no existe duda
acerca de la linealidad de la función de calibración y el sistema no posee error
sistemático (el intercepto (”a”) no es significativamente diferente de cero. La
concentración del estándar deberá ser igual o mayor al la máxima concentración que
se espera encontrar en las muestras de ensayo.
Siempre constituye una buena práctica, graficar los datos antes de realizar cualquier
análisis estadístico. En el caso del análisis de regresión, esta etapa es de vital
importancia, puesto que si se realizan en forma aislada, pueden cometerse errores
que pueden llegar a ser significativos.
Cualquier conjunto de datos de igual tamaño puede ser graficado uno contra el otro
en un diagrama que muestra la relación que existe entre ellos (una correlación)
Los valores graficados sobre el eje-y son a menudo referidos como la variable
dependiente, debido a que sus valores dependen de la magnitud de la otra variable.
Por ejemplo, la respuesta instrumental obviamente dependerá de la concentración
del analito presente en el estándar. Inversamente, los datos registrados en el eje-x
son referidos como la variable independiente.
2.3.1 Evaluación del gráfico de dispersión
El gráfico de los datos deberá ser inspeccionado por posibles “outliers” ( valores
anómalos) y puntos de influencia. En general, un outlier es un resultado el cual es
significativamente diferente del resto del conjunto de datos. En el caso de un
experimento de calibración, es un punto que podrá ser removido de los otros puntos
de calibración. Un punto de influencia, es un punto de calibración que puede tener
un efecto perturbador en la posición de la línea de regresión. Un punto de influencia
puede ser un outlier, pero puede también ser causado por un inadecuado o pobre
diseño experimenta. Los puntos de influencia pueden tener uno o dos efectos sobre
la línea de regresión: “efecto palanca” o error sistemático.
EFECTO PALANCA
La regresión lineal establece los valores de “a” y “b” y es la que mejor describe la
relación entre el conjunto de datos. Las ecuaciones para el cálculo de estas variables se
indican en el Anexo respectivo, pero ellas pueden ser fácil y rápidamente determinadas
aplicando un paquete estadístico adecuado. Es preciso hacer notar que la regresión de
“y” sobre “x” (generalmente utilizada en los estudios de calibración) no es la misma
que la regresión de “x” sobre “y”. Esta consideración es porque los procedimientos
usados en la regresión lineal asumen que todos los errores están en los valores de “y” y
que los errores en los valores de “x” son no-significativos. Ella es una consideración
razonable para muchos métodos analíticos en los cuales es posible preparar estándares
donde la incertidumbre en la concentración es no-significativa comparada con la
variabilidad aleatoria del instrumento analítico. Resulta entonces esencial asegurarse
que los datos de la respuesta instrumental y de la concentración de los estándares sean
correctamente asignados.
Fig. 4 Regresión lineal por mínimos cuadrados – la mejor línea recta
2.4.1Consideraciones
Usando un software para realizar la regresión lineal, se obtienen una serie de diferentes
parámetros estadísticos y posiblemente (dependiendo del software utilizado) una Tabla y/o
gráfico de residuales.
El significado e interpretación de cada uno de los datos de “salida” del análisis de regresión
se discuten a continuación.
La Fig.5 (a) muestra un gráfico de residuales ideal. Los residuales están dispersos
aproximadamente en forma aleatoria alrededor del “cero”. La Fig.5 (b) muestra un patrón
de residuales que se obtienen cuando la desviación estándar de la respuesta del instrumento
aumenta con la concentración del analito. La Fig.5 (c) ilustra un típico gráfico de
residuales que es obtenida cuando la línea recta es trazada a partir de datos que no
representan una regresión lineal. Finalmente la Fig.5 (d) muestra un posible modelo de
residuales cuando la línea de regresión lineal ha sido incorrectamente trazada a partir del
“cero”. Las Fig.5 (b) y (d) representan modelos cuyos residuales, claramente son NO-
aleatorios.
Una salida típica de un análisis de regresión lineal se indica en la Fig.6. La salida indicada
corresponde a una Planilla de cálculo Excel, pero información similar se obtiene a partir de
otros software. Los diferentes aspectos involucrados se describen con mayor detalle en las
siguientes secciones.
El coeficiente de correlación, r
Por estas razones es esencial la representación gráfica de los datos y no solamente realizar
la estadística cuando se desee asegurar que la curva de calibración es la adecuada para los
propósitos previamente definidos. La Fig.7 muestra algunos ejemplos de cómo el
coeficiente de correlación puede ser erróneamente interpretado.
Fig. 7 Interpretación del coeficiente de correlación
La Fig.7 (a) indica un caso donde la relación es claramente no-lineal a través del rango
completo de los valores de “x”.En la Fig. 7 (b) el valor r = 0 indica que no existe
correlación lineal. Sin embargo, es claramente significativa la relación no-lineal. Las Figs.
7 (c) y (d) indican los efectos de valores “anómalos” individuales. En Fig. 7(c) el
intercepto de la línea trazada con el outlier presente (línea punteada) será incorrecta
comparada con la línea trazada con el outlier removido (línea sólida). En la Fig. 7 (d) tanto
el intercepto como la pendiente serán incorrecto. En la Fig 7. (e), el valor de r = 0.998
indica una fuerte correlación. Sin embargo, los dos grupos de puntos son distintos y ambos
muestran una correlación significativa. Aunque existen 12 puntos de datos, la distribución
de los puntos indican que estos, constituyen el efecto de “calibración con 2.puntos”
(donde siempre se conseguirá que r =1).
La pregunta que un Analista a menudo se hace es: Cuán cerca de 1 deberá ser el valor del
coeficiente de correlación para disponer de una buena Curva de Calibración?
La respuesta a esta interrogante debe ser abordada de acuerdo a los objetivos que se
persiguen:
Análisis de “trazas”.
Cuantificación de macro constituyentes
Incertidumbres aceptadas para el Informe de resultados.
Cuanto más cercano el valor de r a 1, tanto menor será la Incertidumbre asociada a dichos
resultados.
Por ejemplo, si para una serie de 10 datos se obtiene un r = 0,6, significará que
estadísticamente la correlación es significativa. Sin embargo, es altamente improbable que
con una correlación de 0,6 podrá ser usada para algún uso específico, dado que la
incertidumbre asociada a este valor es demasiado alta para predecir valores obtenidos en
estas condiciones.
Los parámetros relacionados con r son r2 y r2 ajustado son a menudo usados para describir
la fracción de la varianza total en los datos y representan el denominado coeficiente de
determinación y determina la relación entre las variables analizadas. Una buena
correlación lineal, conlleva a que el r2 sea muy cercano a 1.
La desviación estándar residual (conocida también como el error estándar residual) es una
medida estadística de la desviación de los datos a partir de la línea de regresión trazada. Se
calcula utilizando la expresión dada en la Eq.1
Ecuación 1
Software tal como Excel produce una Tabla de resultados de análisis de varianza.
La suma de los términos cuadrados (SS) representa diferentes fuentes de variación en los
datos de calibración.
Los valores de los coeficientes estadísticos “t” y “p” relacionan la significancia cuando
existe o no diferencia significativa de “cero”. En un experimento de calibración debería
esperarse que el valor de la pendiente (b) sea muy significativamente diferente de “cero”.
El valor “t” deberá ser por lo tanto un número grande (para una calibración con 7 pares de
datos, el valor “t” deberá ser mucho mayor que 2,6 (valor numérico “t”de Student para 5
grados de libertad y P = 95 %), y el valor “p” debería ser pequeño (mucho menor de 0.05 si
el análisis de regresión ha sido realizado con un nivel de confianza de 95 % (valores típicos
se indican en Fig. 6).
Idealmente, se debería esperar que la línea de calibración pase por el origen. Si éste es el
caso, entonces el intercepto(a) no debería ser significativamente diferente de “cero”. En la
regresión, deberíamos esperar un valor de “t” muy pequeño (< 2.6 en Curva de calibración
de 7 pares de datos) y un valor “p” > 0.05 (para una regresión a un nivel de confianza de 95
%). Cuando puede asumirse razonablemente que la línea de calibración pasa por “cero”
(también puede asumirse por inspección del intervalo de confianza del “intercepto”). Si éste
tiende a cero, entonces el intercepto (a) no es significativamente diferente de “cero”, como
se indica en el ejemplo de la Fig.6 .
2.6 Uso de la función de calibración para estimar valores en las muestras de ensayo.
Ecuación 2
Donde:
3. CONCLUSIONES
Siguiendo las etapas que se indican, es posible evitar los problemas planteados:
ANEXOS
PROTOCOLO DE EXPERIENCIA
DATOS:
ESTADIGRAFOS CALCULADOS:
Coeficiente de correlación , r 0,9999
Coeficiente de determinación , r 2 0,9998
Intercepto de la línea recta, a 0,00404
Pendiente de la línea recta, b 0,04312
d.f t 0,95
3 3,18
5 2,57
Para d.f = 5
Número de replicados, m 1 2 3
Valores exp. de y, y 0 0,100 0,100 0,100
Conc. calculadas, x 0 2,23 2,23 2,23
(y0-y) -0,1716 -0,1716 -0,1716
(y0-y)2 0,02944 0,02944 0,02944
Desviación estándar, S 0 0,071 0,055 0,049
Error estándar de x 0, SE 0,18 0,14 0,13
Lím. de confianza sup. 2,41 2,37 2,35
Lím. de confianza inf. 2,04 2,08 2,10
Incert.est.relativa u % 3,2 2,5 2,2
4.- Estimación de los Límites de Detección (LoD) y Cuantificación (LoQ)
Parámetro y x
L o D: 0,01 0,19
L o Q: 0,03 0,62
a= 0,00404 ± 0,00193
b= 0,04312 ± 0,00027
r= 0,9999 r2= 0,9998
S y/x = 0,0027
S x0 = 0,071
LoD = 0,19
LoQ = 0,62
RESUMEN DE RESULTADOS
ENSAYO: Determinación de Arsénico (As) en Aguas naturales
(Método: Espectrofotometría Ag – DDTC)
Resultados de la Calibración
Concentración de As en muestra de
agua natural:
-
Coef. de correlación, r 0,99947
Coef. de determinac.,r 2 0,9989
Pendiente, b -61,38
Intercepto, a 70,28
xi (x i - x) (x i - x) 2 yi yi (y i - y i ) (y i - y i ) 2
0 -15 225 0,320 0,3218 -0,0018 3,19E-06
5 -10 100 0,410 0,4150 -0,0050 2,50E-05
10 -5 25 0,520 0,5082 0,0118 1,39E-04
15 0 0 0,600 0,6014 -0,0014 2,04E-06
20 5 25 0,700 0,6946 0,0054 2,87E-05
25 10 100 0,770 0,7879 -0,0179 3,19E-04
30 15 225 0,890 0,8811 0,0089 7,97E-05
Sumat. 15 700 0,6014 5,96E-04
d.f. 5
N= 7
Una vez que han sido determinadas la pendiente y la ordenada en el origen de la recta de
regresión, e fácil calcular la concentración (valor de x) correspondiente a cualquier señal
medida en el instrumento (valor de y). Sin embargo, también es necesario estimar el error
asociado a la concentración calculada. El cálculo de un valor de x a partir de un valor dado
de y, conlleva al uso de las ecuaciones indicadas en los Anexos II – 1 y 2.
En el ejemplo del Anexo II-3 la señal originada por este método se representa en el eje-y,
mientras que en el eje-x se expresa en términos de las cantidades de analito añadidas. La
línea de regresión se calcula de la manera usual, si bien el espacio ocupado por ella se
extrapolará al punto del eje-x en que y = 0. Este valor negativo sobre el eje-x corresponde a
la cantidad de analito en la muestra problema. El análisis del ejemplo respectivo muestra
que este valor viene dado por a/b, la razón entre la ordenada en el origen y la pendiente de
la recta de regresión. Ya que tanto “a” como “b” están sujetos a error, el valor calculado
también lo estará. Sin embargo, en este caso, la cantidad no se predice a partir de un único
valor medido de y, de manera que la fórmula de la desviación estándar, SxE, del valor
extrapolado de x (xE) no es la misma que la indicada en el Anexo I (Ec. de regresión lineal )
Al igual que en el ejemplo 1 del Anexo II, se mejora la Precisión aumentando el valor de n.
En general, en un experimento de adiciones de estándar deberían usarse al menos seis
puntos. Además, se mejora maximizando ∑(xi – x)2, de manera que las soluciones de
calibrado deberían cubrir, si fuera posible, un intervalo considerable.
Los límites de confianza para xE se determinan como siempre, como:
xE ± t(n-2) SxE