Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Módulo 2 – Parte II
Contenido
Introducción...................................................................................................................................................................... 2
Criterios ............................................................................................................................................................................. 2
Informe .............................................................................................................................................................................. 2
EQA/PT: Modelo de informe ...................................................................................................................................... 4
Los distintos esquemas pueden ofrecer una variedad de indicadores, pero la información básica nunca debería
estar ausente.
Criterios
Supongamos que vamos a evaluar la participación en un esquema de evaluación externa de la calidad. Tenemos
disponibles en el mercado distintos esquemas y debemos seleccionar uno.
¿Cuáles son los criterios a considerar al momento de seccionar un esquema evaluación externa de la calidad
(EQA/PT)?
Matriz: Las muestras desafío deberían tener una matriz apropiada, conmutable y homogénea. Las
muestras deben ser semejantes a las muestras que procesamos rutinariamente.
Concentraciones: Deben estar próximas o representar niveles de decisión médica. Es importante que
los niveles de decisión médica evaluados sean relevantes para el procedimiento de medida
considerando su uso previsto.
Tratamiento estadístico: Debe ser correcto y permitir la exclusión de datos atípicos. Si el esquema
está acreditado por la norma ISO 17043 o sigue sus lineamientos, por lo general el tratamiento
estadístico de los datos se ajusta a los lineamientos de la norma ISO 13528 recurriendo a estadística
robusta.
Cantidad de participantes: La cantidad de participantes es crítica. Recordemos que, si nos
aseguramos un grupo de comparación con una buena cantidad de participantes, respetando el concepto
de trazabilidad metrológica, aseguramos la consistencia del grupo de comparación.
Frecuencia: La frecuencia de participación es importante. Diferentes esquemas ofrecen distintas
frecuencias de comparación para distintas especialidades del laboratorio. A mayor cantidad de
participaciones más consistencia tendrán los resultados y podremos obtener información confiable.
ISO 17043:2101: Esta Norma Internacional especifica los requisitos generales para la competencia de
los proveedores de programas de ensayos de aptitud y para el desarrollo y la operación de los
programas de ensayos de aptitud. Estos requisitos son generales para todos los tipos de programas de
ensayos de aptitud, y pueden utilizarse como base para definir requisitos técnicos específicos para
campos particulares de aplicación.
Educación: Los esquemas de evaluación externa de la calidad (EQA) o ensayos de aptitud (PT)
también tienen un rol educativo importante. Si el proveedor del EQAS/PT trata los datos sobre la base
de diferentes métodos analíticos y trata también los resultados de incertidumbre reportados por los
participantes, esto puede dar información valiosa para la evaluación adicional de los métodos analíticos.
Informe
De acuerdo a la norma ISO 17043:2010, los informes de los esquemas de evaluación externa de la calidad y/o
ensayos de aptitud (PT/EQA) deben ser claros y exhaustivos e incluir información sobre los resultados de todos
los participantes, junto con una indicación del desempeño de los participantes individuales.
e) fecha de emisión y estado del informe (por ejemplo, preliminar, provisional o final);
i) descripción clara de los ítems de ensayo de aptitud utilizados incluyendo los detalles necesarios de la
preparación del ítem de ensayos de aptitud y de la evaluación de la homogeneidad y estabilidad;
n) procedimientos utilizados para establecer la desviación estándar para la evaluación de aptitud, u otros
criterios de evaluación;
o) valores asignados y resúmenes estadísticos para los métodos/procedimientos de ensayo utilizados por cada
grupo de participantes (si distintos grupos de participantes utilizan métodos diferentes);
p) comentarios del proveedor de ensayos de aptitud y asesores técnicos sobre el desempeño de los
participantes;
Los proveedores de los esquemas suelen presentar la información del método. Recordemos que el principio de
medida es el fenómeno que sirve como base de una medición y que el método de medida hace referencia a la
descripción genérica de la secuencia lógica de operaciones utilizadas en una medición.
Comparador
Cuando hablamos de “todos los laboratorios” nos referimos a todos los participantes del esquema que informan
un valor para el mensurando en cuestión, independientemente del método empleado y la plataforma analítica
en uso. En nuestro ejemplo, todos los laboratorios que informan ácido úrico en suero mg/dL
Aspectos negativos: No se puede asegurar que todos los participantes tengan la misma trazabilidad
metrológica para el procedimiento de medida empleado.
Cuando hablamos de agrupación por método, consideramos a todos los laboratorios participantes que utilizan
el mismo principio y método de medida para el mensurando en cuestión. En nuestro ejemplo, todos los
laboratorios participantes que informan ácido úrico en suero en mg/dL recurriendo a un mismo método:
Uricasa/Colorimétrico.
Aspectos positivos: El Nº suele ser más grande que el del grupo par.
Aspectos negativos: No se puede asegurar que todos los participantes tengan la misma trazabilidad
metrológica para el procedimiento de medida empleado, aún con el mismo método.
- Equipo (o familia)
- Método
- Reactivo
- Calibrador
Cantidad de laboratorios
También recordemos que solo el grupo par nos asegura que todos los participantes del grupo tienen la misma
trazabilidad metrológica. Si el comparador es el método puede que la trazabilidad de todos los participantes sea
la misma o no, ya que distintos fabricantes pueden ofrecer diferente trazabilidad metrológica para un mismo
procedimiento de medida (siendo el método el mismo). Cuando el comparador es “todos los laboratorios”, es
muy poco probable que todos los participantes tengan la misma trazabilidad metrológica.
La citada norma establece que el número mínimo de participantes en el programa de ensayos de aptitud
necesarios para lograr los objetivos del diseño estadístico es un aspecto crítico. También nos dice que en los
casos en que el número de participantes sea insuficiente para lograr estos objetivos o para producir un análisis
estadísticamente significativo de resultados, el proveedor de ensayos de aptitud debe documentar y
proporcionar a los participantes, detalles de los enfoques alternativos utilizados para evaluar el desempeño de
los participantes.
La norma ISO 13528:2015 en el punto 5.4 hace referencia a consideraciones para esquemas con pocos
participantes. Referenciando a la norma ISO 17043:2010, nos dice que el diseño estadístico de un esquema de
ensayos de aptitud debe considerar el número mínimo de participantes que se necesitan para cumplir con los
objetivos del diseño y establecer enfoques alternativos que se utilizarán si el número mínimo no se logra.
También nos dice que los métodos estadísticos que son apropiados para esquemas con un gran número de
participantes pueden no ser apropiados para esquemas con un número limitado de participantes. El problema
es que las estadísticas determinadas a partir de un pequeño número de resultados de los participantes pueden
no ser lo suficientemente confiables, y un participante podría ser evaluado frente a un grupo de comparación
inadecuado.
Según esta norma el número mínimo de participantes necesario para los diversos métodos estadísticos
dependerá de una variedad de situaciones:
- los métodos estadísticos utilizados, por ejemplo, el método robusto particular o la estrategia de
eliminación de los atípicos elegidos;
- la experiencia del proveedor de ensayos de aptitud con la matriz, el mensurando, los métodos y el
grupo de participantes;
Muchos esquemas de pruebas de aptitud tienen pocos participantes, o tienen grupos de comparación con un
pequeño número de participantes, incluso si hay un gran número de participantes en el esquema. Esto puede
suceder con frecuencia cuando los participantes se agrupan y puntúan por método o grupo par, como se hace
comúnmente en las pruebas de la aptitud y/o esquemas de evaluación externa de la calidad, para los
laboratorios clínicos.
La norma, referenciando las guías de IUPAC establece que cuando el número de participantes es pequeño, el
valor asignado debe determinarse idealmente utilizando un procedimiento metrológicamente válido,
independientemente de los participantes, por ejemplo, por formulación o por un laboratorio de referencia. Los
criterios de evaluación del desempeño también deben basarse en criterios externos, como el criterio de un
experto o criterios basados en la aptitud para el propósito. En estas situaciones ideales, el rendimiento se
evalúa utilizando el valor asignado predeterminado y el criterio de rendimiento, por lo que las pruebas de
aptitud pueden realizarse con un solo participante.
Sabemos muy bien que esta situación no es factible en el área de clínicos y por lo tanto enfrentamos un gran
desafío.
En los EQA/PT de laboratorios clínicos el valor asignado y la dispersión de los datos se deriva de los resultados
de los laboratorios participantes. Si el número de participantes es demasiado pequeño para los procedimientos
particulares utilizados, la evaluación del desempeño puede volverse poco fiable; Por lo tanto, es importante
considerar si se debe fijar un número mínimo de participantes para la evaluación del desempeño.
Cada valor asignado tiene una incertidumbre asociada. Cuando el valor asignado se obtiene a partir del
tratamiento estadístico de los valores informados por los participantes, la incertidumbre del valor asignado se
estima como:
Para el uso de la mediana como valor asignado, el criterio no puede cumplirse para p≤18.
Otros estimadores robustos, como el Algoritmo A (media robusta), tienen una eficiencia intermedia y pueden
cumplir el criterio para p> 15.
En resumen, existen limitaciones en el tamaño de los conjuntos de datos sobre la aplicabilidad de algunos
estimadores de tendencia central.
Dispersión de datos
No se recomienda el uso de criterios de desempeño basados en la dispersión de los resultados de los
participantes en pequeños conjuntos de datos debido a la muy alta variabilidad de las estimaciones de
dispersión. Por ejemplo, para p = 30, se espera que las estimaciones de la desviación estándar para los datos
normalmente distribuidos varíen aproximadamente un 25% a cada lado de su valor verdadero (basado en un
nivel de confianza del 95%).
Si el N (o P) es mayor de 30, la incertidumbre del valor asignado (obtenida a partir de los datos del grupo) es lo
suficientemente pequeña para no ser considerada en las evaluaciones. Cuando N (o P) es menor de 30 y más
aún, cuando N (o P) es menor de 20 ya no podemos omitir considerar la incertidumbre del valor asignado en
las evaluaciones.
Las desviaciones de una distribución normal son más difíciles de identificar si N (o P) es pequeño. No se
recomiendan estadísticas robustas cuando N <20.
La diferencia entre los parámetros de población y las correspondientes estimaciones de la muestra aumentan
con la disminución del tamaño de la muestra N.
En conclusión, los valores medios de consenso y las desviaciones estándar observadas de los resultados de las
mediciones de los laboratorios que participan en EQA/PT no son suficientemente fiables para evaluar el
desempeño de un laboratorio en un EQA/PT con un número limitado de participantes (menos de 30).
Valor informado
El valor informado representa el valor medido de una magnitud. Recordemos que el valor medido de una
magnitud es el valor de una magnitud que representa un resultado de medida.
- Unidades
- Cantidad de decimales
- Errores de transcripción
Existen, según se describe en la norma ISO 13528:2015, esencialmente cinco métodos disponibles para obtener
el valor asignado.
1. Formulación.
3. Valores de referencia.
Formulación: El elemento de ensayo de aptitud puede prepararse mezclando materiales con diferentes
niveles conocidos de una propiedad en proporciones especificadas, o añadiendo una proporción especificada de
una sustancia a un material de base.
Valores de referencia: Una selección de muestras preparados de EQA/PT, son medidas por un laboratorio
elegido, ya sea utilizando un método primario o junto con un material de referencia certificado (CRM). El valor
asignado se deriva directamente del método primario utilizado o de una calibración con respecto al valor de
referencia certificado del CRM. Esto proporcionará un valor rastreable a través del método principal o al CRM
utilizado, pero se basa en los resultados de un único laboratorio y los métodos primarios apropiados o CRM
pueden no estar disponibles.
Valor consenso de los participantes: Con este enfoque, el valor asignado xpt para el ítem de prueba de
aptitud usado en una ronda de un esquema de prueba de aptitud es la estimación de tendencia central (por
ejemplo, media robusta, mediana o media aritmética) formada a partir de los resultados reportados por los
participantes en la ronda, utilizando un procedimiento adecuado (estadística robusta). Esta opción es la más
utilizada por los proveedores de esquemas de evaluación externa de la calidad. El valor asignado (valor de
referencia) termina siendo la media robusta del grupo de comparación cuando el esquema está acreditado o
sigue los lineamientos de la norma ISO 17043:2010.
Existen, como se describe en la norma ISO 13528:2015, esencialmente cinco enfoques para determinar la
desviación estándar para la evaluación de la competencia, es decir, el rango aceptable de resultados de los
participantes:
1. Valor prescrito.
2. Por percepción.
3. De un modelo general.
Por percepción: La desviación estándar para la evaluación de la competencia puede fijarse en un valor que
corresponda al nivel de rendimiento que el proveedor de EQA/PT desearía que los laboratorios pudieran
lograr.
A partir de un modelo general: El valor de la desviación estándar para la evaluación de aptitud puede ser
derivado de un modelo general para la reproducibilidad del método de medición.
Datos obtenidos en la ronda de un esquema EQA/PT: Con este enfoque, la desviación estándar para la
evaluación de competencia utilizada en una ronda de un esquema se deriva de los resultados informados por
los participantes en la misma ronda. Será la desviación estándar robusta de los resultados reportados por todos
los participantes.
Esta última opción es la que se utiliza en la mayoría de los esquemas del área de clínicos. La limitación reside
en la cantidad de participantes del grupo de comparación. Para que los estimados sean consistentes, el N del
grupo debe ser mayor de 30.
Contamos con el desvío estándar del grupo que por lo general surge de la estadística robusta. Contamos con la
media del grupo de comparación que por lo general surge de la estadística robusta. Por lo tanto, reemplazando:
Vamos a considerar, como ocurre en la mayoría de los EQA/PT del área de clínicos, que el valor asignado ha
sido estimado a partir de los resultados de los participantes del grupo de comparación recurriendo a la media
robusta.
Para obtener la incertidumbre expandida del valor asignado recurrimos a la siguiente ecuación:
Para un intervalo de confianza del 95 % el factor K asume un valor de 1.96. Por lo tanto, la ecuación nos queda:
Recordemos la ecuación que nos permite estimar la incertidumbre estándar del valor asignado:
Ahora vamos a identificar los datos necesarios para llevar a cabo la estimación. Comencemos con el desvío
estándar robusto del grupo de comparación (S*):
Entonces:
Recordemos la ecuación que nos permite estimar la incertidumbre expandida del valor asignado:
Reemplazando:
Si se cumple el siguiente criterio, la incertidumbre del valor asignado puede considerarse despreciable y no es
necesario incluirla en la interpretación de los resultados de la ronda de pruebas de aptitud:
Recordemos que:
En clínicos, por lo general, el desvío estándar del EQA/PT se estima a partir de los resultados de los
participantes. Sabemos que existen limitaciones y que el N del grupo debería ser mayor de 30.
Por lo tanto:
Entonces cuando el desvío estándar del EQA/PT sea obtenido a partir del resultado de los participantes (S*) el
criterio quedaría:
Por lo tanto:
Reemplazando:
Recordemos el criterio que debe cumplirse para considerar que la incertidumbre del valor asignado no es
significativa:
Y además que:
Apliquemos el criterio:
El criterio se cumple, el valor asignado es confiable, su incertidumbre estándar pequeña y por ende el grupo de
comparación consistente.
La evaluación del desempeño (o puntuación) por parte del proveedor de EQA/PT añade valor a los resultados
analíticos generados por el participante. El propósito de proporcionar una evaluación de desempeño
normalizada es hacer que todos los resultados del EQA/PT sean comparables, de manera que el participante
pueda apreciar inmediatamente la importancia de la evaluación. El uso de la incertidumbre de medición en la
evaluación del desempeño está aumentando a medida que la comprensión de este aspecto está mejorando. Se
pueden tener en cuenta dos tipos de incertidumbre de medición:
Dada la diversidad de propósitos de los esquemas EQA/PT, no es posible definir un único método de
evaluación universal. Por lo tanto, existen disponibles una serie de diseños estadísticos utilizados para la
evaluación de rendimiento. Los más comunes se enumeran a continuación.
a) “Z score”: Es lo que se utiliza de manera más frecuente. No tiene en cuenta la incertidumbre del valor
asignado y la incertidumbre del valor informado por el participante.
Es fundamental que el N del grupo sea grande, ya que consideramos en la estimación el valor asignado
(media robusta del grupo de comparación) y el desvío estándar del grupo (dispersión de datos de los
participantes). Recordemos que estas estimaciones son confiables a partir de N mayores a 30.
Cuando los informes están en español se utiliza generalmente IDE en lugar de Z y la ecuación queda:
b) “Z´score”: En este caso se tiene en cuenta la incertidumbre del valor asignado. Este modelo de
estimación puede ser de utilidad cuando la incertidumbre del valor asignado es significativa, situación
que se presenta cuando los grupos de comparación tienen un N menor de 30.
Cuando los informes están en español se utiliza generalmente IDE en lugar de Z y la ecuación queda:
c) Zeta scores (ς): En este caso se considera la incertidumbre del valor asignado y la incertidumbre del
valor informado. Las puntuaciones de Zeta pueden ser útiles cuando un objetivo para el esquema
EQA/PT es evaluar la capacidad de un participante para generar resultados que estén cerca del valor
asignado dentro de su incertidumbre declarada. Es poco frecuente su uso en clínicos.
Recordemos que los valores obtenidos podrán ser positivos o negativos según el valor informado sea mayor o
menor que el valor asignado. En le interpretación se considera el módulo de Z.
Estos gráficos nos permiten identificar desvíos y tendencias que tal vez no generen exclusiones, pero pueden
requerir atención. Es decir, aportan información importante para la prevención de efectos adversos sobre los
resultados de los pacientes.
Ya hemos mencionado que es fundamental revisar los resultados de la última encuesta frente a los resultados
de encuestas anteriores. Estos gráficos deben ser revisados de esa forma, revisando el IDE de la última
encuesta frente a los IDE de las encuestas anteriores para poder identificar desvíos, tendencias y/o alguna otra
situación anómala.
Error de medida
Estimar el error de medida es muy simple. Recordemos primero la definición de error de medida:
Comencemos por el valor medido de una magnitud. El valor medido de una magnitud es el valor informado por
el participante.
Desde la definición decimos que vamos a evaluar la diferencia entre el valor obtenido y el valor de referencia.
Por lo tanto, según lo que hemos repasado, en nuestro caso es la diferencia entre el valor informado y la media
robusta del grupo de comparación.
Ahora vamos a identificar el valor de referencia, que es el valor asignado y en este caso está representado por la
media del grupo de comparación:
Reemplazando:
Es importante destacar que el concepto de error de medida está asociado a la exactitud y NO a la veracidad.
Error de medida no es sesgo. Recordemos que el sesgo es la diferencia entre la media de una serie de medidas
efectuadas sobre un material y el valor asignado al material.
Por lo tanto, si hemos escogido una especificación de desempeño analítico para el procedimiento de medida,
podemos enfrentar el error de medida de cada encuesta con la especificación de desempeño analítico.
--Fin de Documento--