Documentos de Académico
Documentos de Profesional
Documentos de Cultura
N ISO 10399
españolla
Mayo 2010
Metod
dología
Ensayyo dúo-trío
(ISO 10399:2004)
1
Sensory analysis.
a Methodology. Duo-trio test. (ISO 10399:2004)
CORRESPONDENCIA Esta norrma es la versión oficial, en español, de la Norma Europpea EN ISO 10399:2010,
que a suu vez adopta la Norma Internacional ISO 10399:2004.
ICS 67.240
Versión en español
Análisis sensorial
Metodología
Ensayo dúo-trío
(ISO 10399:2004)
Sensory analysis. Methodology. Duo-trio Analyse sensorielle. Méthodologie. Essai Sensorische Analyse. Prüfverfahren.
test. duo-trio. Duo-Trio-Prüfung.
(ISO 10399:2004) (ISO 10399:2004) (ISO 10399:2004)
Los miembros de CEN están sometidos al Reglamento Interior de CEN/CENELEC que define las condiciones dentro de
las cuales debe adoptarse, sin modificación, la norma europea como norma nacional. Las correspondientes listas
actualizadas y las referencias bibliográficas relativas a estas normas nacionales pueden obtenerse en el Centro de
Gestión de CEN, o a través de sus miembros.
Esta norma europea existe en tres versiones oficiales (alemán, francés e inglés). Una versión en otra lengua realizada
bajo la responsabilidad de un miembro de CEN en su idioma nacional, y notificada al Centro de Gestión, tiene el mismo
rango que aquéllas.
Los miembros de CEN son los organismos nacionales de normalización de los países siguientes: Alemania, Austria,
Bélgica, Bulgaria, Chipre, Croacia, Dinamarca, Eslovaquia, Eslovenia, España, Estonia, Finlandia, Francia, Grecia,
Hungría, Irlanda, Islandia, Italia, Letonia, Lituania, Luxemburgo, Malta, Noruega, Países Bajos, Polonia, Portugal,
Reino Unido, República Checa, Rumanía, Suecia y Suiza.
CEN
COMITÉ EUROPEO DE NORMALIZACIÓN
European Committee for Standardization
Comité Européen de Normalisation
Europäisches Komitee für Normung
CENTRO DE GESTIÓN: Avenue Marnix, 17-1000 Bruxelles
PRÓLOGO
El texto de la Norma ISO 10399:2004 del Comité Técnico ISO/TC 34 Productos alimenticios, de la
Organización Internacional de Normalización (ISO), ha sido adoptado como Norma EN ISO 10399:2010.
Esta norma europea debe recibir el rango de norma nacional mediante la publicación de un texto idéntico
a ella o mediante ratificación antes de finales de agosto de 2010, y todas las normas nacionales
técnicamente divergentes deben anularse antes de finales de agosto de 2010.
Se llama la atención sobre la posibilidad de que algunos de los elementos de este documento estén sujetos
a derechos de patente. CEN y/o CENELEC no es(son) responsable(s) de la identificación de dichos
derechos de patente.
De acuerdo con el Reglamento Interior de CEN/CENELEC, están obligados a adoptar esta norma europea
los organismos de normalización de los siguientes países: Alemania, Austria, Bélgica, Bulgaria, Chipre,
Croacia, Dinamarca, Eslovaquia, Eslovenia, España, Estonia, Finlandia, Francia, Grecia, Hungría,
Irlanda, Islandia, Italia, Letonia, Lituania, Luxemburgo, Malta, Noruega, Países Bajos, Polonia, Portugal,
Reino Unido, República Checa, Rumanía, Suecia y Suiza.
DECLARACIÓN
El texto de la Norma ISO 10399:2004 ha sido aprobado por CEN como Norma EN ISO 10399:2010 sin
ninguna modificación.
ÍNDICE
Página
PRÓLOGO .............................................................................................................................................. 6
4 PRINCIPIO............................................................................................................................. 8
6 JUECES .................................................................................................................................. 9
6.1 Cualificación ........................................................................................................................... 9
6.2 Número de jueces ................................................................................................................... 9
7 PROCEDIMIENTO ............................................................................................................. 10
10 PRECISIÓN Y SESGO........................................................................................................ 11
BIBLIOGRAFÍA ................................................................................................................................... 24
PRÓLOGO
Las normas internacionales se redactan de acuerdo con las reglas establecidas en la Parte 2 de las
Directivas ISO/IEC.
La tarea principal de los comités técnicos es preparar normas internacionales. Los proyectos de normas
internacionales adoptados por los comités técnicos se envían a los organismos miembros para votación.
La publicación como norma internacional requiere la aprobación por al menos el 75% de los organismos
miembros que emiten voto.
Se llama la atención sobre la posibilidad de que algunos de los elementos de este documento puedan estar
sujetos a derechos de patente. ISO no asume la responsabilidad por la identificación de cualquiera o todos
los derechos de patente.
La Norma ISO 10399 fue preparada por el Comité Técnico ISO/TC 34, Productos alimenticios,
Subcomité SC 12, Análisis sensorial.
Esta segunda edición anula y sustituye a la primera edición (ISO 10399:1991) que ha sido revisada
técnicamente.
El método es estadísticamente menos eficiente que el del ensayo triangular (descrito en la Norma ISO 4120) pero es
más fácil de realizar por los jueces.
El método es aplicable incluso cuando se desconoce la naturaleza de la diferencia (es decir, no determina el tamaño ni la
dirección de la diferencia entre muestras, ni hay indicación del atributo(s) responsable(s) de esta diferencia). El método
es aplicable únicamente si los productos son bastante homogéneos.
a) determinar que:
− no existe una diferencia perceptible (ensayo dúo-trío de similitud) cuando, por ejemplo se produce un cambio en
los ingredientes, procesado, envasado, manipulación o almacenamiento;
− la técnica de la referencia constante, utilizada cuando uno de los productos es familiar para los jueces (por ejemplo,
una muestra procedente de la producción habitual), y
− la técnica de la referencia equilibrada, utilizada cuando uno de los productos no es más familiar que el otro.
ISO 8589:1988 Análisis sensorial. Guía general para el diseño de salas de cata.
3 TÉRMINOS Y DEFINICIONES
Para los fines de este documento, se aplican los términos y definiciones incluidos en la Norma ISO 5492 además de los
siguientes:
NOTA Se conoce también como error de Tipo I, nivel de significación o índice de falso positivo.
3.3 diferencia:
Situación en la que se pueden distinguir las muestras basándose en sus propiedades sensoriales.
NOTA La proporción de evaluaciones en las que se detecta una diferencia perceptible entre los dos productos se conoce por el símbolo pd.
3.4 producto:
Material a evaluar.
3.5 muestra:
Unidad de producto preparada, presentada y evaluada en el ensayo.
3.6 sensibilidad:
Término general que resume la bondad del ensayo.
NOTA En términos estadísticos, la sensibilidad del ensayo se define mediante los valores de α, β y pd.
3.7 similitud:
Situación en la que cualquier diferencia perceptible entre las muestras es tan pequeña que los productos se pueden
considerar intercambiables.
3.8 tríada:
Las tres muestras presentadas al juez en el ensayo dúo-trío.
NOTA En el ensayo dúo-trío, una muestra se marca como la muestra de referencia y las otras dos se marcan con códigos diferentes. Una de las
muestras codificadas es el mismo producto que la muestra de referencia; la otra muestra codificada es el otro producto del ensayo.
4 PRINCIPIO
El número de jueces se elige basándose en la sensibilidad deseada para el ensayo. (Véase 6.2 y la discusión en el
capítulo A.3).
Los jueces reciben un conjunto de tres muestras (es decir, una tríada) una de las cuales está marcada como referencia y
las otras dos muestras marcadas con códigos diferentes. A los jueces se les informa de que una de las muestras
codificadas es igual a la muestra de referencia y de que la otra muestra es diferente a la muestra de referencia. Los
jueces indican cuál de las muestras codificadas creen que es igual a la de referencia o cuál de las muestras codificadas
creen que es diferente a la referencia, basándose en su entrenamiento y las instrucciones recibidas previamente a la
realización del ensayo.
Se contabiliza el número de respuestas correctas y se determina la significación consultando una tabla estadística.
5.2 Realizar el ensayo en condiciones que eviten la comunicación entre los jueces hasta que se hayan completado
todas las evaluaciones, utilizado las instalaciones y cabinas conforme a la Norma ISO 8589.
5.3 Preparar las muestras fuera de la vista de los jueces y de forma idéntica (es decir, mismos utensilios, mismos
recipientes e igual cantidad de producto).
5.4 Los jueces no deben ser capaces de identificar las muestras por su forma de presentación. Por ejemplo, en un
ensayo de gusto, se deben evitar diferencias en el aspecto. Enmascarar diferencias de color irrelevantes utilizando filtros
de luz y/o iluminación tenue.
5.5 Codificar los recipientes que contienen las muestras de manera uniforme, preferiblemente utilizando números de
tres dígitos, elegidos al azar para cada ensayo. Cada tríada se compone de tres muestras, una marcada como referencia y
otras dos con diferentes códigos. Preferiblemente, se deberían utilizar diferentes códigos para cada juez durante una
sesión. Sin embargo, se pueden utilizar los mismos códigos para todos los jueces dentro de un ensayo, siempre que cada
código se utilice una sola vez por juez durante una sesión del ensayo (por ejemplo, cuando se llevan a cabo varios
ensayos dúo-trío sobre diferentes productos en la misma sesión).
5.6 La cantidad o volumen servido debe ser idéntico en las tres muestras de cada tríada, igual a la de todas las demás
muestras de una serie de ensayos sobre un determinado tipo de producto. Se puede fijar la cantidad o volumen a
evaluar. Si no es así, se debería decir a los jueces que tomen siempre cantidades o volúmenes similares de cualquiera de
las muestras.
5.7 La temperatura de las tres muestras en cada tríada debe ser idéntica, igual a la de todas las demás muestras en una
serie de ensayos sobre un determinado tipo de producto. Es preferible presentar las muestras a la temperatura a la que se
consume, generalmente, el producto.
5.8 Se debe decir a los jueces si deben o no tragar las muestras o si pueden hacer lo que quieran. En este último caso,
se les debe requerir que procedan de la misma forma con todas las muestras.
5.9 Durante las sesiones del ensayo, debe evitarse dar información sobre la identidad del producto, los efectos
esperados del tratamiento, o el desempeño individual, hasta que las sesiones se hayan completado.
6 JUECES
6.1 Cualificación
Todos los jueces deberían poseer el mismo nivel de cualificación, siendo este nivel elegido sobre las bases del objetivo
del ensayo (véanse las Normas ISO 8586-1 e ISO 8586-2 como guía). La experiencia y familiaridad con el producto
pueden mejorar el desempeño de un juez y, por tanto, pueden aumentar la probabilidad de encontrar una diferencia
significativa. El control del desempeño de los jueces a lo largo del tiempo puede ser útil para aumentar la sensibilidad.
Todos los jueces deben estar familiarizados con la mecánica del ensayo dúo-trío, es decir, el método, la tarea y el
procedimiento de evaluación.
Siempre que sea posible, se deben evitar las evaluaciones repetidas por el mismo juez. Sin embargo, si se necesitan
evaluaciones repetidas, para obtener un número suficiente de evaluaciones totales, se debería intentar por todos los
medios que cada juez lleve a cabo el mismo número de repeticiones. Por ejemplo, si sólo se dispone de 12 jueces, cada
uno debe evaluar tres tríadas para obtener un total de 36 evaluaciones.
NOTA Cuando se contrasta la similitud usando la tabla A.2, no es válido tratar tres evaluaciones realizadas por 12 jueces como 36 evaluaciones
independientes. Sin embargo, el ensayo de diferencia usando la tabla A.1 es válido incluso aunque se realicen evaluaciones repetidas (véanse
las referencias [9] y [10]). Publicaciones recientes (véanse las referencias [7] y [8]) sobre pruebas de discriminación con repeticiones
sugieren enfoques alternativos para el análisis de evaluaciones con repetición en pruebas de discriminación.
7 PROCEDIMIENTO
7.1 Si el producto es familiar para los jueces (por ejemplo, una muestra control de la línea de producción) se utiliza la
técnica de la referencia constante. Si ningún producto es más familiar que otro, se utiliza la técnica de la referencia
equilibrada.
a) Técnica de la referencia constante: Se preparan los protocolos de trabajo y las hojas de cata (véase el capítulo B.2)
antes del ensayo para utilizar el mismo número de secuencias posibles de dos productos, A y B:
A-REF AB A-REF BA
Las presentaciones se distribuyen al azar en grupos de dos entre los jueces (es decir, utilizar cada secuencia una sola
vez entre los dos primeros jueces; utilizar cada presentación una sola vez de nuevo entre los dos jueces siguientes,
etc.). Esto minimizará el desequilibrio que resultaría si el número total de jueces no fuese un número par.
b) Técnica de la referencia equilibrada: Se preparan los protocolos de trabajo y las hojas de cata (véase el capítulo B.1)
antes del ensayo para utilizar el mismo número de las cuatro secuencias posibles de dos productos, A y B:
A-REF AB A-REF BA
B-REF AB B-REF BA
donde las dos primeras tríadas contienen el producto A como referencia (es decir, A-REF) y las dos últimas tríadas
contienen el producto B como referencia (es decir, B-REF). Las presentaciones se distribuyen aleatoriamente en
grupos de cuatro entre los jueces (es decir, utilizar cada secuencia una sola vez entre el primer grupo de cuatro
jueces; utilizar de nuevo cada secuencia una sola vez entre el siguiente grupo de cuatro jueces, etc.). Esto
minimizará el desequilibrio que resultaría si el número total de jueces no fuese un múltiplo de cuatro.
7.2 Se presentan las tres muestras de cada tríada simultáneamente si es posible, siguiendo la misma disposición
espacial para cada juez (por ejemplo, en una línea para ser examinadas siempre de izquierda a derecha, en una serie de
tres). Dentro de la tríada, generalmente, se autoriza a los jueces a repetir la evaluación de cada muestra tantas veces
como deseen (por supuesto si la naturaleza de la muestra permite evaluaciones repetidas).
7.3 Se pide a los jueces que evalúen primero la muestra de referencia, y a continuación las dos muestras codificadas en
el orden en el cual fueron presentadas. A los jueces se les informa de que una de las muestras codificadas es igual a la
muestra de referencia y que la otra es diferente a la muestra de referencia. Se pide a los jueces que indiquen bien cuál de
las dos muestras codificadas es igual que la muestra de referencia, o bien cuál de las dos muestras codificadas es
diferente de la muestra de referencia.
NOTA Cuando se decide si pedir a los jueces que seleccionen la muestra que es igual que la de referencia o que seleccionen la muestra diferente a la
referencia, se debería tener en cuenta si el panel utiliza rutinariamente otros ensayos de discriminación. Muchos ensayos de discriminación,
como, por ejemplo, el ensayo triangular, se centran en identificar la muestra “extraña” o “diferente” del ensayo. Cuando se pide a los jueces
identificar la muestra “diferente” en un método e identificar la “misma” muestra en otro método puede causar confusión y conducir a un
elevado nivel de respuestas incorrectas.
7.4 Se debería proporcionar una hoja de cata para cada tríada de muestras. Si un juez debe efectuar más de un ensayo
durante una sesión, se recoge el formulario de respuestas completado y las muestras ya evaluadas antes de presentar la
tríada siguiente. El juez no debe volver a ninguna de las muestras anteriores ni modificar el veredicto sobre un ensayo
previo.
7.5 No se pregunta sobre la preferencia, aceptación o grado de diferencia después de la selección inicial de la muestra
diferente. La selección que acaba de hacer el juez puede condicionar la respuesta a preguntas adicionales. La respuesta a
estas cuestiones se puede obtener mediante pruebas individuales de preferencia, aceptación, grado de diferencia, etc.
(Véase la Norma ISO 6658). Se puede incluir una sección de comentarios para que los jueces incluyan sus
observaciones sobre las razones de su elección.
7.6 El ensayo dúo-trío es un procedimiento de elección forzada; no se permite a los jueces la opción de responder “no
hay diferencia“. Si un juez no detecta diferencia entre las muestras se le debe pedir que seleccione una muestra al azar e
indique en la sección de comentarios de la hoja de cata que la selección fue aleatoria.
Si se desea, se puede calcular un intervalo de confianza sobre la proporción de la población que puede distinguir las
muestras. El método se describe en el capítulo B.3.
Si se desea, se puede calcular un intervalo de confianza sobre la proporción de la población que puede distinguir las
muestras. El método se describe en el capítulo B.3.
10 PRECISIÓN Y SESGO
Debido a que los resultados de los ensayos de discriminación sensorial son función de sensibilidades individuales, no se
puede establecer una declaración general de la reproducibilidad de los resultados aplicable al conjunto de jueces. La
precisión referente a un grupo particular de jueces mejora conforme aumenta el tamaño del panel, así como con su
entrenamiento y exposición al producto.
Dado que se usa un procedimiento de elección forzada, los resultados obtenidos por este método no tienen sesgo,
siempre que se observen las precauciones indicadas en el capítulo 7.
1) En esta norma internacional, “similar” no significa “idéntico”. Más bien, “similar” significa que los dos productos son suficientemente parecidos
para ser intercambiables. No es posible demostrar que dos productos sean idénticos. Sin embargo, puede demostrarse que cualquier diferencia
que exista entre dos productos es tan pequeña como para no ser significativa en la práctica.
ANEXO A (Normativo)
TABLAS
A.1 Los valores que aparecen en la tabla A.1 son el mínimo número de respuestas correctas necesarias para la
significación al nivel de riesgo α establecido (es decir, columna) para el número de jueces correspondiente, n (es decir,
fila). Rechazar la hipótesis “no existe diferencia” si el número de respuestas correctas es mayor o igual que el valor de
la tabla A.1.
Tabla A.1 − Número mínimo de respuestas correctas necesarias para concluir que existe diferencia significativa,
basado en un ensayo dúo-trío
α α
n n
0,20 0,10 0,05 0,01 0,001 0,20 0,10 0,05 0,01 0,001
6 5 6 6 — — 26 16 17 18 20 22
7 6 6 7 7 — 27 17 18 19 20 22
8 6 7 7 8 — 28 17 18 19 21 23
9 7 7 8 9 — 29 18 19 20 22 24
10 7 8 9 10 10 30 18 20 20 22 24
11 8 9 9 10 11 32 19 21 22 24 26
12 8 9 10 11 12 36 22 23 24 26 28
13 9 10 10 12 13 40 24 25 26 28 31
14 10 10 11 12 13 44 26 27 28 31 33
15 10 11 12 13 14 48 28 29 31 33 36
16 11 12 12 14 15 52 30 32 33 35 38
17 11 12 13 14 16 56 32 34 35 38 40
18 12 13 13 15 16 60 34 36 37 40 43
19 12 13 14 15 17 64 36 38 40 42 45
20 13 14 15 16 18 68 38 40 42 45 48
21 13 14 15 17 18 72 41 42 44 47 50
22 13 14 15 17 19 76 43 45 46 49 52
23 15 16 16 18 20 80 45 47 48 51 55
24 15 16 17 19 20 84 47 49 51 54 57
25 16 17 18 19 21 88 49 51 53 56 59
NOTA 1 Los valores de la tabla son exactos porque están basados en la distribución binomial. Para valores de n no incluidos en la tabla, se
calculan los valores utilizando la aproximación normal a la binomial como sigue:
mínimo número de respuestas (x) = número entero más cercano mayor que
x = ( n / 2) + z n / 4
donde z varía con el nivel de significación como sigue: 0,84 para α = 0,20; 1,28 para α = 0,10; 1,64 para α = 0,05; 2,33 para α = 0,01;
3,09 para α = 0,001.
NOTA 2 Los valores n < 24 no se recomiendan, generalmente, para el ensayo dúo-trío de diferencia.
NOTA 3 Adaptada de la referencia [11].
A.2 Los valores dados en la tabla A.2 son el número máximo de respuestas correctas necesarias para la “similitud” a
los niveles pd, β y n elegidos. Se acepta la hipótesis “no existe diferencia” al nivel de confianza 100(1−β) % si el número
de respuestas correctas es menor o igual que el valor de la tabla A.2.
Tabla A.2 − Número máximo de respuestas correctas necesarias para concluir que dos muestras son similares,
basado en un ensayo dúo-trío
pd pd
n β n β
10% 20% 30% 40% 50% 10% 20% 30% 40% 50%
20 0,001 3 4 5 6 8 52 0,001 17 19 22 25 28
0,01 5 6 7 8 9 0,01 19 22 25 27 30
0,05 6 7 8 10 11 0,05 22 24 27 30 33
0,10 7 8 9 10 11 0,10 23 26 28 31 34
0,20 8 9 10 11 12 0,20 25 27 30 33 35
24 0,001 5 6 7 9 10 56 0,001 18 21 24 27 30
0,01 7 8 9 10 12 0,01 21 24 27 30 33
0,05 8 9 11 12 13 0,05 24 27 29 32 36
0,10 9 10 12 13 14 0,10 25 28 31 34 37
0,20 10 11 13 14 15 0,20 27 30 32 35 38
28 0,001 6 8 9 11 12 60 0,001 20 23 26 30 33
0,01 8 10 11 13 14 0,01 23 26 29 33 36
0,05 10 12 13 15 16 0,05 26 29 32 35 38
0,10 11 12 14 15 17 0,10 27 30 33 36 40
0,20 12 14 15 17 18 0,20 29 32 35 38 41
32 0,001 8 10 11 13 15 64 0,001 22 25 29 32 36
0,01 10 12 13 15 17 0,01 25 28 32 35 39
0,05 12 14 15 17 19 0,05 28 31 34 38 41
0,10 13 15 16 18 20 0,10 29 32 36 39 43
0,20 14 16 18 19 21 0,20 31 34 37 41 44
36 0,001 10 11 13 15 17 68 0,001 24 27 31 34 38
0,01 12 14 16 18 20 0,01 27 30 34 38 41
0,05 14 16 18 20 22 0,05 30 33 37 40 44
0,10 15 17 19 21 23 0,10 31 35 38 42 45
0,20 16 18 20 22 24 0,20 33 36 40 43 47
40 0,001 11 13 15 18 20 72 0,001 26 29 33 37 41
0,01 14 16 18 20 22 0,01 29 32 36 40 44
0,05 16 18 20 22 24 0,05 32 35 39 43 47
0,10 17 19 21 23 25 0,10 33 37 41 44 48
0,20 18 20 22 25 27 0,20 35 39 42 46 50
pd pd
n β n β
10% 20% 30% 40% 50% 10% 20% 30% 40% 50%
44 0,001 13 15 18 20 23 76 0,001 27 31 35 39 44
0,01 16 18 20 23 25 0,01 31 35 39 43 47
0,05 18 20 22 25 27 0,05 34 38 41 45 50
0,10 19 21 24 26 28 0,10 35 39 43 47 51
0,20 20 23 25 27 30 0,20 37 41 45 49 53
48 0,001 15 17 20 22 25 80 0,001 29 33 38 42 46
0,01 17 20 22 25 28 0,01 33 37 41 45 50
0,05 20 22 25 27 30 0,05 36 40 44 48 53
0,10 21 23 26 28 31 0,10 37 41 46 50 54
0,20 23 25 27 30 33 0,20 39 43 47 52 56
84 0,001 31 35 40 44 49 100 0,001 39 44 49 54 60
0,01 35 39 43 48 52 0,01 42 47 53 58 64
0,05 38 42 46 51 55 0,05 46 51 56 61 67
0,10 39 44 48 52 57 0,10 48 53 58 63 68
0,20 41 46 50 54 59 0,20 50 55 60 65 70
88 0,001 33 37 42 47 52 104 0,001 40 46 51 57 63
0,01 37 41 46 50 55 0,01 44 50 55 61 66
0,05 40 44 49 53 58 0,05 48 53 59 64 70
0,10 41 46 50 55 60 0,10 50 55 60 66 71
0,20 43 48 52 57 62 0,20 52 57 63 68 73
92 0,001 35 40 44 49 55 108 0,001 42 48 54 59 65
0,01 38 43 48 53 58 0,01 46 52 57 63 69
0,05 42 46 51 56 61 0,05 50 55 61 67 72
0,10 43 48 53 58 63 0,10 52 57 63 68 74
0,20 46 50 55 60 65 0,20 54 60 65 71 76
96 0,001 37 42 47 52 57 112 0,001 44 50 56 62 68
0,01 40 45 50 56 61 0,01 48 54 60 66 72
0,05 44 49 54 59 64 0,05 52 58 63 69 75
0,10 46 50 55 60 66 0,10 54 60 65 71 77
0,20 48 53 57 62 67 0,20 56 62 68 73 79
NOTA 1 Los valores de la tabla son exactos porque están basados en la distribución binomial. Para valores de n no incluidos en la tabla, se calcula
el límite superior de confianza 100(1−β) % para pd utilizando la aproximación normal a la binomial como sigue:
2 3
[2( x / n ) − 1] + 2 zβ ( nx − x ) / n
donde
x es el número de respuestas correctas;
n es el número de jueces;
zβ varía como sigue: 0,84 para β = 0,20; 1,28 para β = 0,10; 1,64 para β = 0,05; 2,33 para β = 0,01; 3,09 para β = 0,001.
Si el valor calculado es inferior al límite seleccionado para pd, declarar las muestras similares al nivel β de significación.
NOTA 2 Los valores n < 36 no se recomiendan, generalmente, para un ensayo dúo-trío de similitud.
NOTA 3 Adaptada de la referencia [11].
A.3 La tabla A.3 muestra un planteamiento estadístico para determinar el número de jueces. La sensibilidad estadística
del ensayo es función de tres valores: el riesgo α, el riesgo β y la máxima proporción permitida de jueces que perciben
una diferencia, pd2). Antes de realizar el ensayo, se seleccionan los valores de α, β y pd utilizando las siguientes
directrices.
− un riesgo-α de 10% a 5% (0,10 a 0,05) indica una ligera evidencia de que existía una diferencia;
− un riesgo-α de 5% a 1% (0,05 a 0,01) indica evidencia moderada de que existía una diferencia;
− un riesgo-α de 1% a 0,1% (0,01 a 0,001) indica una fuerte evidencia de que existía diferencia, y
− un riesgo-α inferior a 0,1% (< 0,001) indica evidencia muy fuerte de que existía una diferencia.
Para riesgos-β, la fuerza de la evidencia de que no existe una diferencia se determina utilizando los mismos criterios que
para el riesgo-α (sustituyendo “β ” por “α ” y “no existe diferencia” por “existe diferencia”).
La máxima proporción permitida de sujetos que perciben una diferencia, pd, se divide en tres rangos:
Se elige el número de jueces para obtener el nivel de sensibilidad requerido por el ensayo. Se identifican, en la tabla A.3
la sección correspondiente al valor de pd seleccionado y la columna correspondiente al valor de β seleccionado. El
número mínimo de jueces requerido se encuentra en la fila correspondiente al valor seleccionado de α. Alternativa-
mente, la tabla A.3 se puede usar para desarrollar un conjunto de valores de pd, α y β que proporcionen una sensibilidad
aceptable mientras se mantiene el número de jueces en límites prácticos. El enfoque se presenta con detalle en la
referencia [12].
Los valores dados en la tabla A.3 son el número mínimo de jueces necesarios para realizar un ensayo dúo-trío con una
sensibilidad específica determinada por los valores de pd, α y β. En la tabla, se consulta la sección correspondiente al
valor elegido de pd y la columna correspondiente al valor elegido de β. Se lee el número mínimo de jueces en la fila
correspondiente al valor elegido de α.
2) En esta norma internacional, la probabilidad de una respuesta correcta, pc, se calcula como pc = pd + (1 − pd)/2, donde pd es la proporción de la
población de jueces que puede distinguir entre los dos productos. En un ensayo dúo-trío, también se podría aplicar un modelo psicométrico del
proceso de decisión de los jueces, como el modelo de Thurstone-Ura [8].
β
α pd
0,20 0,10 0,05 0,01 0,001
0,20 12 19 26 39 58
0,10 19 26 33 48 70
0,05 50% 23 33 42 58 82
0,01 40 50 59 80 107
0,001 61 71 83 107 140
0,20 19 30 39 60 94
0,10 28 39 53 79 113
0,05 40% 37 53 67 93 132
0,01 64 80 96 130 174
0,001 95 117 135 176 228
0,20 32 49 68 110 166
0,10 53 72 96 145 208
0,05 30% 69 93 119 173 243
0,01 112 143 174 235 319
0,001 172 210 246 318 412
0,20 77 112 158 253 384
0,10 115 168 214 322 471
0,05 20% 158 213 268 392 554
0,01 252 325 391 535 726
0,001 386 479 556 731 944
0,20 294 451 618 1 006 1 555
0,10 461 658 861 1 310 1 905
0,05 10% 620 866 1 092 1 583 2 237
0,01 1 007 1 301 1 582 2 170 2 927
0,001 1 551 1 908 2 248 2 937 3 812
NOTA Adaptada de la referencia [12].
ANEXO B (Informativo)
EJEMPLOS
B.1 Ejemplo 1: Ensayo dúo-trío para confirmar que existe diferencia − Técnica de la referencia equilibrada
B.1.1 Antecedentes
A un fabricante de sopa de tomate le gustaría introducir una nueva fórmula baja en sal y más cara con la intención de
obtener mayor posibilidad de éxito en el mercado. Antes de realizar un ensayo de comparación con consumidores de la
nueva fórmula con la actual, la fábrica desea confirmar que los dos productos puedan ser diferenciados sensorialmente.
Se elige el ensayo dúo-trío en la modalidad de la referencia equilibrada ya que por el olor y sabor complejo del producto
es importante que el proceso de decisión de los jueces sea sencillo. El director de producción está dispuesto a asumir
sólo un pequeño riesgo de concluir que existe diferencia cuando no la hay. Sin embargo, como la fórmula anterior es
todavía muy aceptable, está dispuesto a aceptar un mayor riesgo de no identificar una diferencia cuando la haya.
A-REF AB B-REF AB
A-REF BA B-REF BA
Cada una de las cuatro tríadas se presenta nueve veces de tal manera que llegue para los 36 jueces en orden aleatorio
equilibrado. (Véase la figura B.1 para el protocolo de trabajo). En la figura B.2 se muestra un ejemplo de hoja de cata
utilizada.
Opcionalmente, el analista puede calcular un intervalo de confianza inferior unilateral de la proporción de la población
que puede percibir una diferencia entre las muestras. Los cálculos (véase el capítulo B.3) son
El analista puede concluir con un 99% de nivel de confianza que al menos el 23% de la población puede percibir una
diferencia entre las muestras.
Ensayo dúo-trío
Juez nº. ________________ Nombre ______________________________________ Fecha ________________
Instrucciones
Pruebe las muestras de izquierda a derecha. La muestra de la izquierda es la de referencia. De las otras dos muestras
una es igual a la de referencia y la otra distinta a la referencia. Marque con una “X” en el cuadro correspondiente de
la muestra que es igual a la de referencia. Si no está seguro, indique una propuesta. Puede indicar en comentarios que
se ha marcado de forma aleatoria.
REF 941 792
Comentarios: ___________________________________________________________________________________
______________________________________________________________________________________________
Figura B.2 − Hoja de cata del ensayo dúo-trío de diferencia del Ejemplo 1
B.2 Ejemplo 2: Ensayo dúo-trío para confirmar que dos muestras son similares − Técnica de la referencia
constante
B.2.1 Antecedentes
Una fábrica de refrescos quiere asegurarse de que un nuevo envase no altera ni el olor ni el sabor de una bebida hasta el
punto de que los consumidores puedan detectar la diferencia. El director de producción sabe que es imposible probar
que dos productos son idénticos, pero quiere estar seguro de que sólo una pequeña parte de la población será capaz de
detectar una diferencia si existiera. Por otro lado, el fabricante está dispuesto a asumir con alta probabilidad la
conclusión errónea de que los productos son diferentes cuando no lo son, ya que ello solamente significaría continuar
con el satisfactorio envase actual, y quizás, modificar el nuevo y volverlo a evaluar.
Es decir, el analista puede asegurar al nivel de confianza del 95% que no más del 21% de los jueces puede distinguir entre
las muestras. Se concluye que el nuevo envase responde al criterio del fabricante del 95% de certeza (es decir, β = 0,05)
que no más de pd = 30% de la población, será capaz de detectar diferencia. El nuevo envase podría sustituir al actual.
B.3.1 Antecedentes
Si se estima conveniente, el analista puede calcular intervalos de confianza sobre la proporción de la población que
puede distinguir la muestra. Los cálculos son los siguientes, donde x = número de respuestas correctas y n = número
total de jueces:
− sd (desviación estándar de p̂ d ) = 2 pˆ c (1 − pˆ c ) / n
Para un intervalo de confianza del 90%, zα = 1,28; para un intervalo de confianza del 95%, zα = 1,64; y para un intervalo
de confianza del 99%, zα = 2,33.
Si el analista realizara un ensayo de similitud, a un nivel de confianza del 95%, la proporción real de la población capaz
de distinguir las muestras no es superior al 21%. Por otro lado, si hiciera un ensayo de diferencia, puesto que el límite
de confianza inferior del 95% es negativo, pd = 0% está en el intervalo, y es por tanto, un valor posible, lo que nos lleva
a la conclusión de que no existe diferencia perceptible entre las muestras.
En conjunto, los intervalos de confianza permiten un error del 5% para los límites superior e inferior, por lo que el
analista sensorial puede tener una certeza del 90% de que la proporción real de diferenciación está comprendida entre el
0% y el 21% de la población. Dependiendo del objetivo del estudio, se puede elegir usar el límite de confianza superior
unilateral, el límite de confianza inferior unilateral, o el límite de confianza bilateral.
BIBLIOGRAFÍA
[1] ISO 3534-1, Statistics. Vocabulary and symbols. Part 1: Probability and general statistical terms.
[4] ISO 8586-1, Sensory analysis. General guidance for the selection, training and monitoring of assessors. Part 1:
Selected assessors.
[5] ISO 8586-2, Sensory analysis. General guidance for the selection, training and monitoring of assessors. Part 2:
Experts.
[6] BROCKHOFF, P.B. and SCHLICH, P. Handling replications in discrimination tests. Food Quality and Preference, 9
(5), 1998, pp. 303-312.
[7] ENNIS, D.M. and BI, J. The Beta-Binomial Model: Accounting for Inter-trial Variation in Replicated Difference
and Preference Tests. Journal of Sensory Studies, 13 (4), 1998, pp. 389-412.
[9] KUNERT, J. and MEYNERS, M. On the triangle test with replications. Food Quality and Preference, 10, 1999.
[10] KUNERT, J. On repeated difference testing. Food Quality and Preference, 12, 2001, pp 385-391.
[11] MEILGAARD, M., CIVILLE, G.V., Carr, B.T. Sensory Evaluation Techniques, 2nd Edition, CRC Press, Inc., Boca
Raton, FL, 1991, p. 338.
[12] SCHLICH, P. Risk Tables for Discrimination Tests. Food Quality and Preference, 4, 1993, pp. 141-151.