Está en la página 1de 38

NORMA NTP-ISO 6658

TÉCNICA PERUANA 2008

Comisión de Normalización y de Fiscalización de Barreras Comerciales No Arancelarias -


INDECOPI
Calle de La Prosa 138, San Borja (Lima 41) Apartado 145 Lima, Perú

Análisis Sensorial. Metodología. Lineamientos generales

Sensory analysis. Methodology. General guidance

(EQV. ISO 6658:2005 Sensory analysis. Methodology. General guidance)

2008-12-03
1
a
Edición
R.0037-2008/INDECOPI-CNB. Publicada el 2009-01-01 Precio basado en 38 páginas
I.C:S: 01.040.67; 67.240 ESTA NORMA ES RECOMENDABLE
Descriptores: Análisis sensorial, metodología, lineamientos generales

ii

ÍNDICE

páginas
ÍNDICE i
PREFACIO iii
INTRODUCCIÓN v
1. OBJETO Y CAMPO DE APLICACIÓN 1
2. REFERENCIAS NORMATIVAS 1
3. TÉRMINOS Y DEFINICIONES 2
4. REQUISITOS GENERALES 2
5. MÉTODOS DE ENSAYO 9
6. ANÁLISIS DE RESULTADOS 27
7. ANTECEDENTES 33
ANEXO A 34

ANEXO B 37
PREFACIO

A. RESEÑA HISTÓRICA

A.1 La presente Norma Técnica Peruana ha sido elaborada por el Comité Técnico
de Normalización de Bebidas Alcohólicas Vitivinícolas mediante el Sistema 2 u ordinario,
durante los meses de diciembre de 2007 a setiembre de 2008, utilizando como
antecedente a la ISO 6658:2005 Sensory análisis – Methodology – General
guidance.

A.2 El Comité Técnico de Normalización de Bebidas Alcohólicas Vitivinícolas


presentó a la Comisión de Normalización y de Fiscalización de Barreras Comerciales No
Arancelarias – CNB -, con fecha 2008-09-22, el PNTP-ISO 6658:2008, para su revisión y
aprobación; siendo sometido a la etapa de Discusión Pública 2008-11-04. No
habiéndose presentado observaciones fue oficializado como Norma Técnica Peruana
NTP-ISO 6658:2008 Análisis sensorial. Metodología. Lineamientos generales, 1ª Edición,
el 01 de enero de 2009.

A.3 Esta Norma Técnica Peruana es una adopción de la ISO 6658:2005. La


presente Norma Técnica Peruana presenta cambios editoriales referidos principalmente
a terminología empleada propia del idioma español y ha sido estructurada de acuerdo a
las Guías Peruanas GP 001:1995 y GP 002:1995.

B. INSTITUCIONES QUE PARTICIPARON EN LA ELABORACIÓN


DE LA NORMA TÉCNICA PERUANA
Secretaría Comité de la Industria Vitivinícola Sociedad Nacional de Industrias

Presidente Alfredo San Martín Novelli Sociedad Nacional de Industrias


Secretario Edwin Landeo Del Pino
ENTIDAD REPRESENTANTES
BODEGAS VISTA ALEGRE S.A. Rodolfo Vasconi

BODEGAS Y VIÑEDOS TABERNERO S.A.C. Carlos Rotondo


VIÑA OCUCAJE S.A. Ricardo Rubini
VIÑA TACAMA S.A. Francisco Hernández
VITIVINÍCOLA EL FUNDADOR
DE CAÑETE Miguel Mirez Crisóstomo
EL ALAMBIQUE SAC José Américo Vargas de la Jara
ASOCIACIÓN DE PRODUCTORES
DE VINOS Y PISCOS DEL VALLE
DE ICA - APROPICA Jesús Hernández
ASOCIACIÓN VITIVINÍCOLA DE
LUNAHUANÁ Juan Carlos Alvarado
BODEGA EL CATADOR José Carrasco
PISCO PAYET Guillermo Payet
BODEGAS VIÑAS DE ORO S.A. James Bosworth Edwin Torres
BODEGA SOTELO Julio Sotelo
LICORES SAN FRANCISCO Nicanor Revilla
SOC. IND. E. COPELLO S.A.C. José Copello Fedeli
BODEGA LA BLANCO Carlos Arturo Mejía
SANTIAGO QUEIROLO S.A.C. Jorge Queirolo Rosa Revilla
CORPISCO José Moquillaza
EL ALAMBIQUE DE AZPITIA Jaime Marimón
COMITÉ DEL PISCO – ADEX José Miguel Poblete
INDECOPI José Dajes
MINISTERIO DE LA PRODUCCIÓN Luis Guerrero

ASPEC Samuel Ureña


COFRADÍA NACIONAL DE CATADORES DEL PERÚ John Schuler
INASSA Emma Aguinaga Maycol Antón
SAT Clotilde Huapaya Mercedes Otaegui
CERPER Gloria Reyes Mario Pomiano
LA MOLINA CALIDAD TOTAL Carmen Rodríguez
LABORATORIOS Lourdes Hernández
CITEvid Manuel Morón Ely Anchante
UNIVERSIDAD AGRARIA LA MOLINA Beatriz Hatta Eduardo Morales
FOOD SOLUTIONS Sonia Palomino
Elsa Zubiate
CERTILAB Felipe Surco
Consultor Juan Carlos Palma
Consultor Marco Antonio Zúñiga Díaz
Consultor Marko García
Consultor Jorge Llanos
Consultor Milber Ureña
Consultora Ana Villanueva
Consultora Lyris Monasterio
Consultora Soledad Marroquín
Introducción

Este NTP constituye una introducción general a la metodología del análisis sensorial y
debe leerse antes de realizar los procedimientos de prueba más detallados descritos en
otras Normas Internacionales. Cubre el área general de metodología y tiene por objeto
cumplir las siguientes funciones:

a) proporcionar al usuario de pruebas específicas un breve conocimiento básico de


las principales características de los métodos de análisis sensorial;

b) proporcionar detalles sobre los requisitos generales, procedimientos e


interpretación de los resultados comunes a todos o la mayoría de pruebas;

c) proporcionar lineamientos suficientes sobre los requisitos, procedimientos e


interpretación de los resultados para las diferentes pruebas específicas que
permitan elegir el procedimiento(s) más apropiado para solucionar un problema en
particular.
Comprende 3 partes principales, cubiertas en los capítulos 4, 5 y 6. Es esencial leer
primero el capítulo 4, ―Requisitos generales‖. El capítulo 5, ―Métodos de ensayo‖,
describe, de manera general, todas las pruebas principales, bajo 5 títulos:

Definiciones;
Aplicación;
Evaluadores;
Procedimiento;
Análisis de resultados.

El capítulo 6 se ocupa de algunos principios generales de recopilación de datos y el


análisis de datos sensoriales y además trata brevemente los principios generales
del tratamiento estadístico de los resultados.

Análisis Sensorial. Metodología. Lineamientos generales.

1. OBJETO Y CAMPO DE APLICACIÓN

Esta Norma Técnica Peruana establece lineamientos generales sobre el uso del
análisis sensorial. Describe pruebas para el examen de alimentos mediante el
análisis sensorial, e incluye alguna información sobre las técnicas que deben utilizarse si
se requiere el análisis estadístico de los resultados.

Por lo general, estas pruebas están destinadas sólo para el análisis sensorial
objetivo. Sin embargo, si no puede utilizarse una prueba para determinar la
preferencia, se indicará esto.

2. REFERENCIAS NORMATIVAS

La presente norma contiene disposiciones que al ser citadas en este texto,


constituyen requisitos de este Proyecto de Norma Técnica Peruana. La edición
indicada estaba en vigencia en el momento de esta publicación. Como toda norma
está sujeta a revisión, se recomienda a aquellos que realicen acuerdos en base a ellas,
que analicen la conveniencia de usar las ediciones recientes de las normas citadas
seguidamente. El Organismo Peruano de Normalización posee, en todo momento, la
información de las Normas Técnicas Peruanas en vigencia.

2.1 Norma Técnica Peruana


NTP ISO 5492 Análisis sensorial. Vocabulario

3. TÉRMINOS Y DEFINICIONES

Para los fines de esta Norma Técnica Peruana, se aplican los términos y definiciones
dados en
NTP ISO 5492 y el siguiente:
3.1 análisis sensorial: examen de atributos organolépticos de un producto a
través de los órganos de los sentidos.

4. REQUISITOS GENERALES

4.1 Información básica

Este capítulo cubre los requisitos generales comunes a todas las situaciones
encontradas en el análisis sensorial. La información básica sobre estos requisitos es la
siguiente:

a) La respuesta humana a un estímulo no puede ser aislada de la experiencia


anterior o de otros estímulos sensoriales recibidos del entorno.

NOTA: Sin embargo, se pueden controlar las influencias que provienen de estas dos
fuentes y normalizar el efecto.

b) La variabilidad de la respuesta sensorial es inherente a cualquier grupo de


personas utilizado para las pruebas y es inevitable; ésta puede surgir de
incoherencias dentro de una persona y debido a diferencias fisiológicas y
psicológicas entre los individuos.

NOTA Sin embargo, con entrenamiento, este grupo puede presentar respuestas
individuales muy coherentes. El reconocimiento de estos factores es importante en el
análisis de resultados.
c) Los sesgos sistemáticos en los experimentos sensoriales que implican una
respuesta humana, pueden conducir a datos engañosos y la interpretación incorrecta
que pueden ser difíciles de identificar. Se deberían identificar los factores que
pueden producir un sesgo, y controlarlos en la medida de lo posible mediante el
diseño experimental apropiado y la realización de las pruebas.
d) La validez de las conclusiones sacadas de los resultados depende de la prueba
utilizada y la forma en que se realiza, incluyendo las preguntas que se han formulado.

4.2 Declaración de objetivos

Existen tres tipos de objetivo, como se indica a continuación:


a) Aquellos en los que el propósito principal de la prueba es clasificar, ordenar
por rangos o describir el producto(s);
b) Aquellos en los que el propósito es distinguir entre dos o más productos; aquí
es importante distinguir entre la necesidad de conocer si hay una diferencia, cuán
grande es la magnitud de la diferencia, la dirección (o calidad) de esa diferencia, la
influencia de esa diferencia, por ejemplo, con respecto a la preferencia, o si toda una
población o sólo parte de ésta detecta una diferencia;
c) Aquellos en los que se busca asegurar que los productos no difieren.
En el análisis sensorial, un determinado problema con frecuencia requiere una
considerable discusión u opiniones antes de seleccionar la prueba apropiada. Por eso, el
concepto inicial del problema puede requerir una aclaración.

4.3 Selección de la prueba

La selección de la prueba apropiada depende en gran parte de la naturaleza del objetivo


de la prueba, pero también tiene que tomar en cuenta los factores relacionados con el
producto, los evaluadores, el ambiente de ensayo, y el nivel deseado de precisión
analítica y la confianza estadística en las conclusiones. Se debería determinar por
anticipado la acción que se tomaría en base al resultado de la prueba.

Para cada prueba, en el capítulo 5 se trata de proporcionar directivas con


respecto a su pertinencia. Pueden ser necesarias pruebas preliminares para confirmar
la aplicabilidad de una determinada prueba.
Debido a la fatiga sensorial y los efectos de adaptación, dependiendo de la naturaleza
de la prueba y el tipo de producto, sólo se puede evaluar un número limitado de
muestras durante una sesión. Se puede moderar algunos de estos efectos mediante
procedimientos de enjuague apropiados y la recuperación entre una muestra y otra.
Aunque el uso de muestras de control es esencial en la mayoría de casos, naturalmente
éste limita el número de muestras que se puede evaluar durante cualquier sesión.
Siempre se debe determinar el plan estadístico antes de comenzar las pruebas.
Esto es especialmente recomendable si el número de muestras a evaluar requiere más
de una sesión.
Se debería seleccionar los detalles de los planes estadísticos en base a textos
especializados.
Cualquiera que sea el método de ensayo que se utilice, se debería considerar el enfoque
de ensayo secuencial descrito en ISO 16820 cuando sea conveniente procurar que el
número de muestras o el número de evaluadores sea mínimo.
4.4 Selección y entrenamiento de evaluadores
Un panel de análisis sensorial constituye un verdadero ―instrumento de
medición‖ y, por
consiguiente, los resultados de los análisis realizados dependen de sus miembros.
Por lo tanto, la selección de personas dispuestas a participar en un panel tiene que
realizarse con cuidado y debería ser considerada como una verdadera inversión, tanto
en términos de tiempo como financieros. El apoyo de la dirección en la organización es
necesario si debe ser eficaz.
La evaluación sensorial puede ser realizada por tres tipos de jueces: ―jueces‖,
―jueces calificados‖ o ―jueces expertos‖. Los jueces pueden ser ―jueces novatos‖ que
no tienen que cumplir con un criterio preciso de selección o entrenamiento, o
personas que ya han participado en algunas pruebas sensoriales (juez iniciado). Los
jueces calificados son jueces que han sido seleccionados y entrenados para una prueba
sensorial en particular. Los jueces expertos son evaluadores que han sido
seleccionados y entrenados para una variedad de métodos de análisis sensorial y
que demuestran una agudeza especial en el trabajo del panel.

NOTA Los jueces contratados por compañías para realizar análisis sensoriales como
la función principal de su cargo son ejemplos de evaluadores expertos.

Los métodos de selección y entrenamiento a utilizar dependen de las tareas y métodos


que se piensa dar a los jueces seleccionados. Se debería notar que estos métodos
a veces sólo constituyen una forma de seleccionar a los mejores candidatos de
entre los que están disponibles, antes que cumplir con criterios predeterminados.
Además, la selección de evaluadores por su capacidad para discriminar y describir
alimentos es muy distinta de la utilizada para pruebas de preferencias. La primera
requiere una selección y entrenamiento, mientras que la segunda sólo necesita que
el panel sea representativo de un sector especificado de la población, por ejemplo,
un grupo de consumidores.
Si debe realizarse un procedimiento de selección, algunos criterios importantes
para seleccionar evaluadores son los siguientes:
a) capacidad general para realizar la tarea sensorial específica, lo cual puede
incluir una sensibilidad especial a los estímulos que se está estudiando;
b) disponibilidad con respecto al trabajo normal;
c) motivación (buena disposición e interés);
d) buena salud (incluyendo la ausencia de alergias específicas o tratamiento con
medicamentos), buenas condiciones dentales y buena higiene general.
Se debería realizar un seguimiento periódico del desempeño de los evaluadores
calificados y expertos para asegurar que se sigan cumpliendo los criterios por los
cuales fueron seleccionados inicialmente.

4.5 Material a ensayar

La naturaleza del producto a ensayar determina el protocolo experimental de la


prueba y también puede influir en el tipo de prueba que se requiere para cumplir los
objetivos de la misma. Por ejemplo, un protocolo en el cual los alimentos deben ser
consumidos calientes, tendrá que tomar en cuenta el índice de enfriamiento del
producto y el probable efecto en los atributos sensoriales, y los cambios en los
atributos sensoriales que pueden producirse al mantener el producto caliente antes
de la prueba.
Los métodos de preparación y presentación de muestras deberían ser apropiados
para el producto y el problema implicado.

EJEMPLO 1: Un producto que normalmente se consume caliente, debería ser


preparado en la forma usual y ensayado caliente; sin embargo, pueden utilizarse
temperaturas elevadas en algunas circunstancias con el fin de tener mayor facilidad para
evaluar algunos sabores.
EJEMPLO 2: Un producto que normalmente se consume en piezas discretas, no debería
ser homogeneizado para conservar las características de textura. Sin embargo, se
debe tener cuidado de asegurar la máxima uniformidad entre las submuestras para
cada evaluador; esto incluye tamaño de porción similar y uniformidad de composición.
Los principios generales para el muestreo de productos (de acuerdo con las
Normas Internacionales referentes al producto que se está ensayando) deberían
aplicarse a las muestras de ensayo. En todos los casos, es necesaria la documentación
de los códigos de identificación de las muestras o los números de lote. Se pueden sacar
conclusiones válidas para un producto en su conjunto sólo si las muestras ensayadas son
representativas.
A veces pueden utilizarse portadores para pruebas relacionadas con la evaluación
de productos para los cuales no es factible una degustación directa (véase ISO
5497), por ejemplo, ingredientes de alimentos.
Se deberían especificar las condiciones de iluminación cuando se evalúa el aspecto.
Cuando la prueba se relaciona sólo con diferencias de sabor, el efecto de las
diferencias de color puede ocultarse parcialmente con el uso de condiciones de
iluminación que minimicen la diferencia de color.
Los recipientes deben ser seleccionados de tal manera que no afecten la prueba o el
producto.
Éstos pueden incluir envases de cerámica o vidrio lavables, o recipientes de plástico o
papel desechables, pero no deben transferir materiales químicos que podrían
producir contaminación. Particularmente, se deberían lavar los recipientes lavables
sólo con detergentes libres de cualquier olor y ontaminación y se deberían enjuagar con
agua, y los recipientes poliméricos y de papel, incluyendo recipientes aislados utilizados
para muestras calientes o frías, deberían estar libres de cualquier olor y contaminación.
Los jueces pueden utilizar limpiadores de paladar de una muestra a otra y de una sesión
a otra, pero se debería tener cuidado de asegurarse de que no influyan en el
sabor de los productos a evaluar. Se pueden utilizar agua sin gas y carbonatada y
alimentos sosos (por ejemplo, galletas sin sal) de una muestra a otra y de una sesión
a otra. Son convenientes controles del suministro de agua para asegurarse de que sea
blanda. Para fines particulares, se pueden utilizar agua desionizada, aguas destilada en
alambique de vidrio, agua de manantial con bajo contenido de minerales, agua filtrada
con carbón o agua de grifo hervida, pero se debería tener en cuenta que es probable
que tengan sabores diferentes.

4.6 Sala de pruebas

Los análisis sensoriales deberían realizarse en una sala de pruebas dedicada (Véase la
NTP ISO 8589 para mayores detalles). El propósito debería ser crear, para cada juez, un
ambiente separado con un mínimo de distracción, de modo que éste pueda adaptarse
rápidamente a la naturaleza de la nueva tarea(s). Durante las pruebas, no se
deberían permitir actividades ajenas, incluyendo la preparación de las muestras,
puesto que éstas pueden conducir a resultados sesgados. La sala debería tener una
temperatura confortable y estar ventilada con aire libre de olores; es conveniente un
flujo de aire limitado para evitar fluctuaciones de temperatura excesivas. No se
debería permitir que olores persistentes, como tabaco o cosméticos, contaminen el
ambiente de la sala de pruebas.
Se debería restringir el ruido. Por lo general, un ruido de fondo bajo es generalmente
más tolerable que un nivel de ruido fluctuante. La conversación distrae más que el ruido
de fondo.
Las interrupciones producen la mayor distracción.
Por lo general, es útil tener un control sobre el color y la intensidad de la iluminación,
aunque rara vez las luces coloreadas logran ocultar completamente las diferencias en el
aspecto.
Las superficies deberían ser no absorbentes y estar diseñadas de tal manera que
faciliten un alto nivel de higiene. Las dimensiones de las cabinas de degustación son
importantes; los cielos rasos muy bajos y las cabinas muy angostas pueden ser
opresivos o producir una sensación de claustrofobia. Es necesario que haya asientos
cómodos.

Si se ha previsto la adquisición computarizada de datos, entonces se debería


implementarla en forma segura e higiénica y en una manera que no comprometa la
apreciación sensorial.

4.7 Planificación y realización de la prueba

La planificación y realización de la prueba están determinadas por los objetivos el


programa, la prueba seleccionada y las limitaciones prácticas relacionadas con el
uso de sujetos humanos. Particularmente, es importante reconocer los sesgos que
podrían ser inherentes a la prueba seleccionada, y realizar la prueba de tal manera
que se minimice los efectos de cualquier sesgo. Los posibles sesgos pueden tener su
origen en fuentes tanto psicológicas como fisiológicas.
El sesgo psicológico más grave proviene de los evaluadores que interactúan para influir
en sus apreciaciones el uno respecto del otro, y debería minimizarse mediante el uso de
cabinas individuales o la separación adecuada de los evaluadores. Además, es necesaria
la gestión rigurosa de las actividades de los evaluadores.
La manera y orden de presentación de las muestras son aspectos importantes de la
prueba y pueden introducir sesgos psicológicos. Por ejemplo, las muestras deberían ser
codificadas con números aleatorios de 3 dígitos, y se deberían cambiar los códigos para
cada prueba. El orden de evaluación también puede ser una fuente de sesgo y, por
lo general, se debería especificar el orden. Con un número pequeño de muestras y
evaluadores, se puede equilibrar el orden de tal modo que todo orden posible se
produzca un igual número de veces. En experimentos más grandes, se puede
equilibrar o aleatorizar el orden.
Los sesgos fisiológicos están relacionados a menudo con la naturaleza de las muestras
de ensayo. En particular, puede producirse la adaptación a un estímulo de sabor
específico en una exposición reiterada a ese estímulo, y se puede sentir fatiga al
masticar alimentos sólidos.
Ambos factores pueden imponer un límite superior al número de muestras a evaluar en
una sesión. Se puede recomendar la expectoración de muestras en el caso de paneles
entrenados pero se puede tener como resultado la pérdida de información sobre
atributos sensoriales específicos.
El hambre y la saciedad pueden influir en el desempeño de un evaluador y, si se
mantiene los paneles mucho tiempo, el desempeño puede deteriorarse. Si es posible, se
debería pedir a los evaluadores que se abstengan de fumar o consumir cosas ligeras
como café durante 1 h antes de la prueba. Los evaluadores no deberían llevar ningún
olor extraño a la sesión, por ejemplo olor a tabaco o cosméticos, puesto que éstos
podrían influir en las respuestas de otros evaluadores.
La hora del día en que se realiza la prueba es importante. El horario debería tener en
cuenta las horas de comer habituales locales puesto que por lo general, el desempeño
es considerado óptimo a media mañana y a media tarde. Los evaluadores que
sufran de trastornos emocionales, resfríos y otras enfermedades, deberían ser
excluidos de las pruebas hasta que se recuperen.

La comparación de resultados comprende tres aspectos:


 verificar que todos los datos hayan sido registrados con exactitud, en forma
computarizada o manual;

 verificar que se haya registrado cualquier información pertinente adicional que


pueda ayudar o poner en duda la interpretación de los resultados;

 verificar que los evaluadores sean motivados a seguir participando si se tiene


planeado realizar otras pruebas.

5. MÉTODOS DE ENSAYO

5.1 Generalidades

Las pruebas más utilizadas se dividen en 3 grupos:


a) pruebas de discriminación, utilizadas para determinar la probabilidad de
diferencia o similitud entre productos (Véase el apartado 5.2);
b) pruebas con ayuda de escalas y categorías, para estimar el orden o magnitud
de las diferencias o las categorías o clases a las cuales deberían ser asignadas las
muestras (Véase el apartado 5.3);
c) pruebas descriptivas, utilizadas para identificar los atributos sensoriales
específicos presentes en una muestra (Véase el apartado 5.4).
Para el número de jueces, consulte las respectivas normas, considerando el riesgo α o β
dependiendo del propósito de la prueba. Alternativamente, el análisis secuencial
(Véase la norma ISO 16820) puede permitir tomar una decisión después de menos
pruebas que las que requerirían los enfoques convencionales que utilizan un
número predeterminado de evaluaciones.

Las pruebas también pueden ser cuantitativas.


5.2 Pruebas de discriminación
5.2.1 Generalidades
Las siguientes pruebas son utilizadas comúnmente para determinar la probabilidad
de diferencia o similitud entre muestras:
a) prueba de comparación por parejas (Véase el apartado 5.2.2);
b) prueba triangular (Véase el apartado 5.2.3);
c) prueba dúo-trío (Véase el apartado 5.2.4);
d) prueba dos de cinco (Véase el apartado 5.2.5);
e) prueba ―A/no A‖ (Véase el apartado 6.2.6).
Para todas estas pruebas, existen diferentes maneras de analizar los resultados.
5.2.2 Prueba de comparación por parejas
5.2.2.1 Definición
Ésta es una prueba en la que se presentan muestras en parejas con el objeto de
comparar y detectar las diferencias en base a algunos criterios definidos.
Véase la norma ISO 5495 para mayores detalles.

5.2.2.2 Aplicación
Se recomienda la prueba de comparación por parejas para:
a) determinar si existe una diferencia perceptible en un atributo en particular (por
ejemplo, dulzor), o determinar si no existe ninguna diferencia perceptible en ese
atributo,
b) seleccionar, entrenar y realizar un seguimiento del desempeño de los evaluadores,
c) comparar dos productos en cuanto a preferencia en el contexto de pruebas
realizadas con consumidores.
Las ventajas de esta prueba con respecto a otras pruebas de discriminación son
la simplicidad y la menor fatiga sensorial.
La desventaja del método de comparaciones por parejas es que, a medida que se
incrementa el número de muestras a comparar, el número de intercomparaciones
requerido se vuelve rápidamente inmanejable.
5.2.2.3 Procedimiento
Los jueces reciben un juego de dos muestras (la pareja). Designan la muestra que
consideran que es la más intensa en el atributo considerado, aunque esta elección sea
sólo una conjetura. Una de las muestras puede ser un control. Se cuenta el número de
veces que se selecciona cada muestra.
Es necesario determinar, antes de realizar la prueba, si la prueba estadística que sigue,
va a ser unilateral (es decir, el supervisor de la prueba espera una determinada dirección
de la diferencia y la hipótesis alternativa corresponde a la existencia de una diferencia
en esa dirección) o bilateral (es decir, el supervisor de la prueba no tiene ninguna
dirección prevista de la diferencia y la hipótesis alternativa corresponde a una
diferencia en cualquiera de las dos direcciones).
No se deberían combinar preguntas sobre diferencia y preferencia: los criterios
para la selección de paneles son diferentes para estas preguntas.

5.2.2.4 Análisis de resultados


Véase el apartado 6.2.2.
5.2.3 Prueba triangular
5.2.3.1 Definición
Ésta es una prueba de discriminación en la que se presenta simultáneamente tres
muestras codificadas, dos de las cuales son idénticas. Se les pide a los evaluadores que
indiquen cuál es la muestra diferente.
Véase la norma ISO 4120 para mayores detalles.
5.2.3.2 Aplicación
La prueba triangular es recomendable:
a) cuando se desconoce la naturaleza de la diferencia, y
b) para la selección y entrenamiento de evaluadores.
La prueba no debería utilizarse para la determinación de preferencias. Algunas
desventajas de la prueba son que: es poco económica para la evaluación de un gran
número de muestras, puede ser más afectada por la fatiga sensorial que la prueba de
comparación por parejas, con muestras que tienen un sabor intenso, si se conoce la
naturaleza de la diferencia, es estadísticamente menos eficiente que algunas otras
pruebas, y el método es aplicable sólo si los productos son lo más homogéneos posible.
5.2.3.3 Procedimiento
Se le presenta a cada uno de los evaluadores un juego de tres muestras codificadas,
dos de las cuales son idénticas, y se les pide que seleccionen la muestra diferente.
Las muestras deberían ser presentadas un igual número de veces en cada uno de los
dos grupos de tres cambios de orden distintos, que son:
BAA ABA AAB
ABB BAB BBA
5.2.3.4 Análisis de resultados
Véase el apartado 6.2.3.
5.2.4 Prueba dúo-trío
5.2.4.1 Definición
Ésta es una prueba de discriminación en la que se presenta en primer lugar una muestra
de referencia. A continuación, se presenta dos muestras, una de las cuales es
idéntica a la muestra de referencia y se les pide a los evaluadores que la identifiquen.
Véase la norma ISO 10399 para mayores detalles.
5.2.4.2 Aplicación

Esta prueba dúo-trío se utiliza para determinar si existe una diferencia o similitud
sensorial entre una determinada muestra y una referencia. Es especialmente
adecuada cuando la muestra de referencia es bien conocida para los evaluadores, por
ejemplo, una muestra de producción regular.
Si hay un sabor residual, esta prueba es menos adecuada que la de comparación por
parejas (5.2.2) o la de ―A/no A‖ (5.2.6).
5.2.4.3 Procedimiento
Primero, se les presenta a los evaluadores una muestra de referencia identificada.
Luego, se les presenta dos muestras codificadas, una de las cuales es idéntica a la
muestra de referencia y se les pide a los evaluadores que identifiquen esta muestra.
5.2.4.4 Análisis de resultados
Véase el apartado 6.2.4.
5.2.5 Prueba dos de cinco
5.2.5.1 Definición
Ésta es una prueba de discriminación en la que se presenta cinco muestras codificadas,
dos de las cuales pertenecen a un tipo y tres a otro. Se les pide a los evaluadores que
agrupen los dos juegos de muestras.
5.2.5.2 Aplicación
La prueba dos de cinco es recomendable para establecer una diferencia de una manera
más económica que mediante otras pruebas (el método es estadísticamente más
eficiente).

Las desventajas de esta prueba son similares a las de la prueba triangular (5.2.3). Es
mucho más afectada por la fatiga sensorial y los efectos de la memoria pero tiene mayor
poder estadístico. Se utiliza principalmente en aplicaciones visuales, auditivas o táctiles.
5.2.5.3 Procedimiento
Se les presenta a cada uno de los evaluadores un juego de cinco muestras codificadas y
se les dice que dos pertenecen a un tipo y tres a otro. Se les pide a los
evaluadores que agrupen los dos juegos de muestras.
Cuando el número de evaluadores es inferior a 20, el orden de presentación debería
ser seleccionado al azar de entre los siguientes 20 cambios distintos.
AAABB BBBAA AABAB BBABA ABAAB BABBA BAAAB ABBBA AABBA
BBAAB ABABA BABAB BAABA ABBAB ABBAA BAABB BABAA ABABB
BBAAA AABBB
5.2.5.4 Análisis de resultados
Véase el apartado 6.2.5.
5.2.6 Prueba “A/no A”
5.2.6.1 Definición
Ésta es una prueba en la que se presenta a los evaluadores una serie de
muestras que pueden ser ―A‖ o ―no A‖ después de que han aprendido a reconocer la
muestra ―A‖. Se les pide a los evaluadores que indiquen si cada una de las muestras es
―A‖ o no.
Véase la norma ISO 8588 para mayores detalles.
5.2.6.2 Aplicación
Ésta es una prueba de discriminación que puede utilizarse para la evaluación de
muestras que tienen variaciones de aspecto o dejan un sabor residual persistente.
Es especialmente útil cuando no pueden obtenerse muestras repetidas
estrictamente similares.
5.2.6.3 Procedimiento
Se presenta a los evaluadores muestras una a la vez. Primero, se les presenta la
muestra de referencia ―A‖ varias veces, hasta que puedan reconocerla. Luego, se les
presenta al azar varias muestras, cada una de las cuales puede ser ―A‖ o ―no A’,
y éstos tienen que determinar si las muestras son ―A‖ o no. Se debería dejar
pasar un intervalo de tiempo considerable (por ejemplo, de 2 a 5 min.) entre
cada recepción de muestras, y sólo se deberían examinar pocas muestras durante
una sesión.
5.2.6.4 Análisis de resultados
Véase el apartado 6.2.6.
5.3 Uso de escalas y categorías
5.3.1 Consideraciones generales
Véase la NTP ISO 4121 para mayores detalles.
En el análisis sensorial, los métodos de medición podrían tratar de decidir las
categorías, clases o grados a los cuales las muestras deberían ser asignadas. También
pueden tratar de encontrar estimados numéricos de la magnitud de atributos de las
muestras o de diferencias entre las muestras.
No existe una relación directa entre la escala de respuestas utilizada para obtener
números y la escala de medición que corresponde a los valores registrados. De este
modo, el mismo método para obtener números (escala de respuestas) puede conducir a
valores, cuya escala de medición es sólo ordinal (intervalos desiguales) o está en
una escala de intervalos (intervalos iguales). Con una escala de medición ordinal,
no se puede asumir que la magnitud de la diferencia entre dos valores refleja la
diferencia entre las intensidades percibidas. Tampoco, se puede asumir que la relación
de dos valores refleja la relación de las intensidades percibidas. Con una escala de
medición de intervalos, mayores valores numéricos corresponden a mayores
intensidades percibidas (o grados de placer) y la magnitud de la diferencia entre
dos valores refleja la magnitud de la diferencia en la intensidad percibida de la
propiedad que se está midiendo. Sin embargo, un valor numérico igual a cero podría no
indicar una ausencia total de la propiedad y no se puede asumir que la relación de dos
valores refleja la relación de las intensidades percibidas.
La selección de la escala de respuestas depende de los objetivos del estudio y los
productos en estudio. En cualquier caso específico, se puede elegir de entre varias
escalas igualmente buenas. Cualquiera que sea la escala de respuestas que se adopte,
debería ser fácil de usar, discriminante, sin sesgo y entendida fácilmente por los
evaluadores (véase NTP ISO 4121).
5.3.2 Interpretación de resultados
5.3.2.1 Calidad de las mediciones obtenidas
Independientemente de la escala de respuestas, la calidad de las mediciones depende
de la manera en que se obtuvieron. Los aspectos a considerar son:

 el nivel de entrenamiento de los evaluadores (Véase la NTP ISO 8586-1 y


NTP ISO 8586-2), y
 el método de presentación de las muestras (Véase los apartados 4.5 y 4.7).

5.3.2.2 Poder estadístico e interpretación


El análisis estadístico está influenciado por la naturaleza de la escala de medición
(ordinal, de intervalos o relaciones) antes que por la escala de respuestas utilizada.

Los resultados medidos en una escala ordinal son mejor analizados utilizando métodos
no paramétricos, por ejemplo, la prueba de Wilcoxon en el caso de dos muestras
igualadas o la prueba de Friedman con más de dos muestras. Se pueden analizar
mediciones en una escala de intervalos o relaciones mediante una prueba
paramétrica, por ejemplo, el análisis de varianza, si se puede asumir una distribución
normal de residuales.
Por lo general, las pruebas paramétricas son más poderosas que las no paramétricas.
Es decir, si existe una diferencia, será más probable que la prueba paramétrica la
demuestre.
Por otro lado, las pruebas no paramétricas son más robustas que las paramétricas; es
decir, son menos afectadas por anomalías en los datos.
En el análisis sensorial, se evalúa la percepción de una propiedad, no la propiedad en sí
misma, y es imposible estar seguro de que se ha logrado la igualdad de los intervalos.
Aunque no es inusual interpretar los resultados como si correspondieran a una escala de
medición de intervalos o relaciones, esta interpretación debería ser expresada en cada
caso específico como una hipótesis de trabajo.
5.3.2.3 Tipos de medición
Es útil distinguir los siguientes tipos de medición:
a) clasificación (Véase el apartado 5.3.3);
b) valoración global (Véase el apartado 5.3.4);
c) ordenación por rangos (Véase el apartado 5.3.5);
d) clasificación con ayuda de una escala y puntuación (Véase el apartado 5.3.6) El
término ―medición‖ es genérico y se refiere a todos éstos.
5.3.3 Clasificación
5.3.3.1 Generalidades
La clasificación es un método de distribución de muestras (físicamente o
mediante las etiquetas que las identifican) en categorías previamente definidas.
5.3.3.2 Aplicación
La clasificación es aplicable cuando se desea asignar las muestras a la más apropiada de
varias categorías que no se encuentran en un orden específico. Por ejemplo, el
pescado puede ser clasificado de acuerdo con su especie, o las muestras pueden ser
asignadas a categorías de acuerdo con los tipos de defecto que tienen. El principio
consiste en que se asigna cada muestra a la categoría de la cual es más típica. Si se
utilizan números para representar las categorías, se dice que la medición está en
una escala nominal, y los números sólo sirven de etiquetas. Para dichos números,
ni el orden ni la magnitud proporcionan información.
5.3.4 Valoración global
5.3.4.1 Generalidades
La valoración global se refiere a un método de clasificación de muestras en grupos que
constituyen una escala ordinal de calidad.
5.3.4.2 Aplicación
La valoración global es aplicable cuando se desea asignar muestras a la más apropiada
de varias categorías que se asume que reflejan la calidad. Por ejemplo, el pescado puede
ser clasificado según su frescura o las muestras pueden ser asignadas a categorías de
acuerdo con la gravedad de sus defectos. El principio consiste en que se asigna cada
muestra a la categoría de la cual es más típica. Si se utilizan números para representar
las categorías, se dice que la medición está en una escala ordinal. Para dichos números,
solamente el orden proporciona información.

5.3.5 Ordenación por rangos


5.3.5.1 Generalidades
Véase la NTP-ISO 8587 para mayores detalles.
NOTA: Compare con el apartado 5.3.6.
La ordenación por rangos es un método de clasificación en el que se coloca una serie de
muestras en orden de intensidad o grado de algún atributo especificado. No se
trata de evaluar la magnitud de la diferencia entre las muestras. Si la posición en
el orden se registra como número, la escala de medición resultante es ordinal.
5.3.5.2 Aplicación
La ordenación por rangos puede utilizarse como una forma rápida de caracterizar
un pequeño número de muestras (aproximadamente seis) con atributos complejos
(por ejemplo, calidad y sabor) o si se debe evaluar un gran número de muestras
(aproximadamente 20) sólo por el aspecto.
5.3.5.3 Procedimiento
Es necesario asegurarse de que los jueces comprendan y acuerden el atributo o criterio
en base al cual se deben ordenar las muestras. Cada juez examina
independientemente las muestras codificadas en el orden establecido y asigna una
ordenación por rangos preliminar. Luego, los evaluadores deberían revisar esta
ordenación por rangos haciendo un nuevo examen de las muestras y modificarla, si es
necesario, cambiando el orden.
5.3.6 Clasificación con ayuda de una escala y puntuación

5.3.6.1 Generalidades

La clasificación con ayuda de una escala es un método de clasificación en el cual se


asigna cada muestra a alguna posición de una escala ordinal. Se puede asignar más de
una muestra a la misma posición de la escala. La escala puede ser numérica,
verbal, gráfica o una combinación de éstas. Puede ser continua o discreta y unipolar o
bipolar (Véase la NTP ISO 4121). Si la escala es numérica, a menudo al
procedimiento se le denomina ―puntuación‖. Puede ser útil que los evaluadores
tengan algunas muestras como referencias para identificar posiciones específicas de la
escala.
5.3.6.2 Aplicación
La clasificación con ayuda de una escala puede utilizarse para evaluar la intensidad de
uno o más atributos o grados de gustación de las muestras.
Aunque tanto la ordenación por rangos como la clasificación con ayuda de una
escala invocan sólo escalas ordinales, no son equivalentes. La ordenación por rangos
coloca las muestras en orden y, por consiguiente, sus resultados sólo se refieren al grupo
de muestras ordenadas por rangos. La clasificación con ayuda de una escala proporciona
un estimado ordinal de la magnitud de atributos o preferencias porque se utiliza la
misma escala ordinal independientemente de las muestras que se están evaluando. Por
lo tanto, la clasificación con ayuda de una escala es preferible si se deben comparar los
resultados de un juego de muestras con otros. Pero, puesto que la ordenación por
rangos alienta a los evaluadores para que utilicen cualquier diferencia percibida entre
las muestras, puede revelar pequeñas distinciones entre las muestras a las que se les da
la misma clasificación.
.3.6.3 Procedimiento
El método de clasificación a utilizar debería ser claramente definido y comprendido por
los evaluadores. Cada evaluador examina independientemente las muestras una por
una en un orden establecido y asigna cada una de éstas a una posición en una escala.
5.4 Pruebas descriptivas

5.4.1 Tipos de prueba


Estas pruebas pueden aplicarse a una o más muestras para caracterizar, tanto
cualitativa como cuantitativamente, uno o más atributos sensoriales. Éstas pueden
ser clasificadas como:
a) pruebas descriptivas simples (Véase el apartado 5.4.2),
b) métodos de análisis descriptivos y de perfil sensorial (Véase el apartado
5.4.3), o
c) perfil de libre elección (Véase el apartado 5.4.4).
5.4.2 Prueba descriptiva simple
5.4.2.1 Definición
Ésta es una prueba para obtener una descripción cualitativa de atributos individuales
que contribuyen al carácter general de una muestra.
5.4.2.2 Aplicación
La prueba puede utilizarse para:

 identificar y describir los atributos de una muestra o muestras en particular; y

 establecer la secuencia en la que estos atributos son percibidos.

Se recomienda utilizar la prueba para la descripción de diferencias previamente


establecidas. Es una prueba útil para el entrenamiento de evaluadores o para el
desarrollo de vocabulario preliminar para las técnicas descriptivas más detalladas que
se describen más abajo.
5.4.2.3 Procedimiento
La prueba puede aplicarse a una o más muestras. Cuando se presentan más de una
muestra durante una sesión, el orden en que se presenta las muestras, influirá. La
importancia de esto puede evaluarse repitiendo la prueba, utilizando un orden de
presentación diferente.
Cada evaluador evalúa la muestra en forma independiente y se registra los hallazgos. Se
puede proporcionar una lista de verificación de atributos. La evaluación sensorial puede
ir seguida de una discusión conducida por el jefe del panel.
5.4.2.4 Interpretación de resultados
Los resultados deberían ser comparados para elaborar una lista de términos
descriptivos aplicables a la muestra, en base a la frecuencia de uso de cada uno de éstos.
Con frecuencia es útil una discusión abierta al término de la evaluación.
5.4.3 Pruebas descriptivas cuantitativas y de perfil sensorial
5.4.3.1 Definición

Éstas son pruebas o métodos teóricos para evaluar, de manera reproducible, las
propiedades organolépticas de un producto utilizando términos seleccionados a partir
de un glosario previamente establecido mediante pruebas descriptivas simples.
Los atributos individuales que contribuyen a la impresión sensorial general de la
muestra son evaluados en una escala de intensidad y los resultados son utilizados para
determinar un perfil sensorial del producto. El método puede utilizarse para
evaluar todas las sensaciones en forma separada o combinada.
Véase la norma ISO 6564, NTP ISO 8586-1 e ISO 13299 para mayores detalles.

5.4.3.2 Aplicación

Se recomienda utilizar las pruebas descriptivas para:

 desarrollar nuevos productos;

 establecer la naturaleza de las diferencias entre productos;

 realizar el control de la calidad;

 proporcionar datos sensoriales para su correlación con datos instrumentales, y

 proporcionar datos sensoriales para su correlación con datos de consumidores.

5.4.3.3 Jueces
Se requiere un panel de jueces calificados o expertos, especialmente entrenados
en el método.

Según sea el caso:


el responsable del panel puede servir para dirigir el entrenamiento

 el responsable del panel puede servir para dirigir una discusión y lograr
un consenso, o en caso no haya un responsable de panel, la situación puede ser
controlada por el organizador de la prueba.

5.4.3.4 Procedimiento
Se realiza un grupo de preliminar de pruebas (o entrenamiento) con la variedad
de productos a ensayar, con el fin de establecer las propiedades organolépticas
importantes para caracterizarlos y distinguirlos. Los resultados de estas pruebas se
emplean para elaborar el glosario de términos descriptivos a utilizar y para establecer el
procedimiento experimental para presentar y examinar las muestras. Luego, se entrena
a un panel en la metodología y, especialmente, en el uso del glosario. En esta etapa, es
útil tener un juego de materiales de referencia, compuestos puros o productos
naturales, que obtengan determinados puntajes de olor o sabor o tengan
determinadas propiedades visuales o de textura.
En las sesiones de la prueba, los jueces cotejan las muestras con el glosario de términos,
puntuando cada atributo presente en una escala de intensidad.
Es usual observar el orden en que los factores son percibidos, incluyendo la presencia
de un sabor residual, y puntuar la impresión general del aroma y sabor.
5.4.3.5 Interpretación de resultados
Existen dos enfoques básicos para el tratamiento de los datos.

En los métodos de perfil por consenso, inmediatamente después de que los evaluadores
han concluido sus evaluaciones, el jefe del panel tabula los resultados e inicia una
discusión para resolver las diferencias. A la luz de la discusión y, si es necesario,
después de un nuevo examen de las muestras, el panel llega a una decisión en grupo
sobre el perfil.
En los otros métodos de análisis descriptivos, puede no haber ninguna discusión y el
perfil obtenido es una serie de promedios de los puntajes asignados a cada descriptor
por cada evaluador.
Se pueden comparar estadísticamente los promedios, por ejemplo, utilizando el análisis
de varianza. Además, para todos los métodos de análisis descriptivos, existen
técnicas de análisis multivariado.
5.4.4 Perfil de libre elección

5.4.4.1 Definición

Éste es un método descriptivo en el cual evaluadores no entrenados o


mínimamente entrenados evalúan los productos utilizando sus propios grupos
individuales de descriptores.
5.4.4.2 Aplicación
Se recomienda utilizar estas pruebas para el desarrollo de nuevos productos
(especialmente, el mapeo de percepción de espacios del producto). Su ventaja
más importante es que se evita el entrenamiento del panel.
5.4.4.3 Jueces
No es necesario un entrenamiento específico.
5.4.4.4 Procedimiento
Cada miembro del panel elabora su propia lista idiosincrática de términos
descriptivos evaluando una amplia variedad de muestras y tratando de caracterizarlas y
distinguir entre éstas.
Luego, los jueces realizan sus evaluaciones individuales de los productos de
ensayo utilizando una hoja de evaluación descriptiva tradicional elaborada con su
propio vocabulario.
5.4.4.5 Interpretación de resultados
Por lo general, los datos son sometidos al Análisis Generalizado de Procrustes o Statis
para generar un mapa de percepción por consenso de dimensiones importantes y
evaluar el grado de coincidencia de los datos de cada evaluador con el mapa de
consenso obtenido estadísticamente.

6. ANÁLISIS DE RESULTADOS

6.1 Generalidades
Este capítulo proporciona indicaciones generales sobre los métodos apropiados a
utilizar para el análisis estadístico de los resultados de las pruebas sensoriales.
Mayores detalles sobre pruebas específicas pueden encontrase en las Normas
Internacionales apropiadas mencionadas en la Bibliografía. Los términos estadísticos
en negrita son explicados en el Anexo A y están conformes con ISO 3534-1, ISO 3542-2
e ISO 3534-3.

6.2 Pruebas de discriminación

6.2.1 Generalidades
El propósito de las pruebas de discriminación descritas en 5.2 es determinar si existe
una diferencia detectable entre dos productos, A y B (o una preferencia por uno de
ellos). El análisis se basa en el número de evaluadores en cada categoría
particular, por ejemplo, aquellos que prefieren A, aquellos que prefieren B, o aquellos
que eligen correctamente la muestra diferente.
Esta Norma Internacional que trata de manera detallada cada método, también
describe cómo utilizarlo para asegurar la similitud cuando se requiere.
6.2.2 Prueba de comparación por parejas (véase ISO 5495)
6.2.2.1 Interpretación estadística
Existen dos formas posibles de esta prueba. La primera se relaciona con la detección y
la determinación de la dirección de una diferencia especificada entre dos productos; la
segunda se relaciona con la preferencia por uno de ellos.
En ambos casos, la hipótesis nula es que no se puede hacer ninguna diferenciación entre
dos productos (por intensidad o por orden de preferencia). En términos cuantitativos, la
hipótesis nula es que existe igual probabilidad (1/2) de que un evaluador seleccionado al
azar del panel seleccionará la muestra A ó la muestra B.
La interpretación de resultados basados en el número de participantes que indiquen
que A (o B) tiene la mayor intensidad o que prefieren A (o B), depende de la hipótesis
alternativa en oposición a la hipótesis nula. Dependiendo de la naturaleza de la
hipótesis alternativa, que debe ser especificada antes de realizar la prueba, ésta será de
dos colas o de una cola.

6.2.2.2 Prueba de dos colas


La prueba de dos colas es aquella en la que simplemente se desea averiguar si existe
una diferencia en intensidad entre los dos productos (prueba de intensidad), o si se
prefiere uno de los productos en vez del otro (prueba de preferencias). La hipótesis
alternativa se escribe PA ≠ PB (es decir, PA > PB ó PA < PB ).
En un nivel de significación de 5%, se rechaza la hipótesis nula si el número de votos
para una muestra es por lo menos igual al de la columna 2 de la Tabla A.1.
Si éste es el caso, la conclusión será que hay una diferencia significativa entre
los dos productos y, si la mayoría de votos es a favor del producto A, la conclusión será
que, para la característica en cuestión, A tiene una intensidad significativamente
mayor que B (o es significativamente preferido, si esa fue la base de los votos de los
evaluadores).
6.2.2.3 Prueba de una cola (direccional)
La prueba de una cola es aquella en la que se desea descubrir si uno de los
productos especialmente designados (A, por ejemplo) tiene una mayor intensidad
que el otro; la hipótesis alternativa es entonces PA > 1/2 . Una prueba direccional
es apropiada sólo si cualquier resultado en la dirección opuesta no se interpretara
como un efecto verdadero sino simplemente como un resultado fortuito que no pone en
duda la hipótesis nula.
En un nivel de significación de 5%, se rechaza la hipótesis nula si el número de votos a
favor de A es por lo menos igual al de la columna 4 de la Tabla A.1. Si éste es
el caso, la conclusión será que la superioridad de A sobre B (en intensidad) ha
sido reconocida significativamente por el panel.

6.2.3 Prueba triangular (véase ISO 4120)


La hipótesis nula es que no es posible distinguir entre los productos. En este
caso, la probabilidad P de identificar la muestra que es diferente a las otras dos, es igual
a P0 = 1/3 .
En términos estadísticos, la hipótesis nula H0 es expresada por P0 = 1/3.
La prueba es de una cola. El supervisor de la prueba quiere saber si es posible distinguir
entre los dos productos, de manera que rechazará la hipótesis nula en favor de la
hipótesis alternativa P > 1/3 .
Si el número de respuestas correctas es mayor o igual al número correspondiente
en la columna 3 de la Tabla A.1, esto corresponde a una proporción de
respuestas correctas significativamente mayor que P0 = 1/3 en el nivel de significación
de 5%.
6.2.4 Prueba dúo-trío
La hipótesis nula es que no es posible distinguir entre los productos. En este
caso, la probabilidad de identificar la muestra que es idéntica a la muestra de
referencia, es igual a .
En términos estadísticos, la hipótesis nula H0 es expresada por P0 = 1/2
La prueba es de una cola. El supervisor de la prueba quiere saber si es posible distinguir
entre los dos productos, de manera que rechazará la hipótesis nula en favor de la
hipótesis alternativa P0 > 1/2 , si el número de respuestas correctas es mayor o igual al
número de la columna 4 de la Tabla A.1 correspondiente al nivel de significación de 5%.

6.2.5 Prueba dos de cinco

La hipótesis nula es P0 = 1/10 . La prueba es de una cola y la hipótesis alternativa es P0 >


1/10 . El número de respuestas correctas es comparado con el número correspondiente
de la columna 5 de la Tabla A.1.
6.2.6 Prueba “A/no A” (véase ISO 8588)
Los números de respuestas "A" y respuestas "no A" se suman por separado para las
muestras que el analista sensorial sabe que son "A", y para aquellas que se sabe que son
"no A", dando una tabla de 2 x 2. Se puede utilizar una prueba de independencia chi
cuadrado (x2) o una prueba ―exacta‖ de Fisher para determinar si las proporciones de
respuestas "A" y "no A" son diferentes para los dos tipos de muestra.
La prueba es de una cola, siendo la hipótesis nula que las dos proporciones son iguales y
la hipótesis alternativa de que la proporción de respuestas "A" es mayor para las
muestras que se sabe que son "A".
6.2.7 Tratamiento de los respuestas “no hay diferencia” en las pruebas de
discriminación

En las pruebas de discriminación, pueden presentarse respuestas ―no hay


diferencia‖. Sin embargo, se puede estipular que éstas no están permitidas (la técnica
de elección forzada).
Cuando sucede esto, se utilizan las respuestas de evaluadores que de alguna manera
habrían respondido ―no hay diferencia‖ pero cuyas apreciaciones pueden ser
predominantemente correctas. Su desventaja radica en que puede contrariar a los
evaluadores que honestamente desean registrar ―no hay diferencia‖. Si se permite los
resultados ―no hay diferencia‖, se informa el número de evaluadores que responden
―no hay diferencia‖ y el análisis estadístico utiliza sólo los resultados de aquellos que
informaron una diferencia. Las conclusiones son expresadas como si se relacionaran con
evaluadores que manifiestan una preferencia o informan una diferencia.
6.2.8 Efectos sistemáticos

Se deberían realizar verificaciones para ver si hay algún efecto sistemático en relación
con, or ejemplo:
El orden de la prueba para cada evaluador, y la secuencia de la presentación a varios
evaluadores.
6.2.9 Enfoque secuencial (véase ISO 16820)
En el enfoque secuencial, se examinan continuamente los resultados acumulativos de
una prueba de discriminación durante la prueba. La prueba se detiene tan pronto como
se llegue a una decisión. Este enfoque a menudo permite llegar a una decisión después
de menos pruebas que las que se requeriría utilizando tamaños de muestra
predeterminados.
6.3 Pruebas con ayuda de escalas y categorías
6.3.1 Generalidades

Véase la NTP ISO 4121 para mayores detalles.


La selección de un método estadístico para el análisis sensorial con cualquiera de las
pruebas indicadas en 5.3 depende del propósito de la misma y del número de productos
ensayados.
Este apartado proporciona información sobre los métodos estadísticos utilizados.
Para mayores detalles en el contexto específico de cada prueba, se deberían consultar
los libros de texto sobre estadística pertinentes o buscar la asesoría de un estadístico.
6.3.2 Clasificación

Se pueden resumir los resultados obtenidos para un tipo de producto como frecuencias
para cada categoría. Después, se puede utilizar la prueba chi cuadrado ( ) para
comparar las distribuciones de dos o más tipos de un producto en las diferentes
categorías, es decir, para probar la hipótesis nula de que las distribuciones son las
mismas en comparación con la hipótesis alternativa de que éstas son diferentes.
6.3.3 Valoración global (véase NTP ISO 4121)
Se pueden resumir los datos como en la clasificación. Alternativamente, se pueden
resumir los resultados utilizando medianas y se pueden comparar estadísticamente
los datos utilizando pruebas de suma de rangos, aunque se pueden requerir
ajustes para considerar grandes números de rangos ligados. Si se utilizan los datos de
una muestra como base para una decisión con respecto a una cantidad mayor (un
―lote‖), véase ISO 2859-1, ISO 2859-2, ISO 2859-3 e ISO 3951 para obtener las
características de un plan de muestreo apropiado.
6.3.4 Ordenación por rangos (véase PNTP ISO 8587)
Cuando las muestras han sido ordenadas por varios evaluadores como se indica en
5.3.2, pueden realizarse pruebas estadísticas para determinar si las muestras son
significativamente diferentes (pruebas de suma de rangos). También pueden realizarse
pruebas para determinar si una determinada muestra tiene un rango
significativamente superior o inferior que las demás muestras.
Los puntajes de rangos pueden ser agrupados en grupos homogéneos.
6.3.5 Clasificación con ayuda de una escala

Para la clasificación en una escala discreta con un pequeño número de posiciones,


los resultados para una muestra pueden ser tratados como en la clasificación. Los
datos continuos, o datos discretos con un gran número de posiciones, pueden ser
agrupados y resumidos por frecuencias en cada intervalo.
Cuando se clasifica más de una muestra, se debería utilizar un método no paramétrico
para comparar las distribuciones obtenidas.
Si los datos cumplen las condiciones de la puntuación, tal como están o después
de ser transformados, entonces se pueden utilizar los métodos indicados en 5.3.6.
6.3.6 Puntuación
Se pueden resumir los resultados obtenidos para una muestra como una mediana
o un promedio (media aritmética) con alguna medida de la dispersión (por
ejemplo, rango o desviación estándar).
Si se trata de sólo dos muestras y la hipótesis de normalidad de la distribución de los
puntajes es razonable, se puede utilizar una prueba t (véase ISO 2854). Si los puntajes se
obtienen de más de dos muestras, el procedimiento normal es el análisis de varianza.
stribución de los puntajes de cada muestra parece no ser normal, el uso de métodos
libres de distribución puede ser útil.
6.4 Pruebas analíticas o descriptivas
Véase la norma ISO 6564 para mayores detalles.
En los apartados 5.4.2.4 y 5.4.3.5, se da indicaciones sobre el tratamiento de resultados
para pruebas descriptivas simples y para métodos de perfil.

7. ANTECEDENTES

ISO 6658:2005 Sensory analysis – Methodology – General


guidance
ANEXO A

(INFORMATIVO)

TÉRMINOS ESTADÍSTICOS
A.1 Prueba de una hipótesis - Hipótesis nula
En el análisis sensorial, se realiza una prueba para evaluar una hipótesis. Se
debería establecer esta hipótesis claramente y sin ambigüedades antes de realizar la
prueba. Debería formularse de modo que puede traducirse a un lenguaje estadístico
como una hipótesis nula H0
. La hipótesis nula es generalmente aquella que establece que no existe ninguna
diferencia entre productos con respecto a la intensidad de una característica (o que no
existe ninguna preferencia por uno de ellos).
A.2 Hipótesis alternativa
La hipótesis alternativa es la hipótesis claramente establecida que se aceptará si se
rechaza la hipótesis nula. Si la hipótesis nula H0 es P = P 01 , la hipótesis alternativa H1
puede ser de dos colas o de una cola (por ejemplo, P > P0 ). En 6.2.2, se da ejemplos de
ambos tipos.
A.3 Significación y nivel de significación
Cuando se analizan los resultados de una prueba, existen dos conclusiones posibles:

 no se rechaza la hipótesis nula;

 se rechaza la hipótesis nula.

Puesto que cualquier prueba es realizada por un número limitado de evaluadores,


la conclusión que rechaza la hipótesis nula (en favor de la hipótesis alternativa) implica
un riesgo. El nivel de significación es la probabilidad (o el valor máximo de la
probabilidad) de rechazar la hipótesis nula cuando ésta es verdadera. A esto se le
denomina ―riesgo alfa‖.
La lógica clásica de la prueba de significación exige que se tome una decisión por
anticipado con respecto al riesgo alfa aceptable. Generalmente, el valor preestablecido
para el nivel de significación es = 0,05 (5%) o = 0,01 (1%). La mayoría de tablas
estadísticas utilizadas para interpretar resultados de ensayo incluyen estos dos niveles
de significación. Es importante notar que se puede rechazar la hipótesis nula en el
―nivel de 5%‖ pero no en el ―nivel de 1%‖.
Si se rechaza la hipótesis nula en el ―nivel de 1%‖, de hecho, también se rechaza
en el ―nivel de 5%‖. Esto explica el porqué a veces se utilizan las expresiones
―significativo‖ para el nivel de 5% y ―muy significativo‖ para el nivel de 1%.

A.4 Conclusiones erróneas: Tipo dos - Eficiencia


Si la prueba no conduce al rechazo de la hipótesis nula, esto no demuestra de
ninguna manera que esta hipótesis es verdadera. Sólo significa que, en base a la
información limitada disponible (prueba con n evaluadores), no hay motivo suficiente
para rechazar esta hipótesis (en el nivel de significación elegido). Mientras mayor
sea la cantidad de información (mientras más grande sea n), más se justifica rechazar
la hipótesis nula cuando es falsa; la eficiencia de la prueba se incrementa con el
número de evaluadores que participan en la misma. Por ejemplo, en el caso de
un prueba de preferencias (6.2.2)
realizada con 20 evaluadores, la hipótesis nula P0 = 1/2 puede no ser rechazada (siendo
la conclusión que no existe ninguna preferencia significativa por cualquiera de los
dos productos), mientras que, si la prueba hubiera sido realizada con 100 evaluadores,
se podría haber demostrado una preferencia significativa por uno de los productos
a partir de las mismas proporciones de las dos elecciones.
El error tipo dos (que depende del nivel de significación elegido) es la
probabilidad (denotada con ) de no rechazar equivocadamente la hipótesis nula
cuando la hipótesis alternativa especificada es realmente verdadera.

Si la hipótesis nula y la hipótesis alternativa pueden ser definidas con los valores de un
parámetro como en las pruebas de discriminación (prueba de comparación por
parejas, prueba triangular, prueba dúo-trío, etc.), se puede calcular el error tipo dos en
función de este parámetro. Para pruebas en las que la hipótesis nula y la hipótesis
alternativa no pueden ser definidas utilizando los valores de un parámetro
(pruebas de evaluación, clasificación), generalmente no es posible calcular el error tipo
dos.

Tabla A.1 - Tablas de significación

Número de
evaluadores
Prueba de
comparación
por parejas
(de dos colas)
Prueba
triangular
Prueba dúo-trío y
prueba de
comparación por
parejas (de una
cola)
Prueba
dos de cinco
5

NOTA Todos los resultados se refieren al nivel de significación de 5%. Para otros niveles
de significación, véase referencia bibliográfica [23].
ANEXO B

BIBLIOGRAFÍA

1. ISO 2854, Interpretación estadística de datos — Técnicas de estimación y pruebas


relacionadas con medias y varianzas
2. ISO 2859 (todas las partes), Procedimientos de muestreo para la inspección por
atributos
3. ISO 3534-1, Estadística — Vocabulario y símbolos — Parte 1: Términos generales de
estadística y probabilidad
4. ISO 3534-2, Estadística — Vocabulario y símbolos — Parte 2: Control de calidad
estadístico
5. ISO 3534-3, Estadística — Vocabulario y símbolos — Parte 3: Diseño de
experimentos
6. ISO 3951 (todas las partes), Procedimientos de muestreo para la inspección por
variables
7. ISO 3972, Análisis sensorial — Metodología — Método para investigar la
sensibilidad gustativa
8. ISO 4120, Análisis sensorial — Metodología — Prueba triangular
9. NTP ISO 4121, Análisis sensorial — Lineamientos para el uso de escalas de
respuesta cuantitativas
10. ISO 5495, Análisis —Metodología — Prueba de comparación por parejas
11. ISO 5497, Análisis sensorial — Metodología — Lineamientos para la preparación de
muestras para las cuales no es factible un análisis sensorial directo
12. ISO 6564, Análisis sensorial — Metodología - Métodos de perfiles de sabor

13. NTP ISO 8586-1, Análisis sensorial — Guía general para la selección,
entrenamiento y seguimiento de evaluadores — Parte 1: Evaluadores calificados
14. NTP ISO 8586-2, Análisis sensorial — Guía general para la selección,
entrenamiento y seguimiento de evaluadores — Parte 2: Expertos
15. PNTP ISO 8587, Análisis sensorial —Metodología – Ordenación por rangos
16. ISO 8588, Análisis sensorial — Metodología - Prueba ―A/no A‖

17. PNTP ISO 8589, Análisis sensorial — Guía general para el diseño de salas de
pruebas
18. ISO 10399, Análisis sensorial — Metodología — Prueba dúo-trío
19. ISO 13299, Análisis sensorial — Metodología — Guía general para el
establecimiento de un perfil sensorial
20. ISO 13300-1, Análisis sensorial — Guía general para el personal de un laboratorio de
evaluación sensorial — Parte 1: Responsabilidades del personal
21. ISO 13300-2, Análisis sensorial — Guía general para el personal de un laboratorio de
evaluación sensorial — Parte 2: Selección y entrenamiento de jefes de paneles
22. ISO 16820, Análisis sensorial — Metodología — Análisis secuencial
23. Roessler, Pangborn, Sidel and Stone, J. Food Science, 43, 1978, p. 940

También podría gustarte