Está en la página 1de 7

LOS RIESGOS Y PELIGROS DE ANLISIS DE DATOS SENSORIALES DE PREDICCIN DE VIDA TIL: SIMULACIN DE DATOS APLICADA AL CASO DE CAF

2. Materiales y mtodos 2.1. Escenarios con la variabilidad de datos diferente Con el fin de evaluar cmo la variabilidad de datos influye en estantera Las estimaciones de duracin, se construyeron 3.000 conjuntos de datos simulados. Un ideal perfil de la evolucin estancamiento de caf como una funcin de almacenamiento tiempo se construy, como si se obtuvieron mediante una prueba descriptiva, sobre la base de los resultados de los experimentos anteriores (Guerra, 2005). En esas pruebas, 12 asesores entrenados evaluaron el atributo'' aejo'' ('''' Rancido en italiano) en una escala de nueve puntos discretos con anclajes semnticas (1 no rancio, rancio 9 extrema), utilizando un diseo de bloques completos al equilibrada con dos repeticiones, a las ocho tiempos de almacenamiento (0, 20, 45, 55, 65, 70, 80, 100 das despus de la apertura). El grupo se form con cinco muestras de referencia creados con el fin de obtener un estancamiento preciso y repetible nivel (Cappuccio, Teixeira, y Teixeira, 2006). Los resultados de los Este experimento mostr que la evolucin de la nota rancio como una funcin del tiempo de almacenamiento sigue una tendencia sigmoidal. Este perfil aqu se asume como el ideal para la creacin delos escenarios simulados. Sobre esta base, 3.000 perfiles simulados fueron creados al azar: 1000 con una baja, 1000 y 1000 con medio con alta variabilidad en el asesor de juicios (Fig. 1). Para crear las distribuciones, las frecuencias de las puntuaciones han sido establecidas. Por ejemplo, en el caso de baja variabilidad (Fig. 1a), nos supone que los jueces ofrecen resultados muy homogneos, con un mximo de 1 punto de diferencia de la que se esperaba (en una escala 1e9), con la disminucin de la probabilidad. estas probabilidades sera 0,5 para la puntuacin esperada y 0,25 para la siguiente y los anteriores. En el caso de la variabilidad del medio (Fig. 1b), la probabilidades sern 0,0417, 0,0833, 0,2083, 0,3333, 0,2083, 0,0833, y 0,0417, respectivamente. A partir de estas distribuciones de probabilidad nmeros aleatorios han sido a continuacin se extrajo, siendo as capaz de realizar 1.000 tramas de datos por distribucin. La transformacin de los datos a escala de nueve puntos en los binarios (requerido mediante regresin logstica y modelos de supervivencia) se hizo considerar como inaceptable todas las muestras que recibieron una puntuacin ms alta que un valor de corte elegido, llamado aceptabilidad limitar. En este caso se seleccionaron dos puntos de corte diferentes, de acuerdo con los resultados anteriores (Guerra, 2005): 2 y 3 en la escala de nueve puntos, que corresponde a apenas perceptible'''' y '''' Perceptible en la escala de estancamiento. Por ltimo, sealamos que hemos generado (y por lo tanto tambin analizado) las puntuaciones como si fueran completamente independiente, sin tener en cuenta ningn efecto juez. Al analizar los datos reales, sin embargo, haciendo caso omiso de este efecto puede causar una subestimacin de los errores estndar de las estimaciones.

2.2. Anlisis de los datos La vida til se calcula para cada conjunto de datos simulados utilizando tres modelos diferentes: de regresin no lineal, regresin logstica y el anlisis de supervivencia basada en una distribucin de Weibull. Otro distribuciones, que se pueden encontrar en la literatura, como exponencial y log-normal (Gimnez et al., 2007), tienen a priori ha descartado, debido a la falta de sentido fsico. 2.2.1. Regresin no lineal Supusimos que el estancamiento (s) sigue un perfil sigmoidal como una funcin del logaritmo del tiempo de almacenamiento (t) y por lo que eligi un modelo de regresin sigmoidal:

Donde b y c son a estimar los parmetros de regresin y 1 y 8 vienen desde el lmite de la funcin de registro (t) cerca de 0 o N en una escala de nueve puntos. El logaritmo de tiempo era utilizado para evitar estimaciones negativas de la vida til. Valor de vida til se obtuvo considerando tres diferentes lmites de aceptabilidad: 2, 2.5 y 3.5 en los elegidos nueve puntos escala, una puntuacin de 2 significa que la nota de estancamiento es casi perceptible y una puntuacin de 3 significa que el estancamiento es Perceptible. 2.2.2. El anlisis de supervivencia En el anlisis de supervivencia, tiempo hasta el fracaso es una variable aleatoria, por lo tanto, y se caracteriza por una funcin de densidad acumulativa (cdf, dando la probabilidad de observar un valor de tiempo hasta el fracaso inferior o igual a t), o correspondientemente, por el llamado funcin de supervivencia (probabilidad de sobrevivir despus de un tiempo t). A partir de estos, tambin la funcin de densidad de probabilidad (pdf), la funcin de riesgo y la funcin de riesgo acumulativo pueden ser derivados (Lawless, 1982). Un modelo de supervivencia ampliamente utilizado es el modelo de Weibull, que se aplic en los datos simulados. La distribucin Weibull (Weibull, 1951) presenta una funcin de supervivencia caracterizada por dos constantes, el parmetro de forma (l) y el parmetro de escala (n) (Breyfogle, 1992).

Los parmetros fueron estimados por mxima similitud con mtodo. Valores de la vida de anaquel se obtuvieron utilizando tres diferentes valores cdf, 0,1, 0,3 y 0,5, lo que corresponde a un 10, 30 o 50% de probabilidad de observar un tiempo de fallo menor.

2.2.3. La regresin logstica Los estudios de modelos logsticos de la evolucin de la probabilidad de una muestra que est siendo juzgado inaceptable (p), como una funcin del logaritmo del tiempo de almacenamiento (t), como se indica en la siguiente ecuacin:

Donde a y b son los parmetros de regresin. El modelo se estim mediante registro (t) como variable explicativa. La vida til se define como el tiempo por el cual la probabilidad de valor inaceptable era igual a 0,1, 0,3 y 0,5. 2.3. resmenes de datos Los resultados de los anlisis de los conjuntos de datos simulados se resumieron por medio de la caja de parcelas (Tukey, 1970), una herramienta poderosa para mostrar las caractersticas de distribucin de una variable cuantitativa y compararlos entre diferentes grupos. Cada diagrama de caja se refiere a la vida til calculada mediante una especfica combinacin de mtodo de estimacin, de corte y la probabilidad nivel. Los extremos de la caja corresponden a la primera (bajo) y tercer cuartil (alta) de la distribucin de los resultados, la lnea en el cuadro indica la mediana. Los bigotes se extienden de los cuartiles de los valores observados bajo y ms alto. La posicin de la caja nos permite comparar la tendencia central de estimaciones mientras que la anchura de la caja y la longitud de los bigotes son informativos acerca de la variabilidad (cuanto mayor sea la cuadro, mayor ser la variabilidad). 2.4. Calculo computarizados Simulaciones y anlisis de datos se llevaron a cabo utilizando R (Venables, Smith, y el Equipo Central R el Desarrollo, 2007). 3. RESULTADOS Y DISCUSIN Los siguientes resultados y consideraciones proceden tanto de los una revisin de la literatura crtica y a partir del anlisis de los diferentes considera escenarios. 3.1. Los riesgos en la eleccin de la prueba Cuando se realiza una prueba de vida til, un enfoque de consumo o de expertos puede ser utilizado. En el caso de un panel de expertos, ya que se dijo antes, se evalan una o ms atributos sensoriales, suponiendo que la prediccin de la evolucin de tales atributos con el tiempo va a determinar la aceptabilidad del producto. Esta suposicin es todo menos sencillo, pero en el caso del caf puede ser vlida, ya que la nica variable sensorial relacionada con el tiempo, que posiblemente puede dar lugar a un rechazo es estancamiento. Por otro lado, el enfoque de los consumidores provoca varios problemas, como la inconsistencia de sus juicios (Hough et al., 2003), la variabilidad del resultado diferente cuando los consumidores se utilizan paneles (Gimnez et al., 2007) y de organizacin problemas para una empresa, ya que los consumidores no pueden evaluar ms de tres o cuatro muestras en una sola sesin.

3.2. Errores en la eleccin del modelo Conjuntos de datos sensoriales son generalmente incompleta, porque todo el observaciones se toman con un horario fijo y luego a veces falla no se puede observar con exactitud (Blischke y Murthy, 2000; Hough et al., 2003). El mecanismo que impide la observacin precisa de los tiempos hasta el fallo se llama censura. Si se descuida un sesgo en la estimacin de la vida til ser probablemente obtenida, sobre todo en caso de los experimentos diseados escalonados (Gacula, 1975). Con el fin de obtener una estimacin de la distribucin del tiempo de fracaso, mtodos no paramtricos o paramtrica se puede aplicar. Metodologas no paramtricas se utilizan con el fin de determinar funcin de la forma de la supervivencia (o riesgo) sin asumir cualquier distribucin particular (Lawless, 1982). Por ejemplo, la Tcnica KaplaneMeier estima el valor de la supervivencia la funcin en cada tiempo de muestreo, suponiendo un valor constante para la funcin de intervalos de tiempo inexplorados. Sin embargo, este tipo de anlisis no es til cuando todos los datos son censurados, y por lo que no es adecuado para el anlisis sensorial. La forma alternativa consiste en la aplicacin de paramtrica tcnicas, que permiten la obtencin de una caracterizacin especfica y una representacin paramtrica de todas las funciones que los describir la distribucin del tiempo de falla y se basan en la definicin de las constantes que son especficos de la adoptada modelo. Muchos modelos se han utilizado en la bibliografa, por ejemplo, exponencial, logartmica normal o Weibull. Exponencial y los modelos normales de registro no son adecuados para estudios de vida til porque en este contexto que carecen de significado fsico: de hecho la funcin de riesgo asociado a la antigua es constante a lo largo tiempo, mientras que en el segundo modelo que muestra un pico correspondiente a los primeros valores de la variable tiempo. Ambas formas son incompatibles con el envejecimiento de un producto alimenticio, ya que el Se espera que la funcin de riesgo para aumentar con el tiempo de almacenamiento (Gacula Y Kubala, 1975; Gacula y Singh, 1984). Esta es la razn por la Distribucin Weibull ha sido elegido para nuestra discusin. De las estimaciones de los parmetros basndose en los datos de supervivencia es posible para calcular los cuartiles de la distribucin del tiempo. La por lo que en la vida til estudia una probabilidad de aceptacin equivalente al 50% (es decir, el tiempo medio) se elige a menudo es que si el parmetro de forma es lo suficientemente grande, el pdf tiende a ser simtrica, y el percentil 50 coincide con la valor medio (Gacula y Kubala, 1975). Una opcin de suma importancia en la estimacin de los parmetros es la funcin de riesgo, ha habido una tendencia a utilizar el valor de riesgo h (t) (expresada en porcentaje) para cada tiempo de fallo de la expresin:

Donde k es el rango inverso asignado a cada tiempo de terminacin (fallo, as como censurado) (Gacula y Kubala, 1975). Desafortunadamente, este mtodo puede ser utilizado solamente cuando la ocurrencia de ms de un evento (fallo o retirada) en el mismo tiempo tiene una probabilidad insignificante. Adems, slo el derecho de censura los datos pueden ser manejados de esta manera. Por lo tanto, a pesar de que se encuentra en la literatura (Cardelli y Labuza, 2001;. Duyvesteyn et al, 2001), la aplicacin de esta estimacin de riesgo no es

adecuada para el anlisis de datos sensoriales. Esto no quiere decir que es de Weibull no es adecuado para la estimacin de la vida til, pero el problema de esta mtodo consiste en la necesidad de prestar atencin a la censura Definicin. Una definicin incorrecta de la censura conduce necesariamente a una prediccin de la vida til equivocado. Hoy en da, el uso de paquetes estadsticos modernos pueden resolver este problema, sin embargo, los investigadores tienen que ser conscientes de las consecuencias de todo posibles opciones. En los ltimos aos, ms sofisticada y adecuada tcnicas para la estimacin de parmetros, es decir, mxima verosimilitud (Kalbfleisch y Prentice, 1980; Lawless, 1982), fueron puesto a disposicin tambin para los practicantes por el desarrollo de software adecuado y fcil de usar. Teniendo en cuenta el anlisis de regresin no lineal, es importante subrayar que la eleccin de un modelo sigmoidal y de la ecuacin relativa es necesariamente arbitraria. Pero, puesto que la subyacente fenmeno fisicoqumico no es completamente conocido, el modelo que se elige arbitrariamente. En este caso, se eligi el modelo de acuerdo con las sugerencias de los la literatura (Breslin, 2001) y experimentaciones anteriores (Guerra, 2005). Es importante sealar que el modelo se aplic a todos los los datos. La aplicacin del anlisis de regresin en la valores de la mediana (o en los medios), aunque generalizadas, es correctos, ya que causa una subestimacin de la variabilidad. De hecho, si un valor nico sustituye 12 observaciones en cada tiempo de muestreo, la variabilidad cae necesariamente hacia abajo. Por lo tanto, la forma ms correcta para la aplicacin de un modelo de regresin no lineal es para trabajar en todas las puntuaciones. La ventaja de regresin no-lineal es que no es necesario para transformar los datos en una forma binaria. De hecho, el modelo es no se basa en los valores de probabilidad, sino de las puntuaciones otorgadas por los jueces. Por lo tanto, este mtodo funciona como una calibracin, en observaciones de hechos se toman en momentos bien definidos con el fin de determinar cmo el perfil de las puntuaciones evoluciona con el tiempo. Entonces, dada una puntuacin, se puede volver al correspondiente tiempo. Por desgracia, este mtodo produce una lgica problema, ya que el tiempo se considera como variable explicativa, mientras que en realidad el tiempo es la variable que tiene que ser estimado. Otro problema a ser enfrentado con precaucin es la eleccin del lmite de aceptabilidad. Este valor se calcula a menudo como la media de una serie de evaluaciones de aceptabilidad determinado en la norma muestras que se caracterizan por una intensidad conocida de el atributo sensorial. As que es posible (como sucedi en este especfico caso) que el lmite elegido no es un nmero entero. En de esta manera las puntuaciones se consideran como una variable continua, incluso si no lo son. Este problema conceptual se puede superar de trabajo en las puntuaciones de binarios y en probabilidades. Finalmente, un comentario se debe hacer en la naturaleza del tiempo variable. Se aplic la regresin no lineal y los modelos logsticos mediante una forma logartmica del variable tiempo. Recomendamos a trabajar en la segunda forma, ya que el uso de veces no logartmicas puede dar lugar a valores de vida til negativos, especialmente en el caso de datos de alta variabilidad.

3.3. La variabilidad debido a la eleccin del lmite de corte o el ruido en los datos En la Tabla 1 y en las figuras. Se dan los resultados para los tres 2E4 modelos considerados, los escenarios y cut-offs (aceptabilidad lmites). Tabla 1 nos permite notar algunas tendencias claras. No lineal regresin parece ser afectada por el cambio en los parmetros, regresin logstica y modelos Weibull dan muy similar predicciones, tanto en trminos de valor medio y de la variabilidad de estimaciones. Una comparacin entre estos modelos y no lineales regresin es bastante difcil porque regresin no-lineal es no se basa en los valores de probabilidad. La comparacin entre logstica El anlisis de regresin y la supervivencia pone en evidencia que el eleccin del modelo no afecta al resultado final, cuando el se establecen otros parmetros: las diferencias son pequeas en comparacin con la variabilidad del muestreo, siempre dentro de la dispersin. Tambin la variabilidad de los datos (es decir el grado de diferencia en el juicio de los evaluadores) no afecta considerablemente el resultado, y depende del valor de la probabilidad de inaceptable. Un alto nivel de probabilidad (0.5) da lugar a diferencias dentro del 20% para los dos modelos, mientras que una baja probabilidad nivel (0.1) da lugar a diferencias de vida til de 50% al comparar un panel con baja y alta variabilidad. De todos modos, la ventaja de trabajar con un panel entrenado conduce a la posibilidad de la obtencin de datos afectados por la disminucin de la variabilidad, y por lo tanto predicciones de vida til ms precisos. La variabilidad de datos afecta estante estimaciones de duracin no slo en trminos de precisin (anchura del diagrama de caja), sino tambin en trminos de precisin (posicin del centro de la caja): de hecho, a medida que aumenta la variabilidad, las estimaciones del tiempo de almacenamiento tienden a disminuir. En el caso de los estudios de consumo, la comisin debe ser cuidadosamente reclutado en relacin con el tipo de producto, y grandes lo suficiente para permitir un anlisis de datos correcto incluso en caso de eliminacin de parte del panel debido a la falta de consistencia. En cuanto al valor de la probabilidad de inaceptabilidad, la literatura nos dice que el tiempo medio es elegido con mayor frecuencia. Eso significa que si 100 elementos se almacenan por un perodo de tiempo igual a la vida til, esperamos que 50 de ellos ya tienen fracasaron en ese perodo y 50 estn an sobreviven. La eleccin de los este nivel es arbitraria, y la estimacin de la vida til est fuertemente influenciada por ella. As que es muy importante para evaluar y justificar cada eleccin. Tabla 1 sugiere que la eleccin de la probabilidad nivel puede fcilmente afectar el valor final en un 20% (por ejemplo, 23 y 27 das en caso de regresin logstica con baja variabilidad de datos, el valor de corte de 2 y compararon los niveles de probabilidad de 0,3 y 0.5). Las diferencias son considerables para la baja de corte lmites, llegando a 100% para el modelo de Weibull (por ejemplo, 15 y 31 da en caso de modelo de Weibull con la variabilidad de datos bajas, de corte valor de 2 y la comparacin de los niveles de probabilidad de 0.1 y 0.5). Por ltimo, la eleccin del lmite de aceptabilidad afecta el resultado dramticamente. A diferencia de slo 1 punto en un punto de nueve escala (2 o 3 en nuestro caso), puede conducir a resultados finales que difieren por 160% en el caso de bajo nivel de probabilidad, independientemente de la mtodo. Esa es una diferencia de ms de 20 das (16 y 42 das en caso de regresin logstica, 15 y 40 das en caso de anlisis de supervivencia) para la estimacin del mismo producto.

Podemos concluir que en el caso de la utilizacin de un panel entrenado, la variabilidad de los evaluadores "juicios puede ser manejado, mientras que la eleccin del valor de corte por el investigador o el empresa puede cambiar el resultado en un 160%. Tambin la eleccin de los el nivel de probabilidad es crucial, y es necesaria esta eleccin tanto en el caso de un panel entrenado o una prueba de consumidores.

CONCLUSIONES PERSONALES En sntesis el artculo nos deja claro que existen varios mtodos para estimar la vida til de productos alimenticios mirando las caractersticas del producto. Basndose en antecedentes de estudio realizados al mismo producto. Como consecuencia en el caso de este artculo la metodologa utilizada para mirar la vida en anaquel del caf almacenado nos arroja unos resultados positivos con un mtodo paneles entrenados, y eleccin de corte cambia los resultados. Con respecto a este estudio lo podemos mirar desde un punto de vista que el caf tiene mucho forma de ayar la vida til pues este estudio fue una forma arbitraria de medir pero efectiva on que siguiendo una frecuencia lgica dela toma de anlisis sensorial con ayuda de herramienta estadstica y software que facilitaron el proceso para analizar la vida en anaquel del caf almacenado. Otra parte vemos que ellos mismo vea que cometan un error por Conjuntos de datos sensoriales son generalmente incompleta, porque todo el observaciones se toman con un horario fijo y luego a veces falla no se puede observar con exactitud por este mtodo por eso ella utilizaban funcin de supervivencia.