Está en la página 1de 11

UNA APLICACIÓN DEL ANÁLISIS DE REGRESIÓN NO LINEAL PARA

DATOS DE CIENCIA ALIMENTARIA CON MICROSOFT EXCEL SOLVER


Resumen: El objetivo de este trabajo fue introducir un método simple, rápido, robusto,
confiable y procedimiento fácilmente explicable para realizar análisis de regresión no lineal
basado en la entrada del usuario funciones El método descrito aquí es usar la función SOLVER
en la hoja de cálculo programa Microsoft Excel, que emplea un protocolo iterativo de ajuste de
mínimos cuadrados para producir la bondad óptima de ajuste a los datos experimentales. Los
datos que se utilizarán como ejemplo es en el área de ciencias de la alimentación.
INTRODUCTION
La práctica de aplicar técnicas de ajuste de curvas para describir datos experimentales es
ampliamente utilizado en todos los campos de investigación, particularmente en la ciencia de
los alimentos. El propósito del ajuste de la curva.
en ciencia de los alimentos, los datos son para describir datos en la forma universalmente
reconocida y = f (x), donde y es la variable dependiente y se mide en el experimento, y x se
controla durante el experimento que se llama variable independiente (Bowen, 1995). La
relación entre x e y se describe mediante una función f que está en forma de una ecuación que
contiene uno o más parámetros Cuanto mejor se ajusta, más precisa es la función que describe
los datos. Solicitud de ajuste lineal a datos experimentales es un método relativamente
sencillo y puede ser ejecutado con unos simples comandos de apuntar y hacer clic. Sin
embargo, describir datos con funciones no lineales (regresión no lineal) es más problemático.
Esto se puede realizar usando softwares informáticos especializados como Sigma Plot,
MATLAB, Minitab y otros. Sin embargo,
Estos softwares tienden a ser caros y contienen un exceso de características innecesarias. Es
solo adecuado para usuarios experimentados con conocimientos matemáticos y no es
aplicable para un usuario novato para aprender. Aparte de eso, estos softwares no pueden
manipular los datos muy bien y tienden a mostrar datos, gráficos, resultados y análisis en
múltiples ventanas que pueden ser confusos al usuario
Microsoft Excel es un programa alternativo para adaptarse a funciones no lineales. Este
software es parte del paquete de Microsoft Office y, por lo tanto, no se requieren gastos
adicionales. Tiene una interfaz fácil de usar con buenas capacidades de manejo de datos,
función matemática incorporada y gráficos instantáneos Incluso contiene la función SOLVER,
que es ideal para ajustar datos con funciones no lineales a través de un algoritmo iterativo
(Bowen, 1995).
El objetivo de este trabajo es llevar a cabo un análisis de regresión no lineal de datos científicos
con funciones de entrada del usuario utilizando la función SOLVER de Microsoft Excel. Los
datos a utilizar son isoterma de sorción de un alimento.
La isoterma de sorción de un alimento es una curva en la que el contenido de agua en
equilibrio (Xeq) (kg el agua por kg de sólido seco) de un material alimenticio se representa en
función de la actividad del agua (aw) en un dada la temperatura constante. Tanto aw como
Xeq se determinarán cuando el sistema tenga alcanzó el equilibrio (Chen y Mujumdar, 2008).
Las isotermas de sorción de agua ilustran la cantidad en estado estacionario de agua retenida
(es decir, capacidad de retención de agua) por los alimentos en función de aw o humedad
relativa a temperatura constante (Barbosa-Cánovas, 2007). El conocimiento y la comprensión
de las isotermas de sorción del material alimentario es muy importante en la ciencia de los
alimentos para diseño y optimización de aparatos de secado, diseño de material de embalaje,
predicción de estabilidad o vida útil y para determinar los cambios de humedad que pueden
ocurrir durante el almacenamiento de productos alimenticios. Las isotermas de sorción de la
mayoría de los materiales alimenticios son no lineales y generalmente forma sigmoidea Cada
material alimenticio muestra un tipo diferente de isoterma de sorción y se basa sobre la
composición química y el estado fisicoquímico de los componentes de los alimentos.
Brunaueret al. (1940) y Chen y Mujumdar (2008) describieron cinco tipos de isotermas según
sus forma y procesos, como se muestra en la Figura 1

Figura 1: Forma general de las isotermas observadas en los materiales alimenticios.


(Chen y Mujumdar, 2008, pág. 76)
Se han desarrollado varios modelos matemáticos para describir las isotermas de sorción. por
predicción y ajuste de datos de isotermas de sorción de alimentos, algunas de las ecuaciones
semiempíricas con dos o tres parámetros de ajuste como BET, GAB y Oswin son los más
utilizados. En este trabajo, los datos de la isoterma de sorción del chip de plátano a 25 ° C de
Kim (2014) como se muestra en La Tabla 1 se utilizará para el análisis de regresión no lineal.
Tabla 1: Datos de isoterma de sorción del chip de plátano (Kim, 2014, p. 16)
METHOD
Para realizar un protocolo de ajuste de curvas en una hoja de cálculo de Excel, el método
descrito en este trabajo se realizó en una computadora portátil Microsoft Pentium i5 y Excel
2013. El método implica ingreso manual de datos y gráficos de datos, seguido de ajuste de
curvas y visualización del resultado curva ajustada a los datos. La bondad del ajuste se puede
evaluar calculando R2 valor. El R2 el valor se llama coeficiente de determinación y su valor
representa la fracción de la varianza general de la variable dependiente que se explica por la
variable independiente (Bowen, 1995).
Tradicionalmente, los datos no lineales podrían cambiarse a una forma lineal y luego analizarse
por regresión lineal. Esta transformación tiende a dar análisis inexactos ya que el lineal
La regresión se realizó en datos transformados, que también pueden cambiar el error
experimental. Este método está desactualizado y ya no debe usarse. Uno de los métodos
adecuados para el análisis de datos no lineales se denomina ajuste iterativo de mínimos
cuadrados no lineales. Este método usa el mismo objetivo explicado para la regresión lineal,
que es minimizar la suma al cuadrado (SS) valor de la diferencia entre los datos experimentales
y el ajuste. El detalle sobre las SS Billo (2011) explica el valor. Es un método iterativo o cíclico
que es diferente de el método de regresión lineal. En este método, el usuario debe
proporcionar una estimación inicial de parámetro. El primer paso de iteración calcula un valor
SS inicial basado en el valor inicial dado por el usuario. El segundo paso de iteración cambia el
valor del parámetro en una pequeña cantidad y recalcula el valor de SS. Este paso de
procesamiento se repite muchas veces para asegurarse de que los cambios en los valores de
los parámetros dan el valor más pequeño posible de SS. Función SOLVER en Excel utiliza el
método de programación de iteración de gradiente reducido generalizado (GRG). UNA Smith
describe una descripción detallada de la evolución e implementación de este código y Lasdon
(1992).
El siguiente ejemplo ilustra cómo usar la función SOLVER en Excel para ajustar los datos de
isoterma de sorción como en la Tabla 1 con funciones no lineales de entrada del usuario. En
este ejemplo Ecuación de isoterma de sorción de Oswin como en la ecuación. 1 se usa para
ajustar los datos. La ecuación describe contenido de humedad de equilibrio de un material
(alimento) a cierta humedad relativa o agua actividad. El modelo de Oswin se muestra a
continuación (Chen y Mujumdar, 2008):

donde Xeq es el contenido de humedad de equilibrio (variable dependiente), aw es la actividad


del agua (variable independiente) y k y n son los parámetros de ajuste, que se determinarán.
Para realizar un análisis de regresión no lineal utilizando la ecuación de Oswin, lo siguiente los
procedimientos se llevan a cabo:
1. Inserte en una hoja de cálculo los datos experimentales en dos columnas, la columna C
contiene la variable independiente (aw) y la columna D que contiene la variable
dependiente (Xeq). Esto es ilustrado en la figura 2.
2. 2. Graficar los datos insertados contenidos en las celdas C25 a D33 en un diagrama de
dispersión. Los datos los puntos se muestran como cuadrados rellenos.
3. Ingrese etiquetas en las celdas I25 a I32 para describir el contenido de las celdas
adyacentes. En la celda I25 ingrese k, que describirá el parámetro en la celda J25. Al
seleccionar las celdas I25 y J25 seleccione FORMULAS en el menú superior y en el
Administrador de nombres haga clic en "Crear nombres a partir de Selección".
Aparecerá un pequeño diálogo de ventana y marque la opción "Columna izquierda".
Esta voluntad asigne el nombre en la celda I25 a la celda J25. Del mismo modo, para
las celdas I26 a I32 ingrese n, media de y, df, SE de y, R2, T crítico y CI respectivamente.
Para asignar los nombres en las celdas J26 a J32, repita el mismo procedimiento que el
explicado para la celda J25.
4. Ingrese el valor de estimación inicial de los parámetros k y n en las celdas J25 y J26,
respectivamente. En este ejemplo, las estimaciones iniciales son 0.1 y 0.2,
respectivamente.
5. En la columna E (Xeq, ajuste) ingrese la ecuación que describe la función de Oswin.
Esto ha sido reorganizado de la ecuación. 1 en un formulario que Excel reconoce:
= k * (C26 / (1-C26)) ^ n, donde k y n se refieren a los valores de los parámetros en las
celdas J25 y J26.
6. Copie la ecuación de la celda E27 a E33. Tenga en cuenta que C26 es un pariente
referencia, que especifica la ubicación de una celda en relación con la celda en la que
se realiza el cálculo se llevará a cabo, en este caso, la celda E26. Copiar así de las filas
25 a 33, cambia el valor de C26 para reflejar la fila apropiada.
7. Para calcular el valor medio de la y, ingrese la siguiente fórmula en J27.
= PROMEDIO (D26: D33)
8. Los grados de libertad se calculan ingresando la siguiente fórmula en J28. Es definido como
el número de puntos de datos menos el número de parámetros en las funciones.
= CONTEO (D26: D33) CONTEO (J25: J26)
9.El error estándar de los valores y se define como (Billo, 2011)

y se calcula ingresando la siguiente fórmula en J29.


= SQRT (SUMA ((D26: D33-E26: E33) ^ 2) / df) fit=ajuste
Sin embargo, como esta fórmula debe expresarse como una fórmula de matriz, presione Ctrl +
Shift + Enter. Esto encierra toda la fórmula dentro de un par de llaves ({}), denotándolo como
una matriz fórmula.
10. El R2 el valor se calcula ingresando la siguiente fórmula en J30 y expresándola
como una fórmula de matriz como se describió anteriormente.
= 1-SUMA ((D26: D33-E26: E33) ^ 2) / SUMA ((D26: D33-Mean_of_y) ^ 2)
11. Para determinar el intervalo de confianza del ajuste, el valor t crítico en un significado
El nivel 95% se calcula ingresando la siguiente fórmula en J31. = TINV (0.05, df)
El intervalo de confianza (CI) se define en J32.
= Critical_t * SE_of_y
Ingrese la siguiente fórmula en F26
= E26 + Cl
y copiarlo a F33. Del mismo modo ingrese
= E26-Cl
En G26 y copiar a G33. Esto dará los valores límite de confianza superior e inferior de
el ajuste.
12. El SE de los valores y, R2
 y CI se calculan automáticamente: 0.052, 0.458 y
0,128, respectivamente.
13. La Figura 2 muestra la plantilla de hoja de cálculo con las fórmulas utilizadas en este
procedimiento.
el gráfico de las columnas E, F y G frente a la columna C de modo que se muestren como líneas
en el
gráfico como se muestra en la Figura 3. Se ve claramente que los valores iniciales de
estimación (línea gruesa) son
No es un buen ajuste de los datos con grandes límites de confianza (líneas finas).
14. Abra la función SOLVER, que se puede encontrar en el menú Datos. El diálogo
aparece el cuadro ilustrado en la Figura 5. Si SOLVER no está en este menú, debe instalarse.
Consulte la documentación de Excel para el procedimiento de instalación.
15. En el cuadro “Establecer celda objetivo” ingrese J30
16. Establezca la opción "Igual a" en "Máx.". Esto significa que SOLVER intenta calcular el
valores máximos de R2
.
17. En el cuadro “Al cambiar las celdas” ingrese J25: J26. Esto significa que SOLVER intenta
cambiar el
valores de k y n hasta obtener el valor máximo de R2
 (R2
 expresa la proporción de
varianza en la variable dependiente explicada por la variable independiente. La correlación
índice de 0 significa que x no ayuda a predecir y. Como el R2
el valor aumenta hacia 1 el más exactamente la función se ajusta a los datos).
Figura 2. Plantilla de hoja de cálculo para regresión no lineal: las fechas se ingresan en la
columna
C y D solían generar el ajuste basado en los parámetros en las celdas J25 y J26. Columna F y
G calcule el intervalo de confianza del 95% alrededor del ajuste.
18. La opción "Sujeto a restricciones" puede dejarse vacía. Las restricciones están
acostumbradas a imponer límites sobre los valores de rango utilizados para definir los
parámetros. Si, por ejemplo, el valor de el parámetro k está por debajo de 10, luego se puede
definir en esta opción haciendo clic en el botón Agregar y insertando "k <10" en el cuadro.
19. Haga clic en "Resolver" para realizar el ajuste. El SOLVER recorrerá iterativamente el
rutina de ajuste, ajustando los valores de los parámetros de k y n para maximizar el valor de R2
. los los valores óptimos de k y n son 0.055 y 0.675, respectivamente, y el valor máximo de R2
  Es 0.993.La línea gruesa de la figura 4 muestra el mejor ajuste y está claro que es una mejora
sobre El ajuste proporcionado por los valores de los parámetros iniciales. Además los
intervalos de confianza (delgada líneas) alrededor del ajuste se han reducido. Entonces la
ecuación final es

20. Este procedimiento puede repetirse con diferentes valores iniciales de k y n para ver si
SOLVER encuentra la misma solución. La configuración predeterminada de SOLVER se puede
cambiar haciendo clic en "Opciones" y en "Solver
Aparecerá el cuadro de diálogo "Opciones". Cada opción tiene una configuración
predeterminada que es apropiada para La mayoría de las situaciones, pero se puede cambiar.
Esta opción está diseñada solo para usuarios experimentados y por lo tanto no será discutido
en este documento. Tenga en cuenta que se calcula el error estándar de los datos alrededor de
la línea de regresión, que también es conocido como el error estándar de los residuos. En el
procedimiento anterior, el error estándar del los residuos se usan para calcular el intervalo de
confianza. El intervalo de confianza es un indicador de La probabilidad de que el valor
verdadero se encuentre dentro del rango especificado por la fórmula de probabilidad
(Bowen, 1995). El valor común del intervalo de confianza es del 95%, lo que significa que hay
a95% de probabilidad de que el valor verdadero se encuentre dentro del intervalo. Para
calcular la confianza
intervalo el valor t crítico debe determinarse y depende de los grados de libertad.
Microsoft Excel tiene una función incorporada (tinv) para determinar el valor t crítico y la
entrada
fórmula en la celda J31 calcula este valor para el intervalo de confianza deseado y grados de
libertad.

Figura 3: Ajuste de Oswin de los datos de isotermas de sorción basados en las estimaciones
iniciales de los parámetros (espesor línea) y el intervalo de confianza del 95% (línea delgada)
alrededor del ajuste.
Figura 4: Ajuste de Oswin de los datos de isoterma de sorción calculados por el SOLVER.
conclusión
requerir que el usuario comprenda las matemáticas detrás de los procesos involucrados en el
ajuste de curvas
técnica. Sin embargo, es importante que el usuario entienda lo suficiente sobre los datos
ajustado, utiliza el tipo correcto de análisis y puede juzgar la bondad del ajuste a partir de los
resultados. En esto
En el documento, el modelo de Oswin se aplica a los datos de la isoterma de sorción y el
resultado se muestra en la ecuación.
3)
El valor R2 calculado en este documento se evalúa para dar la bondad de la función a
los datos. Suponga que se utiliza una determinada función para describir los datos, la precisión
de
La función describe o se adapta a los datos que se pueden determinar en función del R2
 valor. en este papel
el R2
 el valor fue 0.993, lo que significa que el 99.3% de la variación de la variable independiente
puede explicarse por la variación de la variable dependiente.
Aunque esta técnica se considera robusta y confiable, algunos puntos deberían ser
tomado en consideración. Primero, cuando el número de parámetros en una función es mayor,
SOLVER llevará más tiempo encontrar los valores óptimos. Segundo parámetro inicial
los valores deben ser razonables y si son inapropiados, el proceso de iteración puede conducir
a
dirección incorrecta y la solución nunca se puede encontrar.

También podría gustarte