Está en la página 1de 4

Modelo de Regresión Lineal y modelo de Superficies de Respuestas

Un análisis de regresión es la herramienta más utilizada en la estadística, ya que permite


investigar las relaciones entre las variables cuantitativas. El modelo de regresión lineal nos
dice que, trata de explica la relación que hay entre la variable de respuesta y la variable
explicativa. Las observaciones de Y pueden ser pueden ser descritas por el siguiente
modelo:
Y = β0 + β 1 X +ε

En este modelo se está admitiendo que todos los factores y/o causas que están influyendo
en la variable respuesta (Y) pueden ser divididos en dos grupos: en el primero contiene una
variable explicativa (X) y el segundo incluye un conjunto amplio de factores no controlados
que reciben el nombre de perturbación o error aleatorio, ε es quien provoca la dependencia
entre las variables dependiente e iii es independiente y no es perfecta, pero se encuentra
ligada a la incertidumbre. La variable ε  recibe el nombre de error, y en ella van todos
aquellos factores que pueden influir a la hora de explicar el comportamiento de la variable  Yi
que, sin embargo, no están reflejados en las variables explicativas, Xi. Cuando es hora de
estimar los parámetros del modelo, será de suma importancia que el ε no se encuentre
ejerciendo alguna influencia sobre la variable dependiente. El valor esperado del error es
cero, y cuando tenemos el valor esperado de la variable Y sobre la variable X podemos ver
está dado por la siguiente fórmula:
E ( YIX )= β0 + β 1 X

En donde β 0 y β 1representan los parámetros del modelo, y sus valores son desconocidos. Si
se desea especificar correctamente la ecuación que relaciona las dos variables es necesario
realizar la estimación de estos dos parámetros, en donde β 0 es el punto en el cual la línea
recta intercepta en el eje y, β 1 es la pendiente de la línea, es decir, es la cantidad en que se
incrementa o disminuye la variable Y por cada unidad que se incrementa X. un procedimiento
que nos permite ajustar la pendiente de la recta y estimar los valores de estos parámetros es
método de mínimos cuadrados cuya ecuación es la siguiente:
n n
S=∑ (ε i)2=∑ ( y i−[ β0 + β 1 X i ])2
i=1 i=1

Con esta fórmula es posible estimar los valores de los parámetros, y también se consigue
que el error de los cuadrados sea mínimo. Un aspecto que es importante resaltar es que los
estimadores β 0 y β 1son variables aleatorias, ya que dependen de los valores observados, y i.
De esta manera, es posible evaluar el valor esperado y la varianza de los estimadores. Sin
embargo, es esencial evaluar que tan buena es la interpretación de la línea recta con
respecto X y Y. Esto puede ser analizado probando las hipótesis, pero primero nuestro erro
tiene que tener las siguientes condiciones: el error debe ser igual a 0, el error cometido en un
momento determinado (i), no debe estar correlacionado con el error cometido en otro
momento del tiempo, j, es decir, que, los errores no ejercen influencia unos sobre otros. Si
ese fuera el caso, que existiera este tipo de influencia o correlación, nos encontraríamos ante
el problema de la autocorrelación en los residuos, el cual impide realizar una estimación por
Mínimos Cuadrados válida. Estas hipótesis implican que los errores siguen una distribución
Normal de media cero y varianza constante por lo que, dado su carácter aleatorio, hace
que los errores sean por naturaleza impredecibles. Hipótesis:
H o =βi =0

H A =β i ≠ 0

Mientras que el modelo de superficies de respuestas es un modelo matemático y estadístico


utilizados para el análisis de problemas de aquellas variables de interés que logran tener
efecto sobre otras. El propósito inicial de estas técnicas es diseñar un experimento que
proporcione valores razonables de la variable respuesta y, a continuación, determinar el
modelo matemático que mejor se ajusta a los datos obtenidos. El objetivo final es establecer
los valores de los factores que optimizan el valor de la variable respuesta. La metodología del
diseño de superficie de respuesta se utiliza con frecuencia para refinar los modelos después
de haber determinado los factores importantes utilizando diseños de cribado o diseños
factoriales, especialmente si se sospecha que existe curvatura en la superficie de respuesta.

En estadística, la metodología de superficie de respuesta (RSM) explora las relaciones entre


varias variables explicativas y una o más variables de respuesta. El método fue presentado
por George Box y K. B. Wilson en 1951. La idea principal de RSM es utilizar una secuencia
de experimentos diseñados para obtener una respuesta óptima. Box y Wilson sugieren usar
un modelo de polinomio de segundo grado para hacer esto. Reconocen que este modelo es
solo una aproximación, pero lo usan porque es fácil de estimar y aplicar, incluso cuando se
sabe poco sobre el proceso.

Los enfoques estadísticos como el RSM pueden emplearse para maximizar la producción de
una sustancia especial mediante la optimización de los factores operativos. A diferencia de
los métodos convencionales, la interacción entre las variables del proceso puede
determinarse mediante técnicas estadísticas. Esta metodología requiere de tres “factores”: el
modelo, diseño y técnica de optimización. En el diseño nos habla que, para poder optimizar
un proceso es necesario aplicar el diseño de experimentos, aquellos que nos sirvan para
ajustar un modelo de regresión lineal múltiple, el aspecto del modelo, requiere el uso de
análisis de regresión lineal múltiples, y este conformado con sus aspectos básicos, es decir,
con sus parámetros de los modelos, modelo ajustado, significancia del modelo, prueba de
falta de ajuste, residuos, predichos, intervalos de confianza para predichos y coeficiente de
determinación. El aspecto de optimización se conforma por técnicas matemáticas, como lo
son, las derivadas, Lagrange, Matrices, valores y vectores propios y sistemas de ecuaciones
simultáneas. Los diseños de superficie de respuesta se clasifican con base en el grado del
modelo que se pretende utilizar. Estos diseños proporcionan los tratamientos a correr para
generar datos que permitan ajustar un modelo que describa una variable de respuesta en
una región experimental. El diseño debe permitir que otros diseños de orden mayor se
construyan a partir de él. Esto permite que, cuando el comportamiento de la respuesta
resulta ser más complicado de lo que se pensaba, se agregan puntos adicionales al diseño
para tratar de explicar ese comportamiento. La diferencia entre RSM y un diseño
experimental radica en que un diseño experimental por si solo tiene como objetivo localizar el
tratamiento “ganador” entre todos aquellos que se han probado. En cambio, RSM pretende
localizar las condiciones óptimas de operación del proceso. Ello supone un reto para el
investigador, requiere una estrategia más completa e incluye la posibilidad de efectuar varios
experimentos secuenciales y el uso de técnicas matemáticas más avanzadas. Una de las
aplicaciones más ampliamente extendidas de estas técnicas es la de modelar y analizar
problemas en los cuales una respuesta de interés (pudiendo ser más de una) viene
influenciada por varios factores de carácter cuantitativo siendo el objetivo el de optimizar
dicha respuesta determinando los valores óptimos de los factores implicados. En la situación
en la que nos encontremos relativamente próximos al óptimo, será necesario incorporar
curvatura al modelo para aproximarlo a la respuesta a predecir. Considerar el efecto que
sobre más de una variable respuesta tienen factores implica obtener un modelo de superficie
de respuesta adecuado para cada una de ellas, para así tratar de encontrar el conjunto de
condiciones que optimizan todas las respuestas o las mantiene en un determinado rango.
Para estimar los parámetros del modelo de manera efectiva, debemos aplicar un diseño
experimental apropiado para recopilar los datos necesarios. Algunas de las características
más importantes de un buen diseño son: Que permite estudiar la adecuación del modelo
(falta de ajuste), también nos proporciona estimadores precisos de los coeficientes del
modelo y proporciona una estimación interna del error, nos permite realizar experimentos
en bloques y no requiere de demasiados niveles de las variables independientes. Los
diseños de superficie de respuesta se construyen en Statgraphics con la secuencia Special, y
es aquí donde radica la diferencia entre estos dos métodos, que el método regresión lineal
puede hacerse manualmente y en software, pero en el método de regresión lineal, se debe
obtener las hipótesis, es decir, que, se sigue recurriendo al cuadro ANOVA mientras que el
método de superficie de respuesta sólo necesita los valores del método de regresión
múltiple, es exclusivo para el múltiple y no para el simple, ya que el simple sólo es para
pendientes. La metodología de superficie de respuesta usa modelos estadísticos, y por lo
tanto, los profesionales deben ser conscientes de que incluso el mejor modelo estadístico es
una aproximación a la realidad. En la práctica, tanto los modelos como los valores de los
parámetros son desconocidos y están sujetos a la incertidumbre además de la ignorancia.
Por supuesto, un punto óptimo estimado no necesita ser óptimo en realidad, debido a los
errores de las estimaciones y de las insuficiencias del modelo .El MSR debe permitir la
detección de la falta de ajuste, para lo cual se requieren repeticiones al menos en el centro
del diseño. El diseño debe proporcionar un estimador puro de la varianza del error, lo cual se
logra con repeticiones al menos en el punto central. De igual forma, debe generar una
distribución satisfactoria de los puntos experimentales sobre la región experimental.

También podría gustarte