Está en la página 1de 10

MODELOS DE REGRESIN LINEALES Y NO LINEALES: SU

APLICACIN EN PROBLEMAS DE INGENIERA 1


Claudia Minnaard Facultad de Ingeniera. Universidad Nacional de Lomas de Zamora Universidad CAECE Buenos Aires. Argentina. minnaard@uolsinectis.com.ar RESUMEN Habitualmente el tratamiento de la regresin se limita al caso lineal. En muchos casos esto puede ser suficiente pero en otros no. Ser necesario probar la linealidad de la curva de regresin, dicha prueba se puede obtener por el mtodo de anlisis de la variancia. En el presente trabajo se describe la aplicacin de modelos lineales y no lineales en problemas de ingeniera, utilizando el software XLStat. Asimismo se describe el intervalo de confianza para el coeficiente de regresin en el modelo lineal, para la ordenada al origen y para la imagen a travs de la recta. En el caso de los modelos no lineales se prueba la bondad del ajuste realizado a travs de las pruebas especficas. La correcta eleccin de un modelo adecuado, que describa los datos en problemas de ingeniera, proporciona elementos de juicio suficientes para la toma de decisiones en condiciones de incertidumbre. Palabras clave: regresin lineal, regresin no lineal, mejor ajuste, mtodo de mnimos cuadrados

INTRODUCCIN En el anlisis de regresin2 una de las dos variables, que llamamos X, puede considerarse como variable ordinaria, es decir se puede medir sin error apreciable. La otra variable Y, es una variable aleatoria. A X se la llama variable independiente (algunas veces variable controlada) y nuestro inters es la dependencia de Y en trminos de X. Supongamos que en cierto experimento aleatorio tratamos de manera simultnea dos variables, una variable ordinaria X y una variable aleatoria Y. Efectuamos el experimento de tal manera que
Trabajo aceptado para ser presentado en forma oral en el IICaim Segundo Congreso Argentino de Ingeniera Mecnica. San Juan, Argentina. Noviembre 2010 2 Este trmino lo sugiri la observacin de Galton que en promedio los hijos de padres altos no son tan altos como sus padres y los hijos de padres bajos no son tan bajos como sus padres, as que existe la tendencia a regresar hacia la media. El trmino correlacin fue tambin propuesto por Galton (Proceedingd of the Royal Society of London, 45, 1888). En: http://rspl.royalsocietypublishing.org/content/by/year/1888
1

20

seleccionamos primero n valores x1, x2,......... ...., xn de X y luego para cada

x j obtenemos un valor

observado y j de Y. Entonces, tenemos una muestra de n parejas de valores:

(x1, y1),(x2 , y2 ),........ .......... .,(xn , yn )


Podemos graficar las n parejas como puntos del plano. Nuestro objetivo es hallar alguna funcin que describa aproximadamente el diagrama de puntos anterior, en el rango considerado de la variable X. A tal efecto en primer lugar elegimos una clase de funciones de donde seleccionaremos alguna funcin apropiada. Las clases de funciones ms utilizadas son las siguientes: i) Polinomiales a) Lineales

f ( x, a ) = a 0 + a1 x
b) Cuadrticas

a = (a 0 , a1 ) a = (a 0 , a1 , a 2 )

f (a, x) = a 0 + a1 x + a1 x 2
c) En general de grado menor o igual a m

f (a, x) = a 0 + a1 x + a 2 x 2 + ......... + a m x m a = (a 0 , a1 , a 2 ,..........., a m )


ii) Potenciales

f ( x, a ) = a 0 .x a1
iii) Exponenciales

a = (a 0 , a1 ) a = (a 0 , a1 )

f ( x, a ) = a 0 .(a1 ) x
iv) Logartmicas

f ( x, a ) = a 0 + a1 ln x

a = (a 0 , a1 )

21

Ya elegida la clase de funciones C = { f ( x, a ) / a A } nos falta determinar en la misma alguna que describa los valores dados. Para realizar tal propsito necesitamos un criterio, utilizaremos aqu el llamado mtodo de mnimos cuadrados. Diversos autores (Sotomayor et al. (2002); Mendenhall et al. (2004), Garca (2004), Montgomery el al. (2002)) describen el mtodo.
n

Sea f ( x, a ) una funcin cualquiera de la clase C . Graficando:(Grfico 1)

Grfico 1

Tenemos que para cada valor de i = 1,2, ,n observado y el obtenido a travs de la funcin

el error es la diferencia entre el valor

i = Yi f ( xi , a)
n n

Definimos la funcin S que en cada vector vale Sa =


2 i = (Yi f ( xi , a)) 2 i =1 i =1

Si los puntos ( x1 , y1 ), ( x 2 , y 2 ),..................., ( x n , y n ) pertenecen a la grfica de f entonces Sa = 0 y recprocamente. Si eso no ocurre debemos procurar que dicha funcin tome el valor mnimo. En general tal . Entonces la funcin que elegimos es la funcin mnimo se alcanza para un nico valor de a

= f ( x, a ) que se denomina funcin de mnimos cuadrados para el problema dado. y


22

: Determinacin de a
Recordemos que para que S tenga un mnimo en el punto a debe ocurrir

Sa = 0 a j

Por lo tanto obtenemos

2 (Yi f ( xi , a ))
i =1

f ( xi , a ) = 0 a j

De donde resulta

i =1

n f ( xi , a )) f ( xi , a ) = Yi f ( xi , a ) a j a j i =1

j =0,1,...,m

Desarrollando las sumatorias resulta un sistema de ecuaciones normales cuya solucin es el vector buscado a

REGRESIN LINEAL Aplicar el mtodo de mnimos cuadrados utilizando las herramientas que nos proporcionan las Tics resulta sencillo. Tomemos un ejemplo: En la produccin de herramientas, el mtodo para deformar acero a temperatura normal mantiene una relacin inversa con la dureza del mismo ya que, a medida que la deformacin crece, se ve afectada la dureza del acero. Para investigar esta relacin se ha tomado la siguiente muestra:
X: deformacin (en mm) Y : dureza Brinell (en kg/mm2)

6 68

9 67

11 65

13 53

22 44

26 40

28 37

33 34

35 32

Tabla 1: Deformacin y Dureza Brinell

23

Representamos mediante un diagrama de dispersin indicando la recta de regresin, su ecuacin y el coeficiente de determinacin correspondiente.3

Grfico 2: Diagrama de dispersin y recta de regresin para los datos de la Tabla 1.

ANALISIS DE LA VARIANZA Siendo y = a + bx la recta de regresin lineal, el parmetro b se llama coeficiente de regresin. Su valor expresa el incremento de

cuando x aumenta una unidad. Si b toma un valor positivo, y

crece al crecer x , y en consecuencia la recta es creciente, lo que indica que la la variable y dependencia entre las variables es directa. decrece al crecer x , y en consecuencia la recta es y decreciente, lo que indica que la dependencia entre las variables es inversa. Si b = 0 , la recta es
Si b toma un valor negativo, la variable horizontal y no hay dependencia entre las variables, ya que las variaciones de x no provocan . variacin de y
3

Tanto el diagrama de dispersin como la recta de regresin fueron representados mediante Excel 2007.

24

Es muy interesante ver que los mtodos de anlisis de la varianza tambin pueden aplicarse en relacin con problemas de regresin. Utilizando el software XLStat4 aplicamos el anlisis de la varianza a los datos de la Tabla 1. Prueba de la hiptesis = 0 contra la alternativa 0 ( : coeficiente de regresin de la poblacin) Anlisis de la varianza:

Fuente Modelo Error Total corregido

GDL 1 7 8

Suma de los cuadrados 1643,735 77,154 1720,889

Media de los cuadrados 1643,735 11,022

F 149,132

Pr > F < 0,0001

Calculado contra el modelo Y=Media(Y)


Tabla 2: Anlisis de la varianza aplicado al modelo

Como F = 149,132 > 0,001 se rechaza la hiptesis nula, por lo tanto 0 Parmetros del modelo: Desviacin tpica 2,460 Lmite inferior Lmite superior (95%) (95%) 69,899 -1,575 81,541 -1,064

Fuente Interseccin Deformacin

Valor 75,720 -1,320

t 30,779

Pr > |t| < 0,0001 < 0,0001

0,108 -12,212

Tabla 3: Parmetros del modelo lineal e intervalos de confianza del 95% para el coeficiente de regresin y la ordenada al origen

Ver en http://www.xlstat.com/

25

EL COEFICIENTE DE DETERMINACION Se define el coeficiente de determinacin como la parte relativa de la variacin total que viene explicada por el modelo.

y) 2 (y R = 2 Sy
2

El coeficiente de determinacin toma valores entre 0 y 1. ( 0 R 1 ). Todo ajuste mnimo cuadrtico debe venir acompaado de su respectivo coeficiente de determinacin para poder conocer el poder representativo de la funcin de ajuste, es decir el valor explicativo del modelo.
2

Si R > 0,90 se acepta el ajuste, en caso contrario se debe buscar otro modelo.
2

Para el ejemplo propuesto R = 0,955 > 0,90 por lo tanto la regresin lineal es un muy buen ajuste.
2

REGRESIONES NO LINEALES Si bien la regresin lineal es un muy buen ajuste para el problema propuesto, aplicaremos otros tipos de regresiones a fin de poder comparar. Cuadrtica

Grfico 3 : Regresin cuadrtica

26

Potencial

Grfico 4 : Regresin potencial

Exponencial

Grfico 5 : Regresin exponecial

27

Logartmica

Grfico 6 : Regresin logartmica

Compararamos las regresiones aplicadas Tipo de regresin Lineal Cuadrtica Potencial Exponencial Logartmica Coeficiente de determinacin 0,955 0,971 0,941 0,978 0,955

Tabla 4: Comparacin entre las regresiones

Es posible observar(Tabla 4) que casos R > 0,90 .


2

las regresiones son muy buenas, ya que en todos los

28

El mejor ajuste es a travs de una funcin exponencial ( R = 0,978) , seguido por la regresin
2

cuadrtica ( R = 0,971) , si bien se puede observar que los dos valores anteriores estn muy cerca uno del otro.
2

CONCLUSIONES La aplicacin de distintas regresiones sobre un mismo problema nos permite realizar comparaciones, sin limitarse solamente al caso lineal. La facilidad de que nos brindan las nuevas tecnologas permiten en poco tiempo efectuar comparaciones que nos permitan la correcta eleccin de un modelo adecuado, que describa los datos en problemas de ingeniera, as como nos proporciona elementos de juicio suficientes para la toma de decisiones en condiciones de incertidumbre.

REFERENCIAS BIBLIOGRFICAS Velasco Sotomayor,G. ; Wisniewski, P.(2002) Probabilidad y Estadstica para Ingeniera y Ciencias. Editorial Thomson. Mendenhall,W. ; Wackerly,D.; Sheaffer, R.(2004) Estadstica Matemtica con Aplicaciones. Grupo Editorial Iberoamrica. Garca, R. (2004). Inferencia estadstica y diseo de experimentos. Buenos Aires: Eudeba. Montgomery,D. ; Peck,E. y Vinning, G. (2002). Introduccin al Anlisis de Regresin Lineal. Editorial C.E.C.S.A.

29

También podría gustarte