Está en la página 1de 19

Capítulo

Ajuste de
modelos no
3
lineales
Contenidos:

3.1 Indicadores para medir la calidad de


un ajuste
3.2 Modelos de regresión no lineales
a) Modelo exponencial
b) Modelo potencial
c) Modelo hiperbólico
d) Modelo polinomial cuadrático
196

INTRODUCCIÓN

Los modelos de regresión lineal proporcionan un marco rico y flexible que se adapta a las
necesidades de muchos analistas, sin embargo, los modelos de regresión lineal no son
adecuados para todas las situaciones. Hay muchos problemas en ingeniería y en ciencias
donde la variable de respuesta y las variables predictoras se relacionan a través de una
función no lineal conocida. Esto conduce a un modelo de regresión no lineal. Cuando se
aplica el método de mínimos cuadrados a esos modelos, las ecuaciones normales que
resultan son no lineales y, en general, son difíciles de resolver. En este capítulo se
describirá la estimación de los parámetros de un modelo de regresión no lineal.
197

3.1 INDICADORES PARA MEDIR LA CALIDAD DE UN AJUSTE

COEFICIENTE LINEAL DE PEARSON

∑(𝒙 − 𝒙
̅)(𝒚 − 𝒚
̅)
𝒓𝒙𝒚 =
̅)𝟐 (𝒚 − 𝒚
√∑(𝒙 − 𝒙 ̅ )𝟐

Permite medir la calidad del ajuste de un modelo lineal a la trayectoria de la nube de


puntos experimentales.

Propiedades:
• −1 ≤ 𝑟𝑥𝑦 ≤ 1
• 𝑟𝑥𝑦 = 𝑟𝑦𝑥
• Si 𝑟𝑥𝑦 > 0 la relación lineal entre X e Y es directa
• Si 𝑟𝑥𝑦 < 0 la relación lineal entre X e Y es indirecta
• Si |𝑟𝑥𝑦 | ≈ 1 la trayectoria de los puntos experimentales se ajusta
aproximadamente a un modelo lineal simple.
• Si |𝑟𝑥𝑦 | = 1 la trayectoria de los puntos experimentales se ajusta perfectamente a
un modelo lineal simple.
• Si |𝑟𝑥𝑦 | ≈ 0 la trayectoria de los puntos experimentales no se ajusta a un modelo
lineal simple.

COEFICIENTE DE DETERMINACIÓN

∑𝑛𝑖=1(𝑦̂𝑖 − 𝑦̅)2
𝑅2 =
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2

Se llama coeficiente de determinación R2 a la proporción de la variabilidad explicada


por la variable x. Los valores de R2 se encuentran en el intervalo 0 ≤ 𝑅 2 ≤ 1. Los valores
de R2 cercanos a 1 implican que la mayor parte de la variabilidad de y está explicada por
el modelo de regresión.

• El coeficiente de determinación toma valores entre 0 y 1. (0≤ R2≤1).


• Todo ajuste mínimo cuadrático debe venir acompañado de su respectivo coeficiente
de determinación para poder conocer el poder representativo de la función de ajuste,
es decir el valor explicativo del modelo.
• Si R2>0,90 se acepta el ajuste, en caso contrario se debe buscar otro modelo.
• Para el ejemplo propuesto R2=0,955 > 0,90 por lo tanto la regresión lineal es
un muy buen ajuste.
198

3.2 MODELOS DE REGRESIÓN NO LINEALES


Hay muchas situaciones en las que un modelo lineal de regresión puede no ser lo
adecuado, por ejemplo, cuando se tiene el conocimiento directo de la forma de la relación
entre la variable de respuesta Y y la variable predictiva X, quizá con base en la teoría
que gobierna los fenómenos.
La relación real entre la respuesta (Y) y los regresores (X) puede ser una ecuación
diferencial que por lo general conducirá a un modelo de forma no lineal. Cualquier
modelo que no sea lineal en los parámetros desconocidos es un modelo de regresión no
lineal. Por ejemplo, el modelo:
𝒚 = 𝒂. 𝒆𝒃𝒙

Es no lineal en los parámetros desconocidos a y 𝑏. Aquí se usarán las letras a, b, c, ... para
representar los parámetros en un modelo no lineal.

MODELO EXPONENCIAL 𝒚 = 𝒂. 𝒆𝒃𝒙

El modelo exponencial se caracteriza por tener un gráfico curvilíneo con un


comportamiento netamente creciente o decreciente. Con la presencia de una asíntota
horizontal que presenta mayor relevancia en modelos de tipo decreciente.

El diagrama de dispersión mostrado a continuación


presenta este comportamiento creciente por lo que puede
ser modelado por la expresión algebraica 𝒚 = 𝒂. 𝒆𝒃𝒙

Para determinar los parámetros de la ecuación, es necesario


convertir el modelo exponencial en un modelo lineal a
través del siguiente procedimiento:

𝒚 = 𝒂. 𝒆𝒃𝒙
𝒍𝒏(𝒚) = 𝒍𝒏(𝒂. 𝒆𝒃𝒙 )
𝒍𝒏(𝒚) = 𝒍𝒏(𝒂) + 𝒍𝒏(𝒆𝒃𝒙 )
𝒍𝒏(𝒚) = 𝒍𝒏(𝒂) + 𝒃𝒙
199

Definiendo las nuevas variables: 𝒀∗ = 𝒍𝒏(𝒚) 𝒂∗ = 𝒍𝒏(𝒂)

Obtenemos un modelo lineal de la forma: 𝒀∗ = 𝒂∗ + 𝒃𝒙

Tras estas transformaciones en la tabla de valores podemos obtener la ecuación de


regresión por el método de mínimos cuadrados y por ende los correspondientes valores
de los estimadores 𝒂∗ y 𝒃.

MODELO POTENCIAL 𝒚 = 𝒂. 𝒙𝒃

El modelo potencial se caracteriza por tener un gráfico


curvilíneo con un comportamiento netamente creciente o
decreciente, con un punto de partida necesariamente en
el origen de coordenadas y no presenta asíntotas.

El diagrama de dispersión mostrado a continuación


presenta este comportamiento creciente por lo que puede
ser modelado por la expresión algebraica 𝒚 = 𝒂. 𝒙𝒃

Mediante el método de linealización podemos determinar


los parámetros de la ecuación:

𝒚 = 𝒂. 𝒙𝒃
𝒍𝒐𝒈(𝒚) = 𝒍𝒐𝒈(𝒂. 𝒙𝒃 )
𝒍𝒐𝒈(𝒚) = 𝒍𝒐𝒈(𝒂) + 𝒍𝒐𝒈(𝒙𝒃 )
𝒍𝒐𝒈(𝒚) = 𝒍𝒐𝒈(𝒂) + 𝒃. 𝒍𝒐𝒈(𝒙)

Definiendo las nuevas variables:

𝒀∗ = 𝒍𝒐𝒈(𝒚) 𝑿∗ = 𝒍𝒐𝒈(𝒙) 𝒂∗ = 𝒍𝒐𝒈(𝒂)

Obtenemos un modelo lineal de la forma: 𝒀∗ = 𝒂∗ + 𝒃𝑿∗

Tras estas transformaciones en la tabla de valores podemos obtener la ecuación de


regresión por el método de mínimos cuadrados y por ende los correspondientes valores
de los estimadores 𝒂∗ y 𝒃.
200
𝒙
MODELO HIPERBÓLICO 𝒚=
𝒂𝒙+𝒃

El modelo hiperbólico se caracteriza por tener un gráfico


curvilíneo con un comportamiento netamente creciente o
decreciente, con dos asíntotas, una horizontal y otra
vertical.

El diagrama de dispersión de al lado presenta este


comportamiento decreciente por lo que podría ser
𝒙
modelado por la expresión algebraica 𝒚 = 𝒂𝒙+𝒃 .

El método de linealización en este caso consiste en invertir


ambos miembros de la igualdad

𝟏 𝒂𝒙 + 𝒃
=
𝒚 𝒙

𝟏 𝒂𝒙 𝒃
= +
𝒚 𝒙 𝒙

𝟏 𝟏
= 𝒂 + 𝒃.
𝒚 𝒙

𝟏 𝟏
Definiendo las nuevas variables: 𝒀∗ = 𝒚 𝑿∗ = 𝒙

Obtenemos un modelo lineal de la forma: 𝒀∗ = 𝒂 + 𝒃𝑿∗

Tras estas transformaciones en la tabla de valores podemos obtener la ecuación de


regresión por el método de mínimos cuadrados y por ende los correspondientes valores
de los estimadores 𝒂 y 𝒃.
201

MODELO DE REGRESIÓN POLINOMIAL

Los modelos polinomiales son útiles en casos cuando el


analista sabe que hay efectos curvilíneos presentes en el
diagrama de dispersión propuesto. También son útiles
como funciones de aproximación a relaciones no
lineales, desconocidas y posiblemente muy complejas.

Hay varias consideraciones importantes que se


presentan cuando se ajusta un polinomio de una
variable. Algunas de ellas se describirán a continuación.

a) Orden del modelo:

Es importante mantener tan bajo como sea posible el


orden del modelo. Cuando la función de respuesta
parezca ser curvilínea, se deben intentar transformaciones
para mantener al modelo como de primer orden (de grado
1). Los métodos que se describieron anteriormente son
útiles en este aspecto, si falla lo anterior, se debe intentar
un polinomio de segundo orden (de grado 2).
Como regla general, se debe evitar el uso de polinomios de orden superior (con grado
mayor que 2), a menos que se puedan justificar por razones ajenas a los datos. Un modelo
de orden menor en una variable transformada casi siempre es preferible a un modelo de
orden superior en la métrica original. El ajuste arbitrario de polinomios de orden superior
es un grave abuso del análisis de regresión. Siempre se debe mantener un sentido de
parsimonia, esto es, se debe usar el modelo más simple posible que sea consistente con
los datos y el conocimiento del ambiente del problema. Recuérdese que en un caso
extremo siempre es posible hacer pasar un polinomio de orden n-1 por n puntos, por lo
que siempre se puede encontrar un polinomio con grado suficientemente alto que
produzca un ajuste “bueno” con los datos. Ese modelo no contribuiría a mejorar el
conocimiento de la función desconocida, ni es probable que sea buen predictor.

b) Estrategia para la construcción del modelo

Se han sugerido diversas estrategias para elegir el orden de un polinomio de


aproximación. Un método es ajustar en forma sucesiva modelos de orden creciente hasta
que el coeficiente de determinación R2 sea el más aceptable. Un procedimiento alterno
es ajustar el modelo de orden máximo adecuado, y a continuación eliminar términos, uno
por uno, comenzando con el de orden máximo hasta que el término que quede de orden
202

máximo tenga un coeficiente de determinación R2 aceptable. Esos dos procedimientos se


llaman selección en avance y eliminación en reversa, respectivamente, y no
necesariamente conducen al mismo modelo. En vista del comentario del punto a, se
deben usar con cuidado esos procedimientos. En la mayor parte de los casos se debería
restringir la atención a polinomios de primero y segundo orden.

c) Extrapolación

La extrapolación con modelos polinomiales puede ser peligrosa en extremo, por ejemplo,
véase el modelo de segundo orden en la figura de abajo, si se extrapola más allá del rango
de los datos originales, la respuesta predicha se va hacia abajo; esto puede ser contrario
al comportamiento real del sistema. En general, los modelos polinomiales pueden
dirigirse hacia direcciones imprevistas e inadecuadas, tanto en la interpolación como en
la extrapolación.

Peligro de extrapolar

MODELO CUADRÁTICO

El modelo cuadrático se caracteriza por tener un gráfico


parabólico, esto es con una sola concavidad sea esta hacia
arriba o hacia abajo. El modelo cuadrático está representado
por la ecuación general de segundo orden:

𝒚 = 𝒂𝒙𝟐 + 𝒃𝒙 + 𝒄

La elección de este modelo se debe ver respaldada por la


obtención de un coeficiente de determinación R2 lo más cercano a 100%.
203

INVESTIGACIÓN 1

La masa de bacterias en un cultivo se mide cada día durante cinco días.

t días 1 2 3 4 5
M gramos 3.6 5.7 9.1 14.6 23.3

a) Agregue una fila a la tabla para los valores de ln(M).


b) Utilice la tecnología para graficar M versus t e ln(M) versus t. ¿Cuál de los
diagramas de dispersión es lineal?
c) Utilice la GDC para hallar el modelo lineal 𝑌 = 𝑚𝑋 + 𝑐 donde 𝑌 ≡ ln (𝑀) y 𝑋 ≡ 𝑡.
d) Luego, demuestre que 𝑀 ≈ 2.25 × 1.60𝑡 .
e) Estime la masa original de bacterias.
204

INVESTIGACIÓN 2

Más de una ocasión ocurre que al calentar en un microondas nuestras bebidas se han
excedido de calor, por lo que la temperatura llega a ser más elevada de la que se desea.
Esta investigación consiste en poder modelar la temperatura que experimenta una taza
de leche tras haber sido calentada, con la intención de poder saber con cierta precisión
cuánto tiempo le toma a esta alcanzar una temperatura determinada. En la tabla y en el
diagrama se muestran los datos primarios que darán origen a la fórmula final, los cuales
son los minutos transcurridos y la temperatura de la leche evaporada en dichos minutos.
Cabe agregar que la temperatura del ambiente es de 17.3°C, y el tiempo de exposición
de la sustancia elegida en el microondas fue de 90 segundos.

a) Efectúe las transformaciones necesarias para linealizar los datos.


b) Utilice la tecnología para graficar los datos transformados
c) Utilice la GDC para hallar el modelo lineal 𝑌 ∗ = 𝑚𝑋 ∗ + 𝑐
d) Luego, indique la ecuación y=T(t)
e) Estime la temperatura de la leche tras 13 min
f) Estime cuánto tiempo le toma a la leche alcanzar los 46°C

Tiempo Temperatura
t (min) T (°C)
0 56.1
5 52.9
10 49.9
15 47.8
20 44.5
25 42.2
30 39.9
35 37.9
40 36.1
45 34.5
50 33.1
55 31.8
60 30.5
65 29.4
70 28.4
75 27.5
80 26.7
85 26.0
90 25.3
205
206

EJERCICIO 3.2A:

1. La cantidad Q de una sustancia química responsable de la elasticidad de la piel se


mide a distintas edades (t años). Los resultados se muestran en
la tabla y el gráfico.

Edad t (años) 2 10 20 30 50 65 80
Químico Q (mg) 119 98 82 70 50 40 30

a) ¿Cuál es el efecto sobre Q cuando t aumenta?


b) ¿La gráfica es lineal?
c) Construya una tabla de valores comparando 𝑄
con √𝑡.
d) Explique por qué 𝑄 = 𝑚√𝑡 + 𝑐 es un modelo
probable para los datos originales.
e) Usa tu calculadora para encontrar m y c.
f) Encuentre la cantidad de químico en:
(i) un bebé recién nacido (ii) una persona de 25 años.
g) ¿Es probable que las respuestas en f sean confiables?
207

2. Un baño de pájaros está lleno de agua. Con el tiempo, el agua se evapora como se
muestra en la siguiente tabla:

Tiempo t (horas) 3 6 9 12 15 18 21 24
Cantidad de agua
6.7 3.6 2 1.1 0.6 0.32 0.18 0.10
restante V (litros)

a) Dibuja un diagrama de dispersión de V versus t.


b) Dibuja un diagrama de dispersión de:
(i) ln(V) versus t (ii) ln(V) versus ln(t).
c) Encuentre el modelo que conecta V y t.
d) Estime la cantidad de agua que queda en el baño
para pájaros después de 5 horas.
e) Estime la cantidad de agua que se ha evaporado después de 10 horas.
208

3. La velocidad máxima de una canoa en un lago con diferentes números de remeros


se registra en la siguiente tabla:

N° de remeros 4 6 10 14 18
Velocidad máxima S (km/h) 8.7 10.3 12.6 14.2 15.9

a) Dibuja un diagrama de dispersión de S contra r.


b) Dibuja un diagrama de dispersión de ln(S) contra ln(r).
c) Encuentre el modelo que conecta r y S.
d) Predice la velocidad máxima de la canoa si hay 8 remeros.
209

4. La siguiente tabla muestra los valores de ln(x) y ln(y).

Ln(x) 1.10 2.08 4.30 6.03


Ln(y) 5.63 5.22 4.18 3.41

La relación entre ln(x) y ln(y) puede ser modelado por la ecuación de regresión
Ln(y)=a ln(x) + b
a) Halla los valores de a y b
b) Usa la ecuación de regresión para estimar el valor de y cuando x=3.57
La relación entre x e y puede ser modelada usando la fórmula 𝑦 = 𝑘𝑥 𝑛 , donde
𝑘 ≠ 0, 𝑛 ≠ 0, 𝑛 ≠ 1
c) Por la expresión ln(y) en términos de ln(x), halla el valor de n y de k.
210

INVESTIGACIÓN 3

En este caso, el siguiente trabajo matemático estará centrado en determinar una fórmula
que describa la concentración plasmática de la metformina dentro de nuestro cuerpo con
respecto al tiempo, mediante el uso de algunos datos publicados en un artículo sobre
esta medicina

Concentración
Tiempo plasmática de
la metformina
0 0
0.4 630.46
0.9 954.37
1.4 1099.56
1.9 1164.33
2.3 1187.76
2.8 1117.48
3.4 972.78
3.9 851.51
Figura n°1: Imagen obtenida del artículo ya citado, “Estudio de 4.4 745.40
biodisponibilidad de metformina 850 mg tabletas de liberación 4.9 628.27
inmediata” (Muñoz Carnago, y otros 2015) donde se muestra 6.0 480.82
un gráfico aproximado de la gráfica. 8.0 299.95
10.0 179.87
12.0 100.02
14.0 50.21
24.0 0.14
211

INVESTIGACIÓN 4
• ¿Por qué cree que las empresas ofrecen incentivos para que las personas completen

Modelación de un tsunami, representando sus cambios a través del espacio y tiempo en


una gráfica tridimensional. Para esta investigación, decidí utilizar el Tsunami que más
información concisa tuviera a disposición, siendo en este caso uno ocurrido en Chile el
2010.

Figura 1: Modelo NOAA con la recolección de muestras / Intervalos de altura por


degradación de color

Radio de Alturas promedio


expansión (r) en cm (h)
0 240
300 96.69
600 57.63
900 36.11
1000 35.31
2000 18.25
3000 15.38
4000 11.51
5000 8.44
6000 8.11
7000 7.25
212
213

CONCLUSIONES

La aplicación de distintas regresiones sobre un mismo problema nos permite realizar


comparaciones, sin limitarse solamente al caso lineal.
La facilidad de que nos brindan las nuevas tecnologías permite en poco tiempo efectuar
comparaciones que nos permitan la correcta elección de un modelo adecuado, que
describa los datos en problemas de ingeniería, así como nos proporciona elementos de
juicio suficientes para la toma de decisiones en condiciones de incertidumbre.

También podría gustarte