Está en la página 1de 6

AJUSTE DE CURVAS POR MNIMOS CUADRADOS USANDO MATLAB

Mara E. Ascheri, Rubn A. Pizarro


Departamento de Matemtica - Facultad de Ciencias Exactas y Naturales - Universidad Nacional de La
Pampa. Uruguay 151 - (6300) - Santa Rosa (LP) - Argentina.
e-mail: mavacheri@exactas.unlpam.edu.ar - Tel:. 02954-425166 - Fax: 02954-432679

Tema: Experiencia de Ctedra en docencia e investigacin en matemtica. Trabajo Original.

RESUMEN
A menudo se dispondr de un conjunto de datos representados por puntos y se desear ajustar
curvas a dicho conjunto de datos.
Los mtodos desarrollados para el ajuste de curvas dependen de la incertidumbre de los datos.
El objetivo de este trabajo es introducir a los alumnos de Clculo Numrico, en el uso de la tcnica
de ajuste de curvas por medio de la regresin con mnimos cuadrados en la solucin de problemas de
ingeniera, de fsica y de matemtica aplicada, en general, utilizando el paquete MATLAB. Esta tcnica,
les permitir resolver diferentes problemas cientficos y tecnolgicos, entre los que se encuentran los
problemas que se deben afrontar frecuentemente en la prctica de la ingeniera. Adems de que se espera
que los alumnos asimilen y dominen los conceptos especficos impartidos referidos a la regresin, se
pretende que comprueben lo indispensable de la utilizacin de la computadora para resolver este tipo de
problemas. Tambin se espera, a partir de las distintas actividades propuestas a realizar por los alumnos,
que observen y reconozcan cundo la regresin con mnimos cuadrados resulta apropiada, arribando as a
resultados satisfactorios.
En resumen, se espera que los alumnos hayan aprendido a valorar la confiabilidad de las
respuestas y ser capaces de escoger el mejor mtodo (o mtodos) para resolver los problemas que se les
presenten.

INTRODUCCIN
Durante el desarrollo del curso "Clculo Numrico" describimos los mtodos numricos
aplicados, a alumnos de tercer ao de las carreras: Ingeniera en Electrnica, Ingeniera Civil,
Licenciatura en Fsica y Profesorado en Matemtica.
Entre los objetivos propuestos en este curso podemos citar los siguientes:
1. que sea fcilmente comprensible para los alumnos con un conocimiento mnimo de matemticas;
2. capacitar a los alumnos para que practiquen los mtodos numricos en una computadora;
3. elaborar programas simples que puedan usarse de manera sencilla en aplicaciones cientficas;
4. proporcionar software que resulte fcil de comprender.
La importancia de los mtodos numricos ha aumentado de forma drstica en la enseanza de la
ingeniera y la ciencia, lo cual refleja el uso actual y sin precedentes de las computadoras. El desarrollo de
un programa siempre es importante en el aprendizaje de mtodos numricos. Cuando los alumnos
implementen con buen resultado los mtodos numricos en una computadora personal y los apliquen para
resolver problemas que de otro modo resultan intratables, entonces tendrn una demostracin tangible de
cmo les pueden ayudar las computadoras para su desarrollo profesional.
Nuestra actitud previa era que cualquier lenguaje de programacin que los alumnos supieran
podra resultar adecuado. Sin embargo, teniendo en cuenta que muchos de los alumnos que se matriculan
en este curso no han aprendido o no tienen la prctica suficiente de computacin, que el paquete
MATLAB se ha convertido en una herramienta para casi todos los campos de la ingeniera y de la
matemtica aplicada, y que sus versiones nuevas han mejorado los aspectos de programacin, hemos
pensado que los alumnos emplearn su tiempo de manera ms fcil y productiva si utilizan este paquete.
Como profesores responsables del dictado de la asignatura "Clculo Numrico", hemos
implementado en la misma el uso del paquete MATLAB, versin 5.1, lo cual nos ha facilitado el proceso
de enseanza - aprendizaje de los mtodos numricos desarrollados a lo largo de todo el curso.

DESARROLLO
En la ciencia y en la ingeniera se da, a menudo, el caso de que un experimento produce un
conjunto de datos (x1, y1),,(xn, yn), siendo las abscisas {xi} distintas entre s. Uno de los objetivos del

1
clculo numrico es la determinacin de una frmula y = f(x) que relacione las variables. Normalmente se
dispone de una clase de frmulas previamente establecidas, y lo que hay que hallar son los valores ms
adecuados de unos coeficientes o de unos parmetros para estas frmulas. Aunque hay muchos tipos
distintos de funciones que se pueden usar, suele ocurrir que existe un modelo matemtico subyacente
basado en la situacin fsica que se est estudiando, que determina la forma de la funcin salvo algunos
coeficientes.
Los alumnos han visto cmo se construye un polinomio cuya grfica pase por todos los puntos
de un conjunto dado. Si todos los valores {xi}, {yi} se conocen con una precisin de varias cifras
significativas, entonces la interpolacin polinomial produce buenos resultados, lo que no ocurre en otras
circunstancias. Algunos experimentos se llevan a cabo con una maquinaria especializada que permite
obtener los datos con varias cifras significativas de precisin; sin embargo, muchos experimentos se
realizan con un equipamiento de, como mucho, dos o tres cifras significativas. A sto se aade, a menudo,
un cierto error experimental de las mediciones de forma que, aunque se calculen tres o cuatro cifras de los
valores {xi} e {yi}, sucede que el valor exacto f (xi) verifica
f (xi) = yi + ci,
donde ci es el error de la medicin.
Cmo se encuentra la mejor aproximacin que pase cerca (no por encima de cada uno) de los
puntos?. Para responder a esta pregunta introducimos el concepto del error cuadrtico medio. Un ajuste
ptimo es aqul que minimiza este error (problema de mnimos cuadrados). El error cuadrtico medio es
la eleccin tradicional porque es mucho ms fcil de minimizar computacionalmente que otros errores
(por ejemplo, error mximo y error medio). El enfoque de mnimos cuadrados le da mucho ms peso a un
punto que est fuera de la tendencia de los datos, pero no permite que el punto domine completamente a
la aproximacin. Con base en la teora estadstica, con este mtodo, conocido con el nombre de regresin
con mnimos cuadrados, se encuentra algn tipo de funcin que con mayor probabilidad se aproxima a los
valores verdaderos.
Hemos desarrollado la teora bsica para investigar todo lo referido al ajuste de curvas por medio
de la regresin con mnimos cuadrados. Primero se aprendi a ajustar "la mejor" lnea recta a travs de un
conjunto de datos inciertos (regresin lineal). Luego se analiz el ajuste potencial, se estudi una tcnica
general para ajustar "al mejor" polinomio (regresin polinomial) y se analiz el hecho de que en algunos
casos es ms apropiado efectuar transformaciones que expresen los datos de manera que sean compatibles
con la regresin lineal.
Presentamos una amplia variedad de problemas que ayudarn a mejorar las habilidades de los
alumnos, tanto en el conocimiento de la teora como en la prctica del ajuste de curvas por medio de la
regresin con mnimos cuadrados. Con la misma finalidad presentamos adems, algunas actividades
referidas a resolver problemas reales de ingeniera y de matemtica aplicada, en general.
Las tareas de computacin con el paquete MATLAB que proponemos, sirven para que los
alumnos tengan la oportunidad de practicar sus habilidades en la computacin cientfica y adems, para
que los ayude a realizar la componente numrica de los ejercicios que deban resolver en el laboratorio.
Los siguientes casos de estudio son una muestra de aquellos que en forma rutinaria se encuentran
en los estudios superiores. Ms an, son problemas representativos de aquellos que se encontrarn en la
vida profesional.
Los clculos hechos en una computadora debern ser presentados por los alumnos mediante
tablas y grficos, de manera que les permitan visualizar e interpretar las aproximaciones numricas
obtenidas.
La Actividad 1 tomada de la fsica, muestra cmo se utiliza el ajuste potencial para modelar
determinadas situaciones.
La Actividad 2 tomada de la ingeniera qumica, demuestra cmo se puede linealizar un modelo
no lineal y ajustarse a datos que usan regresin lineal.
La Actividad 3 muestra que si los datos que se deben ajustar no son lineales y no presentan una
naturaleza polinomial, entonces puede ocurrir que la curva resultante presente oscilaciones grandes
(oscilacin polinomial). Esta actividad ilustra entonces, el hecho de que no se suelen usar polinomios de
grado seis o mayor, a no ser que se sepa que la funcin de la que provienen los datos es un polinomio.

Actividad 1
En 1601 el astrnomo alemn Johannes Kepler formul su tercera ley del movimiento planetario,
T=Cx3/2, donde x es la distancia al sol medida en millones de kilmetros, T es el perodo orbital medido
en das y C es una constante. Las parejas de datos (x, T) observados para los primeros cuatro planetas,
Mercurio, Venus, La Tierra y Marte, son (58, 88), (108, 225), (150, 365) y (228, 687). Obtngase el
coeficiente C por el mtodo de mnimos cuadrados y grafquese la curva junto con los puntos que
representan a los datos. Escrbanse las conclusiones a las que se arribaron.

2
Resultados obtenidos por los alumnos:
Clculo de los coeficientes para un ajuste potencial
Distancia, xi Perodo orbital, Ti Ti xi3/2 xi3
58 88 38870.90592 195112
108 225 252533.0076 1259712
150 365 670547.817 3375000
228 687 2365151.732 11852352
:3327103.461 :16682176

El coeficiente es C = 0.199440616. La curva T = 0.199440616 x3/2 y las parejas de datos se


muestran en la siguiente figura

El ajuste por mnimos cuadrados para los primeros cuatro planetas,


T=0.199440616x3/2, usando la tercer ley de Kepler del movimiento planetario.

Conclusin a la que arribaron los alumnos luego de realizar esta actividad:


El ajuste potencial ptimo en mnimos cuadrados para los cuatro primero planetas usando la
tercera ley de Kepler del movimiento planetario, es aceptable.

Actividad 2
Los modelos de crecimiento poblacional son importantes en muchos campos de la ingeniera. La
suposicin de que la tasa de crecimiento de la poblacin (dp/dt) es proporcional a la poblacin actual (p)
en el tiempo (t) es de fundamental importancia en muchos de los modelos, en forma de ecuacin
dp
= kp , (1)
dt
en donde k es un factor de proporcionalidad conocido como la tasa de crecimiento especfico y tiene
unidades de tiempo -1. Si k es una constante, entonces se puede obtener la solucin de la ecuacin (1) de
la teora de ecuaciones diferenciales
p (t ) = p 0 e kt , (2)
en donde p0 es la poblacin en el tiempo t=0. Se observa que p(t) en la ecuacin (2) tiende a infinito a
medida que t crece. Este comportamiento es claramente imposible en los sistemas reales. Por lo tanto, se
debe modificar el modelo y hacerlo ms realista.
Primero, se debe reconocer que la tasa de crecimiento especfico k no puede ser constante a
medida que la poblacin crece. Esto es porque, cuando p tiende a infinito, el organismo que se modela se
ve limitado por factores tales como el almacenamiento de comida y produccin de desperdicios txicos.
Una manera de expresar esto matemticamente es la de usar el modelo de tasa de crecimiento y saturacin
tal como
f
k = k mx , (3)
K+ f
en donde kmx es la mxima tasa de crecimiento posible para valores de comida (f) abundante y K es la
constante de semi-saturacin. Vemos que cuando K = f, k= kmx /2. Por lo tanto, K es la cantidad de
comida disponible que sostiene una tasa de crecimiento poblacional igual a la mitad de la tasa mxima.
Las constantes K y kmx son valores empricos basados en medidas experimentales de k para varios
valores de f. Como ejemplo, supngase que la poblacin p representa una levadura empleada en la
produccin comercial de cerveza y f es la concentracin de la fuente de carbono a fermentarse. Las

3
medidas de k contra f de la levadura se muestran en el Cuadro 1. Se necesita calcular kmx y K de estos
datos empricos.
Cuadro 1. Datos usados en la evaluacin de las constantes en un modelo
de promedio de crecimiento de saturacin que caracteriza a la cintica
microbial.
f, mg/l k, das-1
7 0.29
9 0.37
15 0.48
25 0.65
40 0.80
75 0.97
100 0.99
150 1.07

sese el procedimiento de mnimos cuadrados lineal para determinar kmx y K y realcese el


grfico correspondiente. Escrbanse adems, las conclusiones a las que se arribaron.
Observacin. La ecuacin diferencial resultante se podr resolver usando los mtodos numricos que
analizaremos oportunamente, cuando se conoce f(t).

Resultados obtenidos por los alumnos:


Datos usados para la regresin lineal
f, mg/l k, das-1 1/f, L/mg 1/k,da (1/f)2, L2/mg2 (1/f)(1/k), L/mg.da
7 0.29 0.14286 3.44828 0.02041 0.49262
9 0.37 0.11111 2.70270 0.01235 0.30030
15 0.48 0.06667 2.08333 0.00444 0.13890
25 0.65 0.04000 1.53846 0.00160 0.06154
40 0.80 0.02500 1.25000 0.00063 0.03125
75 0.97 0.01333 1.03092 0.00018 0.01374
100 0.99 0.01000 1.01010 0.00010 0.01010
150 1.07 0.00667 0.93458 0.00004 0.00623
: 0.41564 : 13.99837 : 0.03975 : 1.05468
Se obtiene
kmx = 1.23 das -1, K = 22.18 mg/L.
De estos resultados, de (3) y de (1), se obtiene
dp f
= 1.23 p.
dt 22.18 + f

Linealizacin del modelo de promedio de saturacin. La lnea es un ajuste


con mnimos cuadrados que se usa en la evaluacin de los coeficientes del
modelo, kmx=1.23 das -1 y K=22.18mg/L, para levadura en la fabricacin de
cerveza.

Conclusin a la que arribaron los alumnos luego de realizar esta actividad:


Si f se aproxima a cero a medida que p crece, entonces dp/dt tiende a cero y la poblacin se
estabiliza.

4
Actividad 3
Se usa la funcin f(x)=1.44/x2+0.24x para generar seis parejas de datos (0.25, 23.1), (1.0, 1.68),
(1.5, 1.0), (2.0, 0.84), (2.4, 0.826) y (5.0, 1.2576).
Obtngase los ajustes mediante polinomios ptimos en mnimos cuadrados, para 2, 3, 4 y 5
grados.
Grafquense, para cada caso, el polinomio ptimo y la funcin f(x).
Escrbanse adems, las conclusiones a las que se arribaron.
Observacin. No deja de ser tentadora la posibilidad de utilizar un polinomio ptimo en el sentido de los
mnimos cuadrados para ajustar datos que no son lineales. Pero si los datos no muestran una naturaleza
polinomial, puede ocurrir que la curva resultante presente oscilaciones grandes. Este fenmeno llamado
oscilacin polinomial, se hace ms pronunciado conforme aumenta el grado del polinomio, y por esta
razn, no se suelen usar polinomios de grado 6 o mayor, a no ser que se sepa que la funcin de la cual
provienen los datos es un polinomio.

Resultados obtenidos por los alumnos:

P2(x) = 22.93 - 16.96 x + 2.553 x2


P3(x) = 33.04 - 46.51 x + 19.51 x2 - 2.296 x3
P4(x) = 39.92 - 80.93 x + 58.39 x2 - 17.15 x3 + 1.680x4
P5(x) = 46.02 - 118.1 x + 119.4 x2 - 57.51 x3 + 13.03x4 - 1.085x5

(a) Ajuste de P2(x) a los datos (b) Ajuste de P3(x) a los datos
(c) Ajuste de P4(x) a los datos (d) Ajuste de P5(x) a los datos

Conclusiones a las que arribaron los alumnos luego de desarrollar esta actividad:
1.- P3(x), P4(x) y P5(x) presentan oscilaciones grandes en el intervalo [2, 5].
2.- P5(x) pasa por los seis puntos; sin embargo, es la que peor se aproxima a la funcin.
3.- El polinomio que se ajusta a los datos y se aproxima a la funcin es P2(x).

5
RESULTADOS Y CONCLUSIONES
Una vez finalizado el anlisis de este tema, los alumnos deben haber aumentado en gran medida
sus capacidades en el ajuste de curvas con datos por medio de la regresin con mnimos cuadrados.
Tienen la suficiente informacin para aprovechar satisfactoriamente una amplia variedad de problemas de
ingeniera y de matemtica aplicada relacionados con esta temtica. Deben dominar las distintas tcnicas,
deben haber aprendido a valorar la confiabilidad de las respuestas y ser capaces de escoger el mejor
mtodo (o mtodos) para cualquier problema. Deben entender la derivacin de la regresin lineal con
mnimos cuadrados y ser capaces de valorar la confiabilidad del ajuste usando grficas. Deben
comprender el uso del ajuste potencial. Deben saber linealizar datos para llevar a cabo transformaciones y
deben entender las situaciones en donde es apropiado usar regresin polinomial. Por ltimo, deben
descubrir que los mtodos referidos a la interpolacin lineal se utilizan, fundamentalmente, cuando se
conoce que los datos son muy exactos y deben entonces, asimilar y dominar todos los conceptos relativos
al ajuste de curvas por medio de la regresin con mnimos cuadrados.
Por otro lado, la implementacin por parte de los alumnos de las tcnicas analizadas en
programas simples, es de gran utilidad como herramienta de aprendizaje de dichas tcnicas.
El uso del paquete MATLAB mejora a los software utilizados anteriormente, porque adems de
que ahorra tiempo y esfuerzo en la resolucin de una gran variedad de problemas, que las soluciones
obtenidas resultan ms fiables que las obtenidas manualmente, que es una herramienta para la enseanza
de la matemtica, facilita el proceso de enseanza - aprendizaje aportando una interfaz grfica visual ms
didctica y comprensible.

BIBLIOGRAFA
[1] CHAPRA, S. - CANALE, R., 1992, "Mtodos Numricos para Ingenieros", Mxico, Mc Graw-Hill.
[2] GARCA MERAYO, F. - NEVOT LUNA, A., 1992, "Anlisis Numrico", Espaa, Paraninfo.
[3] GERALD, C. - WHEATLEY, P., 2000, "Anlisis Numrico con Aplicaciones",.Mxico, Pearson
Educacin.
[4] GORDON, J., 1985, "Algoritmos Numricos", La Plata.
[5] MATHEWS, J. - KURTIS, D., 2000, "Mtodos Numricos con MATLAB", Espaa, Prentice Hall.
[6] NAKAMURA, S., 1992, "Mtodos Numricos Aplicados con Software", Mxico, Prentice Hall
Hispanoamericana, S.A.

También podría gustarte