Está en la página 1de 7

Ajuste de Datos Experimentales por Medio de Mnimos Cuadrados, Parte I

Salvador Acha Daza

Diana Acha Izquierdo

Programa Doctoral en Ing. Elctrica, FIME-UANL


Octubre 2000
Resumen.- En el presente trabajo se trata de mostrar de manera sencilla el ajuste de curvas a

datos experimentales, usando el concepto de mnimos cuadrados. En muchas aplicaciones de la


ingeniera y de la ciencia los modelos son lineales en los coeficientes; lo cual permite escribir
una forma explcita para la solucin. Al tener redundancia, es decir un mayor nmero de
observaciones que parmetros a determinar, se puede plantear bajo consideraciones estadsticas
apropiadas una prueba de significacin estadstica para los parmetros del modelo propuesto,
este tema se trata en la parte II.
keywords.- mnimos cuadrados, ajuste de funciones.
Introduccin
Es frecuente el problema de tener un conjunto de mediciones y desear ajustar los datos
observados a funciones que describan la relacin entre la variable dependiente y la variable
independiente. El problema original parece estar asociado al nombre de Gauss quien trat de
ajustar curvas a datos experimentales obtenidos en observaciones astronmicas. En nuestros das
el planteamiento permite establecer un modelo matemtico basado en optimizacin, para dar
solucin al problema de calcular los coeficientes que satisfacen el criterio de mnimos cuadrados.
El presente artculo muestra de forma sencilla la solucin matricial del problema, ilustrando la
forma de llegar a una expresin cerrada de la solucin. Con ejemplos sencillos se tiene una
comprobacin al aplicar en forma directa la solucin presentada. En el apartado 1 se desarrollan
las ecuaciones para el clculo de los coeficientes, despus en el apartado 2 se discuten dos
ejemplos, en uno se muestra las transformaciones para lograr un modelo como el discutido con
detalle en el apartado 1. Al final se presentan las conclusiones del trabajo y en apndices se
extiende el material para incluir pruebas de significacin estadstica lo cual debe complementar
el anlisis y agrega valor al modelo obtenido bajo el criterio de los mnimos cuadrados.
1 Desarrollo de Ecuaciones para el Clculo de los Coeficientes
Con el fin de establecer la nomenclatura general se considera que se tiene un conjunto de n
pares de observaciones (xi, yi). En un plano x-y se puede visualizar la distribucin de
observaciones usando un diagrama de dispersin, Figura 1.
x

x
x

Fig. 1 Diagrama de dispersin, observaciones en el plano x-y.

Como se muestra en la Figura 1, para cada observacin se tiene un valor terico expresado
por la ecuacin de la funcin. As, se puede hablar de un error o "desajuste" a la diferencia entre
el valor observado y el valor terico. Al sumar los errores al cuadrado, se tiene SS.
n

SS 12 22 2n i2

(1)

i 1

En el caso particular cuando los datos pueden ser descritos por una recta, y = a 1x + ao, se
requieren los coeficientes a1 y ao. Los mejores coeficientes sern aquellos que minimizan el
cuadrado de los errores, dando lugar al mtodo de mnimos cuadrados. El gradiente de SS
igualado a cero ser la solucin buscada. De la Figura 1:
i y iobs y iterica y iobs (a 1 x i a o )

(2)

para el caso particular de n = 4 observaciones, la suma SS del cuadrado de los errores:

SS y1 a 1 x1 a o

2 y 2 a1 x 2 a o 2 y 3 a1 x 3 a o 2 y 4 a1 x 4 a

(3)
El gradiente de SS:

SS
a 0
1
SS

SS

0
a o

(4)

y las componentes del gradiente (4) se obtienen como:


SS
2 y1 a1 x1 a o x1 2 y 2 a 1 x 2 a o x 2 2 y 3 a1 x 3 a o x 3 2 y 4 a1 x 4 a o x 4
a1
SS
2 y1 a 1 x1 a o (1) 2 y 2 a 1 x 2 a o (1) 2 y 3 a 1 x 3 a o (1) 2 y 4 a 1 x 4 a o
ao

Al igualar a cero las componentes del gradiente y en forma matricial:

y1 a1 x1 a o y 2 a1 x 2 a o y 3 a1 x 3 a o y 4 a1 x 4 a o

x1

x 2
x 3

x 4

(5.a)

y1 a1 x1 a o y 2 a1 x 2 a o y 3 a1 x 3 a o y 4 a1 x 4 a o

1
1
0
1

1

(5.b)

Las formas anteriores (5.a) y (5.b) se pueden escribir en una sola expresin matricial:

y1 a1 x1 a o y 2 a1 x 2 a o y 3 a1 x 3 a o y 4 a1 x 4 a o

x1

x2
x3

x4

1
1
0 0 (6)
1

y al transponer (6):

x1 x 2 x 3 x 4
1 1 1 1

y1 a 1 x1 a o
y a x a
0
o
1 2
2

y 3 a 1 x 3 a o 0

y 4 a 1 x 4 a o

(7)

Se puede arreglar (7) y obtener una forma condensada de la solucin para a1 y ao.

x1 x 2 x 3 x 4
1 1 1 1

y1 x1

y 2 x 2

y 3 x 3
y 4 x 4

1
1
1

a 1 0
a 0
o

(8)

Llamando A a la matriz que tiene la informacin de la medicin en variable independiente x,


como At a la matriz que presenta en forma de renglones las columnas de A y al vector de
informacin de medicin en la variable dependiente y, se tiene:
A t (y A a) 0

(9)

At y AtA a 0

(10)

con solucin:

a At A

1 A t y

(11)

2 Ejemplos
a) Para ilustrar la aplicacin de (11) se propone los siguientes pares de valores medidos, para
la variable independiente x y el correspondiente valor de la variable dependiente y.
xi
1.0
1.8
2.0
3.0

yi
1.0
3.0
1.8
2.9

Los arreglos de informacin, para n = 4:


1.0
1.8

x
2.0

3 .0
1.0
At
1

1.0
3.0

y
1.8

2.9
2.0 3.0
1
1

1.8
1

1.0

1.0 1.8 2.0 3.0 1.8


At A
1
1
1 2.0
1

3 .0
1
0.49261 0.96059
AtA

2.12315
0.96059

1 .0
At y
1

1 .8
1

2 .0
1

1.0
1.8
A
2.0

3.0

1
1
17.24

1
7.80

1
1
1

7.80
4.00

1 .0
3.0 3.0
18.7

1 1 .8
8 .7

2 .9

1 t
a1
t
A y
a A A
o

a1
17.24
a 7.80

7.80
4.00

18.7
8.7

a1
0.85468
a 0.50837

Con solucin para los coeficientes a 1 y ao, que resultan en la recta y = 0.85468 x + 0.50837.
Una grfica de la recta ajustada y de los valores observados se muestra en la Figura 2.
4

4
3.5
3
2.5
2
1.5
1
0.5
0
-0.5
-1

-0.5

0.5

1.5

2.5

3.5

Fig. 2 Grafica de funcin ajustada y = 0.85468 x + 0.50837 y las mediciones.

b) Modelo no-lineal, observaciones originales (x, y) y transformaciones, pag. 123, Ref. [1].
Dato
1
2
3
4
5
6
7
8
9
10

x(i)
1.00000
2.00000
3.00000
4.00000
5.00000
6.00000
7.00000
8.00000
9.00000
10.00000

Ln[x(i)]
0.00000
0.69315
1.09861
1.38629
1.60944
1.79176
1.94591
2.07944
2.19722
2.30259

y(i)
148.00000
1487.00000
3807.00000
10498.00000
17551.00000
34057.00000
48905.00000
76987.00000
109193.00000
147413.00000

Matriz de informacin A usando Ln (x)


0.00000
1.00000
0.69315
1.00000
1.09861
1.00000
1.38629
1.00000
1.60944
1.00000
1.79176
1.00000
1.94591
1.00000
2.07944
1.00000
2.19722
1.00000
2.30259
1.00000

ln[y(i)]
4.99721
7.30452
8.24460
9.25894
9.77287
10.43579
10.79763
11.25139
11.60087
11.90099

La matriz A transpuesta
0.00000 0.69315 1.09861 1.38629 1.60944 1.79176 1.94591 2.07944 2.19722 2.30259
1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000

Dato At * y1
1
158.68420
2
95.56481
Coeficientes solucin a(i)
1
2.96514
2
5.07782
13
12
11
10
9
8
7
6
5
4

0.5

1.5

2.5

Fig. 3 Ajuste de datos transformados a una forma lineal Ln [y] = 2.96514 Ln [x] + 5.07782.

Para este segundo ejemplo se observa que una transformacin logartmica en ambas variables
permite tener un problema lineal de dos coeficientes. El ajuste que se logra se puede observar en
la Figura 3. En las Figuras A.1 y A.2 se muestra el efecto de la transformacin logartmica sobre
los datos originales.
Conclusiones
En el trabajo se han presentado las ideas fundamentales para el ajuste de datos
experimentales a polinomios o formas no lineales, pero que forman un sistema lineal en los
coeficientes. Se desarroll de manera detallada el procedimiento para obtener las frmulas
matriciales generales las cuales permiten resolver este importante problema en la prctica de la
ingeniera y de la ciencia. Al tener un mayor nmero de mediciones, se aumenta la
REDUNDANCIA y se puede aplicar pruebas de hiptesis sobre los coeficientes. Tambin se
puede asignar un mayor peso o "credibilidad" que refleje la calidad de la medicin; con este
procedimiento se obtiene el resultado que se conoce como mnimos cuadrados ponderados.
6

Referencias
[1] Stephen A. DeLurgio, Forecasting Principles and Applications, McGraw-Hill International Editions,
1998.
[2] Masterton, Slowinski, Elementary Mathematical Preparation for General Chemistry, Saunders
Golden Series, 1974.
[3] V. P. Spiridonov, A. A. Lopatkin, Tratamiento Matemtico de Datos Fsico-Qumicos, Editorial MIR,
Mosc, 1973.

Apndice
4

15

x 10

10

10

10

Fig. A.1 Datos observados y vs. x, Ejemplo 2.


12
11
10
9
8
7
6
5
4

Fig. A.2 Datos transformados Ln[y] vs. x, Ejemplo 2.

También podría gustarte