Está en la página 1de 11

Ajuste de una función lineal: El método de cuadrados mínimos

Vamos a analizar un caso diferente al que hemos tratado hasta ahora que es la medición reiterada de una magnitud. Un problema
muy usual que se presenta en el laboratorio es la medición de variables que están relacionadas entre sí. El caso más simple es
cuando tenemos dos variables, que llamaremos x e y, que siguen una relación lineal y = ax + b. Para cada valor de x (Xi), mediremos
un valor asociado de y (Yi). Si las observaciones se efectúan para N valores de la variable independiente x, obtendremos entonces N
pares de valores (Xi, Yi), con i = 1, . . . , N.

La línea recta representa el modelo que relaciona y con x.

Para cada x el valor medido de la variable y (Y ) difiere de su valor esperado, conforme al modelo, en una cantidad aleatoria e, de tal
manera que se cumple:
Y = ax + b + e = y + e
La variable aleatoria e está normalmente distribuida con valor medio 0 y desviación estándar σ.

Se ha supuesto, por simplicidad, que en cada medida toda la incertidumbre está asociada a la variable dependiente y.
el valor medio de Y es una función lineal de x, de tal manera que la recta de regresión es entonces la línea de valores medios.

Los valores de a, b y σ pueden ser estimados a partir de los pares de datos medidos (Xi, Yi), suponiendo que las observaciones son
independientes entre sí. Un método analítico para encontrar la recta que mejor ajusta a los puntos experimentales es el método de
cuadrados mínimos, también denominado regresión lineal. Según este método la recta que proporciona el mejor ajuste de los datos
es aquella para la cual los valores de a y b minimizan la suma S(a, b) de los cuadrados de las distancias verticales di .
S(a, b) es mínima si |∂S/∂a|a0,b0 = 0 y |∂S/∂b|a0,b0 = 0, donde a0 y b0 son los valores de a y b que minimizan S y reciben el nombre de
estimadores de cuadrados mínimos.
Distribuyendo las sumatorias y evaluando en a0 y b0, el sistema de ecuaciones anterior se reduce a:

La solución de este sistema de ecuaciones es:


También resulta necesario estimar la varianza σ2. La misma da una idea de cuán dispersos están los valores observados Yi respecto de
las correspondientes ordenadas (para cada valor de Xi) en la recta de ajuste.

donde SSE es S(a0, b0). El N−2 en el denominador aparece ya que el sistema de ecuaciones impone condiciones de vinculo (reduce los
grados de libertad) tales que si se tienen N − 2 pares (Xi, Yi) totalmente independientes los restantes dos quedan unívocamente
determinados por el sistema (asumiendo que ya se han determinado a0, b0). Del mismo modo se puede pensar que si mido solo dos
puntos (X1, Y1) y (X2, Y2) aún cuando se puede determinar a0 y b0 queda indeterminada la varianza muestral de Y .
Coeficiente de determinación y de correlación lineal:
Uno se podría preguntar si los valores medidos (Xi, Yi) realmente responden a una relación lineal. Para responder a esta pregunta
debemos idear una cierta medida de qué tan bien la recta encontrada ajusta los datos.

El grado en que un conjunto de puntos admite una relación lineal entre x e y es medida por el coeficiente de determinación
representado por r2:

El coeficiente de determinación r2 es un número que varía entre 0 y 1. Si este número es cercano a 1, los puntos, en general, están
próximos a alguna línea recta; si r2 es cercano a 0, los puntos tienen poca tendencia a yacer sobre una línea recta.

Es importante destacar aquí que algunos autores usan el coeficiente de correlación r definido como:
Las propiedades más importantes del coeficiente de correlación (r) son las siguientes:

- El valor de r no depende de cuál de las dos variables bajo estudio está definida como x y cuál como y.

- El valor de r es independiente de las unidades en las que se midan x e y.

- El intervalo de valores que puede tomar el coeficiente de correlación es −1 ≤ r ≤ 1

- r=1 si y solo si todos los pares (Xi, Yi) están en una línea recta con pendiente positiva y

- r=-1 si y solo si todos los pares (Xi, Yi) están en una línea recta con pendiente negativa.

- El cuadrado del coeficiente de correlación da el coeficiente de determinación.


70
Ecuación y=a*x+b
58 Ecuación y=a*x+b
b -1,2 b 58
60 a 2,3 a -0,4
Residual Sum of Squares 2,62691E-28 Coeficiente de correlación -1
56 Coeficiente de determinación 1
Coeficiente de correlación 1
50 Coeficiente de determinación 1

54
40

y
y

52
30

50
20

10 48

0 46
0 5 10 15 20 25 30 0 5 10 15 20 25 30
x x
Ecuación y = a * x +b
120 120 -3,76806 ± 3,4245
b
a 2,2358 ± 0,11815
Residual Sum of Squares 6981,46222
100 100 Coeficiente de correlación 0,93904
Coeficiente de determinaci 0,8818

80 80

60 60
y

y
40 40
Ecuación y = a * x +b
20 b -1,6134 ± 0,2708
a 2,3022 ± 0,00924 20
Residual Sum of Squares 42,69137
0 Coeficiente de correlación 0,99961
Coeficiente de determinación 0,99923 0

-20
10 20 30 40 50 -20
0 10 20 30 40 50
x
x
250
Ecuación y=a*x+b
b -16,22562 ± 1,32
a 5,17074 ± 0,045
200 Suma de cuadrados 1017,63711
Coeficiente de correlación 0,99818
Coeficiente de determinación 0,99636

150
y

100

50

0
0 10 20 30 40 50
x
Metodo de cuadrados mínimos aplicados a polinomios

Supongamos ahora que medimos dos variables x e y que están relacionadas entre sí siguiendo una relación polinómica.

y=

Según este método el polinomio que proporciona el mejor ajuste de los datos es aquel para el cual los valores de ai
(i = 0, …., n) minimizan la suma S de los cuadrados de las distancias verticales di .

Para encontrar estos valores pedimos que las derivadas parciales de S respecto a cada ai sea igual a cero,

Esto nos proporciona un sistema de n+1 ecuaciones con n+1 incógnitas y su solución nos proporcionará los valores de los
coeficientes ai del polinomio.
250 250
Ecuación y=a*x+b Ecuación y = a0+a1 x +a2 x^2
b -16,22562 ± 1,32 a0 -5,68859 ± 0,3699
a 5,17074 ± 0,045 a1 3,95493 ± 0,03346
a2 0,02384 ± 6,3605E-4
200 Suma de cuadrados 1017,63711 200 Residual Sum of Square 32,94489
Coeficiente de correlación 0,99818 r 0,99988
Coeficiente de determinación 0,99636 Adj. R-Square 0,99988

150 150
y

y
100 100

50 50

0 0
0 10 20 30 40 50 0 10 20 30 40 50

x x

También podría gustarte