Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Métodos de mínimos
cuadrados
Modelamiento matemático
Un modelo matemático permite describir las relaciones entre variables que han
sido medidas en un conjunto de datos. La construcción de modelos es un proceso
creativo que depende de la experiencia del modelador, sus preferencias e
intuiciones, así como del objetivo para el cual se construye el modelo.
Se distingue:
• modelos construidos en base a una clase de funciones (polinomios, splines…)
cuyos coeficientes están ajustados a los datos
• modelos construidos en base a leyes físicas que rigen el comportamiento de los
datos
• modelos mecanísticos, cuya estructura proviene de mecanismos o leyes físicas,
pero cuyos parámetros son ajustados de manera de reproducir los datos
medidos.
Modelamiento matemático
Planteamiento general
Se desea ajustar estos datos de modo de estimar los valores { ŷi , i = 1… N} que
se tendrían si no hubiese ningún error de medición.
Mínimos cuadrados
Una manera de ajustar los datos es minimizar la suma de los errores cuadráticos:
N
yi − yˆ i
χ =∑ε
2 2
i con ε i =
i =1 σi
Grados de libertad
GL = N − (M + N ) + L = L−M
Residuos de la regresión
Se puede utilizar este resultado para medir la calidad del ajuste, dado que las
tablas de la distribución del chi cuadrado indican la probabilidad de superar un
determinado valor para χ2.
Mínimos cuadrados
∀i ∈{1,...N }, yˆ i = a
Se busca minimizar
2
N
y −a
χ2 = ∑ i
i =1 σ
La solución es
1 N
aˆ = ∑ yi = y
N i =1
Es decir, el mejor ajuste de los datos {yi, i = 1… N} por una constante corresponde
a la media aritmética de estos datos (en caso de haber considerado desviaciones σi
variables, se hubiese encontrado una media ponderada de los datos). La calidad del
ajuste se puede evaluar al calcular la suma de residuos cuadráticos
2
N
y − y
χ2 = ∑ i
i =1 σ
y comparar su valor con el valor crítico para una variable del chi cuadrado con
N – 1 grados de libertad.
Mínimos cuadrados
yi − yˆ i
εi =
σi
Ejemplo introductorio
∀i ∈{1,...N }, yˆ i = b xi
donde:
• se dispone de mediciones {yi, i = 1… N} con desviación σ
∑x i yi
bˆ = i =1
N
∑i
x 2
i =1
∀i ∈{1,...N }, yˆ i = a + b xi
donde:
• Se dispone de mediciones {yi, i = 1… N} con desviación σ desconocida.
N
S E = ∑ ( yi − a − b xi ) 2
i =1
∂S E N
∂a = −2∑ yi − a − b xi = 0
i =1
N
∂S E = −2 x ( y − a − b x ) = 0
∂b ∑
i =1
i i i
Ajuste de un modelo lineal
de una variable
La solución es:
N
∑ ( yi − y ) ( xi − x )
covarianza entre x e y
bˆ = i =1 N =
varianza de x
∑
i =1
( xi − x ) 2
aˆ = y − bx
1 N
x = N ∑ xi (media de x)
con i =1
y = 1
N
∑
N i =1
yi (media de y)
Ajuste de un modelo lineal
de una variable
Estimación de la desviación estándar σ
SE
σˆ =
N −2
Ajuste de un modelo lineal
de una variable
Incertidumbre en los parámetros de regresión
E{aˆ} = a
E{bˆ} = b
2
σ2 (x2 ) σ 1
var{aˆ} = var{bˆ} =
N ( x 2 ) − ( x )2 N ( x2 ) − ( x )2
2
σ x x
cov{aˆ , bˆ} = − corr{aˆ , bˆ} = −
N ( x2 ) − ( x )2 (x2 )
Ajuste de un modelo lineal
de una variable
aˆ − a ( x2 ) − ( x )2 bˆ − b
TN − 2 = N TN′ − 2 = N [( x 2 ) − ( x ) 2 ]
σˆ (x2 ) σˆ
Ajuste de un modelo lineal
de una variable
Significancia de la regresión
∑ (x
i =1
i − x ) ( yi − y )
R=
N 2
N
∑ ( xi − x ) ∑ ( yi − y ) 2
i =1 i =1
N −2
Bajo la hipótesis nula, se define una variable de Student como TN′′− 2 = R
1 − R2
donde:
• el índice i se refiere al número del dato (entre 1 y N)
• el índice j se refiere al número de la variable (entre 1 y M)
N M
S E = ∑ ( yi − ∑ a j xij ) 2
i =1 j =1
Ajuste de un modelo lineal
de varias variables
Estimación de los parámetros de regresión
∂S E
∀j ∈ {1,...M }, =0
∂a j
O sea:
N M
∀j ∈ {1,...M }, ∑ 2( yi − ∑ ak xik ) xij = 0
i =1 k =1
Ajuste de un modelo lineal
de varias variables
Para expresar la solución, es conveniente utilizar notaciones vectoriales y
matriciales. Sea
Xt X A = Xt Y
ˆ = ( X t X ) −1 Xt Y
A
SE
σ̂ =
N −M
Ajuste de un modelo lineal
de varias variables
Incertidumbre en los parámetros de regresión
C = σ 2 ( Xt X ) −1
ˆ = σˆ 2 ( Xt X ) −1
C
M
∀i ∈{1,...N }, yi = ∑ a j xij + ε i
j =1
S R /( M − 1)
F=
S E /( N − M )
SR S
R2 = =1− E
S S
S E /( N − M )
R′2 = 1 −
S /( N − 1)
2 S E ( x1 ,..., x j −1 , x j , x j +1...xM )
R Y j •1, 2 ,..., j −1, j +1,..., M = 1−
S E ( x1 ,..., x j −1 , x j +1...xM )
yˆ = a1 x1 + a2 x2 + ...+ aM xM
• a1 = 0 (una condición)
• a1 = 0 y a2 = 1 (dos condiciones)
• a1 + a2 = 0 (una condición)
Test de un modelo lineal
sujeto a condiciones
El modelo inicial puede re-escribirse en un modelo transformado, el cual toma en
cuenta las condiciones lineales:
• yˆ = a2 x2 + ...+ aM xM
• yˆ = x2 + a3 x3 + ...+ aM xM
• yˆ = a1 ( x1 − x2 ) + ...+ aM xM
S E ( H 0 ) − S E ( H1 )
F= k
S E ( H1 )
N −M
Casos particulares
j =0
donde:
• el índice i se refiere al número del dato (entre 1 y N)
• el índice j se refiere al grado del monomio (entre 0 y M)
N
S E = ∑ ( yi − f ( A; X i )) 2
i =1
∂S E N
∂f ( A; Xi )
∀j ∈ {1,...M }, = −∑ ( yi − f ( A; Xi )) =0
∂a j i =1 ∂a j
Ajuste de un modelo no lineal
de varias variables
Para resolver las ecuaciones anteriores (ecuaciones normales), se suele recurrir a
métodos iterativos, como por ejemplo los métodos de Levenberg-Marquardt y
de Gauss-Newton. A continuación, se explica el principio de dichos métodos.
M
∂f ( A k ; X i )
f (A min
; Xi ) ≈ f ( A ; Xi ) + ∑
k
δa j
j =1 ∂a j
con δa j = a min
j − a k
j
Ajuste de un modelo no lineal
de varias variables
La suma de cuadrados se escribe entonces bajo la forma
2
N M
∂f ( A k
; Xi )
S E = ∑ yi − f ( A ; X i ) − ∑
k
δa j
i =1 j =1 ∂a j
∀j ∈{1,...M }, a kj +1 = a kj + δa j
Ajuste de un modelo no lineal
de varias variables
Después de numerosas iteraciones, se obtiene la solución para los parámetros
{aj, j = 1… M}, o sea { â min
j , j = 1… M}. Se obtiene también una aproximación
de la matriz de varianza – covarianza de estos parámetros:
ˆ = σˆ 2 ( Xt X ) −1
C
SE
donde σ̂ = es una estimación de la desviación estándar σ desconocida
N −M
X es una matriz de tamaño N × M cuyo término genérico es
ˆ min ; X )
∂f ( A i
∂a j
Ajuste de un modelo no lineal
de varias variables
Modelos particulares
• regresión polinomial
• regresión potencia (ver ejercicios)
• regresión logística
• regresión poissoniana
Lecturas recomendadas
Condición A
x: 0.536 0.543 0.377 0.940 0.629 0.826
y: 0.540 0.450 0.279 1.176 0.582 1.098
Condición B
x: 0.614 0.357 0.556 1.411 0.650 0.864 0.885 0.554
y: 0.876 0.399 0.570 2.025 1.035 1.533 1.266 0.795
Se desea saber si las rectas de regresión bajo cada condición son iguales o no.
7) Un día, sin razón aparente, la capacidad del circuito de filtración en una planta
disminuyó aproximadamente un 20% y se ha mantenido en este nivel durante
varios días. El superintendente de la planta quiere saber por qué y si es o no
necesario comprar filtros adicionales para recuperar la producción anterior de
la planta. El tiempo necesario para reunir un filtrado de volumen V de una
celda con concentración de sólidos C a presión constante ∆P está representado
por la siguiente ecuación:
V 2 r µC
t= 2 A2 ∆P
(1)