Está en la página 1de 12

CN202: MINIMOS CUADRADOS

Clase 1
Es un procedimiento de análisis numérico en la que, dados un conjunto de datos
(pares ordenados y familia de funciones), se intenta determinar la función continua
que mejor se aproxime a los datos (línea de regresión o la línea de mejor ajuste),
proporcionando una demostración visual de la relación entre los puntos de los
mismos. En su forma más simple, busca minimizar la suma de cuadrados de las
diferencias ordenadas (llamadas residuos) entre los puntos generados por la
función y los correspondientes datos.

Este método se utiliza comúnmente para analizar una serie de datos que se
obtengan de algún estudio, con el fin de expresar su comportamiento de manera
lineal y así minimizar los errores de la data tomada.
Necesitamos encontrar una recta y = mx + b. Debemos aplicar el método de
mínimos cuadrados

Eje y
B(x1, y1) Distancia entre A y B
y1 )
A(x1, yr)
yr
)
e
c
e y=mx+b
s
i y=mx1+b=yr
t
X1 a Eje x
m
o
2
s 𝐷𝐴𝐵 = √(𝑦1 − 𝑦𝑟 )
e
n
2
𝐷𝐴𝐵 =(𝑦1c− 𝑦𝑟 )2 = (𝑦1 − (𝑚𝑥1 + 𝑏))2
o
2 n
Sea 𝐷𝐴𝐵 =𝑆
t
Por lo tanto 𝑆 =r (𝑦1 − (𝑚𝑥1 + 𝑏))2 𝑆 = 𝑓(𝑚, 𝑏)
a
r
u
n
a
r
Distancia 1 : y1-yr=y1-(mx1+b)

Distancia 2
Distancia 3

Eje x

Donde
𝐷12 = (𝑦1 − 𝑚𝑥1 − 𝑏)2
𝐷22 = (𝑦2 − 𝑚𝑥2 − 𝑏)2

𝐷𝑛2 = (𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)2

Definimos una función de desviación S como

𝑆 = 𝐷12 + 𝐷22 + 𝐷32 +………+𝐷𝑛2 = ∑𝑛1(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)2

𝑆 = ∑(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)2


1
La función S una función en variables m y b que se deben determina derivando
parcialmente S con respecto a m y b es igual a cero, obteniéndose

𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)(−1) = 0 (1)
𝜕𝑏
𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)(−𝑥𝑛 ) = 0 (2)
𝜕𝑚

𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)(−1) = 0
𝜕𝑏

∑(−𝑦𝑛 + 𝑚𝑥𝑛 + 𝑏) = 0

− ∑(𝑦𝑛 ) + 𝑚 ∑(𝑥𝑛 ) + 𝑏 ∑ 1 = 0

𝑛𝑏 + 𝑚 ∑(𝑥𝑛 ) = ∑(𝑦𝑛 )

Para la ecuación 2:
𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)(−𝑥𝑛 ) = 0
𝜕𝑚

2 ∑(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)(−𝑥𝑛 ) = 0

∑(𝑦𝑛 − 𝑚𝑥𝑛 − 𝑏)(−𝑥𝑛 ) = 0

∑(−𝑥𝑛 𝑦𝑛 + 𝑚(𝑥𝑛 )2 + 𝑏𝑥𝑛 ) = 0


∑ −𝑥𝑛 𝑦𝑛 + ∑ 𝑚(𝑥𝑛 )2 + ∑ 𝑏𝑥𝑛 = 0

𝑏 ∑ 𝑥𝑛 + 𝑚 ∑(𝑥𝑛 )2 = ∑ 𝑥𝑛 𝑦𝑛

De las ecuaciones (1) y (2) obtenemos:

𝑛𝑏 + 𝑚 ∑(𝑥𝑛 ) = ∑(𝑦𝑛 )

𝑏 ∑ 𝑥𝑛 + 𝑚 ∑(𝑥𝑛 )2 = ∑ 𝑥𝑛 𝑦𝑛

𝑏𝑛 + 𝑚 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
{
𝑏 ∑ 𝑥𝑖 + 𝑚 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖

𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑥𝑖 𝑦𝑖

Suma(xi) Suma(yi) 𝑆𝑢𝑚𝑎(𝑥𝑖2 ) 𝑆𝑢𝑚𝑎 (𝑥𝑖 𝑦𝑖 )


Ejemplo 1

𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑥𝑖 𝑦𝑖
1 0,9 1 0,9
2 2,1 4 4,2
3 2,9 9 8,7
4 4,2 16 16,8
5 4,8 25 24
6 6,3 36 37,8
21 21,2 91 92,4
Suma(xi) Suma(yi) 𝑆𝑢𝑚𝑎(𝑥𝑖2 ) 𝑆𝑢𝑚𝑎 (𝑥𝑖 𝑦𝑖 )

Numero de datos: 𝑛 = 6
6𝑏 + 21𝑚 = 21,2
{
21𝑏 + 91𝑚 = 92,4

𝑏 = −0,107 𝑦 𝑚 = 1,040

𝑦 = −0.107 + 1,040𝑥

𝑥𝑖 𝑦𝑖 𝑦𝑖 𝑠𝑜𝑏𝑟𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 𝐸𝑟𝑟𝑜𝑟 = (𝑦𝑟𝑒𝑐𝑡𝑎 − 𝑦𝑖 )2


1 0,9 −0,107 + 1,040(1) = 0,933 0,001
2 2,1 1,973 0,016
3 2,9 3,013 0,013
4 4,2 4,053 0,022
5 4,8 5,093 0,086
6 6,3 6,133 0,028
Fórmulas para calcular b y m

Ejemplo 2
Ajuste a una exponencial
𝑦 = 𝑎𝑒 𝑚𝑥 (1)
Paso 1: Sacar logaritmo neperiano en ambos lados
ln(𝑦) = ln(𝑎𝑒 𝑚𝑥 )
ln(𝑦) = ln(𝑎) + ln(𝑒 𝑚𝑥 )
ln(𝑦) = ln(𝑎) + 𝑚𝑥ln(𝑒)
ln(𝑦) = ln(𝑎) + 𝑚𝑥
Cambio de variable: 𝑧 = ln(𝑦) 𝑦 𝑐 = ln(𝑎)

z=c+𝑚𝑥

𝑐𝑛 + 𝑚 ∑ 𝑥𝑖 = ∑ 𝑧𝑖
{
𝑐 ∑ 𝑥𝑖 + 𝑚 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑧𝑖
𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑧𝑖 = ln(𝑦𝑖 ) 𝑥𝑖 𝑧𝑖

Suma(xi) 𝑆𝑢𝑚𝑎(𝑥𝑖2 ) 𝑆𝑢𝑚𝑎 (𝑧𝑖 ) 𝑆𝑢𝑚𝑎 (𝑥𝑖 𝑧𝑖 )

𝑦 = 𝑎𝑒 𝑚𝑥
𝑎 = 𝑒𝑐

𝑛
2
𝑆 = ∑(𝑦𝑛 − 𝑦𝑎𝑗𝑢𝑠𝑡𝑒 )
1

Clase 2

𝑦 = 𝑏 + 𝑚𝑥
𝑏𝑛 + 𝑚 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
{
𝑏 ∑ 𝑥𝑖 + 𝑚 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖

𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑥𝑖 𝑦𝑖
5 9 25 45
7 11 49 77
10 15 100 150
12 16 144 192
16 20 256 320
20 24 400 480
23 27 529 621
93 122 1503 1885
Suma(xi) Suma(yi) 𝑆𝑢𝑚𝑎(𝑥𝑖2 ) 𝑆𝑢𝑚𝑎 (𝑥𝑖 𝑦𝑖 )

𝑛=7

𝑏𝑛 + 𝑎 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
{
𝑏 ∑ 𝑥𝑖 + 𝑎 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖

7𝑏 + 93𝑎 = 122
{
93𝑏 + 1503𝑎 = 1885

𝑎 = 0,988 𝑦 𝑏 = 4,306
𝑦 = 4,306 + 0,988𝑥

𝑃𝑎𝑟𝑎 𝑦 = 14 𝑐𝑢𝑎𝑙 𝑒𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥


14 = 4,306 + 0,988𝑥
𝑥 = 9,812
𝑛
2
𝑆 = ∑(𝑦𝑛 − 𝑦𝑎𝑗𝑢𝑠𝑡𝑒 )
1

𝑆 = ∑(𝑦𝑛 − (𝑎𝑥 2 + 𝑏𝑥 + 𝑐))2


1

𝑆 = 𝑓(𝑎, 𝑏, 𝑐)

𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑎𝑥2 − 𝑏𝑥 − 𝑐)(−1) = 0 (1)
𝜕𝑐
𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑎𝑥2 − 𝑏𝑥 − 𝑐)(−𝑥) = 0 (2)
𝜕𝑏
𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑎𝑥2 − 𝑏𝑥 − 𝑐)(−𝑥 2 ) = 0 (3)
𝜕𝑎

Para la primera ecuación:


𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑎𝑥2 − 𝑏𝑥 − 𝑐)(−1) = 0 (1)
𝜕𝑐

∑ −𝑦𝑛 + 𝑎 ∑(𝑥𝑛 )2 + 𝑏 ∑ 𝑥 + 𝑐 ∑ 1 = 0
𝑖=1

∑ −𝑦𝑛 + 𝑎 ∑(𝑥𝑛 )2 + 𝑏 ∑ 𝑥 + 𝑐𝑛 = 0
𝑐𝑛 + 𝑏 ∑ 𝑥 + 𝑎 ∑(𝑥𝑛 )2 = ∑ 𝑦𝑛

Para la segunda ecuación:


𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑎𝑥2 − 𝑏𝑥 − 𝑐)(−𝑥) = 0 (2)
𝜕𝑏
𝑛

∑ −𝑦𝑛 𝑥𝑛 + 𝑎 ∑(𝑥𝑛 )3 + 𝑏 ∑ 𝑥 2 + 𝑐 ∑ 𝑥 = 0
𝑖=1
𝑛

𝑐 ∑ 𝑥 + 𝑏 ∑ 𝑥 2 + 𝑎 ∑(𝑥𝑛 )3 = ∑ 𝑦𝑛 𝑥𝑛
𝑖=1

Para la tercera ecuación:


𝜕𝑆
= 2 ∑(𝑦𝑛 − 𝑎𝑥2 − 𝑏𝑥 − 𝑐)(−𝑥 2 ) = 0 (3)
𝜕𝑎

∑ −𝑦𝑛 𝑥 2 + 𝑎 ∑(𝑥𝑛 )4 + 𝑏 ∑ 𝑥 3 + 𝑐 ∑ 𝑥 2 = 0
𝑖=1
𝑛

𝑐 ∑ 𝑥 2 + 𝑏 ∑ 𝑥 3 + 𝑎 ∑(𝑥𝑛 )4 = ∑ 𝑦𝑛 𝑥 2
𝑖=1

Resumen

𝑐𝑛 + 𝑏 ∑ 𝑥 + 𝑎 ∑(𝑥𝑛 )2 = ∑ 𝑦𝑛
𝑛

𝑐 ∑ 𝑥 + 𝑏 ∑ 𝑥 2 + 𝑎 ∑(𝑥𝑛 )3 = ∑ 𝑦𝑛 𝑥𝑛
𝑖=1
𝑛

𝑐 ∑ 𝑥 2 + 𝑏 ∑ 𝑥 3 + 𝑎 ∑(𝑥𝑛 )4 = ∑ 𝑦𝑛 𝑥 2
𝑖=1

𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑥𝑖3 𝑥𝑖4 𝑥𝑖 𝑦𝑖 𝑦𝑖 𝑥𝑖2


-3 15 9 -27 81 -45 135
-1 5 1 -1 1 -5 5
1 1 1 1 1 1 1
3 5 9 27 81 15 45
0 26 20 0 164 -34 186
Suma(xi) Suma(yi) 𝑆𝑢𝑚𝑎(𝑥𝑖2 ) 𝑠𝑢𝑚𝑎(𝑥𝑖3 ) 𝑠𝑢𝑚𝑎(𝑥𝑖4 ) 𝑆𝑢𝑚𝑎 (𝑥𝑖 𝑦𝑖 )

4𝑐 + 0𝑏 + 20𝑎 = 26
0𝑐 + 20𝑏 + 0𝑎 = −34
20𝑐 + 0𝑏 + 164𝑎 = 186
𝑎 = , 𝑏 = −1,7 𝑦 𝑐 =

4𝑐 + 20𝑎 = 26
20𝑐 + 164𝑎 = 186

Para Septiembre
Coeficiente de correlación
El coeficiente de correlación lineal es un número real comprendido entre -1 y 1 es
decir

−𝟏 ≤ 𝒓 ≤ 𝟏
Y la formula breve para calcúlalo es

𝑆𝑋𝑌
𝑟=
𝑆𝑋 𝑆𝑌
Donde 𝑆𝑋𝑌 𝑒𝑠 𝑙𝑎 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎, 𝑆𝑋 𝑦 𝑆𝑌 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑥 𝑦 𝑦

𝑆𝑋𝑌 ̅ − 𝑋.̅ 𝑌̅
= 𝑋𝑌

𝑆𝑋 = √𝑋̅2 − (𝑋̅ )2

𝑆𝑌 = √𝑌̅2 − (𝑌̅)2

El signo del coeficiente de correlación es el mismo que el de la covarianza


a) Si la covarianza es positiva, la correlación es directa.
b) Si la covarianza es negativa, la correlación es inversa.
c) Si la covarianza es nula, no existe correlación.

También podría gustarte