REGRESIÓN POR MÍNIMOS CUADRADOS
REGRESIÓN LINEAL
El ejemplo más simple de una aproximación por mínimos cuadrados es ajutar una línea
recta a un conjunto de observaciones definidas por puntos: (x1, y1), (x2, y2),…, (xn, yn).
La expresión matemática para la línea recta es
y = a 0 + a 1x + e
ao, a1= Coeficientes
e= error
Ejercicio. Ajuste con una REGRESION LINEAL los valores proporcionados en la tabla
Como tenemos 7 puntos, entonces:
n= 7
PARA LA ECUACIÓN LINEAL PARA COEF. DE CORRELACIÓN
xi yi xi*yi xi^2 Promedio y (yi-y)^2 e^2=(yi-a0-a1*x)^2
1 0.5 0.5 1 3.42857143 8.57653061 0.168686224489796
2 2.5 5 4 3.42857143 0.8622449 0.5625
3 2 6 9 3.42857143 2.04081633 0.347257653061224
4 4 16 16 3.42857143 0.32653061 0.326530612244898
5 3.5 17.5 25 3.42857143 0.00510204 0.589604591836734
6 6 36 36 3.42857143 6.6122449 0.797193877551021
7 5.5 38.5 49 3.42857143 4.29081633 0.199298469387755
SUMATORIA 28 24 119.5 140 22.7142857 2.99107142857143
PROMEDIO 4 3.42857 St Sr
x y
a1= 0.83929
a0= 0.07143
SOL. La ecuación de la línea recta que ajustará a los puntos dados es:
y= 0.0714 + 0.839286 x
Ya que se conoce la ecuación, requerimos saber el COEFICIENTE DE CORRELACIÓN
(r, entre más próximo sea a 1, mejor es el ajuste de la curva a los datos)
a) La desviación estandar es sy= 1.94569121
b) El error estandar estimado se obtiene con al ecuación
Por lo tanto sx/y= 0.77344314
c) El COEFICIENTE DE CORRELACION, r.
r= 0.93183561
Por lo tanto, como r es proximo a 1, la ecuación presenta un buen ajuste.
OTRA OPCIÓN ES USAR "Análisis de Datos" de Excel
xi yi
1 0.5
2 2.5
3 2
4 4
5 3.5
6 6
7 5.5
En el Menú "DATOS" seleccionar "Análisis de Datos"
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9318356132188
Coeficiente de determinación R^2 0.8683176100629
R^2 ajustado 0.8419811320755
Error típico 0.7734431367038
Observaciones 7
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Regresión 1 19.7232142857143
Residuos 5 2.99107142857143
Total 6 22.7142857142857
Coeficientes Error típico
Intercepción 0.0714285714286 0.653678757775826
Variable X 1 0.8392857142857 0.146167013783437
La curva de ajuste es y= 0.071428571
El coefiente de correlacion r= 0.931835613
Como el coefieciente de correlación es próximo a 1, indica que la ecuación encontrada tiene un
Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Superior 95.0%
0.10927167294163 0.91723703243 -1.60890616965128 1.75176331 -1.60890617 1.75176331
5.74196388474635 0.002245440086 0.463551443684809 1.21501998 0.46355144 1.21501998
+ 0.8392857 x
ión encontrada tiene un buen ajuste con los datos originales.
perior 95.0%
Ejercicio: Ajustar a un polinomio de segundo grado los datos dados
Cha
xi yi 70
0 2.1
60
1 7.7
2 13.6 50
3 27.2 40
4 40.9
5 61.1 30
20
10
¿Cuánto vale y cuando x=4.5? 0
0 1 2
Solucion:
Como son 6 datos, entonces
Como es un polinomio de 2do grado
xi yi xi^2 xi^3 xi^4 xiyi xi^2*yi
0 2.1 0 0 0 0 0
1 7.7 1 1 1 7.7 7.7
2 13.6 4 8 16 27.2 54.4
3 27.2 9 27 81 81.6 244.8
4 40.9 16 64 256 163.6 654.4
5 61.1 25 125 625 305.5 1527.5
∑= 15 152.6 55 225 979 585.6 2488.8
Plantear el sistema a resolver, donde las incógnitas son ao, a1 y a2 (que son los coeficientes del polinomio de 2do
6 ao + 15 a1 + 55
15 ao + 55 a1 + 225
55 ao + 225 a1 + 979
Resolver el Sistema por el Método de tu preferencia
0.82142857 -0.58928571 0.08928571
X= A-1*B= -0.58928571 0.72678571 -0.13392857
0.08928571 -0.13392857 0.02678571
Por lo tanto, mis coeficientes son ao=
a1=
a2=
La ecuación cuadrática es y=
Calcular el valor de r
r= 0.999254
Como r es muy próximo a 1, entonces la curva correspondiente a la función cuadrática se ajusta bie
El valor de y cuando x=4.5 es y= 50.775
Chart Title
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6
n= 6
m= 2 y se requiere resolver el sistema lineal
𝑥 ̅=
2.5
𝑦 ̅= 25.4333333
Promedio y (yi-y)^2 e^2=(yi-a0-a1*x-a2*x^2)^2
25.4333333 544.44 0.143316326530569
25.4333333 314.47 1.00285918367327
25.4333333 140.03 1.0816000000005
25.4333333 3.12 0.804865306121773
25.4333333 239.22 0.619593877551809
25.4333333 1272.11 0.094336734693502
2513.39 3.74657142857143
los coeficientes del polinomio de 2do grado)
MATRIZ DE COEFICIENTES AUMENTADA
a2 = 152.6 6 15 55 152.6
a2 = 585.6 15 55 225 585.6
a2 = 2488.8 55 225 979 2488.8
152.6 2.478571429
* 585.6 = 2.359285714
2488.8 1.860714286
2.47857143
2.35928571
1.86071429
2.478571 + 2.359286 x + 1.860714 x^2
e a la función cuadrática se ajusta bien a los valores de la tabla.
FORMULAS
si x= 4.5
y= 50.7748
Linealización de relaciones no lineales
Se pueden utilizar, por ejemplo:
* MODELO EXPONENCIAL: Se linealiza aplicando el ln
* MODELO MEDIANTE UNA ECUACION DE POTENCIAS: Se linealiza aplicando el Log
*MODELO MEDIANTE UNA ECUACIÓN DE RAZÓN DE CRECIMIENTO: Se linealiza aplicando el inverso
ENTRE OTRAS
EJERCICIO
Ajuste los datos proporcionados en la tabla mediante una TRANSFORMACIÓN LOGARITMICA DE LOS DATOS
x y 1o. GRAFICAR LOS DATOS
1 0.5
2 1.7 Gráfica de los puntos (DATOS)
3 3.4 Se observa que los datos no se ajustan a una linea recta, sin
4 5.7 embargo se pueden LINEALIZAR,, mediante, en este caso una
5 8.4 TRANSFORMACIÓN LOGARÍTMICA
9
8
7
6
5
4
3
2
1
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
2o. Identificar que tipo de FUNCIÓN se parece, en este caso es una función de potencias
Por mera observación de la gráfica, se puede ver que la curva correspondiente a los datos se ajustaría bien a una ecuación de la forma y =α2.x^β2
La ecuación y =α2.x^β2 es linealizada al aplicar el logaritmo de base 10 obtieniéndose
log y =β2 log x + log α2
3o. Aplicar a los DATOS el LOG, los nuevos valores se usan para linealizar los datos
x y log x log y
1 0.5 0 -0.30103
2 1.7 0.30103 0.230449
3 3.4 0.477121 0.531479
4 5.7 0.60206 0.755875
5 8.4 0.69897 0.924279
4o. LINEALIZAR
Como tenemos 5 puntos, entonces:
n= 5
PARA LA ECUACIÓN LINEAL PARA COEF. DE CORRELACIÓN
xi yi xi*yi xi^2 Promedio y (yi-y)^2 e^2=(yi-a0-a1*x)^2
0 -0.30103 0 0 0.4282104 0.531791550144 6.564258128002E-07
0.30103 0.23044892 0.06937204 0.0906 3.42857143 10.22798757102 1.120477721456E-05
0.47712125 0.53147892 0.25357989 0.2276 3.42857143 8.393145020358 1.669436046503E-05
0.60205999 0.75587486 0.45508201 0.3625 3.42857143 7.143306970786 2.108088737726E-06
0.69897 0.92427929 0.6460435 0.4886 3.42857143 6.271479135035 9.369221628461E-09
SUMATORIA 2.07918125 2.14105198 1.42407743 1.1693 32.56771024734 3.067302145174E-05
PROMEDIO 0.415836 0.4282104 St Sr
x y
a1= 1.75172365
a0= -0.30021979
La ecuación de la línea recta que ajustará a los puntos dados es:
y= -0.30022 + 1.752 x
log y = log α2 + β2 log x
Si log α2= -0.30022 entonces α2= 0.5009336491
Si m= 1.751724 entonces β2= 1.75172364808
5o. Sustituir los valores de a y b en la función de POTENCIAS
y =α2.x^β2
1.7517
y= 0.5009 x