Está en la página 1de 35

Regresión lineal y polinomial

METODOS NUMERICOS

Evellyn Margarita Blanco Serrano


TECNOLÓGICO NACIONAL
DE MÉXICO
EN CELAYA
REGRESIÓN LINEAL
MÉTODOS NUMÉRICOS

DOCENTE: CLAUDIA MAYELA ALCARAZ AVENDAÑO


APROXIMACIÓN FUNCIONAL
Con frecuencia necesitamos interpretar y correlacionar datos experimentales que se encuentran en
forma de datos discretos, estos pueden ser aproximados mediante funciones analíticas sencillas, las
cuales se pueden evaluar, integrar o diferenciar fácilmente.

Existen dos maneras de aproximar un grupo de datos con base en el error asociado.
1. Cuando los datos muestran un grado significativo de error, por ejemplo, cuando se utilizan datos
experimentales, la estrategia es derivar una curva simple que represente el comportamiento
general de los datos, en la que cada punto pueda ser incorrecto, pero la curva se diseñe de tal
manera que siga un patrón sobre los puntos tomados como un todo. En este proceso se puede
utilizar la regresión con mínimos cuadrados o regresión.

2. Por otro lado, cuando se conoce que los datos son muy exactos, el proceso de ajustar un grupo de
datos a una curva que pase exactamente por cada uno de los puntos se puede llevar a cabo por
medio de polinomios, los cuales se conocen como polinomios de interpolación.
1) REGRESIÓN POR MINIMOS CUADRADOS.

El método de mínimos cuadrados consiste en encontrar una función analítica sencilla que represente el comportamiento general
de los datos, aunque la curva propuesta no pase por todos y cada uno de los puntos en cuestión. Está ecuación debe satisfacer
la condición de minimizar la suma de las desviaciones (di) del comportamiento de cada par de datos discretos, con respecto al
comportamiento del método propuesto, elevadas al cuadrado, es decir:
2
=0 [1]

1.1) REGRESIÓN LINEAL

El ejemplo más simple de una aproximación por mínimos cuadrados, consiste en ajustar a una línea recta un conjunto de datos
discretos (x1,y1), (x2,y2), …., (xn, yn).

Se inicia la ecuación de una línea recta a la cual se le agrega el error producido entre el comportamiento de los datos y el modelo
propuesto, de esta forma se tiene: y = a0 + a1x [2]

Donde:

a0 = Ordenada al origen.
a1 = Pendiente.
De esta forma:
E = y – a0 – a1x [3]

Al aplicar el criterio de que el “mejor” ajuste se cumple cuando se puede minimizar la suma de los cuadrados
de los residuos Sr, es decir el error entre el modelo y los datos experimentales, se tiene:

[4]
Este criterio tiene la ventaja de proporcionar una línea única para un conjunto dado de datos.
Para determinar los valores de a0 y a1 que minimizan la ecuación (4), se deriva la ecuación con respecto a cada
uno de los coeficientes.
𝑑𝑆𝑟
= - 2 Σ(yi – a0 – a1xi)= 0
𝑑𝑎0 [5]
𝑑𝑆𝑟
𝑑𝑎1 = - 2 Σ[(yi – a0 – a1xi) xi]= 0
Al igual ambas derivadas a cero, se genera un mínimo para la suma de los cuadrados de los residuos Sr, de la
siguiente forma:
- 2 Σ(yi – a0 – a1xi)= 0 = Σyi – Σa0 – Σa1xi [6]

- 2 Σ(yi – a0 – a1xi) xi = 0 = Σyixi – Σa0xi – Σa1xi 2 [7]

De la ecuación (6) se obtiene:


Σyi = na0 + a1Σxi [8]

De la ecuación (7) se obtiene:


Σyixi = a0Σxi + a1Σ(x)i2 [9]
Al resolver en forma simultánea las ecuaciones (8) y (9) se obtienen los valores de a0 y a1, mediante las
siguientes ecuaciones:
[10]

ȳ [11]

CUANTIFICACION DEL ERROR EN LA REGRESIÓN LINEAL

Recordemos que la suma de los cuadrados de los residuos se define como:

Donde los residuos representan el cuadrado de la distancia vertical entre los datos y la línea recta.
La dispersión de los puntos alrededor de la recta es de magnitud similar a lo largo de los datos, la regresión con
mínimos cuadrados proporciona la mejor aproximación a y b. A esto se le conoce como principio de probabilidad
máxima dentro de la estadística.
Para comparar la eficiencia del ajuste se determina la suma de los cuadrados alrededor de la media para la variable
dependiente (y), la cual se denomina suma total de los cuadrados.

[12]

Ésta es la cantidad de dispersión en la variable dependiente antes de la regresión. Después de llevar a cabo la
regresión lineal se puede calcular Sr, que es la suma de los cuadrados de los residuos alrededor de la línea de
regresión, la cual presenta la dispersión que existe después de la regresión. La diferencia entre las dos cantidades, St
– Sr cuantifica la mejora en la reducción del error al utilizar la línea recta. Esta diferencia se normaliza al error total y
se obtiene:
[13]
[14]

donde r es el coeficiente de correlación.

Si el coeficiente de
correlación tiende a
1, se dice que se tiene
un buen ajuste.
EJEMPLO 1:

Utilice la regresión por mínimos cuadrados para ajustar a una línea recta el grupo de datos mostrado:

x y
1 75
2 78
5 97
10 123
20 160
30 200
40 240

a) Haga una gráfica de los datos.


b) Obtenga la ecuación de la recta y el coeficiente de correlación.
SOLUCIÓN:

a) Se grafican los datos, y se ve con claridad que tienden hacia una línea recta, por lo que
aplicaremos mínimos cuadrados

300

250

200

150

100

50

0
0 5 10 15 20 25 30 35 40 45
b) Realizamos la tabla correspondiente para poder obtener a1 y a0 (se utilizan las fórmulas [10] y [11]
respectivamente). Y así obtener la ecuación de la recta [2]

De esta forma obtenemos:


2 2
x y xy x (yi-y)
1.000000 75.000000 75.000000 1.000000 4096.000000

2.000000 78.000000 156.000000 4.000000 3721.000000


a1= 4.204693
5.000000 97.000000 485.000000 25.000000 1764.000000 a0= 74.12759271
10.000000 123.000000 1230.000000 100.000000 256.000000

20.000000 160.000000 3200.000000 400.000000 441.000000


Ecuación de la recta:
30.000000 200.000000 6000.000000 900.000000 3721.000000
y = 74.127593 + 4.204693x
40.000000 240.000000 9600.000000 1600.000000 10201.000000

total 108.000000 973.000000 20746.000000 3030.000000 24200.000000


b) Ahora agregamos 2 columnas para calcular el coeficiente de correlación [14]

x y xy x2 (yi-a0-a1xi)2 (yi-y)2 Quedando


1.000000 75.000000 75.000000 1.000000 11.104128 4096.000000

2.000000 78.000000 156.000000 4.000000 20.584177 3721.000000 El coeficiente de


5.000000 97.000000 485.000000 25.000000 3.418586 1764.000000 correlación
r= 0.998133
10.000000 123.000000 1230.000000 100.000000 46.587131 256.000000
El coeficiente de
20.000000 160.000000 3200.000000 400.000000 3.163226 441.000000 correlación tiende
a 1, por lo que fue
un buen ajuste.
30.000000 200.000000 6000.000000 900.000000 0.072030 3721.000000

40.000000 240.000000 9600.000000 1600.000000 5.360685 10201.000000

total 108.000000 973.000000 20746.000000 3030.000000 90.289964 24200.000000

Sr St
AHORA LEE LOS CODIGOS QR PARA VISUALIZAR LOS EJEMPLOS DE
REGRESIÓN LINEAL:

VIDEO: EJEMPLO 1 VIDEO: EJEMPLO 2

Una vez hecho lo anterior, resuelve en tu libreta el problema resuelto por cada una de las
formas vistas en los videos.
Ejercicio 2: Resuelve en tu libreta por el método de mínimos
cuadrados.

De acuerdo a la información mostrada en la tabla:

MES COSTO (Y) HORAS (X)


ENERO 400 10.00 a) Realice una gráfica de los datos.
FEBRERO 500 12.50 b) Obtenga la ecuación de la
MARZO 500 17.50 recta y el coeficiente de
ABRIL 600 20.00 correlación.
MAYO 1,500 50.00 c) Determine ¿cuáles serán
JUNIO 900 30.00 los costos en
TOTAL 4,400 140.00 una jornada de trabajo de
40 horas?
TECNOLÓGICO NACIONAL
DE MÉXICO
EN CELAYA
REGRESIÓN CUADRATICA O POLINOMIAL
MÉTODOS NUMÉRICOS

DOCENTE: CLAUDIA MAYELA ALCARAZ AVENDAÑO


REGRESIÓN CUADRATICA O POLINOMIAL

Algunos datos discretos se representan pobremente mediante una línea recta, tal como se
aprecia en la siguiente figura.

En este caso, es recomendable utilizar una curva para representarlos, por lo que otra
alternativa es ajustar a polinomios, utilizando regresión polinomial.
El método de mínimos cuadrados se puede extender fácilmente del caso lineal al polinomial y ajustar datos
discretos aun polinomio de m-ésimo grado.
El procedimiento se inicia de la ecuación de un polinomio de m-ésimo grado a al cual se le agrega el error
producido entre el comportamiento de los datos y el modelo propuesto, de esta forma se tiene:

y= a0 + a1xi + a2xi2 + ... + amxim + E

Donde:
E= Error entre el modelo y los datos experimentales De esta forma:
E= yi - a0 - a1xi - a2xi2 - ... - amxim
Al aplicar el criterio de que el "mejor" ajuste se cumple cuando se puede minimizar la suma de los cuadrados
de los residuos Sr, es decir el error entre el modelo y los datos experimentales, se tiene:

Sr= yi - a0 - a1xi - a2xi2 - ... - amxim )2

Al seguir el mismo procedimiento de la sección anterior se calcula la derivada de la ecuación anterior con
respecto a cada uno de los coeficientes del polinomio.
Para aplicar el mínimo, estas ecuaciones se igualan a cero y se reordenan para obtener el siguiente conjunto:
Donde las sumatorias varían desde i=1 hasta n.

Las m + 1 ecuaciones son lineales y tienen m + 1 incógnitas: a0, a1,..., am


Los coeficientes de las incógnitas se pueden calcular directamente de los datos observados. El problema de
determinar polinomios de grado m con mínimos cuadrados es equivalente a resolver un sistema de m + 1
ecuaciones lineales simultáneas.

El coeficiente de correlación r se calcula mediante:

Si el coeficiente de
correlación tiende a 1,
donde: se dice que se tiene un
buen ajuste.
EJEMPLO:
Ajuste los siguientes datos discretos a un polinomio de 2° orden:

3. Haga una gráfica de los datos.


4. Presente la ecuación del modelo ajustado y el coeficiente de correlación.
SOLUCIÓN:
2) Haga una gráfica de los datos.

y
7.000000

6.000000

5.000000

4.000000

3.000000

2.000000

1.000000

0.000000
0.000000 0.50 0000 1.000000 1.500000 2.00 0000 2.50 0000
-1.000000
SOLUCIÓN:

3) Como se observa en la gráfica, el comportamiento de los datos, se encuentra lejos de ser lineal,
por lo que se propone un polinomio de segundo orden de la forma:

𝑦 =𝑎 +
0 𝑎 1 𝑥 +𝑎 2 𝑥2

Y el sistema que se debe plantear es aquel formado por tres ecuaciones con tres incógnitas:
Por lo tanto se genera una tabla que contenga los valores de las sumatorias que se requieren para
aplicar las ecuaciones anteriores:
Mediante los datos de la tabla anterior se plantea el sistema:

Que al ser resuelto este sistema de Por lo que la ecuación de segundo


ecuaciones por uno de los métodos grado que representa el conjunto de
estudiados se obtiene: datos es:
Ahora agregamos 2 columnas para calcular el coeficiente de correlación, quedando:

Quedando

El coeficiente de
correlación r=
0.998283

El coeficiente de
correlación tiende
a 1, por lo que fue
un buen ajuste.

Sr St
AHORA LEE LOS CODIGOS QR PARA VISUALIZAR LOS VIDEOS PARA
REFORZAR EL TEMA

Video 1 Video 2
Ejercicio: Resuelve en tu libreta por el método de regresión cuadrática.

De acuerdo a la información mostrada en la tabla:

X Y Ajuste los siguientes


0 2.1 datos discretos a un
1 7.7 polinomio de 2°
2 13.6 orden:
3 27.2
4 40.9 3.1) Haga una gráfica de los datos.
Presente
5 la ecuación
61.1 del modelo ajustado y el coeficiente de c

También podría gustarte