Está en la página 1de 5

PREPARACIÒN Y EVALUACIÒN DE PROYECTOS CIV-390

REGRESION LINEAL

I. MARCO TEÓRICO

La primera forma de regresión lineal documentada fue el método de los mínimos


cuadrados que fue publicada por Legendre en 1805, Gauss publicó un trabajo en donde
desarrollaba de manera más profunda el método de los mínimos cuadrados, y en dónde
se incluía una versión del teorema de Gauss-Márkov.

El término regresión se utilizó por primera vez en el estudio de variables antropométricas:


al comparar la estatura de padres e hijos, donde resultó que los hijos cuyos padres tenían
una estatura muy superior al valor medio, tendían a igualarse a éste, mientras que
aquellos cuyos padres eran muy bajos tendían a reducir su diferencia respecto a la
estatura media; es decir, "regresaban" al promedio. La constatación empírica de esta
propiedad se vio reforzada más tarde con la justificación teórica de ese fenómeno.

El término lineal se emplea para distinguirlo del resto de técnicas de regresión, que
emplean modelos basados en cualquier clase de función matemática. Los modelos
lineales son una explicación simplificada de la realidad, mucho más ágiles y con un
soporte teórico mucho más extenso por parte de la matemática y la estadística. .

El objetivo de un modelo de regresión es tratar de explicar la relación que existe entre


una variable dependiente (variable respuesta) Yun conjunto de variables independientes
(variables explicativas) X1, ..., Xn.

En un modelo de regresión lineal simple tratamos de explicar la relación que existe entre
la variable respuesta Yy una única variable explicativa X.

Mediante las técnicas de regresión de una variable Y sobre una variable X, buscamos
una función que sea una buena aproximación de una nube de puntos (xi, yi), mediante
una curva del tipo:

FACULTAD DE INGENIERIA CIVIL Página 1


PREPARACIÒN Y EVALUACIÒN DE PROYECTOS CIV-390

El modelo de regresión lineal simple tiene la siguiente expresión:

= + +

En donde es la ordenada en el origen (Valor que toma Y cuando X vale 0), es la


pendiente de la recta (explica cómo cambia Y al incrementar X en una unidad) y una
variable que incluye un conjunto grande de factores cada uno de los cuales influye en
la respuesta sólo en pequeña magnitud a la que llamaremos error. X e Y son variables
aleatorias, por lo que no se puede establecer una relación lineal exacta entre ellas

II. FORMULAS

Método de los mínimos cuadrados

Para hacer una estimación del modelo de regresión simple trataremos de buscar una
recta de la forma:

= +

De modo que se ajuste a una nube de puntos.

Para esto utilizaremos el método de mínimos cuadrados. Este método consiste en


minimizar la suma de los cuadrados de errores

= ( + )

Es decir, la suma de los cuadrados de las diferencias entre valores reales observados (y)
y los valores estimados (yi).

Con este método, las expresiones que se obtienen para y son los siguientes:

∗ ∑( ∗ ) − ∑ ∗ ∑
=
∗ ∑ − |∑ |

∑ ∗ ∑ − ∑ ∗ ∑( ∗ )
=
∗ ∑ − |∑ |

FACULTAD DE INGENIERIA CIVIL Página 2


PREPARACIÒN Y EVALUACIÒN DE PROYECTOS CIV-390

Σ Es el símbolo sumatorio de todos los términos, mientas (x, y) son los datos en estudio
y n la cantidad de datos que existen.

El método de mínimos cuadrados calcula a partir de los n pares de datos


experimentales (x, y), los valores a y b que mejor ajustan los datos a una recta. Se
entiende por el mejor ajuste aquella recta que hace mínimas las distancias d de los
puntos medidos a la r

∗ ∑( ∗ ) − ∑( ) ∗ ∑( )
=
[ ∗ (∑ ) − ∑( ) ] ∗ [ ∗ ∑( ) ∗ ∑( ) ]

El coeficiente de correlación puede valer cualquier número comprendido entre -1 y +1.

· Cuando r=1, la correlación lineal es perfecta, directa.

· Cuando r=-1, la correlación lineal es perfecta, inversa

· Cuando r=0, no existe correlación alguna, independencia total de los valores X e Y

Teniendo una serie de datos (x, y), mostrados en un gráfico o gráfica, si al conectar
punto a punto no se describe una recta, debemos aplicar el método de mínimos
cuadrados

Variantes de la regresión lineal

Función potencial:

Se puede transformar en log( ) = ∗ log( ) + log( )

Si usamos nuevas variables = log( ) = log( ) obtenemos la relación lineal

= +

Donde

= log( )

FACULTAD DE INGENIERIA CIVIL Página 3


PREPARACIÒN Y EVALUACIÒN DE PROYECTOS CIV-390

Función Exponencial:

=

Tomando logaritmos neperianos a ambos miembros tenemos

ln = ln + ( ∗ ln )

Pero como ln = 1 la expresión queda como:

ln = + ln

Si usamos las nuevas variables = = ln obtenemos la relación lineal

= +

Donde

= ln( )

III. Aplicación-Ejemplos
1) Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente,
14, 20, 32, 42 y 44 kilos.

a) Hallar la ecuación de la recta de regresión de la edad sobre el


peso.
b)¿Cuál sería el peso aproximado de un niño de seis años?

xi yi xi² yi² xi · yi
2 14 4 196 28
3 20 9 400 60
5 32 25 1 024 160
7 42 49 1 764 294
8 44 64 1 936 352
25 152 151 5 320 894

FACULTAD DE INGENIERIA CIVIL Página 4


PREPARACIÒN Y EVALUACIÒN DE PROYECTOS CIV-390

= =5 = = 30,4

= − 5 = 5,2 = = 30,4 = 139,84

894
= − 5 ∗ 30.4 = 26,8
5

− 5 = 0,192( − 30) = 0,192 − 0,76

− 30,4 = 5,15( − 5) = , + ,

= 5,15 ∗ 6 + 4,65

= ,

FACULTAD DE INGENIERIA CIVIL Página 5