MODULO 3
REGRESION LINEAL
Y* a bx (1)
y5 P5
*
y3 P
*y3 y
3 *
y4 *y 4 y*
* P4
y1 P1 yi y* desviaciones
y1 y* *y 2 y*
y2 P2 O errores
*
0 x1 x2 x3 x4 x5 x
P á g i n a 1|8
MODULO 3: REGRESION LINEAL DOCENTE: ING. CAMILO MARIN G.
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
Usando el método de los mínimos cuadrados, para el conjunto de puntos P1 , P2 ,P3 ,… ,Pn
la suma de los cuadrados de las desviaciones (errores) entre los valores estimados (𝑦∗) y los
n
i 1
La suma de las desviaciones debe ser mínima, es decir que el valor de s debe ser el menor
posible. por consiguiente, si reemplazamos la adecuación (1) en (2) se tiene:
s y (a bx) y 2 2 y (a bx) 2
2
Aplicando sumatorias:
Para que s sea mínimo debemos derivar e igualar a cero derivando (3) respecto de “a” y luego
respecto a “b” se tiene:
ds
2 y 2na 2b x 0
da
y na b x 0 ; de donde:
a
y b x
(4)
n
ds
2 xy 2a x 2b x 2 0 ; de donde:
db
b
xy a x
x 2 (𝜶)
xy ( n ) x n xy y x b( x)
y b x
2
b
x 2
n x 2
P á g i n a 2|8
MODULO 3: REGRESION LINEAL DOCENTE: ING. CAMILO MARIN G.
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
n xy x y
b
n x 2 ( x ) 2
(5)
Las expresiones (4) y (5) proporcionan los valores de “a” y “b” de la ecuación de regresión
lineal (1) y* a bx (1)
n xy x y cor ( x1 y1 )
r (6) r (7)
n x 2 ( x) 2 n y 2 ( y ) 2 x y
P á g i n a 3|8
MODULO 3: REGRESION LINEAL DOCENTE: ING. CAMILO MARIN G.
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
Correlación * Correlación
* *
* positíva * negativa
** *
* *
* **
* * *
* *
0 x 0 * x
Ejemplo:
Una empresa varia su cantidad de producción, de acuerdo a la cantidad de empleados de la
siguiente manera.
N° de Empleados 11 15 20 22 24 26 31 36
SOLUCION:
a) llamamos: x= número de empleados
y= cantidad o volumen de producción
La ecuación de regresión lineal tiene la forma: y a bx , donde: por las fórmulas (4)y(5)
deducidas se tiene:
a
y b x (4) b
n xy x y
(5)
n n x 2 ( x ) 2
P á g i n a 4|8
MODULO 3: REGRESION LINEAL DOCENTE: ING. CAMILO MARIN G.
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
x
x i
185
n 8
x 23,125
y 457
Empleados Producción xi yi xi 2 yi 2
xi yi
P á g i n a 5|8
MODULO 3: REGRESION LINEAL DOCENTE: ING. CAMILO MARIN G.
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
68424
r 0,9911 r 0,9911
69035,10
Como r se acerca a 1, se concluye que se tiene un alto grado de relación entre las variables
“x” e “y”.
Otro método para la determinación del coeficiente de correlación “r”
cov( x, y )
Consiste en utilizar la formula (7) es decir r
x y
xy
xy xy
r xy
x y n
donde
x x 2
( x) 2
y y 2
( y)2
n ; n
93098
xy 10568,125 xy 1069,125
8
4739
x (23,125) 2 x 7,59
8
1832.368
y (457) 2 y 142,116
8
1069,125 1069,125
r
7,59 142,116 1078, 662
P á g i n a 6|8
MODULO 3: REGRESION LINEAL DOCENTE: ING. CAMILO MARIN G.
ESTADISTICA Y ANALISIS NUMERICO CARRERA DE INGENIERIA CIVIL
r 0,9911
La ecuación de regresión lineal también se calcula con:
xy 1069,125
b b 18,56
x 2 (7,59) 2
a y b x 457 18, 56 23125 a 27,84
* *
Estos límites se
* t
*t
* establecen por el
t
* * * t
t investigador de acuerdo al
t t grado de seguridad que
* * t
exija el problema de
t
* Bandeja de seguridad investigación (5%;10%,
* t t
etc.) estableciendo por
t
encima y debajo de la
recta estos porcentajes.
0 1 o 0 r2 1
permite indicar el grado de certeza con que una variable depende de la otra. Si se
considera un rango de 0a 100%se tiene:
* * y ab x
t*
t
log y log a x log b
* * * t *
t t
* t y a b log x t
*
* t*
t
t * * *
t t
Regresión Logarítmica t
Regresión Exponencial
*
*
* y ax b
*
log y log a b log x
* *
t
* *
t
t Regresión Potencial
P á g i n a 8|8