Está en la página 1de 37

SEMANA 2

ANALISIS DE REGRESION
LINEAL Y MULTIPLE
Docente:
Mercedes Aida Osorio Maza
mosorio@uni.edu.pe

2017 - I
TEORIA
TEMAS A DESARROLLAR
Anlisis de Regresin Lineal Simple;
Coeficiente de determinacin, Coeficiente
de correlacin.
Anlisis de Regresin Polinomial de 1er y
2do grado.
Regresin Lineal Mltiple.
Regresin Lineal Mltiple con 2 variables
independientes.
ANLISIS DE REGRESIN
Consiste en emplear mtodos estadsticos que determinen
matemticamente un modelo de la curva que ms se ajusta a
los datos.
Es decir: y= f (xi )
Donde:
y = variable dependiente
x = variable independiente
f = funcin
Para elegir la relacin funcional que ms se ajusta a los
datos lo 1ro que debemos hacer es el diagrama de
dispersin.
DIAGRAMA DE DISPERSIN
Es la grfica de los valores (xi , yi) este diagrama permite
visualizar la tendencia que siguen los puntos ya sea lineal,
exponencial, etc.
Otros diagramas de dispersin:

En base a la tendencia que siguen los datos nosotros


analizamos los diferentes tipos de regresin.
1.- ANLISIS DE REGRESIN LINEAL

2.- ANALISIS DE REGRESION EXPONENCIAL

3.- ANALISIS DE REGRESION POTENCIAL

4.- ANALISIS DE REGRESIN POLINOMIAL

5.-ANALISIS DE REGRESIN LINEAL MLTIPLE


1.- ANLISIS DE REGRESIN LINEAL
Es aquel anlisis cuando la relacin entre x e y es de
tipo lineal.
Matemticamente el modelo ser:

yi A Bx i i

Donde:
y i Variable dependiente
x i Variable indenpendiente
A, B Coeficient es
i Error
Si tenemos un diagrama de dispersin lineal y si asumimos
un modelo de estimacin de la forma:

Tendremos:
yi a bx i
yi a bx i (Modelo Muestral)
i

yi A Bx i (Modelo Poblaciona l)

Para que el modelo estimado este muy prximo al modelo


real, nosotros debemos minimizar el error.
Tomando una observacin el error ser 1 y1 y1
Luego la recta que mejor se ajusta ser aquella que
minimice la suma cuadrado del error:

i2 yi yi min.
2

Es decir:
n
y1 y1 y 2 y 2 ..................yi yi yi yi
2 2 2 2 2
i
i 1

Para hallar los estimadores a y b que hagan mnimo el


error se estimara de:

i2 i2
0 0 Ecuaciones Normales
a b
Obtenemos las Ecuaciones Normales:

1 era Ecuacin Normal

n n

y
i 1
i na b x i
i 1

2 da Ecuacin Normal

n n n

x y
i 1
i i a x i b x 0
i 1 i 1
2
i
2.- ANLISIS DE REGRESIN EXPONENCIAL

Cuando el diagrama de dispersin se nos presenta en la


siguiente forma:
El modelo ser linealizado tomando logaritmo natural y/o
funcin logaritmo.

y ab x

lny lna xlnb


y* a * b * x
La estimacin de a* y b* se halla igual que la regresin
lineal simple de las ecuaciones:

y* na * b * x i

2
Ecuaciones normales
xy* a * x b * x
i i

La regresin exponencial se presenta en muchos problemas


de Fsica, Qumica Economa. Etc.
3.- ANLISIS DE REGRESIN POTENCIAL
Si se presenta un modelo la manera de linealizarlo es
mediante ln y/o log.
lny ln(ax b )
lny lna blnx

Las ecuaciones sern:

i
y *
na * b * i
x *

i i
x * *
y a * i i
x b x *2
COEFICIENTE DE DETERMINACIN (r2)

Es aquella medida conocida tambin como coeficiente de


bondad de ajuste ya que indica en que porcentaje se ajusta
la lnea de regresin al conjuntos de datos.

y - y
2

r 2
i

y i - y
2

y i Valor observado
y i Valor estimado en base al modelo y i a bx i
Grficamente:

r 2 Mide el %de la variacion de " y"explicada por la variable" x"


Grficamente el coeficiente de determinacin se observa:

Se sabe:
y i Valor Observado
y i Valor Estimado
yi - y Desviacin yi con respecto al promedio y.
yi - y desviacin de yi con respecto al promedio y.
i yi yi
Luego:

iy - y 2

iy - y 2
i
2
.

S.Cuad.Tot al S.C. Regresin S.C. Error

Coeficiente de No Determinacin (1 r2)


Nos indica el % porcentaje de la variacin de y que no
depende de la variacin de x, su variacin se debe a los
factores aleatorios.

Coeficiente de Correlacin (r)


Mide el grado de asociacin entre x e y.
En la regresin mltiple:
2
ry.12

2Variables Independientes
4.- ANLISIS DE REGRESIN POLINOMIAL

yi Bo B1x B2 x 2 B3 x 3 .................. i

Se aplica cuando en el diagrama de dispersin los puntos no


siguen una tendencia lineal sino una tendencia curva. Ya sea
de 2do grado, 3ro grado, etc.
Para poder hallar los parmetros:

Bo , B1 , B2 ,..............., etc.

Aplicaremos el criterio de los mnimos cuadrticos:


n


i 1
2
i min

Luego:

i2
0
Bo

Nos genera estimadores que minimicen la suma cuadrado


del error.
Luego obtendremos:

B0 n B1 x B2 x 2 ................ y



B0 x B1 x B2 x .......... yx Ecuaciones Normales
2 3

2
B0 x B1 x B2 x ........ yx
2 3 4

(As sucesivamente)
4.1) REGRESIN POLINOMIAL (2do Grado)
Grficamente:

Expresando matricialmente tenemos:

B0 n B1 x B2 x 2 y Los estimadores

B0 x B1 x B2 x yx B0 , B1 , B2 se hallan
2 3


B0 x 2 B1 x 3 B2 x 4 yx2 de las Ecuaciones Normales
Del modelo:

yi Bo B1x i B2 x i2 i

Matricialmente ser:

y i xB i
y i y i i
Luego:
Ejemplo (n = 4)

y1 1 x1 x12 i
y 2
B0
2 1 x2 x 2 i
2
B1
y 3 1 x3 x3 i
B2
2
y 4 1 x4 x 4 i
Para poder hallar los parmetros, aplicamos el mtodo de los
mnimos cuadrados.

12 y xB y xB

0 0
Bi Bi

xx B xy NOTA : Si
B xx xy yi xB i i yi xB
1

Hallamos (xx) y (xy)

n

xi i
x 2

x x x i
i
x 2
i
x 3

x i2 i
x 3
i
x 4

yi

x y xi yi

xi2 yi

El vector de coeficiente ser:

B 0

B xx xy B1
1

B 2

El modelo matricial ser:

yi xB y/o yi Bo B1x i B2 x i2
5.- ANLISIS DE REGRESIN
LINEAL MULTIPLE
Sean x1, x2, ..................., xP, p variables independientes, y
una variable aleatoria que depende de las k variables
independientes.
El mtodo matemtico de regresin lineal mltiple es:

yi B0 B1x1 B2 x 2 B3X3 .................Bp x p i

El problema al igual que en la regresin lineal es estimar los


parmetros:
B 0 , B1 , B 2 ,.............B P
Esto se halla minimizando la suma cuadrado del error

i min.
2
Si:

yi B0 B1x1 B2 x 2 ........Bp x p
n n n
Q i yi yi
2 2

i 1 i 1 i 1

Luego:

Q
0.
Bk
Nos dar estimadores mnimos cuadrados

Q Q
0, 0,..................
B1 B2
5.1) REGRESIN LINEAL MULTIPLE
(2 Variables Independientes)
Si:

Q 2I yi yi yi B0 B1x1 B2 x 2
n n n
2 2

i 1 i 1 i 1

Luego las ecuaciones normales son:

nB0 B1 x1 B2 x 2 yi
B0 x1 B1 x12 B2 x1x 2 x1 yi
B0 x 2 B1 x1x 2 B2 x 22 x 2 yi
Expresando matricialmente :

yi xB i i
Ejemplo (n = 4)

y1 1 x11 x 21 1
y 1 B0
2 x12 x 22 2
B1
y 3 1 x13 x 23 3
B2
y 4 1 x14 x 24 4
Luego:
y1 B0 B1x11 B 2 x 21 1
y 2 B0 B1x12 B2 x 22 2
y 3 B0 B1x13 B 2 x 23 3
y 4 B0 B1x14 B 2 x 24 4
Los valores de B i se hallan de:

i2
Bi
i2
y xB y xB
0
Bi Bi
Luego:
xx B xy
B xx xy
1

Hallamos(xx)
1 x11 x 221
1 1 1 1
x 222
x x11 x14 1 x12
x12 x13 x
1 x13 x 223
x 221 x 2
22 x 2
23 x 224 2
1 x14 x 24
Luego: n n

n x 1i x 2i
n i 1
n n
i 1

xx x1i 1i
x 2
x x
1i 2i


i 1 i 1 i 1
n n n
x 2i x x x 2i
i 1
1i 2i
i 1 i 1

y1
1 1 1 1 y
x x11 x12 x13 x14 y 2
y3
x 221 x 222 x 223 x 224
y4
Luego:
yi

x y x1i y i
x 22i y i

Entonces:

Bi
xx xy

1

Matriz Inversa.
(Metodo Gauss - Jordan y / o cofactores)

Coeficiente de determinacin en la regresin lineal mltiple

y i y 2
2
ry.12 i 1
n

y
i 1
i y 2

yi B0 B1x1 B2 x 2 (Modelo Estimado)


yi Valor Observado
DIAGRAMA DE DISPERSIN (Ln(P) VS 1/T))

4.5

3.5

3 Series1
y = 191.2e-1386x
LN(P)

Lineal (Series1)
R = 0.879
Polinmica (Series1)
2.5 Exponencial (Series1)

y = -3631.x + 14.04
R = 0.940
2

1.5
y = -5E+12x 4 + 5E+10x 3 - 2E+08x 2 + 45703x - 321.3
R = 0.941

1
0.0026 0.0027 0.0028 0.0029 0.003 0.0031 0.0032 0.0033 0.0034 0.0035 0.0036
1/T
DIAGRAMA DE DISPERSIN CUADRATICA
8

7 7

5 5

4
Presin(P)

3 3
y = 0.000x3 - 0.114x2 + 39.08x - 4444.
R = 0.998

2
y = 0.004x2 - 3.196x + 546.3 1.8
R = 0.975

1 1.1
Series1
0.7
0.4
Polinmica (Series1)
0.15 0.17 0.2
0 0 Polinmica (Series1)
325 335 345 355 365 375 385

-1
Temperatura(T)
VIDEO INTRODUCTORIO DE ANLISIS DE
REGRESIN LINEAL Y MLTIPLE
VIDEO DE RESOLUCIN DE EJERCICIOS DE
ANLISIS DE REGRESIN LINEAL Y
MLTIPLE