Está en la página 1de 12

Introduccion

Regresion lineal simple


Un modelo de regresion es un modelo que permite describir c
omo influye una variable X sobre otra variable Y .

X: Variable independiente o explicativa o exogena

Y: Variable dependiente o respuesta o endogena

El objetivo es obtener estimaciones razonables de Y para


distintos valores de X a partir de una muestra de n pares de
valores (x1, y1), . . . , (xn, yn ).

Introduccion
Tipos de relacion
Lineal: Cuando la funcion f (x ) es
lineal,
)

f (x ) = 0 +
1x

Relacin lineal positiva


Si 1 > 0 hay
relacion lineal positiva.

Relacin lineal negativa

10

10

Si 1 < 0 hay relacion lineal negativa.


6

-2

-2

-6

-6
-2

-1

Los datos tienen un aspecto


recto.

-2

-1

Medidas de dependencia lineal


La covarianza
Una medida de la dependencia lineal es la
covarianza:
n

cov (x, y ) = i (xi x) (yi


n
=1
y)
1
Si hay relacion lineal positiva, la covarianza sera positiva
y grande.
)

Si hay relacion lineal negativa, la covarianza sera negativa


y grande en valor absoluto.
Si hay no hay relacion entre las variables o la relaci
on es marcadamente no lineal, la covarianza sera
proxima a cero.

PERO la covarianza depende de las unidades de medida

Medidas de dependencia lineal


El coeficiente de correlacion lineal
Una medida de la dependencia lineal que no depende de las
unidades de medida es el coeficiente de correlacion lineal:
cov (x, y
r(x,y ) = cor (x, y ) )
sx sy
=
dond
e:

.
s x2 =

(xi
x)2

i=1
)

n1
-1 cor (x, y ) 1

cor (x, y ) = cor (y, x )

sy2 =

(yi
y)2

i=1

n1

cor (ax + b, cy + d ) = cor (x, y ) para cualesquiera valores


a, b, c, d .
)

El modelo de regresion lineal simple


El modelo de regresion lineal simple
supone que,
yi = 0 + 1xi + ui
donde:
yi representa el valor de la variable respuesta para la
observacion i-esima.

xi representa el valor de la variable explicativa para la


observacion i-esima.

ui representa el error para la observacion i-esima que se


asume normal,
ui N(0, )

0 y 1 son los coeficientes de regresion:


)

0 : intercepto

1 : pendiente

Los parametros que hay que estimar son: 0, 1 y .

El modelo de regresion lineal simple

uo:

La diferencia entre cada valor yi de la variable respuesta y su


estimacion
yi
ei = yi yi
Valor observado
Dato (y)

Recta de
regresin
estimada

Ejemplo (cont.): Indudablemente, una empresa determinada que


haya producido exactamente 25 mil unidades no va a tener un
gasto de exactamente 16,6 mil euros. La diferencia entre el
costo estimado y el real es el residuo. Si por ejemplo el costo
real de la empresa es de 18 mil euros, el residuo es:
ei = 18 16,6 = 1,4mil euros

Hipotesis del modelo de regresion lineal simple


Linealidad: La relacion existente entre X e Y es
lineal,
)

f (x ) = 0 + 1x
Homogeneidad: El valor promedio del error es
cero,
)

E [ui ] = 0
Homocedasticidad: La varianza de los errores es
constante,
)

Var (ui ) = 2
Independencia: Las observaciones son
independientes,
)

E [ui uj ] = 0

Estimadores de mnimos cuadrados


Ejercicio 4.1
Los datos de la produccion de trigo en toneladas (X ) y el precio
del kilo de harina en pesetas (Y ) en la decada de los 80 en
Espana fueron:
Produccion de
30 28 32 25 25 25 22 24 35
trigo
Precio de la
25 30 27 40 42 40 50 45 30
Ajusta
la recta de regresion por el metodo de mnimos
harina
cuadrados

Resultados
1

X0
1

x i yi
nxy
X10
xi2
2
i =1nx

9734 10 28,6
=
35,4
1,3537
2
8468 10 28,6

= y 1 x= 35,4 + 1,3537 28,6 =

74,116

La recta de regresion es: y = 74,116


1,3537x

40
25

Estimacion de la varianza
Para estimar la varianza de los errores, 2, podemos
utilizar,
.n 2
ei

2 =

i= 1

que es el estimador maximo verosmil de 2, pero es un


estimador sesgado.
Un estimador insesgado de 2 es la varianza
residual,
.

e2i

i =1

2 =
sR
n2

Estimacion de la varianza
Ejercicio 4.2
Calcula la varianza residual en el ejercicio 4.1.

Resultados
Calculamos primero los residuos, ei , usando la recta de
regresion,
yi = 74,116 1,3537xi
xi
30
28
32
25
25
25
22
24
yi
25
30
27
40
42
40
50
45
yi 33.5 36.21 30.79 40.27 40.27 40.27 44.33 41.62
ei -8.50 -6.21 -3.79 -0.27 1.72 -0.27 5.66
3.37
La varianza residual
es:

X ei2
s2
R

i=1

n2

207,9
=
2
25,99
8

35
40
30
25
26.73 19.96
3.26 5.03

Inferencia para la pendiente


Ejercicio 4.3
1. Calcula un intervalo de confianza al 95 % para la pendiente de la
recta de regresion obtenida en el ejercicio 4.1.
2. Contrasta la hipotesis de que el precio de la harina depende
linealmente de la produccion de trigo, usando un nivel de
significacion de 0.05.

Resultados
1. t n 2, /2 = t8,0,025 = 2,306

2,306

1,3537 1
q

25,99
9 32,04
2,306

2,046 1 0,661
2. Como el intervalo no contiene al cero, rechazamos que 1 = 0 al nivel 0.05.

De hecho:

p
2

2 =
R / (n 1) X
s s

1,3537 = 4,509 >


q 25,99
932,04 2,306

Inferencia para el intercepto


Ejercicio 4.4
1. Calcula un intervalo de confianza al 95 % para el intercepto de la
recta de regresion obtenida en el ejercicio 4.1.
2. Contrasta la hipotesis de que la recta de regresion pasa por
el origen, usando un nivel de significacion de 0.05.

Resultados
1. t n 2 , /2 = t8,0,025 = 2,306

2,306 r

74,1151 0

2,306 53,969 0 94,261


2
25,99 101 + 28,6
9 32,04

2. Como el intervalo no contiene al cero, rechazamos que 0 = 0 al nivel 0.05.

De

hecho:

2,306
sR
2

1 0
n

x 2
(n 1) X
s 2

74,1151
= 8,484 >
28,6

25,99 10
1

2

9 32,04
+

También podría gustarte