P. 1
Regresion Lineal Simple

Regresion Lineal Simple

|Views: 5|Likes:
Publicado porGogogoair

More info:

Published by: Gogogoair on May 24, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PPT, PDF, TXT or read online from Scribd
See more
See less

09/04/2015

pdf

text

original

1

Pronósticos, Series
de Tiempo y
Regresión
Capítulo 3: Regresión Lineal
Simple
2
Temas
 Modelo de Regresión Lineal Simple
 Estimaciones puntuales de los mínimos
cuadrados
 Estimaciones puntuales y predicciones
puntuales
 Suposiciones del modelo y el error estándar
 Prueba de la significancia de la pendiente y la
ordenada al origen
 Intervalos de confianza y de predicción
 Coeficientes de determinación y correlación
simples
 Una prueba F para el modelo
3
Modelo de Regresión Lineal
Simple
Supuesto básico: la relación entre la
variable dependiente (y) y la variable
independiente (x) es aproximadamente
una linea recta.
4
Modelo de Regresión Lineal
Simple
Consumo de combustible según temperatura
28.00, 11.70
32.50, 12.40
39.00, 10.80
45.90, 9.40
57.80, 9.50
62.50, 7.50
28.00, 12.40
58.10, 8.00
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
Temperatura media por hora (Fahrenheit)
C
o
n
s
u
m
o

d
e

c
o
m
b
u
s
t
i
b
l
e

(
t
o
n
e
l
a
d
a
s

p
o
r

s
e
m
a
n
a
)
Diagrama
de
dispersión
5
Modelo de Regresión Lineal
Simple
Consumo de combustible según temperatura
28.00, 11.70
32.50, 12.40
39.00, 10.80
45.90, 9.40
57.80, 9.50
62.50, 7.50
28.00, 12.40
58.10, 8.00
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
Temperatura media por hora (Fahrenheit)
C
o
n
s
u
m
o

d
e

c
o
m
b
u
s
t
i
b
l
e

(
t
o
n
e
l
a
d
a
s

p
o
r

s
e
m
a
n
a
)
Diagrama
de
dispersión
observamos:
- tendencia negativa
- puntos dispersados alrededor de la línea
6
Modelo de Regresión Lineal
Simple
y = μ
y|x
+ c = β
0
+ β
1
x + c
 Donde
 μ
y|x
= β
0
+ β
1
x es el valor medio de la variable dependiente
y cuando el valor de la variable independiente es x.
 β
0
= ordenada al origen (valor medio de y cuando x = 0)
 β
1
= pendiente (A valor medio de y cuando | x una unidad)
 c es un término de error: describe los efectos de todos los
factores no incluidos en el modelo
7
Modelo de Regresión Lineal
Simple
Si β
0
= 15.77 y β
1
= -0.1281, entonces
cuando la temperatura x = 28, el valor
medio de consumo de combustible
que observamos es
μ
y|x
= β
0
+ β
1
x = 15.77 – 0.1281(28)
= 12.1832 MMcf de gas natural.
8
Modelo de Regresión Lineal
Simple
Si β
0
= 15.77 y β
1
= -0.1281, entonces
cuando la temperatura x = 29, el valor
medio de consumo de combustible
que observamos es
μ
y|x
= β
0
+ β
1
x = 15.77 – 0.1281(29)
= 12.0551 MMcf de gas natural.
La diferencia = 12.0551 - 12.1832 = -0.1281
9
Modelo de Regresión Lineal
Simple
 β
0
y β
1
se llaman parámetros de regresión.
 Ya que no conocemos los valores reales de
β
0
y β
1
, debemos estimarlos con los datos
de la muestra.
 (Nota: la interpretación de β
0
a veces no es
aplicable.)
 Importante: observamos que estas
variables se mueven juntas, mas no
podemos deducir una relación causa-
efecto.
10
Estimaciones puntuales de los
mínimos cuadrados
 estimación puntual de los mínimos cuadrados de la
pendiente β
1

( )( )
( )
( )
¿
¿
¿ ¿
¿ ¿
= ÷ =
÷ = ÷ ÷ =
=
n
x
x x SS
y
n
y x
y x y y x x SS
donde
SS
SS
b
i
i xx
i i
i i i i xy
xx
xy
2
2
1
11
Estimaciones puntuales y
predicciones puntuales
 Estimación puntual del valor medio de la
variable dependiente cuando el valor de la
variable independiente es x
0



 se predice c = 0
0 1 0
ˆ
x b b y + =
12
Estimaciones puntuales y
predicciones puntuales
 Se puede demostrar que estas estimaciones
puntuales dan un valor de la suma de los
residuos cuadráticos (SSE) que es menor
que la que se obtiene con cualesquiera otros
valores de b
0
y b
1
. Se les llaman
estimaciones puntuales de los mínimos
cuadrados.
 la recta se llama recta de regresión de
mínimos cuadrados
 la ecuación se llama ecuación de prediccción
de mínimos cuadrados.
13
Suposiciones del modelo y el
error estándar
 Suposiciones
1. A cualquier valor dado de x, la media de la
población de los valores potenciales del término
error es igual a cero.
2. Suposición de la varianza constante. A cualquier
valor dado de x, c tiene una varianza que no
depende del valor de x.
3. Suposición de la normalidad. A cualquier valor
dado de x, c tiene una distribución normal.
4. Suposición de la independencia. Cualquier valor
del término error c es estadísticamente
independiente de cualquier otro valor de c.
14
Suposiciones del modelo y el
error estándar
 En otras palabras,
 dado un valor de x, la población de valores
potenciales del término de error tiene una
distribución normal, con valor medio 0 y varianza σ
2

que no depende de x.
 La población de valores potenciales de y|x tiene
distribución normal con valor medio de β
0
+ β
1
x y
varianza σ
2
que no depende de x.
 Es más probable que la suposición de
independencia se viole cuando se utilizan series
temporales en un estudio de regresión.
15
Suposiciones del modelo y el
error estándar
 Error cuadrático medio = estimación puntual
de σ
2


 error estándar = estimación puntual de σ
2
2
÷
=
n
SSE
s
2 ÷
=
n
SSE
s
( )
¿ ¿ ¿ ¿
= = = =
(
¸
(

¸

+ ÷ = ÷ =
n
i
n
i
n
i
n
i
i i i i i i
y x b y b y y y SSE
1 1 1 1
1 0
2
2
ˆ
var
y|x
16
Prueba de la significancia de la
pendiente y la ordenada al origen
Hipótesis nula: β
1
= 0
nivel de significancia α (0.10, 0.05, 0.01)
los valores p se basan en n-2 grados de
libertad
Se rechaza la hipótesis nula si se
cumple la condición de punto de rechazo
de alguna de las hipótesis alternativas, o
si p < α
17
Prueba de la significancia de la
pendiente y la ordenada al origen
 Si se cumplen los supuestos de la regresión,
entonces la población de todos los valores
posibles de b
1
es normalmente distribuida con
valor medio β
1
y desviación estándar


 cuya estimación puntual es

xx
b
SS
o
o =
1
xx
b
SS
s
s =
1
18
Prueba de la significancia de la
pendiente y la ordenada al origen
 y la población de todos los valores posibles
de la estadística de prueba t




 tiene una distribución t con n – 2 grados de
libertad.

1
1
b
s
b
t =
19
Prueba de la significancia de la
pendiente y la ordenada al origen
Hipótesis
alternativa

Condición de
punto de
rechazo
Valor p
H
a
: β
1
≠ 0 2 × (área bajo la curva t a
la derecha de |t|)
H
a
: β
1
> 0 área bajo la curva t a la
derecha de t
H
a
: β
1
< 0 área bajo la curva t a la
izquierda de t
| |
) 2 (
2 /
| |
÷
>
n
t t
o
| |
( ) 2 ÷
>
n
t t
o
| |
( ) 2 ÷
÷ <
n
t t
o
20
Intervalos de confianza y de
predicción
Si se cumplen las suposiciones de la
regresión, un intervalo de confianza de
100(1-α)% para la pendiente verdadera
β
1
es
| |
( )
| |
1
2
2 / 1 b
n
s t b
÷
±
o
21
Intervalos de confianza y de
predicción
Si se cumplen las suposiciones de la
regresión, un valor de distancia (v.d.)
para un valor particular x
0
de x (para la
regresión lineal simple) es
( )
xx
SS
x x
n
d v
2
0
1
. .
÷
+ =
22
Intervalos de confianza y de
predicción
Si se cumplen las suposiciones de la
regresión, un intervalo de confianza de
100(1-α)% para el valor medio de y
cuando la variable independiente es x
0

es
| |
( )
. .
ˆ
2
2 /
d v s t y

±
o
23
Intervalos de confianza y de
predicción
La población de todos los errores
posibles de predicción está normalmente
distribuida con media cero y desviación
estándar
σ√1 + valor de distancia
La estimación puntual es
s√1 + valor de distancia
Se llama error estándar del error de
predicción

24
Intervalos de confianza y de
predicción
Si se cumplen las suposiciones de la
regresión, un intervalo de predicción
100(1-α)% para un valor individual de y
cuando la variable independiente es x
0

es
| |
( )
. . 1
ˆ
2
2 /
d v s t y
n
+ ±
÷
o
25
Intervalos de confianza y de
predicción
Nótese que el intervalo de predicción es
mayor que el intervalo de confianza:
mayor incertidumbre acerca del término
de error.
Entre más alejado del valor medio es x
i
,
mayores son los intervalos de confianza
y de predicción.
26
Coeficientes de determinación
y correlación simples
 En el caso del modelo de regresión lineal simple,
1. Variación total = Σ(y
i
-y)
2
2. Variación explicada = Σ(y
i
-y)
2
3. Variación inexplicada = Σ(y
i
-y
i
)
2

4. Variación total = Variación explicada + Variación
inexplicada
5. El coeficiente de determinación simple es
r
2
= (variación explicada)/(variación total)
6. El r
2
es la proporción de la variación total en los n
valores observados de la variable dependiente que
explica el modelo de regresión lineal simple

27
Coeficientes de determinación
y correlación simples
Coeficiente de correlación simple (r)
entre y y x
si b
1
> 0
si b
1
< 0
donde b
1
es la pendiente de la recta
de mínimos cuadrados que relaciona y
con x. Este coeficiente de correlación
mide la fuerza de la relación lineal
entre y y x.
2
2
r r
r r
÷ =
+ =
28
Coeficientes de determinación
y correlación simples
También se puede calcular mediante
la fórmula
yy xx
xy
SS SS
SS
r =
29
Coeficientes de determinación
y correlación simples
La correlación de la población de
todas las combinaciones posibles de
valores observados de x e y se
denomina ρ
Para probar la hipótesis nula H
0
: ρ = 0,
utilizamos la estadística de prueba
2
1
2
r
n r
t
÷
÷
=
30
Una prueba F para el modelo
 estadística F global

F(modelo) = Variación inexplicada
(Variación explicada)/(n-2)

 Podemos rechazar H
0

1
=0 y aceptar H
a
: β
1
≠0 en el nivel de
significancia α si se cumple alguna de:
 F(modelo)>F
[α]
 Valor p < α
 En el punto F
[α]
se basa en 1 grado de libertad para el
numerador y n-2 grados de libertad para el denominador.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->