Está en la página 1de 30

Pronsticos, Series de Tiempo y Regresin

Captulo 1: Series de Tiempo

Temas
Modelo de Regresin Lineal Simple Estimaciones puntuales de los mnimos cuadrados Estimaciones puntuales y predicciones puntuales Suposiciones del modelo y el error estndar Prueba de la significancia de la pendiente y la ordenada al origen Intervalos de confianza y de prediccin Coeficientes de determinacin y correlacin simples Una prueba F para el modelo
2

Modelo de Regresin Lineal Simple


Supuesto bsico: la relacin entre la variable dependiente (y) y la variable independiente (x) es aproximadamente una linea recta.

Modelo de Regresin Lineal Simple


Con u o d co bu b gn p u

Con u o d co bu b ( on po n )

Diagrama de dispersin

4.00 2.00 0.00 8.00 6.00 4.00 2 00 0 00 0.00


28 00 2 40

32 50 2 40 28 00 70 39 00

0 80 45 90 9 40 57 80 9 50 58 0 8 00 62 50 7 50

0.00 T

20.00 p u

30.00 d

40.00 po ho

50.00 (F h nh )

60.00

70.00

Modelo de Regresin Lineal Simple


Consumo om usti l segn tem er tur
Consumo de om usti le (tonel das or semana)

Diagrama de dispersin

14.00
28.00, 2.40

12.00 10.00 8.00

.50, .

.40 39.00, 0. 0 45.90, 9.40 57. 0, 9.50 58. 0, 8.00 62.50, 7.50

6.00 4.00 2.00 0.00 0.00

observamos: - tendencia negativa - puntos dispersados alrededor de la lnea


10.00 20.00 30.00 40.00 or or ( 50.00 renheit) 60.00 70.00

em er tur medi

Modelo de Regresin Lineal Simple


y=
Donde

y|x

y|x

+I=

1x

+I

1x

es el valor medio de la variable dependiente

y cuando el valor de la variable independiente es x.


 
0 1

= ordenada al origen (valor medio de y cuando x = ) = pendiente (( valor medio de y cuando o x una unidad)

describe los efectos de todos los factores no incluidos en el modelo

I es un trmino de error:

Modelo de Regresin Lineal Simple


= 15.77 y 1 = - .1281, entonces cuando la temperatura x = 28, el valor medio de consumo de combustible que observamos es
Si
0
y|x

1x

= 15.77 0.1281(28)

= 12.1832 MMcf de gas natural.

Modelo de Regresin Lineal Simple


= 15.77 y 1 = - .1281, entonces cuando la temperatura x = 29, el valor medio de consumo de combustible que observamos es
Si
0
y|x

1x

= 15.77 0.1281(29)

= 12.0551 MMcf de gas natural. La diferencia = 12.0551 - 12.1832 = -0.1281


8

Modelo de Regresin Lineal Simple


y 1 se llaman parmetros de regresin. Ya que no conocemos los valores reales de 0 y 1 , debemos estimarlos con los datos de la muestra. (Nota: la interpretacin de 0 a veces no es aplicable.) Importante: observamos que estas variables se mueven juntas, mas no podemos deducir una relacin causaefecto.
0
9

Estimaciones puntuales de los mnimos cuadrados


estimacin puntual de los mnimos cuadrados de la pendiente 1

b1 !

SS xy SS xx

donde SS xy ! xi  x yi  y ! xi yi y SS xx

x y 
i

x ! x  x !
2 i i

Estimaciones puntuales y predicciones puntuales


Estimacin puntual del valor medio de la variable dependiente cuando el valor de la variable independiente es x0

y ! b0  b1 x0
se predice I =

11

Estimaciones puntuales y predicciones puntuales


Se puede demostrar que estas estimaciones puntuales dan un valor de la suma de los residuos cuadrticos (SSE) que es menor que la que se obtiene con cualesquiera otros valores de b y b1. Se les llaman estimaciones puntuales de los mnimos cuadrados. la recta se llama recta de regresin de mnimos cuadrados la ecuacin se llama ecuacin de predicccin de mnimos cuadrados.
12

Suposiciones del modelo y el error estndar


Suposiciones
1.

2.

3.

4.

A cualquier valor dado de x, la media de la poblacin de los valores potenciales del trmino error es igual a cero. Suposicin de la varianza constante. A cualquier valor dado de x, I tiene una varianza que no depende del valor de x. Suposicin de la normalidad. A cualquier valor dado de x, I tiene una distribucin normal. Suposicin de la independencia. Cualquier valor del trmino error I es estadsticamente independiente de cualquier otro valor de I.
13

Suposiciones del modelo y el error estndar


En otras palabras,


dado un valor de x, la poblacin de valores potenciales del trmino de error tiene una distribucin normal, con valor medio y varianza que no depende de x. La poblacin de valores potenciales de y|x tiene distribucin normal con valor medio de 0 + 1x y varianza 2 que no depende de x. Es ms probable que la suposicin de independencia se viole cuando se utilizan series temporales en un estudio de regresin.

14

Suposiciones del modelo y el error estndar


Error cuadrtico medio = estimacin puntual de 2 SSE 2 vary|x s !

n2

error estndar = estimacin puntual de SS s! n2


SS !
n i !1

yi  yi

n i !1

n n y  b0 yi  b1 xi yi i !1 i !1 2 i
15

Prueba de la significancia de la pendiente y la ordenada al origen


Hiptesis nula: 1 = nivel de significancia ( .1 , . 5, . 1) los valores p se basan en n-2 grados de libertad Se rechaza la hiptesis nula si se cumple la condicin de punto de rechazo de alguna de las hiptesis alternativas, o si p <
16

Prueba de la significancia de la pendiente y la ordenada al origen


Si se cumplen los supuestos de la regresin, entonces la poblacin de todos los valores posibles de b1 es normalmente distribuida con valor medio 1 y desviacin estndar
W b1 ! W SS xx

cuya estimacin puntual es

sb1 !

s SS xx
17

Prueba de la significancia de la pendiente y la ordenada al origen


y la poblacin de todos los valores posibles de la estadstica de prueba t

b1 t! sb1
tiene una distribucin t con n 2 grados de libertad.

18

Prueba de la significancia de la pendiente y la ordenada al origen


Hiptesis alternativa Ha : Ha : Ha :
1 1> 1<

Condicin de punto de rechazo

Valor p 2 v (rea bajo la curva t a la derecha de |t|) rea bajo la curva t a la derecha de t rea bajo la curva t a la izquierda de t
19

| t |" t

(n2) ?E / 2 A

n t " t? E A 2

n  2 t?E A

Intervalos de confianza y de prediccin


Si se cumplen las suposiciones de la regresin, un intervalo de confianza de 100(1- )% para la pendiente verdadera 1 es

n2 b1 s t?E / 2Asb1

A
20

Intervalos de confianza y de prediccin


Si se cumplen las suposiciones de la regresin, un valor de distancia (v.d.) para un valor particular x0 de x (para la regresin lineal simple) es

1 x0  x v.d . !  n SS xx

21

Intervalos de confianza y de prediccin


Si se cumplen las suposiciones de la regresin, un intervalo de confianza de 100(1- )% para el valor medio de y cuando la variable independiente es x0 es

n 2 y s t?E / 2 A s

v.d .
22

Intervalos de confianza y de prediccin


La poblacin de todos los errores posibles de prediccin est normalmente distribuida con media cero y desviacin estndar 1 + valor de distancia La estimacin puntual es s1 + valor de distancia Se llama error estndar del error de prediccin
23

Intervalos de confianza y de prediccin


Si se cumplen las suposiciones de la regresin, un intervalo de prediccin 100(1- )% para un valor individual de y cuando la variable independiente es x0 es

n  2 y s t?E / 2 A s

1  v.d .
24

Intervalos de confianza y de prediccin


Ntese que el intervalo de prediccin es mayor que el intervalo de confianza: mayor incertidumbre acerca del trmino de error. Entre ms alejado del valor medio es xi, mayores son los intervalos de confianza y de prediccin.

25

Coeficientes de determinacin y correlacin simples


1. 2. 3. 4. 5.

6.

En el caso del modelo de regresin lineal simple, Variacin total = (yi-y)2 Variacin explicada = (yi-y)2 Variacin inexplicada = (yi-yi)2 Variacin total = Variacin explicada + Variacin inexplicada El coeficiente de determinacin simple es r2 = (variacin explicada)/(variacin total) El r2 es la proporcin de la variacin total en los n valores observados de la variable dependiente que explica el modelo de regresin lineal simple
26

Coeficientes de determinacin y correlacin simples


Coeficiente de correlacin simple (r) entre y y x r !  r2 si b1 > 0 si b1 < 0 r !  r 2 donde b1 es la pendiente de la recta de mnimos cuadrados que relaciona y con x. Este coeficiente de correlacin mide la fuerza de la relacin lineal entre y y x.
27

Coeficientes de determinacin y correlacin simples


Tambin se puede calcular mediante la frmula

r!

SS xy SS xx SS yy

28

Coeficientes de determinacin y correlacin simples


La correlacin de la poblacin de todas las combinaciones posibles de valores observados de x e y se denomina Para probar la hiptesis nula H0: = 0, utilizamos la estadstica de prueba

t!

r n2 1 r
2
29

Una prueba F para el modelo


estadstica F global F(modelo) = Variacin inexplicada (Variacin explicada)/(n-2) Podemos rechazar H0: 1=0 y aceptar Ha: significancia F(modelo)>F[ Valor p <
] 10

en el nivel de

si se cumple alguna de:

En el punto F[ ] se basa en 1 grado de libertad para el numerador y n-2 grados de libertad para el denominador.
30

También podría gustarte