Está en la página 1de 16

SESIÓN 9

1. Análisis de Regresión
Y = f (X )
Regresión simple Y es una función de X
o regresión
bivariada

Variable dependiente es Variable independiente


la variable que se desea es la variable que explica;
explicar o predecir; también se también se le denomina
le denomina regresando o variable explicativa o
variable de respuesta regresor

Y = f ( X 1 , X 2 , X 3 ,..., X k )
Regresión
múltiple o
regresión Y es una función
multivariada de dos o más
variables
independientes
Si X e Y cambian en forma lineal, entonces a medida que X cambia, Y
cambia en una cantidad constante. Si existe una relación curvilínea, Y
cambiará en una cantidad diferente a medida que X cambia.
Modelo lineal
(con datos Población)
Y =  0 + 1 X + 
Error = (i − ˆ i )

Modelo lineal
(con datos muestrales)
Y = b0 + b1 X + e MCO
produce
una recta
tal que la
suma de los
Modelo de regresión
Yˆt = b0 + b1 X errores sea
estimada Cero
(i − ˆ i ) = 0
Intercepto Pendiente
Publicidad (X)
Ventas (Y) MCO asegura que se minimice la
Mes (en cientos de
Ventas (en miles de Q) suma de los errores al cuadrado,
Q)
Ejemplo, pues produce una recta tal que la
Inc. 1 450 50
suma de los errores al cuadrado
2 380 40 es menor de lo que sería con
3 540 65 cualquier otra recta.
(i − i ) = min
ˆ 2
4 500 55
5 420 45

550 Yˆt = b0 + b1 X
i : el valor observado de
Y cuando X = 55
500 Yˆi : el valor estimado
Yˆi : el valor estimado de Y de Y cuando X =
Ventas (Y)

450 cuando X = 50 Yˆi 55


Yi
Un error positivo
Yˆi
400 Yˆi ( − ˆ )  0
i i

Yi Un error negativo
(ˆ −  )  0 Algunos errores son positivos:(ˆ i  ˆ i )
350

(ˆ  ˆ )
i i
Algunos errores son negativos:
300 i i
35 40 45 50 55 60 65
Publicidad (X)
Se requiere calcular la suma de cuadrados y productos cruzados, es decir se
debe calcular:
Suma de cuadrados de X
SCx = ( X i − X )
2

=X − 2 (X)
2

Suma de cuadrados de y
SCy =  (Yi − Y )
2

= Y −2 (Y )
2

Suma de productos cruzados de X y Y


SCxy = ( X i − X )(Yi − Y )
=   −
(  )(  )
n
Pendiente de la recta Intercepto de la
de tendencia recta de tendencia

SCxy
b1 = b0 =  − b1 
SCx
El término de error ε es una variable aleatoria distribuida
1 normalmente

Varianzas en los valores Y son las mismas en todos


2 los valores Y (homoscedasticidad)

Los términos de error son independientes uno del


3 otro, es decir que no existe autocorrelación.

4 El supuesto de linealidad
Si una serie de tiempo tiene una tendencia ascendente o
descendente a largo plazo, el análisis de tendencia puede ser útil
para desarrollar pronósticos.

Variable Variable
dependiente es la independiente es
serie de tiempo que se una variable
desea pronosticar observada, el tiempo
Recta de tendencia
utilizando regresión simple
o mínimos cuadrados
Yˆt = b0 + b1t
ordinarios (MCO)

Pendiente de la recta Intercepto de la


de tendencia recta de tendencia
SCxy
b1 = b0 =  − b1 
SCx
▪ Considerando los siguientes datos de préstamos en miles de Quetzales,
desarrolle un modelo para predecir el comportamiento futuro de la cartera:
Suma de cuadrados de X
Mes t(X) Créditos (Y) XY X2
ene-16 1 7.0 7 1 SCx =   2

( )
2

feb-16 2 7.1 14.2 4 n


mar-16 3 7.9 23.7 9 = 1496 – (136)2 = 340
abr-16 4 7.3 29.2 16 16
may-16 5 8.2 41 25
jun-16 6 8.3 49.8 36 Suma de cuadrados de productos cruzados
jul-16 7 8.1 56.7 49
SCxy =   −
(  )(  )
ago-16 8 8.6 68.8 64
sep-16 9 8.8 79.2 81
n
oct-16 10 8.9 89 100 = 1214 – (136) (135.9) = 58.85
nov-16 11 8.7 95.7 121 16
dic-16 12 9.1 109.2 144
ene-17 13 9.4 122.2 169 Pendiente de la Intercepto de la
feb-17 14 9.1 127.4 196 recta de tendencia recta de tendencia
mar-17 15 9.5 142.5 225 SCxy
b1 = b0 =  − b1 
abr-17 16 9.9 158.4 256
SCx
136 135.9 1,214.0 1,496.0 = 8.49 – (0.173) (8.5)
= 58.85 = 0.173 = 7.02
Proyección de períodos: 340
May-17 = 7.02 + 0.173(17) = 9.96
…. La ecuación para la recta de tendencia es:
Jul-17 = 7.02 + 0.173(19) = 10.31 Yˆt = b0 + b1t = 7.02 + 0.173t
▪ Como la recta de regresión es la recta del ajuste óptimo, se ajusta o
representa la relación entre X y Y mejor que cualquier otra recta, no obstante
solo eso representa y no garantiza que sea buena.
▪ Hay dos medidas de bondad de ajuste:
1. El error estándar o error típico de la estimación, y
2. El coeficiente de determinación

▪ El error estándar de estimación o error típico, Se, es una medida del grado de
dispersión de los valores Y, alrededor de la recta de regresión. Mide la
variación de los puntos de datos por encima y por debajo de la recta de
regresión.
▪ Refleja la tendencia a desviarse del valor real de
▪ dependiente Y Y cuando se utiliza el modelo de regresión para
fines predictivos, por eso también es una
medida del error típico.
▪ El error estándar se expresa en las misma
unidades que la variable
2. Análisis de Correlación
Es una medida de la fuerza de la relación entre la variable
dependiente (X) e independiente (Y). Ambas variables juegan un
papel simétrico.

−1  r  1
r=+1 relación positiva perfecta
r=-1 relación negativa perfecta
r=0 No hay relación
Coeficiente de correlación: proporciona una medida relativa de la
capacidad del modelo para explicar las desviaciones en los valores Yi.
Mide la fuerza de la relación entre Y y la variable explicativa X.
Medida de asociación lineal entre dos variables.

SCxy
r=
(SCx )(SCy )
Coeficiente de determinación: proporciona una medida de bondad
de ajuste porque revela qué porcentaje del cambio en Y se explica por
un cambio en X.

r =
2 (SCxy ) 2

(SCx )(SCy )

También podría gustarte