Está en la página 1de 45

Unidad 2.

Modelo de regresión con dos


variables
Objetivos
 Definir el modelo de regresión lineal simple.
 Obtener las estimaciones de mínimos cuadrados
ordinarios.
 Analizar la bondad de ajuste del modelo.
 Calcular los coeficientes estimados ante cambio en
las unidades de medición.
 Analizar la forma funcional de la relación entre las
variables.
 Explicar los valores esperados y varianzas de los
estimadores MCO.
 Determinar características de la regresión al origen.
Modelo de regresión simple.
Y=β 0 + β1 X + u
Terminología.
 La relación entre X y Y se puede nombrar como:

 “Y en función de X”

 “Explicar a Y en términos de X”

 “Explicar cuánto varía Y cuando X varía ”


Modelo de regresión simple.
Elementos de la regresión simple
Y=β 0 + β1 X + u
 Y: Variable explicada, dependiente, respuesta,
predicha o regresando.
 β 0: Parámetro de Intercepto
 β1 : Parámetro de la Pendiente
 X: Variable explicativa, independiente, de control,
predictora o regresora
 u: Término de error o perturbación representan factores
distintos a X que afectan a Y.
Modelo de regresión simple.
 Si los demás factores en u permanecen constantes, de
la manera que Δu=0, entonces ΔY= β1 ΔX (Por qué?)
además que β1 =ΔY /ΔX
Demostración
 Suponga que existen dos observaciones Yi y Yj que se
relacionan linealmente:
 Yi= β 0 + β1 Xi+Ui ui=Yi-bo-b1Xi
 Yj= β 0 + β1 Xj+Uj uj=Yj-bo-b1Xj
 Pruebe que si Δu=0, entonces ΔY= β1 ΔX
 Δu=ui-uj=(Yi-bo-b1Xi)-(Yj-bo-b1Xj)=Yi-bo-b1Xi-Yj+bo+b1Xj
 =(Yi-Yj)-b1Xi+b1Xj =(Yi-Yj)-b1(xi-xj)

Si Δu=0(Yi-Yj)-b1(xi-xj)=0(Yi-Yj)=b1(xi-xj)ΔY=b1Δx al
despejar b1=ΔY/ΔX…
 Ante un cambio de x, y se afecta en b1 unidades de
Ejemplos
Identifique e interprete cada elemento de modelos de
regresión simple.
 Rendimiento de los años de educación sobre el salario.

 V. Dependiente=salario. V. Independiente=educ
 Bo= Valor del salario cuando educ =0
 B1= El efecto sobre Y ante un cambio de x.
 Por cada año adicional de educación recibida, su
salario aumentará $bi adicionales al actual.
 U=otros factores que afectan al salario: horas de
trabajo, situación económica país…
Consideraciones adicionales de y, x, u
1. X , u son variables aleatorias.
2. Media de residuos
 Media (u)=0
 E(u)=0  Σ ui=0
3. Independencia entre X y u .
 Correlación (x,u)=Cov(X,u)/[desv(x)*desv(u)]
 Cov(X,u)=0
 =E[(X-mediax)(U-mediau)]
 =E[(X-mediax)(U)]
 =E(X*U-Mediax*u)
0
 =E(X*U)-Mediax *E(u)
 =E(X*U)Σ xi*ui=0
Estimación de parámetros β 0 , β1
 Mínimos Cuadrados Ordinarios (MCO)
 Realiza la estimación de β 0 , β1 minimizando el
término de u. Y=bo+b1X
 Ofrece la mejor recta de regresión lineal.

Y Recta MCO

X
Estimación parámetros MCO
 Al despejar los parámetros:

2 ( Yi ) 2 SSxy
SSy   Yi 
n Pendiente= b1 
SSx
( X i ) 2 Intercepto = Ybarra-Pendiente*
SSx   X i 
2

n
Xbarra

(  X i )(  Yi )
SSxy   X iYi 
n ESTADISTICA I
Y=Bo+B1X
Ejemplo

X: Horas 100 Notas


Estudio
Individuo semanal Y: Notas 80
1 2 20 60
2 5 45 (x,y)
3 10 60 40
4 12 78
20
5 15 96
0
0 2 4 6 8 10 12 14 16

Y=Valor real
=Valor estimado o ajustado de Y
=residuo, diferencia entre el valor Y estimado y real
 Suponga que la estimación MCO de los
parámetros fue : =11,36 ; =5,5 entonces:

X: Horas
Individuo Estudio Y: Notas ui=Y–Y^
semanal Y^=11.36+5,5X

1 2 20 =11,36+5,5*
2=22 20-22=-2
2 5 45 =11,36+5,5*
5=39 45-39=6
3 10 60 66 6
4 12 78 77 1
5 15 96 94 2

Sería correcto realizar la siguiente equivalencia Y=Y^+u ?


Ejercicio
 Utilizando la base de datos CEOSAL1
(información de 209 CEO en el año 1990)
 Analice las variables Salary y Roe.
 Tipo de variable y unidades.
 Estadísticos principales.
 Estime el modelo de regresión lineal donde se
exprese el efecto del Roe sobre el salario.
 Interprete los coeficientes estimados.
 Realice la gráfica de variable estimada vs observada.
 Analice el comportamiento del residuo
 Estadísticos principales
 Gráfico
Ejercicio
 Utilizando la base de datos WAGE1
(información de 526 individuos en el año 1976)
 Analice las variables wage y educ.
 Tipo de variable y unidades
 Estadísticos principales.
 Estime el modelo de regresión lineal donde se
exprese el efecto de la educación sobre el salario.
 Interprete los coeficientes estimados
 Realice la gráfica de variable estimada vs observada.
 Analice el comportamiento del residuo
 Estadísticos principales
 Gráfico
Bondad de ajuste

 La R-cuadrada de la regresión, también


llamada coeficiente de determinación, es el
cociente de la variación explicada entre la
variación total; por tanto, se interpreta como la
proporción de la variación muestral de y que es
explicada por x.
 El valor de R2 esta siempre entre cero y uno.
 0,16
Valores R2

Si R2 es bajo ¿se puede concluir que el


modelo es incorrecto?
Salary=f(roe) R2=0,01=1%
Salario=f(educ) R2=0,16=16%
Efectos de los cambios de
unidades de medición
Interprete los coeficientes de la siguiente regresión.
1. Considere que Salary está expresado en miles y Roe
en porcentaje (%)

2. ¿Cuál sería el valor de los coeficientes estimados si


salary se expresa en unidades y Roe en decimales y
no se cuenta con los datos para realizar la regresión?

Salary*(unidades)=bo*+b1* roe*(decimal)
Unidades de medición

Unidades originales Unidades reescaladas


  
Yi  1   2 X i  ui  

1. Determine los factores de escala w1 y w2


Y*=w1Y X*=w2X
2. Calcular los coeficientes reescalados:
Ejemplo
En la siguiente regresión, Salary está expresado en miles
y Roe en porcentaje (%)

Exprese la regresión de Salary (unidades) y Roe (decimal)


 Utilizando las formulas reescaladas
Salario*(unidades)=w1 Salario (miles)
3000=1000* 3
Roe*(decimal)=w2 Roe(%)
0,20 =(0,01) *20

Intercepto*=1000*963.19=963190
Pendiente*=(1000/0,01)*18,50=1850000
Salario_unid=963190+1850000Roe_dec
 Transformando las variables de la base de
datos Ceosal 1 y realizando la regresión.
 Se crearon las variables:
 Salario_unidades=1000*salary
 Roe_decimal=0,01*Roe
 Se realizó la regresión lineal:
 ^salario_unid = 963000 + 1850000*Roe_decimal
Ejercicio
 Si X = gastos en publicidad (cientos de dólares),
Y= ingresos por ventas (miles de dólares) para
una tienda deportiva durante cinco meses, la
regresión resultó.
Ŷ=1 + 1.2X
a) Interprete los coeficientes estimados
 Si gasto en publicidad es cero (x=0), el ingreso por
ventas será de 1mil.
 Si el gasto en publicidad aumenta 1 unidad de x(un
ciento), el ingreso por ventas aumenta 1,2 unidades de
y(1,2 miles)
Ejercicio
 Si X = gastos en publicidad (cientos de dólares),
Y= ingresos por ventas (miles de dólares) para
una tienda deportiva durante cinco meses, la
regresión resultó.
Ŷ=1 + 1.2X
 Calcule las siguientes regresiones:
a) Y(unidades $), X(unidades $)
b) Y(cientos), X(unidades)
c) Y(unidades), X(miles)
Ejercicio
  Si X (cientos de dólares), Y (miles de dólares)
Ŷ=1.0 + 1.2X
a) Y(unidades), X(unidades)
Y*unid=w1 Ymil
= Ymil *  w1=1000
X*unid=w1 X cientos
= X cientos *  w2=100
B1*=1000*1=1000, B2=(1000/100)*1,2=12
Yunid=1000+12Xunid
  Y mil  cientos

Ymil * *  w1=10

Y
Ejercicio

 Si
  X (cientos de dólares), Y(miles de dólares)
Ŷ=1.0 + 1.2X
b) Y(cientos), X(unidades)
 Y*cientos=w1 Y miles

 El objetivo es transformar Y miles a Y cientos y

encontrar w1
 Y*cientos=w1 Ymiles * *

 w1=10
 X*unid=w2 Xcientos

 w2 Xcientos*
 w2=100
 B1*=w1*b1 =10*1=10
 B2*=(w1/w2)*b2=(10/100)*1,2=0,12
 Ycientos=10+0,12Xunid
Ejercicio
 Si X (cientos de dólares), Y (miles de dólares)
Ŷ=1.0 + 1.2X
c) Y(unidades), X(miles)
Forma Funcional
Incorporación de no linealidades en las variables de la regresión
lineal.

 Salario por hora = -0,90+0,54 años de educación.


 Interprete el valor de la pendiente…parece razonable?
Forma Funcional
Modelos de regresión en
Logaritmos
Los logaritmos convierten
las variaciones en cambios
porcentuales, con amplia
aplicación en el campo
económico.

30
Modelos de regresión en Logaritmos
Caso I Modelo Nivel-Log

 Una variación del 1 % en X está asociada con un


cambio en Y de 0,01*β1.
 Ejemplo:

Salario_anual (miles)= bo+950,5 ln_ventas


Si las ventas incrementan 1%, el salario anual en miles
aumentará 0,01*950,5=9,5 miles $

31
Modelos de regresión logaritmica
 Caso II: Modelo Log-Nivel (Y en logaritmos, X no)

 En el modelo log-lineal, un cambio unitario en X (ΔX=1)


está asociado con un cambio de (100*β1) %
Ejemplo.

 Si la edad aumenta en un año, los ingresos


aumentan (100*0,0087)%=0,87%

32
Modelos de regresión logarítmica
 Caso III: Modelo Log-Log.

 Una variación del 1 % en X está asociada con una


variación en Y de un β1 % .
Ejemplo:

Si las ventas incrementan 1%, el salario aumenta


0,257%

33
Modelo Interpretación
Y=bo+b1 X Si x incrementa una unidad entonces Y varía
b1 unidades de y
Y=bo+b1 LogX Si x incrementa 1% entonces Y varía
0,01*B1 unidades de Y
Log Y=bo+b1X Si x incrementa una unidad entonces Y varía
(100*b1)%
Log Y=bo+B1 Log X Si x incrementa 1% entonces Y varía b1%
Ejercicio
A partir de las siguientes regresiones de las variables : Calificación
(puntos) y renta (miles $), responda:

Si la renta aumenta 1%, la calificación aumenta 0,01*36,2=0,362


puntos.

Si la renta aumenta 1%, la calificación aumenta 0,554%.

Si la renta aumenta 1 mil, la calificación aumenta 0,00284 puntos

35
Ejercicio
a) ¿Cuántos puntos aumentará la calificación ante un incremento
de $1000 en la renta?
Y unid original cuando renta unid(mil)
Y=bo+b1X

b) ¿Si el incremento de la renta es de $2000, cual será el efecto


sobre la calificación?
Yunid Xmil y=bo+b1 X
2*0,00284=0,00568

36
c) ¿Cuál es el impacto (%) sobre la calificación,
si el incremento de la renta es 1,5%?
Y% x% logy=bo+b1 logx

Si la renta aumenta 1,5%, la calificación aumenta


0,556*1,5%=0,834%
Ejercicio
Utilice el archivo CEOSAL2 que contiene información sobre
directores generales (CEO) Salary es el sueldo anual (miles
de dólares) y ceoten son los años de antigüedad como CEO.
 Determine el sueldo y la antigüedad promedio en esta

muestra.
 Estime los siguientes modelo de regresión simple e

interprete los parámetros estimados.


 Salary=bo+b1ceoten
 log(salary)=bo+b1ceoten
 Log(salary)=bo+b1 log(ceoten)
 Salary=bo+b1 log(ceoten)
Significado de la regresión “lineal”


 Las
  variables dependiente e independiente pueden
estar expresadas en logaritmos (no lineales).
 Para desarrollar la estimación por MCO se debe
garantizar la linealidad de los coeficientes no
necesariamente de las variables.
 Por ejemplo el modelo log Y=bo+b1 X aunque no es
lineal en variables , sí lo es en parámetros por tanto
es posible estimarlo por MCO.
 En el siguiente modelo Y= los betas no son lineales
por tanto no es posible estimarlos por MCO.
Propiedades de metodología
MCO

 El modelo Y=Bo+B1x+u presenta linealidad en


los parámetros.
 Se cuenta con una muestra aleatoria que sigue
el modelo poblacional de la ecuación.
 No todos los valores de Xi son iguales.
 Para todo valor de la variable explicativa, el
valor esperado de u es cero. E(u/x)=0
Propiedades de los estimadores MCO

Los estimadores de MCO son insesgados, es decir:

La varianza de los estimadores de MCO son:


var( 1 ) 
 i
X 2

2

var(  2 ) 
2
n * SSx SSx
Propiedades de los estimadores
MCO

 Homocedasticidad: El error u tiene la misma


varianza para cualquier valor de la variable
explicativa. Var(u/x)=σ2
Regresión a través del origen
 
Yi   2 X i  ui
 Existen ocasiones en que se impone una
restricción que cuando x=0, y=0.
 Se denomina regresión al origen porque la
recta pasa a través del punto x=0, y=0.
 Para obtener la estimación del parámetro se
emplea MCO.
 No suele usarse en la practica porque el
estimador de la pendiente es sesgado.
Diferencias

Y=β 1 + β2 X Y=β2 X
 Para estimar  Para estimar
parámetros se utilizan parámetros se utilizan
sumas cuadráticas SSX, sumas de cuadrados
SSy, SSXY. simples Σx2, Σy2 , Σxy.
 Grados de libertad=n-2.  Grados de libertad=n-1
 Σ ui=0  No siempre Σ ui=0
 r2 no negativo  r2 puede resultar
negativo y por tanto
incorrecto.
Ejercicio
Utilice el archivo CEOSAL2 que contiene información sobre
directores generales (CEO) Salary es el sueldo anual (miles
de dólares) y ceoten son los años de antigüedad como CEO.
 Estime los siguientes modelos de regresión simple e

interprete sus diferencias.


 Salary=bo+b1ceoten
 Salary=b1ceoten

También podría gustarte