Está en la página 1de 26

Unidad I - Modelo de

Regresión lineal simple


Econ. Ana Espinoza, MSc.
Modelo de regresión lineal simple
• 
Objetivo: Estimar la relación entre y y x (explicar y en términos de x)

• Y: variable dependiente (endógena)


• X: variable independiente (exógena)
• : Parámetro del intercepto
• : Parámetro de la pendiente – mide el efecto de x sobre y (el cambio en y está dado por
el cambio en X multiplicada por ) 
• : término de error o perturbación

** Todo cambio en una unidad de X tiene siempre el mismo efecto sobre y ( )


Ejemplos
El rendimiento del fréjol de soja está dado por :

• Y: rendimiento ; x: fertilizante

• 𝛽1: mide el efecto del fertilizante sobre el rendimiento cuando todo lo


demás es constante (u) 
Ejemplos
Salario de acuerdo a la educación observada:

• Y: salario (por hora) ; x: educación (en años)

• 𝛽1: variación en el salario por hora por cada año más de educación
cuando todo lo demás es constante (u)
Supuestos del modelo
•1.  Linealidad en parámetros : todo cambio de x
en una unidad tiene siempre el mismo efecto sobre y  (, sin
importar el valor de x.

EJ: y que

2. Media condicional nula: Ej: E(cap|8) = E(cap|


16)
Pregunta
Suponga que la calificación en un examen final, score, depende de las
asistencias a las clases (attend) y de factores no observados que
influyen sobre el desempeño en el examen (por ejemplo, habilidad del
estudiante).

score = 𝛽0 + 𝛽1attend + u

¿En qué casos se esperará que este modelo satisfaga E(u|x)=u?


Obtención de Estimaciones MCO: cómo
estimar 𝛽0 y 𝛽1 ?
• Para estimar los parámetros poblaciones, se necesita tomar una
muestra de la población. Sea {(xi,yi): i=1,…,n} una muestra aleatoria de
tamaño n tomada de la población:

• Partiendo de y , y utilizando propiedades


estadísticas para realizar algunas transformaciones…. se obtendrán los
estimadores de pendiente e intercepto.
Obtención de Estimaciones MCO: cómo
estimar 𝛽0 y 𝛽1 ?
Estimación de MCO (mínimos cuadrados ordinarios) del intercepto 𝛽0
(1)

Estimación de MCO de la pendiente 𝛽1

(2)

• Expresa la covarianza muestral entre x y y , sobre la varianza muestral de x.


• Si la muestra de x y y están correlacionadas (+)  Sera (+)
• Si la muestra de x y y están correlacionadas (-)  Sera (-)
Obtención de Estimaciones MCO: cómo
estimar 𝛽0 y 𝛽1 ?
Valor ajustado para y cuando x = xi (valor que se predice para y cuando
x = xi )

• Para cada valor de la muestra existirá un valor ajustado (valor


predicho)
Residual: diferencia entre el verdadero valor de yi y su valor ajustado.
Obtención de Estimaciones MCO: cómo
estimar 𝛽0 y 𝛽1 ?

y Se eligirán de tal manera que la SUMA DE RESIDUALES AL


CUADRADO sea tan pequeña como sea posible (de allí el nombre de
MINIMOS CUADRADOS ordinarios)

Se obtiene la línea de regresión por MCO:

Valores predichos
(corresponden a
estimaciones)
Obtención de Estimaciones MCO: cómo
estimar 𝛽0 y 𝛽1 ?
De la línea de regresión:

La pendiente estimada indica la cantidad en la que cambia yˆ cuando x


se incrementa en una unidad:
Ejemplos - Sueldo de los directores generales (CEO) y rendimiento sobre el capital

• Suponga el sgte. modelo sobre la relación entre el salario y el


rendimiento del capital:

• Y : salario (salario annual en miles de dólares)


• X: roe (%)
• Qué mide 𝛽1? Qué signo se esperaría que tenga 𝛽1?
Utilizando una base de datos sobre 209 CEO en el año 1990, se estimó
la s línea de regresión:
Ejemplos - Sueldo de los directores generales (CEO) y rendimiento sobre el capital

• Qué mide 𝛽1? El cambio en miles de dólares del salario provocado por un cambio de un pto.
porcentual % en el roe.
• Qué signo se esperaría que tenga 𝛽1? (+) un incremento en el rendimiento sobre el patrimonio,
debería de generar un mayor salario

De la regresión estimada:
• Si el roe=0 , el salario predicho del CEO es igual a $963,191.00
• Cambio que se predice para el salario en función del roe:
• Cuando el rendimiento sobre el patrimonio aumente en 1%, el salario aumentará en $18,501.00 (no
importa cuál sea el sueldo inicial)

• Si roe = 30  aprox. $1.5 millones (no quiere decir que para toda
empresa con roe =30  salario = $1.5 Mill (valores “predichos” , dependen de la muestra, hay más
factores que afectan el salario)
Ejemplos – Resultados de votación & gastos de campaña

• Con una base de datos de 173 contiendas bipartidistas, en las que en cada
contienda hay 2 candidatos: A y B, se obtuvieron datos sobre los resultados de las
elecciones y gastos de campaña de cada candidato. Para estimar si gastar más con
relación al rival implica mayor % de votos, se estimó la sgte. Línea de regresión:

• voteA = % votos obtenido por candidato A (resultados)


• shareA = % del total de gastos de campaña que corresponde al candidato A
• Existen otros factores que afecten los resultados de las elecciones? Cuáles?
• Qué significa 𝛽1?
Cuál es la cantidad de votos que se predice para el candidato A si shareA=60 (qué
significa 60%)? Tiene setido este resultado?
Propiedades MCO en cualquier muestra
Valores ajustados:
• Residuos :
• Ideal : , pero no sucede en realidad:
• Si >0  la regresión predice un valor inferior a yi
• Si < 0  la regresión predice un valor superior a yi
Propiedades MCO en cualquier muestra

Los valores predichos son


superiores al valor real de la
muestra
Propiedades algebraicas de los MCO
1. La suma y por tanto el promedio muestral de los residuales de MCO, es cero.
, donde
**Recordemos que los estimadores MCO se eligen de tal manera que minimicen la
suma de residuos al cuadrado (sea cero)
2. La covarianza muestral entre regresores y residuales de MCO es 0.

3. El punto se encuentra siempre sobre la línea de regresión MCO. Ej: se


estimó la líne de regresión .
Promedio muestral de educ es 12.56 y del salario 5.90. Si reemplazamos educ =
12.56 en la regresion estimada  salario predicho = 5.88 ~5.90
Propiedades algebraicas de los MCO
Suma total de cuadrados (STC):
• Variación muestral total en las yi  qué tan dispersas estan las yi en la muestra

Suma explicada de cuadrados (SEC)


• Variación muestral de las , donde

Suma residual de Cuadrados (SRC)


• Variación muestral de los

STC también puede expresarse como


Bondad de ajuste (R2)
• Qué tan bien se ajusta la línea de regresión MCO a los datos?
• Qué tan bien la variable explicativa, x, eplica la variable dependiente , y?  R2

proporción de la variación muestral de y que es explicada por x


• 0 ≤ R2 ≤ 1
• R2 x 100  % de la variación muestral de y que es explicada por x
• R2 = 1  ajuste perfecto de los datos
• R2 ~ 0  ajuste pobre de los datos (poca variación de las yi es captada por la variación de las
 R2 muy baja no necesariamente significa que la regresión MCO es inútil.

IMPORTANTE: NO ATRIBUIR el éxito de una regresión solamente al R2


Bondad de ajuste (R2) - Ejemplo
De la regresión estimada para medir el efecto del roe (rendimiento del
capital) sobre el salario del CEO:

• Cómo se interpreta el R2 en esta regresión?


• Cuánto de la variación en el salario es explicado por el rendimiento sobre
el capital? Qué concluiría respecto a este resultado?
Bondad de ajuste (R2) - Ejemplo
De la regresión estimada para medir el efecto del roe (rendimiento del capital)
sobre el salario del CEO:

• Cómo se interpreta el R2 en esta regresión?  0.0132x100 = 1.32%  el


rendimiento sobre el capital explica solamente el 1.32% de la variación en los
salarios de la muestra de CEO’s.
• Qué concluiría acerca de la variación del salario de la muestra que es explicada
por el rendimiento sobre el capital?  que no explica mucho la variación en los
salarios (la R2 es baja), el 98.7% de la variación en los salarios no queda explicada!
Unidades de medición

Qué pasa cuando cambian las unidades de medición de la variable


dependiente?
Ej: Caso 1:
salary : miles de dólares al año
Las dos regresiones tienen la
Caso 2 : misma interpretación
salardol = 1,000*salary

Un cambio de unidades en la variable dependiente no varía la interpretación de los resultados 


cuando se multiplica la variable dependiente por una constante c  toda la muestra se multiplica por
c  el intercepto y pendiente también se multiplican por c
Unidades de medición
Qué pasa cuando cambian las unidades de medición de la variable
independiente?
Ej: Caso 1: Para conservar la
interpretación:
salary : miles de dólares al año
variable
Caso 2 : independiente se
roedec = roe/100  roedec =0.15 (rendimiento sobre el capital del 15%) dividió por 100 y la
 mismo resultado que en caso 1 pendiente se mult.
*100
Un cambio de unidades en la variable independiente no cambia al intercepto:
• Si la variable independiente se divide por una constante c  coeficiente de pendiente se
multiplica por c
• Si la variable independiente se multiplica por una constante c  coeficiente de
pendiente se divide por c
Incroporación de No linealidades

Por qué incorporar no linealidades?


Ej: cuándo expresar una variable en forma logarítmica ? Ej: rendimiento de
la educación sobre el salario (rendimientos constantes o crecientes?)
El cambio del salario de acuerdo con la educación puede expresarse de forma en que
por cada año más de educación, el salario aumente un porcentaje constante. 
log(wage) Cambio porcentual del salario por un
año más de educación (el cambio
porcentual es el mismo por cada año
adicional de educación 
“rendimiento creciente”)
Un incremento de años de educación de 11 a 12 años, puede producir un
aumento en el salario del 6%
Incroporación de No linealidades -
Ejemplo
Estimando la regresión del salario sobre la educación:

• Educ tiene una interpretación porcentual multiplicándola por 100

Interpretación CORRECTA: por cada año más de educación el salario predicho aumenta en
8,3% (0.083*100=8,3%).
INCORRECTO: un año más de educación incrementa log(wage) 8.3 por ciento)

Por qué utilizar log(wage)? Para imponer a la educación un efecto porcentual constante sobre el
salario.
Incorporación de No linealidades – Formas
funcionales usando logaritmos

Semi-elasticidad de y
respecto a x

Elasticidad de y
respecto a x

También podría gustarte