Documentos de Académico
Documentos de Profesional
Documentos de Cultura
V. Independiente V. Dependiente
2
El Análisis de Regresión
• El objetivo del análisis de regresión es explicar y pronosticar
el comportamiento de la variable dependiente a través del
comportamiento de la o las variables independientes.
3
El Análisis de Regresión
• La regresión y correlación están relacionadas pero son
distintos.
4
El Análisis de Regresión
• El análisis de regresión es útil en econometría cuando queda
claramente definido el sentido de la relación causal: “qué
causa a qué”.
5
El Análisis de Regresión
• Ejemplo: Número de ahogados y ventas de helados
• Esta variables pueden presentar cierta asociación, pero no
existe una relación causal entre ellas.
Si observo datos de estas dos variables, quizás podría encontrar cierta asociación entre esas
dos variables.
Ahogados
6
Otros ejemplos de regresión espuria
http://www.tylervigen.com/spurious-correlations
Ejemplo de relación espuria: Gasto en ciencia y tecnología de los EE.UU vs la cantidad de
suicidos por arma, estrangulación o sofocación
7
EJEMPLO: Total de ventas de los arcades vs la cantidad de grados de doctor en los
EE.UU. Pero en ninguno de los ejemplos, hay relación causal. no existe relación causal
entre estas variables.
8
El Modelo de Regresión Lineal Clásico con Dos
Variables
• La idea es explicar a la endógena 𝑌 mediante un solo regresor
𝑋.
Parte explicada por X F. Regresión
Lluvia, por ejemplo.
Comportamiento de Y
Cosecha, supongamos. Perturbación
Parte no explicada por X
Puede ser fertilizantes, o error
técnicas de sembrado, etc
• En ecuaciones: 𝑌𝑖 = 𝐹𝑅𝑃𝑖 + 𝑢𝑖
El volumen de Aquella parte Y aquella
cosechas se explicada por la parte que no
descomponen en: variable X es explicada 9
por X
Supuestos del MRLC con 2 variables
• Empezaremos definiendo y explicando los supuestos.
FRP o “regresión”
La Función de regresión poblacional es
una función lineal de los X y los betas.
• En otras palabras, la 𝐹𝑅𝑃𝑖 es lineal en los parámetros 𝛽1 y 𝛽2 .
• 𝛽1 es el intercepto
• 𝛽2 es la pendiente
10
Supuestos del MRLC con 2 variables
• ¿Qué significa lineal en parámetros? Los “betas” aparecen
como términos independientes o como coeficientes. Ejemplos:
• 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 2 + 𝑢𝑖
𝛽
• 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 3 + 𝑢𝑖
1 Yi se relaciona con la inversa de Xi, obviamente esa inversa
• 𝑌𝑖 = 𝛽1 + 𝛽2 + 𝑢𝑖 es no lineal en la variable, sin embargo, satisface el
𝑋𝑖 supuesto de linealidad en los parámetros. Porque beta 1 y
beta 2 aparecen en forma lineal.
• 𝑌𝑖 = 𝑒 𝛽1 𝑋𝑖 𝛽2 𝑒 𝑢𝑖
11
Supuestos del MRLC con 2 variables
• La relación entre 𝑋 e 𝑌 puede verse mediante un diagrama de
dispersión La relación entre Y *
En este caso, ese pata tiene X decimos que es
lineal, entonces
trazamos una línea
recta que es la FRP.
Esa línea poblacional
sirve como una
especie de guía
teórica de cómo es la
relación entre da
educación y los
salarios.
𝑢1 𝐹𝑅𝑃𝑖 = 𝛽1 + 𝛽2 𝑋𝑖
𝑢2
Nota: Esa función de regresión
poblacional depende de estos
parámetros beta 1 y beta 2. Cabe aclarar
que estos parámetros son
PARÁMETROS POBLACIONALE, por lo
tanto, no son parámetros visibles por el
investigador. El investigador solo puede
observar esos puntos negros.
12
Supuestos del MRLC con 2 variables
• Supuesto 2: La esperanza condicional de 𝑢𝑖 dado 𝑋𝑖 es igual a
cero
𝐸 𝑢𝑖 |𝑋𝑖 = 0 𝑖 = 1, … , 𝑛
13
Supuestos del MRLC con 2 variables
• El supuesto, 𝐸 𝑢𝑖 |𝑋𝑖 = 0 dice que no importa qué valor tome Esto es otra característica
𝐸 𝑢𝑖 𝑋𝑖 = 0
equivale a decir que
los puntos se
encuentran
alrededor de la
𝑋𝑖 = 6 𝑋𝑖 = 11 recta, a lo largo de
ella.
14
Supuestos del MRLC con 2 variables
• Veamos ahora a la esperanza condicional, 𝐸 𝑌𝑖 𝑋𝑖 .
• En el ejemplo, es el salario promedio para cada nivel Es decir, el valor
esperado del salario dado
que observo un nivel X de
educativo. educación.
𝐸 𝑌𝑖 𝑋𝑖 = 𝛽1 + 𝛽2 𝑋𝑖
tal cuál, que es la Función de
regresión Poblacional Teórica,
FRP
15
Supuestos del MRLC con 2 variables
Porque
es
constant
𝐸 𝑌𝑖 𝑋𝑖 = 𝐸 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖 𝑋𝑖
La esperanza se aplica a cada uno de estos sumandos Porque Porque la
es condicional de
constante X contra X es
Por el supuesto 1, esta esperanza es igual a 0. la misma
variable
= 𝛽1 + 𝛽2 𝑋𝑖 + 𝐸 𝑢𝑖 𝑋𝑖
=0
Por lo tanto, se comprueba que esa esperanza es igual a FRP
= 𝛽1 + 𝛽2 𝑋𝑖
16
Supuestos del MRLC con 2 variables
• Otras implicaciones del supuesto 2:
17
Supuestos del MRLC con 2 variables
• Demostración de (a): Dada la ley de las expectativas totales,
𝐸 𝐸 𝑎 𝑏 = 𝐸[𝑎], entonces
𝐸 𝑢𝑖 = 𝐸 𝐸 𝑢𝑖 𝑋𝑖
=𝐸 0 =0
18
Supuestos del MRLC con 2 variables
• Demostración de (c) :
𝐶𝑜𝑣 𝑋𝑖 , 𝑢𝑖 = 𝐸 𝑋𝑖 − 𝐸 𝑋𝑖 𝑢𝑖 − 𝐸 𝑢𝑖 Aquí multiplico todos los
términos .
= 𝐸 𝑋𝑖 𝑢𝑖 − 𝐸 𝑋𝑖 𝑢𝑖 − 𝑋𝑖 𝐸 𝑢𝑖 + 𝐸 𝑋𝑖 𝐸 𝑢𝑖
Es constante, porque ya es una media, si le saco
E otra vez es el mismo valor constante o sea E[X]
= 𝐸 𝑋𝑖 𝑢𝑖 − 𝐸 𝑋𝑖 𝐸 𝑢𝑖 − 𝐸 𝑋𝑖 𝐸 𝑢𝑖 + 𝐸 𝑋𝑖 𝐸[𝑢𝑖 ]
= 𝐸 𝑋𝑖 𝑢𝑖 − 𝐸 𝑋𝑖 𝐸 𝑢𝑖
Se van son iguales.
19
Supuestos del MRLC con 2 variables
Antes hablamos de la
relación de los errores con
los valores aleatorios de
Xi, sin embargo, en este
• Supuesto 3: Las perturbaciones son “esféricas”. supuesto 3 vamos a
hablar de las varianzas y
covarianzas.
Los individuos tienen la misma variabilidad en sus perturbaciones, para todo i siempre será sigma al cuadrado. Eso se llama
𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎 2 ∀𝑖 = 1, … , 𝑛 “Homocedasticidad”
20
Supuestos del MRLC con 2 variables
Densidad
Remuneraciones
𝑌 La amplitud de la campana es la varianza o
dispersión y como vemos es constante
alrededor de la reta.
5
𝐸 𝑌𝑖 |𝑋𝑖 = 𝛽1 + 𝛽2 𝑋𝑖
10
15
𝑋 Años de educación
La dispersión de las remuneraciones es constante a lo largo de la recta
de regresión.
21
Supuestos del MRLC con 2 variables
Y Y
X X
Pero, en cambio aquí la dispersión va aumentando conforme
aumente los X
Si mis datos son homocedásticos eso quiere decir que mis
observaciones que son los puntitos se encuentren
salpicados a lo largo de la recta, pero con la misma
dispersión
Homocedástico Heterocedástico
22
Supuestos del MRLC con 2 variables
• No autocorrelación en series de tiempo: el error en un Esto ya lo hemos hablado,
periodo no se relaciona con el error de otros periodos solo que lo diferenciaremos
aquí con la definición de
corte transversal que aún no
hemos definido.
23
Supuestos del MRLC con 2 variables
• Supuesto 4: La variable aleatoria 𝑋 se encuentra “fija” en
muestras repetidas.
• La muestra de datos es una muestra aleatoria obtenida de la
población.
• Normalmente, los valores de X e Y deberían cambiar si se
toman diferentes muestras.
• Ejem: Muestras de 3 individuos, X=Educación, Y=Salario
• Supuesto 2 (a): 𝐸 𝑢𝑖 = 0
• Supuesto 3 (a): 𝑉𝑎𝑟 𝑢𝑖 = 𝜎 2 𝐶𝑜𝑣(𝑢𝑖 , 𝑢𝑗 ) = 0
25
MODELO DE REGRESIÓN LINEAL CLÁSICO CON 2 VARIABLES
26