Está en la página 1de 33

Estadistica Empresarial II

Lección 7
Modelo Lineal Simple

Manuel León Navarro

Instituto de Estudios Bursátiles

M. León Estadistica Empresarial II 1 / 28


Introducción a la Causalidad y Correlación

Hasta ahora el estudio se ha centrado en el análisis de una variable


(algo en diferencia de medias)
En esta lección empezaremos el estudio de las relaciones entre
variables.
Existen dos tipos de relación: Correlación y Causalidad.
La correlación trata de investigar si dos variables suelen ocurrir de
forma conjunta
La causalidad trata de investigar si una variable explica o causa a
otra. Es una relación más profunda.

M. León Estadistica Empresarial II 2 / 28


Introducción a la Causalidad y Correlación

La diferencia fundamental es que mientras que la causalidad trata


de establecer la causa definitiva de un problema, con la correlación se
trata de identificar factores importantes asociados con el problema.
En muchos estudios, especialmente aquellos que se llevan a cabo por
teóricos, tienden a confundir ambos conceptos.

Video

M. León Estadistica Empresarial II 3 / 28


Introducción a la Causalidad y Correlación
Pero a veces Si ....

M. León Estadistica Empresarial II 4 / 28


Correlación

Dos variables están correlacionadas si existe una asociación empı́rica


entre ellas. Puede ser positiva o negativa
Si es positiva quiere decir que cuando una variable toma un valor
alto (en relación a su media) entonces la otra variable tambien
tenderá a mostrar valores altos (en relación a su media)
Si no hay correlación entre las variables, entonces decimos que los
valores de las mismas no tienen un comportamiento sistematico
(habra valores altos de una con altos o bajos de la otra).
La herramienta más basica que nos permite medir correlación es el
coeficiente de correlación lineal r , que toma valores entre [−1, 1]
El análisis correlacional, tiene cierto valor explicativo aunque parcial
y con muchas cautelas. Si dos variables estan correlacionadas, es
posible que una de ellas explique a la otra, aunque no es necesario.

M. León Estadistica Empresarial II 5 / 28


Correlación Espúrea

Ahora bien, puede darse él caso de que dos variables estén
aparentemente relacionadas, pero que en realidad no lo están (lo que
se conoce en el lenguaje de la investigación como çorrelación
espuria”).
A veces la correlación entre dos variables se produce por una tercera
que afecta a las dos de forma conjunta.

Z −→ X
↘ Y
La simple correlación entre X e Y no implica ningun tipo de relación
causal entre ambas.
Ejemplo clásico: Correlación entre venta de helados y hectáreas
incendiadas (factor común: temperatura).

M. León Estadistica Empresarial II 6 / 28


Causalidad

El último nivel de un proceso de investigación consiste en descubrir las


causas o los factores que están detras de un determinado fenómeno.
El interés se centra en explicar por qué ocurre un fenómeno y en qué
condiciones se da éste. Normalmente se explicará el fenomeno en
términos de una serie de variables explicativas.
Para poder responder a esta pregunta es necesario el uso de modelos
estadı́sticos más avanzados que permitan controlar por la exitencia
de factores comunes y evitar correlaciones espúreas.
En algunos campos de la estadı́stica o econometrı́a el tratamiento de
la causalidad es formal, habiéndose desarrollado conceptos y
técnicas para diferenciar la correlación espúrea de la causalidad: Series
Temporales (“causalidad en sentido de Granger”).
En esta lección estudiaremos las relaciones LINEALES (también
aquellas que se puedan linealizar)
M. León Estadistica Empresarial II 7 / 28
Modelo lineal simple - Introducción

Modelo estadı́stico - Modelo Matemático - Modelo Teorı́a Económica


Etapas de la modelización estadı́stica-econométrica
Especificación del modelo (Identificación)
Estimación del Modelo
Diagnosis del Modelo
Utilización del Modelo (Inferencia, Predicción, etc)

M. León Estadistica Empresarial II 8 / 28


Modelo lineal simple - Tipos de variables (Datos) -
Notación

Datos de sección cruzada (i). Son individuos en un momento del


tiempo (personas, paises, etc)
Datos temporales (t). Son variables referentes a una variable a lo
largo de un tiempo determinado (años, meses, dı́as, etc)
Datos de Panel. Son variables de individuos que evolucionan en el
tiempo.
Un mismo problema estadı́stico se puede plantear en términos temporales
o de sección cruzada. Ejemplo: Efectos del stock de capital humano sobre
el crecimiento para datos agregados de España o también para datos de
las distintas CCAA.

M. León Estadistica Empresarial II 9 / 28


Modelo lineal simple - Especificación

El modelo lineal simple tiene la forma:

Yi = β0 + β1 Xi + Ui
Donde
Yi es la variable dependiente (endógena)
Xi es la variable independiente (exógena)
Ui es un variable aleatoria que cumple
E (Ui ) = 0, Var (Ui ) = σu2 y Cov (Ui , Uj ) = 0
Además se supone que Ui es Normal, por lo que Ui ∼ N(0, σu2 )

M. León Estadistica Empresarial II 10 / 28


Modelo lineal simple - Interpretación parámetros

Constante (β0 )
Es el valor esperado de la Yi cuando Xi = 0, es decir
 
Yi
β0 = E
Xi = 0

Pendiente (β1 )
Refleja la variación de la Yi cuando la variable Xi aumenta en una
unidad
∂Yi
β1 =
∂Xi
Transformaciones: Modelo en Logaritmos

Ln(Yi ) = β0 + β1 Ln(Xi ) + Ui

M. León Estadistica Empresarial II 11 / 28


Modelo lineal simple - Interpretación modelo logaritmos

El modelo, una vez despejada Yi es

Yi = e β0 +β1 Ln(Xi )+Ui


Y derivando

∂Yi 1
= e β0 +β1 Ln(Xi )+Ui · β1 ·
∂Xi Xi
teniendo en cuenta el resultado anterior y reorganizando se obtiene que:
∂Yi
Yi
β1 = ∂Xi
Xi

En ese caso β1 es el incremento porcentual de la Yi cuando la Xi aumenta


en un 1 %. Es decir es una elasticidad

M. León Estadistica Empresarial II 12 / 28


Modelo lineal simple - Interpretación modelo - Ejercicio

Sea el modelo
Ln(Yi ) = β0 + β1 Xi + Ui
Obtenga la interpretación del parámetro β1
Sea el modelo
Yi = β0 + β1 Ln(Xi ) + Ui
Obtenga la interpretación del parámetro β1

M. León Estadistica Empresarial II 13 / 28


Modelo lineal simple - Interpretación modelo - Ejercicio -
Solución
Para el caso de Ln(Yi ) = β0 + β1 Xi + Ui , en primer lugar despejamos Yi :

Yi = e β0 +β1 Xi +Ui
Y derivamos respecto a Xi
∂Yi
= e β0 +β1 Xi +Ui · β1
∂Xi
∂Yi
Ahora, con Yi = e β0 +β1 Xi +Ui , la expresión queda ∂Xi = Yi · β1
Y reorganizando
∂Yi
Yi
β1 =
∂Xi
Y por lo tanto β1 se interpreta de la siguiente manera: Si la Xi aumenta en
una unidad, la Yi aumentara en β1 %.
M. León Estadistica Empresarial II 14 / 28
Modelo lineal simple - Interpretación modelo - Ejercicio -
Solución

Para el caso de Yi = β0 + β1 Ln(Xi ) + Ui


Y derivamos respecto a Xi

∂Yi 1
= β1 ·
∂Xi Xi
Y reorganizando

∂Yi
β1 = ∂Xi
Xi

Y por lo tanto β1 se interpreta de la siguiente manera: Si la Xi aumenta en


un 1 %, la Yi aumentará en β1 unidades.

M. León Estadistica Empresarial II 15 / 28


Modelo lineal simple - Ejemplos
La ecuación de consumo de una economı́a:
Modelo teorı́a económica - Modelo teórico
C = co + c1 Y
Modelo estadı́stico
Ct = β0 + β1 Yt + Ut
β1 es la propensión marginal a consumir
Si se quiere estudiar la relación entre el salario y la eduación se puede
plantear la ecuación:
Modelo teórico
W = f (E )
Modelo estadı́stico
Ln(Wi ) = β0 + β1 Ei + Ui
Interpretación de β1
M. León Estadistica Empresarial II 16 / 28
Modelo lineal simple - Ejemplos
Se supone que la nota de un alumno depende de las horas de estudio:

N = f (E )
Modelo estadı́stico
Ni = β0 + β1 Ln(Ei ) + Ui
Interpretación de β1 .
Se supone que el precio de las acciones de una empresa electrica
depende de la cantidad de lluvia:
Modelo teórico
P = f (R)
Modelo estadı́stico
Ln(Pt ) = β0 + β1 Ln(Rt ) + Ut
Interpretación de β1 (elasticidad precio-lluvia)
M. León Estadistica Empresarial II 17 / 28
Modelo lineal simple - Ejemplos

Estimación del modelo CAPM

E (ri ) − rf = βi (E (rm ) − rf )
Modelo Estadı́stico
rit − rft = βi (rmt − rft )

M. León Estadistica Empresarial II 18 / 28


Modelo lineal simple - Estimación

Para poder hacer inferencia se necesita dar unos valores a los parámetros
desconocidos =⇒ Estimador =⇒ Muestra =⇒ Estimación.
Definición-Y estimada
Dada un estimación de βˆ0 y βˆ1 se define Ŷi = βˆ0 + βˆ1 Xi .

Definición-Residuo
Dada un estimación de βˆ0 y βˆ1 se define el residuo del modelo como
Ûi = Yi − Ŷi

El residuo tambien se puede escribir como:

Ûi = Yi − βˆ0 + βˆ1 Xi

M. León Estadistica Empresarial II 19 / 28


Modelo lineal simple - Estimación - análisis gráfico
observacion 1 2 3 4 5 6 7 8 9 10
Y 2.74 2.36 4.32 3.04 2.02 2.48 1.54 2.908 1.84 4.18
X 1.2 2.3 2.6 1.7 1.1 1.9 1.2 2.34 1.45 2.9

M. León Estadistica Empresarial II 20 / 28


Modelo lineal simple - Estimación - análisis gráfico

M. León Estadistica Empresarial II 21 / 28


Modelo lineal simple - Estimación - Objetivo

La primera idea podria ser conseguir βˆ0 y βˆ1 de tal manera que se
minimice la suma de los residuos. Problema: Se pueden hacer muy
negativos.
La siguiente idea que nos viene a la cabeza es ponderar aquellos
valores que se van por exceso de aquellos que se van por defecto. Esto
se puede hacer elevandolos al cuadrado. Por lo tanto se debe
minimizar la suma de residuos al cuadrado.
Definición de Suma Residual
SR= ni=1 Ûi2
P

Pn 2
La estrategia que seguiremos será Min SR, es decir Min i=1 Ûi

M. León Estadistica Empresarial II 22 / 28


Modelo lineal simple - Estimación - Objetivo
Minimizar ni=1 Ûi2
P
A través de la definición de residuo:
n
X n 
X 2
Ûi2 = Yi − Ŷi
i=1 i=1

Y con la definición de Ŷi se obtiene que queremos minimar la expresión:


X n  2
Yi − (βˆ0 + βˆ1 Xi )
i=1

Las soluciones de dicho programa de optimización son:


Pn
ˆ (Xi − X̄ )(Yi − Ȳ ) Cov (X , Y )
β1 = i=1 Pn 2
=
i=1 (Xi − X̄ ) Var (X )

βˆ0 = Ȳ − βˆ1 X̄
M. León Estadistica Empresarial II 23 / 28
Modelo lineal simple - Estimación - Ejemplo

obs. Y X Y − Ȳ X − X̄ (Y − Ȳ )(X − X̄ ) (Y − Ȳ )2 (X − X̄ )2
1 2.74 1.2 -0.003 -0.669 0.002 0.000 0.448
2 2.36 2.3 -0.383 0.431 -0.165 0.147 0.186
3 4.32 2.6 1.577 0.731 1.153 2.488 0.534
4 3.04 1.7 0.297 -0.169 -0.050 0.088 0.029
5 2.02 1.1 -0.723 -0.769 0.556 0.522 0.591
6 2.48 1.9 -0.263 0.031 -0.008 0.069 0.001
7 1.54 1.2 -1.203 -0.669 0.805 1.447 0.448
8 2.908 2.34 0.165 0.471 0.078 0.027 0.222
9 1.84 1.45 -0.903 -0.419 0.378 0.815 0.176
10 4.18 2.9 1.437 1.031 1.482 2.066 1.063
Suma 27.428 18.69 0.000 0.000 4.230 7.669 3.696

27,428 18,69
Por lo tanto Ȳ = 10 = 2,74 X̄ = 10 = 1,87. Además:
4,230
βˆ1 = = 1,144
3,696
Y por último βˆ0 = 2,74 − 1,144 · 1,87 = 0,6
M. León Estadistica Empresarial II 24 / 28
Modelo lineal simple - Estimación - Ejemplo (cont.)

obs. Y X Ŷ Û
1 2.74 1.20 1,98 = 0,6 + 1,144 · 1,20 0,76 = 2,74 − 1,98
2 2.36 2.30 3,24 = 0,6 + 1,144 · 2,30 −0,88 = 2,36 − 3,24
3 4.32 2.60 3,58 = 0,6 + 1,144 · 2,60 0,74 = 4,32 − 3,58
4 3.04 1.70 2,55 = 0,6 + 1,144 · 1,70 0,49 = 3,04 − 2,55
5 2.02 1.10 1,86 = 0,6 + 1,144 · 1,10 0,16 = 2,02 − 1,86
6 2.48 1.90 2,78 = 0,6 + 1,144 · 1,90 −0,30 = 2,48 − 2,78
7 1.54 1.20 1,98 = 0,6 + 1,144 · 1,20 −0,44 = 1,54 − 1,98
8 2.91 2.34 3,28 = 0,6 + 1,144 · 2,34 −0,37 = 2,91 − 3,28
9 1.84 1.45 2,26 = 0,6 + 1,144 · 1,45 −0,42 = 1,84 − 2,26
10 4.18 2.90 3,92 = 0,6 + 1,144 · 2,90 0,26 = 4,18 − 3,92
Suma 27.43 18.69 27.43 0.00

M. León Estadistica Empresarial II 25 / 28


Modelo lineal simple - Estimación - Ejercicio
Se quiere estudiar el efecto que la tasa de paro puede tener en la tasa de
inflación (curva de Phillips). Para ello se obtienen los datos de la tabla
siguiente:
años Inflación Tasa de Paro
2001 1.04 -0.25
2002 -3.19 3.99
2003 -2.28 2.75
2004 -0.41 1.82
2005 0.67 0.34
2006 -1.67 2.26
2007 -0.16 1.25
2008 -2.782 2.61
2009 -0.735 1.67
2010 -3.47 2.23

Se pide
Planteé un modelo estadı́stico que permita contestar a la pregunta.
Estime dicho modelo e interprete el resultado
Calcule la inflación esperada en cada año y los residuos.
M. León Estadistica Empresarial II 26 / 28
Modelo lineal simple - Estimación - Ejercicio - Solución

Si denominamos a Yt como la tasa de inflación y Xt como la tasa de


paro, el modelo que permite contestar a la pregunta es:

Yt = β0 + β1 · Xt + Ut
Para estimar el modelo anterior se deben calcular las medias y
varianzas de las variables, ası́ como la covarianza entre ambas.
obs. Y X Y − Ȳ X − X̄ (Y − Ȳ )(X − X̄ ) (Y − Ȳ )2 (X − X̄ )2
2001 1.04 -0.25 2.339 -2.117 -4.951 5.470 4.481
2002 -3.19 3.99 -1.891 2.122 -4.014 3.577 4.504
2003 -2.28 2.75 -0.981 0.877 -0.860 0.963 0.769
2004 -0.41 1.82 0.889 -0.046 -0.041 0.790 0.002
2005 0.67 0.34 1.969 -1.526 -3.004 3.876 2.329
2006 -1.67 2.26 -0.371 0.391 -0.145 0.138 0.153
2007 -0.16 1.25 1.139 -0.615 -0.700 1.297 0.378
2008 -2.782 2.61 -1.483 0.745 -1.105 2.200 0.555
2009 -0.735 1.67 0.564 -0.195 -0.110 0.318 0.038
2010 -3.47 2.23 -2.171 0.364 -0.790 4.715 0.133
Suma -12.987 18.69 0.000 0.000 -15.721 23.342 13.341

M. León Estadistica Empresarial II 27 / 28


Modelo lineal simple - Estimación - Ejercicio - Solución

−12,987
Con lo sumatorios anteriores, se obtiene que Ȳ = 10 = −1,299 y
que X̄ = 18,69
10 = 1,87.
La estimación de β1 se obtiene como:
−15,72
βˆ1 = = −1,178
13,34
La estimación de β0 se obtiene como
βˆ0 = −1,299 − (−1,178) · 1,87 = 0,904
La interpretación de las estimaciones es la siguiente: β1 = −1,178
significa que por cada unidad que aumenta la tasa de paro la inflación
se reduce en 1.178 unidades. β0 = 0,904 significa que si la tasa de
paro fuera 0 (pleno empleo) la tasa de inflación de esta economı́a
serı́a 0.904.

M. León Estadistica Empresarial II 28 / 28


Modelo lineal simple - Estimación - Ejercicio - Solución

El análisis gráfico del problema se presenta en el gráfico siguiente:

M. León Estadistica Empresarial II 29 / 28


Modelo lineal simple - Estimación - Ejercicio - Solución

Por último, se presenta la estimación de cada variable exogena y los


residuos:
obs. Y X Ŷ Û
2001 1.04 -0.25 1,20 = 0,904 − 1,178 · (−0,25) −0,16 = 1,04 − 1,2
2002 -3.19 3.99 −3,80 = 0,904 − 1,178 · (3,99) 0,61 = −3,19 − (−3,80)
2003 -2.28 2.75 −2,33 = 0,904 − 1,178 · (2,75) 0,05 = −2,28 − (−2,33)
2004 -0.41 1.82 −1,24 = 0,904 − 1,178 · (1,82) 0,83 = −0,41 − (−1,24)
2005 0.67 0.34 0,50 = 0,904 − 1,178 · (0,34) 0,17 = 0,67 − 0,50
2006 -1.67 2.26 −1,76 = 0,904 − 1,178 · (2,26) 0,09 = −1,67 − (−1,76)
2007 -0.16 1.25 −0,57 = 0,904 − 1,178 · (1,25) 0,41 = −0,16 − (−0,57)
2008 -2.78 2.61 −2,18 = 0,904 − 1,178 · (2,61) −0,61 = −2,78 − (−2,18)
2009 -0.74 1.67 −1,07 = 0,904 − 1,178 · (1,67) 0,33 = −0,74 − (−1,07)
2010 -3.47 2.23 −1,73 = 0,904 − 1,178 · (2,23) −1,74 = −3,47 − (−1,73)
Suma -12.99 18.69 -12.99 0.00

M. León Estadistica Empresarial II 30 / 28


Modelo lineal simple - en R

La función que permite estimar un modelo lineal simple es lm(). Dicha


función toma la forma:
lm(Y ~ X)

Con datos de diferentes cotizaciones se quiere saber como afecta la


cotización máxima de Iberdrola al precio de cierre de Iberdrola.
library(readxl)
cotiz_men <- read_excel("C:/docencia/estadistica/estadistica IEB/datos/attach(cotiz_men)
eq1 <- lm(IBE.Cl ~ IBE.Hi)
eq1

M. León Estadistica Empresarial II 31 / 28


Modelo lineal simple - en R

El resultado que se obtiene del código anterior es


Call:
lm(formula = IBE.Cl ~ IBE.Hi)

Coefficients:
(Intercept) IBE.Hi
0.08159 0.94366

Donde se observa que la estimación de β0 es 0.081 y la estimación de β1


es 0.943. Por lo tanto se conlcuye que si el precio máxima aumenta en una
unidad, el precio último lo hará en 0.94 unidades.

M. León Estadistica Empresarial II 32 / 28


Modelo lineal simple - en R

Tambien se podrı́a especificar en logaritmos


library(readxl)
cotiz_men <- read_excel("C:/docencia/estadistica/estadistica IEB/datos/attach(cotiz_men)
eq2 <- lm(log(IBE.Cl) ~ log(IBE.Hi))

cuyo resultado es:


Call:
lm(formula = log(IBE.Cl) ~ log(IBE.Hi))

Coefficients:
(Intercept) log(IBE.Hi)
-0.08103 1.02006

Ejercicio: ¿Como se interpretaria?

M. León Estadistica Empresarial II 33 / 28

También podría gustarte