Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Además de las reglas teóricas que vienen dadas por la que nos garanticen que el modelo
Economía debemos imponer otras reglas estadísticas proporciona resultados precisos y
fiables
Cuando el modelo econométrico verifica todas las hipótesis ideales, se denomina modelo básico de
regresión lineal
H.1.Modelo estocástico
• La relación entre la variable a explicar (Y) y las "K" variables explicativas (Xi) especificadas en el
modelo es estocástica (es decir, aleatoria) debido a la presencia del término de error en el modelo
(ui)
H.2. La causalidad del modelo es unidireccional
• Establece que serán las "K" variables explicativas (Xi) las que expliquen la variable a explicar (Y), y no
al revés.
• En la mayoría de los casos reales, la causalidad se produce en las dos direcciones, para ello se utilizan
los denominados modelos de ecuaciones simultáneas
Ejemplo:
H.3. Linealidad
• Establece que el modelo es lineal en los coeficientes βi, es decir, que estos se incorporan al modelo
sumando o multiplicando a las variables explicativas.
• Si el modelo no es lineal, debe ser linealizable para poder aplicar el MCO. Si no es linealizable, se
requerirán otros métodos de estimación como "mínimos cuadrados no lineales" o el algoritmo de
Newton-Rapson.
EJEMPLO: a la hora de seleccionar las variables explicativas de la cifra de ventas, no será igual
si el análisis es con datos de tipo transversal, temporal o de panel.
• Establece que el tamaño muestral "n" (es decir, el número de observaciones de cada variable) es mucho
mayor que el número de coeficientes a estimar "k+1". Es un requisito que garantiza la precisión y la
robustez de los resultados que se obtiene con la estimación.
• Establece que las variables explicativas toman valores deterministas (no aleatorios) de manera que no hay
asociada ningún tipo de incertidumbre en relación a los valores que toman las variables explicativas del
modelo en muestras repetidas.
• Esta hipótesis se viola en los modelos de series de tiempo donde, con frecuencia, se incluyen como variables
explicativas de la variable Y, valores retrasados (históricos) de ella misma.
Las ventas del año 2010 se incorporan al modelo para explicar la cifra de ventas del año 2011. Es siempre
una variable aleatoria porque depende del término de error (aleatorio)
• Establece que las variables explicativas son todas independientes entre sí de forma
que todas aportan información relevante a la hora de explicar la variable Y.
• Establece que el término de error es totalmente aleatorio, es decir, que no incluye ninguna
variable explicativa relevante que se ha omitido en la especificación del modelo por error del
analista.
Cuando el MBRL cumple las tres hipótesis vistas sobre el término de error, se dice que las
perturbaciones del modelo son esféricas
1.8. Hipótesis “no ideal” sobre el error. H.12: errores normalmente distribuidos
Establece que el término de error del modelo se distribuye según una distribución normal de media cero y
varianza constante.
2
Esta hipótesis garantiza el uso de distribuciones derivadas de la Normal, como son la t de Student, de
Pearson y la Fn,m de Snedecord; para hacer inferencia sobre los parámetros estimados.
función de regresión
muestral (FRM)
diferentes métodos de
obtención
Nos centraremos en el
método de estimación de
MCO
2. Expresiones matriciales
Importante
• Los supuestos sobre el término de error no son necesarios para obtener la expresión de estimador
• Algunos de los supuestos sobre el término de error son necesarios para garantizar alguna propiedad
del
PROPIEDAD 1
PROPIEDAD 1
Importante
La propiedad de linealidad del estimador es imprescindible de cara a la fase de validación del modelo si
asumimos que también se verifica la H.12 sobre la distribución del término de error
A partir de esta afirmación, podremos calcular los intervalos de confianza en los que se moverán las
estimaciones obtenidas y podremos realizar contrastes de hipótesis sobre el valor real de los parámetros
NOTA: teorema de aditividad de normales, sabemos que una función lineal de una variable aleatoria
que se distribuye como una normal, también sigue una distribución normal
PROPIEDAD 2
PROPIEDAD 3
PROPIEDAD 3
IMPORTANTE:
El teorema de Gaus-Markov establece la optimalidad del estimador MCO de los coeficientes del modelo en
el contexto del MBRL: “El estimador MCO es el estimador lineal e insesgado óptimo (ELIO), en el sentido
de que cualquier otro estimador lineal e insesgado tiene una varianza mayor”.
NOTA: en el caso de incumplirse alguna de las hipótesis ideales sobre el término de error, el estimador
MCO dejará de ser óptimo.
PROPIEDAD 4
El estimador [] es CONSISTENTE.
Esta propiedad indica que, si fuese posible ampliar el tamaño muestral al tamaño total de
la población, el valor estimado de los parámetros coincidirá con su valor real y, por lo
tanto, su varianza
sería igual a cero.
Ejemplo: Estamos interesados en analizar la evolución de las ventas de un producto (ventas) en el periodo
(2006-2010) en función de los gastos en publicidad (public) y el precio unitario de venta de dicho producto
(precio)
Paso 3: Coeficientes estimados. Gretl calcula los signos y valores numéricos de los
coeficientes estimados de la siguiente manera:
Paso 3: Coeficientes estimados. Gretl calcula los signos y valores numéricos de los
coeficientes estimados de la siguiente manera:
Desv. tipica
Signos de los coeficientes estimados
Cada βi con i = 1,2 permite cuantificar el impacto parcial (es decir, ceteris paribus) de variaciones unitarias en cada
variable explicativa sobre la variable dependiente.
Tenemos que tener en cuenta las unidades de medida de las variables.
= 2.935897 ⇒ Indica que, si no varía el precio de venta unitario del producto, un incremento anual de un
millón de euros en publicidad, aumenta la cifra de ventas anual del producto en 2.9 millones.
= −0.311538 ⇒ Indica que, si no varía el gasto en publicidad anual, un incremento del precio de venta unitario
del producto de mil euros, reduce las ventas anuales en 0.3 millones.
0= 3.180769 ⇒ Sería el valor de las ventas en el momento en el que, simultáneamente, se diese que el
precio unitario del producto fuese cero (es decir, el bien fuese gratuito) y la empresa no hubiese incurrido en
gastos de publicidad.
Como obviamente esta interpretación no tiene ningún sentido, en este caso concluiríamos que el término
constante no tiene interpretación económica.
• Cuando todas las variables del modelo (explicativas y dependientes) estén expresadas en
logaritmos:
Que el modelo teórico no sea lineal y haya sido necesario linealizarlo mediante logaritmos para
poder aplicar un determinado método de estimación.
En ocasiones, el fenómeno económico que se estudia (las variables) es muy volátil y es necesario
aplicar logaritmos para alisar el comportamiento de las variables fuertemente volátiles y poder
observar mejor la relación entre ellas. Esta transformación es muy típica en las series de datos
bursátiles.
x100 variación
porcentual de Y ante una
variación unitaria en X
variación unitaria
de Y ante una variación
de
un 1% en X
El estimador MCO, sabemos que es una combinación lineal de la variable dependiente [] y a su vez es variable
aleatoria por depender del término de error
• Si asumimos la hipótesis adicional (H.12) de que el término de error se distribuye como una Normal,
tendremos que si se dan las hipótesis ideales de homocedasticidad (H.9) y ausencia de correlación entre los
términos de error del modelo (H.10), la distribución del vector de perturbaciones será:
K: nº total de
coeficientes a
estimar
Si incluimos este estimador en la expresión de los parámetros tipificados (es decir, les restamos la media y dividimos por
su desviación típica), obtenemos una nueva expresión útil para poder determinar los intervalos de confianza de dichos
parámetros:
El contraste de Jarque–Bera (JB) está basado en los coeficientes de asimetría y curtosis de los residuos
generados por la estimación del modelo, que bajo la hipótesis nula se distribuye como:
Si el coeficiente de asimetría de JB aplicado sobre los residuos no está muy alejado del valor 0 y el de curtosis
no difiere mucho de 3: no se rechazaría la hipótesis nula
Este contraste tiene validez cuando la muestra es suficientemente grande (algunos autores consideran a partir de
50)
Una clara evidencia de no normalidad puede avisarnos de la presencia de datos atípicos (outliers) en nuestro
modelo que pueden estar provocando heterocedastidad y alterando la eficiencia de nuestro estimador
obtenido por MCO.
Corrección: eliminar estos datos.
© Copyright Universidad Europea. Todos los derechos reservados 51
3. Normalidad, inferencia y bondad de ajuste
Utilizaremos el contraste t-Student de significatividad individual de los parámetros para saber si debemos
incluir o no una variable en la especificación del modelo, en la medida en que si el verdadero valor del
parámetro fuera igual a cero está claro que la importancia de dicha variable para explicar a la variable
dependiente sería nula y, por tanto, no deberíamos incluirla en nuestro modelo.
EJEMPLO: estimamos el precio de las casas en Madrid en función de su superficie (en m2):
EJEMPLO: estimamos el precio (en euros) de las casas en Madrid en función de su superficie (en
m2):
N=50
El programa Gretl nos proporciona directamente el p-valor del estadístico t y su p-valor asociado:
En el caso de Gretl, las estrellas que acompañan a los p-valores asociados a los coeficientes
estimados, indican de manera directa el nivel de confianza estadística al que podemos rechazar la
hipótesis nula de no significatividad individual de las respectivas variables explicativas, manera que:
• Para conocer entre qué valores estará realmente el valor de dicho parámetro con un 95% de confianza,
Gretl nos proporciona directamente el intervalo de confianza:
• Por cada m2 que aumente la superficie del piso, con una probabilidad del 95%, dará lugar a un
aumento de su precio de entre 3224.36 y 5463.93 euros.
• Cuanto menor sea el intervalo en el que se mueva el intervalo del parámetro, más preciso será el mismo.
=0
Significatividad
Cualquier programa estadístico facilita la contrastación de hipótesis mediante el uso del denominado
p-valor asociado al estadístico F que determina la menor probabilidad de que cometamos el error de
rechazar la hipótesis nula, siendo cierta (error tipo I).
+centroi
Contraste de significatividad conjunta de todos los coeficientes del modelo, a partir del coeficiente de
determinación lineal R2
Contraste de significatividad conjunta de todos los coeficientes del modelo, a partir del coeficiente de
determinación lineal R2
Porcentaje de error
Esta expresión nos permite interpretar el coeficiente de determinación lineal como el porcentaje de
la varianza real que viene explicado por la varianza estimada, ya que de este porcentaje se deduce
el porcentaje que supone el error.
Efectivamente, podemos ver que a medida que la varianza de la estimada sea más diferente de la
varianza de la variable real, irá aumentando el valor de la varianza del Error
Ve más allá