Está en la página 1de 64

Econometría

Grado en Administración y Dirección de Empresas


3º CURSO
UNIDAD 2. EL MODELO BÁSICO DE
REGRESIÓN LINEAL
Prof. Dra. Irene Ródenas
10 de ABRIL 2023 Monedero
Ve más allá
Facultad de Ciencias Sociales y de
la Comunicación
Índice
 Tema 1. Especificación del modelo básico de regresión lineal (MBRL).

 Tema 2. Estimación por el método de mínimos cuadrados ordinarios (MCO).

 Tema 3. Normalidad, inferencia y bondad de ajuste.

 Tema 4. Ejemplo completo de estimación e inferencia.

© Copyright Universidad Europea. Todos los derechos reservados 2


TEMA 1. Especificación del modelo básico
de regresión lineal (MBRL).

© Copyright Universidad Europea. Todos los derechos reservados 3


1. Las relaciones teóricas entre variables
2. Las hipótesis “ideales” del modelo
3. H.1.Modelo estocástico y H.2. Causalidad unidireccional
3.1. H.1. modelo estocástico (o aleatorio)
3.2. H.2. La causalidad del modelo es unidireccional
4. H.3. Linealidad y H.4. Especificación correcta
4.1. H.3. Linealidad
4.2. H.4. Especificación correcta
5. H.5. Coeficientes constantes y H.6. Suficientes grados de
libertad 5.1. H.5. Coeficientes constantes
5.2. H.6. Suficientes grados de libertad
6. H.7. Variables explicativas no aleatorias y H.8.
Linealmente
independientes
6.1. H.7. Variables explicativas no aleatorias
6.2. H.8. Variables explicativas linealmente independientes
7. Hipótesis ideales sobre el error
8. Hipótesis “no ideal” sobre el error. H.12: errores
normalmente distribuidos
8.1. H.12. Término de error normalmente distribuido

© Copyright Universidad Europea. Todos los derechos reservados 4


1. Especificación del modelo básico de regresión lineal

1.1. Las relaciones teóricas entre variables

Para realizar una correcta


especificación econométrica es
Es necesario conocer, con suficiente
imprescindible contar con una
precisión, la realidad que se quiere
buena formación en teoría
describir
económica sobre el fenómeno que
se quiere estudiar

Es necesario conocer de antemano


La especificación supone pasar del
las limitaciones y posibilidades de
modelo económico(teórico)al
la información estadística de que se
econométrico (empírico)
dispone

se buscarán modelos parsimoniosos


se hace necesaria una revisión en la
© Copyright Universidad Europea. Todos los derechos reservados literatura 5
© Copyright Universidad Europea. Todos los derechos reservados 6
1. Especificación del modelo básico de regresión lineal

1.2. Las hipótesis “ideales” del modelo

 Además de las reglas teóricas que vienen dadas por la que nos garanticen que el modelo
Economía debemos imponer otras reglas estadísticas proporciona resultados precisos y
fiables

 Cuando usamos estimadores de parámetros poblacionales desconocidos, valoramos su precisión en


función de que dichos estimadores satisfagan todas o algunas de las denominadas propiedades
deseables de un estimador:

Insesgadez, eficiencia y consistencia

facilitan la aplicación de MCO

Cuando el modelo econométrico verifica todas las hipótesis ideales, se denomina modelo básico de
regresión lineal

© Copyright Universidad Europea. Todos los derechos reservados 7


1. Especificación del modelo básico de regresión lineal
1.2. Las hipótesis “ideales” del modelo
Problemas en el análisis econométrico
• Aparecerán cuando las hipótesis ideales dejen de verificarse (por errores del analista o por
razones ajenas a su actuación)
o TAREA: detectar el fallo y tratar de corregirlo para recuperar la calidad de nuestras
estimaciones.

© Copyright Universidad Europea. Todos los derechos reservados 8


1. Especificación del modelo básico de regresión lineal
1.3. H.1.Modelo estocástico y H.2. Causalidad unidireccional

H.1.Modelo estocástico

• La relación entre la variable a explicar (Y) y las "K" variables explicativas (Xi) especificadas en el
modelo es estocástica (es decir, aleatoria) debido a la presencia del término de error en el modelo
(ui)
H.2. La causalidad del modelo es unidireccional

• Establece que serán las "K" variables explicativas (Xi) las que expliquen la variable a explicar (Y), y no
al revés.
• En la mayoría de los casos reales, la causalidad se produce en las dos direcciones, para ello se utilizan
los denominados modelos de ecuaciones simultáneas

¡OJO! La causalidad implica correlación, pero no al revés.

Ejemplo:

© Copyright Universidad Europea. Todos los derechos reservados 9


1. Especificación del modelo básico de regresión lineal
1.4. H.3. Linealidad y H.4. Especificación correcta

H.3. Linealidad

• Establece que el modelo es lineal en los coeficientes βi, es decir, que estos se incorporan al modelo
sumando o multiplicando a las variables explicativas.
• Si el modelo no es lineal, debe ser linealizable para poder aplicar el MCO. Si no es linealizable, se
requerirán otros métodos de estimación como "mínimos cuadrados no lineales" o el algoritmo de
Newton-Rapson.

Ejemplo: función de producción de un bien con tecnología Cobb- Douglas

© Copyright Universidad Europea. Todos los derechos reservados 10


1. Especificación del modelo básico de regresión lineal
1.4. H.3. Linealidad y H.4. Especificación correcta

H.4. Especificación correcta

Establece que el modelo está correctamente especificado en el sentido de que:

 No omite variables explicativas relevantes para explicar la variable Y.


 No incluye variables explicativas superfluas para explicar la variable Y.
 Se identifica correctamente que la relación es lineal.
 Se identifican correctamente las relaciones de causalidad.

EJEMPLO: a la hora de seleccionar las variables explicativas de la cifra de ventas, no será igual
si el análisis es con datos de tipo transversal, temporal o de panel.

© Copyright Universidad Europea. Todos los derechos reservados 11


1. Especificación del modelo básico de regresión lineal
1.5. H.5. Coeficientes constantes y H.6. Suficientes grados de libertad

H.5. Coeficientes constantes

• Establece que los coeficientes βi permanecen estables lo largo de todas las


muestras.
EJEMPLO: Si la empresa estima con precisión el impacto del precio del producto sobre sus ventas, la H.5.
garantiza que la cuantía de dicho impacto será la misma en cualquier mercado de características similares donde
quiera vender su producto.
H.6. Suficientes grados de libertad

• Establece que el tamaño muestral "n" (es decir, el número de observaciones de cada variable) es mucho
mayor que el número de coeficientes a estimar "k+1". Es un requisito que garantiza la precisión y la
robustez de los resultados que se obtiene con la estimación.

• Si el número de observaciones es igual al número de coeficientes a estimar, se denomina ajuste perfecto,


situación de inestabilidad total

© Copyright Universidad Europea. Todos los derechos reservados 12


1. Especificación del modelo básico de regresión lineal
1.6. H.7. Variables explicativas no aleatorias y H.8. Linealmente independientes

H.7. Variables explicativas no aleatorias

• Establece que las variables explicativas toman valores deterministas (no aleatorios) de manera que no hay
asociada ningún tipo de incertidumbre en relación a los valores que toman las variables explicativas del
modelo en muestras repetidas.

• Esta hipótesis se viola en los modelos de series de tiempo donde, con frecuencia, se incluyen como variables
explicativas de la variable Y, valores retrasados (históricos) de ella misma.

Las ventas del año 2010 se incorporan al modelo para explicar la cifra de ventas del año 2011. Es siempre
una variable aleatoria porque depende del término de error (aleatorio)

© Copyright Universidad Europea. Todos los derechos reservados 13


1. Especificación del modelo básico de regresión lineal
1.6. H.7. Variables explicativas no aleatorias y H.8. Linealmente independientes

H.8. Variables explicativas linealmente independientes

• Establece que las variables explicativas son todas independientes entre sí de forma
que todas aportan información relevante a la hora de explicar la variable Y.

• La ausencia de dependencia lineal entre las variables explicativas del modelo


implica que no hay variables con información redundante en el mismo.

© Copyright Universidad Europea. Todos los derechos reservados 14


1. Especificación del modelo básico de regresión lineal

1.7. Hipótesis ideales sobre el error

© Copyright Universidad Europea. Todos los derechos reservados 15


1. Especificación del modelo básico de regresión lineal

1.7. Hipótesis ideales sobre el error

H.9. Término de error no sistemático

• Establece que el término de error es totalmente aleatorio, es decir, que no incluye ninguna
variable explicativa relevante que se ha omitido en la especificación del modelo por error del
analista.

Si aplicamos el operador esperanza matemática al término de error


del modelo, se observa que su esperanza es nula: E(ui)= Oi.

Es una consecuencia directa del


cumplimiento
de la H.4. especificación correcta

© Copyright Universidad Europea. Todos los derechos reservados 16


1. Especificación del modelo básico de regresión lineal

1.7. Hipótesis ideales sobre el error

H.10. Término de error es homocedástico

El incumplimiento de esta hipótesis se conoce como heterocedasticidad y afecta, directamente,


a la eficiencia (precisión) del estimador. Problema típico de datos de corte transversal.

© Copyright Universidad Europea. Todos los derechos reservados 17


1. Especificación del modelo básico de regresión lineal

1.7. Hipótesis ideales sobre el error

H.11. Término de error incorrelacionado

• Establece que el término de error de una observación no está relacionado con el


término de error de otras observaciones y, por lo tanto, la covarianza entre ellos es
nula. Es decir:

• El incumplimiento de esta hipótesis se conoce como autocorrelación y, al igual que la


heterocedasticidad, afecta directamente a la eficiencia (precisión) del estimador.

• La autocorrelación es un problema típico de modelos con datos series de tiempo

© Copyright Universidad Europea. Todos los derechos reservados 18


1. Especificación del modelo básico de regresión lineal

1.7. Hipótesis ideales sobre el error

H.11. Término de error incorrelacionado

Cuando el MBRL cumple las tres hipótesis vistas sobre el término de error, se dice que las
perturbaciones del modelo son esféricas

La matriz de varianzas-covarianzas del término de error es escalar:

Si no se cumple H10 y/o H11, las


perturbaciones no son esféricas

será necesario formular el modelo básico de


regresión lineal de un modo más general

Modelo de regresión lineal generalizado


(MRLG) y su estimación por mínimos
cuadrados generalizados (MCG)

© Copyright Universidad Europea. Todos los derechos reservados 19


1. Especificación del modelo básico de regresión lineal

1.8. Hipótesis “no ideal” sobre el error. H.12: errores normalmente distribuidos

• Hipótesis imprescindible para poder hacer contrastación de hipótesis y construir intervalos de


confianza.
• No es considerada ideal porque no es necesaria para obtener estimadores con propiedades deseables con
el método de MCO
H.12. Término de error normalmente distribuido

Establece que el término de error del modelo se distribuye según una distribución normal de media cero y
varianza constante.

NN indica una distribución Normal "N- dimensional, vector columna


de N términos de error

 2
Esta hipótesis garantiza el uso de distribuciones derivadas de la Normal, como son la t de Student, de
Pearson y la Fn,m de Snedecord; para hacer inferencia sobre los parámetros estimados.

© Copyright Universidad Europea. Todos los derechos reservados 20


TEMA 2. Estimación por el método de
mínimos cuadrados ordinarios (MCO).

© Copyright Universidad Europea. Todos los derechos reservados 21


1. Método de estimación por MCO
1. Problema que tratamos de solucionar
2. Expresiones matriciales
3. Método de estimación por mínimos cuadrados ordinarios
2. Propiedades de los estimadores MCO en el MBRL múltiple
2.1. P.1.
2.2. P.2.
3. El teorema de Gauss-Markov
3.1. P.3
3.2. P.4
4. Interpretación de los coeficientes estimados
4.1. Signos de los coeficientes estimados
4.2. Cuantía de los coeficientes estimados
4.3. Interpretación del término constante
4.4. Interpretación de los coeficientes cuando en el modelo hay variables en
logaritmos

© Copyright Universidad Europea. Todos los derechos reservados 22


2. Estimación por MCO

2.1. Método de estimación por MCO

1. Problema que tratamos de solucionar

función de regresión
muestral (FRM)

diferentes métodos de
obtención
Nos centraremos en el
método de estimación de
MCO

© Copyright Universidad Europea. Todos los derechos reservados 23


2. Estimación por MCO

2.1. Método de estimación por MCO

2. Expresiones matriciales

© Copyright Universidad Europea. Todos los derechos reservados 24


2. Estimación por MCO

2.1. Método de estimación por MCO

3. Método de estimación por mínimos cuadrados ordinarios

Sistema de ecuaciones normales

© Copyright Universidad Europea. Todos los derechos reservados 25


2. Estimación por MCO

2.1. Método de estimación por MCO

3. Método de estimación por mínimos cuadrados ordinarios

© Copyright Universidad Europea. Todos los derechos reservados 26


2. Estimación por MCO

2.1. Método de estimación por MCO

3. Método de estimación por mínimos cuadrados ordinarios

Importante
• Los supuestos sobre el término de error no son necesarios para obtener la expresión de estimador

• Algunos de los supuestos sobre el término de error son necesarios para garantizar alguna propiedad
del

© Copyright Universidad Europea. Todos los derechos reservados 27


2. Estimación por MCO

2.2. Propiedades de los estimadores MCO en el MBRL múltiple

PROPIEDAD 1

© Copyright Universidad Europea. Todos los derechos reservados 28


2. Estimación por MCO

2.2. Propiedades de los estimadores MCO en el MBRL múltiple

PROPIEDAD 1

Importante
La propiedad de linealidad del estimador es imprescindible de cara a la fase de validación del modelo si
asumimos que también se verifica la H.12 sobre la distribución del término de error

A partir de esta afirmación, podremos calcular los intervalos de confianza en los que se moverán las
estimaciones obtenidas y podremos realizar contrastes de hipótesis sobre el valor real de los parámetros

NOTA: teorema de aditividad de normales, sabemos que una función lineal de una variable aleatoria
que se distribuye como una normal, también sigue una distribución normal

© Copyright Universidad Europea. Todos los derechos reservados 29


2. Estimación por MCO

2.2. Propiedades de los estimadores MCO en el MBRL múltiple

PROPIEDAD 2

© Copyright Universidad Europea. Todos los derechos reservados 30


2. Estimación por MCO
2.3. El teorema de Gauss-Markov

PROPIEDAD 3

© Copyright Universidad Europea. Todos los derechos reservados 31


2. Estimación por MCO
2.3. El teorema de Gauss-Markov

PROPIEDAD 3

IMPORTANTE:
El teorema de Gaus-Markov establece la optimalidad del estimador MCO de los coeficientes del modelo en
el contexto del MBRL: “El estimador MCO es el estimador lineal e insesgado óptimo (ELIO), en el sentido
de que cualquier otro estimador lineal e insesgado tiene una varianza mayor”.

NOTA: en el caso de incumplirse alguna de las hipótesis ideales sobre el término de error, el estimador
MCO dejará de ser óptimo.

© Copyright Universidad Europea. Todos los derechos reservados 32


2. Estimación por MCO

2.3. El teorema de Gauss-Markov

PROPIEDAD 4

El estimador [] es CONSISTENTE.

Esta propiedad indica que, si fuese posible ampliar el tamaño muestral al tamaño total de
la población, el valor estimado de los parámetros coincidirá con su valor real y, por lo
tanto, su varianza
sería igual a cero.

© Copyright Universidad Europea. Todos los derechos reservados 33


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Ejemplo: Estamos interesados en analizar la evolución de las ventas de un producto (ventas) en el periodo
(2006-2010) en función de los gastos en publicidad (public) y el precio unitario de venta de dicho producto
(precio)

© Copyright Universidad Europea. Todos los derechos reservados 34


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

PASO 1. Especificar el modelo teórico (poblacional)

PASO 2: modelo estimado por MCO (la función de regresión muestral):

© Copyright Universidad Europea. Todos los derechos reservados 35


2. Estimación por MCO
2.4. Interpretación de los coeficientes estimados

Paso 3: Coeficientes estimados. Gretl calcula los signos y valores numéricos de los
coeficientes estimados de la siguiente manera:

© Copyright Universidad Europea. Todos los derechos reservados 36


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Paso 3: Coeficientes estimados. Gretl calcula los signos y valores numéricos de los
coeficientes estimados de la siguiente manera:

Desv. tipica
Signos de los coeficientes estimados

© Copyright Universidad Europea. Todos los derechos reservados 37


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Cuantía de los coeficientes estimados

Cada βi con i = 1,2 permite cuantificar el impacto parcial (es decir, ceteris paribus) de variaciones unitarias en cada
variable explicativa sobre la variable dependiente.
Tenemos que tener en cuenta las unidades de medida de las variables.

 = 2.935897 ⇒ Indica que, si no varía el precio de venta unitario del producto, un incremento anual de un
millón de euros en publicidad, aumenta la cifra de ventas anual del producto en 2.9 millones.

 = −0.311538 ⇒ Indica que, si no varía el gasto en publicidad anual, un incremento del precio de venta unitario
del producto de mil euros, reduce las ventas anuales en 0.3 millones.

© Copyright Universidad Europea. Todos los derechos reservados 38


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Interpretación del término constante

La inclusión de un término constante en la especificación del modelo es, generalmente, un artificio


matemático para lograr un mejor ajuste sin que tenga ninguna interpretación económica concreta

0= 3.180769 ⇒ Sería el valor de las ventas en el momento en el que, simultáneamente, se diese que el
precio unitario del producto fuese cero (es decir, el bien fuese gratuito) y la empresa no hubiese incurrido en
gastos de publicidad.

Como obviamente esta interpretación no tiene ningún sentido, en este caso concluiríamos que el término
constante no tiene interpretación económica.

© Copyright Universidad Europea. Todos los derechos reservados 39


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Interpretación de los coeficientes cuando en el modelo hay variables en logaritmos

• Cuando todas las variables del modelo (explicativas y dependientes) estén expresadas en
logaritmos:

Los coeficientes βi de las variables explicativas expresan el cambio porcentual en la variable Y


cuando la explicativa correspondiente varía en un 1%.

© Copyright Universidad Europea. Todos los derechos reservados 40


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Interpretación de los coeficientes cuando en el modelo hay variables en logaritmos

¿Por qué nos encontramos con variables explicativas en logaritmos?

 Que el modelo teórico no sea lineal y haya sido necesario linealizarlo mediante logaritmos para
poder aplicar un determinado método de estimación.

 En ocasiones, el fenómeno económico que se estudia (las variables) es muy volátil y es necesario
aplicar logaritmos para alisar el comportamiento de las variables fuertemente volátiles y poder
observar mejor la relación entre ellas. Esta transformación es muy típica en las series de datos
bursátiles.

© Copyright Universidad Europea. Todos los derechos reservados 41


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Interpretación de los coeficientes cuando en el modelo hay variables en logaritmos

x100 variación
porcentual de Y ante una
variación unitaria en X

© Copyright Universidad Europea. Todos los derechos reservados 42


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Interpretación de los coeficientes cuando en el modelo hay variables en logaritmos

variación unitaria
de Y ante una variación
de
un 1% en X

© Copyright Universidad Europea. Todos los derechos reservados 43


2. Estimación por MCO

2.4. Interpretación de los coeficientes estimados

Interpretación de los coeficientes cuando en el modelo hay variables en logaritmos

© Copyright Universidad Europea. Todos los derechos reservados 44


TEMA 3. Normalidad, inferencia y bondad de
ajuste

© Copyright Universidad Europea. Todos los derechos reservados 45


1. La hipótesis adicional de normalidad sobre el término de error del modelo
2. Contraste de normalidad: Jarque-Bera (JB)
3. Contraste de significatividad individual
4. Intervalos de confianza
5. Contraste de significatividad de todos los coeficientes del modelo
5.1. Contraste de significatividad conjunta de todos los coeficientes del modelo, a
partir del estadístico F de Snedecord
5.2. Contraste de significatividad conjunta de todos los coeficientes del modelo, a
partir del coeficiente de determinación lineal R2
5.3. Porcentaje de error

© Copyright Universidad Europea. Todos los derechos reservados 46


3. Normalidad, inferencia y bondad de ajuste
3.1. La hipótesis adicional de normalidad sobre el término de error del modelo

 Una vez especificado el modelo correctamente, nos interesará identificar y cuantificar la


capacidad de cada variable explicativa incluida en el mismo para explicar el comportamiento
de la variable dependiente.

El estimador MCO, sabemos que es una combinación lineal de la variable dependiente [] y a su vez es variable
aleatoria por depender del término de error

La distribución de probabilidad del término de


error del modelo determinará la del estimador.

• Si asumimos la hipótesis adicional (H.12) de que el término de error se distribuye como una Normal,
tendremos que si se dan las hipótesis ideales de homocedasticidad (H.9) y ausencia de correlación entre los
términos de error del modelo (H.10), la distribución del vector de perturbaciones será:

© Copyright Universidad Europea. Todos los derechos reservados 47


3. Normalidad, inferencia y bondad de ajuste

3.1. La hipótesis adicional de normalidad sobre el término de error del modelo

© Copyright Universidad Europea. Todos los derechos reservados 48


3. Normalidad, inferencia y bondad de ajuste

3.1. La hipótesis adicional de normalidad sobre el término de error del modelo

Comportamiento de la variable Varianza de los parámetros estimados


dependiente • La hipótesis adicional de normalidad de las
• Estaremos interesados en estimar el valor de los perturbaciones es imprescindible para poder
parámetros. Dado que el contrastar las hipótesis de significatividad
• modelo econométrico es aleatorio, dicha estimación individual y conjunta de los parámetros
no ofrece un resultado exacto, tendrá un rango de estimados y para construir intervalos de
variación determinado por su distribución de confianza porque garantizan el uso de
probabilidad distribuciones derivadas de la normal.

Siempre será necesario contrastar la hipótesis de normalidad del


término de error del modelo como paso previo al análisis de
significatividad individual y conjunta de los parámetros estimados

Para lo que se requiere la utilización de los estadísticos tn de Student y Fn,m de


Snedecord.
© Copyright Universidad Europea. Todos los derechos reservados 49
3. Normalidad, inferencia y bondad de ajuste

3.1. La hipótesis adicional de normalidad sobre el término de error del modelo

Cálculo de la varianza de los parámetros estimados

Con el objetivo de disponer de un estimador insesgado de la varianza del término de error, se


utiliza:

K: nº total de
coeficientes a
estimar

Si incluimos este estimador en la expresión de los parámetros tipificados (es decir, les restamos la media y dividimos por
su desviación típica), obtenemos una nueva expresión útil para poder determinar los intervalos de confianza de dichos
parámetros:

© Copyright Universidad Europea. Todos los derechos reservados 50


3. Normalidad, inferencia y bondad de ajuste

3.2. Contraste de normalidad: Jarque-Bera (JB)

El contraste de Jarque–Bera (JB) está basado en los coeficientes de asimetría y curtosis de los residuos
generados por la estimación del modelo, que bajo la hipótesis nula se distribuye como:

 Si el coeficiente de asimetría de JB aplicado sobre los residuos no está muy alejado del valor 0 y el de curtosis
no difiere mucho de 3: no se rechazaría la hipótesis nula
 Este contraste tiene validez cuando la muestra es suficientemente grande (algunos autores consideran a partir de
50)

 Una clara evidencia de no normalidad puede avisarnos de la presencia de datos atípicos (outliers) en nuestro
modelo que pueden estar provocando heterocedastidad y alterando la eficiencia de nuestro estimador
obtenido por MCO.
 Corrección: eliminar estos datos.
© Copyright Universidad Europea. Todos los derechos reservados 51
3. Normalidad, inferencia y bondad de ajuste

3.3. Contraste de significatividad individual

Utilizaremos el contraste t-Student de significatividad individual de los parámetros para saber si debemos
incluir o no una variable en la especificación del modelo, en la medida en que si el verdadero valor del
parámetro fuera igual a cero está claro que la importancia de dicha variable para explicar a la variable
dependiente sería nula y, por tanto, no deberíamos incluirla en nuestro modelo.

© Copyright Universidad Europea. Todos los derechos reservados 52


3. Normalidad, inferencia y bondad de ajuste

3.3. Contraste de significatividad individual

• La especificación correcta del modelo en cuanto a la inclusión-exclusión de variables, va a ser un


factor fundamental desde el punto de vista de la validez de los contrastes de significación
individual.

• Cualquier programa estadístico facilita la contrastación de hipótesis mediante el uso del


denominado p-valor: nivel de significación crítico (menor probabilidad de que cometamos el error de
rechazar la hipótesis nula, siendo cierta (error tipo I)

EJEMPLO: estimamos el precio de las casas en Madrid en función de su superficie (en m2):

© Copyright Universidad Europea. Todos los derechos reservados 53


3. Normalidad, inferencia y bondad de ajuste

3.3. Contraste de significatividad individual

EJEMPLO: estimamos el precio (en euros) de las casas en Madrid en función de su superficie (en
m2):
N=50

El programa Gretl nos proporciona directamente el p-valor del estadístico t y su p-valor asociado:

© Copyright Universidad Europea. Todos los derechos reservados 54


3. Normalidad, inferencia y bondad de ajuste

3.3. Contraste de significatividad individual

En el caso de Gretl, las estrellas que acompañan a los p-valores asociados a los coeficientes
estimados, indican de manera directa el nivel de confianza estadística al que podemos rechazar la
hipótesis nula de no significatividad individual de las respectivas variables explicativas, manera que:

© Copyright Universidad Europea. Todos los derechos reservados 55


3. Normalidad, inferencia y bondad de ajuste

3.4. Intervalos de confianza

• Las estimaciones puntuales deben ir acompañadas de sus respectivos intervalos de confianza

• Para conocer entre qué valores estará realmente el valor de dicho parámetro con un 95% de confianza,
Gretl nos proporciona directamente el intervalo de confianza:

• Por cada m2 que aumente la superficie del piso, con una probabilidad del 95%, dará lugar a un
aumento de su precio de entre 3224.36 y 5463.93 euros.
• Cuanto menor sea el intervalo en el que se mueva el intervalo del parámetro, más preciso será el mismo.

© Copyright Universidad Europea. Todos los derechos reservados 56


3. Normalidad, inferencia y bondad de ajuste

3.5. Contraste de significatividad de todos los coeficientes del modelo

=0

Utilizaremos el contraste F-Snedecord de significatividad conjunta de los parámetros

© Copyright Universidad Europea. Todos los derechos reservados 57


3. Normalidad, inferencia y bondad de ajuste

3.5. Contraste de significatividad de todos los coeficientes del modelo

• Si se verifica la hipótesis de normalidad sobre el término de error de nuestro modelo, podemos


utilizar el estadístico F de Snedecor para realizar este contraste.

• Dado que la aceptación de la hipótesis alternativa es fácilmente alcanzable (que al menos


alguna variable incluida en el modelo sea significativa), no incluimos el término constante en
la hipótesis nula

Significatividad

Cualquier programa estadístico facilita la contrastación de hipótesis mediante el uso del denominado
p-valor asociado al estadístico F que determina la menor probabilidad de que cometamos el error de
rechazar la hipótesis nula, siendo cierta (error tipo I).

© Copyright Universidad Europea. Todos los derechos reservados 58


3. Normalidad, inferencia y bondad de ajuste

3.5. Contraste de significatividad de todos los coeficientes del modelo

+centroi

© Copyright Universidad Europea. Todos los derechos reservados 59


3. Normalidad, inferencia y bondad de ajuste
3.5. Contraste de significatividad de todos los coeficientes del modelo

También observamos que


ambas variables son
individualmente
significativas a un 99 % de
confianza

© Copyright Universidad Europea. Todos los derechos reservados 60


3. Normalidad, inferencia y bondad de ajuste
3.5. Contraste de significatividad de todos los coeficientes del modelo

Contraste de significatividad conjunta de todos los coeficientes del modelo, a partir del coeficiente de
determinación lineal R2

 El coeficiente de determinación lineal R2 representa la proporción de la varianza de la


variable dependiente poblacional (real) (Yi) que viene explicada por la varianza de la
variable estimada

• Sabiendo que en el MBRL se cumple que la varianza

© Copyright Universidad Europea. Todos los derechos reservados 61


3. Normalidad, inferencia y bondad de ajuste
3.5. Contraste de significatividad de todos los coeficientes del modelo

Contraste de significatividad conjunta de todos los coeficientes del modelo, a partir del coeficiente de
determinación lineal R2

Para poder comparar entre sí dos modelos se emplea habitualmente la el


con distinto número de variables coeficiente de determinación lineal
explicativas ajustado
por sus grados de libertad
En el ejemplo anterior:

Donde el R2=0.649091 indica que nuestro


modelo estaría explicando un 65% de la
variabilidad de los precios de las casas en
Madrid.

© Copyright Universidad Europea. Todos los derechos reservados 62


3. Normalidad, inferencia y bondad de ajuste
3.5. Contraste de significatividad de todos los coeficientes del modelo

Porcentaje de error

 Esta expresión nos permite interpretar el coeficiente de determinación lineal como el porcentaje de
la varianza real que viene explicado por la varianza estimada, ya que de este porcentaje se deduce
el porcentaje que supone el error.

 Efectivamente, podemos ver que a medida que la varianza de la estimada sea más diferente de la
varianza de la variable real, irá aumentando el valor de la varianza del Error

 En cualquier caso, el porcentaje de la varianza explicada de la variable dependiente estará


condicionado por el número de variables explicativas consideradas en el modelo de manera que, a
mayor número de variables explicativas, mayor valor del R2 (aunque estas no sean significativas).

© Copyright Universidad Europea. Todos los derechos reservados 63


Gracias

Ve más allá

© Copyright Universidad Europea. Todos los derechos reservados

También podría gustarte