Está en la página 1de 41

Econometrı́a

Modelo de Regresión con dos Variables:


Inferencia Estadı́stica

Profesor: Mauricio Leiva del Campo


e-mail: m.leiva@udd.cl

Ingenierı́a Comercial
Universidad del Desarrollo

Primer Semestre 2022

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 1 / 41


En la clase anterior...
• En la clase anterior vimos el r 2 como medida de bondad de ajuste.
• Los definimos de la siguiente forma:

(Yi − Y )2
P b
2 SCE
r =P 2
=
(Yi − Y ) SCT

• ó también como:

ubi2
P
2 SCR
r =1− P 2
=1−
(Yi − Y ) SCT

• La cantidad r 2 se conoce como coeficiente de determinación (muestral), y es la medida


más común de la bondad del ajuste de una lı́nea de regresión.
• En otras palabras, r 2 mide la proporción o el porcentaje de la variación total en Y
explicada por el modelo de regresión.
Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 2 / 41
En la clase anterior...

• Podemos observar 2 propiedades de r 2 :


1 Es una cantidad no negativa.
2 Sus lı́mites son 0 ≤ r 2 ≤ 1
• Donde 1 significa un ajuste perfecto, es decir, Ybi = Yi por cada i.
• Un r 2 cero significa que no hay relación entre la variable dependiente y la explicativa, es
decir βb1 = 0
• Nota... Revisar R 2 ajustado. Libro Gujarati 2010, página 201.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 3 / 41


En la clase anterior...
Participación de la variación de Yi en dos componentes.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 4 / 41


Coeficiente de Correlación

• Una cantidad estrechamente relacionada con el r 2 , pero conceptualmente muy diferente


es el coeficiente de correlación
• El Coeficiente de correlación es una medida del grado de asociación entre dos variables

r = ± r2

• o de su definición que se conoce como Coeficiente de Correlación Muestral


P
xi yi
r=qP
( xi2 )( yi2 )
P
P P P
n Xi Yi − ( Xi )( Yi )
=q P
[n Xi2 − ( Xi )2 ][n Yi2 − ( Yi )2 ]
P P P

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 5 / 41


Coeficiente de Correlación

Alguna propiedades de r :
1 Puede tener signo positivo o negativo.
2 −1 ≤ r ≤ 1
3 Es simétrico, es decir, el coeficiente de correlación entre Y y X (rYX ) es el mismo entre
X e Y (rXY )
4 Si X y Y son estadı́sticamente independientes1 , el coeficiente de correlación es cero; pero
una correlación igual a cero (r = 0) no necesariamente implica independencia estadı́stica

1
Dudas: revisar en algún libro de estadı́stica
Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 6 / 41
Coeficiente de Correlación

Alguna propiedades de r :
5 r es una medida de asociación lineal o dependencia lineal; su uso en la descripción de
relaciones no lineales no tiene significado.
6 Aunque es una medida de asociación lineal entre dos variables, esto no implica
necesariamente alguna relación causa-efecto. Correlación no implica causalidad

¿Cómo se verı́a gráficamente?

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 7 / 41


Teorı́a Clásica de la Inferencia Estadı́stica

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 8 / 41


Teorı́a Clásica de la Inferencia Estadı́stica

• La Teorı́a Clásica de la Inferencia Estadı́stica consta de dos partes:


• Estimación
• Prueba de Hipótesis
• Hasta ahora hemos estudiado el tema de la estimación del modelo de regresión lineal (con
una variable explicativa).
• Con ciertos supuestos del modelo clásico, fue posible mediante el método de MCO
estimar los parámetros para β0 , β1 y σ 2 .

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 9 / 41


Teorı́a Clásica de la Inferencia Estadı́stica

• Para estimar mediante el método de MCO no hicimos ningún supuesto sobre la


distribución que tienen los errores en el modelo
• Asumimos que esta distribución tiene media cero y varianza constante.
• Sin embargo, cuando se pretende realizar inferencia estadı́stica se debe incorporar un
supuesto adicional al modelo lineal general.
• La idea básica es que si queremos conocer con que probabilidad es posible observar un
determinado valor del parámetro, debemos conocer la forma de su distribución.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 10 / 41


Supuesto de Normalidad de ui

El modelo clásico de regresión lineal normal supone que cada ui está normalmente distribuida
con:
• Media: E (ui ) = 0
• Varianza: E [ui − E (ui )]2 = E (ui2 ) = σ 2
• cov (ui , uj ) : E {[ui − E (ui )][uj − E (uj )]} = E (ui uj ) = 0 con i 6= j

Estos supuestos se expresan en forma compacta como:

ui ∼ N(0, σ 2 )

• Donde el sı́mbolo ∼ significa distribuido


• N significa distribución normal

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 11 / 41


Supuesto de Normalidad de ui

• ¿Qué significan los términos entre paréntesis?


• Como vimos, para dos variables normalmente distribuidas, una covarianza o correlación
cero significa independencia entre las dos variables.
• Por lo que el supuesto de normalidad anterior significa que ui y uj no solo no están
correlacionadas, sino que también están idénticamente distribuidas.

ui ∼ NID(0, σ 2 )

• Donde NID significa Normal e independientemente distribuido

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 12 / 41


Supuesto de Normalidad de ui

¿Por qué debemos asumir el supuesto de normalidad?


¿Por qué se emplea este supuesto?

Algunas razones:
1 Influencia del error, ui . Esperamos que la influencia de estas variables sea pequeña y en el
mejor de los casos aleatoria.
2 Teorema central del lı́mite: Si existe un gran número de variables aleatorias independientes
con idéntica distribución, entonces, con pocas excepciones, la distribución de su suma
tiende a ser normal a medida que se incrementa al infinito el número de tales variables.
3 Una variante del teorema del lı́mite central establece que, aunque el número de variables
no sea muy grande, o si estas variables no son estrictamente independientes, su suma
puede estar aún normalmente distribuida.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 13 / 41


Supuesto de Normalidad de ui

4 Con el supuesto de normalidad, se derivan con facilidad las distribuciones de probabilidad


de los estimadores de MCO.
5 La distribución normal es una distribución comparativamente sencilla y requiere sólo dos
parámetros (la media y la varianza)
6 Si trabajamos con una muestra finita o pequeña, con datos de 100 o menos
observaciones, la suposición de normalidad desempeña un papel relevante. Permite utilizar
las pruebas estadı́sticas t, F y χ2 para los modelos de regresión.
7 Por último, en muestras grandes, los estadı́sticos de las pruebas t y F que se basan en el
supuesto de que el término de error está distribuido normalmente pueden seguir
aplicándose con validez.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 14 / 41


Propiedades de los estimadores MCO según supuesto de normalidad

1 Son insesgados
2 Tienen mı́nima varianza
3 Presentan consistencia
4 βb0 está normalmente distribuido
5 βb1 está normalmente distribuido
6 (n − k)(b σ 2 /σ 2 ) está distribuida como la distribución χ2 (ji cuadrada), con (n − k) gl.
7 (βb0 , βb1 ) se distribuyen de manera independiente respecto de σ b2
8 βb0 y βb1 ) tienen mı́nima varianza entre toda clase de estimadores insesgados, lineales o no
lineales (MEI).

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 15 / 41


Propiedades de los estimadores MCO según supuesto de normalidad

Para resumir...

Yi v N(β0 + β1 Xi , σ 2 )

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 16 / 41


Pruebas de Hipótesis e Intervalos de
Confianza

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 17 / 41


Algunas ideas...

• Para contextualizar, recordemos el ejemplo visto. El que muestra el aumento en un año de


escolaridad provocará un aumento de salario promedio por hora en 0, 7775
• Este βb1 constituye una cifra estimada (puntual) del valor poblacional desconocido de β1
• Pero, cabe preguntarse... ¿Qué tan confiable es esta estimación?
• Veremos primero la construcción de intervalos de confianza y luego evaluaremos la
significancia individual de los parámetros estimados.
• En estadı́stica, la confiabilidad puntual de un estimador, la medimos por su error estándar.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 18 / 41


Algunas ideas...

• Además, podemos construir un intervalo alrededor del estimador puntual, por ejemplo, un
intervalo que tenga un 95 % de probabilidad de incluir al verdadero valor del parámetro.
• Esto se conoce como Estimación por intervalos o Intervalos de Confianza
• Siendo más especı́ficos...
• Supongamos que deseamos encontrar que tan “cerca” está βb1 de β1 .

Pr (βb1 − δ ≤ β1 ≤ βb1 + δ) = 1 − α

• Donde δ y α son positivos, con 0 ≤ α ≤ 1.


• La probabilidad de que el intervalo aleatorio (βb1 − δ, βb1 + δ) sea 1 − α

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 19 / 41


Algunas ideas...

• El intervalo anterior, es conocido como Intervalo de Confianza


• 1 − α se denomina Coeficiente de Confianza
• α es el nivel de significancia
• Los extremos del intervalo de confianza se conocen como lı́mites de confianza o valores
crı́ticos
• βb1 − δ es el lı́mite de confianza inferior
• βb1 + δ es el lı́mite de confianza superior.
• Este estimador de intervalo es construido de manera que tenga una probabilidad
especı́fica 1 − α de contener en sus lı́mites al verdadero valor del parámetro.
• Por ejemplo, si α = 0, 05 (5 %), quiere decir que la probabilidad de que el intervalo
incluya al verdadero parámetro β1 es de 0, 95 (95 %)

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 20 / 41


Intervalos de Confianza para los Coeficientes de Regresión β0 y β1
Intervalo de Confianza para β1

• Anteriormente mostramos que con el supuesto de normalidad de ui , los estimadores de


MCO βb0 y βb1 son también normalmente distribuidos con medias y varianzas establecidas.

βb1 − β1
Z=
ee(β1 )
qP
βb1 − β1 xi2
=
σ
• Donde, se tiene Z normal estándar
• Pero, conocemos σ 2 ?

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 21 / 41


Intervalos de Confianza para los Coeficientes de Regresión β0 y β1
Intervalo de Confianza para β1

• En la práctica pocas veces conocemos σ 2


b2 . Por lo que si se reemplaza σ por
• Esta está determinada por el estimador insesgado de σ
σ
b podemos reescribir la ecuación anterior como:

βb1 − β1
t=
ee(βb1 )
qP
βb1 − β1 xi2
=
σ
b
• Donde ee(βb1 ) se refiere al error estándar estimado.
• La variable t sigue la distribución t con (n − k) gl.2

2
Se puede demostrar.
Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 22 / 41
Intervalos de Confianza para los Coeficientes de Regresión β0 y β1
Intervalo de Confianza para β1

• Por lo tanto en lugar de utilizar la distribución normal, usamos la distribución t para


construir un intervalo de confianza para β1 :

Pr (−tα/2 ≤ t ≤ tα/2 ) = 1 − α

• Donde el valor t al centro de la desigualdad es el valor calculado con la ecuación anterior


(t c ).
• tα/2 es el valor de la variable t obtenido de la distribución t para un nivel de significancia
de α/2 y n − k gl.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 23 / 41


Intervalos de Confianza para los Coeficientes de Regresión β0 y β1
Intervalo de Confianza para β1

• Reemplazando el resultado de t obtenido anteriormente, podemos reescribir el intervalo


de confianza como:
!
βb1 − β1
Pr −tα/2 ≤ ≤ tα/2 = 1 − α
ee(βb1 )

• Reorganizando términos, finalmente tenemos:


 
Pr βb1 − tα/2 · ee(βb1 ) ≤ β1 ≤ βb1 + tα/2 · ee(βb1 ) = 1 − α

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 24 / 41


Intervalos de Confianza para los Coeficientes de Regresión β0 y β1
Intervalo de Confianza para β1

• De forma compacta podemos escribir el intervalo de confianza para β1 a 100(1 − α) %


como:

βb1 ± tα/2 · ee(βb1 )

• De forma análoga, podemos escribir el intervalo de confianza para β0 como:


 
Pr βb0 − tα/2 · ee(βb0 ) ≤ β0 ≤ βb0 + tα/2 · ee(βb0 ) = 1 − α

• ¿Cómo será de forma compacta para β0 ?

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 25 / 41


Intervalos de Confianza para los Coeficientes de Regresión β0 y β1
Algunas Observaciones

• Nos podemos dar cuenta que los intervalos de confianza para los betas, en ambos casos la
amplitud del intervalo de confianza es proporcional al error estándar del estimados.
• Mientras más grande sea el error estándar, más amplio será el intervalo de confianza.
• Es decir, mientras mayor sera el ee del estimador, mayor será la incertidumbre de estimar
el verdadero valor del parámetro desconocido.
• Es por esto, la importancia del ee de un estimados, que suele describirse como una
medida de la precisión del estimador3

3
Con que precisión mide el estimador al verdadero parámetro poblacional
Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 26 / 41
Intervalo de Confianza para σ 2

• Podemos obtener el intervalo de confianza para σ 2 ?


• Sı́, el cual se expresa de la siguiente forma:
" #
b2
σ σ 2
Pr (n − k) 2 ≤ σ 2 ≤ (n − k) 2 =1−α
b
χα/2 χ1−α/2

• La interpretación de este intervalo es que si establecemos lı́mites de confianza a 95 %


sobre σ 2 y que entre estos lı́mites caerá el verdadero σ 2 , acertaremos, a la larga, 95 % de
las veces.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 27 / 41


Prueba de Hipótesis

• Vimos el problema de la estimación puntual y por intervalos, ahora consideraremos el


tema de las pruebas de hipótesis.
• ¿Es compatible o no lo es una observación o una estimación según la hipótesis planteada?
• Donde por compatible nos referimos a “bastante” cercano al valor hipotético, de forma
que no se rechaza la hipótesis planteada.
• Según el ejemplo, es el βb1 = 0, 7775 obtenido anteriormente consistente con la hipótesis
planteada. De ser ası́, no se rechaza la hipótesis, de lo contrario se puede rechazar.
• ¿Cuales son las hipótesis planteadas?

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 28 / 41


Prueba de Hipótesis

• Hipótesis Nula: Es la hipótesis plantada y se denota con el sı́mbolo H0


• Hipótesis Alternativa: La hipótesis nula suele contrastarse con una alternativa, que es la
hipótesis alternativa, la que suele denotarse como H1 o también como HA
• En estadı́stica, cuando se rechaza la hipótesis nula se dice que el hallazgo es
estadı́sticamente significativo
• Si la hipótesis nula no es rechazada, se dice que el resultado no es estadı́sticamente
significativo

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 29 / 41


Prueba de Hipótesis
Prueba de significancia de los coeficientes de regresión: la prueba t

• Un enfoque muy utilizado es el método de la prueba de significancia


• Lo que nos interesa es evaluar si cada parámetro estimado, de forma individual, es
estadı́sticamente significativo.
• Usamos los resultados muestrales para verificar la veracidad o falsedad de la hipótesis nula
(H0 )
• El criterio a utilizar (para β1 ), según el supuesto de normalidad, es el estadı́stico t

βb1 − β1
t=
ee(βb1 )
qP
βb1 − β1 xi2
=
σ
b
• Esta sigue una distribución t con n − k gl.
Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 30 / 41
Hipótesis nula “cero” y regla práctica

• Frecuentemente en los trabajos empı́ricos, la hipótesis nula es H0 : βk = 0


• Para el caso de β1 es H0 : β1 = 0 que quiere decir, que el coeficiente de la pendiente es
cero.
• Por que definimos la hipótesis nula de “cero” ?
• Porque se quiere establecer si Y tiene relación con la variable X , la variable explicativa.
• Es por esto que se toma el valor cero, por lo que no tendrı́a sentido tomar otro valor
(queremos evaluar si existe relación entre Y y X )
• A qué nos referimos con la regla práctica?

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 31 / 41


Hipótesis nula “cero” y regla práctica

• La regla práctica dice que si el número de grados de libertad es relativamente grande, y


si α se fija en 0, 05, se rechaza la hipótesis nula H0 : β1 = 0 si el valor t calculado es
superior a 1, 96 en valor absoluto.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 32 / 41


Hipótesis nula “cero” y regla práctica

• El razonamiento de estas reglas es el siguiente:

t = βb1 /ee(βb1 ) > tα/2


t = βb1 /ee(βb1 ) < −tα/2

• o expresado en valor absoluto:

βb1
|t| = > tα/2
ee(βb1 )

• Para los grados de libertad correspondientes


• Podemos plantear una hipótesis unilateral de una cola? es decir β1 > 0
• Sı́, el procedimiento es similar, mayor detalle revisar libro Gujarati, 2010; Capı́tulo 5.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 33 / 41


Selección del nivel de significancia: α

• ¿Qué nivel de significancia debemos escoger?


• Es aceptado escoger niveles de significancia α de 1, 5 y a lo mucho de 10 %
• Esto generalmente está estandarizado y son los niveles de significancia que se utilizan en
la mayorı́a de los trabajos empı́ricos que contienen econometrı́a.
• Podemos evitar el problema relacionado a la selección del valor apropiado de α al emplear
el conocido valor p del estadı́stico de prueba.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 34 / 41


Nivel exacto de significancia: Valor p

• Para calcular el nivel exacto de significancia, el procedimiento es el siguiente:


• Una vez que obtenemos el estadı́stico t (estadı́stico de prueba), podrı́amos mirar la tabla
estadı́stica adecuada y encontrar la probabilidad real de obtener un valor estadı́stico de
prueba tan grande o mayor que el obtenido
• Esta probabilidad se conoce como valor p y se define como el nivel de significancia más
bajo al cual puede rechazarse una hipótesis nula
• El problema es que tendrı́amos que mirar toda la tabla y compara con nuestro estadı́stico
calculado lo que serı́a un proceso ‘engorroso”
• Los softwares estadı́sticos como Stata, nos entregan rápidamente el valor p.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 35 / 41


Prueba de significancia Global del Modelo
• Permite evaluar la significancia conjunta y simultánea de los parámetros estimados del
modelo.
• En la hipótesis nula tenemos al modelo restringido donde los parámetros son cero. Se
plantea la siguiente hipótesis:

H0 : β1 = β2 = ...βk = 0
H1 : Al menos un βk 6= 0

• El estadı́stico calculado es:


(n − k)SCE
Fc =
(k − 1)SRC
r2 (n − k)
Fc = 2
·
(1 − r ) (k − 1)

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 36 / 41


Prueba de significancia Global del Modelo

• Este estadı́stico se distribuye F ya que involucra la comparación de dos varianzas que se


distribuyen chi-cuadrado
• Estadı́stico tabulado: Ft = F(α,k−1,n−k)
• Si Fc > Ft , se rechaza H0 y se concluye a favor de la significancia global del modelo.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 37 / 41


Resultados Stata - Ejemplo Salario Educación

Yb = −0, 83 + 0, 7775Xi

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 38 / 41


Resultados R - Ejemplo Salario Educación

Yb = −0, 83 + 0, 7775Xi
Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 39 / 41
Ejercicio
En una determinada empresa, se observaron los siguientes datos mensuales (medidos en
millones de pesos) correspondientes al año 2016:
Meses Ventas Publicidad
Enero 120.3 25.2
Febrero 125.2 26.6
Marzo 140.2 34.1
Abril 130.9 28.3
Mayo 131.3 28.6
Junio 130.2 28.3
Julio 132.1 29.4
Agosto 133.4 29.5
Septiembre 133.7 30.2
Octubre 132.4 29.5
Noviembre 129.8 27.9
Diciembre 140.9 35.2
Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 40 / 41
Ejercicio

Se solicita evaluar el Ingreso por Ventas en función del Gasto en Publicidad.


a) Establezca la función de regresión poblacional y muestral del modelo.
b) Calcule los coeficientes del modelo de regresión. Interpretar los resultados de estos
(estadı́sticamente y económicamente).
c) Obtener las varianzas y los errores estándar de los estimadores.
d) Comprobar mediante un prueba de hipótesis si el parámetro asociado a la variable
Publicidad es estadı́sticamente significativo al 5 %. Interpretar el resultado (Nota:
t(0,025;10) = 2, 228)
e) ¿Cuál es el poder explicativo del modelo propuesto? Determine e Interprete.

Universidad del Desarrollo Econometrı́a 04 Primer Semestre 2022 41 / 41

También podría gustarte