Está en la página 1de 6

Contabilidad y Finanzas

Asignatura: Econometría Año 3ro 5to Semestre


Clase No 3 Orientación Tema 1 Segunda parte.
Tema 1: Modelo de Regresión Lineal General
Contenido a Orientar
Objetivos:
Prueba F total, pruebas t parciales. Métodos de selección de la mejor ecuación de regresión en
modelos de regresión lineal múltiples. Pronósticos intervalos de confianza para los parámetros B o y B1 y
estimación de Yk linealidad de un modelo lineal y no lineal
Método:
 Explicativo
 Elaboración conjunta
Medios:
 Tiza y pizarra
 Libro de Texto
Control de la Actividad:
Preguntas de comprobación que sirven para la introducción de los nuevos contenidos y se chequera el
estudio independiente
Solución:
Ejercicio No 4
Con los datos del ejercicio anterior obtenga la matriz de varianzas y covarianzas
Solución

^ (b )=S2e ( x̀ x )−1 ; S 2e = ỳ y− b̀ x̀ y
V
n− p

21

[ ]
b̀ x̀ y=[ 1.038−( 0.073 ) 2.014 ] 37.7 = [ 1.038 ( 21 )−0.073 ( 37.7 )+ 2.014 ( 13.57 ) ]
13.57

n
b̀ x̀ y=46.375 ; ỳ y= [ ]
∑ y 2i =46.48 ; S2e = 46.48−46.375
i =1 7
=
0.10412
7
=0.015

pág. 1
102.95 −18.6 −106 0.072 −0.013 −0.074
^ (b )=0.015
V
[ [
1
21.5
18.6
−106
4.2
17 ][
17 = −0.013 0.0029 0.012
120 −0.074 0.012 0.084 ]
^ (b 0)=0.072 ; V
V ^ (b 1) =0.029 ; V
^ (b 2)=0.084

^ov ( b 0 b 1) =C
C ^ov ( b 1 b0 ) =−0.013

^ov ( b 0 b 2 )=C
C ^ov ( b 2 b 0 )=−0.074

^ov ( b 1 b2 ) =C
C ^ov ( b2 b1 ) =0.012

Introducción
Recordar de la estadística Matemática
 Prueba de significación sobre la ecuación de regresión lineal simple. Uso del estadígrafo F
SCreg
 Coeficiente de determinación R2= x 100 %
SC total
 Linealidad del Modelo
Desarrollo de la Clase
Prueba de significación sobre la ecuación de regresión lineal múltiple. Prueba de F total. Se realizará la
misma por la vía matricial, la cual es aplicable para la relación funcional entre dos o más variables
independientes, mediante el análisis de varianza en la regresión (ANOVA).

Causas de la Suma de Grados de Cuadrado Medio F F


Variación cuadrados Libertad (CM) (Calculada) (tabulada)
(SC) (GL)
Debido a la b̀ x̀ y−n ý 2 p-1 b̀ x̀ ỳ−n ý 2 S 2reg
Regresión p−1 S 2reg F1(p-1;n-p)
Residual o Error ỳ y−b̀ x̀ y 2 n-p ỳ y −b̀ x̀ y
n− p
Total ỳ y−n ý 2 n-1

En esta prueba se parte de las siguientes hipótesis


H0: B1=B2=…….=Bj
H1: al menos una Bj difiere de las demás
Regla de decisión Si F calculada ¿ Ftab Se rechaza H0 para un α dado
pág. 2
Si F calculada < Ftab no se rechaza H0
Se dan las conclusiones respecto a si la ecuación de regresión es o no de buen ajuste.
Retomemos los ejemplos 4 y 5 de la clase No2 ( de ejercitación ) en la cual se habían obtenido para el
modelo Y^ =B0 + B1 X 1 +B 2 X 2, con los siguientes datos:
Y 1.6 2.0 1.5 1.7 2.2 2.5 3.0 1.9 1.8 2.8
X1 4 2 4 2 1 1 1 2 2 1
X2 0.4 0.6 0.4 0.4 0.7 0.8 1 0.5 0.4 0.8

` ; ^y =1.038−0.073 x +2.014 ; n=10


b̀ xy=46.376 ; ỳ y=46.48 1

Se desea probar si la ecuación obtenida es de buen ajuste con α =5%

Solución:

H0: B1= B2

H1: B1≠ B2

Para obtener F debemos calcular las sumas de cuadrados y para ello se calculará además la media
de valores de y:
n

∑ yi 1,6+2.00+1.5+1.7+ 2.2+ 2.5+ 3.0+1.9+1.8+2.8 21


ý= i=1 = = =2.1
n 10 10

SCtotal= ỳ y−n ý 2=46.48−10 ( 2.1 )2=46.48−44.1=2.38

SC ^y = b̀ x̀ y−n ý2 =46.376−44.1=2.276

SCe`= ỳ y− b̀ x̀ y 2=SC total−SC ^y=2.38-2.276=0.104

SC e ỳ y −b̀ x̀ y 0.104
CM e = = = =0.015
n− p n− p 7

SC ^y b̀ x̀ ỳ−n ý 2 2.276
CM ^y = = = =1.138
p−1 p−1 2

CM ^y 1.138
F= = =75.85
CM e 0.015

Causas de la Suma de Grados de Cuadrado Medio F F


Variación cuadrados Libertad (CM) (Calculada) (tabulada)
pág. 3
(SC) (GL)
Debido a la 2.276 2 1.138 75.85
Regresión F1(2;7)=4.74
Residual o Error 0.0104 7 0.104
Total 2.38

Como 75.85 >4.74 se rechaza H0 con α=5% por lo que se puede concluir que la ecuación obtenida
es de buen ajuste.

Coeficiente de determinación Múltiple

SC ^y 2.276
R2= 100 %= 100=95.6 %
SC total 2.38

Interpretación: el 95.6 % de la variación del precio del producto se explica con su relación con otras
variables. Por otra parte, cuando se comparan modelos diferentes números de variables de
parámetros se acostumbra a calcularse e interpretarse el coeficiente de determinación ajustado el
cual aparece en las salidas de STATGRAF y se muestran a continuación:

SCe 0.104
n− p 7
R2 =1− =1− =0.943
SC total 2.38
n−1 9

R2 =0.943 (94.3%)

Ahora bien, serán necesarias las dos variables en el modelo para explicar el precio del producto,
para dar respuesta a esa interrogante existen varios criterios, como, por ejemplo.

a) Coeficiente de determinación
b) Le error estándar Se
c) La prueba de t parciales

a) Coeficiente de determinación: Con el ajuste ^y =f ( x 1 ) , al aplicar la regresión lineal simple se


obtiene que : ^y =2.816−0.358 x 1 con un coeficiente de determinación R 2 =0,6474(64,74%) con
el ajuste ^y =f ( x 1 , x 2 ), al aplicar la regresión lineal se obtiene que:
^y =1.03767−0.0730233 x 1+2.0139 x 2 , R2=0.943% y R2=0.943 (94.3%)

Al incrementar una variable (x2) se logra aumentar sustancialmente el valor del coeficiente de
determinación, pero hay que usar este criterio con precaución ya que al agregar una variable
siempre traerá consigo un incremento en el valor R 2 debido a la expresión matemática, que lo
define, pero no indica necesariamente que aumente la precisión en la estimación de y precio
del producto y se recurre a R2ajustado.
b) El error estándar Se: La varianza del error Se2 es un estimador insesgado de σ 2. Se desea
que Se, disminuya al agregar una variable al modelo.

pág. 4
Para el ajuste ^y =2.816−0.358 x 1 se obtuvo que Se2=0.105; Se=0.324
Para el ajuste ^y =2.816−0.0730233 x 1+ 2.01395 x 2; se obtuvo que Se2=0.015; Se=0.122, o sea el
error estándar disminuye al incorporar la variable x 2 y por tanto mejora la precisión de la
estimación de ¨y¨ pero también hay que tener precaución ya que agregando variables al
modelo hacemos Se cero y R2 puede llegar a la unidad.
c) Prueba t student parciales
Una de las pruebas o dócimas que pueden realizarse, para analizar el aporte de cada variable
al modelo de regresión obtenido son las t parciales a los coeficientes b j.

Se parte de las siguientes pruebas de hipótesis


H0: B1=B2
H1: B1<B2
El estadígrafo de prueba
b j−B j bj
t = ESb el cual bajo la hipótesis nula H0 queda como t= ESb
1 j

Regla de decisión
Rechazar H0 si :
|t|>t ∝
(1− ;n− p )
2

No Rechazar H0 si :
|t|≤t
(1− ∝2 ; n− p)
A continuación, realizaremos la prueba de significación para los coeficientes B 1 y B2 del
ejemplo desarrollado en clase.

Prueba de significación sobre B1


H0: B1=B2
H1: B1≠B2
Para α=0.05(5%), el t tabulado t (0.975;7) =2.36
b1 −0.073
t = ESb = 0.054 =-1.35 y como |−1.35|< 2.36 no se rechaza H0
1

Conclusión la variable x1 no tiene aporte significativo en el precio del producto.

Prueba de significación sobre B2


H0: B2=0
H1: B2=0

b 2 2.014
t = ESb = 0.288 =6.99; y como 6.99>2.36 se rechaza H0 para α=5%
2

Conclusión: La variable x2 tiene un aporte significativo en la explicación del precio del


producto.

Método de selección de la mejor ecuación de regresión


Anteriormente, se plantearon algunos criterios para analizar si todas las variables eran o no
necesarias para explicar el comportamiento dela variable dependiente o variable de respuesta
(que en el ejemplo analizado fue el precio del producto)
pág. 5
Existen varios métodos para seleccionar la mejor ecuación de regresión para ello es
necesario recordar primero algunos elementos de estadística matemática referidos a la
correlación y dar nuevos elementos
Recordar ¿Que representa r y ρ en el análisis de la correlación lineal simple? Coeficiente de
correlación lineal simple muestral y poblacional respectivamente, o sea:
Cov ( x , y ) Cov ( x , y ) SPC xy
ρ ( x , y )= ( población ) ; r ( x , y )=r = =
σx σ y Sx Sy √ SCC x SCC y
y−1 ≤ r ≤ 1
Como interpretación de r , Grado de interpretación entre las variables x e y (directa o inversa )
según el signo de r fuese positivo o negativo respectivamente, siendo r el estimador puntual
de ρ de otra manera r=signo de b1√ R2 , que expresado matricialmente seria:
b̀ x̀−n ý 2
r =signo de b 1
√ ỳ y−n ý
2

Ahora bien, cuando se trabaja con dos variables o más variables explicativas o
independientes, se tiene que hablar de correlación lineal múltiple que en el modelo lineal
E ( y ^y )
general la definimos como : ρ( y 1 x 1 ; x 2 ; x j )= 2 2
√ E ( y )( E ý )

pág. 6

También podría gustarte