Está en la página 1de 54

METODOS ECONOMETRICOS

MODELO LINEAL GENERAL

Mag.Ing.Jose Saavedra
.
1
MODELO LINEAL GENERAL

Para efectos del cálculo matricial:

Yi  1  2 Xi 2  3 Xi3  ......  k Xik  i

 Y1  1 x12 x13 . x1k   1   1 


 Y2  1 x 22 x 23 . x 2k  2   2 
 Y  1 x 31 x 33 . x 3k  3   3 
 3   x    
 .  . . . . .  .   . 
 .  . . . . .  .   . 
 Yn  1 x n1 x n2 . x nk  k  k 

Yn1 = X nkk1 + n1


.
2
SUPUESTOS DEL MODELO

1. Forma funcional de la relación (supuesto de lineal)


2. Correcta especificación del modelo (es decir, que X es la única
variable explicativa)
3. Las variable X’s no son estocásticas.
4. Identificabilidad de los parámetros. (β1, β2,…. βk) se podrán
estimar de forma única)
5. La esperanza de las perturbaciones condicionada a la
 
información dada es nula: E i  0nx1
6. Las perturbaciones son esféricas: E'  2 I

7. Las perturbaciones recogidas se distribuyen de forma normal ó
Gaussiana

3
ESTIMACION DE LOS PARAMETROS

El principio básico para estimar los parámetros es que


se debe de minimizar la suma de los cuadrados de cada
uno de los residuales.

 1 
 2 
 i  '   12 ...n   
2

 
n 
  Y  Ŷ  Y  Xˆ

4
 μ1  Y1  Yˆ1  Y1  1 x 12 x 13 ....x 1k   ˆ1 
          
.  .  .  .  .  . 
.   .   .   .   .  . 
          
.  .  .  .  .  . 
 μ   Y   Ŷ   Y  1 x   ˆ 
n n  n n n2 x n3 ....x nk  k

μ μ  (Y  X ˆ )(Y  X ˆ )
' '

 Y 'Y  Y ' X ˆ  ˆX 'Y  ˆ ' X ' X ˆ


 Y 'Y  2 ˆ ' X 'Y  ˆ ' X ' X ˆ

Derivando respecto a  donde este es igual a cero.


dμμ
´'
- 2X 'Y  2 X ' X ˆ  0
d ˆ
X ' X ˆ  X 'Y * *
ˆ  (X' X ) 1 X ' Y
5
ESTIMACION DE LA VARIANZA DEL TERMINO DE
PERTURBACION

Un estimador del término de perturbación sería el residual.


La varianza residual podría utilizarse como estimador de la
varianza del término de perturbación.
Sin embargo la esperanza del transpuesto μ’μ es
insesgada.
Se expresa como la suma de las diferencias cuadráticas
entre el valor observado (Y) y el estimado(Ŷ).

S  ˆ
2 2
  ( Yi  Ŷi ) 2
  ˆ 2
i

n2 n2

6
Ejercicio Ilustrativo de Estimación de Parámetros en un Modelo Lineal
Simple (MCO)
Se dispone de información de los ingresos totales y gastos en alimentación
de 12 familias
Familia Gasto alimentación Ingreso Total
(nuevos soles) (nuevos soles)
1 830 2100
2 510 1100
3 420 900
4 560 1600
5 1250 3200
6 840 2300
7 720 1800
8 490 700
9 690 1300
10 850 2400
11 550 1200
12 780 1700

7
Familia Yi Xi X i Yi X2 Ŷi ˆ i  Yi  Ŷi
1 830 2,100 1,743,000 4,410,000 830.22 -0.22
2 510 1,100 561,000 1,210,000 529.69 -19.69
3 420 900 378,000 810,000 469.58 -49.58
4 560 1,600 896,000 2,560,000 679.95 -119.95

5 1,250 3,200 4,000,000 10,240,000 1160.80 89.20

6 840 2,300 1,932,000 5,290,000 890.32 -50.32


7 720 1,800 1,296,000 3,240,000 740.06 -20.06
8 490 700 343,000 490,000 409.48 80.52
9 690 1,300 897,000 1,690,000 589.79 100.21
10 850 2,400 2,040,000 5,760,000 920.37 -70.37
11 550 1,200 660,000 1,440,000 559.74 -9.74
12 780 1,700 1,326,000 2,890,000 710.00 70.00

Totales 8,490 20,300 16,072,000 40,030,000 8,490 0

8
Solución
Como los parámetros a estimar son 1 y 2 se establece las ecuaciones
normales siguientes:

 Y  n1  2  Xi (1)

 YX  1  Xi  2  Xi2 (2)

Y reemplazando, se tiene:

En (1) 8490  12ˆ 1  20300ˆ 2


En (2) 16072000  20300ˆ 1  40030000ˆ 2

Si se despeja de la primera ecuación el intercepto y se reemplaza dicho


valor en le segunda se obtienen los siguientes estimadores:

̂1 = 199.108 ̂ 2 = 0.301

9
La función de regresión muestral, es decir la regresión de
Y con respecto a X:

Ŷi  199.108  0.301Xi

Sustituyendo las observaciones muestrales de X en la


ecuación anterior se obtiene la columna 6 de la tabla.

Comparando estos valores con aquellos observados para la


variable dependiente hallamos los errores
correspondientes a cada observación de la muestra. Se
verifica que la suma de errores estimados es 0. (Columna
i)

10
MÉTODO MATRICIAL:

Familia Yi Xi X i Yi X2 Ŷi ˆ i  Yi  Ŷi


1 830 2,100 1,743,000 4,410,000 830.22 -0.22
2 510 1,100 561,000 1,210,000 529.69 -19.69
3 420 900 378,000 810,000 469.58 -49.58
4 560 1,600 896,000 2,560,000 679.95 -119.95

5 1,250 3,200 4,000,000 10,240,000 1160.80 89.20

6 840 2,300 1,932,000 5,290,000 890.32 -50.32


7 720 1,800 1,296,000 3,240,000 740.06 -20.06
8 490 700 343,000 490,000 409.48 80.52
9 690 1,300 897,000 1,690,000 589.79 100.21
10 850 2,400 2,040,000 5,760,000 920.37 -70.37
11 550 1,200 660,000 1,440,000 559.74 -9.74
12 780 1,700 1,326,000 2,890,000 710.00 70.00

Totales 8,490 20,300 16,072,000 40,030,000 8,490 0

11
La ecuación matricial se escribe de la siguiente forma:


 Y1  1 X 21 .  1    1 
 Y  1 X      
 2  22 .   2   2 
   .    
    
 .  . . . . .  .   . 
 .  . . . . .  .   . 
       
Yn  1 X 2 k .     n 

O simplemente:

Y  X  

12
Para el caso de 2 variables:

(X' X)ˆ  (X' Y)

n
(X' X )   Xi  
 y X' Y   Y i 

  Xi X 2
i



 X Y
i i

(X' X)  20300
12 20300 
40030000
y X' Y   8490 

  16072000 

(X' X)1  00.586348323  0.000297349



.000297349 1.75773E  07 

ˆ   0.586348323  0.000297349 8490   199.10795 


 0.000297349 1.75773E  07  16072000 0.3005273

Los  son los mismos obtenidos que el método anterior.

13
Ejercicio Ilustrativo de Estimación de Parámetros en un Modelo Lineal
General (MCO)

El director de una agencia de viajes quiere estudiar el sector turístico en Perú.


Para ello dispone de información relativa al grado de ocupación hotelera (Y),
número medio de turistas (X2), medido en miles de turistas, y estancia media
(X3), medida en días.

OBSERVACIÓNº Nº DE OCUPACIÓN TURISTAS DÍAS DE


HOTELERA (MILES) ESTANCIA
1 5 2 3
2 8 3 4
3 8 5 6
4 9 4 5
5 9 6 7
6 13 2 6
7 6 3 4
8 9 4 5
9 4 5 4
10 3 6 3

14
Solución

En este caso se tienen 2 variables independientes, por lo que será conveniente


hacer uso de la forma matricial, por lo tanto:
Modelo Lineal General:

Yi  1   2 X 2  3 X 3   i
, donde n =10; k=3

 n X i2 X i3 
(X ' X)   X i 2 X 2
i2 X X 
i 2 i3 

 X i 2 X x i2 i3 X i3 
2

  Y1 
X ' Y   X i 2 Yi 
 X i 3Yi 

15
los coeficientes del modelo serán:

ˆ 1   2.5529 
ˆ  ˆ 2   (X X) X Y   1.0821
' 1 '
ˆ   1.9608 
3 

Luego, el modelo estimado es:

Ŷi  ˆ 1  ˆ 2 X 2  ˆ 3X3  2.5529  1.0821X 2  1.9608X3

16
OPERACIONES CON MATRICES
En este sección se presentarán las nociones básicas del álgebra
matricial.

Dado los siguientes datos hipotéticos (Periodo 1991-1995)

AÑO Y X1 X2
1991 3 3 5
1992 1 1 4
1993 8 5 6
1994 3 2 4
1995 5 4 6
Se desea estimar el siguiente modelo de regresión lineal:

Yt = β1 + β2X1t + β3X2t +μt

Donde:

• Yt es la variable dependiente o endógena.


• X1, X2 son variables independientes o exógenas.
• β1, β2 y β3 son parámetros desconocidos. A β1 se le conoce con el
nombre de intercepto, a los β2 y β3 se les llaman coeficientes de
regresión.
• μt es una variable aleatoria no correlacionada y no observable.

18
A partir de los datos se crean las siguientes matrices:

3
1 1 3 5
1 1 4
  
Y  8 X  1 5 6
   
3 1 2 4
5 1 4 6

En este caso:
• n = 5 (numero de observaciones)
• k = 3 (numero de parámetros del modelo)

19
• Matriz.- es un arreglo de números o elementos en filas y en
columnas. Cuando se habla del orden de una matriz se
refiere a la cantidad de elementos ordenados en filas y
columnas, por ejemplo las matrices X es una matriz de orden
(3x5), mientras que la matriz Y es de (5x1).

• Para estimar el modelo se hará uso de


  (X' X ) X' Y
1

• Por lo que para encontrar esos valores será necesario


realizar ciertos cálculos matriciales previos tales como:

20
TRANSPUESTA DE UNA MATRIZ
La transpuesta de una matriz X de orden (5x3) la cual se denota por X’, es
una matriz de orden (3x5), la cual es obtenida a partir de cambiar las filas
por las columnas, es decir que por ejemplo la primera fila de X se
convierte la primera columna de X’.
Las transpuestas de X e Y serán:

1 1 1 1 1

X'  3 1 5 2 4  Y'  3 1 8 3 5
5 4 6 4 6

21
MULTIPLICACIÓN DE MATRICES
Cada elemento de esta nueva matriz se obtiene sumando los valores
que resultan de multiplicar los elementos de una fila de la matriz
(por ejemplo de X’) por su columna correspondiente de la otra
matriz (por ejemplo Y), lo que originará que se forme una matriz de
orden (3x1) la cual proviene de que la primera matiz tenga 3 filas y
la segunda 5 columnas.

3
 
1 1 1 1 1 1  1 3  11  1 8  1 3  1 5   20 
X' Y  3 1 5 2 4 8   3  3  11  5  8  2  3  4  5    76 
 
5 4 6 4 6 3 5  3  4 1  6  8  4  3  6  5 109
5

22
En el Excel:
• Aplicar la función: =mmult(matriz1,matriz2)
• Sombrear el área de la matriz resultante y con las teclas “control” + “
(shif)”, posicionándose en la barra de funciones, teclear “  (enter)”

23
• De manera similar se calcula:

3
1
 
Y' Y  3 1 8 3 5 8  3  3  11  8  8  3  3  5  5  108
 
3
5

1 3 5
1 1 4  5 15 25 
 1 1 1 1 1 
X' X  3 1 5 2 4 1 5 6  15 55 81 
 
5 4 6 4 6 1 2 4 25 81 129
1 4 6

24
INVERSA²
La inversa de una matriz origina otra matriz la cual se podrá
calcular solamente cuando tenga la misma cantidad de filas y
columnas, además su determinante debe ser diferente de cero.

Para el calculo de los parámetros se debe calcular la inversa de:

 5 15 25 
X' X  15 55 81 
25 81 129
 

² La inversa de una matriz puede ser halla por medio de calculadoras matriciales, esto resulta
útil para el ahorro de tiempo en los cálculos.

25
En el Excel:
• Aplicar la función: =minv(matriz)
• Sombrar el área de la matriz resultante y con las teclas “control” + “
(shif)”, posicionándose en la barra de funciones, teclear “  (enter)”

26
CALCULO DE LOS PARAMETROS

Utilizando la fórmula   (X' X)1 X' Y , se obtiene:

26.7 4.5  8   20   4 
ˆ   4.5 1  1.5  76    2.5 
  8  1.5 2.5  109  1.5

27
Valor estimando de la varianza de los términos de perturbación 
ˆ
2

En el modelo de regresión lineal se obtiene a partir de:

2 
  (Y' Y  ' X' Y) /( n  k )


'  4 2.5  1.5

28
 20 

 
' X' Y  4 2.5  1.5 76   106.5
109


2
(Y' Y  ' X' Y) 108  106.5
    0.75
nk 53

29
Estimación de la matriz de varianzas y covarianzas de los B:

2
ˆ
var()   (X' X) 1

26.7 4.5  8  20.025 3.375 6 


ˆ 
var()  0.75 4.5  
1  1.5   3.375 0.75  1.125 
  8  1.5 2.5    6  1.125 1.875 

30
INFERENCIA ESTADISTICA

31
INTERVALO DE CONFIANZA PARA LOS
PARAMETROS

A fin de establecer los intervalos de confianza para los


coeficientes de regresión (I) y teniendo la varianza
poblacional desconocida se construye un intervalo
asumiendo que esta variable tiene una distribución
estadística “t” a partir de las estimaciones de los
parámetros y sus varianzas por ejemplo: para n

Pr ob( ta / 2 £ t £ ta / 2 )  1  a
ˆ 1  1
Pr ob( t a / 2 £ £ ta/2 )  1 a
ˆ 1
32
Multiplicando por –1
ˆ 1  1
Pr ob( t a / 2   ta/2 )  1 a
ˆ 1
Despejando: 1

Pr ob(ˆ 1t a / 2  ˆ 1  1  t a / 2ˆ 1 )  1  a


Sumando:

Pr ob(ˆ 1  ˆ 1t a / 2  1  ˆ 1  ˆ 1t a / 2ˆ 1 )  1  a


Pr ob( ˆ1  ˆ  1ta / 2 £ 1 £ ˆ1  ˆ  1ta / 2 )  1  a
 
1  ˆ 1  ˆ  1ta / 2 , ˆ 1  ˆ  1ta / 2 con un nivel de significa ción a
33
Ejemplo:

Número de Ingreso Consumo


familia X Y
1 80 70
2 100 65
3 120 90
4 140 95
5 160 110
6 180 115
7 200 120
8 220 140
9 240 155
10 260 150

Y  X  
Donde :
Y : Consumo
XConsultoria
: Ingreso Virgen del Carmen S.A.
34
Y X
70  1 80   1 
65  1  
   100 

β  2 
90  1 120   3 
     1   
.   . .    . 

.  . .  2  . 
     
.  . .  . 
150 1 260  
     10 
  ( x ' x ) x' y
ˆ 1

1
 1 80 
  
 1 100 
 1 120  1
1
( x' x) x' y  
1 1 1 ..............1 
 .
 n
.   
x
1 
  10 1700 
 x 1700 322000  
 80 100 120 .........260  . 
.   i x 2
1  
  
 . . 
  

Consultoria Virgen del Carmen S.A.
1 260  35
1  322000 - 1700   0.975757 - 0.005152 
    
330000  - 1700 10   - 0.005152 0.0000303
 70 
 
 65 
1..........1  .   1110 
x ' y    
 
 80....260  .   205500 
. 
 
150 
 

 0.975757 - 0.005152  1110   24.4545   ˆ1 


ˆ          
 - 0.005152
Consultoria Virgen del Carmen S.A.
0.0000303  205500   0.50909   ˆ2 
36
ESTIMACION DE LA VARIANZA DEL TERMINO DE
PERTURBACION
e' e Y 'Y   ' X 'Y
  2
   13210010-2
132,100-131,764
(n  k ) nk
 70 
 
 65 
. 
y ' y  (70 65 .........150 )   132100
. 
. 
 
150 
 

 1110 
 ' x' y  (24.4545 * 0.5091)   131764.5
 205500 
Consultoria Virgen del Carmen S.A.
37
Reemplazando en la fórmula tenemos:

Calculando Varianza
 0.975757 - 0.005152 
Var 1  (41.9375) 
 - 0.005152 0.0000303

  2  41.9375(0.975757 )  40.9209
1

   41.9375(0.0000303)  0.00127
2
2
ˆ   6.3969
1

ˆ  2  0.0356
Consultoria Virgen del Carmen S.A.
38
CONSTRUCCION DE INTERVALOS PARA I


ˆ 
Ie1
ˆ t ˆ 

i a/ 2, 1
ˆita/ 2 
Para un nivel de significación del 5% observando en la
tabla “t” de student:

t(n-k)a/2= t (10-2)0.05/2 = t(8)0.025= 2.306

2  0.5091  0.0356(2306),0.5091  0.0356(2306)


2  0.4268,0.5919 con a  0.05
39
Otra forma de expresarlo con prob.:

P(0.4268£2 £0.5919)=1-0.05=0.95

Dado un coeficiente de confianza del 95% en el


I.p si se construye cien intervalos repetidos con
los límites siguientes 0.4268 y 0.919, en el 95%
de ellos estarían verdadero parámetro
poblacional.

40
Objetivos del tema
• Conocer el proceso para contrastar hipótesis

• Diferenciar entre hipótesis nula y alternativa

• Nivel de significación

• Significación

• Toma de decisiones, tipos de error y cuantificación del


error.

Contrastes de hipótesis
41
Contrastando una hipótesisdemasiados...
Son

Creo que la edad


media es 40 años...

¡Gran
diferencia!

Muestra Rechazo la
aleatoria hipótesis

X  20 años Contrastes de hipótesis 42


Identificación de hipótesis
• Hipótesis nula Ho • Hipótesis alternativa H1
– La que contrastamos – Niega a H0

– Los datos pueden refutarla


– Los datos pueden mostrar evidencia a
favor
– No debería ser rechazada sin una buena – No debería ser aceptada sin una gran
razón. evidencia a favor.

H 0 : p  50% , £, 
 , , 
 H1 : p  50%

Contrastes de hipótesis
43
Razonamiento básico
Si supongo que H0 es cierta...

¿qué hace un
científico cuando su
teoría no coincide
con sus
predicciones?

  40
X  20

... el resultado del experimento sería improbable.


Sin embargo ocurrió.
Contrastes de hipótesis 44
Razonamiento básico
Si supongo que H0 es cierta...

Rechazo que H0 sea


cierta.

  40
X  20

... el resultado del experimento sería improbable.


Sin embargo ocurrió.
Contrastes de hipótesis 45
Razonamiento básico
Si supongo que H0 es cierta...
• No hay evidencia contra H0
¿Si una teoría hace
predicciones con •No se rechaza H0
éxito, queda
probado que es •El experimento no es
cierta? concluyente

•El contraste no es significativo

  40
X  38

... el resultado del experimento es coherente.

Contrastes de hipótesis 46
Región crítica y nivel de
Región crítica
significación
Nivel de significación: a
• Valores ‘improbables’ si... • Número pequeño: 1% , 5%
• Es conocida antes de realizar el • Fijado de antemano por el
experimento: resultados experimentales investigador
que refutarían H0 • Es la probabilidad de rechazar H0
cuando es cierta

a=5%

Reg. Crit. Reg. Crit.

No rechazo H0
H0: =40
Región aceptación (1-
Contrastes de hipótesis
α)
47
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa

Bilateral H1: 40

Unilateral Unilateral

H1: <40 H1: >40


Contrastes de hipótesis 48
Significación: p

a
H0: =40 Contrastes de hipótesis 49
Econometría U. de
Sevilla
Significación: p

No se rechaza
H0: =40

a
H0: =40 Contrastes de hipótesis 50

X  43
Significación : p
El contraste es estadísticamente significativo cuando p<a
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

El p-valor es el menor nivel de significación al que rechazaríamos H0

a P

Se rechaza H0: =40

Se acepta H1: >40


a P

X  50
Contrastes de hipótesis 51
Resumen: a, p y criterio de rechazo
• Sobre a • Sobre p
– Es número pequeño, – Es conocido tras
preelegido al diseñar el realizar el experimento
experimento

– Conocido a sabemos – Conocido p sabemos


todo sobre la región todo sobre el resultado
crítica del experimento

 Sobre el criterio de rechazo


 Contraste significativo  p menor que a
Contrastes de hipótesis
52
Tipos de error al contrastar
hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0 Error de tipo II
Correcto
Probabilidad 1- β
Probabilidad β

Rechazo H0 Error de Correcto


Acepto H1
tipo I Probabilidad 1-α
Probabilidad α .

Econometría U. de Contrastes de hipótesis 53

Sevilla
Conclusiones
• Las hipótesis no se plantean después de observar los datos.

• En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:

– H0 : Hipótesis científicamente más simple.


– H1 : El peso de la prueba recae en ella.

• α debe ser pequeño

• Rechazar una hipótesis consiste en observar si p<α

• Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I

• No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de
tipo II

• Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos.

Contrastes de hipótesis
54
Econometría U. de Sevilla

También podría gustarte