Está en la página 1de 36

Universidad Técnica Federico Santa María Renato Allende Olivares

Econometría ICN 312 Humberto Villalobos Torres

8. SEXTO MÓDULO

8.1 I NTRODUCCIÓN

La estadística tiene como uno de sus grandes objetivos describir y predecir


eventos del mundo real a través de métodos lo más objetivos e imparciales posibles.
Con el fin de predecir, se plantean habitualmente expresiones matemáticas (ecuación),
que de alguna manera logren relacionar cantidades del mundo real en expresiones
medibles en el abstracto mundo de la matemática.

Los análisis de regresión, son modelos que cuentan con una expresión
matemática sencilla que relaciona una variable de interés con otras, llamadas
variables explicativas, pero que adicionalmente agrega una componente estocástica
que explique las variaciones existentes entre las variables observadas y las esperadas
a través del modelo matemático propuesto, donde se deberá encontrar la función
matemática que ajuste de manera razonablemente bien a un conjunto de datos, a partir
de algunos métodos de estimación entre los que se destaca el de mínimos cuadrados.

Sus aplicaciones en la actualidad son de toda índole, desde estimaciones de


resistencia en ingeniería, rentabilidades y consumos en administración, hasta
pronósticos de fechas de nacimiento en la medicina, que proporcionan una adecuada
predicción en la región predeterminada por los datos asociados a la función de
pronóstico

La palabra regresión parte en 1822, por Sir Francis Galton (1822 – 1911),
primo de Charles Darwin. Galton que estudiaba la eugenesia, término también
introducido por sí mismo para definir el estudio de la mejora de la raza humana a
partir de los rasgos hereditarios.

Galton estudió la altura de los hijos con relación a la altura de sus padres, y
probó que la altura de hijos altos “regresaba” hacia el promedio de la altura de la
población a lo largo de sucesivas generaciones. En otras palabras, hijos de padres
extraordinariamente altos tendían a ser en promedio más bajos que sus padres, e hijos
de padres muy bajos tendían a ser en promedio más altos que sus padres. Galton, en
su estilo aristocrático, la llamó una ‘regresión hacia la mediocridad’.

144
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Con anterioridad a Galton, Legendre y Gauss, había introducido el método de


los mínimos cuadrados en 1805 utilizándolo para definir la longitud de un metro
como una diez millonésima parte del arco meridional, a datos astronómicos,
usualmente medidos en cantidades continuas tal como la posición o magnitud de un
cuerpo celeste. Ellos definen los errores en una estimación con el signo opuesto al que
generalmente se conocen, es decir &i = Ŷi – Yi, donde Ŷi representa la estimación de
la variable aleatoria Yi. Posteriormente, en 1809, Gauss introduce la distribución
Normal con media cero y varianza constante para los errores, la cual en 1821
abandonó, debido a que la propiedad importante del método de mínimos cuadrados no
es que los datos provengan de una distribución Normal, sino, de la suposición de
varianza constante.

En la actualidad, el término de ‘regresión’ se utiliza siempre que se busca


estudiar la explicación de una variable en términos de otras variables llamadas
explicativas, es decir, predecir una variable en función de otra(s), y no implica que se
esté estudiando si se está produciendo una regresión a la media.

La idea consiste en establecer una relación entre la variable explicada, y una o


más variables explicativas. La variable a explicada acuña nombres tales como:
variable predecida, variable dependiente; variable endógena, variable objetivo,
variable regresiva, mientras que respectivamente, las variables explicativas acuñan
nombres tales como: variables predictoras, variables independientes; variables
exógenas, variables de control, variables regresoras.

Luego se establece una relación funcional entre la variable endógena y la o las


variables exógenas, a la cual se le asigna una componente estocástica, de tal forma
que el modelo que explica la relación es expresado por:

Modelo : Yi = f(x; β) + &i = µ + &i i = 1, ... , n,

donde:

Yi := Variable respuesta, que se considera como una variable aleatoria


observable.
f(x; β) := Función conocida que representa la relación entre el valor esperado de Yi
y el correspondiente valor de xi.
&i := Variable aleatoria no observable, cuyo valor esperado es cero y cuya
varianza es finita y constante.

145
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

La función f(x) caracteriza al problema de regresión, que está compuesta por


parámetros desconocidos y una o más variables exógenas que es una variable
matemática, es decir, una variable observable supuestamente sin error. Luego se
pueden distinguir los siguientes casos a partir de esta función:

1.- f(x; β) lineal en los parámetros.

2.- f(x; β) no es lineal en los parámetros.

En este caso se distinguen dos grupos:

2.1.- f(x) “linealizable” mediante alguna transformación.


2.2.- f(x) no “linealizable”.

Si bien es cierto el uno central, es proporcionar una expresión matemática que


relacione de la forma más precisa posible a un conjunto de variables regresoras con
una variable de regresiva, no es posible establecer con certeza una relación causa –
efecto entre ambas, ya que esta relación se encuentra más allá de alcance de los
análisis de regresión.

8.2 Regresión Lineal Simple

Considere un experimento, en el cual se considera sólo una variable


independiente, la cual trata de explicar una variable a predecir, que se encuentra
asociada a un mismo elemento, en este sentido se tiene el hecho de la relación de dos
mediciones realizadas simultáneamente a un elemento, que conforman dos variables
“x” e “y” para un rango de diferentes condiciones experimentales. Si se hacen n
mediciones, éstas se pueden expresar por:

(xi, yi) con i = 1 , . . . , n ,

denota los correspondientes n pares ordenados de observaciones. Se construye un


modelo estadístico paramétrico para esta situación, proponiendo una relación
funcional – f(x; β) – entre x e y es considerada o se aproxima a una linealidad.

A menudo la variable x representa las condiciones experimentales, y la

146
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

variable y es la respuesta del experimento y corresponde a la variable dependiente,


con los supuestos planteados anteriormente para el error ε. Se asume que yi son
observaciones de variables aleatorias independientes Yi. En contraste, los valores de xi
son considerados constantes, no aleatorios, al menos en un primer desarrollo, la
variable x es denominada independiente o explicativa.

Como ya se mencionó, el primer paso en el análisis, es realizar un gráfico de


dispersión de y versus x, si el gráfico muestra una relación lineal aproximada entre las
dos variables se puede considerar un modelo estadístico adecuado para esta relación.
En este caso se estudia el modelo de regresión lineal clásico.

En esta situación el modelo estadístico a utilizar está dado por:

Modelo : Yi = f(x) + &i = "0 + "1 xi + &i . i = 1, ... , n,

En estricto rigor se considera que las variables Yi, son variables aleatorias, que
para poder encontrar la relación entre las variables se realiza un proceso de medición
para logras establecer la relación de las variables a través de un conjunto de datos.

147
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Además, es posible realizar supuestos distribucionales verificables


estadísticamente acerca de los εi, en particular que poseen una distribución Normal.
Que es la base para poder llegar a realizar inferencias respecto al modelo, sus
parámetros y sus predicciones. A partir de estos supuestos es posible visualizar a
partir del siguiente diagrama de dispersión estos conceptos.

8.2 Estimación de Parámetros

El método comúnmente usado para la estimación de parámetros en los


modelos de Regresión Lineal es denominado Mínimos Cuadrados Ordinarios
(MCO), aunque este método coincide con la estimación de los parámetros "0 y "1 del
modelo lineal a través del método de Máxima Verosimilitud (MV), que se basa en
supuestos distribucionales de la variable respuesta. Sin embargo, la estimación de la
varianza 52, de la variable respuesta, que para el caso de la MV es un estimador
sesgado, a través de MCO se obtiene un estimador insesgado de ésta.

8.2.1 Mínimos Cuadrados Ordinarios

Este es un método descriptivo, que a partir de un modelo de Regresión Lineal


Simple de la forma:

Yi = " 0 + " 1 xi+ &i (8.1)

148
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Se busca determinar los estimadores "0 y "1 que minimicen &i cuadráticos.
Esto se resuelve mediante las derivadas parciales, con respecto a cada parámetro, que
son igualadas a cero, es decir:

n n
g (ε i2 ) = ∑
i =1
ε i2 = ∑(y − β
i =1
i 0 − β1 x i ) 2

tal que:

n n
∂ ∑
i =1
ε i2 n
∂ ∑ε
i =1
2
i n

∂β 0
= −2 ∑(y − β
i =1
i 0 − β1 xi ) , y
∂β 1
= −2 ∑(y − β
i =1
i 0 − β1 xi ) x i

las soluciones para las ecuaciones normales son:

n n
∂ ∑ &i2
i =1
∂ ∑&
i =1
2
i
=0 y =0
∂β 0 ∂ β1

las segundas derivadas de g (ε i2 ) son definidas negativas. Por lo tanto, los


estimadores MCO de β 0 y β1 son:

n
∑ ( y i − y )( x i − x ) Sx y
"ɵ 1 = i = 1 =
n Sx x
∑ ( xi − x ) 2
i =1

"ɵ 0 = y - x "ɵ 1

A través de las estimaciones de mínimos cuadrados ordinarios se pueden tener


pronósticos de la variable respuesta, que sólo garantizan la minimización la función
g (ε i2 ) , que estará bien acodada por el recorrido de los datos. Sin embargo, estas
estimaciones pueden no ser las más adecuadas, como tampoco que el modelo sea

149
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

adecuado para realizar buenos pronósticos, pues para lograr inferencias respecto a la
adecuidad del modelo, sus parámetros o sus pronósticos, son necesarios
distribuciones de probabilidad.

El modelo de regresión lineal ajustado a través de los estimadores de mínimos


cuadrados ordinarios, mediante igualdades básicas es posible escribirlo de forma
idéntica por las siguiente ecuaciones de regresión ajustadas.

yˆ i = βˆ 0 + βˆ1 xi (8.2)

yˆ i = y − x βˆ1 + βˆ1 x i

yˆ i = y + βˆ1 ( x i − x ) (8.3)

La ecuación (8.3), muestra la clara evidencia de la importancia del parámetro


β1 en la ecuación de regresión. Es decir, una estimación β1 de muy cercana a cero,
implicaría la poca relación ‘lineal’ entre la variable endógena y exógena.

Además recordando conceptos básicos de estadística descriptiva en cuanto a


indicadores de asociación lineal, se tiene que el coeficiente β1 posee una estrecha
relación con el coeficiente de asociación lineal de Pearson, como se visualiza a
continuación

n n n

∑ ( yi − y )( xi − x ) ∑ ( yi − y )( xi − x ) ∑ (x − x )
i =1
i
2

rp = i =1
= i =1
×
n n n n n

∑ (x − x ) ∑ ( y − y )
i =1
i
2

i =1
i
2
∑ (x − x ) ∑ ( y − y )
i =1
i
2

i =1
i
2
∑ (x − x)
i =1
i
2

n
n

∑ ( yi − y )( xi − x )
n

∑ ( xi − x )2 ∑ (x − x)
i =1
i
2

sx
rp = i =1
2
× i =1
= β1 × = β1 ×
 n  n n sy
 ∑ ( xi − x ) 

2
∑( y − y)
i =1
i
2

∑ ( y − y)
i
2
 i =1  i =1

150
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

de esta relación se obtiene que el estimador del coeficiente β1 se escribe a través del
estimador del coeficiente de asociación lineal de Pearson como:

sx sy
r p = β̂ 1 ⇒ β̂ 1 = r p
sy sx

sx
yˆ i = y + r p ( xi − x ) (3.4)
sy

A través de las ecuaciones de regresión ajustadas (3.2), (3.3) y (3.4) se


obtienen idénticas estimaciones, que además ayudarán, cuando se realicen supuestos
distribucionales, para realizar inferencias respecto al modelo a través del coeficiente
β1 o la verdadera relación lineal ρ.

APLICACIÓN 3.1: La Gerencia de Airlines S.A., una aerolínea transportadora


considera que existe una relación directa entre los gastos publicitarios, en miles de
US$ (P [M/US$]), y el número de pasajeros, en miles de pasajeros (Q [M/US$]), que
escogen viajar con Airlines S.A. Para determinar si esta relación existe.

P [M/US$] 10 12 8 17 10 15 10 14 19 10 11 13 16 10 12
Q [M/US$] 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16

A través de un diagrama de dispersión, se puede visualizar el tipo de relación


que existe entre ambas variables, como se observa a continuación:

Diagrama de Dispersión
26
Q [M/US$]

22
18
14
10
7 9 11 13 15 17 19 21
P[M/US$]

Modelo Propuesto: Yi = β0 + β1 xi + &i

Sxx = ∑ (x − x)
i
2
= 137,7333 Syy = ∑ ( y − y)
i
2
= 171,7333

151
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Sxy = ∑ ( y − y)( x − x ) = 148,9333


i i y = 17,8667 x = 12,4667
Con los datos se puede obtener:

S xy S xy
β1 = = 1,0813 ⇒ β0 = y - B x = 4,3865 ⇒ rp = = 0,9684
S xx S yy S xx

Luego los modelos de regresión ajustados estarían dados por:

ŷ i = 4,3865 + 1,0813 xi (8.2)

ŷ i = 17,8667 + 1,0813 (xi – 12, 4667) (8.3)

171,7333
ŷ i = 17,8667 + 0,9684 (xi – 12, 4667) (8.4)
137,7333

Con cualquiera de las ecuaciones anteriores se puede visualizar que para un


gasto en publicidad de 9 [M/US$], se tendría una estimación del el número de
pasajeros que viajaría de:

ŷ i = 17,8667 + 1,0813 (9 – 12, 4667) = 14,1182 US$.

APLICACIÓN 3.2: Los datos a continuación representan una muestra reducida de los
tiempos de transporte y el porcentaje de capacidad no utilizada por camiones de una
empresa de transporte.

% de Capacidad 7,75 18,75 11,15 14,95 10,85 8,05 14,10 12,55


Transporte 60,505 1,315 15,055 2,145 17,050 53,145 1,495 5,050

% de Capacidad 13,60 8,35 15,55 16,70 22,45 9,10 11,65


Transporte 7,550 41,470 0,450 0,250 3,745 20,310 4,595

A través de un diagrama de dispersión, se puede visualizar el tipo de relación


que existe entre ambas variables, como se observa a continuación:

Diagrama de Dispersión
80
Tiempos de
Transporte

60
40
20
0
7 9 11 13 15 17 19 21 23
% de Capacidad no Utilizada
152
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Modelo Propuesto: Yi = exp {– ("0 + "1 xi + &i)}

ln (Yi) = – ("0 + "1 xi + &i)

 1 
ln   = "0 + "1 Xi + &i
 Yi 

 1 
Yi* = "0 + "1 Xi + &i Yi* = ln  
 Yi 
Con los datos se puede obtener:

15

∑yx * *
i i − ny x
− 265,1626 − 15 × −1,7400 ×13,0367
βˆ1 = i =1 =
15
2796,1975 − 15 × (13,0367) 2
∑i =1
x i2 − n x 2

75,0986
= = 0,304
246,8773

βˆ 0 = y*i − βˆ1 x = – 1,7400 – 0,304 × 13,0367 = – 5,706

con los datos se puede obtener la ecuación de regresión ajustada entre el porcentaje de
capacidad no utilizada y el logaritmo del inverso del tiempo de transporte, la cual está
dada por:

yˆ i* = −5,706 + 0,304 x i

Además, a través la estimación del coeficiente de β1 se puede obtener el grado


de asociación lineal entre el porcentaje de capacidad no utilizada y el logaritmo del
inverso del tiempo de transporte, el cuál está dado por:

sx 17,6341
r p = β̂ 1 = 0,304 = 0,7581
sy 2,8356

Luego con la ecuación de regresión ajustada se puede realizar una estimación


para el logaritmo del inverso del tiempo de transporte, cuando se tiene el porcentaje

153
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

de capacidad no utilizada del camión del 19,5%, la cual está dada por:

= – 5,706 + 0,304 × 19,5 = 0,222

luego,

 1 
Yi* = ln   = 0,222 ⇒ ŷ = exp{– 0,222} = 0,80 [u.t.]
 Yi 

APLICACIÓN 3.3: La rentabilidad promedio semanal, de la acción XY en el tiempo,


está dada para las últimas 16 semanas por los valores expresados por la Tabla 1.

Tiempo 1988 1989 1990 1991 1992 1993 1994 1995


Rentabilidad 6,0 7,1 10,7 7,0 11,9 13,5 9,2 15,8

Tiempo 1996 1997 1998 1999 2000 2001 2002 2003


Rentabilidad 17,8 13,2 21,4 17,0 25,1 21,4 27,8 16,6

A través de un diagrama de dispersión, se puede visualizar el tipo de relación


que existe entre ambas variables, sin embargo, como se observa en la gráfica de
dispersión los tiempos son transformados a la escala 1, … , n, particularmente para las
estimaciones de los parámetros:

Diagrama de Dispersión
30
Rentabilidad

20

10

0
0 2 4 6 8 10 12 14 16 18
Tiempo

Modelo Propuesto: Yi = β0 + β1 xi + &i

15

∑yx *
i i − n y*x
2451,7 − 16 × −8,5 × 15,094 398,92
βˆ1 = i =1 = = = 1,1733
15
1496 − 16 × (8,5) 2 340,00

i =1
xi2 − n x 2

154
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

βˆ 0 = y − βˆ1 x = 15,094 – 1,1733 x 8,5 = 7,767

con los datos se puede obtener la ecuación de regresión ajustada a la rentabilidad de la


acción en el tiempo, la cual está dada por:

ŷ i = 7,767 + 1,1733 xi

Luego si se desea estima la rentabilidad de la acción para el año 2004, se debe


tener especial cuidad en el reemplazo del año codificado (17) en la ecuación anterior,
es decir: ŷ17 = 7,767 + 1,1733 × 17 = 27,71%.

APLICACIÓN 3.4: El porcentaje de humedad en la ‘Mortadela’ es una medida de


calidad, cantidad y estabilidad del alimento y tiene una importancia tanto económica,
como de procesamiento de éste. El ingeniero encargado del control de calidad tiene la
creencia de que este indicador se encuentra estrechamente relacionado con el
porcentaje de lípidos. La siguiente tabla muestra los análisis químicos de una muestra
de 120 unidades.

% de Humedad % de Lípidos (marca de clase)


(marca de clase) 17,12 18,76 20,4 22,04 23,68
60,69 --- --- --- 2 4
61,82 --- --- --- 6 1
62,95 --- 1 2 8 9
64,08 --- 6 34 5 1
65,21 2 2 12 --- ---
66,34 --- 9 --- --- ---
67,47 15 1 --- --- ---

En el caso de datos agrupados, no es posible la realización de una gráfica de


dispersión, por lo tanto sólo por la configuración de los datos en la tabla conjunta se
propone y ajusta un modelo de pronóstico.

Modelo Propuesto: Yi = β0 + β1 xi + &i

60,69 × 6+ ... +67,47 ×16 17,12 × 17 + ... + 23,68 × 15


X= = 64,36 Y= = 20,37
120 120

60,692 × 6 + ... + 67,47 2 × 16


S x2 = − 64,362 = 3,34
120

155
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

17,122 × 17 + ... + 23,682 × 15


S y2 = − 20,37 2 = 3,87
120
rk
2 × 17,12 × 65,21 + 15 × 17,12 × 67,47 + ... + 4 × 23,68 × 60,69
∑f m m
ij
ij i • • j =
120
= 1308,33

1308,33 − 64,36 × 20,37 S2


rp = = – 0,746 ˆy = y + rp 2 x ( xi − x )
2 3,87 × 3,34 S y2

Luego si se desea estimar el % de humedad en la mortadela cuando el % de


lípidos es de 23,58%, entonces se tiene que: yˆ = 61, 78% .

8.2.2 Máxima Verosimilitud

El método de máxima verosimilitud se basa en la función de verosimilitud


asociada a una muestra aleatoria, razón por la cual se requiere de supuestos,
‘verificables’ estadísticamente de las distribuciones respecto a las variables
respuestas.

Sean Y1, ... , Yn variables aleatorias independientes, tal que y1, ... , yn son
observaciones de Y1, ... , Yn respectivamente. Si la estructura del error se asume tiene
distribución Normal (Ver Pág. 148), entonces es posible suponer que:

Yi ∼ N(.i, 52) i = 1, ... , n,

donde la media .i = „[Yi] sigue el modelo .i = β 0 + β1 xi, i = 1, ... , n, por lo tanto,


este modelo tiene tres parámetros (β0, β 1, 52), ya que se supone que los x1, ... , xn son
constantes.

Entonces bajo el supuesto distribucional de las Yi, se tiene que la función de


densidad asociada a cada Yi sería:

1  1 
f Yi ( y i ) = exp − ( y i − ( β 0 + β1 x i )) 2 
2π σ  2σ 2 

156
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Luego se puede determinar la función de verosimilitud de Y1, ... , Yn para


determinar los estimadores de los parámetros: β0, β1, 52, que es la densidad conjunta
de Y1, ... , Yn, la cual se simboliza por:


1  1 
_(β0, β1, 5 ; Y1, ... , Yn) =
2
exp − ( y i − ( β 0 + β 1 x i )) 2 
i =1
2π σ  2σ 2 

 1 
n  1 n 
= 
 2π σ
 exp −
  2σ
2 ∑
i =1
( y i − ( β 0 + β 1 x i )) 2 


Utilizando el logaritmo de la función de verosimilitud, se tiene la fundón de


logverosimilitud la cual a través de las derivadas parciales respecto a cada parámetro
se pueden obtener los estimadores máximo verosímil de éstos. Esta función se
simbolizada por l(β0, β 1, 52; Y1, ... , Yn) = log _(β0, β 1, 52; Y1, ... , Yn), busca
determinar los valores de (β0, β1, 52) que maximiza l(β0, β1, 52; Y1, ... , Yn). Estos
valores podrían ser encontrados como solución a partir de las ecuaciones verosímiles.
Como una forma de reducir la simbología esta función, en el futuro la expresaremos
por:

1
l(β 0, β 1, 52; Y ) = g(52) – D(β0, β1)

2σ 2

donde:

n
g(52) = − log (2πσ 2 )
2

n
D(β 0, β 1) = ∑(y − β
i =1
i 0 − β1 xi ) 2

Para un valor de σ2, los valores de (β 0, β1) que maximiza l(β0, β1, 52; Y )


también minimiza D(β0, β1). En particular, el valor mínimo es el mismo, para


cualquier valor de σ2.

157
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Para minimizar D(β0, β1) mediante las derivadas parciales, con respecto β0, β 1
y σ son obtenido e igualando a cero, entonces
2

n
∂D( β 0 , β1 )
∂β 0
= −2 ∑(y − β
i =1
i 0 − β1 x i )

y
n
∂D( β 0 , β1 )
∂β 1
= −2 ∑(y − β
i =1
i 0 − β1 x i ) xi

que son llamadas ecuaciones normales, las cuales tienen solución a través de:

∂D( β 0 , β1 ) ∂D( β 0 , β1 )
=0 y =0
∂β 0 ∂β1

las segundas derivadas de D(β0, β1) son positivas, que garantizan que las soluciones
minimizan a D(β 0, β1). Por lo tanto, son los estimadores máximos verosímil de β0 y
β 1:

∑ ( y − y )( x − x )
i =1
i i
Sx y sy
βˆ1 = n
= = rp
Sx sx

i =1
( xi − x ) 2

βɵ 0 = y − βɵ 1 x

Desde los resultados obtenidos, la logverosímilitud que se maximiza con los


estimadores de β0 y β1, para un valor de σ2 es:

n 1
l( β̂ 0 , β̂ 1 , 52; Y ) = − log (2πσ 2 ) – D( β̂ 0 , β̂ 1 )

2 2σ 2

Para encontrar el estimador máximo verosímil σ2 se debe resolver la ecuación:

158
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

∂l ( βˆ 0 , βˆ1 , σ 2 ; Y )

n 1
=− + D( β̂ 0 , β̂ 1 ) = 0
∂σ 2 2σ 2 2σ 4

tal que:

n
1 1
σˆ = D( βˆ 0 , βˆ1 ) =
2
n n ∑(y − β
i =1
i 0 − β1 xi ) 2

3.3 Propiedades de los Estimadores

3.3.1 Suficiencia

Si Y = (Y1, ... , Yn) sigue un modelo estadístico con vector paramétrico θ ,


 

recordando que un estadístico T( Y ) = T(Y1, ... , Yn) se dice ser suficiente para θ si la
 

distribución condicional de Y no depende de θ . Por el criterio de factorización de


 

Neyman, T( Y ) es suficiente para θ si solo si la función densidad de Y , es decir la


  

función de verosimilitud puede ser escrita de la siguiente forma:

l( θ = (β0, β1, 52); Y ) = g{ θ ; T( Y )} × h( Y )


    

donde g{ θ ; T( Y )} y h( Y ) son funciones adecuadas, tal que h( Y ) no depende de θ ,


    

y g{ θ ; T( Y )} depende en Y a través T( Y ) solamente. Esto es equivalente a decir


   

que la función de logverosimilitud tiene la forma:

l( θ ; Y ) = a{ θ ; T( Y )} + b( Y )
    

para funciones convenientes de a{ θ ; T( Y )} y b( Y ).


  

La función de logverosimilitud l( θ ; Y ) en el modelo de regresión lineal


 

simple tratado está dado por:

n 1
l( θ ; Y ) = − log (2πσ 2 ) – D( β̂ 0 , β̂ 1 )
 
2 2σ 2

159
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

n
n 1
l( θ ; Y ) = − log (2πσ 2 ) – ∑(y − β − β1 xi ) 2
 
i 0
2 2σ 2 i =1

n 1  n n

l( θ ; Y ) = − log (2πσ 2 ) – ∑ + ∑ (β + β1 xi ) 2

y i2

2 2σ 2  0
 i =1 i =1
n 
−2 ∑ y i (β 0 + β1 xi ) 

i =1 

n n
n 1 1
l( θ ; Y ) = − log (2πσ 2 ) – ∑ y i2 − ∑ (β + β1 x i ) 2
 
0
2 2σ 2 i =1
2σ 2
i =1
n n
β0 β1
+
σ2
∑y +σ ∑y x
i =1
i 2
i =1
i i

   
Entonces se encuentra el estadístico T( Y ) = (T1( Y ),T2( Y ),T3( Y )), que son
estadísticos suficiente para (β0, β1, 52), donde:

n n n

∑ Yi2 ; ∑ ∑x Y ,
  
T1( Y ) = T2( Y ) = Yi ; T3 ( Y ) = i i
i =1 i =1 i =1

Los estimadores máximo verosímil de los parámetros son siempre funciones


 
del estadístico suficiente T( Y ), por ello las estadísticas Ti( Y ), son suficientes para
estimar: β0, β1, 52.

3.3.2 Insesgamiento

El insesgamiento de los coeficientes de regresión estimados, ambos β̂ 0 y β̂ 1


que son combinaciones lineales de las variables Y1, ... , Yn, y las cuales tienen un
supuesto distribucional importante y verificable estadísticamente. Entonces es de
interés verificar que los estimadores de β0 y β 1 sean insesgados, es decir:

160
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

 n 

 ∑ (Y i − Y )( x i − x ) 

„[ β̂ 1 ] = „  i =1

n
 


∑ i =1
( xi − x ) 2



claramente se demuestra que:

n n  n
xi 
∑ Y ( xi − x ) = Y ∑ ( xi − x ) = Y  n ∑ − nx  = Y (n x − n x ) = 0
 n 
i =1 i =1  i =1 

luego,

 n 

 ∑ Yi ( x i − x ) 
 1 
n  1
n
„[ β̂ 1 ] = „ 

i =1
n
 = E 
 S xx  i =1

( x i − x )Yi  =
 S xx ∑ ( x − x )E[Y ]
i =1
i i



∑ i =1
( xi − x ) 2 

Como, „[Yi] = .i = β0 + β 1 xi, luego reemplazando se tiene:

n n
1 1
„[ β̂ 1 ] =
S xx ∑i =1
( xi − x )E[Yi ] =
S xx ∑ ( x − x )(β
i =1
i 0 + β1 xi )

1  
n n
= ∑ ( xi − x )β 0 + ∑ ( xi − x ) β1 x i 
S xx  
 i =1 i =1 

n n
1 1 1
=
S xx ∑ i =1
( xi − x )β1 xi =
S xx
β1 ∑ (x − x) x
i =1
i i =
S xx
β 1 Sxx = β1

1 n 
„[ β̂ 0 ] = „[ Y − x "ˆ 1 ] = „[ Y ] – „[ x "ˆ 1 ] = „ 
 n ∑
i =1
Yi  – x β1


161
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

n
1
=
n ∑ E[Y ] –
i =1
i x β1

n
1
=
n ∑ (β
i =1
0 + β1 x i ) – x β 1

= β0 + x β1 – x β1 = β 0

De las demostraciones anteriores se verifica que los estimadores mínimos


cuadrados, que coinciden con los estimadores máximo verosímil de los parámetros
del modelo, que por lo demás son insesgados. También es posible verificar que éstos
estimadores son aquellos que poseen la mínima varianza dentro de los estimadores
insesgados de los parámetros, esta propiedad los convierten en ELIVUM
(Estimadores lineales insesgados de varianza uniformemente mínima).

3.4 Inferencias Respecto a los Parámetros y Predicciones del Modelo

Como resultado de los estimadores y varianza de los estimadores que se


mostraron en las sesiones anteriores, se tiene que para β̂ 1 y β̂ 0 :

σ2
„[ β̂ 1 ] = β1 y •[ β̂ 1 ] =
S xx

n
σ2 ∑x
i =1
2
i

„[ β̂ 0 ] = β0 y •[ β̂ 0 ] =
n S xx

En ambos casos por ser estimadores consistentes de sus respectivos


parámetros, además de ser los estimadores máximo verosímil se tiene:

 σ 
2   σ2
n 
β̂ 1 ∼ N  β1 ; 
y β̂ 0 ∼ N  β 0 ; ∑ x i2 
S xx   n S xx 
  i =1 

162
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Sobre la base de las distribuciones hipotéticas, pero verificables


estadísticamente, se convierten en los elementos básicos para las inferencias de los
parámetros del modelo de regresión simple, en particular, se presentan los métodos
para realizar pruebas de hipótesis e intervalos de confianza.

En un primer paso se considera la estimación de σ2 para el modelo regresión


lineal. El estimador máximo verosímil σˆ MV
2
de σ2 es sesgado, donde su valor
esperado está dado por: σ2(1 – 2/n). Con el objetivo de eliminar es sesgo asociado a
σˆ MV
2
, se considera un estimador, función de σˆ MV
2
, tal que este nuevo estimar cumpla
con la propiedad de insesgamiento, el cual está dado por:

1 n
σˆ 2 = ∑ ( yi - yˆ i ) 2
n − 2 i =1

Para realizar las pruebas de hipótesis e intervalos para β0 y β1 son basados en


la distribución t de Student. Luego, utilizando los procedimientos clásicos, es posible
verificar que:

 βˆ − β 
T =  1 1  S xx ∼ t (n – 2) (3.5)
 σˆ 

Donde la distribución de T es una distribución t de Student con n – 2 grados


de libertad, en el futuro g.l. La cual es la base para la determinación de Intervalos de
confianza y realizar pruebas de hipótesis asociadas a este parámetro, es decir, para
determinar los límites de confianza para un intervalo bilateral basta el despeje
apropiado del β1 de siguiente probabilidad:

  βˆ − β  
 t1−α /2 (n − 2) ≤  1 1  S xx ≤ t1−α /2 (n − 2)  = 1 – α = γ
 σˆ 
   
de donde se obtiene, que el intervalo del γ% de confianza para β1 está dado por:

 σˆ 2 ˆ σˆ 2 
Iγ%C(β1) =  βˆ1 − t1−α /2 (n − 2) ; β1 + t1−α /2 (n − 2) 
 S xx S xx 

163
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

También es posible realizar pruebas de hipótesis para el parámetro β1, ya sean


bilaterales como unilaterales. Considere el caso de una hipótesis bilateral de la
siguiente forma:

H0 : β1 = β 1 / Ho v/s H1 : β1 ≠ β1 / Ho

donde, β1 / Ho representa el valor del parámetro bajo la hipótesis nula (H0). Entonces
la regla de decisión asociada al estadístico de prueba (3.5),bajo H0, estaría dado por

σˆ 2 σˆ 2
eW:{ β̂ 1 / β̂ 1 < −t1−α /2 (n − 2) + β1 / Ho ∨ β̂ 1 > t1−α /2 (n − 2) + β 1 / Ho }
S xx S xx

la cual es equivalente a:

  βˆ1 − β 1 / Ho  
eW: βˆ1 /   S xx > t1−α / 2 (n − 2)
 σˆ 
   

Determinar tq(n – 2) es el q-ésimo percentil de la distribución t con n – 2 g.l.,


es equivalente a la ecuación:

t( y ) = t 1– p / 2(n – 2)

La cual define el ‘valor p’ de esta prueba. La cual indica que para cualquier
valor p obtenido en una prueba que sea menor que algún error tipo I, α, dado por el
investigador, entonces se rechazaría la hipótesis nula.

También es posible respecto al parámetro β0, utilizando los procedimientos


clásicos, verificar que:

 βˆ − β 
T=  0 0
 nS xx ∼ t (n – 2) (3.6)
 σˆ ∑ x 2 
 i 

Donde la distribución de T es una distribución t de Student con n – 2 con g.l.


La cual es la base para la determinación de Intervalos de confianza y realizar pruebas
de hipótesis asociadas a este parámetro, es decir, para determinar los límites de

164
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

confianza para un intervalo bilateral basta el despeje apropiado del β0 de siguiente


probabilidad:

  βˆ − β  

 t1−α /2 (n − 2) ≤  1 1  n S xx ≤ t1−α /2 (n − 2)  = 1 – α = γ
  σˆ ∑ xi2  
   

de donde se obtiene, que el intervalo del γ% de confianza para β0 está dado por:

 σˆ 2 n
σˆ 2 n 
Iγ%C(β0) =  βˆ0 − t1−α /2 (n − 2) ∑x 2
i ; βˆ0 + t1−α /2 (n − 2) ∑x i
2

 nS xx i =1 nS xx i =1 

También es posible realizar pruebas de hipótesis para el parámetro β0, ya sean


bilaterales como unilaterales. Considere el caso de una hipótesis unilateral de la
siguiente forma:

H0 : β0 = β 0 / Ho v/s H1 : β0 > β 0 / Ho

donde, β 0 / Ho representa el valor del parámetro bajo la hipótesis nula (H0). Entonces
la regla de decisión asociada al estadístico de prueba (3.6), bajo H0, estaría dado por

σˆ 2 n
eW:{ β̂ 0 / β̂ 0 > t1−α (n − 2) ∑x i
2
+ β 0 / Ho }
nS xx i =1

la cual es equivalente a:

  βˆ − β  
eW:  βˆ0 /  0 0 / Ho
 nS xx > t1−α (n − 2) 
  σˆ ∑ x 2  
 i 

También se pueden construir intervalos de confianza o realizar pruebas de


hipótesis para σ2. En este caso, se utiliza el hecho que:

165
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

( n − 2)σˆ 2
χ= ∼ χ 2 (n − 2 ) (3.7)
σ 2

Donde la distribución de χ es una distribución Chi Cuadrado con n – 2 con g.l.


La cual es la base para la determinación de Intervalos de confianza y realizar pruebas
de hipótesis asociadas a σ2, es decir, para determinar los límites de confianza para un
intervalo bilateral basta el despeje apropiado del σ2 de siguiente probabilidad:

 (n − 2)σˆ 2 
  χ α / 2, ( n − 2 ) ≤ ≤ χ 1−α / 2, ( n − 2)  = 1 – α = γ
 σ2 

de donde se obtiene, que el intervalo del γ% de confianza para σ2 está dado por:

 (n − 2)σˆ 2 (n − 2)σˆ 2 
Iγ%C(σ2) =  ; 
 χ α / 2, ( n − 2) χ 1−α / 2, ( n − 2) 

También es posible realizar pruebas de hipótesis para el parámetro σ2, ya sean


bilaterales como unilaterales. Considere el caso de una hipótesis unilateral de la
siguiente forma:

H0 : σ2 = σ Ho
2
v/s H1 : σ2 < σ Ho
2

donde, σ Ho
2
representa el valor del parámetro bajo la hipótesis nula (H0). Entonces la
regla de decisión asociada al estadístico de prueba (3.7), bajo H0, estaría dado por

(n − 2)
eW:{ σˆ 2 / σˆ 2 < χ α , ( n − 2) }
σ Ho
2

 (n − 2)σˆ 2 
la cual es equivalente a: eW: σˆ 2 / < χ α , ( n − 2) 
 σ Ho
2


Otra estimación de interés en modelos de regresión, son las predicciones


realizadas con el modelo, tanto para una predicción media, que se simbolizará por
µ̂ , como para en particular, que simbolizaremos por Yˆ . Como se había
Y / xp / xp

166
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

mencionado con anterioridad, Yi son variables aleatorias con una distribución de


probabilidad Normal con esperanza y varianza determinada, es decir:

µ̂ Y / x p ∼ N( µ Y / x p ; •[ µ̂ Y / x p ])

donde:

„[ µ̂ Y / x p ] = „[ βˆ 0 + βˆ1 x p ] = „[ β̂ 0 ] + „[ β̂ 1 x p ] = β0 + xp β1.

•[ µ̂ Y / x p ] = •[ βˆ 0 + βˆ1 x p ] = •[ Y + βˆ1 ( x p − x ) ]

n
( xi − x )
= •[ Y + ∑ i =1
S xx
Yi ( x p − x ) ]

1 n
(x p − x) n 
= •
 n ∑
i =1
Yi +
S xx ∑
i =1
( x i − x )Yi 


 n  1 ( x p − x )( x i − x )  
= •
 i =1∑  +
n
 S xx
Yi 
 
 

2
 1 ( x p − x )( x i − x ) 
n
= ∑i =1
 +
n
 S xx
 V[Yi ]

2
 1 ( x p − x )( x i − x )  2
n
= ∑i =1
 +
n
 S xx
 σ ,

desarrollando el cuadrado y aplicando la sumatoria sobe los factores se tiene que el


factor central como antes se ha mostrado la suma de las diferencias entre cada
observación de la variable regresora respecto a su promedio es cero (D (xi – x ) = 0).
Además, la suma de las diferencias cuadráticas entre cada observación de la variable
regresora respecto a su promedio es Sxx, con lo cual se simplifica parte del tercer
término, es decir:

167
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

n  1 ( x p − x )( x i − x ) (( x p − x )( x i − x )) 2 
 
•[ µ̂ Y / x p ] = σ 2

i =1
 n2

+2
n S xx
+
2
S xx 

 (x p − x) n
(x p − x) 2 n 
2 1
=σ +2 ∑ ( xi − x ) + ∑ ( xi − x ) 2 
n n S xx 2
S xx 
 1 1 


( x p − x ) 2 
2 1
=σ +
n S xx 
 

Luego se tiene, al igual que el caso de los parámetros del modelo la


distribución de la predicción media sería:


( x p − x ) 2 
2 1
µ̂ Y / x p ∼ N(β0 + xp β1; σ + )
n S xx 
 

Para realizar las pruebas de hipótesis e intervalos para µ Y / x p es necesario que


se basen en la distribución t de Student. Luego, utilizando los procedimientos
clásicos, es posible verificar que:

 µˆY / x p − µY / x p 
T=   n S xx ∼ t (n – 2) (8.8)
 σˆ ( S xx − n ( x p − x ) 2 
 

Donde la distribución de T es una distribución t de Student con n – 2 g.l. La


cual es la base para la determinación de Intervalos de confianza y realizar pruebas de
hipótesis asociadas a µ Y / x p , es decir, para determinar los límites de confianza para
un intervalo bilateral basta el despeje apropiado del µ Y / x p de siguiente probabilidad:

  µˆY / x p − µY / x p  
  −t1−α /2 (n − 2) ≤   n S xx ≤ t1−α /2 (n − 2)  = 1 – α = γ
  σˆ ( S xx − n ( x p − x ) 2  
   
de donde se obtiene, que el intervalo del γ% de confianza para µ Y / x p está dado por:

168
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

  1 ( x − x )2  
Iγ%C( µ Y / x p ) =  µˆY / x p ∓ t1−α /2 (n − 2) σˆ 2  + p  
 n
  S xx  

También es posible realizar pruebas de hipótesis para el parámetro µ Y / x p , ya


sean bilaterales como unilaterales. Considere el caso de una hipótesis unilateral de la
siguiente forma:

H0 : µ Y / x p = µ / Ho v/s H1 : µ Y / x p > µ / Ho

donde, µ / Ho representa el valor de la respuesta media bajo la hipótesis nula (H0).


Entonces la regla de decisión asociada al estadístico de prueba (3.8),bajo H0, estaría
dado por

  ( x p − x )2  
 2 1 
e.W.:  µˆY / x p / µˆY / x p > t1−α (n − 2) σˆ  +  + k
n S xx  
  
la cual es equivalente a:

  µˆY / x p − µ /Ho  
   n S xx > t1−α / 2 (n − 2) 
eW:  µˆY / x p /
  σˆ 2 ( S xx − n ( x p − x ) 2  
 

En algunas ocasiones el interés recae solamente en determinar un


pronóstico de la variable endógena, para un valor en particular de la variable exógena,
y no en la respuesta media de ésta. El efecto en este alteración respecto a los
conceptas anteriores está en la varianza de esta predicción que como es natural
aumenta respecto a la variabilidad de la respuesta media, pues, el error en la
predicción es distinto. Considere un valor en particular de la variable exógena,
digamos xp, entonces un pronóstico para la verdadera variable y el verdadero valor de
éste está dada por:

Yˆ/ x p = β̂ 0 + β̂ 1 x p Y/ x p = β0 + β1xp + εp
Por lo tanto el error de predicción está dado por:

169
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

Yˆ/ x p – Y/ x p = β̂ 0 + β̂ 1 x p – (β0 + β1xp + εp)

= ( β̂ 0 – β0) + ( βˆ1 − β1)xp + εp

donde claramente, se puede distinguir que „[ Yˆ/ x p – Y/ x p ] = 0, sin embargo la


varianza de este error de predicción es nuestro interés la cual estaría dada por:

•[ Yˆ/ x p – Y/ x p ] = •[( β̂ 0 – β0) + ( βˆ1 − β1)xp + εp]

= •[( β̂ 0 – β0)] + •[ ( βˆ1 − β1)xp]

+ 2‚Ž•( β̂ 0 – β0; ( βˆ1 − β1)xp) + •[εp]

2x2  x2
=σ +1  + σ 2 p – 2xp σ 2 x + σ 2
n S  S xx S xx
 xx 
luego,

 x2 x 2p 
2 1
+ 1
x
•[ Y/ x p – Y/ x p ] = σ
ˆ + + − 2x p
 n S xx S xx S xx 
 


1 x + x p − 2 x p x 
2 2  1 (x p − x) 2 
2 2 
= σ 1+ + = σ 1+ +
 n S xx   n S xx 
   

Luego se tiene, al igual que el caso de los parámetros del modelo la


distribución de la una predicción cualquiera sería:

 1 (x p − x) 2 
2 )
Y/ x p ∼ N(β0 + xp β1; σ 1 + +
ˆ
 n S xx 
 

Para realizar las pruebas de hipótesis e intervalos para Y/ x p es necesario que


se basen en la distribución t de Student. Luego, utilizando los procedimientos
clásicos, es posible verificar que:

170
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

 Yˆ/ x p − Y/ x p 
T=   n S xx ∼ t (n – 2) (3.9)
 σˆ (nS xx + S xx − n ( x p − x )2 
 

Donde la distribución de T es una distribución t de Student con n – 2 g.l. La


cual es la base para la determinación de Intervalos de confianza y realizar pruebas de
hipótesis asociadas a Y/ x p . Obviando los desarrollos equivalentes a los expuestos con
anterioridad es posible llegar a que el intervalo bilateral del γ% de predicción para
Y/ x p está dado por:

  1 ( x − x )2  
Iγ%P( Y/ x p ) =  µˆY / x p ∓ t1−α /2 (n − 2) σˆ 2  1 + + p 
  n S xx  
  

También es posible realizar pruebas de hipótesis para el parámetro Y/ x p , ya


sean bilaterales como unilaterales, sin embargo, estás se decidirán en aplicaciones
futuras.

8.5 Uso de la Tabla de Análisis de Varianza (ANDEVA)

La tabla de análisis de varianza asociada a un modelo de regresión, muestra la


descomposición de la variabilidad total asociada a la variable respuesta, entre lo
explicadazo por el modelo y lo explicado por el error aleatorio. Considérese en primer
caso, la suma de cuadrados total (SCT) asociado a la variable respuesta como:

n
SCT = ∑ (Y − Y )
i =1
i
2
(8.9)

La cual se puede descomponer en dos factores: la suma de cuadrados de


regresión (SCR), y la suma de cuadrado de residuos (SCE). La primera, muestra
cuanto de la variabilidad total está siendo explicada por el modelo, lo cual, un buen
modelo explicará la mayor parte de la variabilidad total y por consiguiente será muy
cercana a SCT. La segunda, muestra cuanto de la variabilidad total está siendo
explicada por el error aleatorio, por consiguiente será deseable que esta sea lo más

171
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

pequeña posible, en relación a la SCT, para que exista muy poca variabilidad que no
este explicada por el modelo. Luego la descomposición de SCT sería:

n n

∑ (Y − Y ) = ∑ (Y − Yˆ + Yˆ − Y )
i =1
i
2

i =1
i i i
2

n n n
= ∑i =1
(Yi − Yˆi ) 2 + 2 ∑
i =1
(Yi − Yˆi )(Yˆi − Y ) + ∑ (Yˆ − Y )
i =1
i
2

En primer paso resolveremos:

n n n

∑ i =1
(Yi − Yˆi )(Yˆi − Y ) = ∑
i =1
(Yi − Yˆi )Yˆi – ∑ (Y − Yˆ )Y
i =1
i i

Donde se visualizan dos factores, el primero:

n n

∑i =1
(Yi − Yˆi )Yˆi = ∑ (Y − Y − βˆ ( x − x ))(Y − βˆ ( x − x ))
i =1
i 1 i 1 i

n n
= ∑ i =1
Yi (Y − βˆ1 ( x i − x )) – ∑ Y (Y − βˆ ( x − x )) –
i =1
1 i

∑ βˆ ( x − x )(Y − βˆ ( x − x )) –
i =1
1 i 1 i

n n
=n Y 2
– β̂ 1 ∑ Y (x − x) – n Y
i =1
i i
2
+ Y β̂1 ∑ (x − x) –
i =1
i

n n
Y β̂1 ∑ (x − x) + ∑ (x − x)
i =1
i β̂ 12
i =1
i
2

n n
= β̂ 12 ∑ (x − x)
i =1
i
2
– β̂ 1 ∑ Y (x − x)
i =1
i i

172
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

n
S xx
= βˆ12 S xx – β̂ 1 ∑ Y (x − x) S
i =1
i i
xx

n
Yi ( x i − x )
= βˆ12 S xx – β̂ 1 ∑ i =1
S xx
× S xx = βˆ12 S xx – βˆ1 × βˆ1 × S xx = 0

Por otro lado, el segundo factor:

n n


i =1
(Yi − Yˆi )Y = Y ∑ (Y − Y − βˆ ( x − x ))
i =1
i 1 i

n
=n Y 2
–n Y 2
– Y β̂1 ∑ (x − x) = 0
i =1
i

Luego se obtiene que la descomposición de la suma de cuadrados total esta


compuesta por dos factores:

n n n

∑ (Y − Y ) = ∑
i =1
i
2

i =1
(Yi − Yˆi ) 2 + ∑ (Yˆ − Y )
i =1
i
2

El primero de ellos denomina SCE, mientras que el segundo es la SCR. A partir


de estas sumase construye la tabla de Análisis de Análisis de varianza ANDEVA, que
como se pudo observar en el desarrollo de las demostraciones anteriores afecta sólo a
la componente de regresión β1.

Fuente de g.l. Sumas de Cuadrado


Estadística F
Variación Cuadrados Medio
SCR CMR
Regresión 1 SCR CMR =
1 CME
SCE
Residuos n–2 SCE CME =
n − 2

Total n–1 SCT

173
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

El uso de la tabla de análisis de varianza, tiene muchos resultados, el primero


que se destaca es el uso de ésta para realizar la prueba de hipótesis asociada al
coeficiente de regresión, es decir:

H0 : β1 = β 1 / Ho v/s H1 : β1 ≠ β1 / Ho

donde, β1 / Ho representa el valor del parámetro bajo la hipótesis nula (H0). Sin
embargo, la regla de decisión no es análoga a la vista en sesiones anteriores, pues aquí
se hace el uso de que la razón entre el cuadrado medio de regresión y el cuadrado
medio de residuos se comporta como una distribución F de Snedecor, con los grados
de libertad respectivos. Entonces la regla de decisión asociada a este nuevo estadístico
de prueba, bajo H0, estaría dado por:

eW:{Fobs / Fobs > F1 – α (1; n – 2)}

Observar que la suma de cuadrados de regresión como de residuos pueden ser


escritas en función de las estimaciones de los parámetros a partir de:

n n
SCR = ∑i =1
(Yˆi − Y ) 2 = ∑ (Y + βˆ ( x − x ) − Y )
i =1
1 i
2

n
= ∑ (βˆ ( x − x ))
i =1
1 i
2

n n
= ∑
i =1
( βˆ1 ( x i − x )) 2 = βˆ12 ∑ (x − x)
i =1
i
2
= β̂ 12 S xx

Ahora, como ya se ha visto, el coeficiente de regresión puede ser expresado en


función del coeficiente de asociación lineal de Pearson rp, razón por la cuál también
es posible representar la suma de cuadrados de regresión en términos de este
coeficiente a través de:

2
n  s 2y   S yy 
2
 r  S
SCR = ∑ (Yˆ − Y )
i =1
i
2
= β̂ 12 S xx =  rp
 s x2 
S =
 xx  p S
 xx
 xx

 

174
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

= r p2 S yy = (n − 1)r p2 s 2y

También es posible advertir que la suma de cuadrados de residuos es escritas


en función de las estimaciones de los parámetros a partir de:

n n
SCE = ∑
i =1
(Yi − Yˆi ) 2 = ∑ (Y − Y − βˆ ( x − x ))
i =1
i 1 i
2

n
= ∑ ((Y − Y )
i =1
i
2
+ βˆ12 ( x i − x ) 2 − 2(Yi − Y ) βˆ1 ( xi − x ))

n
= SCT + β̂ 12 S xx – 2βˆ1 ∑ (Y − Y )( x − x )
i =1
i i

n
(Yi − Y )( x i − x )
= SCT + β̂ 12 S xx – 2 S xx β̂ 1 ∑
i =1
S xx

= SCT + β̂ 12 S xx – 2 S xx βˆ1 βˆ1 = SCT – β̂ 12 S xx

Un segundo factor de importancia en la Tabla ANDEVA, es que partir de este


se construye un indicador muy importante para ver la capacidad predictiva del
modelo, que se conoce como coeficiente de determinación, R2, la cual representa el
porcentaje de la variabilidad total que esta siendo explicada por el modelo, y que es
representado por la razón de la suma de cuadrado de regresión sobre la suma de
cuadrado total, es decir:

SCR r p2 S yy SCT − SCE SCE


R2 = = = r p2 = =1– (8.10)
SCT S yy SCT SCT

Luego es posible dejar la SCR, como la SCE en términos del coeficiente de


determinación R2, y construir la razón F, como se muestra a continuación.

175
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

n
SCR = ∑ (Yˆ − Y )
i =1
i
2
= R 2 S yy

n
SCE = ∑ (Y − Yˆ )
i =1
i i
2
= SCT – SCR = Syy – R 2 S yy = (1 – R2) Syy

Entonces la razón F, está dado por:

R 2 S yy (n − 2) R 2 (n − 2)r p
2
CMR ( n − 2)
F= = × = = (3.11)
CME (1 − R 2 ) S yy 1 (1 − R 2 ) (1 − r p2 )

Por esta razón la prueba de hipótesis relacionada con el coeficiente de


regresión β1, puede ser utilizada para probar la existencia de asociación lineal entre
un par de variables, ρ, es decir:

σ 2y σ x2
H0 : β1 = β 1 / Ho ⇔ H0 : ρ = β1 / Ho ⇔ H0 : ρ = β1 / Ho = ρ/Ho
σ x2 σ y2
v/s v/s v/s
σ y2 σ x2
H1 : β1 ≠ β 1 / Ho ⇔ H1 : ρ ≠ β 1 / Ho ⇔ H1 : ρ ≠ β 1 / Ho ≠ ρ/Ho
σ x2 σ y2
donde, ρ/Ho representa el valor del parámetro bajo la hipótesis nula (H0). Entonces la
regla de decisión asociada al estadístico de prueba (3.11),bajo H0, estaría dado por

eW:{Fobs / Fobs > F1 – α (1; n – 2)}

APLICACIÓN 8.6: Considere la APLICACIÓN 3.1, en la cual se estudio la relación


entre los gastos publicitarios, en miles de US$ (P [M/US$]), y el número de pasajeros,
en miles de pasajeros (Q [M/US$]), y se obtuvo:

ŷ i = 4,3865 + 1,0813 xi

Determinar un intervalo del 95% de confianza para la cantidad media de


pasajeros que Airlines S.A. transportaría si los gastos en publicidad ascienden a 9000

176
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

US$., sería equvalente a.

ŷ = 4,3865 + 1,0813 × 9 = 14,1182 US$.

1  S yy × S xx − S xy 
2
σˆ 2
=  = 0,82263
n−2 S xx 
 

1 (x p - x) 2
I95%C(µY/x) : [14,1182 ∓ t1–α/2 (n – 2) σˆ + ] : [13,7192 ; 14,5172]
n n

∑ (x
i=1
i - x) 2

También podría ser de interés verificar estadísticamente si el gasto en


publicidad una variable que permita pronosticar de buena forma la cantidad de
pasajeros que transporta Airlines S.A. con un 5% de significancia, es decir:

H0 : β1 = 0 v/s H1 : β1 ≠ 0

−1 / 2
 n 
eW : { β̂1 / β̂ 1 < – t0,975 (13) σˆ  ∑ ( xi - x ) 2  ∨
 
 i =1 
−1 / 2
 n 
β̂ 1 > t0,975 (13) σˆ  ∑( xi - x ) 2  }
 
 i =1 

eW : { β̂1 / β̂1 < –0,1669 ∨ β̂ 1 > 0,1669}

β̂1 = 1,08313 ⇒⇐ Interpretación : Se rechaza H0.

APLICACIÓN 8.7: Considere la APLICACIÓN 3.2, donde se analizan los datos a


acerca de los tiempos de transporte y el porcentaje de capacidad no utilizada por
camiones de una empresa de transporte. Entonces se obtuvo:

yˆ i* = −5,706 + 0,304 xi

Entonces puede ser interesante de contrastar si los tiempos de transporte una


variable importante para los pronósticos con un 5% de significancia, utilizando la

177
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

tabla ANDEVA, es decir:

H0 : "1 = 0 v/s H1 : "1 ≠ 0


15
SCT = ∑(y
i =1
i
* − yi* ) 2 = 85,113 – 15 x (1,7400)2 = 39,6981

 15 
 * 
ˆ
SCE = SCT – β1 × 
 ∑
*
y i x i − n y x  = 39,6981 – 0,304 x 75,0986 = 16,8536

 i =1 

F. de V. g.l. SC CM Fobs
Regresión 1 22,8445 22,8446 17,6212
Residuos 13 16,8536 1,2964
Total 14 39,6981

eW : { Fobs / Fobs > F1 – ! (1, 13)}


eW : { Fobs / Fobs > F0,95 (1, 13)}
eW : { Fobs / Fobs > 4,667}

Fobs = 17,6212 ⇒ Se rechaza H0.

También puede ser importante determine mediante un intervalo del 90% de


confianza los tiempos de transporte medios cuando el % de capacidad no utilizada es
de 19,5 %, es cual estaría dado por:

µ̂ */X = 19,5% = – 5,706 + 0,304 × 19,5 = 0,222

 
1 (19.5 − X) 2 
S( µ̂ */X = 19,5%) = σˆ × n + 

 ∑ (X i − X ) 2 

1 (19,5 − 13,0367) 2 
= 1,296 ×  +  = 0,553

 15 2796,1975 − 15 × 13,0367
2

I95%C(.*/X = 19,5%) = [-0,7607; 1,2047]

178
Universidad Técnica Federico Santa María Renato Allende Olivares
Econometría ICN 312 Humberto Villalobos Torres

N
1 −1
.*/X = 19,5% = ∑ N × ln( y
i =1
i /X = 19,5%)

I95%C(./X = 19,5%) = [1/exp{1,2047} ; 1/exp{-0,7607}] ⇔ [0,2998; 2,140]

179

También podría gustarte