Está en la página 1de 63

Conhecimentos Especficos Mtodos Quantitativos Anatel

Aula 09 Inferncia no modelo de regresso


Prof. Alexandre Lima

Aula 09

Sumrio
1

Inferncia no Modelo de Regresso Linear Simples ................................................ 2


1.1

Introduo ........................................................................................................................ 2

1.2

Valores Esperados dos Estimadores ...................................................................... 4

1.3

Varincias e Covarincias dos Estimadores ........................................................ 5

1.4

Distribuies Amostrais .............................................................................................. 6

1.5

Teorema de Gauss-Markov........................................................................................ 9

1.6

Coeficiente de Determinao .................................................................................... 9

1.7

Relaxamento dos Pressupostos do Modelo ....................................................... 13

1.8

Regresso sem o Intercepto ................................................................................... 15

1.8.1
1.9

Coeficiente de Determinao da Regresso sem o Intercepto ...................................... 17


Intervalos de Confiana ............................................................................................ 20

1.10

Teste de Hipteses.................................................................................................. 25

1.11

Anlise de Varincia ............................................................................................... 28

Resumo.................................................................................................................................... 40

Exerccios de Fixao ......................................................................................................... 43

4. Gabarito .................................................................................................................................. 48
5. Resoluo dos Exerccios de Fixao ........................................................................... 49

1
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Inferncia no Modelo de Regresso Linear Simples

1.1

Introduo

A anlise de regresso estuda a dependncia de uma varivel, chamada de


dependente, em relao a outras variveis, chamadas de explanatrias (ou
variveis independentes ou regressores), com o objetivo de estimar valores da
primeira, dados os valores das segundas.
J estudamos o modelo de Regresso Linear Simples (RLS)
(1)

Yi = E (Y | X i ) + i = + X i + i ,

i = 1, 2,...n

em que o intercepto, a declividade e denota a componente aleatria


da variao de Y ( uma varivel aleatria). Observe que Y varivel
dependente e X o regressor ou preditor. A funo E (Y | X i ) Funo de
Regresso Populacional (FRP).
Vimos que a reta estimativa (ou Funo de Regresso Amostral (FRA)) dada
por
y = a + bx

em que y denota os valores dados pela reta estimativa, a a estimativa do


parmetro , e b , tambm denominado coeficiente de regresso linear, a
estimativa do parmetro .
Existem diversos mtodos de estimao da reta de regresso. O mais
empregado o mtodo dos mnimos quadrados, em que a reta a ser
adotada dever ser aquela que torna mnima a soma dos quadrados das
distncias da reta aos pontos experimentais. Em outras palavras, devemos
procurar a reta para a qual se consiga minimizar a soma dos quadrados
n
dos resduos i=1 ei2 , em que ei = i = yi y i = yi a bxi denota o i-simo resduo.
A idia central desse procedimento simplesmente a de minimizar a variao
residual em torno da reta estimativa.
Aprendemos que os estimadores a (do intercepto ) e b (da declividade )
so dados por

(2)

S xy

b =

S xx
a = y bx
2
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

em que
(3)

S xy = ( xi x )( yi y ) = xi yi
i

xi yi ,
n i
i

e
(4)

S xx = ( xi x ) = xi xi
n i
i
i

Nota: A estimativa da declividade tambm pode ser calculada pela frmula


b=

Cov ( X , Y )
Var ( X )

em que Cov ( X , Y ) a covarincia amostral e Var ( X ) a varincia amostral de


X. No faa confuso com a notao: na aula 1 deste curso, a covarincia
amostral foi denotada por s xy e a varincia amostral por s x2 . A estimativa do
coeficiente angular tambm pode ser calculada pela frmula

b=r

DP(Y )
DP( X )

em que r denota o coeficiente de correlao de Pearson, DP (Y ) o desvio


padro amostral de Y e DP ( X ) o desvio padro amostral de X.
Para chegar equao acima, basta desenvolver a penltima frmula:
Cov( X , Y )
b=
. Sabemos que
Var( X )

r=

Cov( X , Y )
Cov ( X , Y ) = rDP ( X ) DP (Y )
DP( X ) DP(Y )

b=

DP( X ) DP(Y )
rDP( X ) DP(Y )
DP(Y )
= r
= r
2
Var ( X )
DP( X )
DP ( X )

ento

3
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Interpretao Geomtrica do Intercepto e da Declividade


O intercepto o valor estimado de y quando x = 0, e representa a variao
estimada de y quando x varia uma unidade, conforme ilustrado pela figura a
seguir.

Algebricamente,

E ( y | x )
= tan( )
x

em que denota o ngulo formado entre a reta de regresso e o eixo Ox.


1.2

Valores Esperados dos Estimadores

Pode-se demonstrar que os estimadores a e b de (2) tm mdia dadas por


(5)

E (a) =

E (b) =

Logo, os estimadores a e b, que tambm costumam ser denotados por e


, so justos (ou no viesados ou no tendenciosos), pois suas mdias
so iguais aos verdadeiros valores dos parmetros. Isso quer dizer que
se coletarmos vrias amostras de iguais tamanhos, e aplicarmos as equaes
de (2), os valores mdios das estimativas encontradas de a e b tendero a e
, respectivamente.
4
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

O resultado acima verdadeiro somente quando so vlidos os pressupostos


do modelo apresentados anteriormente. O pressuposto da normalidade dos
erros no necessrio para o resultado (5), mas ser importante para o
estudo da inferncia sobre o modelo de regresso.
1.3

Varincias e Covarincias dos Estimadores

Sabemos que
Var(a) = E{[a E(a)]2} = E[(a )2] = E(a2) 2
Var(b) = E{[b E(b)]2} = E[(b )2] = E(b2) 2
Cov(a,b) = E[(a )(b )]
em que Var(.) denota varincia e Cov(.) representa a covarincia.
Sendo 2 a varincia do erro aleatrio do modelo, pode-se demonstrar que

(6)

var(b) =

(7)

xi2
var(a ) =
nS xx

(8)

Cov(a, b) = 2
S xx

S xx
2

Como o termo 2 / S xx aparece em (6), (7) e (8), podemos reescrever (7) e (8)
como
var(a ) = var(b)

2
i

e
Cov ( a , b ) = x var( b ) ,

respectivamente.
Do exposto, percebe-se que:

5
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Quanto maior a varincia do termo de erro (dada por 2) maiores sero as


varincias de a e b e a covarincia entre eles.
Quanto mais concentrados os valores de x estiverem em torno de sua mdia
x , menor ser o valor de Sxx (lembre que S xx = ( xi x ) 2 ) e maiores sero as
varincias de a e b e a covarincia entre eles. Isso pode ser visto
graficamente na prxima figura.
O sinal da covarincia Cov ( a , b ) oposto ao sinal de x . Note que o grfico da
reta ajustada passa pelo ponto das mdias ( x , y ) . Assim, ainda na figura,
mantendo-se fixo o ponto ( x , y ) , um aumento em b diminui o intercepto a
da reta ajustada.

1.4

Distribuies Amostrais

Sob a hiptese da normalidade dos erros, a e b tambm so distribudos


normalmente
(9)

b ~ N ,
S xx

x2
(10) a ~ N , var(b) i

(11) Cov(a, b) = x

2
S xx

(repetida por convenincia)

Ainda falta definir um estimador para a varincia do erro aleatrio 2. Prova-se


que a varincia dos resduos (ou varincia residual)
6
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

2 =

2
i

n2

um estimador no tendencioso de 2, ou seja, E ( 2 ) = 2 (*). Ressaltamos


que os resduos correspondem diferena entre o valor observado da varivel
dependente e seu respectivo valor estimado, ou seja, ei = yi y i = yi a bxi .
(*) O 2 que subtrado do n do denominador corresponde ao nmero de
parmetros de regresso ( , ) no modelo; essa subtrao torna o estimador
2 no tendencioso.

Frmula alternativa para o clculo do erro padro residual


(raiz quadrada da varincia dos resduos):
EP (ei ) = = 1 r 2 Y

Note que 0 EP(ei ) Y .


Exemplo. Voltemos a um dos exemplos vistos na aula 4, em que foi obtida
reta y = 0,174 + 0, 217 x ( S xx = 42 ). Foi dada a tabela a seguir:

xi

yi

xi yi

1
2
3
4
5
6
7
8
xi = 36

0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2

0,5
1,2
2,7
3,2
6,0
9,0
11,9
16,0
xi yi = 50,5

xi2
1
4
9
16
25
36
49
64
xi2 = 204

yi2
0,25
0,36
0,81
0,64
1,44
2,25
2,89
4,00
yi2 = 12,64

7
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Substituamos, na tabela acima, as suas trs ltimas colunas,como abaixo:

xi

yi

yi

ei = yi yi

1
2
3
4
5
6
7
8
xi = 36

0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2

0,174+0,217x1=0,392

0,108
-0,008
0,075
-0,242
-0,058
0,025
0,008
0,092
ei = 0

0,174+0,217x2=0,608
0,174+0,217x3=0,825
0,174+0,217x4=1,042
0,174+0,217x5=1,258
0,174+0,217x6=1,475
0,174+0,217x7=1,692
0,174+0,217x8=1,908

= 9,2

e12
0,0117
0,0001
0,0056
0,0584
0,0034
0,0006
0,0001
0,0084
ei2 = 0,0883

Observe que
(a)
(b)

y = y (demonstrvel);
e = 0 , consequncia direta de (a).
i

Estimemos as varincias de a e b , bem como Cov ( a , b ) . A primeira etapa


estimar 2:
Varincia residual =

e
=

2
i

n2

0,0833
= 0,0147.
6

Agora, utilizemos as frmulas (6), (7) e (8), substituindo 2 (desconhecido)


pela sua estimativa 2 :
var(b) =

var(a ) =

2
S xx

2
i

0,0147
= 350 10 6 ,
42

var(b) =

204
350 10 6 = 8,925 10 3 ,
8

cov(a, b) = x var(b) =

36
350 10 6 = 1,575 10 3 .
8

Assim, assumindo a normalidade do erro aleatrio do modelo, obtemos as


seguintes estimativas:
b ~ N(0,217; 350x10-6)
a ~ N(0,175; 8,925x10-3)
8
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

1.5

Teorema de Gauss-Markov

O teorema Gauss-Markov nos garante que, de todos os


estimadores lineares possveis no viesados para e , os estimadores de
mnimos quadrados a e b , definidos por (2), so os de menor varincia. Ou
seja, os estimadores a e b so os Melhores Estimadores Lineares No
Viesados (MELNV).
Uma consequncia lgica do teorema que, se h estimadores de menor
varincia que a e b para e , estes ou so viesados ou so no lineares. Ns
no nos preocuparemos com o seu estudo. A demonstrao deste teorema
foge ao escopo desta aula.
1.6

Coeficiente de Determinao

Os resduos ei = yi y i , embora utilizados para avaliar a aderncia da reta


ajustada de mnimos quadrados aos pontos (xi, yi), tm o inconveniente de
serem afetados pela unidade utilizada. Para superar esse obstculo,
voltaremos discusso sobre o coeficiente de determinao R2 visto
anteriormente.
Primeiramente, temos que a variao total de y dada por
(12)

2
S yy = ( yi y ) 2 = yi yi
n i
i
i

Nosso objetivo separar a variao total de y em 2 partes: uma


explicada pela regresso e outra associada ao termo de erro (ou no
explicada pela regresso).

9
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Considere a identidade
(13)

yi y = ( yi y i ) + ( y i y ) .

Elevando ambos os membros de (13) ao quadrado e somando as n


observaes, obtemos:
(14)

(y
i

y ) 2 = i( yi y i ) 2 + i( y i y ) 2 + 2i( yi y i )( y i y ).

Demonstra-se que o ltimo termo de (14) nulo e segue-se ento que

(y
i

(15)

y ) 2 = i( yi y i ) 2 + i( y i y ) 2

SQT

SQE

SQR

em que:
SQT = Soma dos quadrados total = Syy =

(y
i

y ) 2 (ou variao total)

SQE = Soma dos quadrados dos erros =

(y
i

y i ) 2 (ou variao

residual)
SQR = Soma dos quadrados da regresso =

( y
i

y ) 2 (ou variao

explicada)
Dividindo ambos os membros de (15) por SQT, resulta
(16) 1 =

SQE SQR
.
+
SQT SQT

Finalmente, definimos o coeficiente de determinao por


(17) R 2 =

SQR
SQE
.
= 1
SQT
SQT

Da definio, tem-se que 0 R2 1. O coeficiente R2 mede a proporo (ou


a porcentagem) da variao total em y explicada por x dentro do
modelo de regresso. O R2 quantifica o grau de ajuste de um conjunto de
dados reta de regresso estimada. Quanto mais prximo de 1 estiver R2
10
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

melhor ter sido nosso trabalho para explicar a variao em y, com y = a + bx , e


maior ser a capacidade de previso do modelo sobre todas as
observaes amostrais, ou seja, R2 nos diz o quo prximos os valores
estimados (ou previstos) de Y esto de seus valores observados.

O coeficiente R2 uma medida descritiva. , s vezes, chamado medida de


aderncia. Por si s, no mede a qualidade do modelo de regresso. No
se pode julgar o mrito de um modelo com base somente no valor de seu R2.
Os parmetros estimados podem conter informaes teis mesmo quando esse
nmero baixo (como R2=0,32). Isto pode ocorrer, por exemplo, quando
aplicamos a regresso linear simples no contexto de variveis econmicas1.
H outras formas de apresentar R2. Sabemos que

y i = a + bxi e y = a + b x .

Subtraindo a segunda equao da primeira, obtemos

y i y = b( xi x ) ( y i y ) 2 = b 2 ( xi x ) 2 .
Fazendo o somatrio de ambos os membros da equao,

( y
i

y ) 2 = ib 2 ( xi x ) 2 = b 2 i( xi x ) 2 ,

obtemos,
(18) SQR = b 2 S xx ,
logo,
S
(19) R = b xx
S
yy
2

S xy2
=
S S
xx yy

Vimos que o coeficiente de correlao linear de Pearson r dado por


r=

S xy
S xx S yy

Ento,
(20) r 2 = R 2

GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson Makron Books, 2000.

11
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Observe que, no ajuste perfeito, ou seja, quando todas as observaes se


encontram na reta ajustada, todos os resduos so nulos e R2 =1, assim como
o mdulo do coeficiente de correlao linear de Pearson (veja a figura abaixo).

Voltando ao exemplo anterior,


2

1
SQT = i( yi y ) = yi yi 2,06 (calculado anteriormente)
n i
i

SQE =

(y
i

y i ) 2 = 0,0883

SQR = b 2 S xx = 0,217 2 42 = 1,972


O coeficiente R2 dado por
S
42
R 2 = b 2 xx = 0,217 2
= 0,957
S
2,06
yy

O resultado acima nos diz que 95,7% da variao de y explicada pelo modelo
de regresso (veja a figura abaixo). Podemos dizer que a reta ajustada tem
uma boa aderncia aos pontos (xi, yi).

12
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

1.7

Relaxamento dos Pressupostos do Modelo

Heterocedasticidade
Lembremos da seguinte premissa do modelo de regresso linear clssico:
A varincia do termo de erro sempre constante, ou seja,

Var(ei) = E[ei2] = 2
Quando a varincia dos erros constante, dizemos que os erros so
homocedsticos. Todo o estudo que fizemos at o momento est baseado
nesta premissa.

Entretanto, muitas vezes no mundo real os erros so heterocedsticos, ou


seja, suas varincias no so constantes. Posto em equao,
Var(ei) = E[ei2] = 2(i).
A heterocedasticidade pode ser causada por vrias fatores. Por exemplo, o
aperfeioamento da coleta de dados pode levar a uma diminuio na varincia
dos erros das observaes mais recentes.
A
prxima
figura
heterocedasticidade.

ilustra

os

conceitos

de

homocedasticidade

13
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Figura: homocedasticidade versus heterocedasticidade.

Autocorrelao
A Autocorrelao
pressuposto:

ocorre

quando

no

se

observa

seguinte

Os termos de erro so estatisticamente independentes. Isso implica


que Cov(ei,ej) = E[eiej] = 0, para i j.

Simbolicamente, quando h autocorrelao,

Cov(ei,ej) = E[eiej] 0 para i j.


A autocorrelao dos erros muito comum em sries temporais (por exemplo,
o grfico do ndice BOVESPA ao longo dos ltimos 10 anos uma srie
temporal).
14
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

H modelos de regresso linear que corrigem os problemas de


heterocedasticidade e autocorrelao. Entretanto, julgamos desnecessrio, at
mesmo prejudicial (a menos que voc tenha tempo de sobra - concurseiro com
tempo de sobra??), estud-los para a prova, pois acreditamos ser desprezvel
a probabilidade de serem cobrados.
1.8

Regresso sem o Intercepto

Em certas situaes da vida prtica, sabemos que a reta de regresso dos


dados deve passar pela origem. Considere, por exemplo, um estudante de
engenharia eltrica que est fazendo o levantamento experimental da famosa
Lei de Ohm, dada por V = RI, em que R o valor de uma resistncia, V a
tenso aplicada em um resistor e I a corrente que atravessa o resistor. Note
que a equao V = RI passa pela origem do grfico da tenso (eixo vertical)
versus corrente (eixo horizontal). O valor da resistncia d a declividade da
reta.
A regresso sem o intercepto tambm chamada regresso sem termo
constante ou regresso que passa pela origem. Neste caso nosso modelo passa
a ser
Y = X +

e a condio imposta passa a ser

min ei2 = min ( yi y i ) 2 = min ( yi bxi ) 2


i

em que ei = i denota o resduo.


Aplicando ento o mtodo de mnimos quadrados, obtemos as seguintes
frmulas para b e sua varincia (*)
(21) b =

x y
x
i

2
i

(22) var(b) =

2
i

em que 2 estimado por


(23) 2 =

2
i

n 1

15
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

(*) a prova pode ser encontrada no apndice do captulo 6 da referncia


GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson
Makron Books, 2000.
interessante comparar tais frmulas com as que se obtm quando o termo
de intercepto est includo no modelo:

b=

S xy
S xx

( x x )( y y )
(x x)
i

var(b) =

(x

x )2

2 =

2
i

n2

As diferenas entre os dois conjuntos de frmulas so evidentes: no modelo


com intercepto usamos somas de quadrados e produtos cruzados (isto ,
produtos entre X e Y) ajustados em relao mdia. Alm disso, o nmero de
graus de liberdade para calcular 2 (n-1) na regresso sem o intercepto e
(n-2) na regresso com intercepto. A estatstica 2 tem (n-1) graus de
liberdade na regresso sem o intercepto porque a obteno dos yi necessita da
estimativa de somente um parmetro do modelo.
Aprendemos, quando estudamos o modelo de regresso linear com intercepto,
que 2 = ei2 = SQE = SQT SQR. Vimos que SQR = b2Sxx = b2 ( xi x ) 2 , por
conseguinte

e = (y
2
i

y ) 2 b 2 ( xi x ) 2 (regresso com intercepto).

Para o modelo com intercepto zero, pode-se mostrar analogamente que

e = y
2
i

2
i

b 2 xi2

Note que as somas dos quadrados de Y e X no so ajustadas pela


mdia na frmula acima.
Se o exerccio no mencionar qual o modelo, sempre resolva a questo
usando o modelo com intercepto.

16
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

1.8.1

Coeficiente de Determinao da Regresso sem o Intercepto

Vimos que SQE = ei2 = yi2 b 2 xi2 quando a regresso passa pela origem.
Como R 2 = 1 SQE / SQT , temos que
R2 = 1

2
i

b 2 xi2
SQT

=1

2
i

b 2 xi2
S yy

=1

y b x
y ( y ) / n
2
i

2
i

2
i

A frmula acima indica que no podemos assumir a igualdade entre o


coeficiente de determinao e o coeficiente de correlao linear
quando a regresso passa pela origem.

regresso sem intercepto: R 2 r 2


J caiu em prova! (ANAC/UnB-CESPE/2009) Um estudo sobre a duraco
de uma operaco de carregamento mostrou haver relaco linear na forma Yk =
Xk + k, em que Yk o tempo (horas) do carregamento k; Xk o volume total
(em toneladas) do carregamento k; o coeficiente angular; e k representa
um erro aleatrio com mdia zero e variancia 2.
De uma amostra aleatria de 341 operaces de carregamento, observam-se os
341

seguintes

resultados:

X kYk = 988 ;
k =1

341

Y
k =1

341

X k2 = 1.704 ;
k =1

341

X k = 682 ;
k =1

341

Y
k =1

2
k

= 681 ;

= 341 .

Com base nessas informaces, julgue os itens a seguir.


O coeficiente R2 (ou coeficiente de determinaco ou explicaco) do modelo
apresentado igual a 0,81, o que indica que 81% da variaco total do tempo
de carregamento so explicadas pelo volume total do carregamento.
Resoluo
Note que a regresso passa pela origem, pois o modelo especificado
Yk = Xk + k.
O coeficiente R2 mede a percentagem da variao na varivel
dependente Y (tempo em horas do carregamento) explicada pela variao

17
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

na varivel explicativa X (volume total em toneladas do carregamento)


dentro do modelo de regresso.
Estimativa da declividade

b=

x y
x
i

2
i

988
= 0,58
1.704

Clculo de R2
SQE = yi2 b 2 xi2 = 681 0,582 1.704 = 107,77

( Y )
= Y
n

SQT = S yy

R2 = 1

= 681

3412
= 340
341

SQE
107,77
= 1
= 0,68 0,81 item errado
SQT
340

Alm disso, errado dizer que


(...) variaco total do tempo de carregamento so explicadas pelo volume
total do carregamento.
A afirmao correta seria
(...) variaco total do tempo de carregamento so explicadas pela variao do
volume total do carregamento.
Calculemos o coeficiente de correlao.
r=

S xy
S xx S yy

S xy = X k Yk

( X ) ( Y ) = 988 682 341 = 306


k

( X )

S xx = X k2
r=

S xy
S xx S yy

340

= 1.704

n
306

341

682
= 340
341

306
= 0,90 r 2 = 0,81
340

Constatamos que r 2 R 2 para regresso sem intercepto.


GABARITO: E
18
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

A correlaco linear entre o tempo de carregamento e o volume total do


carregamento superior a 0,85.
Resoluo
O item est certo, pois vimos que r = 0,9. O clculo do item anterior no foi
uma perda de tempo!
GABARITO: C
Sendo os erros aleatrios distribudos segundo uma normal, ento a estimativa
de mxima verossimilhanca para o coeficiente inferior a 0,60 e superior a
0,55.
Resoluo

Se admitirmos os erros aleatrios do modelo de regresso distribudos


normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos (*).
Trata-se de uma regresso sem o intercepto. Logo,

b=

X Y
X

k k
2
k

988
= 0,58
1.704

Note que 0,55 < b = 0,58 < 0,60 item certo.


(*) GUJARATI, D. N. Econometria Bsica, 3 Ed., Pearson Makron Books,
2000.
GABARITO: C
Sendo y , x e , respectivamente, a mdia dos tempos de carregamento, a
mdia dos volumes totais do carregamento e a estimativa de mnimos
quadrados do coeficiente angulardo modelo, ento y = x .
Resoluo
O modelo Yk = Xk + k. Logo,
E(Yk) = E(Xk + k) = E(Xk) + E(k) = E(Xk) + E(k) = E(Xk), pois E(k) = 0.
19
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Note que E(Yk) = E(Xk) E(Xk). Item errado.


Nota: errou a questo quem confundiu a estimativa do coeficiente angular,
dada por , com o prprio coeficiente angular .
GABARITO: E
1.9

Intervalos de Confiana

A partir deste ponto, abandonaremos a notao e para os parmetros do


modelo Y = + X + de RLS e adotaremos em seus lugares 1 e 2,
respectivamente. A razo disso que empregaremos o termo daqui para
frente para designar o nvel de significncia do teste, como logo veremos.
O modelo de RLS fica ento na forma
(24) Y = 1 + 2 X +
em que 1 e 2 denotam as estimativas de 1 e 2 , respectivamente.
Se os pressupostos do modelo (24) se verificam, inclusive o da normalidade
dos erros, pode-se provar que

(25)

2 2
s )2

= t n 2

segue distribuio t de Student com n2 graus de liberdade, em que

s2 =
2

2
S xx

a varincia amostral de 2 (lembre que 2 denota a varincia amostral dos


resduos do modelo).
O nmero de graus de liberdade (GL) o nmero de observaes subtrado do
nmero de parmetros do modelo. No modelo de RLS, GL = n2.
Da tabela auxiliar da t de Student encontramos valores crticos tc tais que

P{tc t tc } = 1 .
Segue-se que
20
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

2
tc = 1 ,
P t c 2
s)2

e, rearranjando a inequao anterior, obtemos


)
)
(26) P{ 2 tc s )2 2 2 + t c s )2 } = 1

Exemplo. Considere o nvel de significncia = 0,05 = 5% e a estatstica t


com 30 graus de liberdade. Podemos ver na figura abaixo que 1 = 0,95 =
95% a rea sob a densidade t (curva azul) no intervalo -2,042 t 2,042 (tc
= 2,042 para = 5%, confira!) e 2 = 0,025 = 2,5% a rea de cada uma
das caudas da distribuio.
Distribuio da estatstica t, N=30
0.4
0.35
0.3

Densidade

0.25
0.2
0.15
0.1

Prob = 0.025
t>2.042

Prob = 0.025
t<-2.042

Area = 0,95
-2.042<t<2.042

0.05
0
-5

-4

-3

-2

-1

0
t

)
O intervalo observado 2 tc s )2 denominado intervalo com 100 (1 )% de

confiana para o parmetro 2 . A interpretao de um intervalo de confiana


a seguinte:
se um nmero infinito de amostras aleatrias for coletado e um intervalo
com 100 (1 )% de confiana para 2 for calculado a partir de cada amostra,
ento 100 (1 )% desses intervalos contero o valor verdadeiro de 2 .

Na prtica, obtemos somente uma amostra aleatria e calculamos uma


estimativa do intervalo de confiana. Uma vez que esse intervalo conter
21
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

ou no o valor verdadeiro de 2 , no razovel fixar um nvel de


probabilidade para essa realizao. A afirmao apropriada a seguinte:
o intervalo observado contm o valor verdadeiro de 2 , com 100 (1 )% de
confiana. Essa afirmao tem uma interpretao de freqncia; ou seja, no
sabemos se a afirmao verdadeira para essa amostra especfica, mas o
)
mtodo usado para obter o intervalo 2 tc s )2 resulta em afirmaes corretas

em 100 (1 )% do tempo.
Para o intercepto 1 , a estimao dos intervalos de confiana (IC) funciona
rigorosamente da mesma maneira que para 2 . Assim, podemos reescrever
(26) como
)
)
(27) P{1 t c s )1 1 1 + tc s )1 } = 1

em que
(28) s s)

2 xi2
=
nS xx

Exemplo. Retornemos ao exemplo de RLS que temos utilizado ao longo desta


aula. A reta estimada y = 0,174 + 0, 217 x e as distribuies estimadas de 1 e 2
so:

2 : N (0,217;0,0003505)

1 : N (0,174;0,008938)
Se quisermos calcular os intervalos de confiana de 95% para 1 e 2 , temos
de escolher corretamente o valor crtico tc. Lembre que n = 8 observaes.
Logo, t6 = 2,447, o que implica 2,5% de rea para cada cauda.

22
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima
Distribuio da estatstica t, N=30
0.4
0.35
0.3

Densidade

0.25
0.2
0.15
0.1

Prob = 0.025
t>2.447

Prob = 0.025
t<-2.447

0.05
0
-5

-4

-3

-2

-1

0
t

O IC de 2 no nvel de 95% de confiana dado por


)
2 t c s ) = 0,217 2,447 0,0003505 = 0,217 0,046 .
2

O IC de 1 no nvel de 95% de confiana dado por


)
1 tc s ) = 0,174 2,447 0,008938 = 0,174 0,231 .
1

Exemplo (DECEA/2009/Cesgranrio) Uma determinada empresa resolveu


estudar a relao do ativo total (em bilhes de reais) e a receita lquida (em
milhes de reais) das 17 maiores instituies financeiras do pas. O estudo
forneceu os seguintes resultados:
Estatstica de regresso
R2

0,55

R2 Ajustado

0,52

Erro padro

2,86

Observaes

17

23
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Coeficientes

Erro padro

valor-P

Interseo

4,5

1,43

3,1

0,007

Receita
lquida

0,1

0,02

4,3

0,001

Com base nos resultados, o intervalo de confiana de 95%, bilateral, para a


inclinao da reta, , , aproximadamente,
(A) 0,1 1,64 x 0,02
(B) 0,1 1,75 x 0,02
(C) 0,1 1,96 x 0,02
(D) 0,1 2,13 x 0,02
(E) 0,1 4,30 x 0,02
Resoluo
Seja o modelo de RLS Y = 1 + 2 X + , em que a inclinao da reta 2 o
mencionado pelo enunciado, X a varivel independente (ativo) e Y a
varivel dependente (receita lquida).
Pede-se o intervalo de confiana de 2. Vimos que ele dado por
)
2 t c s ) = 0,1 4,3 0,02 opo correta (E), certo? ERRADO! Voc caiu numa
2

pegadinha da banca.
O valor T da tabela a estatstica de teste da Hiptese nula Ho: 2=0.
)
O IC dado por 2 tc s )2 , onde tc o valor crtico de t extrado da tabela

auxiliar t de Student.
No modelo de RLS, para n = 17 observaes, temos (n2) = 15 graus de
liberdade (GL). Para o IC bilateral 95% de confiana e 15 GL, tc = 2,131
)
2,13. Como 2 = 0,1 e s )2 = 0,02 , temos que:
)
IC: 2 tc s )2 = 0,1 2,13 0,02 .

Nota: a estatstica R2 Ajustado ser definida no estudo da regresso linear


mltipla. Essa estatstica no usada na RLS.
GABARITO: D

24
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

1.10 Teste de Hipteses


A hiptese nula H0
A hiptese nula geralmente o oposto do que queremos provar. Por
exemplo, no modelo de RLS Y = 1 + 2 X + , ao calcularmos 2 estamos
supondo que existe uma relao entre as variveis X e Y. Assim, uma
hiptese nula (H0) usualmente adotada H0: 2 = 0 .
A hiptese alternativa H1
A hiptese alternativa contradiz a hiptese nula. Por exemplo, quando a
hiptese nula H0: 2 = 0 a hiptese alternativa pode ser H1: 2 0 ou H1: 2
<0 ou ainda H1: 2 >0.
A preocupao de definir as hipteses do examinador, voc s ter de testlas. Para tal, ser necessria uma estatstica de teste.
Vimos que

2 2
s

segue distribuio t com n2 graus de liberdade. Se a hiptese nula


H0: 2 = k,
em que k uma constante, for aceita, ento t n2 = ( 2 k ) / s tambm possui
2

distribuio t com n2 graus de liberdade. Esta ser a estatstica usada no


teste. Ressaltamos que, na maioria dos exames, a hiptese nula
H0: 2 =0 e t n2 =

2
s 2

embora isso nem sempre ocorra.


A Regio de Rejeio
Se a estatstica t n2 = ( 2 k ) / s 2 for muito grande em mdulo (valor absoluto),
rejeitamos H0. A lgica est no fato de, se 2 ficar muito distante de k,
provavelmente H0 est errada.
25
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Mas o quo grande tem de ser a estatstica acima para rejeitarmos H0 em


favor de H1: 2 0? A resposta a essa pergunta a escolha de um nvel de
significncia . A regio de rejeio composta por valores t tais que
P{t tc} = P{t -tc} = /2,
conforme ilustrado pela figura abaixo.
Distribuio da estatstica t, N=30
0.5

NO REJEITAR H0

REJEITAR H0

0.45

REJEITAR H0

0.4

Densidade

0.35
0.3
0.25
0.2

Prob = /2
t<-t

0.15

Prob = /2
t>t

0.1

P(-tc<t<tc) = 1-

0.05
0
-5

-4

-3

-2

-1

0
t

Tipos de erro (reviso!)


Sempre que aplicamos um teste de hipteses corremos o risco de errar. H
dois tipos de erro.
Erro tipo I: rejeitar H0 sendo ela verdadeira. Neste caso, H0 verdadeira e
P{t c ( 2 k ) / s 2 t c } = 1 , pois ( 2 k ) / s 2 segue a distribuio tn-2. Assim, a
probabilidade de cometer um erro tipo I .
Erro tipo II: aceitar a hiptese H0 sendo ela falsa. Entretanto, essa
probabilidade no pode ser calculada, pois no sabemos o verdadeiro valor do
parmetro. Mas podemos dizer que a probabilidade de um erro nvel II
aumenta medida que diminui a probabilidade de um erro nvel I, quando se
escolhe um menor nvel de significncia .

26
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Exemplo. Com os dados do exemplo do exemplo anterior, teste a hiptese H0:


1=0 em favor da hiptese alternativa H1: 10 nos nveis de 10% e 20% de
significncia.
As mesmas frmulas enunciadas para 2 se aplicam para 1 . A estatstica de
teste

t n2 = ( 1 k ) / s = 0,174 / 0,008938 = 1,84 .


1

a) = 0,10
P{t tc} = P{t -tc} = /2 = 0,05
Como n=8, temos n2 = 6 GL. Da tabela auxiliar, tc=1,94. Como tc < tn2 < tc ,
tn-2 se encontra na regio de aceitao. Portanto, no rejeitamos a hiptese
nula no nvel de significncia de 10%.
b) = 0,20
P{t tc} = P{t -tc} = /2 = 0,10
Da tabela auxiliar, tc = 1,44. Como tn-2>tc, tn-2 encontra-se na regio de
rejeio. Portanto, a hiptese nula rejeitada no nvel de significncia
de 20%.
Testes unilaterais (unicaudais)
At agora estudamos os testes bilaterais ou bicaudais, que se caracterizam
pela hiptese nula H0: i =0 (i=1,2), contra a alternativa H1: i 0.
Se rejeitarmos H0 em favor da alternativa H1: i 0, estaremos considerando
que i pode assumir qualquer valor negativo ou positivo, menos o zero. Ocorre
s vezes, pela natureza das variveis, que i no pode ser negativo e, dessa
forma, estabelecemos a hiptese alternativa H1: i >0. O que voc precisa
saber para a prova est explicado na sequncia.
Em um teste bilateral, a regio de rejeio composta por valores t tais que
P{t tc} = P{t -tc} = /2 . Em um teste unilateral direita, a regio de
rejeio composta por valores t tais que P(ttc) = . Na prxima figura,
temos = 5% e tc = 1,697 (30 graus de liberdade).

27
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima
Distribuio da estatstica t
0.4
0.35
0.3

Densidade

0.25
0.2

Rejeitar se t > 1.697


Prob = 0.05

0.15
0.1
0.05
0
-5

-4

-3

-2

-1

0
t

O restante do procedimento idntico ao j estudado.


1.11 Anlise de Varincia
Seja o modelo de RLS dado por Y = 1 + 2 X + e sua reta estimativa y = 1 + 2 x
. Vimos anteriormente que SQT = SQR + SQE, ou seja,

(y

y ) 2 = ( y i y ) 2 + ( yi y i ) 2 .

A expresso acima a equao bsica da anlise de varincia ou ANOVA


(ANalysis Of VAriance). Veremos que a anlise de varincia pode ser usada
para testar a significncia da regresso. J aprendemos que os
componentes

( y

y ) 2 (SQR)

(y

y i ) 2 (SQE)

medem, respectivamente, a variao em y devida reta de regresso e a


variao residual deixada sem explicao pela reta de regresso.
A ideia usar a equao da ANOVA para testar a hiptese de no haver
regresso (2=0). Se no h regresso,
y = 1

28
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

1 = y (pois 1 = y 2 x = y 0.x = y ).
Portanto,

( y

y ) 2 = (1 y ) 2 = ( y y ) 2 =0 (SQR nula).

Neste caso, SQT = SQE e isto quer dizer que a varincia total de Y (y2) igual
a varincia residual 2 (varincia do erro aleatrio do modelo), ou seja,
y2 = 2 .
Vamos agora dividir os termos dos lados esquerdo e direito da equao da
ANOVA pela varincia residual 2:

(y

y)2

( y
=

y)2

(y
+

y i ) 2

Observe que a diviso de SQT por 2 (lado esquerdo da expresso acima),


2

y y
( yi y ) = i = n21 ,

1
2

resulta numa varivel aleatria qui-quadrado com n1 graus de liberdade, pois


assumimos que y2 = 2 (lembre que a mdia amostral y causa a subtrao de
1 grau de liberdade na estatstica).
Seguindo a mesma linha de raciocnio, temos que a estatstica
1
2

y y
( yi y i ) = i i = n22
2

uma varivel aleatria qui-quadrado com n2 graus de liberdade (a


diminuio de 2 graus de liberdade causada pela estimao dos parmetrods
1 e 2 ).
Ainda falta analisar a estatstica

( y

y)2

22 S xx
(lembre que SQR = 22 S xx ).
2

A varivel aleatria 2 normal. Sendo 2 = 0 por hiptese, temos que


29
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

2 ~ N 0,

.
S xx

Considere a varivel normal reduzida


z=

S
2 0
= 2 xx .

/ S xx

Elevando ao quadrado ambos os membros da expresso acima, obtemos,

0
z = 2
/ S
xx

= 2 S xx = SQR ,

2
2

e conclumos que a diviso de SQR por 2 resulta numa varivel aleatria quiquadrado com 1 grau de liberdade.
Assim, a equao

(y

y)2

( y

y)2

(y

y i ) 2

pode ser reescrita como

n21 = 12 + n2 2 ,
se, de fato, vlida a hiptese 2 = 0 .
Aprendemos que uma varivel resultante da soma de duas outras
variveis independentes n21 e n22 uma varivel n21 +n2 . Uma consequncia
da propriedade de aditividade da qui-quadrado a seguinte: se trs
variveis n2 , n21 e n22 so tais que n2 = n21 + n22 , ento a condio necessria
e suficiente para que n21 e n22 sejam independentes que n = n1 + n2.
(*) o termo tcnico seria corolrio.
Conclumos que

12 = (SQR/2)
e
30
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

n2 2 = (SQE/2)
so variveis qui-quadrado independentes, pois o nmero de graus de
liberdade de SQT/2 n1, caso a premissa 2 = 0 seja vlida.
Considere a estatstica F
SQR / 2
22 S xx
SQR / 1
12 / 1
1
(29) F =
,
=
=
=
SQE / 2 n22 /(n 2) SQE /(n 2)
2
n2

em que 2 denota a varincia residual amostral. Note que F tem 1 grau de


liberdade no numerador e n2 graus de liberdade no denominador. Ento (29)
pode ser usada para se testar, pela ANOVA, a hiptese H0 de no haver
regresso. O teste ser unilateral, uma vez que, sendo falsa H0, o numerador
tender a crescer. A varivel (29) dever ser comparada com o valor crtico
F1,n 2 , em que o nvel de significncia do teste de hipteses. Daremos um
exemplo de teste pela ANOVA mais adiante.
O teste acima descrito equivalente ao teste bilateral da hiptese nula 2 = 0 ,
porque demonstra-se que o F de (29) o quadrado do tn-2 quando 2 = 0 , ou
seja, F1,n-2 = t2n-2.
Podemos resumir tudo o que foi visto neste item na tabela de ANOVA abaixo.

(GUJARATI, D. N. Econometria Bsica, 3 Ed., Pearson Makron Books, 2000)


Soma de
Fonte de
Graus de
Mdia dos
F
Fcalculado
Quadrados
Variao
Liberdade
quadrados
Regresso

SQR

SQR/1

Residual

SQE

n-2

= SQE/(n-2)

Total

SQT

n-1

SQR / 1
SQE /( n 2) F1,n-2,

Pelo que foi visto at o momento, tanto faz usar t ou F no modelo de RLS. Na
verdade, F muito til para a inferncia do modelo de regresso linear
mltipla, que ser visto posteriormente.

31
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Nota: cuidado com a notao. Alguns autores no adotam as mesmas


abreviaturas que so usadas neste curso. Vimos que
SQR = Soma dos quadrados da regresso =

( y
i

y ) 2 (variao explicada).

Alguns autores a chamam de Soma dos Quadrados Explicada (SQE) pela


regresso.
Vimos tambm que
SQE = Soma dos quadrados dos erros =

(y
i

y i ) 2 (variao residual).

Alguns autores a chamam de Soma dos Quadrados dos Resduos (SQR).


Neste caso inverte-se a notao. Na prova, o examinador ter de explicar a
qual soma estar se referindo. Voc ter apenas de estar bem atento.
Exemplo. Testar pela ANOVA a existncia de regresso linear para os dados
do exemplo do item 21.4, ao nvel de 10% de significncia. Considere F1;6;0,1 =
3,776.
Dados: 1 = 0,174 (intercepto estimado), 2 = 0,217 (inclinao estimada), Syy =
2,06; Sxx = 2,06, Sxy = 9,1 e n = 8.
Soluo:
Vamos testar as hipteses
H0: 2 = 0,
H1: 2 0.
SQR = 22 S xx = 0,217 2 42 1,978 .
SQE = SQT SQR = Syy SQR = 2,06 1,978 = 0,082.
F = SQR/[SQE/(n2)] = 1,987/(0,082/6) 144,73.
Como F = 144,73 >> 3,776, rejeitamos H0 e conclumos que h regresso. A
prxima figura ilustra a distribuio amostral de F. A rea azul corresponde a
P(F > fc) = 10%, em que o valor crtico fc = 3,776.

32
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima
Distribuio da estatstica F
curva F
rea = 10%
0.25

Densidade

0.2

0.15

0.1

P(F > 3.776) = 0,10

0.05

0
0

20

40

60

80

100

120

140

Fonte de
Variao
Regresso
Residual
Total

Graus de Quadrado
Soma de
Mdio
Quadrados Liberdade
1,978
1
1,978
0,082
6
0,014
2,060
7

F
1,978
= 144 ,73
0,014

3,776

Exemplo (DECEA/Cesgranrio/2009/Adaptada) Considere os dados abaixo


para responder s prximas duas questes.
Resultados parciais da aplicao de um modelo de regresso linear simples,
em um conjunto de 27 observaes.
ANOVA

Grau de
liberdade

Soma de
quadrados

Regresso

Mdia dos
quadrados

F de significao

68.000

3,2E-10

Resduo

680

Total

85.000
Coeficientes

Erro padro

Interseo

9,59

8,73

Varivel
X1

4,76

Estatstica
t

Valor-P

33
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

A variabilidade total explicada por esse modelo, aproximadamente,


A) 90%
B) 80%
C) 70%
D) 60%
E) 50%
Resoluo

R2 =

SQR 68.000
=
= 0,8 = 80%
SQT 85.000

GABARITO: B
O valor de X no quadro acima, aproximadamente,
A) 10,00
B) 8,73
C) 2,01
D) 0,48
E) 0,0001
Resoluo
Reta de regresso: Y = + X 1 + , em que a varivel independente X1, a
varivel dependente Y, e so os parmetros do modelo e o termo de
erro aleatrio.
Dados: = 4,76 (estimativa da declividade), SQR = 68.000.
Sabemos que

Var ( ) =
S xx
2

e que
SQR
SQR = 2 S xx S xx = 2

Logo,
34
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Var( ) =

SQR / 2
da declividade).

( ) =

2
SQR / 2

= X (frmula do erro padro do estimador

Como no conhecemos o valor da varincia 2 do erro aleatrio, trabalharemos


com a mdia dos quadrados dos resduos (cujo valor tabelado 680), que,
como visto, corresponde estimativa de 2. Em outras palavras,
2 = SQE /(n 2) = 680 .
Ento,

SQR / 2

680
=
68.000 / 4,76 2

4,76 2 4,76
=
0,48
100
10

GABARITO: D
Exemplo (Engenharia-BNDES/Cesgranrio/2008) Um experimento foi
realizado com o objetivo de estimar o preo de uma ao, dado o seu valor
patrimonial, ambos em reais. Uma amostra de aes negociadas recentemente
forneceu dados sobre o preo e o valor patrimonial por ao. Aplicou-se o
modelo de regresso linear simples Y = + X + . Alguns resultados da
tabela da anlise da varincia, obtida a partir dos dados dessa amostra, esto
apresentados a seguir.
ANOVA
Fontes de
variao

Grau de liberdade

Soma de quadrados

Mdia dos quadrados

Fcalculado

56.000

Regresso

F de significncia

3,1E-14

Resduo
Total

59

88.480

Considere as afirmaes abaixo, derivadas da tabela da ANOVA


I - O coeficiente de determinao mostra que o modelo proposto explica
aproximadamente 63% da variabilidade total.
II O valor da estatstica Fcalculado 100, e a concluso do teste que a
varivel valor patrimonial significativa, isto, deve-se rejeitar a hiptese nula
(H0 : b = 0) .

35
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

III - Dado que, ao incorporar no modelo a varivel retorno por ao (%), a


varincia residual passou a ser 360 reais2, pode-se concluir que, perdendo um
grau de liberdade, reduz-se a soma dos resduos quadrticos em 200
unidades.
Est(o) correta(s) a(s) afirmao(es)
A) I apenas.
B) I e II, apenas.
C) I e III, apenas.
D) II e III, apenas.
E) I, II e III.
Resoluo
Vimos que a ANOVA do modelo de regresso linear simples pode ser resumida
pela tabela a seguir.

Fonte de
Variao

Soma de
Graus de Quadrado
Quadrados Liberdade
Mdio

Regresso

SQR

SQR/1

Residual

SQE

n2

SQE/(n2)

Total

SQT

n1

SQR / 1
SQE /( n 2) F1,n-2,

A tabela acima ser usada na anlise das afirmaes.


Afirmao I:
R2 = SQR/SQT
SQR/1 = SQR = 56.000 R2 = 56.000/88.480 0,63
Portanto, correto afirmar que O coeficiente de determinao mostra que o
modelo proposto explica aproximadamente 63% da variabilidade total.
Afirmao II:
Fcalculado =

SQR / 1
SQE /( n 2)

SQE = SQT SQR = 88.480 56.000 = 32.480


36
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

n1 = 59 n = 60
Fcalculado =

56 .000
SQR / 1
=
= 100
SQE /( n 2) 32.480 / 58

Logo correta a afirmao II.


Afirmao III:
O modelo inicial do tipo Y = + X + , em que temos 1 varivel
independente ou regressor (X) e k = 2 parmetros a serem estimados ( e ).
Ao incorporar no modelo a varivel retorno por ao (R), passamos a ter um
modelo do tipo Y = + X + R + (modelo de regresso linear mltipla), com
2 variveis explanatrias (X e R) e k = 3 parmetros a serem estimados (,
e ).
Vimos que a varincia residual (varincia dos erros aleatrios i) para o modelo
de RLS dada por

e
=

2
i

n2

= SQE/(n 2).

Logo,

2 =

32.480
= 560 reais2
58

para o modelo inicial Y = + X + .


Suponha que, ao incorporar no modelo a varivel R (retorno por ao), a
varincia residual passou a ser 360 reais2. Ento, pode-se concluir que a
introduo de mais uma varivel independente reduziu a soma dos resduos
quadrticos em 200 unidades. Note que a banca considerou a afimao correta
com base neste raciocnio.
Entretanto, o enunciado contm a seguinte frase:
Considere as afirmaes abaixo, derivadas da tabela da ANOVA
Ora, parte da afirmao III (aquela que diz respeito hiptese de reduo da
varincia residual) no foi derivada da tabela da ANOVA. Trata-se de uma
inconsistncia lgica do enunciado. Por esse motivo, eu teria marcado a opo
B (I e II, apenas).
37
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Nota: a varincia residual do modelo de Regresso Linear Mltipla (RLM)


Y = + X + R +
dada por (memorize para a prova!)

2
i

2
RLM
=

nk

= SQE/(n k),

em que k denota o nmero de parmetros do modelo (k = 3 para o modelo


com 3 regressores).
GABARITO: E
Exemplo (SUSEP/ESAF/2010) A partir de uma amostra aleatria (X1 ,Y1),
(X2 ,Y2),..., (X20 ,Y20) foram obtidas as estaststicas:
mdias X = 12,5 e Y = 19, varincias amostrais s x2 = 30 e s 2y = 54 e covarincia
S xy = 36 .

Qual a reta de regresso estimada de Y em X?


A) Yi = 19 + 0,667 X i
B) Yi = 12,5 + 1,2 X i
C) Yi = 4 + 1,2 X i
D) Yi = 19 + 1,2 X i
E) Yi = 80 + 22,8 X i
Resoluo
A reta a estimar
Yi = 1 + 2 X i ,

em que o parmetro 2 (estimativa da declividade) dado por

S
2 = xy =
S xx

i =1

( X i X )(Yi Y )

i =1

(Xi X )

Cov( X , Y )
,
Var ( X )

e o parmetro 1 (estimativa do intercepto) por


38
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

1 = Y 2 X .
Observe que estamos usando uma notao diferente do enunciado: a
quantidade Sxy definida acima no a covarincia entre X e Y.
Logo, 2 = 36 / 30 = 1,2 e 1 = 19 1,2 12,5 = 4,0 . Deste modo, a reta de regresso

estimada
de Y em X Yi = 4 + 1,2 X i .
GABARITO: C
Exemplo (SUSEP/ESAF/2010) Com os dados da questo anterior,
determine o valor da estatstica F para testar a hiptese nula de que o
coeficiente angular da reta do modelo de regresso linear simples de Y em X
igual a zero.
A) 144
B) 18
C) 36
D) 72
E) 48
Resoluo
Sabemos que F =

SQR / 1
.
SQE /( n 2)

SQR = 22 S xx = 1,2 2 [(n 1) s x2 ] = 1,44[19 30] = 820,80


SQT = S yy = ( n 1) s y2 = 19 54 = 1.026
SQE = SQT SQR = 1.026 820 ,80 = 205,20

Assim,
F=

820 ,80
= 72
205,20 / 18

GABARITO: D

39
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Resumo
1 n
( xi x )( yi y ) .
n 1 i =1

- Covarincia: Cov ( X , Y ) =

Cov( X , Y )
=
- Coef. de correlao: r =
DP( X ).DP(Y )

i =1

i =1

( xi x )( yi y )

( xi x ) 2

i =1

( yi y ) 2

S xy
S xx S yy

- Somas de Quadrados:

( x )( y )

S xy = i =1 xi yi

1
n

1
S xx = i =1 x
n

( x )

1
S yy = i =1 y
n

( y )

2
i

2
i

i =1

i =1

i =1

i =1

- O COEFICIENTE DE CORRELAO ADIMENSIONAL


- CORRELAO NO CAUSALIDADE
- A CORRELAO MEDE APENAS A RELAO LINEAR
- Regresso Linear Simples:
modelo Y = + X + , em que o intercepto, a declividade e
denota a componente aleatria da variao de Y ( uma varivel aleatria).
Funo de Regresso Populacional (FRP): E (Y | x ) = + X .
Funo de Regresso Amostral (FRA) y = a + bx , em que y denota os valores
dados pela reta estimativa, a a estimativa do parmetro , e b a
estimativa do parmetro .
b=

S xy
S xx

Cov( X , Y )
DP(Y )
=r
Var ( X )
DP( X )

a = y bx
SQT = SQR + SQE
40
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima
n

SQT = S yy = ( yi y ) 2 a soma dos quadrados total (variao total)


i =1

SQE = ( yi y i ) 2 a soma dos quadrados dos erros (variao residual)


i =1

SQR = ( y i y ) 2 a soma dos quadrados da regresso (variao explicada)


i =1

variao total = variao residual +variao explicada


2

S xy
SQR
SQE
=1
=
= r2
R da regresso com intercepto: R =
SQT
SQT S xx S yy
2

b ~ N ,
S xx

xi2
a ~ N , var(b)

SQT = ( yi y ) 2 = S yy
SQR = ( y i y ) 2 = b 2 S xx
SQE = ( yi y i ) 2 = ei2 , em que os e i so os resduos do modelo. Os resduos

so realizaes do erro aleatrio do modelo.


Regresso com intercepto: SQE = ( yi y ) 2 b 2 ( xi x ) 2
Varincia dos resduos do modelo de RLS:
2

e
=

2
i

n2

SQE
a estimativa
n2

da varincia de .
Erro padro dos resduos do modelo de RLS: EP (ei ) = = 1 r 2 Y
Estatstica t para testar se h regresso (H0: = 0): t =

b
2
.
, em que s b2 =
sb
S xx

Intervalo de confiana para : b tc sb .


41
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Estatstica F: F =

SQR
SQE /(n 2)

- ANOVA para o modelo de RLS:


Fonte de
Variao

Soma de
Graus de
Quadrados Liberdade

Mdia dos
quadrados

Regresso

SQR

SQR/1

Residual

SQE

n-2

SQE/(n-2)

Total

SQT

n-1

SQR / 1
SQE /( n 2)

F1,n-2,

- Regresso sem o intercepto: Y = X + :

x y
b=
x
i

2
i

, var(b) =

2
i

e
=

2
i

n 1

SQE = ei2 = yi2 b 2 xi2


R

y
=1

2
i

b 2 xi2
SQT

y
=1

2
i

b 2 xi2
S yy

y b x
=1
y ( y ) / n
2
i

2
i

2
i

R2 r 2

- Se admitirmos os erros aleatrios do modelo de regresso distribudos


normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos.

42
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Exerccios de Fixao

(Analista Judicirio TRT17/CESPE-UnB/2009) Um estudo estatstico foi


realizado para avaliar a relao entre o logaritmo do valor pago em um
processo judicial de natureza trabalhista (Y) e o correspondente logaritmo do
valor da causa (X). Para o estudo, foram selecionados ao acaso 301 processos
judiciais trabalhistas. Observando-se o par de valores (Xk,Yk) do k-simo
processo, k = 1, 2, ..., 301, foram obtidos os resultados apresentados na
tabela a seguir.
mdia amostral de X (em ln R$)

11,60

desvio padro amostral de X (em ln R$)


mdia amostral de Y (em ln R$)

2,40
11,40

desvio padro amostral de Y (em ln R$)

2,80

correlao linear de Pearson entre X e Y

0,53

A partir dessas informaes, julgue os prximos itens, considerando um


modelo de regresso linear simples na forma Yk = a + bX k + ek , em que a e b so
os coeficientes do modelo, {ek } representa uma sequncia independente de
erros aleatrios normais com mdia zero e varincia 2 .
1. A estimativa de mxima verossimilhana para o coeficiente b superior a
0,5 e inferior a 0,7.
2. A estimativa de mnimos quadrados ordinrios do coeficiente a superior a
4.
3. O valor da estatstica R2 ajustado superior a 0,30.
4. O valor da estatstica F para testar b = 0 maior que 50.
5. O erro padro para a estimativa do coeficiente b menor que 0,04.
6. A estimativa da varincia 2 menor que 7.
7. A covarincia entre X e Y maior que 3.
8. A varincia da reta ajustada Yk = a + bX k , em que a e b so as estimativas
de mnimos quadrados ordinrios e 0 < X k < 10 , menor ou igual a 2 / 301 .

43
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

9. Considerando que o coeficiente a seja nulo, tem-se uma reta de regresso


que passa pela origem, na forma Yk = bX k + ek . Nesse caso, a estimativa de
mnimos do coeficiente b ser maior que 0,90.
10. (AFRFB/ESAF/2009) Na anlise de regresso linear simples, as
estimativas e dos parmetros e da reta de regresso podem ser
obtidas pelo mtodo de Mnimos Quadrados. Nesse caso, os valores dessas
estimativas so obtidos atravs de uma amostra de n pares de valores Xi Yi
com (i =1, 2, ...., n), obtendo-se: Y i= + X i , onde Y i a estimativa de Yi = + Xi.
Para cada par de valores Xi Yi com (i =1, 2, ..., n) pode-se estabelecer o desvio ou
resduo aqui denotado por ei entre a reta de regresso Yi e sua estimativa
Y i . Sabe-se que o Mtodo de Mnimos Quadrados consiste em adotar como
estimativas dos parmetros e os valores que minimizam a soma dos
quadrados dos desvios ei. Desse modo, o Mtodo de Mnimos Quadrados
consiste em minimizar a expresso dada por:
n

(A)

[Y ( X )]

i =1
n

(B)

[Y X ]

i =1
n

(C)

[Y ( X )]

i =1
n

(D)

[Y

2
Yi ]

( X i ) 2 ]

i =1
n

(E)

[Y

i =1

11. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) A partir de uma


amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se
22

22

i =1

(X

i =1

22

(Y Y )
i

i =1

22

Yi = 286

X i = 440
2

= 1.690

X ) 2 = 850 ,

i =1

22

(X

X )(Yi Y ) = 1.105

i =1

Obtenha a reta de regresso linear de Y em X.


(A) Yi = 13 + 0,65 X i
(B) Yi = 13 + 1,3 X i
44
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

(C) Yi = 20 + 0,65 X i
(D) Yi = 20 + 2 X i
(E) Yi = 13 + 1,3 X i
12. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) Com os dados da
questo anterior, calcule o valor mais prximo do coeficiente de determinao
R2 da regresso linear de X em Y.
(A) 0,65
(B) 0,81
(C) 0,85
(D) 0,91
(E) 0,88
13. (MDIC/ESAF/2012) Considere os valores da varivel aleatria Y
observados para determinados valores da varivel X.
X
Y

1
9

2
9

3
6

4
4

5
16

6
9

7
10

8
8

9
19

10
16

11
26

Obtenha a expresso mais prxima da reta de regresso de Y em X.


(A) Yi = 6 + 1,4Xi
(B) Yi = 3,6 + 0,714Xi
(C) Yi = 12 + 0,714Xi
(D) Yi = 12 + 1,4Xi
(E) Yi = 3,6 + 1,4Xi
14. (MDIC/2012/ESAF) Com os dados da questo 13, calcule o valor mais
prximo da variao de Y explicada pela regresso.
(A) 250,6
(B) 154
(C) 110
(D) 424
(E) 215,6
15. (IBGE/Cesgranrio/2010/Adaptada) Dentre os itens abaixo, identifique
as premissas bsicas para o modelo de regresso.
45
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

I.

Linearidade do fenmeno medido

II.

Varincia no constante dos termos de erro (heterocedasticidade)

III. Normalidade dos erros


IV. Erros correlacionados
V.

A covarincia entre dois erros aleatrios distintos no nula.

So premissas APENAS os itens


(A) I e III.
(B) II e III.
(C) I, III e IV.
(D) I, III e V.
(E) I, II, III e V.
16. (IBGE/Cesgranrio/2010) Ajustou-se um modelo de regresso linear
simples a dados provenientes de alguns experimentos executados por um
fabricante de concreto, com o objetivo de determinar de que forma e em que
medida a dureza de um lote de concreto depende da quantidade de cimento
usada para faz-lo. Quarenta lotes de concreto foram feitos com quantidades
diferentes de cimento na mistura, e a dureza de cada lote foi medida aps sete
dias. Sabendo-se que
n

SQR = Yi Y
i =1

= 5.275,2

SQE = Yi Yi

= 366,6

i =1

o coeficiente de determinao , aproximadamente,


(A) 0
(B) 0,064
(C) 0,5
(D) 0,94
(E) 14,38
17. (Analista Judicirio TJ-RO/CESPE-UnB/2012) Com respeito ao
modelo de regresso linear simples, assinale a opo correta.
(A) O parmetro de inclinao da reta igual tangente do ngulo formado
entre a reta e o eixo Oy.
(B) A inclinao da reta proporcional correlao entre a varivel resposta e
a varivel preditora.
46
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

(C) Se o modelo linear estiver bem ajustado, a correlao entre o resduo do


modelo e a varivel resposta deve estar prxima de -1.
(D) Se o intercepto do modelo for nulo, a varivel resposta assume o valor
zero quando a varivel preditora for igual ao inverso da inclinao da reta.
(E) O parmetro de inclinao da reta igual ao cosseno do ngulo formado
entre a reta e o eixo Ox.

47
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

4.

Gabarito

1C
2C
3E
4C
5E
6C
7C
8E
9C
10 B
11 E
12 C
13 E
14 E
15 A
16 D
17 B

48
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

5.

Resoluo dos Exerccios de Fixao

(Analista Judicirio TRT17/CESPE-UnB/2009) Um estudo estatstico foi


realizado para avaliar a relao entre o logaritmo do valor pago em um
processo judicial de natureza trabalhista (Y) e o correspondente logaritmo do
valor da causa (X). Para o estudo, foram selecionados ao acaso 301 processos
judiciais trabalhistas. Observando-se o par de valores (Xk,Yk) do k-simo
processo, k = 1, 2, ..., 301, foram obtidos os resultados apresentados na
tabela a seguir.
mdia amostral de X (em ln R$)

11,60

desvio padro amostral de X (em ln R$)


mdia amostral de Y (em ln R$)

2,40
11,40

desvio padro amostral de Y (em ln R$)

2,80

correlao linear de Pearson entre X e Y

0,53

A partir dessas informaes, julgue os prximos itens, considerando um


modelo de regresso linear simples na forma Yk = a + bX k + ek , em que a e b so
os coeficientes do modelo, {ek } representa uma sequncia independente de
erros aleatrios normais com mdia zero e varincia 2 .
1. A estimativa de mxima verossimilhana para o coeficiente b superior a
0,5 e inferior a 0,7.
Resoluo
Dados:

X = 11,60
s x = X = 2,40

Y = 11,40
s y = Y = 2,80

r = 0,53

Modelo de Regresso Linear Simples:

Yk = a + bX k + k
em que a o intercepto, b a declividade e {ek } representa uma sequncia
independente de erros aleatrios normais com mdia zero e varincia 2 .
49
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Reta estimativa: E (Yk | X k ) = Yk = a + bX k , em que Yk denota os valores dados pela


reta estimativa, a a estimativa do coeficiente a , e b a estimativa do
coeficiente b .

Se admitirmos os erros aleatrios do modelo de regresso


distribudos normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos.
Clculo da estimativa b :

S
Cov( X , Y )
b = xy =
S xx
Var ( X )

r=

Cov( X , Y )
= 0,53
DP( X ) DP(Y )

Cov ( X , Y ) = 0,53 2, 40 2,80 = 3,56

Cov( X , Y ) 0,53 2,40 2,80


b =
=
0,62
Var ( X )
2,40 2,40
Item correto.
GABARITO: C
2. A estimativa de mnimos quadrados ordinrios do coeficiente a superior a
4.
Resoluo
Estimativa de mnimos quadrados ordinrios do coeficiente a :
a = Y bX = 11,40 0,62 11,60 4,21 superior a 4

Item correto.
GABARITO: C
3. O valor da estatstica R2 ajustado superior a 0,30.
Resoluo
50
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

O R2 ajustado ser definido na aula sobre regresso mltipla. Por ora, voc
somente precisa saber que o R2 igual ao R2 ajustado para o modelo de RLS.
Relao entre R2 (coeficiente de determinao) e r (coeficiente de correlao):

R2 = r 2
Logo,

R 2 = r 2 = 0,532 0,28 inferior a 0,30


Item errado.
GABARITO: E
4. O valor da estatstica F para testar b = 0 maior que 50.
Resoluo

F=

SQR
SQE /(n 2)

SQR = b 2 S xx = 0,62 2 S xx
S xx = ( n 1) x2 , em que x2 = s x2 .
S xx = ( n 1) x2 = 300 2,4 2 = 1.728 SQR = 0,622 1.728 = 664,24
SQT = SQR + SQE

SQT = S yy

S yy = SQT = (n 1) y2 , em que y2 = s 2y .

SQT = 300 2,82 = 2.352,00 SQE = SQT SQR = 2.352 ,00 664 ,24 = 1.687 ,76
Logo, F =

664,24
= 664,24 / 5,64 = 117,68 maior que 50 (item certo)
1.687,76 / 299

GABARITO: C
5. O erro padro para a estimativa do coeficiente b menor que 0,04.
51
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Resoluo
Sabemos que a distribuio do estimador da declividade b normal:

b ~ N ,
S xx

2
Logo o Erro Padro (EP) ou desvio padro de b EP (b) =
.
S xx
Mas no sabemos o valor da varincia 2 do erro aleatrio do modelo. Neste
caso, deve-se calcular uma estimativa do erro padro:
EPest (b) =

2
S xx

em que a estimativa da varincia (ou varincia dos resduos)

2 =

Ento, EPest (b) =

SQE 1.687,76
=
= 5,64
n2
299

5,64
= 0,06 maior que 0,04 (item errado)
1.728

GABARITO: E
6. A estimativa da varincia 2 menor que 7.
Resoluo
Varincia residual:

2 =

SQE 1.687,76
=
= 5,64 menor que 7 (item certo)
n2
299

GABARITO: C
7. A covarincia entre X e Y maior que 3.
Resoluo
Dados: r = 0,53 , s x = 2,40 , e s y = 2,80 .
52
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

Clculo da covarincia (amostral) entre X e Y:


r=

s xy
= 0,53
sx s y

s xy = 0,53 s x s y s xy = 0,53 2,40 2,80 = 3,56 maior que 3

Item certo.
GABARITO: C
8. A varincia da reta ajustada Yk = a + bX k , em que a e b so as estimativas
de mnimos quadrados ordinrios e 0 < X k < 10 , menor ou igual a 2 / 301 .
Resoluo
A varincia dos resduos dada por

2 =

SQE
n2

A afirmativa A varincia da reta ajustada Yk = a + bX k (..) menor ou igual a

2 / 301 inconsistente. Item errado.


GABARITO: E
9. Considerando que o coeficiente a seja nulo, tem-se uma reta de regresso
que passa pela origem, na forma Yk = bX k + ek . Nesse caso, a estimativa de
mnimos do coeficiente b ser maior que 0,90.
Resoluo
Quando a reta de regresso passa pela origem (regresso sem intercepto),, a
estimativa de mnimos quadrados do coeficiente b dada por

b =

Precisamos calcular as quantidades

xy
x

xy

Sabemos que

53
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

S xy = xy

1
( x )( y ) S xy xy =
n
n

S xx = x 2

1
( x )2 S xx x2 =
n
n

S xy

As aproximaes

xy e

x
n

xy x y = xy XY
n

n n

x x

n n

x
n

X2

S xx
x2 podem ser usadas porque n = 301 um
n

nmero grande
Logo,
3,56 =

2,40

xy 11,60 11,40
n

x
=
n

11,60
2

xy = 128,96

x
n

= 140,32

Finalmente,
xy
b = 2 =
x

xy

n = 128,96 = 0,92 maior que 0,90 (item certo)


x 2 140,32
n

GABARITO: C
10. (AFRFB/ESAF/2009) Na anlise de regresso linear simples, as
estimativas e dos parmetros e da reta de regresso podem ser
obtidas pelo mtodo de Mnimos Quadrados. Nesse caso, os valores dessas
estimativas so obtidos atravs de uma amostra de n pares de valores Xi Yi
com (i =1, 2, ...., n), obtendo-se: Y i= + X i , onde Y i a estimativa de Yi = + Xi.
Para cada par de valores Xi Yi com (i =1, 2, ..., n) pode-se estabelecer o desvio ou
resduo aqui denotado por ei entre a reta de regresso Yi e sua estimativa
Y i . Sabe-se que o Mtodo de Mnimos Quadrados consiste em adotar como
estimativas dos parmetros e os valores que minimizam a soma dos
quadrados dos desvios ei. Desse modo, o Mtodo de Mnimos Quadrados
consiste em minimizar a expresso dada por:
n

(A)

[Y ( X )]

i =1

54
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima
n

(B)

[Y X ]

i =1
n

(C)

[Y ( X )]

i =1
n

(D)

[Y

2
Yi ]

( X i ) 2 ]

i =1
n

(E)

[Y

i =1

Resoluo
A questo forneceu todas as informaes necessrias para a resoluo.
Pelo Mtodo dos Mnimos Quadrados temos que minimizar a soma dos
quadrados das diferenas entre os valores de Yi e as respectivas estimativas
, por meio da reta de regresso. Logo teramos:
Y
i

[Y Y ] = [Y ( + X )] = [Y X ]
n

i =1

i =1

i =1

Logo alternativa correta a B.


GABARITO: B
11. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) A partir de uma
amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se
22

22

X i = 440
i =1

(X

i =1

22

(Y Y )
i

i =1

22

Yi = 286
2

= 1.690

X ) 2 = 850 ,

i =1

22

(X

X )(Yi Y ) = 1.105

i =1

Obtenha a reta de regresso linear de Y em X.


(A) Yi = 13 + 0,65 X i
(B) Yi = 13 + 1,3 X i
(C) Yi = 20 + 0,65 X i
(D) Yi = 20 + 2 X i
55
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

(E) Yi = 13 + 1,3 X i
Resoluo
Modelo de regresso linear simples:
Y = + X + ,

em que o intercepto, a declividade e denota a componente aleatria


da variao de Y ( uma varivel aleatria).
Y = a + bX (reta estimativa),

em que Y denota os valores dados pela reta estimativa, a a estimativa do


parmetro , e b a estimativa do parmetro .
b=

S xy
S xx

a = y bx = mdia de Y subtrada da declividade x mdia de X

Dados:
22

- S xy = ( X i X )(Yi Y ) = 1.105
i =1
22

- S xx = ( X i X ) 2 = 850
i =1

1 22
286
Yi =
= 13

n i =1
22
1 22
440
- mdia de X = X = X i =
= 20
n i =1
22

- mdia de Y = Y =

Logo,

b=

S xy
S xx

1.105
= 1,3
850

a = y bx = 13 1,3 20 = 13 26 = 13

Reta estimativa: Y = a + bX i = 13 + 1,3 X i (opo E).


GABARITO: E
56
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

12. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) Com os dados da


questo anterior, calcule o valor mais prximo do coeficiente de determinao
R2 da regresso linear de X em Y.
(A) 0,65
(B) 0,81
(C) 0,85
(D) 0,91
(E) 0,88
Resoluo
A correlao entre as variveis aleatrias X e Y, denotada por (X,Y), dada
por:

( X ,Y ) =

Cov ( X , Y )
= covarincia/(desvio padro de X . desvio padro de Y)
XY

O mdulo da correlao sempre menor ou igual a 1: -1 (X,Y) 1.


A correlao amostral ou coeficiente de correlao linear de Pearson (r)
o estimador da correlao (X,Y), sendo dada por:
22

S xy
Cov( X , Y )
=
=
r=
DP( X ) DP(Y ) S xx S yy

(X

X )(Yi Y )

i =1

22

( X i X )2
i =1

22

(Y Y )

1.105
1.105
=
= 0,92
850 1.690 29,15 41,11

i =1

R 2 = r 2 = 0,922 = 0,85 .
NOTA: no confunda correlao amostral r com correlao (X,Y)! A primeira
uma estimativa da segunda. A correlao um momento estatstico. S
conseguimos calcular a correlao (X,Y) quando conhecemos a distribuio
conjunta de probabilidade de X e Y, ou seja, quando sabemos quem a funo
f(X,Y).
GABARITO: C

57
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

13. (MDIC/ESAF/2012) Considere os valores da varivel aleatria Y


observados para determinados valores da varivel X.
X
Y

1
9

2
9

3
6

4
4

5
16

6
9

7
10

8
8

9
19

10
16

11
26

Obtenha a expresso mais prxima da reta de regresso de Y em X.


(A) Yi = 6 + 1,4Xi
(B) Yi = 3,6 + 0,714Xi
(C) Yi = 12 + 0,714Xi
(D) Yi = 12 + 1,4Xi
(E) Yi = 3,6 + 1,4Xi
Resoluo
Seja Y a varivel dependente e X a varivel suposta sem erro, ou seja, no
aleatria. A Regresso Linear Simples (RLS) pressupe que seja adotado o
modelo
Y = + X + ,

em que o intercepto, a declividade e denota a componente aleatria


da variao de Y ( o erro aleatrio).
A reta estimativa do modelo de RLS dada pela frmula

y i = a + bxi
em que yi denota os valores dados pela reta estimativa, a a estimativa do
parmetro , e b , tambm denominado coeficiente de regresso linear, a
estimativa do parmetro .
Frmulas necessrias para estimar a reta de regresso de Y em X pelo
mtodo dos mnimos quadrados:
S xy
Estimativa da declividade: b =
S xx
Estimativa do intercepto: a = y bx


Soma dos produtos: S xy = xi yi xi yi
n i i
i

1
Soma dos quadrados de X: S xx = xi xi
n i
i

58
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

1
Soma dos quadrados de Y: S yy = yi yi
n i
i

1
Mdia de Y: y = yi
n i
1
Mdia de X: x = xi
n i

A construo da tabela a seguir facilita os clculos da questo:


X

10

11

X=66

16

10

19

16

26

Y=132

XY

18

18

16

80

54

70

64

171

160

286

XY=946

X2

16

25

36

49

64

81

100

121

X2=506

Assim,

y=

1
132
yi =
= 12

n i
11

x=

1
66
=6
xi =

11
n i

1
66 132
S xy = xi yi xi yi = 946
= 154
n i i
11
i

662
1
= 110
Sxx = x i x i = 506
11
n i
i

b=

S xy
S xx

154
= 1,40
110

a = y bx = 12 1, 4 6 = 3,60

y i = a + bxi = 3,6 + 1,4 xi

GABARITO: E
14. (MDIC/2012/ESAF) Com os dados da questo 13, calcule o valor mais
prximo da variao de Y explicada pela regresso.
59
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

(A) 250,6
(B) 154
(C) 110
(D) 424
(E) 215,6
Resoluo
A Soma dos Quadrados da Regresso (SQR) nos d o valor da variao de Y
explicada pela regresso:
n

S xy2

i =1

S xx

SQR = ( y i y ) 2 = b 2 S xx = bS xy =
SQR = bS xy = 1,4 154 = 215,6

GABARITO: E
15. (IBGE/Cesgranrio/2010/Adaptada) Dentre os itens abaixo, identifique
as premissas bsicas para o modelo de regresso.
I.

Linearidade do fenmeno medido

II.

Varincia no constante dos termos de erro (heterocedasticidade)

III. Normalidade dos erros


IV. Erros correlacionados
V.

A covarincia entre dois erros aleatrios distintos no nula.

So premissas APENAS os itens


(A) I e III.
(B) II e III.
(C) I, III e IV.
(D) I, III e V.
(E) I, II, III e V.
Resoluo
Anlise dos itens:
I) Premissa verdadeira, pois parte-se do princpio de que a relao entre as
variveis independente e dependente linear.
60
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

II) Falsa. A varincia


(homocedasticidade).

dos

termos

de

erro

deve

ser

constante

III) Verdadeira. Assumimos que os erros aleatrios so bem modelados pela


distribuio normal.
IV) Falsa. A covarincia entre erros distintos deve ser nula e isto implica que
os erros no devem ser correlacionados.
V) Falsa, conforme explicado acima.
GABARITO: A
16. (IBGE/Cesgranrio/2010) Ajustou-se um modelo de regresso linear
simples a dados provenientes de alguns experimentos executados por um
fabricante de concreto, com o objetivo de determinar de que forma e em que
medida a dureza de um lote de concreto depende da quantidade de cimento
usada para faz-lo. Quarenta lotes de concreto foram feitos com quantidades
diferentes de cimento na mistura, e a dureza de cada lote foi medida aps sete
dias. Sabendo-se que
n

SQR = Yi Y
i =1

= 5.275,2

SQE = Yi Yi

= 366,6

i =1

o coeficiente de determinao , aproximadamente,


(A) 0
(B) 0,064
(C) 0,5
(D) 0,94
(E) 14,38
Resoluo
R2 = 1 - SQE/SQT
em que SQE a variao residual (soma dos quadrados dos erros) e SQT a
variao total (soma dos quadrados total). Vimos que
SQT = SQE + SQR = 366,6 + 5.275,2 = 5.641,8
Logo,
61
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

R2 = 1 - 366,6/5.641,8 0,94
GABARITO: D
17. (Analista Judicirio TJ-RO/CESPE-UnB/2012) Com respeito ao
modelo de regresso linear simples, assinale a opo correta.
(A) O parmetro de inclinao da reta igual tangente do ngulo formado
entre a reta e o eixo Oy.
(B) A inclinao da reta proporcional correlao entre a varivel resposta e
a varivel preditora.
(C) Se o modelo linear estiver bem ajustado, a correlao entre o resduo do
modelo e a varivel resposta deve estar prxima de -1.
(D) Se o intercepto do modelo for nulo, a varivel resposta assume o valor
zero quando a varivel preditora for igual ao inverso da inclinao da reta.
(E) O parmetro de inclinao da reta igual ao cosseno do ngulo formado
entre a reta e o eixo Ox.
Resoluo
Anlise das opes
(A) A afirmativa correta seria: o parmetro de inclinao da reta igual
tangente do ngulo formado entre a reta e o eixo Ox. Segue a justificativa.
Seja o modelo de RLS
y = + x + ,
em que o intercepto, a declividade (coeficiente angular ou parmetro
de inclinao) da reta de regresso e denota a componente aleatria da
variao de y. O parmetro de inclinao da reta representa a variao em
E(y|x) para uma variao de 1 unidade em x. Algebricamente,

E ( y | x )
= tan( )
x

em que denota o ngulo formado entre a reta de regresso e o eixo Ox.


(B) A estimativa do parmetro de inclinao da reta dada por

= b =

Cov( X , Y )
Var ( X )
62

www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 09 Inferncia no modelo de regresso
Prof. Alexandre Lima

como

r=

Cov( X , Y )
Cov ( X , Y ) = rDP ( X ) DP (Y )
DP( X ) DP(Y )

DP( X ) DP(Y )
rDP( X ) DP(Y )
DP(Y )
= r
= r
2
Var ( X )
DP( X )
DP ( X )

ento

e, conclui-se que a inclinao da reta proporcional varivel r, que


representa a correlao entre a varivel resposta (y) e a varivel preditora (x).
Opo correta.
(C) O resduo ( ei ) corresponde diferena entre o valor observado da varivel
dependente ( yi ) e seu respectivo valor estimado ( yi ), ou seja,
ei = yi yi = yi a bxi . No correto afirmar que se o modelo linear estiver bem
ajustado, a correlao entre o resduo do modelo e a varivel resposta deve
estar prxima de -1, pois sabe-se que a correlao entre o resduo do modelo
() e a varivel resposta (y) nula.
(D) Se o intercepto do modelo for nulo, a reta de regresso
E ( y | x) = x .

Neste caso, a varivel resposta ( y ) assume o valor unitrio quando a varivel


preditora (x) for igual ao inverso da inclinao da reta:

1
= 1 = y
b

Opo incorreta.
(E) Opo incorreta, pois o parmetro de inclinao da reta igual tangente
do ngulo formado entre a reta e o eixo Ox.
GABARITO: B
At a prxima aula. Bons estudos!
Alexandre Lima
alexandre@pontodosconcursos.com.br

63
www.pontodosconcursos.com.br | Prof. Alexandre Lima

También podría gustarte