Aula 09

Conhecimentos Especficos Mtodos Quantitativos Anatel
Aula 09 Inferncia no modelo de regresso

Prof. Alexandre Lima
Aula 09
Sumrio
1
Inferncia no Modelo de Regresso Linear Simples ................................................ 2

1.1
Introduo ........................................................................................................................ 2
1.2
Valores Esperados dos Estimadores ...................................................................... 4
1.3
Varincias e Covarincias dos Estimadores ........................................................ 5
1.4
Distribuies Amostrais .............................................................................................. 6
1.5
Teorema de Gauss-Markov........................................................................................ 9
1.6
Coeficiente de Determinao .................................................................................... 9
1.7
Relaxamento dos Pressupostos do Modelo ....................................................... 13
1.8
Regresso sem o Intercepto ................................................................................... 15
1.8.1
1.9
Coeficiente de Determinao da Regresso sem o Intercepto ...................................... 17

Intervalos de Confiana ............................................................................................ 20
1.10
Teste de Hipteses.................................................................................................. 25
1.11
Anlise de Varincia ............................................................................................... 28
Resumo.................................................................................................................................... 40
Exerccios de Fixao ......................................................................................................... 43
4. Gabarito .................................................................................................................................. 48
5. Resoluo dos Exerccios de Fixao ........................................................................... 49
1
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Inferncia no Modelo de Regresso Linear Simples
1.1
Introduo
A anlise de regresso estuda a dependncia de uma varivel, chamada de

dependente, em relao a outras variveis, chamadas de explanatrias (ou
variveis independentes ou regressores), com o objetivo de estimar valores da
primeira, dados os valores das segundas.
J estudamos o modelo de Regresso Linear Simples (RLS)
(1)
Yi = E (Y | X i ) + i = + X i + i ,
i = 1, 2,...n
em que o intercepto, a declividade e denota a componente aleatria

da variao de Y ( uma varivel aleatria). Observe que Y varivel
dependente e X o regressor ou preditor. A funo E (Y | X i ) Funo de
Regresso Populacional (FRP).
Vimos que a reta estimativa (ou Funo de Regresso Amostral (FRA)) dada
por
y = a + bx
em que y denota os valores dados pela reta estimativa, a a estimativa do

parmetro , e b , tambm denominado coeficiente de regresso linear, a
estimativa do parmetro .
Existem diversos mtodos de estimao da reta de regresso. O mais
empregado o mtodo dos mnimos quadrados, em que a reta a ser
adotada dever ser aquela que torna mnima a soma dos quadrados das
distncias da reta aos pontos experimentais. Em outras palavras, devemos
procurar a reta para a qual se consiga minimizar a soma dos quadrados
n
dos resduos i=1 ei2 , em que ei = i = yi y i = yi a bxi denota o i-simo resduo.
A idia central desse procedimento simplesmente a de minimizar a variao
residual em torno da reta estimativa.
Aprendemos que os estimadores a (do intercepto ) e b (da declividade )
so dados por
(2)
S xy
b =
S xx
a = y bx
2

em que
(3)
S xy = ( xi x )( yi y ) = xi yi
i
xi yi ,
n i
i
e
(4)
S xx = ( xi x ) = xi xi
n i
i
i
Nota: A estimativa da declividade tambm pode ser calculada pela frmula

b=
Cov ( X , Y )
Var ( X )
em que Cov ( X , Y ) a covarincia amostral e Var ( X ) a varincia amostral de

X. No faa confuso com a notao: na aula 1 deste curso, a covarincia
amostral foi denotada por s xy e a varincia amostral por s x2 . A estimativa do
coeficiente angular tambm pode ser calculada pela frmula
b=r
DP(Y )
DP( X )
em que r denota o coeficiente de correlao de Pearson, DP (Y ) o desvio

padro amostral de Y e DP ( X ) o desvio padro amostral de X.
Para chegar equao acima, basta desenvolver a penltima frmula:
Cov( X , Y )
b=
. Sabemos que
Var( X )
r=
Cov( X , Y )
Cov ( X , Y ) = rDP ( X ) DP (Y )
DP( X ) DP(Y )
b=
DP( X ) DP(Y )
rDP( X ) DP(Y )
DP(Y )
= r
= r
2
Var ( X )
DP( X )
DP ( X )
ento
3

Interpretao Geomtrica do Intercepto e da Declividade

O intercepto o valor estimado de y quando x = 0, e representa a variao
estimada de y quando x varia uma unidade, conforme ilustrado pela figura a
seguir.
Algebricamente,
E ( y | x )
= tan( )
x
em que denota o ngulo formado entre a reta de regresso e o eixo Ox.

1.2
Valores Esperados dos Estimadores
Pode-se demonstrar que os estimadores a e b de (2) tm mdia dadas por

(5)
E (a) =
E (b) =
Logo, os estimadores a e b, que tambm costumam ser denotados por e

, so justos (ou no viesados ou no tendenciosos), pois suas mdias
so iguais aos verdadeiros valores dos parmetros. Isso quer dizer que
se coletarmos vrias amostras de iguais tamanhos, e aplicarmos as equaes
de (2), os valores mdios das estimativas encontradas de a e b tendero a e
, respectivamente.
4

O resultado acima verdadeiro somente quando so vlidos os pressupostos

do modelo apresentados anteriormente. O pressuposto da normalidade dos
erros no necessrio para o resultado (5), mas ser importante para o
estudo da inferncia sobre o modelo de regresso.
1.3
Varincias e Covarincias dos Estimadores
Sabemos que
Var(a) = E{[a E(a)]2} = E[(a )2] = E(a2) 2
Var(b) = E{[b E(b)]2} = E[(b )2] = E(b2) 2
Cov(a,b) = E[(a )(b )]
em que Var(.) denota varincia e Cov(.) representa a covarincia.
Sendo 2 a varincia do erro aleatrio do modelo, pode-se demonstrar que
(6)
var(b) =
(7)
xi2
var(a ) =
nS xx
(8)
Cov(a, b) = 2
S xx
S xx
2
Como o termo 2 / S xx aparece em (6), (7) e (8), podemos reescrever (7) e (8)
como
var(a ) = var(b)
2
i
e
Cov ( a , b ) = x var( b ) ,
respectivamente.
Do exposto, percebe-se que:
5

Quanto maior a varincia do termo de erro (dada por 2) maiores sero as

varincias de a e b e a covarincia entre eles.
Quanto mais concentrados os valores de x estiverem em torno de sua mdia
x , menor ser o valor de Sxx (lembre que S xx = ( xi x ) 2 ) e maiores sero as
varincias de a e b e a covarincia entre eles. Isso pode ser visto
graficamente na prxima figura.
O sinal da covarincia Cov ( a , b ) oposto ao sinal de x . Note que o grfico da
reta ajustada passa pelo ponto das mdias ( x , y ) . Assim, ainda na figura,
mantendo-se fixo o ponto ( x , y ) , um aumento em b diminui o intercepto a
da reta ajustada.
1.4
Distribuies Amostrais
Sob a hiptese da normalidade dos erros, a e b tambm so distribudos

normalmente
(9)
b ~ N ,
S xx
x2
(10) a ~ N , var(b) i
(11) Cov(a, b) = x
2
S xx
(repetida por convenincia)
Ainda falta definir um estimador para a varincia do erro aleatrio 2. Prova-se

que a varincia dos resduos (ou varincia residual)
6

2 =
2
i
n2
um estimador no tendencioso de 2, ou seja, E ( 2 ) = 2 (*). Ressaltamos

que os resduos correspondem diferena entre o valor observado da varivel
dependente e seu respectivo valor estimado, ou seja, ei = yi y i = yi a bxi .
(*) O 2 que subtrado do n do denominador corresponde ao nmero de
parmetros de regresso ( , ) no modelo; essa subtrao torna o estimador
2 no tendencioso.
Frmula alternativa para o clculo do erro padro residual

(raiz quadrada da varincia dos resduos):
EP (ei ) = = 1 r 2 Y
Note que 0 EP(ei ) Y .

Exemplo. Voltemos a um dos exemplos vistos na aula 4, em que foi obtida
reta y = 0,174 + 0, 217 x ( S xx = 42 ). Foi dada a tabela a seguir:
xi
yi
xi yi
1
2
3
4
5
6
7
8
xi = 36
0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2
0,5
1,2
2,7
3,2
6,0
9,0
11,9
16,0
xi yi = 50,5
xi2
1
4
9
16
25
36
49
64
xi2 = 204
yi2
0,25
0,36
0,81
0,64
1,44
2,25
2,89
4,00
yi2 = 12,64
7

Substituamos, na tabela acima, as suas trs ltimas colunas,como abaixo:
xi
yi
yi
ei = yi yi
1
2
3
4
5
6
7
8
xi = 36
0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2
0,174+0,217x1=0,392
0,108
-0,008
0,075
-0,242
-0,058
0,025
0,008
0,092
ei = 0
0,174+0,217x2=0,608
0,174+0,217x3=0,825
0,174+0,217x4=1,042
0,174+0,217x5=1,258
0,174+0,217x6=1,475
0,174+0,217x7=1,692
0,174+0,217x8=1,908
= 9,2
e12
0,0117
0,0001
0,0056
0,0584
0,0034
0,0006
0,0001
0,0084
ei2 = 0,0883
Observe que
(a)
(b)
y = y (demonstrvel);
e = 0 , consequncia direta de (a).
i
Estimemos as varincias de a e b , bem como Cov ( a , b ) . A primeira etapa

estimar 2:
Varincia residual =
e
=
2
i
n2
0,0833
= 0,0147.
6
Agora, utilizemos as frmulas (6), (7) e (8), substituindo 2 (desconhecido)

pela sua estimativa 2 :
var(b) =
var(a ) =
2
S xx
2
i
0,0147
= 350 10 6 ,
42
var(b) =
204
350 10 6 = 8,925 10 3 ,
8
cov(a, b) = x var(b) =
36
350 10 6 = 1,575 10 3 .
8
Assim, assumindo a normalidade do erro aleatrio do modelo, obtemos as

seguintes estimativas:
b ~ N(0,217; 350x10-6)
a ~ N(0,175; 8,925x10-3)
8

1.5
Teorema de Gauss-Markov
O teorema Gauss-Markov nos garante que, de todos os

estimadores lineares possveis no viesados para e , os estimadores de
mnimos quadrados a e b , definidos por (2), so os de menor varincia. Ou
seja, os estimadores a e b so os Melhores Estimadores Lineares No
Viesados (MELNV).
Uma consequncia lgica do teorema que, se h estimadores de menor
varincia que a e b para e , estes ou so viesados ou so no lineares. Ns
no nos preocuparemos com o seu estudo. A demonstrao deste teorema
foge ao escopo desta aula.
1.6
Coeficiente de Determinao
Os resduos ei = yi y i , embora utilizados para avaliar a aderncia da reta

ajustada de mnimos quadrados aos pontos (xi, yi), tm o inconveniente de
serem afetados pela unidade utilizada. Para superar esse obstculo,
voltaremos discusso sobre o coeficiente de determinao R2 visto
anteriormente.
Primeiramente, temos que a variao total de y dada por
(12)
2
S yy = ( yi y ) 2 = yi yi
n i
i
i
Nosso objetivo separar a variao total de y em 2 partes: uma

explicada pela regresso e outra associada ao termo de erro (ou no
explicada pela regresso).
9

Considere a identidade
(13)
yi y = ( yi y i ) + ( y i y ) .
Elevando ambos os membros de (13) ao quadrado e somando as n

observaes, obtemos:
(14)
(y
i
y ) 2 = i( yi y i ) 2 + i( y i y ) 2 + 2i( yi y i )( y i y ).
Demonstra-se que o ltimo termo de (14) nulo e segue-se ento que
(y
i
(15)
y ) 2 = i( yi y i ) 2 + i( y i y ) 2
SQT
SQE
SQR
em que:
SQT = Soma dos quadrados total = Syy =
(y
i
y ) 2 (ou variao total)
SQE = Soma dos quadrados dos erros =
(y
i
y i ) 2 (ou variao
residual)
SQR = Soma dos quadrados da regresso =
( y
i
y ) 2 (ou variao
explicada)
Dividindo ambos os membros de (15) por SQT, resulta
(16) 1 =
SQE SQR
.
+
SQT SQT
Finalmente, definimos o coeficiente de determinao por

(17) R 2 =
SQR
SQE
.
= 1
SQT
SQT
Da definio, tem-se que 0 R2 1. O coeficiente R2 mede a proporo (ou

a porcentagem) da variao total em y explicada por x dentro do
modelo de regresso. O R2 quantifica o grau de ajuste de um conjunto de
dados reta de regresso estimada. Quanto mais prximo de 1 estiver R2
10

melhor ter sido nosso trabalho para explicar a variao em y, com y = a + bx , e

maior ser a capacidade de previso do modelo sobre todas as
observaes amostrais, ou seja, R2 nos diz o quo prximos os valores
estimados (ou previstos) de Y esto de seus valores observados.
O coeficiente R2 uma medida descritiva. , s vezes, chamado medida de

aderncia. Por si s, no mede a qualidade do modelo de regresso. No
se pode julgar o mrito de um modelo com base somente no valor de seu R2.
Os parmetros estimados podem conter informaes teis mesmo quando esse
nmero baixo (como R2=0,32). Isto pode ocorrer, por exemplo, quando
aplicamos a regresso linear simples no contexto de variveis econmicas1.
H outras formas de apresentar R2. Sabemos que
y i = a + bxi e y = a + b x .
Subtraindo a segunda equao da primeira, obtemos
y i y = b( xi x ) ( y i y ) 2 = b 2 ( xi x ) 2 .
Fazendo o somatrio de ambos os membros da equao,
( y
i
y ) 2 = ib 2 ( xi x ) 2 = b 2 i( xi x ) 2 ,
obtemos,
(18) SQR = b 2 S xx ,
logo,
S
(19) R = b xx
S
yy
2
S xy2
=
S S
xx yy
Vimos que o coeficiente de correlao linear de Pearson r dado por

r=
S xy
S xx S yy
Ento,
(20) r 2 = R 2
GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson Makron Books, 2000.
11

Observe que, no ajuste perfeito, ou seja, quando todas as observaes se

encontram na reta ajustada, todos os resduos so nulos e R2 =1, assim como
o mdulo do coeficiente de correlao linear de Pearson (veja a figura abaixo).
Voltando ao exemplo anterior,

2
1
SQT = i( yi y ) = yi yi 2,06 (calculado anteriormente)
n i
i
SQE =
(y
i
y i ) 2 = 0,0883
SQR = b 2 S xx = 0,217 2 42 = 1,972

O coeficiente R2 dado por
S
42
R 2 = b 2 xx = 0,217 2
= 0,957
S
2,06
yy
O resultado acima nos diz que 95,7% da variao de y explicada pelo modelo
de regresso (veja a figura abaixo). Podemos dizer que a reta ajustada tem
uma boa aderncia aos pontos (xi, yi).
12

1.7
Relaxamento dos Pressupostos do Modelo
Heterocedasticidade
Lembremos da seguinte premissa do modelo de regresso linear clssico:
A varincia do termo de erro sempre constante, ou seja,
Var(ei) = E[ei2] = 2
Quando a varincia dos erros constante, dizemos que os erros so
homocedsticos. Todo o estudo que fizemos at o momento est baseado
nesta premissa.
Entretanto, muitas vezes no mundo real os erros so heterocedsticos, ou

seja, suas varincias no so constantes. Posto em equao,
Var(ei) = E[ei2] = 2(i).
A heterocedasticidade pode ser causada por vrias fatores. Por exemplo, o
aperfeioamento da coleta de dados pode levar a uma diminuio na varincia
dos erros das observaes mais recentes.
A
prxima
figura
heterocedasticidade.
ilustra
os
conceitos
de
homocedasticidade
13

Figura: homocedasticidade versus heterocedasticidade.
Autocorrelao
A Autocorrelao
pressuposto:
ocorre
quando
no
se
observa
seguinte
Os termos de erro so estatisticamente independentes. Isso implica

que Cov(ei,ej) = E[eiej] = 0, para i j.
Simbolicamente, quando h autocorrelao,
Cov(ei,ej) = E[eiej] 0 para i j.

A autocorrelao dos erros muito comum em sries temporais (por exemplo,
o grfico do ndice BOVESPA ao longo dos ltimos 10 anos uma srie
temporal).
14

H modelos de regresso linear que corrigem os problemas de

heterocedasticidade e autocorrelao. Entretanto, julgamos desnecessrio, at
mesmo prejudicial (a menos que voc tenha tempo de sobra - concurseiro com
tempo de sobra??), estud-los para a prova, pois acreditamos ser desprezvel
a probabilidade de serem cobrados.
1.8
Regresso sem o Intercepto
Em certas situaes da vida prtica, sabemos que a reta de regresso dos

dados deve passar pela origem. Considere, por exemplo, um estudante de
engenharia eltrica que est fazendo o levantamento experimental da famosa
Lei de Ohm, dada por V = RI, em que R o valor de uma resistncia, V a
tenso aplicada em um resistor e I a corrente que atravessa o resistor. Note
que a equao V = RI passa pela origem do grfico da tenso (eixo vertical)
versus corrente (eixo horizontal). O valor da resistncia d a declividade da
reta.
A regresso sem o intercepto tambm chamada regresso sem termo
constante ou regresso que passa pela origem. Neste caso nosso modelo passa
a ser
Y = X +
e a condio imposta passa a ser
min ei2 = min ( yi y i ) 2 = min ( yi bxi ) 2

i
em que ei = i denota o resduo.

Aplicando ento o mtodo de mnimos quadrados, obtemos as seguintes
frmulas para b e sua varincia (*)
(21) b =
x y
x
i
2
i
(22) var(b) =
2
i
em que 2 estimado por

(23) 2 =
2
i
n 1
15

(*) a prova pode ser encontrada no apndice do captulo 6 da referncia

GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson
Makron Books, 2000.
interessante comparar tais frmulas com as que se obtm quando o termo
de intercepto est includo no modelo:
b=
S xy
S xx
( x x )( y y )
(x x)
i
var(b) =
(x
x )2
2 =
2
i
n2
As diferenas entre os dois conjuntos de frmulas so evidentes: no modelo

com intercepto usamos somas de quadrados e produtos cruzados (isto ,
produtos entre X e Y) ajustados em relao mdia. Alm disso, o nmero de
graus de liberdade para calcular 2 (n-1) na regresso sem o intercepto e
(n-2) na regresso com intercepto. A estatstica 2 tem (n-1) graus de
liberdade na regresso sem o intercepto porque a obteno dos yi necessita da
estimativa de somente um parmetro do modelo.
Aprendemos, quando estudamos o modelo de regresso linear com intercepto,
que 2 = ei2 = SQE = SQT SQR. Vimos que SQR = b2Sxx = b2 ( xi x ) 2 , por
conseguinte
e = (y
2
i
y ) 2 b 2 ( xi x ) 2 (regresso com intercepto).
Para o modelo com intercepto zero, pode-se mostrar analogamente que
e = y
2
i
2
i
b 2 xi2
Note que as somas dos quadrados de Y e X no so ajustadas pela

mdia na frmula acima.
Se o exerccio no mencionar qual o modelo, sempre resolva a questo
usando o modelo com intercepto.
16

1.8.1
Coeficiente de Determinao da Regresso sem o Intercepto
Vimos que SQE = ei2 = yi2 b 2 xi2 quando a regresso passa pela origem.
Como R 2 = 1 SQE / SQT , temos que
R2 = 1
2
i
b 2 xi2
SQT
=1
2
i
b 2 xi2
S yy
=1
y b x
y ( y ) / n
2
i
2
i
2
i
A frmula acima indica que no podemos assumir a igualdade entre o

coeficiente de determinao e o coeficiente de correlao linear
quando a regresso passa pela origem.
regresso sem intercepto: R 2 r 2

J caiu em prova! (ANAC/UnB-CESPE/2009) Um estudo sobre a duraco
de uma operaco de carregamento mostrou haver relaco linear na forma Yk =
Xk + k, em que Yk o tempo (horas) do carregamento k; Xk o volume total
(em toneladas) do carregamento k; o coeficiente angular; e k representa
um erro aleatrio com mdia zero e variancia 2.
De uma amostra aleatria de 341 operaces de carregamento, observam-se os
341
seguintes
resultados:
X kYk = 988 ;
k =1
341
Y
k =1
341
X k2 = 1.704 ;
k =1
341
X k = 682 ;
k =1
341
Y
k =1
2
k
= 681 ;
= 341 .
Com base nessas informaces, julgue os itens a seguir.

O coeficiente R2 (ou coeficiente de determinaco ou explicaco) do modelo
apresentado igual a 0,81, o que indica que 81% da variaco total do tempo
de carregamento so explicadas pelo volume total do carregamento.
Resoluo
Note que a regresso passa pela origem, pois o modelo especificado
Yk = Xk + k.
O coeficiente R2 mede a percentagem da variao na varivel
dependente Y (tempo em horas do carregamento) explicada pela variao
17

na varivel explicativa X (volume total em toneladas do carregamento)

dentro do modelo de regresso.
Estimativa da declividade
b=
x y
x
i
2
i
988
= 0,58
1.704
Clculo de R2
SQE = yi2 b 2 xi2 = 681 0,582 1.704 = 107,77
( Y )
= Y
n
SQT = S yy
R2 = 1
= 681
3412
= 340
341
SQE
107,77
= 1
= 0,68 0,81 item errado
SQT
340
Alm disso, errado dizer que

(...) variaco total do tempo de carregamento so explicadas pelo volume
total do carregamento.
A afirmao correta seria
(...) variaco total do tempo de carregamento so explicadas pela variao do
volume total do carregamento.
Calculemos o coeficiente de correlao.
r=
S xy
S xx S yy
S xy = X k Yk
( X ) ( Y ) = 988 682 341 = 306

k
( X )
S xx = X k2
r=
S xy
S xx S yy
340
= 1.704
n
306
341
682
= 340
341
306
= 0,90 r 2 = 0,81
340
Constatamos que r 2 R 2 para regresso sem intercepto.

GABARITO: E
18

A correlaco linear entre o tempo de carregamento e o volume total do

carregamento superior a 0,85.
Resoluo
O item est certo, pois vimos que r = 0,9. O clculo do item anterior no foi
uma perda de tempo!
GABARITO: C
Sendo os erros aleatrios distribudos segundo uma normal, ento a estimativa
de mxima verossimilhanca para o coeficiente inferior a 0,60 e superior a
0,55.
Resoluo
Se admitirmos os erros aleatrios do modelo de regresso distribudos

normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos (*).
Trata-se de uma regresso sem o intercepto. Logo,
b=
X Y
X
k k
2
k
988
= 0,58
1.704
Note que 0,55 < b = 0,58 < 0,60 item certo.

(*) GUJARATI, D. N. Econometria Bsica, 3 Ed., Pearson Makron Books,
2000.
GABARITO: C
Sendo y , x e , respectivamente, a mdia dos tempos de carregamento, a
mdia dos volumes totais do carregamento e a estimativa de mnimos
quadrados do coeficiente angulardo modelo, ento y = x .
Resoluo
O modelo Yk = Xk + k. Logo,
E(Yk) = E(Xk + k) = E(Xk) + E(k) = E(Xk) + E(k) = E(Xk), pois E(k) = 0.
19

Note que E(Yk) = E(Xk) E(Xk). Item errado.

Nota: errou a questo quem confundiu a estimativa do coeficiente angular,
dada por , com o prprio coeficiente angular .
GABARITO: E
1.9
Intervalos de Confiana
A partir deste ponto, abandonaremos a notao e para os parmetros do

modelo Y = + X + de RLS e adotaremos em seus lugares 1 e 2,
respectivamente. A razo disso que empregaremos o termo daqui para
frente para designar o nvel de significncia do teste, como logo veremos.
O modelo de RLS fica ento na forma
(24) Y = 1 + 2 X +
em que 1 e 2 denotam as estimativas de 1 e 2 , respectivamente.
Se os pressupostos do modelo (24) se verificam, inclusive o da normalidade
dos erros, pode-se provar que
(25)
2 2
s )2
= t n 2
segue distribuio t de Student com n2 graus de liberdade, em que
s2 =
2
2
S xx
a varincia amostral de 2 (lembre que 2 denota a varincia amostral dos

resduos do modelo).
O nmero de graus de liberdade (GL) o nmero de observaes subtrado do
nmero de parmetros do modelo. No modelo de RLS, GL = n2.
Da tabela auxiliar da t de Student encontramos valores crticos tc tais que
P{tc t tc } = 1 .
Segue-se que
20

2
tc = 1 ,
P t c 2
s)2
e, rearranjando a inequao anterior, obtemos

)
)
(26) P{ 2 tc s )2 2 2 + t c s )2 } = 1
Exemplo. Considere o nvel de significncia = 0,05 = 5% e a estatstica t

com 30 graus de liberdade. Podemos ver na figura abaixo que 1 = 0,95 =
95% a rea sob a densidade t (curva azul) no intervalo -2,042 t 2,042 (tc
= 2,042 para = 5%, confira!) e 2 = 0,025 = 2,5% a rea de cada uma
das caudas da distribuio.
Distribuio da estatstica t, N=30
0.4
0.35
0.3
Densidade
0.25
0.2
0.15
0.1
Prob = 0.025
t>2.042
Prob = 0.025
t<-2.042
Area = 0,95
-2.042<t<2.042
0.05
0
-5
-4
-3
-2
-1
0
t
)
O intervalo observado 2 tc s )2 denominado intervalo com 100 (1 )% de
confiana para o parmetro 2 . A interpretao de um intervalo de confiana

a seguinte:
se um nmero infinito de amostras aleatrias for coletado e um intervalo
com 100 (1 )% de confiana para 2 for calculado a partir de cada amostra,
ento 100 (1 )% desses intervalos contero o valor verdadeiro de 2 .
Na prtica, obtemos somente uma amostra aleatria e calculamos uma

estimativa do intervalo de confiana. Uma vez que esse intervalo conter
21

ou no o valor verdadeiro de 2 , no razovel fixar um nvel de

probabilidade para essa realizao. A afirmao apropriada a seguinte:
o intervalo observado contm o valor verdadeiro de 2 , com 100 (1 )% de
confiana. Essa afirmao tem uma interpretao de freqncia; ou seja, no
sabemos se a afirmao verdadeira para essa amostra especfica, mas o
)
mtodo usado para obter o intervalo 2 tc s )2 resulta em afirmaes corretas
em 100 (1 )% do tempo.
Para o intercepto 1 , a estimao dos intervalos de confiana (IC) funciona
rigorosamente da mesma maneira que para 2 . Assim, podemos reescrever
(26) como
)
)
(27) P{1 t c s )1 1 1 + tc s )1 } = 1
em que
(28) s s)
2 xi2
=
nS xx
Exemplo. Retornemos ao exemplo de RLS que temos utilizado ao longo desta

aula. A reta estimada y = 0,174 + 0, 217 x e as distribuies estimadas de 1 e 2
so:
2 : N (0,217;0,0003505)
1 : N (0,174;0,008938)
Se quisermos calcular os intervalos de confiana de 95% para 1 e 2 , temos
de escolher corretamente o valor crtico tc. Lembre que n = 8 observaes.
Logo, t6 = 2,447, o que implica 2,5% de rea para cada cauda.
22

0.4
0.35
0.3
Densidade
0.25
0.2
0.15
0.1
Prob = 0.025
t>2.447
Prob = 0.025
t<-2.447
0.05
0
-5
-4
-3
-2
-1
0
t
O IC de 2 no nvel de 95% de confiana dado por

)
2 t c s ) = 0,217 2,447 0,0003505 = 0,217 0,046 .
2
O IC de 1 no nvel de 95% de confiana dado por

)
1 tc s ) = 0,174 2,447 0,008938 = 0,174 0,231 .
1
Exemplo (DECEA/2009/Cesgranrio) Uma determinada empresa resolveu

estudar a relao do ativo total (em bilhes de reais) e a receita lquida (em
milhes de reais) das 17 maiores instituies financeiras do pas. O estudo
forneceu os seguintes resultados:
Estatstica de regresso
R2
0,55
R2 Ajustado
0,52
Erro padro
2,86
Observaes
17
23

Coeficientes
Erro padro
valor-P
Interseo
4,5
1,43
3,1
0,007
Receita
lquida
0,1
0,02
4,3
0,001
Com base nos resultados, o intervalo de confiana de 95%, bilateral, para a

inclinao da reta, , , aproximadamente,
(A) 0,1 1,64 x 0,02
(B) 0,1 1,75 x 0,02
(C) 0,1 1,96 x 0,02
(D) 0,1 2,13 x 0,02
(E) 0,1 4,30 x 0,02
Resoluo
Seja o modelo de RLS Y = 1 + 2 X + , em que a inclinao da reta 2 o
mencionado pelo enunciado, X a varivel independente (ativo) e Y a
varivel dependente (receita lquida).
Pede-se o intervalo de confiana de 2. Vimos que ele dado por
)
2 t c s ) = 0,1 4,3 0,02 opo correta (E), certo? ERRADO! Voc caiu numa
2
pegadinha da banca.
O valor T da tabela a estatstica de teste da Hiptese nula Ho: 2=0.
)
O IC dado por 2 tc s )2 , onde tc o valor crtico de t extrado da tabela
auxiliar t de Student.
No modelo de RLS, para n = 17 observaes, temos (n2) = 15 graus de
liberdade (GL). Para o IC bilateral 95% de confiana e 15 GL, tc = 2,131
)
2,13. Como 2 = 0,1 e s )2 = 0,02 , temos que:
)
IC: 2 tc s )2 = 0,1 2,13 0,02 .
Nota: a estatstica R2 Ajustado ser definida no estudo da regresso linear

mltipla. Essa estatstica no usada na RLS.
GABARITO: D
24

1.10 Teste de Hipteses

A hiptese nula H0
A hiptese nula geralmente o oposto do que queremos provar. Por
exemplo, no modelo de RLS Y = 1 + 2 X + , ao calcularmos 2 estamos
supondo que existe uma relao entre as variveis X e Y. Assim, uma
hiptese nula (H0) usualmente adotada H0: 2 = 0 .
A hiptese alternativa H1
A hiptese alternativa contradiz a hiptese nula. Por exemplo, quando a
hiptese nula H0: 2 = 0 a hiptese alternativa pode ser H1: 2 0 ou H1: 2
<0 ou ainda H1: 2 >0.
A preocupao de definir as hipteses do examinador, voc s ter de testlas. Para tal, ser necessria uma estatstica de teste.
Vimos que
2 2
s
segue distribuio t com n2 graus de liberdade. Se a hiptese nula

H0: 2 = k,
em que k uma constante, for aceita, ento t n2 = ( 2 k ) / s tambm possui
2
distribuio t com n2 graus de liberdade. Esta ser a estatstica usada no

teste. Ressaltamos que, na maioria dos exames, a hiptese nula
H0: 2 =0 e t n2 =
2
s 2
embora isso nem sempre ocorra.

A Regio de Rejeio
Se a estatstica t n2 = ( 2 k ) / s 2 for muito grande em mdulo (valor absoluto),
rejeitamos H0. A lgica est no fato de, se 2 ficar muito distante de k,
provavelmente H0 est errada.
25

Mas o quo grande tem de ser a estatstica acima para rejeitarmos H0 em

favor de H1: 2 0? A resposta a essa pergunta a escolha de um nvel de
significncia . A regio de rejeio composta por valores t tais que
P{t tc} = P{t -tc} = /2,
conforme ilustrado pela figura abaixo.
0.5
NO REJEITAR H0
REJEITAR H0
0.45
REJEITAR H0
0.4
Densidade
0.35
0.3
0.25
0.2
Prob = /2
t<-t
0.15
Prob = /2
t>t
0.1
P(-tc<t<tc) = 1-
0.05
0
-5
-4
-3
-2
-1
0
t
Tipos de erro (reviso!)

Sempre que aplicamos um teste de hipteses corremos o risco de errar. H
dois tipos de erro.
Erro tipo I: rejeitar H0 sendo ela verdadeira. Neste caso, H0 verdadeira e
P{t c ( 2 k ) / s 2 t c } = 1 , pois ( 2 k ) / s 2 segue a distribuio tn-2. Assim, a
probabilidade de cometer um erro tipo I .
Erro tipo II: aceitar a hiptese H0 sendo ela falsa. Entretanto, essa
probabilidade no pode ser calculada, pois no sabemos o verdadeiro valor do
parmetro. Mas podemos dizer que a probabilidade de um erro nvel II
aumenta medida que diminui a probabilidade de um erro nvel I, quando se
escolhe um menor nvel de significncia .
26

Exemplo. Com os dados do exemplo do exemplo anterior, teste a hiptese H0:

1=0 em favor da hiptese alternativa H1: 10 nos nveis de 10% e 20% de
significncia.
As mesmas frmulas enunciadas para 2 se aplicam para 1 . A estatstica de
teste
t n2 = ( 1 k ) / s = 0,174 / 0,008938 = 1,84 .

1
a) = 0,10
P{t tc} = P{t -tc} = /2 = 0,05
Como n=8, temos n2 = 6 GL. Da tabela auxiliar, tc=1,94. Como tc < tn2 < tc ,
tn-2 se encontra na regio de aceitao. Portanto, no rejeitamos a hiptese
nula no nvel de significncia de 10%.
b) = 0,20
P{t tc} = P{t -tc} = /2 = 0,10
Da tabela auxiliar, tc = 1,44. Como tn-2>tc, tn-2 encontra-se na regio de
rejeio. Portanto, a hiptese nula rejeitada no nvel de significncia
de 20%.
Testes unilaterais (unicaudais)
At agora estudamos os testes bilaterais ou bicaudais, que se caracterizam
pela hiptese nula H0: i =0 (i=1,2), contra a alternativa H1: i 0.
Se rejeitarmos H0 em favor da alternativa H1: i 0, estaremos considerando
que i pode assumir qualquer valor negativo ou positivo, menos o zero. Ocorre
s vezes, pela natureza das variveis, que i no pode ser negativo e, dessa
forma, estabelecemos a hiptese alternativa H1: i >0. O que voc precisa
saber para a prova est explicado na sequncia.
Em um teste bilateral, a regio de rejeio composta por valores t tais que
P{t tc} = P{t -tc} = /2 . Em um teste unilateral direita, a regio de
rejeio composta por valores t tais que P(ttc) = . Na prxima figura,
temos = 5% e tc = 1,697 (30 graus de liberdade).
27

Distribuio da estatstica t
0.4
0.35
0.3
Densidade
0.25
0.2
Rejeitar se t > 1.697

Prob = 0.05
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
0
t
O restante do procedimento idntico ao j estudado.

1.11 Anlise de Varincia
Seja o modelo de RLS dado por Y = 1 + 2 X + e sua reta estimativa y = 1 + 2 x
. Vimos anteriormente que SQT = SQR + SQE, ou seja,
(y
y ) 2 = ( y i y ) 2 + ( yi y i ) 2 .
A expresso acima a equao bsica da anlise de varincia ou ANOVA

(ANalysis Of VAriance). Veremos que a anlise de varincia pode ser usada
para testar a significncia da regresso. J aprendemos que os
componentes
( y
y ) 2 (SQR)
(y
y i ) 2 (SQE)
medem, respectivamente, a variao em y devida reta de regresso e a

variao residual deixada sem explicao pela reta de regresso.
A ideia usar a equao da ANOVA para testar a hiptese de no haver
regresso (2=0). Se no h regresso,
y = 1
28

1 = y (pois 1 = y 2 x = y 0.x = y ).
Portanto,
( y
y ) 2 = (1 y ) 2 = ( y y ) 2 =0 (SQR nula).
Neste caso, SQT = SQE e isto quer dizer que a varincia total de Y (y2) igual
a varincia residual 2 (varincia do erro aleatrio do modelo), ou seja,
y2 = 2 .
Vamos agora dividir os termos dos lados esquerdo e direito da equao da
ANOVA pela varincia residual 2:
(y
y)2
( y
=
y)2
(y
+
y i ) 2
Observe que a diviso de SQT por 2 (lado esquerdo da expresso acima),

2
y y
( yi y ) = i = n21 ,
1
2
resulta numa varivel aleatria qui-quadrado com n1 graus de liberdade, pois

assumimos que y2 = 2 (lembre que a mdia amostral y causa a subtrao de
1 grau de liberdade na estatstica).
Seguindo a mesma linha de raciocnio, temos que a estatstica
1
2
y y
( yi y i ) = i i = n22
2
uma varivel aleatria qui-quadrado com n2 graus de liberdade (a

diminuio de 2 graus de liberdade causada pela estimao dos parmetrods
1 e 2 ).
Ainda falta analisar a estatstica
( y
y)2
22 S xx
(lembre que SQR = 22 S xx ).
2
A varivel aleatria 2 normal. Sendo 2 = 0 por hiptese, temos que

29

2 ~ N 0,
.
S xx
Considere a varivel normal reduzida

z=
S
2 0
= 2 xx .
/ S xx
Elevando ao quadrado ambos os membros da expresso acima, obtemos,
0
z = 2
/ S
xx
= 2 S xx = SQR ,
2
2
e conclumos que a diviso de SQR por 2 resulta numa varivel aleatria quiquadrado com 1 grau de liberdade.
Assim, a equao
(y
y)2
( y
y)2
(y
y i ) 2
pode ser reescrita como
n21 = 12 + n2 2 ,
se, de fato, vlida a hiptese 2 = 0 .
Aprendemos que uma varivel resultante da soma de duas outras
variveis independentes n21 e n22 uma varivel n21 +n2 . Uma consequncia
da propriedade de aditividade da qui-quadrado a seguinte: se trs
variveis n2 , n21 e n22 so tais que n2 = n21 + n22 , ento a condio necessria
e suficiente para que n21 e n22 sejam independentes que n = n1 + n2.
(*) o termo tcnico seria corolrio.
Conclumos que
12 = (SQR/2)
e
30

n2 2 = (SQE/2)
so variveis qui-quadrado independentes, pois o nmero de graus de
liberdade de SQT/2 n1, caso a premissa 2 = 0 seja vlida.
Considere a estatstica F
SQR / 2
22 S xx
SQR / 1
12 / 1
1
(29) F =
,
=
=
=
SQE / 2 n22 /(n 2) SQE /(n 2)
2
n2
em que 2 denota a varincia residual amostral. Note que F tem 1 grau de

liberdade no numerador e n2 graus de liberdade no denominador. Ento (29)
pode ser usada para se testar, pela ANOVA, a hiptese H0 de no haver
regresso. O teste ser unilateral, uma vez que, sendo falsa H0, o numerador
tender a crescer. A varivel (29) dever ser comparada com o valor crtico
F1,n 2 , em que o nvel de significncia do teste de hipteses. Daremos um
exemplo de teste pela ANOVA mais adiante.
O teste acima descrito equivalente ao teste bilateral da hiptese nula 2 = 0 ,
porque demonstra-se que o F de (29) o quadrado do tn-2 quando 2 = 0 , ou
seja, F1,n-2 = t2n-2.
Podemos resumir tudo o que foi visto neste item na tabela de ANOVA abaixo.
(GUJARATI, D. N. Econometria Bsica, 3 Ed., Pearson Makron Books, 2000)

Soma de
Fonte de
Graus de
Mdia dos
F
Fcalculado
Quadrados
Variao
Liberdade
quadrados
Regresso
SQR
SQR/1
Residual
SQE
n-2
= SQE/(n-2)
Total
SQT
n-1
SQR / 1
SQE /( n 2) F1,n-2,
Pelo que foi visto at o momento, tanto faz usar t ou F no modelo de RLS. Na
verdade, F muito til para a inferncia do modelo de regresso linear
mltipla, que ser visto posteriormente.
31

Nota: cuidado com a notao. Alguns autores no adotam as mesmas

abreviaturas que so usadas neste curso. Vimos que
SQR = Soma dos quadrados da regresso =
( y
i
y ) 2 (variao explicada).
Alguns autores a chamam de Soma dos Quadrados Explicada (SQE) pela

regresso.
Vimos tambm que
SQE = Soma dos quadrados dos erros =
(y
i
y i ) 2 (variao residual).
Alguns autores a chamam de Soma dos Quadrados dos Resduos (SQR).

Neste caso inverte-se a notao. Na prova, o examinador ter de explicar a
qual soma estar se referindo. Voc ter apenas de estar bem atento.
Exemplo. Testar pela ANOVA a existncia de regresso linear para os dados
do exemplo do item 21.4, ao nvel de 10% de significncia. Considere F1;6;0,1 =
3,776.
Dados: 1 = 0,174 (intercepto estimado), 2 = 0,217 (inclinao estimada), Syy =
2,06; Sxx = 2,06, Sxy = 9,1 e n = 8.
Soluo:
Vamos testar as hipteses
H0: 2 = 0,
H1: 2 0.
SQR = 22 S xx = 0,217 2 42 1,978 .
SQE = SQT SQR = Syy SQR = 2,06 1,978 = 0,082.
F = SQR/[SQE/(n2)] = 1,987/(0,082/6) 144,73.
Como F = 144,73 >> 3,776, rejeitamos H0 e conclumos que h regresso. A
prxima figura ilustra a distribuio amostral de F. A rea azul corresponde a
P(F > fc) = 10%, em que o valor crtico fc = 3,776.
32

Distribuio da estatstica F
curva F
rea = 10%
0.25
Densidade
0.2
0.15
0.1
P(F > 3.776) = 0,10
0.05
0
0
20
40
60
80
100
120
140
Fonte de
Variao
Regresso
Residual
Total
Graus de Quadrado
Soma de
Mdio
Quadrados Liberdade
1,978
1
1,978
0,082
6
0,014
2,060
7
F
1,978
= 144 ,73
0,014
3,776
Exemplo (DECEA/Cesgranrio/2009/Adaptada) Considere os dados abaixo

para responder s prximas duas questes.
Resultados parciais da aplicao de um modelo de regresso linear simples,
em um conjunto de 27 observaes.
ANOVA
Grau de
liberdade
Soma de
quadrados
Regresso
Mdia dos
quadrados
F de significao
68.000
3,2E-10
Resduo
680
Total
85.000
Coeficientes
Erro padro
Interseo
9,59
8,73
Varivel
X1
4,76
Estatstica
t
Valor-P
33

A variabilidade total explicada por esse modelo, aproximadamente,

A) 90%
B) 80%
C) 70%
D) 60%
E) 50%
Resoluo
R2 =
SQR 68.000
=
= 0,8 = 80%
SQT 85.000
GABARITO: B
O valor de X no quadro acima, aproximadamente,
A) 10,00
B) 8,73
C) 2,01
D) 0,48
E) 0,0001
Resoluo
Reta de regresso: Y = + X 1 + , em que a varivel independente X1, a
varivel dependente Y, e so os parmetros do modelo e o termo de
erro aleatrio.
Dados: = 4,76 (estimativa da declividade), SQR = 68.000.
Sabemos que
Var ( ) =
S xx
2
e que
SQR
SQR = 2 S xx S xx = 2
Logo,
34

Var( ) =
SQR / 2
da declividade).
( ) =
2
SQR / 2
= X (frmula do erro padro do estimador
Como no conhecemos o valor da varincia 2 do erro aleatrio, trabalharemos

com a mdia dos quadrados dos resduos (cujo valor tabelado 680), que,
como visto, corresponde estimativa de 2. Em outras palavras,
2 = SQE /(n 2) = 680 .
Ento,
SQR / 2
680
=
68.000 / 4,76 2
4,76 2 4,76
=
0,48
100
10
GABARITO: D
Exemplo (Engenharia-BNDES/Cesgranrio/2008) Um experimento foi
realizado com o objetivo de estimar o preo de uma ao, dado o seu valor
patrimonial, ambos em reais. Uma amostra de aes negociadas recentemente
forneceu dados sobre o preo e o valor patrimonial por ao. Aplicou-se o
modelo de regresso linear simples Y = + X + . Alguns resultados da
tabela da anlise da varincia, obtida a partir dos dados dessa amostra, esto
apresentados a seguir.
ANOVA
Fontes de
variao
Grau de liberdade
Soma de quadrados
Mdia dos quadrados
Fcalculado
56.000
Regresso
F de significncia
3,1E-14
Resduo
Total
59
88.480
Considere as afirmaes abaixo, derivadas da tabela da ANOVA

I - O coeficiente de determinao mostra que o modelo proposto explica
aproximadamente 63% da variabilidade total.
II O valor da estatstica Fcalculado 100, e a concluso do teste que a
varivel valor patrimonial significativa, isto, deve-se rejeitar a hiptese nula
(H0 : b = 0) .
35

III - Dado que, ao incorporar no modelo a varivel retorno por ao (%), a

varincia residual passou a ser 360 reais2, pode-se concluir que, perdendo um
grau de liberdade, reduz-se a soma dos resduos quadrticos em 200
unidades.
Est(o) correta(s) a(s) afirmao(es)
A) I apenas.
B) I e II, apenas.
C) I e III, apenas.
D) II e III, apenas.
E) I, II e III.
Resoluo
Vimos que a ANOVA do modelo de regresso linear simples pode ser resumida
pela tabela a seguir.
Fonte de
Variao
Soma de
Graus de Quadrado
Quadrados Liberdade
Mdio
Regresso
SQR
SQR/1
Residual
SQE
n2
SQE/(n2)
Total
SQT
n1
SQR / 1
SQE /( n 2) F1,n-2,
A tabela acima ser usada na anlise das afirmaes.

Afirmao I:
R2 = SQR/SQT
SQR/1 = SQR = 56.000 R2 = 56.000/88.480 0,63
Portanto, correto afirmar que O coeficiente de determinao mostra que o
modelo proposto explica aproximadamente 63% da variabilidade total.
Afirmao II:
Fcalculado =
SQR / 1
SQE /( n 2)
SQE = SQT SQR = 88.480 56.000 = 32.480

36

n1 = 59 n = 60
Fcalculado =
56 .000
SQR / 1
=
= 100
SQE /( n 2) 32.480 / 58
Logo correta a afirmao II.

Afirmao III:
O modelo inicial do tipo Y = + X + , em que temos 1 varivel
independente ou regressor (X) e k = 2 parmetros a serem estimados ( e ).
Ao incorporar no modelo a varivel retorno por ao (R), passamos a ter um
modelo do tipo Y = + X + R + (modelo de regresso linear mltipla), com
2 variveis explanatrias (X e R) e k = 3 parmetros a serem estimados (,
e ).
Vimos que a varincia residual (varincia dos erros aleatrios i) para o modelo
de RLS dada por
e
=
2
i
n2
= SQE/(n 2).
Logo,
2 =
32.480
= 560 reais2
58
para o modelo inicial Y = + X + .

Suponha que, ao incorporar no modelo a varivel R (retorno por ao), a
varincia residual passou a ser 360 reais2. Ento, pode-se concluir que a
introduo de mais uma varivel independente reduziu a soma dos resduos
quadrticos em 200 unidades. Note que a banca considerou a afimao correta
com base neste raciocnio.
Entretanto, o enunciado contm a seguinte frase:
Considere as afirmaes abaixo, derivadas da tabela da ANOVA
Ora, parte da afirmao III (aquela que diz respeito hiptese de reduo da
varincia residual) no foi derivada da tabela da ANOVA. Trata-se de uma
inconsistncia lgica do enunciado. Por esse motivo, eu teria marcado a opo
B (I e II, apenas).
37

Nota: a varincia residual do modelo de Regresso Linear Mltipla (RLM)

Y = + X + R +
dada por (memorize para a prova!)
2
i
2
RLM
=
nk
= SQE/(n k),
em que k denota o nmero de parmetros do modelo (k = 3 para o modelo

com 3 regressores).
GABARITO: E
Exemplo (SUSEP/ESAF/2010) A partir de uma amostra aleatria (X1 ,Y1),
(X2 ,Y2),..., (X20 ,Y20) foram obtidas as estaststicas:
mdias X = 12,5 e Y = 19, varincias amostrais s x2 = 30 e s 2y = 54 e covarincia
S xy = 36 .
Qual a reta de regresso estimada de Y em X?

A) Yi = 19 + 0,667 X i
B) Yi = 12,5 + 1,2 X i
C) Yi = 4 + 1,2 X i
D) Yi = 19 + 1,2 X i
E) Yi = 80 + 22,8 X i
Resoluo
A reta a estimar
Yi = 1 + 2 X i ,
em que o parmetro 2 (estimativa da declividade) dado por
S
2 = xy =
S xx
i =1
( X i X )(Yi Y )
i =1
(Xi X )
Cov( X , Y )
,
Var ( X )
e o parmetro 1 (estimativa do intercepto) por

38

1 = Y 2 X .
Observe que estamos usando uma notao diferente do enunciado: a
quantidade Sxy definida acima no a covarincia entre X e Y.
Logo, 2 = 36 / 30 = 1,2 e 1 = 19 1,2 12,5 = 4,0 . Deste modo, a reta de regresso
estimada
de Y em X Yi = 4 + 1,2 X i .
GABARITO: C
Exemplo (SUSEP/ESAF/2010) Com os dados da questo anterior,
determine o valor da estatstica F para testar a hiptese nula de que o
coeficiente angular da reta do modelo de regresso linear simples de Y em X
igual a zero.
A) 144
B) 18
C) 36
D) 72
E) 48
Resoluo
Sabemos que F =
SQR / 1
.
SQE /( n 2)
SQR = 22 S xx = 1,2 2 [(n 1) s x2 ] = 1,44[19 30] = 820,80

SQT = S yy = ( n 1) s y2 = 19 54 = 1.026
SQE = SQT SQR = 1.026 820 ,80 = 205,20
Assim,
F=
820 ,80
= 72
205,20 / 18
GABARITO: D
39

Resumo
1 n
( xi x )( yi y ) .
n 1 i =1
- Covarincia: Cov ( X , Y ) =
Cov( X , Y )
=
- Coef. de correlao: r =
DP( X ).DP(Y )
i =1
i =1
( xi x )( yi y )
( xi x ) 2
i =1
( yi y ) 2
S xy
S xx S yy
- Somas de Quadrados:
( x )( y )
S xy = i =1 xi yi
1
n
1
S xx = i =1 x
n
( x )
1
S yy = i =1 y
n
( y )
2
i
2
i
i =1
i =1
i =1
i =1
- O COEFICIENTE DE CORRELAO ADIMENSIONAL

- CORRELAO NO CAUSALIDADE
- A CORRELAO MEDE APENAS A RELAO LINEAR
- Regresso Linear Simples:
modelo Y = + X + , em que o intercepto, a declividade e
denota a componente aleatria da variao de Y ( uma varivel aleatria).
Funo de Regresso Populacional (FRP): E (Y | x ) = + X .
Funo de Regresso Amostral (FRA) y = a + bx , em que y denota os valores
dados pela reta estimativa, a a estimativa do parmetro , e b a
b=
S xy
S xx
Cov( X , Y )
DP(Y )
=r
Var ( X )
DP( X )
a = y bx
SQT = SQR + SQE
40

n
SQT = S yy = ( yi y ) 2 a soma dos quadrados total (variao total)

i =1
SQE = ( yi y i ) 2 a soma dos quadrados dos erros (variao residual)

i =1
SQR = ( y i y ) 2 a soma dos quadrados da regresso (variao explicada)

i =1
variao total = variao residual +variao explicada

2
S xy
SQR
SQE
=1
=
= r2
R da regresso com intercepto: R =
SQT
SQT S xx S yy
2
b ~ N ,
S xx
xi2
a ~ N , var(b)
SQT = ( yi y ) 2 = S yy
SQR = ( y i y ) 2 = b 2 S xx
SQE = ( yi y i ) 2 = ei2 , em que os e i so os resduos do modelo. Os resduos
so realizaes do erro aleatrio do modelo.

Regresso com intercepto: SQE = ( yi y ) 2 b 2 ( xi x ) 2
Varincia dos resduos do modelo de RLS:
2
e
=
2
i
n2
SQE
a estimativa
n2
da varincia de .
Erro padro dos resduos do modelo de RLS: EP (ei ) = = 1 r 2 Y
Estatstica t para testar se h regresso (H0: = 0): t =
b
2
.
, em que s b2 =
sb
S xx
Intervalo de confiana para : b tc sb .

41

Estatstica F: F =
SQR
SQE /(n 2)
- ANOVA para o modelo de RLS:

Fonte de
Variao
Soma de
Graus de
Quadrados Liberdade
Mdia dos
quadrados
Regresso
SQR
SQR/1
Residual
SQE
n-2
SQE/(n-2)
Total
SQT
n-1
SQR / 1
SQE /( n 2)
F1,n-2,
- Regresso sem o intercepto: Y = X + :
x y
b=
x
i
2
i
, var(b) =
2
i
e
=
2
i
n 1
SQE = ei2 = yi2 b 2 xi2

R
y
=1
2
i
b 2 xi2
SQT
y
=1
2
i
b 2 xi2
S yy
y b x
=1
y ( y ) / n
2
i
2
i
2
i
R2 r 2
- Se admitirmos os erros aleatrios do modelo de regresso distribudos

normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos.
42

Exerccios de Fixao
(Analista Judicirio TRT17/CESPE-UnB/2009) Um estudo estatstico foi

realizado para avaliar a relao entre o logaritmo do valor pago em um
processo judicial de natureza trabalhista (Y) e o correspondente logaritmo do
valor da causa (X). Para o estudo, foram selecionados ao acaso 301 processos
judiciais trabalhistas. Observando-se o par de valores (Xk,Yk) do k-simo
processo, k = 1, 2, ..., 301, foram obtidos os resultados apresentados na
tabela a seguir.
mdia amostral de X (em ln R$)
11,60
desvio padro amostral de X (em ln R$)

mdia amostral de Y (em ln R$)
2,40
11,40
desvio padro amostral de Y (em ln R$)
2,80
correlao linear de Pearson entre X e Y
0,53
A partir dessas informaes, julgue os prximos itens, considerando um

modelo de regresso linear simples na forma Yk = a + bX k + ek , em que a e b so
os coeficientes do modelo, {ek } representa uma sequncia independente de
erros aleatrios normais com mdia zero e varincia 2 .
1. A estimativa de mxima verossimilhana para o coeficiente b superior a
0,5 e inferior a 0,7.
2. A estimativa de mnimos quadrados ordinrios do coeficiente a superior a
4.
3. O valor da estatstica R2 ajustado superior a 0,30.
4. O valor da estatstica F para testar b = 0 maior que 50.
5. O erro padro para a estimativa do coeficiente b menor que 0,04.
6. A estimativa da varincia 2 menor que 7.
7. A covarincia entre X e Y maior que 3.
8. A varincia da reta ajustada Yk = a + bX k , em que a e b so as estimativas
de mnimos quadrados ordinrios e 0 < X k < 10 , menor ou igual a 2 / 301 .
43

9. Considerando que o coeficiente a seja nulo, tem-se uma reta de regresso

que passa pela origem, na forma Yk = bX k + ek . Nesse caso, a estimativa de
mnimos do coeficiente b ser maior que 0,90.
10. (AFRFB/ESAF/2009) Na anlise de regresso linear simples, as
estimativas e dos parmetros e da reta de regresso podem ser
obtidas pelo mtodo de Mnimos Quadrados. Nesse caso, os valores dessas
estimativas so obtidos atravs de uma amostra de n pares de valores Xi Yi
com (i =1, 2, ...., n), obtendo-se: Y i= + X i , onde Y i a estimativa de Yi = + Xi.
Para cada par de valores Xi Yi com (i =1, 2, ..., n) pode-se estabelecer o desvio ou
resduo aqui denotado por ei entre a reta de regresso Yi e sua estimativa
Y i . Sabe-se que o Mtodo de Mnimos Quadrados consiste em adotar como
estimativas dos parmetros e os valores que minimizam a soma dos
quadrados dos desvios ei. Desse modo, o Mtodo de Mnimos Quadrados
consiste em minimizar a expresso dada por:
n
(A)
[Y ( X )]
i =1
n
(B)
[Y X ]
i =1
n
(C)
[Y ( X )]
i =1
n
(D)
[Y
2
Yi ]
( X i ) 2 ]
i =1
n
(E)
[Y
i =1
11. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) A partir de uma

amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se
22
22
i =1
(X
i =1
22
(Y Y )
i
i =1
22
Yi = 286
X i = 440
2
= 1.690
X ) 2 = 850 ,
i =1
22
(X
X )(Yi Y ) = 1.105
i =1
Obtenha a reta de regresso linear de Y em X.

(A) Yi = 13 + 0,65 X i
(B) Yi = 13 + 1,3 X i
44

(C) Yi = 20 + 0,65 X i
(D) Yi = 20 + 2 X i
(E) Yi = 13 + 1,3 X i
12. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) Com os dados da
questo anterior, calcule o valor mais prximo do coeficiente de determinao
R2 da regresso linear de X em Y.
(A) 0,65
(B) 0,81
(C) 0,85
(D) 0,91
(E) 0,88
13. (MDIC/ESAF/2012) Considere os valores da varivel aleatria Y
observados para determinados valores da varivel X.
X
Y
1
9
2
9
3
6
4
4
5
16
6
9
7
10
8
8
9
19
10
16
11
26
Obtenha a expresso mais prxima da reta de regresso de Y em X.

(A) Yi = 6 + 1,4Xi
(B) Yi = 3,6 + 0,714Xi
(C) Yi = 12 + 0,714Xi
(D) Yi = 12 + 1,4Xi
(E) Yi = 3,6 + 1,4Xi
14. (MDIC/2012/ESAF) Com os dados da questo 13, calcule o valor mais
prximo da variao de Y explicada pela regresso.
(A) 250,6
(B) 154
(C) 110
(D) 424
(E) 215,6
15. (IBGE/Cesgranrio/2010/Adaptada) Dentre os itens abaixo, identifique
as premissas bsicas para o modelo de regresso.
45

I.
Linearidade do fenmeno medido
II.
Varincia no constante dos termos de erro (heterocedasticidade)
III. Normalidade dos erros

IV. Erros correlacionados
V.
A covarincia entre dois erros aleatrios distintos no nula.
So premissas APENAS os itens

(A) I e III.
(B) II e III.
(C) I, III e IV.
(D) I, III e V.
(E) I, II, III e V.
16. (IBGE/Cesgranrio/2010) Ajustou-se um modelo de regresso linear
simples a dados provenientes de alguns experimentos executados por um
fabricante de concreto, com o objetivo de determinar de que forma e em que
medida a dureza de um lote de concreto depende da quantidade de cimento
usada para faz-lo. Quarenta lotes de concreto foram feitos com quantidades
diferentes de cimento na mistura, e a dureza de cada lote foi medida aps sete
dias. Sabendo-se que
n
SQR = Yi Y
i =1
= 5.275,2
SQE = Yi Yi
= 366,6
i =1
o coeficiente de determinao , aproximadamente,

(A) 0
(B) 0,064
(C) 0,5
(D) 0,94
(E) 14,38
17. (Analista Judicirio TJ-RO/CESPE-UnB/2012) Com respeito ao
modelo de regresso linear simples, assinale a opo correta.
(A) O parmetro de inclinao da reta igual tangente do ngulo formado
entre a reta e o eixo Oy.
(B) A inclinao da reta proporcional correlao entre a varivel resposta e
a varivel preditora.
46

(C) Se o modelo linear estiver bem ajustado, a correlao entre o resduo do

modelo e a varivel resposta deve estar prxima de -1.
(D) Se o intercepto do modelo for nulo, a varivel resposta assume o valor
zero quando a varivel preditora for igual ao inverso da inclinao da reta.
(E) O parmetro de inclinao da reta igual ao cosseno do ngulo formado
entre a reta e o eixo Ox.
47

4.
Gabarito
1C
2C
3E
4C
5E
6C
7C
8E
9C
10 B
11 E
12 C
13 E
14 E
15 A
16 D
17 B
48

5.
Resoluo dos Exerccios de Fixao
(Analista Judicirio TRT17/CESPE-UnB/2009) Um estudo estatstico foi

realizado para avaliar a relao entre o logaritmo do valor pago em um
processo judicial de natureza trabalhista (Y) e o correspondente logaritmo do
valor da causa (X). Para o estudo, foram selecionados ao acaso 301 processos
judiciais trabalhistas. Observando-se o par de valores (Xk,Yk) do k-simo
processo, k = 1, 2, ..., 301, foram obtidos os resultados apresentados na
tabela a seguir.
mdia amostral de X (em ln R$)
11,60
desvio padro amostral de X (em ln R$)

mdia amostral de Y (em ln R$)
2,40
11,40
desvio padro amostral de Y (em ln R$)
2,80
correlao linear de Pearson entre X e Y
0,53
A partir dessas informaes, julgue os prximos itens, considerando um

modelo de regresso linear simples na forma Yk = a + bX k + ek , em que a e b so
os coeficientes do modelo, {ek } representa uma sequncia independente de
erros aleatrios normais com mdia zero e varincia 2 .
1. A estimativa de mxima verossimilhana para o coeficiente b superior a
0,5 e inferior a 0,7.
Resoluo
Dados:
X = 11,60
s x = X = 2,40
Y = 11,40
s y = Y = 2,80
r = 0,53
Modelo de Regresso Linear Simples:
Yk = a + bX k + k
em que a o intercepto, b a declividade e {ek } representa uma sequncia
independente de erros aleatrios normais com mdia zero e varincia 2 .
49

Reta estimativa: E (Yk | X k ) = Yk = a + bX k , em que Yk denota os valores dados pela

reta estimativa, a a estimativa do coeficiente a , e b a estimativa do
coeficiente b .
Se admitirmos os erros aleatrios do modelo de regresso

distribudos normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos.
Clculo da estimativa b :
S
Cov( X , Y )
b = xy =
S xx
Var ( X )
r=
Cov( X , Y )
= 0,53
DP( X ) DP(Y )
Cov ( X , Y ) = 0,53 2, 40 2,80 = 3,56
Cov( X , Y ) 0,53 2,40 2,80

b =
=
0,62
Var ( X )
2,40 2,40
Item correto.
GABARITO: C
2. A estimativa de mnimos quadrados ordinrios do coeficiente a superior a
4.
Resoluo
Estimativa de mnimos quadrados ordinrios do coeficiente a :
a = Y bX = 11,40 0,62 11,60 4,21 superior a 4
Item correto.
GABARITO: C
3. O valor da estatstica R2 ajustado superior a 0,30.
Resoluo
50

O R2 ajustado ser definido na aula sobre regresso mltipla. Por ora, voc
somente precisa saber que o R2 igual ao R2 ajustado para o modelo de RLS.
Relao entre R2 (coeficiente de determinao) e r (coeficiente de correlao):
R2 = r 2
Logo,
R 2 = r 2 = 0,532 0,28 inferior a 0,30

Item errado.
GABARITO: E
4. O valor da estatstica F para testar b = 0 maior que 50.
Resoluo
F=
SQR
SQE /(n 2)
SQR = b 2 S xx = 0,62 2 S xx
S xx = ( n 1) x2 , em que x2 = s x2 .
S xx = ( n 1) x2 = 300 2,4 2 = 1.728 SQR = 0,622 1.728 = 664,24
SQT = SQR + SQE
SQT = S yy
S yy = SQT = (n 1) y2 , em que y2 = s 2y .
SQT = 300 2,82 = 2.352,00 SQE = SQT SQR = 2.352 ,00 664 ,24 = 1.687 ,76
Logo, F =
664,24
= 664,24 / 5,64 = 117,68 maior que 50 (item certo)
1.687,76 / 299
GABARITO: C
5. O erro padro para a estimativa do coeficiente b menor que 0,04.
51

Resoluo
Sabemos que a distribuio do estimador da declividade b normal:
b ~ N ,
S xx
2
Logo o Erro Padro (EP) ou desvio padro de b EP (b) =
.
S xx
Mas no sabemos o valor da varincia 2 do erro aleatrio do modelo. Neste
caso, deve-se calcular uma estimativa do erro padro:
EPest (b) =
2
S xx
em que a estimativa da varincia (ou varincia dos resduos)
2 =
Ento, EPest (b) =
SQE 1.687,76
=
= 5,64
n2
299
5,64
= 0,06 maior que 0,04 (item errado)
1.728
GABARITO: E
6. A estimativa da varincia 2 menor que 7.
Resoluo
Varincia residual:
2 =
SQE 1.687,76
=
= 5,64 menor que 7 (item certo)
n2
299
GABARITO: C
7. A covarincia entre X e Y maior que 3.
Resoluo
Dados: r = 0,53 , s x = 2,40 , e s y = 2,80 .
52

Clculo da covarincia (amostral) entre X e Y:

r=
s xy
= 0,53
sx s y
s xy = 0,53 s x s y s xy = 0,53 2,40 2,80 = 3,56 maior que 3
Item certo.
GABARITO: C
8. A varincia da reta ajustada Yk = a + bX k , em que a e b so as estimativas
de mnimos quadrados ordinrios e 0 < X k < 10 , menor ou igual a 2 / 301 .
Resoluo
A varincia dos resduos dada por
2 =
SQE
n2
A afirmativa A varincia da reta ajustada Yk = a + bX k (..) menor ou igual a
2 / 301 inconsistente. Item errado.

GABARITO: E
9. Considerando que o coeficiente a seja nulo, tem-se uma reta de regresso
que passa pela origem, na forma Yk = bX k + ek . Nesse caso, a estimativa de
mnimos do coeficiente b ser maior que 0,90.
Resoluo
Quando a reta de regresso passa pela origem (regresso sem intercepto),, a
estimativa de mnimos quadrados do coeficiente b dada por
b =
Precisamos calcular as quantidades
xy
x
xy
Sabemos que
53

S xy = xy
1
( x )( y ) S xy xy =
n
n
S xx = x 2
1
( x )2 S xx x2 =
n
n
S xy
As aproximaes
xy e
x
n
xy x y = xy XY
n
n n
x x
n n
x
n
X2
S xx
x2 podem ser usadas porque n = 301 um
n
nmero grande
Logo,
3,56 =
2,40
xy 11,60 11,40
n
x
=
n
11,60
2
xy = 128,96
x
n
= 140,32
Finalmente,
xy
b = 2 =
x
xy
n = 128,96 = 0,92 maior que 0,90 (item certo)

x 2 140,32
n
GABARITO: C
10. (AFRFB/ESAF/2009) Na anlise de regresso linear simples, as
estimativas e dos parmetros e da reta de regresso podem ser
obtidas pelo mtodo de Mnimos Quadrados. Nesse caso, os valores dessas
estimativas so obtidos atravs de uma amostra de n pares de valores Xi Yi
com (i =1, 2, ...., n), obtendo-se: Y i= + X i , onde Y i a estimativa de Yi = + Xi.
Para cada par de valores Xi Yi com (i =1, 2, ..., n) pode-se estabelecer o desvio ou
resduo aqui denotado por ei entre a reta de regresso Yi e sua estimativa
Y i . Sabe-se que o Mtodo de Mnimos Quadrados consiste em adotar como
estimativas dos parmetros e os valores que minimizam a soma dos
quadrados dos desvios ei. Desse modo, o Mtodo de Mnimos Quadrados
consiste em minimizar a expresso dada por:
n
(A)
[Y ( X )]
i =1
54

n
(B)
[Y X ]
i =1
n
(C)
[Y ( X )]
i =1
n
(D)
[Y
2
Yi ]
( X i ) 2 ]
i =1
n
(E)
[Y
i =1
Resoluo
A questo forneceu todas as informaes necessrias para a resoluo.
Pelo Mtodo dos Mnimos Quadrados temos que minimizar a soma dos
quadrados das diferenas entre os valores de Yi e as respectivas estimativas
, por meio da reta de regresso. Logo teramos:
Y
i
[Y Y ] = [Y ( + X )] = [Y X ]
n
i =1
i =1
i =1
Logo alternativa correta a B.

GABARITO: B
11. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) A partir de uma
amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se
22
22
X i = 440
i =1
(X
i =1
22
(Y Y )
i
i =1
22
Yi = 286
2
= 1.690
X ) 2 = 850 ,
i =1
22
(X
X )(Yi Y ) = 1.105
i =1
Obtenha a reta de regresso linear de Y em X.

(A) Yi = 13 + 0,65 X i
(B) Yi = 13 + 1,3 X i
(C) Yi = 20 + 0,65 X i
(D) Yi = 20 + 2 X i
55

(E) Yi = 13 + 1,3 X i
Resoluo
Modelo de regresso linear simples:
Y = + X + ,

da variao de Y ( uma varivel aleatria).
Y = a + bX (reta estimativa),
em que Y denota os valores dados pela reta estimativa, a a estimativa do

parmetro , e b a estimativa do parmetro .
b=
S xy
S xx
a = y bx = mdia de Y subtrada da declividade x mdia de X
Dados:
22
- S xy = ( X i X )(Yi Y ) = 1.105
i =1
22
- S xx = ( X i X ) 2 = 850
i =1
1 22
286
Yi =
= 13
n i =1
22
1 22
440
- mdia de X = X = X i =
= 20
n i =1
22
- mdia de Y = Y =
Logo,
b=
S xy
S xx
1.105
= 1,3
850
a = y bx = 13 1,3 20 = 13 26 = 13
Reta estimativa: Y = a + bX i = 13 + 1,3 X i (opo E).

GABARITO: E
56

12. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) Com os dados da

questo anterior, calcule o valor mais prximo do coeficiente de determinao
R2 da regresso linear de X em Y.
(A) 0,65
(B) 0,81
(C) 0,85
(D) 0,91
(E) 0,88
Resoluo
A correlao entre as variveis aleatrias X e Y, denotada por (X,Y), dada
por:
( X ,Y ) =
Cov ( X , Y )
= covarincia/(desvio padro de X . desvio padro de Y)
XY
O mdulo da correlao sempre menor ou igual a 1: -1 (X,Y) 1.

A correlao amostral ou coeficiente de correlao linear de Pearson (r)
o estimador da correlao (X,Y), sendo dada por:
22
S xy
Cov( X , Y )
=
=
r=
DP( X ) DP(Y ) S xx S yy
(X
X )(Yi Y )
i =1
22
( X i X )2
i =1
22
(Y Y )
1.105
1.105
=
= 0,92
850 1.690 29,15 41,11
i =1
R 2 = r 2 = 0,922 = 0,85 .
NOTA: no confunda correlao amostral r com correlao (X,Y)! A primeira
uma estimativa da segunda. A correlao um momento estatstico. S
conseguimos calcular a correlao (X,Y) quando conhecemos a distribuio
conjunta de probabilidade de X e Y, ou seja, quando sabemos quem a funo
f(X,Y).
GABARITO: C
57

13. (MDIC/ESAF/2012) Considere os valores da varivel aleatria Y

observados para determinados valores da varivel X.
X
Y
1
9
2
9
3
6
4
4
5
16
6
9
7
10
8
8
9
19
10
16
11
26
Obtenha a expresso mais prxima da reta de regresso de Y em X.

(A) Yi = 6 + 1,4Xi
(B) Yi = 3,6 + 0,714Xi
(C) Yi = 12 + 0,714Xi
(D) Yi = 12 + 1,4Xi
(E) Yi = 3,6 + 1,4Xi
Resoluo
Seja Y a varivel dependente e X a varivel suposta sem erro, ou seja, no
aleatria. A Regresso Linear Simples (RLS) pressupe que seja adotado o
modelo
Y = + X + ,

da variao de Y ( o erro aleatrio).
A reta estimativa do modelo de RLS dada pela frmula
y i = a + bxi
em que yi denota os valores dados pela reta estimativa, a a estimativa do
parmetro , e b , tambm denominado coeficiente de regresso linear, a
Frmulas necessrias para estimar a reta de regresso de Y em X pelo
mtodo dos mnimos quadrados:
S xy
Estimativa da declividade: b =
S xx
Estimativa do intercepto: a = y bx

Soma dos produtos: S xy = xi yi xi yi
n i i
i
1
Soma dos quadrados de X: S xx = xi xi
n i
i
58

1
Soma dos quadrados de Y: S yy = yi yi
n i
i
1
Mdia de Y: y = yi
n i
1
Mdia de X: x = xi
n i
A construo da tabela a seguir facilita os clculos da questo:

X
10
11
X=66
16
10
19
16
26
Y=132
XY
18
18
16
80
54
70
64
171
160
286
XY=946
X2
16
25
36
49
64
81
100
121
X2=506
Assim,
y=
1
132
yi =
= 12
n i
11
x=
1
66
=6
xi =
11
n i
1
66 132
S xy = xi yi xi yi = 946
= 154
n i i
11
i
662
1
= 110
Sxx = x i x i = 506
11
n i
i
b=
S xy
S xx
154
= 1,40
110
a = y bx = 12 1, 4 6 = 3,60
y i = a + bxi = 3,6 + 1,4 xi
GABARITO: E
14. (MDIC/2012/ESAF) Com os dados da questo 13, calcule o valor mais
prximo da variao de Y explicada pela regresso.
59

(A) 250,6
(B) 154
(C) 110
(D) 424
(E) 215,6
Resoluo
A Soma dos Quadrados da Regresso (SQR) nos d o valor da variao de Y
explicada pela regresso:
n
S xy2
i =1
S xx
SQR = ( y i y ) 2 = b 2 S xx = bS xy =
SQR = bS xy = 1,4 154 = 215,6
GABARITO: E
15. (IBGE/Cesgranrio/2010/Adaptada) Dentre os itens abaixo, identifique
as premissas bsicas para o modelo de regresso.
I.
Linearidade do fenmeno medido
II.
Varincia no constante dos termos de erro (heterocedasticidade)
III. Normalidade dos erros

IV. Erros correlacionados
V.
A covarincia entre dois erros aleatrios distintos no nula.
So premissas APENAS os itens

(A) I e III.
(B) II e III.
(C) I, III e IV.
(D) I, III e V.
(E) I, II, III e V.
Resoluo
Anlise dos itens:
I) Premissa verdadeira, pois parte-se do princpio de que a relao entre as
variveis independente e dependente linear.
60

II) Falsa. A varincia

(homocedasticidade).
dos
termos
de
erro
deve
ser
constante
III) Verdadeira. Assumimos que os erros aleatrios so bem modelados pela

distribuio normal.
IV) Falsa. A covarincia entre erros distintos deve ser nula e isto implica que
os erros no devem ser correlacionados.
V) Falsa, conforme explicado acima.
GABARITO: A
16. (IBGE/Cesgranrio/2010) Ajustou-se um modelo de regresso linear
simples a dados provenientes de alguns experimentos executados por um
fabricante de concreto, com o objetivo de determinar de que forma e em que
medida a dureza de um lote de concreto depende da quantidade de cimento
usada para faz-lo. Quarenta lotes de concreto foram feitos com quantidades
diferentes de cimento na mistura, e a dureza de cada lote foi medida aps sete
dias. Sabendo-se que
n
SQR = Yi Y
i =1
= 5.275,2
SQE = Yi Yi
= 366,6
i =1
o coeficiente de determinao , aproximadamente,

(A) 0
(B) 0,064
(C) 0,5
(D) 0,94
(E) 14,38
Resoluo
R2 = 1 - SQE/SQT
em que SQE a variao residual (soma dos quadrados dos erros) e SQT a
variao total (soma dos quadrados total). Vimos que
SQT = SQE + SQR = 366,6 + 5.275,2 = 5.641,8
Logo,
61

R2 = 1 - 366,6/5.641,8 0,94
GABARITO: D
17. (Analista Judicirio TJ-RO/CESPE-UnB/2012) Com respeito ao
modelo de regresso linear simples, assinale a opo correta.
(A) O parmetro de inclinao da reta igual tangente do ngulo formado
entre a reta e o eixo Oy.
(B) A inclinao da reta proporcional correlao entre a varivel resposta e
a varivel preditora.
(C) Se o modelo linear estiver bem ajustado, a correlao entre o resduo do
modelo e a varivel resposta deve estar prxima de -1.
(D) Se o intercepto do modelo for nulo, a varivel resposta assume o valor
zero quando a varivel preditora for igual ao inverso da inclinao da reta.
(E) O parmetro de inclinao da reta igual ao cosseno do ngulo formado
entre a reta e o eixo Ox.
Resoluo
Anlise das opes
(A) A afirmativa correta seria: o parmetro de inclinao da reta igual
tangente do ngulo formado entre a reta e o eixo Ox. Segue a justificativa.
Seja o modelo de RLS
y = + x + ,
em que o intercepto, a declividade (coeficiente angular ou parmetro
de inclinao) da reta de regresso e denota a componente aleatria da
variao de y. O parmetro de inclinao da reta representa a variao em
E(y|x) para uma variao de 1 unidade em x. Algebricamente,
E ( y | x )
= tan( )
x
em que denota o ngulo formado entre a reta de regresso e o eixo Ox.

(B) A estimativa do parmetro de inclinao da reta dada por
= b =
Cov( X , Y )
Var ( X )
62

como
r=
Cov( X , Y )
Cov ( X , Y ) = rDP ( X ) DP (Y )
DP( X ) DP(Y )
DP( X ) DP(Y )
rDP( X ) DP(Y )
DP(Y )
= r
= r
2
Var ( X )
DP( X )
DP ( X )
ento
e, conclui-se que a inclinao da reta proporcional varivel r, que

representa a correlao entre a varivel resposta (y) e a varivel preditora (x).
Opo correta.
(C) O resduo ( ei ) corresponde diferena entre o valor observado da varivel
dependente ( yi ) e seu respectivo valor estimado ( yi ), ou seja,
ei = yi yi = yi a bxi . No correto afirmar que se o modelo linear estiver bem
ajustado, a correlao entre o resduo do modelo e a varivel resposta deve
estar prxima de -1, pois sabe-se que a correlao entre o resduo do modelo
() e a varivel resposta (y) nula.
(D) Se o intercepto do modelo for nulo, a reta de regresso
E ( y | x) = x .
Neste caso, a varivel resposta ( y ) assume o valor unitrio quando a varivel

preditora (x) for igual ao inverso da inclinao da reta:
1
= 1 = y
b
Opo incorreta.
(E) Opo incorreta, pois o parmetro de inclinao da reta igual tangente
do ngulo formado entre a reta e o eixo Ox.
GABARITO: B
At a prxima aula. Bons estudos!
Alexandre Lima
alexandre@pontodosconcursos.com.br
63

Aula 09

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Aula 09

Cargado por

Copyright:

Formatos disponibles

Conhecimentos Especficos Mtodos Quantitativos Anatel

Aula 09 Inferncia no modelo de regresso

Inferncia no Modelo de Regresso Linear Simples ................................................ 2

Valores Esperados dos Estimadores ...................................................................... 4

Varincias e Covarincias dos Estimadores ........................................................ 5

Distribuies Amostrais .............................................................................................. 6

Coeficiente de Determinao .................................................................................... 9

Relaxamento dos Pressupostos do Modelo ....................................................... 13

Regresso sem o Intercepto ................................................................................... 15

Coeficiente de Determinao da Regresso sem o Intercepto ...................................... 17

Anlise de Varincia ............................................................................................... 28

Exerccios de Fixao ......................................................................................................... 43

Conhecimentos Especficos Mtodos Quantitativos Anatel

Inferncia no Modelo de Regresso Linear Simples

A anlise de regresso estuda a dependncia de uma varivel, chamada de

em que o intercepto, a declividade e denota a componente aleatria

em que y denota os valores dados pela reta estimativa, a a estimativa do

Conhecimentos Especficos Mtodos Quantitativos Anatel

Nota: A estimativa da declividade tambm pode ser calculada pela frmula

em que Cov ( X , Y ) a covarincia amostral e Var ( X ) a varincia amostral de

em que r denota o coeficiente de correlao de Pearson, DP (Y ) o desvio

Conhecimentos Especficos Mtodos Quantitativos Anatel

Interpretao Geomtrica do Intercepto e da Declividade

em que denota o ngulo formado entre a reta de regresso e o eixo Ox.

Valores Esperados dos Estimadores

Pode-se demonstrar que os estimadores a e b de (2) tm mdia dadas por

Logo, os estimadores a e b, que tambm costumam ser denotados por e

Conhecimentos Especficos Mtodos Quantitativos Anatel

O resultado acima verdadeiro somente quando so vlidos os pressupostos

Varincias e Covarincias dos Estimadores

Conhecimentos Especficos Mtodos Quantitativos Anatel

Quanto maior a varincia do termo de erro (dada por 2) maiores sero as

Sob a hiptese da normalidade dos erros, a e b tambm so distribudos

(repetida por convenincia)

Ainda falta definir um estimador para a varincia do erro aleatrio 2. Prova-se

Conhecimentos Especficos Mtodos Quantitativos Anatel

um estimador no tendencioso de 2, ou seja, E ( 2 ) = 2 (*). Ressaltamos

Frmula alternativa para o clculo do erro padro residual

Note que 0 EP(ei ) Y .

Conhecimentos Especficos Mtodos Quantitativos Anatel

Substituamos, na tabela acima, as suas trs ltimas colunas,como abaixo:

Estimemos as varincias de a e b , bem como Cov ( a , b ) . A primeira etapa

Agora, utilizemos as frmulas (6), (7) e (8), substituindo 2 (desconhecido)

Assim, assumindo a normalidade do erro aleatrio do modelo, obtemos as

Conhecimentos Especficos Mtodos Quantitativos Anatel

O teorema Gauss-Markov nos garante que, de todos os

Os resduos ei = yi y i , embora utilizados para avaliar a aderncia da reta

Nosso objetivo separar a variao total de y em 2 partes: uma

Conhecimentos Especficos Mtodos Quantitativos Anatel

Elevando ambos os membros de (13) ao quadrado e somando as n

Demonstra-se que o ltimo termo de (14) nulo e segue-se ento que

y ) 2 (ou variao total)

SQE = Soma dos quadrados dos erros =

Finalmente, definimos o coeficiente de determinao por

Da definio, tem-se que 0 R2 1. O coeficiente R2 mede a proporo (ou

Conhecimentos Especficos Mtodos Quantitativos Anatel

melhor ter sido nosso trabalho para explicar a variao em y, com y = a + bx , e

O coeficiente R2 uma medida descritiva. , s vezes, chamado medida de

Subtraindo a segunda equao da primeira, obtemos

Vimos que o coeficiente de correlao linear de Pearson r dado por

Conhecimentos Especficos Mtodos Quantitativos Anatel

Observe que, no ajuste perfeito, ou seja, quando todas as observaes se

Voltando ao exemplo anterior,

SQR = b 2 S xx = 0,217 2 42 = 1,972