Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aula 09
Sumrio
1
Introduo ........................................................................................................................ 2
1.2
1.3
1.4
1.5
Teorema de Gauss-Markov........................................................................................ 9
1.6
1.7
1.8
1.8.1
1.9
1.10
Teste de Hipteses.................................................................................................. 25
1.11
Resumo.................................................................................................................................... 40
4. Gabarito .................................................................................................................................. 48
5. Resoluo dos Exerccios de Fixao ........................................................................... 49
1
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1.1
Introduo
Yi = E (Y | X i ) + i = + X i + i ,
i = 1, 2,...n
(2)
S xy
b =
S xx
a = y bx
2
www.pontodosconcursos.com.br | Prof. Alexandre Lima
em que
(3)
S xy = ( xi x )( yi y ) = xi yi
i
xi yi ,
n i
i
e
(4)
S xx = ( xi x ) = xi xi
n i
i
i
Cov ( X , Y )
Var ( X )
b=r
DP(Y )
DP( X )
r=
Cov( X , Y )
Cov ( X , Y ) = rDP ( X ) DP (Y )
DP( X ) DP(Y )
b=
DP( X ) DP(Y )
rDP( X ) DP(Y )
DP(Y )
= r
= r
2
Var ( X )
DP( X )
DP ( X )
ento
3
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Algebricamente,
E ( y | x )
= tan( )
x
E (a) =
E (b) =
Sabemos que
Var(a) = E{[a E(a)]2} = E[(a )2] = E(a2) 2
Var(b) = E{[b E(b)]2} = E[(b )2] = E(b2) 2
Cov(a,b) = E[(a )(b )]
em que Var(.) denota varincia e Cov(.) representa a covarincia.
Sendo 2 a varincia do erro aleatrio do modelo, pode-se demonstrar que
(6)
var(b) =
(7)
xi2
var(a ) =
nS xx
(8)
Cov(a, b) = 2
S xx
S xx
2
Como o termo 2 / S xx aparece em (6), (7) e (8), podemos reescrever (7) e (8)
como
var(a ) = var(b)
2
i
e
Cov ( a , b ) = x var( b ) ,
respectivamente.
Do exposto, percebe-se que:
5
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1.4
Distribuies Amostrais
b ~ N ,
S xx
x2
(10) a ~ N , var(b) i
(11) Cov(a, b) = x
2
S xx
2 =
2
i
n2
xi
yi
xi yi
1
2
3
4
5
6
7
8
xi = 36
0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2
0,5
1,2
2,7
3,2
6,0
9,0
11,9
16,0
xi yi = 50,5
xi2
1
4
9
16
25
36
49
64
xi2 = 204
yi2
0,25
0,36
0,81
0,64
1,44
2,25
2,89
4,00
yi2 = 12,64
7
www.pontodosconcursos.com.br | Prof. Alexandre Lima
xi
yi
yi
ei = yi yi
1
2
3
4
5
6
7
8
xi = 36
0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2
0,174+0,217x1=0,392
0,108
-0,008
0,075
-0,242
-0,058
0,025
0,008
0,092
ei = 0
0,174+0,217x2=0,608
0,174+0,217x3=0,825
0,174+0,217x4=1,042
0,174+0,217x5=1,258
0,174+0,217x6=1,475
0,174+0,217x7=1,692
0,174+0,217x8=1,908
= 9,2
e12
0,0117
0,0001
0,0056
0,0584
0,0034
0,0006
0,0001
0,0084
ei2 = 0,0883
Observe que
(a)
(b)
y = y (demonstrvel);
e = 0 , consequncia direta de (a).
i
e
=
2
i
n2
0,0833
= 0,0147.
6
var(a ) =
2
S xx
2
i
0,0147
= 350 10 6 ,
42
var(b) =
204
350 10 6 = 8,925 10 3 ,
8
cov(a, b) = x var(b) =
36
350 10 6 = 1,575 10 3 .
8
1.5
Teorema de Gauss-Markov
Coeficiente de Determinao
2
S yy = ( yi y ) 2 = yi yi
n i
i
i
9
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Considere a identidade
(13)
yi y = ( yi y i ) + ( y i y ) .
(y
i
y ) 2 = i( yi y i ) 2 + i( y i y ) 2 + 2i( yi y i )( y i y ).
(y
i
(15)
y ) 2 = i( yi y i ) 2 + i( y i y ) 2
SQT
SQE
SQR
em que:
SQT = Soma dos quadrados total = Syy =
(y
i
(y
i
y i ) 2 (ou variao
residual)
SQR = Soma dos quadrados da regresso =
( y
i
y ) 2 (ou variao
explicada)
Dividindo ambos os membros de (15) por SQT, resulta
(16) 1 =
SQE SQR
.
+
SQT SQT
SQR
SQE
.
= 1
SQT
SQT
y i = a + bxi e y = a + b x .
y i y = b( xi x ) ( y i y ) 2 = b 2 ( xi x ) 2 .
Fazendo o somatrio de ambos os membros da equao,
( y
i
y ) 2 = ib 2 ( xi x ) 2 = b 2 i( xi x ) 2 ,
obtemos,
(18) SQR = b 2 S xx ,
logo,
S
(19) R = b xx
S
yy
2
S xy2
=
S S
xx yy
S xy
S xx S yy
Ento,
(20) r 2 = R 2
GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson Makron Books, 2000.
11
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1
SQT = i( yi y ) = yi yi 2,06 (calculado anteriormente)
n i
i
SQE =
(y
i
y i ) 2 = 0,0883
O resultado acima nos diz que 95,7% da variao de y explicada pelo modelo
de regresso (veja a figura abaixo). Podemos dizer que a reta ajustada tem
uma boa aderncia aos pontos (xi, yi).
12
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1.7
Heterocedasticidade
Lembremos da seguinte premissa do modelo de regresso linear clssico:
A varincia do termo de erro sempre constante, ou seja,
Var(ei) = E[ei2] = 2
Quando a varincia dos erros constante, dizemos que os erros so
homocedsticos. Todo o estudo que fizemos at o momento est baseado
nesta premissa.
ilustra
os
conceitos
de
homocedasticidade
13
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Autocorrelao
A Autocorrelao
pressuposto:
ocorre
quando
no
se
observa
seguinte
x y
x
i
2
i
(22) var(b) =
2
i
2
i
n 1
15
www.pontodosconcursos.com.br | Prof. Alexandre Lima
b=
S xy
S xx
( x x )( y y )
(x x)
i
var(b) =
(x
x )2
2 =
2
i
n2
e = (y
2
i
e = y
2
i
2
i
b 2 xi2
16
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1.8.1
Vimos que SQE = ei2 = yi2 b 2 xi2 quando a regresso passa pela origem.
Como R 2 = 1 SQE / SQT , temos que
R2 = 1
2
i
b 2 xi2
SQT
=1
2
i
b 2 xi2
S yy
=1
y b x
y ( y ) / n
2
i
2
i
2
i
seguintes
resultados:
X kYk = 988 ;
k =1
341
Y
k =1
341
X k2 = 1.704 ;
k =1
341
X k = 682 ;
k =1
341
Y
k =1
2
k
= 681 ;
= 341 .
17
www.pontodosconcursos.com.br | Prof. Alexandre Lima
b=
x y
x
i
2
i
988
= 0,58
1.704
Clculo de R2
SQE = yi2 b 2 xi2 = 681 0,582 1.704 = 107,77
( Y )
= Y
n
SQT = S yy
R2 = 1
= 681
3412
= 340
341
SQE
107,77
= 1
= 0,68 0,81 item errado
SQT
340
S xy
S xx S yy
S xy = X k Yk
( X )
S xx = X k2
r=
S xy
S xx S yy
340
= 1.704
n
306
341
682
= 340
341
306
= 0,90 r 2 = 0,81
340
b=
X Y
X
k k
2
k
988
= 0,58
1.704
Intervalos de Confiana
(25)
2 2
s )2
= t n 2
s2 =
2
2
S xx
P{tc t tc } = 1 .
Segue-se que
20
www.pontodosconcursos.com.br | Prof. Alexandre Lima
2
tc = 1 ,
P t c 2
s)2
Densidade
0.25
0.2
0.15
0.1
Prob = 0.025
t>2.042
Prob = 0.025
t<-2.042
Area = 0,95
-2.042<t<2.042
0.05
0
-5
-4
-3
-2
-1
0
t
)
O intervalo observado 2 tc s )2 denominado intervalo com 100 (1 )% de
em 100 (1 )% do tempo.
Para o intercepto 1 , a estimao dos intervalos de confiana (IC) funciona
rigorosamente da mesma maneira que para 2 . Assim, podemos reescrever
(26) como
)
)
(27) P{1 t c s )1 1 1 + tc s )1 } = 1
em que
(28) s s)
2 xi2
=
nS xx
2 : N (0,217;0,0003505)
1 : N (0,174;0,008938)
Se quisermos calcular os intervalos de confiana de 95% para 1 e 2 , temos
de escolher corretamente o valor crtico tc. Lembre que n = 8 observaes.
Logo, t6 = 2,447, o que implica 2,5% de rea para cada cauda.
22
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Densidade
0.25
0.2
0.15
0.1
Prob = 0.025
t>2.447
Prob = 0.025
t<-2.447
0.05
0
-5
-4
-3
-2
-1
0
t
0,55
R2 Ajustado
0,52
Erro padro
2,86
Observaes
17
23
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Coeficientes
Erro padro
valor-P
Interseo
4,5
1,43
3,1
0,007
Receita
lquida
0,1
0,02
4,3
0,001
pegadinha da banca.
O valor T da tabela a estatstica de teste da Hiptese nula Ho: 2=0.
)
O IC dado por 2 tc s )2 , onde tc o valor crtico de t extrado da tabela
auxiliar t de Student.
No modelo de RLS, para n = 17 observaes, temos (n2) = 15 graus de
liberdade (GL). Para o IC bilateral 95% de confiana e 15 GL, tc = 2,131
)
2,13. Como 2 = 0,1 e s )2 = 0,02 , temos que:
)
IC: 2 tc s )2 = 0,1 2,13 0,02 .
24
www.pontodosconcursos.com.br | Prof. Alexandre Lima
2 2
s
2
s 2
NO REJEITAR H0
REJEITAR H0
0.45
REJEITAR H0
0.4
Densidade
0.35
0.3
0.25
0.2
Prob = /2
t<-t
0.15
Prob = /2
t>t
0.1
P(-tc<t<tc) = 1-
0.05
0
-5
-4
-3
-2
-1
0
t
26
www.pontodosconcursos.com.br | Prof. Alexandre Lima
a) = 0,10
P{t tc} = P{t -tc} = /2 = 0,05
Como n=8, temos n2 = 6 GL. Da tabela auxiliar, tc=1,94. Como tc < tn2 < tc ,
tn-2 se encontra na regio de aceitao. Portanto, no rejeitamos a hiptese
nula no nvel de significncia de 10%.
b) = 0,20
P{t tc} = P{t -tc} = /2 = 0,10
Da tabela auxiliar, tc = 1,44. Como tn-2>tc, tn-2 encontra-se na regio de
rejeio. Portanto, a hiptese nula rejeitada no nvel de significncia
de 20%.
Testes unilaterais (unicaudais)
At agora estudamos os testes bilaterais ou bicaudais, que se caracterizam
pela hiptese nula H0: i =0 (i=1,2), contra a alternativa H1: i 0.
Se rejeitarmos H0 em favor da alternativa H1: i 0, estaremos considerando
que i pode assumir qualquer valor negativo ou positivo, menos o zero. Ocorre
s vezes, pela natureza das variveis, que i no pode ser negativo e, dessa
forma, estabelecemos a hiptese alternativa H1: i >0. O que voc precisa
saber para a prova est explicado na sequncia.
Em um teste bilateral, a regio de rejeio composta por valores t tais que
P{t tc} = P{t -tc} = /2 . Em um teste unilateral direita, a regio de
rejeio composta por valores t tais que P(ttc) = . Na prxima figura,
temos = 5% e tc = 1,697 (30 graus de liberdade).
27
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Densidade
0.25
0.2
0.15
0.1
0.05
0
-5
-4
-3
-2
-1
0
t
(y
y ) 2 = ( y i y ) 2 + ( yi y i ) 2 .
( y
y ) 2 (SQR)
(y
y i ) 2 (SQE)
28
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1 = y (pois 1 = y 2 x = y 0.x = y ).
Portanto,
( y
y ) 2 = (1 y ) 2 = ( y y ) 2 =0 (SQR nula).
Neste caso, SQT = SQE e isto quer dizer que a varincia total de Y (y2) igual
a varincia residual 2 (varincia do erro aleatrio do modelo), ou seja,
y2 = 2 .
Vamos agora dividir os termos dos lados esquerdo e direito da equao da
ANOVA pela varincia residual 2:
(y
y)2
( y
=
y)2
(y
+
y i ) 2
y y
( yi y ) = i = n21 ,
1
2
y y
( yi y i ) = i i = n22
2
( y
y)2
22 S xx
(lembre que SQR = 22 S xx ).
2
2 ~ N 0,
.
S xx
S
2 0
= 2 xx .
/ S xx
0
z = 2
/ S
xx
= 2 S xx = SQR ,
2
2
e conclumos que a diviso de SQR por 2 resulta numa varivel aleatria quiquadrado com 1 grau de liberdade.
Assim, a equao
(y
y)2
( y
y)2
(y
y i ) 2
n21 = 12 + n2 2 ,
se, de fato, vlida a hiptese 2 = 0 .
Aprendemos que uma varivel resultante da soma de duas outras
variveis independentes n21 e n22 uma varivel n21 +n2 . Uma consequncia
da propriedade de aditividade da qui-quadrado a seguinte: se trs
variveis n2 , n21 e n22 so tais que n2 = n21 + n22 , ento a condio necessria
e suficiente para que n21 e n22 sejam independentes que n = n1 + n2.
(*) o termo tcnico seria corolrio.
Conclumos que
12 = (SQR/2)
e
30
www.pontodosconcursos.com.br | Prof. Alexandre Lima
n2 2 = (SQE/2)
so variveis qui-quadrado independentes, pois o nmero de graus de
liberdade de SQT/2 n1, caso a premissa 2 = 0 seja vlida.
Considere a estatstica F
SQR / 2
22 S xx
SQR / 1
12 / 1
1
(29) F =
,
=
=
=
SQE / 2 n22 /(n 2) SQE /(n 2)
2
n2
SQR
SQR/1
Residual
SQE
n-2
= SQE/(n-2)
Total
SQT
n-1
SQR / 1
SQE /( n 2) F1,n-2,
Pelo que foi visto at o momento, tanto faz usar t ou F no modelo de RLS. Na
verdade, F muito til para a inferncia do modelo de regresso linear
mltipla, que ser visto posteriormente.
31
www.pontodosconcursos.com.br | Prof. Alexandre Lima
( y
i
y ) 2 (variao explicada).
(y
i
y i ) 2 (variao residual).
32
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Densidade
0.2
0.15
0.1
0.05
0
0
20
40
60
80
100
120
140
Fonte de
Variao
Regresso
Residual
Total
Graus de Quadrado
Soma de
Mdio
Quadrados Liberdade
1,978
1
1,978
0,082
6
0,014
2,060
7
F
1,978
= 144 ,73
0,014
3,776
Grau de
liberdade
Soma de
quadrados
Regresso
Mdia dos
quadrados
F de significao
68.000
3,2E-10
Resduo
680
Total
85.000
Coeficientes
Erro padro
Interseo
9,59
8,73
Varivel
X1
4,76
Estatstica
t
Valor-P
33
www.pontodosconcursos.com.br | Prof. Alexandre Lima
R2 =
SQR 68.000
=
= 0,8 = 80%
SQT 85.000
GABARITO: B
O valor de X no quadro acima, aproximadamente,
A) 10,00
B) 8,73
C) 2,01
D) 0,48
E) 0,0001
Resoluo
Reta de regresso: Y = + X 1 + , em que a varivel independente X1, a
varivel dependente Y, e so os parmetros do modelo e o termo de
erro aleatrio.
Dados: = 4,76 (estimativa da declividade), SQR = 68.000.
Sabemos que
Var ( ) =
S xx
2
e que
SQR
SQR = 2 S xx S xx = 2
Logo,
34
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Var( ) =
SQR / 2
da declividade).
( ) =
2
SQR / 2
SQR / 2
680
=
68.000 / 4,76 2
4,76 2 4,76
=
0,48
100
10
GABARITO: D
Exemplo (Engenharia-BNDES/Cesgranrio/2008) Um experimento foi
realizado com o objetivo de estimar o preo de uma ao, dado o seu valor
patrimonial, ambos em reais. Uma amostra de aes negociadas recentemente
forneceu dados sobre o preo e o valor patrimonial por ao. Aplicou-se o
modelo de regresso linear simples Y = + X + . Alguns resultados da
tabela da anlise da varincia, obtida a partir dos dados dessa amostra, esto
apresentados a seguir.
ANOVA
Fontes de
variao
Grau de liberdade
Soma de quadrados
Fcalculado
56.000
Regresso
F de significncia
3,1E-14
Resduo
Total
59
88.480
35
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Fonte de
Variao
Soma de
Graus de Quadrado
Quadrados Liberdade
Mdio
Regresso
SQR
SQR/1
Residual
SQE
n2
SQE/(n2)
Total
SQT
n1
SQR / 1
SQE /( n 2) F1,n-2,
SQR / 1
SQE /( n 2)
n1 = 59 n = 60
Fcalculado =
56 .000
SQR / 1
=
= 100
SQE /( n 2) 32.480 / 58
e
=
2
i
n2
= SQE/(n 2).
Logo,
2 =
32.480
= 560 reais2
58
2
i
2
RLM
=
nk
= SQE/(n k),
S
2 = xy =
S xx
i =1
( X i X )(Yi Y )
i =1
(Xi X )
Cov( X , Y )
,
Var ( X )
1 = Y 2 X .
Observe que estamos usando uma notao diferente do enunciado: a
quantidade Sxy definida acima no a covarincia entre X e Y.
Logo, 2 = 36 / 30 = 1,2 e 1 = 19 1,2 12,5 = 4,0 . Deste modo, a reta de regresso
estimada
de Y em X Yi = 4 + 1,2 X i .
GABARITO: C
Exemplo (SUSEP/ESAF/2010) Com os dados da questo anterior,
determine o valor da estatstica F para testar a hiptese nula de que o
coeficiente angular da reta do modelo de regresso linear simples de Y em X
igual a zero.
A) 144
B) 18
C) 36
D) 72
E) 48
Resoluo
Sabemos que F =
SQR / 1
.
SQE /( n 2)
Assim,
F=
820 ,80
= 72
205,20 / 18
GABARITO: D
39
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Resumo
1 n
( xi x )( yi y ) .
n 1 i =1
- Covarincia: Cov ( X , Y ) =
Cov( X , Y )
=
- Coef. de correlao: r =
DP( X ).DP(Y )
i =1
i =1
( xi x )( yi y )
( xi x ) 2
i =1
( yi y ) 2
S xy
S xx S yy
- Somas de Quadrados:
( x )( y )
S xy = i =1 xi yi
1
n
1
S xx = i =1 x
n
( x )
1
S yy = i =1 y
n
( y )
2
i
2
i
i =1
i =1
i =1
i =1
S xy
S xx
Cov( X , Y )
DP(Y )
=r
Var ( X )
DP( X )
a = y bx
SQT = SQR + SQE
40
www.pontodosconcursos.com.br | Prof. Alexandre Lima
S xy
SQR
SQE
=1
=
= r2
R da regresso com intercepto: R =
SQT
SQT S xx S yy
2
b ~ N ,
S xx
xi2
a ~ N , var(b)
SQT = ( yi y ) 2 = S yy
SQR = ( y i y ) 2 = b 2 S xx
SQE = ( yi y i ) 2 = ei2 , em que os e i so os resduos do modelo. Os resduos
e
=
2
i
n2
SQE
a estimativa
n2
da varincia de .
Erro padro dos resduos do modelo de RLS: EP (ei ) = = 1 r 2 Y
Estatstica t para testar se h regresso (H0: = 0): t =
b
2
.
, em que s b2 =
sb
S xx
Estatstica F: F =
SQR
SQE /(n 2)
Soma de
Graus de
Quadrados Liberdade
Mdia dos
quadrados
Regresso
SQR
SQR/1
Residual
SQE
n-2
SQE/(n-2)
Total
SQT
n-1
SQR / 1
SQE /( n 2)
F1,n-2,
x y
b=
x
i
2
i
, var(b) =
2
i
e
=
2
i
n 1
y
=1
2
i
b 2 xi2
SQT
y
=1
2
i
b 2 xi2
S yy
y b x
=1
y ( y ) / n
2
i
2
i
2
i
R2 r 2
42
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Exerccios de Fixao
11,60
2,40
11,40
2,80
0,53
43
www.pontodosconcursos.com.br | Prof. Alexandre Lima
(A)
[Y ( X )]
i =1
n
(B)
[Y X ]
i =1
n
(C)
[Y ( X )]
i =1
n
(D)
[Y
2
Yi ]
( X i ) 2 ]
i =1
n
(E)
[Y
i =1
22
i =1
(X
i =1
22
(Y Y )
i
i =1
22
Yi = 286
X i = 440
2
= 1.690
X ) 2 = 850 ,
i =1
22
(X
X )(Yi Y ) = 1.105
i =1
(C) Yi = 20 + 0,65 X i
(D) Yi = 20 + 2 X i
(E) Yi = 13 + 1,3 X i
12. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) Com os dados da
questo anterior, calcule o valor mais prximo do coeficiente de determinao
R2 da regresso linear de X em Y.
(A) 0,65
(B) 0,81
(C) 0,85
(D) 0,91
(E) 0,88
13. (MDIC/ESAF/2012) Considere os valores da varivel aleatria Y
observados para determinados valores da varivel X.
X
Y
1
9
2
9
3
6
4
4
5
16
6
9
7
10
8
8
9
19
10
16
11
26
I.
II.
SQR = Yi Y
i =1
= 5.275,2
SQE = Yi Yi
= 366,6
i =1
47
www.pontodosconcursos.com.br | Prof. Alexandre Lima
4.
Gabarito
1C
2C
3E
4C
5E
6C
7C
8E
9C
10 B
11 E
12 C
13 E
14 E
15 A
16 D
17 B
48
www.pontodosconcursos.com.br | Prof. Alexandre Lima
5.
11,60
2,40
11,40
2,80
0,53
X = 11,60
s x = X = 2,40
Y = 11,40
s y = Y = 2,80
r = 0,53
Yk = a + bX k + k
em que a o intercepto, b a declividade e {ek } representa uma sequncia
independente de erros aleatrios normais com mdia zero e varincia 2 .
49
www.pontodosconcursos.com.br | Prof. Alexandre Lima
S
Cov( X , Y )
b = xy =
S xx
Var ( X )
r=
Cov( X , Y )
= 0,53
DP( X ) DP(Y )
Item correto.
GABARITO: C
3. O valor da estatstica R2 ajustado superior a 0,30.
Resoluo
50
www.pontodosconcursos.com.br | Prof. Alexandre Lima
O R2 ajustado ser definido na aula sobre regresso mltipla. Por ora, voc
somente precisa saber que o R2 igual ao R2 ajustado para o modelo de RLS.
Relao entre R2 (coeficiente de determinao) e r (coeficiente de correlao):
R2 = r 2
Logo,
F=
SQR
SQE /(n 2)
SQR = b 2 S xx = 0,62 2 S xx
S xx = ( n 1) x2 , em que x2 = s x2 .
S xx = ( n 1) x2 = 300 2,4 2 = 1.728 SQR = 0,622 1.728 = 664,24
SQT = SQR + SQE
SQT = S yy
S yy = SQT = (n 1) y2 , em que y2 = s 2y .
SQT = 300 2,82 = 2.352,00 SQE = SQT SQR = 2.352 ,00 664 ,24 = 1.687 ,76
Logo, F =
664,24
= 664,24 / 5,64 = 117,68 maior que 50 (item certo)
1.687,76 / 299
GABARITO: C
5. O erro padro para a estimativa do coeficiente b menor que 0,04.
51
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Resoluo
Sabemos que a distribuio do estimador da declividade b normal:
b ~ N ,
S xx
2
Logo o Erro Padro (EP) ou desvio padro de b EP (b) =
.
S xx
Mas no sabemos o valor da varincia 2 do erro aleatrio do modelo. Neste
caso, deve-se calcular uma estimativa do erro padro:
EPest (b) =
2
S xx
2 =
SQE 1.687,76
=
= 5,64
n2
299
5,64
= 0,06 maior que 0,04 (item errado)
1.728
GABARITO: E
6. A estimativa da varincia 2 menor que 7.
Resoluo
Varincia residual:
2 =
SQE 1.687,76
=
= 5,64 menor que 7 (item certo)
n2
299
GABARITO: C
7. A covarincia entre X e Y maior que 3.
Resoluo
Dados: r = 0,53 , s x = 2,40 , e s y = 2,80 .
52
www.pontodosconcursos.com.br | Prof. Alexandre Lima
s xy
= 0,53
sx s y
Item certo.
GABARITO: C
8. A varincia da reta ajustada Yk = a + bX k , em que a e b so as estimativas
de mnimos quadrados ordinrios e 0 < X k < 10 , menor ou igual a 2 / 301 .
Resoluo
A varincia dos resduos dada por
2 =
SQE
n2
b =
xy
x
xy
Sabemos que
53
www.pontodosconcursos.com.br | Prof. Alexandre Lima
S xy = xy
1
( x )( y ) S xy xy =
n
n
S xx = x 2
1
( x )2 S xx x2 =
n
n
S xy
As aproximaes
xy e
x
n
xy x y = xy XY
n
n n
x x
n n
x
n
X2
S xx
x2 podem ser usadas porque n = 301 um
n
nmero grande
Logo,
3,56 =
2,40
xy 11,60 11,40
n
x
=
n
11,60
2
xy = 128,96
x
n
= 140,32
Finalmente,
xy
b = 2 =
x
xy
GABARITO: C
10. (AFRFB/ESAF/2009) Na anlise de regresso linear simples, as
estimativas e dos parmetros e da reta de regresso podem ser
obtidas pelo mtodo de Mnimos Quadrados. Nesse caso, os valores dessas
estimativas so obtidos atravs de uma amostra de n pares de valores Xi Yi
com (i =1, 2, ...., n), obtendo-se: Y i= + X i , onde Y i a estimativa de Yi = + Xi.
Para cada par de valores Xi Yi com (i =1, 2, ..., n) pode-se estabelecer o desvio ou
resduo aqui denotado por ei entre a reta de regresso Yi e sua estimativa
Y i . Sabe-se que o Mtodo de Mnimos Quadrados consiste em adotar como
estimativas dos parmetros e os valores que minimizam a soma dos
quadrados dos desvios ei. Desse modo, o Mtodo de Mnimos Quadrados
consiste em minimizar a expresso dada por:
n
(A)
[Y ( X )]
i =1
54
www.pontodosconcursos.com.br | Prof. Alexandre Lima
(B)
[Y X ]
i =1
n
(C)
[Y ( X )]
i =1
n
(D)
[Y
2
Yi ]
( X i ) 2 ]
i =1
n
(E)
[Y
i =1
Resoluo
A questo forneceu todas as informaes necessrias para a resoluo.
Pelo Mtodo dos Mnimos Quadrados temos que minimizar a soma dos
quadrados das diferenas entre os valores de Yi e as respectivas estimativas
, por meio da reta de regresso. Logo teramos:
Y
i
[Y Y ] = [Y ( + X )] = [Y X ]
n
i =1
i =1
i =1
22
X i = 440
i =1
(X
i =1
22
(Y Y )
i
i =1
22
Yi = 286
2
= 1.690
X ) 2 = 850 ,
i =1
22
(X
X )(Yi Y ) = 1.105
i =1
(E) Yi = 13 + 1,3 X i
Resoluo
Modelo de regresso linear simples:
Y = + X + ,
S xy
S xx
Dados:
22
- S xy = ( X i X )(Yi Y ) = 1.105
i =1
22
- S xx = ( X i X ) 2 = 850
i =1
1 22
286
Yi =
= 13
n i =1
22
1 22
440
- mdia de X = X = X i =
= 20
n i =1
22
- mdia de Y = Y =
Logo,
b=
S xy
S xx
1.105
= 1,3
850
a = y bx = 13 1,3 20 = 13 26 = 13
( X ,Y ) =
Cov ( X , Y )
= covarincia/(desvio padro de X . desvio padro de Y)
XY
S xy
Cov( X , Y )
=
=
r=
DP( X ) DP(Y ) S xx S yy
(X
X )(Yi Y )
i =1
22
( X i X )2
i =1
22
(Y Y )
1.105
1.105
=
= 0,92
850 1.690 29,15 41,11
i =1
R 2 = r 2 = 0,922 = 0,85 .
NOTA: no confunda correlao amostral r com correlao (X,Y)! A primeira
uma estimativa da segunda. A correlao um momento estatstico. S
conseguimos calcular a correlao (X,Y) quando conhecemos a distribuio
conjunta de probabilidade de X e Y, ou seja, quando sabemos quem a funo
f(X,Y).
GABARITO: C
57
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1
9
2
9
3
6
4
4
5
16
6
9
7
10
8
8
9
19
10
16
11
26
y i = a + bxi
em que yi denota os valores dados pela reta estimativa, a a estimativa do
parmetro , e b , tambm denominado coeficiente de regresso linear, a
estimativa do parmetro .
Frmulas necessrias para estimar a reta de regresso de Y em X pelo
mtodo dos mnimos quadrados:
S xy
Estimativa da declividade: b =
S xx
Estimativa do intercepto: a = y bx
Soma dos produtos: S xy = xi yi xi yi
n i i
i
1
Soma dos quadrados de X: S xx = xi xi
n i
i
58
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1
Soma dos quadrados de Y: S yy = yi yi
n i
i
1
Mdia de Y: y = yi
n i
1
Mdia de X: x = xi
n i
10
11
X=66
16
10
19
16
26
Y=132
XY
18
18
16
80
54
70
64
171
160
286
XY=946
X2
16
25
36
49
64
81
100
121
X2=506
Assim,
y=
1
132
yi =
= 12
n i
11
x=
1
66
=6
xi =
11
n i
1
66 132
S xy = xi yi xi yi = 946
= 154
n i i
11
i
662
1
= 110
Sxx = x i x i = 506
11
n i
i
b=
S xy
S xx
154
= 1,40
110
a = y bx = 12 1, 4 6 = 3,60
GABARITO: E
14. (MDIC/2012/ESAF) Com os dados da questo 13, calcule o valor mais
prximo da variao de Y explicada pela regresso.
59
www.pontodosconcursos.com.br | Prof. Alexandre Lima
(A) 250,6
(B) 154
(C) 110
(D) 424
(E) 215,6
Resoluo
A Soma dos Quadrados da Regresso (SQR) nos d o valor da variao de Y
explicada pela regresso:
n
S xy2
i =1
S xx
SQR = ( y i y ) 2 = b 2 S xx = bS xy =
SQR = bS xy = 1,4 154 = 215,6
GABARITO: E
15. (IBGE/Cesgranrio/2010/Adaptada) Dentre os itens abaixo, identifique
as premissas bsicas para o modelo de regresso.
I.
II.
dos
termos
de
erro
deve
ser
constante
SQR = Yi Y
i =1
= 5.275,2
SQE = Yi Yi
= 366,6
i =1
R2 = 1 - 366,6/5.641,8 0,94
GABARITO: D
17. (Analista Judicirio TJ-RO/CESPE-UnB/2012) Com respeito ao
modelo de regresso linear simples, assinale a opo correta.
(A) O parmetro de inclinao da reta igual tangente do ngulo formado
entre a reta e o eixo Oy.
(B) A inclinao da reta proporcional correlao entre a varivel resposta e
a varivel preditora.
(C) Se o modelo linear estiver bem ajustado, a correlao entre o resduo do
modelo e a varivel resposta deve estar prxima de -1.
(D) Se o intercepto do modelo for nulo, a varivel resposta assume o valor
zero quando a varivel preditora for igual ao inverso da inclinao da reta.
(E) O parmetro de inclinao da reta igual ao cosseno do ngulo formado
entre a reta e o eixo Ox.
Resoluo
Anlise das opes
(A) A afirmativa correta seria: o parmetro de inclinao da reta igual
tangente do ngulo formado entre a reta e o eixo Ox. Segue a justificativa.
Seja o modelo de RLS
y = + x + ,
em que o intercepto, a declividade (coeficiente angular ou parmetro
de inclinao) da reta de regresso e denota a componente aleatria da
variao de y. O parmetro de inclinao da reta representa a variao em
E(y|x) para uma variao de 1 unidade em x. Algebricamente,
E ( y | x )
= tan( )
x
= b =
Cov( X , Y )
Var ( X )
62
como
r=
Cov( X , Y )
Cov ( X , Y ) = rDP ( X ) DP (Y )
DP( X ) DP(Y )
DP( X ) DP(Y )
rDP( X ) DP(Y )
DP(Y )
= r
= r
2
Var ( X )
DP( X )
DP ( X )
ento
1
= 1 = y
b
Opo incorreta.
(E) Opo incorreta, pois o parmetro de inclinao da reta igual tangente
do ngulo formado entre a reta e o eixo Ox.
GABARITO: B
At a prxima aula. Bons estudos!
Alexandre Lima
alexandre@pontodosconcursos.com.br
63
www.pontodosconcursos.com.br | Prof. Alexandre Lima