Está en la página 1de 6

WORKSHOP SEMANA 11

Considerando o banco de dados anexado à oficina você deve completar os seguintes passos, lembre-se de responder adicionando se
necessário uma caixa de código e / ou texto

1. Anote as bibliotecas necessárias para executar o(s) código(s).


2. Importe e limpe corretamente (se necessário) o banco de dados.
3. Desenvolve um modelo de regressão linear múltipla onde a variável explicada é o Produto Interno Bruto (PIB) do país.
4. Qual é o efeito causal que você deseja estimar? Por que é interessante?
5. Conclua globalmente sobre os resultados do modelo.
^. Conclua de forma particular os resultados do modelo.
7. Quais variáveis não consideradas poderiam afetar a variável explicada? Justi^que.

do google.colab importar arquivos carregados = files.upload()

Escolha arquivos nations_gdp_s... life_co2.csv


• nations_gdp_school_life_co2.csv(application/vnd.ms-excel) - 11654 bytes, última modificação: 26/12/2021 - 100% concluído
Salvar naçõesgdpvida escolarco2.csv para naçõesgdpvida escolarco2 (1).csv

Não foi possível salvar automaticamente. Esse arquivo foi atualizado remotamente ou em outra guia. Mostrar diferenças

importar statsmodels.api como sm


Importar statsmodels.formula.api como SMF
importar matplotlib.pyplot como plt
de statsmodels.graphics.regressionplots importar abline_plot
Importar numpy como NP
Importar Seaborn como SNS

Importar statsmodels.formula.api como SMF

# Observar dados

Importação de E/S

df = pd.read_csv(io. BytesIO(carregado['nations_gdp_school_life_co2.csv']), sep=';', decimal=",",encoding='ISO-8859-1')


impressão (df)

Região do País RGP escola VIDA CO2


D
0 Argélia África 7300.399902 6.716667 72.316666 15.00
1 Benim África 1338.800049 3.100000 54.733334 1.20
2 Botsuana África 12307.400390 8.600000 52.250000 9.20
3 Burquina Faso África 1063.400024 1.300000 53.783333 0.20
4 Burundi África 349.200012 2.483333 48.866665 0.10
.. ... ... ... ... ... ...
189 Samoa Oceânia 4012.600098 10.300000 71.533333 3.10
190 Ilhas Salomão Oceânia 2249.199951 4.500000 66.500000 1.40
191 Tonga Oceânia 4072.199951 10.133333 71.833336 4.85
192 Tuvalu Oceânia Nan Nan 66.033333 Nan
193 Vanuatu Oceânia 3809.800049 6.700000 69.966667 1.50
[194 linhas x 6 colunas]

df.cabeça()


País região RGPD escola VIDA CO2

0 Argélia África 7300.399902 6.716667 72.316666 15.0

1 Benim África 1338.800049 3.100000 54.733334 1.2

2 Botsuana África 12307.400390 8.600000 52.250000 9.2

3 Burquina Faso África 1063.400024 1.300000 53.783333 0.2

4 Burundi África 349.200012 2.483333 48.866665 0.1

Não foi possível salvar automaticamente. Esse arquivo foi atualizado remotamente ou em outra guia. Mostrar diferenças

<classe 'pandas.core.frame.DataFrame'>
RangeIndex: 194 entradas, 0 a 193
Data colunas (total de 6 colunas):
# Coluna Contagem não nula Dtype

0 País 194 não-nulo objeto


1 região 194 não-nulo objeto
2 RGPD 179 não-nulo Flutuaç
3 escola 188 não-nulo ão64
Flutuaç
4 VIDA 194 não-nulo ão64
Flutuaç
5 CO2 185 não-nulo ão64
Flutuaç
dtypes: float64(4), object(2) uso de memória: 9.2+ KB

df.corr()

RGPD escola VIDA CO2

RGPD 1.000000 0.573280 0.611219 0.826819

escola 0.573280 1.000000 0.725207 0.416818

VIDA 0.611219 0.725207 1.000000 0.445990


#Eliminar linhas que têm NaN df.dropna(inplace=True) df.info()

<classe 'pandas.core.frame.DataFrame'>
Int64Index: 175 entradas, 0 a 193
Colunas de dados (total de 6 colunas):
# coluna contagem não nula dtype
0 País 175 não-nulo objeto
1 região 175 não-nulo objeto
2 RGPD 175 não-nulo Flutuaç
3 escola 175 não-nulo ão64
Flutuaç
4 VIDA 175 não-nulo ão64
Flutuaç
5 CO2 175 não-nulo ão64
Flutuaç
dtypes: float64(4), object(2)ão64
uso de memória: 9.6+ KB

df.corr()

Não foi possível salvar automaticamente. Esse arquivo foi atualizado remotamente ou em outra guia. Mostrar diferenças

lacuna scnooi lire coz M

RGPD 1.000000 0.580460 0.614272 0.826819

escola 0.580460 1.000000 0.735768 0.422787

VIDA 0.614272 0.735768 1.000000 0.443450

CO2 0.826819 0.422787 0.443450 1.000000

sns.heatmap(df.corr(), cmap="RdBu", annot=True);


O

1 0.58

0.9

042

# Resumo do Modelo

mod = smf.ols('gdp ~escola+vida+CO2', df).fit() mod.params

Intercept -19827.455018 escola 651.858271


VIDA 301.887907
CO2 362.431085
dtype: float64 mod = smf.ols('gdp ~school+life+CO2 mod.params print(mod.summary())

Não foi possível salvar automaticamente. Esse arquivo foi atualizado remotamente ou em outra guia. Mostrar diferenças
df).fit()

Variável Dep.: RGPD R-quadrado: 0.769
Modelo: OLS Adj. R-quadrado: 0.764
Método: Mínimos Estatística F: 189.2
Data: quadrados
Seg , 27 Dez 2021 Prob (estatística F): 4,26E-54
Hora: 02:43:37 Log-Probabilidade: -1791.2
Não. Observações: 175 AIC: 3590.
Resíduos Df: 171 BIC: 3603.
Modelo Df: 3 não robustos
Tipo de covariância:

======================== ==========
ERRO STD t P>|t| [0.025
COEF 0.975]
Interceptação -1.983e+04 4250.157 -4.665 0.000 -2,82e+04 -1,14e+04
escola 651.8583 259.089 2.516 0.013 140.434 1163.283
VIDA 301.8879 78.581 3.842 0.000 146.775 457.001
CO2 362.4311 22.374 16.198 0.000 318.266 406.597

======================== ==========
36.887 Durbin-Watson:
Autocarro: 1.850
Prob(Omnibus): 0.000 Jarque-Bera (JB): 67.548
Enviesar: 1.020 Prob(JB): 2.15e-15
Curtose: 5.258 Cond. Não. 600.

Avisos:
[1] Os erros padrão pressupõem que a matriz de covariância dos erros está especificada
corretamente.

mod.resumo()

Resultados da regressão
Variável Dep.: PIB OLS R-quadrado: 0.769
Modelo: OLS Adj. R-quadrado: 0,764
Método: Mínimos quadrados Estatística F: 189.2
Data: Seg, 27 Dez 2021 Prob (estatística F): 4.26e-
54
Hora: 02:08:23
Log-Verossimilhança: -
Não. Observações: 175
1791.2
Resíduos Df: 171
AIC: 3590.
Modelo Df: 3
BIC: 3603.
Tipo de covariância: não robusto coef
std err
t P>|t| [0.025 0.975]
Interceptação -1.983e+04 4250.157 - 0,000 -2,82e+04 -1,14e+04
4.665
escola 651.8583 259.089 2.516 0.013 140.434 1163.283
Vida 301.8879 78.581 3.842 0.000 146.775 457.001
CO2 362,4311 22.374 16.198 0.000 318.266 406.597
Autocarro: 36.887 Durbin-Watson: 1.850
Prob(Omnibus): 0.000 Jarque-Bera (JB): 67.548

Não foi possível salvar automaticamente. Esse arquivo foi atualizado remotamente ou em outra guia. Mostrar diferenças

Avisos:
[1] Os Erros Padrão pressupõem que a matriz de covariância dos erros está especificada corretamente.

4. Qual é o efeito causal que você deseja estimar? Por que é interessante?

O Efeito Causal que queremos estimar com a variável Produto Interno Bruto (PIB), é a subvariabilidade em razão de outras variáveis (escolaridade,
vida e emissões de CO2) e a forma como elas se relacionam com as demais. Ao executar um modelo de regressão linear única ou múltipla, você
aprende a desconsiderar as informações existentes e encontrar o que é realmente relevante e nos dá informações reais e consistentes. O Produto
Interno Bruto é o valor total dos bens e serviços produzidos no território de um país num determinado período, Livre de duplicações. Pode ser
obtido através da diferença entre o valor bruto da produção e os bens e serviços consumidos durante o próprio processo de produção, a preços de
aquisição (consumo intermediário). Esta variável também pode ser obtida em termos líquidos, deduzindo-se do PIB o valor acrescentado e o
consumo de capital ^jo dos bens de equipamento utilizados na produção.

5. Conclua globalmente sobre os resultados do modelo.


Ao concluir globalmente, pode-se a^rmar que a variável PIB em relação às demais variáveis estudadas, obtém um R-quadrado (R2) de 76,9%, este
valor nos diz que as variáveis são signi^cativas
^. Conclua de forma particular os resultados do modelo.

A partir de uma breve análise da regressão múltipla realizada, é possível visualizar variáveis que não nos dão muita informação e se tornam
variáveis que mancham o modelo

7. Quais variáveis não consideradas poderiam afetar a variável explicada? Justi^que.

Além das variáveis já analisadas, deve-se considerar a quantidade de população que os países possuem e, assim, o PIB per capita poderia ser
avaliado e, assim, poder comprar a renda pelos indivíduos. Outra variável que pode ser acrescentada é a in^ação experimentada pelos países e
realizar o exercício de encontrar o PIB real obtido por cada país em um ano.

Não foi possível salvar automaticamente. Esse arquivo foi atualizado remotamente ou em outra guia. Mostrar diferenças

• 0 s correu 23:43

También podría gustarte