Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fmsa315 - s11 - A.ipynb - Fernández - Constanza
Fmsa315 - s11 - A.ipynb - Fernández - Constanza
En utilisant la base de données jointe à l'atelier, vous devez compléter les étapes suivantes, en n'oubliant pas de répondre en ajoutant si
nécessaire une case de code et/ou un texte.
Il n'était pas possible de sauvegarder automatiquement. Ce fichier a été mis à jour à distance ou dans un autre onglet. Montrer les différences
import statsmodels.api as sm
import statsmodels.formula.api as smf
import matplotlib.pyplot as plt
from statsmodels.graphics.regressionplots import abline_plot
import numpy as np
import seaborn as sns
import io
df.head()
•
pays région PIB l'école vie co2
Il n'était pas possible de sauvegarder automatiquement. Ce fichier a été mis à jour à distance ou dans un autre onglet. Montrer les
différences
<class 'pandas.core.frame.DataFrame'>
RangeIndex : 194 entrées, 0 à 193
Donn Colonnes (6 colonnes au total) :
ées Colonnes Compte non nul Type de
# Colonne données
0 pays 194 non nul objet
1 région 194 non nul objet
2 PIB 179 non nul float64
3 l'école 188 non nul float64
4 vie 194 non nul float64
5 co2 185 non nul float64
dtypes : float64(4), object(2) utilisation de la mémoire : 9.2+ KB
df.corr()
<class 'pandas.core.frame.DataFrame'>
Int64Index : 175 entrées, 0 à 193
Colonnes de données (6 colonnes au total) :
# Colonne Non-nulle Compte Type
0 pays 175 non nul objet
1 région 175 non nul objet
2 PIB 175 non nul float64
3 l'école 175 non nul float64
4 vie 175 non nul float64
5 co2 175 non nul float64
dtypes : float64(4), object(2) utilisation de la mémoire : 9.6+ KB
df.corr()
Il n'était pas possible de sauvegarder automatiquement. Ce fichier a été mis à jour à distance ou dans un autre onglet. Montrer les
différences
1 0.58
0.9
042
# Résumé du modèle
Il n'était pas possible de sauvegarder automatiquement. Ce fichier a été mis à jour à distance ou dans un autre onglet. Montrer les
différences df).fit()
—
Dép. variable PIB R-carré : 0.769
Modèle : MCO Adj. R-carré : 0.764
Méthode : Moindres Statistique F : 189.2
Date : carrés
Mon , 27 Dec 2021 Prob (F-statistique) : 4.26e-54
Le temps : 02:43:37 Vraisemblance logarithmique : -1791.2
Non. Observations : 175 AIC : 3590.
Résidus Df : 171 BIC : 3603.
Df Modèle : 3 non robustes
Covariance Type :
======================== ==========
std err t P>||t| [0.025
coef 0.975]
Intercept -1.983e+04 4250.157 -4.665 0.000 -2.82e+04 -1.14e+04
l'école 651.8583 259.089 2.516 0.013 140.434 1163.283
vie 301.8879 78.581 3.842 0.000 146.775 457.001
co2 362.4311 22.374 16.198 0.000 318.266 406.597
======================== ==========
36.887 Durbin-Watson :
Omnibus : 1.850
Prob(Omnibus) : 0.000 Jarque-Bera (JB) : 67.548
Obliquité : 1.020 Prob(JB) : 2.15e-15
Kurtosis 5 258 Cond. Non. 600.
:
Avertissements :
[1] Les erreurs standard supposent que la matrice de covariance des erreurs est correctement
spécifiée.
mod.summary()
Résultats de la régression
Variable dépendante MCO
: PIB R-carré : 0.769
Modèle : MCO Adj. R au carré : 0,764
Méthode : Moindres carrés Statistique F : 189.2
Date : Lun, 27 Dec 2021 Prob (statistique F) : 4,26e-
54
Le temps : 02:08:23
Vraisemblance logique : -
Non. Observations : 175
1791.2
Résidus Df : 171
AIC : 3590.
Df Modèle : 3
BIC : 3603.
Type de covariance : non robuste coef
std err
t P>|t|| [0.025 0.975]
Intercept -1.983e+04 4250.157 -4.665 0,000 -2,82e+04 -1,14e+04
école 651.8583 259.089 2.516 0.013 140.434 1163.283
vie 301.8879 78.581 3.842 0.000 146.775 457.001
co2 362.4311 22.374 16.198 0.000 318.266 406.597
Omnibus : 36 887 Durbin-Watson : 1 850
Prob(Omnibus) : 0.000 Jarque-Bera (JB) : 67.548
Il n'était pas possible de sauvegarder automatiquement. Ce fichier a été mis à jour à distance ou dans un autre onglet. Montrer les différences
Avertissements :
[1] Les erreurs standard supposent que la matrice de covariance des erreurs est correctement spécifiée.
4. Quel est l'effet causal que vous souhaitez estimer ? Pourquoi est-ce intéressant ?
L'effet causal que nous voulons estimer avec la variable Produit intérieur brut (PIB) est la sous-variabilité en termes d'autres variables (scolarité, vie
et émissions de CO2) et la manière dont elles influencent les autres. En réalisant un modèle de régression linéaire simple ou multiple, vous
apprenez à faire abstraction des informations existantes et à trouver ce qui est vraiment pertinent et vous donne des informations réelles et
cohérentes Le produit intérieur brut est la valeur totale des biens et services produits sur le territoire d'un pays au cours d'une période donnée, sans
duplication. Elle peut être obtenue par la différence entre la valeur brute de la production et les biens et services consommés au cours du processus
de production lui-même, aux prix d'achat (consommation intermédiaire). Cette variable peut également être obtenue en termes nets en déduisant du
PIB la valeur ajoutée et la consommation de capital des biens d'équipement utilisés dans la production.
Une brève analyse de la régression multiple permet d'observer des variables qui n'apportent pas beaucoup d'informations et qui deviennent des
variables qui entachent le modèle.
7. Quelles sont les variables non prises en compte qui pourraient affecter la variable expliquée ? Justi^que.
En plus des variables déjà analysées, la taille de la population des pays doit être prise en compte afin d'évaluer le PIB par habitant et de pouvoir
ainsi acheter le revenu par individu. Une autre variable qui peut être ajoutée est l'inflation que connaissent les pays et l'exercice consiste à trouver
le PIB réel que chaque pays obtient en un an.
Il n'était pas possible de sauvegarder automatiquement. Ce fichier a été mis à jour à distance ou dans un autre onglet. Montrer les différences