Prédiction de la consommation énergétique et des émissions de CO2 des bâtiments
Contexte & Objectif
La ville de Seattle souhaite atteindre son objectif de ville neutre en émission de carbone en 2050. Des relevés minutieux ont été effectués par les agents de la ville en 2016. Ces relevés sont coûteux à obtenir !
J’interviens dans cette mission pour tenter de prédire les émissions de CO2 et la consommation totale d’énergie de bâtiments non destinés à l’habitation. La prédiction doit se baser sur les données structurelles des bâtiments (taille et usage des bâtiments, date de construction, situation géographique, etc.)
Problématique : Peut-on prédire la performance énergétique d’un bâtiment non résidentiel à partir de ses caractéristiques structurelles, et quel modèle offre les meilleures performances prédictives ?
Outils & Méthodes
Langage : Python (matplotlib, seaborn, numpy, pandas, scikit-learn, …)
Autres éléments : Github, Git, Visual Studio Code, Terminale, UV (=package manager).
Etape 0 – Configuration de l’environnement de travail
Etape 1 – Structuration et nettoyage des données
Etape 2 – Réalisation d’une analyse exploratoire (EDA)
Etape 3 – Feature Engineering
Etape 4 – Mise en place d’une pipeline de modélisation robuste
Etape 5 – Modélisation (Régression Linéaire, Random Forest, Gradient Boosting, SVM)
Etape 6 – Optimisation du modèle retenu et interprétation des résultats
Résultats & Livrables
Les variables structurelles et fonctionnelles des bâtiments permettent d’expliquer environ 59 % de la variance de la consommation énergétique et 43 % de celle des émissions de CO₂.
Ces performances, obtenues via un modèle de Gradient Boosting optimisé, démontrent une capacité prédictive significative malgré la forte variabilité et l’asymétrie des données.
L’analyse des importances met en évidence le rôle prépondérant :
de la surface du bâtiment
du type d’usage principal
dans l’estimation des consommations et émissions.
Le modèle constitue une base exploitable pour l’aide à la décision en matière de performance énergétique et de planification environnementale.
Quelques visualisations extraites de l’analyse :





