Prédiction de la consommation énergétique et des émissions de CO2 des bâtiments

Contexte & Objectif

La ville de Seattle souhaite atteindre son objectif de ville neutre en émission de carbone en 2050. Des relevés minutieux ont été effectués par les agents de la ville en 2016. Ces relevés sont coûteux à obtenir !

J’interviens dans cette mission pour tenter de prédire les émissions de CO2 et la consommation totale d’énergie de bâtiments non destinés à l’habitation. La prédiction doit se baser sur les données structurelles des bâtiments (taille et usage des bâtiments, date de construction, situation géographique, etc.)

Problématique : Peut-on prédire la performance énergétique d’un bâtiment non résidentiel à partir de ses caractéristiques structurelles, et quel modèle offre les meilleures performances prédictives ?

Outils & Méthodes

Langage : Python (matplotlib, seaborn, numpy, pandas, scikit-learn, …)

Autres éléments : Github, Git, Visual Studio Code, Terminale, UV (=package manager).

Etape 0 – Configuration de l’environnement de travail

Etape 1 – Structuration et nettoyage des données 

Etape 2 – Réalisation d’une analyse exploratoire (EDA) 

Etape 3 – Feature Engineering

Etape 4 – Mise en place d’une pipeline de modélisation robuste

Etape 5 – Modélisation (Régression Linéaire, Random Forest, Gradient Boosting, SVM) 

Etape 6 –  Optimisation du modèle retenu et interprétation des résultats 

Résultats & Livrables

Les variables structurelles et fonctionnelles des bâtiments permettent d’expliquer environ 59 % de la variance de la consommation énergétique et 43 % de celle des émissions de CO₂.

Ces performances, obtenues via un modèle de Gradient Boosting optimisé, démontrent une capacité prédictive significative malgré la forte variabilité et l’asymétrie des données.

L’analyse des importances met en évidence le rôle prépondérant :

  • de la surface du bâtiment

  • du type d’usage principal
    dans l’estimation des consommations et émissions.

Le modèle constitue une base exploitable pour l’aide à la décision en matière de performance énergétique et de planification environnementale. 

Quelques visualisations extraites de l’analyse :