Performance énergétique et big data : nos outils favoris

Data


Malgré les années qui défilent, Excel reste un indispensable en matière de gestion des données. Mais pour le pilotage de la performance énergétique, on peut trouver mieux : les volumes de données vont crescendo – d’autant plus depuis les exigences de la réglementation RT2012 –, et on cherche à limiter les erreurs de saisie en se tournant vers de plus en plus d’automatisation. En bref, Excel atteint rapidement ses limites… Heureusement, d’autres outils existent, notamment en open source, pour assurer une bonne gestion de la performance énergétique. Voici ceux que nous utilisons depuis plusieurs années pour les projets de suivi et de garantie de performance énergétique.

Performance énergétique : les outils du big data

Les outils pour analyser et visualiser les données énergétiques

Python, un langage de programmation flexible

Aussi souple qu’un reptile, Python est un langage de programmation facile à prendre en main, qui permet une approche orientée objet. Très utilisé par les analystes de données et les data scientists, il s’exécute directement sous forme de scripts. Cela permet une souplesse dans la création et le test de divers algorithmes, avec un process itératif et agile. De plus, sa syntaxe est simple d’utilisation avec des mots usuels en anglais (print, if, drop) qui facilitent l’écriture des programmes.

Au passage, Python permet de charger et d’analyser de gros volumes de données. Mais les avantages ne s’arrêtent pas là : le fichier source reste une référence brute et n’est pas manipulé, des scripts d’analyse différents peuvent être testés sur une partie des données avant déploiement. Bonus : on dispose de librairies puissantes pour manipuler des données issues d’autres domaines.

Des librairies pour manipuler les données

Diverses librairies ou bibliothèques écrites pour le langage de programmation Python rendent la manipulation et l’analyse des données bien plus rapides, avec des fonctions très puissantes précodées. Nous utilisons notamment les librairies suivantes…

NumPy Permet de manipuler des matrices ou des tableaux multi-dimensionnels et d’y appliquer des fonctions mathématiques.
SciPy Fédère un ensemble de bibliothèques à usage scientifique avec des modules sur l’optimisation, le calcul algébrique, les statistiques et les calculs de probabilité de base.
Pandas Permet d’analyser plus facilement des données à travers une structuration de celles-ci et la manipulation de tableaux numériques et de séries temporelles.
Scikit Learn Permet de faire du machine learning sur les données collectées pour, par exemple, combler des trous de données ou faire des prévisionnels. Des instituts français d’enseignement supérieur et de recherche comme Inria et Télécom ParisTech contribuent au développement de cette librairie.

 

Plotly, un outil de visualisation

Plotly est un outil particulièrement utile pour la data visualisation : en s’appuyant sur une librairie JavaScript, il permet de créer facilement des graphiques interactifs. En sachant que tout projet nécessite des données nettoyées, structurées et exploitables, l’outil a l’avantage de fournir une présentation visuelle et digeste, facilitant ainsi les prises de décisions. D’un point de vue technique, le grand avantage de Plotly est d’être utilisable via plusieurs langages de programmation dont Python, R, et JavaScript. Dans le bâtiment, on dirait qu’il s’agit d’un outil « interopérable » !

Les outils de travail collaboratifs

JupyterHub

Derrière ce nom de station spatiale se cache une application web qui permet de programmer dans plus de 40 langages de programmation – Oui, rien que ça. – dont Python, Julia, Ruby, R ou encore Scala2. Avec elle, on peut réaliser des notebooks (fichiers contenant du code à exécuter et organisés en cellules) et des programmes alliant texte markdown et code. Il est également possible d’intégrer les outils précédemment cités et de rendre le tout accessible à tous, sans oublier que tout est hébergé dans le cloud : terminée la souffrance de l’ordinateur qui fume face à d’innombrables données !

Avec JupyterHub, on peut notamment réaliser une pré-analyse, trier et nettoyer les données en impliquant plusieurs membres de l’équipe. Inspection, approfondissement du code et analyses deviennent collaboratifs, et ce, sans transfert de rapports ou de divers documents. De quoi s’assurer des données de qualité et cohérentes dès le début et pendant tout le projet !

À noter

Google Colab propose depuis peu, en mode beta, la création et le partage de notebooks pour tout détenteur d’un compte Google, y compris gratuit. Idéal pour faire un premier test !

 

Virtual Building Platform, la plateforme Data d’Openergy

En plus des outils présentés plus haut, nous avons développé chez Openergy une plateforme Data, qui permet d’automatiser les étapes d’import, de nettoyage et d’analyse des données. Les algorithmes développés dans un premier temps en notebook, en mode « prototype », peuvent ainsi être mis en production sur la plateforme, de façon à automatiser le workflow d’analyse de données. Ensuite, on a plus qu’à générer les dashboards nécessaires au projet (en Plotly, bien sûr) !

 

💡 À lire : Quels sont les enjeux et les cadres d’une simulation thermique dynamique ? 💡

D’autres outils de la performance énergétique : quand il n’y en a plus…

R

R est un langage de programmation également utilisé pour l’analyse de données. Contrairement à Python qui est plus généraliste, R est plutôt dédié aux analyses statistiques.

Ainsi, R sera plus adapté pour l’analyse de données avec des projets lourds en statistiques. Les chercheurs et statisticiens font donc naturellement partie des principaux utilisateurs de ce langage. À noter également que l’apprentissage de R est moins simple et rapide que Python.

Tableau Software

Avec Tableau Software, on peut visualiser ses données avec les tendances et les informations essentielles à connaître. Si la plateforme est robuste et évolutive, elle ne permet pas de traiter les données en amont… et elle est payante !

Grafana

Enfin, l’outil Grafana permet, lui aussi, de créer des tableaux de visualisation de données.

🔎 Retrouvez aussi le décret tertiaire en infographie ! 🔎

Vous avez désormais un véritable arsenal pour analyser et visualiser des données afin de comparer les consommations énergétiques réelles à celles obtenues suite à des simulations énergétiques. Puissants, flexibles et simples à prendre en main, ils doivent devenir vos alliés dans votre mission pour améliorer la performance énergétique des bâtiments. À condition de ne pas négliger la phase d’apprentissage et l’infrastructure, garants d’une utilisation optimale !

Crédit photo : Pexels / NESA by Makers

Amah Jean Abaglo

Amah Jean Abaglo

OPENERGY | Smart Energy Manager