Le secteur tertiaire (bureaux, commerces, administrations, écoles, hôtels…) représente environ 10 % des émissions de gaz à effet de serre (GES) en France, soit presque autant que le secteur industriel. Chez LHIRR, nous menons des missions de conseil et d’accompagnement pour réduire significativement l’empreinte carbone des bâtiments tertiaires. Nos analyses récentes ont montré qu’une optimisation des systèmes énergétiques (chauffage, climatisation, automatisation…) peut réduire les émissions de CO₂ jusqu’à 30 %, sans investissements majeurs ni travaux lourds.
Pour atteindre ces résultats, nous collectons une vaste quantité de données hétérogènes (consommation d’énergie, températures, pressions, positions de vannes, etc.) afin d’analyser et optimiser le fonctionnement des bâtiments. Actuellement, ces données sont souvent stockées de manière ad hoc, projet par projet, sans être pleinement valorisées.
Objectifs
Nous souhaitons accélérer et améliorer le traitement de ces données en masse, pour évaluer l’efficacité énergie / carbone des actions engagées, benchmarker les bâtiments entre eux et simplifier la gestion des données collectées par LHIRR. Le stagiaire réalisera des allers-retours entre analyses de données réelles (consommations, émissions, fonctionnement) et la conception d’une architecture de données permettant de structurer et valoriser ces informations. L’un des moyens identifiés est de mettre en place une architecture de type Data Lake, en trois couches : la couche Bronze, qui stocke les données brutes non transformées ; la couche Silver, avec des données nettoyées, enrichies et organisées selon un modèle commun ; et la couche Gold, regroupant les données prêtes pour l’analyse et la visualisation.
Missions :
Analyse de données (~1/3 du temps) :
Architecture de données (~1/3 du temps) :
Etudier les options techniques et concevoir l’architecture globale en collaboration avec les utilisateurs chez LHIRR, notre expert data, et ChatGPT.
Modéliser et créer un modèle de données pour la couche Silver (données nettoyées et enrichies), développer les pipelines ETL pour transformer les données brutes en données prêtes à l’usage, et pérenniser les analyses (couche Gold).
Optimiser l’expérience utilisateur (faciliter le dépôt et la récupération de données, visualiser simplement les données disponibles, etc.)
Participation à nos missions habituelles (~1/3 du temps) :
Contribuer aux projets de stratégie de décarbonation pour des patrimoines immobiliers (plus de 100 bâtiments).
Participer à l’analyse de la consommation et du fonctionnement de grands bâtiments parisiens (plus de 10 000 m²).
Intervenir dans l’optimisation des systèmes énergétiques.
Pour se chauffer, s’éclairer, se ventiler, se climatiser ou encore produire de l’eau chaude, les bâtiments tertiaires s’appuient sur des équipements énergivores, souvent méconnus du grand public, et pilotés par des systèmes informatiques de gestion technique du bâtiment (GTB). Cependant, ces systèmes sont fréquemment mal conçus ou mal paramétrés. LHIRR aide ses clients à réduire leur consommation et leurs émissions de GES en combinant analyses sur site et évaluation de la performance des équipements et de la configuration des systèmes. Dans le cadre de nos missions, nous sommes donc amenés à collecter de grandes quantités de données diverses, telles que :
Consommations d’énergie : données issues d’Enedis, GRDF, CPCU, compteurs divers, avec une fréquence de collecte allant de 5 minutes à un mois, parfois pour des centaines de bâtiments en simultané.
Données de fonctionnement des équipements : réglages de température, pressions d’air neuf, horaires de fonctionnement, etc. – un bâtiment peut générer des centaines de milliers de points de données chaque jour.
Données diverses : surface des bâtiments, localisation, températures extérieures, irradiation solaire, …
Ces informations présentent un potentiel encore peu exploité. L’optimisation de nos méthodes, tant pour l’analyse que pour la gestion de ces données massives, est donc un enjeu stratégique pour LHIRR.
L’architecture Data Lake que nous envisageons, qui utilise des processus « Extract, Transform, Load » pour transformer et enrichir les données, est actuellement privilégié pour sa capacité à stocker de grandes quantités d’informations à faible coût. Cependant, nous restons ouverts à d’autres solutions : le candidat pourra explorer et proposer des approches différentes pour répondre aux enjeux d’analyse et de visualisation des données. Cette liberté permettra d’adapter au mieux l’infrastructure à nos besoins et de vous offrir une expérience stimulante et enrichissante.
Environnement technique potentiel (à confirmer par les recherches du stagiaire) :
Python (pandas, numpy)
ETL : AWS Athena, Jobs Spark ou PySpark orchestrés par AWS Glue,
Stockage : AWS S3
Outils de visualisation de données : Tableau, matplotlib, Graphana, Excel
Vous êtes passionné(e) par les sujets liés à la décarbonation, curieux(se) et prêt(e) à explorer les fonctionnements divers des systèmes et équipements. Vous appréciez le terrain et la gestion de projet, vous êtes à l’aise avec les outils numériques (Python, Excel, bases de données) et avez des bases en physique applicable au bâtiment (thermodynamique, thermique, fluides) ?
Notre équipe cherche à intégrer de jeunes ingénieur(e)s pour enrichir sa démarche d’évolution des pratiques d’ingénierie pour faciliter la transition énergétique et carbone du bâtiment.
Compétences et qualités recherchées :
Curiosité et autonomie ; une connaissance préalable du monde du bâtiment n’est pas requise.
Vision d’ingénieur : capacité à naviguer entre raisonnements en ordres de grandeur et analyses détaillées.
Intérêt marqué pour la transition énergétique et la décarbonation
Niveau « intermédiaire à élevé » en Python (vous avez déjà mené un projet de A à Z , par exemple dans le cadre d’un cours, d’un projet de recherche, ou de stage)
Compétences de base à avancées en Excel
Notions de modélisation de données
Nous nous vous envoyons quelques questions auxquelles nous vous demandons de répondre librement (la manière nous intéresse autant que le contenu, répondez de la façon qui vous représente le mieux : vidéo, audio, texte, dessin, chanson, …) ;
Vous rencontrez l’ingénieur encadrant dans nos locaux, un café ou en visio selon nos contraintes respectives ;
Vous rencontrez un autre ingénieur LHIRR pour confirmer notre intérêt mutuel ;
Pour ce stage, il vous sera demandé de nous présenter l’un des projets Python que vous avez eu l’occasion de mener. Pas d’autocensure sur ce point : nous évaluerons autant votre approche que la complexité technique du projet.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Vélizy-Villacoublay