STAGE Anomaly detection in multivariate with GANs H/F

Stage(6 mois)
Paris
Salaire : Non spécifié
Début : 28 février 2025
Télétravail non autorisé
Expérience : < 6 mois
Éducation : Bac +5 / Master
Postuler

TotalEnergies
TotalEnergies

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

Tu seras intégré(e) à la Data Team de la TotalEnergies Digital Factory (TDF), composée de plusieurs dizaines de Data Scientists qui participent à la construction de solutions d'aide à la décision basées sur les technologies de pointe dans l'IA, e.g. Machine Learning, Optimisation, Computer Vision pour tous les métiers de la compagnie. Tu seras rattaché(e) directement à un Data Scientist de l'équipe pour étudier et cadrer l'usage de nouvelles technologies dans ce contexte.

L'objectif de ce stage Anomaly detection in multivariate time series with GANs H/F est d'étudier et d'évaluer l'apport des GANs (Generative Adversarial Networks) dans la détection d'anomalies sur les turbines éoliennes à partir des données capteurs.

La détection d'anomalies dans les capteurs éoliens est cruciale pour la maintenance prédictive et l'optimisation des performances des turbines éoliennes. Les GANs offrent une approche prometteuse pour cette tâche. Cependant, il est essentiel de tester cette technologie dans ce contexte spécifique et de l'améliorer ou explorer d'autres pistes si nécessaire. Une approche alternative pourrait consister à encoder les variables temporelles dans une image pour mieux capturer les anomalies.

Dans ce contexte, l'objectif principal est d'étudier et comparer les différentes méthodes de détection d'anomalies (classiques et basées sur les GANs) et d'explorer des approches alternatives si nécessaire. Les éléments suivants seront prépondérants pour arriver à l'objectif principal :

  • Veille scientifique sur les différentes méthodes de détection d'anomalies basées sur les GANs / AEs / ML
  • Conceptualisation et production de code pour l'application des méthodes
  • Création de POCs avec des données de capteurs des turbines éoliennes réelles

  • Comparaison avec des approches de détection d'anomalies traditionnelles
  • Mise en place d'un protocole de mesure de la performance rigoureux pour pouvoir conclure à la fin de la pertinence d'un approche complexe de Deep Learning vs une approches ML « classique ».

  • S'impliquer dans les activités transverses de l'équipe Data, en collaborant avec d'autres membres de l'équipe pour participer à l'animation de la communauté globale de la Data chez TotalEnergies.

Pourquoi utiliser des GANs pour la détection d'anomalies ?

Nous cherchons à adopter une approche non supervisée pour générer un score d'anomalie à partir d'un grand nombre de capteurs (plus de 50 à 100), et nous voulons que cette méthode soit suffisamment généralisable pour s'appliquer à différents contextes. Actuellement, les approches traditionnelles rencontrent des difficultés à gérer les problèmes de non-linéarité dans les relations complexes entre plusieurs séries temporelles. En général, les techniques classiques comparent une prédiction avec l'état actuel, ce qui fonctionne bien dans de nombreux cas, mais reste limité dans des scénarios plus complexes.

Pourquoi alors choisir un GAN (Generative Adversarial Network) ? La force de cette approche réside dans son architecture "deux en un". Le GAN se compose de deux parties : un discriminateur et un générateur (ou reconstructeur). Le discriminateur aide à identifier si une donnée est anormale ou non, tandis que le générateur produit un score d'anomalie, qui indique à quel point l'exemple est éloigné de la distribution normale. Cette dualité permet d'obtenir à la fois une détection de problème (via le discriminateur) et un score d'anomalie (via le générateur), offrant ainsi une approche plus complète que les méthodes classiques de type AutoEncoder, qui se basent uniquement sur le score de reconstruction.

Vous évoluerez au sein d'une équipe de professionnels confirmés et auprès d'un tuteur-coach, le référent de votre futur métier. Un accompagnement individualisé vous permettra de favoriser votre autonomie et de vous mener à votre diplôme !


Profil recherché

Actuellement en école d'ingénieur ou en Master dans le domaine de la Data et de l'Intelligence Artificielle, vous recherchez un stage de fin d'étude d'une durée de 6 mois à partir de février 2025 ?

Techniques :

  • Data Science/Machine Learning/Deep Learning
  • Mathématiques avancées
  • Traitement du signal

Informatiques :

  • Python
  • Github
  • PyTorch

Savoir-être :

  • Bienveillance
  • Rigueur
  • Travail d'équipe
  • Capacités d'analyse et de synthèse

Langues vivantes :

  • Anglais courant
  • Français courant

Référence :

Repo :

Alors n'attend plus, postule pour rejoindre notre équipe !

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres
Postuler