Tu seras intégré(e) à la Data Team de la TotalEnergies Digital Factory (TDF), composée de plusieurs dizaines de Data Scientists qui participent à la construction de solutions d'aide à la décision basées sur les technologies de pointe dans l'IA, e.g. Machine Learning, Optimisation, Computer Vision pour tous les métiers de la compagnie. Tu seras rattaché(e) directement à un Data Scientist de l'équipe pour étudier et cadrer l'usage de nouvelles technologies dans ce contexte.
L'objectif de ce stage Anomaly detection in multivariate time series with GANs H/F est d'étudier et d'évaluer l'apport des GANs (Generative Adversarial Networks) dans la détection d'anomalies sur les turbines éoliennes à partir des données capteurs.
La détection d'anomalies dans les capteurs éoliens est cruciale pour la maintenance prédictive et l'optimisation des performances des turbines éoliennes. Les GANs offrent une approche prometteuse pour cette tâche. Cependant, il est essentiel de tester cette technologie dans ce contexte spécifique et de l'améliorer ou explorer d'autres pistes si nécessaire. Une approche alternative pourrait consister à encoder les variables temporelles dans une image pour mieux capturer les anomalies.
Dans ce contexte, l'objectif principal est d'étudier et comparer les différentes méthodes de détection d'anomalies (classiques et basées sur les GANs) et d'explorer des approches alternatives si nécessaire. Les éléments suivants seront prépondérants pour arriver à l'objectif principal :
Pourquoi utiliser des GANs pour la détection d'anomalies ?
Nous cherchons à adopter une approche non supervisée pour générer un score d'anomalie à partir d'un grand nombre de capteurs (plus de 50 à 100), et nous voulons que cette méthode soit suffisamment généralisable pour s'appliquer à différents contextes. Actuellement, les approches traditionnelles rencontrent des difficultés à gérer les problèmes de non-linéarité dans les relations complexes entre plusieurs séries temporelles. En général, les techniques classiques comparent une prédiction avec l'état actuel, ce qui fonctionne bien dans de nombreux cas, mais reste limité dans des scénarios plus complexes.
Pourquoi alors choisir un GAN (Generative Adversarial Network) ? La force de cette approche réside dans son architecture "deux en un". Le GAN se compose de deux parties : un discriminateur et un générateur (ou reconstructeur). Le discriminateur aide à identifier si une donnée est anormale ou non, tandis que le générateur produit un score d'anomalie, qui indique à quel point l'exemple est éloigné de la distribution normale. Cette dualité permet d'obtenir à la fois une détection de problème (via le discriminateur) et un score d'anomalie (via le générateur), offrant ainsi une approche plus complète que les méthodes classiques de type AutoEncoder, qui se basent uniquement sur le score de reconstruction.
Vous évoluerez au sein d'une équipe de professionnels confirmés et auprès d'un tuteur-coach, le référent de votre futur métier. Un accompagnement individualisé vous permettra de favoriser votre autonomie et de vous mener à votre diplôme !
Actuellement en école d'ingénieur ou en Master dans le domaine de la Data et de l'Intelligence Artificielle, vous recherchez un stage de fin d'étude d'une durée de 6 mois à partir de février 2025 ?
Techniques :
Informatiques :
Savoir-être :
Langues vivantes :
Référence :
Repo :
Alors n'attend plus, postule pour rejoindre notre équipe !
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres