Dans ce stage Recherche, vous étudierez expérimentalement les algorithmes de détection d’anomalies non supervisée dans les séries temporelles :
- Vous dresserez un état de l’art des techniques d’apprentissage automatique (Machine Learning) existantes, qui s’appuiera notamment sur un ensemble de contributions et d’études réalisées au sein d’Orange.
- Vous implémenterez un algorithme existant afin de l’intégrer dans une librairie de détection d’anomalies basée sur des autoencodeurs, développée chez Orange.
- Vous évaluerez les performances des algorithmes de l’état de l’art les plus prometteurs sur des jeux de données ouverts.
L’objectif global de ce stage est d’évaluer le potentiel de différentes familles d’approches de détection d’anomalies, et de consolider cette évaluation dans une librairie de détection d’anomalies.
Les jeux de données ouverts utilisés lors de l’évaluation refléteront des cas d’usages pratiques, dont des sujets stratégiques pour Orange tels que la détection d’attaques informatiques à partir de l’analyse du trafic réseau.
Ce stage servira également de travail préparatoire à la définition d’un sujet de recherche pour une thèse.
Références:
[1] N. Najari, S. Berlemont, G. Lefebvre, S. Duffner, et C. Garcia, “ RADON: Robust Autoencoder for Unsupervised Anomaly Detection ”, in 2021 14th International Conference on Security of Information and Networks (SIN), déc. 2021, p. 1-8. doi: 10.1109/SIN54109.2021.9699174.
[2] N. Najari, S. Berlemont, G. Lefebvre, S. Duffner, et C. Garcia, “ Robust Variational Autoencoders and Normalizing Flows for Unsupervised Network Anomaly Detection ”, in Advanced Information Networking and Applications, vol. 450, L. Barolli, F. Hussain, et T. Enokido, Éd., in Lecture Notes in Networks and Systems, vol. 450. , Cham: Springer International Publishing, 2022, p. 281-292. doi: 10.1007/978-3-030-99587-4_24.
[3] “Automatic Feature Engineering for Time Series Classification: Evaluation and Discussion”, Aurélien Renault, Alexis Bondu, Vincent Lemaire, Dominique Gay, International Joint Conference on Neural Networks (IJCNN 2023)
[4] Boniol, P., J. Paparrizos, et T. Palpanas (2023). Tutorial : New trends in time series anomaly detection. In International Conference on Extending Database Technology. https://www.youtube.com/watch?v=96869qimXAA
Stage de fin d’études Bac+5 en école d’ingénieurs ou master recherche en informatique.
Langages de programmation exigé : Python (PyTorch, Pandas, Scikit-learn).
Connaissances en deep learning, machine learning.
Bonne maîtrise des outils de version control (git).
Connaissances appréciées en données de trafic réseau, Internet des Objets.
Très bonne maitrise écrite et orale de l’anglais.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.