Contexte
Les réseaux de neurones profonds sont aujourd’hui largement utilisés dans de nombreuses applications telles que la détection d’image, le traitement du langage naturel ou bien la reconnaissance vocale, mais ils restent vulnérables aux perturbations. Ces attaques adversariales consistent à modifier légèrement une entrée pour tromper le modèle et ainsi mettre le système en défaut. Comprendre et détecter ces anomalies est essentiel pour renforcer la robustesse des systèmes d’intelligence artificielle et ainsi améliorer la confiance à ce type de système.
Objectifs du Stage
L’objectif de ce stage est d’exploiter la méthode développée par Bessaï et al. [1] pour la détection des attaques adversariales en analysant les schémas d’activation neuronale, et d’étendre les expérimentations à un plus grand nombre de méthodes d’attaque.
Nous disposons déjà de résultats pour les attaques FGSM [3] et PGD [7]. Le travail consistera à :
Étendre les expérimentations aux attaques CW [2], DeepFool [8], BIM [6], JSMA [9], ainsi qu’à d’autres attaques adversariales récentes.
Comparer la méthode de Bessaï et al. [1] à d’autres approches de détection telles que Katzir et al. [5], Granda et al. [4] et Sterneck et al. [11].
Tester la combinaison de cette méthode avec d’autres stratégies de défense qui modifient le modèle, telles que la distillation défensive [10] et l’entraînement adversarial [7].
Étudier l’impact des architectures et des jeux de données sur les performances de détection et de robustesse.
Le(la) candidat(e) idéal(e) devra avoir :
Une bonne maîtrise de Python et des bibliothèques Keras/TensorFlow.
Des connaissances de base en réseaux de neurones et en apprentissage profond.
Une bonne compréhension des concepts d’algèbre linéaire, indispensables pour la manipulation des tenseurs.
Idéalement, des connaissances en analyse statique, notamment en interprétation abstraite.
Une familiarité avec les attaques adversariales et les méthodes de défense, telles que l’entraînement adversarial et la distillation défensive.
2 entretiens dont au moins l’un en présentiel.