Contexte
La MAIF, cherche à répondre à des nouveaux besoins, spécifiquement sur la question de la fraude documentaire. Cela s’inscrit dans son plan de lutte contre la fraude à l’assurance, pour répondre à la fois aux exigences règlementaires et pour préserver la collectivité des sociétaires tant sur une dimension éthique qu’économique. À ce titre, nous souhaitons explorer et développer en interne de nouvelles modalités d’analyses de documents, en plus des cas que nous adressons actuellement.
La MAIF, comme toutes les sociétés d’assurance, est victime d’attaques organisées et planifiées pouvant présenter un impact économique important.
Ce stage vise à mettre en place une démarche de recherche et développement pour analyser des documents servant de justificatifs à des sinistres en gestion à la MAIF. Ces documents servent pour leur grande majorité à motiver une indemnisation de préjudice subi par le sociétaire. Ces documents seront analysés durant toute la durée du stage, à la recherche d’anomalies permettant de lever des soupçons de fraude.
Objectifs
Vous devrez notamment réimplémenter une ou plusieurs techniques de l’état de l’art pour détecter des altérations volontaires et des falsifications au sein de documents. Il peut s’agir par exemple d’une modification sur un montant de facture ou d’une modification de la personne facturée. Vous serez amené(e) à déployer cette implémentation dans le système opérant pour que toute falsification détectée soit signalée aux acteurs de la lutte contre la fraude du groupe MAIF.
Vous contribuerez à l’amélioration des connaissances dans différents aspects de l’informatique industrielle ainsi qu’en recherche scientifique :
⁃ Lecture de bibliographie scientifique et apprentissage de l’état de l’art sur une discipline donnée ;
⁃ Implémentation d’algorithmes de l’état de l’art dans les domaines de l’analyse d’images et du traitement de données numériques ;
⁃ Analyse de documents et des images par des techniques d’apprentissage machine ou profond ;
⁃ Découverte d’un système industriel de gestion de données et interactions avec les métiers MAIF en charge de la lutte contre la fraude.
À l’issue du stage, vous aurez également contribué directement à la lutte contre la fraude documentaire en ayant déployé dans le système opérant une alerte qui sera utilisée par les équipes de lutte contre la fraude.
Pour ce stage, nous recherchons un candidat ou une candidate avec des compétences en cours d’acquisition en ingénierie logicielle et data science ou analyse d’images, et notamment :
⁃ Master en cours ou formation en école d’ingénieur spécialisé dans l’analyse de données, IA, de documents et d’images ou équivalent.
⁃ Expérience en machine learning et/ou deep learning, connaissances théoriques et pratiques.
⁃ Expérience dans la manipulation des documents (métadonnées, images au niveau pixel, utilisation de CNN, connaissances théoriques et pratiques basiques sur les réseaux de neurones et les réseaux à convolution).
⁃ Première expérience (stage, projet important) en analyse d’images et machine learning.
⁃ Compétences en génie logiciel et maitrise des concepts de fondamentaux de l’architecture et bonnes pratiques de code (coder proprement, patrons de conceptions, pratiques de CI/CD, etc.).
⁃ Technologies classiques en analyse d’image et machine learning : Python, PyTorch/ PyTorchLightning, Pandas/Polars, ScikitLearn/Genstim, HuggingFace’s transformers.
⁃ Maitrise des fondamentaux de la gestion de logiciel : CI/CD, système de gestion de version (Git).
Pour candidater
⁃ CV, listes des projets réalisés et ce qu’ils ont apportés concrètement au regard de l’offre actuel, dépôt GitHub/GitLab, contributions publiques à des logiciels libres ou open source, portfolio personnel, etc.
⁃ Stage pour profil équivalent M2 / Ingénieur avec une expérience en analyse d’images et des compétences en ingénierie logicielle ;
⁃ Application à la lutte contre la fraude documentaire ;
⁃ Février à juin/juillet 2024 ;
⁃ Potentiellement (convention en cours d’établissement) en collaboration et co-encadrement avec un laboratoire de recherche en informatique, spécialisé dans l’analyse de documents et la lutte contre la fraude documentaire ;
⁃ Poursuite envisagée en thèse CIFRE sur la période 2025 – 2028 (notamment sous conditions d’acceptation du projet par l’ANRT).