Dans le cadre de ce stage, tu participeras à une étude de faisabilité visant à explorer l’utilisation des LLMs (Large Language Models) pour la détection de fraude, spécifiquement pour analyser les Conditions Générales d’Utilisation (CGUs) et vérifier la validité des offres présentées.
Étude de l’état de l’art des LLMs : Analyser et comprendre les dernières avancées sur les modèles de langage de grande taille (LLMs) et leurs applications en Data Science.
Étude de l’utilisation des LLMs pour la détection de fraude : Investiguer comment les LLMs peuvent être utilisés pour l’analyse de documents juridiques et la détection de fraudes (notamment la validation des CGUs).
Prototypage des solutions : Développer des premières solutions pour tester la faisabilité de l’application des LLMs
Possibilité de fine-tuning : Si les premiers POCs (Proof of Concept) sont prometteurs, il sera possible de fine-tuner les modèles pour aborder des approches plus complexes et innovatrices.
Implémentation dans notre stack : En fonction des résultats, contribuer à l’implémentation d’une solution au sein de notre infrastructure existante.
Ce stage a été conçu avant tout comme un parcours de formation et d’accompagnement. Notre objectif est de t’accompagner dans ton apprentissage tout en te permettant de comprendre les enjeux réels auxquels nous faisons face en entreprise et au sein de l’équipe data. Ce n’est pas seulement un travail technique, c’est une immersion dans un projet d’envergure, avec un accompagnement personnalisé, afin de te donner une vision claire des défis et des solutions dans un contexte professionnel.
Compétences et savoir-faire recherchés :
Connaissances de base en Machine Learning, NLP et modèles de langage (LLM)
Maîtrise de Python et des bibliothèques associées à l’IA (TensorFlow, PyTorch, Hugging Face, etc.)
Intérêt pour la fraude, la détection d’anomalies et l’analyse de données
Capacité à apprendre rapidement et à s’adapter à de nouvelles technologies
Bonnes capacités de communication et travail en équipe
Stack Technique :
Infra : GCP (BigQuery, VertexAI, Composer, GKE, …) + Terraform
ML : TensorFlow, Scikit-Learn, Transformers, Hugging Face, …
Data Visualisation : Metabase
Langages : Python, SQL
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres