Data Scientist – Détection de fraude - Stage - Paris

Stage(6 mois)
Paris
Salaire : Non spécifié
Début : 05 janvier 2025
Télétravail fréquent
Éducation : Bac +5 / Master

pass Culture
pass Culture

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Dans le cadre de ce stage, tu participeras à une étude de faisabilité visant à explorer l’utilisation des LLMs (Large Language Models) pour la détection de fraude, spécifiquement pour analyser les Conditions Générales d’Utilisation (CGUs) et vérifier la validité des offres présentées.

Tes principales missions seront :

  1. Étude de l’état de l’art des LLMs : Analyser et comprendre les dernières avancées sur les modèles de langage de grande taille (LLMs) et leurs applications en Data Science.

  2. Étude de l’utilisation des LLMs pour la détection de fraude : Investiguer comment les LLMs peuvent être utilisés pour l’analyse de documents juridiques et la détection de fraudes (notamment la validation des CGUs).

  3. Prototypage des solutions : Développer des premières solutions pour tester la faisabilité de l’application des LLMs

  4. Possibilité de fine-tuning : Si les premiers POCs (Proof of Concept) sont prometteurs, il sera possible de fine-tuner les modèles pour aborder des approches plus complexes et innovatrices.

  5. Implémentation dans notre stack : En fonction des résultats, contribuer à l’implémentation d’une solution au sein de notre infrastructure existante.

À propos du stage :

Ce stage a été conçu avant tout comme un parcours de formation et d’accompagnement. Notre objectif est de t’accompagner dans ton apprentissage tout en te permettant de comprendre les enjeux réels auxquels nous faisons face en entreprise et au sein de l’équipe data. Ce n’est pas seulement un travail technique, c’est une immersion dans un projet d’envergure, avec un accompagnement personnalisé, afin de te donner une vision claire des défis et des solutions dans un contexte professionnel.


Profil recherché

Compétences et savoir-faire recherchés :

  • Connaissances de base en Machine Learning, NLP et modèles de langage (LLM)

  • Maîtrise de Python et des bibliothèques associées à l’IA (TensorFlow, PyTorch, Hugging Face, etc.)

  • Intérêt pour la fraude, la détection d’anomalies et l’analyse de données

  • Capacité à apprendre rapidement et à s’adapter à de nouvelles technologies

  • Bonnes capacités de communication et travail en équipe

Stack Technique :

  • Infra : GCP (BigQuery, VertexAI, Composer, GKE, …) + Terraform

  • ML : TensorFlow, Scikit-Learn, Transformers, Hugging Face, …

  • Data Visualisation : Metabase

  • Langages : Python, SQL

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres