Vous serez intégré(e) au sein de la Cellule IA dont les missions principales sont les suivantes :
Mettre en place de façon continue les Proofs of Concept (POC) fonctionnels et techniques issus des analyses d'opportunité ;
Benchmarker de façon régulière les outils d'Intelligence Artificielle, Data Science et Bigdata ;
Réaliser et préparer l'industrialisation des POC identifiés comme pertinents.
Au sein de cette équipe composée de spécialistes (data scientists, ML engineers et data engineers), vous participerez au développement de projets d'IA générative avec pour objectif d'adapter les grands modèles de langage (LLM) aux métiers de la Banque de France.
Le développement des LLM spécifiques aux activités d'une banque centrale est nécessaire pour assurer la précision, la pertinence et le respect des principes de l'IA dite de confiance dans un secteur avec de grands enjeux.
Nous développons actuellement système RAG qui repose sur un modèle d'embedding qui vectorise les textes de la base documentaire pour permettre une recherche sémantique. Cette étape, essentielle pour la pertinence des résultats, pourrait être renforcée en adaptant davantage le modèle au lexique spécifique de la Banque de France.
L'entraînement d'un modèle d'embedding suit généralement deux grandes phases : le pretraining, qui est coûteux en ressources, et le finetuning, qui affine les performances sur une tâche spécifique. Dans ce contexte, une stratégie prometteuse consiste à prolonger la phase de finetuning (further finetuning) afin de spécialiser le modèle de manière plus approfondie pour la récupération de textes.
Lors de ce stage, vous contribuerez aux activités du pôle en tant que Stagiaire ML Engineer et aurez les missions suivantes :
Réaliser un benchmark des modèles d'embedding open source.
Collecter et préparer des données adaptées.
Automatiser la génération du dataset pour l'entraînement.
Effectuer un further finetuning du modèle.
Évaluer les performances avec :
Les données spécifiques de la Banque de France.
Le benchmark MTEB pour une évaluation standardisée.
Intégré(e) à la Cellule IA, vous participerez pleinement à la vie de l'équipe : restitutions régulières du travail effectué, participation à la veille technologique générale, aux séminaires internes, aux séances de brainstorming...
Formation recherchée :
Formation supérieure en informatique ou métier de la donnée (ingénieur ou équivalent) à la recherche d'un stage de fin d'études dans ce domaine.
Votre cursus scolaire vous a permis de maîtriser les fondements mathématiques et statistiques des techniques de data science/machine learning et IA et vous avez mis en pratique vos connaissances au travers de projets étudiants et/ou de stages.
Compétences :
Prérequis : connaissance en Deep Learning et NLP avec une première expérience dans l'utilisation de modèles de type LLM
Maitrise de la programmation avancée en Python (paradigme de programmation orientée objets) et des bonnes pratiques de développement logiciel en Python (tests unitaires, Git)
Aptitude à vulgariser une information complexe aussi bien à l'écrit qu'à l'oral, bonnes capacités rédactionnelles et de communication (pour documenter les travaux et restituer les résultats)
Qualités :
Esprit méthodique et rigueur d'analyse
Force de proposition, agilité, autonomie
Curiosité et créativité
Goût du travail en équipe
Contactez nos ambassadeurs
La Banque de France est une institution socialement responsable, attachée au respect de la diversité sous toutes ses formes, à la lutte contre les discriminations, à favoriser la parité Femme/Homme et à garantir un environnement de travail de qualité.
Des aménagements de poste peuvent être organisés pour tenir compte des handicaps des personnes recrutées.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres