Stage - 6 mois - Recherche Data Science F/H - Rennes

Stage(6 mois)
Saint-Grégoire
Salaire : Non spécifié
Début : 02 février 2025
Télétravail non autorisé
Expérience : < 6 mois
Éducation : Bac +5 / Master
Postuler

Groupe BPCE
Groupe BPCE

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

Poste et missions

Au sein de la Direction Intelligence de la donnée de BPCE Vie, le pôle d'expertise Data Science et IA conçoit et pilote des modèles, de machine learning classique à l'IA générative, au service des métiers de BPCE Vie.

Rejoignez le pôle recherche en tant que Data Scientist pour un stage à partir de Février 2025 ! L'objectif est d'améliorer nos algorithmes permettant de déterminer l'appétence de clients à nos produits d'épargne (moteur de recommandation).

Les moteurs de recommandation jouent un rôle crucial pour aider les utilisateurs à découvrir des produits pertinents et personnalisés. Toutefois, un défi majeur persiste : la majorité des données disponibles sont non étiquetées, rendant difficile l'identification des préférences réelles des utilisateurs.
Le PU Learning (« Positive Unlabeled Learning ») offre une solution élégante à ce problème. Contrairement aux approches traditionnelles de machine learning qui nécessitent des jeux de données complets et étiquetés, le PU Learning permet de tirer parti des données partiellement étiquetées (positives) et des données non étiquetées. Cette approche innovante ouvre des perspectives inédites pour améliorer la précision et l'efficacité des recommandations, tout en réduisant les besoins en annotation manuelle.

Le stage se déroulera en trois phases : documentation et lecture d'articles de recherche, développement de solutions en Python et tests sur notre moteur de recommandation en production.

Concrètement votre quotidien ? en collaboration avec votre tuteur/ tutrice, vous interviendrez sur les missions suivantes :

  • Documentation sur le PU Learning, article de recherche : https://arxiv.org/pdf/1808.02180 ;
  • Reprendre et vérifier l'implémentation faite dans le cadre d'intégration du PU Learning à un modèle Catboost ;
  • Recherche de solution sur le scaling, implémenter « Ensemble Kernel Mean Matching Yun-Qian Miao, Ahmed K. Farahat, Mohamed S. Kamel » ;
  • Documentation sur les méthodes de PU Learning avec les GNN (Graph Neural Networks) : https://arxiv.org/pdf/2103.04683, https://jaeminyoo.github.io/resources/papers/YooKYKJK21.pdf ;
  • Implémentation de la solution dans notre package interne de GNN ;
  • Test et benchmarks de solution sur notre moteur de recommandation.

    Stack technique : VS Code sur PC de développeur, GPU sur GCP (Google Cloud Platform).

Profil recherché

Vous préparez un niveau d'études Bac+5 dans le domaine de la Data Science ;

Pour réussir votre mission, vous :

  • Possédez une bonne connaissance de Python ;
  • Bénéficiez de bonnes connaissances des algorithmes de Machine Learning de base et Deep Learning ;
  • Avez un savoir des méthodes à Noyaux, des Graph Neural Networks.

Le candidat recherché est flexible et curieux. Nous recherchons un candidat capable de communiquer et transmettre ses résultats au sein de l'équipe.

Saurez-vous relever le challenge ? N'attendez plus, rejoignez-nous !

Envie d’en savoir plus ?

Postuler