Data Scientist

Résumé du poste
CDI
Paris
Salaire : Non spécifié
Télétravail occasionnel
Expérience : > 3 ans
Éducation : Bac +5 / Master
Compétences & expertises
Contenu généré
Spacy
Mongodb
Celery
Pytorch
Elasticsearch
+4

Mayday
Mayday

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

En tant que Data Scientist, tu seras au cœur de notre produit et de ses nombreuses innovations, à la croisée entre la R&D et le développement de solutions concrètes pour nos clients.

Tes missions principales seront :

  1. Recherche & Développement en IA/NLP

    • Concevoir et tester des modèles innovants pour répondre aux enjeux complexes de gestion de la connaissance;

    • Explorer les dernières tendances en IA et NLP, notamment autour des transformers et des modèles pré-entraînés;

    • Travailler sur des problématiques de deep learning et proposer des solutions nouvelles basées sur la recherche appliquée.

  2. Mise à disposition et évangélisation des modèles d’IA

    • Créer des modèles capables d’automatiser la gestion de la connaissance et d’optimiser les processus clients;

    • Assurer le déploiement des modèles via des API, pour que les squads produit puissent facilement les intégrer dans leurs workflows;

    • Collaborer étroitement avec les équipes backend et produit pour que tout fonctionne comme un charme côté technique.

  3. Maintenance et amélioration des systèmes existants

    • Maintenir et améliorer nos systèmes de “Retrieval Augmented Generation” (RAG), en intégrant les dernières avancées LLM.

    • Travailler sur l’amélioration continue des performances des modèles, en veillant à leur fiabilité et leur évolutivité;

    • Réagir rapidement aux besoins d’optimisation et d’évolution des modèles en fonction des retours utilisateurs et des nouveautés technologiques.


Profil recherché

🥇 Tu es la candidate ou le candidat idéal si tu t’identifies dans ce qui suit :

Hard Skills

📚 Tu as une expérience en :

  • NLP : classification, extraction, question-answering…

  • LLMs et RAG : expérience avec des modèles de génération et de récupération augmentée, et leur intégration dans des produits

  • Python : tu maîtrises Python, les librairies de machine learning (PyTorch, scikit-learn) et les frameworks NLP (Huggingface, spaCy)

  • Algorithmes de recherche hybride : Compétence dans les recherches combinant embeddings et recherche syntaxique

✍️ Tu as déjà travaillé avec des bases de données vectorielles telles que Elasticsearch et/ou MongoDB ou des technologies similaires pour stocker des documents et embeddings

🏁 Tu as déjà eu des expériences d’architectures comprenant des processus asynchrones (Celery, RabbitMQ, Kafka, etc.)

Soft Skills

  • 🤩 Tu es customer centric et places la satisfaction de nos clients au premier plan

  • 📞 Tu souhaites t’impliquer dans tous les aspects techniques de notre stack et avoir un impact sur les produits d’une startup en pleine croissance

  • 🔬 Tu as un esprit R&D avec une passion pour l’innovation et les solutions nouvelles, tout en gardant à l’esprit les objectifs business.

  • 🚀 Tu as une appétence pour l’univers startup ; tu as l’envie et l’ambition de faire partie d’une belle aventure avec une croissance forte et donc des opportunités nombreuses


Déroulement des entretiens

Nous aimons les process rapides et efficaces. C’est pourquoi le process se déroulera en quatres étapes :

  • 1 entretien de fit avec le CTO : 30 min

  • 1 entretien de fit avec notre Head of Data : 30 min

  • 1 entretien technique : ~4h à faire à la maison + 1h de présentation du travail effectué

  • 1 entretien avec 2 fondateurs et 2 employés : 4x 30min

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres