Vous rejoindrez notre équipe Technique afin de nous aider à développer nos produits futurs et existants : spécification, architecture, développement, test et déploiement. Vous travaillerez sous la responsabilité de Bogdan, notre Directeur Technique, au sein d’une équipe de 10 personnes et près de notre équipe d’IA composée de 4 personnes.
🌻 Sur ce poste à mi-chemin entre l’analyse de données, le Data Engineering (Extract, Transform, Load - ETL) et le Prompt Engineering, tes responsabilités seront les suivantes :
Collecter, stocker et standardiser des données brutes issues de multiples sources (textes, tableaux et images notamment)
Mettre en forme et nettoyer ces données afin de les rendre exploitables par des algorithmes d’IA
Assurer la qualité des données en implémentant des contrôles, des tests et des processus de validation
Maintenir, tester et améliorer une architecture de pipeline de données optimale
Développer et maintenir des pipelines de données intégrant des modèles de langage via des API (ex. OpenAI, Anthropic)
Contribuer à l’ingénierie des prompts pour optimiser l’utilisation de ces modèles
Identifier et évaluer des opportunités de gains de productivité grâce à l’automatisation des processus
🌱 L’environnement technique :
Notre stack ETL actuel assure l’extraction de texte, de graphiques et d’images à partir de fichiers PDF, LaTex etc. Nous transformons ces documents en plusieurs étapes, en utilisant le format JSON pour structurer les données. Nous procédons notamment à des classifications d’images, à la génération de contenu via des modèles de langage (LLM multimodaux ou texte uniquement) et déployons une importante ingénierie à chaque étape du processus.
Pour en savoir plus sur notre équipe technique : “How to handle a technical crisis at Gymglish (and live to tell the tale)”.
💡 Autres informations :
Type de contrat : CDI 39h - statut cadre
Lieu de travail : Paris
Disponibilité : ASAP
Rémunération : 40-45k€ annuel + PEE & prime de vacances
Congés payés : 5 semaines de vacances + 5 jours supplémentaires
🫶 Pourquoi postuler :
Rejoignez le secteur de l’éducation, des langues et de la culture, favorisant l’ouverture aux autres et l’apprentissage continu. 📚
Intégrez une équipe diversifiée de 40 personnes, représentant 14 nationalités et parlant 13 langues. 🌍
Travaillez dans notre bureau ‘cosy’ à Paris 12, un ancien lavoir entièrement rénové, à proximité des lignes 1, 8 et du RER A, ou en télétravail, de manière hebdomadaire. 😉
Nous acceptons occasionnellement les enfants 🧒 et les animaux 😻 au bureau !
Profitez de notre mutuelle Alan 🩺 et de titres-restaurant Swile 🍽️ pris en charge à 60% (au lieu des 50% légaux !).
Aimigo subventionne un abonnement avec un réseau de salle de sport partenaire : Les Cercles de la Forme 🏋️♂️
Bénéficiez du remboursement de 50% de vos frais de transport. 🚆
Tous les profils sont les bienvenus, nous voulons des personnalités dotée de détermination et de résilience, capable de faire preuve d’ingéniosité sans relâche pour surmonter les défis. L’optimisme est une qualité essentielle, tout comme une curiosité insatiable et un engagement envers l’apprentissage continu.
Nous valorisons également la bienveillance et l’esprit d’équipe : être respectueux et collaboratif est essentiel.
Enfin, nous attendons un véritable sens des responsabilités et de la propriété dans le travail, avec un souci constant de bien faire et de livrer un travail de qualité.
👀 Nous recherchons une personne :
Des expériences dans la conception, l’optimisation et la maintenance de bases de données, de pipelines de données, d’architectures et d’ensembles de données.
Capacité à mener des analyses de causes profondes sur des données et des processus internes et externes, afin de répondre à des problématiques métier et d’identifier des axes d’amélioration.
Aptitude à construire des processus supportant la transformation des données, la gestion des structures de données, des métadonnées, des dépendances et des charges de travail.
Forte appétence pour les défis techniques, y compris sur des environnements on-premise, l’utilisation d’outils open-source et la prise en compte de contraintes matérielles des serveurs.
Rigueur, autonomie, esprit d’initiative, curiosité…
Excellente communication, tant à l’oral qu’à l’écrit (anglais et français).
🎁 Point Bonus si vous avez :
Expérience dans l’extraction de données à partir de divers formats, notamment PDF et LaTeX
Compétences en Python
Connaissance et expérience des modèles de langage (LLM) et des systèmes RAG (Retrieval-Augmented Generation)
Familiarité avec l’environnement ligne de commande Linux
Minimum 2 ans d’expérience sur les compétences mentionnées ci-dessus
Puis :
Premier call de prise de contact avec notre RH, Anastasia (environ 15 minutes). 📳
Un test technique pour évaluer vos compétences ! 👨💻
Entretien avec Leo our Head of AI (environ 1h30) 🗣️
Entretien avec le CTO (environ 1h) 🗣️
Les candidatures seront traitées à partir du 1er janvier 2025
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.