Le Datalab répond aux sollicitations de la Direction Technique concernant les supports en statistiques et en analyse de données. A ce titre, le Datalab participe à des projets techniques et apporte un soutien autour de la DATA pour répondre à des problématiques métier.
Au sein de cette équipe, votre objectif sera de contribuer à un projet multidimensionnel axé sur l'exploitation des Large Language Models (LLMs) et le développement d'outils innovants. Vous aurez l'opportunité de travailler sur l'extraction d'informations pertinentes à partir de bases de données non structurées, ainsi que sur diverses tâches de génération de texte.
Ce stage s'inscrit dans une dynamique de recherche et développement visant à surmonter des défis tels que la gestion de connaissances, l'extraction d'informations et l'automatisation de systèmes complexes. Les solutions innovantes issues de ce projet permettront de faciliter l'accès à l'information et de simplifier des tâches critiques à travers l'automatisation.
Le stagiaire sera chargé de :
- Analyser l'état de l'art et les outils open source disponibles.
- Développer des prototypes et Proof of Concept (PoC) pour tester la mise en place de diverses solutions, avec des missions telles que :
- La conception d'un chatbot capable d'interagir naturellement et de manière compréhensible
- L'extraction d'information via des LLM,
- L'automatisation de tâches techniques en intégrant des flux permettant de guider et optimiser les processus de travail.
- Retour d'expérience et optimisation, en analysant l'efficacité des prototypes et en proposant des améliorations continues.
- Utiliser diverses méthodes de génération de texte, parmi lesquelles la méthode RAG (Retrieval-Augmented Generation) pour le développement de chatbots documentaires et autres approches innovantes comme des modèles génératifs et des mécanismes de réponse intelligente.
Cette mission vous permettra d'explorer plusieurs dimensions de la génération de texte assistée par IA, tout en acquérant une solide base théorique et pratique.
Nous recherchons un stagiaire avec les compétences suivantes :
- Étudiant en science des données ou informatique
- Connaissances solides en IA (couches de convolution, mécanisme d'attention, autoencodeur),
- Connaissances pratiques en traitement du langage naturel (NLP) et en utilisation des Large Language Models (LLM) tels que GPT-3, BERT, etc.
- Familiarité avec la méthode RAG (Retrieval-Augmented Generation) et son application dans les conversations en mode chatbot.
- Connaissance des services et outils AWS et capacité à les utiliser pour le développement et le déploiement de solutions IA.
- Maîtrise du langage de programmation Python (PyTorch, PySpark, SQL, Streamlit seraient un plus) et des outils de développement d'IA comme Hugging Face, spaCy, transformers, et des frameworks comme PyTorch.
- Aptitude à travailler de manière autonome et être force de proposition
- Solides compétences en communication et en rédaction de rapports.
Ces entreprises recrutent aussi au poste de “Recherche industrielle”.
Évry-Courcouronnes