Au sein d’Orange, les conversations sont au coeur de notre activité. Dialogues entre client et télé-conseiller, suite de commentaires de techniciens, ce sont des sources de données complexes pour lesquelles l’analyse (et l’automatisation de ces analyses) prend du temps. Néanmoins, ces analyses sont indispensables pour mieux cerner les problèmes et trouver les solutions pour y répondre. Les techniques de Machine Learning classiques (classification, clustering) permettent de répondre en partie à ce problème, mais avec la démocratisation des LLMs, on cherche à savoir comment utiliser ces nouvelles méthodes pour mieux explorer et détecter les sujets d’intérêts dans nos conversations.
En particulier, ce stage se concentre sur l’utilisation de LLMs pour la détection de signaux faibles dans les conversations et l’émergence de nouveaux sujets dans le temps. L’évaluation, pilier du domaine, sera également une composante centrale du stage, afin de contrôler la validité des sorties de LLMs et éviter les hallucinations.
Étuiant.e issu.e d’une formation bac +5 avec une spécialisation en Data Science / Machine Learning :
- tu as de solides compétences en mathématiques, data science, statistiques
- tu maitrises la programmation en Python
- tu sais utiliser chatGPT mais tu veux creuser le sujet des LLMs plus en profondeur
- tu connais le domaine du NLP ou tu es curieux.se de le découvrir
- tu prends des initiatives et tu aimes travailler en équipe