Dans le cadre d’un STAGE, l’Agence recherche son futur Talent, au sein de notre Direction Expertise, Innovation et Internationale, plus particulièrement au Domaine “Interopérabilité Sémantique”, pour une durée de 6 mois.
L’objectif du stage est de développer une ou plusieurs approches de traduction, basées sur des modèles de langage (LLM), qui suggèrent :
• Un ensemble de synonymes valides respectant des règles éditoriales strictes. Il fait partie des objectifs du stage de formaliser ces règles et d’explorer comment celles-ci peuvent être fournies au LLM par le biais de techniques de prompting ;
• Une description textuelle complète et non ambiguë du terme.
Les deux premiers LLM à considérer sont GPT-4 et Mixtral [3–6], mais cette liste reste ouverte et peut évoluer au cours du stage.
Nous souhaitons évaluer empiriquement la qualité des suggestions, en particulier pour comparer nos traductions à celles fournies par une solution existante, mais aussi pour améliorer de manière itérative les méthodes étudiées.
À cette fin, l’objectif principal du stage est de proposer des stratégies permettant d’évaluer nos traductions. En conséquence, le.la stagiaire proposera et motivera des stratégies pour comparer objectivement les traductions.
D’un point de vue méthodologique, nous souhaitons explorer plusieurs directions :
• Premièrement, tirer parti des textes cliniques français pour améliorer les traductions suggérées
• Deuxièmement, tirer parti de la structure de SNOMED CT, en profitant de la disponibilité des descriptions, des synonymes et potentiellement des traductions des termes frères et, dans une autre mesure, des termes sémantiquement proches.
Actuellement étudiant.e de niveau master 2, vous avez des connaissances en Grand Modèle de Langage (LLM) et/ou Représentation des Connaissances (KE), une aptitude à la rédaction de documentation technique, avec une parfaite maîtrise de l’Anglais.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres