Stage : Evaluation de la performance de grands modèles de langage en science des matériaux F/H

Stage
Meaux
Salaire : Non spécifié
Télétravail non autorisé
Expérience : < 6 mois
Postuler

Safran
Safran

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

Contexte
Les méthodes d'apprentissage automatique voient leur usage se populariser progressivement dans le domaine de la science des matériaux au gré des évolutions des moyens informatiques les supportant, et des impératifs de développement de nouveaux matériaux toujours plus performants. Dans le domaine aéronautique, ces impératifs sont tant environnementaux que socio-économiques : diminution des émissions de gaz à effet de serre, réduction des émissions sonores et de la consommation de carburant, différentiation des produits…

De manière générale, la recherche de nouveaux matériaux performants est compliquée par leur grande complexité : grand nombre d'éléments chimiques, procédés et paramètres de mise en œuvre divers... Cette complexité résulte, par explosion combinatoire, en un immense espace des possibles dont de nombreuses zones demeurent aujourd'hui inconnues mais qui renferment les matériaux de demain.

Les méthodes d'apprentissage automatique sont exploitées pour leur capacité à guider dans cet espace titanesque la conception de nouveaux matériaux, en simplifiant la modélisation du lien entre leur composition, leur structure et leurs propriétés. Cependant, la viabilité de ces méthodes repose de fait sur l'existence de données qu'il convient de générer par la réalisation de plans d'expériences, ou de collecter si elles ont déjà été générées.

Objectifs
Ce projet s'inscrit dans le cadre de travaux ayant pour but l'évaluation de la pertinence de grands modèles de langage (Large Language Models, LLM) pour la conception de nouveaux matériaux, selon deux axes.
Le premier axe concerne la collection de données automatisée pour l'analyse accélérée de corpus bibliographiques. La pertinence des LLM sera jugée sur la qualité de l'extraction de connaissances précises dans des publications scientifiques et techniques, en vue de la constitution de bases de données composition-propriétés alimentant des modèles d'apprentissage supervisé. Ce premier axe a pour principale application le développement de nouveaux revêtements mis en œuvre par PVD (Physical Vapor Deposition). L'étude se focalisera notamment sur l'analyse d'une bibliographie restreinte autour du domaine des revêtements céramiques binaires, relativement bien connu.


Étudiant.e en première ou deuxième année de master en mathématiques appliquées, statistiques ou sciences informatiques ayant de solides connaissances en apprentissage statistique/machine learning.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Postuler