Stage ML Engineer — Sélection optimale des embeddings pour la détection d'anomalie en milieu industriel (4-6 mois)

Stage(4 à 6 mois)
Palaiseau
Salaire : Non spécifié
Télétravail fréquent
Éducation : Bac +5 / Master

Visionairy
Visionairy

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

La détection d’anomalie ou de défauts présente un enjeu important dans le contrôle qualité de pièces manufacturées. Majoritairement réalisée par des opérateurs, elle reste dans la plupart des cas partielle et peu répétable.

Une des problématiques liées à la détection d’anomalie est le faible nombre de données anormales et leur inconsistance. De ce fait, la majorité des méthodes développées adoptent le paradigme non-supervisé. Les modèles récents sont construits selon l’agencement : représentation, modélisation, score.

Heckler et al. (1) ont montré l’importance du choix des embeddings dans la performance finale du modèle, et le fait qu’il n’existe pas une configuration universelle mais que cela dépend des objets considérés.

\=> L’objectif du stage est de développer un algorithme d’entrainement et d’évaluation qui permette de tester plusieurs configurations et choisir la plus performante selon des critères donnés.

Parmi les enjeux, il conviendra de définir l’espace des combinaisons possibles de manière suffisamment large pour espérer obtenir de bonnes performances, tout en restant assez compact pour limiter le temps de calcul. On s’appuiera sur des frameworks d’optimisation comme optuna, azureml etc.

Plus largement, vous contribuerez à la librairie interne de Visionairy en ajoutant des fonctionnalités liées au traitement d’images ou à d’autres modèles de vision et en faisant en sorte d’améliorer les performances de l’existant.

Encadré par le CTO, vous serez amené à collaborer avec l’ensemble de l’équipe de Visionairy, au sein de l’incubateur de Polytechnique (Drahi-X-Novation Center). Vous travaillerez sur des données industrielles réelles.

Stack: Python, Pytorch, MLFlow, Azure, Lightning

Mots clés : unsupervised learning, anomaly detection, ml engineering, mlflow, ml ops

Missions

  • Développer un algorithme d’entrainement et d’évaluation permettant de choisir la meilleure combinaison échelle / embedding / modèle / hyperparamètres

  • Améliorer et développer de nouvelles fonctionnalités en lien avec le traitement d’image et des modèles de vision spécialisés (segmentation, ocr, ..)

  • Expérimenter et évaluer les performances des modèles sur les datasets internes de pièces industrielles

  • Améliorer la CI/CD les modèles dans notre pipeline MLFlow/Azure.

Biblio

(1) Heckler, L., König, R., & Bergmann, P. (2023). Exploring the importance of pretrained feature extractors for unsupervised anomaly detection and localization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 2917-2926).


Profil recherché

Nous recherchons une personne avec un background plutôt développement logiciel qui s’intéresse à l’IA et veut contribuer à améliorer la performance de modèles SOTA en production.

Requis

  • Expérience(s) ou formation en développement logiciel

  • Deep learning & computer vision

  • Bonne pratique de Python, Pytorch

  • Intéressé par le secteur et rejoindre une startup

Préféré

  • Expérience significative en Pytorch

  • Intérêt / expérience en ML Ops

  • Lightning


Déroulement des entretiens

  1. Call d’intro (20 min)

  2. Entretien (1H30) (sur place)

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres