La détection d’anomalie ou de défauts présente un enjeu important dans le contrôle qualité de pièces manufacturées. Majoritairement réalisée par des opérateurs, elle reste dans la plupart des cas partielle et peu répétable.
Une des problématiques liées à la détection d’anomalie est le faible nombre de données anormales et leur inconsistance. De ce fait, la majorité des méthodes développées adoptent le paradigme non-supervisé. Les modèles récents sont construits selon l’agencement : représentation, modélisation, score.
Heckler et al. (1) ont montré l’importance du choix des embeddings dans la performance finale du modèle, et le fait qu’il n’existe pas une configuration universelle mais que cela dépend des objets considérés.
\=> L’objectif du stage est de développer un algorithme d’entrainement et d’évaluation qui permette de tester plusieurs configurations et choisir la plus performante selon des critères donnés.
Parmi les enjeux, il conviendra de définir l’espace des combinaisons possibles de manière suffisamment large pour espérer obtenir de bonnes performances, tout en restant assez compact pour limiter le temps de calcul. On s’appuiera sur des frameworks d’optimisation comme optuna, azureml etc.
Plus largement, vous contribuerez à la librairie interne de Visionairy en ajoutant des fonctionnalités liées au traitement d’images ou à d’autres modèles de vision et en faisant en sorte d’améliorer les performances de l’existant.
Encadré par le CTO, vous serez amené à collaborer avec l’ensemble de l’équipe de Visionairy, au sein de l’incubateur de Polytechnique (Drahi-X-Novation Center). Vous travaillerez sur des données industrielles réelles.
Stack: Python, Pytorch, MLFlow, Azure, Lightning
Mots clés : unsupervised learning, anomaly detection, ml engineering, mlflow, ml ops
Développer un algorithme d’entrainement et d’évaluation permettant de choisir la meilleure combinaison échelle / embedding / modèle / hyperparamètres
Améliorer et développer de nouvelles fonctionnalités en lien avec le traitement d’image et des modèles de vision spécialisés (segmentation, ocr, ..)
Expérimenter et évaluer les performances des modèles sur les datasets internes de pièces industrielles
Améliorer la CI/CD les modèles dans notre pipeline MLFlow/Azure.
Biblio
(1) Heckler, L., König, R., & Bergmann, P. (2023). Exploring the importance of pretrained feature extractors for unsupervised anomaly detection and localization. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 2917-2926).
Nous recherchons une personne avec un background plutôt développement logiciel qui s’intéresse à l’IA et veut contribuer à améliorer la performance de modèles SOTA en production.
Requis
Expérience(s) ou formation en développement logiciel
Deep learning & computer vision
Bonne pratique de Python, Pytorch
Intéressé par le secteur et rejoindre une startup
Préféré
Expérience significative en Pytorch
Intérêt / expérience en ML Ops
Lightning
Call d’intro (20 min)
Entretien (1H30) (sur place)
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres