Mission
“ Le stage porte sur les mécanismes et politiques d’allocation à la demande et de partage dynamique de GPU au sein d’un cluster Kubernetes. L’objectif est de maximiser l’utilisation des cartes GPU en partitionnant dynamiquement les ressources (coeurs de calcul, mémoire) d’une carte tout en satisfaisant les besoins en ressources des applications.” [Architecte RD en systèmes répartis chef de projet]
Les outils de Nvidia peuvent partitionner statiquement les ressources d’un GPU (de type Multi Instances GPUs) en plusieurs GPUs virtuels. Mais cette approche statique ne permet pas de suivre la demande des applications, et l’administrateur doit intervenir pour repartitionner le GPU manuellement. Idéalement il faudra un mécanisme pour adapter dynamiquement les partitions. .
- Tu fais une analyse des différentes techniques de partage spatial ou temporel d’une carte GPU et une revue des gestionnaires de GPU intégrés à Kubernetes
- Sur la base d’une solution existante, tu prototypes un gestionnaire de ressource GPU intégré au scheduler Kubernetes capable de configurer dynamiquement les ressources GPU en faisant différents compromis entre isolation et dynamicité
- Tu valides la solution au travers de simulations et de scénarios de déploiement de différentes classes d’applications en lien avec des cas d’usage Orange (e.g. tâches de prédiction avec modèles IA/ML).
Compétences
- Tu es en formation Bac + 5 (ingénieur ou équivalent)
- Tu maitrises des technologies des containers et des micro-services : Docker, Kubernetes
- Tu maitrises les langages de programmation tels que Python, C/C++, ou Go
- Tu as des connaissances en programmation parallèle sur GPU (CUDA)
- Tu as des connaissances dans le domaine de l’IA et de frameworks de deep learning (PyTorch, TensorFlow)
Tu as envie d’intégrer une équipe projet de recherche ? Rejoins-nous !
Profil
“Nous valorisons un esprit d’initiative : un-e stagiaire qui n’hésite pas à prendre des responsabilités et à s’impliquer dans des projets variés.” [Architecte RD en systèmes répartis chef de projet]
- Tu fais preuve de curiosité et de persévérance
- Tu sais travailler en autonomie et tu es capable de prendre des initiatives
- Tu es à l’aise à l’oral et à l’écrit.
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.