Description du poste :
Rejoignez notre équipe de 300 experts en HPC chez Eviden, où nous assurons l’installation et la gestion de clusters de calcul de classe mondiale, régulièrement classés dans le « Top 500 ». Nos clients incluent des grands groupes industriels ainsi que des acteurs majeurs de la recherche scientifique, notamment dans les domaines météorologique et spatial.
En tant que membre de l’équipe support applicatif, vous interviendrez principalement sur des problématiques de niveau 2 et 3 pour nos clients dans les domaines de la recherche scientifique. Vous serez responsable de l’assistance technique avancée pour les utilisateurs et du maintien de la performance des applications scientifiques et techniques exécutées sur nos infrastructures HPC.
Responsabilités principales :
- Fournir un support technique de niveau 2/3 pour les utilisateurs des clusters HPC et résoudre des problématiques complexes.
- Analyser et optimiser les applications parallèles (profiling, debugging, tuning).
- Participer à l'amélioration des performances des applications en utilisant des technologies de parallélisation telles que MPI, OpenMP, et offloading GPU.
- Collaborer avec les équipes de développement et d’administration pour résoudre les incidents techniques et améliorer l’expérience utilisateur.
- Assurer une veille technologique sur les nouvelles tendances dans le domaine du calcul haute performance.
Compétences techniques requises :
- Solides connaissances des systèmes Linux.
- Maîtrise des langages de programmation : Fortran, C/C++, Python.
- Expertise dans les technologies de parallélisation : MPI, OpenMP, GPU (Cuda, OpenACC, ...).
- Expérience avec les outils de gestion des performances, tels que les analyseurs de performance et débogueurs spécifiques à l'HPC.
- Bonne compréhension des environnements HPC (gestion des files de tâches, gestion des ressources, etc.).
Compétences supplémentaires appréciées :
- Connaissances en administration système (gestion des nœuds de calcul, stockage, réseaux).
- Expérience avec des systèmes de gestion de clusters (Slurm, PBS, etc.).
- Compétences en scripting pour automatiser les processus d'exploitation.