Dans un contexte de transformation et sur un marché très spécifique et compétitif, le PMU a mis en place depuis 2021 une méthodologie d’agilité à l’échelle (SAFe) afin d’améliorer ses produits et de créer des offres toujours plus innovantes.
Au sein de la Direction des Opérations IT, nous recherchons notre futur Lead SRE H/F.
Votre terrain de jeu :
- Gestion de l’équipe SRE : superviser une équipe d’ingénieurs SRE en charge de la fiabilité, de la disponibilité et des performances des systèmes,
- Conception et implémentation des architectures robustes : collaborer avec les équipes de développement pour concevoir, mettre en oeuvre et maintenir des architectures logicielles évolutives et résilientes,
- Automatisation et outillage : mettre en place des pipelines d’intégration continue/déploiement continu (CI/CD), automatiser les tâches opérationnelles et développer des outils pour améliorer l’efficacité opérationnelle,
- Surveillance et alerting : mettre en place des systèmes de surveillance avancés pour détecter les problèmes de manière proactive, configurer des alertes et des mécanismes de réponse aux incidents.
- Gestion des incidents : coordonner la réponse aux incidents majeurs, mener des analyses post-mortem et proposer des actions correctives pour prévenir les incidents futurs.
- Optimisation des performances : identifier les goulets d’étranglement et les points de faiblesse des systèmes, proposer et mettre en oeuvre des solutions d’optimisation des performances.
- Sécurité et conformité : collaborer avec les équipes de sécurité pour garantir la conformité aux normes de sécurité et mettre en place des mesures de sécurité robustes.
- Formation et mentorat : encadrer et former les membres de l’équipe SRE, partager les meilleures pratiques et favoriser le développement professionnel.
Le monde du gaming et du betting vous anime ? Et si c’était vous, notre candidat idéal ?
- Expérience significative d’au moins 6 ans dans un rôle d’ingénieur SRE ou similaire, avec une expérience préalable en gestion d’équipe
- Solides compétences en programmation et en scripting (Python, Go, Shell, etc.)
- Maîtrise des concepts de l’infrastructure en tant que code (IaC) et des outils associés (Terraform, Ansible, Puppet, etc.)
- Connaissance approfondie des principes de gestion des incidents et des meilleures pratiques en matière de fiabilité des systèmes.
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.
Boulogne-Billancourt