La mission se déroulera au sein du Département Support et Opérations de la DDSI, et plus précisément dans l’entité “ Exploitation des services” qui a pour ambition de mettre en place d’une équipe orientée fiabilité/SRE ayant pour objectif d’aider les équipes Service Delivery à augmenter la disponibilité et la résilience du SI
L’ingénieur(e) fiabilité met en oeuvre des compétences sur la performance applicative et l’administration système. Son rôle principal est d’assurer la fiabilité, la disponibilité, la performance et la sécurité des systèmes informatiques en production.
Missions :
En tant qu’Ingénieur(e) Fiabilité, vos responsabilités principales seront les suivantes :
Gestion des Incidents et Résolution de Problèmes:
Participer à la gestion des incidents de production, de leur détection à leur résolution complète, en minimisant l’impact sur les utilisateurs.
Mener des analyses post-incident (post-mortem) pour identifier les causes profondes et mettre en place des actions correctives durables.
Développer des outils et des procédures pour prévenir la récurrence des incidents.
Analyse et Optimisation de la Performance:
Analyser les performances des systèmes existants et identifier les axes d’amélioration.
Proposer et mettre en oeuvre des solutions pour optimiser la fiabilité, la disponibilité et la scalabilité de nos infrastructures.
Définir et suivre les indicateurs de performance clés (SLO, SLA, SLI) et mettre en place des alertes proactives.
Amélioration continue :
Collaborer étroitement avec les équipes de Service Delivery pour intégrer les exigences de fiabilité dès la conception des applications.
Participer aux rétrospectives post-mise en production afin d’identifier les axes d’améliorations
* Proposer des solutions suite à l’analyse des rétrospectives
Votre profil :
De formation supérieure Bac+5 ou une expérience d’au moins 5 ans dans les métiers de la fiabilité/SRE.
Disposant d’une aisance relationnelle, vous avez le sens de la communication et du travail en équipe.
Vous justifiez des compétences Techniques dans les domaines :
Systèmes et Réseaux: Maîtrise approfondie des systèmes d’exploitation (Linux, Windows Server), des réseaux (TCP/IP, DNS, routage, pare-feu) et des protocoles associés.
Programmation et Scripting: Solides compétences en programmation (Python, Go, Java, ou autre langage pertinent) et en scripting (Bash, PowerShell).
Infrastructure as Code (IaC): Expérience avec des outils d’IaC tels que Terraform, Ansible…
Conteneurisation et Orchestration: Connaissance pratique de Docker et Kubernetes (ou d’autres orchestrateurs de conteneurs).
Monitoring et Logging: Expérience sur les outils d’observabilité (Dynatrace, splunk,..)
Sécurité: Bonnes connaissances des principes de sécurité informatique et des bonnes pratiques de sécurisation des systèmes et des applications.
Compétences Comportementales Requises :
Capacité d’Analyse et de Synthèse: Aptitude à analyser des problèmes complexes, à identifier les causes racines et à proposer des solutions efficaces.
Résolution de Problèmes: Forte capacité à résoudre des problèmes techniques sous pression, dans un environnement dynamique.
Collaboration et Communication: Excellent esprit d’équipe, capacité à communiquer clairement et efficacement avec des interlocuteurs techniques et métiers.
Rigueur et Organisation: Méthodologie, sens du détail et capacité à gérer plusieurs tâches simultanément.
Autonomie et Proactivité: Capacité à travailler de manière autonome, à prendre des initiatives et à être force de proposition.
Veille technologique: Capacité à se tenir informé des évolutions
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.