Suivi quotidien des systèmes et résolution proactive des incidents.
Maintenance et mise à jour des logiciels (y compris bases de données) et des infrastructures matérielles.
Gestion des incidents critiques liés à l’infrastructure de données et interventions d’urgence pour la correction des bugs.
Contribution à la mise en œuvre d’une roadmap annuelle pour faciliter le déploiement rapide de nouveaux services métiers par les équipes de développement et adapter la plateforme aux besoins DevOps et DataOps, tout en respectant des contraintes budgétaires strictes.
Déploiement de nouvelles architectures et solutions techniques.
Contribution à l’automatisation des processus de mise à disposition des données pour accompagner une transition vers une approche data-driven.
Rédaction de documentation technique claire et à jour.
Surveillance et amélioration continue des mesures de sécurité en lien avec le RSSI.
Application des meilleures pratiques pour assurer la protection des données et des systèmes.
Amélioration du système de monitoring pour évoluer vers une architecture axée sur l’observabilité.
Renforcement de la résilience de la plateforme pour assurer une haute disponibilité et minimiser les temps d’arrêt.
Vos must have
Solide expérience dans des environnements à haute disponibilité.
Diplôme en informatique avec idéalement une certification en administration Linux ou réseau
Capacités d’analyse et de résolution de problèmes.
Rigueur et sens des responsabilités afin d’intervenir sur des infrastructures critiques et à gérer des situations d’urgence de manière autonome.
Capacité à travailler en équipe avec les différentes parties prenantes (infrastructure, développement, métiers) et à communiquer efficacement
Force de proposition pour améliorer la plateforme en accord avec les besoins métiers et les évolutions technologiques.
Stack
Must have
Systèmes d’exploitation : Debian Linux.
Virtualisation et Conteneurisation : Proxmox, Docker ou toute technologie équivalentes (Xen, VMWare, chroot, Jails BSD).
Monitoring et d’Alerting : Nagios, CheckMK, Zabbix, Atlassian OpsGenie, Pager Duty.
Outils collaboratifs : Jira, Confluence, Jira Service Management.
Infrastructure Matérielle et Réseau : HP et Cisco.
Nice to have
Bases de données : MariaDB (gestion avancée des moteurs, flux de réplication complexe, volumes importants, ProxySQL).
Réseaux : HAProxy, FRRouting.
Stockage et Systèmes de Fichiers : ZFS, CEPH, NFS.
Automatisation et Gestion du Code : Ansible, Git.
Langages de Script et Programmation : Bash, Python.
Ces entreprises recrutent aussi au poste de “Ingénierie et administration des réseaux”.
Voir toutes les offres