En tant que SRE Confirmé, vous aurez la responsabilité cruciale d’assurer que notre infrastructure puisse supporter notre croissance rapide. Votre mission principale sera de garantir le scaling de notre charge de production jusqu’à 2 fois notre capacité actuelle, en prenant la responsabilité d’y parvenir à tous les niveaux (backend, infrastructure ou bases de données).
Vous devrez également :
Assurer une observabilité de pointe et veiller au respect des SLA
Être responsable de la sécurité de l’infrastructure (propriétaire de l’infrastructure et de la certification SOC2)
Votre temps sera réparti entre :
80% : Gestion et amélioration de l’infrastructure
20% : Développement sur le backend lorsque nécessaire
Responsabilités principales
Concevoir et mettre en œuvre des solutions pour garantir la scalabilité de notre infrastructure
Assurer le monitoring et l’observabilité complète de nos systèmes
Gérer la sécurité de l’infrastructure et piloter notre conformité SOC2
Optimiser les performances de nos systèmes distribués
Mettre en place et améliorer les processus de CI/CD
Gérer notre infrastructure bare metal hébergée sur OVH via Ansible
Collaborer avec l’équipe backend pour optimiser les performances applicatives
Concevoir et implémenter des stratégies de déploiement robustes
Compétences et qualifications requise
Expérience concrète dans l’implémentation d’au moins un système distribué (bases de données ou architecture) ayant géré un trafic moyen (>300 req/s ou équivalent)
Solides connaissances en observabilité (traçage, logs, métriques, et idéalement profilage)
Expérience avec au moins un langage typé (TypeScript, Rust, Java, Go)
Maîtrise des concepts d’infrastructure avancés : DNS, HTTP, réseaux avancés (routage, MTU, maillage virtuel, etc.), cache distribué
Compréhension approfondie des bases de données : théorème CAP, patterns de déploiement (failover/shard), stratégies d’indexation, stockage en colonnes, réplication géographique, PubSub
Expérience avec les outils de CI : GitOps, GitHub Actions
Expertise en CD : Kubernetes (ou Hashistack), Cilium, Ansible
Expérience significative en administration système et gestion d’infrastructure bare metal
Capacité à intervenir sur le code backend lorsque nécessaire
Compétences techniques appréciées
Connaissances des environnements cloud (GCP, AWS)
Expérience avec des solutions de haute disponibilité
Connaissance des pratiques DevSecOps
Expérience dans la mise en place de solutions conformes aux exigences de certification (SOC2)
Capacité à concevoir des systèmes complexes à grande échelle
Aptitude à décomposer un projet ambitieux en étapes itératives cohérentes, tant du point de vue technique que business
Capacité à exprimer des positions techniques argumentées, y compris lorsqu’elles divergent
Autonomie dans la recherche de solutions et la résolution de problèmes
Volonté d’apprendre et d’utiliser de nouvelles technologies hors de votre zone de confort
Esprit d’excellence et mentalité d’athlète/champion alignés avec notre culture d’entreprise sportive
Expérience significative en tant que SRE ou DevOps dans un environnement à forte charge
Expérience concrète avec des infrastructures bare metal
Le processus de recrutement dure entre 2 et 4 semaines et comprend :
Un premier appel en visioconférence avec le CTO ou le VP Engineering pour faire connaissance, comprendre le produit, la stack technique et la vision de l’entreprise.
Un second entretien dans nos locaux avec le VP Engineering pour évaluer l’adéquation du profil avec nos besoins (compétences techniques et relationnelles).
Une discussion technique approfondie avec le CTO dans nos bureaux, qui peut s’enchaîner avec le second entretien. Un test technique peut être demandé si nécessaire.
Prise de références et vérification des antécédents en asynchrone.
Un dernier entretien dans nos locaux avec la direction, le CEO de Reelevant.
Ces entreprises recrutent aussi au poste de “Cloud computing et DevOps”.
Voir toutes les offres