Contexte :
Dans le cadre de son programme Industrie 4.0, Renault développe depuis 2017 sa propre plateforme pour connecter et agréger les données industrielles des 22 sites du Groupe et de plus de 2500 machines.
Fort de partenariats stratégiques signés avec Google Cloud (stack data full GCP), Renault Digital est à la recherche d’un(e) Data Engineer au sein du Pôle Architecture et Data pour mettre en place des chaînes de traitement de données répondant à de nouveaux besoins métiers.
Vous collaborerez au jour le jour avec les équipes métiers ainsi qu’avec les autres fonctions du Pôle Architecture & Data (Data Analysts et Scientists, architectes, …), exploitant des téraoctets de données (événements en mode streaming, traitements en batch et temps réels et les appels aux APIs) afin entre autres d’alimenter des modèles de machine learning (segmentation clients, détection automatiquement des pannes des véhicules, …).
Responsabilités principales :
Vous participez aux phases de framing, MVP et release des produits, services et APIs orientés data ;
Vous argumentez les choix d’architecture des projets et de la plateforme datalake sur GCP ;
Vous contribuez à la valeur métier des produits orientés Data s’appuyant sur le Datalake, en mettant en place des chaînes bout en bout de traitement de la data, de l’ingestion à l’exposition d’APIs et à la visualisation des données et des solutions ML/DS ;
Vous êtes garant de la qualité des données transformées dans le Datalake, du bon fonctionnement des chaînes de traitement et de l’optimisation de l’utilisation des ressources des ressources cloud ;
Vous proposez des standards d’architecture et de développement ;
Vous êtes force de proposition, innovant(e) et bienveillant(e).
Environement technique :
Spark, Scala, Python, Java, Airflow, SQL, Google Cloud Platform (BigQuery, Cloud Storage, PubSub, Beam, Dataflow, Cloud ML, TensorFlow, Kubernetes), Git, Docker, JSON, Bash, Spotfire
Profil recherché :
Vous avez minimum 5 ans d’expérience en tant que Data Engineer ;
Vous disposez d’une expérience en développement Spark, Scala, Python et requêtage SQL sur des gros volumes de données ;
Vous avez une appétence pour la data : validation, transformation, analyse, valorisation ;
Vous possédez une expérience de développement et orchestration de chaines ETL complexes via Airflow ou équivalent ;
Vous pratiquez la méthodologie agile (Agile Scrum et/ou Kanban) ;
Vous utilisez les services cloud (préférablement GCP) ;
Vous êtes capable d’échanger en anglais technique écrit et oral.
Informations complémentaires :
Votre poste sera basé à Boulogne-Billancourt (France) en CDI (temps plein)
Vous bénéficiez de 2 à 3 jours de télétravail par semaine
Premier call avec les chargées de recrutement
Entretien technique avec les opérationnels
Entretien RH
Vous êtes prêt(e)s à relever avec nous les défis de la data, n’hésitez pas à postuler !!
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Boulogne-Billancourt