Le télétravail est-il possible pour ce poste ?

Le télétravail est autorisé pour ce poste.

Quel est le type de contrat pour ce poste ?

Le contrat pour ce poste est de type {contract_type}.

Senior Data Engineer - Mirakl

Mirakl

Senior Data Engineer

Résumé du poste

CDI

Bordeaux

Salaire : Non spécifié

Télétravail fréquent

Expérience : > 4 ans

Compétences & expertises

Contenu généré

Identification des plantes

Détection des intrusions

Gestion de la qualité

Culture technologique

Kubernetes

+12

Postuler

avant-hier

Mirakl

Cette offre vous tente ?

Postuler

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Mirakl, leader et pionnier de l’économie de plateforme, propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d'accélérer de façon durable et rentable leur croissance. Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media. Basée à Paris et Boston, Mirakl est certifiée Great Place to Work.

A propos de Mirakl Labs

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.

Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

A propos du job

La solution SaaS Mirakl est le moteur des marketplaces des plus importants e-commerçants à travers le monde. Cette solution gère et produit de gros volumes de données qui présentent des challenges extrêmement intéressants pour les spécialistes de la donnée (produits, commandes, clients, niveaux de stock, prix, computer vision, catalog transformer, messages, appels API, données de navigation, séries temporelles, données géolocalisées, etc.).

En tant que Senior Data Engineer au sein de l’équipe Data Mirakl, vos principales missions seront de :

Contribuer à l'enrichissement de la Data Platform (ETL)
Améliorer la robustesse de nos pipelines de production pour nos applications Machine Learning (inférence real time etc.)
Contribuer aux projets d'IA, incluant des solutions de transformation, d'IA générative et de Computer Vision
Collaborer avec les équipes Data Science pour faciliter l’intégration et l'industrialisation de modèles d'IA fine-tunés

Intégré(e) dans une équipe de spécialistes de la donnée (data engineers, machine learning engineers, data scientists, data analysts), vous êtes un des acteurs clés pour garantir la place de Mirakl comme solution dominante sur son marché.

Notre stack et nos outils :

Apache Spark, Kafka, AWS, Databricks, Anyscale, Python, Airflow, Mlflow, Tensorflow, Delta lake, Superset, Kubernetes, Redshift, SQL, Terraform, Ansible

Au quotidien, vous allez :

- Participer à la définition et à l’implémentation d’une architecture performante, robuste, scalable et aux coûts maîtrisés pour nos applications Spark ainsi que pour nos pipelines de production de Machine Learning (évaluation des feature stores, refactoring de DAG Airflow)
- Accompagner les Data Scientists lors de leur mise en production (relecture de code, pair programming) et mettre en place les best practices
- Optimiser et améliorer la CI/CD de l’équipe en collaboration avec l’équipe SRE
- Assurer la montée en compétence des membres de l’équipe sur les sujets de MLOps et Data Engineering
- Réfléchir à la meilleure façon d'intégrer les données Google Analytics dans la data platform
- Partager ses connaissances et présenter les travaux devant toutes les équipes Labs

Ce qu’on peut vous apporter :

Des projets data driven, divers et variés (traitements massifs d’images, de textes, time series etc.) pour des produits différents de Mirakl
Une culture orientée sur la veille technologique
Des projets qui ont un vrai impact business devant être déployés sur des centaines de clients dans un contexte multilingue

Quelques exemples de sujets en cours :

Enrichissement des données produit à partir des images et des descriptions
Modération automatique des produits
Mapping automatique des données produit
Identification des produits à fort potentiels
Détection de comportements frauduleux
Sentiment analysis sur les messages échangés entre clients et vendeurs et dans les évaluations
Détermination de prix optimaux
Monitoring de la qualité de service des vendeurs
Des applications d’inférence en synchrone de nos modèles de ML

Vous aimerez ce job si :

Vous êtes passionné(e) par la data et les technologies modernes permettant d'en tirer partie
Vous vous intéressez à la data science et avez des connaissances générales sur les algorithmes de Machine Learning

Vous avez un background en développement et avez évolué dans un environnement Data
Vous avez a minima 4 ans d’expérience en environnement Machine Learning et/ou Data
Vous avez mis en production avec succès des applications Big Data faisant appel à du Machine Learning, du NLP, du traitement d’images dans des projets d'envergure, à fort volume de données
Votre maîtrisez Python, êtes un pro des frameworks data de la fondation Apache et êtes à l'aise dans un environnement AWS
Vous maîtrisez au moins un outil d’orchestration (Airflow, Data Pipeline ou tout autre outil similaire)
Vous présentez vos travaux de manière simple et accessible
Vous faîtes preuve d'un bon relationnel et vous aimez mentorer des collaborateurs
Vous parlez couramment anglais et français

Les plus pour le poste :

Vous avez une expérience significative dans le domaine du e-commerce
Vous avez déjà mis en place un Data Lake, Data Warehouse ou une Data Platform
Vous avez déployé des applicatifs en environnement Kubernetes
Vous avez mis en place des pipelines d'ingestion de données avec une approche CDC à l'aide de Debezium ou autre
Vous maîtrisez Java/Scala

Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.

Envie d’en savoir plus ?

Découvrez l'entreprise

Explorez la vitrine de l’entreprise ou suivez-la pour savoir si elle vous correspond vraiment !

Explorer l’entreprise

Ils sont sociables

L'entreprise

Mirakl

SaaS / Cloud Services, E-commerce

750 collaborateurs

Créée en 2012

Âge moyen : 33 ans

35%

65%

Qui sont-ils ?

Mirakl est le leader et pionnier de l’économie de plateforme. Elle propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d’accélérer de façon durable et rentable leur croissance.

Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d’élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d’efficacité et augmenter leurs profits grâce au retail media.

Mirakl c’est :

Une entreprise créée en 2012, membre du Next40 de la French Tech
Plus de 750 collaborateurs répartis dans le monde et représentant plus de 40 nationalités
Plus de 450 clients B2C et B2B dans plus de 40 pays dont : Airbus, Astore by AccorHotels, Galeries Lafayette, Carrefour, Decathlon, Maisons du Monde, Leroy Merlin, H&M, Sonepar…
Une dernière levée de fonds de 555 millions de dollars en série E et une valorisation à plus de 3,5 milliards de dollars